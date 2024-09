Lecture Zen Résumer l'article

Mistral AI publie via le protocole BitTorrent un nouveau modèle de langage, dont la particularité est d’être multimodal. Baptisé Pixtral 12B, il devrait bientôt être utilisable directement sur la plateforme de la jeune startup française, y compris Le Chat, son chatbot.

C’est inédit pour Mistral AI. La jeune startup française spécialisée dans l’intelligence artificielle générative a partagé son tout premier modèle de langage multimodal. Son nom ? Pixtral 12B, un nom pas tout à fait choisi au hasard, puisqu’il suggère sa capacité à traiter des images (p comme picture), l’une des particularités de la multimodalité.

C’est par un message sur X (ex-Twitter) que la nouvelle a été annoncée, le 11 septembre 2024. Le message de l’entreprise peut apparaître obscur : il s’agit en fait d’un lien magnet, qui permet de récupérer un fichier torrent et lancer ensuite le téléchargement du modèle. Pour récupérer Pixtral 12B, il faut un logiciel adapté, comme QBitTorrent.

Cela fait maintenant plusieurs mois que Mistral AI a pris l’habitude de se servir de BitTorrent pour partager ses modèles de langage. Fin décembre, la société diffusait le modèle Mixtral 8x7B (87 Go). En avril, un autre modèle était partagé, Mixtral 8x22B, pour un poids de 262 Go. Ici, Pixtral 12B est presque modeste, avec ses 23,64 Go.

Prochainement, Pixtral devrait être utilisable sur Le Chat, l'IA de Mistral.

Un modèle bientôt utilisable en ligne

Un modèle multimodal se caractérise par sa capacité à manier des données variées, comme du texte, des images, de l’audio ou de la vidéo. Il est capable de combiner des sources diverses et les traiter en fonction du prompt de l’internaute. Par exemple, il peut décrire une image en produisant des lignes de texte. ChatGPT, par exemple, est multimodal.

Le modèle Pixtral 12B a aussi été partagé sur Hugging Face, qui recense des centaines de milliers de modèles et qui dispose d’outils permettant de les tester assez facilement — du moins, certains d’entre eux. Des précisions techniques sont également fournies pour l’installation et l’utilisation. On en trouve également sur X.

Pour l’instant, la taille des images générées via Pixtral 12B est plutôt petite, de 1024 par 1024 pixels de côté. À l’avenir, des itérations à venir de Pixtral devraient permettre de créer des visuels plus grands. Il est également prévu de rentrer le modèle exploitable directement sur la plateforme de Mistral AI, via une interface exploitable par des novices.

