L'open source en IA gagne du terrain face aux modèles propriétaires

Résumé par IA, vérifié par Numerama

Les modèles de langage open source comme LlaMA ou Mixtral réduisent l'écart avec leurs homologues propriétaires et fermés, suggérant une convergence des performances dans les prochaines années.
L'étude conduite par l'équipe de Catherine Wood d’Ark Investment Management révèle une amélioration impressionnante de l'open source, notamment en termes de compréhension massive des langues multitâches.
Malgré la présence de modèles plus aboutis comme GPT-4 de OpenAI, de nouveaux acteurs de plus petite taille et des solutions internationales affichent des performances prometteuses, mettant en lumière le potentiel croissant de l'open source.

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

Les modèles de langage open source se rapprochent de leurs rivaux fermés et propriétaires, selon une étude comparant les performances des uns et des autres. Si les seconds sont toujours devant, l’écart s’est réduit en 2023.

Quel est le point commun entre LlaMA, Flan-T5-XXL et Mixtral 8x7B ? Hormis des noms en apparence barbares, ce sont tous de grands modèles de langage, c’est-à-dire des systèmes spécialisés dans le traitement automatique du langage naturel. C’est grâce à eux qu’il est possible d’avoir de l’IA générative, comme ChatGPT pour le texte ou Dall-E pour le dessin.

Mais ces trois modèles partagent une autre caractéristique : ils sont tous open source. Il est possible d’accéder au code pour analyser leur fonctionnement. Flan-T5-XXL est ainsi disponible via le site Hugging Face, Mixtral 8x7B peut être récupéré via un fichier torrent et le modèle LlaMA est à retrouver sur le site de Meta, la maison mère de Facebook.

Or, une analyse récente sur les performances des LLM (large language models) fait le constat d’une tendance de fond : les modèles de langage open source comme LlaMA ou Mixtral sont manifestement en phase de rattrapage par rapport aux LLM privés — c’est-à-dire ceux dont les fondations techniques ne sont pas librement partagées.

Ces modèles propriétaires sont bien connus. On retrouve les solutions de Google (Chinchilla, PaLM, Gemini), ainsi que Claude, développé par l’entreprise Anthropic, et les multiples générations de GPT, le modèle d’OpenAI qui fait tourner ChatGPT. Tous sont fermés et, selon le graphique de l’étude, tous sont globalement supérieurs à leurs contemporains libres.

Pour aller plus loin

Intelligence artificielle // Source : Canva

Llama 2 : Meta lance un modèle d’IA plus puissant, open source et gratuit pour tout le monde

ark open source llm propriétaire privé fermé libre — Dans la course à l’IA générative, l’open source a l’air de rattraper les modèles fermés. // Source : Ark

Mais pour combien de temps ? À en croire le mouvement suggéré par le graphique, les LLM open source vont bientôt et même rattraper les LLM privés. Si les seconds font encore la course en tête, l’écart apparaît se résorber progressivement. On peut imaginer que les deux courbes finiront par se croiser dans deux à trois ans, s’il n’y a pas de changement brusque dans ces trajectoires.

Ces travaux ont été menés par les équipes de Catherine Wood, fondatrice et directrice générale d’Ark Investment Management. Il s’agit d’une société américaine de gestion d’investissement spécialisée dans les fonds négociés en bourse, qui se positionne dans plusieurs domaines, dont celui de l’intelligence artificielle. Elle est aussi impliquée dans les crypto-monnaies.

L’open source progresse face aux modèles fermés

Ils ont été salués par Yann Le Cun, le directeur scientifique de l’IA chez Meta. « Les modèles d’IA open source sont en passe de dépasser les modèles propriétaires », a-t-il réagi le 14 décembre. L’intéressé prêche, il est vrai, aussi pour sa paroisse. Sa société a aussi embrassé l’ouverture pour l’IA générative. Les deux modèles LlaMA cités dans l’étude sont de Meta.

Un commentaire que partage Catherine Wood. « Bien que toujours en retard, la performance des modèles d’IA open source s’améliore par rapport aux modèles fermés », a-t-elle réagi sur X (ex-Twitter). Le seul relativement en retard parmi les IA propriétaires est Grok, la solution lancée par Elon Musk. L’impression que ce chatbot laisse est assez contrastée.

Dévoilée en décembre, et mise à jour par la suite de façon à intégrer des modèles plus récents comme Gemini et Mixtral, l’étude compare les modèles à travers le temps (axe des abscisses) et sur une faculté particulière (axe des ordonnées). Celle-ci porte sur l’erreur logarithmique absolue des performances en matière de compréhension massive des langues multitâches.

Le nouveau modèle de Google, Gemini, est pris en compte. // Source : Google

Selon Jozef Soja, qui a participé à l’étude, « cela rend mieux compte du fait que chaque amélioration marginale des performances est plus difficile à atteindre que la précédente ». Par ailleurs, cette manière de faire permet de « montrer à quel point le GPT-4 est actuellement en tête du peloton ». GPT-4 est aujourd’hui le modèle le plus abouti d’OpenAI, avec GPT-4 Turbo.

L’intéressé ajoute « qu’il est particulièrement intéressant de voir à quel point les derniers modèles open source semblent être performants par rapport à leur taille. Mixtral bat GPT 3.5 sur ce benchmark avec une fraction des paramètres ». GPT-3.5 est sorti début 2020, tandis que Mixtral a été annoncé en décembre 2023.

L’étude d’Ark offre une photographie incomplète du paysage — l’ensemble des modèles de langage, open source ou fermés, ne figurant pas sur le graphique. On retrouve néanmoins les plus médiatisés, avec ceux des géants du web — Google, Meta (Facebook) ou même OpenAI, qui bénéficie du soutien et des financements de Microsoft.

Des acteurs de plus petite taille sont aussi présents (tels Claude et Mixtral) et des solutions étrangères peu connues en Occident. C’est le cas de Falcon 180B, un modèle de langage conçu par l’Institut d’innovation technologique des Émirats arabes unis, mais aussi Yi-34B de la startup chinoise 01.ai. D’autres pourraient être ajoutées si le graphique est maintenu à jour.

Les constats de l’étude interrogent sur la pertinence, à terme, de conserver des modèles fermés si l’open source offre de meilleures perspectives. Cette éventualité pourrait alors remettre l’orientation prise par OpenAI, par exemple. On se souvient que la société avait qualifié d’erreur l’idée d’embrasser l’open source à ses débuts. Le futur pourrait lui donner tort.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !

Toutes les infos sur ChatGPT

L’open source en IA gagne du terrain face aux modèles propriétaires

L’open source progresse face aux modèles fermés

Oubliez les shootings : Google Pomelli devient un studio photo IA 100 % gratuit

PlayStation ferme le studio Bluepoint, et c’est une catastrophe

Le mini frigo Xbox Series X revient en promotion à presque moitié prix

Google dévoile Gemini 3.1 Pro : le nouveau meilleur modèle IA devant Claude et GPT

Microsoft prouve qu’on peut stocker des données sur du verre pendant 10 000 ans

NVIDIA Studio : le secret des monteurs de Mastu et Michou pour booster leur productivité

Vous avez un vieux PC ? VLC est à la recherche d’anciens ordinateurs pour son app Windows XP

Quels sont les meilleurs casques audio Bluetooth à réduction de bruit en 2026 ?

Comment générer de la musique gratuitement avec Google Gemini et Lyria 3 ?

SCAF : le chancelier allemand jette un froid sur l’avenir de l’avion européen