Aujourd’hui, les modèles de langage sont essentiellement américains. Mais le Royaume-Uni entend développer une solution nationale, souveraine. 100 millions de livres sterling sont annoncés, pour débuter. Une trajectoire que la France pourrait suivre.

100 millions de livres sterling, soit un peu plus de 113 millions d’euros. Tel est le montant du financement que Londres vient d’annoncer, le 24 avril 2023, pour « accélérer les capacités du Royaume-Uni dans un type d’intelligence artificielle qui émerge rapidement ». En ligne de mire ? Faire en sorte que le pays puisse avoir son propre ChatGPT souverain.

Cet investissement, selon le gouvernement anglais, est une première étape, pour amorcer le groupe de travail chargé de piloter ce programme. Ce montant s’ajoute aux 900 millions de livres sterling (un peu plus d’un milliard d’euros) déjà fléchés pour développer la puissance de calcul du pays, précise l’exécutif britannique dans son communiqué.

À travers cette enveloppe, Londres entend « garantir des capacités souveraines » et une large adoption des modèles de langage qui devront être « sûrs et fiables ». Ces modèles de langage sont appelés modèles de fondation (foundation models en anglais). À l’issue de leur entraînement, qui nécessite d’ingérer de vastes quantités de données, ils peuvent ensuite servir à diverses tâches.

ChatGPT
ChatGPT est basé sur un modèle de langage fourni par une entreprise américaine. // Source : Focal Foto

Par exemple, ChatGPT repose sur le modèle de langage GPT, qui est un genre de modèle de langage — un transformateur génératif pré-entraîné (en anglais, Pre-Trained Transformer). Il en est à sa version 4 depuis la mi-mars. Google utilise le modèle de langage LaMDA pour son chatbot Bard. Quant à Facebook, son modèle est appelé LLaMA.

Ces modèles de base sont entraînés sur des fichiers de nature variée. Il peut s’agir de textes, d’images, de vidéos ou de fichiers sonores, en fonction des facultés qui sont recherchées. Par exemple, ChatGPT est plutôt spécialisé dans le texte (même si GPT-4 ouvre la voie à l’emploi multimodal), tandis que Midjourney, DALL-E ou Stable Diffusion sont taillés pour les images.

La constitution de capacités souveraines pour se doter de ses propres modèles d’intelligence artificielle doit offrir une alternative aux solutions déjà existantes et ainsi éviter de se retrouver en situation de dépendance. Mais au-delà de ces enjeux de souveraineté, le Royaume-Uni voit aussi ces modèles comme un puissant levier de croissance, avec une hausse du PIB à la clé.

Bientôt des modèles de langage souverains en France ?

En France, le gouvernement n’a pas annoncé à ce jour de plan équivalent. Jean-Noël Barrot, le ministre chargé de la Transition numérique et des Télécommunications, a évoqué à plusieurs reprises ChatGPT et les répercussions qu’il pourrait avoir, mais davantage à travers le prisme de la régulation — il a mentionné le règlement sur l’IAde la sécurité et des enjeux éthiques.

« Mieux vaut créer en Europe les conditions pour que l’innovation se développe en accord avec nos valeurs. J’ai saisi le Comité national d’éthique qui rendra son avis à l’été. Il éclairera nos choix de société », indiquait-il le 11 avril. Toutefois, il a aussi reconnu « qu’il n’y a aucune raison que nous ne puissions pas développer à notre tour des modèles en France. »

En attendant, la France se dote des capacités techniques qui permettront, le cas échéant, de faire tourner ces modèles d’intelligence artificielle. Dans son plan pour France 2030, le gouvernement reconnaît que la maîtrise de l’IA « est un facteur majeur de souveraineté nationale », et que cela n’est possible « que grâce à des capacités de calcul de grande ampleur. »

« Il n’y a aucune raison que nous ne puissions pas développer à notre tour des modèles en France. »

Jean-Noël Barrot

« Les modèles derrière l’intelligence artificielle sont entraînés avec des algorithmes comportant plusieurs dizaines de milliards de paramètres. Il est donc indispensable que nous ayons sur notre sol ces capacités de calcul dites exaflopiques », poursuit le document. Une observation qui rejoint celle du Royaume-Uni et son enveloppe de 900 millions de livres sterling.

Des appels émergent déjà pour encourager la constitution d’un modèle de langage national, comme au Royaume-Uni Un modèle de langage qui serait également open source, afin d’éviter son appropriation et aussi assurer sa transparence. Aujourd’hui, les grandes entreprises qui conçoivent les modèles de langage sont plutôt dans une logique inverse, en optant pour un modèle à base d’API.

À l’avenir, cela pourrait toutefois changer. C’est en tout cas la prédiction de Yann LeCun, le patron de l’intelligence artificielle chez Meta, la maison mère de Facebook. Dans un entretien au Nouvel Obs, ce spécialiste reconnu de l’IA anticipe que ces modèles de langage deviendront un standard ouvert commun à tous les industriels, exactement comme l’infrastructure Internet.

Dans ce cadre, les modèles de langage souverains pourraient devenir sans objet, s’ils deviennent des standards. Les besoins en puissance de calcul, en revanche, seront plus que jamais nécessaires pour traiter ces données massives, mais aussi pour entraîner des modèles. Le calcul haute performance, avec l’ère exascale, devra y répondre.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.