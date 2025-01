Lecture Zen Résumer l'article

Une formule est depuis peu régulièrement brandie pour décrire la stupeur provoquée par le modèle de langage DeepSeek : « le moment Spoutnik de l’IA ». Cette formule s’inspire d’un évènement clé de la guerre froide et suggère une course à l’intelligence artificielle qui se jouera entre la Chine et les USA.

C’est une formule que l’on voit circuler massivement depuis quelques jours. La sortie du nouveau modèle de langage de DeepSeek serait, pour les États-Unis, un « moment Spoutnik ». La formule a, par exemple, été employée par Marc Andreessen, entrepreneur et investisseur historique de la Silicon Valley et personnalité très en vue sur X (ex-Twitter).

« DeepSeek R1 est le moment Spoutnik de l’intelligence artificielle », écrivait-il le 26 janvier. La raison ? Ce modèle de langage conçu par une startup chinoise est capable de faire aussi bien, voire mieux, que les systèmes d’IA générative équivalents en Occident. Et surtout de le faire pour bien moins cher par rapport aux sommes englouties aux USA.

Une comparaison a ainsi très rapidement émergé : le modèle le plus avancé de la société américaine OpenAI, appelé o1, qui est son premier modèle dit « de raisonnement », aurait nécessité des centaines de millions de dollars. En face, DeepSeek R1, qui est aussi un modèle de raisonnement, n’aurait requis « que » 5 ou 6 millions de dollars (un chiffre invérifiable). Une paille.

Polémique sur le coût réel de DeepSeek-R1

Depuis, ce narratif d’une IA ultra low cost est contesté. Des voix s’élèvent pour dire qu’un modèle aussi peu cher relève de la propagande chinoise et que le coût réel de DeepSeek est bien plus élevé. Il a été dit également que DeepSeek aurait eu accès à des puces H100 de Nvidia très avancées, et cela, dans des quantités énormes, malgré l’embargo américain.

Ces affirmations sont invérifiables à ce stade, d’un côté comme de l’autre, bien que l’on sache que des ingénieurs chinois en IA ont accédé en secret à des puces Nvidia interdites. Mais le volume évoqué — 50 000 puces H100 — parait exagéré. À 30 000 dollars l’unité, la dépense atteindrait 1,5 milliard de dollars. Cela, juste pour les puces, sans compter le reste.

Une puce H100. // Source : Nvidia

Le mal est fait en tout cas : la présentation d’un modèle capable de faire jeu égal à o1 pour un prix dérisoire a eu un effet dévastateur sur la bourse américaine spécialisée dans la high tech. Les grandes sociétés comme AMD, ASML, Broadcom, Microsoft, Alphabet (Google), ARM et BE Semiconductor ont toutes dévissé, parfois de façon spectaculaire.

Dans ce domaine, la palme de l’effondrement revient à Nvidia, qui vu sa valeur boursière perdre jusqu’à 600 milliards de dollars — et qui recule encore au NASDAQ. En effet, quel sens y a-t-il à investir des milliards dans l’IA si, en fin de compte, on peut arriver à un même résultat technique en ayant besoin d’une fraction de ces investissements ?

Coup dur pour le juteux business de Nvidia, mais aussi questionnement plus large à l’heure où de nombreuses annonces ont eu lieu à grands coups de milliards. Par ricochet, cela questionne aussi l’intérêt des besoins énergétiques réels pour faire tourner toutes ces futures infrastructures, si on peut faire mieux ou autant, avec moins.

Stargate ? Un programme pharaonique aux USA de 500 milliards de dollars sur cinq ans, avec OpenAI, Microsoft, Nvidia, ARM et Oracle. De son côté, Meta annonce 65 milliards en 2025 pour ses infrastructures en IA. Microsoft 80 milliards et Amazon plus de 75 milliards. Tout cela, en plus des dépenses déjà engagées.

C’est quoi le moment Spoutnik ?

C’est dans ce contexte que doit se comprendre le moment Spoutnik, qui est une référence directe à un moment-clé de la guerre froide entre les États-Unis et l’Union soviétique. Ce moment Spoutnik a même été l’acte fondateur de la course à l’espace entre Washington et Moscou — et qui a finalement vu la victoire du premier sur le second, après une lutte sur près de vingt ans.

Le 4 octobre 1957, l’URSS lance le tout premier satellite artificiel de la Terre : Spoutnik. Les États-Unis ont alors découvert avec horreur l’existence d’une sonde soviétique capable d’évoluer au-dessus de leur territoire, dans l’espace. Après tout, si l’on peut survoler l’Amérique en toute impunité, on peut aussi l’espionner. Et si besoin, l’attaquer.

République de Spoutnik 1. // Source : Nasa

Dans le New York Times, cet évènement a même été qualifié de « Pearl Harbor technologique », en référence à l’attaque surprise — et dévastatrice — de l’armée japonaise contre la base navale de Pearl Harbor, à Hawaï, durant la Seconde Guerre mondiale. DeepSeek R1 pourrait-il être l’équivalent d’un Pearl Harbor technologique, comme l’a été Spoutnik ?

Certains le pensent : « les parallèles avec Spoutnik et la course à l’espace sont fous : les craintes concernant la sécurité nationale explosent ; l’Amérique se croyait imbattable ; une puissance rivale prend de l’avance ; les marchés paniquent », pouvait-on lire sur X sur un compte dressant les points communs entre les deux situations.

Vers un branle-bas de combat général aux USA ?

DeepSeek-R1 étant tout récent, il est sans doute trop tôt pour déterminer si son émergence aura des effets similaires sur l’IA que ce qu’a provoqué la sonde Spoutnik. Sam Altman, le fondateur et patron d’OpenAI, a eu une réaction polie, en reconnaissant que « DeepSeek-R1 est un modèle impressionnant, en particulier pour ce qui est de le proposer à ce prix. »

Mais l’intéressé a aussi ramassé le gant et relevé le défi. « Il est évident que nous fournirons de bien meilleurs modèles et il est tout à fait stimulant d’avoir un nouveau concurrent », a-t-il affirmé. Et selon lui, il demeure « plus important que jamais de disposer de plus de capacités de calcul pour mener à bien notre mission ». La stratégie demeure, en somme.

Du côté de Meta, il a été rapporté que la sortie de ce DeepSeek-R1 a été vue comme une menace, pour l’entreprise et pour toute la Silicon Valley. À la Maison-Blanche aussi, cela n’a pas été accueilli favorablement, surtout que la présentation de DeepSeek-R1 a quelque peu perturbé l’annonce autour du projet Stargate, que Donald Trump présidait.

« J’espère que le lancement de l’IA DeepSeek par une société chinoise sera un avertissement pour nos industriels et leur rappellera qu’il faut rester très concentrés sur la concurrence pour gagner », a-t-il déclaré le 27 janvier. À ce stade, il n’est pas encore question d’un bannissement de DeepSeek au nom de la sécurité nationale.

Donald Trump a aussi entendu parler de DeepSeek, et cela ne lui plait pas. // Source : White House

De façon plus surprenante, il a aussi considéré que le faible coût du modèle comme un « développement positif ». « Au lieu de dépenser des milliards et des milliards, vous dépenserez moins et vous arriverez, je l’espère, à la même solution », a-t-il lancé. Une position qui tranche avec la tendance à mobiliser des quantités invraisemblables de capitaux.

De quoi pousser à reconsidérer cette fuite en avant en matière de puissance et de gigantisme financier de la bigh tech, au profit de modèles plus frugaux ? À voir. À défaut de coup d’arrêt, cela montre qu’une voie tierce efficace existe, avec un point d’équilibre entre performances, consommation énergétique et coûts de fabrication et d’entraînement.

De fait, l’émoi à Washington et dans la Silicon Valley traduit clairement une stupeur et un relatif sentiment de vulnérabilité, similaire à ce qu’a connu le pays à la fin des années 50, quand une sonde soviétique s’est baladée dans le ciel. Mais la riposte devrait finir par arriver vite, et fort. Pour OpenAI, elle devrait s’appeler o3.

Les choses risquent de bouger rapidement, en tout cas. David Sacks, qui a été désigné par Trump pour piloter la stratégie de l’IA, ne dit pas autre chose : « DeepSeek R1 montre que la course à l’IA sera très compétitive. J’ai confiance dans les États-Unis, mais nous ne pouvons pas nous reposer sur nos lauriers ». À bon entendeur.

