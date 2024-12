Lecture Zen Résumer l'article

Avec DeepSeek-V3, la Chine a possiblement de quoi inquiéter OpenAI et les grands groupes américains. Son approche open source, sur un secteur de plus en plus dominé par des groupes privés, lui permet d’aller vite, pour beaucoup moins d’argent.

En quelques années, la Chine s’est imposée comme le premier pays en matière d’innovation technologique. Longtemps associé à une image d’assembleur et/ou de copieur, le pays de Huawei et de Xiaomi est aujourd’hui celui qui investit le plus dans la recherche, avec l’espoir de détrôner les États-Unis. En plus des smartphones et des ordinateurs, la Chine est aujourd’hui capable de concevoir ses propres puces et, depuis peu, est leader sur le secteur automobile.

En avance sur l’intelligence artificielle générative grâce à des entreprises comme OpenAI, Google ou Meta, les États-Unis ont longtemps pensé qu’ils maintiendraient leur avance suffisamment longtemps pour tenir la Chine à distance. Deux ans après l’annonce de ChatGPT, la Chine prétend pourtant les avoir détrônés.

DeepSeek : l’usine à modèles chinois

Fondée en 2023, l’entreprise DeepSeek va vite. En moins d’un an, elle a réussi à mettre en ligne plusieurs modèles considérés comme performants, notamment grâce à un très grand effort de financement d’acteurs chinois. DeepSeek travaille à la fois sur des LLM classiques (comme GPT-4o), des LLM entraînés pour des tâches (le code, par exemple) et des modèles d’avant-garde, capables de « réfléchir » (comme o1 ou o3).

Sa dernière prouesse s’appelle DeepSeek-V3 et a été annoncée le 26 décembre 2024. Au programme de ce nouveau modèle :

Une interface 100 % inspirée de celle de ChatGPT, avec des animations très similaires. Il y a même un bouton Search, avec un moteur de recherche intégré.

Une vitesse d’écriture en nette progression (60 tokens/mots par seconde).

Un modèle totalement open source, avec 671 milliards de paramètres (c’est plus que Meta Llama 3.1, le meilleur modèle open source américain).

Un coût d’entraînement estimé à 5,5 millions de dollars, ce que certains estiment à 10 fois moins que chez les Américains, avec 14,8 trillions de tokens analysés pour l’entraînement.

Une API nettement moins chère, qui pourrait inciter de nombreux développeurs à utiliser DeepSeek, s’il est vraiment efficace, plutôt que GPT-4o ou une autre solution américaine.

Sur Twitter, DeepSeek s’exprime comme une entreprise américaine. Le but est de faire de l’ombre à OpenAI et les autres groupes US. // Source : X

Selon les benchmarks publiés par DeepSeek, son modèle V3 est comparable à GPT-4o (OpenAI) et à Claude-3.5-Sonnet (Anthropic), les deux LLM les plus populaires aux États-Unis. DeepSeek-V3 s’en sort même mieux avec les maths et le code, tout en excellant naturellement en chinois. Tout cela reste à prouver (les premiers testeurs indiquent que DeepSeek semble parfois s’emmêler les pinceaux), mais c’est néanmoins très prometteur. Surtout pour un coût si faible.

Benchmarks publiés par DeepSeek pour présenter son LLM V3. // Source : DeepSeek

Les États-Unis doivent-ils s’inquiéter de DeepSeek-V3 ?

En quelques mois et avec relativement peu d’argent, les ingénieurs recrutés par la Chine auraient donc réussi à égaler GPT-4o, le modèle par défaut de ChatGPT. Il reste bien sûr de nombreux avantages à OpenAI (multimodalité, mode voix, intégration, génération d’images et de vidéos etc.), mais l’exploit demeure impressionnant. DeepSeek réussit d’autant plus son coup de communication que sa dernière annonce fait réagir aux États-Unis, là où les précédentes n’intéressaient qu’un public très averti. Le patron de Perplexity s’étonne même de la politique américaine contre l’open source, qui ralentirait les chercheurs. Bref, les États-Unis ont mordu à l’hameçon et s’inquiètent de la remontée chinoise.

Autre coup fort : DeepSeek-V3 est déjà accessible gratuitement. Tout le monde peut l’essayer.

Le patron de Perplexity, une entreprise américaine, dénonce la politique des États-Unis vis-à-vis de l’open source. // Source : X

En plus des exploits de DeepSeek, qui veut être le ChatGPT chinois, la Chine finance d’autres modèles de pointe. Parmi eux, CogVideoX, HunyuanVideo (Tencent) et Kling pour générer des vidéos ou Qwen chez Alibaba. Tous ont un point commun : l’open source. Une approche différente des États-Unis, qui permet aux chercheurs d’aller plus vite, avec beaucoup plus de données.

Seule inconnue : comment réagiront les États-Unis de Donald Trump, qui est bien conscient de cette concurrence chinoise ? Une guerre technologique comme avec Huawei n’est pas impossible, pour freiner les recherches chinoises.

Ce contenu est bloqué car vous n’avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par YouTube.

Pour pouvoir le visualiser, vous devez accepter l’usage étant opéré par YouTube avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l’amélioration des produits d’Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l’audience de ce site (en savoir plus) En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires. Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies. J’accepte tout Gérer mes choix

Découvrez les bonus Numerama+ + rapide, + pratique, + exclusif Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore. Découvrez les nombreux avantages de Numerama+. S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci Il y a une bonne raison de ne pas s'abonner à Numerama+ Tout le monde n'a pas les moyens de payer pour l'information.

C'est pourquoi nous maintenons notre journalisme ouvert à tous. Mais si vous le pouvez,

voici trois bonnes raisons de soutenir notre travail : 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama .

2 Vous profiterez d'une lecture sans publicité , de nombreuses fonctions avancées de lecture et des contenus exclusifs .

3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir. Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+. S'abonner à Numerama+