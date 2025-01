Lecture Zen Résumer l'article

Numéro 1 des téléchargements sur l’App Store américain, DeepSeek est la première intelligence artificielle générative qui a réussi à détrôner ChatGPT. Derrière elle se cache un modèle open source développé par une entreprise chinoise, qui semble avoir réussi à faire aussi bien qu’OpenAI ou Google, avec beaucoup moins d’argent.

Depuis son introduction en novembre 2022, ChatGPT est, de très loin, le service référence dès que l’on parle d’intelligence artificielle générative. De très nombreux concurrents ont émergé (Gemini, Perplexity, Claude…), mais de toutes ces alternatives à ChatGPT, aucun n’avait réussi à détrôner l’application d’OpenAI dans les téléchargements. DeepSeek, un service open source chinois, est devenu la première application sur iPhone le 26 janvier 2025, après un buzz phénoménal sur les réseaux sociaux.

Qu’est-ce que DeepSeek ? Il s’agit d’une entreprise fondée en 2023 pour permettre à la Chine de rivaliser avec les grands groupes américains. Ses derniers modèles, R1 et V3, impressionnent pour deux raisons : leur efficacité… et leur coût d’utilisation.

Pour vous présenter DeepSeek, le plus simple est de demander au chatbot d’expliquer qui il est. Nous avons demandé au modèle DeepSeek-V3, qui est accessible depuis l’adresse chat.deepseek.com, de « rédiger un ou deux paragraphes dans un style journalistique pour expliquer ce que fait DeepSeek ». Voici sa réponse :

« DeepSeek est une entreprise spécialisée dans le développement de solutions avancées en intelligence artificielle (IA), visant à repousser les limites de la technologie pour répondre aux besoins complexes des entreprises et des particuliers. Fondée sur une expertise pointue en apprentissage profond (deep learning) et en traitement des données, DeepSeek conçoit des systèmes capables d’analyser, de prédire et d’interagir de manière autonome. Ses applications couvrent des domaines variés, allant de la reconnaissance vocale et visuelle à l’automatisation des processus métiers, en passant par la personnalisation des expériences utilisateurs.

En misant sur une approche innovante et éthique, DeepSeek se positionne comme un acteur clé dans la transformation numérique. Ses technologies sont déployées pour optimiser les décisions stratégiques, améliorer l’efficacité opérationnelle et créer des interactions plus intelligentes entre les humains et les machines. Avec une vision tournée vers l’avenir, DeepSeek continue d’explorer les frontières de l’IA, tout en s’engageant à garantir une utilisation responsable et transparente de ses solutions. »

L’interface de DeepSeek reprend celle de ChatGPT. // Source : Numerama

DeepSeek, meilleur que ChatGPT et beaucoup moins cher ?

Ce qu’oublie de dire l’intelligence artificielle dans sa courte introduction est l’exploit réalisé par ses ingénieurs, qui ont conçu des modèles parmi les plus sophistiqués au monde avec très peu d’argent.

DeepSeek n’a été financé qu’avec 5,6 millions de dollars, contre 100 millions de dollars pour un modèle comme GPT-4. Les tarifs d’utilisation de son API sont aussi 30 fois inférieurs à ceux d’OpenAI, ce qui rend le modèle chinois terriblement séduisant pour les développeurs en quête de leur propre chatbot. Une des particularités de DeepSeek est d’avoir conçu des modèles avec des puces considérés « anciennes », des Nvidia H800. Pourtant, d’après les premiers tests, DeepSeek bat GPT-4o et le modèle o1 dans de nombreux exercices.

C’est quoi la différence entre DeepSeek-V3 et DeepSeek-R1 ?

DeepSeek a mis au point plusieurs modèles sophistiqués. Le plus universel est DeepSeek-V3, un LLM conçu pour rivaliser avec GPT-4o, Claude-3.5 ou Gemini. Il peut répondre à des questions, analyser des documents et générer du texte dans différents styles.

En plus de DeepSeek-V3, l’entreprise chinoise propose différents modèles spécialisés, dédiés au code ou aux maths notamment. Sa dernière prouesse est DeepSeek-R1, un « modèle de raisonnement » comparable à ChatGPT-o1, mais pour 27 fois moins cher par question. Il est capable de s’auto-interroger et de simuler une réflexion, pour résoudre un problème sophistiqué. Ses résultats impressionnent les chercheurs, qui le positionnent déjà comme un rival d’o3, le futur super modèle d’OpenAI.

DeepSeek-R1, en bleu foncé, semble en mesure de rivaliser avec o1. // Source : DeepSeek

Un développement open source : l’autre prouesse de DeepSeek ?

DeepSeek met-il une claque à la recherche américaine, comme certains analystes semblent le dire ? Ce n’est pas l’avis de Yann LeCun, le responsable de l’intelligence artificielle chez Meta, qui voit en DeepSeek une humiliation pour les grands groupes privés comme OpenAI et Google qui, malgré un très grand investissement et des recherches gardées secrètes, sont dépassés par des technologies open source.

Une des particularités de DeepSeek est que les codes source de DeepSeek-V3 et DeepSeek-R1 sont disponibles en ligne, et tout le monde peut les utiliser. Avec cette approche très ouverte, la Chine fait un pari différent des États-Unis, qui pourrait l’aider à attirer les meilleurs chercheurs.

« Comme leur travail est publié et open source, tout le monde peut en profiter » // Source : Yann LeCun

Comment parler à DeepSeek ?

Pour essayer un des modèles DeepSeek, le plus simple est de se rendre sur chat.deepseek.com ou de télécharger l’application sur iOS ou Android. Le modèle est aussi accessible depuis Perplexity, le moteur de recherche dopé à l’IA.

DeepSeek est-il censuré par la Chine ?

Parler à un LLM chinois est-il vraiment une bonne idée, alors que le régime de Xi Jinping est réputé pour son contrôle de la parole ? Le chatbot de DeepSeek, qui est disponible gratuitement en ligne et sous la forme d’une application, est en effet censuré. Il ne dira pas de mal du gouvernement chinois et mettra fin à la génération de texte dès qu’il est interrogé sur la Chine.

Cela dit, considérer que DeepSeek est juste « un ChatGPT chinois » est sans doute une erreur. Le chatbot a des limites, mais le modèle open source peut être utilisé librement par les développeurs. Les travaux de l’entreprise pourraient profiter à des entreprises américaines ou européennes, tout en accélérant le développement de chatbots à des coûts inférieurs.

DeepSeek va-t-il détrôner ChatGPT sur le long terme ?

En détrônant ChatGPT sur l’App Store américain en janvier 2025, DeepSeek a provoqué un séisme dans le monde de l’intelligence artificielle. Aucun autre rival d’OpenAI n’avait réussi une telle prouesse, malgré des moyens colossaux. Le service chinois, seulement grâce à la hype provoquée sur les réseaux sociaux, a réussi l’exploit de devenir premier sans dépenser beaucoup d’argent.

Sur l’App Store, DeepSeek a battu ChatGPT. // Source : Capture Numerama

Le succès de DeepSeek va-t-il durer ? C’est difficile à dire, surtout quand on connaît la politique protectionniste de Donald Trump (demandez à TikTok). D’autres applications ont connu des succès éphémères, avant de redescendre rapidement. Personne n’imagine vraiment DeepSeek devenir le numéro 1 sur la durée, ChatGPT repassera sans doute rapidement devant.

L’exploit de DeepSeek réside dans son rapport coût/efficacité, qui atomise tous les autres services de l’IA. La Chine envoie un message fort aux États-Unis, en prouvant qu’il est possible de créer une intelligence artificielle permanente sans serveurs surpuissants. OpenAI, Google ou Anthropic ont grand intérêt à s’en inspirer.

