Mistral AI piraté ? Un hacker met en vente 5 Go de code source et 450 dépôts internes pour 25 000 dollars

Résumé par IA, vérifié par Numerama

Mistral AI dément un piratage massif de 5 Go de code source malgré une compromission temporaire d'un système de gestion de code le 12 mai.
L'entreprise française a neutralisé rapidement l'attaque sans impact significatif sur les données clients, services hébergés ou environnements de recherche.
Un vendeur sur un forum cybercriminel revendique toujours la possession de données internes de Mistral AI, sans possibilité de vérifier leur authenticité pour l'instant.

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

Contacté par Numerama, Mistral AI dément le piratage massif de 5 Go de code source revendiqué sur un forum cybercriminel. L’entreprise française reconnaît cependant qu’un de ses systèmes de gestion de code a été temporairement compromis le 12 mai, dans le cadre de l’attaque supply chain TanStack, sans accès aux données clients ni à ses environnements de recherche.

Mise à jour publiée à 15h00 : Mistral dément un piratage massif de son code source

Contacté par Numerama, un porte-parole de Mistral AI réagit à la revendication d’un hacker qui affirme détenir les données internes de l’entreprise. Le groupe français reconnaît avoir subi une compromission temporaire, mais indique que sa portée est limitée : « Un groupe d’attaquants a temporairement compromis l’un de nos systèmes de gestion de code le 12 mai 2026 à travers une attaque de la chaîne d’approvisionnement logicielle d’un tiers », explique Mistral AI. « Ils ont contaminé certains de nos packages SDK pendant une brève période. »

Mistral AI affirme avoir neutralisé l’attaque rapidement et dit avoir mené une enquête en collaboration avec les autorités. Sa conclusion est sans ambiguïté : « Les attaquants n’ont accédé à aucune donnée au-delà de certains dépôts de code non critiques. Ni nos services hébergés, ni les données utilisateurs gérées, ni aucun de nos environnements de recherche et de test n’ont été compromis. » Autrement dit, si une partie du code source revendiquée par le vendeur peut éventuellement être authentique, elle ne concernerait que des dépôts secondaires, sans toucher aux modèles, aux données clients ou à la R&D de Mistral. Reste désormais à voir les données que publiera le vendeur s’il met ses menaces à exécution.

Article original, publié le 14 mai à 11h40 :

Et votre vie numérique devient sereine

Bitdefender Premium Security est une solution de cybersécurité européenne qui vous protège automatiquement contre les pirates et toutes les menaces du web. Profitez de vos activités en ligne en toute tranquillité

Mistral AI, le champion français de l’intelligence artificielle valorisé autour des 12 milliards d’euros, est l’un des rares contre-pouvoirs européens à OpenAI, Google et Anthropic. Mais si la pépite française de l’IA occupe l’actualité le 14 mai, ce n’est pas pour ses derniers modèles. Mistral au cœur d’une affaire de cybersécurité inquiétante : un vendeur affirme sur un forum cybercriminel détenir environ 5 Go de données internes attribuées à l’entreprise, incluant du code source, des outils internes et des projets clients.

À ce stade, rien n’a été confirmé publiquement par Mistral AI, ce qui nous encourage à parler au conditionnel : l’authenticité des données proposées à la vente n’a pas été vérifiée. Mais Mistral enquête, en parallèle, sur une attaque supply chain distincte. Les deux affaires pourraient être indépendantes ou liées. Numerama a contacté Mistral AI avant de publier cet article et le mettra à jour en cas de confirmation ou de démenti.

🔴🇫🇷 Mistral AI : un groupe de hackers revendique le vol d’environ 5 Go de dépôts internes et de code source, incluant près de 450 repositories privés liés à l’inférence, au fine-tuning et à plusieurs projets internes de l’entreprise.https://t.co/id98PtJuAg
— FrenchBreaches (@Frenchbreaches) May 13, 2026

Que disent les hackers sur le piratage de Mistral AI ?

Sur un forum cybercriminel, un vendeur affirme détenir environ 5 Go de données extraites des infrastructures internes de Mistral AI. Le tarif demandé pour une cession exclusive va jusqu’à 25 000 dollars, sans possibilité de vérifier l’information pour l’instant. En l’absence d’acheteur sous une semaine, le vendeur menace de publier gratuitement l’intégralité des fichiers.

Selon les déclarations du vendeur, le butin comprend près de 450 dépôts privés. La capture d’écran de la publication, diffusée par FrenchBreaches, laisse entrevoir une liste de fichiers dont les noms, s’ils sont authentiques, esquissent un inventaire complet de l’activité de Mistral :

Du code source d’inférence (mistral-inference-internal.tar.gz, mistral-inference-private.tar.gz) ;
Des outils de fine-tuning (mistral-finetune-internal.tar.gz, finetuning-feedback.tar.gz) ;
Des dashboards et plateformes internes (dashboard.tar.gz, website-v3.tar.gz) ;
Des projets expérimentaux et solutions à venir (devstral-cloud.tar.gz, typhoon.tar.gz, turbine.tar.gz, mistral-surge.tar.gz) ;
Des agents verticaux sectoriels (mistral_finance_agent.tar.gz, kyc-doc-agent.tar.gz, mistral-lawyer-internal.tar.gz) ;
Des fichiers qui pourraient correspondre à une réponse à un appel d’offres du laboratoire pharmaceutique américain Pfizer (pfizer-rfp-2025.tar.gz).

Capture d'écran partagée par FrenchBreaches. — Capture d’écran partagée par FrenchBreaches. // Source : FrenchBreaches

Si le contenu de ces fichiers se révèle authentique, les conséquences pour Mistral seraient lourdes. Une fuite de code source d’inférence donnerait des indications précieuses sur l’optimisation de ses modèles. Les outils de fine-tuning interne pourraient révéler la méthodologie du Français pour adapter ses modèles à des cas d’usage spécifiques, l’un de ses arguments commerciaux principaux face à OpenAI ou Anthropic. Et les noms de fichiers évoquant des projets clients soulèveraient des questions de confidentialité commerciale délicates.

Reste une réalité : ce type de revendication doit être manipulé avec énormément de précaution. Les forums cybercriminels regorgent de fausses offres ou massivement exagérées, certaines composées de données publiques repackagées, d’autres provenant de fuites antérieures. Il est difficile de savoir si Mistral est vraiment victime d’un piratage massif.

Mistral enquête sur un incident de sécurité… mais le lien reste à établir

Si Mistral n’a pas réagi à la revendication des 5 Go, l’entreprise a en revanche publié le 12 mai un advisory de sécurité officiel. L’entreprise reconnaît avoir été affectée par une attaque supply chain liée à la compromission de TanStack, une bibliothèque open source très utilisée par les développeurs JavaScript. L’attaque a contaminé plus de 170 packages sur npm et PyPI entre le 11 et le 12 mai, dont les SDK officiels de Mistral.

Mistral affirme que « l’enquête en cours indique qu’un appareil de développeur affecté a été impliqué » et qu’il n’y a « aucune indication que l’infrastructure de Mistral ait été compromise ». Plusieurs internautes y voient un lien évident avec la revendication du piratage de son code source, mais ce n’est pas forcément le cas.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Le futur n’attend pas : anticipez l’avenir des nouvelles technologies et de l’IA en lisant gratuitement ToujoursPlus, chaque jeudi dans votre boîte mail !

Tout comprendre à La guerre de l’IA