Selon un article publié par The Verge à la mi-mai 2026, Microsoft aurait commencé à annuler la plupart de ses licences Claude Code. D’après des sources internes citées par le média américain, l’entreprise estimerait que certains usages d’agents IA coûtent désormais plus cher que le travail humain.

Depuis deux ans, le discours dominant chez les géants de la tech tient en une promesse : l’IA générative et les agents vont faire exploser la productivité tout en réduisant les coûts opérationnels.

Cette idée a longtemps été présentée comme une évidence. Mais plusieurs études sont depuis venues nuancer la prophétie : une automatisation excessive, accompagnée de licenciements massifs, pourrait fragiliser la consommation, voire contribuer à l’émergence d’un « PIB fantôme ».

Cette fois, pourtant, la douche froide ne vient pas du monde académique. Elle vient de Microsoft, l’une des entreprises les plus engagées dans la vague de l’IA. Selon un article publié par The Verge à la mi-mai 2026, la firme aurait commencé à annuler la plupart de ses licences directes Claude Code, tout en encourageant ses ingénieurs à utiliser à la place l’interface en ligne de commande de GitHub Copilot.

La raison présumée est particulièrement ironique : ces outils coûteraient désormais plus cher qu’un humain.

Microsoft fait machine arrière sur l’IA ?

Pour rappel, Microsoft avait commencé à ouvrir l’accès à Claude Code fin 2025, en invitant plusieurs milliers de ses propres développeurs à l’utiliser au quotidien. D’après le média américain, l’outil de programmation par IA d’Anthropic s’est rapidement imposé en interne — peut-être même un peu trop.

Claude Code. // Source : Anthropic
Claude Code. // Source : Anthropic

Son succès aurait notamment freiné la dynamique autour de GitHub Copilot CLI, le nouvel outil de Microsoft. Il s’agit d’une version en ligne de commande de GitHub Copilot, pensée pour fonctionner en dehors des environnements de développement classiques, comme Visual Studio Code.

Mais la concurrence interne n’expliquerait pas tout. Toujours selon The Verge, des documents et communications internes suggèrent que, dans certains scénarios, l’utilisation d’agents IA coûterait plus cher que des salariés humains chargés des mêmes tâches.

Officiellement, Microsoft aurait expliqué à ses employés vouloir faire de Copilot CLI le principal outil « agentique » en ligne de commande au sein de sa division Experiences + Devices. Mais, selon plusieurs sources internes citées par le média, la décision serait aussi largement financière.

Cette division, qui regroupe notamment les équipes chargées de Windows, Microsoft 365, Outlook, Microsoft Teams et Surface, réduirait ainsi progressivement son usage de Claude Code d’ici à la fin juin.

La date n’est pas anodine. Le 30 juin marque la fin de l’exercice fiscal en cours de Microsoft. L’annulation des licences Claude Code permettrait donc à l’entreprise de réduire rapidement certaines dépenses opérationnelles avant l’ouverture du nouvel exercice, en juillet, souligne The Verge.

Pour autant, cette annulation des licences Claude Code ne remettrait pas en cause les grands accords conclus entre Microsoft et Anthropic. Elle n’aurait aucune incidence sur l’accord Foundry, qui prévoit un investissement de Microsoft pouvant atteindre 5 milliards de dollars dans Anthropic, ni sur l’accès aux modèles Claude pour les clients de Foundry. Elle ne modifierait pas non plus l’engagement pris par Anthropic d’acheter pour 30 milliards de dollars de capacité de calcul Azure. Mais, reste que, cette décision marque peut-être le début d’un rétropédalage sur l’IA.

Microsoft n’est pas la seule entreprise à ralentir sur l’IA

Comme le souligne Fortune, Microsoft n’est pas la seule entreprise à lever le pied sur l’IA en interne. En avril 2026, Praveen Neppalli Naga, directeur technique d’Uber, expliquait à The Information que l’entreprise avait déjà consommé, en seulement quatre mois, l’intégralité de son budget 2026 consacré aux outils de programmation par IA.

Cette envolée des dépenses s’expliquerait notamment par la politique très volontariste menée par Uber en interne. L’entreprise avait encouragé ses équipes à utiliser massivement ces outils, allant jusqu’à établir des classements internes en fonction de leur niveau d’adoption de l’IA.

Ces signaux pourraient tempérer les espoirs placés par les géants de la tech dans cette technologie. Alors que certains continuent de promettre une « renaissance » de l’IA, le coût de son adoption reste un frein difficile à ignorer. Une réalité qui fait écho aux propos tenus récemment par Bryan Catanzaro, vice-président de l’apprentissage profond appliqué chez Nvidia, dans une interview accordée à Axios. « Pour mon équipe, le coût du calcul dépasse largement celui des employés », a-t-il déclaré.

Et, à y regarder de plus près, cela n’a rien de surprenant. Le cœur du problème tient à la manière dont les usages de l’IA sont facturés : au token et à l’appel de modèle. Chaque prompt, chaque réponse, chaque étape intermédiaire d’un agent IA consomme des tokens, facturés à l’usage. Or, un agent chargé d’orchestrer une tâche complexe ne sollicite pas un modèle une seule fois. Il peut le faire des dizaines, voire des centaines de fois, en boucle, souvent avec des contextes longs.

À petite échelle, sur des tâches simples, le modèle économique peut rester compétitif. Mais dès que l’on déploie des agents autonomes auprès de milliers d’employés, la consommation de tokens peut exploser bien plus vite que prévu. Selon Goldman Sachs — cité par plusieurs analystes financiers –,l’essor des agents pourrait multiplier par 24 la consommation mondiale de tokens d’ici 2030, pour atteindre environ 120 quadrillions de tokens par mois.

Goldman Sachs anticipe que l’essor des agents pourrait multiplier par 24 la consommation de tokens d’ici 2030. // Source : Goldman Sacha via Moomoo
Goldman Sachs anticipe que l’essor des agents pourrait multiplier par 24 la consommation de tokens d’ici 2030. // Source : Goldman Sachs via Moomoo

En parallèle, les prix unitaires des tokens baissent. Gartner estime qu’en 2030, pour les fournisseurs d’IA générative, le coût d’exécution d’inférences sur un modèle de langage de 1 000 milliards de paramètres sera plus de 90 % inférieur à celui de 2025. Intuitivement, on pourrait donc penser que cette baisse suffira à rendre l’IA massivement rentable.

Un calcul économique de l’IA trop optimiste

Mais deux dynamiques viennent compliquer ce raisonnement. D’abord, les fournisseurs n’ont aucune obligation de répercuter intégralement leurs gains d’efficacité sur les prix facturés aux clients. Ensuite, les agents IA consomment beaucoup plus de tokens par tâche qu’un simple chatbot. Le volume augmente donc fortement.

Résultat : même si chaque token coûte moins cher, la combinaison de tâches automatisées plus nombreuses, d’agents plus nombreux et d’une consommation plus élevée par tâche peut faire grimper la facture plus vite que les baisses de prix ne la compensent.

Selon Gartner, le coût d’exécution d’inférences sur un LLM de 1 000 milliards de paramètres sera plus de 90% inférieur à celui de 2025. // Source : Gartner
Selon Gartner, le coût d’exécution d’inférences sur un LLM de 1 000 milliards de paramètres sera plus de 90% inférieur à celui de 2025. // Source : Gartner

En filigrane, les informations autour de Microsoft rappellent que le calcul économique de l’IA a souvent été trop optimiste. Derrière le prix du token, il faut aussi compter la supervision humaine, la correction des erreurs, l’orchestration technique et l’itération permanente sur les processus. Mis bout à bout, ces coûts « invisibles » peuvent suffire à faire exploser la facture, jusqu’à dépasser parfois la masse salariale des humains que ces outils étaient censés remplacer.

L’épisode Claude Code montre surtout que, pour les entreprises, le vrai défi de l’IA ne sera bientôt plus seulement technologique. Il sera aussi comptable.



Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Pour ne rien manquer de l’actualité, suivez Numerama sur Google !