Face à des factures imprévisibles, une nouvelle génération d’outils s’impose pour reprendre le contrôle, tandis que l’open source et les modèles low cost rebattent déjà les cartes du marché de l’IA.

Pendant des mois, dans la Silicon Valley, consommer toujours plus d’IA était presque devenu un objectif en soi. Cette course à l’usage, baptisée « tokenmaxxing », reposait sur une idée simple : plus un salarié utilisait des modèles comme GPT ou Claude, plus il était productif.

Mais cette logique est en train de se fissurer, rattrapée par une réalité beaucoup plus concrète : la facture.

Car derrière les promesses d’efficacité, l’économie des tokens s’avère bien plus instable que prévu. Plusieurs entreprises découvrent que leurs coûts explosent, non pas parce que les prix unitaires augmentent, ils baissent, mais parce que les usages deviennent plus complexes. Requêtes plus longues, automatisations multiples, chaque tâche consomme davantage de tokens, souvent sans visibilité claire.

Une question simple revient alors en boucle : « combien de tokens me reste-t-il ? » et surtout, combien cela va-t-il coûter à la fin du mois.

Le problème est d’autant plus aigu que les modèles économiques évoluent. La transition vers une tarification à l’usage rend les dépenses imprévisibles. Selon Reuters qui a consacré un papier sur ces problématiques le 29 juin 2026, certaines entreprises, comme Uber, ont même dû freiner brutalement l’adoption d’outils d’IA après avoir épuisé leur budget annuel en quelques mois.

Face à cette dérive, un changement de stratégie s’opère et de nouveaux acteurs font leur apparition.

Fin juin, Microsoft aurait commencé à annuler la plupart de ses licences Claude Code, estimant que certains usages d’agents IA reviennent désormais plus cher que le travail humain. // Source : Numerama / Microsoft
Fin juin, Microsoft aurait commencé à annuler la plupart de ses licences Claude Code, estimant que certains usages d’agents IA reviennent désormais plus cher que le travail humain. // Source : Numerama / Microsoft

Les grands gagnants de cette réorganisation

De nombreux dirigeants de la tech, comme chez Microsoft, plaident désormais pour une approche plus pragmatique : réserver les modèles les plus puissants aux tâches critiques, et basculer le reste vers des alternatives moins coûteuses.

Ce virage ouvre un boulevard à l’open source, et à la concurrence chinoise. Des modèles comme ceux de DeepSeek ou le récent GLM-5.2, présenté comme capable de rivaliser avec les meilleurs modèles occidentaux rebattent les cartes. L’écart de performance se réduit, et l’argument du prix devient décisif.

En parallèle, tout un écosystème d’optimisation émerge. Des outils open source proposent par exemple de compresser les tokens avant même qu’ils n’atteignent le modèle, réduisant drastiquement la facture sans sacrifier les résultats.

D’autres s’appuient sur une logique de « routing », qui consiste à choisir le bon modèle au bon moment. C’est notamment le cas d’OpenRouter, une plateforme qui permet aux entreprises de faire transiter leurs requêtes vers différents modèles d’IA afin de choisir à chaque fois l’option la plus performante et la moins coûteuse. Selon une note de Citi citée par Reuters, la part des tokens open source traités via cet outil est ainsi passée de 34 % en janvier à 65 % en juin.

Une guerre des prix à l’approche des IPO

Cette pression sur les prix commence aussi à reconfigurer la stratégie des géants de l’IA. OpenAI comme Anthropic envisageraient des baisses significatives de leurs tarifs, notamment sur les tokens, dans un contexte de concurrence accrue, et à l’approche d’éventuelles introductions en bourse.

Le risque est évident : déclencher une guerre des prix qui rognerait les marges, au moment même où les investisseurs commencent à s’impatienter du retour sur investissement de l’IA.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !