Pendant des mois, dans la Silicon Valley, consommer toujours plus d’IA était presque devenu un objectif en soi. Cette course à l’usage, baptisée « tokenmaxxing », reposait sur une idée simple : plus un salarié utilisait des modèles comme GPT ou Claude, plus il était productif.
Mais cette logique est en train de se fissurer, rattrapée par une réalité beaucoup plus concrète : la facture.
Car derrière les promesses d’efficacité, l’économie des tokens s’avère bien plus instable que prévu. Plusieurs entreprises découvrent que leurs coûts explosent, non pas parce que les prix unitaires augmentent, ils baissent, mais parce que les usages deviennent plus complexes. Requêtes plus longues, automatisations multiples, chaque tâche consomme davantage de tokens, souvent sans visibilité claire.
Une question simple revient alors en boucle : « combien de tokens me reste-t-il ? » et surtout, combien cela va-t-il coûter à la fin du mois.


Le problème est d’autant plus aigu que les modèles économiques évoluent. La transition vers une tarification à l’usage rend les dépenses imprévisibles. Selon Reuters qui a consacré un papier sur ces problématiques le 29 juin 2026, certaines entreprises, comme Uber, ont même dû freiner brutalement l’adoption d’outils d’IA après avoir épuisé leur budget annuel en quelques mois.
Face à cette dérive, un changement de stratégie s’opère et de nouveaux acteurs font leur apparition.

Les grands gagnants de cette réorganisation
De nombreux dirigeants de la tech, comme chez Microsoft, plaident désormais pour une approche plus pragmatique : réserver les modèles les plus puissants aux tâches critiques, et basculer le reste vers des alternatives moins coûteuses.
Ce virage ouvre un boulevard à l’open source, et à la concurrence chinoise. Des modèles comme ceux de DeepSeek ou le récent GLM-5.2, présenté comme capable de rivaliser avec les meilleurs modèles occidentaux rebattent les cartes. L’écart de performance se réduit, et l’argument du prix devient décisif.
En parallèle, tout un écosystème d’optimisation émerge. Des outils open source proposent par exemple de compresser les tokens avant même qu’ils n’atteignent le modèle, réduisant drastiquement la facture sans sacrifier les résultats.
D’autres s’appuient sur une logique de « routing », qui consiste à choisir le bon modèle au bon moment. C’est notamment le cas d’OpenRouter, une plateforme qui permet aux entreprises de faire transiter leurs requêtes vers différents modèles d’IA afin de choisir à chaque fois l’option la plus performante et la moins coûteuse. Selon une note de Citi citée par Reuters, la part des tokens open source traités via cet outil est ainsi passée de 34 % en janvier à 65 % en juin.
Une guerre des prix à l’approche des IPO
Cette pression sur les prix commence aussi à reconfigurer la stratégie des géants de l’IA. OpenAI comme Anthropic envisageraient des baisses significatives de leurs tarifs, notamment sur les tokens, dans un contexte de concurrence accrue, et à l’approche d’éventuelles introductions en bourse.
Le risque est évident : déclencher une guerre des prix qui rognerait les marges, au moment même où les investisseurs commencent à s’impatienter du retour sur investissement de l’IA.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !











