Dévoilé à la mi-juin 2026, GLM-5.2 talonne Claude Opus 4.8 et fait jeu égal avec, voire dépasse, GPT-5.5 sur certains benchmarks de code. Des performances qui propulsent ce modèle chinois sous les projecteurs, d’autant qu’il dispose d’un autre atout majeur : une licence ouverte, gratuite et auto-hébergeable.

C’est le tout dernier modèle de Z.ai, ex-Zhipu AI. La start-up chinoise vient de le publier, avec un timing difficilement plus opportun pour capter l’attention de l’écosystème IA.

Alors que Washington a interdit l’accès à Claude Fable 5 et Mythos aux utilisateurs étrangers, poussant Anthropic à retirer ses deux modèles, l’émergence d’une IA très performante, téléchargeable et exécutable localement, prend une tout autre dimension.

En temps normal, les performances techniques de GLM-5.2 auraient suffi à attirer l’attention. Mais sa structure à poids ouverts (open weights) intervient à un moment où la dépendance aux IA fermées américaines est de plus en plus remise en question, au point de propulser le modèle en tête des discussions sur Hacker News le 17 juin 2026.

GLM-5.2 se hisse à la quatrième place de l’Artificial Analysis Intelligence Index v4.1, derrière Claude Opus 4.8, GPT-5.5 et Claude Sonnet 4.6 // Source : Artificial Analysis
GLM-5.2 se hisse à la quatrième place de l’Artificial Analysis Intelligence Index v4.1, derrière Claude Opus 4.8, GPT-5.5 et Claude Sonnet 4.6 // Source : Artificial Analysis

Une mémoire de travail multipliée par cinq

Sorti le 13 juin, le modèle affiche 744 milliards de paramètres (dont environ 40 milliards actifs) et cible les tâches longues : construire un logiciel de bout en bout, explorer un dépôt complet ou maintenir un projet sur plusieurs heures.

Sa fenêtre de contexte atteint un million de tokens, contre 200 000 pour GLM-5.1. Deux modes de raisonnement, « Max » et « High », permettent d’arbitrer entre performance maximale et consommation de ressources.

Sur les benchmarks, GLM-5.2 s’impose comme l’un des modèles ouverts les plus performants à ce jour. Le cabinet Artificial Analysis lui attribue un score de 51 sur son indice d’intelligence, devant MiniMax-M3 et DeepSeek V4 Pro (44 chacun).

Sur FrontierSWE, un test conçu pour les projets techniques de long horizon, il atteint 74,4%, juste derrière Claude Opus 4.8 (75,1%) et devant GPT-5.5 (72,6%). Même dynamique sur SWE-bench Pro. Sur l’évaluation GDPval-AA v2, qui mesure la performance agentique en conditions réelles, il se hisse au niveau de GPT-5.5 en mode de raisonnement avancé.

Une licence qui pèse autant que les scores

Sur la partie « libre », Z.ai joue la carte maximale : GLM-5.2 est publié sous licence MIT et téléchargeable sur Hugging Face. N’importe quelle entreprise peut récupérer le modèle, le modifier, le commercialiser et le faire tourner sur ses propres serveurs sans verser de royalties à Z.ai.

À condition évidemment d’avoir les machines pour faire tourner un modèle de 744 milliards de paramètres, ce qui exclut d’emblée la plupart des particuliers et des petites structures.

Pour qui n’a pas cette capacité de calcul, l’accès passe par une API. Et là, l’usage reste payant : 1,40 dollar par million de tokens en entrée, 4,40 dollars en sortie. L’écart avec les modèles fermés demeure net : GPT-5.5 facture 5 et 30 dollars pour les mêmes volumes.

Une nuance importante concerne le coût réel à l’usage. GLM-5.2 se montre nettement plus bavard que ses concurrents directs en phase de raisonnement, avec environ 43 000 tokens générés par tâche, contre 26 000 pour GLM-5.1 et 24 000 pour MiniMax-M3.

Le coût par tâche accomplie peut donc dépasser celui de certains modèles ouverts concurrents, même si l’avantage face aux modèles fermés américains reste significatif.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !