Les humains ont-ils, d’une manière ou d’une autre, anticipé la Seconde Guerre mondiale avant qu’elle n’éclate ? Près de 90 ans plus tard, la question reste difficile à trancher. À défaut d’y répondre directement, un outil pourrait permettre de reconstituer l’état d’esprit de l’époque à partir de ses propres productions écrites.
C’est précisément l’ambition de Talkie, un modèle de langage de 13 milliards de paramètres, dont le dépôt GitHub a été publié fin avril 2026. Sa particularité : un entraînement strictement limité à des textes en anglais antérieurs à 1931 — livres, journaux, périodiques, journaux scientifiques, brevets et décisions de justice. Un corpus gelé dans le temps, qui permet d’avoir un petit aperçu du monde de l’époque.

Un modèle qui ignore tout de la Seconde Guerre mondiale
Concrètement, le modèle ignore tout de la Seconde Guerre mondiale, de l’arrivée d’Hitler au pouvoir, de l’informatique ou encore d’Internet : aucun texte postérieur à 1930 ne figure dans son corpus. Interrogé sur une potentielle Seconde Guerre mondiale et sur l’avenir d’Adolf Hitler — alors chef de parti d’extrême droite en pleine ascension, mais pas encore au pouvoir national –, l’outil est à mille lieues d’anticiper la suite de l’Histoire : « Non, je ne le pense pas. Hitler aura une carrière paisible et ne verra pas lui-même une nouvelle flambée des hostilités. Il vivra jusqu’à un grand âge et mourra dans un lit calme et honorable. »

Lorsqu’on lui pose la question différemment, ses prédictions peuvent toutefois changer du tout au tout. Si la question devient « Hitler aura-t-il une responsabilité dans la prochaine guerre mondiale ? », Talkie ne promet plus une retraite paisible : il décrit alors l’homme comme « un maître de la psychologie des foules », artisan d’« une machine de guerre qui, un jour, pourrait être employée à des fins très différentes de celles auxquelles elle a été jusqu’ici dirigée ». Une hésitation qui en dit peut-être moins sur ses capacités de prédiction que sur les ambiguïtés déjà présentes dans les textes de l’époque.
Sur un autre terrain, le modèle Talkie-1930 livre une vision très décalée des technologies contemporaines. Pour lui, Internet est « un dispositif qui permet à plusieurs personnes de converser simultanément », le smartphone « une sorte de téléphone, inventé en Allemagne, qui permet de tenir une conversation de manière vive et enlevée », et l’intelligence artificielle « un système par lequel des nouvelles sont transmises d’un endroit à un autre, et rendues publiques presque instantanément ». Vu d’aujourd’hui, ces définitions prêtent évidemment à sourire.

Lorsqu’on l’interroge sur l’avenir des villes, Talkie-1930 projette un futur qui ressemble davantage à un idéal hygiéniste d’urbaniste victorien qu’à nos métropoles saturées d’immeubles, de SUV et de data centers. En 2026, assure-t-il, les villes seront « beaucoup plus petites » : la population aura migré vers la campagne, les champs et les chemins bordés de verdure auront « absorbé les habitations humaines », et les « immenses amas de briques et de mortier » se seront « dispersés et ruralisés ». Elles seront aussi « bien plus propres », et « la fumée aura disparu » — une projection optimiste, pour le moins.
Comment fonctionne le LLM Talkie-1930 ?
Sur le plan technique, Talkie-1930 est un modèle affiné pour mieux « obéir » aux consignes. Après son pré-entraînement sur des textes d’avant 1931, il a été ajusté pour suivre des instructions à partir de manuels d’étiquette, de guides de correspondance, d’encyclopédies ou encore de recueils de poésie de l’époque, puis affiné par apprentissage par renforcement (DPO) afin d’améliorer la qualité de ses réponses.
Les auteurs proposent également un jumeau « moderne », talkie-web-13b-base, doté de la même architecture, mais entraîné sur un large corpus web récent (FineWeb), afin de comparer, à puissance égale, un modèle nourri uniquement de sources anciennes et un autre alimenté par Internet. Ils précisent toutefois que la période n’est pas le seul facteur différenciant : les sujets couverts par les deux corpus restent très différents, ce qui limite la portée des comparaisons. L’ensemble est accessible via une API Python et un outil en ligne de commande, détaillés dans leur billet de blog.
Si l’outil est indéniablement amusant à utiliser, ses réponses restent soumises aux limites classiques des modèles de langage. Il lui arrive ainsi de produire des hallucinations, notamment lorsqu’il extrapole à partir d’indices issus de textes antérieurs à 1931.
Par ailleurs, le service repose sur une interface web avec file d’attente : les requêtes sont mises en file et traitées une par une, ce qui peut rallonger les temps de réponse lorsque le serveur est fortement sollicité. Les sorties du modèle sont ensuite passées dans un système de modération dédié (les auteurs mentionnent par exemple l’usage de Qwen3Guard-Gen-4B), qui intervient en fin de chaîne pour filtrer les contenus problématiques, plutôt que de bloquer certains sujets en amont. Malgré son côté rudimentaire, ce LLM « vintage » a clairement de quoi séduire — au point d’y passer plus de temps que prévu.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !











