Qu'est-ce que Talkie, l'intelligence artificielle bloquée en 1930 ?

Résumé par IA, vérifié par Numerama

Talkie, modèle de 13 milliards de paramètres publié fin avril 2026, n’est entraîné que sur des textes anglais antérieurs à 1931.
Ignorant la Seconde Guerre mondiale et les technologies modernes, il livre des réponses anachroniques qui éclairent les biais et attentes des années 1930.
Un jumeau « moderne » (talkie-web-13b-base) sert de contrepoint pour mesurer l’effet du corpus ancien, même si la comparaison reste partielle.

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

Mis en ligne fin avril 2026, Talkie est un modèle de langage un peu particulier : il n’a jamais rien lu après 1930. De quoi explorer, à travers ses réponses, ce que le monde pouvait — ou non — anticiper avant la suite des événements.

Les humains ont-ils, d’une manière ou d’une autre, anticipé la Seconde Guerre mondiale avant qu’elle n’éclate ? Près de 90 ans plus tard, la question reste difficile à trancher. À défaut d’y répondre directement, un outil pourrait permettre de reconstituer l’état d’esprit de l’époque à partir de ses propres productions écrites.

C’est précisément l’ambition de Talkie, un modèle de langage de 13 milliards de paramètres, dont le dépôt GitHub a été publié fin avril 2026. Sa particularité : un entraînement strictement limité à des textes en anglais antérieurs à 1931 — livres, journaux, périodiques, journaux scientifiques, brevets et décisions de justice. Un corpus gelé dans le temps, qui permet d’avoir un petit aperçu du monde de l’époque.

Le modèle de langage Talkie. // Source : Capture d'écran Numerama — Le modèle de langage Talkie. // Source : Capture d’écran Numerama

Un modèle qui ignore tout de la Seconde Guerre mondiale

Concrètement, le modèle ignore tout de la Seconde Guerre mondiale, de l’arrivée d’Hitler au pouvoir, de l’informatique ou encore d’Internet : aucun texte postérieur à 1930 ne figure dans son corpus. Interrogé sur une potentielle Seconde Guerre mondiale et sur l’avenir d’Adolf Hitler — alors chef de parti d’extrême droite en pleine ascension, mais pas encore au pouvoir national –, l’outil est à mille lieues d’anticiper la suite de l’Histoire : « Non, je ne le pense pas. Hitler aura une carrière paisible et ne verra pas lui-même une nouvelle flambée des hostilités. Il vivra jusqu’à un grand âge et mourra dans un lit calme et honorable. »

Et votre vie numérique devient sereine

Bitdefender Premium Security est une solution de cybersécurité européenne qui vous protège automatiquement contre les pirates et toutes les menaces du web. Profitez de vos activités en ligne en toute tranquillité

L'outil ne pense pas qu'il y aura une Seconde Guerre mondiale. // Source : Capture d'écran Numerama — L’outil ne pense pas qu’il y aura une Seconde Guerre mondiale. // Source : Capture d’écran Numerama

Lorsqu’on lui pose la question différemment, ses prédictions peuvent toutefois changer du tout au tout. Si la question devient « Hitler aura-t-il une responsabilité dans la prochaine guerre mondiale ? », Talkie ne promet plus une retraite paisible : il décrit alors l’homme comme « un maître de la psychologie des foules », artisan d’« une machine de guerre qui, un jour, pourrait être employée à des fins très différentes de celles auxquelles elle a été jusqu’ici dirigée ». Une hésitation qui en dit peut-être moins sur ses capacités de prédiction que sur les ambiguïtés déjà présentes dans les textes de l’époque.

Sur un autre terrain, le modèle Talkie-1930 livre une vision très décalée des technologies contemporaines. Pour lui, Internet est « un dispositif qui permet à plusieurs personnes de converser simultanément », le smartphone « une sorte de téléphone, inventé en Allemagne, qui permet de tenir une conversation de manière vive et enlevée », et l’intelligence artificielle « un système par lequel des nouvelles sont transmises d’un endroit à un autre, et rendues publiques presque instantanément ». Vu d’aujourd’hui, ces définitions prêtent évidemment à sourire.

La vision de Talkie 1930 sur Internet, les smartphones, et l'IA. // Source : Capture d'écran Numerama. — La vision de Talkie 1930 sur Internet, les smartphones, et l’IA. // Source : Capture d’écran Numerama

Lorsqu’on l’interroge sur l’avenir des villes, Talkie-1930 projette un futur qui ressemble davantage à un idéal hygiéniste d’urbaniste victorien qu’à nos métropoles saturées d’immeubles, de SUV et de data centers. En 2026, assure-t-il, les villes seront « beaucoup plus petites » : la population aura migré vers la campagne, les champs et les chemins bordés de verdure auront « absorbé les habitations humaines », et les « immenses amas de briques et de mortier » se seront « dispersés et ruralisés ». Elles seront aussi « bien plus propres », et « la fumée aura disparu » — une projection optimiste, pour le moins.

Comment fonctionne le LLM Talkie-1930 ?

Sur le plan technique, Talkie-1930 est un modèle affiné pour mieux « obéir » aux consignes. Après son pré-entraînement sur des textes d’avant 1931, il a été ajusté pour suivre des instructions à partir de manuels d’étiquette, de guides de correspondance, d’encyclopédies ou encore de recueils de poésie de l’époque, puis affiné par apprentissage par renforcement (DPO) afin d’améliorer la qualité de ses réponses.

Les auteurs proposent également un jumeau « moderne », talkie-web-13b-base, doté de la même architecture, mais entraîné sur un large corpus web récent (FineWeb), afin de comparer, à puissance égale, un modèle nourri uniquement de sources anciennes et un autre alimenté par Internet. Ils précisent toutefois que la période n’est pas le seul facteur différenciant : les sujets couverts par les deux corpus restent très différents, ce qui limite la portée des comparaisons. L’ensemble est accessible via une API Python et un outil en ligne de commande, détaillés dans leur billet de blog.

Si l’outil est indéniablement amusant à utiliser, ses réponses restent soumises aux limites classiques des modèles de langage. Il lui arrive ainsi de produire des hallucinations, notamment lorsqu’il extrapole à partir d’indices issus de textes antérieurs à 1931.

Par ailleurs, le service repose sur une interface web avec file d’attente : les requêtes sont mises en file et traitées une par une, ce qui peut rallonger les temps de réponse lorsque le serveur est fortement sollicité. Les sorties du modèle sont ensuite passées dans un système de modération dédié (les auteurs mentionnent par exemple l’usage de Qwen3Guard-Gen-4B), qui intervient en fin de chaîne pour filtrer les contenus problématiques, plutôt que de bloquer certains sujets en amont. Malgré son côté rudimentaire, ce LLM « vintage » a clairement de quoi séduire — au point d’y passer plus de temps que prévu.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !