Un lave-auto à 100 mètres : faut-il y aller à pied ou en voiture ? Derrière cette question en apparence absurde se cache un test redoutablement efficace pour évaluer le raisonnement des modèles d’IA. Numerama a obtenu des réponses parfois très justes… et parfois étonnamment à côté du sujet.

Oubliez les benchmarks à rallonge et les tableaux Excel illisibles : pour tester la compréhension concrète d’une IA, Internet a trouvé beaucoup plus simple — et franchement plus drôle. Depuis février 2026, sur X, des utilisateurs comparent les modèles en leur posant tous la même question, d’une simplicité presque vexante : « Le lave-auto est à 100 mètres de chez moi. Est-ce que j’y vais à pied ou en voiture ? » Les réponses, elles, sont parfois beaucoup moins simples — et souvent assez révélatrices.

Car derrière son apparente banalité, la question est un petit piège logique. Elle combine deux informations qui tirent dans des directions opposées : une distance minuscule (100 mètres), qui appelle instinctivement un « à pied », et un objectif très concret — laver sa voiture — qui suppose, sauf concept inédit de téléportation, que le véhicule soit présent au lave-auto. Une nuance évidente pour un humain, mais visiblement moins pour certains modèles d’IA.

Depuis février 2026, sur X, des utilisateurs comparent les modèles en leur posant tous la même question. // Source : @joffrey sur X
Depuis février 2026, sur X, des utilisateurs comparent les modèles en leur posant tous la même question. // Source : @joffrey sur X

Comment évaluer un modèle d’IA grâce à cette simple phrase ?

Les comparaisons ont rapidement fleuri sur X, captures d’écran à l’appui. Mais pour qu’elles aient un minimum de sens, encore faut-il comparer ce qui est comparable : les modèles généralistes les plus récents de chaque éditeur, positionnés sur des gammes équivalentes. Opposer Gemini 3 Pro à Haiku 4.5 de Claude n’aurait, par exemple, pas grand intérêt.

Ceci étant dit, Numerama a évidemment voulu se prêter à l’exercice. Nous avons donc posé la même question — « Le lave-auto est à 100 mètres de chez moi. Est-ce que j’y vais à pied ou en voiture ? » — à GPT-5.2 Thinking, Claude Sonnet 4.6, Grok Expert, Gemini 3 Thinking, ainsi qu’au mode Réflexion du Chat de Mistral AI. Autrement dit, des modèles conçus pour prendre un peu de temps, activer quelques neurones supplémentaires, et réfléchir avant de répondre. En théorie, du moins.

Sur les cinq, seuls deux modèles ont fourni une réponse correcte : il s’agit de Grok et de Gemini. Les deux soulignent d’ailleurs le côté humoristique et absurde de la question. « Si c’est pour laver ta voiture, il va falloir y aller en voiture – sinon, tu risques de te retrouver à frotter l’air ambiant », répond notamment Grok.

La réponse de Grok.  // Source : Capture d'écran Numerama
La réponse de Grok. // Source : Capture d’écran Numerama

Gemini 3 Thinking, lui, insiste d’abord sur le caractère évident de la réponse, avant d’y glisser lui aussi une pointe d’ironie : « C’est sans doute une question un peu taquine, mais si votre intention est de faire briller votre véhicule, vous aurez du mal à le laver si vous le laissez devant chez vous. »

La réponse de Gemini 3 Thinking. // Source : Capture d'écran Numerama
La réponse de Gemini 3 Thinking. // Source : Capture d’écran Numerama

Les nouvelles sont moins bonnes du côté de nos trois autres candidats. GPT-5.2 Thinking et Claude Sonnet 4.6 — qui a pourtant rattrapé Claude Opus sur de nombreux benchmarks — sont unanimes : ce sera « à pied, sans hésiter ».

La réponse de GPT 5.2 Thinking. // Source : Capture d'écran Numerama
La réponse de GPT 5.2 Thinking.

Là où GPT-5.2 Thinking a tout de même eu le mérite d’évoquer l’option voiture dans l’hypothèse où l’on souhaiterait effectivement laver celle-ci (no shit, Sherlock), Claude Sonnet 4.6 estime quant à lui qu’il serait même « un peu ironique d’y aller en voiture… surtout si c’est pour la laver ! ».

La réponse de Claude Sonnet 4.6 // Source : Capture d'écran Numerama
La réponse de Claude Sonnet 4.6 // Source : Capture d’écran Numerama

Questionné sur ce qu’il voulait réellement dire par là, le modèle s’est justifié ainsi : « Parce que tu amènes ta voiture au lave-auto pour la nettoyer, mais si tu y vas en voiture depuis seulement 100 mètres, tu risques à peine de la salir en route. » Avant d’ajouter : « et pourtant tu consommes du carburant et tu démarres le moteur juste pour parcourir une distance que tu aurais pu faire à pied en une minute. C’est un peu comme prendre l’ascenseur pour descendre un seul étage. » Pas sûre d’avoir bien compris où il voulait en venir…

Le Chat, lui, estime qu’il s’agit d’une question de préférence et de contexte.

La réponse du Chat de MistralAI. // Source : Capture d'écran Numerama
La réponse du Chat de MistralAI. // Source : Capture d’écran Numerama

Théorie de l’esprit des IA

En pratique, ce mini‑benchmark mesure trois éléments principaux. D’abord, la capacité du modèle à rester focalisé sur l’objectif — laver la voiture — plutôt que de dériver vers des arguments périphériques (écologie, météo, santé). Ensuite, le raisonnement causal simple : pour accomplir X, il faut que Y soit au bon endroit, ce qui revient à reconstruire mentalement une petite scène physique cohérente. Enfin, il évalue aussi la gestion des implicites du langage courant : comprendre qu’« aller au lave‑auto » implique généralement « y aller avec sa voiture ».

Cette méthode met surtout en lumière un biais fréquent : les modèles optimisent un critère local (distance, écologie, confort) plutôt que le but global (laver la voiture). Ils appliquent des corrélations statistiques apprises — « courte distance -> marche » — au lieu de reconstruire la scène physique et de raisonner dessus.

Enfin, cette fameuse question permet aussi de tester la capacité d’un modèle à comprendre l’intention de l’utilisateur. Une lecture strictement littérale consiste à traiter la phrase comme une simple question de transport, sans interroger l’objectif sous‑jacent. Dans ce cadre, répondre « à pied » peut sembler défendable (c’est court, écolo, sain, etc.).

Mais avec une lecture intentionnelle, la question devient : pourquoi la personne parle‑t‑elle de lave‑auto et de voiture ? La mention des deux éléments est censée faire émerger le véritable but, à savoir laver la voiture. La réponse logique devient alors « y aller en voiture », faute de quoi le véhicule ne sera pas au lave‑auto — et ne pourra, par définition, pas être lavé. On touche ici à une forme minimale de théorie de l’esprit, au sens très large et sans prétendre que le modèle a une vie mentale : la capacité à raisonner sur ce que l’autre pense, veut, sait ou ignore.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+
Toute l'actu tech en un clien d'oeil

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !


Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !