On reproche parfois aux intelligences artificielles génératives d’être très bavardes. Demandez leur de construire un échange avec vous, et elles vous tartinent de texte. Au fil des ans, les concepteurs de modèles d’IA ont tenté de contenir cette propension à produire quatre paragraphes de réponse alors qu’un seul aurait pu suffire. Mais ce n’est pas toujours probant.
Côté programmation, cette production à rallonge a aussi pu être observée. Au lieu de se contenter de corriger un petit bug, comme cela lui avait été demandé au départ, l’assistant de code peut de temps en temps s’emballer — et réécrire dans la foulée la moitié de votre application, installer trois outils obscurs et créer plusieurs fichiers dont vous n’avez pas l’utilité.

On exagère évidemment, mais c’est pour mieux souligner la motivation qui a présidé à la création d’un projet open source étonnant : Ponytail (ou queue de cheval, en anglais). L’idée ? Contrer le syndrome de « générateur de code au kilomètre » qui saisit parfois certains chatbots. L’objectif ? Miser sur un agent IA qui cherche à en faire le moins possible.
C’est là que la référence à la queue de cheval prend tout son sens : le projet joue en effet avec l’image d’Épinal de l’informaticien qui se coiffe ainsi, porte des lunettes ovales et se fait le partisan du moindre effort. Il ne s’agit pas de ne pas travailler, mais de proposer un code fonctionnel efficace, avec juste ce qu’il faut.


« Vous le connaissez », s’en amuse la description. C’est cet informaticien qui est dans l’entreprise depuis un paquet d’années et qui, lorsque « vous lui montrez cinquante lignes de code, les regarde, ne dit rien et les remplace par une seule ». Eh bien, c’est justement ce savoir-faire que Ponytail désire appliquer à l’IA générative.
Trois règles strictes pour calmer le zèle de la machine
« Votre agent IA va se mettre à penser comme le développeur senior le plus paresseux de la salle », promet Dietrich Gebert, le propriétaire de la page GitHub sur laquelle est proposé Ponytail. Et l’outil agit en somme comme un filtre ou un guide de bonne conduite pour les IA, au lieu de les laisser se disperser et faire de la sur-ingénierie logicielle.
Ainsi, au lieu de les laisser dériver vers des solutions trop complexes, il fixe des règles strictes :
- Interdiction de réinventer la roue : si le langage de programmation possède déjà une fonction native pour accomplir une tâche, l’IA a l’obligation de l’utiliser. Pas question d’écrire vingt lignes de code sur mesure ou d’installer une extension obscure quand l’outil de base fait déjà le travail.
- Le mantra du YAGNI (You Aren’t Gonna Need It) : L’IA ne doit pas coder une fonctionnalité au cas où on en aurait besoin dans six mois. Si ce n’est pas demandé expressément pour le problème actuel, cela n’existe pas.
- La chasse au gras : Via des commandes spécifiques, l’outil force l’IA à analyser le projet existant pour traquer le superflu et lui demander : « Regarde tout ce qu’on peut supprimer pour que ce soit plus léger. »
Selon les mesures internes faites par Dietrich Gebert, Ponytail sabre avec efficacité. On parle de 80 à 94 % de code en moins, de coûts en baisse de 47 à 77 % (pour l’usage payant des modèles) et de gains de vitesse multipliés par trois à six. Ces mesures sont basées sur dix essais à travers plusieurs modèles d’IA d’Anthropic (Haiku, Sonnet et Opus).

Moins de lignes, moins de frais
Même s’il faut évidemment prendre ces données avec les pincettes d’usage propres à un échantillon aussi réduit, la tendance est là. En forçant les modèles à la diète, on réduit le nombre de jetons (tokens) échangés avec les serveurs. Résultat : la facture s’allège et l’IA répond au quart de tour.
Au-delà des économies de temps et d’argent, Ponytail pose surtout une question cruciale à l’ère des assistants virtuels. À force de laisser des algorithmes ultra-zélés générer des kilomètres de lignes à la chaîne, le risque est grand de voir les logiciels se transformer en usines à gaz indéboulonnables et difficiles à maintenir pour des humains.
En somme, ce projet open source vise surtout à rappeler une règle d’or de conception que les machines ont tendance à zapper à l’heure de l’inflation de l’IA : le principe KISS (Keep It Simple, Stupid, soit garde ça simple, idiot). Parce que, comme le glisse Dietrich Gebert, « le meilleur code est le code que vous n’écrivez pas. »
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !











