Les Américains qui ont accès à la fonctionnalité AI Overviews de Google ont beaucoup relevé les errements de l’intelligence artificielle. Des problèmes admis en partie par l’entreprise américaine, mais aussi contestés. Malgré tout, la société annonce avoir apporté de nombreux changements dans le fonctionnement de son outil.

« Le fromage peut glisser de la pizza pour un certain nombre de raisons […] Vous pouvez également ajouter 1/8 de tasse de colle non toxique à la sauce pour la rendre plus collante. »

Cette allégation est fausse. Elle a pourtant été affirmée par AI Overviews, le nouvel outil de Google censé résumer avec l’intelligence artificielle de sa première page des résultats de son moteur de recherche. Lancé aux USA à la mi-mai après un an de test, l’outil a surtout marqué les esprits par ses divagations. D’autres exemples absurdes ont aussi été signalés, avec des captures d’écran à l’appui.

Ces égarements amusent beaucoup les Américains sur les réseaux sociaux ; d’autres en revanche sont préoccupés sur les dégâts que cela pourrait avoir en matière de désinformation. L’affaire, en tout cas, pose la question de la pertinence de l’accord signé en début d’année entre Google et Reddit, car le premier puise notamment dans le second pour nourrir AI overviews.

Sur Reddit, ça shitpost beaucoup aussi… et les délires des internautes sont parfois compris par l’IA au premier degré. // Source : Reddit

Deux semaines plus tard, Google a officiellement admis le problème dans un billet de blog publié le 30 mai. La responsable de la recherche, Liz Reid, a ainsi parlé « d’aperçus étranges et erronés », tout en minimisant l’ampleur du problème — l’intéressée a évoqué « un très grand nombre de captures d’écran truquées. »

Parmi les cas contestés figure celui du chien laissé dans l’habitacle d’une voiture. « Certains de ces résultats truqués étaient évidents et stupides. […] Ces [réponses] ne sont jamais apparues. Nous encourageons donc toute personne rencontrant ces captures d’écran à effectuer elle-même une recherche pour vérifier », a conseillé Liz Reid.

Google essaie de corriger le tir avec l’IA

Malgré tout, AI Overviews ne donne pas pleinement satisfaction et, au-delà des montages qui ont pu circuler en ligne, il y a effectivement des réponses qui ne sont pas convenables. D’où une série d’actions prises pour borner plus efficacement l’intelligence artificielle, afin d’éviter les sorties de route. Toutes les mesures n’ont pas été détaillées, mais il y a eu :

la mise au point de meilleurs mécanismes de détection pour les requêtes absurdes qui ne doivent donner de résumé par IA, et une limitation l’inclusion de contenu satirique et humoristique (pour éviter, par exemple, de manger une pierre par jour) ;

la mise à jour des systèmes afin de limiter l’utilisation de contenu généré par les utilisateurs dans les réponses susceptibles d’offrir des conseils trompeurs ;

l’ajout de restrictions de déclenchement pour les requêtes pour lesquelles les résumés par IA ne s’avéraient pas aussi utiles ;

Pour des sujets tels que l’actualité et la santé, des améliorations supplémentaires ont été apportées (dont la décision de ne pas faire de résumé par IA pour l’actualité la plus récente).

En tout, Google déclare avoir procédé à une douzaine de changements techniques dans ses systèmes pour ajuster globalement AI Overviews — au lieu de traiter spécifiquement au cas par cas chaque requête erronée. Selon l’entreprise américaine, cela permet aussi d’apporter une réponse pour des écarts qui n’ont pas encore été rapportés.

Mais Liz Reid insiste sur un point : AI Overviews n’a pas été lancé de façon inconsidérée.

« Nous avons testé la fonctionnalité de manière approfondie avant le lancement. Nous avons déployé des efforts considérables en matière de red-teaming, réalisé des évaluations avec des échantillons de requêtes d’utilisateurs types et effectué des tests sur une partie du trafic de recherche afin d’évaluer les performances », a-t-elle déclaré.

Seulement, tous les efforts de Google ne peuvent pas tenir la comparaison face à « des millions de personnes utiliser la fonctionnalité avec de nombreuses recherches inédites. » Et d’ajouter plus loin « qu’à l’échelle du web, avec des milliards de requêtes qui arrivent chaque jour, il y a forcément des bizarreries et des erreurs. »

(mise à jour du sujet pour actualiser l’introduction)

