Des développeurs travaillent sur une méthode d'apprentissage renforcé qui permet à des bots de communiquer entre eux en créant leur propre langage. Par ce biais, ils espèrent offrir la possibilité à ces IA de tenir de vraies conversations avec l'homme.

Et si les chatbots apprenaient leur propre langue pour (enfin) parvenir à tenir de véritables conversations avec les humains plutôt que de tenter d’imiter notre langage ? C’est le parti-pris original adopté par Igor Mordatch, un roboticien ukrainien qui travaille à la création d’un langage propre à ces intelligences artificielles.

Mordatch, qui a rejoint OpenAI, le labo sur l’IA créé par Elon Musk et Sam Altman, conçoit des mondes virtuels où plusieurs bots n’ont d’autre choix que de se se déplacer et d’accomplir différentes actions pour atteindre un objectif commun, comme par exemple un point précis dans l’espace.

Les séances de simulation virtuelle se font dans un monde en deux dimensions qui prend la forme d’un carré blanc, où les bots sont respectivement représentés par un cercle rouge, vert ou bleu. Par ce biais, ils apprennent à utiliser des signes pour indiquer une action précise, un objet, un lieu ou d’autres bots. L’idée est que la formation poursuivie par les bots leur permette, à terme, de transposer ces techniques sur l’utilisation de langues comme l’anglais.

Connue sous le nom d’« apprentissage renforcé », cette méthode repose principalement sur des essais et des erreurs sur lesquels les bots s’appuient pour éviter leur répétition et atteindre leur objectif. Il s’agit de la même technique que celle utilisée par AlphaGo, l’IA de Google redoutable au jeu de go.

Une méthode plus « humaine »

De cette manière, les chercheurs espèrent que les bots commenceront à s’appuyer sur une communication de plus en plus complexe et complète, ce qui pourrait les aider à comprendre plus profondément le sens du langage. Igor Mordatch explique ainsi : « Pour interagir de manière intelligente avec les hommes, mémoriser un schéma statistique ne suffit pas. Il faut que l’agent soit doté d’une compréhension de la langue pour utiliser celle-ci […] et atteindre des objectifs dans son environnement. »

L’équipe menée par Mordatch précise que ce type d’apprentissage est similaire à celui que nos lointains ancêtres ont utilisé pour apprendre à communiquer et interagir avec l’environnement pendant l’âge de pierre. Ce projet prend le contrepied de la méthode prisée par la majorité des développeurs à l’heure actuelle, qui préfèrent s’appuyer sur les réseaux de neurones artificiels et leur structure basée sur des statistiques et des codes mathématiques visant à reproduire le langage humain, sans envisager d’intégrer un langage « natif » propre aux bots.

Plus généralement, d’autres développeurs explorent de nouveaux moyens pour améliorer l’apprentissage des intelligences artificielles et leur permettre d’étendre leurs capacités d’interaction. Des ingénieurs de Google DeepMind ont ainsi conçu des IA capables de coopérer ou de se défier selon les situations tandis que d’autres ont développé un algorithme capable de « mémoriser » des actions pour pouvoir les réutiliser par la suite.

Partager sur les réseaux sociaux