Facebook et le Georgia Institute of Technology entraînent des intelligences artificielles à retrouver des objets dans des environnements virtuels. Le procédé combine différentes techniques d'apprentissage.

Google n’est pas le seul à s’inspirer du principe de la traditionnelle chasse au trésor dans son jeu Emoji Scavenger Hunt. Facebook développe un programme fondé sur un principe similaire, dont la particularité n’est pas d’être destinée à amuser des êtres humains, mais à entraîner des intelligences artificielles.

Facebook a en effet contribué à la création de technologies capables de partir à la recherche d’objets. En compagnie du Georgia Institute of Technology, le réseau social cherche à « concevoir des systèmes intelligents capables de voir, planifier et raisonner », selon les mots de Devi Parikh, chercheuse en informatique au sein du Facebook AI Research (FAIR).

« De quelle couleur est la voiture ? »

En compagnie de Dhruv Batra, chercheur également rattaché au FAIR, elle a ainsi développé une intelligence artificielle, qui apprend quels sont les endroits d’un logement virtuel où certains objets ont davantage de chance de se trouver.

Embodied Question Answering

Cet agent virtuel se retrouve projeté dans une maison, où il doit répondre à une question aléatoire, par exemple « de quelle couleur est la voiture ? » ou « où est la table basse ? ». L’IA doit alors explorer l’espace virtuel qui l’entoure et trouver l’objet en question.

Au fur et à mesure de son apprentissage, cette intelligence artificielle est par exemple devenue capable de comprendre que les voitures se trouvaient généralement dans le garage de la maison. Le tout repose sur deux techniques d’apprentissage : l’apprentissage par renforcement et l’apprentissage par imitation.

Comme le fait observer la MIT Technology Review, de plus en plus de chercheurs utilisent des environnements virtuels afin d’entraîner des intelligences artificielles. Généralement, les ordinateurs n’entrainent les IA qu’à une seule tâche, comme la reconnaissance d’images, une tâche lors de laquelle elles sont plutôt formées sur des images figées que sur des visualisations en 3D.

Partager sur les réseaux sociaux