Google a enseigné la curiosité à une intelligence artificielle capable de jouer à un jeu de plateforme, en ajoutant un système de récompenses qui la motive à explorer toujours plus loin.

Parce qu’ils sont souvent une simulation plus ou moins réaliste des mécaniques de la vie réelle, les jeux vidéo sont un bon terrain d’entrainement pour le développement des intelligences artificielles qui doivent apprendre à apprendre, et à ne pas répéter les mêmes erreurs. Google, comme d’autres, se sert donc aussi des jeux pour éduquer ses IA et inventer de nouvelles solutions.

Les équipes de Google DeepMind ont ainsi publié une nouvelle étude (.pdf) dans laquelle ils s’attaquent à la maîtrise par une IA du vieux jeu de plateforme Montezuma’s Revenge, sorti en 1984 sur consoles Atari 2600. Le titre n’a pas été choisi au hasard, mais parce qu’il est notoirement l’un des plus durs de toute l’histoire du jeu de plateforme et que la moindre erreur est immédiatement sanctionnée. Il exige par ailleurs que l’intelligence planifie à l’avance une série d’actions.

L’équipe avait déjà tentée il y a un an de lancer son IA sur le jeu, en lui livrant les commandes et le rendu de l’écran, sans aucune autre information. Mais l’intelligence artificielle s’était lamentablement plantée. Ils ont alors réfléchi au problème et compris que l’IA devait être « motivée » à explorer les différents écrans que compose le niveau — oui, à l’époque il n’y avait pas encore de scrolling. Les développeurs ont créé un système interne de récompenses, qui fait que l’IA est félicitée chaque fois qu’elle se rend à un endroit du jeu qu’elle n’avait encore jamais exploré.

Et le résultat est là. L’IA parvient à explorer 15 écrans quand elle reçoit un « bonus » pour ses nouvelles découvertes, alors qu’elle restait à deux écrans sans ce bonus.

Entre autres jeux, Google travaille aussi sur une IA pour Hearthstone et Hearthstone, et pourrait aussi s’attaquer aux meilleurs joueurs de Starcraft.

Partager sur les réseaux sociaux

Articles liés