Microsoft vient d'accomplir un bel exploit. Une équipe de chercheurs spécialisée dans l'IA a réalisé ce qu'aucun homme n'a jamais pu faire : atteindre les 999,990 points sur Ms Pac-Man grâce à un système de réseaux neuronaux.

Les intelligences artificielles n’en finissent plus de se développer, réalisant des prouesses pratiquement impossible pour l’Homme. Une étude annonce même que d’ici 50 ans, les IA auront dominé les humains dans tous les domaines.

En attendant, c’est dans le jeu vidéo qu’une IA développée par les équipes de Maluuba — la startup canadienne, filière « deep learning » de Microsoft, acquise en janvier dernier — s’est distinguée, atteignant le score de 999.990 points au classique Ms Pac Man de 1981.

Un jeu choisi spécialement pour sa difficulté, puisqu’aucun être humain n’a réussi à atteindre ce score parfait. Pour pouvoir l’atteindre, les ingénieurs ont créé un logiciel pour la version Atari 2600 qui divise le jeu en différentes parties afin que les algorithmes puissent les résoudre individuellement.

Diviser pour mieux régner

La méthodologie de développement suivie s’appelle « Hybrid Reward Architecture » et compte près de 150 agents analysant le jeu. Ceux-ci vont ensuite suivre une organisation proche de l’entreprise, avec une IA « chef » qui reçoit les suggestions de tous les autres algorithmes. Ils vont ensuite être triés par rapport à la direction qu’ils choisissent, mais également grâce la confiance qu’ils ont dans leur décision, comme l’explique Microsoft dans sa note de blog : « Par exemple, si 100 agents voulaient aller à droite parce que c’était le meilleur chemin pour Pac Man, mais que trois voulaient aller à gauche parce qu’il y avait un fantôme à droite, il donnerait plus de poids à ceux qui avaient remarqué le fantôme, et donc irait à gauche.  »

Harm Van Seijen, un des chercheurs de l’équipe de Maluuba et auteur d’un papier revenant sur l’expérience, a jugé que les meilleurs résultats ont été obtenus lorsque les algorithmes agissaient de manière égoïste, uniquement focalisés sur leur principal objectif : « Il y a cette bonne interaction entre la manière dont, d’une part, ils doivent coopérer en fonction des préférences de tous les agents, mais en même temps, chaque agent ne s’occupe que d’un problème particulier […] Cela profite à l’ensemble. »

Certains pourraient considérer cette technique comme de la triche, mais elle reste des plus impressionnantes au vu de la complexité du jeu choisi. D’autant que cette étape dans le développement des réseaux de neurones artificiels est importante, car elle permettrait des avancées significatives pour résoudre des problèmes encore plus complexes, comme certaines maladies.

Partager sur les réseaux sociaux