DeepMind et une université londonienne ont développé un algorithme qui permet à une IA de se doter d'une forme de mémoire. Celle-ci lui a permis d'apprendre à jouer à 10 jeux vidéo d'Atari à la suite, en s'appuyant sur ses connaissances précédentes. Une véritable avancée.

DeepMind, la filiale de Google dédiée à l’intelligence artificielle, a démontré ce derniers mois l’importance, pour ses IA, de « rêver » comme de puiser dans ses souvenirs.  Elle vient de réaliser une avancée encore plus poussée en la matière grâce à un nouvel algorithme conçu avec l’aide de l’Imperial College London, nommé « Elastic Weight Consolidation » (EWC).

En recourant à l’intelligence artificielle Deep Q-Network (déjà utilisée pour d’autres tests effectués sur des jeux Atari), les développeurs se sont inspirés du processus d’apprentissage du système neuronal humain. Et plus précisément de celui qui concerne les connexions synaptiques, qui permettent de mémoriser les éléments appris dans une situation donnée (comme l’apprentissage d’une activité) pour les utiliser par la suite dans un autre contexte.

Concrètement, jusqu’ici, un nouveau réseau neuronal devait être créé spécifiquement pour chaque jeu. Le même ne pouvait pas s’attaquer à Space Invaders puis à Breakout si on ne lui fournissait pas ces deux informations différentes en même temps. Désormais, grâce à l’algorithme, le réseau est capable de mémoriser ces informations pour réutiliser celles qui lui semblent le plus pertinentes et ainsi s’adapter à chaque jeu, aussi différents soient-ils.

Un apprentissage moins performant

James Kirkpatrick, l’auteur de l’étude, souligne : « Auparavant, nous avions un système qui pouvait jouer à n’importe quel jeu mais était limité à celui-ci. Là, nous faisons la démonstration d’un système capable d’apprendre à jouer à différents jeux les uns après les autres. »

Néanmoins, l’algorithme présente encore d’importantes lacunes : il est notamment bien moins performant qu’une IA dédiée à un usage unique. Une faiblesse reconnue par James Kirkpatrick : « À l’heure actuelle, nous avons démontré l’apprentissage séquentiel mais il reste à prouver qu’il améliore l’efficacité de la formation. Les prochaines étapes vont consister à essayer d’utiliser cet apprentissage séquentiel pour améliorer l’apprentissage du monde réel. »

L’équipe affirme que ce type de recherche pourrait également bénéficier à la neuroscience, car le rapprochement toujours plus poussé des IA avec la complexité d’un cerveau humain permettent de mieux appréhender celui-ci.

Partager sur les réseaux sociaux