DeepMind et une université londonienne ont développé un algorithme qui permet à une IA de se doter d’une forme de mémoire. Celle-ci lui a permis d’apprendre à jouer à 10 jeux vidéo d’Atari à la suite, en s’appuyant sur ses connaissances précédentes. Une véritable avancée.

DeepMind, la filiale de Google dédiée à l’intelligence artificielle, a démontré ce derniers mois l’importance, pour ses IA, de « rêver » comme de puiser dans ses souvenirs.  Elle vient de réaliser une avancée encore plus poussée en la matière grâce à un nouvel algorithme conçu avec l’aide de l’Imperial College London, nommé « Elastic Weight Consolidation » (EWC).

En recourant à l’intelligence artificielle Deep Q-Network (déjà utilisée pour d’autres tests effectués sur des jeux Atari), les développeurs se sont inspirés du processus d’apprentissage du système neuronal humain. Et plus précisément de celui qui concerne les connexions synaptiques, qui permettent de mémoriser les éléments appris dans une situation donnée (comme l’apprentissage d’une activité) pour les utiliser par la suite dans un autre contexte.

Concrètement, jusqu’ici, un nouveau réseau neuronal devait être créé spécifiquement pour chaque jeu. Le même ne pouvait pas s’attaquer à Space Invaders puis à Breakout si on ne lui fournissait pas ces deux informations différentes en même temps. Désormais, grâce à l’algorithme, le réseau est capable de mémoriser ces informations pour réutiliser celles qui lui semblent le plus pertinentes et ainsi s’adapter à chaque jeu, aussi différents soient-ils.

space-invaders

Un apprentissage moins performant

James Kirkpatrick, l’auteur de l’étude, souligne : « Auparavant, nous avions un système qui pouvait jouer à n’importe quel jeu mais était limité à celui-ci. Là, nous faisons la démonstration d’un système capable d’apprendre à jouer à différents jeux les uns après les autres. »

Néanmoins, l’algorithme présente encore d’importantes lacunes : il est notamment bien moins performant qu’une IA dédiée à un usage unique. Une faiblesse reconnue par James Kirkpatrick : « À l’heure actuelle, nous avons démontré l’apprentissage séquentiel mais il reste à prouver qu’il améliore l’efficacité de la formation. Les prochaines étapes vont consister à essayer d’utiliser cet apprentissage séquentiel pour améliorer l’apprentissage du monde réel. »

L’équipe affirme que ce type de recherche pourrait également bénéficier à la neuroscience, car le rapprochement toujours plus poussé des IA avec la complexité d’un cerveau humain permettent de mieux appréhender celui-ci.

Découvrez les bonus

+ rapide, + pratique, + exclusif

Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.

Découvrez les nombreux avantages de Numerama+.

S'abonner à Numerama+

Vous avez lu 0 articles sur Numerama ce mois-ci

Il y a une bonne raison de ne pas s'abonner à

Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.

Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :

  • 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
  • 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
  • 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.

Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.

S'abonner à Numerama+

Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !