La victoire du système d’intelligence artificielle de Google au jeu de go a eu un retentissement international. En Chine, des spécialistes de l’IA souhaitent le défier en fin d’année.

Avec sa victoire au jeu de go par quatre points à un contre Lee Sedol, qui est l’un des meilleurs représentants mondiaux de cette discipline, AlphaGo a démontré sa très grande maîtrise de ce jeu de plateau ancestral tout droit venu de Chine. C’est donc sans surprise qu’il est désormais considéré comme le deuxième meilleur joueur de go au monde, selon un classement officieux mais cependant jugé très fiable.

Maintenant, que va faire DeepMind, le laboratoire de recherche en IA dépendant de Google, qui est à l’origine d’AlphaGo ? Va-t-il continuer à entraîner son système d’intelligence artificielle au go contre d’autres joueurs de classe mondiale ? Ou va-t-il chercher d’autres défis à remporter, par exemple dans les jeux vidéo (StarCraft) ou dans les cartes à jouer (Magic et Hearthstone) ?

Peut-être que la prochaine étape du développement de l’intelligence artificielle de Google sera d’affronter une autre IA au jeu de go. C’est en tout cas ce que souhaite une équipe de chercheurs chinois. L’affrontement pourrait avoir lieu d’ici la fin de l’année 2016, selon les informations de Reuters, citant la presse chinoise. Reste à savoir si Google compte relever le défi ou passer son tour.

Si Google répond favorablement au challenge, ce ne sera pas la première fois qu’AlphaGo affrontera une intelligence artificielle.

apprentissage profond, big data, analyse statistique et apprentissage par renforcement

En effet, dans le cadre de son entraînement mêlant tout à la fois apprentissage profond (deep learning), analyse de données massives (big data) et méthode de Monte-Carlo (qui consiste à établir des statistiques sur les coups jouables selon la partie), n’a pas seulement digéré les parties des meilleurs joueurs de go pour identifier les meilleurs coups à jouer dans telle ou telle situation.

Il a aussi joué contre lui-même à de très nombreuses reprises pour se renforcer à chaque partie, selon l’approche de l’apprentissage par renforcement (reinforcement learning). En jouant contre d’autres instances de lui-même, AlphaGo a naturellement renforcé de façon considérable son niveau de jeu, ce qui lui a permis de terrasser le meilleur joueur européen en 2015 puis l’un des meilleurs joueurs du monde cette année.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !