AlphaGo a été mis à jour pour devenir encore meilleur au jeu de go. Pour le vérifier, les concepteurs de cette intelligence artificielle l’ont envoyée discrètement sur des serveurs que fréquentent les meilleurs joueurs mondiaux. Résultat, l’IA les a tous battus.

Si vous vous intéressez au jeu de go, peut-être avez-vous entendu parler ces jours-ci d’un mystérieux compétiteur qui a sévi sur deux serveurs de go asiatiques, Tygem et FoxGo. Identifié sous le pseudonyme de « Master » sur l’un et « Magister » sur l’autre, il a littéralement écrasé ses opposants, parmi lesquels figurent pourtant quelques-uns des meilleurs joueurs mondiaux.

Très vite, les observateurs se sont rendus compte que ce virtuose ne pouvait pas être un humain. Pour parvenir à une telle domination dans un délai aussi bref, sans que personne ne connaisse l’identité du joueur se cachant derrière les pseudonymes de « Master » et de « Magister », il ne pouvait s’agir que d’une intelligence artificielle. C’est en tout cas l’explication la plus rationnelle qui a circulé parmi les connaisseurs.

https://twitter.com/gwern/status/816462316669636608

Au cours de sa courte carrière sur Tygem et FoxGo, ce joueur a en effet remporté pas moins de 51 parties d’affilée. La suivante n’a pas pu être jouée dans des conditions satisfaisantes, puisque l’adversaire du moment, Chen Yaoye, s’est retrouvé hors ligne, ce qui a précipité la fin de la partie et l’a enregistrée comme un match nul. Au total, sur les 61 matchs joués, « Master » en a remporté… 60.

En face de « Master », il y avait pourtant des poids lourds du jeu de go, notamment la crème de la crème : le Japonais Iyama Yuta (5ème au classement mondial établi par Go Ratings), le Sud-Coréen Park Jung-hwan (3ème) et le Chinois Ke Jie (1er). C’est tout simplement surhumain. Un total inconnu s’est payé les meilleurs joueurs du monde, certes au cours de parties officieuses, mais tout de même !

Les meilleurs ont été vaincus

Bien qu’il ne soit pas officiel, le classement réalisé par Go Ratings est devenu au fil des ans une référence au sein de la communauté des joueurs de go. Selon Le Monde, il est « très consulté » car il permet d’avoir une bonne photographie des forces en présence. Dans l’ensemble, le classement est surtout occupé par des Chinois, des Sud-Coréens et des Japonais.

Deux intelligences artificielles sont présentes dans le classement : DeepZenGo, un système venu du Japon et classé à la 408ème place, et le très célèbre AlphaGo, un système américano-britannique, qui se trouve en 2ème position (il a occupé un temps la toute première place du classement). AlphaGo a créé la sensation l’an passé en devenant la première IA à défaire largement Lee Sedol, l’un des meilleurs joueurs du monde.

Ce n’est que mercredi 4 janvier que le pot aux roses a été découvert. Dans un message publié sur Twitter, Demis Hassabis, le directeur de DeepMind, a révélé que celui qui se cachait derrière les pseudonymes de « Master » et « Magister » n’était autre… qu’AlphaGo, le système d’intelligence artificielle développé par DeepMind, la filiale de Google depuis 2014.

C’est en fait une version améliorée d’AlphaGo qui a été utilisée sur FoxGo et Tygem. « Nous avons travaillé dur pour améliorer AlphaGo et au cours des derniers jours, nous avons joué quelques parties rapides et non officielles en ligne avec notre nouvelle version du prototype pour vérifier que tout fonctionne bien comme nous l’espérions », explique Demis Hassabis.

Chose amusante pour les connaisseurs, AlphaGo a battu Ke Jie à trois reprises. Or, Ke Jie, un peu fanfaron, avait d’abord annoncé avant le combat de Lee Sedol contre AlphaGo qu’il était capable de battre la machine, la jugeant « plus faible que lui  ». Il a ensuite refusé de jouer contre l’intelligence artificielle, estimant qu’elle risquait de s’approprier son style de jeu. Puis finalement, il a accepté de l’affronter.

Goban

Sans doute Ke Jie espérait-il un match avec un peu de couverture médiatique, à la manière de ce qui s’est passé avec Lee Sedol. Manque de chance pour lui (ou heureusement ?), les parties se sont déroulées loin des regards. Et si Lee Sedol avait pu arracher un point lors des cinq parties contre AlphaGo, Ke Jie n’a pas réussi à gagner un seul match. Mais l’IA qu’il a affrontée n’était pas tout à fait la même.

Au jeu de go, les possibilités au départ s’élèvent à 10170. À chaque coup, l’intelligence artificielle doit explorer des milliards et des milliards de combinaisons pour déterminer la meilleure stratégie possible, ce qui constitue un défi absolument gigantesque. AlphaGo est toutefois un cas particulier, puisqu’il bénéficie du soutien de Google pour progresser dans le domaine de l’apprentissage automatique.

Dans le cas d’AlphaGo, le système mêle apprentissage profond (ou deep learning), une technique consistant à ingérer une myriade de parties entre des joueurs de haut niveau, et apprentissage par renforcement (reinforcement learning), afin de renforcer les capacités de l’intelligence artificielle en la faisant jouer contre elle-même. Vu les résultats obtenus très récemment, c’est une approche qui a payé.


Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !