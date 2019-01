Une conférence aura lieu le 24 janvier pour montrer les avancées de l'intelligence artificielle sur StarCraft 2.

Où en sont les recherches de DeepMind sur StarCraft 2 ? La réponse à cette question sera donnée le jeudi 24 janvier. C’est à cette date que la filiale de Google spécialisée dans l’intelligence artificielle tiendra une conférence de deux heures, de 19h à 21h (heure de Paris). La retransmission aura lieu en direct sur la chaîne YouTube de DeepMind et la page Twitch de StarCraft.

L’intérêt de DeepMind pour un jeu comme StarCraft s’est manifesté la première fois en 2016. Peu après, DeepMind et Blizzard se sont associés pour développer un environnement de travail destiné à entraîner un système d’IA. Cet environnement a été ouvert au public un an plus tard. Et depuis, des points d’étape réguliers sont faits lors des différentes éditions de la BlizzCon.

On sait maintenant qu’elle a saisi les règles de base du jeu et qu’elle a imaginé des stratégies originales pour vaincre l’adversaire, par exemple en le submergeant de ses ouvriers, ce qui lui permet de vaincre une fois sur deux l’IA du jeu en difficulté maximale. Elle a aussi observé des parties entre joueurs, lui permettant d’appliquer des stratégies courantes et de contrer des tactiques offensives.

Le fait que Blizzard annonce la tenue d’une conférence exceptionnelle et en direct en vue de faire une « démonstration de DeepMind sur StarCraft II » suggère que la firme britannique est parvenue à une percée majeure. Est-elle par exemple capable de rivaliser avec des joueurs semi-professionnels ? Fin 2017, il avait été constaté que les systèmes d’IA étaient encore très loin d’être au niveau.

Des enjeux de recherche importants

Les travaux de DeepMind sur StarCraft 2 portent sur divers enjeux. Ceux-ci vont de la théorie des jeux à la prise de décision malgré une information incomplète, en passant par le jeu en temps réel (et non en tour par tour, comme au go ou aux échecs, ce qui permet de marquer des pauses), la gestion à plusieurs niveaux (des unités, de l’économie, de l’ordre de construction…) et à la planification à long terme.

Par exemple, l’information incomplète signifie que les actions adverses ne sont pas accessibles en permanence, du fait d’un brouillard de guerre. Pour voir une zone de la carte, il faut qu’un de ses bâtiments ou l’une de ses unités se trouve dans les parages et y reste. Sinon, la zone est hors de vue et on ne peut plus savoir ce qui s’y passe — comme un regroupement ennemi.

La difficulté est donc d’appliquer un plan de jeu et de l’adapter en permanence en allant chercher autant que possible de l’information chez l’ennemi (ce qu’il fait lui aussi dans le même temps), sachant que celle-ci sera toujours partielle (on ne voit jamais toute la carte d’un coup et en permanence). Les éventuels ajustements qui sont donc faits doivent donc régulièrement être revus et corrigés.

À cela s’ajoute l’immensité du terrain de jeu. DeepMind avait esquissé l’ampleur du défi qu’il a choisi de relever : il existe plus de 300 actions de base qui peuvent être prises et celles-ci « sont hiérarchiques, peuvent être modifiées et augmentées. Même en supposant une petite taille d’écran de 84×84, il existe près de 100 millions d’actions possibles disponibles », relevait DeepMind en 2017.

Or, les écrans standards disposent d’un affichage bien plus vaste.