Logo Spiria

AlphaGo Zero

19 octobre 2017.

Game of Go.

Game of Go. © iStock.

Le laboratoire DeepMind de Google a développé un exceptionnel programme d’intelligence artificielle. Baptisé AlphaGo Zero, le logiciel a été capable d’apprendre par lui-même à devenir l’un des meilleurs joueurs Go au monde, en quelques jours seulement. Google dit que le programme s’est lui-même doté de « capacités surhumaines ». AlphaGo Zero a débuté sans connaître la moindre stratégie pour gagner au jeu Go — un jeu chinois vieux de plusieurs siècles dans lequel deux joueurs utilisent des pions noirs et blancs avec pour objectif de contrôler le plus grand territoire possible. Il aura fallu même pas quatre jours à AlphaGo Zero pour vaincre son prédécesseur, AlphaGo, qui avait battu l’année dernière le meilleur joueur humain au monde, le Sud-Coréen Lee Sedol. « Le concept le plus important d’AlphaGo Zero est que son apprentissage se fait complètement tabula rasa, c’est-à-dire qu’il commence à partir d’un état vierge et découvre par lui-même, en jouant seulement contre lui-même, sans aucun savoir humain, sans données, fonctionnalités ou interventions de l’homme », a déclaré le chercheur principal d’AlphaGo, David Silver, dans un entretien avec le journal Nature. Cela ne signifie pas que DeepMind a conçu une IA capable de faire n'importe quoi. Pour pouvoir s'autoformer, AlphaGo Zero doit se limiter à un problème dans lequel des règles claires encadrent les actions. Mais dans ce cas, il peut découvrir des stratégies jamais envisagées par les humains, ce qui est très impressionnant.

Ars Technica, “New neural network teaches itself Go, spanks the pros.”