Deepmind ajoute a chaque fois un nouvel élément au problème.
Pour le go ou les échecs, l’ensemble des informations du jeu est disppnibles et le nombres d’actions possibles est relativement limité.
Pour SC2, l’IA (comme l’humain) ne dispose que d’informations partielles sur l’état de la partie (à cause du brouillard de guerre). Le nombre d’actions possibles a aussi grandement augmenté.
Au passage, Alphastar était bridé en terme d’APM pour bien montrer que ce n’etait pas sur la vitesse d’exécution qu’il battait l’humain mais sur le choix des actions a effectuer.
Avec Hanabi, ils s’attaquent à un problème sur lequel l’IA bloque encore beaucoup, à savoir la collaboration entre IA. Le choix d’Hanabi n’est pas surprenant car les autres facteurs sont atténués : peu d’actions possibles, peu d’inconnu dans ses cartes et que la fonction de coût est plutôt simple à implémenter.
L’objectif de deepmind est de choisir la meilleure information à transmettre aux autres IA pour résoudre le problème, pas de battre l’humain (qui sera vite battu à mon avis)
1 commentaires
L’IA de DeepMind s’attaque à Hanabi, un jeu de cartes collaboratif (français)
12/02/2019
Le 13/02/2019 à 16h 56
Deepmind ajoute a chaque fois un nouvel élément au problème.
Pour le go ou les échecs, l’ensemble des informations du jeu est disppnibles et le nombres d’actions possibles est relativement limité.
Pour SC2, l’IA (comme l’humain) ne dispose que d’informations partielles sur l’état de la partie (à cause du brouillard de guerre). Le nombre d’actions possibles a aussi grandement augmenté.
Au passage, Alphastar était bridé en terme d’APM pour bien montrer que ce n’etait pas sur la vitesse d’exécution qu’il battait l’humain mais sur le choix des actions a effectuer.
Avec Hanabi, ils s’attaquent à un problème sur lequel l’IA bloque encore beaucoup, à savoir la collaboration entre IA. Le choix d’Hanabi n’est pas surprenant car les autres facteurs sont atténués : peu d’actions possibles, peu d’inconnu dans ses cartes et que la fonction de coût est plutôt simple à implémenter.
L’objectif de deepmind est de choisir la meilleure information à transmettre aux autres IA pour résoudre le problème, pas de battre l’humain (qui sera vite battu à mon avis)