L’IA de DeepMind s’attaque à Hanabi, un jeu de cartes collaboratif (français)

Le 12 février 2019 à 09h30

1 min

Sciences et espace

Sciences

L'intelligence artificielle de la filiale de Google s'est déjà attaqué au jeu de Go en écrasant les meilleurs joueurs mondiaux, puis à des joueurs pros sur Starcraft II, là encore avec succès.

Désormais, DeepMind se lance un nouveau challenge avec Hanabi. Il s'agit d'un jeu de cartes collaboratif de deux à cinq joueurs, où l'ensemble des participants œuvre pour un même but, mais avec des informations incomplètes.

Chaque joueur tient en effet ses cartes à l'envers. Il ne peut donc voir que celles des autres participants. À chaque tour, les joueurs peuvent poser une carte (pour faire une série de feu d'artifice), donner un indice à un autre joueur (qu'il doit comprendre correctement et s'en souvenir) ou se défausser d'une carte.

Sébastien Gavois

Le 12 février 2019 à 09h30

Commentaires (17)

Pierre_ Abonné

Le 12/02/2019 à 12h14

Étonnant comme choix, Hanabi me semble beaucoup moins complexe à maîtriser que le jeu de Go…

Pour moi le plus dur dans ce jeu c’est de se souvenir de tous les indices que les autres joueurs nous donnent, à priori ça devrait pas être un problème pour Deepmind " />

Otiel Abonné

Le 12/02/2019 à 12h48

Pierre_ a écrit :

Pour moi le plus dur dans ce jeu c’est de se souvenir de tous les indices que les autres joueurs nous donnent, à priori ça devrait pas être un problème pour Deepmind " />

Je dirais même de tous les indices qui ont été donnés à chaque joueur.

le podoclaste

Le 12/02/2019 à 12h50

Un bon p’tit jeu, Hanabi, je conseille à tout le monde.

L’avantage de soumettre un jeu coop a une IA, c’est qu’elle ne mettra pas la raclée aux humains, mais avec eux.

127.0.0.1

Le 12/02/2019 à 12h55

Étonnant qu’ils ne s’attaquent pas Fortnite. Ca ferait davantage de buzz.

alegui

Le 12/02/2019 à 13h02

Chez nous on autorise de décaler les cartes sur le côté quand on nous indique des cartes (par indice direct uniquement, pas par déduction, là ça serait de la triche). A droite pour les cartes posables, en bas à l’envers pour les précieuses, à gauche pour les cartes jetables.

Et pour nos cartes, on autorise de rappeler ce qu’on a dit sur une carte.

latlanh

Le 12/02/2019 à 13h28

Je comprend pas qu’ils ne s’attaquent aps a de vrai gros joueur SC2 :p je suis vraiment currieux de voir ce que ca donne contre un Serral aujourd’hui

shadowfox

Le 12/02/2019 à 15h04

Il me semble que ça déjà ait été fait et que l’IA défonçait tout pour la simple raison qu’elle n’est pas gênée par des contraintes physiques et de fatigue pour réaliser un nombre d’actions par minute conséquent.

EDIT : Oui, ça été fait avec AlphaStar de DeepMind.

latlanh

Le 12/02/2019 à 15h08

oui contre des pro player qui sont en perte de vitesse, de memoire Mana a gagner une game, les scores ressemblent a ceux de Serral contre ces même joueur (sauf que Serral ne perd pas de map contre Mana :p )

Gersho

Le 12/02/2019 à 15h22

et aussi avec obligation pour les joueurs de prendre Protoss car l’IA sait faire que du PvP >.>

latlanh

Le 12/02/2019 à 15h34

Ha j’avais loupé ca!

Mearwen

Le 12/02/2019 à 16h23

Enfin les joueurs capables de mettre 5-1 à Mana ça court pas les rues :)

Globalement, SC2 pour DeepMind c’est quasi terminé, d’ici la Blizzcon de novembre ils auront une IA capable de mettre des raclées a tout le monde

 

latlanh

Le 13/02/2019 à 08h10

Chez les joueurs pro? Il en a quand mm pas mal :p

Arkeen Abonné

Le 13/02/2019 à 10h18

Certes, mais le but de DeepMind c’était aussi de se rapprocher d’un niveau de jeu humain, et de ne gagner “que” par l’intelligence … à ce niveau-là c’est quand même assez foiré je trouve.

dargos

Le 13/02/2019 à 12h35

Les techniques étaient très efficaces et surtout surprenantes

Par ailleurs c’est 5-0 qui s’est pris Mana

Pas un seul moment ne lui a été favorable

Vous devriez voir les replay, c’est assez impressionnant

Pour Hanabi, c’est un choix intéressant : coopt avec des humains et déductions d’actions humaines discutables

:popcorn:

Zaillounet

Le 13/02/2019 à 16h56

Deepmind ajoute a chaque fois un nouvel élément au problème.

Pour le go ou les échecs, l’ensemble des informations du jeu est disppnibles et le nombres d’actions possibles est relativement limité.

Pour SC2, l’IA (comme l’humain) ne dispose que d’informations partielles sur l’état de la partie (à cause du brouillard de guerre). Le nombre d’actions possibles a aussi grandement augmenté.

Au passage, Alphastar était bridé en terme d’APM pour bien montrer que ce n’etait pas sur la vitesse d’exécution qu’il battait l’humain mais sur le choix des actions a effectuer.

Avec Hanabi, ils s’attaquent à un problème sur lequel l’IA bloque encore beaucoup, à savoir la collaboration entre IA. Le choix d’Hanabi n’est pas surprenant car les autres facteurs sont atténués : peu d’actions possibles, peu d’inconnu dans ses cartes et que la fonction de coût est plutôt simple à implémenter.

L’objectif de deepmind est de choisir la meilleure information à transmettre aux autres IA pour résoudre le problème, pas de battre l’humain (qui sera vite battu à mon avis)

Arkeen Abonné

Le 13/02/2019 à 19h53

Zaillounet a écrit :

Alphastar était bridé en terme d’APM pour bien montrer que ce n’etait pas sur la vitesse d’exécution qu’il battait l’humain mais sur le choix des actions a effectuer.

Pour moi le principal problème est justement là. Les EPM n’étaient pas “capées”, AlphaStar avait juste une limite moyenne d’EPM (lissées sur qq 10aines de secondes il me semble). Du coup, l’IA pouvait avoir des pics d’EPM de fou, qu’elle compensait en en faisant moins avant ou après. Et c’est comme ça que l’IA a plusieurs fois dépassé les 1600 EPM, pour des brèves périodes de temps (les + critiques j’imagine), chose que l’humain est incapable : les joueurs pro ne dépassent pas les 600 APM.

Et c’est sans compter que certes, l’IA est limitée par le brouillard de guerre, mais pas par un quelconque taille d’écran. Elle n’avait aucune caméra a gérer puisqu’elle était “omnisciente” sur tout ce qu’elle voyait de la map. Et donc une source d’action en moins pour les EPM.

À ce compte là, la machine a bien sa vitesse d’exécution de son coté, et pas qu’un peu. Du coup difficile de dire si c’est bien son “intelligence” qui a battu les adversaires humains ou ses “mécaniques”…

Arkeen Abonné

Le 13/02/2019 à 20h00

Cf : comme précédent.  Avec moins de limites qu’un joueur humain, effectivement on peut s’attendre à voir de nouvelles techniques émerger. Mais puisqu’un humain n’est pas capable de les reproduire, c’est pas tellement de l’intelligence, c’est surtout qu’humains et machine ne jouent pas avec les mêmes règles.

Catégories

Nous Suivre

À propos

L’IA de DeepMind s’attaque à Hanabi, un jeu de cartes collaboratif (français)

Commentaires (17)