L'IA de DeepMind s'attaque à Hanabi, un jeu de cartes collaboratif (français)

L’IA de DeepMind s’attaque à Hanabi, un jeu de cartes collaboratif (français)

L'IA de DeepMind s'attaque à Hanabi, un jeu de cartes collaboratif (français)

L'intelligence artificielle de la filiale de Google s'est déjà attaqué au jeu de Go en écrasant les meilleurs joueurs mondiaux, puis à des joueurs pros sur Starcraft II, là encore avec succès.

Désormais, DeepMind se lance un nouveau challenge avec Hanabi. Il s'agit d'un jeu de cartes collaboratif de deux à cinq joueurs, où l'ensemble des participants œuvre pour un même but, mais avec des informations incomplètes.

Chaque joueur tient en effet ses cartes à l'envers. Il ne peut donc voir que celles des autres participants. À  chaque tour, les joueurs peuvent poser une carte (pour faire une série de feu d'artifice), donner un indice à un autre joueur (qu'il doit comprendre correctement et s'en souvenir) ou se défausser d'une carte.

Commentaires (17)


Étonnant comme choix, Hanabi me semble beaucoup moins complexe à maîtriser que le jeu de Go…

Pour moi le plus dur dans ce jeu c’est de se souvenir de tous les indices que les autres joueurs nous donnent, à priori ça devrait pas être un problème pour Deepmind <img data-src=" />








Pierre_ a écrit :



Pour moi le plus dur dans ce jeu c’est de se souvenir de tous les indices que les autres joueurs nous donnent, à priori ça devrait pas être un problème pour Deepmind <img data-src=" />





Je dirais même de tous les indices qui ont été donnés à chaque joueur.



Un bon p’tit jeu, Hanabi, je conseille à tout le monde.



L’avantage de soumettre un jeu coop a une IA, c’est qu’elle ne mettra pas la raclée aux humains, mais avec eux.


Étonnant qu’ils ne s’attaquent pas Fortnite. Ca ferait davantage de buzz.


Chez nous on autorise de décaler les cartes sur le côté quand on nous indique des cartes (par indice direct uniquement, pas par déduction, là ça serait de la triche). A droite pour les cartes posables, en bas à l’envers pour les précieuses, à gauche pour les cartes jetables.

Et pour nos cartes, on autorise de rappeler ce qu’on a dit sur une carte.


Je comprend pas qu’ils ne s’attaquent aps a de vrai gros joueur SC2 :p je suis vraiment currieux de voir ce que ca donne contre un Serral aujourd’hui


Il me semble que ça déjà ait été fait et que l’IA défonçait tout pour la simple raison qu’elle n’est pas gênée par des contraintes physiques et de fatigue pour réaliser un nombre d’actions par minute conséquent.



EDIT : Oui, ça été fait avec AlphaStar de DeepMind.


oui contre des pro player qui sont en perte de vitesse, de memoire Mana a gagner une game, les scores ressemblent a ceux de Serral contre ces même joueur (sauf que Serral ne perd pas de map contre Mana :p )


et aussi avec obligation pour les joueurs de prendre Protoss car l’IA sait faire que du PvP &gt;.&gt;


Ha j’avais loupé ca!


Enfin les joueurs capables de mettre 5-1 à Mana ça court pas les rues :)

Globalement, SC2 pour DeepMind c’est quasi terminé, d’ici la Blizzcon de novembre ils auront une IA capable de mettre des raclées a tout le monde

&nbsp;


Chez les joueurs pro? Il en a quand mm pas mal :p


Certes, mais le but de DeepMind c’était aussi de se rapprocher d’un niveau de jeu humain, et de ne gagner “que” par l’intelligence … à ce niveau-là c’est quand même assez foiré je trouve.


Les techniques étaient très efficaces et surtout surprenantes

Par ailleurs c’est 5-0 qui s’est pris Mana

Pas un seul moment ne lui a été favorable

Vous devriez voir les replay, c’est assez impressionnant



Pour Hanabi, c’est un choix intéressant : coopt avec des humains et déductions d’actions humaines discutables

:popcorn:


Deepmind ajoute a chaque fois un nouvel élément au problème.

Pour le go ou les échecs, l’ensemble des informations du jeu est disppnibles et le nombres d’actions possibles est relativement limité.

Pour SC2, l’IA (comme l’humain) ne dispose que d’informations partielles sur l’état de la partie (à cause du brouillard de guerre). Le nombre d’actions possibles a aussi grandement augmenté.

Au passage, Alphastar était bridé en terme d’APM pour bien montrer que ce n’etait pas sur la vitesse d’exécution qu’il battait l’humain mais sur le choix des actions a effectuer.



Avec Hanabi, ils s’attaquent à un problème sur lequel l’IA bloque encore beaucoup, à savoir la collaboration entre IA. Le choix d’Hanabi n’est pas surprenant car les autres facteurs sont atténués : peu d’actions possibles, peu d’inconnu dans ses cartes et que la fonction de coût est plutôt simple à implémenter.

L’objectif de deepmind est de choisir la meilleure information à transmettre aux autres IA pour résoudre le problème, pas de battre l’humain (qui sera vite battu à mon avis)








Zaillounet a écrit :



Alphastar était bridé en terme d’APM pour bien montrer que ce n’etait pas sur la vitesse d’exécution qu’il battait l’humain mais sur le choix des actions a effectuer.





Pour moi le principal problème est justement là. Les EPM n’étaient pas “capées”, AlphaStar avait juste une limite moyenne d’EPM (lissées sur qq 10aines de secondes il me semble). Du coup, l’IA pouvait avoir des pics d’EPM de fou, qu’elle compensait en en faisant moins avant ou après. Et c’est comme ça que l’IA a plusieurs fois dépassé les 1600 EPM, pour des brèves périodes de temps (les + critiques j’imagine), chose que l’humain est incapable : les joueurs pro ne dépassent pas les 600 APM.

Et c’est sans compter que certes, l’IA est limitée par le brouillard de guerre, mais pas par un quelconque taille d’écran. Elle n’avait aucune caméra a gérer puisqu’elle était “omnisciente” sur tout ce qu’elle voyait de la map. Et donc une source d’action en moins pour les EPM.

À ce compte là, la machine a bien sa vitesse d’exécution de son coté, et pas qu’un peu. Du coup difficile de dire si c’est bien son “intelligence” qui a battu les adversaires humains ou ses “mécaniques”…



Cf : comme précédent.&nbsp; Avec moins de limites qu’un joueur humain, effectivement on peut s’attendre à voir de nouvelles techniques émerger. Mais puisqu’un humain n’est pas capable de les reproduire, c’est pas tellement de l’intelligence, c’est surtout qu’humains et machine ne jouent pas avec les mêmes règles.


Fermer