[MàJ] Jeu de Go : l’intelligence artificielle AlphaGo remporte la première manche
Fight !
Le 09 mars 2016 à 09h10
2 min
Sciences et espace
Sciences
Cette nuit, Lee Sedol affrontera l'ordinateur de DeepMind au jeu de Go dans une première manche (sur cinq). Cette compétition sera retransmise en direct sur YouTube.
Cette nuit, à partir de 4h30 du matin, aura lieu la première manche d'une série de cinq matchs qui opposera Lee Sedol à AlphaGo. Le premier est l'un des meilleurs joueurs de Go au monde (si ce n'est le meilleur) qui est classé au plus haut niveau : 9-dan pro. Le second est une intelligence artificielle développée par DeepMind, une filiale de Google.
AlphaGo n'en est pas à son coup d'essai puisque l'ordinateur a battu le champion européen Fan Hui par 5 à 0 en 2015. Ce dernier n'est par contre classé « que » 2-dan pro. Lee Sedol était confiant et aurait déclaré qu'il pensait battre l'ordinateur par 5 à 0, ou au pire 4 à 1, mais il était moins agressif lors des dernières conférences expliquant qu'AlphaGo était visiblement « bien plus efficace » que ce qu'il pensait, comme le rapportent nos confrères de l'AFP.
Quoi qu'il en soit, si les règles du jeu de Go sont relativement simples, Demis Hassabis, cofondateur de DeepMind, explique qu'il s'agit « probablement du jeu le plus complexe inventé par l'Homme » et que « le nombre de combinaisons possibles est supérieur au nombre d'atomes dans l'Univers » indique Sciences et Avenir.
Bref, après les échecs, l'homme va de nouveau affronter la machine et tenter de sortir vainqueur. Le match sera a regarder via le flux suivant :
Commentaires (150)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 08/03/2016 à 18h59
Le 08/03/2016 à 18h59
Le 08/03/2016 à 19h00
Le 08/03/2016 à 19h21
Le 08/03/2016 à 19h22
Et quand l’ordi joue on a droit à un spectacle de claquette ou a va être vraiement ennuyeux à mourir ? (deja que c’est purement cérébral…et qu’on meurt d’ennui aux échecs…)
Le 08/03/2016 à 19h24
Le 08/03/2016 à 19h25
Le gros avantage de l’ordinateur dans ces rencontres, c’est qu’il n’a pas besoin d’aller aux toilettes. Sauf bien sûr si c’est une machine de T’urines.
Le 08/03/2016 à 19h25
Le 08/03/2016 à 19h34
C’est vrai que vu le stress que peut apporter une partie d’échec de haut niveau et qu’une personne qui n’est pas en très bonne santé n’y résiste pas. : chinois:
Le 08/03/2016 à 20h21
Oulah, oulah, tu confond quelque chose et dis quelque chose de fondamentalement faux :
Tu confond nombre d’atomes, et quantité de mémoire qu’il faudrait pour stocker ce nombre. Et par extension, tu confond également la mémoire qu’il faudrait pour stocker des possibilités.
Justement, c’est le rôle de l’algorithmie que de réduire la quantité de mémoire nécessaire a stocker ces possibilités : tu n’écris pas les possibilités de manière littérale (se qui n’aurait aucuns sens en matière informatique) mais de manière abstraite. C’est justement le principe a la base de la machine de Turing/ruban de möbius : tu peux théoriquement stocker des données a l’infini et revenir ou avancer sur chaque itération. C’est un des principes de l’intelligence artificielle.
De fait la comparaison et l’ordre de grandeur sont un peu mal foutus, il y a bien d’autre choses quantifiable/calculable qui dépassent le nombre d’atomes dans l’univers. (le nombre de décimales unique de PI par exemple)
Le 08/03/2016 à 20h22
Attendez, je lance l’ O.S.T. d’Hikaru no Go
Le 08/03/2016 à 20h24
Même pour les échecs, il est impossible pour un ordinateur de calculer toutes les combinaisons de coup possibles jusqu’à l’échec et mat. La technique était de calculer toutes les combinaisons des N prochains coup, et d’évaluer quelles combinaisons donnaient les meilleurs résultats.
Pour le go, cette technique ne marche pas car il est impossible d’évaluer si on est en train de gagner ou de perdre juste en regardant le plateau à un instant t. Tout peut se renverser en un seul coup.
La technique qui est utilisé pour le go est plutôt celle de Monte Carlo, qui consiste à évaluer au hasard certaines combinaisons de coup jusqu’à la fin de la partie, et de choisir parmi ces quelques combinaisons la meilleur possible. Même si ça semble très aléatoire, cette technique a donné des bons résultats.
DeepMind quant à lui ajoute à Monte Carlo l’utilisation de réseaux de neurones profonds, c’est-à-dire ce qu’on appelle de l’intelligence artificielle en informatique. Ces réseaux de neurones sont revenu à la mode ces dernières années grâce à l’arrivée de meilleurs ordinateurs, mais aussi de beaucoup plus de données facilement disponible grâce à Internet.
Le 08/03/2016 à 21h07
La puissance oui, mais surtout le stockage !
Sans une base de données contenant des millions d’enregistrement propre (c’est a dire chaque exemple est annoté pour permettre l’apprentissage) et consultable avec un délai raisonnable, un algo même performant ne sert à rien.
Aujourd’hui ce n’est plus un frein, et même l’annotation peut être faite a grande échelle (cf les captcha google qui sont annoté par des humains a leur insu).
C’était inimaginable il y’a 20 ans, même avec la puissance de deep blue.
Le 08/03/2016 à 21h55
… pour moi plutôt les recherches en IA et les avancés en prédiction de calcul (nos cpu en sont gavés)
Le jour ou on pourra manipuler les qbit : je pense que l’humanité sera en danger … d’extinction.
juste prévisible.
Le 08/03/2016 à 21h56
… non, les réseaux neuronaux.
Le 08/03/2016 à 21h59
A voir :
YouTubePlus simple pour ceux qui veulent voir de l’ia :
YouTubepour comprendre le début de notre fin ….
Le 08/03/2016 à 17h53
Le 08/03/2016 à 17h56
Pas sûr que je mette le réveil pour suivre le direct, par contre je veux bien savoir le résultat demain " />
Le 08/03/2016 à 18h01
Celui qui m’a appris le jeu de Go avait insisté sur l’aspect visuel du jeu.
Je continue aujourd’hui de préférer les échecs, qui me conviennent mieux.
Le 08/03/2016 à 18h05
La saison 4 de l’AVGN durant 5h, si je la commence à 23h30, elle devrait se finir à peu près à l’heure de cette passionnante partie. " />
Le 08/03/2016 à 18h11
Forcément à un moment donné la machine à le dessus surtout qu’elle ne fait pas d’erreur si le programme n’en contient pas et ne fatigue pas.
Moi je suis battu depuis l’amstrad pc1512, il me battait à chaque fois aux échecs. :(
Le 08/03/2016 à 18h18
Le 08/03/2016 à 18h19
Pas forcement pour le jeu de go. Il y a en effet plus de combinaison que d’atome dans l’univers. L’ordinateur doit faire des hypothese pas toujours juste. A contrario pour les echecs je pense qu’il est possible de savoir qui va gagner uniquement en fonction de qui commence.
Le 08/03/2016 à 18h35
Le nombre de coup aux échecs reste toujours trop important pour tout calculer. Il semblerait que le nombre de coups possibles soit de 10¹²⁰ pour les échecs.
Le go c’est 19×19. Bref, à la louche (19×19)!, soit ~1,4 × 10⁷⁶⁸, coups possibles pour une partie (sans compté les pierres mangées ce qui rend le chiffre encore plus grand). Pour le truc des atomes, l’univers observable c’est ~10⁸⁰.
Le 08/03/2016 à 18h36
Pour moi y a aucune “intelligence” artificielle la dedans.
Juste un algo, pas fondamentalement compliqué, qui calcul des centaines de millions de combinaison et qui accumule de l’experience en priorisant les combinaisons qui l’ont mené a la victoire.
Si le champion perd pas aujourd’hui il perdra après demain, et alors ? juste le fruit d ordi de plus en plus puissant et d’algo qui aboutissent forcement a la meilleure solution si on a la puissance pour les calculer.
Le 08/03/2016 à 18h40
Ça et sans doute une grosse base de données de parties enregistrées dans la bestiole (Deep learning comme disent les gens du market’ ? " />)
Le 08/03/2016 à 18h41
Les échecs ne sont pas encore un jeu “résolu”, ce qui signifie qu’il n’existe pas de schéma type pour gagner (ou nul) à tous les coups ou savoir, quelque soit l’état d’une partie, quel est le meilleur coup possible.
Les jeux “résolus” restent pour l’heure assez simples : les allumettes, les tours de Hanoi, ou encore le morpion.
AlphaGo a quelque chose que les joueurs humains ne peuvent pas avoir : il a pu simuler un nombre remarquable de parties en peu de temps, et analyser sur chaque partie quels étaient les meilleurs coups à jouer. Quand on pense à Hikaru No Go, le manga de référence sur le go, le champion fantomatique Sai se montre invaincu parce qu’il a totalité une expérience en terme de durée et de parties qu’aucun humain ne possède.
C’est un peu ce bénéfice que possède ici AlphaGo ; Il a à la fois la possibilité d’apprendre de millions de parties humaines enregistrées, mais en plus simuler de nouvelles parties très rapidement pour analyser les résultats là où la même chose pour un humain prendrait des siècles. Cependant, si les humains peuvent encore résister à haut niveau à ces machines sans avoir ces avantages, c’est que les premières font peu preuve de créativité ou de prise de risque.
Le 08/03/2016 à 18h41
Esperons que les humains gagnent celle la .. parceque les strategies de Go préenregistrés, associés au machine learning sauce google …
Il gagnera surement les premieres … mais 3⁄5 j’ai un doute quand meme !
Le 08/03/2016 à 18h42
Oui je l’incluais dans l’expérience ^^ l’algo a surement été initialisé avec une tonne de match pro depuis des années.
Le 08/03/2016 à 18h43
Pour AlphaGo, on est pourtant dans les vieilles recettes de la fin des années 80 sur les réseaux de neurones qui ne donnaient pas grand chose à l’époque et qui cartonnent maintenant justement grâce aux nouvelles possibilités aussi bien en capacité de calcul qu’en vitesse d’exécution. :chinoix:
Le 08/03/2016 à 18h51
Le 08/03/2016 à 18h53
Le 14/03/2016 à 17h07
Ils ne payent pas, puisqu’il fallait gagner 3 parties pour gagner 1M$ : Les pros bossent gratos ! :)
Le 15/03/2016 à 09h12
Le 09/03/2016 à 16h13
ah oui c’est juste je n’avais pas pris en compte l’expansion. Bref, c’est très grand, mais pas infini.
Le 09/03/2016 à 16h22
Le 09/03/2016 à 17h01
Le 09/03/2016 à 17h54
C’est vrai qu’on ne trouve pas grand chose.
Perso j’ai fini par trouver ici :
AlphaGo Distributed, in its largest variant, used 280 GPUs and 1920 CPUs.
Evidemment, j’ai rien trouvé comme autre source, ni même concernant le match AlphaGo versus Fan Hui par exemple…
EDIT/ Contre Fan Hui, il y aurait eu 1 202 CPU et 176 GPU
Le 09/03/2016 à 17h54
Le 09/03/2016 à 20h53
Merci pour le lien : chinois: Ça me rappelle mes vieux cours de traitement du signal.
Le 10/03/2016 à 07h54
Merci je recherchais justement quels livres pouvaient faire figure de référence de départ, et surtout en effet des videos de type université en ligne, je vais me pencher dessus " />
Le 10/03/2016 à 08h27
2ème victoire à l’instant d’AlphaGo sur l’humain.
Le 10/03/2016 à 08h31
pourquoi factorielle ?
Perso je calcule le nombre de combinaisons comme suit :
il y a 19 x 19 emplacements (soit 361), et 3 possibilités pour un emplacement : pierre blanche, pierre noire, pas de pierre.
Le nombre d’arrangement est donc : 3 puissance 361, soit 1,7 x 10 puissance 172
Le 10/03/2016 à 08h32
Celle ci a été plus serrée (et plus longue à obtenir) mais oui : 2-0 pour alphago
Le 10/03/2016 à 08h42
Le 10/03/2016 à 08h47
Le 10/03/2016 à 08h49
Tu calcules le nombre d’arrangement (état du Goban à un instant), mais pas le nombre de parties différentes possibles. J’ai trouvé ce papier qui fait un peu la différence entre les deux " />
Edit : Double grilled
Le 10/03/2016 à 09h21
Le 10/03/2016 à 10h14
Oui la brute force est même stupide, on arrive à de valeur totalement inatteignable, même pour les échecs, alors encore moins pour le go.
Le 10/03/2016 à 11h00
J’aime noter la différence d’ordre de grandeur entre go et échecs. Aux échecs, tu peux construire un arbre des N prochains coups, c’est faisable (et fait) et dans cette optique, l’ordi a bruteforcé le jeu pour gagner à tous les coups contre l’humain.
Au go, c’est impossible, même pour les 3 prochains coups la combinatoire dépasse nos meilleurs calculateurs. Il faut obligatoirement trouver une nouvelle façon de faire que “juste” calculer (construire un arbre et le parcourir).
De toutes façon -l’équipe DeepMind le rappelle à chaque interview- quand on demande à un maitre de Go pourquoi il a joué tel coup, il n’y a pas de réponse rationnelle mais plutôt des truc du genre “j’ai senti qu’il fallait jouer là”.
Il n’y a pas d’algorithme (de méthode) pour bien jouer au Go, il faut avant tout s’imprégner des bons patterns, qui peuvent prendre des milliers de formes distinctes ayant chacune de nombreuses variations. Il me semble que l’humain accomplit ce travail avec une logique “irrationnelle” (je ne trouve pas de terme adéquat mais disons “non basée sur le calcul et la certitude”), on définit des concepts abstraits comme “zone d’influence”, “potentiel”, “initiative”, etc puis on fait une sorte de moyenne de tous ces indicateurs pour “sentir” le bon coup.
L’approche Deepmind a été exemplaire en la matière : c’est exactement ce qu’ils ont fait (et réussi : 2 victoires contre un 9 dan, moi je dis chapeau). Pour préciser ce qui a déjà été dit : il s’agit de 2 réseaux neuronaux en série. Le premier fait une “estimation de valeur” réduisant les coups possibles à un nombre raisonnable et le résultat passe dans le deuxième réseau qui fait une “estimation éthique” pour réduire encore ce nombre de coups.
Le travail de calibrage a donc consisté à lui faire ingurgiter des millions de parties pour déterminer le coup gagnant d’après telle configuration du goban.
Ca a l’air con maintenant que c’est fait mais rappelons-nous que c’était de la science fiction il y a tout juste quelques mois (voire semaines). Je m’enflamme mais on est à un moment charnière de l’IA, le Go devait être le dernier jeu de stratégie réfractaire à l’IA. Il nous a poussé à développer une techno très pointue, j’attends de voir ses futures applications, ça peut faire des merveilles.
Le 09/03/2016 à 10h53
Le 09/03/2016 à 11h04
Plus ou moins HS : C’est vraiment très intéressant (je ne connais pas trop ce domaine contrairement à beaucoup ici visiblement " />) mais tu as l’air de bien maîtriser le sujet, tu aurais des ressources (pour profane !) à conseiller ?
Le 09/03/2016 à 11h22
" />
" />
Le 09/03/2016 à 11h26
Lee Sedol a peut être juste évalué les coups de la machine pour voir sa façon de jouer, quitte à y laisser un match.Les 2 prochaines rencontres seront intéressantes je pense (et on sera fixé si la machine les gagne toutes).
Le 09/03/2016 à 11h36
Le 09/03/2016 à 11h44
En gros si, l’univers est limité puisqu’il a un âge (13.5 GA) et que la vitesse de la lumière est elle-même limitée…
Donc en caricaturant à l’extrême on pourrait dire que l’univers est “contenu” dans une sphère de 13.5 millards d’années-lumière de rayon…
Le 09/03/2016 à 11h50
Lee Sedol, le champion coréen, est sorti des sentiers battus afin de tenter déstabiliser l’ordinateur
Tenter de prendre l’ascendant psychologique sur un ordinateur… mais bien sûr " />
Le 09/03/2016 à 11h53
Le 09/03/2016 à 11h59
L’univers observable est une sphère de 82 milliards d’années-lumières de diamètres.
Le 09/03/2016 à 12h02
Le 09/03/2016 à 12h03
Sébastien Gavois: c’est possible d’ARRETER de lire la conneries des atomes à chaque intervention sur la question ? laisse les autres journalistes le faire.C’est comme dire qu’a starcraft il y a 100 milliards de coup possible par action car on peut cliquer a chaque endroit de la map.
oui je peux jouer A1 tout le temps mais 355 fois sur 361 ca sert a rien !
Le 09/03/2016 à 12h07
Le 09/03/2016 à 12h07
Le 09/03/2016 à 12h08
Le 09/03/2016 à 12h15
Le 09/03/2016 à 12h15
edit: foirage
Le 09/03/2016 à 09h29
Jour 1 : “bon je vais l’exploser ce petit ordinateur! 5-0 que je vais lui mettre”
Jour 2 à n : regarde l’ordinateur jouer
Jour n+1: “bon je vais sûrement gagner… enfin peut-être… je devrais… ”
Jour j , fin de première manche : “Bon je vais essayer de pas prendre un 5-0 dans les dents” " /> " />
Le 09/03/2016 à 09h33
Pour ceux que ça intéresse, une explication relativement claire du principe de l’algorithme d’AlphaGo : YouTube
Le 09/03/2016 à 09h48
Le 09/03/2016 à 09h52
Le 09/03/2016 à 09h57
Si le coréen perd, je propose de faire le match suivant contre Sarah Connor. On verra bien comment s’en sortira le programme " />
" />
Le 09/03/2016 à 09h58
Le 09/03/2016 à 10h02
Le 09/03/2016 à 10h25
Merki, c’est fort intéressant.
Le 09/03/2016 à 10h25
Le 09/03/2016 à 10h25
Pas mal le pseudo, pendant un moment j’ai cru à un troll qui me répondait.
Oui, j’ai pas explicité plus mes propos, mais tu as étendu ma pensée.
Effectivement, ça ne fait que calculer, mais qui ne calcul pas en fin de compte?
Dans la finalité, ces algo apprennent à répondre de mieux en mieux à leur environnement.
J’ai toujours détesté les réseaux de neurones, alors que je suis ébahi face à ce qu’ils peuvent faire.
En revanche, j’ai toujours adoré les algo génétiques. Plus simple à coder je trouve…
Le 09/03/2016 à 10h31
On trouve assez facilement des articles qui expliquent que AlphaGo tourne sur le cloud de Google, mais je n’ai trouvé aucune indication sur les ressources allouées.
Personne n’a remarqué de ralentissement chez Google entre 5h et 9h ce matin ? ;-)
Le 09/03/2016 à 10h39
Lee Sedol a abandonné, ce qui est classique au Go. Le commentateur en anglais indiquait que ça se jouait à quelques points, mais qu’il avait du mal à compter sur le tableau utilisé pour la présentation.
Mon opinion perso est que c’est dommage de ne pas aller au bout de la partie, surtout si elle est serrée. C’est considéré comme tout à fait normal au go d’arrêter quand l’issue est certaine. Mais il s’agit ici de parties qui sont regardées par beaucoup de gens qui ne connaissent pas le jeu, et le fait de ne pas aller au bout rends le truc encore plus cryptique.
Le 09/03/2016 à 10h42
Le 09/03/2016 à 10h43
Le 09/03/2016 à 10h45
Surtout qu’en général on parle implicitement de l’univers visible, donc un truc parfaitement limité
Le 09/03/2016 à 10h47
Le 09/03/2016 à 12h19
Le problème c’est quand tu joue contre un adversaire que tu n’as jamais vu jouer et qui connait toutes tes parties par coeur. Il faut bien tester un peu la réaction de l’adversaire.
Le 09/03/2016 à 12h20
Le 09/03/2016 à 12h26
Le 09/03/2016 à 12h33
Le champion est inquiet :
“Aujourd’hui, je sais comment son algorithme a réussi à réduire le nombre de choix possibles. J’ai le sentiment qu’AlphaGo peut dans une certaine mesure imiter l’intuition humaine”“A présent, je crois que je ne pourrais peut-être pas vaincre AlphaGo avec une marge aussi importante que 5-0. Je dois être un peu plus stressé”.“Je pense que l’IA va à terme battre les humains au Go et qu’il s’agit de la conséquence inévitable du changement”, a ajouté le champion sud-coréen. “Mais les robots ne comprendront jamais la beauté du jeu comme nous, les humains, la comprenons”.
Le 09/03/2016 à 12h42
C’est curieux que personne ici ne parle du cours de Yann LeCun au Collège de France, qui a pourtant été largement médiatisé lors de la conférence d’ouverture il y a quelques semaines, et qui est le père de l’apprentissage profond par convolution.
AlphaGo n’utilise pas exclusivement cette technique, mais le cour est intéressant car il est donné par une pointure mondiale sur le sujet, et parce que ça permet de bien situer ce qu’il est aujourd’hui capable d’attendre de la part de ces techniques. La labellisation automatique à la fin de la conférence d’ouverture est assez bluffante par sa précision (le tout en temps réel s’il vous plaît).
C’est dispo ici :http://www.college-de-france.fr/site/yann-lecun/course-2015-2016.htm
Le 09/03/2016 à 12h45
AlphaGo n’utilise pas exclusivement cette technique, mais le cour est intéressant car il est donné par une pointure mondiale sur le sujet, et parce que ça permet de bien situer ce qu’il est aujourd’hui capable d’attendre de la part de ces techniques.
En shorter on peut imaginer quoi ? Les 50 prochaines années ?
Le 09/03/2016 à 12h49
Le 09/03/2016 à 13h03
Le 09/03/2016 à 13h12
Le 09/03/2016 à 13h17
Le 09/03/2016 à 13h25
Le 09/03/2016 à 13h31
Le 09/03/2016 à 14h27
J’ai regadé le match cette nuit jusqu’à 8h30, le jeu était vraiment serré et d’après les commentateurs alphaGo était très agressif comparé aux dernières fois.
Je serai présent aux prochains matchs, c’est vraiment intéressant de voir un algo bien jouer " />
Le 09/03/2016 à 15h31
En fait c’est beaucoup plus compliqué que ça.
L’algorithme possède deux réseaux neuronaux entrainnés (deep learning) avec un très grand nombre de partie déjà joué ce qui lui permet d’estimer la valeur d’un coup et le second lui permet de choisir la pertinence du coup.
Mais l’originalité car comme tu le dis , il ne peut pas estimer tous les coups possible. Il va donc les choisir au hasard. l’entrainement et le modèle d’apprentissage prend ensuite le relais en choisissant le bon coup à jouer.
Il faut une très grande puissance de calcul pour faire ça.
La grande différence est que la machine va jouer des millions de partie différente et trouver la bonne, l’humain non.
Le 09/03/2016 à 15h34
Le 09/03/2016 à 15h57
Concernant le Morpion, l’humain résiste : n’importe quel môme de 7 ans arrache le match nul à la machine.
Le 08/03/2016 à 17h33
@Sébastien : on compte sur toi pour suivre le match et nous faire un résumé demain matin " />
Le 08/03/2016 à 17h38
Intéressant. Pour le jeu d’échec, l’être humain est dépassé, pour le jeu de GO le résultat sera certainement le même. Rdv demain !
Le 08/03/2016 à 17h40
Etant moi-même joueur de go amateur (je précise : pas à un haut niveau loin de là hein " /> ), j’ai hâte de voir ça (je suis l’actualité d’AlphaGo attentivement depuis quelques temps, et des IA joueuses de go en général)
Miam ! " />
Le 08/03/2016 à 17h42
C’est énervant, ces histoires de “machines”, “ordinateurs” plus fort que…
En l’occurrence c’est bien le programme informatique développé par des chercheurs humains qui va se mesurer à un cerveau humain sugar powered.
D’après wikipedia deepblue son pendant pour les échecs “occupait la 259e place au TOP500 des supercalculateurs avec une puissance de calcul de 11,38 GFLOPS”.
Donc ok pour l’avancée programmatique qui me passe largement au-dessus, mais quid de la puissance du moteur ?
Le 08/03/2016 à 22h12
http://blogs.wefrag.com/drak/2015/11/20/algorithme-genetique-exemple-2-voiture-2d-et-reseau-de-neurones/
Le 08/03/2016 à 22h28
Et les réseaux de neurone existe depuis plus de 50 ans ;)
Les version multicouche depuis au moins une trentaine d’années.
Le deep learning n’est pas une nouveauté, c’est l’avènement de la combinaison puissance/données massive/algo optimisé.
Le 08/03/2016 à 22h31
C’est un poil plus compliqué que ça. Pour deepblue et sa victoire aux échecs, il s’agissait essentiellement de faire du bruteforce, donc la puissance brute comptait plus que tout.
Ici, c’est un algo d’apprentissage, et c’est la phase d’apprentissage qui est déterminante que tout. La machine elle-même n’a pas nécessairement besoin d’être hyper puissante pour faire le calcul.
Le 08/03/2016 à 22h34
L’algo lui-même est assez générique en fait, c’est ça la prouesse et c’est ça qui le rend “intelligent”. En gros il a été parametré pour apprendre à jouer au go, mais il pourrait être parametré pour d’autres tâches, comme le diagnostic médical.
C’est sa force comparé à un simple bruteforce qui n’est par définition applicable qu’à un problème donné.
Le 08/03/2016 à 22h43
Le 08/03/2016 à 23h02
“le nombre de combinaisons possibles est supérieur au nombre d’atomes dans l’Univers ” C’est pas un peu putassier ça? Je croyais que l’univers était infini ou tout du moins qu’on ne connaissait pas ces limites.
Le 08/03/2016 à 23h15
Ça veut bien dire que c’est très grand! " />
Le 08/03/2016 à 23h40
Je crois que c’est dans la tete au carré sur France Inter où un chercheur en IA disait que les progrès fait par AlphaGo dépassait toutes les previsions des specialistes. Ils pensaient qu’il ne pourrait battre un humain que dans 5 ans je crois.
Ca confirme le fait que le gars qui va jouer ce soir est un peu confiant que ce qu’il disait un peu auparavant.
Mais de ce que j’avais compris également c’est que le jeu de go n’a rien à voir avec les échecs et que justement une tactique bruteforce est totalement inutile ici car l’impredictabilité (j’aime pas les néologisme mais bon..) du jeu de go est beaucoup trop grande. Un joueur à qui il ne reste que quelques pierres n’est pas forcement un mauvaise posture.
Le 08/03/2016 à 23h41
le libre arbitre
Le 09/03/2016 à 00h13
Surtout que je crois avoir lu que la machine faisait des coups étonnants, risqués voire téméraires. Le fait qu’il y ait de la surprise me fascine. En gros, les programmeurs sont étonnés de ce que ça donne, ça fait froid dans le dos à certains, perso je trouve ça sympa.
Pour l’histoire de l’IA consciente qui pète la race humaine, je ne vois pas pourquoi ça plutôt qu’autre chose. Certes, ça pourrait tout changer, mais dans n’importe quel sens. Je crains beaucoup plus les humains que les machines, ils ont largement prouvé leur nocivité sur le monde.
Le 09/03/2016 à 03h31
Le calcul quantique ne pourrait-il apporter un avantage concernant le GO ?
Le 09/03/2016 à 04h04
Le 09/03/2016 à 04h14
déjà 60 000 spectateurs " />
Edit: trompage dans les zéros " />
Le 09/03/2016 à 04h37
C’est en ce moment !
Quelqu’un qui s’y connais en Go pourrai commenter ? " />
Le 09/03/2016 à 05h55
Le 09/03/2016 à 06h02
Les commentateurs sont géniaux, c’est une leçon de Go avec le match en tant qu’exemple concret.
Le 09/03/2016 à 06h47
ça me rappelle Hunter x hunter 2011 avec komugi contre meruem " /> http://i.stack.imgur.com/cdCMD.jpg
Le 09/03/2016 à 07h32
Et bien, il semblerait qu’AlphaGo vienne de gagner à l’instant.
Le 09/03/2016 à 07h36
Alpha Go winner : W+Res ? kesako Res
Le 09/03/2016 à 07h39
Resign
Abandon donc (la plupart des matchs de Go finisse par Resign, vu que les mecs savent quand ils n’ont plus aucunes chances de gagner)
Le 09/03/2016 à 07h40
Merci pour l’info…
Le 09/03/2016 à 07h48
Le 09/03/2016 à 07h57
Le 09/03/2016 à 07h59
Attention ici, voici l’histoire :
Il y a eu 2 rencontres IBM VS Kasparov, la première était DeepBlue contre Kasparov, la seconde était DeeperBlue contre Kasparov. DeepBlue s’est fait battre (premère archi BlueGene pour les deux, Deper étant une évolution avec plus d’ouvertures et plus de capacité de calcul), et n’était pas conçu pour battre le joueur. La seconde, DeeperBlue elle était spécifiquement faite pour battre le joueur.
Le 09/03/2016 à 08h07
Je peux ressortir la polémique de l’époque sur Deeperblue ? " /> (comme quoi il n’aurait pas joué tout seul et qu’il a été démonté bien vite sans possibilité de revanche " /> )
Le 09/03/2016 à 08h07
Doublon
Le 09/03/2016 à 08h33
Le 09/03/2016 à 08h33
Ce que cette théorie ne dit pas, c’est comment ils auraient trouvé un joueur humain capable de battre le meilleur joueur humain " />
Le 09/03/2016 à 08h59
C’est faux, aucune ordinateur n’est capable d’analyser “tous les coups” pour aller à l’échec et mat… Le nombre de coups est exponentiel, totalement incalculable, et il serait ridicule de faire tous ces calculs vu que la très grande majorité des coups à jouer sont des coups stupides.
Les ordinateurs d’échec fonctionnent selon plusieurs méthodes :
- base de connaissance de partie. Notamment pour les ouvertures, les programmes contemporains contiennent tous une énorme base de données des grandes ouvertures classiques et des réponses à y apporter. Pareil pour les enchaînements techniques de mat de fin de partie (tour + roi vs roi…etc.)
- capacité d’analyse avec une profondeur de N : il s’agit d’analyser jusqu’à N coups successifs, sous forme de branche (chaque coup ouvrant la porte à une nouvelle version de la partie), afin de trouver des positions jugées comme étant “meilleures”
- capacité d’analyse de l’échiquier pour déterminer ce qu’est une position jugée “meilleure” : le mat est bien évidemment l’objectif premier, mais un gain de pièce, une défense de pièce, le contrôle du centre de l’échiquier ou bien juste une bonne diagonale d’un fou sont également des critères permettant d’associer un score à une succession de coups. La machine choisira le meilleur score.
Le 09/03/2016 à 09h07
On a vérifié que c’était pas un Coréen mécanique comme il y a eu un Turc mécanique ?
Le 09/03/2016 à 09h11
Raaaah il ne mettent même pas le score à la fin !! " />
Le 09/03/2016 à 09h14
Alpha go a gagné par forfait, il n’y a donc pas de score pour la partie
Ca se joue en 5 manches, une par jour, donc il reste encore 2 manches pour retourner la situation
Le 10/03/2016 à 12h27
Si cela continue comme cela, il va falloir faire une nouvelle partie avec 9 points de handicap pour AlphaGo pour voir jusqu’où va la déculotée " />
Le 10/03/2016 à 12h44
Le 10/03/2016 à 14h58
Ca n’a rien d’étonnant , ils jouent des millions de partie de manière aléatoire puis les examine et trouve le meilleur choix avec son réseau de neurones entrainnés sur les parties types.
Il faut une sacrée puissance de calcul, c’est presque déséquilibré comme match en fait. Les champions humains faisant très peu d’erreur ont leur chance. Par contre un joueur lambda se fera pulvériser.
Le 10/03/2016 à 18h34
La suite samedi matin à 4h30 pour ceux qui vont se poser la question demain matin. ;-)
Le 11/03/2016 à 09h04
Le 11/03/2016 à 09h45
Le 11/03/2016 à 10h36
Le 11/03/2016 à 13h41
Plus longue, oui, parce que Lee Sedol avait du mal a voir où AlphaGo l’emmenait, plus serrée, bof, vue le différentiel final d’environs 30 points, c’est l’équivalent d’un 6p face a un 9p, soit un gouffre.
Le 12/03/2016 à 07h43
Bon bah, il semblerait qu’AlphaGo soit encore en train de démonter de l’humain pour la 3ème fois…
Le 12/03/2016 à 08h19
Démontage terminé. 3-0 avec un score aux environs des 70-45 hors captures (le coin bas gauche semblait assez épique, mais finalement AlphaGo qu’on pensait avoir peur des échanges … A juste fait un truc du genre “fuck it, j’ai plus de coups d’avance que toi et une lecture propre du goban”.
Edit : j’attend la conférence de presse qui risque d’être “j’ai essayé mais il est vraiment trop fort”.
Le 12/03/2016 à 10h00
Prochaine victime… " /> " /> Ah les égos des joueurs. " />
Le 12/03/2016 à 11h35
A voir comment vont se dérouler les 2 dernières manches. Si y’a 5-0 avec des scores aussi fleuves que les matches 2 et 3 pour 4 et 5, soit Lee Sedol a un jeu qui n’est plus adapté aux ouvertures et lectures de ses concurrents (peu probable), soit va falloir penser a ouvrir des nouveaux niveaux (mais y’a quoi au dessus de 9p ?)
Le 12/03/2016 à 12h49
Le 12/03/2016 à 17h15
J’ai hate de voir un match du style au shogi la machine contre  Wikipedia
Le 13/03/2016 à 11h20
3-1 pour la machine, l’honneur est sauf.
Le 14/03/2016 à 09h43