TwitterfacebookYouTubeSteamRSS
Logo JambonBurst
La toute dernière chronique
Firewatch : sortir ou ne pas sortir des sentiers battus
Monde a l’envers : Un coréen s’incline devant un PC
Ça nous intéresse

Monde a l’envers : Un coréen s’incline devant un PC

Le 27 janvier dernier, était publié dans la revue scientifique Nature un article intitulé « Mastering the game of Go with deep neural networks and tree search ». Un titre un peu lourdaud ; rien d’anormal pour le journal. Mais voilà : cette revue élitiste, qui se limite généralement aux contributions de chercheurs prestigieux, met cette fois en avant les recherches d’un vingtaine d’employés de la compagnie Google.

Le programme AlphaGo, développé par la succursale DeepMind du groupe, vient en effet d’effectuer une percée dans le domaine de l’intelligence artificielle, en s’imposant face à des professionnels du jeu de Go. Le super-algorithme serait sur le point de tataner (demain, 12 mars) le coréen Lee Sedol, 33 ans, considéré par beaucoup comme le maître mondial de la discipline.

"J'aime les maths" - Demis Hassabis, co-fondateur de DeepMind Technologies

« J’aime les maths » – Demis Hassabis, co-fondateur de DeepMind Technologies

Pour rappel, le Go est un jeu de plateau made in China, revêtant des apparences relativement simplistes : Une grille sur laquelle les deux opposants placent des pierres dans le but d’encercler les territoires ennemis, et des règles du jeu qui tiennent sur le revers d’une carte postale – adresse et timbre compris.

Cette simplicité n’est cependant qu’apparente, puisque le nombre de parties possibles dépasserait les 10170 (Autant qu’il y aurait d’atomes dans un univers où chaque atome contiendrait lui-même un sous-univers. Pour ainsi dire.).
Pour comparaison, les échecs ne présentent « que » 10120 combinaisons environ, raison pour laquelle le superordinateur Deep Blue d’IBM était parvenu, dès 1997, à défaire le maître en la matière : Garry Kasparov.

Mais pour le Go, c’est un peu plus tendu.

Des PC de moins en moins cons

Pour parvenir à ses fins, l’équipe de développement d’AlphaGo a fait appel à des algorithmes d’intelligence artificielle aux petits oignons.

Les IA modernes s’appuient massivement sur le principe d’apprentissage automatique :
Au lieu de programmer « à la main, comme un porc » tous les cas de figure face auxquels la machine peut se retrouver, on « se contente » de la doter de la faculté d’apprendre. Cet apprentissage peut être effectué par différents biais. Le robot peut, par exemple, s’instruire en affrontant d’autres joueurs (humains ou machines), ou encore en piochant dans les bases de données, pour observer des parties jouées par le passé.
Contrairement aux intelligences artificielles « classiques » procurant une réponse fixe pour une entrée donnée, les algorithmes utilisant le Deep Learning sont dynamiques, et s’améliorent donc au fil du temps.
Quand bien même on voudrait avancer qu’une machine n’aura pas la jugeote d’apprentissage d’un humain, elle restera cependant douée d’une faculté majeure : elle peut apprendre vite. Genre, très vite. A l’instar de la Google Car, capable d’engranger l’équivalent de milliers d’heures d’expérience virtuelle en un laps de temps réduit (sans accroc à la clé, ou presque), l’algorithme d’AlphaGo peut affiner sa technique en effectuant les traitements en parallèle, s’instruisant ainsi sans relâche.

(Image issue de l'article officiel, Nature #529) A droite, une représentation du réseau neuronal estimant la probabilité du prochain coup, en fonction de la configuration actuelle du plateau. A gauche, le réseau estimant l'issue de la partie. Enfin, je crois

(Image issue de l’article officiel, Nature) A gauche, une représentation du réseau neuronal estimant la probabilité du prochain coup en fonction de la configuration actuelle du plateau. A droite, le réseau estimant l’issue de la partie. Enfin, je crois.

Dans le cas d’AlphaGo, cet apprentissage automatique prend comme support des réseaux neuronaux, s’inspirant de la structure du cerveau humain. Au fil de l’apprentissage, les interconnexions entre les neurones virtuels* évoluent. Comme dans une vraie caboche, les stimuli répétés renforcent certaines connexions, tandis que les impulsions plus occasionnelles tombent dans l’oubli (pour la même raison qu’on se souvient encore des 150 Pokémons, alors qu’on a oublié nos tables de 7, 8 et 9). Il se tisse peu à peu une toile de connaissances, de laquelle émerge une forme « d’instinct » (ouais, c’est en tout cas ce qu’a pu ressentir le champion coréen)

* Les réseaux neuronaux sont ici simulées informatiquement. En laboratoire, certains chercheurs tentent de pousser l’idée plus loin, en construisant des dispositifs imitant directement les neurones. J’avais posté une message sur le sujet, il y a quelques années déjà… Si jamais. Non ? Bon.

Donc en gros

En gros on en est là : Lee Sedol, le « Maître Splinter » du Go, se confronte à la bête de DeepMind depuis le 9 mars dernier. Initialement très optimiste, il a rapidement revu son jugement à la baisse.
Et pour cause : sur les cinq manches que comporte la baston, deux ont déjà été gagnées par la machine (dans des parties durant 4 à 5 heures) !

« A présent, je crois que je ne pourrais peut-être pas vaincre AlphaGo avec une marge aussi importante que 5-0. Je dois être un peu plus stress. » (Tu m’étonnes)

"Ne pas ragequit, ne pas ragequit..."

« Ne pas ragequit, ne pas ragequit… »

Le prochain round aura lieu demain, samedi 12 mars, et pourra être suivi en direct sur la chaine officielle. Là où ça devient chaud, c’est que cette manche est décisive pour l’issue de l’affrontement, et pourrait établir une fois pour toutes la suprématie de la machine en matière de jeux de logique.

Quoi qu’il advienne, il me semble certain que l’apprentissage automatique est voué à étendre son influence dans de nombreux domaines. Le traitement du langage, la reconnaissance d’images, le pilotage automatique, sont autant d’applications situées directement dans la ligne de mire de ces techniques.
Et puis viendra le moment où les machines de Deep Learning s’attaqueront à l’univers du jeu vidéo… !

Mise à jour (12/03/15) :
Comme on pouvait le craindre pour Lee Sedol, le troisième match a été remporté par l’ordinateur. Il explique que la partie fût très stressante, face à cet adversaire imperturbable.

« Je suis désolé. J’ai raté des opportunités, je n’ai pas pu supporter la pression. Je me suis senti impuissant. »

Demis Hassabis félicitant la ténacité de Lee Sedol face à son programme

Demis Hassabis félicitant la ténacité de Lee Sedol face à son programme, après cette 3ème défaite.

Deleted

Rédacteur

Voir ses autres articles

à voir aussi

Commentaires (11)

Ecrire un commentaire
  1. DelosCrafter

    well played, bon article !

  2. [J.M], Le Coq de l'Amour

    Appliquée à l'industrie, une telle capacité d'apprentissage, ça peut être intéressant.

    Cependant, je reste inquiet vis à vis de ces machines. A ce rythme là, la machine risque de remplacer l'homme et les conséquences ne seront pas toutes positives.

    M'enfin, tant que ça finit pas comme dans Terminator, on est dans le bon !

  3. Slade

    On est pas dans la merde avec Gogole.

    Très chouette article Deleted, c'est fluide et bien illustré.

  4. DelosCrafter

    Appliquée à l'industrie, une telle capacité d'apprentissage, ça peut être intéressant.

    Cependant, je reste inquiet vis à vis de ces machines. A ce rythme là, la machine risque de remplacer l'homme et les conséquences ne seront pas toutes positives.

    M'enfin, tant que ça finit pas comme dans Terminator, on est dans le bon !
    Bah, si les machines remplacent l'homme sur les activités d'industrie à la chaine, pourquoi pas. Mais, pour que ça fonctionne, il faudrait mettre les choses en place correctement.
    Si l'état possède les machines, il peut remplacer les ouvriers, les payer et en plus dégager du bénéfice pour rembourser les machines. C'est juste que si tu es côté en bourse et qu'en plus il faut payer un patron des milles et des cents, c'est juste pas possible. Fin bref, dans ma tête c'est la monde des bisounours avec fluffy sur son arc-en-ciel.

  5. Hunkii

    Sans aller dans le Deep Learning, les dev' de jeu vidéo pourraient auraient du se bouger les fesses depuis quelque temps déjà, j'ai pas vu une IA qui m'a surpris depuis FEAR premier du nom (les IA qui trichent ça compte pas).

Voir la suite des commentaires