Libratus

Libratus (puis « Lengpudashi ») est un programme informatique d'intelligence artificielle destiné à jouer au poker, développé à l'université Carnegie-Mellon de Pittsburgh aux États-Unis. Ce type de logiciels est aussi nommé pokerbot.

Libratus

Informations
Créateur	Tuomas Sandholm Noam Brown Université Carnegie-Mellon de Pittsburgh
Dernière version	(10 avril 2017)
État du projet	Lengpudashi
Environnement	Superordinateur « Bridges »
Type	Intelligence artificielle

Libratus joue la forme du poker la plus populaire actuellement, le Texas hold'em en no-limit (mises non limitées) dans sa variante à deux joueurs (en Head's up (en)).

En 2017, le programme est vainqueur d'un tournoi de poker l'opposant à quatre joueurs professionnels humains.

Présentation

Libratus est un programme informatique entièrement écrit en partant de zéro[1]. Il est le successeur de Claudico (en) et fut suivi de Lengpudashi (冷扑克大师)[n 1]. Son nom vient du latin et signifie « équilibré ».

La construction de Libratus a nécessité 15 millions d'heures/cœur de calculs (à comparer aux 3 millions pour Claudico) ; ces calculs furent effectués sur le superordinateur « Bridges » du centre de calcul à hautes performances de Pittsburgh (en).

Selon Tuomas Sandholm, l'un des créateurs de Libratus, le programme n'a pas de stratégie préprogrammée, mais la calcule à l'aide d'un algorithme adaptatif utilisant une variante de la technique de la « minimisation du regret[3] hypothétique »[4], la méthode CFR+[n 2] introduite en 2014 par Oskari Tammelin[5].

Outre CFR+, Libratus utilise une nouvelle technique que Sandholm et un de ses étudiants, Noam Brown[6], avaient développée pour résoudre les études de finales aux échecs. Cette méthode permet de contourner la méthode des « cartes d'action[n 3] », qui était jusque-là la norme dans la programmation du poker.

Libratus ne joue que contre un seul[7] autre adversaire, en suivant les règles du Texas hold'em à deux joueurs, c'est-à-dire dans la variante dite en « face à face »[n 4] (Heads up poker (en)).

Match de Pittsburgh 2017

Déroulement

Du 11 au 31 janvier 2017, Libratus fut opposé lors d'un tournoi organisé dans un casino de Pittsburgh à quatre joueurs humains, professionnels de poker[8], à savoir Jason Les[6], Dong Kim[6], Daniel McAulay[6] et Jimmy Chou[6]. Pour que le résultat du tournoi soit le plus significatif possible, un total de 120 000 mains furent jouées, une augmentation de 50 % par rapport au tournoi qu'avait disputé Claudico (en) en 2015 (ce qui obligea à allonger la durée du tournoi de treize à vingt jours).

Les quatre joueurs étaient regroupés en équipes de deux, jouant indépendamment les mêmes mains en échangeant les côtés, c'est-à-dire que les cartes reçues par une équipe humaine dans une donne étaient attribués à Libratus, celui-ci jouant la même donne contre l'autre équipe, de telle sorte que l'élément de hasard dans les distributions soit annulé.

Force

Dès le premier jour de la compétition, Libratus prit l'avantage contre les humains. Le dixième jour, Dong Kim déclara :

« Jusqu'ici, je ne m'étais pas rendu compte à quel point il était bon. Aujourd'hui, j'avais les mêmes sensations qu'en jouant contre un tricheur qui aurait vu mes cartes. Mais Libratus ne trichait pas, il était seulement trop fort[9]. »

À la 16^e journée du tournoi, Libratus franchit pour la première fois la barre des 1 000 000 dollars en jetons virtuels. À la fin de la journée, il était en avance de 1 194 402 __SUB_LEVEL_SECTION_3__nbsp;dollars en jetons contre l'équipe humaine.

À la fin de la compétition, Libratus menait par 1 766 250 dollars en jetons, une victoire écrasante, les joueurs humains étant tous en déficit de leur côté.

Texas Hold'em poker.

Place	Nom	Gain ou pertes	Par main
1	Libratus	$1 766 250	$14,72[10]
2	Dong Kim	- $85 649	- $2,85
3	Daniel MacAulay	- $277 657	- $17,43
4	Jimmy Chou	- $522 857	- $29,34
5	Jason Les	- $880 087	- $9,26

Dans ce match en no-limit (mises non limitées) 50/100, Libratus gagne 14,72bb/100[10] (bb : big blind ; la grosse blinde est une relance minimale) ; la grosse blinde étant fixée pour ce match à cent dollars, le gain est de 14,72 grosses blindes pour cent mains, un résultat exceptionnellement élevé.

Architecture

Un premier module extrait un arbre réduit du jeu et évalue une première ébauche de la stratégie globale du plan. L'abstraction est développée avec équilibrage des stratégies. Finalement l'auto-amélioration enrichie la stratégie globale[11].

deep learning[12] : les parties jouées durant la journée étaient analysées par Libratus la nuit, ce qui lui permettait d'améliorer sa stratégie durant le tournoi, et d'éliminer les imperfections (holes, les « trous » dans sa stratégie) que les équipes humaines avaient pu découvrir ;
équilibre de Nash[12] ;
imprévisibilité[12] : jeu sur un grand nombre de variantes tactiques, comme des petites mises ou des sur-relances qu'un bon joueur humain trouveraient incorrectes ; « Chaque fois qu'on a trouvé la faille, le lendemain, elle avait disparu[12] ».

Lengpudashi au match de Haikou 2017

En avril 2017, Lengpudashi remporte la victoire face à six joueurs chinois de l'équipe Dragons (des ingénieurs et des investisseurs chinois, de simples amateurs de poker à l’exception de Alan Du, qui a participé aux World Series), dans une rencontre exhibition à but commercial, à 36 000 mains[13] sur l'île de Hainan[14]. Par rapport à Libratus à 147 milli-bb (bb : big blind) par partie, Lengpudashi s'améliore pour atteindre 220 milli-bb[15].

Autres applications possibles

Bien que Libratus soit initialement conçu pour jouer au poker, ses concepteurs prévoient de lui donner de nombreuses autres applications[16].

Les techniques qu'il utilise devraient lui permettre de s'adapter à n'importe quelle situation dans laquelle une « information incomplète » est présente[17], par exemple quand des « adversaires » cachent certaines informations, ou bien en fournissent de fausses. Sandholm et ses collègues envisagent d'appliquer ce système à des situations du monde réel, telles que la cybersécurité, la négociation commerciale[17] ou le diagnostic médical[18].

Notes et références

Notes

« cold poker master[2]. »
CFR+ : Counterfactual Regret Minimization[5] : minimisation du regret hypothétique.
action mapping : cartes d'action.
heads up : face à face.

Références

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Libratus » (voir la liste des auteurs).

Guilain Depardieu et Thibaut Martin, « L'intelligence artificielle va-t-elle nous dépasser ? », à partir de 4 min 21 s, sur Arte, 28 septembre 2018.
(zh) 机械鸡, « 中国人工智能的崛起 » [« La montée de l'intelligence artificielle en Chine »], sur Tencent,‎ 12 octobre 2017 : « Lengpudashi（中文名“冷扑克大师”） ».
R. Lambert, « Une IA championne de poker ? », sur Pensée Artificielle, 11 mars 2018.
(en) Jeremy Hsu, « Meet the New AI Challenging Human Poker Pros », sur IEEE Spectrum: Technology, Engineering, and Science News, 10 janvier 2017.
(en) Noam Brown et Tuomas Sandholm, « Safe and Nested Endgame Solving for Imperfect-Information Games » [PDF], sur Carnegie Mellon University, 2017.
(en) « Brains versus Artificial Intelligence », sur Rivers Casino, 11-31 janvier 2017.
« Une intelligence artificielle affronte des professionnels du poker en direct », sur Le Monde, 12 janvier 2017.
(en) Byron Spice et Garrett Allen, « Upping the Ante: Top Poker Pros Face Off vs. Artificial Intelligence », sur Université Carnegie-Mellon, 4 janvier 2017 (consulté le 1^er octobre 2018).
(en) Cade Metz, « Artificial Intelligence Is About to Conquer Poker—But Not Without Human Help », sur Wired, 24 janvier 2017.
Petiteglise, « La machine bat l’homme… Et tue le poker ? », sur Poker Académie, 1^er février 2017 (consulté le 1^er octobre 2018).
Pierre-Yves Gerlat, « Comment l’intelligence artificielle de Libratus est devenue la championne incontestée au Poker », sur Actu IA, 18 décembre 2017 (consulté le 1^er octobre 2018).
Aline Gérard, « Libratus : l'ordinateur qui sait nous bluffer au poker », sur Le Parisien, 28 janvier 2017 (consulté le 1^er octobre 2018).
SuperCaddy, « Lengpudashi : l'intelligence artificielle sans pitié pour la team Dragons », sur Club Poker, 11 avril 2017 (consulté le 1^er octobre 2018).
Antoine Boudet, « La version améliorée de l’IA Libratus continue de dominer des humains au poker », sur Numerama, 11 avril 2017 (consulté le 1^er octobre 2018).
Malick, « Poker : Lengpudashi, une autre IA de l'université Carnegie Mellon terrasse ses six adversaires humains », sur Développez, 18 avril 2017 (consulté le 1^er octobre 2018).
(en) Will Knight, « Why Poker Is a Big Deal for Artificial Intelligence », sur MIT Technology Review, 23 janvier 2017.
Rémi Sussan, « L’Intelligence artificielle va-t-elle mettre fin au poker ? », sur Le Monde, 28 janvier 2017.
(en) « Artificial Intelligence Wins $800,000 Against 4 Poker Masters » [« L'IA gagne 800 000 dollars contre des maîtres du poker »], sur Interesting Engineering, 27 janvier 2017.

Articles connexes

Portail du poker
Portail de l’informatique
Portail des jeux

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.

[3] « cold poker master[2]. »

[7] CFR+ : Counterfactual Regret Minimization[5] : minimisation du regret hypothétique.

[9] action mapping : cartes d'action.

[11] heads up : face à face.

[1] Guilain Depardieu et Thibaut Martin, « L'intelligence artificielle va-t-elle nous dépasser ? », à partir de 4 min 21 s, sur Arte, 28 septembre 2018.

[2] (zh) 机械鸡, « 中国人工智能的崛起 » [« La montée de l'intelligence artificielle en Chine »], sur Tencent,‎ 12 octobre 2017 : « Lengpudashi（中文名“冷扑克大师”） ».

[4] R. Lambert, « Une IA championne de poker ? », sur Pensée Artificielle, 11 mars 2018.

[5] (en) Jeremy Hsu, « Meet the New AI Challenging Human Poker Pros », sur IEEE Spectrum: Technology, Engineering, and Science News, 10 janvier 2017.

[cmu2017-6] (en) Noam Brown et Tuomas Sandholm, « Safe and Nested Endgame Solving for Imperfect-Information Games » [PDF], sur Carnegie Mellon University, 2017.

[riverscasino2017_01_11-8] (en) « Brains versus Artificial Intelligence », sur Rivers Casino, 11-31 janvier 2017.

[10] « Une intelligence artificielle affronte des professionnels du poker en direct », sur Le Monde, 12 janvier 2017.

[12] (en) Byron Spice et Garrett Allen, « Upping the Ante: Top Poker Pros Face Off vs. Artificial Intelligence », sur Université Carnegie-Mellon, 4 janvier 2017 (consulté le 1^er octobre 2018).

[13] (en) Cade Metz, « Artificial Intelligence Is About to Conquer Poker—But Not Without Human Help », sur Wired, 24 janvier 2017.

[poker-academie2017_02_01-14] Petiteglise, « La machine bat l’homme… Et tue le poker ? », sur Poker Académie, 1^er février 2017 (consulté le 1^er octobre 2018).

[15] Pierre-Yves Gerlat, « Comment l’intelligence artificielle de Libratus est devenue la championne incontestée au Poker », sur Actu IA, 18 décembre 2017 (consulté le 1^er octobre 2018).

[leparisien2017_01_28-16] Aline Gérard, « Libratus : l'ordinateur qui sait nous bluffer au poker », sur Le Parisien, 28 janvier 2017 (consulté le 1^er octobre 2018).

[17] SuperCaddy, « Lengpudashi : l'intelligence artificielle sans pitié pour la team Dragons », sur Club Poker, 11 avril 2017 (consulté le 1^er octobre 2018).

[18] Antoine Boudet, « La version améliorée de l’IA Libratus continue de dominer des humains au poker », sur Numerama, 11 avril 2017 (consulté le 1^er octobre 2018).

[19] Malick, « Poker : Lengpudashi, une autre IA de l'université Carnegie Mellon terrasse ses six adversaires humains », sur Développez, 18 avril 2017 (consulté le 1^er octobre 2018).

[20] (en) Will Knight, « Why Poker Is a Big Deal for Artificial Intelligence », sur MIT Technology Review, 23 janvier 2017.

[lemonde2017_01_28-21] Rémi Sussan, « L’Intelligence artificielle va-t-elle mettre fin au poker ? », sur Le Monde, 28 janvier 2017.

[22] (en) « Artificial Intelligence Wins $800,000 Against 4 Poker Masters » [« L'IA gagne 800 000 dollars contre des maîtres du poker »], sur Interesting Engineering, 27 janvier 2017.