Koniec żywego pokera. Sztuczna inteligencja wygrywa z elitą zawodowców

Ciekawostki
Bartosz 15/07/2019

Ostatnia aktualizacja: 15 lipca 2019

Najnowsze „Science” opisuje program sztucznej inteligencji Pluribus, który pobił najlepszych profesjonalistów w najbardziej popularnej odmianie pokera zwanej teksańskim klinczem (ang. Texas Hold’em) w wersji bez ograniczeń (No-Limit) na sześciu zawodników. To jedna z najtrudniejszych gier, poziomem skomplikowania znacznie przewyższająca go czy szachy.

Poker od dawna był uważany za jedno z największych wyzwań dla sztucznej inteligencji. Twórcy teorii gier – John von Neumann i John Nash – w swoich najważniejszych publikacjach przytaczali właśnie tę grę dla ilustracji swoich koncepcji.

AI bierze pokera

W przeciwieństwie do szachów pokerzysta musi podejmować decyzje bez pełnej wiedzy o tym, jakie karty ma w ręku przeciwnik. W dodatku musi się liczyć z blefem, a więc świadomym wprowadzaniem w błąd przez innych graczy.

Nic dziwnego, że złożoność tej gry do niedawna przerastała możliwości komputerów i twórców botów. Dwa late temu jednak zaczęło się to zmieniać. Powstały pierwsze programy, które wygrywają z zawodowcami w dużo prostszej wersji Texas Hold’em – tylko na dwóch zawodników.

A teraz „Science” informuje o programie Pluribus, który ogrywa profesjonalistów w odmianie tego pokera dla wielu graczy. W wersji bez ograniczeń gracze mogą licytować, dopóki mają jakiekolwiek żetony i nie mają ograniczenia co do wysokości licytacji. Gra może skończyć się na dwa sposoby – albo gracz licytujący najwyżej zostanie sam, reszta spasuje, albo sprawdzane jest, kto ma najsilniejszy układ pięciu kart.

Program grał w pokera sam ze sobą

Pluribus jest dziełem dwóch naukowców: Tuomasa Sandholma, profesora Carnegie Mellon University, oraz Noama Browna, który pracuje w laboratorium sztucznej inteligencji Facebooka.

Wcześniej Brown był doktorantem Sandholma na Carnegie Mellon, gdzie oboje stworzyli program Libratus, który ogrywa zawodowców w pokera na dwóch graczy.

Pluribus, podobnie jak wcześniejszy Libratus (a także inne programy sztucznej inteligencji, np. grający w go AlphaGo), znalazł najlepszą strategię rozgrywając miliony partii sam ze sobą (tj. z sześcioma kopiami samego siebie). Program nie dostał żadnych wstępnych podpowiedzi i wskazówek od ludzkich profesjonalistów, po prostu zaczął licytować losowo, poprawiając się z partii na partię.

Opracowanie strategii zabrało – jak piszą badacze w „Science” – osiem dni wirtualnego rozgrywania partii pokera na 64-rdzeniowym serwerze, zajmując 512 GB pamięci. O dziwo, nie wymagało więc jakichś wielkich supermocy komputerowych.

Całość czytaj na: wyborcza.pl

1 komentarz

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Jogibaboo

15/07/2019

dwie osoby na świecie używają określenia "teksański klincz" - polski tłumacz filmu "Rounders" i autor tego artykułu.
E-PLAY.PL