Ostatnia aktualizacja: 15 lipca 2019
Najnowsze „Science” opisuje program sztucznej inteligencji Pluribus, który pobił najlepszych profesjonalistów w najbardziej popularnej odmianie pokera zwanej teksańskim klinczem (ang. Texas Hold’em) w wersji bez ograniczeń (No-Limit) na sześciu zawodników. To jedna z najtrudniejszych gier, poziomem skomplikowania znacznie przewyższająca go czy szachy.
Poker od dawna był uważany za jedno z największych wyzwań dla sztucznej inteligencji. Twórcy teorii gier – John von Neumann i John Nash – w swoich najważniejszych publikacjach przytaczali właśnie tę grę dla ilustracji swoich koncepcji.
AI bierze pokera
W przeciwieństwie do szachów pokerzysta musi podejmować decyzje bez pełnej wiedzy o tym, jakie karty ma w ręku przeciwnik. W dodatku musi się liczyć z blefem, a więc świadomym wprowadzaniem w błąd przez innych graczy.
Nic dziwnego, że złożoność tej gry do niedawna przerastała możliwości komputerów i twórców botów. Dwa late temu jednak zaczęło się to zmieniać. Powstały pierwsze programy, które wygrywają z zawodowcami w dużo prostszej wersji Texas Hold’em – tylko na dwóch zawodników.
A teraz „Science” informuje o programie Pluribus, który ogrywa profesjonalistów w odmianie tego pokera dla wielu graczy. W wersji bez ograniczeń gracze mogą licytować, dopóki mają jakiekolwiek żetony i nie mają ograniczenia co do wysokości licytacji. Gra może skończyć się na dwa sposoby – albo gracz licytujący najwyżej zostanie sam, reszta spasuje, albo sprawdzane jest, kto ma najsilniejszy układ pięciu kart.
Program grał w pokera sam ze sobą
Pluribus jest dziełem dwóch naukowców: Tuomasa Sandholma, profesora Carnegie Mellon University, oraz Noama Browna, który pracuje w laboratorium sztucznej inteligencji Facebooka.
Wcześniej Brown był doktorantem Sandholma na Carnegie Mellon, gdzie oboje stworzyli program Libratus, który ogrywa zawodowców w pokera na dwóch graczy.
Pluribus, podobnie jak wcześniejszy Libratus (a także inne programy sztucznej inteligencji, np. grający w go AlphaGo), znalazł najlepszą strategię rozgrywając miliony partii sam ze sobą (tj. z sześcioma kopiami samego siebie). Program nie dostał żadnych wstępnych podpowiedzi i wskazówek od ludzkich profesjonalistów, po prostu zaczął licytować losowo, poprawiając się z partii na partię.
Opracowanie strategii zabrało – jak piszą badacze w „Science” – osiem dni wirtualnego rozgrywania partii pokera na 64-rdzeniowym serwerze, zajmując 512 GB pamięci. O dziwo, nie wymagało więc jakichś wielkich supermocy komputerowych.
Całość czytaj na: wyborcza.pl
Jogibaboo
15/07/2019