Tönkreveri a mesterséges intelligencia a profi pókereseket

2017-02-02
Kijelenthetjük, hogy a Carnegie Mellon University új botja, a Libratus fényes győzelmet arat heads-up párbajban az NLHE klasszisok felett.

 

Az első "Brains Vs. Artificial Intelligence" összecsapást 2015-ben rendezték, és akkor a Claudico elnevezésű bot nagyarányú vereséget szenvedett a Doug "WCGRider" Polk, Dong "Donger Kim" Kim, Bjorn "iamalagtard" Li és Jason "PremiumWhey" Les alkotta team ellen. Akkor a 80.000 leosztás alatt a játékosok együttesen $732.713-ral verték a szoftvert.

 

Az új mesterséges intelligencia szoftver, a Libratus ellenfelei most Dong "Donger Kim" Kim, Jason "PremiumWhey" Les, Jimmy "ForTheSwaRMm" Chuo és Daniel "dougiedan678" McAulay.

Már a 20 napig tartó verseny elején látszott, hogy Libratus jóval keményebb dió lesz, mint „kisöccse”. A párbaj 20%-ának lejátszása után Libratus vezetett, már akkor $135.000 pluszban volt.

A tendencia nem változott január 24-ére sem, mikor a 120.000 leosztásos meccs már túljutott a felén, és 65.000 leosztásnál tartottak. A Libratus, 50/100 vakok mellett, már $794.392-os profiton állt. Ekkor ugyan még 55.000 leosztás hátra volt, de érezhetően már a profik sem nagyon hitték el, hogy nyerhetnek. 

Január 30-ra gyakorlatilag eldőlt, hogy Libratus fényes győzelmet arat a profik felett: 101.908 leosztás után a gép közel 1,4 millió dollárral vezet. A négy profi közül egyedül Dong "Donger Kim" Kim jelent komoly ellenfelet Libratusnak, de ő is mínuszban van, $22.309-t vesztett. A többieket valósággal megsemmisíti a bot: Daniel "dougiedan678" McAulay $271.233-t, Jimmy "ForTheSwaRMm" Chuo $365.559-t, Jason "PremiumWhey" Les pedig $718.341-t bukott  (volna, ha a parti valódi pénzben zajlana). A felek minden leosztást $20.000-ral kezdenek, a vak $50/$100.

 

 

Miért akkora kihívás a póker a mesterséges intelligencia számára?

 

Egy pókerjátszma során hiányos információk alapján kell dönteni, ami nagyon komplexszé teszi a játékot, és sokkal inkább hasonlóvá sok való-világbeli helyzethez.

A Libratus győzelme hatalmas eredmény a mesterséges intelligencia-kutatásban. A póker olyan gondolkodást és intelligenciát követel, mely eddig igen nehéznek bizonyult a gépek számára. A póker alapvetően különbözik a dámától, a sakktól, vagy a Go-tól, mert az ellenfél lapjai rejtve maradnak a játék során. A „hiányos információ” játékok esetében rendkívül komplikált kitalálni az ideális stratégiát az ellenfél minden lehetséges megközelítésére. A no-limit Texas hold’em pedig különösen nagy kihívás, mert az ellenfél lényegében bármekkora összeget kockáztathat. 

 

“A póker az egyik legnehezebb játék a mesterséges intelligencia (MI) számára.” – állítja Andrew Ng, a Baidu vezető tudósa. „Nincs egyetlen optimális lépés, ehelyett a MI szoftvernek randomizálnia kell a tevékenységét annak érdekében, hogy elbizonytalanítsa az ellenfeleket, ha blöfföl.

 

A Libratus-t Tuomas Sandholm, a CMU számítástechnikai karának professzora, és végzős hallgatója, Noam Brown alkotta meg. A Finnországból emigrált Sandholm a játékelmélet és a mesterséges intelligencia szakértője – szerinte bámulatos, hogy az emberek ilyen sokáig le tudják játszani a számítógépeket. „Elképesztő, hogy milyen jók ezek a profi játékosok.” – mondja. „Az összes játék közül, melyekkel a mesterséges intelligencia foglalkozott, a póker az egyetlen, ahol az MI még nem ért el emberfeletti teljesítményt.”

 

A MI kutatók a játékelméletet vagy a stratégiai döntéshozatal matematikáját használják a legjobb stratégia megtalálásához a különböző bizonytalanságok mellett. Mivel a lehetőségek száma hatalmas, általában a közelítés valamilyen formáját is alkalmazzák.

 

“Az, hogy egy lépés jó vagy sem, olyan dolgoktól függ, amit nem láthatsz.” mondja Vincent Conitzer, a Duke University professzora, aki MI-t és játékelméletet tanít. „Ez azt is eredményezi, hogy kiszámíthatatlannak kell lenned. Ha sosem blöffölsz, nem vagy jó játékos. Ha mindig blöffölsz, szintén nem vagy jó játékos. A játékelmélet megmondja hogyan tedd véletlenszerűvé a játékod olyan módon, ami bizonyos értelemben optimális.”

 

Tavaly Sandholm egy korábbi póker program, a Claudico fejlesztését vezette, melyet rendesen elvert pár profi pókerjátékos. Magyarázata szerint a Libratus több új megközelítést is alkalmaz a magas szintű játék elérése érdekében. Például újfajta megközelítési technikát, és több új olyan módszert, amely a játék későbbi szakaszában felfedett kártyák alapján a lehetséges végkimeneteleket elemzi. 

 

A gépi tanulás és MI fejlődésével több játékban is fejlesztettek ki emberfeletti képességekkel rendelkező programokat a közelmúltban. Tavaly a DeepMind, az Alphabet leányvállalatának kutatói kifejlesztettek egy olyan programot, mely meg tudja verni a világ legjobb Go játékosait is. Ez azért lenyűgöző eredmény, mert a Go egyrészt rendkívül összetett játék, másrészt mert a játékon belül nehéz mérni a haladást.

 

Egy pár kutatócsapat a pókerre összpontosít. Egy másik tudóscsoport a kanadai Alberta egyetemén, a Charles University-n és a cseh műegyetemen nemrégiben kifejlesztettek egy DeepStack elnevezésű programot, ami már megvert pár profi játékost heads-up no limit Texas hold’em-ben. 

 

Sandholm szerint azonban a Libratus elleni versenyben résztvevő játékosok sokkal erősebbek, és sokkal több kört játszanak a gép ellen, ami nagyobb statisztikai jelentőséget biztosít az eredménynek. 

 

Azokat a technikákat, melyet az okosabb poker-botok fejlesztésére használnak, a való világban is sok téren tudják majd alkalmazni. A játékelméletet már alkalmazták a terheléses támadások kutatásában és a kiberbiztonság egyéb területein, a taxi szolgáltatók számára fejlesztett automatizált segítőalkalmazás fejlesztésében, és a robottervezés területén – mondja Sam Ganzfried, aki a Claudico fejlesztésében is részt vett, most pedig a Florida International University tanársegédje.

 

Az, hogy a Libratus nyer a mostani versenyen, persze jelenti azt, hogy az emberek többé nem érdemelnek helyet a kártyaasztal mellett. A no-limit Texas hold’em többjátékos verziójában ugyanis nem lehet alkalmazni a Libratus által használt technikákat.

 
Címkék: póker,