TROLOGRAFICKY: Vítězství umělé inteligence v Pokeru

Autor: Wolfsen | 6.2.2017 | 4

Ve dnech 11.-30. 1. se v americkém Pittsburghu konal pokerový maraton. To by nestálo ani za špetku mé pozornosti, kdyby v něm vedle 4 hráčů světové pokerové špičky nezápolil také počítačový program Liberatus. A zvítězil!

Vítěznou umělou inteligenci Liberatus vyvinuli experti z Carnegie Mellon University -  profesor Tuomas Sandholm a doktorand Noam Brown. S Liberatem se utkali hráči Dong Kim, Jason Les, Jimmy Chou a Daniel McAuley. Hrál se bezlimitní Heads Up Texas Hold'em Poker. Lidští hráči, ač poraženi, si mezi sebou rozdělili 200 000 USD.

Poker byl až do minulého pondělí další hrou, ve které (nejlepší) lidští hráči odolávali náporům umělé inteligence. Nebylo to kvůli vysokému vlivu náhody v této hře (zatímco Šach a Go jsou hry bez náhody), ani kvůli nedokonalé informaci, ale především kvůli umění blafovat.

Jak řekl ředitel Katedry informatiky CMU  (Head of Computer Science department) Frank Pfenning: "Počítač nemůže v pokeru zvítězit, pokud neumí blafovat." Dodal také, že narozdíl od jednorázového Deep Blue (zápas UI vs. Kasparov v Šachu) nebo AlphaGo (UI vs. Li-Sedol v go), je Liberatus dále využitelný kdekoliv je třeba jednat na základě nedokonalé informace a dokonce dezinformace. Např. v obchodních jednáních, vojenských strategiích, medicíně atd. "Představte si, že váš smartphone vám v budoucnosti bude schopen usmlouvat lepší cenu za nové auto."

K instalaci podobné aplikace do mobilního telefonu je zatím daleko. Liberatus svou strategii počítal na Pittsburghském superpočítači o rychlosti 1,35 PFLOPS (peta-floating-operations-per-second), tedy asi 7 250krát rychlejší než špičkový laptop, a operační paměti 274 TB (asi 17 500krát více).

Vzhledem k náhodné povaze pokeru také nestačilo pouze zaznamenat skóre jako u Šachu nebo Go, ale byla nutná důmyslnější metodika, aby bylo možné usoudit, že vítězství Liberata není pouze dílem náhody. Hrálo se celkem 120 00 her, s každým ze čtyř hráčů po 30 000 hrách. Liberatus zvítězil se ziskem 1 766 250 USD, tedy průměrně 14,7 USD na jednu hru. Vezmeme-li jednu hru jako jeden náhodný jev, byla směrodatná odchylka výhry Liberata mezi 120 000 a 240 000 USD. Podmínkou pro úspěch Liberata (nebo lidského hráče) přitom bylo skončit alespoň jednu směrodatnou odchylku nad nulou. Tuto podmínku Liberatus splnil více než sedminásobně.

Server Pokerlistings.com spočítal pravděpodobnost, že lidští hráči byli ve skutečnosti lepší ještě o něco explicitněji. V případě dolní hranice směrodatné odchylky činí asi 0,0001 % a v případě horní hranice asi 0,54 %.

Zpráva o vítězství Liberata na webu CMU (EN)

Podrobný článek na Pokerlistings.com (EN)

Sdílet s přáteli:

Komentáře

Jj. Už se nemůžeme dočkat.
www.csfd.cz/film/389-valecne-hry/

6.2.2017 20:34:47

Bezchybná logika
Tvá logika je bezchybná, ale nemyslel jsi spíše něco z tohohle:
https://cs.wikipedia.org/wiki/R.U.R.
https://cs.wikipedia.org/wiki/Já,_robot_(kniha)
http://www.csfd.cz/film/194413-battlestar-galactica/ ?

7.2.2017 10:31:54

Ne nutně.

8.2.2017 11:40:32

Vybíráme z Bazaru

Bluff (Perudo, Liar's dice)
Bluff (Perudo, Liar's dice)
Akt. cena: 450 Kč
Končí za: 5 dnů

Nejnovější otázky

další >>

Velké herní akce

Kalendář všech akcí >>

Offcanvas