Umělá inteligence se učila hrát šachy jen 4 hodiny. Pak rozdrtila nejlepšího hráče světa

13.01.2018 20:41

 

Umělá inteligence AlphaZero před několika měsíci ukázala svou naprostou nadřazenost ve hře go: trvalo jí jen tři dny, aby se ji naučila, pak porazila nejlepšího hráče na světě. Nyní se jí povedl podobně husarský kousek, ale tentokrát v šachu a její úspěch je snad ještě působivější.

Přestože je AlphaZero program specializovaný na hru go, chtěli jeho autoři vyzkoušet, jak si povede v úplně jiném odvětví. Nechali ho tedy, aby se sám seznámil s šachy – hrou, která je stará nejméně 1500 let. Počítač měl na seznámení s hrou, jejími pravidly, strategií a taktikou pouhé čtyři hodiny. Během nich ho nikdo netrénoval, stroj se hru naučil zcela sám a zlepšoval se tím, že hrál sám proti sobě. Doposud nejlepší šachový počítač proti ní nedokázal vyhrát ani jedinkrát, zmohl se maximálně na remízy.

 

Tato umělá inteligence jménem AlphaZero je upravenou verzí programu AlphaGo Zero, který porazil dříve nejlepší program na hraní go AlphaGo 100:0. Lidé, a to ani ti nejlepší, už proti tomuto programu nemají vůbec šanci – když to naposledy zkusil světový velmistr v go, Korejec Lee-Sedol, drtivě prohrál.
Přestože je AlphaZero program specializovaný na hru Go, chtěli jeho autoři vyzkoušet, jak si povede v úplně jiném odvětví. Nechali ho tedy, aby se sám seznámil s šachy – hrou, která je stará nejméně 1500 let. Počítač měl na seznámení s hrou, jejími pravidly, strategií a taktikou pouhé čtyři hodiny. Během nich ho nikdo netrénoval, stroj se hru naučil zcela sám a zlepšoval se tím, že hrál sám proti sobě.

Pak ho jeho autoři nechali hrát proti zřejmě nejlepšímu současnému hráči šachu, což také není člověk, ale program jménem Stockfish8. AlphaZero proti němu sehrál 100 partií. Ani jednu neprohrál, všechny skončily buď jeho výhrou, nebo remízou. Lidé, kteří partii dvou strojů sledovali, byli zaskočení až šokovaní.


Mike Klein pro web Chess.com uvedl: „Šachy se dnes jednou provždy změnily. A možná s tím i zbytek světa. Ani ne rok poté, co Alpha Go senzačně vyhrál proti nejlepšímu lidskému hráči go, zničil v šachu nejlepšího konkurenta.“

Na úspěchu stroje je pozoruhodné zejména to, že ho dosáhl zcela bez lidské pomoci. Starší generace umělých inteligencí byly zásobované obrovským množstvím již odehraných partií nebo těch nejlepších a nejslavnějších her – z nich se učily nejúčinnější postupy. AlphaZero nic takového k dispozici neměl, vycházel jen z toho, že mu programátoři vložili do paměti pravidla šachů.

Začínal s nulovou znalostí, ale během těch čtyř hodin, které měl na trénink povolené, hrál proti sobě velké množství partií, z nichž se dokázal poučit. Přitom proti svému konkurentovi je mnohem pomalejší. Zatímco AlphaZero umí za sekundu spočítat jen 800 000 pozicí, Stockfish 8 zvládne spočítat 70 milionů tahů. Ani tak ale proti googlovské umělé inteligenci neměl šanci.

Když hrál AlphaZero bílými figurami, zvítězil v 25 případech a remizoval také ve 25 hrách, když hrál za černé, dařilo se mu už méně – vyhrál tři hry, remizoval 72krát. Podle šachových teoretiků to jen zdůrazňuje, jak velkou výhodou je hra za bílou stranu. Pro fanoušky šachu: nejoblíbenějšími zahájeními byly u něj Anglická hra (pěšec na c4), Dámský gambit a obecně jakékoliv otevření dámským pěšcem.
AlphaZero po tomto fenomenálním vítězství změřil síly ještě se svým starším sourozencem AlphGo, který byl modifikován pro hru šachu. Po dalších osmi hodinách tréninku ho porazil 60:0.

„Poté, co jsem si četl zprávu a pak jsem viděl samotné hry, vzpomněl jsem si, jak jsem si vždycky představoval, že na Zemi přistane nějaký naprosto nadřazený druh a ukáže nám, jak hrát šachy,“ uvedl pro server Chess.com šachový velmistr Peter Heine Nielsen. „Tak teď jsem to viděl.“

V šachové komunitě se nyní rozproudila živá debata, jestli jsou opravdu klasické šachové počítače, jako je třeba Stockfish8 nebo Elmo, zastaralé, nebo se dokáží z porážek poučit. Lidé, zdá se, jsou už z těchto odvětví založených na konkrétní sadě jednoduchých pravidel definitivně ze hry. Od doby, kdy počítač Deep Blue od IBM porazil Garryho Kasparova, uplynulo letos už dvacet let – a zatímco lidští hráči zůstávají stále stejně omezení svou biologickou kapacitou, stroje se zlepšují raketovou rychlostí.

Pro oblast umělých inteligencí je to také obrovský pokrok. AlphaGo (a jeho vylepšení AlphaZero) byly kritizovány jako příliš specializované, tudíž by to vlastně ani neměly být umělé inteligence. Nyní se ukazuje, že jde o mnohem variabilnější a univerzálnější programy, které by už brzy mohly promluvit také do praktických stránek života, třeba pátrání po rakovinových nádorech na rentgenových snímcích nebo do vědeckého výzkumu.

 

Odkdy počítače poráží člověka

1997: Program Deep Blue porazil velmistra Garryho Kasparova v šachu.
2011: Program IBM Watson porazil světové šampiony ve hře Jeopardy (česká verze se jmenovala Risk).
2016: Umělá inteligence AlphaGo porazila velmistra Lee-Sedola ve hře Go.
2016: Umělá inteligence Libratus z Carnegie Meloon University porazila čtyři přední hráče pokeru.
2017: Program DeepStack, na němž pracovali i čeští vědci, rozdrtil 33 hráčů v pokeru – a to i pomocí intuice.