Computerskakmotorer er ret gammel teknologi. Det kom først i rampelyset, da DeepBlue-motoren fra IBM besejrede Garry Kasparov da han var på sit højeste tidspunkt i 1997. Dette nederlag chokerede verden. Maskinen havde slået mennesker i et spil om intellekt. Siden da er skakmotorerne løbende blevet opdateret og forbedret. I 2017 DeepMind annonceret en ny motor, Alpha Zero.
Den 5. december 2017 blev skakverdenen endnu en gang chokeret til sin kerne, da AlphaZero slå Tørfisk 8, tidens stærkeste skakmotor. I løbet af et tidsstyret 100-kamps spil vandt AlphaZero 28 kampe, uafgjort 72 og 0 tab.
Hvad er AlphaZero?
I begyndelsen var AlphaZero ikke udviklet som en skakmotor. Det var et program, der kunne lære brætspil som Shogi, Chess og Go ved at spille med det. Forskere hos DeepMind brugte Neural Network System til at udvikle motoren. Derfra trænede den sig adskillige gange i at lære skak.
Før brugte skakmotorer brute force-teknikker til at finde det bedste træk. Denne teknik fungerede ved at beregne millioner af movesets for at finde det bedst mulige resultat. I dette tilfælde blev motorer forsynet med så mange data som muligt for at lære dem skak. Det krævede en meget kraftfuld computer at beregne millioner af positioner og evaluere dem hurtigt. Programmet ville forsøge at forudsige det mulige udfald af hvert lovligt træk af hver brik for de næste par træk. Den brugte Alpha-Beta-beskæringsmetoden for at gøre denne proces så hurtig som muligt.
AlphaZero brugte dog Neural Network og Self-learning model. Det fungerede ved kun at lede efter de bedste positioner fra sin erfaring med træning. Den brugte Monte Carlo Tree Search-algoritmen til at finde brættets bedst mulige træk. AlphaZero havde ingen menneskelig undervisning eller viden til at lære skak.
Der var tidligere antydninger fra AlphaZero om, at en intuitionsmaskine kunne være kompetent i en ræsonnementopgave (dvs. skak). Men der var ingen indikator for, at ræsonnement var opstået ud af dyb læring. https://t.co/8oyNklP65R
— Carlos E. Perez (@IntuitMachine) April 19, 2023
Hvorfor var AlphaZero så kraftfuld?
AlphaZero brugte Tensor Processing Unit (TPU), som Google-programmer bruger. Den brugte 5,000 førstegenerations TPU'er og 64 andengenerations TPU'er til at træne sig selv. Forskere hos DeepMind vurderede, at motoren spillede på et højere ELO-ratingniveau efter kun 4 timers træning uden nogen åbningsbøger eller slutspilstabeller.
Mens AlphaZero søgte efter 80,000 positioner på et sekund, søgte Stockfish 8 efter omkring 70 mio. Denne enorme forskel i antal blev dækket ved kun at søge efter lovende stillinger. Dette gjorde AlphaZero mere performant.
Efter DeepMind offentliggjorde resultaterne af det første 100-kampe spil, var alle i vantro og ærefrygt. Tørrfisk blev fuldstændig tæsket med 28 tab og 0 sejre. I et 1,000-kamps spil vandt AlphaZero 155, tabte 6 og uafgjort 839 kampe. Garry Kasparov kommenteret at AlphaZero ved at lære af at lege med sig selv havde udviklet strategier, der "afspejler sandheden". Motoren brugte træk, som ingen havde set før, fordi den lærte skak helt af sig selv uden hjælp fra traditionelle skakåbninger eller slutspil.

Kunstige neurale netværk erobrede computerskak
Snart begyndte hver anden fremtrædende skakmotor at have et neuralt netværk og et selvlærende system på plads. AlphaZero var lukket kildekode og kørte på Google-hardware, så det var umuligt at skabe noget identisk. Men entusiastiske programmører formåede at skabe Leela, en Open Source Chess-motor, der brugte samme metode som AlphaZero.
Tørfisk NNUE (effektivt opdaterbart neuralt netværk) version blev oprettet og fusioneret med Stockfish i 2020. AlphaZero-projektet blev afbrudt senere. Programmet blev aldrig offentliggjort, men deres papir er tilgængeligt i Videnskab tidsskrift. På trods af dets korte udseende ændrede og omformede den computerskak og skakverdenen.
YouTube: AlphaZero: Kaster nyt lys over de store spil skak, shogi og Go
Fotokreditter: Funktionen billede er taget af Gorodenkoff. Skærmbilledet i artiklens brødtekst blev taget af forfatteren til TechAcute.
Kilder: James Somers (The New Yorker) / Tørrfisk / Videnskab