AI On Itsenäisesti Oppinut Pelaamaan Shakkia Yli-inhimillisellä Tasolla Päivässä - Vaihtoehtoinen Näkymä

AI On Itsenäisesti Oppinut Pelaamaan Shakkia Yli-inhimillisellä Tasolla Päivässä - Vaihtoehtoinen Näkymä
AI On Itsenäisesti Oppinut Pelaamaan Shakkia Yli-inhimillisellä Tasolla Päivässä - Vaihtoehtoinen Näkymä

Video: AI On Itsenäisesti Oppinut Pelaamaan Shakkia Yli-inhimillisellä Tasolla Päivässä - Vaihtoehtoinen Näkymä

Video: AI On Itsenäisesti Oppinut Pelaamaan Shakkia Yli-inhimillisellä Tasolla Päivässä - Vaihtoehtoinen Näkymä
Video: MITEN PELATA SHAKKIA!? 2024, Huhtikuu
Anonim

AlphaZero-algoritmi hallitsi shakin ja shogipelin 24 tunnissa ilman ihmisen opettajaa siten, että se voitti muut mestariohjelmat, jotka olivat aiemmin ehdottomasti tappaneet ihmisiä.

Keinotekoisen älykkyyden (AI) algoritmeja kehittävä yritys Deep Mind on julkaissut tiedot shakin ja shogin pelaamiseen tarkoitetun AlphaGo-algoritmin uudelleenkoulutuksen tuloksista. Aikaisemmin AlphaGo pystyi voittamaan maailmanmestarit mennä -pelissä. Tekoäly onnistui hallitsemaan uudet pelit vielä nopeammin. Vastaava työ julkaistaan Cornellin yliopiston preprint-palvelimella.

AlphaZero käytti vahvistusoppimismenetelmää. Se on syvän koneoppimisen alatyyppi, jossa ei käytetä ihmisen opettajaa, vaan pelkästään pelejä kahden AI: n välillä. Vaikka alussa molemmat AI-pelaajat pelaavat erittäin heikosti, suuren nopeudensa vuoksi (verrattuna ihmisen opettajaan) he voivat pelata valtavan määrän pelejä lyhyessä ajassa ja valita hyvin todistettuja liikkeitä ja niiden sekvenssejä tietyissä pöydän paikoissa, mikä antaa algoritmien kyky nostaa tasoaan erittäin nopeasti.

Tässä tapauksessa AlphaZero saavutti pelitaso, joka on korkeampi kuin mikään ihmisen pelaaja vain 24 tunnissa. Sitten hän sai leikkiä Stockfishin, parhaan saatavilla olevan shakkurin, ja Elmon, parhaan shogipelaajan (erittäin muunnettu shakki, varhaisessa keskiaikaisessa Japanissa) kanssa.

Hyvin lyhyestä harjoitusjaksosta huolimatta AlphaZero voitti Stockfishia 28 kertaa ja veti vielä 72 kertaa. Hän onnistui voittamaan Elmoa vastaan 90 kertaa, häviämään 8 kertaa ja piirtämään 2 kertaa. Nämä ovat erittäin korkeita tuloksia. Sekä shakki että shogi eroavat hyvin toisistaan sekä AlfaGo-alun perin luomiseen käytettäväksi. Esimerkiksi "japanilainen shakki" merkitsee erittäin eksoottisia mahdollisuuksia, kuten minkä tahansa vihollisen "syömien" kappaleiden pelaamista. Go-palvelulle luodun algoritmin voitto vain pelaamalla täysin identtisellä omalla algoritmilla tarkoittaa, että ihmisen opettaja voi saavuttaa

IVAN ORTEGA