Keunstmjittige yntelliginsje hellet maksimale skoare yn Ms. Pac-Man

juny 17, 2017 19:17 Fernijd

Foto: Wikipedia/BeŻet, ilovemypit

Wittenskippers fan Microsoft hawwe in kompjûter leard om de maksimale skoare fan 999.990 te heljen yn de Atari-klassiker Ms. Pac-Man. Dat spul is ûnfoarsisberder as Pac-Man en wurdt dêrom troch in protte tiims brûkt om ûndersyk te dwaan nei keunstmjittige yntelliginsje.

De ûndersikers makken gebrûk fan in fernijende strategy, dy’t de Hybrid Reward Architecture neamd wurdt. Hja setten nammentlik mear as 150 KY-aginten yn. Eltse agint moat in lyts probleem oplose. Sa binne der aginten dy’t inkeld ferantwurdlik binne foar it opiten fan de baltsjes, wylst oare aginten har bekommerje om de spoeken. Boppe dy 150 aginten pleatsten de ûndersikers in KY-baas. Dy lit him liede troch de advizen fan de 150 aginten en kiest dan in strategy. It is in snoade taktyk. Yn stee fan ien agint dy’t ien kompleks probleem oplosse moat, lost in grutte groep aginten in protte lytse problemen op.

De taktyk blykt te wurkjen. Nea earder helle in kompjûter of in minske de maksimale skoare. It koste lykwols wol de nedige muoite. Pas nei rûchwei trijetûzen kear besykjen slagge KY deryn om 999.990 op ’e teller te krijen. “De learkurve ferrint stadich, om’t it model traind wurde moat”, skriuwe de ûndersikers yn harren rapport. “Ek al binne de lettere nivo’s pittiger, it model kin dochs goed út ’e fuotten. It foardiel is dat it systeem dan de kaarten goed ken.”

Undersikers tinke dat de oanpak goed wurket foar takomstige KY-systemen. Wannear’t in persoan in fraach stelt oan in tsjetbot, dan kin dy tsjetbot him fuorje litte troch foarbylden fan goede en minne antwurden. Dêrnei kiest de tsjetbot in antwurd. Stel dat in persoan positive feedback jout – bygelyks dat it petear as noflik ûnderfûn waard – dan leart de tsjetbot dêrfan en kin er selsstannich syn antwurden ferbetterje. Dêrtroch hawwe minsken de hannen frij om oare wurksumheden op te pakken.

In hegere skoare as 999.990 helje is ûnmooglik, stiet yn it ûndersyksrapport. Net omdat it spultsje dermei ophâldt, mar om’t de skoare automatysk op nul set wurdt nei ien miljoen punten.”

Boarne: scientias.nl

juny 17, 2017 19:17 Fernijd
Skriuw in reaksje

Gjin opmerkingen

Noch gjin opmerkings

Der binne noch gjin opmerkingen, mar jo kinne de earste wêze

Skriuw in reaksje
Sjoch opmerkingen

Skriuw in reaksje

Jo mailadres wurdt net sichtber foar oare besikers fan dit webstee.
As der in stjerke by in hokje stiet, moatte jo dêr wat ynfiere.*