De AI van DeepMind kan nu menselijke spelers verslaan in Quake III

We hebben games gezien waarin ontwikkelaars bots plaatsen om het menselijke spelers gemakkelijk te maken of om singleplayer-recreaties te maken van de multiplayer-modi van veel games. Deze AI-spelers zijn zelden capabel genoeg om te strijden tegen hun menselijke tegenhangers. Ze worden dus gebruikt om de leercurve van veel multiplayer-spellen te vergemakkelijken. Aan de andere kant is DeepMind een bedrijf dat gespecialiseerd is in het gebruik van AI in veel vakgebieden. Ze onthulden dat hun AI-gestuurde bots eindelijk hun menselijke tegenhangers konden verslaan in een van de meest gespeelde multiplayer-games Quake III. Hun bevindingen zijn fascinerend voor degenen die iets hebben met AI-leren en -mogelijkheden.

Dit is niet de eerste onderneming van DeepMind in videogames, ze hebben al een neurale engine ontwikkeld die professionele spelers van veel multiplayer-games kan verslaan. Het beste voorbeeld hier is AlphaGo, waar hun AI de bekende pro-speler van het genoemde spel versloeg. Ze hebben ook AI ontwikkeld voor veel andere spellen.

Inhoudingen

Terugkomend op hun conclusies met betrekking tot hun AI in Quake III. Quake III is drastisch anders dan veel andere spellen die er zijn. De game is categorisch anders vanwege de procedureel gegenereerde fasen en het feit dat de game in first person-perspectief is. Het probleem voor AI-ontwikkeling hier is dat ze niet de best mogelijke methode konden leren om het spel te verslaan. Het probleem in feite bleek een verhulde zegen, aangezien AI leek op een humanoïde leercurve, waarover later meer.

De AI begon helemaal opnieuw en leerde de regels van de capture the flag-modus zelf. De AI was toen in staat om 40 menselijke spelers te verslaan waarbij zowel mensen als de AI werden gematcht. Na mensen aanzienlijk te hebben verslagen, accepteerde DeepMind dat hun overwinning wordt toegeschreven aan de pro-menselijke reactietijden van hun AI-agent. Dus besloten ze om ze te vertragen, maar de AI was nog steeds in staat om hun menselijke tegenhangers te verslaan.

Voortgang van AI

Tomshardware meldt dat hun conclusies vooral fascinerend zijn omdat de AI de basisprincipes van het spel zelf moest leren en het feit dat de AI in staat was om de resultaten te krijgen wanneer fasen procedureel werden gegenereerd.

DeepMind zei dat hun werk aan dit project het feit benadrukt dat we AI efficiënt kunnen trainen door multi-agent-technieken te gebruiken, wat AI tegen AI betekent. Het maakt de AI niet alleen bewust van zijn fouten, maar werkt ook aan dingen die beter kunnen. Ze zeiden, "Het benadrukt de resultaten door gebruik te maken van het natuurlijke curriculum dat wordt geboden door training met meerdere agenten en door de ontwikkeling van robuuste agenten te forceren die zelfs met mensen kunnen samenwerken.”

Facebook Twitter Google Plus Pinterest