Doom został uruchomiony na wszystkim – kalkulatorze, kosiarce, w standardowych aplikacjach Windows i nie tylko. Ale za pomocą kilku generatywnych sieci neuronowych? To pierwszy taki przypadek w przypadku legendarnej strzelanki z id Software.
Grupa czterech byłych i obecnych pracowników Google Research i Google DeepMind zaprezentowała GameNGen, silnik gry oparty na modelu neuronowym, zdolny do tworzenia skomplikowanych interaktywnych scen w wysokiej jakości.
GameNGen może interaktywnie symulować rozgrywkę Doom przy 20 fps. Podczas przewidywania następnej klatki szczytowy stosunek sygnału do szumu osiąga 29,4 (porównywalnie ze stratną kompresją JPEG).
GameNGen szkolono w dwóch etapach: w pierwszym agent AI grał w Dooma (sesje były nagrywane), a w drugim trenowano model dyfuzyjny, aby stworzyć kolejną klatkę, uwarunkowaną sekwencją poprzednich i wprowadzanymi poleceniami .
Inaczej mówiąc, GameNGen nie generuje gry na bieżąco, a jedynie odtwarza to, co już widziało. Zamiast renderować, model neuronowy tworzy sekwencję klatek, która zmienia się w zależności od działań gracza.
Jak na razie GameNGen boryka się z szeregiem ograniczeń, takich jak bardzo krótka pamięć (nieco ponad trzy sekundy) oraz różnice w zachowaniu agenta (podczas treningu) i prawdziwego gracza.
Choć GameNGen jest obecnie daleki od ideału, jego twórcy mają nadzieję, że w przyszłości te rozwiązania sprawią, że proces produkcji gier wideo będzie tańszy i bardziej dostępny.