Sztuczna inteligencja uczy się grać w Mario. Zobacz jej postępy na TikToku

TikTok to miejsce publikowania nagrań wideo z przeróżnych, często głupich wyzwań, ale nie tylko. W platformie tej można też znaleźć filmiki edukacyjne, a także z zabawnymi zwierzętami czy memami. Można tam też oglądać transmisje na żywo, a bohaterką jednej z nich jest sztuczna inteligencja, która uczy się grać w Mario.

AI gra w Mario na TikToku

Właściwie od kilku tygodni różne konta na TikToku prowadzą transmisje na żywo, w ramach których różne boty AI uczą się grania w Super Mario World. Jednym z tych, które radzą sobie ze słynną grą Nintendo lepiej, jest bot o nazwie Rupert. Rupert już wkrótce pokona bowiem składający się z siedmiu poziomów pierwszy świat gry.

W jaki sposób Rupert uczy się grania w Mario? Dokładnie tak, jak w Mario gramy my, ludzie – grając do porażki i próbując w kółko, i w kółko, aż dojdzie jeszcze dalej niż dotąd. Rupert potrafi wielokrotnie powtarzać te same błędy, ale z czasem ewoluuje i staje się coraz lepszym graczem.

Sztuczna inteligencja inspirowana ewolucją

Rupert posiada jeden cel – dostać się na drugi koniec poziomu. Wie, jakie przyciski może naciskać i widzi, co dzieje się na ekranie. Co ciekawe, to co on widzi my możemy zobaczyć w lewym górnym rogu transmisji. W przeciwieństwie do człowieka sztuczna inteligencja nie mogła jednak tak po prostu założyć, czego na ekranie unikać, a czego nie. Dopiero z czasem uczy się, co prowadzi do sukcesu, a co do porażki.

@_thepcmasterrace
#rupert
♬ original sound – Join The PCMasterRace

Warto jeszcze wspomnieć, że Rupert w pewnym sensie naśladuje mechanizmy doboru naturalnego i wykorzystuje „gatunki” oraz „pokolenia”. Podczas każdego „pokolenia” sztuczna inteligencja wypróbowuje określoną strategie dla każdego „gatunku”, poświęcając temu od dwóch do sześciu serii. Co 50 – 100 gatunków sztuczna inteligencja segreguje to czego się nauczyła i tworzy nowe „pokolenie”.

Gdy sztuczna inteligencja gra w Super Mario World, oceniana jest jej „kondycja”. Wartość „kondycji” jest tym większa, im dalej Rupert jest w stanie dotrzeć na konkretnym poziomie i im szybciej jest w stanie to zrobić. Co więcej, „pokolenia” o najwyższej kondycji są wybierane, by je ze sobą łączyć. Powstają w ten sposób nowe „pokolenia”, o jeszcze wyższym stopniu wyrafinowania i radzące sobie z grą jeszcze lepiej.

Opisana metoda działa powoli, ale działa. Dzięki niej sztuczna inteligencja faktycznie uczy się grać w Mario. Pokonanie pierwszego poziomu Super Mario World zajęło Rupertowi zaledwie 57 pokoleń. To rzecz jasna wywołało radość na czacie wśród użytkowników TikToka.

Rozwiązane opracowane wcześniej, niż mogłoby się wydawać

Warto wspomnieć, że Rupert bazuje na programie MarI/O stworzonym przez programistę i streamera o pseudonimie SethBling. MarI/O powstał lata temu, ale teraz, w dobie popularności zaawansowanej sztucznej inteligencji takiej jak ChatGPT cieszy się szczególnie dużym zainteresowaniem.

Rupert i MarI/O to rzecz jasna algorytmy znacznie mniej skomplikowane niż czatboty takie jak ChatGPT. Mimo to są równie ciekawe.

Źródło: Gizmodo, fot. tyt. Canva

AI gry mario si sztuczna inteligencja