Sztuczna inteligencja niemalże opanowała tajniki Minecrafta
Wczoraj (28.11) mieliśmy do czynienia z konferencją Neural Information Processing Systems (NeurIPS), podczas której wręczono nagrodę Outstanding Datasets and Benchmarks Paper Award. Powędrowała ona w stronę firmy NVIDIA, a konkretniej – badaczy odpowiedzialnych za pracę opisującą sztuczną inteligencję o nazwie MineDojo. Potrafi ona wykonywać przeróżne akcje w grze Minecraft przy wykorzystaniu pisemnych podpowiedzi.
Największe wrażenie robi jednak ilość zawartości przetworzona przez sztuczną inteligencję. Mowa tu o 730 000 filmach na YouTube (ponad 2,2 mld transkrybowanych słów), 7 000 stronach z wiki Minecrafta oraz 340 000 postach i 6,6 mln komentarzy z forum Reddit, gdzie użytkownicy opisywali rozgrywkę. Wszystkie te dane zostały wykorzystane do opracowania niestandardowego modelu transformatora nazwanego MineCLIP.
Możliwości AI od NVIDII / Źródło: MineDoJO
Zaprogramowano go tam, by kojarzył klipy wideo z konkretnymi akcjami i działaniami podejmowanymi w grze Minecraft. Jeśli więc jakaś osoba poleci sztucznej inteligencji MineDojo zbudować portal do Netheru, to będzie ona dokładnie wiedzieć jakie kroki należy wykonać, by uzyskać odpowiedni rezultat. Robi wrażenie, prawda?
Jak możemy wyczytać na stronie NVIDII:
Podczas gdy badacze od dawna szkolili autonomicznych agentów AI w środowiskach gier wideo, takich jak StarCraft, Dota i Go, agenci ci są zwykle specjalistami tylko w kilku zadaniach. Badacze NVIDII skierowali więc wzrok na Minecrafta, najpopularniejszej gry na świecie, aby opracować skalowalne ramy szkoleniowe dla agenta generalnego – takiego, który może z powodzeniem wykonywać wiele różnych zadań o otwartym charakterze.
Źródło: NVIDIA
W wielkim skrócie oznacza to, że sztuczna inteligencja stała się znacznie bardziej otwarta na różne scenariusze i bardziej efektywna. Trudno znaleźć lepsze środowisko do szkolenia tego typu zachowań niż Minecraft, gdzie trudno szukać liniowości i jednej ścieżki do wykonania określonego zadania.
Sama praca „MINEDOJO: Building Open-Ended Embodied Agents with Internet-Scale Knowledge” zadebiutowała już w czerwcu bieżącego roku, lecz dopiero teraz zyskała nieco większy rozkgłos. Co ciekawe, kod źródłowy MineDojo oraz MineCLIP jest dostępny zupełnie bezpłatnie na portalu GitHub i każdy może uzyskać do niego dostęp.
Źródło: NVIDIA, MineDojo