Wyobraź sobie rozmowę ze sztuczną inteligencją, która zachowuje się podobnie do człowieka – robi pauzę, myśli i dopiero wtedy odpowiada, zawsze zachowując poprawną logikę. Ostatnie badanie, które pojawiło się na arXiv pokazuje bardzo ciekawy eksperyment związany z trenowaniem dużych modeli językowych. Okazuje się, że dzięki wykorzystaniu konkretnego sposobu manipulacji, AI może naśladować ludzki proces myślenia. To może zmienić sposób w jaki w przyszłości będziemy wychodzić w interakcję z tą technologią.
Zdolność AI do naśladowania ludzkich procesów myślowych została w pewien sposób “ucieleśniona” w ostatnim badaniu i projekcie oznaczonym jako Quiet-STaR. Technika wykorzystywana przez naukowców i inżynierów nie polega na próbie nadania sztucznej inteligencji świadomości podobnej do ludzkiej, ale raczej na wyposażeniu AI w zdolność do generowania wewnętrznych „uzasadnień”. To rzecz identyczna jak nasz, ludzki zakulisowy proces myślowy, który dzieje się na sekundy przed udzieleniem odpowiedzi w rozmowie.
Opisywana przeze mnie metoda stanowi znaczącą zmianę w stosunku do tradycyjnego sposobu generowania odpowiedzi przez AI – ta jest często bezpośrednia i oparta na natychmiastowym przetwarzaniu danych w tle.
Jak Quiet-STaR usprawnia rozumowanie AI
Możecie teraz zapytać – ale, jak dokładnie Quiet-STaR poprawia obecny sposób “rozumowania” AI? Spójrzmy na to z perspektywy prostej analogii. Wyobraź sobie, że masz trudne zadanie matematyczne. Zamiast podawać pierwszą liczbę, która przychodzi ci do głowy, poświęcasz chwilę na zastanowienie się, być może przypominając sobie znaną formułę lub metodę. Quiet-STaR “zaszczepia” podobny mechanizm „pauzy i myślenia” w modelach sztucznej inteligencji, umożliwiając jej skuteczniejsze radzenie sobie ze złożonymi zadaniami wymagającymi rozumowania. W rezultacie, odpowiedzi AI są nie tylko szybkie, ale także przemyślane i bardziej dokładne.
Włączenie tego „procesu myślowego” do dużych modeli językowych było nie lada wyczynem. Naukowcy napotkali dwie przeszkody – znaczący wzrost kosztów oraz mocy obliczeniowej, ale też trudności w wytłumaczeniu modelom, jak działa koncept ludzkiego “wewnętrznego” sposobu myślenia. Oba wyzwania zostały jednak pokonane, a Quiet-STaR wydaje się działać poprawnie dla wszystkich zapytań. Modele AI raz za razem wykonywały podobną operację – dostarczając odpowiedzi o znacznie wyższej jakości niż w przypadku konwencjonalnego przetwarzania danych.
Wdrożenie tego pomysłu to konieczność
Badanie działania Quiet-STaR mogłoby otworzyć zupełnie nowe możliwości w edukacji i sposobie podejmowania decyzji. Uczniowie, zamiast biernie wchłaniać treści, mogliby korzystać z AI do budowania głębszego zrozumienia danego tematu. W rezultacie, nauka stałaby się bardziej efektywna i angażująca.
W sytuacjach wymagających skomplikowanych analiz i strategii, Quiet-STaR może służyć jako narzędzie do generowania przemyślanych i logicznych rekomendacji. AI, uzbrojona w zdolność do logicznego rozumowania i analizy danych, może stać się cennym doradcą dla osób na stanowiskach kierowniczych, pomagając im podejmować lepsze decyzje. Z resztą, to już się dzieje, ale w nieco mniejszej skali.
W przyszłości, dzięki „procesowi myślenia”, sztuczna inteligencja może stać się bardziej intuicyjna i łatwiejsza w obsłudze. Zamiast predefiniowanych odpowiedzi, interakcje z AI będą przypominać naturalne rozmowy z ludźmi. Obecnie takie konwersacje to jedynie sprytne symulacje nie mające nic wspólnego z rzeczywistym dialogiem. Takie działanie otwiera z kolei drzwi do szerokiego spektrum zastosowań, od obsługi klienta po tworzenie wirtualnych asystentów.
Warto pamiętać, że jeszcze długa droga przed nami zanim metody i projekty typu Quiet-STaR będą sprawnie działać w większym środowisku – takim, jak np. ChatGPT czy Google Gemini. To jednak ekscytujący krok naprzód i kolejne przesunięcie granicy w zakresie rozwoju dużych modeli językowych.
Sztuczną inteligencję da się więc nauczyć, jak “myśleć” w ludzki sposób – choć na razie na bardzo podstawowym poziomie. Sami widzicie jednak, jak szybko rozwija się ta technologia.
Kto wie, co stanie się w tej kwestii za dwa lub trzy lata.
źródło: arXiv / fot. obrazek wygenerowany przy użyciu modelu Leonardo XL