Cóż, systemy sztucznej inteligencji uczą się coraz bardziej imponujących sztuczek. Doskonale pokazuje to najnowsza sztuczna inteligencja stworzona przez badaczy z Uniwersytetu Duke’a, która potrafi wygenerować realistyczną ludzką twarz na podstawie na podstawie rozpikselowanego zdjęcia. Trzeba przyznać, że jest to nieco przerażające.
Całe szczęście, że sztuczna inteligencja z Uniwersytetu Duke’a tak po prostu nie cofa rozmazania zdjęcia, ujawniając rzeczywiste twarze sfotografowanych osób, a generuje twarze sztuczne, nienależące do prawdziwych ludzi. Te w ograniczonym stopniu przypominają oblicza z oryginalnych zdjęć.
PULSE (Photo Upsampling via Latent Space Exploration), bo tak brzmi nazwa sztucznej inteligencji, jest w stanie generować zdjęcia o rozdzielczości 64 razy większej niż źródłowe zdjęcia rozpikselowane. Zatem, obrazy przez nią tworzone są 8 razy bardziej szczegółowe niż te generowane przy użyciu innych metod. To naprawdę widać.
Porównanie twarzy wygenerowanych z pomocą sztucznej inteligencji PULSE do twarzy wygenerowanych przy użyciu innych systemów. | Źródło: Uniwersytet Duke’a
Generatywna Sieć Przeciwstawna w akcji
W jaki sposób PULSE działa? System nie próbuje odtworzyć oryginalnej twarzy, dodając do rozpikselowanego zdjęcia kolejne szczegóły, a zamiast tego stara się generować obrazy, które po ponownym rozpikselowaniu wyglądałyby jak pierwotne rozmazane zdjęcie. Sztuczna inteligencja w kilka sekund zamienia obraz o wymiarach 16 x 16 pikseli na taki o wymiarach 1024 x 1024 pikseli.
Sztuczna inteligencja PULSE generująca twarz na podstawie rozpikselowanego obrazu. | Źródło: Uniwersytet Duke’a
PULSE zawdzięcza swoje umiejętności temu, że jego autorzy sięgnęli po technologię Generatywnej Sieci Przeciwstawnej (GAN). Jest to metoda nauki sztucznej inteligencji polegająca na wykorzystaniu dwóch różnych sieci neuronowych. Pierwsza z nich, określany generatorem, zwykle ma za zadanie na podstawie dostarczanych informacji tworzyć obrazy (w tym wypadku przedstawiające twarze) wyglądające niczym prawdziwe zdjęcia, a druga, dyskryminator, który otrzymuje zarówno obrazy wygenerowane, jak i dostarczone z zasobów innej sieci neuronowej, musi je od siebie odróżniać. Proces nauczania kończy się, gdy generator zaczyna tworzyć obrazy tak podobne do rzeczywistych zdjęć, że dyskryminator przestaje być w stanie wychwytywać różnice.
Zauważalne postępy
Sztuczna inteligencja z Uniwersytetu Duke’a jest systemem jeszcze bardziej zaawansowanym niż ten, który został stworzony przez Nvidię, a którego w ubiegłym roku wykorzystano do stworzenia strony internetowej ThisPersonDoesNotExist.com. Producent kart graficznych z pomocą GAN opracował SI, która generowała twarze nieistniejących ludzi, mieszając cechy twarzy należących do rzeczywistych osób, podczas gdy dla PULSE generuje twarze jedynie w oparciu o rozpikselowane zdjęcia.
Porównanie obrazów wygenerowanych przez PULSE (dolny rząd) do oryginalnych zdjęć (górny rząd) oraz ich rozpikselowanych wersji (środkowy rząd). | Źródło: Uniwersytet Duke’a
Do czego sztuczna inteligencja typu PULSE mogłaby się przydać? Jak twierdzą jej autorzy, na wzór PULSE można by stworzyć systemy, które byłyby też w stanie generować realistyczne obrazy zupełnie innych rzeczy – zwierząt, zachodów słońca, drzew, balonów – czegokolwiek. Zdaniem badaczy tego typu algorytmy mogłyby znaleźć zastosowanie w wielu dziedzinach – w medycynie, mikroskopii czy astronomii.
Źródło: Uniwersytet Duke’a, fot. tyt. Uniwersytet Duke’a