Stability AI, start up odpowiadający za sztuczną inteligencje Stable Diffusion, która generuje obrazy w oparciu o tekstowe komendy, stworzył nowy model sztucznej inteligencji. Model ten nosi nazwę Stable Video Diffusion, i jak wskazuje nazwa, jest w stanie tworzyć krótkie animacje.
Stable Video Diffusion – sztuczna ingeligencja generująca animacje
Póki co Stability AI udostępniło swój nowy model tylko do użytku badawczego. Jego kod trafił do serwisu GitHub, a dodatkowe pliki niezbędne do uruchomienia modelu lokalnie znajdują się w serwisie Hugging Face. Szczegółami na temat modelu jego twórcy podzielili się w swojej pracy naukowej.
Użytkownicy mogą zapisać się już też na listę oczekujących na dostęp do internetowej wersji narzędzia Stable Video Diffusion. Narzędzie to ma demonstrować potencjalne zastosowania modelu w marketingu, edukacji, rozrywce i nie tylko. Ale jaki możliwości Stable Video Diffusion tak właściwie oferuje?
Model o wielu ograniczeniach
Podobno Stable Video Diffusion jest w stanie generować animacje składające się na 14 do 25 klatek, w rozdzielczości 576 x 1024 pikseli. Klatki te mogą być odtwarzane z wybraną przez użytkownika częstotliwością – od 3 do 30 klatek na sekundę. Daje nam to materiały wideo o długości od 2 do 5 sekund. Podobno generowanie takich animacji ma trwać maksymalnie po 2 minuty.
Próbki zaprezentowane na powyższym wideo prezentują się nieźle. Model ma jednak na razie wiele ograniczeń. Oprócz tego, że generowane przez niego filmy są krótkie, to brakuje im fotorealizmu. Poza tym Stable Video Diffusion nie może symulować ruchu kamery innego niż powolne przesuwanie, nie ma kontroli nad tekstem, nie generuje czytelnego tekstu i nie generuje prawidłowo ludzi i twarzy.
Stability AI wytrenowało swój nowy model ma zbiorze danych obejmującym miliony filmów. Następnie udoskonalono go na mniejszym zestawie danych. Co ważne, podczas procesu treningowego firma wykorzystała publicznie dostępne materiały wideo do celów badawczych.
Niebezpieczny krok w przód?
W sztucznej inteligencji generującej filmy leży ogromny potencjał. Taka sztuczna inteligencja jest logicznym krokiem w przód po modelach generujących obrazy. Niemniej, narzędzia takie jak Stable Video Diffusion posiadają ogromny potencjał nadużyć. Istnieje bowiem ryzyko, że będą wykorzystywane przy tworzeniu deepfake’ów i naruszaniu praw autorskich. Oczywiście twórcy modeli AI zabezpieczają je tak, aby jak najbardziej utrudnić wykorzystywanie ich do nielegalnych i złośliwych celów, ale niejednokrotnie demonstrowano, że takie zabezpieczenia łatwo obejść.
Na razie nie wiadomo, kiedy Stable Video Diffusion stanie się ogólnodostępnym internetowym narzędziem. Gdy to nastąpi, będziemy mogli na własnej skórze przekonać się o jego możliwościach.
Źródło: Stability AI, fot. tyt. Stability AI