ChatGPT doczekał się aktualizacji mogącej zmienić sposób korzystania z tego popularnego narzędzia. Użytkownicy podpowiedzą sztucznej inteligencji nie tylko poprzez wpisywanie tekstu, ale również poprzez wydawanie komend głosowych czy przesyłanie zdjęć. Funkcje już niedługo trafią do osób płacących za usługę, wszyscy inni otrzymają do nich dostęp w późniejszym terminie. Na co dokładnie należy się przygotować?
ChatGPT stał się jeszcze bardziej zaawansowany
Nie da się zaprzeczyć temu, że sztuczna inteligencja chyba na dobre rozgościła się na internetowym podwórku. Powszechny dostęp do zaawansowanych asystentów/chatbotów to fakt i trudno przejść obojętnie obok rozwoju tego typu usług. Zaledwie kilka dni temu informowaliśmy Was chociażby o nadchodzącym wielkimi krokami debiucie Microsoft Copilot, zwiastunie „nowej ery AI”. To jednak jeszcze przed nami – na razie skupmy się na teraźniejszości.
Jest nią bez wątpienia zestaw nowości, które wkrótce ubogacą popularny ChatGPT. Klienci otrzymają możliwość podpowiadania botowi poprzez wysyłanie zdjęć czy nagrań głosowych. Dzięki temu odpowiedzi mają być jeszcze dokładniejsze oraz skuteczniejsze. No dobra, ale jak to wszystko ma w ogóle działać? Jeśli chodzi o aspekt głosowy, to raczej wielkich zaskoczeń nie ma. Wypowiadane kwestie zostaną przekonwertowane na tekst i przekazane do modelu językowego, który wygenerowane wskazówki przerobi na mowę i wypowie je na głos. Chodzi więc o coś na wzór znanych usług pokroju Asystenta Google.
Oczywiście całość ma wyprzedzać konkurencję o kilka kroków. Stanie się to za prawą zupełnie nowego modelu zamiany tekstu na mowę. Docelowo wygeneruje on dźwięk podobny do ludzkiego na podstawie samego tekstu oraz kilkusekundowego nagrania prezentującego przykładową mowę. Użytkownicy otrzymają do wyboru pięć głosów, przynajmniej na razie. Ogromne wrażenie robi jednak umiejętność szybkiej nauki przez ten rodzaj AI.
Firma stojąca za narzędziem rzecz jasna zdaje sobie sprawę z zagrożeń mogących wystąpić przy rozwoju takich technologii. Mowa rzecz jasna o możliwości podszycia się przez złośliwych aktorów i używanie naturalnie brzmiącego głosu do tworzenia obrzydliwych manipulacji. Dlatego też już teraz opracowywane są pewne ograniczenia mające na celu zminimalizowanie szansy na wystąpienie nadużyć.
Bot to kompleksowe rozwiązanie dla wielu osób
Jeśli zaś chodzi o podpowiedzi w formie zdjęć, to zasada działania także jest dosyć prosta. Wystarczy wykonać zdjęcie interesującego nas przedmiotu, natomiast ChatGPT zrobi wszystko, by pozyskać wszelkie informacje na jego temat. Nie zabraknie również możliwości dopisania tekstu w celu doprecyzowania pytania. Jeśli wygenerowany przez AI tekst okaże się niewystarczający, to nic nie stoi na przeszkodzie, by przesłać kolejny obraz itd.
Zapewne sporo osób zaczęło w tym momencie wyobrażać sobie scenariusz rodem z filmów sci-fi. Na szczęście nas to na razie nie czeka. OpenAI celowo ograniczyło zdolność ChatGPT do analizowania i wydawania oświadczeń na temat grafik przedstawiających ludzi. Nie dowiecie się więc za wiele na temat kogoś, komu zrobiliście na ulicy, ale wstydziliście się zagadać. To dobra wiadomość.
Debiut wyżej opisanych nowości nastąpi na przestrzeni dwóch najbliższych tygodni – na razie jednak tylko dla osób korzystających z płatnej wersji narzędzia. Konkretna data premiery dla pozostałych klientów nie jest niestety znana. Pozostaje więc uzbroić się w odpowiednią dawkę cierpliwości.
Nie można też stracić z oczu samego narzędzia, bowiem kolejne miesiące/lata mają być dla jego rozwoju kluczowe. Sztuczna inteligencja nie powiedziała jeszcze ostatniego słowa.
Źródło: Twitter (X) (@OpenAI), The Verge / Zdjęcie otwierające: unsplash.com (@ilgmyzin)