Apple trenowało sztuczną inteligencję na filmikach z YouTube

Wygląda na to, że Apple wykorzystywało filmy z YouTube do trenowania swojej sztucznej inteligencji. Mamy do czynienia z niezwykle istotną wiadomością, ponieważ właściciel popularnej platformy uznaje takie poczynania za niezgodne z regulaminem. Tym samym doszło do naruszenia przepisów przez największe korporacje, co oczywiście nie przeszło obojętnie uwadze mediów, jak i przeciętnych konsumentów. Czy więc istnieje szansa, iż koncern za cokolwiek odpowie?

Apple przegięło używając filmiki z YouTube do szkolenia sztucznej inteligencji?

Nadal nie doszło do uregulowania kwestii prawnych związanych ze sztuczną inteligencją. Nad tym aspektem nieustannie pracują m.in. przedstawiciele organów Unii Europejskiej – już wkrótce powinniśmy być świadkami implementacji stosownych zmian. Dostosują się do nich nie tylko technologiczni giganci, ale także twórcy czy operatorzy dużych modeli językowych. Ograniczone zostanie nadużywanie danych, co obecnie jest dosyć powszechnym zjawiskiem.

Sprawdź także: Przeglądarki Chromium po cichu wysyłają Twoje dane do Google. Co na to Komisja Europejska?

Dowiedzieliśmy się właśnie, że ponad 170 tys. filmów z portalu YouTube należy do ogromnego zbioru danych wykorzystywanych przez największe globalne firmy. Materiały szkoleniowe miały ulepszyć sztuczną inteligencję, lecz najprawdopodobniej korporacje robiły to wbrew obowiązującym przepisom. Na liście znajdują się takie podmioty jak chociażby Apple, Anthropic, NVIDIA oraz Salesforce. Użyto klipy wrzucone przez około 48 tys. kanałów, także tych najpopularniejszych.

Najnowszy raport autorstwa Proof News oraz Wired informuje o obecności treści pierwotnie wstawionych na profilach MrBeasta czy Marquesa Brownlee. Nie zabrakło także zawartości będącej własnością ABC News, BBC, a także The New York Times. Mamy więc do czynienia z prawdziwym rozstrzałem, co prezentuje się niezwykle podejrzanie – trudno bowiem stwierdzić co w przyszłości firmy zrobią z pozyskanymi informacjami. Najbardziej pokaźnym rodzajem danych jest transkrypcja klipów, lecz szczegóły niestety nie są znane.

Co ciekawe, opublikowano nawet specjalne narzędzie, które można wykorzystać do podejrzenia wyjawionego zestawu danych. Dzięki temu bardzo szybko sprawdzimy czy nasza (lub naszych ulubionych influencerów) twórczość znalazła się w bazie wykorzystanej przez technologicznych gigantów. Warto jednak wspomnieć, że filmiki z YouTube to nie wszystko. Mamy także do czynienia z wieloma artykułami z Wikipedii oraz wieloma innymi źródłami. Sami więc przyznacie, iż korporacje nieco sobie poszalały.

Firmy nie chcą przestrzegać prawa

Rzadko kiedy są one transparentne jeśli chodzi o dane pozyskiwane do szkolenia modeli sztucznej inteligencji. Aspekt ten jest niezwykle kontrowersyjny i przedstawiciele firm niechętnie dzielą się detalami. Raczej pojawiają się odpowiedzi wyłącznie zapewniające, że pobierane informacje były publicznie dostępne lub użyte zgodnie z licencją. Eksperci mają co do tego ogromne wątpliwości, zwłaszcza iż podobne praktyki są niezgodne z regulaminem platformy YouTube.

Przeczytaj również: O to pierwszy bezemisyjny pociąg pasażerski napędzany wodorem

Trzeba więc czekać na rozwój wydarzeń. Pozostaje mieć nadzieję, że już wkrótce wprowadzone zostanie prawo wymuszające na koncernach większą transparentność.

Źródło: The Verge / Zdjęcie otwierające: Apple, unsplash.com (@vmxhu)