Meta i Microsoft udostępniły model językowy AI Llama 2 do użytku komercyjnego

Anna BorzęckaSkomentuj
Meta i Microsoft udostępniły model językowy AI Llama 2 do użytku komercyjnego
Od jakiegoś czasu w sieci krążyły plotki o tym, że Meta tworzy model językowy sztucznej inteligencji z myślą o zastosowaniach komercyjnych. Plotki te właśnie się potwierdziły. Mark Zuckerberg i Satya Nadella ujawnili dziś powstanie Llama 2, czyli otwartoźródłowego i bezpłatnego modelu językowego AI. Jest on jednak przeznaczony nie tylko do użytku w celach komercyjnych, ale też badawczych.

Llama 2 – model językowy AI stawiający na odpowiedzialność

Co istotne, Llama 2 jest modelem językowym kładącym nacisk na odpowiedzialne użytkowanie. Deweloperzy przetestowali go dokładnie pod kątem bezpieczeństwa, a ponadto stworzyli jego schemat transparentności, aby wyszczególnić potencjalne problemy, jakie mogą z nim wystąpić. W parze z modelem udostępniono na dodatek przewodnik odpowiedzialnego użytkowania i zasady akceptowalnych przypadków użytku.

Meta i Microsoft udostępnili różne warianty modelu Llama 2, wstępnie wytrenowane i dopracowane. Są to warianty 7B, 13B i 70B. Dostęp do Llama 2 można uzyskać za pośrednictwem usług takich jak Microsoft Azure, Amazon Web Services i Hugging Face. Model można też pobrać bezpośrednio na komputer z systemem Windows ze strony internetowej Meta. Oto, co na temat Llama 2 miał do powiedzenia Mark Zuckerberg:

„Współpracujemy z firmą Microsoft, aby wprowadzić Llama 2 – następną generację naszego modelu języka open source. Llama 2 będzie dostępna bezpłatnie do celów badawczych i komercyjnych.

Meta ma długą historię open sourcingu naszej infrastruktury i sztucznej inteligencji — od PyTorch, wiodącej platformy uczenia maszynowego, przez modele takie jak Segment Anything, ImageBind i Dino, po podstawową infrastrukturę w ramach projektu Open Compute. Takie działanie pomogło nam tworzyć lepsze produkty i napędzać rozwój całej branży.

Otwarte oprogramowanie napędza innowacje, ponieważ udostępnia nowe technologie znacznie większej liczbie programistów. Poprawia również bezpieczeństwo – gdy oprogramowanie jest ogólnodostępne, więcej osób może je przeanalizować, aby zidentyfikować i naprawić potencjalne problemy. Uważam, że gdyby ekosystem był bardziej otwarty, pozwoliłoby to na szybszy postęp. Z tego względu udostępniamy Llama 2 na zasadzie open source.

Dzisiaj oddajemy do użytku wstępnie wytrenowane i dopracowane modele z parametrami 7B, 13B i 70B. Llama 2 została przeszkolona na 40% więcej danych niż Llama 1 i ma dodatkowe ulepszenia w swojej budowie. W przypadku precyzyjnie dopracowanych modeli zebraliśmy ponad 1 milion adnotacji i zastosowaliśmy nadzorowane dostrajanie i uczenie wzmacniające z wykorzystaniem informacji zwrotnych od ludzi (RLHF), uzyskując świetne wyniki w zakresie bezpieczeństwa i jakości. Modele można pobrać bezpośrednio lub – w ramach naszego partnerstwa z firmą Microsoft – uzyskać do nich dostęp za pośrednictwem platformy Azure. Istnieje również zoptymalizowana wersja, którą można uruchomić lokalnie w systemie Windows.

Nie mogę się doczekać, aby zobaczyć, co wszyscy stworzycie!”

Jeden z niewielu takich modeli

Dla przypomnienia, oryginalny model Llama również był modelem otwartoźródłowym, ale tylko do użytku badawczego. LLama 2 to natomiast model, po który w końcu mogą sięgnąć firmy, by stworzyć na jego podstawie własne czatboty czy generatory obrazów. Oczywiście, to nie jedyny otwartoźródłowy model AI dostępny na rynku, ale poza Stable Diffusion od Stability jest zdecydowanie jednym z niewielu.

Oczywiście trzeba trzymać kciuki za to, że otwartoźródłowe modele językowe sztucznej inteligencji będą faktycznie wykorzystywane zgodnie z zasadami wyznaczonymi przez ich twórców. Podejrzewam jednak, że znajdą się cyberprzestępcy, który postanowią zignorować ich licencje open source.

Źródło: Meta / fot. tyt. Meta

Udostępnij

Anna BorzęckaSwoją przygodę z dziennikarstwem rozpoczęła w 2015 roku. Na co dzień pisze o nowościach ze świata technologii i nauki, ale jest również autorką felietonów i recenzji. Chętnie testuje możliwości zarówno oprogramowania, jak i sprzętu – od smartfonów, przez laptopy, peryferia komputerowe i urządzenia audio, aż po małe AGD. Jej największymi pasjami są kulinaria oraz gry wideo. Sporą część wolnego czasu spędza w World of Warcraft, a także przyrządzając potrawy z przeróżnych zakątków świata.