Google pokazało kolejny model AI. Czym jest Gemma?

Google zaprezentowało swoją najnowszą serię modeli językowych AI o nazwie Gemma. Modele te są odgórnie ogólnodostępne i mają otwartą architekturę. Każdy z nich został oparty na technologii podobnej do tej, która napędza bardziej zaawansowane AI od Google – Gemini. Istnieje jednak jedna, kluczowa różnica pomiędzy modelami Gemma a Gemini.

Wspomnę o tym od razu – kluczową różnicą względem Gemini jest to, iż modele Gemma zostały zaprojektowane do działania na komputerach osobistych. Ta wersja oznacza także pierwszy duży krok Google w kierunku rozwoju dużych modeli językowych w modelu open source (choć nie do końca oficjalnie).

Google prezentuje Gemma AI

Seria Gemma składa się z dwóch wariantów: Gemma 2B z 2 miliardami parametrów i Gemma 7B z 7 miliardami parametrów. Obie wersje są oferowane przez Google we wstępnie wyszkolonym formacie oraz po początkowym fine-tuningu. W kontekście sztucznej inteligencji „parametry” odnoszą się do wartości informacji w sieci neuronowej, które wpływają na zachowanie modelu sztucznej inteligencji. Waga to z kolei określona grupa tychże parametrów przechowywana jako plik.

Google DeepMind i inne zespoły AI w firmie z Mountain View opracowały Gemmę, czerpiąc spostrzeżenia z rozwoju serii modeli Gemini. Nazwa „Gemma” pochodzi od łacińskiego słowa (pisanego tak samo) oznaczającego „kamień szlachetny”.

Chociaż Gemma stanowi pierwszą, otwartą wersję dużego modela językowego po ChatGPT, firma ma historię aktywnego brania udziału w otwartych i transparentnych badaniach nad sztuczną inteligencją. W tym wypadku godne uwagi osiągnięcia obejmują chociażby architekturę Transformer i narzędzia takie jak TensorFlow, BERT, T5 i JAX, które odegrały kluczową rolę w rozwoju obecnego AI.

Google twierdzi, że Gemma przewyższa Llama 2 firmy Meta w różnych testach porównawczych. Przyznam Wam, że benchmarki w AI stają się tym, co kiedyś AnTuTu i GeekBench dla smartfonów. Ciężko na ich podstawie realnie ocenić wydajność.

Google Gemma — Tak w benchmarkach radzi sobie nowy model od Google / fot. Google

Open source to jedyne wyjście

W przeciwieństwie do mniejszych otwartych modeli LLM, które wcześniej przypominały karykatury technologiczne ze względu na ograniczone możliwości i wysokie poziomy błędów, w ostatnich latach większe modele osiągają poziom wydajności porównywalny z ChatGPT 3.5.

Eksperci uważają, że tworzenie modeli sztucznej inteligencji z dostępnymi źródłami i otwartymi wagami ma kluczowe znaczenie dla zapewnienia przejrzystości i prywatności w technologii AI. Należy jednak zauważyć, że Gemma nie jest klasyfikowana jako „open source” w tradycyjnym znaczeniu, które zazwyczaj odnosi się do licencji oprogramowania z minimalnymi ograniczeniami.

Gemma wydaje się odpowiedzią Google na strategię Meta, która polega na wydawaniu modeli o otwartej architekturze, takich jak LLaMA i Llama 2. Podejście to kontrastuje z modelami sztucznej inteligencji, takimi jak GPT-4 Turbo firmy OpenAI, które są dostępne wyłącznie za pośrednictwem aplikacji ChatGPT i interfejsu API w chmurze i nie mogą być obsługiwane lokalnie.

Według raportu Reutersa strategia Google z Gemmą może mieć na celu przyciągnięcie większej liczby programistów do platformy chmurowej Vertex AI.

Choć nie zostało to jeszcze dokładnie przetestowane, Google zapewnia, że wariant 7B Gemmy przewyższa modele Meta’s Llama 2 (7B i 13B) w testach porównawczych. Model jest obecnie dostępny za pośrednictwem Kaggle, platformy dla społeczności uczenia maszynowego, oraz na Hugging Face.

Wraz z wydaniem Gemmy, Google wprowadziło również „Responsible Generative AI Toolkit”. Ten zestaw narzędzi ma na celu zapewnienie wskazówek i narzędzi do tworzenia tego, co Google określa jako „bezpieczne i odpowiedzialne” aplikacje AI.

źródło: Google / fot. Google

7 bilionów dolarów – tyle trzeba, aby zbudować nowego „boga”

AI google sztuczna inteligencja