Kredyty obrazkowe: Catherine Delahaye/Getty Images
Zaledwie tydzień po wprowadzeniu na rynek najnowszej wersji modeli Gemini firma Google ogłosiła dzisiaj wprowadzenie na rynek Gemma – nowej rodziny lekkich modeli do użytku na świeżym powietrzu. zaczynając od Gemma 2b i Gemma 7bTe nowe modele są „inspirowane Gemini” i są dostępne do użytku komercyjnego i badawczego.
Google nie dostarczył nam szczegółowego artykułu na temat tego, jak te modele wypadają na przykład w porównaniu z podobnymi modelami firm Meta i Mistral, stwierdzając jedynie, że są one „wyrafinowane”. Firma zauważa, że są to gęste modele przeznaczone wyłącznie do dekodera, o tej samej architekturze, którą zastosowała w swoich modelach Gemini (i ich komponentach Poprzednie modele PaLM) i że standardy zobaczymy jeszcze dzisiaj Tablica liderów z przytuloną twarzą.
Aby rozpocząć pracę z Gemmą, programiści mają dostęp do gotowych do użycia notatników Colab i Kaggle, a także integracji z Hugging Face, MaxText i NeMo firmy Nvidia. Po przeszkoleniu i wstępnym dostrojeniu tych modeli można je uruchamiać wszędzie.
Choć Google podkreśla, że są to modele otwarte, warto zaznaczyć, że nie są to modele typu open source. W rzeczywistości na konferencji prasowej poprzedzającej dzisiejsze ogłoszenie Janine Banks z Google podkreśliła zaangażowanie firmy w oprogramowanie open source, ale zauważyła również, że Google bardzo świadomie podchodzi do sposobu, w jaki odnosi się do modeli Gemma.
„[Open models] „Stało się to obecnie bardzo powszechne w branży” – powiedział Banks. „Często odnosi się to do modeli o otwartej wadze, w przypadku których programiści i badacze mają szeroki dostęp do dostosowywania i dostrajania modeli, ale jednocześnie warunki użytkowania – takie jak redystrybucja, a także własność opracowanych zmiennych — różnią się w zależności od konkretnych warunków korzystania z modelu.” Widzimy więc pewną różnicę między tym, co tradycyjnie nazywamy oprogramowaniem open source, i zdecydowaliśmy, że sensowne jest określanie naszych modeli GEMMA jako oprogramowania typu open source.
Oznacza to, że programiści mogą używać modelu do wnioskowania i dostosowywania go według potrzeb, a zespół Google twierdzi, że chociaż te rozmiary modeli są odpowiednie w wielu przypadkach użycia.
„Jakość wytwarzania znacznie wzrosła w zeszłym roku” – powiedziała Trace Warkentin, dyrektor ds. zarządzania produktami w Google DeepMind. „Rzeczy, które wcześniej były domeną bardzo dużych modeli, są teraz możliwe dzięki najnowszym, mniejszym modelom. Otwiera to zupełnie nowe sposoby tworzenia aplikacji AI, z których jesteśmy bardzo podekscytowani, w tym możliwość wnioskowania i dostrajania na komputerze stacjonarnym lub laptopie komputer.” Dla programisty lokalnie z procesorem graficznym RTX lub na pojedynczym hoście w GCP z procesorami Cloud TPU.
Dotyczy to również otwartych modeli konkurentów Google w tej przestrzeni, więc będziemy musieli zobaczyć, jak modele Gemmy radzą sobie w rzeczywistych scenariuszach.
Oprócz nowych modeli Google wprowadza także nowy zestaw narzędzi Odpowiedzialna sztuczna inteligencja, który zapewni „niezbędne wskazówki i narzędzia do tworzenia bezpieczniejszych aplikacji AI za pomocą Gemmy”, a także narzędzie do debugowania.
„Nieuleczalny entuzjasta muzyki. Piwo. Totalny odkrywca. Wichrzyciel. Oddany fanatyk sieci”.
More Stories
Połączenia na Twitterze są teraz domyślnie włączone. Oto jak to wyłączyć
Electronic Arts zwalnia 5% siły roboczej, zamyka studio i odwołuje gry
Remedy Entertainment kupuje prawa do serii Control od 505 Games za 17 milionów euro