Czas e-biznesu

Wszystkie najświeższe informacje o Polsce z Czasu e Biznesu.

Google wprowadza dwa nowe otwarte stopnie LLM

Google wprowadza dwa nowe otwarte stopnie LLM

Kredyty obrazkowe: Catherine Delahaye/Getty Images

Zaledwie tydzień po wprowadzeniu na rynek najnowszej wersji modeli Gemini firma Google ogłosiła dzisiaj wprowadzenie na rynek Gemma – nowej rodziny lekkich modeli do użytku na świeżym powietrzu. zaczynając od Gemma 2b i Gemma 7bTe nowe modele są „inspirowane Gemini” i są dostępne do użytku komercyjnego i badawczego.

Google nie dostarczył nam szczegółowego artykułu na temat tego, jak te modele wypadają na przykład w porównaniu z podobnymi modelami firm Meta i Mistral, stwierdzając jedynie, że są one „wyrafinowane”. Firma zauważa, że ​​są to gęste modele przeznaczone wyłącznie do dekodera, o tej samej architekturze, którą zastosowała w swoich modelach Gemini (i ich komponentach Poprzednie modele PaLM) i że standardy zobaczymy jeszcze dzisiaj Tablica liderów z przytuloną twarzą.

Aby rozpocząć pracę z Gemmą, programiści mają dostęp do gotowych do użycia notatników Colab i Kaggle, a także integracji z Hugging Face, MaxText i NeMo firmy Nvidia. Po przeszkoleniu i wstępnym dostrojeniu tych modeli można je uruchamiać wszędzie.

Choć Google podkreśla, że ​​są to modele otwarte, warto zaznaczyć, że nie są to modele typu open source. W rzeczywistości na konferencji prasowej poprzedzającej dzisiejsze ogłoszenie Janine Banks z Google podkreśliła zaangażowanie firmy w oprogramowanie open source, ale zauważyła również, że Google bardzo świadomie podchodzi do sposobu, w jaki odnosi się do modeli Gemma.

„[Open models] „Stało się to obecnie bardzo powszechne w branży” – powiedział Banks. „Często odnosi się to do modeli o otwartej wadze, w przypadku których programiści i badacze mają szeroki dostęp do dostosowywania i dostrajania modeli, ale jednocześnie warunki użytkowania – takie jak redystrybucja, a także własność opracowanych zmiennych — różnią się w zależności od konkretnych warunków korzystania z modelu.” Widzimy więc pewną różnicę między tym, co tradycyjnie nazywamy oprogramowaniem open source, i zdecydowaliśmy, że sensowne jest określanie naszych modeli GEMMA jako oprogramowania typu open source.

READ  Losowe: Super Mario Odyssey Easter Egg prezentuje akcesoria Nintendo

Oznacza to, że programiści mogą używać modelu do wnioskowania i dostosowywania go według potrzeb, a zespół Google twierdzi, że chociaż te rozmiary modeli są odpowiednie w wielu przypadkach użycia.

„Jakość wytwarzania znacznie wzrosła w zeszłym roku” – powiedziała Trace Warkentin, dyrektor ds. zarządzania produktami w Google DeepMind. „Rzeczy, które wcześniej były domeną bardzo dużych modeli, są teraz możliwe dzięki najnowszym, mniejszym modelom. Otwiera to zupełnie nowe sposoby tworzenia aplikacji AI, z których jesteśmy bardzo podekscytowani, w tym możliwość wnioskowania i dostrajania na komputerze stacjonarnym lub laptopie komputer.” Dla programisty lokalnie z procesorem graficznym RTX lub na pojedynczym hoście w GCP z procesorami Cloud TPU.

Dotyczy to również otwartych modeli konkurentów Google w tej przestrzeni, więc będziemy musieli zobaczyć, jak modele Gemmy radzą sobie w rzeczywistych scenariuszach.

Oprócz nowych modeli Google wprowadza także nowy zestaw narzędzi Odpowiedzialna sztuczna inteligencja, który zapewni „niezbędne wskazówki i narzędzia do tworzenia bezpieczniejszych aplikacji AI za pomocą Gemmy”, a także narzędzie do debugowania.