Czas e-biznesu

Wszystkie najświeższe informacje o Polsce z Czasu e Biznesu.

Google wprowadza dwa nowe otwarte stopnie LLM

Google wprowadza dwa nowe otwarte stopnie LLM

Kredyty obrazkowe: Catherine Delahaye/Getty Images

Zaledwie tydzień po wprowadzeniu na rynek najnowszej wersji modeli Gemini firma Google ogłosiła dzisiaj wprowadzenie na rynek Gemma – nowej rodziny lekkich modeli do użytku na świeżym powietrzu. zaczynając od Gemma 2b i Gemma 7bTe nowe modele są „inspirowane Gemini” i są dostępne do użytku komercyjnego i badawczego.

Google nie dostarczył nam szczegółowego artykułu na temat tego, jak te modele wypadają na przykład w porównaniu z podobnymi modelami firm Meta i Mistral, stwierdzając jedynie, że są one „wyrafinowane”. Firma zauważa, że ​​są to gęste modele przeznaczone wyłącznie do dekodera, o tej samej architekturze, którą zastosowała w swoich modelach Gemini (i ich komponentach Poprzednie modele PaLM) i że standardy zobaczymy jeszcze dzisiaj Tablica liderów z przytuloną twarzą.

Aby rozpocząć pracę z Gemmą, programiści mają dostęp do gotowych do użycia notatników Colab i Kaggle, a także integracji z Hugging Face, MaxText i NeMo firmy Nvidia. Po przeszkoleniu i wstępnym dostrojeniu tych modeli można je uruchamiać wszędzie.

Choć Google podkreśla, że ​​są to modele otwarte, warto zaznaczyć, że nie są to modele typu open source. W rzeczywistości na konferencji prasowej poprzedzającej dzisiejsze ogłoszenie Janine Banks z Google podkreśliła zaangażowanie firmy w oprogramowanie open source, ale zauważyła również, że Google bardzo świadomie podchodzi do sposobu, w jaki odnosi się do modeli Gemma.

„[Open models] „Stało się to obecnie bardzo powszechne w branży” – powiedział Banks. „Często odnosi się to do modeli o otwartej wadze, w przypadku których programiści i badacze mają szeroki dostęp do dostosowywania i dostrajania modeli, ale jednocześnie warunki użytkowania – takie jak redystrybucja, a także własność opracowanych zmiennych — różnią się w zależności od konkretnych warunków korzystania z modelu.” Widzimy więc pewną różnicę między tym, co tradycyjnie nazywamy oprogramowaniem open source, i zdecydowaliśmy, że sensowne jest określanie naszych modeli GEMMA jako oprogramowania typu open source.

READ  Nowe głośniki Sony Rugged Party są głośne, przenośne iw pełni oświetlone (dosłownie)

Oznacza to, że programiści mogą używać modelu do wnioskowania i dostosowywania go według potrzeb, a zespół Google twierdzi, że chociaż te rozmiary modeli są odpowiednie w wielu przypadkach użycia.

„Jakość wytwarzania znacznie wzrosła w zeszłym roku” – powiedziała Trace Warkentin, dyrektor ds. zarządzania produktami w Google DeepMind. „Rzeczy, które wcześniej były domeną bardzo dużych modeli, są teraz możliwe dzięki najnowszym, mniejszym modelom. Otwiera to zupełnie nowe sposoby tworzenia aplikacji AI, z których jesteśmy bardzo podekscytowani, w tym możliwość wnioskowania i dostrajania na komputerze stacjonarnym lub laptopie komputer.” Dla programisty lokalnie z procesorem graficznym RTX lub na pojedynczym hoście w GCP z procesorami Cloud TPU.

Dotyczy to również otwartych modeli konkurentów Google w tej przestrzeni, więc będziemy musieli zobaczyć, jak modele Gemmy radzą sobie w rzeczywistych scenariuszach.

Oprócz nowych modeli Google wprowadza także nowy zestaw narzędzi Odpowiedzialna sztuczna inteligencja, który zapewni „niezbędne wskazówki i narzędzia do tworzenia bezpieczniejszych aplikacji AI za pomocą Gemmy”, a także narzędzie do debugowania.