Europejskie startupy ścigają się, aby rozwiązać problem z popularnymi chatbotami AI: jakość odpowiedzi w językach innych niż angielski.
Firma Silo AI z siedzibą w Helsinkach ma w środę rozpocząć inicjatywę mającą przyczynić się do budowy nowych dużych modeli językowych, które stanowią podstawę generatywnych produktów sztucznej inteligencji, takich jak ChatGPT firmy OpenAI i Google Bard, w językach europejskich, w tym szwedzkim, islandzkim, norweskim i Duński.
Fińska firma dołącza do innych grup udoskonalających technologię stojącą za chatbotami, które realistycznie odpowiadają na podpowiedzi napisane w językach takich jak niemiecki, hebrajski czy arabski.
Ruchy pojawiają się, gdy firmy na całym świecie zaczynają wdrażać oprogramowanie AI stworzone przez wspierane przez Microsoft OpenAI i Google, co skłania krytyków do wyrażania obaw dotyczących nadmiernego polegania na potężnej, zamkniętej technologii zbudowanej przez niewielką grupę głównie amerykańskich uczestników.
Potrzebna inicjatywa europejska. . . „Wiedza jest pozyskiwana z perspektywy europejskiej i możemy kontrolować rodzaj danych, które do niej trafiają” — powiedział Peter Sarlin, dyrektor generalny Silo AI.
Bard od Google działa obecnie tylko w języku angielskim. ChatGPT OpenAI obsługuje dziesiątki języków, w tym europejski, indyjski, perski i inne. Jednak według tych, którzy dokładnie ją przetestowali, nie jest ona równie dokładna we wszystkich językach.
Silo AI próbuje rozwiązać ten problem, gromadząc zespół doświadczonych naukowców zajmujących się sztuczną inteligencją z całej Europy. Będą budować, trenować i uruchamiać modele w języku skandynawskim na najpotężniejszym superkomputerze na kontynencie Lomiktóry znajduje się w Finlandii i został zmodyfikowany do obsługi generatywnych programów AI.
Nowa inicjatywa zespołu, znana jako SiloGen, planuje z czasem rozszerzyć się na więcej języków.
Ale problem nie jest czysto językowy. Sarlin powiedział, że tworzenie modeli w Europie może zapewnić, że jakość danych wykorzystywanych do szkolenia będzie reprezentatywna dla kultury i etyki krajów poza Stanami Zjednoczonymi, w tym kwestii prywatności.
Model Silo AI będzie również open source, co oznacza, że każdy, kto chce go opublikować, może go analizować i dostosowywać. Kontrastuje to z zamkniętymi modelami OpenAI i Google, w których firmy mogą niechętnie udostępniać swoje poufne lub prywatne dane.
Inne europejskie wysiłki obejmują OpenGPT-X i LEAM, dwie kierowane przez Niemców inicjatywy mające na celu rozwój paradygmatów języków open source. Modele OpenGPT-X są budowane we współpracy z niemieckim start-upem AI Aleph Alpha.
Kiedy uruchomiono go w zeszłym roku, grupa stojąca za OpenGPT-X ostrzegała, że brak dostępu do szczegółów modeli takich jak GPT-4 zagraża „suwerenności cyfrowej i niezależności rynkowej” Europy w dziedzinie sztucznej inteligencji, co może utrudniać rozwój europejskich firm i badań.
Wiodące chatboty zostały zaprogramowane tak, aby dawały najlepsze wyniki w języku angielskim, co było „nie fair w stosunku do reszty świata” – powiedział Marco Trombetti, dyrektor generalny włoskiej firmy zajmującej się tłumaczeniami cyfrowymi Translated.
Aby temu przeciwdziałać, jego firma stworzyła narzędzie do tłumaczenia ChatGPT na żywo, które działa w 60 językach i ma na celu poprawę odpowiedzi narzędzia.
„To skok technologiczny o pięć lat wstecz dla świata nieanglojęzycznego, skutecznie tworzący świat dwóch prędkości” — powiedział Trombetti o istniejących narzędziach sztucznej inteligencji.
Takie obawy wyrażane są nie tylko w Europie. Izraelski Urząd ds. Innowacji wydał 7,5 miliona Shy (około 2,1 miliona dolarów) na założenie Stowarzyszenia Przetwarzania Języka Naturalnego. Dror Bean, jej dyrektor generalny, powiedział, że grupa próbuje odwrócić „słabą i nieodpowiednią jakość rozpoznawania mowy hebrajskiej i arabskiej w różnych typach systemów komputerowych”.
Przy ograniczonych funduszach na badania nad sztuczną inteligencją w krajach arabskojęzycznych i stosunkowo niewielu hebrajskich na świecie, powiedział Bean, istnieje obawa, że zostaną pozostawieni w tyle, ponieważ produkty AI są integrowane z aplikacjami komercyjnymi, takimi jak Microsoft Office i Google Workspace.
Dodał, że „jakość rozumienia i rozpoznawania mowy ludzkiej zarówno w języku hebrajskim, jak i arabskim jest niska i stanowi przeszkodę w uzyskaniu i stosowaniu zaawansowanych usług”.
Dodatkowe raporty autorstwa Johna Thornhilla
„Nieuleczalny entuzjasta muzyki. Piwo. Totalny odkrywca. Wichrzyciel. Oddany fanatyk sieci”.
More Stories
343 szczegóły Nowy system rozwoju kariery w Halo Infinite
Bezpłatna aktualizacja Hogwarts Legacy po cichu dodaje nową zawartość
E3 samo się zabiło, mówi Jeff Kelly z Summer Game Fest