Europejskie startupy ścigają się, aby rozwiązać problem z popularnymi chatbotami AI: jakość odpowiedzi w językach innych niż angielski.
Firma Silo AI z siedzibą w Helsinkach ma w środę rozpocząć inicjatywę mającą przyczynić się do budowy nowych dużych modeli językowych, które stanowią podstawę generatywnych produktów sztucznej inteligencji, takich jak ChatGPT firmy OpenAI i Google Bard, w językach europejskich, w tym szwedzkim, islandzkim, norweskim i Duński.
Fińska firma dołącza do innych grup udoskonalających technologię stojącą za chatbotami, które realistycznie odpowiadają na podpowiedzi napisane w językach takich jak niemiecki, hebrajski czy arabski.
Ruchy pojawiają się, gdy firmy na całym świecie zaczynają wdrażać oprogramowanie AI stworzone przez wspierane przez Microsoft OpenAI i Google, co skłania krytyków do wyrażania obaw dotyczących nadmiernego polegania na potężnej, zamkniętej technologii zbudowanej przez niewielką grupę głównie amerykańskich uczestników.
Potrzebna inicjatywa europejska. . . „Wiedza jest pozyskiwana z perspektywy europejskiej i możemy kontrolować rodzaj danych, które do niej trafiają” — powiedział Peter Sarlin, dyrektor generalny Silo AI.
Bard od Google działa obecnie tylko w języku angielskim. ChatGPT OpenAI obsługuje dziesiątki języków, w tym europejski, indyjski, perski i inne. Jednak według tych, którzy dokładnie ją przetestowali, nie jest ona równie dokładna we wszystkich językach.
Silo AI próbuje rozwiązać ten problem, gromadząc zespół doświadczonych naukowców zajmujących się sztuczną inteligencją z całej Europy. Będą budować, trenować i uruchamiać modele w języku skandynawskim na najpotężniejszym superkomputerze na kontynencie Lomiktóry znajduje się w Finlandii i został zmodyfikowany do obsługi generatywnych programów AI.
Nowa inicjatywa zespołu, znana jako SiloGen, planuje z czasem rozszerzyć się na więcej języków.
Ale problem nie jest czysto językowy. Sarlin powiedział, że tworzenie modeli w Europie może zapewnić, że jakość danych wykorzystywanych do szkolenia będzie reprezentatywna dla kultury i etyki krajów poza Stanami Zjednoczonymi, w tym kwestii prywatności.
Model Silo AI będzie również open source, co oznacza, że każdy, kto chce go opublikować, może go analizować i dostosowywać. Kontrastuje to z zamkniętymi modelami OpenAI i Google, w których firmy mogą niechętnie udostępniać swoje poufne lub prywatne dane.
Inne europejskie wysiłki obejmują OpenGPT-X i LEAM, dwie kierowane przez Niemców inicjatywy mające na celu rozwój paradygmatów języków open source. Modele OpenGPT-X są budowane we współpracy z niemieckim start-upem AI Aleph Alpha.
Kiedy uruchomiono go w zeszłym roku, grupa stojąca za OpenGPT-X ostrzegała, że brak dostępu do szczegółów modeli takich jak GPT-4 zagraża „suwerenności cyfrowej i niezależności rynkowej” Europy w dziedzinie sztucznej inteligencji, co może utrudniać rozwój europejskich firm i badań.
Wiodące chatboty zostały zaprogramowane tak, aby dawały najlepsze wyniki w języku angielskim, co było „nie fair w stosunku do reszty świata” – powiedział Marco Trombetti, dyrektor generalny włoskiej firmy zajmującej się tłumaczeniami cyfrowymi Translated.
Aby temu przeciwdziałać, jego firma stworzyła narzędzie do tłumaczenia ChatGPT na żywo, które działa w 60 językach i ma na celu poprawę odpowiedzi narzędzia.
„To skok technologiczny o pięć lat wstecz dla świata nieanglojęzycznego, skutecznie tworzący świat dwóch prędkości” — powiedział Trombetti o istniejących narzędziach sztucznej inteligencji.
Takie obawy wyrażane są nie tylko w Europie. Izraelski Urząd ds. Innowacji wydał 7,5 miliona Shy (około 2,1 miliona dolarów) na założenie Stowarzyszenia Przetwarzania Języka Naturalnego. Dror Bean, jej dyrektor generalny, powiedział, że grupa próbuje odwrócić „słabą i nieodpowiednią jakość rozpoznawania mowy hebrajskiej i arabskiej w różnych typach systemów komputerowych”.
Przy ograniczonych funduszach na badania nad sztuczną inteligencją w krajach arabskojęzycznych i stosunkowo niewielu hebrajskich na świecie, powiedział Bean, istnieje obawa, że zostaną pozostawieni w tyle, ponieważ produkty AI są integrowane z aplikacjami komercyjnymi, takimi jak Microsoft Office i Google Workspace.
Dodał, że „jakość rozumienia i rozpoznawania mowy ludzkiej zarówno w języku hebrajskim, jak i arabskim jest niska i stanowi przeszkodę w uzyskaniu i stosowaniu zaawansowanych usług”.
Dodatkowe raporty autorstwa Johna Thornhilla
„Nieuleczalny entuzjasta muzyki. Piwo. Totalny odkrywca. Wichrzyciel. Oddany fanatyk sieci”.
More Stories
Połączenia na Twitterze są teraz domyślnie włączone. Oto jak to wyłączyć
Electronic Arts zwalnia 5% siły roboczej, zamyka studio i odwołuje gry
Remedy Entertainment kupuje prawa do serii Control od 505 Games za 17 milionów euro