Ładowanie

Naukowcy z Politechniki Wrocławskiej pracują nad polską wersją ChatGPT

„Polski ChatGPT” powstaje na PWr

23 października, 2023

Naukowcy z Politechniki Wrocławskiej pracują nad polską wersją ChatGPT fot. Politechnika Wrocławska

Naukowcy z Politechniki Wrocławskiej pracują nad polską wersją ChatGPT – chatbota służącego do generowania odpowiedzi na pytania wprowadzane przez użytkownika. Polska wersja będzie uzupełniona danymi związanymi z polskim kontekstem społeczno-kulturalnym.

ChatGPT to program stworzony przez amerykańską firmę OpenAI założoną przez Elona Muska. Jest to transformer językowy, który za pomocą sztucznej inteligencji udziela odpowiedzi na zadane mu pytanie. Prototyp programu został uruchomiony 30 listopada 2022. W styczniu 2023 roku, zaledwie dwa miesiące po premierze miał już 590 milionów odwiedzin. Chatbot generuje odpowiedź w języku polskim, jednak w związku z tym, że jest to tłumaczenie, to tekst może zawierać błędy językowe.

ChatGPT po polsku

Naukowcy z Politechniki Wrocławskiej chcą utworzyć polską wersję ChatGPT, która będzie uwzględniać naszą kulturę, historię i obyczaje.

Podejrzewamy, że podczas trenowania ChatGPT nie widział za dużo języka polskiego w stosunku do innych języków. W związku z tym jest duża szansa, że przygotowując odpowiedzi, nadpisuje pewną wiedzę dotyczącą polskiej kultury, obyczajów i faktów danymi z innych języków. W trakcie testów zwróciliśmy uwagę, że dotyczy to zwłaszcza polskiej kultury i historii, popełnia też trochę błędów gramatycznych i stylistycznych – tłumaczy dr inż. Jan Kocoń z Katedry Sztucznej Inteligencji. – W naszym interesie jest, by nad tym panować i mieć kontrolę nad informacjami, które są związane z naszych krajem – dodaje.

Odpowiedzi wygenerowane przez AI będą musiały być jeszcze sprawdzone przez specjalny system, który oceni czy są one prawdziwe.

Widzimy ogromną potrzebę stworzenia dobrze zabezpieczonego polskiego modelu językowego, która aby był bezpieczną bazą dla przedsiębiorców, administracji, naukowców i zwykłych użytkowników – mówi dr Jan Kocoń. – Musimy mieć tę technologię pod kontrolą, choćby ze względu na bezpieczeństwo generowanych tekstów – dodaje.

Prace nad polskim Chat GPT na Politechnice Wrocławskiej

Uczelnia rozpoczęła gromadzenie danych. W ramach zadania uruchomiony zostanie superkomputer wyspecjalizowany w przetwarzaniu języka naturalnego i sztucznej inteligencji.

– Kupujemy sprzęt warty prawie 130 mln zł. Składa się na niego m.in. 300 kart graficznych H100, stosowanych do trenowania głębokich sieci neuronowych, ponad 30 petabajtów (jeden petabajt to tysiąc terabajtów) miejsca na dyskach twardych i petabajt pamięci RAM – wymienia dr inż. Jan Kocoń. – Nie czekaliśmy na ten sprzęt z założonymi rękami. Już teraz mamy zebrane prawie 300 gigabajtów czystego tekstu pochodzącego z różnych źródeł i liczba ta cały czas rośnie. Zatrudniamy też 60 osób przygotowujących instrukcje do tego systemu, przy pomocy których można go stroić pod realizację naszego modelu językowego. Do badań można dołączyć już teraz – podkreśla.

Pierwsza, testowa wersja ma zostać opublikowana już w pierwszej połowie przyszłego roku.

Tagi