Powstaje polski ChatGPT

NASK (Naukowa i Akademicka Sieć Komputerowa) zapowiedziała powstanie polskiego wielkiego modelu językowego PLLuM oraz opartego na nim inteligentnego asystenta.

Polacy nie gęsi, iż swój ChatGPT mają

29 listopada 2023 r. zawiązano konsorcjum PLLuM (Polish Large Language Universal Model). Składa się na nie sześć czołowych instytucji naukowych w Polsce z dziedziny sztucznej inteligencji i językoznawstwa, w tym Politechnika Wrocławska (lider konsorcjum), Państwowy Instytut Badawczy NASK, Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy (OPI PIB), Instytut Podstaw Informatyki PAN, Uniwersytet Łódzki oraz Instytut Slawistyki PAN.

Celem konsorcjum jest stworzenie pierwszego otwartego dużego modelu językowego w języku polskim oraz opracowanie opartego na nim inteligentnego asystenta. Cały projekt wedle zapowiedzi, będzie realizowany zgodnie z zasadami etycznej i odpowiedzialnej sztucznej inteligencji, uwzględniając reprezentatywność, przejrzystość i sprawiedliwość przetwarzania danych.

Zagrożenia związane z Chat GPT i innymi AI

Z motyką na słońce?

Wiele osób może zadawać sobie pytanie, jaki jest sens tworzenia polskiego modelu językowego, jeśli już ChatGPT wykonuje już polecenia w języku polskim. Jak wskazuje NASK, chociaż istnieją już duże modele językowe dostępne na otwartych licencjach, to jednak wciąż brakuje modeli, które zostałyby wytrenowane na reprezentatywnych zbiorach języka polskiego. Niewielki udział polskich tekstów w danych treningowych sprawia, że modele te nie są odpowiednie do wielu komercyjnych zastosowań w naszym rodzimym język. PLLum ma być zatem trenowany na nadwiślańskich danych, opartych na polskiej kulturze. Sprawi to, że odpowiedzi generowane przez model będą dokładniejsze i uwzgledniające lokalny kontekst.

W ogłoszeniu NASK można wyczytać również, że projekt pozwoli polskim specjalistom lepiej poznać działanie modeli językowych oraz umożliwi rozbudowę krajowych kompetencji w tej dziedzinie.

Trudna droga

Przed PLLum stoi wieje wyzwań. Jednym z nich jest dostęp do dużej bazy danych treningowych, która pozwoli na rozwój i działanie modelu. Można się spodziewać, że część danych będzie pochodziła ze zdigitalizowanych zbiorów bibliotecznych, jednakże to źródło jest ograniczone i nie wystarczy do dynamicznego rozwoju PLLum. Duzi gracze w dziedzinie AI dane treningowe dla swoich modeli pozyskują za pomocą web scrappingu, czyli zbieraniu danych, które są ogólnie dostępne w Internecie, bez zgody osób, które je opublikowały. Czy PLLum również będzie korzystał z tej praktyki? Na razie nie mamy takich informacji.

Wyzwania

Powstanie PLLum nie będzie łatwe ani szybkie, Nie jest również gwarantowane, że projekt będzie sukcesem. Jednakże sama próba stworzenia nowego modelu jest dobrym pomysłem, gdyż pozwoli na zdobycie cennego doświadczenia i wiedzy. Trzymamy zatem kciuki za sukces tej inicjatywy.

Źródło:

https://www.nask.pl/pl/aktualnosci/5314,Nie-stac-nas-na-to-by-zostawac-w-tyle-Powstanie-pierwszy-polski-otwarty-wielki-m.html