Jak podaje portal naukawpolsce.pl, pod koniec sierpnia br. została udostępniona nowa wersja polskiego modelu językowego Bielik (Bielik-11B-v2), czyli dużego modelu językowego służącego do generowania treści tekstowych, w oparciu o obszerną bazę polskich tekstów. W szkoleniu Bielika wykorzystano zasoby obliczeniowe dwóch najszybszych superkomputerów w Polsce – Heliosa i Atheny przy krakowskim AGH (Akademia Górniczo-Hutnicza).
Bielik, czyli polski model językowy
Bielik to – mówiąc obrazowo – polski produkt, należący do kategorii dużych modeli językowych (LLM – Large Language Model). Został on opracowany przez zespół działający w ramach Fundacji SpeakLeash przy współpracy z Akademickim Centrum Komputerowym Cyfronet AGH. Jak podkreślają jego twórcy – Bielik został stworzony z myślą o bardziej efektywnym posługiwaniu się językiem polskim oraz lepszym rozumieniu polskich realiów, co ma go odróżnić od modeli zagranicznych, które gorzej radzą sobie na tym tle (np. najbardziej popularny ChatGpt). Do jego nauki wykorzystano ogromny zbiór danych tekstowych. Przedstawiciele fundacji SpeakLeash podkreślają, że dzięki tej pracy, zasoby fundacji są aktualnie największym, najlepiej opisanym i udokumentowanym zbiorem danych w języku polskim. Co istotne, twórcy modelu udostępniają go w formule opensource, co pozwoli na jego wykorzystanie także przy tworzeniu niepublicznych baz danych.
AGH udostępnia najszybsze komputery w Polsce
W ramach prac nad Bielikiem wykorzystano superszybkie komputery Akademickiego Centrum Komputerowego Cyfronet AGH, tj. Heliosa i Athenę. Rzeczniczka uczelni poinformowała, że wsparcie zespołu z AGH obejmowało optymalizację i skalowanie procesów treningowych, prace nad przepływami przetwarzania danych, rozwój metod generowania danych syntetycznych oraz testowanie modelu.
Co ciekawe, komputery użyte do pracy nad Bielikiem osiągają ogromną moc obliczeniową. Wskazuje się, że łączna moc obliczeniowa Heliosa i Atheny w tradycyjnych symulacjach komputerowych wynosi ponad 44 PFLOPS (petaflops to milion miliardów flopsów), natomiast w obliczeniach związanych ze sztuczną inteligencją, przy niższej precyzji, osiąga aż 2 EFLOPS (eksaflops to miliard miliardów flopsów). Takie liczby robią wrażenie.
Nieoczywista przewaga Bielika
Twórcy Bielika zwracają uwagę, że dostępne w Internecie narzędzia oparte o sztuczną inteligencję (np. najbardziej popularny ChatGpt), są obsługiwane przez zewnętrzne serwery. Bielik może zostać natomiast uruchomiony na własnych serwerach organizacji. Może to mieć duże znaczenie w przypadku, gdy dany podmiot zamierza przetwarzać przy jego wykorzystaniu dane wrażliwe, takie jak np. dane medyczne lub informacje, które są poufne i muszą podlegać specjalnej ochronie. W ocenie twórców modelu, co prawda Bielik może nie dorównać swoją mocą np. ChatGpt, ale z pewnością może on być bardziej dostosowany do specyficznych potrzeb organizacji.
Co więcej, twórcy Bielika słusznie podkreślają, że warto inwestować w budowę własnych narzędzi opartych o sztuczną inteligencję, aby uniezależnić się od zewnętrznych dostawców, które mogą wprowadzać ograniczenia lub zmiany w dostępie do swoich zasobów w obliczu wahań rynkowych, regulacyjnych czy prawnych. Rozwijanie i doskonalenie narzędzi w Polsce, pomoże – jak zauważają twórcy modelu – tworzyć stabilne zaplecze, które może zabezpieczyć wiele kluczowych sektorów, takich jak bankowość, administracja, medycyna czy prawo.
To dobra wiadomość, że w Polsce powstał tak zaawansowany model LLM. Jesteśmy ciekawi w jaki sposób i jak szybko model ten będzie się rozwijał oraz czy dorówna on kiedyś zagranicznym odpowiednikom. Bez wątpienia jego duża zaletą może być to, że w założeniu sprawnie posługuje się on naszym językiem ojczystym, co nie jest takie oczywiste w przypadku modeli zagranicznych, które co prawda mówią po polsku, niemniej ich kompetencje językowe w tym zakresie często pozostawiają dużo do życzenia.
Z Bielikiem można porozmawiać pod tym adresem: https://bielik.ai/
Źródło: