GORĄCE TEMATY

WIĘCEJ

DONALD
ROZMAWIAMY Z JEDNYM Z TWÓRCÓW BIELIKA, DLACZEGO WARTO TRENOWAĆ WŁASNE MODELE JĘZYKOWE, CHOĆBY MAŁE

Rozmawiamy z jednym z twórców Bielika, dlaczego warto trenować własne modele językowe, choćby małe

29.03.2025, 10:30

Sebastian Kondracki jest robotykiem, programistą, szefem innowacji w firmie Deviniti, autorem książki Python AI dla e-commerce i trenerem dużych modeli językowych w projekcie SpeakLeash. Jest także pomysłodawcą i współtwórcą modelu Bielik - polskiego ekosystemu sztucznej inteligencji.

donald.pl: Pozwolimy sobie zacząć nietechnicznie, spytamy o emocje. Za tobą wywiady, spotkania z ludźmi, odpowiadanie na te same pytania. Których pytań masz już dość?

Sebastian: W wywiadach nie jest tak źle. Widać, że nasi redaktorzy są wyedukowani technologicznie. Jednak po wywiadach zaczynają się komentarze użytkowników: "po co nam polski model jak mamy super ChatGPT lub Deepseek" i "wariaci jeszcze system operacyjny polski stwórzcie". Miałbym ochotę wtedy zacytować Kazika.

donald.pl: Proszę zacytować Kazika.

Mamy dużo młodych odbiorców, którzy mogą nie znać klasyki.

Sebastian: "Gdy mnie ktoś tak spyta, za***rwię z laczka i poprawię z kopyta".

donald.pl: To znaczy, że jest jakieś fundamentalne niezrozumienie, dlaczego w ogóle warto próbować i wykonywać tę pracę nad "polskim AI"?

Sebastian: Tak, najwyraźniej brakuje edukacji i wyjaśnienia pojęć. Dlatego misją moją i zespołu

Spichlerza

[projektu SpeakLeash] jest edukacja. Jesteśmy na wielu konferencjach również nietechnicznych, gdzie opowiadamy, że ChatGPT to nie jest tylko LLM, to jest duży model językowy z wieloma różnymi dodatkami.

donald.pl: Co ludzie, ale naprawdę wszyscy ludzie w Polsce powinni zrozumieć z całego tego bałaganu z AI, LLM, SI i innych skrótów, które rozumiemy dość powierzchownie?

Sebastian: Że ChatGPT jest fantastyczny, ale jednak nasze dane gdzieś lecą nie wiadomo gdzie. Tłumaczymy, że wklejanie badań medycznych, danych osobowych, wrażliwych danych firmowych nie jest dobre. Że SLM, czyli małe modele językowe, to fantastyczne narzędzia. Może nie skończyły studiów, jak LLM, ale można je samodzielnie doszkolić i przekazać swoje doświadczenie. Że potrzebujemy SLM, by móc uruchomiać je np. w różnych służbach, aby walczyć z szpiegami, przestępcami. ChatGPT mówi fantastycznie po polsku, ale nie urodził się w Polsce. Czasami musi znać smak polskiego salcesonu i widzieć że Polacy witają się bardziej "stara bida" niż "jak się masz? Super!".

donald.pl: Jest takie stare powiedzenie-mem, że chmura to zawsze czyjś inny komputer. Czyli wysyłamy dane i te dane są czyjeś, dopóki wszystko gra.

Sebastian: Dokładnie i świetnie pokazała to premiera DeepSeeka gdzie rzuciliśmy się na darmowy model i wysyłaliśmy wszystko.

donald.pl: Dlatego warto mieć swoją chmurę, nawet biedniejszą?

Sebastian: Nie biedniejszą! Inną do specjalizowanych zadań. Np. jeśli ChatGPT to metro, przewozi miliony pasażerów, szybko, przyjemnie, ale wymaga dużo prądu i obsługi, to jednak w małej, średniej firmie bardziej potrzebujemy furgonetki zwinnej, szybkiej, taniej. Mało tego, potrzebujemy i metra, i furgonetki, bo jednak pracownicy przyjadą metrem, ale trudno przewozić materiały na budowę również metrem.

donald.pl: Operujemy na uproszczeniach i porównaniach. Pozwolimy sobie na jeszcze jedno, może nie za bardzo bolesne. Czy Bielik to pokemon, którego można trenować tak, żeby ewoluował w różne inne stwory? I to tak u siebie na komputerze, bez ryzyka, że jakiś pan w Chinach podgląda?

Sebastian: O tak, uruchamiasz na swoim komputerze ustawiasz mu tzw. prompt systemowy w którym w wielu słowach budujesz całą personę Nasi członkowie na

Discordzie

prześcigają się w konkursach na nowe persony i twory. Wtedy możesz dzielić się z nim najskrytszymi tajemnicami a on będzie odpowiadał tak jak lubisz.

donald.pl: Czy możemy wytrenować model do tworzenia dowcipów i memów? Testujemy różne modele opowiadając im żart: "Czy wiesz, dlaczego bokserzy na ogół nie uprawiają seksu na noc przed walką? Bo na ogół za sobą nie przepadają". Następnie trzeba "wytłumaczyć" istotę żartu opartą na semantycznym wywiedzeniu w pole odbiorcy, odwołując się też do powszechnie funkcjonujących mitów i zaskoczyć odbiorcę pointą/grą słów.

Sebastian: Modele LLM czy SLM mają bardzo drętwe żarty i chyba nie mają poczucia humoru. Ale możemy właśnie promptem systemowym zbudować odpowiednią personę, która może będzie trochę ciekawiej przekazywać pewne informacje. Jednak żarty będą na poziomie wujków z wesela.

donald.pl: Na poziomie żartów wujka z wesela to można niezłą karierę zrobić, jeździć z występami i mieć szalenie popularnego TikToka, więc to już dużo. Czy Bielik ma szansę "rozumieć" takie rzeczy w przyszłości lepiej, niż inne modele? Czy też nie należy zawracać sobie głowy i skupić się na tym, co może zrobić w technicznych aspektach po nakarmieniu go odpowiednimi danymi?

Sebastian: Próbowałem wytłumaczyć Bielikowi Wasz żart i poprosić o podobny. "Czy wiesz, dlaczego piłkarze na ogół nie grają w szachy przed meczem? Bo na ogół nie mają czasu na ruchy", "Czy wiesz, dlaczego programiści na ogół nie używają kalkulatorów do pisania kodu? Bo na ogół wolą mieć kontrolę nad swoimi zmiennymi".

donald.pl: Jakby to powiedzieć: technicznie jest ok, ale memów z tego nie będzie.

Sebastian: Podczas testowania naszego modelu często wykorzystywaliśmy różne osobistości np. Pudziana, Reksia i prosiliśmy o różne scenariusze. Były wybitnie kreatywne. Myślę że sama kawały to jeszcze nie, ale przygody Kapitana Bomby można spróbować.

donald.pl: Fajnie, że ty i wiele innych osób w czynie społecznym robicie taką robotę. Ale czy to nie powinno wyglądać trochę inaczej? To nie powinien być jeden z priorytetów państwa, żeby na tak ważnej i szybko zmieniającej się dziedzinie zaznaczyć jakieś swoje inicjatywy?

Sebastian: Państwo ma trochę inne priorytety, tworzy pewien system możliwości. Kiedy są nakłady na naukę, badania, dostępność i bogactwo danych, to mamy wszystko, czego potrzeba. To są podstawy. A żeby państwo było innowacyjne, muszą istnieć ruchy open-source, open-science. Czyli takie organizacje jak nasza, które badają i tworzą nie na zamówienie, bez strachy, że nagle przyjdzie jakiś szef i wszystko pozmienia albo ktoś zamknie projekt. Zatem Bielik i Spichlerz muszą być niezależne, finansowane z innych środków niż państwo. Tak narodził się Linux, który jest wszędzie, w każdym telefonie jest cząstka linuxa. Dlatego bardzo współpracujemy z ośrodkami naukowymi, z ministerstwami, ale chcemy być niezależni. Jako open-badacz chcę mieć możliwość zmienić mój plan badań. Mogę dziś zdecydować że będę trenował model do gwary śląskiej.

donald.pl: Czyli to nie jest zaniedbanie, to dobrze, że takie inicjatywy nie są ani państwowe, ani nie są inicjatywą prywatnej firmy?

Sebastian: Nie. Pochodzimy ze środowisk biznesowych, dlatego wiemy czym są venture capital, czym są dotacje unijne, jednak chcemy celowo być niezależni. Prosimy państwo o wsparcie w formie PR, konferencji czy konsultacji. Ale co do zasady wolimy zbierać na

Patronite

i szukać sponsorów. Jak u sportowców: na plecach logo, setki firm, ale nikt nie mówi nam, jak trenować. Ale oczywiście mega cieszymy się, jak nasi wolontariusze zakładają swoje startupy, zaczynają prace w deeptechach bo rodzi nam to nowe partnerstwa, współpracę.

To jest liczba projektów które narodziły się na Ubuntu Linux, a ten narodził się na darmowym Linuxie, to tam jest moc:

donald.pl: A co myślisz o lękach społecznych dotyczących "sztucznej inteligencji"? Te wszystkie nagłówki o tym, że "AI zabierze pracę"?

Sebastian: Ja nie lubię nazwy sztuczna inteligencja, nienawidzę. Czy coś sztucznego zrobiło coś dobrego? Np. aspartan, sztuczny cukier.

donald.pl: Sztuczne biodro jest ok na przykład.

Sebastian: Sztuczne biodro jak i szczęka jest okej. ale kto chcę je mieć, jeżeli nie musi? Ale dobrze, w latach 60. niektórzy chcieli to nazwać "Augmented Intelligence", nawet literki byłyby takie same. No i właśnie, jak podchodzimy do sztucznej inteligencji i wdrażamy ją jako automatyzację, to mamy obniżkę kosztów i nic poza tym. Ale jak wdrażamy AI jako kolaboratywną, czyli wspomagającą to nagle mamy zwrot kosztów siedmiokrotny.

donald.pl: A dlaczego?

Sebastian: To jak człowiekiem i łopatą. Ma narzędzie, ale może mieć lepsze, na przykład koparkę. Wtedy znacznie szybciej i lepiej pracuje. Jednocześnie nie ma mowy o autonomicznej, inteligentnej koparce, która sama będzie uważała na rury i kable, odczytywała zagrożenia i umiała współpracować ze wszystkim, co się dzieje na budowie.

donald.pl: I to właśnie twoim zdaniem się stanie? Otrzymamy jakieś nowe moce?

Sebastian: Badania mówią, że jak np. wdrażamy ja jaką super moc dla nas, to nie spadają nie tylko koszty, ale rosną wartości biznesowe. Dlatego uważam, że teraz jest czas, kiedy technolodzy robią swoje, a mistrzowie od zarządzania powinni tworzyć nowe stanowiska pracy, łączyć zespoły, tworzyć nowe modele biznesowe. Rewolucja z internetem spowodowała narodziny nowych modeli biznesowych, a nie tylko obniżkę kosztów. Dlatego Spichlerz stara się tutaj też powalczyć, szukać modeli biznesowych z wydawcami. Ja np. pokazuję, jak wdrożyć AI w redakcji, ale nie po to, aby zredukować 10 osób do 2 osób, tylko bardziej zbudować zespół 12 osób + AI, który tworzy szybciej artykuły, które lepiej lojalizują, konwertują i sprzedają. Czyli żaden zarząd nie zwolni redaktorów, jak ich artykuły lepiej sprzedają się za paywallem.

donald.pl: Wracając jeszcze do pojęć, których nienawidzisz. Mamy dużo nieporozumień dotyczących tego, czym jest AI, LLM i agenci, czy podobnie nienawidzisz czegoś, co rysuje się na horyzoncie, czyli komputerów kwantowych?

Sebastian: Jest taka fajna okładka, tylko trochę się zestarzała. Trzeba skreślić AI i wstawić biznes, politics itp.

Co do komputerów kwantowych: Ostatnio zapytałem pewnego profesora, który obierał nagrodę za kwantowe technologie a ja za AI, czy już mogę szukać pracy i czy technologia kwantowa jest już dla informatyków czy wciąż dla fizyków. Odpowiedział, że wciąż dla fizyków, zatem nic mądrego nie powiem. Wstyd przyznać ostatni raz fizykę dotykałem na studiach z 30 lat temu.

donald.pl: Prosimy opanować ten wstyd. Można mieć dość różnych nieporozumień, pytań i reakcji. Od kiedy trwa szum wokół AI i Bielika, co cię zaskoczyło, ale pozytywnie?

Sebatian: Ja jestem dość długo w branży AI i jakoś żyłem w bańce, że tych specjalistów pionerów od LLM/SLM w Polsce jest mało. Nagle, jak tworzymy Bielika to bum, ludzie sami się uruchamiają, zgłaszają uwagi do kart projektu, nagle 3000 osób na Discordzie. Ci ludzie są poukrywani w firmach, gdzie robią czasami nudne prace IT, a wiedza wdrożeniowa z nich kipi.

donald.pl: A skąd się nagle wzięli i skąd mają tę wiedzę?

Sebastian: Musieli ją nabyć sami w nocy, poza firmą. To jest niesamowite! Myślę, że tu jest jakiś gen Polaka prawdziwego, który leczy się sam, buduje domy sam, ma ułańską fantazję i nie ma rzeczy niemożliwych, takie pozytywne „szwagier, potrzymaj mi piwo”. Zatem mamy najlepszych młodych naukowców na świecie z AI, patrz zespoły OpenAI czy Łukasz Kaiser który jest współautorem legendarnego artykułu

Attention Is All You Need

. Od nich się zaczęło i nagle mamy najlepszych wdrożeniowców i entuzjastów. No i jeszcze Cyfronet najlepsi specjaliści w Europie do superkomputerów zwłaszcza w obszarze trenowania LLM i SLM. No z nimi właśnie zaistniała taka mega synergia wiedzy! Po prostu open-science.

donald.pl: To na koniec zwyczajnie poprosimy o ulubione śmieszki i memy, mogą być mocno branżowe. No i powiedz, gdzie i jak dołączyć, żeby wam pomóc?

Sebastian: Dla mnie ważne śmieszki są z przesłaniem, czyli Attention Is All You Need.

Wielu startupców robiło przełomy, tak naprawdę używając ChatGPT. W Polsce startupowcy mają lepiej, mogą pobrać Bielika dostroić i stworzyć naprawdę przełomowe usługi. No i na koniec WSPIERAJCIE NAS! Dołączcie do naszego Discorda, bo ruszamy z projektem Sójka czyli można wieczorami klasyfikować groźne teksty które pomogą nam stworzyć model ochroniarza. Rusza też Obywatel Bielik, gdzie będziemy prosić o robienie i opisywanie zdjęć. Nie artystycznych tylko codziennych: krzesło, salceson, schabowy, rozwalający się dom, piękny zabytek lub ptaszka. To wszystko pomoże nam budować nowe modele, a Wam być w przełomowych projektach, gdzie z imienia i nazwiska, jeśli będzie chcieli, wymienimy Was w napisach końcowych.

donald.pl: To my dołączamy do zaproszenia, powodzenia i energii.

Hej, przypominamy tylko:

1. Szanujemy nawet ostrą dyskusję i wolność słowa, ale nie agresję. Przemocowe treści będą usuwane.

2. W komentarzach można swobodnie używać embedów z mediów społecznościowych.

3. Polecamy założenie konta, dzięki temu możesz zobaczyć wszystkie swoje dyskusje w jednym miejscu i dodać coś (👉 Sortownia), co trafi na stronę główną.

4. Jeżeli chcesz Donalda bez reklam, dołącz do naszych patronów: https://patronite.pl/donaldpl

STRONA GŁÓWNA »

Źródła:

1. https://www.youtube.com/watch?v=za4PcZUjiBc&fbclid=IwZXh0bgNhZW0CMTAAAR3mwYLjB5_xHAvAilFcZRf1UpovCw5a_yX0ORlezBlLIMB4y58AIlc0IHM_aem_g8A8dvuITT-T7y9_MF-hoghttps://www.youtube.com/watch?v=za4PcZUjiBc&fbclid=IwZXh0bgNhZW0CMTAAAR3mwYLjB5_xHAvAilFcZRf1UpovCw5a_yX0ORlezBlLIMB4y58AIlc0IHM_aem_g8A8dvuITT-T7y9_MF-hog

Polecane posty z Sortowni

NAJLEPSZE KOMENTARZE TYGODNIA

Powiązane artykuły

News

Nowe wiadomości

STRONA GŁÓWNA

Rozmawiamy z jednym z twórców Bielika, dlaczego warto trenować własne modele językowe, choćby małe

Hej, przypominamy tylko:

1. Szanujemy nawet ostrą dyskusję i wolność słowa, ale nie agresję. Przemocowe treści będą usuwane.

2. W komentarzach można swobodnie używać embedów z mediów społecznościowych.

3. Polecamy założenie konta, dzięki temu możesz zobaczyć wszystkie swoje dyskusje w jednym miejscu i dodać coś (👉 Sortownia), co trafi na stronę główną.

4. Jeżeli chcesz Donalda bez reklam, dołącz do naszych patronów: https://patronite.pl/donaldpl

Źródła:

Polecane posty z Sortowni

Co to za polskie kobiety i co to za impreza?

Jak zchałkowaliśmy internet, chociaż nie planowaliśmy

DeepSeek płakał, jak odpowiadał

Pierwszy na świecie polityczny zamach TikTokowy

Popularne dzisiaj

Sąd uznał Marine Le Pen za winną defraudacji milionów euro, może ją czekać urlop od polityki

Poznań: policjanci nie pomogli przechodniowi w zatrzymaniu złodzieja, bo w tym czasie zajadali się kebabem na cienkim

Bosak twierdzi, że Konfederacja nie chce zmiany prawa w zakresie aborcji, a Mentzen wygłasza tylko prywatne opinie

Chiński koncern obrażony na Polskę zrezygnował z produkcji w Tychach

Powiązane artykuły

Rosyjskie media skutecznie przenikają do chatbotów, które nie odróżniają propagandy od prawdy

W Poznaniu powstanie jedna z unijnych Fabryk AI

Posłanka Soin pokazała tajemniczy zjazd fanek Nawrockiego, milczy w sprawie szczegółów

News

W Berlinie utworzono specjalnie schronienie dla ofiar nieuczciwych szefów

Raport NFZ: liczba porodów znowu w dół, Polacy coraz rzadziej mają dzieci

Wenecja: mieszkańcy boją się ślubu Bezosa i potencjalnego paraliżu

Zakopane wśród wielu projektów białych misiów wybrało tego jednego, który będzie oficjalną maskotką

Arcelin: policjanci wezwani do dwóch porzuconych szczeniaków namierzyli jeszcze dwa i ogarnęli pomoc

Książenice: ksiądz proboszcz oburzony strażakami, którzy nie poświęcili nowego wozu