Duży model językowy

Model oparty zwykle na architekturze transformer, trenowany na ogromnych zbiorach tekstu. Potrafi rozumieć i generować tekst zbliżony do ludzkiego.

Duży model językowy (Large Language Model, LLM) to sieć neuronowa — najczęściej oparta na architekturze transformer (opisanej w pracy „Attention Is All You Need” z 2017 roku) — wytrenowana na gigantycznych zbiorach tekstu: stronach internetowych, książkach, kodzie, dokumentacji. Jej zadanie sprowadza się do jednej, zaskakująco prostej rzeczy: przewidzieć kolejny token (kawałek słowa) na podstawie tego, co było wcześniej. Z tego prostego mechanizmu, przeskalowanego do miliardów parametrów, wyłania się umiejętność rozumienia poleceń i generowania tekstu, który brzmi po ludzku.

Jak to działa i do czego się przydaje

Model nie „wie” niczego w ludzkim sensie — operuje na prawdopodobieństwach. Tekst tnie na tokeny, zamienia je na wektory liczb (embeddings), a mechanizm self-attention pozwala mu ważyć, które wcześniejsze słowa są istotne dla przewidzenia następnego. Trenowanie ma zwykle dwa etapy: pretraining (przewidywanie tokenów na surowym tekście) i fine-tuning / dostrajanie z udziałem ludzi (np. RLHF), które uczy model być pomocnym i grzecznym.

W praktyce LLM użyjesz do generowania i streszczania tekstu, tłumaczeń, klasyfikacji, pisania i wyjaśniania kodu, ekstrakcji danych z dokumentów czy budowy chatbotów. To dlatego stoją za narzędziami takimi jak ChatGPT, Claude czy GitHub Copilot.

Przykład z praktyki IT

Załóżmy, że masz katalog logów i chcesz szybkiego streszczenia błędów. Zamiast czytać wszystko ręcznie, odpalasz model przez API. Z poziomu terminala wygląda to mniej więcej tak:

curl https://api.openai.com/v1/chat/completions -H "Authorization: Bearer $OPENAI_API_KEY" -d '{"model":"gpt-4o","messages":[{"role":"user","content":"Streść te logi i wypisz błędy"}]}'

Dostajesz odpowiedź w JSON-ie, parsujesz pole z treścią i masz gotowy raport. Tę samą logikę wpinasz potem w skrypt CI, bota na Slacku albo własną aplikację.

Częste błędy i mity

  • Halucynacje. Model potrafi z pełnym przekonaniem wymyślić nieistniejącą funkcję czy źródło. Zawsze weryfikuj fakty — szczególnie liczby, nazwy bibliotek i daty.
  • „Im więcej parametrów, tym lepiej”. Niekoniecznie. Mniejszy, dobrze dostrojony model często bije większy w konkretnym zadaniu i jest tańszy.
  • Okno kontekstu nie jest nieskończone. Wrzucenie 200 stron PDF-a może przekroczyć limit tokenów albo po prostu „rozmyć” uwagę modelu.
  • Prywatność. Nie wklejaj sekretów ani danych klientów do publicznego API bez sprawdzenia warunków.

Pojęcia powiązane

Warto poznać też: transformer, token i tokenizacja, embeddings, self-attention, prompt engineering, fine-tuning, RAG (Retrieval-Augmented Generation), halucynacje oraz okno kontekstu.