Maszyna wektorów nośnych

Algorytm klasyfikacji szukający granicy (hiperpłaszczyzny) najlepiej oddzielającej klasy z maksymalnym marginesem. Skuteczny także dla danych o wielu wymiarach.

Wariancja

Miara tego, jak mocno przewidywania modelu zmieniają się przy różnych zbiorach treningowych. Wysoka wariancja zwykle wskazuje na przeuczenie.

Stronniczość modelu

Systematyczne błędy w wynikach modelu wynikające ze skrzywionych danych treningowych lub wadliwych algorytmów. Może prowadzić do niesprawiedliwych decyzji.

Precyzja

Odsetek prawidłowych wskazań wśród wszystkich przypadków, które model uznał za pozytywne. Odpowiada na pytanie: gdy model mówi „tak”, jak często ma rację?

Macierz pomyłek

Tabela podsumowująca wyniki klasyfikatora w czterech kategoriach: trafienia i pomyłki dla klas pozytywnej i negatywnej. Podstawa do liczenia precyzji i czułości.

Zbiór walidacyjny

Zestaw danych używany w trakcie treningu do oceny, jak model uogólnia poza dane treningowe. Pomaga wykryć przeuczenie i dobrać hiperparametry.

Wnioskowanie

Etap użycia wytrenowanego modelu do generowania przewidywań lub wyników na nowych danych. To faza „działania” modelu po treningu.

Model wstępnie wytrenowany

Model nauczony wcześniej na dużym, ogólnym zbiorze danych, który można wykorzystać jako punkt wyjścia do dostrajania pod konkretne zadanie.

Wstrzykiwanie promptu

Podatność, w której atakujący manipuluje wejściem modelu, by skłonić go do niezamierzonych działań lub ujawnienia danych. Istotne zagrożenie bezpieczeństwa dla aplikacji opartych na LLM.

Osadzenie

Reprezentacja danych (np. słów lub obrazów) w postaci ciągłych wektorów liczbowych. Pozwala modelom uchwycić podobieństwo i relacje semantyczne między elementami.