Zbiór treningowy

Zestaw danych używany do nauki modelu. To na nim model dopasowuje swoje parametry.

Inżynieria cech

Proces tworzenia, doboru i przekształcania cech z surowych danych, by poprawić skuteczność modelu. Często decyduje o jakości całego rozwiązania.

Cecha

Mierzalna właściwość obserwacji wykorzystywana jako wejście modelu, np. rozmiar czy kolor. W tabeli odpowiada wartości w kolumnie.

Klastrowanie

Nienadzorowane grupowanie danych w zbiory podobnych elementów, bez wcześniej zdefiniowanych etykiet. Częste w analizie segmentów i wzorców.

Regresja

Zadanie przewidywania wartości ciągłej, takiej jak cena czy sprzedaż. W odróżnieniu od klasyfikacji nie zwraca kategorii, lecz liczbę.

Klasyfikacja

Zadanie przewidywania kategorii wyjściowej, np. czy e-mail to spam, czy nie. Może być binarna lub wieloklasowa.

Dostrajanie

Proces dalszego trenowania wstępnie nauczonego modelu na mniejszym, specjalistycznym zbiorze danych, aby poprawić jego skuteczność w konkretnym zadaniu.

Halucynacja

Zjawisko, gdy model (zwłaszcza językowy) generuje informacje fałszywe lub zmyślone, przedstawiając je z pełnym przekonaniem jak fakty.

Inżynieria promptów

Sztuka i praktyka formułowania skutecznych poleceń dla modeli AI, by uzyskać pożądane wyniki. Obejmuje dobór słów, kontekstu i struktury zapytania.

Prompt

Tekst wejściowy lub instrukcja podawana modelowi (zwłaszcza językowemu), aby uzyskać określoną odpowiedź. Jakość promptu mocno wpływa na wynik.