Autoenkoder

Sieć neuronowa ucząca się kompresować dane do zwięzłej reprezentacji, a następnie je odtwarzać. Używana m.in. do redukcji wymiarów i wykrywania anomalii.

Generatywna sieć przeciwstawna

Architektura złożona z dwóch konkurujących sieci: generatora tworzącego dane i dyskryminatora oceniającego ich prawdziwość. Stosowana do generowania realistycznych obrazów.

K najbliższych sąsiadów

Prosty algorytm klasyfikujący nowy przykład na podstawie najczęstszej klasy wśród jego K najbliższych sąsiadów w danych. Nie wymaga osobnego etapu treningu.

K-średnich

Popularny algorytm klastrowania dzielący dane na K grup wokół wyznaczanych centrów (centroidów). Iteracyjnie przypisuje punkty i przelicza środki skupień.

Las losowy

Zespół wielu drzew decyzyjnych, których wyniki są łączone dla lepszej i stabilniejszej predykcji. Ogranicza przeuczenie pojedynczego drzewa.

Drzewo decyzyjne

Model podejmujący decyzje przez serię pytań dzielących dane według ich cech. Czytelny i łatwy do interpretacji, lecz podatny na przeuczenie.

Krzywa ROC

Wykres przedstawiający czułość względem odsetka fałszywych alarmów dla różnych progów decyzyjnych. Pole pod krzywą (AUC) ocenia jakość klasyfikatora.

Dokładność

Odsetek wszystkich poprawnych przewidywań modelu. Prosta miara, lecz myląca przy bardzo niezrównoważonych klasach.

Czułość

Odsetek rzeczywistych przypadków pozytywnych, które model poprawnie wykrył. Mówi, ilu prawdziwych pozytywów model nie przeoczył.

Zbiór testowy

Zestaw danych użyty po treningu do końcowej oceny modelu na danych, których wcześniej nie widział. Mierzy zdolność uogólniania.