Przetwarzanie języka naturalnego

Dział AI umożliwiający komputerom rozumienie, analizę i generowanie ludzkiego języka. Obejmuje m.in. tłumaczenie, analizę sentymentu i streszczanie tekstu.

Sztuczna inteligencja generatywna

Klasa modeli tworzących nowe treści — tekst, obrazy, audio czy wideo — przypominające dane, na których je trenowano. Uczy się wzorców i generuje nowe, statystycznie podobne wyniki.

Duży model językowy

Model oparty zwykle na architekturze transformer, trenowany na ogromnych zbiorach tekstu. Potrafi rozumieć i generować tekst zbliżony do ludzkiego.

LSTM

Rodzaj sieci rekurencyjnej z mechanizmem bramek pozwalającym zapamiętywać informacje przez długie sekwencje. Łagodzi problem zanikającego gradientu.

Dropout

Technika regularyzacji polegająca na losowym wyłączaniu części neuronów podczas treningu. Zmusza sieć do uczenia się bardziej odpornych reprezentacji.

Hiperparametr

Ustawienie modelu dobierane przed treningiem, np. współczynnik uczenia, liczba warstw czy głębokość drzewa. W przeciwieństwie do parametrów nie jest uczone z danych.

Epoka

Jedno pełne przejście algorytmu uczącego przez cały zbiór treningowy. Trening zwykle obejmuje wiele epok.

Funkcja straty

Miara różnicy między przewidywaniami modelu a prawdziwymi wartościami. Trening polega na minimalizowaniu tej funkcji.

Funkcja softmax

Funkcja przekształcająca wektor liczb w rozkład prawdopodobieństwa sumujący się do jedności. Stosowana w ostatniej warstwie klasyfikatorów wieloklasowych.

Funkcja aktywacji

Funkcja decydująca, jak silnie neuron przekazuje sygnał dalej, wprowadzająca nieliniowość do sieci. Przykłady to ReLU, sigmoida i tanh.