Algorytm optymalizacji, który iteracyjnie zmienia parametry modelu w kierunku najszybszego zmniejszania funkcji straty. Rozmiar kroku zależy od współczynnika uczenia.
Algorytm trenowania sieci neuronowych, który oblicza gradient funkcji straty względem wag i pozwala je korygować. To podstawa nauki w głębokich sieciach.
Sytuacja, gdy model za bardzo dopasowuje się do danych treningowych, ucząc się także szumu. Działa świetnie na danych treningowych, ale słabo na nowych.
Metoda, w której model wytrenowany do jednego zadania jest wykorzystywany jako punkt startowy dla innego. Pozwala oszczędzić dane i czas, korzystając z wcześniej nauczonych cech.
Paradygmat, w którym agent uczy się podejmować decyzje przez interakcję ze środowiskiem i otrzymywanie nagród lub kar. Celem jest maksymalizacja sumy nagród w czasie.
Szybka magistrala szeregowa do podłączania kart rozszerzeń, np. graficznych i dysków NVMe. Występuje w wariantach o różnej liczbie linii (x1, x4, x16).