GPU - Learning Zone

GPU (Graphics Processing Unit) to procesor graficzny — wyspecjalizowany układ zaprojektowany do wykonywania tysięcy prostych operacji jednocześnie. Pierwotnie odpowiadał za renderowanie obrazu (gry, grafika 3D, wyświetlanie pulpitu), ale dziś równie często liczy macierze do uczenia maszynowego, kopie kryptowalut czy symulacje fizyczne. Kluczowa różnica względem CPU: procesor centralny ma kilka–kilkanaście mocnych rdzeni do zadań sekwencyjnych, a GPU ma tysiące słabszych rdzeni do obliczeń równoległych (model SIMD — jedna instrukcja, wiele danych).

Jak to działa i do czego służy

Wyobraź sobie, że masz pomalować stadion. CPU to dwóch świetnych malarzy, GPU to tysiąc przeciętnych. Jeśli zadanie da się pociąć na niezależne kawałki — pixele, wektory, elementy macierzy — armia przeciętnych wygrywa z łatwością. Dlatego GPU błyszczy tam, gdzie te same działania powtarza się na ogromnych zbiorach danych: cieniowanie milionów pikseli na klatkę albo mnożenie macierzy w sieci neuronowej.

GPU ma też własną, szybką pamięć (VRAM — np. GDDR6 lub HBM), bo dostęp do danych musi nadążać za rdzeniami. To dlatego trenując model AI tak często upierasz się o liczbę gigabajtów VRAM — jeśli model się nie zmieści, w ogóle nie ruszysz. Renderowanie 3D, transkodowanie wideo, obliczenia naukowe (HPC) i deep learning to dziś naturalne środowisko tego układu.

Przykład z praktyki

Pracujesz nad modelem w PyTorchu na karcie NVIDIA. Najpierw sprawdzasz, czy system w ogóle widzi GPU:

nvidia-smi — pokazuje model karty, zużycie VRAM i temperaturę,
w kodzie: torch.cuda.is_available() zwraca True, a tensor przenosisz na kartę przez tensor.to("cuda").

Jeśli wykonasz mnożenie dużych macierzy na CPU, a potem to samo na GPU, różnica potrafi być kilkudziesięciokrotna. To nie magia — to po prostu te tysiące rdzeni robiące swoje.

Częste błędy i mity

Więcej rdzeni nie zawsze znaczy szybciej. Jeśli zadanie jest sekwencyjne (zależne krok po kroku), GPU nic nie pomoże — czasem będzie wolniejsze niż CPU. VRAM to nie RAM systemowy — to dwie osobne pule i błąd CUDA out of memory oznacza, że zabrakło tej pierwszej, nawet gdy masz wolne 32 GB w komputerze. Mit, że „GPU to tylko do gier”, obalił rynek AI: dziś centra danych kupują je głównie do obliczeń. Uważaj też na ekosystem — CUDA działa tylko na NVIDIA; przy AMD masz ROCm, a kod nie zawsze jest przenośny.

Pojęcia powiązane

CPU, CUDA, VRAM, równoległość (parallel computing), rendering, deep learning, TPU, sterowniki (drivers).