Jak zbudować system rekomendacji produktów z AI? Praktyczny poradnik

Czym jest system rekomendacji i dlaczego warto go zastosować?

Wyobraź sobie sklep internetowy bez sekcji „klienci, którzy kupili ten produkt, kupili też…”. Brzmi nudno? Właśnie dlatego systemy rekomendacji są dziś wszechobecne — podpowiadają filmy na Netflixie, książki w Empiku i produkty na Amazonie. Działają jak sprytny doradca, który analizuje Twoje wybory i przewiduje, co jeszcze Cię zainteresuje.

To nie tylko wygoda dla użytkownika. AI rekomendacje napędzają sprzedaż, wydłużają czas spędzony na stronie i przywiązują klientów do marki. Badania (źródło: McKinsey) pokazują, że nawet 35% sprzedaży Amazonu pochodzi z rekomendacji. Podobnie Spotify czy YouTube — polecane treści to ich tajna broń.

Filtracja kolaboratywna — poleca na podstawie zachowań podobnych użytkowników.
Content-based — sugeruje na podstawie cech produktów i preferencji użytkownika.
Hybrydowe — miksuje oba powyższe, żeby wykorzystać ich mocne strony.

Hybrydowe — miksuje oba powyższe, żeby wykorzystać ich mocne strony.

Jakie dane są potrzebne do budowy systemu rekomendacji?

Dane użytkowników: identyfikatory, wiek, płeć, lokalizacja, zainteresowania.
Dane produktów: tytuł, opis, kategorie, tagi, cechy techniczne.
Interakcje: oceny (np. 1-5 gwiazdek), kliknięcia, zakupy, czas spędzony na stronie produktu.

Interakcje: oceny (np. 1-5 gwiazdek), kliknięcia, zakupy, czas spędzony na stronie produktu.

PRZECZYTAJ Jak zacząć naukę machine learning krok po kroku

Z reguły dane pochodzą z baz SQL, plików CSV, logów serwera czy narzędzi analitycznych. Do wstępnego czyszczenia i formatowania danych świetnie nada się pandas (Python) lub klasyczny SQL. Warto zadbać o normalizację danych i radzić sobie z brakami — np. przez imputację lub usuwanie niekompletnych rekordów.

Pamiętaj — jakość danych to jakość rekomendacji. Zły lub niepełny zbiór danych prowadzi do nietrafionych sugestii. Typowy problem to tzw. zimny start, czyli nowy użytkownik lub produkt bez historii — na tym etapie warto łączyć różne typy rekomendacji.

Przegląd metod machine learning dla systemów rekomendacji

Filtracja kolaboratywna (user-based/item-based): szuka podobnych użytkowników lub produktów na podstawie historii interakcji.
Content-based: analizuje cechy produktów i preferencje użytkownika, np. poleca filmy z ulubionym aktorem.
Hybrydowe: łączy powyższe metody, aby poradzić sobie z zimnym startem i zwiększyć dokładność.

Hybrydowe: łączy powyższe metody, aby poradzić sobie z zimnym startem i zwiększyć dokładność.

Zaawansowane systemy wykorzystują embeddings (reprezentacje cech produktów/użytkowników w postaci wektorów), matrix factorization (rozkład macierzy) i deep learning (sieci neuronowe). To już wyższa szkoła jazdy — ale spokojnie, zaraz pokażę Ci przykłady!

Matrix factorization na przykładzie ALS

Jedna z najpopularniejszych technik to matrix factorization (rozkład macierzy), szczególnie metoda Alternating Least Squares (ALS). Działa to mniej więcej tak: mamy wielką macierz użytkownicy-produkty (np. oceny filmów) i chcemy „wyciągnąć” z niej ukryte wzorce. Dzięki temu możemy przewidzieć, jak bardzo użytkownik polubi nowy produkt.

W Pythonie łatwo przetestować ALS z biblioteką implicit. Oto prosty przykład:

Parametrami factors, iterations i regularization możesz manipulować, by poprawić wyniki. Im więcej factors, tym bardziej szczegółowe „ukryte cechy” — ale rośnie ryzyko overfittingu.

Wykorzystanie modeli głębokich (deep learning)

Deep learning podbija świat rekomendacji. Możesz budować sieci neuronowe, które uczą się bardzo złożonych zależności w danych. Popularne są autoenkodery oraz modele z embeddingami (np. Neural Collaborative Filtering).

PRZECZYTAJ Etyka w AI – co powinien znać każdy programista sztucznej inteligencji

Przykład prostego autoenkodera w TensorFlow:

Zalety deep learningu? Radzi sobie z różnorodnymi danymi i potrafi „złapać” bardzo subtelne wzorce. Minusy? Spore wymagania sprzętowe, dłuższy czas uczenia i większe ryzyko nadmiernego dopasowania.

Krok po kroku: implementacja prostego systemu rekomendacji w Pythonie

Czas na praktykę! Zbudujemy mały system rekomendacji w Pythonie — krok po kroku.

Przygotowanie środowiska i bibliotek

pandas — analiza danych
scikit-learn — machine learning
implicit — matrix factorization
TensorFlow — deep learning

TensorFlow — deep learning

Import i analiza danych

Dla przykładu pobierz dane MovieLens (link). Załaduj oceny i cechy filmów:

Sprawdź braki, rozkład ocen, liczebność użytkowników i produktów.

Filtracja kolaboratywna item-based — przykład kodu

Najprostszy start: item-based collaborative filtering z scikit-learn.

Testowanie i ocena jakości rekomendacji

RMSE (Root Mean Square Error) — klasyka w regresji, mierzy różnicę między przewidywaniami a rzeczywistymi ocenami.
Precision@k i Recall@k — ile z rekomendowanych produktów faktycznie użytkownik polubił/kupił.

Precision@k i Recall@k — ile z rekomendowanych produktów faktycznie użytkownik polubił/kupił.

Dla precision/recall warto użyć sklearn.metrics lub frameworków jak Surprise.

Rozszerzenie o filtrowanie content-based

Chcesz, by system uwzględniał cechy produktów (np. gatunek filmu)? Zbuduj wektory cech na podstawie opisów lub tagów, a następnie licz ich podobieństwo. Przykład:

Możesz łączyć to podejście z filtracją kolaboratywną — i voilà, masz model hybrydowy!

Jak ocenić i poprawić system rekomendacji?

MAE (Mean Absolute Error)
RMSE
Precision@k, Recall@k
MAP (Mean Average Precision)

MAP (Mean Average Precision)

Do wiarygodnej oceny zawsze dziel dane na train/test (np. train_test_split z scikit-learn) albo użyj cross-validation. Pomaga to uniknąć overfittingu i sprawdzić, czy model nie „oszukuje”.

Typowe problemy to zimny start (nowy użytkownik/produkt bez historii), nadmierne dopasowanie oraz skala danych. Rozwiązania? Hybrydowe modele, regularizacja, lepsza inżynieria cech i optymalizacja parametrów (np. GridSearchCV).

PRZECZYTAJ Chatboty AI – jak zaprojektować skuteczną konwersację?

Do eksperymentów polecam frameworki takie jak Surprise, LensKit, LightFM. Pozwolą Ci szybko przetestować różne algorytmy i ocenić wyniki.

Podsumowanie i dalsze kroki w nauce systemów rekomendacji

Gratulacje! Po tej lekturze wiesz już, jak działa system rekomendacji, jakie są jego rodzaje i jak zbudować własny prototyp w Pythonie. Potrafisz korzystać zarówno z filtracji kolaboratywnej, jak i content-based, a także oceniać jakość predykcji.

Chcesz doskonalić umiejętności? Sięgnij po darmowe zbiory danych — np. MovieLens, Amazon Reviews czy Goodbooks-10k. Eksperymentuj z różnymi modelami, testuj metryki i baw się parametrami.

Kolejny krok? Zgłęb reinforcement learning w rekomendacjach, poznaj systemy rekomendacji w czasie rzeczywistym i dowiedz się, jak wdrażać je w produkcji (np. z pomocą chmury AWS lub GCP). AI rekomendacje to ekscytująca, przyszłościowa dziedzina — nie bój się eksperymentować, bo praktyka czyni mistrza!

Krzysztof Fronczak

Jak zbudować system rekomendacji produktów z AI? Praktyczny poradnik

Czym jest system rekomendacji i dlaczego warto go zastosować?

Jakie dane są potrzebne do budowy systemu rekomendacji?