Wikipedia na celowniku — sztuczna inteligencja karmiona rosyjską propagandą z Wikimedii

Wikimedia Commons jako źródło danych treningowych dla AI

Modele językowe (LLM, czyli Large Language Models) potrzebują ogromnych zbiorów danych, żeby się czegokolwiek nauczyć. Wyobraź sobie, że uczysz się nowego języka — im więcej tekstów przeczytasz, tym lepiej go opanujesz. LLM działają analogicznie, tyle że przetwarzają miliardy dokumentów, obrazów i nagrań. Jednym z najważniejszych źródeł tych danych jest Wikimedia Commons — otwarte repozytorium multimediów powiązane z Wikipedią, gromadzące ponad 140 milionów plików na wolnych licencjach.

Problem polega na tym, że otwartość tego repozytorium — która jest jego największą zaletą — staje się jednocześnie wektorem ataku. Jak wykazał Marcin Żabiński, prezes Instytutu Technologii Społeczno-Politycznych „Kybernetes” i członek Rady Konsultacyjnej ds. Odporności na Dezinformację Międzynarodową przy MSZ, rosyjskie podmioty aktywnie zalewają Wikimedia Commons materiałami propagandowymi. A te materiały trafiają prosto do danych treningowych systemów AI.

Skala problemu — co znajdziesz, szukając „aneksji Krymu”

Żabiński podał konkretny przykład: wyszukując w Wikimedia Commons hasło „annexation of Crimea” po angielsku, z 51 wyników ponad 40 pochodzi z oficjalnej strony Prezydenta Federacji Rosyjskiej lub rosyjskiej telewizji „Niezależna Telewizja Sewastopol”. Dominują nagrania z wieców poparcia dla przyłączenia Krymu do Rosji, a w sekcji grafik — hasła Putina dotyczące polityki krymskiej i zdjęcia z podpisania traktatu akcesyjnego.

Co to oznacza w praktyce? Jeśli model AI trenuje się na takim zbiorze danych, buduje sobie obraz rzeczywistości, w którym aneksja Krymu to w 80% rosyjska narracja — wiece poparcia, oficjalne ceremonie, prorosyjskie komentarze. Ukraińska perspektywa — straty moralne i materialne, cierpienie ludności, złamanie prawa międzynarodowego — jest w tym zbiorze marginalnie reprezentowana.

PRZECZYTAJ Monitorowanie bezpieczeństwa w chmurze: narzędzia i praktyki AWS i Azure

Czym jest data poisoning i dlaczego powinno cię to obchodzić

Data poisoning (zatruwanie danych) to technika, w której atakujący celowo wprowadza zmanipulowane dane do zbiorów treningowych modelu AI. To nie jest atak na infrastrukturę w klasycznym rozumieniu — nikt nie łamie haseł ani nie exploituje podatności serwera. Zamiast tego manipuluje się tym, czego AI się uczy.

Mechanizm jest prosty:

Model AI pobiera dane z otwartych źródeł, w tym z Wikimedia Commons.
Jeśli w tych źródłach dominuje określona narracja, model ją internalizuje jako „wiedzę o świecie”.
Gdy użytkownik pyta model o dany temat, dostaje odpowiedź opartą na skrzywionym zbiorze danych.

Fundacja Wikimedia sama potwierdziła skalę zjawiska: od 2024 roku przepustowość wykorzystywana do pobierania treści multimedialnych z Commons wzrosła o 50%. Za tym wzrostem nie stali ludzie — odpowiadały za niego zautomatyzowane programy przeszukujące katalog obrazów i przesyłające je do modeli AI.

Multimodalność — nie chodzi już tylko o tekst

LLM to od dawna nie są wyłącznie modele tekstowe. Współczesne systemy AI są multimodalne — potrafią przetwarzać tekst, obraz, dźwięk i wideo jednocześnie. Jak wyjaśnił Żabiński, obsługa warstwy obrazów była jednym z najistotniejszych kroków w ewolucji modeli językowych. Większość nowoczesnych LLM dekoduje to, co znajduje się na obrazach, i na tej podstawie wnioskuje oraz generuje treści.

To oznacza, że propaganda wizualna — zdjęcia, infografiki, materiały wideo z oficjalnych rosyjskich źródeł — nie jest przez modele AI po prostu „przechowywana”. Jest interpretowana i włączana do bazy wiedzy modelu.

Metadane jako kolejny wektor ataku

Wikimedia Commons zbiera metadane przy każdym uploadowanym pliku: kto jest autorem, kiedy plik powstał, a przede wszystkim — krótki opis tego, co przedstawia obraz. Ten opis to gotowy punkt wejścia do manipulacji, bo wpływa bezpośrednio na to, jak model językowy interpretuje dany plik. Jeśli opis zdjęcia z aneksji Krymu przedstawia je jako „uroczystość zjednoczenia”, a nie „akt złamania prawa międzynarodowego” — model uczy się właśnie takiej interpretacji.

PRZECZYTAJ Jak wykrywać i usuwać malware z laptopa Windows – poradnik

Steganografia — ukryte instrukcje w obrazach

Żabiński zwrócił uwagę na jeszcze poważniejsze zagrożenie: steganografię. To technika ukrywania informacji wewnątrz plików multimedialnych. Ludzkie oko nie widzi różnicy między zwykłym zdjęciem a zdjęciem z ukrytym przekazem — ale model AI potrafi te informacje odczytać.

W kontekście LLM steganografia może służyć do osadzania w obrazach:

Instrukcji zmieniających zachowanie modelu — ukryty tekst nakazujący modelowi interpretować dane w określony sposób (technika znana jako prompt injection przez kanał wizualny).
Fałszywych kontekstów — dodatkowych informacji, które model traktuje jak fakty.
Triggerów aktywujących konkretne odpowiedzi — model zachowuje się normalnie, dopóki nie natrafi na określony wzorzec w obrazie.

To nie jest teoretyczne zagrożenie. Ataki typu adversarial prompt injection przez obrazy zostały wielokrotnie zademonstrowane w środowisku badawczym — wystarczy odpowiednio zmodyfikować piksele obrazu, żeby model „zobaczył” instrukcje niewidoczne dla człowieka.

Stanowisko Wikimedia — wolna licencja to nie propaganda

Stowarzyszenie Wikimedia Polska, zapytane przez PAP o ten problem, przedstawiło inne spojrzenie. Według nich przewaga rosyjskich materiałów przy hasłach takich jak „annexation of Crimea” wynika przede wszystkim z dostępności licencyjnej. Oficjalna strona Prezydenta Federacji Rosyjskiej publikuje materiały na licencji Creative Commons Attribution 4.0 International, co oznacza, że mogą być legalnie przesyłane na Wikimedia Commons. Wiele innych źródeł — w tym ukraińskich — nie udostępnia swoich materiałów na tak otwartych zasadach.

Wolontariusz Commons o nicku Cybularny wyjaśnił wprost: „Na Commons ładujemy te materiały zewnętrzne, które są udostępniane na akceptowalnej wolnej licencji, a skoro witryna prezydenta Federacji Rosyjskiej udostępnia wolne materiały, to my z nich korzystamy”. Stowarzyszenie podkreśliło, że przechowywanie pliku nie oznacza poparcia dla narracji instytucji, z której materiał pochodzi.

To ważne rozróżnienie — ale z perspektywy bezpieczeństwa AI nie zmienia sedna problemu. Model treningowy nie rozumie kontekstu licencyjnego. Widzi dane i uczy się na nich.

PRZECZYTAJ Zarządzanie hasłami: najlepsze praktyki i narzędzia

Co z tego wynika — perspektywa cyberbezpieczeństwa

Ten przypadek dobrze ilustruje szerszy problem w bezpieczeństwie systemów AI, który wykracza poza samą Wikimedia:

Supply chain attack na dane treningowe — atakujący nie musi włamywać się do OpenAI czy Google. Wystarczy, że zdominuje otwarte źródła danych, z których te firmy korzystają.
Brak mechanizmów weryfikacji — Wikimedia Commons nie została zaprojektowana z myślą o tym, że stanie się jednym z głównych źródeł wiedzy dla AI. Jej mechanizmy moderacji są dostosowane do potrzeb encyklopedii, nie do obrony przed operacjami informacyjnymi na skalę państwową.
Asymetria zasobów — podmioty państwowe (jak Rosja) mogą systematycznie i na dużą skalę zasilać otwarte repozytoria swoimi materiałami, podczas gdy społeczność wolontariuszy nie ma zasobów, żeby temu dorównać.

Żabiński ostrzegł, że problem rosyjskiej aktywności w repozytoriach Wikimedii nie jest jeszcze szeroko uświadomiony ani wśród badaczy, ani w opinii publicznej. Tymczasem skala tej aktywności będzie się nasilać — to tani i skuteczny sposób na kształtowanie tego, jak systemy AI „rozumieją” historię i geopolitykę.

Dla branży cybersecurity to sygnał, że bezpieczeństwo AI wymaga myślenia o integralności danych treningowych z taką samą powagą, z jaką traktujemy bezpieczeństwo kodu czy infrastruktury sieciowej. Modele językowe są tak wiarygodne, jak dane, na których zostały wytrenowane — a te dane coraz częściej stają się polem walki informacyjnej.