Internet ma problem ze „slopem”, a platformy o tym wiedzą. Narzędzia generatywne sprawiły, że banalne stało się tłoczenie nieskończonych wariacji tego samego niskiej jakości wideo, artykułu czy scamu — każda akurat na tyle inna, by prześliznąć się obok starych filtrów. Teraz zespół badaczy Google opublikował artykuł o tym, jak firma walczy z tym na skalę, i warto go przeczytać, nawet jeśli nigdy nie dotkniesz systemu moderacji. Bo granica, którą wyznacza — między „twórczym użyciem AI” a „wrogim slopem” — to ta sama granica, według której oceniany będzie każdy wydawca i każda firma.
Artykuł „Scalable Detection of Adversarial Synthetic Slop and Coordinated Media Abuse” (Google Research, 2026) opisuje wdrożony system S-CTS — Scalable Cluster Termination System. Jest pomyślany pod „internetowe platformy wideo”, a terminologia („kanały”) wyraźnie wskazuje na serwis typu YouTube, choć sam artykuł pozostaje ogólny.
Kluczowa zmiana: od postów do sieci
Najsprytniejsze nie jest tu AI — lecz na co AI patrzy. Tradycyjna moderacja ocenia treść post po poście. To właśnie tę słabość wykorzystuje skoordynowany spam: modele generatywne wypuszczają nieskończone unikalne wariacje funkcjonalnie identycznego śmiecia, więc żadne dwa kawałki się nie pokrywają, a filtry oparte na hashach przepuszczają je wszystkie.
S-CTS odwraca kąt. Zamiast pytać „czy to wideo jest syntetyczne?”, pyta „czy te konta zachowują się jak jeden operator uruchamiający skrypt generatywny?”. Poluje na klastry skoordynowanych kont — artykuł nazywa je „Generation Clusters”, grupy prawdopodobnie używające tego samego generatywnego API lub skryptu — przez dwa komponenty:
- Coordinated Bot-Net Detector (ΨA): wewnętrzne sygnały Google — wzorce użycia API, szeregi czasowe uploadów, pokrewieństwo kont (ta sama linia detekcji Sybil, co przeciw sieciom fałszywych kont).
- Synthetic Pattern Classifier (ΨC): dwuetapowy „Synthetic Content Rater”, który sprowadza klatki wideo, audio i transkrypty do zwięzłego streszczenia tekstowego (oznaczając np. szablonowe narracje i nieludzkie tempo uploadów), a potem każe LLM rozumować nad tym streszczeniem, a nie nad surowymi pikselami.
Ten LLM jest specjalizowany przez LoRA (Low-Rank Adaptation) i Automatic Prompt Optimization — artykuł nazywa to „AI łapie AI”. Praktyczny zysk to zwinność: adaptery LoRA potrzebują „o rzędy wielkości mniej etykiet” niż przetrenowanie pełnego modelu, więc system goni nowy syntetyczny trend w dni, a nie w kwartały.
Co Google naprawdę publikuje w liczbach
Tu opłaca się czytać artykuł, a nie nagłówek. Przez sześciomiesięczny okres bazowy Google raportuje zyski efektywności, a nie efektowne liczniki banów:
- −50% czasu obróbki review treści syntetycznych w porównaniu z ludźmi;
- −32% czasu walidacji klastrów;
- „skrajnie niski wskaźnik fałszywie pozytywnych” (podane jakościowo, bez liczby);
- dla automatycznego egzekwowania precyzja trzymana wysoko — 92–95%, podczas gdy automatyczne zatwierdzenia idą przy czułości do 96%, by odsunąć nieszkodliwą treść od ręcznego review.
Jeśli gdzieś widziałeś większe okrągłe liczby — wyliczenia „zlikwidowanych” kanałów czy klastrów — w samym artykule ich nie ma, więc je pominęliśmy i trzymamy się tego, co autorzy faktycznie opublikowali.
Granica, która ma znaczenie: kreatywność kontra slop
Najważniejsze dla reszty z nas to nie metryka, lecz decyzja projektowa. Google wprost wprowadza „mandat precyzji nad czułością” (precision-over-recall), by nie cenzurować legalnych twórców używających narzędzi AI. A wymóg „klastra” to celowy bezpiecznik: system celuje w skoordynowane sieci syntetycznego spamu, a nie w jedną osobę eksperymentującą z narzędziami generatywnymi.
Mówiąc wprost — użycie AI, by zrobić coś naprawdę użytecznego, nie jest tym, na co poluje. Farma niemal identycznych treści AI obliczona na zalanie filtrów jakości — owszem.
Uczciwe zastrzeżenia
Autorzy są przyjemnie szczerzy co do ograniczeń. Wykrywanie najnowszych modeli generatywnych (wymieniają Sorę i Kling) jest ograniczone „niedoborem dużych, oznaczonych zbiorów wrogich danych” — nie da się wiarygodnie wytrenować detektora na modelu, którego wyjścia ledwie skatalogowałeś. Zaznaczają też: kryptograficzny provenance — C2PA i watermarking Google DeepMind SynthID — to prawdziwy „złoty standard”, ale dopóki nie stanie się powszechny i odporny na manipulację (przeciwnicy po prostu biorą modele bez niego albo zdzierają metadane), systemy detekcji takie jak ten pozostają prowizorką, a nie lekarstwem.
Co to znaczy, jeśli publikujesz treści
Nie prowadzisz botnetu — więc czemu cię to obchodzi? Bo ta sama logika rozlewa się po powierzchniach Google. Poprzeczka jakości dla treści maszynowych rośnie, a sygnały odróżniające „warte pokazania” od „slopu” stają się ostrzejsze:
- AI do pomocy — w porządku; AI-na-skalę-bez-treści — nie. Wyróżnia cię oryginalna substancja — twoje doświadczenie, twoje dane, twój punkt widzenia. O tym samym pisaliśmy w analizie wskazówki Google „dobre SEO to dobre GEO”.
- Flagują za wzorce, nie za pojedyncze kawałki. Szablonowa, niemal zduplikowana treść w nieludzkim tempie to dokładnie ten ślad, który te systemy mają wyłapywać.
- Provenance nadchodzi. Jeśli publikujesz media AI, czysty provenance (i to, że go nie zdzierasz) coraz bardziej będzie sygnałem zaufania, a nie miłym dodatkiem.
Nic z tego nie jest powodem, by unikać narzędzi AI. To powód, by używać ich tam, gdzie naprawdę dodają wartość — pomagając żywemu człowiekowi powiedzieć coś prawdziwego — i przestać traktować „więcej treści” jako strategię samą w sobie.
Źródła
- Abhinav Mathur, Claire Liu, Kelvin Tan, Yifei Liu i in. (Google). „Scalable Detection of Adversarial Synthetic Slop and Coordinated Media Abuse: A LoRA-Enabled Multimodal Defense System”. Google Research, 2026. https://research.google/pubs/scalable-detection-of-adversarial-synthetic-slop-and-coordinated-media-abuse-a-lora-enabled-multimodal-defense-system/
- Pełny tekst (PDF): https://storage.googleapis.com/gweb-research2023-media/pubtools/1039291.pdf
- Wspomniane standardy: C2PA (Coalition for Content Provenance and Authenticity); watermarking Google DeepMind SynthID.