Автоматизированные контент-фермы набирают обороты, паразитируя на крупных СМИ

В новом отчёте рассказывается о том, как фабрика ИИ-контента с сотнями сайтов зарабатывает на медиа-рекламе, в том числе всемирно известных брендов, мимикрируя под крупные СМИ. В следующий раз, когда будете читать новости спорта в Интернете, дважды проверьте URL, на котором находитесь… Рекомендация месяца: Telega.in — платформа нативных интеграций в Telegram-каналах. Проверенные вручную каналы и боты. […] Сообщение Автоматизированные контент-фермы набирают обороты, паразитируя на крупных СМИ появились сначала на Блог SEO-аспиранта.

Jan 20, 2025 - 10:29

Автоматизированные контент-фермы набирают обороты, паразитируя на крупных СМИ

В новом отчёте рассказывается о том, как фабрика ИИ-контента с сотнями сайтов зарабатывает на медиа-рекламе, в том числе всемирно известных брендов, мимикрируя под крупные СМИ.

В следующий раз, когда будете читать новости спорта в Интернете, дважды проверьте URL, на котором находитесь…

Рекомендация месяца: Telega.in — платформа нативных интеграций в Telegram-каналах. Проверенные вручную каналы и боты. Помогаем найти целевую аудиторию в Telegram и запускать эффективные интеграции.

Темпы роста ИИ-ферм удваиваются

Заголовок «Red Sox настоятельно рекомендовали отказаться от Алекса Брегмана в пользу суперзвезды за 427 миллионов долларов» выглядит достаточно обыденно, и на первый взгляд кажется, что он опубликован в BBC Sports. Но при ближайшем рассмотрении оказывается, что вы находитесь на подделке под названием «BBCSportss», а сам текст взят у Sports Illustrated.

В других местах на этом сайте вы также найдёте истории, которые не украдены напрямую у другого автора, а похожи на беспорядочный ремикс того, что написали разные спортивные блогеры, и, похоже, сгенерированы искусственным интеллектом.

BBCSportss: пример сайта из контент-фермы

DoubleVerify, платформа для отслеживания онлайн-рекламы и медиа-аналитики, недавно провела анализ группы из более чем 200 таких сайтов, наполненных смесью, сгенерированного искусственным интеллектом, контента и фрагментов новостных статей, взятых из реальных СМИ.

Согласно результатам анализа, эти проекты часто выбирали доменные имена и оформляли свои сайты так, чтобы они имитировали сайты известных медиа-брендов, включая ESPN, NBC, Fox, CBS и BBC. Многие из подделок выглядят, как легальные спортивные новости.

Представитель Sports Illustrated Пейдж Грэм:

Мы не одобряли контент «BBC Sportss», и он фактически является плагиатом.

Директор по маркетингу компании DoubleVerify, Дэн Сливяновски:

Мы видим, что скорость роста мошеннических схем удваивается или утраивается из года в год. Большая часть этих мошеннических схем направлена на то, чтобы боты потребляли контент, а не только создавали его, увеличивая количество просмотров страниц на сайтах, чтобы получить доход от рекламы, создавая видимость увеличения числа живых читателей.

Но DoubleVerify также заметили скачок в мошеннических схемах с использованием ИИ-ферм, в которых сети веб-сайтов наполняются контентом, созданным искусственным интеллектом, чтобы отнять реальных читателей и доходы от рекламы у реальных изданий.

Статистика сайта BBC Sportss из Similarweb

Выше на скриншоте – пример трафика одного из таких сайтов (причём, не самого выдающегося). 2,500 визитов в месяц – казалось бы, не так уж и много. Но представьте, что у вас таких сайтов 100. Получается уже 250,000 посетителей в месяц. А если сайтов 1,000…

И способов монетизации тут достаточно много: начиная с продажи ссылок на «перспективном, развивающемся СМИ» через различные биржи и заканчивая продажей самого сайта. Не говоря уже про CPA-партнёрки.

Группа вебмастеров «Синтетическое эхо»

DoubleVerify заметили, что группа, которую они называют «Синтетическое эхо», похоже, либо копирует контент с других сайтов, либо использует истории, сгенерированные искусственным интеллектом, либо сочетает и то, и другое.

Гилит Сапорта, руководитель отдела, исследующего мошенничество:

Это даже не фальшивые новости. Это просто случайный мусор.

Хотя это не единственная схема мошенничества, которую наблюдала Сапорта, она считает эту особенно примечательной тем, насколько очевидно взаимосвязаны многие из её составляющих элементов, часто перенося одни и те же варианты веб-дизайна с одного сайта на другой.

Другой пример: «NBC Sportz». Контент крадётся с других медиа-сайтов, переписывается настоящими людьми, с удалением всех первоначальных опознавательных знаков, и публикуется за авторством NBC Sportz.

Одним из сайтов, обманутых подобным образом, стал Detroit Free Press, который подтвердил, что не давал разрешения на перепечатку работ своих авторов.

Представитель Detroit Free Press, Ларк-Мари Антон:

Этот контент не был лицензирован Detroit Free Press и не представляет наш бренд или журналистику.

Компания планирует обратиться в суд.

Вот ещё два примера: NBCSport.co.uk и BBCSportss.co.uk. Тут все тексты сгенерированы искусственным интеллектом, что подтверждает выводы DoubleVerify.

Ни у NBCSport.co.uk, ни у BBCSportss.co.uk нет адреса электронной почты или другой контактной информации, связанной с ними. Как и NBC Sportz или сайт, имитирующий CBS News, они зарегистрированы через Namecheap.

Пример главной страницы сайта NBCSport.co.uk

Злоумышленники уже много лет пытаются использовать успешные СМИ, перепечатывая их работы без разрешения. Однако теперь инструменты искусственного интеллекта позволяют вариациям этой схемы распространяться с новой скоростью.

Гилит Сапорта:

Такой низкокачественный контент на самом деле не нов. Но его гораздо проще воспроизвести и масштабировать с помощью современных инструментов.

Количество ИИ-сайтов резко увеличивается из года в год с тех пор, как инструменты генеративного ИИ стали популярны в 2023 году. В феврале прошлого года компания NewsGuard, занимающаяся мониторингом СМИ, обнаружила 725 новостных и информационных сайтов, наполненных ИИ-контентом. К январю 2025 года она выявила не менее 1,150 таких сайтов.

Шувик Пол, главный операционный директор компании Copyleaks, занимающейся обнаружением ИИ:

Объём увеличился. Многие из них работают за границей и являются весьма скрытными, так что как за ними угнаться?

Крупные СМИ сами используют ИИ

Ещё больше рядового читателя СМИ запутывает тот факт, что крупные медиа-сайты экспериментируют с публикацией новостных статей, сгенерированных искусственным интеллектом.

Журнал Sports Illustrated сам публиковал сгенерированные искусственным интеллектом материалы, которые, по словам его материнской компании, были предоставлены третьей стороной.

В других случаях мошенники скупают домены СМИ, переживающих не лучшие времена, и возрождают их в качестве фабрик ИИ-контента, иногда заменяя ранее добротную журналистику роботизированной фигнёй.

Некоторые из этих сайтов уже вызывают путаницу в реальном мире: в октябре одна из компаний, занимающихся созданием SEO-контента, разместила сгенерированное искусственным интеллектом объявление о параде в честь Хэллоуина в Дублине (Ирландия). Несмотря на то, что такого мероприятия не планировалось, толпы людей пришли, ожидая праздника.

Некоторые из таких сайтов «приклеиваются» к фирменному стилю реальных изданий, чтобы продавать мусор. Это что-то вроде фишинга.

В некоторых случаях эти сайты, похоже, действительно занимаются фишингом. Один из сайтов, попавших в анализ DoubleVerify, был создан для имитации новостного канала Fox, базируясь в Нигерии. Он приветствует потенциальных читателей серией подозрительных всплывающих объявлений о продаже программного обеспечения.

Монетизация через рекламные сети

Хотя всплывающие окна выглядят, как обман, сайты из этой группы, похоже, неплохо зарабатывают на рекламе, которая размещается с помощью крупных автоматизированных инструментов, а не прямых отношений между конкретными сайтами и рекламодателями. Многие из них содержат множество баннеров, управляемых популярными рекламными сетями, такими как Criteo и Sharethrough.

Пример рекламного лендинга, куда попадает пользователь с контент-фермы

Отчёт DoubleVerify предполагает, что владельцы Синтетического Эха выбрали спорт в качестве одной из ведущих категорий контента именно потому, что он считается более безопасным для брендов, чем классические новости.

Во время мониторинга на этих сайтах появлялась реклама от ряда известных компаний, включая таких лидеров технологического рынка, как Asana и Oracle, крупного представителя электронной коммерции Net-A-Porter, гиганта косметической индустрии Sephora и курортной сети Kalahari Resorts.

Двойной удар по крупным СМИ

Во времена, когда доверие к СМИ резко упало, а доходы многих новостных изданий сократились, подобный тип ферм по производству контента является двойным ударом. Он загрязняет информационную экосистему хламом и ворованными материалами, а также отнимает доходы от рекламы у легальных производителей контента.

Сообщение Автоматизированные контент-фермы набирают обороты, паразитируя на крупных СМИ появились сначала на Блог SEO-аспиранта.