Semalt.com 用 AI 生成 1000 万+ 虚假页面骗搜索流量, V2EX 内容遭严重滥用

This topic created in 183 days ago, the information mentioned may be changed or developed.

问题概述

通过 Google 搜索追踪发现，Semalt.com 正在运营一个大规模的 AI 驱动 SEO 欺诈系统. 该系统爬取 V2EX 等技术社区的内容, 使用 AI 生成虚假标题和描述, 然后通过 URL 参数注入到数百个客户网站中, 以劫持搜索引擎流量。

从 URL 中的序列号可以看出, 该系统已生成超过 1000 万个虚假页面.

追踪数据

2025-10-16: 识别号 1,226,522
2025-11-16: 识别号 9,956,398
2025-11-17: 识别号 10,070,497
月增长: 870 万页
生成速度: 日均 28 万页, 11 月加速到 40 万+ 页/天

验证方法

任何人都可以在 Google 搜索以下内容验证:

inurl:"?s-news" inurl:"2025-11" "v2ex" inurl:"?s-news" inurl:"2025-10" "v2ex"

工作原理

URL 模式

https://[域名]/?s-news-[识别号]-[日期]-[AI 垃圾标题]

运作流程

爬取内容 - Semalt 大量爬取 V2EX 页面 (包括用户个人资料页面)
AI 生成虚假新闻 - AI 被输入 V2EX 的页面信息, 被要求编写虚构的随机"新闻", 标题和描述尽可能吸引人. 例如:
- "WangSD Discontinues Tech Engagement After V2EX Membership Termination"
- "V2EX 用户 liuliancc 未能加入本站，未成为第 522760 号会员，时间早于 2020 年 12 月 7 日 20 时 37 分"
- "Innovative Personal News Briefing Systm Proposed by V2EX Member FFM"
- "V2EX Member Wang Shares Insights on MacBook Pro..."
参数注入 - 通过 URL query parameters 将生成的内容注入到客户网站
搜索引擎索引 - Google 索引这些页面, 将 AI 生成的欺骗性虚假标题和描述编入搜索结果
流量劫持 - 用户搜索 V2EX 相关内容时, 看到大量"神秘 V2EX 小新闻", 点击后被导向完全不相关的网站

搜索结果截图

Google 搜索 inurl:"?s-news" inurl:"2025-10" "v2ex"

Google 搜索 inurl:"?s-news" inurl:"2025-11" "v2ex"

甚至搜索我自己的 V2EX 用户名 "bOOOOc" 时, 都能找到使用 Semalt SEO 欺诈手法的网站. Google 搜索我的 V2EX 用户名

可以看到这些 AI 生成的虚假标题都含有 v2ex

实际的例子

以下是实际发现的虚假页面示例：

例 1：地方新闻网站

https://lufkindailynews.com/test/?s-news-7728932-2025-11-11-v2ex-userliuliancc...

标题声称: 报道 V2EX 用户 liuliancc 未能注册会员的"新闻"
实际内容: 美国 Lufkin 地方新闻网站，与 V2EX 毫无关系
虚构程度: 把注册失败的数据包装成新闻报道

例 2：伊朗通讯社

https://www.isna.ir/news/...?s-news-8218190-2025-11-12-member-of-v2ex-exploring...

标题声称: V2EX 会员在技术社区的贡献分析
实际内容: 伊朗通讯社关于恐怖袭击的波斯语新闻
欺骗性: URL 参数完全独立于页面实际内容

例 3：哥伦比亚大学

https://globalfreedomofexpression.columbia.edu/about/...?s-news-3135576...

标题声称: V2EX 用户技术交流分析
实际内容: 哥伦比亚大学言论自由项目页面
影响: 连大学网站也被利用

受影响的域名（部分）

初步发现涉及数百个域名，包括但不限于：

新闻媒体：

lufkindailynews.com （美国地方新闻）
24.kg （科技新闻）
isna.ir （伊朗国家通讯社）

教育机构：

globalfreedomofexpression.columbia.edu （哥伦比亚大学）
portal.ufgd.edu.br （巴西联邦大学）
jak.ppke.hu （匈牙利大学）

商业网站：

meeyland.com （越南房地产平台）
internet-bilet.ua （乌克兰票务网站）

其他：

这些网站是 Semalt 的付费客户，购买了其"autoSEO"或者"AIO Promotion"服务。但这些客户可能：

完全知情并接受这种黑帽手段
不完全了解 Semalt 的具体操作方式，以为是正规 SEO
只关心流量数字，不在乎来源和方式

AI 生成内容的展示

编造戏剧性事件
- 把"用户注销账号"编成"被开除并停止技术讨论"
- 例如："WangSD Dismissed from V2EX and Discontinues Tech Engagement"
把数据记录包装成新闻
- 将后台数据编成"独家报道"
- 例如："V2EX 用户 liuliancc 未能加入本站，未成为第 522760 号会员，时间早于 2020 年 12 月 7 日 20 时 37 分"
虚构创新提案
- 从关键词中提取，编造不存在的"重大创新"
- 例如："Innovative Personal News Briefing System Proposed by V2EX Member FFM"
普通求助变专家见解
- 把"救命，我的 MBP 坏了"包装成"资深用户专家分析"
- 例如："V2EX Member Wang Shares Insights on MacBook Pro Problems"

Semalt 将爬取的数据无差别地输入 LLM, 要求生成"吸引眼球的新闻", 完全不在乎内容的任何真实性.

为什么我认为是 Semalt.com

直接证据：重定向追踪

在测试这些虚假页面时, 发现点击某些页面会被重定向到以下域名:

这些域名直接指向 Semalt 及其关联服务. 其中 podbex.com 直接重定向至 semalt.com aio.com.ai 的其中一个 google chrome 浏览器扩展的开发者是"Semalt LLC" semalt.com/autoseo 是 Semalt 的自动化 SEO 服务页面, 正是生成这些虚假页面的产品.