伪装(Cloaking)
伪装(Cloaking)是一种黑帽 SEO 手段,它向搜索引擎爬虫呈现与人类访客所见不同的内容。它明确违反了 Google 的垃圾内容政策,一旦被发现,会面临最严厉的处罚。
伪装(Cloaking)是一种黑帽 SEO 手段,它向搜索引擎爬虫呈现与人类访客所见不同的内容。它明确违反了 Google 的垃圾内容政策,一旦被发现,会面临最严厉的处罚。
为什么重要
伪装破坏了搜索结果的完整性。当用户发现内容与他们从搜索结果中所预期的不符时,搜索体验便会崩溃。Google 将伪装与自动生成内容、抓取剽窃一同归类为"纯粹垃圾内容"(pure spam),属于最严重的违规类别。由于伪装需要刻意实施(不可能意外发生),相应的处罚也格外严厉。
运作原理
基于 IP 的伪装:检查访客的 IP 地址以识别搜索引擎爬虫。向机器人提供经关键词优化的内容,而向用户提供不同的内容(广告、无关页面)。
基于 User-Agent 的伪装:分析 HTTP User-Agent 头以判断访客是否为爬虫。实现起来更容易,但也更容易被检测。
基于 JavaScript 的伪装:利用爬虫有限的 JavaScript 执行能力。仅通过 JavaScript 渲染的内容,与 HTML 源代码中的内容有所不同。
伪装 vs 合法手段
并非所有"不同内容"都是伪装。
| 手段 | 是否合法? | 原因 |
|---|---|---|
| 地理定向内容(hreflang) | 是 | 对用户和爬虫采用相同逻辑 |
| 响应式移动端/桌面端 | 是 | 适配设备的展示,内容相同 |
| A/B 测试 | 是(需谨慎) | 必须遵守 Google 准则 |
| 仅向爬虫提供不同内容 | 否 — 属伪装 | 具有欺骗意图 |
| 采用 First Click Free 的付费墙 | 是 | Googlebot 通过经批准的方式访问 |
处罚
当 Google 检测到伪装时,会发出人工处置(manual action)。轻微情况会导致页面级别从排名中移除;严重情况则会导致整个域名被取消索引。要恢复,需要移除伪装、提交重新审核请求,然后等待,重建信任需要相当长的时间。
Sources: