404 页面
404 页面是服务器在所请求的 URL 不存在时返回的 HTTP 状态码(404 Not Found)。当浏览器或搜索引擎爬虫尝试访问某个特定 URL,而服务器无法找到对应页面时,它会以 404 状态作出响应,并告知访问者该页面不可用。
404 页面是服务器在所请求的 URL 不存在时返回的 HTTP 状态码(404 Not Found)。当浏览器或搜索引擎爬虫尝试访问某个特定 URL,而服务器无法找到对应页面时,它会以 404 状态作出响应,并告知访问者该页面不可用。
为什么它很重要
404 错误会打断访问者的浏览流程,并可能降低对网站的信任。Google 的 John Mueller 表示,404 响应不会直接损害网站的整体搜索排名。不过,返回 404 的单个页面会从搜索引擎的索引中移除。如果有外部网站链接到返回 404 的 URL,这些反向链接所携带的链接权重就会丢失,可能削弱网站的整体权威性。过多的 404 错误还可能向搜索引擎表明网站维护不善,因此定期监控和管理必不可少。
404 错误的常见成因
- 页面删除或 URL 变更:内容被移除或 URL 结构被更新,却未设置指向新位置的重定向。
- URL 输入错误:访问者手动输入了错误的地址,或外部网站链接到了拼写错误的 URL。
- 内部链接失效:站内链接指向了已不存在的页面,造成失效的链接路径。
- 服务器配置问题:在服务器迁移或域名变更期间,现有的 URL 路径未被正确映射到新位置。
- 过时的外部链接:其他网站链接到了此后已更改的 URL,但这些外部网站并未更新其链接。
SEO 影响
404 错误是一种标准的 HTTP 响应,用于告知搜索引擎某个 URL 不存在。Google 已明确表示,404 错误不会影响同一网站上其他页面的排名。不过,间接影响确实存在。第一,当带有反向链接的页面返回 404 时,这些反向链接的链接权重就会丢失。第二,爬虫反复访问 404 页面会浪费本可用于可索引内容的抓取预算。第三,落到 404 页面的访问者更可能跳出,这会对整体用户体验指标产生负面影响。需要注意的是,Google 不建议将所有 404 页面重定向到首页或通过 robots.txt 屏蔽它们,因为这两种做法都会妨碍它理解网站结构。
设计有效的自定义 404 页面
创建自定义 404 页面,而非依赖默认的服务器错误界面,可以显著改善用户体验。一个有效的自定义 404 页面应包含若干关键要素。它应清楚地传达所请求的页面未找到。保留网站的全局导航可让访问者轻松前往其他板块。提供搜索功能可让访问者找到他们想要的内容。展示热门文章或推荐内容链接有助于降低跳出率。至关重要的是,自定义 404 页面必须返回正确的 HTTP 404 状态码,而非 200 状态码,否则会形成令搜索引擎困惑的软 404。
404 与 410 的区别
404(Not Found)表示页面当前无法找到,而 410(Gone)则明确表明页面已被永久移除。搜索引擎会在一段时间后重新爬取 404 URL,但会将 410 URL 视为永久删除,并更快地将其从索引中移除。根据 Reboot Online 的一项实验,返回 410 状态码的 URL 被移出索引的速度大约比返回 404 的快三倍(平均 4 天对比 12 天)。当内容被有意移除且不存在替代页面时,使用 410 在抓取预算管理方面更高效。话虽如此,Google 的 John Mueller 指出,404 和 410 的处理在实践中非常相似,这意味着在大多数情况下使用 404 已经足够。
Sources:
相关 inblog 文章
inblog 如何提供帮助
inblog 会自动从站点地图中移除已删除的文章,并提供重定向管理功能,将 404 重新导向替代 URL。