SEO

404 페이지

404 페이지는 사용자가 요청한 URL이 서버에 존재하지 않을 때 반환되는 HTTP 상태 코드(404 Not Found)입니다. 브라우저나 검색 엔진 크롤러가 특정 URL에 접근했을 때, 해당 페이지를 찾을 수 없으면 서버는 404 응답을 보내고 사용자에게 페이지가 존재하지 않음을 알립니다.

404 페이지는 사용자가 요청한 URL이 서버에 존재하지 않을 때 반환되는 HTTP 상태 코드(404 Not Found)입니다. 브라우저나 검색 엔진 크롤러가 특정 URL에 접근했을 때, 해당 페이지를 찾을 수 없으면 서버는 404 응답을 보내고 사용자에게 페이지가 존재하지 않음을 알립니다.

왜 중요한가

404 에러는 방문자의 탐색 흐름을 중단시키고, 사이트에 대한 신뢰도를 떨어뜨릴 수 있습니다. Google의 John Mueller는 404 응답 자체가 사이트 전체의 검색 순위에 직접적으로 부정적인 영향을 미치지는 않는다고 밝혔지만, 404가 발생한 개별 페이지는 검색 엔진 인덱스에서 제거됩니다. 또한 외부 사이트에서 404 페이지로 연결되는 백링크가 있다면, 해당 링크가 전달하는 링크 자산(link equity)이 소실되어 사이트 전체의 권위가 약화될 수 있습니다. 과도하게 많은 404 에러는 사이트 관리 품질이 낮다는 신호로 해석될 수 있으므로, 정기적으로 모니터링하고 관리하는 것이 중요합니다.

404 에러의 원인

  1. 페이지 삭제 또는 URL 변경: 기존 콘텐츠를 삭제하거나 URL 구조를 변경하면서 리다이렉트를 설정하지 않은 경우 발생합니다.
  2. 잘못된 URL 입력: 사용자가 주소를 직접 입력할 때 오타가 발생하거나, 외부 사이트에서 잘못된 URL로 링크를 건 경우입니다.
  3. 내부 링크 오류: 사이트 내부에서 존재하지 않는 페이지로 연결하는 깨진 링크(broken link)가 남아 있는 경우입니다.
  4. 서버 설정 문제: 서버 이전이나 도메인 변경 과정에서 기존 URL 경로가 올바르게 매핑되지 않은 경우입니다.
  5. 외부 링크 변경: 다른 웹사이트에서 이미 링크한 URL이 변경되었으나 해당 사이트에서 업데이트하지 않은 경우입니다.

SEO에 미치는 영향

404 에러는 검색 엔진에 해당 URL이 존재하지 않음을 알리는 정상적인 HTTP 응답입니다. Google은 404가 사이트의 다른 페이지 순위에 직접 영향을 미치지 않는다고 명시하고 있습니다. 그러나 간접적인 영향은 존재합니다. 첫째, 백링크가 가리키는 페이지가 404를 반환하면 해당 링크의 자산이 손실됩니다. 둘째, 크롤러가 404 페이지를 반복적으로 방문하면 크롤링 예산(crawl budget)이 낭비될 수 있습니다. 셋째, 방문자가 404 페이지에 도달하면 이탈률이 높아지고, 사이트 전체의 사용자 경험 지표에 부정적인 영향을 줄 수 있습니다. 중요한 점은 모든 404를 무조건 홈페이지로 리다이렉트하거나 robots.txt로 차단하는 것은 Google이 사이트 구조를 이해하는 데 오히려 방해가 되므로 피해야 한다는 것입니다.

효과적인 커스텀 404 페이지 설계

기본 서버 오류 화면 대신 커스텀 404 페이지를 만들면 사용자 경험을 크게 개선할 수 있습니다. 효과적인 커스텀 404 페이지에는 다음 요소를 포함하는 것이 권장됩니다. 먼저, 요청한 페이지가 존재하지 않는다는 사실을 명확하게 안내해야 합니다. 사이트의 글로벌 내비게이션을 유지하여 사용자가 다른 페이지로 쉽게 이동할 수 있도록 해야 합니다. 검색 기능을 제공하면 사용자가 원하는 콘텐츠를 직접 찾을 수 있습니다. 인기 게시물이나 추천 콘텐츠 링크를 함께 노출하면 이탈률을 줄이는 데 도움이 됩니다. 단, 커스텀 404 페이지가 HTTP 200 상태 코드를 반환하는 소프트 404(soft 404)가 되지 않도록 반드시 HTTP 404 상태 코드를 올바르게 반환해야 합니다.

404 vs 410 차이

404(Not Found)는 페이지를 현재 찾을 수 없다는 의미이고, 410(Gone)은 페이지가 영구적으로 삭제되었다는 의미입니다. 검색 엔진은 404 URL을 일정 기간 후 다시 크롤링하지만, 410 URL은 영구 삭제로 판단하여 더 빠르게 인덱스에서 제거합니다. Reboot Online의 실험에 따르면, 410 상태 코드를 반환하는 URL은 404 대비 약 3배 빠르게 디인덱싱되었습니다(평균 4일 vs 12일). 의도적으로 콘텐츠를 삭제했고 대체 페이지가 없는 경우에는 410을 사용하는 것이 크롤링 예산 관리에 효율적입니다. 다만 Google의 John Mueller는 실질적으로 두 코드의 처리 방식이 매우 유사하므로, 대부분의 경우 404를 사용해도 충분하다고 언급한 바 있습니다.

관련 인블로그 게시물

inblog에서 활용하기

inblog는 삭제된 포스트에 대해 사이트맵에서 자동 제거하고, 리다이렉트 관리 기능으로 404 발생 시 대체 URL로 연결할 수 있습니다.