2024년 5월, 구글 SEO 알고리즘 내부 문서 유출 정리

구글 알고리즘 유출이 큰 파장입니다. 관련 내용을 간단하게 정리했습니다.
Han Jang's avatar
May 30, 2024
2024년 5월, 구글 SEO 알고리즘 내부 문서 유출 정리

최근 구글 검색 알고리즘의 내부 문서가 유출되면서 SEO(검색 엔진 최적화) 커뮤니티와 업계 전반에 큰 파장을 일으키고 있습니다. 이 문서들은 구글의 검색 순위 결정 요소와 관련된 다양한 정보를 포함하고 있으며, 구글의 과거 발언과 상충되는 내용도 다수 포함되어 있습니다.

하지만 지금까지 저희가 잘 알고 있는 결론과 같습니다. 결국, 알고리즘 관계 없이 양질의 콘텐츠를 작성이 가장 중요합니다.

구글 SEO 알고리즘 유출 개요

1. 문서 유출 경위:

google algorithm docs leak

2. 문서 내용:

  • 문서에는 2,596개의 모듈과 14,014개의 속성이 포함되어 있으며, 이는 구글 검색 알고리즘의 다양한 요소를 설명합니다.

  • 클릭 데이터, 사용자 참여 지표, 크롬 브라우저 데이터 등이 검색 순위에 영향을 미친다는 내용이 포함되어 있습니다. 이는 구글이 과거에 공개적으로 부인했던 내용과 상충됩니다. (참고)

  • "siteAuthority"와 같은 도메인 권위 점수, "NavBoost"와 같은 클릭 기반 시스템, 새로운 사이트를 샌드박싱하는 "hostAge" 속성 등이 언급되어 있습니다. (참고)

3. 구글의 반응:

  • 구글은 문서의 진위 여부에 대해 초기에는 언급을 피했으나, 이후 문서가 실제 구글의 내부 문서임을 확인했습니다. 다만, 문서의 내용이 맥락에서 벗어나거나 오래된 정보일 수 있다고 경고했습니다. (참고)

4. SEO 커뮤니티의 반응:

  • SEO 전문가들은 문서의 내용이 흥미롭지만, 이를 바탕으로 SEO 전략을 급격히 변경하는 것은 신중해야 한다고 조언합니다.

  • 일부 전문가들은 문서가 구글의 실제 알고리즘을 반영하지 않으며, 단지 내부 API 문서일 뿐이라고 주장합니다. (참고)

구글 알고리즘 유출 요약

유출된 구글 검색 알고리즘 문서에서 드러난 사실들은 다음과 같습니다:

1. 클릭 데이터의 중요성

구글은 오랫동안 클릭 데이터를 검색 순위에 사용하지 않는다고 주장해왔습니다. 그러나 유출된 문서에 따르면, 클릭 데이터는 실제로 중요한 순위 결정 요소로 사용되고 있습니다. 예를 들어, 'goodClicks', 'badClicks', 'lastLongestClicks'와 같은 항목들이 포함되어 있습니다. (참고)

: 이는 사람들이 클릭하고 싶은 제목을 짓는 것이 중요하다는 것을 시사합니다.

2. 도메인 권위 (Domain Authority)

구글은 도메인 권위를 사용하지 않는다고 여러 차례 밝혔습니다. 그러나 문서에는 'siteAuthority'라는 항목이 포함되어 있어, 구글이 사이트 전체의 권위를 측정하고 이를 순위 결정에 사용하고 있음을 시사합니다. (참고)

: 이는 도메인 권위가 높을 수록 더 높은 구글 순위에 게재될 수 있음을 시사합니다.

3. 크롬 데이터의 사용

구글은 크롬 브라우저 데이터를 검색 순위에 사용하지 않는다고 주장해왔습니다. 그러나 유출된 문서에는 크롬 데이터를 포함한 여러 측정 항목이 포함되어 있습니다.

: 크롬 데이터를 웹사이트 품질을 평가하는데 사용될 수 있음을 시사합니다.

4. 신생 웹사이트 샌드박스

구글은 신생 웹사이트를 구글 샌드박스에 포함시키지 않는다고 밝혔습니다. 그러나 문서에는 'hostAge'라는 속성이 포함되어 있어, 신생 웹사이트를 샌드박스에 포함시키는 시스템이 존재함을 보여줍니다.

: 신생 페이지는 구글 색인부터 높은 SERP 순위에 페널티가 있을 수 있음을 시사합니다.

5. 사용자 경험 (UX)

구글은 사용자 경험이 검색 순위에 큰 영향을 미치지 않는다고 주장해왔습니다. 그러나 문서에는 클릭률(CTR)체류 시간(dwell time)과 같은 지표가 실제로 순위에 영향을 미친다는 내용이 포함되어 있습니다. (참고)

: 이는 여전히 퀄리티 있는 콘텐츠의 중요성을 역설합니다. 나무위키, 위키피디아가 검색엔진 상단에 노출되고 있음을 설명할 수 있습니다.

6. 저자 정보의 중요성

구글은 저자 정보가 검색 순위에 영향을 미치지 않는다고 밝혔습니다. 그러나 문서에는 구글이 페이지의 저자 데이터를 수집하고 이를 순위 결정에 사용하고 있음을 시사하는 내용이 포함되어 있습니다.

: 메타 태그의 author 데이터가 검색 순위에 영향을 미칠 수 있음을 시사합니다.

7. 콘텐츠 최신성

문서에는 구글이 콘텐츠의 최신성을 중요하게 여긴다는 내용이 포함되어 있습니다. 이는 구글이 콘텐츠의 최신성을 평가하고 이를 순위 결정에 반영한다는 것을 의미합니다. (참고)

: 아웃데이트된 콘텐츠를 지속적으로 업데이트 해야함을 시사합니다.

8. 링크의 중요성

링크 빌딩이 여전히 중요한 순위 결정 요소로 남아있다는 내용이 문서에 포함되어 있습니다. 링크의 다양성과 관련성이 중요한 역할을 한다는 점이 강조되었습니다.

: 구글은 논문 개념이 익숙한 스탠포드 대학원생들이 만든 서비스입니다. 여전히 양질의 백링크(인용)가 중요함을 시사합니다.

이러한 사실들은 구글의 공개적인 주장과 상충되며, SEO 전문가들에게 충격을 주고 있습니다. 물론 국내에서는 SEO 경쟁 강도가 높지 않기 때문에, 알고리즘 노출 여부와 상관 없이 좋은 품질의 콘텐츠를 작성하는 것이 가장 중요합니다.

결론 및 향후 전망

이번 유출 사건은 구글의 검색 알고리즘에 대한 투명성 문제를 다시 한 번 부각시켰습니다. 문서의 내용이 구글의 과거 발언과 상충되는 부분이 많아, 구글의 신뢰성에 대한 의문이 제기되고 있습니다. 그러나 SEO 전문가들은 여전히 고품질의 사용자 중심 콘텐츠를 제작하고, 실험과 테스트를 통해 최적화 전략을 지속적으로 개선하는 것이 중요하다고 강조합니다.

참고 문서

Share article
SEO, 인바운드 마케팅
인사이트 받아보기