구글 색인이 안되는 이유와 빠른 인덱싱을 위해 해야할 일들 (2025년 ver)
inblog에서 블로그 포스트를 업로드를 하고 대시보드를 살펴보면 아래와 같이 “Not indexed” 라는 표시가 나오는 것을 확인할 수 있습니다.
그렇다면 구글 색인(인덱스)는 무엇인가요?
💡
색인(인덱스)란, 구글에서 웹페이지 정보를 수집하고 이를 구글 데이터베이스에 저장하여 검색 결과에 표시될 수 있도록 준비하는 과정입니다.
이 과정은 크게 세 단계로 나눌 수 있습니다.
크롤링
: 구글의 프로그램(크롤러)가 웹을 탐색하며 새로운 페이지를 발견합니다.색인(인덱스)
: 크롤러가 수집한 웹페이지의 콘텐츠, 이미지, 영상 등의 데이터를 분석하여 구글의 색인에 저장합니다.검색 결과 표시
: 사용자가 검색어를 입력하면, 구글은 색인에 저장된 데이터를 바탕으로 가장 관련성 높은 페이지를 검색 결과에 표시합니다.
따라서 구글에 색인된다는 것은, “해당 웹페이지가 구글 검색 결과에 나타날 수 있는 상태”가 된다는 것을 의미합니다. 색인되지 않은 페이지는 검색 결과에 노출되지 않으며, 색인은 검색엔진최적화(SEO) 작업의 가장 첫 발걸음이기도 합니다.
내 웹사이트 색인 여부는 어떻게 확인할 수 있나요?
크게 두가지 방법으로 색인 여부를 확인할 수 있습니다.
1. 구글 서치콘솔 을 통한 확인
구글 서치콘솔은 구글에서 무료로 제공하는 서비스로, 웹사이트 상태를 모니터링하고 관리 할 수 있습니다. (서치콘솔 활용법 살펴보기)
아래 그림과 같이 서치콘솔 상단에 색인 여부를 확인하고 싶은 웹사이트 URL을 입력합니다. (e.g. https://inblog.ai/blog/post)
만약 색인이 되었다면, 아래와 같은 화면이 나옵니다.
색인이 되지 않았다면, 아래와 같은 화면이 나옵니다.
2. “Site:” 명령어를 통한 확인
간단하게는 구글 검색창에 아래와 같이 검색하여 색인 결과를 확인할 수 있습니다.
site:https://inblog.ai/blog/post
만약 색인이 되었다면, 아래와 같은 화면이 나옵니다.
색인이 되지 않았다면, 아래와 같은 화면이 나옵니다.
물론 inblog 를 활용한다면, 대시보드에서 직접 확인할 수 있습니다 :)
색인이 되지 않은 페이지는 어떻게 색인 요청해야 하나요?
구글 서치콘솔에서 직접 색인 요청을 할 수 있습니다. 아래와 같이 색인 되지 않은 페이지는 “Request Indexing” 버튼을 통해 직접 색인 요청할 수 있습니다.
혹시 사이트맵을 들어보신 적 있으신가요? 없다면 이 링크를 클릭해주세요!
색인 요청을 했는데, 색인이 되지 않아요.. 이유가 무엇인가요?
색인 요청을 했는데, 색인이 되지 않은 이유는 여러가지가 있습니다.
신생 페이지일 경우
먼저, 웹사이트가 얼마 만들어지지 않은 신생 페이지일 경우, 구글 샌드박스를 의심해보는 것이 좋습니다. “구글 샌드박스(Google Sandbox)는 새로운 웹사이트가 구글 검색 결과에서 순위가 잘 나오지 않는 상황을 말합니다.” 자세한 내용은 구글 샌드박스 블로그 포스트를 참고해주세요.
서버 오류 (5xx)
서버 오류는 구글봇이 페이지를 크롤링하는 데 실패했음을 나타냅니다. 서버 과부하, 잘못된 PHP 코드, 또는 기타 서버 설정 문제로 인해 발생할 수 있습니다. 이를 해결하기 위해서는 서버 상태를 점검하고 문제가 일시적인지 확인한 후, 문제가 지속되면 서버 설정을 최적화하거나 캐싱 솔루션을 도입해 서버 부하를 줄여야 합니다.
페이지를 찾을 수 없는 오류 (404 오류)
페이지가 삭제되었거나 잘못된 링크로 인해 구글봇이 해당 페이지에 접근할 수 없을 때 발생합니다. 페이지가 삭제된 경우, 해당 URL을 사이트맵에서 제거하거나 301 리디렉션을 설정해야 합니다. 페이지가 존재하는 경우, 콘텐츠를 추가하고 모든 스크립트가 제대로 렌더링되는지 확인해야 합니다
noindex 태그 또는 robots.txt 파일에 의한 차단
페이지에 noindex
메타 태그가 있거나 robots.txt
파일에서 구글봇이 차단된 경우, 구글은 해당 페이지를 색인하지 않습니다. 이를 해결 하기 위해서는 noindex
태그를 제거하고, robots.txt
파일에서 구글봇 차단 규칙을 수정해야 합니다.
중복 콘텐츠 및 잘못된 캐노니컬 태그
캐노니컬 태그가 잘못 설정되면 구글이 잘못된 버전의 페이지를 색인할 수 있습니다. 이를 해결 하기 위해서는 올바른 캐노니컬 태그를 설정하고, 중복된 페이지가 하나의 URL로 통합되도록 해야 합니다.
신생 페이지를 제외한 오류들은 구글 서치콘솔에서 모두 확인할 수 있으며, 각 오류에 대한 해결책을 적용한 후 색인 요청을 다시 제출하는 것이 좋습니다.
물론 inblog 서비스는 이러한 오류가 발생하지 않습니다. 신생 페이지일 경우, 인내심을 갖고 고품질 콘텐츠를 제작하고 링크를 구축하는 데 집중하는 것이 중요합니다.
그렇다면, 색인이 더 빠르게 되기 위해 해야할 것이 있을까요?
색인이 빠르게 되기 위해 해볼 수 있는 것들은 크게 4가지가 있습니다. 다만 여기서 가장 중요한 것은 인내심을가지고 좋은 콘텐츠를 꾸준히 쌓는 것입니다. SEO는 6개월 정도 소요되는 오래 걸리는 작업이기 때문에, 초반 1~2달에는 고품질 콘텐츠를 정기적으로 쌓아가는 것이 중요합니다.
1. 사이트맵 제출
가장 기본적인 내용입니다. 사이트맵을 생성하고 구글 서치 콘솔에 제출하는 것이 중요합니다. 사이트맵은 검색 엔진이 웹사이트의 중요한 페이지를 쉽게 탐색하고 색인할 수 있도록 도와줍니다.
2. 내부 링크 (인터널 링크) 구축
이미 색인된 페이지를 통해 내부 링크를 구축하면 구글이 새로운 페이지를 더 빠르게 발견하고 색인할 수 있습니다. 특히 트래픽이 많은 페이지에서 새로운 페이지로 연결되는 링크를 추가하면 색인 속도가 빨라질 수 있습니다.
3. 양질의 백링크 구축
백링크는 구글 크롤러가 새로운 페이지를 더 빨리 발견하고 색인할 수 있도록 돕습니다. 특히, 양질의 백링크가 있는 경우, 크롤러는 해당 링크를 따라가면서 새로운 콘텐츠를 빠르게 탐색하고 색인할 가능성이 높아집니다. (파도타기 개념) 백링크가 있는 페이지는 검색 엔진이 더 자주 크롤링하므로, 페이지가 더 빨리 색인될 수 있습니다.
또한 백링크는 다른 웹사이트로부터의 "신뢰"로 간주되며, 이는 구글이 해당 페이지의 중요성과 신뢰성을 평가하는 데 중요한 역할을 합니다. 특히 권위 있는 사이트(e.g. 위키피다 등)로부터의 백링크는 검색 엔진이 해당 페이지를 더 신뢰하게 만들고, 이를 통해 색인 속도가 빨라질 수 있습니다.
이렇기 때문에 소셜 미디어(링크드인 등) 혹은 커뮤니티(디스콰이엇, 이오플래닛) 등에서 페이지를 홍보하는 것이 중요합니다. 홍보를 통해 트래픽을 유도하면 구글봇이 해당 페이지를 더 자주 방문하게 되어 색인 속도가 빨라집니다.
4. 정기적인 콘텐츠 업데이트 및 중복/저품질 콘텐츠 삭제
정기적으로 새로운 콘텐츠를 게시하면 구글이 사이트를 자주 크롤링하게 되어 색인 속도가 빨라집니다. 또한, 기존 콘텐츠를 최신화 업데이트하는 것도 유효한 방법입니다.
또한, 중복된 콘텐츠나 품질이 낮은 페이지는 구글의 크롤링 및 색인을 방해할 수 있으므로, 이러한 페이지를 삭제하거나 리디렉션 설정을 통해 해결해야 합니다.
이러한 방법을을 활용하면, 포스트를 빠르게 색인시킬 수 있습니다. 다만, 계속 염두해두어야 할 것은 양질의 콘텐츠를 작성하는 것입니다. (좋은 콘텐츠 예시 보기)
인사이트 받아보기