SEO

Карта сайта (Sitemap)

Карта сайта (Sitemap) - это структурированный файл, который предоставляет поисковым системам список URL для страниц, изображений, видео и другого контента на сайте. Она служит "картой", помогающей краулерам поисковых систем эффективнее исследовать и индексировать сайт.

Карта сайта (Sitemap) - это структурированный файл, который предоставляет поисковым системам список URL для страниц, изображений, видео и другого контента на сайте. Она служит "картой", помогающей краулерам поисковых систем эффективнее исследовать и индексировать сайт.

Почему это важно

Поисковые системы обнаруживают веб-страницы, переходя по ссылкам. Однако для недавно созданных страниц, глубоких страниц с недостаточным числом внутренних ссылок или крупномасштабных сайтов с сотнями тысяч страниц краулеры могут с трудом обнаруживать каждую страницу естественным образом. Карта сайта напрямую сообщает поисковым системам об этих страницах, повышая эффективность обхода и предотвращая пропуски индексации.

Карты сайта особенно необходимы в следующих сценариях:

  • Крупномасштабные сайты с 500 и более страницами
  • Новые сайты с очень малым числом внешних обратных ссылок
  • Сайты с обилием медиаконтента, такого как изображения и видео
  • Новостные сайты, где контент часто обновляется

Карта сайта - это подсказка для обнаружения и повторного обхода, а не гарантия индексации. Google может обойти URL из карты сайта и всё равно решить не индексировать его из-за качества, дублирования, выбора канонической версии, директив noindex или проблем с рендерингом.

Типы

Карты сайта бывают нескольких типов в зависимости от назначения:

XML-карта сайта: Самый базовый и широко используемый формат. Она структурирует URL и метаданные каждой страницы с помощью тегов, таких как <url>, <loc> и <lastmod>.

Карта изображений: Формат, который специально сообщает поисковым системам об изображениях. Полезен, когда вы хотите максимизировать видимость в поиске по изображениям.

Карта видео: Включает метаданные, такие как заголовок, описание и продолжительность видеоконтента, чтобы помочь Google лучше понимать ваши видео.

Новостная карта сайта: Специализированный формат для новостных издателей, который должен включать только статьи, опубликованные за последние 2 дня.

Индекс карт сайта: Когда один файл карты сайта превышает 50 000 URL или 50 МБ, несколько карт сайта группируются и управляются через один индексный файл.

HTML-карта сайта: Карта сайта, предназначенная для пользователей, а не для поисковых систем. Это страница, которая собирает ссылки на ключевые страницы сайта, повышая удобство навигации.

Руководство по настройке

Шаг 1 - Сгенерируйте карту сайта

Существует три способа генерации карты сайта. Первый - использовать встроенные функции или плагины CMS либо фреймворка (например, Yoast SEO для WordPress). Второй - сгенерировать автоматически с помощью инструментов обхода, таких как Screaming Frog. Третий - написать XML-файл вручную, что подходит для небольших сайтов.

Шаг 2 - Соблюдайте обязательные правила

  • Держите число URL на файл на уровне 50 000 или меньше, а размер файла - 50 МБ или меньше
  • Используйте кодировку UTF-8
  • Записывайте URL как абсолютные пути (например, https://example.com/page)
  • Включайте только канонические URL. Исключайте URL, которые перенаправляют или дублируют страницы
  • Используйте <lastmod> только тогда, когда временная метка отражает значимое изменение контента. Неточные временные метки могут заставить поисковые системы игнорировать этот сигнал.

Шаг 3 - Разверните и отправьте

Поместите файл карты сайта в корневой каталог сайта (например, https://example.com/sitemap.xml). Добавьте Sitemap: https://example.com/sitemap.xml в файл robots.txt и отправьте URL через меню "Файлы Sitemap" в Google Search Console.

Шаг 4 - Настройте автоматическое обновление

Настройте автоматическое обновление карты сайта при каждом добавлении, изменении или удалении контента. Используйте точные временные метки изменений в теге <lastmod>, чтобы побудить поисковые системы приоритетно повторно обходить изменённые страницы.

Для очень крупных сайтов разделяйте URL на логичные дочерние карты сайта, такие как посты, категории, изображения или видео, и ссылайтесь на них из индекса карт сайта. Bing и другие движки также могут поддерживать IndexNow для более быстрого обнаружения, но он должен дополнять, а не заменять чистую XML-карту сайта и внутренние ссылки.

Распространённые ошибки

Включение страниц с noindex в карту сайта: Добавление в карту сайта страниц с тегом noindex или страниц, заблокированных в robots.txt, посылает поисковым системам противоречивые сигналы. Включайте в карту сайта только те страницы, которые хотите проиндексировать.

Включение битых ссылок (404): Если URL удалённых страниц остаются в карте сайта, Google Search Console сообщит об ошибках "Отправленный URL не найден (404)". Регулярно проверяйте карту сайта и удаляйте недействительные URL.

Включение перенаправленных или неканонических URL: URL в карте сайта должны быть финальными каноническими адресами. Отправка старых URL, URL с параметрами отслеживания или альтернативных канонических версий тратит краулинговый бюджет и зашумляет диагностику.

Ошибки формата даты: Согласно исследованию SEMrush, примерно 62% ошибок XML-карт сайта связаны с проблемами формата даты. <lastmod> должен соответствовать формату W3C Datetime (например, 2026-03-17 или 2026-03-17T09:00:00+09:00).

Несогласованность формата URL: Смешивание https и http или www и без www может заставить поисковые системы трактовать одну и ту же страницу как разные сущности. Все URL в карте сайта должны использовать один согласованный формат.

Генерация карты сайта без её отправки: Даже если вы создадите файл карты сайта, но не отправите его в Google Search Console или Bing Webmaster Tools, поисковым системам может потребоваться значительное время, чтобы её обнаружить.

Источники:

Связанные посты inblog

Чем помогает inblog

inblog динамически генерирует XML-карты сайта, которые автоматически отражают публикацию и удаление постов.