Карта сайта (Sitemap)
Карта сайта (Sitemap) - это структурированный файл, который предоставляет поисковым системам список URL для страниц, изображений, видео и другого контента на сайте. Она служит "картой", помогающей краулерам поисковых систем эффективнее исследовать и индексировать сайт.
Карта сайта (Sitemap) - это структурированный файл, который предоставляет поисковым системам список URL для страниц, изображений, видео и другого контента на сайте. Она служит "картой", помогающей краулерам поисковых систем эффективнее исследовать и индексировать сайт.
Почему это важно
Поисковые системы обнаруживают веб-страницы, переходя по ссылкам. Однако для недавно созданных страниц, глубоких страниц с недостаточным числом внутренних ссылок или крупномасштабных сайтов с сотнями тысяч страниц краулеры могут с трудом обнаруживать каждую страницу естественным образом. Карта сайта напрямую сообщает поисковым системам об этих страницах, повышая эффективность обхода и предотвращая пропуски индексации.
Карты сайта особенно необходимы в следующих сценариях:
- Крупномасштабные сайты с 500 и более страницами
- Новые сайты с очень малым числом внешних обратных ссылок
- Сайты с обилием медиаконтента, такого как изображения и видео
- Новостные сайты, где контент часто обновляется
Карта сайта - это подсказка для обнаружения и повторного обхода, а не гарантия индексации. Google может обойти URL из карты сайта и всё равно решить не индексировать его из-за качества, дублирования, выбора канонической версии, директив noindex или проблем с рендерингом.
Типы
Карты сайта бывают нескольких типов в зависимости от назначения:
XML-карта сайта: Самый базовый и широко используемый формат. Она структурирует URL и метаданные каждой страницы с помощью тегов, таких как <url>, <loc> и <lastmod>.
Карта изображений: Формат, который специально сообщает поисковым системам об изображениях. Полезен, когда вы хотите максимизировать видимость в поиске по изображениям.
Карта видео: Включает метаданные, такие как заголовок, описание и продолжительность видеоконтента, чтобы помочь Google лучше понимать ваши видео.
Новостная карта сайта: Специализированный формат для новостных издателей, который должен включать только статьи, опубликованные за последние 2 дня.
Индекс карт сайта: Когда один файл карты сайта превышает 50 000 URL или 50 МБ, несколько карт сайта группируются и управляются через один индексный файл.
HTML-карта сайта: Карта сайта, предназначенная для пользователей, а не для поисковых систем. Это страница, которая собирает ссылки на ключевые страницы сайта, повышая удобство навигации.
Руководство по настройке
Шаг 1 - Сгенерируйте карту сайта
Существует три способа генерации карты сайта. Первый - использовать встроенные функции или плагины CMS либо фреймворка (например, Yoast SEO для WordPress). Второй - сгенерировать автоматически с помощью инструментов обхода, таких как Screaming Frog. Третий - написать XML-файл вручную, что подходит для небольших сайтов.
Шаг 2 - Соблюдайте обязательные правила
- Держите число URL на файл на уровне 50 000 или меньше, а размер файла - 50 МБ или меньше
- Используйте кодировку UTF-8
- Записывайте URL как абсолютные пути (например,
https://example.com/page) - Включайте только канонические URL. Исключайте URL, которые перенаправляют или дублируют страницы
- Используйте
<lastmod>только тогда, когда временная метка отражает значимое изменение контента. Неточные временные метки могут заставить поисковые системы игнорировать этот сигнал.
Шаг 3 - Разверните и отправьте
Поместите файл карты сайта в корневой каталог сайта (например, https://example.com/sitemap.xml). Добавьте Sitemap: https://example.com/sitemap.xml в файл robots.txt и отправьте URL через меню "Файлы Sitemap" в Google Search Console.
Шаг 4 - Настройте автоматическое обновление
Настройте автоматическое обновление карты сайта при каждом добавлении, изменении или удалении контента. Используйте точные временные метки изменений в теге <lastmod>, чтобы побудить поисковые системы приоритетно повторно обходить изменённые страницы.
Для очень крупных сайтов разделяйте URL на логичные дочерние карты сайта, такие как посты, категории, изображения или видео, и ссылайтесь на них из индекса карт сайта. Bing и другие движки также могут поддерживать IndexNow для более быстрого обнаружения, но он должен дополнять, а не заменять чистую XML-карту сайта и внутренние ссылки.
Распространённые ошибки
Включение страниц с noindex в карту сайта: Добавление в карту сайта страниц с тегом noindex или страниц, заблокированных в robots.txt, посылает поисковым системам противоречивые сигналы. Включайте в карту сайта только те страницы, которые хотите проиндексировать.
Включение битых ссылок (404): Если URL удалённых страниц остаются в карте сайта, Google Search Console сообщит об ошибках "Отправленный URL не найден (404)". Регулярно проверяйте карту сайта и удаляйте недействительные URL.
Включение перенаправленных или неканонических URL: URL в карте сайта должны быть финальными каноническими адресами. Отправка старых URL, URL с параметрами отслеживания или альтернативных канонических версий тратит краулинговый бюджет и зашумляет диагностику.
Ошибки формата даты: Согласно исследованию SEMrush, примерно 62% ошибок XML-карт сайта связаны с проблемами формата даты. <lastmod> должен соответствовать формату W3C Datetime (например, 2026-03-17 или 2026-03-17T09:00:00+09:00).
Несогласованность формата URL: Смешивание https и http или www и без www может заставить поисковые системы трактовать одну и ту же страницу как разные сущности. Все URL в карте сайта должны использовать один согласованный формат.
Генерация карты сайта без её отправки: Даже если вы создадите файл карты сайта, но не отправите его в Google Search Console или Bing Webmaster Tools, поисковым системам может потребоваться значительное время, чтобы её обнаружить.
Источники:
- What Is a Sitemap | Google Search Central
- XML Sitemap: What It Is And How To Generate One - Semrush
- How to Create an XML Sitemap (and Submit It to Google) - Ahrefs
- IndexNow Documentation - Bing Webmaster Tools
Связанные посты inblog
Чем помогает inblog
inblog динамически генерирует XML-карты сайта, которые автоматически отражают публикацию и удаление постов.