SEO

Фасетная навигация

Фасетная навигация - это UI-паттерн, который позволяет пользователям сужать список контента, комбинируя фильтры и сортировки - категорию, тег, цену, порядок сортировки и так далее. Часто встречается на страницах категорий интернет-магазинов и на страницах тегов или фильтров блогов; она повышает удобство, но создаёт одну из сложнейших проблем технического SEO: взрывной рост числа URL.

Фасетная навигация - это UI-паттерн, который позволяет пользователям сужать список контента, комбинируя фильтры и сортировки - категорию, тег, цену, порядок сортировки и так далее. Часто встречается на страницах категорий интернет-магазинов и на страницах тегов или фильтров блогов; она повышает удобство, но создаёт одну из сложнейших проблем технического SEO: взрывной рост числа URL.

Почему это важно

Три фильтра по 5 вариантов каждый теоретически дают 5³ = 125 комбинаций URL. Добавьте больше фильтров - и вы получите десятки тысяч URL. Когда Googlebot обходит их все, вы получаете:

Рекомендуемая обработка от Google

1. Индексируйте только ценные фасеты: разрешайте комбинации с реальным поисковым спросом (например, «итальянские рестораны в Сеуле») и блокируйте те, которые никто не ищет (например, «сортировка по убыванию цены»).

2. Каноническая нормализация: указывайте каноникал для семантически эквивалентных комбинаций на один представительный URL - например, /blog?tag=seo&sort=latest -> каноникал /blog?tag=seo.

3. Метатег noindex, follow: используйте <meta name="robots" content="noindex, follow"> на страницах фильтров, которые не хотите индексировать. Это блокирует индексацию, но всё равно позволяет Google переходить по внутренним ссылкам.

4. Disallow в robots.txt: для шаблонов URL, которые Googlebot должен полностью пропускать (?sort=, ?view=, ?utm=), заблокируйте их в robots.txt. Используйте это осторожно - это также блокирует сигналы ранжирования от внешних ссылок на эти URL.

5. Инструмента URL Parameters больше нет: Google закрыл инструмент URL Parameters в Search Console в 2022 году. Обработка параметров теперь зависит только от канонических тегов, meta robots и robots.txt.

6. rel="nofollow" на ссылках фильтров: применяйте nofollow к ссылкам фильтров, чтобы краулеры не переходили по ним. Агрессивно, но эффективно.

Что индексировать, а что блокировать

Разрешить индексацию:

  • Основные страницы категорий и тегов, представляющие отдельную тему
  • Комбинации фильтров с доказанным поисковым спросом
  • Лендинги, обогащённые уникальными описаниями

Блокировать индексацию:

  • URL порядка сортировки (?sort=price_asc, ?sort=date_desc)
  • URL количества элементов на странице (?per_page=20)
  • URL результатов внутреннего поиска (?q=...)
  • Страницы, комбинирующие 3 и более фильтров
  • URL с параметрами сессий или отслеживания

Как диагностировать

  • Отчёт о покрытии в Search Console: проверьте URL, помеченные как «Просканировано - в настоящее время не проиндексировано», на предмет злоупотребления параметрами.
  • Сканирование сайта в Ahrefs / Screaming Frog: измерьте, сколько URL ваш сайт фактически открывает. Если их в 10 раз больше, чем вы ожидали, у вас проблема с фасетами.
  • Анализ лог-файлов: посмотрите, какие шаблоны URL поглощают запросы Googlebot, чтобы диагностировать расход краулингового бюджета.

Источники: