Фасетная навигация
Фасетная навигация - это UI-паттерн, который позволяет пользователям сужать список контента, комбинируя фильтры и сортировки - категорию, тег, цену, порядок сортировки и так далее. Часто встречается на страницах категорий интернет-магазинов и на страницах тегов или фильтров блогов; она повышает удобство, но создаёт одну из сложнейших проблем технического SEO: взрывной рост числа URL.
Фасетная навигация - это UI-паттерн, который позволяет пользователям сужать список контента, комбинируя фильтры и сортировки - категорию, тег, цену, порядок сортировки и так далее. Часто встречается на страницах категорий интернет-магазинов и на страницах тегов или фильтров блогов; она повышает удобство, но создаёт одну из сложнейших проблем технического SEO: взрывной рост числа URL.
Почему это важно
Три фильтра по 5 вариантов каждый теоретически дают 5³ = 125 комбинаций URL. Добавьте больше фильтров - и вы получите десятки тысяч URL. Когда Googlebot обходит их все, вы получаете:
- Расход краулингового бюджета: ресурсы уходят на комбинации фильтров вместо реального контента (самих записей).
- Дублирование контента: один и тот же список записей повторяется под десятками URL сортировок и фильтров.
- Малосодержательный контент: комбинации фильтров с 0-2 результатами накапливаются в индексе.
- Размывание ссылочного веса: обратные ссылки попадают на URL с параметрами вместо канонических, рассеивая сигналы ранжирования.
Рекомендуемая обработка от Google
1. Индексируйте только ценные фасеты: разрешайте комбинации с реальным поисковым спросом (например, «итальянские рестораны в Сеуле») и блокируйте те, которые никто не ищет (например, «сортировка по убыванию цены»).
2. Каноническая нормализация: указывайте каноникал для семантически эквивалентных комбинаций на один представительный URL - например, /blog?tag=seo&sort=latest -> каноникал /blog?tag=seo.
3. Метатег noindex, follow: используйте <meta name="robots" content="noindex, follow"> на страницах фильтров, которые не хотите индексировать. Это блокирует индексацию, но всё равно позволяет Google переходить по внутренним ссылкам.
4. Disallow в robots.txt: для шаблонов URL, которые Googlebot должен полностью пропускать (?sort=, ?view=, ?utm=), заблокируйте их в robots.txt. Используйте это осторожно - это также блокирует сигналы ранжирования от внешних ссылок на эти URL.
5. Инструмента URL Parameters больше нет: Google закрыл инструмент URL Parameters в Search Console в 2022 году. Обработка параметров теперь зависит только от канонических тегов, meta robots и robots.txt.
6. rel="nofollow" на ссылках фильтров: применяйте nofollow к ссылкам фильтров, чтобы краулеры не переходили по ним. Агрессивно, но эффективно.
Что индексировать, а что блокировать
Разрешить индексацию:
- Основные страницы категорий и тегов, представляющие отдельную тему
- Комбинации фильтров с доказанным поисковым спросом
- Лендинги, обогащённые уникальными описаниями
Блокировать индексацию:
- URL порядка сортировки (
?sort=price_asc,?sort=date_desc) - URL количества элементов на странице (
?per_page=20) - URL результатов внутреннего поиска (
?q=...) - Страницы, комбинирующие 3 и более фильтров
- URL с параметрами сессий или отслеживания
Как диагностировать
- Отчёт о покрытии в Search Console: проверьте URL, помеченные как «Просканировано - в настоящее время не проиндексировано», на предмет злоупотребления параметрами.
- Сканирование сайта в Ahrefs / Screaming Frog: измерьте, сколько URL ваш сайт фактически открывает. Если их в 10 раз больше, чем вы ожидали, у вас проблема с фасетами.
- Анализ лог-файлов: посмотрите, какие шаблоны URL поглощают запросы Googlebot, чтобы диагностировать расход краулингового бюджета.
Источники: