Soft 404
Soft 404 - это состояние, при котором сервер возвращает HTTP 200 (OK), но Google анализирует содержимое страницы и решает, что страница фактически не существует. Страница открывается в браузере, однако Google исключает ее из результатов поиска и помечает как "Soft 404" в отчете о покрытии (Coverage) в Search Console.
Soft 404 - это состояние, при котором сервер возвращает HTTP 200 (OK), но Google анализирует содержимое страницы и решает, что страница фактически не существует. Страница открывается в браузере, однако Google исключает ее из результатов поиска и помечает как "Soft 404" в отчете о покрытии (Coverage) в Search Console.
Почему это важно
Soft 404 - это серая зона: "технически все в порядке, но катастрофа для SEO". Владельцы сайтов легко предполагают, что "страница загружается, значит, все хорошо", но Google не индексирует такие страницы и при этом не перестает тратить на них краулинговый бюджет, что снижает общую эффективность сканирования и индексации домена. При аудите крупных сайтов с помощью Ahrefs от 2 до 8% всех URL регулярно классифицируются как soft 404.
Soft 404 против Hard 404 против 200
| Состояние | Код HTTP | Решение Google | Опыт пользователя |
|---|---|---|---|
| Обычная страница | 200 | Проиндексирована | Контент есть |
| Hard 404 | 404 | Удалена из индекса | Страница ошибки |
| Soft 404 | 200 | Исключена из индекса | Тонкий или пустой контент |
Явное указание Google: "Если страница не существует, возвращайте 404. Если она существует, отдавайте реальный контент". Soft 404 - это состояние, при котором не выполняется ни одно из условий.
Распространенные причины
Страницы товаров, которых нет в наличии: страницы интернет-магазина для снятых с продажи товаров, возвращающие сообщение в одну строку "недоступно" со статусом 200.
Пустые страницы результатов поиска: внутренний поиск, возвращающий текст "ничего не найдено" со статусом 200.
Тонкий контент: публикации, содержащие только заголовок и почти без основного текста, или всего одно изображение.
Отсутствующие редиректы: удаленные страницы, возвращающие текст "страница не найдена" со статусом 200 вместо настоящего 404.
Сбой рендеринга JavaScript: SPA, отдающие пустой <body> Googlebot до загрузки JS.
Контент за авторизацией: страницы, возвращающие текст "доступ запрещен" со статусом 200.
Разрастание шаблонов: тысячи страниц по регионам или категориям с практически одинаковым шаблоном и почти без уникального контента.
Как диагностировать
Отчет о покрытии в Search Console: вкладка "Исключено" напрямую помечает URL как "Soft 404".
Проверка URL: сравните то, как Google рендерит конкретный URL, с тем, что вы ожидаете увидеть.
Screaming Frog: фильтруйте по кодам ответа (Response Codes), чтобы найти страницы со статусом 200 и тонким контентом.
Матрица кода HTTP и длины контента: индивидуальные аудиты, которые помечают URL со статусом 200 и объемом текста ниже заданного порога.
Как исправить
Возвращайте настоящие 404: если страница не существует, настройте сервер на возврат 404 (или 410 для окончательного удаления). Это самое надежное решение.
301-редиректы: если у удаленной страницы есть ценные обратные ссылки, настройте 301-редирект на наиболее релевантную родительскую страницу, чтобы сохранить ссылочный вес.
Усильте контент: наполните тонкие страницы реальной пользой. Страницы товаров не в наличии могут включать рекомендации похожих товаров.
noindex: для страниц результатов внутреннего поиска или тонких комбинаций фильтров добавьте мета-тег noindex, чтобы Google их не учитывал.
Переход на SSR/SSG: если причина в задержке рендеринга JS, перейдите на серверный рендеринг.
Сократите шаблонные страницы: объедините или удалите автоматически сгенерированные тонкие страницы.
Источники: