SEO

Soft 404

Soft 404 - это состояние, при котором сервер возвращает HTTP 200 (OK), но Google анализирует содержимое страницы и решает, что страница фактически не существует. Страница открывается в браузере, однако Google исключает ее из результатов поиска и помечает как "Soft 404" в отчете о покрытии (Coverage) в Search Console.

Soft 404 - это состояние, при котором сервер возвращает HTTP 200 (OK), но Google анализирует содержимое страницы и решает, что страница фактически не существует. Страница открывается в браузере, однако Google исключает ее из результатов поиска и помечает как "Soft 404" в отчете о покрытии (Coverage) в Search Console.

Почему это важно

Soft 404 - это серая зона: "технически все в порядке, но катастрофа для SEO". Владельцы сайтов легко предполагают, что "страница загружается, значит, все хорошо", но Google не индексирует такие страницы и при этом не перестает тратить на них краулинговый бюджет, что снижает общую эффективность сканирования и индексации домена. При аудите крупных сайтов с помощью Ahrefs от 2 до 8% всех URL регулярно классифицируются как soft 404.

Soft 404 против Hard 404 против 200

СостояниеКод HTTPРешение GoogleОпыт пользователя
Обычная страница200ПроиндексированаКонтент есть
Hard 404404Удалена из индексаСтраница ошибки
Soft 404200Исключена из индексаТонкий или пустой контент

Явное указание Google: "Если страница не существует, возвращайте 404. Если она существует, отдавайте реальный контент". Soft 404 - это состояние, при котором не выполняется ни одно из условий.

Распространенные причины

Страницы товаров, которых нет в наличии: страницы интернет-магазина для снятых с продажи товаров, возвращающие сообщение в одну строку "недоступно" со статусом 200.

Пустые страницы результатов поиска: внутренний поиск, возвращающий текст "ничего не найдено" со статусом 200.

Тонкий контент: публикации, содержащие только заголовок и почти без основного текста, или всего одно изображение.

Отсутствующие редиректы: удаленные страницы, возвращающие текст "страница не найдена" со статусом 200 вместо настоящего 404.

Сбой рендеринга JavaScript: SPA, отдающие пустой <body> Googlebot до загрузки JS.

Контент за авторизацией: страницы, возвращающие текст "доступ запрещен" со статусом 200.

Разрастание шаблонов: тысячи страниц по регионам или категориям с практически одинаковым шаблоном и почти без уникального контента.

Как диагностировать

Отчет о покрытии в Search Console: вкладка "Исключено" напрямую помечает URL как "Soft 404".

Проверка URL: сравните то, как Google рендерит конкретный URL, с тем, что вы ожидаете увидеть.

Screaming Frog: фильтруйте по кодам ответа (Response Codes), чтобы найти страницы со статусом 200 и тонким контентом.

Матрица кода HTTP и длины контента: индивидуальные аудиты, которые помечают URL со статусом 200 и объемом текста ниже заданного порога.

Как исправить

Возвращайте настоящие 404: если страница не существует, настройте сервер на возврат 404 (или 410 для окончательного удаления). Это самое надежное решение.

301-редиректы: если у удаленной страницы есть ценные обратные ссылки, настройте 301-редирект на наиболее релевантную родительскую страницу, чтобы сохранить ссылочный вес.

Усильте контент: наполните тонкие страницы реальной пользой. Страницы товаров не в наличии могут включать рекомендации похожих товаров.

noindex: для страниц результатов внутреннего поиска или тонких комбинаций фильтров добавьте мета-тег noindex, чтобы Google их не учитывал.

Переход на SSR/SSG: если причина в задержке рендеринга JS, перейдите на серверный рендеринг.

Сократите шаблонные страницы: объедините или удалите автоматически сгенерированные тонкие страницы.

Источники: