На днях сотрудник Google Гэри Илш объяснил подробнее, что означает статус «Страница проиндексирована без контента» в отчете об индексировании в Search Console. По его словам, в большинстве случаев это связано с блокировкой страницы в robots.txt.
- Вопрос
Илша спросили, может ли такая ошибка возникать в результате длительного времени загрузки или таймаутов. При этом автор вопроса приложил скриншот с описанием этого статуса из Справки, где говорится, что он не связан с robots.txt:
«Страница есть в индексе Google, но поисковый робот не смог обработать ее содержание. Возможно, она замаскирована от Google или создана в неиндексируемом формате. Это не имеет отношения к блокировке доступа с помощью файла robots.txt».
- Ответ
Илш ответил, что в описанных случаях более вероятна ошибка soft 404.
Что касается статуса «Страница проиндексирована без контента», то он предназначен для тех страниц, которые заблокированы в robots.txt.
no, we would likely just not used those pages of they time out. maybe we'd report them as soft404, depending on whether they time out for Googlebot or rendering.
this error is really just for pages that are blocked by robots.txt— Gary 鯨理/경리 Illyes (@methode) March 20, 2021
Он также добавил, что это отличный вопрос.