Googlebot сканирует и индексирует первые 15 МБ контента на странице

Июн 27, 2022

В справочной документации Google, касающейся работы Googlebot, появился новый абзац с указанием ограничения по размеру сканируемого файла. Там указывается, что робот будет сканировать первые 15 МБ содержимого html-файла или поддерживаемого текстового файла:

«После первых 15 МБ файла Googlebot прекращает сканирование и рассматривает для индексации только первые 15 МБ контента».

Как сообщил представитель Google Джон Мюллер в своем Twitter-аккаунте, это касается только html-файла, другие элементы, такие как изображения, видео, CSS и JavaScript, извлекаются отдельно.

«Встроенные ресурсы/содержимое, извлеченное с помощью тегов IMG, не являются частью html-файла», – уточнил Мюллер.

Это означает, что контент страницы должен быть структурирован таким образом, чтобы поместить SEO-релевантную информацию в первые 15 МБ html-файла или поддерживаемого текстового файла. Это также означает, что изображения и видео по возможности должны быть сжаты, а не кодироваться непосредственно в html.

Проверить, какие части страницы видит и отображает поисковый робот Google можно при помощи инструмента проверки URL-адресов в Google Search Console.

Ранее, на прошлой неделе Google представил новый дизайн интерфейса Google News, который можно настроить под свои информационные потребности.

Источник: searchengines.guru

Продолжить чтение