В справочной документации Google, касающейся работы Googlebot, появился новый абзац с указанием ограничения по размеру сканируемого файла. Там указывается, что робот будет сканировать первые 15 МБ содержимого html-файла или поддерживаемого текстового файла:
«После первых 15 МБ файла Googlebot прекращает сканирование и рассматривает для индексации только первые 15 МБ контента».
Как сообщил представитель Google Джон Мюллер в своем Twitter-аккаунте, это касается только html-файла, другие элементы, такие как изображения, видео, CSS и JavaScript, извлекаются отдельно.
«Встроенные ресурсы/содержимое, извлеченное с помощью тегов IMG, не являются частью html-файла», – уточнил Мюллер.
Это означает, что контент страницы должен быть структурирован таким образом, чтобы поместить SEO-релевантную информацию в первые 15 МБ html-файла или поддерживаемого текстового файла. Это также означает, что изображения и видео по возможности должны быть сжаты, а не кодироваться непосредственно в html.
Проверить, какие части страницы видит и отображает поисковый робот Google можно при помощи инструмента проверки URL-адресов в Google Search Console.
Ранее, на прошлой неделе Google представил новый дизайн интерфейса Google News, который можно настроить под свои информационные потребности.