Google об индексации изображений, видео, аудио и AMP, а также заморозке запусков

0 0

Google опубликовал новый эпизод подкаста Search Off the Record.

В этом выпуске принял участие специальный гость – сотрудник поиска Паскаль Бечлер, который присоединился к трём постоянным участникам: Мартину Сплитту, Джону Мюллеру и Гэри Илшу.

Сотрудники Google обсуждали такие вопросы, как индексация изображений, видео, аудио и AMP, а также тайминг и заморозка запусков.

  • Индексация изображений

По словам Илша, Google использует совершенно другой механизм для индексации изображений.

Во время преобразования контента поисковик извлекает теги изображений, а затем передаёт URL картинок в специальный индексатор. Далее происходит некая «магия». На этом этапе Google, например, выполняет некоторый анализ или распознавание изображений.

Илш отметил, что этот процесс пока «несовершенный» и до конца не реализован, но данный механизм способен качественно выполнять базовые задачи.

  • Индексация аудио и видео

Затем Илш коротко прошёлся по индексации аудио и видеоконтента.

«Здесь мы также извлекаем видео или метаданные о видео. Это, опять же, очень специфичный формат, поскольку если изображение одно, то видео обычно включает порядка 20-40 изображений в секунду, которые нужно обработать для понимания того, что же происходит в этом видео».

Помимо этого, видео обычно включает аудиодорожку, которую также необходимо обработать, чтобы понять, о чём идёт в нём речь. Это непростая задача. Она выполняется тем же механизмом индексации, который используется для изображений, но в случае видео это становится на порядок сложнее.

  • Индексация AMP

AMP – это тот формат, который Google не индексирует, если на сайте есть каноническая версия страницы. Ускоренные мобильные страницы индексируются только в том случае, если они являются каноническими.

По сути, AMP – это лишь альтернативный формат, который Google показывает пользователям в результатах поиска.

Если же это отдельная, по сути, каноническая AMP-страница, то тогда Google будет обрабатывать её как HTML, и она будет индексироваться – так же, как обычная HTML-страница.

  • Web Stories

После этого Паскаль Бёрчлер рассказал подробнее о формате Web Stories, активно продвигаемом Google в последнее время.

  • Запуски в Google

В завершающей части выпуска сотрудник поиска Джон Мюллер объяснил, почему Google не может назвать точные даты для большинства своих запусков. В основном он говорил о запусках, связанных с Search Console.

Более того, в Google есть такое понятие как «заморозка запусков». Это может происходить, например, когда ответственные сотрудники находятся в отпуске – скажем, во время рождественских праздников. Для Google важно, чтобы, если что-то пойдёт не так, на месте были люди, которые смогут это «починить».

Что касается влияния этих «заморозок» на ранжирование, то процессы, касающиеся работы поиска, по большей части автоматизированные и алгоритмические. Поэтому, если в день Рождества в интернете произойдут изменения, то Google сможет их отобразить в результатах поиска.

Это значит, что Google может не запускать новые алгоритмы или другие функции в этот период, но система продолжает работать автоматически. Поэтому пользователи будут продолжать видеть изменения в поиске в это время, даже если Google не будет запускать никаких обновлений – просто потому, что интернет развивается и меняется всё время.

Прослушать новый выпуск целиком можно на странице.

Источник: searchengines.guru

Мы используем файлы cookie. Продолжив использование сайта, вы соглашаетесь с Политикой использования файлов cookie и Политикой конфиденциальности Принимаю

Privacy & Cookies Policy