Облачная платформа Yandex Cloud разработала библиотеку рекомендаций для работы с данными на разных этапах: от обработки и хранения до анализа и визуализации. Это набор практический руководств, код, документация, обучающие курсы, которые помогут компаниям быстрее и проще разрабатывать в облаке корпоративные хранилища данных, аналитические системы и не только. Data Platform Solution Library уже доступна на GitHub.
В библиотеке выложены рекомендации по работе в облаке с Data Warehouse (DWH) — хранилища, предназначенного для сбора и аналитической обработки исторических данных организации. С их помощью ИТ-специалисты компаний смогут реализовывать такие сценарии как охлаждение данных. Кроме этого, доступны решения для интеграции данных. Они помогают объединить данные из нескольких разрозненных источников и предоставить их в консолидированном виде конечным пользователям. Так, в библиотеке описаны сценарии переноса данных из Yandex Direct или аналитики данных из Яндекс Метрики.
По каждому сценарию для пользователей также доступны статьи, документация, обучающие материалы и вебинары для работы с данными в облаке. В будущем в библиотеке появятся рекомендации по машинному обучению, real-time аналитике, репликации баз данных и не только.
Яндекс последовательно публикует в открытом доступе свои технологии и обучающие материалы. Так, ранее компания выложила в опенсорс исходный код Метрики и код SDK AppMetrica, код системы управления базами данных YDB, платформу для работы с большими данными YTsaurus, а также фреймворк для создания высоконагруженных приложений userver.