Облачная платформа Yandex Cloud разработала библиотеку рекомендаций по работе с данными на разных этапах: от обработки и хранения до анализа и визуализации. Это сборник практических руководств, кода, документации и учебных курсов, которые помогут предприятиям быстро и легко создавать корпоративные хранилища данных, системы аналитики и многое другое в облаке. Библиотека решений Data Platform уже доступна на GitHub.
Библиотека содержит рекомендации по работе в облаке с Хранилищем данных (DWH) — репозиторием, предназначенным для сбора и аналитической обработки исторических данных организации. С их помощью ИТ-специалисты смогут реализовать такие сценарии, как охлаждение данных. Кроме того, доступны решения для интеграции данных. Они помогают объединить данные из нескольких разрозненных источников и доставить их в консолидированной форме конечным пользователям. Итак, в библиотеке описаны сценарии переноса данных из Яндекс Директ или анализа данных из Яндекс Метрики.
Для каждого сценария пользователи также имеют доступ к статьям, документации, обучающие материалы и вебинары по работе с данными в облаке. В будущем библиотека будет содержать рекомендации по машинному обучению, аналитике в реальном времени, репликации баз данных и многому другому.
Яндекс систематически выкладывает в открытый доступ свои технологии и образовательные материалы. Так, компания ранее выпустила с открытым исходным кодом Исходный код метрики и чтобы AppMetrica SDKзакодированный Системы управления базами данных YDBплатформа для работы с большими данными ЮЦауруса также фреймворк для создания высоконагруженных приложений пользователь.