«Яндекс» разместил в открытый доступ датасет для рекомендательных систем
Компания «Яндекс» предоставила доступ к массиву данных Yambda — одному из самых обширных в мире специализированных наборов для разработки и тестирования алгоритмических решений в области рекомендаций.
Yambda базируется на обезличенных данных, собранных сервисом «Яндекс Музыка». Этот массив предназначен для использования специалистами, исследователями и образовательными учреждениями, стремящимися усовершенствовать алгоритмы рекомендаций.
Доступны три версии Yambda: полная (5 миллиардов записей о взаимодействиях), средняя (500 миллионов) и малая (50 миллионов), что позволяет выбирать оптимальный объем данных в зависимости от конкретных задач и целей исследований.
Открытые данные включают агрегированные показатели прослушиваний, пользовательские оценки и метаданные музыкальных композиций. Конфиденциальность пользователей и защита их персональных данных гарантированы.
Yabama может быть использован для тестирования и оптимизации систем рекомендаций в различных сферах, таких как киноиндустрия, музыкальная индустрия, электронная коммерция, литература и другие. Эксперты подчеркивают, что доступ к таким данным способствует развитию научных исследований и привлекает молодых специалистов в области машинного обучения и анализа данных, пишет RS.