5 月 30 日消息,俄羅斯搜索引擎巨頭 Yandex 昨日發布了世界上最大的音樂推薦系統開源數據集 Yambda,包含 47.9 億條匿名用戶的交互數據,旨在幫助開發者創建智能音樂服務。
Yandex 在十個月內收集了近 2800 萬 Yandex Music 月度用戶的數據,具體為用戶與 939 萬首歌曲的 47.9 億次交互,數據集包括聽眾對歌曲好惡的關鍵反饋,所有交互都帶有時間戳以提高準確度。


Yambda 在 Hugging Face 提供三種大小的數據集供自由下載:Yambda-5B(來自 100 萬名用戶的行為)、Yambda-500M(10 萬用戶)和 Yambda-50M(1 萬用戶)。其中規模最大的5B 數據集至少需要 85 GB 存儲空間。





京公網安備 11011402013531號