Yandex, öneri sistemleri için Yambda veri setini yayınladı
Yandex, müzik akış platformu Yandex Music’ten toplanan yaklaşık 5 milyar anonimleştirilmiş kullanıcı etkileşimini içeren yeni veri seti Yambda’yı kullanıma sundu.
Yandex, müzik akış platformu Yandex Music’teki yaklaşık 5 milyar anonimleştirilmiş kullanıcı etkileşimini içeren yeni veri seti Yambda’yı duyurdu. Bu veri seti, öneri sistemleri alanında dünyanın en büyük açık kaynaklı etkinlik verisi olarak dikkat çekiyor.
Yambda, 10 ay boyunca toplanan dinleme, beğenme ve beğenmeme gibi etkileşimleri içeriyor. Veriler; zaman damgaları, ses katıştırmaları ve organik keşif bilgileriyle birlikte sunularak öneri algoritmalarının gerçek dünya koşullarında test edilmesini mümkün kılıyor. Anonimleştirilmiş 1 milyon kullanıcı ve 9,3 milyon müzik parçasına dair detaylar, özellikle e-ticaret, sosyal medya ve kısa video platformları gibi alanlarda öneri modelleri geliştirenler için kritik bir kaynak sunuyor.
Yandex, Yambda’yı üç farklı büyüklükte (50M, 500M ve 5B etkinlik) Hugging Face üzerinden erişime açtı. Veri seti Apache Parquet formatında sunuluyor ve Spark, Hadoop, Pandas gibi sistemlerle uyumlu.
Yandex Öneri Sistemleri Başkanı Nikolai Savushkin, Yambda’nın hem akademiyi hem de sektörü bir araya getirdiğini ve öneri sistemlerinde inovasyonu hızlandıracağını belirtiyor.
Haber Kaynağı : 12punto
Çok Okunanlar
Gazeteci Tuncay Mollaveisoğlu'ndan, Merdan Yanardağ için 'destek' istifası
Mutlak Butlan davası çöktü: Kararın ardından Gürsel Tekin konuştu!
Meral Akşener ile ilgili bomba kulis...
Türk Telekom’da yeni CEO Ebubekir Şahin oldu
Erdoğan sonrası için yarış tüm hızıyla devam ediyor
Gazeteler, İmamoğlu'na casusluk soruşturmasını nasıl gördü?
İmamoğlu'na casusluk soruşturmasıyla ilgili İBB iddiası!
Tamer Karadağlı için talimat geldi! Koltuğu sallanıyor
Şamil Tayyar, AKP'nin yeni torba yasa hazırlığına dair uyarıda bulundu
Verimlilik ve döviz kuru sorunu: Türkiye ve Japonya örneği