Yandex, öneri sistemleri için Yambda veri setini yayınladı
Yandex, müzik akış platformu Yandex Music’ten toplanan yaklaşık 5 milyar anonimleştirilmiş kullanıcı etkileşimini içeren yeni veri seti Yambda’yı kullanıma sundu.
Yandex, müzik akış platformu Yandex Music’teki yaklaşık 5 milyar anonimleştirilmiş kullanıcı etkileşimini içeren yeni veri seti Yambda’yı duyurdu. Bu veri seti, öneri sistemleri alanında dünyanın en büyük açık kaynaklı etkinlik verisi olarak dikkat çekiyor.
Yambda, 10 ay boyunca toplanan dinleme, beğenme ve beğenmeme gibi etkileşimleri içeriyor. Veriler; zaman damgaları, ses katıştırmaları ve organik keşif bilgileriyle birlikte sunularak öneri algoritmalarının gerçek dünya koşullarında test edilmesini mümkün kılıyor. Anonimleştirilmiş 1 milyon kullanıcı ve 9,3 milyon müzik parçasına dair detaylar, özellikle e-ticaret, sosyal medya ve kısa video platformları gibi alanlarda öneri modelleri geliştirenler için kritik bir kaynak sunuyor.
Yandex, Yambda’yı üç farklı büyüklükte (50M, 500M ve 5B etkinlik) Hugging Face üzerinden erişime açtı. Veri seti Apache Parquet formatında sunuluyor ve Spark, Hadoop, Pandas gibi sistemlerle uyumlu.
Yandex Öneri Sistemleri Başkanı Nikolai Savushkin, Yambda’nın hem akademiyi hem de sektörü bir araya getirdiğini ve öneri sistemlerinde inovasyonu hızlandıracağını belirtiyor.
Haber Kaynağı : 12punto
Çok Okunanlar
Müslüman olan Esposito: Hayatım tamamen değişti
İniş takımı arızalanan SunExpress uçağı paniğe neden oldu
AKP’li Cumhurbaşkanı Erdoğan hakkında suç duyurusunda bulunan üç avukata dava
Trump’ın açıklamaları, Suriye güçleri yarın Lübnan’a girecekmiş gibi yorumlandı
FSM Köprüsü'ndeki Amedspor bayrağına polis koruması
Deutsche Bank altın tahminini revize etti
Mersin’de havuza alınmama iddiasında tutuklama
Türkiye'nin mikrokosmosu
Özgür Özel'e yakın isimden istifa ve yeni parti çıkışı
Müslim Sarı’nın sözlerine Zeynel Emre’den sert yanıt