Yandex, öneri sistemleri için Yambda veri setini yayınladı
Yandex, müzik akış platformu Yandex Music’ten toplanan yaklaşık 5 milyar anonimleştirilmiş kullanıcı etkileşimini içeren yeni veri seti Yambda’yı kullanıma sundu.
Yandex, müzik akış platformu Yandex Music’teki yaklaşık 5 milyar anonimleştirilmiş kullanıcı etkileşimini içeren yeni veri seti Yambda’yı duyurdu. Bu veri seti, öneri sistemleri alanında dünyanın en büyük açık kaynaklı etkinlik verisi olarak dikkat çekiyor.
Yambda, 10 ay boyunca toplanan dinleme, beğenme ve beğenmeme gibi etkileşimleri içeriyor. Veriler; zaman damgaları, ses katıştırmaları ve organik keşif bilgileriyle birlikte sunularak öneri algoritmalarının gerçek dünya koşullarında test edilmesini mümkün kılıyor. Anonimleştirilmiş 1 milyon kullanıcı ve 9,3 milyon müzik parçasına dair detaylar, özellikle e-ticaret, sosyal medya ve kısa video platformları gibi alanlarda öneri modelleri geliştirenler için kritik bir kaynak sunuyor.
Yandex, Yambda’yı üç farklı büyüklükte (50M, 500M ve 5B etkinlik) Hugging Face üzerinden erişime açtı. Veri seti Apache Parquet formatında sunuluyor ve Spark, Hadoop, Pandas gibi sistemlerle uyumlu.
Yandex Öneri Sistemleri Başkanı Nikolai Savushkin, Yambda’nın hem akademiyi hem de sektörü bir araya getirdiğini ve öneri sistemlerinde inovasyonu hızlandıracağını belirtiyor.
Haber Kaynağı : 12punto
Çok Okunanlar
İmamoğlu'nun reddi hakim talebi reddedildi
Bayram sonrası ikinci dalga kabine değişikliği kapıda
ABD destekli İsrail-İran savaşında 10. gün
İran’a saldıran Amerikan askerleri için de dua etmeyelim de!..
15 Temmuz’a ilişkin dehşet yeni iddialar!..
İran Savaşı ve küresel düzenin kırılma noktası
İsrail, uzun bir savaşa ne kadar dayanır?
Yurt dışında solcu, Türkiye’de sağcı olanlar
CHP Genel Başkanı Özel hakkında soruşturma açıldı
Hekimler ve neyi bilmediğini bilmek