Yandex, öneri sistemleri için Yambda veri setini yayınladı
Yandex, müzik akış platformu Yandex Music’ten toplanan yaklaşık 5 milyar anonimleştirilmiş kullanıcı etkileşimini içeren yeni veri seti Yambda’yı kullanıma sundu.
Yandex, müzik akış platformu Yandex Music’teki yaklaşık 5 milyar anonimleştirilmiş kullanıcı etkileşimini içeren yeni veri seti Yambda’yı duyurdu. Bu veri seti, öneri sistemleri alanında dünyanın en büyük açık kaynaklı etkinlik verisi olarak dikkat çekiyor.
Yambda, 10 ay boyunca toplanan dinleme, beğenme ve beğenmeme gibi etkileşimleri içeriyor. Veriler; zaman damgaları, ses katıştırmaları ve organik keşif bilgileriyle birlikte sunularak öneri algoritmalarının gerçek dünya koşullarında test edilmesini mümkün kılıyor. Anonimleştirilmiş 1 milyon kullanıcı ve 9,3 milyon müzik parçasına dair detaylar, özellikle e-ticaret, sosyal medya ve kısa video platformları gibi alanlarda öneri modelleri geliştirenler için kritik bir kaynak sunuyor.
Yandex, Yambda’yı üç farklı büyüklükte (50M, 500M ve 5B etkinlik) Hugging Face üzerinden erişime açtı. Veri seti Apache Parquet formatında sunuluyor ve Spark, Hadoop, Pandas gibi sistemlerle uyumlu.
Yandex Öneri Sistemleri Başkanı Nikolai Savushkin, Yambda’nın hem akademiyi hem de sektörü bir araya getirdiğini ve öneri sistemlerinde inovasyonu hızlandıracağını belirtiyor.
Haber Kaynağı : 12punto
Çok Okunanlar
Bilal Erdoğan senaryosu Ankara’yı karıştırdı
Şamil Tayyar’dan gündeme oturacak Mehmet Akif Ersoy iddiası!
MASAK raporlarında gerçek ortaya çıktı
Eski Habertürk spikerinden Mehmet Akif Ersoy hakkında bomba iddialar!
Kastamonu'da ölü bulunan anne ve oğlunun otopsi raporu tamamlandı
'Karşılıklı gol bas, illaki gol yerim ben' mesajını atan kişi bakın kim çıktı?
Güllü'nün kızının yakalanmadan önceki son görüntüleri ortaya çıktı
Mehmet Akif Ersoy'un da aralarında olduğu 4 kişi tutuklandı
Silivri'ye yapılacak duruşma salonunun inşaatından ilk görüntüler
Manchester City, Real Madrid’i yendi: Şampiyonlar Ligi'nde günün sonuçları