Yandex, öneri sistemleri için Yambda veri setini yayınladı
Yandex, müzik akış platformu Yandex Music’ten toplanan yaklaşık 5 milyar anonimleştirilmiş kullanıcı etkileşimini içeren yeni veri seti Yambda’yı kullanıma sundu.

Yandex, müzik akış platformu Yandex Music’teki yaklaşık 5 milyar anonimleştirilmiş kullanıcı etkileşimini içeren yeni veri seti Yambda’yı duyurdu. Bu veri seti, öneri sistemleri alanında dünyanın en büyük açık kaynaklı etkinlik verisi olarak dikkat çekiyor.
Yambda, 10 ay boyunca toplanan dinleme, beğenme ve beğenmeme gibi etkileşimleri içeriyor. Veriler; zaman damgaları, ses katıştırmaları ve organik keşif bilgileriyle birlikte sunularak öneri algoritmalarının gerçek dünya koşullarında test edilmesini mümkün kılıyor. Anonimleştirilmiş 1 milyon kullanıcı ve 9,3 milyon müzik parçasına dair detaylar, özellikle e-ticaret, sosyal medya ve kısa video platformları gibi alanlarda öneri modelleri geliştirenler için kritik bir kaynak sunuyor.
Yandex, Yambda’yı üç farklı büyüklükte (50M, 500M ve 5B etkinlik) Hugging Face üzerinden erişime açtı. Veri seti Apache Parquet formatında sunuluyor ve Spark, Hadoop, Pandas gibi sistemlerle uyumlu.
Yandex Öneri Sistemleri Başkanı Nikolai Savushkin, Yambda’nın hem akademiyi hem de sektörü bir araya getirdiğini ve öneri sistemlerinde inovasyonu hızlandıracağını belirtiyor.
Haber Kaynağı : 12punto
Çok Okunanlar

Son genel seçim anketinde üçüncü parti değişti

Erdoğan yetkilerini devrediyor, kabinenin tamamı değişiyor: OHAL gündemde!

Transferde büyük derbi, Osimhen imzayı atıyor!

AKP'de şehir hastaneleri pişmanlığı

Nihal Candan'ın durumu kötüleşiyor

'Erdoğan’ın askerlik dosyasında diploma yok'

BEDAŞ 18 Haziran Çarşamba elektrik kesintisi yaşanacak ilçeleri sıraladı

İBB operasyonlarında tutuklanan bir kişi daha 'itirafçı' oldu

Beşiktaş'a play-off maçındaki olaylar nedeniyle para cezası

PKK elebaşı Öcalan'dan DEM Parti’ye mesaj
