Aşağıdaki tarih aralığında yayınlanmış haberleri bul
Aşağıdaki tarih aralığında yayınlanmış haberleri bul
ve ve
ve ve
ve ve
Temizle
Euro
Arrow
34,9385
Dolar
Arrow
32,5064
İngiliz Sterlini
Arrow
40,8451
Altın
Arrow
2441,0000
BIST
Arrow
10.087

Seçim yanlılığı (Selection bias)

Bu yazımda, günlük hayatta çok sık karşılaştığımız bir durumdan, Seçim yanlılığı probleminden bahsetmek istiyorum. Bu yazıyı hazırlarken Fethi Tekyaygil’in Medyum’daki yazısından da yararlandım. 

Öncelikle seçim yanlılığı nasıl bir durumdur açıklayalım. Bir bölgede yaşayan farklı eğitim düzeylerinde insanlar olduğunu düşünelim. Diyelim ki bu insanların belirli bir siyasi görüş hakkında ne düşündüğünü öğrenmek istiyoruz. Herkese ulaşıp sorumuzu cevaplamalarını istersek bu çok zaman alan, maliyeti yüksek bir iş olur. Ayrıca bazı insanlara ulaşmak mümkün olmayabilir veya bazıları da cevap vermeyi kabul etmeyebilir. Bu durumda, herkese ulaşmak yerine içlerinden bir gruba ulaşıp onların görüşlerini almak genel olarak kabul gören bir yöntemdir. Burada dikkat edeceğimiz en önemli nokta, belirlediğimiz özellik (eğitim düzeyi) itibariyle bölgenin tamamını temsil edebilecek bir grup insan seçmeye çalışmaktır. Bu gruba örneklem adını veririz. Eğer örneklemin temsil yeteneği olmazsa seçtiklerimizde yanlı davranmışız demektir. 

Tekyaygil’in bahsettiği gibi seçim yanlılığı birçok farklı şekilde olabilir. Bunlardan ilki Kapsam Yanlılığıdır (Coverage Bias). Bu yanlılıkta veriler temsili bir şekilde seçilmemiştir. Örneğin, bu bölgedeki insanlar arasından sadece ilk, orta ve lise mezunlarına belirli bir siyasi görüş hakkında ne düşündüğünü sorarsak üniversite öğrencilerinin veya lisansüstü eğitim mezunlarının ne düşündüğünü sormazsak kapsam açısından yanlı davranmış oluruz. 

Bir diğer yanlılık çeşidi Yanıt Vermeme Yanlılığı veya Katılım Yanlılığı (Non-response Bias — Participation Bias) adını alır. Örneğin, sorularımızı yönelttiğimiz insanlar arasında cevap vermek istemeyenlerin genellikle okuma yazma bilmeyenler olduğunu bildiğimizi düşünelim. Eğer bu insanlar nasıl olsa cevap vermek istemiyor diye onları örnekleme hiç dahil etmezsek yanıt vermeme veya katılım yanlılığı dediğimiz hataya düşmüş oluruz. 

Üçüncü yanlılık çeşidi Örnekleme Yanlılığı (Sampling Bias) olarak isimlendirilir. Veri toplama aşamasında ortaya çıkabilecek bir yanlılık türüdür. Akademik çalışmalarda da rastlanır. Tesadüfilik veya rastgele seçim dediğimiz şartın sağlanamamasını ifade eder. Örneğin, söz konusu bölgede bir çarşı veya meydan, bir üniversite kampüsü ve bir de park alanı. Eğer biz sadece üniversite kampüsüne gidip sorularımızı yönelteceğimiz kişileri özellikle üniversite son sınıf öğrencileri arasından seçersek örnekleme seçilen kişilerin tesadüfi olarak seçilme olasılıklarını ortadan kaldırmış oluruz. Böylece verilen yanıtlar tüm bölgeyi temsil etme açısından güvenilir olmayacaktır. 

Akademik çalışmalarda da rastlanır demekle neyi kastettiğimi de açıklamak isterim. Üniversitede tez yazan öğrenciler veri toplamak için anket yapmak gerektiğinde genellikle en kolayından erişebilecekleri çevrelerine sorularını yöneltiyorlar. Hatta bu yönteme literatürde çok uygun bir ad da verilmiş. “Kolayda örnekleme” diyorlar. Tamam, hızlı veri toplama açısından iyi bir yöntem olabilir ama ya temsiliyet? Acaba seçtikleri örneklem asıl grubu yeterince temsil edebilecek özelliklere sahip mi? Eğer öyle değilse böyle bir örneklemden elde edilmiş verilerden çıkan sonuçlar da gerçeği yansıtmaz. Yani diyebiliriz ki “gerçeğe giden kestirme bir yol yoktur”.

Herhangi bir konuda sağlıklı bir karar verebilmek için daha pek çok kriteri gözetmek gerekir ama özellikle seçim yaparken bu bahsettiğim üç çeşit yanlılığı yapmamaya dikkat edersek daha güvenilir kararlar verebilmemiz mümkün olur.