Selection bias (Seçim Yanlılığı) nedir?

Bu yazının sponsoru da şu şarkı olsun. (Söylemedi.)

adnan

Bu yazının sponsoru da şu şarkı olsun. (Söylemedi.)
Okuma Süresi (Yaklaşık): 3 dakika

Seçim yanlılığı politik seçimleri akla getireceğinden ingilizcesi ile birlikte kullandım. Sanırım bu terim a/b testi yapanlar, analizleri yorumlayanlar, ahkam kesenler için en önemli terimlerden bir tanesi.

Selection bias (Seçim Yanlılığı) nedir?

Seçim yanlılığı, popülasyonla ilgili çıkarımlar yapmak amacıyla veri alt kümesi (örnekler) arasında gerçekleştirildiği durumu tanımlamak için kullanılan terimdir.

Ancak ortaya çıkan sonuç büyük ihtimalle yanlış olacaktır, daha doğrusu yanlı olduğundan yanlış olacaktır. Çünkü örnek veri grubu, veri grubunun tamamını oluşturmaz.

Peki işe yaramaz mı?

Aslında yarar. Verileri doğru şekilde (yani gerçekten rasgele ve mümkün olduğunca çok) toplamamızı bize hatırlatır.

Dijital ajanslar, ürün tasarlayıcıları, kullanıcı araştırmaları yapanlar bundan nasıl faydalanabilir?

Selection bias, verinin ne olduğunu değil ne olmadığını kendimize hatırlatmamız için güzel bir terimdir.

Örneğin, Instagram’da karşısınıza çıkan sizinle ilgili çıkan reklamlardan bazısını “bu reklamı gösterme, ilgimi çekmiyor” diye işaretleyen bir Instagram kullanıcıyı analiz ederken, “Hmm. Demek, işaretlemedikleri ilgisini çekiyor” diye yorumlayamazsınız.

Çünkü kısıtlı veri sadece işaretledikleri hakkındadır. İşaretlemedikleri reklama ilişkin elimizde veri yoktur. Üstteki veri kısıtlıdır. İşaretlemediği reklamı görüp görmediğini, yahut da görse de beğenip beğenmediği hakkında bir bilgi vermez.

Diğer bir hata da, işaretleme yapmış grubu genellemektir. Eğer bu reklamı gösterme, 25-34 yaşındaki bir erkek tarafından yapıldıysa, bu yine kısıtlı bir örnek grubudur, “erkekler bizim bu reklamımızı sevmiyor” diye belirlenemez. Görme saati, eğitim faktörü, kültür faktörü vb bir sürü terim işin içine girdiğinden bize sadece şunu hatırlatmakta kullanılır.

“Çok daha fazla örnek topla ve mümkün olduğunca rastgele örnek topla”

Mesela Confirmation Bias – Onay yanlılığı (Bir Seçim yanlılığı türü) bir seçim yanlılığı türüdür. İnsanların sadece mevcut inançlarını doğrulayan örnekleri hatırlama eğiliminde olduğu durumdur. Sadece onları hatırladığından kendini haklı çıkarmakta bunları kullanma hatasına düşer. Kadın erkek ilişkilerinde sıkça karşımıza çıkar.

Yayın yanlılığı, yayınlanmış akademik çalışmaların genellikle bir seçim yanlılığı içerdiği ve bunun bilim ve araştırmada tekrarlanabilirlik krizinin bir nedeni olarak ortaya çıktığı terimi ifade etmek için de kullanılır.

Üreticiler, kullanıcı araştırmaları yapanlar, Dijital ajanslar seçim yanlılığından nasıl kaçınabilir?

Belirttiğim gibi, verilere şüpheli yaklaşmak için bunu aklımıza getirmeliyiz.

Daha az hatalı hale getirmek için:

  • Popülasyonlardan alt grup seçerken rastgele yöntemler kullanmak.
  • Seçilen alt grupların anahtar özelliklerine göre büyük ölçüde popülasyona eşdeğer olmasını sağlamak (tipik olarak anahtar özellikler bilinmediği için bu yöntem ilkinden daha az bir korumadır).

 

Paylaşalım mı?