Son güncelleme:

Seçim yanlılığı politik seçimleri akla getireceğinden ingilizcesi ile birlikte kullandım. Sanırım bu terim a/b testi yapanlar, analizleri yorumlayanlar, ahkam kesenler için en önemli terimlerden bir tanesi.

Selection bias (Seçim Yanlılığı) nedir?

Seçim yanlılığı, popülasyonla ilgili çıkarımlar yapmak amacıyla veri alt kümesi (örnekler) arasında gerçekleştirildiği durumu tanımlamak için kullanılan terimdir.

Ancak ortaya çıkan sonuç büyük ihtimalle yanlış olacaktır, daha doğrusu yanlı olduğundan yanlış olacaktır. Çünkü örnek veri grubu, veri grubunun tamamını oluşturmaz.

Peki işe yaramaz mı?

Aslında yarar. Verileri doğru şekilde (yani gerçekten rasgele ve mümkün olduğunca çok) toplamamızı bize hatırlatır.

Dijital ajanslar, ürün tasarlayıcıları, kullanıcı araştırmaları yapanlar bundan nasıl faydalanabilir?

Selection bias, verinin ne olduğunu değil ne olmadığını kendimize hatırlatmamız için güzel bir terimdir.

Örneğin, Instagram’da karşısına çıkan reklamlardan bazısını “bu reklamı gösterme, ilgimi çekmiyor” diye işaretleyen bir kullanıcıyı, Instagram ekibi analiz ederken, “Hmm… Demek, işaretlemedikleri ilgisini çekiyor” diye yorumlamamalıdır.

Çünkü kısıtlı veri sadece işaretledikleri hakkındadır. İşaretlemedikleri reklama ilişkin elimizde veri yoktur. Üstteki veri kısıtlıdır. İşaretlemediği reklamı görüp görmediğini, yahut da görse de beğenip beğenmediği hakkında bir bilgi vermez.

Diğer bir hata da, işaretleme yapmış grubu genellemektir. Eğer bu “reklamı gösterme” düğmesine, 25-34 yaşındaki bir erkek tarafından basıldıysa, bu yine kısıtlı bir örnek grubudur, “erkekler bizim bu reklamımızı sevmiyor” diye belirlenemez. Görme saati, eğitim faktörü, kültür faktörü vb bir sürü terim işin içine girdiğinden bize sadece şunu hatırlatmakta kullanılır.

“Çok daha fazla örnek topla ve mümkün olduğunca rastgele örnek topla”

Bir Seçim Yanlılığı Türü: Onay Yanlılığı

Confirmation Bias – Onay yanlılığı (Bir Seçim yanlılığı türü) bir seçim yanlılığı türüdür. İnsanların sadece mevcut inançlarını doğrulayan örnekleri hatırlama eğiliminde olduğu durumdur. Sadece onları hatırladığından kendini haklı çıkarmakta bunları kullanma hatasına düşer. Bir çok ikili ilişkide ve iki zıt grubun tartışmasında sıkça karşımıza çıkar.

Bir Seçim Yanlılığı Türü: Yayın Yanlılığı

Yayın yanlılığı: Bir konu hakkındaki deneysel verilerin çarpıtılmış sunumudur. Çıktıları çok fazla olmayan veya konuyu desteklemeyen sunumlar, -ses getirmeyen- bu yüzden yüzeye çıkamama tehlikesi ile karşı karşıya kalabilir. (Daha fazla bilgi için: (ingilizce) https://www.youtube.com/watch?v=z6E4vljXrNU 

Üreticiler, kullanıcı araştırmaları yapanlar, Dijital ajanslar seçim yanlılığından nasıl kaçınabilir?

Belirttiğim gibi, verilere şüpheli yaklaşmak için bunu aklımıza getirmeliyiz.

Daha az hatalı hale getirmek için:

  • Popülasyonlardan alt grup seçerken rastgele yöntemler kullanmak.
  • Seçilen alt grupların anahtar özelliklerine göre büyük ölçüde popülasyona eşdeğer olmasını sağlamak (tipik olarak anahtar özellikler bilinmediği için bu yöntem ilkinden daha az bir korumadır).