Pozitif Testin Yanıltıcılığı

Mamografi tarama testi pozitif çıkmış. Hemen "kanserim var" düşünmek doğal. Ama matematik beklenmedik bir şey söyler: çoğu pozitif test yanlıştır. Özellikle nadir hastalıklar için.

Bunu Bayes teoremi açıklar.

Senaryo

Bir hastalığın popülasyonda görülme oranı %1 (prevalans). Test ise:

  • Duyarlılık (sensitivity, P(+|D)) = %95 → gerçek hastaları %95 ihtimalle yakalar
  • Özgüllük (specificity, P(−|¬D)) = %95 → sağlamları %95 ihtimalle doğru elemine eder

1000 kişiyi taradığımızda:

GrupSayıTest sonucu
Hasta (10 kişi, %1)10%95'i pozitif → 9-10 gerçek pozitif
Sağlam (990 kişi)990%5'i pozitif → ~50 yanlış pozitif

Toplam pozitif test: ~60. Bunların sadece 10'u gerçek hasta. PPV = 10/60 ≈ %16.

Yani pozitif test alan bir kişinin gerçekten hasta olma olasılığı sadece %16.

Sezgi bunu görmez çünkü "test ne kadar doğru?" sorusuna takılır. Asıl önemli olan: bu hastalık popülasyonda ne kadar yaygın?

Bayes Formülü

P(D+)=P(+D)P(D)P(+)P(D|+) = \frac{P(+|D) \cdot P(D)}{P(+)}

burada:

  • P(D|+): pozitif test verildiğinde hasta olma olasılığı (PPV — istediğimiz)
  • P(+|D): hasta iken pozitif çıkma olasılığı (duyarlılık)
  • P(D): hastalığın taban oranı (prevalans)
  • P(+): pozitif çıkma toplam olasılığı = TP/N + FP/N

Bayes teoremi bize "öncül olasılığı (prevalans) yeni kanıtla (test) nasıl güncelleyeceğimizi" söyler.

Pratik Sonuçlar

Tıpta tarama testleri:

  • Mamografi: pozitif → onaylama testi (biyopsi) gerek
  • HIV testi: ELISA pozitif → Western Blot ile doğrula
  • COVID PCR: ön taramada düşük prevalans → ELISA tipi hızlı testler PPV'si düşük

Hukukta delil:

  • DNA eşleşmesi 1/milyar — ama önce başka kanıt olmadan yapılan rastgele tarama yanlış pozitifler yaratır
  • "Prosecutor's fallacy": olasılığı tersinden okumak

Yapay zeka:

  • Dengesiz veri (örn. sahte para tespiti — %0.1 sahte) için %99 doğruluklu sınıflandırıcı bile pratikte zayıf olabilir
  • Bu yüzden precision/recall metrikleri kullanılır, sadece accuracy değil

İki Test Çözer mi?

Bir test pozitif çıktı, PPV %16. İkinci bağımsız bir test yapsak ne olur? Yeni öncül artık %16 — yani ikinci testin Bayes'i bu güncellenmiş öncülden başlar. Hesap:

  • Yeni P(D) = 0.16
  • Aynı sensitivity 0.95, specificity 0.95
  • Yeni PPV ≈ %78

İki ardışık pozitif → yüksek güven. Bu yüzden tıp pratiğinde doğrulama testleri vardır.

Sezgi Neden Yanılıyor?

İnsan beyni iki olasılığı karıştırır:

  • P(+|D) — "test ne kadar iyi tanır" (yüksek)
  • P(D|+) — "pozitif test ne anlama gelir" (genellikle düşük)

Bunlar çok farklı şeyler. Bayes formülü bu farkı matematiksel olarak ayrıştırır. Daniel Kahneman'ın "Thinking, Fast and Slow" kitabı bu sezgisel yanılgıyı (base rate neglect) detaylı inceler.

Tarihsel Hikâye

Thomas Bayes (1701-1761) Presbiteryan bir vaiz ve amatör matematikçiydi. Koşullu olasılık formülünü ölmeden tamamladı ama yayımlamadı; arkadaşı Richard Price 1763'te onun adına yayımladı. 18. yüzyılda fark edilmedi; 20. yüzyılda istatistik biliminin temel direği oldu. Bilgisayar çağında özellikle Bayesian inference (Bayes çıkarımı) yapay zeka, robot navigasyonu, spam filtreleme ve genom dizilimi gibi alanlarda hayati önem kazandı.

Sayılar

  • Bayes formülünün ilk yayını: 1763 (Price tarafından, Bayes'in ölümünden sonra)
  • Klasik mamografi senaryosu (40 yaş üstü): prevalans ~%0.8, PPV ~%10
  • HIV ELISA testi: duyarlılık %99.7, özgüllük %98.5
  • COVID-19 PCR: duyarlılık ~%70, özgüllük ~%99
  • Spam filtre: Bayesian her e-posta kelimesi için P(spam|kelime) hesaplar

"Pozitif test, kesinlik değildir; sadece şüphenin yön değiştirmesidir."

Kaynaklar