Bayes Teoremi'ne Basit Bir Giriş: Gerçekten Kanser misiniz?
Gelin sizinle birazcık matematik ve biyoloji üzerine kafa yoralım. Hemen korkmayın! Aklınızı zorlayacak ama tahmin ediyoruz bundan keyif alacaksınız.
Şimdi, diyelim ki Türkiye'de kanserin görülme sıklığı 1000'de 1. Yani her 1000 kişiden 1'inde kanser görülüyor olsun. Ve diyelim ki şehrinizde bir laboratuvar var. Bu laboratuvar size kanser olup olmadığınızı söylüyor. Ancak elbette bu laboratuvarın sonuçları kusursuz değil. Buna rağmen şehrin en iyisi onlar! %99 ihtimalle doğru sonuç veriyorlar!
Bu ne demek? Eğer kanseriniz varsa, laboratuvar %99 ihtimalle kanserinizi tespit ediyor. Buna doğru pozitif diyoruz. Aynı şey, kanseriniz yoksa da aynı şekilde geçerli: Eğer kanser değilseniz, laboratuvar sonuçları %99 ihtimalle negatif geliyor. Buna doğru negatif diyoruz.
Ancak %1 ihtimalle laboratuvar hata yapıyor. Yani aslında siz kanser değilken bile kanser olduğunuzu söylüyor. Buna, hatalı pozitif veya Tip-1 Hata diyoruz. Veya kanserseniz, kanser olmadığınızı söylüyor. Buna hatalı negatif veya Tip-2 Hata diyoruz. Ama bu hata, %1 ihtimalle yaşanıyor.
O zaman size soru: Test sonuçlarınız bu laboratuvara gönderildi ve sonuçlar ne yazık ki pozitif geldi. Buna rağmen, aslında kanser olmama ihtimaliniz nedir?
Biraz düşünün...
%1, öyle değil mi? Sonuçta laboratuvar sonuçları %1 ihtimalle hatalıysa, %1 ihtimalle aslında kanser değilsiniz ama sonuçlarınız yanlışlıkla pozitif geldi.
Değil işte! Olasılık matematiği bu şekilde çalışmıyor! Gelin işin aslına bakalım:
Kanser Olmama Olasılığınız
Diyelim ki şehrinizde 5000 kişi yaşıyor. Bunların 5 tanesinin kanser olmasını bekleriz; çünkü yazının başında her 1000 kişiden 1'inde kanser görüldüğünü söylemiştik. 5000'i 1000'e bölerseniz 5 çıkar.
Diyelim bu 5000 kişiyi birden test ettik. O 5 kanser hastasını başarıyla tespit edebilmemiz lazım; çünkü testimiz %99 başarı oranına sahip. 5'in %99'u 4.95. Bireylerden bahsettiğimiz için bunu güvenle 5'e yuvarlayabiliriz. Yani hasta olan hepsini başarıyla tespit ettik. Bu noktada sorun yok.
Peki ya geri kalan 4995 kişi? Bunları test ettiğimizde, 50 kişinin sonuçları hatalı bir şekilde pozitif gelecektir. Neden? Testimiz %1 ihtimalle hatalı sonuç veriyor. Yani 4995 testin 49.95'i, ya da 50 tanesi hatalı olacak.
Aslında maddi destek istememizin nedeni çok basit: Çünkü Evrim Ağacı, bizim tek mesleğimiz, tek gelir kaynağımız. Birçoklarının aksine bizler, sosyal medyada gördüğünüz makale ve videolarımızı hobi olarak, mesleğimizden arta kalan zamanlarda yapmıyoruz. Dolayısıyla bu işi sürdürebilmek için gelir elde etmemiz gerekiyor.
Bunda elbette ki hiçbir sakınca yok; kimin, ne şartlar altında yayın yapmayı seçtiği büyük oranda bir tercih meselesi. Ne var ki biz, eğer ana mesleklerimizi icra edecek olursak (yani kendi mesleğimiz doğrultusunda bir iş sahibi olursak) Evrim Ağacı'na zaman ayıramayacağımızı, ayakta tutamayacağımızı biliyoruz. Çünkü az sonra detaylarını vereceğimiz üzere, Evrim Ağacı sosyal medyada denk geldiğiniz makale ve videolardan çok daha büyük, kapsamlı ve aşırı zaman alan bir bilim platformu projesi. Bu nedenle bizler, meslek olarak Evrim Ağacı'nı seçtik.
Eğer hem Evrim Ağacı'ndan hayatımızı idame ettirecek, mesleklerimizi bırakmayı en azından kısmen meşrulaştıracak ve mantıklı kılacak kadar bir gelir kaynağı elde edemezsek, mecburen Evrim Ağacı'nı bırakıp, kendi mesleklerimize döneceğiz. Ama bunu istemiyoruz ve bu nedenle didiniyoruz.
Bu ne demek? Elimizde 5000 kişi içinden 55 adet pozitif test sonucu var demek. Ancak bu 55 kişiden sadece 5 tanesi gerçekten kanser. 50'si aslında kanser değil!
O zaman, bu teste dayanarak gerçekte kanser olma ihtimalinin 55'te 5 ya da %9 civarında olduğunu söyleriz. Bir diğer deyişle, yine bu teste dayanarak gerçekte kanser olmama ihtimalinin 55'te 50, ya da %91 civarında olduğunu söyleriz.
Bu ne demek? Eğer 5000 kişi test edildiyse ve siz pozitif bir sonuç aldıysanız, bu teste dayanarak %91 ihtimalle gerçekte kanser değilsiniz!
Bayes Teoremi Bize Ne Öğretiyor?
Bu bize ne öğretiyor? Aslında çok fazla şey...
İlk olarak, tekil olasılıkların ne anlama geldiğini çok iyi düşünmemiz gerektiğini gösteriyor. Matematikten anlamanın ne kadar önemli olduğunu gösteriyor. Testlerin başarı oranları ile o testin test ettiği şeyin sizde olup olmadığına dair oranların birbiriyle ilişkili ama aynı şey olmadığını gösteriyor.
Bu örnek bize aynı zamanda ikinci, üçüncü görüşlere başvurmanın ne kadar kıymetli olduğunu gösteriyor. Çünkü burada hesaplayarak kafanızı daha çok karıştırmayacağız; ancak ikinci bir laboratuvardan görüş alıp da, ondan da pozitif sonuç alacak olsaydınız, kanser olma ihtimaliniz %9'dan bir anda %90'ın üzerine fırlayacaktı. Aynı şey, aynı testi aynı laboratuvarda tekrar etmeniz halinde de geçerli; bu nedenle kimi zaman laboratuvarlar aynı kişi için bir testi birden fazla defa test edebilirler. Modern zamanlarda hastanelerin test metotları %99'dan çok ama çok daha isabetlidir. Örneğin bazı testler %99.999 isabetliliğe sahiptirler. Ayrıca hekimler makul düzeyde emin olmaksızın kanser tanısını koymazlar. Bu nedenle kanser veya bir diğer hastalığa dair tıbbi sonuçlarınızı sırf bu yazıdaki basitleştirilmiş bir örnekten yola çıkarak reddetmeye kalkmayın, hayatınızla oynamış olursunuz. Çünkü unutmayın: İşinin hakkını veren laboratuvar teknisyenleri ve hekimler, bu olasılık hesabından fazlasıyla haberdarlar ve tanılarını bunu göz önüne alarak koyarlar.
Ancak Bayes Teoremi'nin bize öğrettiği en önemli şey, hayatta hiçbir şeyden %100 emin olmamak gerektiği. Burada detaylarına girmedik; ancak aslında bilimin kalbinde yer alan Bayes Teoremi isimli müthiş önemli bir matematiksel teoremin nasıl çalıştığını öğrenmiş oldunuz. En azından temel prensibini öğrendiniz.
Bayes Teoremi ve Monty Hall Probleminin Çözümü
Bayes Teoremi (veya Bayes Formülü), belli bir kanıt veya veri ışığında, bir hipotezin gerçek olma olasılığını hesaplar:
P(H∣E)=P(E∣H)P(H)P(E)\LARGE{P(H|E)=\frac{P(E|H)P(H)}{P(E)}}
Eğer elde iki hipotez varsa:
P(H1∣E)=P(E∣H1)P(H1)P(E∣H1)P(H1)+P(E∣H2)P(H2)\LARGE{P(H_1|E)=\frac{P(E|H_1)P(H_1)}{P(E|H_1)P(H_1)+P(E|H_2)P(H_2)}}
Burada (ve genel olarak):
- HH, veri veya kanıttan etkilenen ve onlar ışığında değişecek olan hipotezdir. Çoğunlukla bir gözlemi izah eden birden fazla hipotez vardır ve bu yaklaşımda amaç, en olası olanı tespit etmektir. H1H_1 birinci hipoteze, H2H_2 ikinci hipoteze karşılık gelmektedir.
- P(H)P(H), önsel olasılık olarak bilinir. Bu, henüz EE kanıtı toplanmadan HH hipotezinin doğruluk oranıdır. Genelde bir hipotezin doğruluğuna yönelik olarak kestirdiğimiz bir ihtimalden veya önceden yapılan deneylere bağlı olarak hipotezin sahip olduğu doğruluk değerinden ibarettir.
- EE, bir hipotez ile ilişkili olarak toplanan, daha önceden elde olmayan kanıt veya veridir.
- P(H∣E)P(H|E), koşullu olasılık veya ardıl olasılık olarak tanımlayabileceğimiz, EE kanıtın toplandıktan sonra HH hipotezinin doğru olmasına yönelik olasılık değeridir. Yani bu, bilmek istediğimiz asıl olasılıktır. Bu olasılık, HH hipotezine bağlı olan bir fonksiyondur.
- P(E∣H)P(E|H), eğer HH hipotezi doğruysa, EE kanıtını toplama ihtimalidir. Kimi zaman olabilirlik olarak da ifade edilir. Bu olasılık, toplanan kanıtların eldeki hipotezle tutarlılık oranını da yansıtır. Bu olasılık, EE kanıtına bağlı olan bir fonksiyondur.
- P(E)P(E), eldeki bütün hipotezler için eşit olan marjinal olabilirlik değeridir. Herhangi bir hipoteze bağlı bir değer olmadığı için, farklı hipotezlerin göreli doğruluk oranını hesaplamakta kullanılmaz.
Ayrıca P(E)P(E), matematiksel olarak şu şekilde de genişletilebilir:
P(E)=P(E∣H)×P(H)+P(E∣H deg˘il)×P(H deg˘il)P(E)=P(E|H)\times{P(H)}+P(E|\text{H değil})\times{P(\text{H değil}})
Dolayısıyla Bayes Formülü'nü şöyle de yazabiliriz:
P(H∣E)=P(E∣H)×P(H)P(E∣H)×P(H)+P(E∣H deg˘il)×P(H deg˘il)\LARGE{P(H|E)=\frac{P(E|H)\times{P(H)}}{P(E|H)\times{P(H)}+P(E|\text{H değil})\times{P(\text{H değil}})}}
Eğer bu konuda kafanızı yakmak isterseniz, meşhur Monty Hall Problemi'ni düşünebilirsiniz. O soru bağlamında bulmak istediğimiz olasılık, sunucunun arkasında keçi olan bir kapıyı açtıktan sonra, seçtiğimiz kapının arkasında araba olma ihtimalidir (ve dolayısıyla kapımızı değiştirmeme davranışımızın başarı oranıdır). Şimdi, bunu Monty Hall Problemi için uyarlayacak olurask:
- P(H)P(H), bizim seçtiğimiz 1 numaralı kapının arkasında, tercihimiz öncesinde araba olma ihtimalidir. İşte başta 1/31/3 veya %33.33... olan budur ve eğer ki oyunu hazırlayanların bir önyargısı varsa, bu sayıyı değiştirerek o önyargıyı da işin içine katabiliriz.
- P(H deg˘il)P(\text{H değil}), araba olan kapıyı seçmeme ihtimalimizdir. Arkasında araba olan kapıyı seçme ve seçmeme ihtimalimizin toplamı %100 olmak zorunda olduğu için (başka bir olasılık olmadığı için), %100'den %33.33...'ü çıkarak bu sayıyı bulabiliriz: 2/32/3 veya %66.66...
- P(E∣H)P(E|H), eğer araba seçtiğimiz 1 numaralı kapının arkasındaysa, sunucunun arkasında keçi olan bir kapı gösterme ihtimalidir. Sunucu, bu oyun dahilinde, her zaman arkasında keçi olan bir kapı göstermek zorunda olduğu için, bu değer 1'dir (%100). Farklı senaryolar ve varyantlar altında bu durumu da değiştirerek farklı sonuçlar elde etmek mümkündür.
- P(E∣H deg˘il)P(E|\text{H değil}), eğer seçtiğimiz 1 numaralı kapı arkasında keçi varsa, sunucunun arkasında bir keçi olan bir kapı açma ihtimalidir. Yine, oyunun kuralları gereği sunucu her zaman bir keçi göstereceği için, bu oran da 1'dir (%100).
İşte bunların hepsini birleştirecek olursak, seçtiğimiz kapıyı değiştirmememiz halinde kazanma olasılığımıza yönelik sonucu elde ederiz:
P(H∣E)=1×131×13+1×23=131=13\LARGE{P(H|E)=\frac{1\times{\frac{1}{3}}}{1\times{\frac{1}{3}}+1\times{\frac{2}{3}}}=\frac{\frac{1}{3}}{1}=\frac{1}{3}}
Dilerseniz, kapıyı değiştirme durumunu da sıfırdan hesaplayabilirsiniz; ancak P(H∣E)+P(H deg˘il∣E)=1P(H|E)+P(\text{H değil}|E)=1 olmak zorunda olduğu için, yukarıdaki 1/31/3 oranını 1'den çıkararak, kapıyı değiştirme davranışının doğru olma olasılığının 2/32/3 olduğunu görebiliriz.
Hatta Bayes Formülü'nü kullanarak, sunucunun kapıların ardında ne olduğunu bilmediği durumu da hesaplayabiliriz! Bunu yapacak olursak:
P(H∣E)=1×131×13+12×23=1323=12\LARGE{P(H|E)=\frac{1\times{\frac{1}{3}}}{1\times{\frac{1}{3}}+\frac{1}{2}\times{\frac{2}{3}}}=\frac{\frac{1}{3}}{\frac{2}{3}}=\frac{1}{2}}
Görebileceğiniz gibi burada tek değişen, P(E∣H deg˘il)P(E|\text{H değil}) değerinin %100 değil, %50 (1/21/2) olmasıdır. Görebileceğimiz gibi, tamamen rastgele olan durumda kapımızı değiştirmek veya değiştirmemek fark etmez, iki durumda da kazanma ihtimalimiz %50'dir.
Sonuç
İlerleyen yazılarda bu teoremin detaylarına da gireceğiz ve o zaman da göreceksiniz ki, bir olguyla veya gerçekle ilgili ne kadar çok kanıt toplarsak, onun gerçekliğinden o kadar emin oluruz. Ancak o olguya dair eminlik seviyemiz hiçbir zaman %100'e ulaşmaz.
Bu demek değildir ki her şeye paranoyak bir kuşkuyla yaklaşmalıyız. Bu demek değildir ki gerçek diye bir şey yoktur. Bayes Teoremi'nin bize öğrettiği şey, kanıtlarımızı sonuçlarımıza doğru şekilde bağladığımızdan emin olmak ve her şeyi kesin olarak bildiğimiz yanılgısına düşmemektir. Gerçeklere belki hiçbir zaman %100 isabetle ulaşamayacağız; ancak elimizde %99'un üzerini zorlayan bir bilgi türü olarak bilim varken, buna sırt çevirmek en kibar tabiriyle türümüz için ahmaklık olacaktır.
Kanıtlar, bizi gerçeğe götürür ve eğer ki bir şeyleri kanıt olmaksızın gerçek kabul ediyorsanız... %100 ihtimalle olmasa bile, çok büyük ihtimalle hata yapıyorsunuz.
İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.
Soru & Cevap Platformuna Git- 36
- 18
- 14
- 12
- 11
- 6
- 4
- 2
- 1
- 1
- 0
- 0
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 21/11/2024 13:43:36 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/7795
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.