Korelasyon ve Nedensellik: İki Değişken Arası İlişki (Korelasyon), Nedensellik Anlamına Gelmez!
Anlamsız Korelasyonlar: Havuza Düşerek Boğulma İhtimaliniz, Nicholas Cage'in Rol Aldığı Film Sayısı ile İlişkili Olabilir mi?
Gerçek anlamda bilimsel tartışmalara giren veya akademik araştırmalar yürüten kişilerin mutlaka ama mutlaka karşılaştıkları, daha önemlisi karşılaşmak zorunda oldukları bir cümledir: Korelasyon, nedensellik demek değildir!
Bir diğer deyişle, iki değişken arasında doğrusal bir ilişki olması (biri artarken veya azalırken, diğerinin de ilkiyle aynı yönde artması veya azalması), ikinci değişkende gördüğümüz değişimin sebebinin birinci değişkenin değişimi olduğu anlamına gelmez!
Yine karmaşık oldu... Bir örnek vererek, biraz daha basitleştirelim: Diyelim ki, Kuzey Anadolu illerinde balıkçılık faaliyetleri 2010-2016 yılları arasında %74 oranında artmış olsun. Yine diyelim ki, aynı tarih aralığında (2010-2016 arasında) Çin Halk Cumhuriyeti sınırlarındaki hava kirliliği miktarı da %74 oranında artmış olsun. Bu durumda, Türkiye'deki balıkçılık faaliyetlerindeki artışın, Çin Halk Cumhuriyeti'ndeki hava kalitesinin kötüleşmesinin nedeni olduğunu söyleyebilir miyiz?
Hayır, elbette ki sadece bu verilere bakarak söyleyemeyiz! Evet, ikisi arasında bir ilişki bulunmaktadır. Ancak bu doğrusal ilişki, arada bir nedensellik (neden-sonuç ilişkisi) olduğu anlamına gelmez! Çin'deki hava kalitesinin kötüleşmesinin nedeni, Çin'in gelişmesine bağlı olarak ülkede faaliyet gösteren fabrika sayısının artması olabilir. Ve muhtemelen öyledir de... Ancak unutmayın, bu nedensellik ilişkisi ispatlanmadan, nedenin bu fabrikaların artışı olduğunu bile iddia edemeyiz! İspatsız bir şekilde önerilen bir ilişki, ne kadar bariz olursa olsun, eğitimli bir tahmin veya iyi bir hipotez olmanın ötesine geçemez. O tahminleri bilimsel anlamda ciddiye almaya başlamamız için, o hipotezlerin doğrulanması (daha doğrusu her açıdan yanlışlanmaya çalışılıp bir türlü yanlışlanamaması) şarttır!
Benzer şekilde, Evren içerisindeki olay, olgu ve süreçlere yönelik yeterince veri toplarsanız, tamamen alakasız olay, olgu ve süreçler arasında ilişkiler tespit etmeniz kaçınılmaz olacaktır. Bu metnin kapağındaki görseli ele alalım: Nicholas Cage'in rol aldığı filmlerin sayısı ile, havuza düşerek boğulan insan sayısı arasında belli yıllar için bir ilişki var gibi gözükmektedir. Her iki değişken de bir arada artmakta ve bir arada azalmaktadır. Bu durum, insanların havuzda boğulmasının nedeninin Nicholas Cage'in filmlerde rol alması olduğunu iddia etmemiz için yeterli midir? Elbette hayır!
Bu tür ilişkilere anlamsız ilişki (İng: "spurious correlation") adı verilmektedir. Bir unsurun bir sonucun nedeni olabilmesi için, o unsur ile o sonuç arasında takip edilebilir bir etkileşim olmalıdır. Nicholas Cage'in rol aldığı film sayısı (veya filmlerin kendisi), havuz kenarında zaman geçirmeyi teşvik edici bir doğada olsaydı, belki havuzda boğulmaların nedeni (veya nedenlerinden biri) olabilirdi. Ancak eğer ki böyle bir etkileşim tespit edilemezse, iki değişken arasındaki ilişki tamamen tesadüf eseri oluşmuştur denebilir; dolayısıyla bu ikili arasındaki ilişki, "anlamsız" bir korelasyondur. Çok daha fazla sayıda anlamsız korelasyonu, Tyler Vigen'in "Anlamsız Korelasyonlar" sitesinde bulabilirsiniz. Biz, en beğendiğimiz 10 tanesini aşağıda veriyoruz, görselleri yana kaydırarak daha fazlasını görebilirsiniz:
Tabii ki iki değişken arasında doğrudan bir ilişki olmasına rağmen, söz konusu ilişki herhangi bir anlam ifade etmiyor da olabilir. Benzer şekilde, aradaki ilişki ters de kurulmuş olabilir; bu nedenle de bir anlamsız ilişki doğuyor olabilir. Bir diğer deyişle kurduğumuz ilişki, hatalı neden-sonuç ilişkisi olabilir. Aşağıdaki örnek bunu güzel (ve esprili) bir şekilde gösteriyor:
Bilim Neden Bu Kadar Güçlü?
İşte bilimin gücü, bu yalın gerçeği kavrayabilmekten gelir. Çünkü bilimin işi korelasyonları bulmak değildir; nedenselliği ortaya çıkarmaktır. Hiçbir bilimsel amacınız olmaksızın da veriler toplayabilir ve iki veri arasında ilişki kurabilirsiniz; ancak bunun bilimsel ilerlemeye pek bir katkısı olmayacaktır. Önemli olan, o ilişkiler arasından nedensel olanları tespit etmek ve bunlar üzerinden hipotezler geliştirip, bunları sınayıp, teoriler inşa ederek gerçeğin doğasına yönelik açıklamalar geliştirebilmektir (ve bunu yaparken eski teorileri de sınamak ve gözden geçirmektir). Bilim, budur!
- İstatistik Yalanları: Herhangi Bir Konuda Paylaşılan İstatistikler Konusunda Nelere Dikkat Edilmeliyiz?
- Beslenme-Kanser İlişkisi: Yediğimiz Hemen Her Şey Hem Kansere Sebep Oluyor, Hem de Kanseri Önlüyor!
- Uchuu Evren Simülasyonu: Bugüne Kadar Geliştirilmiş En Büyük Evren Simülasyonu ile Ücretsiz Bir Şekilde Oynayabilirsiniz!
Bu, kuşkusuz ki aralarında zamansal bir ilişki olan iki değişkenin birbiriyle öyle veya böyle ilişkili olduğunu söylemekten çok daha fazlasıdır; çok daha fazla çaba ve emek gerektirir. Günlük yaşantınızda, A olayının B olayından önce yaşanmış olmasını, A olayının B'nin nedeni olduğunu düşünmeniz için yeterli olabilir. Buna mantıkta post hoc ergo propter hoc mantık hatası adını vermekteyiz. Meali: "X, Y'den sonra oldu, dolayısıyla X'in nedeni Y'dir" mantık hatası... Daha basit tabiriyle; aralarında zaman ilişkisi olan olayların, aynı zamanda nedensellik ilişkisi de olduğunu varsayma hatası...
İlişkinin Hiç mi Anlamı Yok?
Peki iki değişken arasındaki ilişkinin tespiti her zaman, tamamen işlevsiz ve anlamsız mıdır? Elbette hayır! Öyle ki, bazı istatistikçiler ve bilim insanları, yazımızın başında kullandığımız ve her bilim insanının karşılaştığını söylediğimiz cümleye aşırı katı olması dolayısıyla karşı çıkarlar. Şu tür cümleleri tercih ederler:
Korelasyon her zaman nedensellik belirtmez, evet; ancak korelasyon, bir nedensellik aramak için iyi bir sebeptir!
Bir diğer deyişle, korelasyonlar bizler için başlangıç noktalarıdır; ancak korelasyonu nedenselliğe bağlamadığımız sürece çok da anlamlı bir iş yapmış olmayız. Mesela sırf bu nedenle besinler ile kanser arasındaki pozitif ve negatif ilişkileri ortaya çıkarıp da nedenselliği bir türlü ispatlayamayan araştırmalar bilime fayda sağlamaktan ziyade kafa karışıklığına neden olmaktadır; çünkü aynı besin bir deneyde kanser artışına sebep oluyor gibi gözükürken, diğer grupta azalmaya neden oluyor gibi gözükmektedir ve araştırmacılar, etik nedenlerle (ve biraz da bu tip konuların doğası gereği) bu korelasyonlardan hangisinin doğru olduğunu gösterecek yeterince kaliteli deneyler inşa etmekte zorlanmaktadırlar. Ama bunu yapamadıkları müddetçe, belli bir besin (mesela şarap veya ekmek ile) kanser arasında pozitif veya negatif bir ilişki olduğunu söylemek imkansız değil belki ama çok ama çok zor olacaktır. Ancak ve ancak yeterince çok sayıda, belki yüzlerce ve binlerce araştırmayı, çok benzer gruplarda, çok benzer şekillerde yaptıktan sonra hep aynı örüntüleri elde ettiğimizde bu korelasyonun bir nedensellik imâ ettiğine olan inancımız artabilir.
Aslında maddi destek istememizin nedeni çok basit: Çünkü Evrim Ağacı, bizim tek mesleğimiz, tek gelir kaynağımız. Birçoklarının aksine bizler, sosyal medyada gördüğünüz makale ve videolarımızı hobi olarak, mesleğimizden arta kalan zamanlarda yapmıyoruz. Dolayısıyla bu işi sürdürebilmek için gelir elde etmemiz gerekiyor.
Bunda elbette ki hiçbir sakınca yok; kimin, ne şartlar altında yayın yapmayı seçtiği büyük oranda bir tercih meselesi. Ne var ki biz, eğer ana mesleklerimizi icra edecek olursak (yani kendi mesleğimiz doğrultusunda bir iş sahibi olursak) Evrim Ağacı'na zaman ayıramayacağımızı, ayakta tutamayacağımızı biliyoruz. Çünkü az sonra detaylarını vereceğimiz üzere, Evrim Ağacı sosyal medyada denk geldiğiniz makale ve videolardan çok daha büyük, kapsamlı ve aşırı zaman alan bir bilim platformu projesi. Bu nedenle bizler, meslek olarak Evrim Ağacı'nı seçtik.
Eğer hem Evrim Ağacı'ndan hayatımızı idame ettirecek, mesleklerimizi bırakmayı en azından kısmen meşrulaştıracak ve mantıklı kılacak kadar bir gelir kaynağı elde edemezsek, mecburen Evrim Ağacı'nı bırakıp, kendi mesleklerimize döneceğiz. Ama bunu istemiyoruz ve bu nedenle didiniyoruz.
Ama bu şekilde yapılan yüzlerce ve binlerce çalışma bile, çoğu durumda bilim insanları için yeterli değildir. Bilim insanları, gerçek bir nedensellik iddiasında bulunabilmek için, en azından çift kör, randomize, kontrollü deneyler yapmak isterler: Yani örneğin bir ilacın insanlar üzerindeki etkisini anlamak için rastgele bir şekilde en az 2 grup oluşturmayı, o gruplardan birine ilacı verirken diğerine vermemeyi, deneycilerin de deneklerin de hangi grupta olduğunu bilmemelerini gerektiren karmaşık ama sistemli bir deney düzeneği kurmak isterler. Böylece diğer tüm değişkenleri olabildiğince sabit tutup (veya istatistiki olarak onların etkilerini eleyip), sadece 1 değişkenin deney veya sistem üzerindeki etkisine bakarak nedenselliği göstermeyi deneyebiliriz. Dahası, farklı açılardan, farklı derecelerde, tekrar tekrar ispatlanan korelasyonlar, olaylar arasındaki nedensellik ilişkisine daha da fazla güven duymamızı sağlayabilir.
Korelasyondan nedenselliğe giden yolu daha iyi anlamak için, sırf bu konuda yazdığımız bu yazımızı okuyabilirsiniz.
İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.
Soru & Cevap Platformuna Git- 62
- 33
- 18
- 17
- 5
- 4
- 3
- 2
- 0
- 0
- 0
- 0
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 18/11/2024 12:43:55 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/4277
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.