Bilimde Tekrarlanabilirlik Neden Önemlidir? Sosyal Bilimlerdeki Bazı Deneyler Neden Tekrarlanamıyor?
Bilimin mihenk taşlarından biri tekrarlanabilirliktir. Bunun temel nedeni, yapılan deneylerin tutarlı olup olmadığını görme ihtiyacıdır. Tekrarlanabilirlik, bir deneyin gerçekle ilişkisi olup olmadığını anlamamızı sağlamaktır. Eğer deney tekrarlanabilir değilse doğruluğundan emin olamayız.
Son yıllarda sosyal bilimciler, bulgularının tekrarlanabilirliği ile alakalı derin endişe duymaktadır. Psikolojide inanılmaz etkili bir bulgu olan "benlik kaynaklarının tükenmesi" veya "Marshmallow Testi" gibi konuların hassas olduğunu düşündüğümüz yöntemlerimizi adeta bir yay gibi büktüğünü gördük. Bu nedenle bilim insanları şu ana kadar süregelen yaygınlaşmış metodolojilerinin hatalı pozitif sonuçlar doğurduğunu fark ettiler. Bu olay "tekrarlanabilirlik krizi" olarak da adlandırıldı.
Bir grup sosyal bilimci, en prestijli bilim dergilerinden biri olan Nature ve Science dergilerindeki 21 adet makaleyi tekrarlamaya çalıştı. Popüler kültürde ve bilimde bir hayli etki bırakmış olan, internetteki arama motorlarının hafıza kaybına neden olması ve kitap okumanın çocukların zekalarını geliştirmesi hakkındaki makaleler, bunlardan bazılarıydı.
Araştırmacılar yaptıkları deneyin sonucunu Nature Human Behavior dergisinde yayınladı. Araştırma bulgularından çıkardıkları en büyük sonuç şuydu: En büyük jurnallerde yayınlanan makaleler bile tekrar edilene kadar içlerinde bir miktar şüphe barındırır. Bunlar sadece başlangıç bulgularıdır, gerçeğin tamamı değildir ve birkaç nedenden ötürü çok zor tekrarlanabilirler.
Çalışmalar Tekrarlanınca Heyecanını Kaybedebilir!
Bilim insanlarından oluşan ve 21 deneyi tekrarlayan grup; sadece deneyleri aynı şekilde tekrarlamakla yetinmedi, aynı zamanda çok daha hassas davrandılar. Örneğin bazı durumlarda katılımcı sayısını 5 kat arttırdılar ve deney yöntemini ve analizini not aldılar.
Ulaşılamayan bir grup hariç orijinal makalelerin yazarlarının hepsi bu deney yöntemleri ve analizleri kontrol ettiler ve altına imzalarını attılar. Bu da yöntemden sapılmayacağına ve sonuçlara ön yargı katılmayacağına dair bir güvence sağladı.
Orijinal 21 makalenin 13'ü tekrarlanabilmişti. Ancak makaleler arasında başarıyla tekrarlanabilenlerin bile etki alanı (kontrol grubu ile deney grubu arasındaki fark) yarı yarıya azaldı. Yani orijinal makalelerdeki sonuçlar deneysel manipülasyon nedeniyle abartılmıştı! Avusturyalı ekonomist ve çalışmanın ortak yazarlarından biri olan Felix Holzmeister şöyle diyor:
Genel olarak çalışmamız, istatistiksel olarak anlamlı bilimsel bulguların en tanınmış dergilerde yayınlanmış olsalar bile tekrarlanana kadar oldukça dikkatli bir şekilde yorumlanması gerektiğini göstermektedir.
Bilim Yapmak Zordur!
Tekrar edilen makalelerin birçoğu, birden fazla deney içermekteydi. Her makaleden sadece bir deney tekrar edildi. Bu nedenle aynı sonuçlara ulaşamamak, başarılı bir şekilde tekrar edilemeyen deneylerin baştaki sonuçlarının tamamen yanlış olduğu anlamına gelmemeli.
Örneğin internette bulabileceğimizi bildiğimiz şeyleri hatırlamakla pek uğraşmadığımızı belirten "Hafızaya Google Etkisi" adlı makalenin sonuçları, bu çalışmada tekrarlanamadı. Ancak makalenin Hazırlama Etkisi (İng: "Priming Effect") içerdiğine kanaat getirildi. Hafızaya Google Etkisi deneyi haricindeki deneylerde de bu duruma tatmin edici bir açıklama sağlanmadı. Ancak başka araştırmalar bu deneyin ana argümanını destekler nitelikte sonuç vermekteydi.
Bir deneyin tekrarlanamamasının birden fazla nedeni olabilir. Örneğin deney tekrar edilirken bir şeyler karıştırılmış olabilir. Bir başka neden olarak orijinal deney, yanlış pozitifte takılmış olabilir. Kentucky Üniversitesinden psikolog Will Gervais'in deneylerinden biri de bu tekrarlanamayan deneylerdendir. Deneyinin amacı, "İnsanların daha rasyonel düşünmesini sağlamak onları inançlarından uzaklaştırabilir mi?" sorusuna cevap aramaktı. Gervais, konu hakkında şunları söylüyor:
Sonradan baktığımızda çalışmamız çok saçmaydı.
Bu çalışmada araştırmacılar, denekleri Robin'in Düşünen Adam heykelinin bir resmine bakmalarını istediler ve bunun insanları daha çok düşünmeye sevk edeceğini düşündüler. Bu çalışma Science dergisinde yayınlandı. Gervais, düşüncelerini şöyle aktarıyor:
Evrim Ağacı'nın çalışmalarına Kreosus, Patreon veya YouTube üzerinden maddi destekte bulunarak hem Türkiye'de bilim anlatıcılığının gelişmesine katkı sağlayabilirsiniz, hem de site ve uygulamamızı reklamsız olarak deneyimleyebilirsiniz. Reklamsız deneyim, sitemizin/uygulamamızın çeşitli kısımlarda gösterilen Google reklamlarını ve destek çağrılarını görmediğiniz, %100 reklamsız ve çok daha temiz bir site deneyimi sunmaktadır.
KreosusKreosus'ta her 10₺'lik destek, 1 aylık reklamsız deneyime karşılık geliyor. Bu sayede, tek seferlik destekçilerimiz de, aylık destekçilerimiz de toplam destekleriyle doğru orantılı bir süre boyunca reklamsız deneyim elde edebiliyorlar.
Kreosus destekçilerimizin reklamsız deneyimi, destek olmaya başladıkları anda devreye girmektedir ve ek bir işleme gerek yoktur.
PatreonPatreon destekçilerimiz, destek miktarından bağımsız olarak, Evrim Ağacı'na destek oldukları süre boyunca reklamsız deneyime erişmeyi sürdürebiliyorlar.
Patreon destekçilerimizin Patreon ile ilişkili e-posta hesapları, Evrim Ağacı'ndaki üyelik e-postaları ile birebir aynı olmalıdır. Patreon destekçilerimizin reklamsız deneyiminin devreye girmesi 24 saat alabilmektedir.
YouTubeYouTube destekçilerimizin hepsi otomatik olarak reklamsız deneyime şimdilik erişemiyorlar ve şu anda, YouTube üzerinden her destek seviyesine reklamsız deneyim ayrıcalığını sunamamaktayız. YouTube Destek Sistemi üzerinde sunulan farklı seviyelerin açıklamalarını okuyarak, hangi ayrıcalıklara erişebileceğinizi öğrenebilirsiniz.
Eğer seçtiğiniz seviye reklamsız deneyim ayrıcalığı sunuyorsa, destek olduktan sonra YouTube tarafından gösterilecek olan bağlantıdaki formu doldurarak reklamsız deneyime erişebilirsiniz. YouTube destekçilerimizin reklamsız deneyiminin devreye girmesi, formu doldurduktan sonra 24-72 saat alabilmektedir.
Diğer PlatformlarBu 3 platform haricinde destek olan destekçilerimize ne yazık ki reklamsız deneyim ayrıcalığını sunamamaktayız. Destekleriniz sayesinde sistemlerimizi geliştirmeyi sürdürüyoruz ve umuyoruz bu ayrıcalıkları zamanla genişletebileceğiz.
Giriş yapmayı unutmayın!Reklamsız deneyim için, maddi desteğiniz ile ilişkilendirilmiş olan Evrim Ağacı hesabınıza üye girişi yapmanız gerekmektedir. Giriş yapmadığınız takdirde reklamları görmeye devam edeceksinizdir.
Onlara Tanrı'ya inanıp inanmadıklarına dair tek bir soru sorduğumuzda bu bize gerçekten küçük bir örneklem sağlıyordu ve buna anlamlı bir sonuç demek güçtü. Makalenin bugün olsa yayınlanmayacağını düşünüyorum.
Deneylerinin tekrarlanamamasının bir başka nedeni ise deneylerdeki insanların değişmesi olabilir. MIT'de psikolog olan David Rand, Nature dergisinde insan iş birliğine dair bir çalışma yayınlamıştı. Deneyinde ekonomi oyunu oynayan çevrimiçi katılımcılar vardı. Çalışması birçok katılımcının zamanla oyuna aşina olmaya başlayacağını ön görüyordu ancak bu varsayım gerçek hayatı yansıtmamaktaydı. Yapılan yeni çalışmalarda bu deneyin sonuçları da tekrarlanamadı.
Bir çalışmanın neden tekrarlanamayacağını anlamak güçtür, kesin olarak anlaşılan şey ise bilim insanlarının bir arada oldukları bir düşünme sürecine girmeleri gerektiğidir. Bir deneyi tekrarlamanın amacı bireysel araştırmacıların hatalarını ortaya çıkarmak değildir. Center for Open Science'ın direktörü ve psikolog olan Brian Nosek'e göre bunu yapmanın amacı şudur:
Bir deneyi tekrarlamak insani değerlerimizi hatırlamak için bir fırsattır.
Brian aynı zamanda şunları da ekliyor:
En iyi dergilerde makale yazanlar da makalelerinin kontrol edilebileceğini bilmelidir. Sosyal bilimlerdeki bu tekrar edilemezlik durumu bile aslında tekrar edilebilir bir bulgudur.
Genellikle bir makale tekrarlanamadığında bu durum o deneyin hipotezlerinin tamamen çürütüldüğü anlamına gelmez Ayrıca makalelerin yazarlarının birer "sahtekâr" olduğu da düşünülmemelidir. Sonuçların tekrarlanamaması, genellikle deneyi nasıl anlatacağımızda önemli değişiklikler yapılacağı anlamına gelir.
Örneğin meşhur Marshmallow Testi'nin tekrar edilmesi ile alakalı bir yazı yayınlandı. Testte erken yaşlarda olan memnuniyetin gecikmesinin ileri yaşlarda başarı getirdiğine dair bir korelasyon gösterildi. İleri zamanlarda yayınlanan bir makalede de böyle bir korelasyon bulundu, ancak aile geçmişi gibi faktörler kontrol edildiğinde bu korelasyondan eser kalmadı. Böylece makalenin çıkarımı şu şekilde değişti: Memnuniyetin gecikmesi bir insanın hayatını pozitif yönde etkileyen benzersiz bir kaldıraç değildir. Bir insanın hayatında değişikliğe yol açması zor bir faktördür, ama buna rağmen büyük bir resmin bir parçasıdır.
Bilimde sıklıkla bir şeyin doğruluğunun ilk gösterimi kalıcı yer edinir. Tekrarlanabilirlik, bilimin amacının bu olmayabileceğinin bir hatırlatıcısıdır. Bilim hatalarını kucaklar ve hatalarından ders alır.
Tekrarlanabilirlik Krizi Yıllardır Var ve Bilim İnsanları Kendilerini Geliştiriyor!
Psikolojideki "tekrarlanabilirlik krizi" 2010 yıllarında başladı. Bu krizin başlamasının nedeni bir makalenin tamamen deneysel metotları kullanarak insanların geleceği bilebileceğine dair kanıt bulduğunu iddia etmesi oldu. Bu olay bilim camiasında deneysel metotların güvenilirliğinin sorgulanmasına yol açtı. Örneğin üniversite öğrencilerinin çizim yapmak gibi küçük eylemleri gerçek deneysel etkileri görmek için yetersiz oldu.
Bilim insanları, eğer az sayıda insanda bir etki bulabilirseniz bu etkinin güçlü olması gerektiğini düşünür. Ancak çoğu zaman küçük örneklerden elde edilen önemli sonuçlar istatistiksel tesadüfler olmuştur.
Tekrarlanabilirlik krizi 2015 yılında aralarında Nosek'in de bulunduğu bir grup psikoloğun Science dergisinde kapsamlı bir sorunun kanıtlarını içeren bir rapor yayınlamasıyla daha da şiddetlendi. 270 psikolog, önde gelen dergilerde yayınlanan 100 deneyi tekrarlamaya çalıştı ve çalışmaların yalnızca yüzde 40'ı tekrarlanma testlerini geçebildi. Kalanlar ya başarısız oldu ya kayda değer veri veremedi. Tekrarlanabilenlerin sonuçları ise orijinal makaleler kadar etkili olamadı. Tekrarlanma eğiliminde olan çalışmalar, anlamlılık eşiğini zar zor geçenlerle karşılaştırıldığında daha yüksek düzeyde anlamlı sonuçlara sahipti. Nosek'e göre deneyleri tekrar etmenin başka bir önemli nedeni de şu:
Bilim insanlarının hangi hipotezlerin tekrarlanmaya değip değmediğine dair sezgilerini geliştirmek ve hangi tür çalışmaların tekrarlanma eğiliminde olup hangilerinin olmadığını anlamak deneyleri tekrar etmek için önemli bir nedendir.
Nosek ve meslektaşları yeni çalışmalarına "tahmin etme" faktörünü de ekledi. Bir grup bilim insanı hangi deneylerin tekrarlanması, hangilerinin tekrarlanmaması gerektiği konusunda birtakım tahminlerde bulundu. Deneyin sonuçlarını aşağıdaki grafikte görebilirsiniz.
Ekonomist ve çalışmanın ortak yazarlarından biri olan Anna Dreber şöyle diyor:
Bu sonuçlara göre tekrarlanması başarısız olan deneylerde sistematik giden bir şeyler var.
Tekrarlanamayan birçok makale, sezgisel olarak da kulağa biraz fazla iyimser geliyor. Mesela bir makale el yıkamanın sonradan anlama önyargısını çürüttüğü iddia ediyor. Çalışmanın özetinde, el yıkamanın "geçmişteki endişeleri genel olarak ortadan kaldırdığını ve metaforik bir 'temiz sayfa' etkisine yol açtığının görüldüğü" belirtiliyor. Araştırmacılar şunu söylüyor:
Deneyde olan her şey kulağa biraz fazla kolay, fazla basit geliyor ama sonuçlar tekrarlanamadı.
Ancak bunlar sayesinde, sosyal bilimlerin daha iyiye gittiğine dair bazı umut verici işaretler var. Birçok bilim insanı çalışma yöntemlerini not alıyor. Bunu yapmaları onların cımbızlama safsatasına düşmelerini de engelliyor. Dergiler artık makalelerin daha fazla katılımcı bulmasını ve bilim insanlarının bütün verilerini not almasını şart koşuyor. Son olarak Nosek şunu söylüyor:
Bu projeden alınacak ders çok olumlu bir reformasyon mesajıdır. Bilim daha iyiye gidiyor!
İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.
Soru & Cevap Platformuna Git- 2
- 2
- 1
- 1
- 1
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- Çeviri Kaynağı: Vox | Arşiv Bağlantısı
- C. F. Camerer, et al. (2018). Evaluating The Replicability Of Social Science Experiments In Nature And Science Between 2010 And 2015. Nature Human Behaviour, sf: 637-644. doi: 10.1038/s41562-018-0399-z. | Arşiv Bağlantısı
- B. Sparrow, et al. (2011). Google Effects On Memory: Cognitive Consequences Of Having Information At Our Fingertips. Science. | Arşiv Bağlantısı
- D. C. Kidd, et al. (2013). Reading Literary Fiction Improves Theory Of Mind. Science. | Arşiv Bağlantısı
- C. F. Camerer, et al. (2018). Evaluating The Replicability Of Social Science Experiments In Nature And Science Between 2010 And 2015. Nature. | Arşiv Bağlantısı
- W. M. Gervais. (2012). Analytic Thinking Promotes Religious Disbelief. Science. | Arşiv Bağlantısı
- J. P. Simmons. (2011). False-Positive Psychology: Undisclosed Flexibility In Data Collection And Analysis Allows Presenting Anything As Significant. Sage Journal. | Arşiv Bağlantısı
- Science, et al. (2015). Estimating The Reproducibility Of Psychological Science. Science. | Arşiv Bağlantısı
- S. W. S. Lee, et al. (2010). Washing Away Postdecisional Dissonance. Science. | Arşiv Bağlantısı
- B. A. N. A. D. S. Lindsay. (2018). Preregistration Becoming The Norm In Psychological Science. APS Observer. | Arşiv Bağlantısı
- G. Naik. (2017). Peer-Review Activists Push Psychology Journals Towards Open Data. Springer Science and Business Media LLC, sf: 161-161. doi: 10.1038/nature.2017.21549. | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 21/11/2024 11:42:26 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/15740
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.
This work is an exact translation of the article originally published in Vox. Evrim Ağacı is a popular science organization which seeks to increase scientific awareness and knowledge in Turkey, and this translation is a part of those efforts. If you are the author/owner of this article and if you choose it to be taken down, please contact us and we will immediately remove your content. Thank you for your cooperation and understanding.