Büyük Sayılar Yasası Nedir? Örneklem Büyüklüğü ile Gerçekte Olan Arasındaki İlişki Nasıldır?
Kumarhanelerde Kasa Neden Her Zaman Kazanır?
Büyük Sayılar Yasası, bir deneyin pratikte gözlenen başarı oranının, deneme sayısı arttıkça teoride beklenen istatistiki sonuca giderek yaklaşma eğiliminde olduğunu belirten bir yasadır. Bunun sebebi, örneklem büyüklüğü ne kadar fazlaysa, bu örneklemin genel popülasyonun niteliklerini yansıtma ihtimalinin o kadar yüksek olmasıdır.
İstatistiksel analizde büyük sayılar yasası çok önemlidir, çünkü örneklem büyüklüğünüze geçerlilik kazandırır. Az miktarda veriyle çalışırken, yaptığınız varsayımlar gerçek popülasyonu uygun bir şekilde yansıtmayabilir. Bu nedenle, tüm veri setini yeterince temsil etmek için yeterli veri noktasının yakalandığından emin olmak önemlidir.
En basit örnek olarak, yazı-tura oyununu ele alalım. Yazı-tura örneği, bir Bernoulli deneyi olarak bilinir; çünkü deneyin her zaman ve sadece iki olası sonucu vardır: Para ya "yazı" ya da "tura" gelecektir. Yani bu tür bir deneyde, elde edilebilecek veriler ikilidir (İng: "binary") ve olayların bir oranı tarafından tanımlanan binom dağılımını takip eder. Dolayısıyla adil bir paranın beklenen (teorik) "yazı" gelme oranı %50'dir. Ancak gerçek bir deneyde:
- İlk atış tura gelebilir. Yani gözlediğiniz yazı oranı %0'dır. Bu, %100 hata payı demektir.
- İkinci atış yine tura gelebilir. Yani gözlediğiniz yazı oran halen %0'dır. Bu, %100 hata payı demektir.
- Üçüncü atış yazı gelebilir. Gözlediğiniz yazı oranı artık %33.3 (3 atışta 1 yazı) olmuştur. Bu, %33.3 hata payı demektir.
- Dördüncü atış tura gelebilir. Gözlediğiniz yazı oranı %25 (4 atışta 1 yazı) olmuştur. Bu, %50 hata payı demektir.
- Beşinci atış yazı gelebilir. Gözlediğiniz yazı oranı %40 (5 atışta 2 yazı) olmuştur. Bu, %20 hata payı demektir.
- Altıncı atış yazı gelebilir. Gözlediğiniz yazı oranı %50 (6 atışta 3 yazı) olmuştur. Bu, %0 hata payı demektir.
Elbette parayı atmaya devam ettikçe, oran %50 etrafında dolanacaktır; ama ne kadar çok sayıda atış yaparsanız, yani deneme sayısı ne kadar yüksek olursa, beklenen değer olan %50'ye o kadar yaklaştığınızı görürsünüz. İşte Büyük Sayılar Yasası, bu deneme sayısı arttıkça, (yazı-tura örneğinde) gözlenen oranın teorik beklenti olan %50'ye, hata payınınsa giderek %0'a yakınsayacağını söyler.
Bu yasanın iki biçimi vardır; ancak bunlar arasındaki farklar tamamen teoriktir. Büyük sayıların hem zayıf hem de güçlü yasaları, bağımsız ve özdeş olarak dağılmış rastgele değişkenler için bir dizi değerde geçerlidir: X1,X2,…,XnX_1, X_2, \dots, X_n.
Bu iki yasa, hem istatistik teorisinin hem de olasılık teorisinin temelini oluşturur. Bu makalede, yasanın her iki biçimini de açıklayacak, onları simüle edecek ve neden istatistik ve olasılık için çok önemli olduklarını açıklayacağız.
Büyük Sayıların Zayıf Yasası: Khinchin Yasası Nedir?
Büyük sayıların zayıf yasası, yukarıda verdiğimiz değerlerde nn sayısı arttıkça, dizinin örnek istatistiğinin (yani dizinin o anki niteliklerini tanımlayan istatistiklerin) olasılık olarak popülasyonun genel ortalamasına yakınsayacağını söyler. Büyük sayıların zayıf yasası, Khinchin Yasası olarak da bilinir.
Bu, şu anlama gelir: Teorik değer ile örnek değer arasında sıfır olmayan bir fark belirlediğinizi varsayalım. Örneğin, yazı tura sonuçları için teorik olasılık (yani 0.5 oranı) ile, birden fazla denemede elde ettiğiniz gerçek oran arasında bir fark tanımlayabilirsiniz (örneğin "fark 0.05'ten küçük olmalı" gibi). Deneme sayısı arttıkça, gerçek farkın önceden tanımlanan bu farktan daha küçük olma olasılığı da giderek artar - ki hatırlayacak olursanız bunu, yukarıdaki gerçek yazı-tura deneyinde, "hata payı" olarak ifade etmiştik ve bu oranın giderek küçüldüğünü görmüştük (arada bir yükselse de). İşte Khinchin Yasası (veya Büyük Sayıların Zayıf Yasası) bu sayının küçülme ihtimalinin, örneklem büyüklüğü sonsuza yaklaştıkça 1'e yaklaştığını söyler.
Bu fikir, gerçek ve beklenen değerler arasında çok çok küçük farklar tanımladığınızda bile geçerlidir. Sadece daha büyük bir örnekleme ihtiyacınız vardır.
Büyük Sayıların Güçlü Yasası: Kolmogorov Yasası Nedir?
Büyük sayıların güçlü yasası, örneklem büyüklüğü veya deneme sayısı arttıkça örneklem istatistiğinin popülasyon değerine nasıl yakınsadığını açıklar. Örneğin, örneklem büyüklüğü arttıkça, örneklem ortalaması da popülasyon ortalamasına giderek yakınsar. Büyük sayıların güçlü yasası, Kolmogorov'un Güçlü Yasası olarak da bilinir.
Yani bir kişi, 100 olası değerden oluşan bir veri kümesinin ortalamasını belirlemek isterse, yalnızca iki veri noktasına güvenmek yerine 20 veri noktası seçerek daha doğru bir ortalamaya ulaşma olasılığı daha yüksektir. Bunun nedeni, iki veri noktasının ortalamanın dışında olması veya ortalamayı temsil etmemesi olasılığının daha yüksek olması ve 20 veri noktasının tamamının temsili olmaması olasılığının daha düşük olmasıdır. Örneğin, veri seti 1'den 100'e kadar olan tüm tamsayıları içeriyorsa ve kişi, sadece 95 ve 40 gibi iki değeri örnek aldıysa, ortalamayı yaklaşık 67.5 olarak belirleyebilir. Halbuki 20 değişkene kadar rastgele örneklemeler almaya devam ederse, daha fazla veri noktasını göz önünde bulundurduğu için ortalama gerçek ortalamaya (yani 50.5'e) doğru kaymalıdır.
Evrim Ağacı'nın çalışmalarına Kreosus, Patreon veya YouTube üzerinden maddi destekte bulunarak hem Türkiye'de bilim anlatıcılığının gelişmesine katkı sağlayabilirsiniz, hem de site ve uygulamamızı reklamsız olarak deneyimleyebilirsiniz. Reklamsız deneyim, sitemizin/uygulamamızın çeşitli kısımlarda gösterilen Google reklamlarını ve destek çağrılarını görmediğiniz, %100 reklamsız ve çok daha temiz bir site deneyimi sunmaktadır.
KreosusKreosus'ta her 10₺'lik destek, 1 aylık reklamsız deneyime karşılık geliyor. Bu sayede, tek seferlik destekçilerimiz de, aylık destekçilerimiz de toplam destekleriyle doğru orantılı bir süre boyunca reklamsız deneyim elde edebiliyorlar.
Kreosus destekçilerimizin reklamsız deneyimi, destek olmaya başladıkları anda devreye girmektedir ve ek bir işleme gerek yoktur.
PatreonPatreon destekçilerimiz, destek miktarından bağımsız olarak, Evrim Ağacı'na destek oldukları süre boyunca reklamsız deneyime erişmeyi sürdürebiliyorlar.
Patreon destekçilerimizin Patreon ile ilişkili e-posta hesapları, Evrim Ağacı'ndaki üyelik e-postaları ile birebir aynı olmalıdır. Patreon destekçilerimizin reklamsız deneyiminin devreye girmesi 24 saat alabilmektedir.
YouTubeYouTube destekçilerimizin hepsi otomatik olarak reklamsız deneyime şimdilik erişemiyorlar ve şu anda, YouTube üzerinden her destek seviyesine reklamsız deneyim ayrıcalığını sunamamaktayız. YouTube Destek Sistemi üzerinde sunulan farklı seviyelerin açıklamalarını okuyarak, hangi ayrıcalıklara erişebileceğinizi öğrenebilirsiniz.
Eğer seçtiğiniz seviye reklamsız deneyim ayrıcalığı sunuyorsa, destek olduktan sonra YouTube tarafından gösterilecek olan bağlantıdaki formu doldurarak reklamsız deneyime erişebilirsiniz. YouTube destekçilerimizin reklamsız deneyiminin devreye girmesi, formu doldurduktan sonra 24-72 saat alabilmektedir.
Diğer PlatformlarBu 3 platform haricinde destek olan destekçilerimize ne yazık ki reklamsız deneyim ayrıcalığını sunamamaktayız. Destekleriniz sayesinde sistemlerimizi geliştirmeyi sürdürüyoruz ve umuyoruz bu ayrıcalıkları zamanla genişletebileceğiz.
Giriş yapmayı unutmayın!Reklamsız deneyim için, maddi desteğiniz ile ilişkilendirilmiş olan Evrim Ağacı hesabınıza üye girişi yapmanız gerekmektedir. Giriş yapmadığınız takdirde reklamları görmeye devam edeceksinizdir.
Her iki yasa da sürekli değişkenlerin ortalamalarından Bernoulli deneylerinin oranlarına kadar çeşitli özellikler için geçerlidir. Biz, her iki senaryoyu da simüle edeceğiz.
Büyük Sayılar Yasası için Simülasyonlar
Büyük sayıların her iki yasasının da matematiksel kanıtları olsa da, onları rastgele örnekleme programı olan Statistics101'i kullanarak simüle edeceğiz. Programı ücretsiz olarak indirebilirsiniz.
IQ örneği ve yazı tura örneği için kodlar bu şekildedir. Simülasyonları kendiniz yapabilir ve sonuçları görebilirsiniz. Bu kodlar kullanılarak oluşturulan örnek grafikleri aşağıda görebilirsiniz. Daha güzel grafikler için veriler Excel'e aktarılmıştır; fakat Statistics101 programı da grafik üretmektedir. Simülasyonlarınız birebir eşleşmeyebilir ancak genel olarak tartışılan modele uygun bir örnek ortaya çıkmalıdır.
Yazı-tura örneğini yukarıda göstermiştik, dolayısıyla burada bir diğer örnek olarak IQ'ya bakacağız.
IQ Örneği
IQ puanları üzerine bir çalışma yaptığımızı hayal edin. Rastgele 100 katılımcı seçiyoruz ve IQ'larını ölçüyoruz. Denekleri toplarken, onların IQ'larını değerlendireceğiz ve her bir ilave kişiyle örnek ortalamasını yeniden hesaplayacağız. Bu işlem, örneklem boyutu 1'den 100'e yükseldikçe, bize örnek bir dizi üretecektir. Büyük sayılar yasası doğruysa, örneklem büyüklüğü arttıkça örneklem araçlarının popülasyon ortalamasına yakınsamasını bekleriz.
Bu popülasyon için, IQ puanlarının popülasyon dağılımını, ortalaması 100 ve standart sapması 15 olan normal bir dağılımı takip ederek tanımlayacağız.
Gördüğünüz gibi, örneklem, popülasyon ortalama IQ değeri olan 100'de yakınsamaktadır. Örnekler dizinin başında daha düzensizdirler, ancak örnek sayısı arttıkça dengelenir ve doğru değerde yakınsarlar.
Büyük Sayılar Yasasının Pratikteki Etkileri
Büyük sayılar yasası hem istatistik hem de olasılık teorisi için gereklidir.
İstatistikte, büyük sayıların her iki yasası da, daha büyük örneklerin, popülasyon değerine tutarlı bir şekilde daha yakın olan tahminler ürettiğini gösterir. Bu özellikler, popülasyonların özelliklerini tahmin etmek için örnekleri kullandığınız çıkarımsal istatistiklerde önemli hale gelir. Bu nedenle istatistikçiler, her zaman büyük örneklem boyutlarının daha iyi olduğunu söylemektedir.
Olasılık teorisindeyse, deneme sayısı arttıkça, gözlemlenen olayların göreli sıklığı, beklenen olasılık değerine yakınsayacaktır. Dört kez yazı tura atarsanız, üç kez tura gelmesi şaşırtıcı değildir (%75). Ancak 100 yazı tura attıktan sonra bu oran, %50'ye son derece yakın olacaktır. Hatta 100 yazı-turadan sonra eğer oran halen %75 düzeyinde kalıyorsa, o paranın âdil değil, hileli olduğunu düşünmek için giderek güçlenen bir argümanınız var demektir.
Bu yasalar, rastgele gibi gözüken olaylara bir tür düzen getirir. Örneğin, bozuk para atmak, zar atmak veya şans oyunlarından bahsediyorsanız, kısa vadede olağandışı bir dizi olay gözlemlemeniz daha olasıdır. Ancak deneme sayısı arttıkça, genel sonuçlar beklenen olasılığa yakınsar.
Kasa Her Zaman Kazanır!
Bu, kumarhanelerdeki "Kasa her zaman kazanır." argümanının ardındaki matematiksel gerekçedir: Kumarhaneler, bir yazı-tura oyunundaki (veya rulet gibi bir oyundaki) kazanma oranını kendilerinden yana %1 veya %5 gibi ufacık miktarlarda saptırsalar bile, on binlerce kumarbazın oynamasına ve bazılarının kazanmasına rağmen, ortalamada her zaman kumarhaneler kârlı çıkarlar. Yani yeterince şanslıysanız kasayı birkaç kez yenebilirsiniz; ancak uzun vadede her zaman kasa kazanacaktır!
Hiçbir Finansal Büyüme Sonsuza Dek Süremez!
Finansal bağlamda, büyük sayılar yasası, hızla büyüyen büyük bir varlığın bu büyüme hızını sonsuza kadar sürdüremeyeceği anlamına gelir. Yüz milyarlarca dolar piyasa değeri olan hisse senetleri (ve bunların büyüme dinamikleri), sıklıkla bu yasaların birer örneği olarak kullanılır.
Ek olarak, "büyük sayılar yasası" terimi bazen iş dünyasında yüzde cinsinden belirtilen büyüme oranlarıyla ilgili olarak da kullanılır. Bir işletme büyüdükçe, yüzde cinsinden büyüme oranının korunmasının giderek zorlaşır. Bunun nedeni, yüzde olarak büyüme oranı sabit kalsa bile, büyümeyi beslemesi gereken dolar miktarının durmaksızın artıyor olmasıdır. Örneğin 10 milyon dolarlık bir firmanın %10 büyümesi için 1 milyon dolar kâr etmesi gerekir. Artık 11 milyon dolar olan firmanın tekrar %10 büyümesi için, artık 1 milyon dolar yeterli değildir; 1.1 milyon dolar kâr etmesi gerekir. Dolayısıyla yüzde bakımından büyüme beklentisi aynı (%10 düzeyinde) tutulmuş olsa da, o yüzdenin tatmin edilebilmesi için gereken maddi miktar daha da artmıştır.
Dolayısıyla iş dünyasında hedef belirlenirken büyük sayılar yasasını gözetmek çok önemlidir. Örneğin bir şirket, bir yılda gelirini ikiye katlayabilir. Şirket gelecek yıl gelirinde yalnızca %50 büyüme elde ederse, son iki yılın her birinde aynı miktarda para kazanmış olacaktır. Bu nedenle finansal kararlar alırken, hele ki büyük dolar değerlerinin çok yüksek olduğu durumlarda yüzdelerin yanıltıcı olabileceğine dikkat etmek önemlidir.
Hiçbir Anket Kusursuz Değildir ve Olamaz!
Özellikle de siyasi anketler ve toplumsal nabzı ölçen çalışmalarda, teknik olarak herkesin fikrinin sorulması gerekir; ancak böylesin bir verinin toplanması imkânsıza yakındır. Buna karşılık, toplanan her ek veri noktası, sonucun, ortalamanın gerçek bir ölçüsü olma olasılığını artırma potansiyeline sahiptir. Dolayısıyla bir örneklemin büyüklüğü ne kadar fazlaysa, gerçekçiliği de o kadar yüksek olacaktır.
Sigorta Endüstrisi Bu Yasa Etrafında Dönüyor!
Büyük sayılar yasası, öngörülen riski hesaplamak ve giderek daha hassas hesaplar yapabilmek için sigorta endüstrisinde de sık sık kullanılmaktadır.
Bir sigorta şirketinin farklı müşterilerden araba sigortası için ne kadar ücret alacağını değerlendirdiği bir durum düşünün. Şirketin küçük bir veri seti olması durumunda, uygun risk profillerini doğru bir şekilde belirlemesi mümkün olmayacaktır.
Sigorta acentesi daha fazla veri topladıkça, yani büyük sayılar yasası giderek artan miktarda devreye girdikçe, genç erkek sürücülerin kazaya neden olma olasılığının daha yüksek olduğunu görebilirler. Bu daha büyük örneklem, trafik kazalarını daha fazla temsil eder ve sigorta şirketi, tahsil edilecek uygun sigorta primleri hakkında daha doğru sonuçlara ulaşabilir.
Ek olarak, büyük sayılar yasası, sigorta şirketlerinin, hangi özelliklerin daha yüksek riske neden olduğunu analiz ederek, primleri değerlendirmek için kriterleri derinlemesine geliştirmelerine olanak tanır. Örneğin alkol tüketimine yatkınlık veya daha riskli coğrafyalarda yaşamak gibi faktörler gözetilerek, kişiye/duruma özel sigorta primleri belirlenebilir.
Büyük Sayılar Yasası Ne Zaman Çalışmaz?
Örneklem büyüklüğü veya deneme sayısı arttıkça, büyük sayılar yasalarının beklenen değere yaklaşamadığı bazı durumlar da vardır. Örneğin veriler "Cauchy dağılımı" denen özel bir dağılım tipine uyduğunda, Cauchy dağılımının tanım gereği beklenen bir değeri olmadığı için, sayılar da beklenen bir değere yakınsayamaz. Benzer şekilde bu yasalar, beklenen değeri sonsuz olan Pareto dağılımına da uygulanamaz.
Burada dikkat edilmesi gereken bir nokta (ve çok sık yapılan bir hata), büyük sayılar yasasının bir sonraki örneklem davranışını kestirmekte kullanılabileceği sanrısıdır. Yani yazı-tura oyununda 5 defa üst üste yazı geldiği için ve bu örneklem, beklenenden ciddi miktarda saptığı için, büyük sayılar yasasından yola çıkarak bir sonraki atışta tura gelmesi gerektiğini düşünmek hatalıdır. Bu hatalı düşünme biçimine Kumarbaz Safsatası denir; çünkü kumarbazlar sıklıkla bu hataya düşerek paralarını kaptırırlar.
Her bir yazı-tura atışının yazı (veya tura) gelme ihtimali %50'dir ve bu, her atış için geçerlidir. Daha önceden ne geldiği, daha sonradan ne geleceğini etkileyemez. Fakat yeterince çok sayıda atış yapılırsa, bunların hepsinin ortalaması %50'ye yakınsayacaktır. Ancak o çok sayıda atış içerisinde değil 5 kere üst üste, 15 kere üst üste yazı bile gelebilir! Dolayısıyla o 15 kere yazı gelecek sürecin içindeyseniz, 5 kere geldiğinde de "Kesin şimdi tura gelecek!" dersiniz, 13 kere yazı geldiğinde de... Ama hiçbirinde, sırf önceki çok sayıda denemede yazı geldi diye artık tura gelmek zorunda değildir.
Sonuç
Tüm bu bilgiler ışığında, bir veri setini analiz ederken, örneklem büyüklüğünüzün popülasyonunuzu temsil edip etmediğini belirlemek için büyük sayılar yasasını anladığınızdan emin olun. Aksi takdirde doğrulama önyargısı gibi bilişsel önyargıların da etkisiyle, gerçekte olanı tespit etmek yerine, görmek istediğinizi görmeniz çok daha olası hale gelecektir.
İçeriklerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!
Bu içeriğimizle ilgili bir sorunuz mu var? Buraya tıklayarak sorabilirsiniz.
Soru & Cevap Platformuna Git- 9
- 4
- 2
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- 0
- Türev İçerik Kaynağı: Statistics By Jim | Arşiv Bağlantısı
- M. James, et al. Law Of Large Numbers: What It Is, How It's Used, Examples. (23 Eylül 2022). Alındığı Tarih: 3 Kasım 2022. Alındığı Yer: Investopedia | Arşiv Bağlantısı
Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?
Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:
kreosus.com/evrimagaci | patreon.com/evrimagaci
Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 21/11/2024 13:55:03 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/13075
İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.