Oyun Teorisi - 3: Strateji Kavramı ve Karma Stratejiler

2 Aralık 2016

18 dakika

38,743

Oyun Teorisi - 3: Strateji Kavramı ve Karma Stratejiler

Evrim Ağacı'ndan bir yeni mesajın var.

Bilimi Yaymamıza Yardım Edin! 😍

Her ay milyonlarca bilimsever Evrim Ağacı'na uğruyor ve karmaşık bilimsel konuları basit bir dille anlattığımız içeriklerimizden faydalanıyor. Ne yazık ki bu okurlarımızın %0.1'inden azı bize destek olmayı seçiyor. Halbuki okurlarımızın sadece %1'i bile Evrim Ağacı'na ayda 39₺ gibi erişilebilir bir miktarla destek olsaydı, bilimi Türkiye geneline yaymamız önünde hiçbir maddi engel kalmazdı! Siz de destekçilerimiz arasına şimdi katılarak, bilimin gücüne güç katın! Daha Fazla...

Ayrıca Maddi Destekçi rozetine sahip olacaksın!

Bilime Destek Ol!

Evrim Ağacı Akademi: Oyun Teorisi Yazı Dizisi

Bu yazı, Oyun Teorisi yazı dizisinin 3. yazısıdır. Bu yazı dizisini okumaya, serinin 1. yazısı olan " Oyun Teorisi - 1: Oyunlar ve Oyunların Modellenmesi" başlıklı makalemizden başlamanızı öneririz.

Yeniden herkese merhabalar. Yazı dizimizin bu kısmında, bir önceki yazıda giriş yaptığımız Nash dengesi konseptine daha derinlemesine ineceğiz, bunun öncesinde de Oyun Teorisi’nin kritik noktalarından olan strateji kavramından bahsedeceğiz. Yine bu yazıda bahsedeceğimiz karma strateji Nash dengeleri, Oyun Teorisi’nin ne olduğu ve ne anlam ifade ettiği bakımından oldukça önemlidir.

Giriş

Hatırlarsanız, bir önceki yazımızda, Para Eşleme oyununda bir saf-strateji Nash dengesi bulunmadığından bahsetmiş, olası her dört sonuçta da oyunculardan birinin tercihini değiştirmek isteyeceğini ve bu isteklerin asla dengeye ulaşmayacak bir döngüye gireceğini belirtmiştik. Bir başka deyişle, ne sonuç çıkarsa çıksın, oyunculardan biri tercihinden (yazı veya tura) dolayı pişman olacaktır, ki bu da Nash dengesinin tanımı ile çelişmektedir.

Hatırlayacak olursanız, saf-strateji Nash dengelerinde oyuncuların kararlarını değiştirmeleri durumunda daha fazla kazanç elde edemeyecekleri bir durum söz konusuydu, ve bu konseptin isminin “denge” olmasının sebebi de buydu.

Tabii, bu noktada Nash dengesinin bir analiz yöntemi olduğunu da hatırlamak önem kazanıyor. Nash dengesi, oyuncuların hangi davranışta bulunacaklarını (en azından oyun defalarca tekrarlanıp bir tür “öğrenme” gerçekleşmeye başlayınca) tahmin etmemize yarayan, güçlü bir yöntemdir. Bu bağlamda, Para Eşleme oyunu için şu ana kadar bir Nash dengesi bulamamış olmamız demek, bu oyunda oyuncuların nasıl davranacağı hakkında da bir fikrimiz (henüz) yok demektir.

Şimdi, tüm bu tartışmaları bir kenara bırakırsak, siz Para Eşleme oyununu nasıl oynardınız? Ya da, Para Eşleme’nin 3x3’lük versiyonu olan, fazlaca aşina olduğumuz Taş Kağıt Makas oyununu nasıl oynuyorsunuz? Her seferinde taş çıkarıp, rakibinizin makası seçtiği zamanlarda kazanmayı mı umuyorsunuz? Yoksa tam tersine, elinizden geldiğince rastgele bir şekilde oynayarak, karşınızdaki oyuncunun kafasını karıştırmaya mı çalışıyorsunuz?

Para Eşleme’de de, Taş Kağıt Makas’ta da herhangi bir hamleye odaklanmak ve daima onu oynamak iyi bir fikir değildir. Teoride Nash dengesi olmayacağı için stabil bir sonuç doğurmayacaktır. Pratikte ise sizi tahmin edilebilir yapacak ve rakibinize (uzun vadede) avantaj kazandıracaktır. İki oyunda da maksimum kazanç beklentisi için hamlelerinizi rastgele yapmanız gerekmektedir.

Stratejiler

Şüphesiz ki şu ana kadar bahsettiğimiz konseptler, yukarıdaki rastgeleleştirme durumunu açıklamada yetersiz kalmaktadır. Bu noktada, bir oyunda seçebileceğiniz her türlü davranışı modelleyebilen strateji tanımı yardımımıza yetişiyor.

Hatırlarsanız, aksiyonları bir oyuncunun seçebileceği hamleler olarak tanımlamış, ve tekil aksiyonları küçük a, aksiyonlar kümesini de (gerek seçenekler, gerekse de kombinasyonlar olarak) büyük A harfi ile göstermiştik. Bu bağlamda, Para Eşleme oyunundaki “yazı” ve “tura” seçenekleri de birer aksiyondur.

Oyun Teorisi ile ilgili diğer içerikler ›

Analiz ve davranış bağlamında aksiyonları kapsayan bir kavram olan stratejileri ise, bir oyuncunun “hamlelerini seçme şekli,” ya da daha resmi olarak “hamleleri üzerindeki olasılık dağılımı” olarak tanımlayabiliriz. Yani, bir oyuncunun “Ben bu oyunda %30 ihtimalle yazı, %70 ihtimalle tura oynayacağım ve o elde hangisini oynayacağımı tamamen bu olasılık dağılımına göre belirleyeceğim,” demesi, bir stratejidir. Aynı şekilde, “%25 tura, %75 yazı” da başka bir stratejidir. Tekil stratejiler küçük s ile, stratejilerin kombinasyonları da büyük S ile gösterilir.

Burada dikkat çekilmesi gereken bir nokta, oyuncunun seçebileceği aksiyonlar sınırlı olsa bile, seçebileceği stratejilerin (eğer birden fazla hamle opsiyonu varsa) daima sonsuz olmasıdır. Bunun sebebi çok açıktır: Herhangi bir hamleye 0 (%0 olasılık) ve 1 (%100 olasılık) arasında bir olasılık değeri yükleyecektir, ve bu aralık sürekli, yani sonsuz sayı içerek bir aralıktır. Bu sebeple bir oyuncunun seçebileceği sonsuz strateji vardır.

Peki, bu yazıdan önce baktığımız örneklerdeki Nash dengelerinde olasılıklardan hiç bahsetmediğimize göre, o durumlarda oyuncular hangi stratejileri uygulamışlardır? Oyuncular, bu örnek dengelerde tek bir hamleyi seçmektedirler ve bu tek hamleli stratejilere de saf strateji denmektedir. Önceki tüm örneklerde, oyuncular saf stratejiler uygulamaktadırlar, yani bir hamleye %100 olasılık vermekte, kalanlarını da %0 ihtimalle oynamaktadırlar. Bu dağılım da bir olasılık dağılımıdır ve strateji tanımına girmektedir.

Evrim Ağacı'ndan Mesaj

Neden Desteğe İhtiyacımız Var?

Aslında maddi destek istememizin nedeni çok basit: Çünkü Evrim Ağacı, bizim tek mesleğimiz, tek gelir kaynağımız. Birçoklarının aksine bizler, sosyal medyada gördüğünüz makale ve videolarımızı hobi olarak, mesleğimizden arta kalan zamanlarda yapmıyoruz. Dolayısıyla bu işi sürdürebilmek için gelir elde etmemiz gerekiyor.

Bunda elbette ki hiçbir sakınca yok; kimin, ne şartlar altında yayın yapmayı seçtiği büyük oranda bir tercih meselesi. Ne var ki biz, eğer ana mesleklerimizi icra edecek olursak (yani kendi mesleğimiz doğrultusunda bir iş sahibi olursak) Evrim Ağacı'na zaman ayıramayacağımızı, ayakta tutamayacağımızı biliyoruz. Çünkü az sonra detaylarını vereceğimiz üzere, Evrim Ağacı sosyal medyada denk geldiğiniz makale ve videolardan çok daha büyük, kapsamlı ve aşırı zaman alan bir bilim platformu projesi. Bu nedenle bizler, meslek olarak Evrim Ağacı'nı seçtik.

Eğer hem Evrim Ağacı'ndan hayatımızı idame ettirecek, mesleklerimizi bırakmayı en azından kısmen meşrulaştıracak ve mantıklı kılacak kadar bir gelir kaynağı elde edemezsek, mecburen Evrim Ağacı'nı bırakıp, kendi mesleklerimize döneceğiz. Ama bunu istemiyoruz ve bu nedenle didiniyoruz.

Destek Ol

Oyuncuların tek bir hamleyi oynamadıkları, belirli olasılıklarla farklı hamleleri oynadıkları durumlarda kullandıkları stratejilere ise karma strateji denilmektedir. Bu durum, şu anda okurlarımıza biraz soyut geliyor olsa da, yazının sonlarına doğru karma stratejilerin ve bu stratejiler arasındaki dengenin ne anlama geldiğini konuşacağız.

Peki, bir olasılık dağılımı ve dolayısıyla sonucu belli olmayan bir oyun söz konusu ise, oyuncunun kazancını nasıl hesaplayabiliriz? Bu durumda, elbette kesin bir kazançtan bahsetmek mümkün değildir. Ancak, oyuncuların olasılıklara bağlı olarak değişen birer kazanç beklentileri olduğunu söyleyebiliriz. Kazanç beklentisi, hangi durumun hangi olasılıkla gerçekleşeceğine bağlı olarak, bir oyuncunun o oyundan ne kadar kazanmayı beklediğidir, daha resmi olarak,

Bu gösterimde, P(as) çarpanı, “‘s’ ile gösterilen stratejilerin oynandığı bilindiğine göre, ‘a’ ile gösterilen aksiyon kümesinin oynanması olasılığı”nı ifade eder. Büyük bir E harfine benzeyen simge ise, ifadenin kalanının, aϵA şartını sağlayan (yani oynanan oyun çerçevesinde mümkün olan) tüm aksiyonlar için toplandığı anlamına gelmektedir. Dikkat ederseniz, “a” ve “s” sadece kazancı ile ilgilendiğimiz i oyuncusunun değil, tüm oyuncuların uyguladıkları stratejileri ve şeçtikleri aksiyonları kapsamaktadır. Oyunların sonucu sadece bir oyuncunun değil, tüm oyuncuların seçimleri ile belirlendiği için, bu oldukça doğaldır.

Eğer bu gösterim size bir şey ifade etmediyse dert etmeyin, aşağıdaki örnekte görünce anlamlandıracağınıza eminiz.

Şu şekildeki bir para eşleme oyununa, Oyuncu 1’in gözünden bakalım. Diyelim ki, Oyuncu 2’nin, %20 olasılıkla (0.2) “yazı” %80 olasılıkla (0.8) “tura” oynayacağını biliyoruz. Bu bağlamda, Oyuncu 1 “yazı” oynamayı seçerse (yani stratejisi, %100 olasılıkla “yazı,”, 0 olasılıkla “tura” oynamak olursa) kazanç beklentisi ne olur?

Bu durumda oyun, yüzde 20 ihtimalle (Y,Y) yani (1,-1) sonucunda, yüzde 80 ihtimalle de (Y,T) yani (-1,1) sonucunda bitecek, ve oyuncular bu kazançlara sahip olacaklardır. Buna göre,

KB1(Yazı) = 0.2*1 + 0.8*(-1) = -0.6

Yani Oyuncu 1, bu durumda -0.6 kazanca sahip olmayı beklemektedir. Tabii ki, bu oyunda Oyuncu 1 asla -0.6 diye bir kazanç elde edemez, ancak bu sayının ifade ettiği zaten bu değildir. Kazanç beklentisini, oyun (ya da Oyun Teorisi bağlamından çıkacak olursak, herhangi bir deney) defalarca ve defalarca tekrarlanırsa ortalamada ne çıkacağı olarak düşünebiliriz. Alternatif olarak, Oyuncu 1’in kaybetme ihtimalinin kazanma ihtimaline göre ne kadar fazla olduğunu bir göstergesi olarak da düşünülebilir. Olasılık Kuramı’ndaki “Beklenen Değer” kavramına aşinaysanız zaten Kazanç Beklentisi’nin de aynı şey olduğunun farkına varmışsınızdır.

Diğer bir durum olarak, Oyuncu 1’in “%50 ihtimalle Y, %50 ihtimalle T” stratejisini izlediğini düşünelim. Bu durumda oyun, %10 ihtimalle (Y,Y), %10 ihtimalle (T,Y), %40 ihtimalle (Y,T) ve %40 ihtimalle de (T,T) sonucunda bitecektir. Yani,

KB1(%50 Yazı %50 tura) = 0.1*1 + 0.1*(-1) + 0.4*(-1) + 0.4*1 = 0

Oyuncu 1, bu durumda 0 kazanç beklentisine sahiptir; yani örneğin, eğer oyun defalarca oynanırsa, bu tekrarların yarısında kazanıp yarısında kaybetmeyi bekler. Açıkça, “%50 yazı” stratejisi “%100 yazı” stratejisinden daha kazançlıdır. Bunun sebebi bir bakışta görülebilir: Oyuncu 1, eğer seçilen taraflar aynı olursa kazanacaktır. Oyuncu 2 “tura”ya ağırlık verdiği için, Oyuncu 1 de “tura”ya ne kadar ağırlık verirse, kazanç beklentisi o kadar fazla olacaktır.

Tabii ki, kazanç beklentisi kavramının anlamlı olması için, ekonomide çok sık yapılan, gerçekçi bir varsayıma başvurmalı ve oyuncuların risk-nötr olduklarını kabul etmeliyiz. Yani oyuncular sadece bekledikleri kazançlarını umursamaktadırlar, ve bu yolda ne kadar risk aldıklarını umursamamaktadırlar. Onlar için, yüzde 10 olasılıkla 1000 lira, %90 olasılıkla da 0 lira almaları durumu ile, yüzde 100 olasılıkla 100 lira almaları durumu arasında bir fark yoktur.

Şimdi strateji kavramını tam olarak tanımladığımıza göre, Nash dengesi anlayışımızı bir seviye ileri götürebiliriz.

Agora Bilim Pazarı

Antarktika Hariç!

Kaplumbağalar her kıtada yaşar… ANTARKTİKA HARİÇ!
Ama bu durum değişmek üzere!
Dünyanın her köşesinde her hayvan türünden en az bir tane bulabiliriz, değil mi? Mesela her kıtada bir kaplumbağa vardır herhalde. Pek öyle değil! Antarktika kıtasında hiç kaplumbağa yok! Baykuş da… Yılan da… Hele böcek hiç yok! En azından şimdilik… Peki bu gerçeği kabullenmeyen azimli bir kafile Antarktika’ya gitmeyi kafaya koysa başlarına neler gelir sizce?
Hiçbir şeyin planlandığı gibi gitmediği bir doğa belgeseline hoş geldiniz.
Antarktika Hariç!, kararlılık ve şansını zorlamak üzerine neşeli bir hikâye. Hayvanlar ve dünyamıza dair ilginç ve eğlenceli bilgiler de cabası!

ALA YILIN KİTAPLARI SEÇKİSİ
2022

Devamını Göster

₺201.00

Satın Al Tüm Ürünler

Karma Strateji Nash Dengesi

Nash dengesi üzerine önceki yazıda kurduğumuz düşünceleri, olduğu gibi Karma Stratejilere de uyarlayabiliriz. Hatırlarsanız, önceki yazımızda, Nash dengesinin her oyuncunun diğer oyunculara en iyi cevabı verdiği durum olarak tanımlamıştık. Saf strateji dengeler için en iyi cevap, oyuncuya mümkün olan en fazla kazancı sağlayan aksiyon idi. Karma stratejilerde ise, aksiyonlardan çıkarak bakış açımızı stratejiler, yani aksiyonlar üzerindeki olasılık dağılımları olarak genişlettik. Direkt olarak oyun matrisimizde yazan mutlak kazançları da, bu olasılık dağılımlarına göre şekillenen kazanç beklentilerine dönüştürdük. Bu tanımları olduğu gibi “en iyi cevap” konseptine uyarlamakta bir sakınca yoktur. Bu sebeple, artık “bir oyuncunun diğer oyunculara en iyi cevabı”nı, “o oyuncunun diğer oyuncuların stratejilerine göre, maksimum kazanç beklentisine sahip olacağı strateji” şeklinde tanımlayabiliriz. Aynı şekilde, Karma Strateji Nash Dengesi’ni de aynı Saf Strateji Nash Dengesi gibi, “her oyuncunun diğerlerine en iyi cevabı verdiği durum” olarak ifade edebiliriz.

Karma Strateji Nash Dengesi, bize önceki yazıdaki ufak bir sorunu gidermekte de yardımcı oluyor: saf stratejinin aksine, her oyunun bir karma strateji Nash dengesi olduğu matematiksel olarak gösterilebilir. (Bu kanıtın detayları bu yazıda verilmeyecektir.)

Peki, biraz Karma Strateji kavramı üzerine düşünelim. Bir oyuncunun Karma Strateji oynaması (yani tek bir aksiyona takılı kalmayıp, birden fazla aksiyonu farklı olasılıklarla oynaması) için ne gerekir?

Oyuncu 1’in, Karma Stratejisi’nde sıfırdan fazla olasılık verdiği, yani oynaması ihtimali olan iki hamle olduğunu düşünelim: A ve B. (Bu hamlelere o stratejinin desteği denilmektedir.) Diyelim ki, Oyuncu 1’in sırasıyla A hamlesini yapmaktan ve B hamlesini yapmaktan beklediği kazançlar, KBA ve KBB olsun. Bu iki değer, oyunun yapısına ve diğer oyuncuların stratejilerine göre değişkenlik gösterebilir. Oyuncunun seçeceği stratejiden kazanç beklentisi de KB olsun. Oyuncu, bu stratejide A’yı p, B’yi ise (1-p) olasılıkla seçecek olsun. KB’nin, p’ye göre değiştiğini (yani p’nin fonksiyonu olduğunu) unutmayın: Oyuncu A’ya daha fazla ağırlık verirse, kazanç beklentisi KBB’den uzaklaşıp KBA’ya yaklaşacaktır. Buna göre,

KB = KBA*p + KBB*(1-p) = (KBA-KBB)*p + KBB, 0≤p≤1

Bu, doğrusal bir fonksiyondur. Fonksiyonun grafiğini çizecek olursak,

veya

KBA’nın mı, KBB’nin mi daha büyük olduğuna göre, elimizde iki farklı grafik olabiliyor. Açıkça görüldüğü üzere,

1) Eğer KBBA) noktasında, yani sadece A aksiyonunu oynadığı noktada,

2) Eğer KBAB) noktasında, yani sadece B aksiyonunu oynadığı noktada

elde edecektir. Ancak biz, bu oyuncunun bir Karma Strateji uygulamasını istiyoruz: Yani ne A’ya, ne de B’ye %100 ağırlık vermemesi (p’nin 0 veya 1 olmaması) gerekiyor. Bunu sağlamanın tek yolu da, KBA=KBB şartının sağlanmasıdır. Bu şart sağlanırsa grafik,

Şeklinde olacaktır ve oyuncunun hangi olasılıkla hangi hamleyi yaptığının, kazanç beklentisi üzerinde hiçbir etkisi olmayacaktır. Bir başka deyişle, oyuncu için p değerinin ne olduğu hiçbir şey fark etmeyecektir, oyuncu bu konuda umursamaz olacaktır. Burada sadece iki hamleli durumda gösterdiğimiz bu sonucu, istediğimiz sayıda hamle için de kolaylıkla gösterebiliriz.

Aslında, bu son derece anlam verici bir durum: Eğer bir oyuncu, bir hamleden diğerlerine göre daha fazla kazanç bekleyecek olursa, ikisi arasında onu tercih edecektir. Eğer stratejiler, yani olasılık dağılımları olarak bakmak gerekirse de, maksimum olasılığı (yani %100) o hamleye verecektir. Bu yüzden, bir oyuncunun Karma Strateji oynaması için gerekli şart, oyuncunun hamleler arasında umursamaz olmasıdır.

Peki, oyuncu tüm p değerleri arasında umursamazsa, yani hangisini seçtiği fark etmezse, o zaman bu olasılık dağılımı nasıl belirlenecektir? Bu sorunun cevabı, Karma Strateji uygulamanın şartında gizli. Birazdan vereceğimiz örnekte açıkça göreceğimiz üzere, oyuncunun farklı aksiyonlardan bekleyeceği kazançların ne olacağı, diğer oyuncuların uygulayacağı stratejilere göre şekillenecektir. Yani, iki oyunculu bir oyunda, Oyuncu 1’in Karma Strateji oynamasını istiyorsak, Oyuncu 2’nin stratejisi Oyuncu 1’in hamlelerinden beklediği kazancı eşitleyecek şekilde olmalıdır. (KBA=KBB) Bunu tersine çevirirsek, hangi hamleyi ne olasılıkla oynayacağını umursamayan bir Oyuncu 1, karma strateji Nash dengesi için Oyuncu 2’nin kazanç beklentilerinin aynı olmasını sağlayacak bir strateji uygulamalıdır. Eğer bu iki oyuncudan biri stratejisindeki olasılık dağılımlarını değiştirecek olursa, diğer oyuncunun kazanç beklentileri eşit olmaktan çıkacak ve denge bozulacaktır.

Bu dediklerimizi, tanıdık bir örnekte görelim.

Örnek: Penaltı Vuruşu

Yukarıda, bir penaltı vuruşunun basitleştirilmiş versiyonunun, normal formda ifadesini görüyoruz. Bu basitleştirilmiş versiyonda, vurucu ya sağa ya da sola vurabilir, kaleci de ya sağa ya da sola atılabilir. (Gerçeğe uygun olarak, kararı aynı anda vermek zorundalar.) Eğer kaleci, vurucunun seçtiği yöne atılırsa, topu kurtarmış olacaktır; aksi takdirde vurucu gol atarak puan kazanacaktır. Ancak, vurucu sağa vurmakta çok başarılı değildir, bu yüzden kaleci öteki tarafa atılsa dahi, sağa vurunca gol olması olasılığı sadece %75’tir. (Yani top %25 ihtimalle auta gider.)

Bu oyunda, vurucu p olasılıkla sola vuracakken, kaleci de q olasılıkla sola atılacaktır.

Bir bakıştan, tıpkı Para Eşleme oyunu gibi, Penaltı Vuruşu oyununda da bir saf strateji Nash dengesinin olmadığını ve bulmaya çalıştığımızda oyunun döngüye girdiğini görebiliriz. Ancak, yukarıda bahsettiğimiz gibi, her oyunda bir Nash Dengesi bulunmaktadır, ve bu denge saf strateji değil ise de karma stratejidir. Bu yüzden, biz de mutlaka bulacağımızı bilerek, Penaltı Vuruşu oyununun karma strateji Nash dengesini çözmeye çalışalım.

Kaleci’nin bir Karma Strateji uygulamasının şartı, yukarıda da bahsettiğimiz gibi,

KBK(sol)= KBK(sağ)

Vurucu, p ihtimalle sola, (1-p) ihtimalle sağa vuracak. Rakamları ve değişkenleri yerine koyarsak,

KBK(sol) = p*1+(1-p)*0.25 = KBK(sağ) = p*0+(1-p)*1

0.75p+0.25=1-p

1.75p=0.75

p=3/7 yani yaklaşık %43. Bu demektir ki, kalecinin karma strateji uygulamasının şartı, vurucunun %43 ihtimalle sola, %57 ihtimalle de sağa vurmasıdır.

p’yi bulduk. q’yu bulmak ve kalecinin stratejisini belirlemek için de, vurucunun karma strateji uygulama şartına bakalım.

KBV(sol)= KBV(sağ)

q*0+(1-q)*1 = q*0.75+(1-q)*0

1-q=0.75q

1.75q=1

q=4/7, yani yaklaşık %57. Yani, vurucunun karma strateji uygulamasının şartı, kalecinin %57 ihtimalle sola, %43 ihtimalle de sağa atılmasıdır. Bu oyunun Karma Strateji Nash Dengesi,

(p,q)=(0.43,0.57)

şeklinde ifade edilebilir.

Tabii, Penaltı Vuruşu oyununda bir saf strateji Nash Dengesi olmadığı için, Karma Strateji dengesinin bozulması durumunda ne olacağı çok açık olarak görülmüyor. Bu yüzden, bir de kısaca, Karma Strateji dengesinin bu kadar görünür olmadığı bir örneğe bakalım.

Örnek: Cinsiyetlerin Savaşı

Sürpriz! Daha önce iki Saf Strateji dengesini (partnerlerin aynı aktiviteyi yaptıkları iki durum) bulduğumuz Cinsiyetlerin Savaşı oyununda, bir de Karma Strateji Nash Dengesi bulunmakta. Bu denge, aynı Penaltı Vuruşu oyununda uyguladığımız metod ile kolayca bulunabilir. Biz, asıl incelemek istediğimiz şey dengenin çözümü olmadığı için, o adımları geçeğiz. Eğer siz kendiniz yapmak isteyecek olursanız, karma strateji dengede erkeğin %67 ihtimalle sinemaya, dişinin de %33 ihtimalle sinemaya gittiğini görebilirsiniz. Bu durumlarda, erkeğin de dişinin de sinemaya veya operaya gitmeyi seçmeleri durumunda bekledikleri kazançlar aynı olacaktır.

Bu örnekte esas incelemek isteyeceğimiz, bu karma dengeyi oynatırsak ne olacağıdır. Söz gelimi, erkek sinemaya biraz daha ağırlık vererek %75 ihtimalle sinemaya gitmeyi seçsin. Bu durumda, dişinin sinemadan kazanç beklentisi,

0.75*1=0.75

olurken, operadan kazanç beklentisi,

0.25*2=0.5

olacaktır, ve kendisi sinemayı seçecektir. (%100 olasılıkla.) Ancak dişinin sinemayı seçmesi ile, erkeğin operadan kazanç beklentisi sıfıra düşecek, sinemadan kazanç beklentisi ise 2’ye çıkacaktır, dolayısıyla erkek de sinemaya %100 ağırlık verecektir. Böylece, oyundaki diğer Nash dengelerinden biri olan (Sinema, Sinema) dengesine ulaşılmış olacaktır. Benzer bir durum, dengenin opera yönünde değişmesi durumu için de söylenebilir.

Yine fiziksel denge ile anoloji kuracak olursak, bunu tıpkı içinde birkaç tane bölgesel çukur olan engebeli ve sürtünmesiz bir yüzeye ve o yüzeye bırakılan bir topa benzetebiliriz. Top, yüzey sürtünmesiz olduğu için, bir çukura düşene kadar ivmeli hareket edecektir. Ancak bir çukura düştüğünde fiziksel dengeye ulaşacak ve duracaktır. Bu, yüzeydeki dengelerden sadece biridir. Eğer birisi topu o çukurdan yukarı iterek dengeyi bozacak olursa, top bir kez daha hareket etmeye başlayacak ve yine bir çukura (dengenin hangi yönde bozulduğuna göre, önceki veya bir başkası) düşüp dengeye ulaşana kadar harekete devam edecektir. Cinsiyetlerin Savaşı oyununda da benzer şekilde, dengeyi bozduğumuzda oyun bozulan yöne göre başka bir denge bulacaktır.

Karma Strateji Denge’yi Yorumlamak

Şu anda bu yazıyı okuyan pek çok okurumuzun, işin matematiğini anlasalar bile, Karma Strateji Nash Dengesi hakkında kafalarında bazı soru işaretleri olduğunu tahmin edebiliyoruz. Baktığınızda, ortada pek çok açıdan çok da mantıklı olmayan bir durum var gibi gözüküyor: Bir oyuncu, hangi hamleyi yapacağını umursamıyor. Ancak karşısındaki rakibin hangi hamleyi hangi olasılıkla yapacağını bir şekilde biliyor, ve buna uygun bir olasılık dağılımı üzerinden bir strateji uyguluyor… Kulağa biraz saçma geliyor, değil mi?

Aslında karma strateji dengelerin yorumlanmasının, herhangi bir olasılık probleminin yorumlanmasından çok bir farkı yoktur. Sadece bunu, oyun gibi soyut bir bağlamda, ve aktörlerinin (genelde) insan gibi bilinçli karar veren bir varlık olduğu durumda görmek biraz kafa karıştırıcı olabiliyor. Biz de, bu durumlara herhangi bir olasılık dağılımından analojiler kurarak bakalım. Kolaylık olması açısından altı yüzlü, her yüzünün gelmesi eşit olasılığa sahip olan bir zar gibi popüler bir örneği ele alalım.

Öncelikle, uygulanan deneyin (zar atılması) fiziksel doğasından kaynaklanan bir olasılık dağılımı vardır ve bu dağılım bize, her yüzün gelme ihtimalinin ⅙ olduğunu söyler. Ancak bu, deneyin sonucunda bu yüzlerden sadece birinin görüleceği gerçeğini değiştirmez: Deneyden önce bir olasılık dağılımı olan “sonuç,” deneyden sonra gerçeğe dönüşmüştür. Benzer şekilde bu, bilinçli gerçekleşen bir olay değildir.

Karma strateji uygulayan bir oyuncu için de aynı şey geçerlidir. Oyuncu tek bir hamle oynayacak olsa da, bilinçli olarak veya olmayarak bunu bir olasılık dağılımı üzerinden seçebilir. Aklınıza, bir defa oynanan bir taş-kağıt-makas oyununda ne düşündüğünüzü getirmeye çalışın. Rakibinizin hamlesini bilmiyorsanız taşın da, kağıdın da, makasın da kazanma şansı eşittir. Eğer tamamen kazanmak için oynuyorsanız (yani, taşı daha çok sevdiğiniz için taş oynamıyorsunuz, tamamen kazandıracağını düşündüğünüz için o hamleyi yapıyorsunuz) o zaman bu üçünden birini nasıl seçersiniz? Tamamen rastgele! Siz, bir el için bilinçli seçim yaptığınızı söyleyebilirsiniz… Peki ya, 10 el için? 100 el? 1000 el? Hepsinde, tamamen rastgele olarak üç opsiyondan birini seçeceksiniz. Birine, diğerinden fazla ağırlık vermeniz sizin yararınıza olmaz (örneğin, 1000 elin 600’ünde taş seçmek) zira bu rakibinizin sizin neye ağırlık verdiğinizi anlamasını sağlar, ve o da ona göre stratejisini değiştirir. Bu, tıpkı altı yüzlü bir zarı 6000 defa attığınızda, her sayının yaklaşık 1000 defa gelmesini beklemek gibidir, yani istatistiki olarak bize bir fikir verir.

Karma strateji Nash dengesinin iyi bir tahmin aracı olduğunu kanıtlayan pek çok veri de vardır. Bunlardan biri de, yukarıda incelediğimiz Penaltı Vuruşu oyununa çok benzer bir veridir. Bu incelemede, 1467 penaltı vuruşu incelenmiştir. Bu vuruşlarda görülen istatistik,

1) hem kalecinin, hem vurucunun sol tarafı seçtiği durumların %58’inde gol oluyor,

2) hem kalecinin, hem vurucunun sağ tarafı seçtiği durumların %70’inde gol oluyor,

3) kalecinin sol, vurucunun sağ tarafı seçtiği durumların %93’ünde gol oluyor,

4) kalecinin sağ, vurucunun sol tarafı seçtiği durumların %95’inde gol oluyor,

şeklindedir. Bunu, bir oyun olarak şöyle yazabiliriz:

Bu oyunu, yukarıdaki örnek gibi çözecek olursanız, p’nin 0.38, q’nun da 0.42 olduğunu göreceksiniz. Bu çözüme göre, vurucunun %42 olasılıkla sola vurmasını, kalecinin de %42 olasılıkla sola atılmasını bekleriz. Gerçekten de, aynı incelemeden gelen veriler bize kalecilerin tüm vuruşların %42’sinde sola atıldığını, vurucuların ise tüm vuruşlarından %40’ını sola vurduğunu söylüyor… Yani, teorik çözümün bulduğu sonuçların neredeyse aynısı! Bu bağlamda, karma strateji Nash dengesinin bize, sadece oyuncuların aklından geçenler hakkında bir fikir vermediğini, aynı zamanda oyunlar defalarca ve defalarca tekrarlanırsa elimize hangi istatistiğin geçeceğini tahmin ettiğini söyleyebiliriz.

Peki, bir oyunu neden karma strateji uygulamak istesin ki? Bu sorunun cevabı daha açık. Birinci sebebi, rakibinin kafasını karıştırmak olabilir. Tıpkı, Para Eşleme ve Penaltı Vuruşu oyunlarında olduğu gibi. Bu oyunlarda, eğer siz bir seçime takılıp kalırsanız, rakibiniz de ona göre hareket edecek ve oyunu kazanacaktır. Tamamen oyunların yapısından ve kazanç dağılımından kaynaklanan bu doğal paradoksu çözmenin tek yolu, tek bir hamleyle yetinmemek, rakibinize birden fazla hamleyi uygulayacağınızı göstermek ve bu şekilde onun kafasını karıştırmaktır. Pratikte bunu, rakibinizin tecrübesi olarak görebilirsiniz: Rakibiniz, sizin önceki 20 elde “taş” seçtiğinizi görürse, 21. elde (ya da öncesinde) “kağıt”ı seçecektir ve oyunu kazanacaktır. Ama eğer 20 elin 6’sında “taş,” 7’sinde “kağıt,” ve diğer 7’sinde de “makas” seçtiğinizi görürse, bunlar arasında rastgele oynadığınızı anlar ve kesinlikle kazanacak bir strateji üretemez. Bu, oyun teorisinin doğası gereği “tecrübe ile öğrenme” konseptini içermesinin bir sonucudur. Aynı şekilde, bir kaleci de, gerek o anda karşısında olan vurucunun, gerekse diğer vurucuların asla tek bir tarafa takılı kalmadığını ve sürekli farklı yönlere vurduklarını bildiği için, kendi kazancını garantileyecek tek bir yön seçemez.

Karma stratejinin oynanmasının bir başka sebebi de, sizin öteki oyuncuların ne yapacağından emin olmamanız olabilir. Cinsiyetlerin Savaşı’ndaki karma denge buna harika bir örnektir: Eğer partnerinizin nereye gideceğinden emin değilseniz, sizin seçtiğiniz yer de bir oyundan ötekine farklılık gösterebilir veya bir olasılık dağılımı üzerinden belirlenebilir.

Ama tüm bu açıklamalar bir kenara, karma stratejiyi anlamanın en iyi yolu, onun bir “denge” olduğunu asla unutmamak, ve gerçek hayatta bir mana ifade etmese de, tüm oyuncuların diğerlerinin stratejilerini (olasılık dağılımlarını) bildiği durumda kendilerinin de o stratejiyi uygulayacaklarını ve bu seçimlerini değiştirmeyeceklerini kavramaktır. Bu, oyun teorisini tamamen teorik, pratikte çok anlamı olmayan bir alan olarak düşünmek demek değildir. Ama karma strateji denge kavramı karmaşık bir konsepttir ve bu tip konseptleri idrak etmenin en kolay yolu, çalışmaların ilerleyen kısımlarında sürekli karşılaşa karşılaşa onlara alışmak, uygulama alanlarını görerek de pratikte ifade ettikleri şeyleri anlamaktır. Bu yüzden, hala kafa karışıklığı yaşayan okurlarımıza da önerimiz, bu aşamada karma strateji dengelere fazla takılmamaları, sadece teorik olarak ne olduğunu anladıklarına emin olmaları, ve sabırla yazı dizimizin ilerleyen kısımlarına devam etmeleridir. Eminiz ki, zamanla bu kavramı anlayacak ve alışacaksınız.

Bir sonraki yazımızda, özel bir oyun türü olan (ve günlük hayatta gördüğümüz pek çok duruma uyarlanabilen) Bayes Oyunları’ndan bahsedeceğiz.

Evrim Ağacı, sizlerin sayesinde bağımsız bir bilim iletişim platformu olmaya devam edecek!

Evrim Ağacı'nda tek bir hedefimiz var: Bilimsel gerçekleri en doğru, tarafsız ve kolay anlaşılır şekilde Türkiye'ye ulaştırmak. Ancak tahmin edebileceğiniz gibi Türkiye'de bilim anlatmak hiç kolay bir iş değil; hele ki bir yandan ekonomik bir hayatta kalma mücadelesi verirken...

O nedenle sizin desteklerinize ihtiyacımız var. Eğer yazılarımızı okuyanların %1'i bize bütçesinin elverdiği kadar destek olmayı seçseydi, bir daha tek bir reklam göstermeden Evrim Ağacı'nın bütün bilim iletişimi faaliyetlerini sürdürebilirdik. Bir düşünün: sadece %1'i...

O %1'i inşa etmemize yardım eder misiniz? Evrim Ağacı Premium üyesi olarak, ekibimizin size ve Türkiye'ye bilimi daha etkili ve profesyonel bir şekilde ulaştırmamızı mümkün kılmış olacaksınız. Ayrıca size olan minnetimizin bir ifadesi olarak, çok sayıda ayrıcalığa erişim sağlayacaksınız.

Avantajlarımız

"Maddi Destekçi" Rozeti

Reklamsız Deneyim

%10 Daha Fazla UP Kazanımı

Özel İçeriklere Erişim

+5 Quiz Oluşturma Hakkı

Özel Profil Görünümü

+1 İçerik Boostlama Hakkı

ve Daha Fazlası İçin...

Aylık

Tek Sefer

₺50/Aylık

₺100/Aylık

₺150/Aylık

₺250/Aylık

₺500/Aylık

Destek Ol

₺50/Aylık

Bu Makaleyi Alıntıla

Okundu Olarak İşaretle

Paylaş

Sonra Oku

Notlarım

Yazdır / PDF Olarak Kaydet

Bize Ulaş

Yukarı Zıpla

Önceki Yazı Sonraki Yazı

Makalelerimizin bilimsel gerçekleri doğru bir şekilde yansıtması için en üst düzey çabayı gösteriyoruz. Gözünüze doğru gelmeyen bir şey varsa, mümkünse güvenilir kaynaklarınızla birlikte bize ulaşın!

Bu makalemizle ilgili merak ettiğin bir şey mi var? Buraya tıklayarak sorabilirsin.

Soru & Cevap Platformuna Git

Bu Makale Sana Ne Hissettirdi?

Kaynaklar ve İleri Okuma

Y. Shoham, et al. Game Theory. (2 Eylül 2019). Alındığı Tarih: 2 Eylül 2019. Alındığı Yer: Coursera | Arşiv Bağlantısı
Y. Shoham, et al. Game Theory Ii: Advanced. (2 Eylül 2019). Alındığı Tarih: 2 Eylül 2019. Alındığı Yer: Coursera | Arşiv Bağlantısı
S. Tadelis. (2013). Game Theory: An Introduction. ISBN: 0691129088. Yayınevi: Princeton University Press.
M. O. Jackson. A Brief Introduction To The Basics Of Game Theory. (2 Eylül 2019). Alındığı Tarih: 2 Eylül 2019. Alındığı Yer: ETH Zürich | Arşiv Bağlantısı
M. O. Jackson. Mechanism Theory. (2 Eylül 2019). Alındığı Tarih: 2 Eylül 2019. Alındığı Yer: Stanford University | Arşiv Bağlantısı
M. O. Jackson. Matching, Auctions, And Market Design. (19 Ağustos 2013). Alındığı Tarih: 2 Eylül 2019. Alındığı Yer: Research Gate | Arşiv Bağlantısı

Evrim Ağacı'na her ay sadece 1 kahve ısmarlayarak destek olmak ister misiniz?

Şu iki siteden birini kullanarak şimdi destek olabilirsiniz:

kreosus.com/evrimagaci | patreon.com/evrimagaci

Çıktı Bilgisi: Bu sayfa, Evrim Ağacı yazdırma aracı kullanılarak 19/08/2025 22:01:31 tarihinde oluşturulmuştur. Evrim Ağacı'ndaki içeriklerin tamamı, birden fazla editör tarafından, durmaksızın elden geçirilmekte, güncellenmekte ve geliştirilmektedir. Dolayısıyla bu çıktının alındığı tarihten sonra yapılan güncellemeleri görmek ve bu içeriğin en güncel halini okumak için lütfen şu adrese gidiniz: https://evrimagaci.org/s/450

İçerik Kullanım İzinleri: Evrim Ağacı'ndaki yazılı içerikler orijinallerine hiçbir şekilde dokunulmadığı müddetçe izin alınmaksızın paylaşılabilir, kopyalanabilir, yapıştırılabilir, çoğaltılabilir, basılabilir, dağıtılabilir, yayılabilir, alıntılanabilir. Ancak bu içeriklerin hiçbiri izin alınmaksızın değiştirilemez ve değiştirilmiş halleri Evrim Ağacı'na aitmiş gibi sunulamaz. Benzer şekilde, içeriklerin hiçbiri, söz konusu içeriğin açıkça belirtilmiş yazarlarından ve Evrim Ağacı'ndan başkasına aitmiş gibi sunulamaz. Bu sayfa izin alınmaksızın düzenlenemez, Evrim Ağacı logosu, yazar/editör bilgileri ve içeriğin diğer kısımları izin alınmaksızın değiştirilemez veya kaldırılamaz.

Kategoriler ve Etiketler

Tümünü Göster