Oyun Teorisi - 3: Strateji Kavramı ve Karma Stratejiler

Yazdır Oyun Teorisi - 3: Strateji Kavramı ve Karma Stratejiler
 

Yeniden herkese merhabalar. Yazı dizimizin bu kısmında, bir önceki yazıda giriş yaptığımız Nash dengesi konseptine daha derinlemesine ineceğiz, bunun öncesinde de Oyun Teorisi’nin kritik noktalarından olan strateji kavramından bahsedeceğiz. Yine bu yazıda bahsedeceğimiz karma strateji Nash dengeleri, Oyun Teorisi’nin ne olduğu ve ne anlam ifade ettiği bakımından oldukça önemlidir.

 
 
Giriş
 
 
Hatırlarsanız, bir önceki yazımızda, Para Eşleme oyununda bir saf-strateji Nash dengesi bulunmadığından bahsetmiş, olası her dört sonuçta da oyunculardan birinin tercihini değiştirmek isteyeceğini ve bu isteklerin asla dengeye ulaşmayacak bir döngüye gireceğini belirtmiştik. Bir başka deyişle, ne sonuç çıkarsa çıksın, oyunculardan biri tercihinden (yazı veya tura) dolayı pişman olacaktır, ki bu da Nash dengesinin tanımı ile çelişmektedir.
 
Hatırlayacak olursanız, saf-strateji Nash dengelerinde oyuncuların kararlarını değiştirmeleri durumunda daha fazla kazanç elde edemeyecekleri bir durum söz konusuydu, ve bu konseptin isminin “denge” olmasının sebebi de buydu.
 
Tabii, bu noktada Nash dengesinin bir analiz yöntemi olduğunu da hatırlamak önem kazanıyor. Nash dengesi, oyuncuların hangi davranışta bulunacaklarını (en azından oyun defalarca tekrarlanıp bir tür “öğrenme” gerçekleşmeye başlayınca) tahmin etmemize yarayan, güçlü bir yöntemdir. Bu bağlamda, Para Eşleme oyunu için şu ana kadar bir Nash dengesi bulamamış olmamız demek, bu oyunda oyuncuların nasıl davranacağı hakkında da bir fikrimiz (henüz) yok demektir.
 
Şimdi, tüm bu tartışmaları bir kenara bırakırsak, siz Para Eşleme oyununu nasıl oynardınız? Ya da, Para Eşleme’nin 3x3’lük versiyonu olan, fazlaca aşina olduğumuz Taş Kağıt Makas oyununu nasıl oynuyorsunuz? Her seferinde taş çıkarıp, rakibinizin makası seçtiği zamanlarda kazanmayı mı umuyorsunuz? Yoksa tam tersine, elinizden geldiğince rastgele bir şekilde oynayarak, karşınızdaki oyuncunun kafasını karıştırmaya mı çalışıyorsunuz?
 
Para Eşleme’de de, Taş Kağıt Makas’ta da herhangi bir hamleye odaklanmak ve daima onu oynamak iyi bir fikir değildir. Teoride Nash dengesi olmayacağı için stabil bir sonuç doğurmayacaktır. Pratikte ise sizi tahmin edilebilir yapacak ve rakibinize (uzun vadede) avantaj kazandıracaktır. İki oyunda da maksimum kazanç beklentisi için hamlelerinizi rastgele yapmanız gerekmektedir.
 
 
Stratejiler
 
Şüphesiz ki şu ana kadar bahsettiğimiz konseptler, yukarıdaki rastgeleleştirme durumunu açıklamada yetersiz kalmaktadır. Bu noktada, bir oyunda seçebileceğiniz her türlü davranışı modelleyebilen strateji tanımı yardımımıza yetişiyor.
 
Hatırlarsanız, aksiyonları bir oyuncunun seçebileceği hamleler olarak tanımlamış, ve tekil aksiyonları küçük a, aksiyonlar kümesini de (gerek seçenekler, gerekse de kombinasyonlar olarak) büyük A harfi ile göstermiştik. Bu bağlamda, Para Eşleme oyunundaki “yazı” ve “tura” seçenekleri de birer aksiyondur.
 
Analiz ve davranış bağlamında aksiyonları kapsayan bir kavram olan stratejileri ise, bir oyuncunun “hamlelerini seçme şekli,” ya da daha resmi olarak “hamleleri üzerindeki olasılık dağılımı” olarak tanımlayabiliriz. Yani, bir oyuncunun “Ben bu oyunda %30 ihtimalle yazı, %70 ihtimalle tura oynayacağım ve o elde hangisini oynayacağımı tamamen bu olasılık dağılımına göre belirleyeceğim,” demesi, bir stratejidir. Aynı şekilde, “%25 tura, %75 yazı” da başka bir stratejidir. Tekil stratejiler küçük s ile, stratejilerin kombinasyonları da büyük S ile gösterilir.
 
Burada dikkat çekilmesi gereken bir nokta, oyuncunun seçebileceği aksiyonlar sınırlı olsa bile, seçebileceği stratejilerin (eğer birden fazla hamle opsiyonu varsa) daima sonsuz olmasıdır. Bunun sebebi çok açıktır: Herhangi bir hamleye 0 (%0 olasılık) ve 1 (%100 olasılık) arasında bir olasılık değeri yükleyecektir, ve bu aralık sürekli, yani sonsuz sayı içerek bir aralıktır. Bu sebeple bir oyuncunun seçebileceği sonsuz strateji vardır.
 
Peki, bu yazıdan önce baktığımız örneklerdeki Nash dengelerinde olasılıklardan hiç bahsetmediğimize göre, o durumlarda oyuncular hangi stratejileri uygulamışlardır? Oyuncular, bu örnek dengelerde tek bir hamleyi seçmektedirler ve bu tek hamleli stratejilere de saf strateji denmektedir. Önceki tüm örneklerde, oyuncular saf stratejiler uygulamaktadırlar, yani bir hamleye %100 olasılık vermekte, kalanlarını da %0 ihtimalle oynamaktadırlar. Bu dağılım da bir olasılık dağılımıdır ve strateji tanımına girmektedir.
 
Oyuncuların tek bir hamleyi oynamadıkları, belirli olasılıklarla farklı hamleleri oynadıkları durumlarda kullandıkları stratejilere ise karma strateji denilmektedir. Bu durum, şu anda okurlarımıza biraz soyut geliyor olsa da, yazının sonlarına doğru karma stratejilerin ve bu stratejiler arasındaki dengenin ne anlama geldiğini konuşacağız.
 
Peki, bir olasılık dağılımı ve dolayısıyla sonucu belli olmayan bir oyun söz konusu ise, oyuncunun kazancını nasıl hesaplayabiliriz? Bu durumda, elbette kesin bir kazançtan bahsetmek mümkün değildir. Ancak, oyuncuların olasılıklara bağlı olarak değişen birer kazanç beklentileri olduğunu söyleyebiliriz. Kazanç beklentisi, hangi durumun hangi olasılıkla gerçekleşeceğine bağlı olarak, bir oyuncunun o oyundan ne kadar kazanmayı beklediğidir, daha resmi olarak,
 
 
Bu gösterimde, P(a|s) çarpanı, “‘s’ ile gösterilen stratejilerin oynandığı bilindiğine göre, ‘a’ ile gösterilen aksiyon kümesinin oynanması olasılığı”nı ifade eder. Büyük bir E harfine benzeyen simge ise, ifadenin kalanının, aϵA şartını sağlayan (yani oynanan oyun çerçevesinde mümkün olan) tüm aksiyonlar için toplandığı anlamına gelmektedir. Dikkat ederseniz, “a” ve “s” sadece kazancı ile ilgilendiğimiz i oyuncusunun değil, tüm oyuncuların uyguladıkları stratejileri ve şeçtikleri aksiyonları kapsamaktadır. Oyunların sonucu sadece bir oyuncunun değil, tüm oyuncuların seçimleri ile belirlendiği için, bu oldukça doğaldır.
 
Eğer bu gösterim size bir şey ifade etmediyse dert etmeyin, aşağıdaki örnekte görünce anlamlandıracağınıza eminiz.
 
 
Şu şekildeki bir para eşleme oyununa, Oyuncu 1’in gözünden bakalım. Diyelim ki, Oyuncu 2’nin, %20 olasılıkla (0.2) “yazı” %80 olasılıkla (0.8) “tura” oynayacağını biliyoruz. Bu bağlamda, Oyuncu 1 “yazı” oynamayı seçerse (yani stratejisi, %100 olasılıkla “yazı,”, 0 olasılıkla “tura” oynamak olursa) kazanç beklentisi ne olur?
 
Bu durumda oyun, yüzde 20 ihtimalle (Y,Y) yani (1,-1) sonucunda, yüzde 80 ihtimalle de (Y,T) yani (-1,1) sonucunda bitecek, ve oyuncular bu kazançlara sahip olacaklardır. Buna göre,
 
KB1(Yazı) = 0.2*1 + 0.8*(-1) = -0.6
 
Yani Oyuncu 1, bu durumda -0.6 kazanca sahip olmayı beklemektedir. Tabii ki, bu oyunda Oyuncu 1 asla -0.6 diye bir kazanç elde edemez, ancak bu sayının ifade ettiği zaten bu değildir. Kazanç beklentisini, oyun (ya da Oyun Teorisi bağlamından çıkacak olursak, herhangi bir deney) defalarca ve defalarca tekrarlanırsa ortalamada ne çıkacağı olarak düşünebiliriz. Alternatif olarak, Oyuncu 1’in kaybetme ihtimalinin kazanma ihtimaline göre ne kadar fazla olduğunu bir göstergesi olarak da düşünülebilir. Olasılık Kuramı’ndaki “Beklenen Değer” kavramına aşinaysanız zaten Kazanç Beklentisi’nin de aynı şey olduğunun farkına varmışsınızdır.
 
Diğer bir durum olarak, Oyuncu 1’in “%50 ihtimalle Y, %50 ihtimalle T” stratejisini izlediğini düşünelim. Bu durumda oyun, %10 ihtimalle (Y,Y), %10 ihtimalle (T,Y), %40 ihtimalle (Y,T) ve %40 ihtimalle de (T,T) sonucunda bitecektir. Yani,
 
KB1(%50 Yazı %50 tura) = 0.1*1 + 0.1*(-1) + 0.4*(-1) + 0.4*1 = 0
 
Oyuncu 1, bu durumda 0 kazanç beklentisine sahiptir; yani örneğin, eğer oyun defalarca oynanırsa, bu tekrarların yarısında kazanıp yarısında kaybetmeyi bekler. Açıkça, “%50 yazı” stratejisi “%100 yazı” stratejisinden daha kazançlıdır. Bunun sebebi bir bakışta görülebilir: Oyuncu 1, eğer seçilen taraflar aynı olursa kazanacaktır. Oyuncu 2 “tura”ya ağırlık verdiği için, Oyuncu 1 de “tura”ya ne kadar ağırlık verirse, kazanç beklentisi o kadar fazla olacaktır.
 
Tabii ki, kazanç beklentisi kavramının anlamlı olması için, ekonomide çok sık yapılan, gerçekçi bir varsayıma başvurmalı ve oyuncuların risk-nötr olduklarını kabul etmeliyiz. Yani oyuncular sadece bekledikleri kazançlarını umursamaktadırlar, ve bu yolda ne kadar risk aldıklarını umursamamaktadırlar. Onlar için, yüzde 10 olasılıkla 1000 lira, %90 olasılıkla da 0 lira almaları durumu ile, yüzde 100 olasılıkla 100 lira almaları durumu arasında bir fark yoktur.
 
Şimdi strateji kavramını tam olarak tanımladığımıza göre, Nash dengesi anlayışımızı bir seviye ileri götürebiliriz.
 
 
Karma Strateji Nash Dengesi
 
Nash dengesi üzerine önceki yazıda kurduğumuz düşünceleri, olduğu gibi Karma Stratejilere de uyarlayabiliriz. Hatırlarsanız, önceki yazımızda, Nash dengesinin her oyuncunun diğer oyunculara en iyi cevabı verdiği durum olarak tanımlamıştık. Saf strateji dengeler için en iyi cevap, oyuncuya mümkün olan en fazla kazancı sağlayan aksiyon idi. Karma stratejilerde ise, aksiyonlardan çıkarak bakış açımızı stratejiler, yani aksiyonlar üzerindeki olasılık dağılımları olarak genişlettik. Direkt olarak oyun matrisimizde yazan mutlak kazançları da, bu olasılık dağılımlarına göre şekillenen kazanç beklentilerine dönüştürdük. Bu tanımları olduğu gibi “en iyi cevap” konseptine uyarlamakta bir sakınca yoktur. Bu sebeple, artık “bir oyuncunun diğer oyunculara en iyi cevabı”nı, “o oyuncunun diğer oyuncuların stratejilerine göre, maksimum kazanç beklentisine sahip olacağı strateji” şeklinde tanımlayabiliriz. Aynı şekilde, Karma Strateji Nash Dengesi’ni de aynı Saf Strateji Nash Dengesi gibi, “her oyuncunun diğerlerine en iyi cevabı verdiği durum” olarak ifade edebiliriz.
 
Karma Strateji Nash Dengesi, bize önceki yazıdaki ufak bir sorunu gidermekte de yardımcı oluyor: saf stratejinin aksine, her oyunun bir karma strateji Nash dengesi olduğu matematiksel olarak gösterilebilir. (Bu kanıtın detayları bu yazıda verilmeyecektir.)
 
Peki, biraz Karma Strateji kavramı üzerine düşünelim. Bir oyuncunun Karma Strateji oynaması (yani tek bir aksiyona takılı kalmayıp, birden fazla aksiyonu farklı olasılıklarla oynaması) için ne gerekir?
 
Oyuncu 1’in, Karma Stratejisi’nde sıfırdan fazla olasılık verdiği, yani oynaması ihtimali olan iki hamle olduğunu düşünelim: A ve B. (Bu hamlelere o stratejinin desteği denilmektedir.) Diyelim ki, Oyuncu 1’in sırasıyla A hamlesini yapmaktan ve B hamlesini yapmaktan beklediği kazançlar, KBA ve KBB olsun. Bu iki değer, oyunun yapısına ve diğer oyuncuların stratejilerine göre değişkenlik gösterebilir. Oyuncunun seçeceği stratejiden kazanç beklentisi de KB olsun. Oyuncu, bu stratejide A’yı p, B’yi ise (1-p) olasılıkla seçecek olsun. KB’nin, p’ye göre değiştiğini (yani p’nin fonksiyonu olduğunu) unutmayın: Oyuncu A’ya daha fazla ağırlık verirse, kazanç beklentisi KBB’den uzaklaşıp KBA’ya yaklaşacaktır. Buna göre,
 
KB = KBA*p + KBB*(1-p) = (KBA-KBB)*p + KBB, 0≤p≤1
 
Bu, doğrusal bir fonksiyondur. Fonksiyonun grafiğini çizecek olursak,
 
 
veya
 
 
KBA’nın mı, KBB’nin mi daha büyük olduğuna göre, elimizde iki farklı grafik olabiliyor. Açıkça görüldüğü üzere,
 
1) Eğer KBBA) noktasında, yani sadece A aksiyonunu oynadığı noktada,
 
2) Eğer KBAB) noktasında, yani sadece B aksiyonunu oynadığı noktada
elde edecektir. Ancak biz, bu oyuncunun bir Karma Strateji uygulamasını istiyoruz: Yani ne A’ya, ne de B’ye %100 ağırlık vermemesi (p’nin 0 veya 1 olmaması) gerekiyor. Bunu sağlamanın tek yolu da, KBA=KBB şartının sağlanmasıdır. Bu şart sağlanırsa grafik,
 
 
 
Şeklinde olacaktır ve oyuncunun hangi olasılıkla hangi hamleyi yaptığının, kazanç beklentisi üzerinde hiçbir etkisi olmayacaktır. Bir başka deyişle, oyuncu için p değerinin ne olduğu hiçbir şey fark etmeyecektir, oyuncu bu konuda umursamaz olacaktır. Burada sadece iki hamleli durumda gösterdiğimiz bu sonucu, istediğimiz sayıda hamle için de kolaylıkla gösterebiliriz.
 
Aslında, bu son derece anlam verici bir durum: Eğer bir oyuncu, bir hamleden diğerlerine göre daha fazla kazanç bekleyecek olursa, ikisi arasında onu tercih edecektir. Eğer stratejiler, yani olasılık dağılımları olarak bakmak gerekirse de, maksimum olasılığı (yani %100) o hamleye verecektir. Bu yüzden, bir oyuncunun Karma Strateji oynaması için gerekli şart, oyuncunun hamleler arasında umursamaz olmasıdır.
 
Peki, oyuncu tüm p değerleri arasında umursamazsa, yani hangisini seçtiği fark etmezse, o zaman bu olasılık dağılımı nasıl belirlenecektir? Bu sorunun cevabı, Karma Strateji uygulamanın şartında gizli. Birazdan vereceğimiz örnekte açıkça göreceğimiz üzere, oyuncunun farklı aksiyonlardan bekleyeceği kazançların ne olacağı, diğer oyuncuların uygulayacağı stratejilere göre şekillenecektir. Yani, iki oyunculu bir oyunda, Oyuncu 1’in Karma Strateji oynamasını istiyorsak, Oyuncu 2’nin stratejisi Oyuncu 1’in hamlelerinden beklediği kazancı eşitleyecek şekilde olmalıdır. (KBA=KBB) Bunu tersine çevirirsek, hangi hamleyi ne olasılıkla oynayacağını umursamayan bir Oyuncu 1, karma strateji Nash dengesi için Oyuncu 2’nin kazanç beklentilerinin aynı olmasını sağlayacak bir strateji uygulamalıdır. Eğer bu iki oyuncudan biri stratejisindeki olasılık dağılımlarını değiştirecek olursa, diğer oyuncunun kazanç beklentileri eşit olmaktan çıkacak ve denge bozulacaktır.
Bu dediklerimizi, tanıdık bir örnekte görelim.
 
 
Örnek: Penaltı Vuruşu
 
 
Yukarıda, bir penaltı vuruşunun basitleştirilmiş versiyonunun, normal formda ifadesini görüyoruz. Bu basitleştirilmiş versiyonda, vurucu ya sağa ya da sola vurabilir, kaleci de ya sağa ya da sola atılabilir. (Gerçeğe uygun olarak, kararı aynı anda vermek zorundalar.) Eğer kaleci, vurucunun seçtiği yöne atılırsa, topu kurtarmış olacaktır; aksi takdirde vurucu gol atarak puan kazanacaktır. Ancak, vurucu sağa vurmakta çok başarılı değildir, bu yüzden kaleci öteki tarafa atılsa dahi, sağa vurunca gol olması olasılığı sadece %75’tir. (Yani top %25 ihtimalle auta gider.)
 
Bu oyunda, vurucu p olasılıkla sola vuracakken, kaleci de q olasılıkla sola atılacaktır.
 
Bir bakıştan, tıpkı Para Eşleme oyunu gibi, Penaltı Vuruşu oyununda da bir saf strateji Nash  dengesinin olmadığını ve bulmaya çalıştığımızda oyunun döngüye girdiğini görebiliriz. Ancak, yukarıda bahsettiğimiz gibi, her oyunda bir Nash Dengesi bulunmaktadır, ve bu denge saf strateji değil ise de karma stratejidir. Bu yüzden, biz de mutlaka bulacağımızı bilerek, Penaltı Vuruşu oyununun karma strateji Nash dengesini çözmeye çalışalım.
 
Kaleci’nin bir Karma Strateji uygulamasının şartı, yukarıda da bahsettiğimiz gibi,
 
KBK(sol)= KBK(sağ)
 
Vurucu, p ihtimalle sola, (1-p) ihtimalle sağa vuracak. Rakamları ve değişkenleri yerine koyarsak,
 
KBK(sol) = p*1+(1-p)*0.25 = KBK(sağ) = p*0+(1-p)*1
 
0.75p+0.25=1-p
 
1.75p=0.75
 
p=3/7 yani yaklaşık %43. Bu demektir ki, kalecinin karma strateji uygulamasının şartı, vurucunun %43 ihtimalle sola, %57 ihtimalle de sağa vurmasıdır.
 
p’yi bulduk. q’yu bulmak ve kalecinin stratejisini belirlemek için de, vurucunun karma strateji uygulama şartına bakalım.
 
KBV(sol)= KBV(sağ)
 
q*0+(1-q)*1 = q*0.75+(1-q)*0
 
1-q=0.75q
 
1.75q=1
 
q=4/7, yani yaklaşık %57. Yani, vurucunun karma strateji uygulamasının şartı, kalecinin %57 ihtimalle sola, %43 ihtimalle de sağa atılmasıdır. Bu oyunun Karma Strateji Nash Dengesi,
 
(p,q)=(0.43,0.57)
 
şeklinde ifade edilebilir.
 
Tabii, Penaltı Vuruşu oyununda bir saf strateji Nash Dengesi olmadığı için, Karma Strateji dengesinin bozulması durumunda ne olacağı çok açık olarak görülmüyor. Bu yüzden, bir de kısaca, Karma Strateji dengesinin bu kadar görünür olmadığı bir örneğe bakalım.
 
 
Örnek: Cinsiyetlerin Savaşı
 
 
Sürpriz! Daha önce iki Saf Strateji dengesini (partnerlerin aynı aktiviteyi yaptıkları iki durum) bulduğumuz Cinsiyetlerin Savaşı oyununda, bir de Karma Strateji Nash Dengesi bulunmakta. Bu denge, aynı Penaltı Vuruşu oyununda uyguladığımız metod ile kolayca bulunabilir. Biz, asıl incelemek istediğimiz şey dengenin çözümü olmadığı için, o adımları geçeğiz. Eğer siz kendiniz yapmak isteyecek olursanız, karma strateji dengede erkeğin %67 ihtimalle sinemaya, dişinin de %33 ihtimalle sinemaya gittiğini görebilirsiniz. Bu durumlarda, erkeğin de dişinin de sinemaya veya operaya gitmeyi seçmeleri durumunda bekledikleri kazançlar aynı olacaktır.
 
Bu örnekte esas incelemek isteyeceğimiz, bu karma dengeyi oynatırsak ne olacağıdır. Söz gelimi, erkek sinemaya biraz daha ağırlık vererek %75 ihtimalle sinemaya gitmeyi seçsin. Bu durumda, dişinin sinemadan kazanç beklentisi,
 
0.75*1=0.75
 
olurken, operadan kazanç beklentisi,
 
0.25*2=0.5
 
olacaktır, ve kendisi sinemayı seçecektir. (%100 olasılıkla.) Ancak dişinin sinemayı seçmesi ile, erkeğin operadan kazanç beklentisi sıfıra düşecek, sinemadan kazanç beklentisi ise 2’ye çıkacaktır, dolayısıyla erkek de sinemaya %100 ağırlık verecektir. Böylece, oyundaki diğer Nash dengelerinden biri olan (Sinema, Sinema) dengesine ulaşılmış olacaktır. Benzer bir durum, dengenin opera yönünde değişmesi durumu için de söylenebilir.
 
Yine fiziksel denge ile anoloji kuracak olursak, bunu tıpkı içinde birkaç tane bölgesel çukur olan engebeli ve sürtünmesiz bir yüzeye ve o yüzeye bırakılan bir topa benzetebiliriz. Top, yüzey sürtünmesiz olduğu için, bir çukura düşene kadar ivmeli hareket edecektir. Ancak bir çukura düştüğünde fiziksel dengeye ulaşacak ve duracaktır. Bu, yüzeydeki dengelerden sadece biridir. Eğer birisi topu o çukurdan yukarı iterek dengeyi bozacak olursa, top bir kez daha hareket etmeye başlayacak ve yine bir çukura (dengenin hangi yönde bozulduğuna göre, önceki veya bir başkası) düşüp dengeye ulaşana kadar harekete devam edecektir. Cinsiyetlerin Savaşı oyununda da benzer şekilde, dengeyi bozduğumuzda oyun bozulan yöne göre başka bir denge bulacaktır.
 
 
Karma Strateji Denge’yi Yorumlamak
 
Şu anda bu yazıyı okuyan pek çok okurumuzun, işin matematiğini anlasalar bile, Karma Strateji Nash Dengesi hakkında kafalarında bazı soru işaretleri olduğunu tahmin edebiliyoruz. Baktığınızda, ortada pek çok açıdan çok da mantıklı olmayan bir durum var gibi gözüküyor: Bir oyuncu, hangi hamleyi yapacağını umursamıyor. Ancak karşısındaki rakibin hangi hamleyi hangi olasılıkla yapacağını bir şekilde biliyor, ve buna uygun bir olasılık dağılımı üzerinden bir strateji uyguluyor… Kulağa biraz saçma geliyor, değil mi?
 
Aslında karma strateji dengelerin yorumlanmasının, herhangi bir olasılık probleminin yorumlanmasından çok bir farkı yoktur. Sadece bunu, oyun gibi soyut bir bağlamda, ve aktörlerinin (genelde) insan gibi bilinçli karar veren bir varlık olduğu durumda görmek biraz kafa karıştırıcı olabiliyor. Biz de, bu durumlara herhangi bir olasılık dağılımından analojiler kurarak bakalım. Kolaylık olması açısından altı yüzlü, her yüzünün gelmesi eşit olasılığa sahip olan bir zar gibi popüler bir örneği ele alalım.
 
Öncelikle, uygulanan deneyin (zar atılması) fiziksel doğasından kaynaklanan bir olasılık dağılımı vardır ve bu dağılım bize, her yüzün gelme ihtimalinin ⅙ olduğunu söyler. Ancak bu, deneyin sonucunda bu yüzlerden sadece birinin görüleceği gerçeğini değiştirmez: Deneyden önce bir olasılık dağılımı olan “sonuç,” deneyden sonra gerçeğe dönüşmüştür. Benzer şekilde bu, bilinçli gerçekleşen bir olay değildir.
 
Karma strateji uygulayan bir oyuncu için de aynı şey geçerlidir. Oyuncu tek bir hamle oynayacak olsa da, bilinçli olarak veya olmayarak bunu bir olasılık dağılımı üzerinden seçebilir. Aklınıza, bir defa oynanan bir taş-kağıt-makas oyununda ne düşündüğünüzü getirmeye çalışın. Rakibinizin hamlesini bilmiyorsanız taşın da, kağıdın da, makasın da kazanma şansı eşittir. Eğer tamamen kazanmak için oynuyorsanız (yani, taşı daha çok sevdiğiniz için taş oynamıyorsunuz, tamamen kazandıracağını düşündüğünüz için o hamleyi yapıyorsunuz) o zaman bu üçünden birini nasıl seçersiniz? Tamamen rastgele! Siz, bir el için bilinçli seçim yaptığınızı söyleyebilirsiniz… Peki ya, 10 el için? 100 el? 1000 el? Hepsinde, tamamen rastgele olarak üç opsiyondan birini seçeceksiniz. Birine, diğerinden fazla ağırlık vermeniz sizin yararınıza olmaz (örneğin, 1000 elin 600’ünde taş seçmek) zira bu rakibinizin sizin neye ağırlık verdiğinizi anlamasını sağlar, ve o da ona göre stratejisini değiştirir. Bu, tıpkı altı yüzlü bir zarı 6000 defa attığınızda, her sayının yaklaşık 1000 defa gelmesini beklemek gibidir, yani istatistiki olarak bize bir fikir verir.
 
Karma strateji Nash dengesinin iyi bir tahmin aracı olduğunu kanıtlayan pek çok veri de vardır. Bunlardan biri de, yukarıda incelediğimiz Penaltı Vuruşu oyununa çok benzer bir veridir. Bu incelemede, 1467 penaltı vuruşu incelenmiştir. Bu vuruşlarda görülen istatistik,
 
1) hem kalecinin, hem vurucunun sol tarafı seçtiği durumların %58’inde gol oluyor,
2) hem kalecinin, hem vurucunun sağ tarafı seçtiği durumların %70’inde gol oluyor,
3) kalecinin sol, vurucunun sağ tarafı seçtiği durumların %93’ünde gol oluyor,
4) kalecinin sağ, vurucunun sol tarafı seçtiği durumların %95’inde gol oluyor,
 
şeklindedir. Bunu, bir oyun olarak şöyle yazabiliriz:
 
 
 
Bu oyunu, yukarıdaki örnek gibi çözecek olursanız, p’nin 0.38, q’nun da 0.42 olduğunu göreceksiniz. Bu çözüme göre, vurucunun %42 olasılıkla sola vurmasını, kalecinin de %42 olasılıkla sola atılmasını bekleriz. Gerçekten de, aynı incelemeden gelen veriler bize kalecilerin tüm vuruşların %42’sinde sola atıldığını, vurucuların ise tüm vuruşlarından %40’ını sola vurduğunu söylüyor… Yani, teorik çözümün bulduğu sonuçların neredeyse aynısı! Bu bağlamda, karma strateji Nash dengesinin bize, sadece oyuncuların aklından geçenler hakkında bir fikir vermediğini, aynı zamanda oyunlar defalarca ve defalarca tekrarlanırsa elimize hangi istatistiğin geçeceğini tahmin ettiğini söyleyebiliriz.
 
Peki, bir oyunu neden karma strateji uygulamak istesin ki? Bu sorunun cevabı daha açık. Birinci sebebi, rakibinin kafasını karıştırmak olabilir. Tıpkı, Para Eşleme ve Penaltı Vuruşu oyunlarında olduğu gibi. Bu oyunlarda, eğer siz bir seçime takılıp kalırsanız, rakibiniz de ona göre hareket edecek ve oyunu kazanacaktır. Tamamen oyunların yapısından ve kazanç dağılımından kaynaklanan bu doğal paradoksu çözmenin tek yolu, tek bir hamleyle yetinmemek, rakibinize birden fazla hamleyi uygulayacağınızı göstermek ve bu şekilde onun kafasını karıştırmaktır. Pratikte bunu, rakibinizin tecrübesi olarak görebilirsiniz: Rakibiniz, sizin önceki 20 elde “taş” seçtiğinizi görürse, 21. elde (ya da öncesinde) “kağıt”ı seçecektir ve oyunu kazanacaktır. Ama eğer 20 elin 6’sında “taş,” 7’sinde “kağıt,” ve diğer 7’sinde de “makas” seçtiğinizi görürse, bunlar arasında rastgele oynadığınızı anlar ve kesinlikle kazanacak bir strateji üretemez. Bu, oyun teorisinin doğası gereği “tecrübe ile öğrenme” konseptini içermesinin bir sonucudur. Aynı şekilde, bir kaleci de, gerek o anda karşısında olan vurucunun, gerekse diğer vurucuların asla tek bir tarafa takılı kalmadığını ve sürekli farklı yönlere vurduklarını bildiği için, kendi kazancını garantileyecek tek bir yön seçemez.
 
Karma stratejinin oynanmasının bir başka sebebi de, sizin öteki oyuncuların ne yapacağından emin olmamanız olabilir. Cinsiyetlerin Savaşı’ndaki karma denge buna harika bir örnektir: Eğer partnerinizin nereye gideceğinden emin değilseniz, sizin seçtiğiniz yer de bir oyundan ötekine farklılık gösterebilir veya bir olasılık dağılımı üzerinden belirlenebilir.
 
Ama tüm bu açıklamalar bir kenara, karma stratejiyi anlamanın en iyi yolu, onun bir “denge” olduğunu asla unutmamak, ve gerçek hayatta bir mana ifade etmese de, tüm oyuncuların diğerlerinin stratejilerini (olasılık dağılımlarını) bildiği durumda kendilerinin de o stratejiyi uygulayacaklarını ve bu seçimlerini değiştirmeyeceklerini kavramaktır. Bu, oyun teorisini tamamen teorik, pratikte çok anlamı olmayan bir alan olarak düşünmek demek değildir. Ama karma strateji denge kavramı karmaşık bir konsepttir ve bu tip konseptleri idrak etmenin en kolay yolu, çalışmaların ilerleyen kısımlarında sürekli karşılaşa karşılaşa onlara alışmak, uygulama alanlarını görerek de pratikte ifade ettikleri şeyleri anlamaktır. Bu yüzden, hala kafa karışıklığı yaşayan okurlarımıza da önerimiz, bu aşamada karma strateji dengelere fazla takılmamaları, sadece teorik olarak ne olduğunu anladıklarına emin olmaları, ve sabırla yazı dizimizin ilerleyen kısımlarına devam etmeleridir. Eminiz ki, zamanla bu kavramı anlayacak ve alışacaksınız.
 
Bir sonraki yazımızda, özel bir oyun türü olan (ve günlük hayatta gördüğümüz pek çok duruma uyarlanabilen) Bayes Oyunları’ndan bahsedeceğiz. Görüşmek dileğiyle.
 
Yazan: Zeki Doruk Erden (Evrim Ağacı)
 
Kaynaklar ve İleri Okuma:
  1. Shoham, Y., Professor, Jackson, M. O., Professor, & Leyton-Brown, K., Professor. Game Theory by Stanford University. Online course on Coursera. https://www.coursera.org/learn/game-theory-1
  2. Shoham, Y., Professor, Jackson, M. O., Professor, & Leyton-Brown, K., Professor. Game Theory II: Advanced Applications by Stanford University. Online course on Coursera. https://www.coursera.org/learn/game-theory-2
  3. Tadelis, S. (2013). Game Theory: An Introduction. 
  4. Jackson, M. O. A Brief Introduction to the Basics of Game Theory. 
  5. Jackson, M. O. Mechanism Theory.
  6. Jackson, M. O. Matching, Auctions, and Market Design. 
6 Yorum