1930'larda John von Neumann ve Oskar Morgenstern"Oyun teorisi" olarak adlandırılan yeni bir ilginç matematik yönünün kurucuları oldu. 1950'lerde genç matematikçi John Nash bu alana ilgi duymaya başladı. Denge teorisi, 21 yaşında yazdığı tezinin konusu oldu. Bu, uzun yıllar sonra - 1994'te Nobel Ödülü'nü kazanan "Nash Dengesi" adlı oyunlar için yeni bir stratejinin doğuşu.
Tez yazmak ile tez yazmak arasındaki uzun boşlukmatematikçiler için evrensel bir sınav olarak kabul edilmiştir. Tanınmayan deha, ciddi zihinsel bozukluklara neden oldu, ancak John Nash, mükemmel mantıksal nedeni sayesinde bu sorunu çözmeyi başardı. "Nash dengesi" teorisi Nobel Ödülü'nü kazandı ve hayatı "Beautiful mind" ("A Beautiful Mind") filmine uyarlandı.
Bir bakışta oyun teorisi
Nash'in denge teorisi, insanların etkileşim içindeki davranışlarını açıkladığı için, oyun teorisinin temel kavramlarını göz önünde bulundurmaya değer.
Oyun teorisi, katılımcıların (aracıların) davranışlarını inceler.Bir oyun gibi birbirleriyle etkileşim koşullarında, sonuç birkaç kişinin kararlarına ve davranışlarına bağlı olduğunda. Katılımcı, oyun stratejisi olarak adlandırılan başkalarının davranışları hakkındaki tahminlerine dayanarak kararlar verir.
Katılımcının diğer katılımcıların herhangi bir davranışı için en uygun sonucu aldığı baskın bir strateji de vardır. Bu, oyuncunun en iyi kaybetmeme stratejisidir.
Tutuklunun ikilemi ve bilimsel buluş
Mahkumun İkilemi bir oyun vakasıdır.katılımcılar, alternatifler çatışmasında ortak bir hedefe ulaşarak rasyonel kararlar almaya zorlanırlar. Soru, kişisel ve genel çıkarlarının yanı sıra her ikisini de elde etmenin imkansızlığını fark ederek bu seçeneklerden hangisini seçeceğidir. Oyuncular zorlu oyun koşullarında kapana kısılmış gibi görünüyor, bu da bazen çok verimli düşünmelerini sağlıyor.
Bu ikilem Amerikalı bir matematikçi tarafından keşfedildi.John Nash. Ortaya çıkardığı denge, kendi yolunda devrimci oldu. Özellikle parlak bir şekilde, bu yeni düşünce, ekonomistlerin, piyasa oyuncularının, başkalarının çıkarlarını göz önünde bulundurarak, yakın etkileşim ve çıkarların kesişimi ile seçimlerini nasıl yaptıkları konusundaki görüşlerini etkiledi.
Oyun teorisini belirli örneklerle incelemek en iyisidir, çünkü bu matematiksel disiplinin kendisi kuru teorik değildir.
Bir mahkumun ikilemine bir örnek
Örnek, iki kişi bir soygun yaptı, içeri girdipolisin elinde ayrı hücrelerde sorgulanıyor. Aynı zamanda, polis memurları, her bir katılımcıya, ortağı aleyhine tanıklık etmesi halinde serbest bırakılacağı uygun koşullar sunar. Suçluların her birinin dikkate alması gereken aşağıdaki stratejiler vardır:
- Her ikisi de aynı anda ifade veriyor ve 2,5 yıl hapis cezasına çarptırılıyor.
- Her ikisi de aynı anda sessizdir ve her biri 1 yıl alır, çünkü bu durumda suçlarının kanıt temeli küçük olacaktır.
- Biri tanıklık edip özgürlüğüne kavuşurken, diğeri susup 5 yıl hapis cezasına çarptırılıyor.
Açıktır ki, davanın sonucu her ikisinin de kararına bağlıdır.ancak farklı hücrelerde oturdukları için bir anlaşmaya varamazlar. Ortak bir çıkar mücadelesinde kişisel çıkarlarının çatışması da açıkça görülmektedir. Mahkumların her birinin eylem için iki seçeneği ve sonuçlar için 4 seçeneği vardır.
mantıksal çıkarım zinciri
Bu nedenle, suçlu A aşağıdaki seçenekleri değerlendirir:
- Ben sessizim ve eşim sessiz - ikimiz de 1 yıl hapis cezası alacağız.
- Ortağımı teslim ediyorum ve o beni teslim ediyor - ikimiz de 2,5 yıl hapis cezası alıyoruz.
- Sessizim ve ortağım beni teslim ediyor - 5 yıl hapis cezası alacağım ve o özgür.
- Ortağımı teslim ediyorum ama sessiz - özgürlük alıyorum ve 5 yıl hapiste.
İşte netlik için olası çözümlerin ve sonuçların bir matrisi.
Mahkûmun ikileminin olası sonuçlarının tablosu.
Soru şu ki, her katılımcı ne seçecek?
"Sessizlik konuşamazsın" veya "Sessiz olamazsın, konuş"
Bir katılımcının seçimini anlamak için şunları yapmanız gerekir:düşüncelerinin zinciri. Suçlu A'nın gerekçesine göre: Eğer susarsam ve partnerim bir şey söylemezse, asgari süreyi (1 yıl) alırız, ama nasıl davranacağını bulamıyorum. Benim aleyhime tanıklık ederse, benim de tanıklık etmem daha iyi olur, yoksa 5 yıl hapis cezasına çarptırılırım. 5 yıldansa 2,5 yıl hapse girmek benim için daha iyi. Eğer sessiz kalırsa, o zaman daha çok tanıklık etmem gerekiyor, çünkü bu şekilde özgür olacağım. Katılımcı B de aynı şekilde savunuyor.
için baskın strateji olduğunu anlamak zor değil.suçluların her biri tanıklık ediyor. Bu oyunun en uygun noktası, her iki suçlunun da ifade vermesi ve "ödüllerini" alması - 2,5 yıl hapis cezası. Nash oyun teorisi buna denge diyor.
Optimal olmayan optimal Nash çözümü
Nash görüşünün devrimci doğası şudur:Bireysel katılımcıyı ve onun kişisel çıkarlarını düşünürsek, böyle bir denge optimal değildir. Sonuçta, en iyi seçenek sessiz kalmak ve serbest bırakılmak.
Nash dengesi temas noktasıdırHer bir katılımcının, yalnızca diğer katılımcıların belirli bir strateji seçmesi koşuluyla kendisi için en uygun seçeneği seçtiği çıkarlar.
Her iki suçlunun da bulunduğu seçeneği göz önünde bulundurarakSessizler ve sadece 1 yıl alıyorlar, buna Pareto-optimal seçeneği diyebiliriz. Ancak bu, ancak suçluların önceden bir anlaşmaya varmaları halinde mümkündür. Ancak bu bile bu sonucu garanti etmez, çünkü geri adım atma ve cezadan kaçınma eğilimi büyüktür. Birbirlerine tam güven eksikliği ve 5 yıl alma tehlikesi tanıma ile seçeneği seçmek zorunda kalıyor. Katılımcıların uyum içinde hareket ederek sessiz seçeneğe bağlı kalacağını varsaymak basitçe mantıksızdır. Nash dengesini incelersek bu sonuca varabiliriz. Örnekler sadece durumu kanıtlıyor.
Bencil veya mantıklı
Nash'in denge teorisi çarpıcı bulgular verdi,daha önce var olan ilkeleri çürütmüştür. Örneğin, Adam Smith, katılımcıların her birinin davranışını sistemi dengeye getiren tamamen bencil olarak gördü. Bu teoriye “piyasanın görünmez eli” adı verildi.
John Nash, tüm katılımcılarınsadece kendi çıkarları doğrultusunda hareket etmek, bu asla optimal bir grup sonucuna yol açmaz. Rasyonel düşünmenin her katılımcının doğasında olduğu göz önüne alındığında, Nash dengesi stratejisinin sunduğu seçenek daha olasıdır.
Tamamen erkek deneyi
Çarpıcı bir örnek, uygunsuz görünse de, Nash'in oyun teorisinin nasıl çalıştığının canlı bir örneği olan "sarışın paradoksu" oyunudur.
Bu oyunda, şirketinbedava adamlar bara geldi. Yakınlarda, biri diğerlerine tercih edilen bir grup kız var, diyor bir sarışın. Erkekler kendilerine en iyi arkadaşı bulmak için nasıl davranabilirler?
Yani, adamlar akıl yürütüyor:herkes sarışınla tanışmaya başlarsa, büyük olasılıkla kimse onu almayacak, o zaman arkadaşları buluşmak istemeyecek. Kimse ikinci yedek olmak istemez. Ama erkekler sarışından kaçınmayı seçerse, o zaman her erkeğin kızlar arasında iyi bir arkadaş bulma olasılığı yüksektir.
Nash dengesi için optimal değilbeyler, çünkü sadece kendi bencil çıkarlarının peşinden koşan herkes bir sarışın seçerdi. Sadece bencil çıkarların peşinde koşmanın, grup çıkarlarının çöküşüyle eş anlamlı olacağı görülebilir. Nash dengesi, her erkeğin tüm grubun çıkarlarıyla temas halinde olan kendi çıkarları doğrultusunda hareket etmesi anlamına gelecektir. Bu, kişisel olarak herkes için en uygun seçenek değil, genel başarı stratejisine dayalı olarak herkes için en uygun seçenektir.
Bütün hayatımız bir oyun
Gerçek dünyada karar verme çokdiğer katılımcılardan belirli rasyonel davranışlar beklediğinizde bir oyuna benzer. İş yerinde, işte, takımda, şirkette ve hatta karşı cinsle ilişkilerde. Büyük anlaşmalardan sıradan yaşam durumlarına kadar her şey şu ya da bu yasaya uyar.
Tabii ki, düşünülen oyun durumları ilesuçlular ve bar, Nash dengesinin harika örnekleridir. Bu tür ikilemlerin örnekleri sıklıkla gerçek piyasada ortaya çıkar ve bu özellikle piyasayı iki tekelcinin kontrol ettiği durumlarda geçerlidir.
Karma stratejiler
Genellikle bir tanesine değil, hemenbirkaç oyun. Rasyonel bir stratejiyle yönlendirilen bir oyun için seçeneklerden birini seçmek, ancak kendinizi başka bir oyunda buluyorsunuz. Birkaç mantıklı karardan sonra, sonucunuzdan memnun olmadığınızı görebilirsiniz. Ne yapılmalı?
İki tür strateji düşünün:
- Saf strateji, bir katılımcının diğer katılımcıların olası davranışları hakkında düşünmekten kaynaklanan davranışıdır.
- Karışık strateji veya rastgele strateji, saf stratejilerin rastgele bir şekilde değiştirilmesi veya belirli bir olasılıkla saf bir stratejinin seçilmesidir. Bu strateji aynı zamanda randomize olarak da adlandırılır.
Bu davranışı göz önünde bulundurarak, yeni birNash dengesine bakın. Daha önce oyuncunun bir kez strateji seçtiği söylenmişse, o zaman başka bir davranış hayal edilebilir. Oyuncuların belirli bir olasılıkla rastgele bir strateji seçtikleri varsayılabilir. Nash dengesini saf stratejilerde bulamayan oyunlarda her zaman karışık stratejiler bulunur.
Karma stratejilerdeki Nash dengesine karma denge denir. Bu, diğer katılımcıların belirli bir sıklıkta stratejilerini seçmeleri koşuluyla, her bir katılımcının stratejilerini seçmek için en uygun sıklığı seçtiği bir dengedir.
Penaltılar ve karma strateji
Oyunda bir karma strateji örneği bulunabilirfutbolun içine. Karışık stratejinin en iyi örneği belki de penaltı atışlarıdır. Yani sadece bir korner atlayabilen bir kalecimiz ve penaltıyı kullanacak bir oyuncumuz var.
Yani, oyuncu ilk kez stratejiyi seçersesol köşeye bir vuruş yapın ve kaleci de bu köşeye düşüp topu yakalayacak, olaylar ikinci kez nasıl gelişebilir? Bir oyuncu karşı köşeye tekme atarsa, bu muhtemelen çok açıktır, ancak aynı köşeye yapılan bir vuruş daha az belirgin değildir. Bu nedenle, hem kalecinin hem de vurucunun rastgele bir seçime güvenmekten başka seçeneği yoktur.
Böylece, belirli bir temiz strateji ile değişen rastgele seçimler yaparak, oyuncu ve kaleci maksimum sonucu almaya çalışır.