Тридесетих година прошлог века Џон фон Нојман и Оскар Моргенштернпостали оснивачи нове занимљиве гране математике, која је названа „теорија игара“. Педесетих година прошлог века млади математичар Џон Неш се заинтересовао за ову област. Теорија равнотеже постала је тема његове дисертације, коју је написао када је имао 21 годину. Тако је рођена нова стратегија игре под називом "Насх Екуилибриум", која је заслужила Нобелову награду много година касније - 1994. године.
Дуга јаз између писања дисертације иуниверзално признат као тест за математичара. Генијалност без препознавања резултирала је озбиљним менталним поремећајима, али је Џон Неш успео да реши овај проблем захваљујући свом одличном логичком уму. Његова теорија „Нешовог еквилибријума” добила је Нобелову награду, а његов живот је снимљен у филму „Леп ум”.
Укратко о теорији игара
Пошто Нешова теорија равнотеже објашњава људско понашање у интеракцијским окружењима, стога је вредно размотрити основне концепте теорије игара.
Теорија игара проучава понашање учесника (агената)у условима међусобне интеракције попут игре, када исход зависи од одлука и понашања више људи. Учесник доноси одлуке на основу својих предвиђања о понашању других, што се назива стратегија игре.
Постоји и доминантна стратегија, у којој учесник добија оптималан резултат за свако понашање других учесника. Ово је играчева најбоља стратегија за победу.
Затвореникова дилема и научни пробој
Затвореника дилема је игра случај гдеучесници су приморани да доносе рационалне одлуке, постижући заједнички циљ у суочавању са сукобом алтернатива. Питање је коју ће од ових опција изабрати, уважавајући свој лични и општи интерес, као и немогућност да добије и једно и друго. Чини се да су играчи затворени у строге услове игре, што их понекад тера да размишљају веома продуктивно.
Ову дилему је проучавао амерички математичарЏон Неш. Равнотежа коју је створио била је револуционарна на свој начин. Ова нова идеја посебно је јасно утицала на мишљење економиста о томе како тржишни играчи бирају, узимајући у обзир интересе других, уз блиску интеракцију и укрштање интереса.
Најбоље је проучавати теорију игара на конкретним примерима, пошто ова математичка дисциплина сама по себи није сувотеоријска.
Пример дилеме затвореника
Примера ради, две особе су извршиле пљачку и завршиле урукама полиције и саслушавају се у посебним ћелијама. Истовремено, полицијски службеници сваком учеснику нуде повољне услове под којима ће бити пуштен ако сведочи против свог партнера. Сваки криминалац има следећи скуп стратегија које ће размотрити:
- Обојица сведоче у исто време и добијају по 2,5 године затвора.
- Обојица ћуте у исто време и добијају по годину дана, пошто ће у овом случају база доказа за њихову кривицу бити мала.
- Један сведочи и добија слободу, а други ћути и добија 5 година затвора.
Очигледно, исход случаја зависи од одлуке обојицеучесника, али не могу да се договоре јер седе у различитим ћелијама. Јасно је видљив и сукоб њихових личних интереса у борби за заједничке интересе. Сваки затвореник има две опције за акцију и 4 могућа исхода.
Ланац логичких закључака
Дакле, криминалац А разматра следеће опције:
- Ја ћутим и мој партнер ћути – обоје ћемо добити 1 годину затвора.
- Предајем партнера и он ме предаје – обоје добијамо 2,5 године затвора.
- Ја ћутим, а партнер ме отера - ја добијем 5 година затвора, а он слободу.
- Предајем партнера, али он ћути – ја добијам слободу, а он 5 година затвора.
Хајде да представимо матрицу могућих решења и исхода ради јасноће.
Табела вероватних исхода дилеме затвореника.
Питање је шта ће сваки учесник изабрати?
„Не можеш да ћутиш, не можеш да говориш“ или „Не можеш да ћутиш, не можеш да говориш“
Да бисте разумели избор учесника, морате проћи крозњегов ланац мисли. По образложењу злочинца А: ако ја ћутим, а мој партнер ћути, добићемо минималну казну (1 година), али не могу да знам како ће се он понашати. Ако он сведочи против мене, онда је боље да сведочим и ја, иначе бих могао да идем у затвор на 5 година. Боље је да служим 2,5 године него 5 година. Ако ћути, онда утолико више морам да сведочим, јер ћу тако добити слободу. Учесник Б аргументује на потпуно исти начин.
Није тешко схватити да је доминантна стратегија засваки од злочинаца треба да сведочи. Оптимална тачка ове игре долази када оба криминалца сведоче и добију своју „награду“ - 2,5 године затвора. Нешева теорија игара ово назива равнотежом.
Субоптимално Насх оптимално решење
Револуционарна природа Нешовог гледишта је тотаква равнотежа није оптимална када се узме у обзир појединачни учесник и његов лични интерес. На крају крајева, најбоља опција је ћутање и слобода.
Нешова равнотежа је тачка контактаинтересовања, где сваки учесник бира опцију која је за њега оптимална само ако други учесници изаберу одређену стратегију.
С обзиром на опцију када оба злочинцасу тихи и примају само 1 годину, можемо то назвати Парето-оптималном опцијом. Међутим, то је могуће само ако се криминалци унапред договоре. Али ни то не би гарантовало овакав исход, јер је искушење да се одступи од споразума и избегне казна велико. Недостатак потпуног поверења једни у друге и опасност од добијања 5 година приморавају нас да изаберемо опцију исповести. Једноставно је ирационално мислити да ће се учесници држати тихе опције док делују заједно. Овај закључак се може извести проучавањем Нешове равнотеже. Примери само потврђују поенту.
Себичан или рационалан
Нешова теорија равнотеже дала је невероватне резултате,оповргао раније постојеће принципе. На пример, Адам Смит је посматрао понашање сваког учесника као апсолутно себично, што је довело систем у равнотежу. Ова теорија је названа „невидљива рука тржишта“.
Џон Неш је то видео да су сви учеснициделује само у циљу остваривања сопствених интереса, то никада неће довести до оптималног групног резултата. С обзиром да је рационално размишљање својствено сваком учеснику, избор који нуди Нешова стратегија равнотеже је вероватнији.
Чисто мушки експеримент
Најбољи пример је игра Блонде Парадок, која, иако наизглед неприкладна, представља јасну илустрацију како функционише Нешова теорија игара.
У овој игри морате да замислите да је компанијаслободни момци су долазили у локал. У близини је група девојака, од којих је једна дража од осталих, рецимо плавуша. Како треба да се понашају момци да би добили најбољу девојку за себе?
Дакле, резоновање момака:ако сви почну да се упознају са плавушом, онда је највероватније нико неће упознати, онда ни њени пријатељи неће желети да је упознају. Нико не жели да буде други избор. Али ако момци одлуче да избегну плавушу, онда је велика вероватноћа да ће сваки од момака наћи доброг пријатеља међу девојкама.
Ситуација Нешове равнотеже није оптимална замомци, јер би, водећи само своје себичне интересе, свако изабрао плавушу. Може се видети да ће остваривање само себичних интереса довести до колапса групних интереса. Нешов еквилибријум би значио да сваки момак делује у свом сопственом интересу, што је у складу са интересима целе групе. Ово није оптимална опција за свакога лично, али је оптимална за све на основу укупне стратегије успеха.
Цео наш живот је игра
Доношење одлука у реалним условима је веомаличи на игру у којој од других учесника очекујете одређено рационално понашање. У послу, на послу, у тиму, у компанији, па чак и у односима са супротним полом. Од великих трансакција до обичних животних ситуација, све је подложно једном или оном закону.
Наравно, разматране ситуације игре сакриминалци и бар су само сјајне илустрације за демонстрирање Нешове равнотеже. Примери оваквих дилема се врло често јављају на реалном тржишту, а то је посебно тачно у случајевима када два монополиста контролишу тржиште.
Мешовите стратегије
Често смо укључени не у једну, већ одмах унеколико игара. Избор једне од опција у једној игри, вођен рационалном стратегијом, али завршава у другој игри. Након што донесете неколико рационалних одлука, можда ћете открити да нисте задовољни исходом. Шта да радим?
Хајде да размотримо две врсте стратегије:
- Чиста стратегија је понашање учесника које произилази из размишљања о могућем понашању других учесника.
- Мешовита стратегија или насумична стратегија је насумично смењивање чистих стратегија или одабир чисте стратегије са одређеном вероватноћом. Ова стратегија се такође назива рандомизована.
Узимајући у обзир овакво понашање, добијамо новоПоглед на Нешову равнотежу. Ако је раније речено да играч једном бира стратегију, онда се може замислити друго понашање. Могуће је претпоставити да играчи бирају стратегију насумично са одређеном вероватноћом. Игре у којима се Нешова равнотежа не може наћи у чистим стратегијама увек их имају у мешовитим.
Нешова равнотежа у мешовитим стратегијама назива се мешовита равнотежа. Ово је равнотежа где сваки учесник бира оптималну фреквенцију избора својих стратегија, под условом да други учесници бирају своје стратегије са датом фреквенцијом.
Пенали и мешана стратегија
У игри се може дати пример мешовите стратегиједо фудбала. Најбоља илустрација мешовите стратегије је можда извођење пенала. Дакле, имамо голмана који може да скочи само у један угао, и играча који ће извести пенал.
Дакле, ако први пут играч одабере стратегијуупутите ударац у леви угао, а голман такође падне у овај угао и ухвати лопту, како се онда догађаји развијају други пут? Ако играч погоди супротни угао, то је највероватније превише очигледно, али ударање у исти угао није ништа мање очигледно. Према томе, и голман и копер немају другог избора него да се ослоне на насумичан избор.
Тако, наизменичним случајним одабиром са специфичном чистом стратегијом, играч и голман покушавају да добију максималан резултат.