Kognitívne fakty o všetkom / Správy a spoločnosť / Nashova rovnováha. Teória hier pre ekonómov (John Nash)

Nashova rovnováha. Teória hier pre ekonómov (John Nash)

V 30. rokoch 20. storočia John von Neumann a Oscar Morgensternsa stali zakladateľmi nového zaujímavého smeru v matematike, ktorý sa nazýval „teória hier“. V 50. rokoch sa o túto oblasť začal zaujímať mladý matematik John Nash. Teória rovnováhy sa stala predmetom jeho dizertačnej práce, ktorú napísal ako 21-ročný. Tak sa zrodila nová herná stratégia s názvom „Nash Equilibrium“, ktorá o mnoho rokov neskôr – v roku 1994 – získala Nobelovu cenu.

Dlhá prestávka medzi písaním dizertačnej práce auniverzálne uznanie sa stalo skúškou pre matematika. Genialita bez uznania mala za následok vážne duševné poruchy, no John Nash dokázal tento problém vyriešiť vďaka svojej vynikajúcej logickej mysli. Jeho teória „Nashovej rovnováhy“ bola ocenená Nobelovou cenou a jeho život bol natočený vo filme „Beautiful mind“ („Hry mysle“).

Stručne o teórii hier

Keďže teória Nashovej rovnováhy vysvetľuje správanie ľudí z hľadiska interakcie, stojí za to zvážiť základné pojmy teórie hier.

Teória hier študuje správanie účastníkov (agentov)z hľadiska vzájomnej interakcie ako hry, kedy výsledok závisí od rozhodnutia a správania viacerých ľudí. Účastník sa rozhoduje na základe svojich predpovedí o správaní ostatných, čo sa nazýva herná stratégia.

Existuje aj dominantná stratégia, v ktorej účastník získa najlepší výsledok za akékoľvek správanie ostatných účastníkov. Toto je najlepšia win-win stratégia pre hráča.

Väzňova dilema a vedecký prielom

Väzňova dilema je prípad s hrou kedyúčastníci sú nútení robiť racionálne rozhodnutia, dosiahnuť spoločný cieľ tvárou v tvár konfliktu alternatív. Otázkou je, ktorú z týchto možností si vyberie, uvedomujúc si osobný a všeobecný záujem, ako aj nemožnosť získať oboje. Zdá sa, že hráči sú uväznení v ťažkých herných podmienkach, čo ich niekedy núti myslieť veľmi produktívne.

Túto dilemu skúmal americký matematikJohn Nash. Rovnováha, ktorú dosiahol, bola svojím spôsobom revolučná. Táto nová myšlienka obzvlášť výrazne ovplyvnila názor ekonómov na to, ako si hráči na trhu vyberajú, berúc do úvahy záujmy ostatných, s úzkou interakciou a priesečníkom záujmov.

Teóriu hier je najlepšie študovať na konkrétnych príkladoch, keďže táto matematická disciplína sama o sebe nie je sucho teoretická.

Príklad väzňovej dilemy

Napríklad dvaja ľudia spáchali lúpež, dostali sa dodo rúk polície a sú vypočúvaní v samostatných celách. Policajti zároveň každému účastníkovi ponúkajú zvýhodnené podmienky, za ktorých bude prepustený, ak bude svedčiť proti svojmu partnerovi. Každý zo zločincov má nasledujúci súbor stratégií, ktoré zváži:

Obaja súčasne vypovedajú a dostanú 2,5 roka väzenia.
Obaja zároveň mlčia a dostávajú každý 1 rok, keďže v tomto prípade bude dôkazová základňa ich viny malá.
Jeden svedčí a dostane slobodu, zatiaľ čo druhý mlčí a dostane 5 rokov väzenia.

Je zrejmé, že výsledok prípadu závisí od rozhodnutia obochúčastníci, ale nevedia sa dohodnúť, pretože sedia v rôznych celách. Jasne viditeľný je aj konflikt ich osobných záujmov v boji za spoločný záujem. Každý z väzňov má dve možnosti akcie a 4 možnosti výsledkov.

Reťazec logických záverov

Takže páchateľ A zvažuje tieto možnosti:

Mlčím ja a mlčí môj partner - obaja dostaneme 1 rok väzenia.
Odovzdám partnera a on mňa - obaja dostaneme 2,5 roka väzenia.
Mlčím a môj partner ma zradí - dostanem 5 rokov väzenia a on bude na slobode.
Odovzdávam partnera, ale on mlčí - ja dostanem slobodu a on dostane 5 rokov väzenia.

Tu je prehľad možných riešení a výsledkov.

Tabuľka možných výsledkov väzňovej dilemy.

Otázkou je, čo si vyberie každý účastník?

„Buď ticho, nemôžeš hovoriť“ alebo „Nemôžeš byť ticho, nemôžeš hovoriť“

Aby ste pochopili výber účastníka, musíte prejsťjeho myšlienkový reťazec. V nadväznosti na odôvodnenie trestného A: ak budem mlčať a partner bude mlčať, dostaneme minimálnu lehotu (1 rok), ale ako sa zachová, neviem zistiť. Ak bude svedčiť proti mne, tak je lepšie, aby som vypovedal, inak môžem sedieť 5 rokov. Radsej si sadnem na 2,5 roka ako na 5 rokov. Ak bude mlčať, o to viac potrebujem svedčiť, lebo tak získam slobodu. Účastník B argumentuje rovnakým spôsobom.

Je ľahké vidieť, že dominantná stratégia prekaždý zo zločincov – má svedčiť. Optimálny bod tejto hry nastáva, keď obaja zločinci vypovedia a dostanú svoju „cenu“ – 2,5 roka väzenia. Nashova teória hier tomu hovorí rovnováha.

Neoptimálne optimálne riešenie Nash

Revolučná povaha Nashovho pohľadu je takátakáto rovnováha nie je optimálna z hľadiska individuálneho účastníka a jeho vlastných záujmov. Najlepšou možnosťou je predsa mlčať a ísť na slobodu.

Nashova rovnováha je bodom kontaktuzáujmov, kde si každý účastník vyberie možnosť, ktorá je pre neho optimálna len za podmienky, že ostatní účastníci si zvolia určitú stratégiu.

Vzhľadom na možnosť, keď obaja zločincisú tiché a každý dostáva len 1 rok, môžete to nazvať Pareto-optimálna možnosť. Je to však možné len vtedy, ak by sa zločinci mohli vopred dohodnúť. Ale ani to by nezaručilo tento výsledok, pretože pokušenie odstúpiť od dohody a vyhnúť sa trestu je veľké. Nedostatok úplnej vzájomnej dôvery a nebezpečenstvo, že dostanete 5 rokov, boli nútení vybrať si možnosť s uznaním. Myslieť si, že účastníci zostanú pri možnosti mlčania, konať v zhode, jednoducho nie je racionálne. Takýto záver možno vyvodiť, ak budeme študovať Nashovu rovnováhu. Príklady len potvrdzujú pravdu.

Sebecké alebo racionálne

Teória Nashovej rovnováhy priniesla prekvapivé závery,vyvrátil existujúce princípy. Napríklad Adam Smith považoval správanie každého z účastníkov za úplne sebecké, čím sa systém dostal do rovnováhy. Táto teória sa nazývala „neviditeľná ruka trhu“.

John Nash videl, že keby boli všetci účastnícikonať, sledovať len svoje záujmy, potom to nikdy nepovedie k optimálnemu skupinovému výsledku. Vzhľadom na to, že racionálne myslenie je vlastné každému účastníkovi, je pravdepodobnejší výber, ktorý ponúka Nashova rovnovážna stratégia.

Čisto mužský experiment

Skvelým príkladom je hra blond paradox, ktorá, aj keď zdanlivo nie je na mieste, je jasnou ilustráciou toho, ako funguje Nashova teória hier.

V tejto hre si musíte predstaviť, že spoločnosťvoľní chlapi prišli do baru. Neďaleko je spoločnosť dievčat, z ktorých jedna má prednosť pred ostatnými, povedzme blondínka. Ako sa chlapci správajú, aby pre seba získali tú najlepšiu priateľku?

Takže myšlienky chlapcov:ak sa všetci začnú zoznamovať s blondínkou, potom to s najväčšou pravdepodobnosťou nikto nedostane, potom sa jej priatelia nebudú chcieť zoznámiť. Nikto nechce byť druhým záložným. Ale ak sa chlapci rozhodnú vyhnúť sa blondínke, potom je pravdepodobnosť, že každý z nich nájde medzi dievčatami dobrú priateľku, vysoká.

Nashova rovnovážna situácia nie je optimálnachlapi, lebo sledujúc len svoje sebecké záujmy, každý by si vybral blondínku. Je vidieť, že presadzovanie iba sebeckých záujmov sa bude rovnať kolapsu skupinových záujmov. Nashova rovnováha bude znamenať, že každý chlap koná vo svojich vlastných záujmoch, ktoré sú v kontakte so záujmami celej skupiny. Toto nie je najlepšia možnosť pre každého osobne, ale najlepšia pre každého na základe celkovej stratégie úspechu.

Celý náš život je hra

Rozhodovanie v reálnom životepripomína hru, keď od ostatných účastníkov očakávate určité racionálne správanie. V biznise, v práci, v tíme, vo firme a dokonca aj vo vzťahoch s opačným pohlavím. Od veľkých transakcií až po bežné životné situácie, všetko sa riadi jedným alebo druhým zákonom.

Samozrejmosťou sú uvažované herné situácie szločinci a bar sú len skvelými ilustráciami Nashovej rovnováhy. Príklady takýchto dilem veľmi často vznikajú na reálnom trhu a funguje to najmä v prípadoch, keď trh ovládajú dvaja monopolisti.

zmiešané stratégie

Často nie sme zapojení do jedného, ale narazniekoľko hier. Výberom jednej z možností v jednej hre, vedenej racionálnou stratégiou, ale skončíte v inej hre. Po niekoľkých racionálnych rozhodnutiach možno zistíte, že váš výsledok nie je podľa vašich predstáv. Čo robiť?

Zvážte dva typy stratégií:

Čistá stratégia je správanie účastníka, ktoré vychádza z premýšľania o možnom správaní ostatných účastníkov.
Zmiešaná stratégia alebo náhodná stratégia je náhodné striedanie čistých stratégií alebo výber čistej stratégie s určitou pravdepodobnosťou. Táto stratégia sa nazýva aj randomizovaná.

Vzhľadom na toto správanie dostávame novéPozrite sa na Nashovu rovnováhu. Ak skôr bolo povedané, že hráč si vyberie stratégiu raz, potom si možno predstaviť iné správanie. Dá sa predpokladať, že hráči volia stratégiu náhodne s určitou pravdepodobnosťou. Hry, ktoré nedokážu nájsť Nashovu rovnováhu v čistých stratégiách, ju majú vždy zmiešanú.

Nashova rovnováha v zmiešaných stratégiách sa nazýva zmiešaná rovnováha. Ide o rovnováhu, kde si každý účastník zvolí optimálnu frekvenciu výberu svojich stratégií za predpokladu, že ostatní účastníci si vyberú svoje stratégie s danou frekvenciou.

Penalty a zmiešaná stratégia

V hre je možné uviesť príklad zmiešanej stratégievo futbale. Najlepšou ilustráciou zmiešanej stratégie je možno penaltový rozstrel. Takže máme brankára, ktorý môže vyskočiť len do jedného rohu, a hráča, ktorý bude penaltu.

Ak teda hráč po prvýkrát zvolí stratégiuurobiť kop do ľavého rohu a brankár tiež spadne do tohto rohu a chytí loptu, ako sa potom môžu udalosti vyvinúť druhýkrát? Ak hráč zasiahne opačný roh, je to pravdepodobne príliš zrejmé, ale zasiahnutie toho istého rohu je rovnako zrejmé. Brankárovi aj kopačke preto nezostáva nič iné, len sa spoľahnúť na náhodný výber.

Takže striedaním náhodného výberu s určitou čistou stratégiou sa hráč a brankár snažia dosiahnuť maximálny výsledok.