Kognitive fakta om alting / Nyheder og Samfund / Nash ligevægt. Spilteori for økonomer (John Nash)

Nash-ligevægt. Theory of Games for Economists (John Nash)

I 1930'erne John von Neumann og Oskar Morgensternblev grundlæggerne af en ny interessant retning af matematik, som blev kaldt "spilteori". I 1950'erne blev den unge matematiker John Nash interesseret i dette område. Ligevægtsteori blev emnet for hans afhandling, som han skrev i en alder af 21. Sådan opstod en ny strategi for spil kaldet "Nash Equilibrium", som vandt Nobelprisen mange år senere - i 1994.

Den lange afstand mellem at skrive en afhandling oguniverselt anerkendt som en prøve for matematikeren. Geni uden anerkendelse resulterede i alvorlige psykiske lidelser, men John Nash var i stand til at løse dette problem takket være sin fremragende logiske grund. Hans teori om "Nash equilibrium" vandt Nobelprisen, og hans liv blev tilpasset i filmen "Beautiful mind".

Spilteori på et blik

Da Nashs ligevægtsteori forklarer menneskers adfærd i et interaktionsmiljø, er det derfor værd at overveje spilteoriens grundlæggende begreber.

Spilteori studerer deltagernes (agenters) adfærdi forhold til interaktion med hinanden som et spil, når udfaldet afhænger af flere personers beslutninger og adfærd. Deltageren træffer beslutninger baseret på sine forudsigelser om andres adfærd, hvilket kaldes en spilstrategi.

Der er også en dominerende strategi, hvor deltageren får det optimale resultat for andre deltageres adfærd. Dette er spillerens bedste no-lose-strategi.

Fangens dilemma og videnskabelige gennembrud

The Prisoner's Dilemma er et tilfælde af leg hvordeltagere er tvunget til at træffe rationelle beslutninger og opnå et fælles mål i en konflikt af alternativer. Spørgsmålet er, hvilken af disse muligheder han vil vælge, idet han realiserer hans personlige og almene interesse, såvel som umuligheden af at opnå begge dele. Spillerne ser ud til at være fængslet under hårde spilforhold, hvilket nogle gange får dem til at tænke meget produktivt.

Dette dilemma blev udforsket af en amerikansk matematikerJohn Nash. Den balance, han bragte frem, blev revolutionær på sin egen måde. Særligt lysende påvirkede denne nye idé økonomers mening om, hvordan markedsaktører træffer valg under hensyntagen til andres interesser, med tæt interaktion og skæringspunkt mellem interesser.

Det er bedst at studere spilteori med specifikke eksempler, da denne matematiske disciplin i sig selv ikke er tørteoretisk.

Et eksempel på en fanges dilemma

Eksempel, to personer begik et røveri, kom indpolitiets hænder og bliver afhørt i separate celler. Samtidig tilbyder politibetjentene hver enkelt deltager favorable betingelser for, at han bliver løsladt, hvis han vidner mod sin partner. Hver af de kriminelle har følgende sæt strategier at overveje:

Begge vidner samtidig og får 2,5 års fængsel.
Begge er tavse på samme tid og får 1 år hver, da bevisgrundlaget for deres skyld i dette tilfælde vil være lille.
Den ene afgiver vidneforklaring og får frihed, mens den anden tier og får 5 års fængsel.

Udfaldet af sagen afhænger naturligvis af begges afgørelsedeltagere, men de kan ikke blive enige, da de sidder i forskellige celler. Konflikten mellem deres personlige interesser i kampen for en fælles interesse er også tydeligt synlig. Hver af fangerne har to muligheder for handling og 4 muligheder for udfald.

Logisk slutningskæde

Så gerningsmanden A overvejer følgende muligheder:

Jeg tier og min partner tier - vi får begge 1 års fængsel.
Jeg afleverer min partner, og han afleverer mig – vi får begge 2,5 års fængsel.
Jeg er tavs, og min partner afleverer mig – jeg får 5 års fængsel, og han er fri.
Jeg afleverer min partner, men han tier - jeg får frihed, og han er 5 år i fængsel.

Her er en matrix af mulige løsninger og resultater for klarhed.

Tabel over sandsynlige udfald af fangens dilemma.

Spørgsmålet er, hvad hver enkelt deltager vælger?

"Stilhed, du kan ikke tale" eller "Du kan ikke tie, tal"

For at forstå valget af en deltager skal du igennemkæden af hans tanker. Efter gerningsmanden A's begrundelse: hvis jeg forbliver tavs, og min partner ikke siger noget, får vi minimumstiden (1 år), men jeg kan ikke finde ud af, hvordan han vil opføre sig. Hvis han vidner imod mig, så er det også bedre for mig at vidne, ellers kan jeg blive fængslet i 5 år. Det er bedre for mig at komme i fængsel i 2,5 år end i 5 år. Hvis han tier, så har jeg så meget desto mere brug for at vidne, da jeg på denne måde får frihed. Deltager B argumenterer på samme måde.

Det er ikke svært at forstå, at den dominerende strategi forhver af de kriminelle vidner. Det optimale punkt i dette spil kommer, når begge kriminelle vidner og modtager deres "præmie" - 2,5 års fængsel. Nash spilteori kalder dette ligevægt.

Ikke-optimal optimal Nash-løsning

Den revolutionære karakter af Nash-synet er deten sådan balance er ikke optimal, hvis vi tager den enkelte deltager og dennes personlige interesse i betragtning. Den bedste mulighed er trods alt at forblive tavs og blive løsladt.

Nash ligevægt er kontaktpunktetinteresser, hvor hver deltager vælger en mulighed, der er optimal for ham kun på betingelse af, at andre deltagere vælger en bestemt strategi.

Overvejer den mulighed, hvor både kriminelleDe er lydløse og får kun 1 år, vi kan kalde det den Pareto-optimale mulighed. Det er dog kun muligt, hvis de kriminelle kunne nå til enighed på forhånd. Men selv dette ville ikke garantere dette resultat, da fristelsen til at trække sig fra aftalen og undgå straf er stor. Manglen på fuldstændig tillid til hinanden og faren for at få 5 år gør det nødvendigt at vælge muligheden med anerkendelse. Det er simpelthen irrationelt at spekulere i, at deltagerne vil holde sig til den tavse mulighed, hvor de handler i fællesskab. Denne konklusion kan drages, hvis vi studerer Nash-ligevægten. Eksempler beviser kun tilfældet.

Egoistisk eller rationel

Nashs ligevægtsteori gav fantastiske resultater,modbeviste de tidligere gældende principper. For eksempel anså Adam Smith hver af deltagernes adfærd som fuldstændig egoistisk, hvilket bragte systemet i balance. Denne teori blev kaldt "markedets usynlige hånd".

John Nash så, at hvis alle deltagere villekun at handle i forfølgelse af deres egne interesser, vil dette aldrig føre til et optimalt grupperesultat. I betragtning af at rationel tænkning er iboende i hver deltager, er det valg, som Nash-ligevægtsstrategien tilbyder, mere sandsynligt.

Rent mandligt eksperiment

Et slående eksempel er spillet "blonde paradoks", som, selvom det virker upassende, er en levende illustration af, hvordan Nashs teori om spil fungerer.

I dette spil skal du forestille dig, at virksomhedengratis fyre kom til baren. I nærheden er en gruppe piger, hvoraf en er at foretrække frem for andre, f.eks. en blondine. Hvordan kan fyre handle for at få den bedste ven til sig selv?

Så ræsonnerer fyrene:hvis alle begynder at stifte bekendtskab med blondinen, så er der højst sandsynligt ingen, der får det, så vil hendes venner ikke mødes. Ingen ønsker at være den anden fallback. Men hvis fyre vælger at undgå blondinen, så er sandsynligheden for, at hver af fyrene finder en god ven blandt pigerne, stor.

Nash-ligevægten er ikke optimal tilfyre, fordi, for kun at forfølge deres egne egoistiske interesser, ville alle vælge en blondine. Det kan ses, at forfølgelsen af kun selviske interesser vil være ensbetydende med sammenbruddet af gruppeinteresser. Nash-ligevægt vil betyde, at hver fyr handler i sine egne interesser, som er i kontakt med hele gruppens interesser. Dette er ikke en optimal mulighed for alle personligt, men optimal for alle, baseret på den overordnede strategi for succes.

Hele vores liv er et spil

Beslutningstagning i den virkelige verden er megetligner et spil, når du forventer en vis rationel adfærd fra andre deltagere. I forretningen, på arbejdet, i et team, i en virksomhed og endda i forhold til det modsatte køn. Fra store tilbud til almindelige livssituationer, alt overholder denne eller hin lov.

Naturligvis de betragtede spil situationer medkriminelle og baren er bare gode illustrationer af Nash-ligevægten. Eksempler på sådanne dilemmaer opstår meget ofte på det virkelige marked, og det gælder især i tilfælde, hvor to monopolister kontrollerer markedet.

Blandede strategier

Ofte er vi ikke involveret i én, men umiddelbart iflere spil. At vælge en af mulighederne for et spil, styret af en rationel strategi, men du befinder dig i et andet spil. Efter et par rationelle beslutninger kan du opleve, at du ikke er tilfreds med dit resultat. Hvad skal der gøres?

Overvej to typer strategier:

En ren strategi er en deltagers adfærd, der kommer fra at tænke på andre deltageres mulige adfærd.
En blandet strategi eller tilfældig strategi er vekslen mellem rene strategier på en tilfældig måde, eller valget af en ren strategi med en vis sandsynlighed. Denne strategi kaldes også randomiseret.

I betragtning af denne adfærd får vi en nyse på Nash ligevægt. Hvis det tidligere blev sagt, at spilleren vælger en strategi én gang, så kan man forestille sig en anden adfærd. Det kan antages, at spillerne vælger en strategi tilfældigt med en vis sandsynlighed. Spil, der ikke kan finde Nash-ligevægte i rene strategier, har dem altid i blandede.

Nash-ligevægten i blandede strategier kaldes blandet ligevægt. Dette er en ligevægt, hvor hver deltager vælger den optimale frekvens for at vælge deres strategier, forudsat at andre deltagere vælger deres strategier med en given frekvens.

Straffe og blandet strategi

Et eksempel på en blandet strategi kan findes i spillettil fodbold. Den bedste illustration af blandet strategi er måske straffesparkskonkurrencen. Så vi har en målmand, der kun kan springe til det ene hjørne, og en spiller, der tager straffen.

Så hvis spilleren for første gang vælger strategienlave et spark til venstre hjørne, og målmanden vil også falde ned i dette hjørne og fange bolden, hvordan kan begivenhederne udfolde sig en anden gang? Hvis en spiller sparker i det modsatte hjørne, er det nok for tydeligt, men et spark i samme hjørne er ikke mindre tydeligt. Derfor har både målmanden og batteren intet andet valg end at stole på et tilfældigt valg.

Så, alternerende tilfældige valg med en vis ren strategi, forsøger spilleren og målmanden at få det maksimale resultat.