În anii 1930, John von Neumann și Oscar Morgensternau devenit fondatorii unei noi ramuri interesante a matematicii, care a fost numită „teoria jocurilor”. În anii 1950, tânărul matematician John Nash a devenit interesat de acest domeniu. Teoria echilibrului a devenit subiectul tezei sale, pe care a scris-o când avea 21 de ani. Așa s-a născut o nouă strategie de joc numită „Nash Equilibrium”, care a meritat premiul Nobel mulți ani mai târziu - în 1994.
Decalajul lung dintre redactarea disertației șiuniversal recunoscut ca un test pentru matematician. Geniul fără recunoaștere a dus la tulburări mintale grave, dar John Nash a reușit să rezolve această problemă datorită minții sale logice excelente. Teoria sa despre „echilibrul Nash” a câștigat un premiu Nobel, iar viața sa a fost filmată în filmul „Beautiful Mind”.
Pe scurt despre teoria jocurilor
Deoarece teoria echilibrului Nash explică comportamentul uman în medii de interacțiune, merită, prin urmare, revizuirea conceptelor de bază ale teoriei jocurilor.
Teoria jocurilor studiază comportamentul participanților (agenților)în condiții de interacțiune unul cu celălalt ca un joc, când rezultatul depinde de deciziile și comportamentul mai multor persoane. Participantul ia decizii pe baza predicțiilor sale despre comportamentul celorlalți, ceea ce se numește strategie de joc.
Există, de asemenea, o strategie dominantă, în care un participant obține rezultatul optim pentru orice comportament al altor participanți. Aceasta este cea mai bună strategie câștig-câștig a jucătorului.
Dilema prizonierului și descoperirea științifică
Dilema prizonierului este un caz de joc în careparticipanții sunt nevoiți să ia decizii raționale, realizând un scop comun în fața unui conflict de alternative. Întrebarea este pe care dintre aceste opțiuni va alege, recunoscându-și interesul personal și general, precum și imposibilitatea de a obține ambele. Jucătorii par să fie blocați în condiții stricte de joc, ceea ce uneori îi obligă să gândească foarte productiv.
Această dilemă a fost studiată de un matematician americanJohn Nash. Echilibrul pe care l-a creat a fost revoluționar în felul său. Această nouă idee a influențat în mod deosebit în mod clar opinia economiștilor despre modul în care jucătorii de pe piață fac alegeri, ținând cont de interesele celorlalți, cu interacțiune strânsă și intersecție de interese.
Cel mai bine este să studiezi teoria jocurilor folosind exemple specifice, deoarece această disciplină matematică în sine nu este sec teoretică.
Exemplu de dilemă a prizonierului
De exemplu, două persoane au comis un jaf și au ajuns înmâinile poliției și sunt audiați în celule separate. În același timp, polițiștii oferă fiecărui participant condiții favorabile în care acesta va fi eliberat dacă depune mărturie împotriva partenerului său. Fiecare infractor are următorul set de strategii pe care le va lua în considerare:
- Ambii depun mărturie în același timp și primesc 2,5 ani de închisoare.
- Ambele rămân tăcute în același timp și primesc câte 1 an fiecare, deoarece în acest caz baza de dovezi pentru vinovăția lor va fi mică.
- Unul depune mărturie și obține libertate, în timp ce celălalt rămâne tăcut și primește 5 ani de închisoare.
Evident, de decizia ambilor depinde decizia cauzeiparticipanților, dar nu pot ajunge la un acord deoarece stau în celule diferite. Conflictul intereselor lor personale în lupta pentru interesele comune este, de asemenea, clar vizibil. Fiecare prizonier are două opțiuni de acțiune și 4 posibile rezultate.
Lanț de concluzii logice
Deci, criminalul A ia în considerare următoarele opțiuni:
- Eu tac și partenerul meu tace - amândoi vom primi 1 an de închisoare.
- Îmi predau partenerul și el mă predă - amândoi primim 2,5 ani de închisoare.
- Rămân tăcut, iar partenerul meu mă scoate la iveală - primesc 5 ani de închisoare, iar el primește libertate.
- Îmi predau partenerul, dar el tăce - primesc libertate, iar el primește 5 ani de închisoare.
Să prezentăm o matrice de soluții posibile și rezultate pentru claritate.
Tabel cu rezultatele probabile ale dilemei prizonierului.
Întrebarea este, ce va alege fiecare participant?
„Nu poți să taci, nu poți vorbi” sau „Nu poți să taci, nu poți vorbi”
Pentru a înțelege alegerea participantului, trebuie să parcurgețilanțul lui de gânduri. Urmărind raționamentul infractorului A: dacă eu tac și partenerul meu tace, vom primi o pedeapsă minimă (1 an), dar nu știu cum se va comporta. Daca depune marturie impotriva mea, atunci mai bine depun marturie si eu, altfel as putea intra la 5 ani de inchisoare. Este mai bine pentru mine să servesc 2,5 ani decât 5 ani. Dacă tăce, cu atât mai mult trebuie să depun mărturie, pentru că așa voi obține libertatea. Participantul B argumentează exact în același mod.
Nu este greu de înțeles că strategia dominantă pentrufiecare dintre criminali urmează să depună mărturie. Punctul optim al acestui joc vine atunci când ambii criminali depun mărturie și își primesc „premiul” - 2,5 ani de închisoare. Teoria jocurilor Nash numește acest lucru un echilibru.
Soluție optimă Nash suboptimală
Natura revoluționară a viziunii lui Nash este aceeaun astfel de echilibru nu este optim atunci când luăm în considerare participantul individual și interesul său propriu. La urma urmei, cea mai bună opțiune este să rămâi tăcut și să pleci liber.
Echilibrul Nash este punctul de contactinterese, în care fiecare participant alege o opțiune care este optimă pentru el numai dacă alți participanți aleg o anumită strategie.
Luând în considerare opțiunea când ambii criminalisunt tăcuți și primesc doar 1 an, o puteți numi o opțiune Pareto-optimă. Cu toate acestea, este posibil doar dacă infractorii ar putea ajunge la o înțelegere în prealabil. Dar nici măcar acest lucru nu ar garanta acest rezultat, deoarece tentația de a se retrage din acord și de a evita pedeapsa este mare. Lipsa încrederii deplină unul în celălalt și pericolul de a obține 5 ani ne obligă să alegem varianta spovedaniei. Este pur și simplu irațional să credem că participanții vor rămâne la opțiunea tăcută în timp ce acționează în concert. Această concluzie poate fi trasă studiind echilibrul Nash. Exemplele doar dovedesc ideea.
Egoist sau rațional
Teoria echilibrului Nash a produs rezultate uimitoare,a infirmat principiile existente anterior. De exemplu, Adam Smith a considerat comportamentul fiecărui participant ca fiind absolut egoist, ceea ce a adus sistemul în echilibru. Această teorie a fost numită „mâna invizibilă a pieței”.
John Nash a văzut asta dacă toți participanții ar fi fostacționați doar în urmărirea propriilor interese, acest lucru nu va duce niciodată la un rezultat optim de grup. Având în vedere că gândirea rațională este inerentă fiecărui participant, alegerea oferită de strategia de echilibru Nash este mai probabilă.
Un experiment pur masculin
Un prim exemplu este jocul Blonde Paradox, care, deși aparent inadecvat, este o ilustrare clară a modului în care funcționează teoria jocurilor Nash.
În acest joc trebuie să vă imaginați că companiabăieți liberi au venit la bar. În apropiere este un grup de fete, dintre care una este de preferat celorlalte, spune o blondă. Cum ar trebui să se comporte băieții pentru a-și obține cea mai bună iubită?
Deci, raționamentul băieților:dacă toată lumea începe să se familiarizeze cu blonda, atunci cel mai probabil nimeni nu o va cunoaște, atunci nici prietenii ei nu vor dori să o cunoască. Nimeni nu vrea să fie a doua alegere. Dar dacă băieții aleg să evite blonda, atunci probabilitatea ca fiecare dintre băieți să-și găsească un prieten bun printre fete este mare.
Situația de echilibru Nash nu este optimă pentrubaieti, pentru ca, urmarind doar propriile interese egoiste, fiecare ar alege-o pe blonda. Se poate observa că urmărirea numai a intereselor egoiste va echivala cu prăbușirea intereselor grupului. Un echilibru Nash ar însemna că fiecare tip acționează în propriul său interes, care este în concordanță cu interesele întregului grup. Aceasta nu este opțiunea optimă pentru toată lumea personal, dar este optimă pentru toată lumea pe baza strategiei generale de succes.
Toată viața noastră este un joc
Luarea deciziilor în condiții reale este foarteseamănă cu un joc în care vă așteptați la un anumit comportament rațional de la alți participanți. În afaceri, la serviciu, în echipă, într-o companie și chiar în relațiile cu sexul opus. De la tranzacții mari până la situații obișnuite de viață, totul este supus unei legi sau alteia.
Desigur, situațiile de joc considerate cucriminalii și barul sunt doar ilustrații grozave pentru a demonstra echilibrul lui Nash. Exemple de astfel de dileme apar foarte des pe piața reală, iar acest lucru este valabil mai ales în cazurile în care doi monopoliști controlează piața.
Strategii mixte
Adesea suntem implicați nu într-una, ci imediat înmai multe jocuri. Alegerea uneia dintre opțiuni într-un joc, ghidată de o strategie rațională, dar ajunge într-un alt joc. După ce ai luat mai multe decizii raționale, s-ar putea să descoperi că nu ești mulțumit de rezultat. Ce să fac?
Să luăm în considerare două tipuri de strategie:
- O strategie pură este comportamentul unui participant care provine din gândirea la comportamentul posibil al altor participanți.
- O strategie mixtă sau aleatorie este alternarea aleatorie a strategiilor pure sau alegerea unei strategii pure cu o anumită probabilitate. Această strategie se mai numește și randomizată.
Având în vedere acest comportament, obținem un nouO privire asupra echilibrului Nash. Dacă mai devreme se spunea că jucătorul alege o singură dată o strategie, atunci se poate imagina un alt comportament. Este posibil să presupunem că jucătorii aleg o strategie aleatoriu cu o anumită probabilitate. Jocurile în care echilibrele Nash nu pot fi găsite în strategii pure le au întotdeauna în cele mixte.
Echilibrul Nash în strategiile mixte se numește echilibru mixt. Acesta este un echilibru în care fiecare participant alege frecvența optimă de alegere a strategiilor sale, cu condiția ca alți participanți să-și aleagă strategiile cu o frecvență dată.
Penalize și strategie mixtă
Un exemplu de strategie mixtă poate fi dat în jocla fotbal. Cea mai bună ilustrare a unei strategii mixte este poate loviturile de departajare. Deci, avem un portar care poate sări doar într-un corner și un jucător care va executa penalty-ul.
Deci, dacă prima dată jucătorul alege strategiaface un șut în colțul din stânga, iar portarul cade și el în acest colț și prinde mingea, atunci cum se pot dezvolta evenimentele a doua oară? Dacă un jucător lovește colțul opus, cel mai probabil este prea evident, dar lovirea aceluiași colț nu este mai puțin evidentă. Prin urmare, atât portarul, cât și kickerul nu au de ales decât să se bazeze pe o alegere aleatorie.
Astfel, alternând selecția aleatorie cu o strategie pură specifică, jucătorul și portarul încearcă să obțină rezultatul maxim.