Echilibru Nash. Teoria jocurilor pentru economiști (John Nash)

Cuprins:

Echilibru Nash. Teoria jocurilor pentru economiști (John Nash)
Echilibru Nash. Teoria jocurilor pentru economiști (John Nash)

Video: Echilibru Nash. Teoria jocurilor pentru economiști (John Nash)

Video: Echilibru Nash. Teoria jocurilor pentru economiști (John Nash)
Video: Teoria Jocurilor și John Nash | Premiul Nobel 2024, Noiembrie
Anonim

În anii 1930, John von Neumann și Oscar Morgenstern au devenit fondatorii unei noi și interesante ramuri a matematicii numită „teoria jocurilor”. În anii 1950, tânărul matematician John Nash a devenit interesat de această direcție. Teoria echilibrului a devenit subiectul disertației sale, pe care a scris-o la vârsta de 21 de ani. Astfel a luat naștere o nouă strategie de joc numită „Nash Equilibrium”, care a câștigat premiul Nobel mulți ani mai târziu – în 1994.

Echilibru Nash
Echilibru Nash

Decalajul lung dintre redactarea unei dizertații și recunoașterea generală a devenit un test pentru un matematician. Geniul fără recunoaștere a dus la tulburări mintale grave, dar John Nash a reușit să rezolve această problemă datorită minții sale logice excelente. Teoria lui Nash Equilibrium a câștigat un premiu Nobel, iar viața sa a fost filmată în Mintea frumoasă.

Pe scurt despre teoria jocurilor

Deoarece teoria echilibrului Nash explică comportamentul oamenilor în condițiile de interacțiune, merită să luăm în considerare conceptele de bază ale teoriei jocurilor.

Teoria jocurilor studiază comportamentul participanților (agenților) în ceea ce privește interacțiunea între ei ca un joc, când rezultatul depinde de decizia și comportamentul mai multor persoane. Participantul ia decizii pe baza predicțiilor sale despre comportamentul celorlalți, care se numește strategie de joc.

Există și o strategie dominantă în care participantul obține cel mai bun rezultat pentru orice comportament al altor participanți. Aceasta este cea mai bună strategie câștig-câștig a jucătorului.

Dilema prizonierului și descoperire științifică

Dilema prizonierului este un caz de joc în care participanții sunt forțați să ia decizii raționale, atingând un scop comun în fața unui conflict de alternative. Întrebarea este pe care dintre aceste opțiuni va alege, realizând interesul personal și general, precum și imposibilitatea de a obține ambele. Jucătorii par a fi închiși într-un mediu de joc dificil, ceea ce îi face uneori să gândească foarte productiv.

Exemple de echilibru Nash
Exemple de echilibru Nash

Această dilemă a fost explorată de matematicianul american John Nash. Echilibrul pe care l-a găsit a fost revoluționar în felul său. În mod deosebit, acest nou gând a influențat opinia economiștilor despre modul în care jucătorii de pe piață fac alegeri, ținând cont de interesele celorlalți, cu interacțiune strânsă și intersecție a intereselor.

Cel mai bine este să studiezi teoria jocurilor prin exemple concrete, deoarece această disciplină matematică în sine nu este teoretică sec.

Exemplu de dilema prizonierului

Exemplu, două persoane au comis un jaf, au căzut în mâinile poliției și sunt audiate în celule separate. În același timp, polițiștii oferă fiecărui participant condiții favorabile în care acesta va fi eliberat dacă depune mărturie împotriva partenerului său. Fiecare dintrecriminalii au următorul set de strategii pe care le va lua în considerare:

  1. Amândoi depun mărturie în același timp și primesc 2,5 ani de închisoare.
  2. Amândoi tac în același timp și primesc câte 1 an fiecare, deoarece în acest caz baza de probă a vinovăției lor va fi mică.
  3. Unul depune mărturie și este eliberat, în timp ce celăl alt tăce și primește 5 ani de închisoare.

Evident, rezultatul cazului depinde de decizia ambilor participanți, dar aceștia nu pot fi de acord, deoarece stau în celule diferite. Conflictul intereselor lor personale în lupta pentru un interes comun este, de asemenea, clar vizibil. Fiecare dintre prizonieri are două opțiuni pentru acțiune și 4 opțiuni pentru rezultate.

Lanț de inferențe logice

Deci, infractorul A ia în considerare următoarele opțiuni:

  1. Eu tac și partenerul meu tace - vom primi amândoi 1 an de închisoare.
  2. Îmi predau partenerul și el mă predă pe mine - amândoi primim 2,5 ani de închisoare.
  3. Tac, iar partenerul meu mă trădează - voi primi 5 ani de închisoare, iar el va fi liber.
  4. Îmi predau partenerul, dar el tace - primesc libertate, iar el primește 5 ani de închisoare.

Să oferim o matrice de soluții posibile și rezultate pentru claritate.

Tabel cu posibilele rezultate ale dilemei prizonierului.

Teoria echilibrului Nash
Teoria echilibrului Nash

Întrebarea este, ce va alege fiecare concurent?

„Taci, nu poți vorbi” sau „Nu poți să taci, nu poți vorbi”

Pentru a înțelege alegerea participantului, trebuie să treceți prin lanțul gândurilor sale. În urma raționamentului infractorului A: dacă eu tac și partenerul meu tace, vom primi un termen minim (1 an), dar euNu știu cum se va comporta. Dacă mărturisește împotriva mea, atunci e mai bine să depun mărturie, altfel pot să stau jos 5 ani. Prefer să stau jos 2,5 ani decât 5 ani. Dacă tace, cu atât mai mult trebuie să depun mărturie, pentru că așa îmi voi obține libertatea. Participant B.

john nash balance
john nash balance

Nu este greu de înțeles că strategia dominantă pentru fiecare dintre făptuitori este să depună mărturie. Punctul optim al acestui joc vine atunci când ambii criminali depun mărturie și își primesc „premiul” – 2,5 ani de închisoare. Teoria jocurilor Nash numește acest echilibru.

Soluție Nash optimă neoptimală

Natura revoluționară a concepției Nashian este că un astfel de echilibru nu este optim atunci când se ia în considerare participantul individual și interesul său personal. La urma urmei, cea mai bună opțiune este să rămâi tăcut și să fii liber.

Echilibrul Nash este un punct de convergență al intereselor, în care fiecare participant alege opțiunea optimă pentru el numai dacă alți participanți aleg o anumită strategie.

Avand in vedere optiunea cand ambii criminali tac si primesc doar 1 an, o putem numi o optiune Pareto-optima. Cu toate acestea, este posibil doar dacă infractorii ar putea fi de acord în prealabil. Dar nici măcar acest lucru nu ar garanta acest rezultat, deoarece tentația de a se retrage din acord și de a evita pedeapsa este mare. Lipsa încrederii deplină unul în celăl alt și pericolul de a obține 5 ani forțat să aleagă varianta cu recunoaștere. Reflectați la ce vor respecta participanțiiopțiunea cu tăcerea, acționând în concert, este pur și simplu irațională. O astfel de concluzie poate fi trasă dacă studiem echilibrul Nash. Exemplele doar ai dreptate.

Egoist sau rațional

Teoria echilibrului Nash a dat concluzii uluitoare care au infirmat principiile care existau înainte. De exemplu, Adam Smith a considerat comportamentul fiecăruia dintre participanți ca fiind complet egoist, ceea ce a adus sistemul în echilibru. Această teorie a fost numită „mâna invizibilă a pieței”.

teoria echilibrului john nash
teoria echilibrului john nash

John Nash a văzut că, dacă toți participanții acționează în propriul lor interes, acest lucru nu va duce niciodată la un rezultat optim de grup. Având în vedere că gândirea rațională este inerentă fiecărui participant, alegerea oferită de strategia de echilibru Nash este mai probabilă.

Experiment pur masculin

Un prim exemplu este jocul paradoxului blond, care, deși pare deplasat, este o ilustrare clară a modului în care funcționează teoria jocurilor Nash.

În acest joc trebuie să vă imaginați că o companie de băieți liberi a venit la un bar. În apropiere se află o companie de fete, dintre care una este de preferat altora, spune o blondă. Cum se comportă băieții pentru a-și obține cea mai bună prietenă?

situație de echilibru
situație de echilibru

Deci, raționamentul băieților: dacă toată lumea începe să se familiarizeze cu blonda, atunci, cel mai probabil, nimeni nu o va înțelege, atunci prietenii ei nu vor dori să se cunoască. Nimeni nu vrea să fie a doua rezervă. Dar dacă băieții aleg să eviteblondă, atunci probabilitatea ca fiecare dintre băieți să-și găsească o iubită bună printre fete este mare.

Situația de echilibru Nash nu este optimă pentru băieți, pentru că, urmărindu-și doar propriile interese egoiste, fiecare ar alege blonda. Se poate observa că urmărirea numai a intereselor egoiste va echivala cu prăbușirea intereselor grupului. Echilibrul Nash va însemna că fiecare tip acționează în propriile interese, care sunt în contact cu interesele întregului grup. Aceasta nu este cea mai bună opțiune pentru toată lumea personal, ci cea mai bună pentru toată lumea, bazată pe strategia generală de succes.

Toată viața noastră este un joc

Luarea deciziilor în lumea reală seamănă foarte mult cu un joc în care te aștepți și de la alți participanți la anumite comportamente raționale. În afaceri, la serviciu, în echipă, într-o companie și chiar în relațiile cu sexul opus. De la afaceri mari la situații obișnuite de viață, totul respectă o lege sau alta.

teoria jocurilor nash
teoria jocurilor nash

Desigur, situațiile de joc de mai sus cu criminali și un bar sunt doar ilustrații excelente care demonstrează echilibrul Nash. Exemple de astfel de dileme apar foarte des pe piața reală, iar acest lucru funcționează mai ales în cazurile în care doi monopoliști controlează piața.

Strategii mixte

Adesea suntem implicați nu în unul, ci în mai multe jocuri deodată. Alegând una dintre opțiunile dintr-un joc, ghidat de o strategie rațională, dar ajungi într-un alt joc. După câteva decizii raționale, s-ar putea să descoperi că rezultatul tău nu este pe placul tău. Ceia?

Să luăm în considerare două tipuri de strategie:

  • Strategia pură este comportamentul participantului, care provine din gândirea la comportamentul posibil al altor participanți.
  • Strategia mixtă sau aleatorie este alternarea unor strategii pure la întâmplare sau alegerea unei strategii pure cu o anumită probabilitate. Această strategie se mai numește și randomizat.
Echilibrul Nash în strategii mixte
Echilibrul Nash în strategii mixte

Având în vedere acest comportament, avem o nouă privire asupra echilibrului Nash. Dacă mai devreme se spunea că jucătorul alege o singură dată o strategie, atunci se poate imagina un alt comportament. Se poate presupune că jucătorii aleg o strategie aleatoriu cu o anumită probabilitate. Jocurile care nu pot găsi echilibrul Nash în strategii pure le au întotdeauna în strategii mixte.

Echilibrul Nash în strategiile mixte se numește echilibru mixt. Acesta este un echilibru în care fiecare participant alege frecvența optimă de alegere a strategiilor sale, cu condiția ca alți participanți să-și aleagă strategiile cu o anumită frecvență.

Penalități și strategie mixtă

Un exemplu de strategie mixtă poate fi găsit în jocul de fotbal. Cea mai bună ilustrare a unei strategii mixte este, probabil, loviturile de departajare. Deci, avem un portar care poate sări doar într-un colț și un jucător care va executa pen alty.

Deci, dacă prima dată jucătorul alege strategia de a trage în colțul din stânga, iar portarul cade și el în acest colț și prinde mingea, cum se pot dezvolta lucrurile a doua oară? Dacă jucătorulva lovi în colțul opus, acest lucru este cel mai probabil prea evident, dar lovirea în același colț nu este mai puțin evidentă. Prin urmare, atât portarul, cât și kickerul nu au de ales decât să se bazeze pe selecția aleatorie.

Astfel, alternând selecția aleatorie cu o anumită strategie pură, jucătorul și portarul încearcă să obțină rezultatul maxim.

Recomandat: