. Studiul Pietelor Oligopoliste Utilizand Teoria Jocului
Capitolul 1
Studiul piețelor oligopoliste utilizând teoria jocurilor
1.1 Introducere
În condițiile în care rezultatul deciziilor unei firme depinde semnificativ de deciziile luate de una sau mai multe firme (identificabile), atunci avem situația de piață denumită oligopol. În mod obișnuit, oligopolul e definit ca o piață cu câțiva vânzători (acesta e și înțelesul termenului de oligopol, prin construcția sa); însă o definire având la bază numărul firmelor de pe o piață nu e lipsită de ambiguitate. Din moment ce esența acestei situații este dată de natura relațiilor competiționale dintre vânzători, e normal (e cel mai bine) ca aceasta să fie baza definiției. Oricum, intuitiv, întotdeauna ne gândim la oligopol ca la o “competiție între câțiva”.
Considerăm că o firmă, în aceste condiții de interdependență a procesului decizional, va căuta să-și maximizeze profitul. Problema ce apare e să atribuie un profit fiecărei decizii alternative, cu scopul de a le ierarhiza și de a găsi optimul. Vrând-nevrând, fiecare firmă e implicată într-un raționament de tipul: “dacă eu aleg A și el alege B, atunci câștig x; dacă eu aleg C și el alege D, atunci câștig y, …”, ș.a.m.d. Relațiile competitorului (aici B, D) pot lua un număr de firme, astfel că firma în cauză trebuie să-și dea seama care va fi răspunsul. Înainte de ierarhizarea alternativelor, firma va trebui să analizeze fiecare acțiune posibilă a competitorilor. Teoria oligopolului se ocupă cu înțelegerea și previzionarea deciziilor competitorilor, în astfel de destinații de strânsă interdependență strategică (adică interacțiuni în gândirea și procesul decizional al firmelor de pe piață).
Un mod natural de analiză pare a fi formularea unor ipoteze asupra naturii reacțiilor competitive așteptate de fiecare firmă și folosirea lor pentru găsirea unei situații de echilibru. Utilizând apoi instrumentele de bază ale analizei microeconomice se ajunge la o precisă determinare a echilibrului pieței. Această abordare a fost într-adevăr una din primele adoptate de economiști. Există câteva ipoteze asupra modelelor de reacții care sunt posibile, fiecare ducând la soluții de echilibru diferite. Vom avea atunci câteva teorii posibile, cu soluții diferite. Acesta nu trebuie să fie o îngrijorare: evidența empirică face diferența între diferitele ipoteze, rezultând cea mai potrivită ipoteză pentru orice situație concretă.
Aplicarea teoriei firmelor în analiza oligopulului a dus la reinterpretări fundamentale ale acestor modele. Abordarea prin teoria jocurilor nu permite alegerea unui model de reacție arbitrar, chiar dacă e plauzibil. Mai mult, așteptările asupra acțiunilor unui competitor rezultă în urma unor calcule raționale ale firmei în cauză. Totuși modelele tradiționale de oligopol păstrează un loc central în teoria oligopolistă; completarea adusă de analiza concretă (din teoria jocurilor) a dus la o definire mai atentă a tipurilor de piață în care se poziționează firmele și a dus chiar la o mai adâncă înțelegere a modelelor în sine.
Se pune acum problema posibilității de comunicare și cooperare între firme. Cităm un pasaj din Adam Smith: “Oamenii din același comerț se întâlnesc uneori, chiar și pentru a petrece, dar conversația de termină cu o conspirație împotriva consumatorilor sau prin găsirea unui mecanism de creștere a prețurilor. E imposibil de prevenit astfel de întâlniri, prin nici o lege care să fie în concordanță cu justiția și cu respectarea libertăților personale.” Admițând posibilitatea comunicării și cooperării, se schimbă unele aspecte ale analizei. În loc de a construi modele de reacție și examinarea consecințelor lor posibile, suntem interesați în a răspunde la întrebări ca:
În ce condiții firmele vor fi de acord să coopereze?
Dacă se decid să coopereze, ce politic de preț și output vor rezulta?
Înțelegerea lor comună va fi stabilă (în sensul menținerii în timp, în circumstanțe schimbate) și dacă nu, care vor fi consecințele încălcării acordului?
Cooperarea între firme (maximizarea de profit) depinde crucial de numărul de perioade în care situația de piață se repetă. Modelele clasice de oligopol tratează implicit situația de piață ca un joc cu o singură mutare: firmele produc și vând o singură dată. În acest caz se dovedește a fi dificil de raționalizat comportamentul cooperativ. Dacă, pe de altă parte, privim situația ca pe un joc repetitiv (posibil cu un număr infinit de perioade) devine ușor de explicat acest comportament cooperativ; dificultatea apare în stabilirea cu exactitate a prețurilor și cantităților ce vor fi atrase.
1.2 Jocuri cu o singură mutare
În această parte vom lucra în termenii unui model foarte specific. Avantajul constă în faptul că rezultatele apar foarte simplu și foarte clar. Dezavantajul e acela că nu întotdeauna e clar dacă aceste rezultate se generează; probleme generale cum ar fi existența, unicitatea sau stabilirea echilibrului nu sunt tratate.
Presupunem că pe piață se confruntă două firme, cu funcția costului total:
, ci > 0, i=1,2 [3.1]
cu costurile marginale ci constante.
Output-urile firmelor pot fi omogene sau nu. (Dacă sunt omogene ci=cr.) Funcția cerere inversă pentru firma i:
, i,j=1,2, i<>j [3.2]
unde >0
Bunurile sunt astfel substituite: o creștere a output-ului firmei j (ca urmare a scăderii prețului) coboară funcțiile cererii și venitului pentru firma i.
Presupunem că , pentru ca piața să fie activă.
Dacă output-urile sunt omogene,
[3.3]
În condiții de omogenitate avem o singură funcție a cererii inverse: și deci bunurile vor fi vândute la același preț dat de suma output-urilor.
Funcția profitului pentru cele două firme:
[3.4]
Funcția cerere (din funcția cererii inverse):
[3.5]
Scriem astfel profitul ca funcție de prețuri:
[3.6]
Din relația [4] rezultă că este strict concav în raport cu qi: cu un maxim în [3.7]
Funcția este liniară și descrescătoare în qi: .
Această situație poate fi considerată ca un joc în forma normală =(N,S,P) în care:
mulțimea jucătorilor este formată de cele două firme de pe piață N={1,2};
spațiul strategiilor este , deci fiecare firmă este liberă să producă orice cantitate nenegativă de output;
funcțiile de câștig sunt reprezentate de funcțiile de profit ale celor două firme date de relația [3.4]: P=(1, 2).
În paralel cu reprezentarea teoretică, vom face și o analiză numerică practică, studiind piața băuturilor răcoritoare ambalate la 2 litri. Cele două firme cu cea mai mare pondere pe piața românească sunt Coca-Cola și European Drinks. Ne vom referi la Coca-Cola folosind termenul firma 1 și variabilele corespunzătoare vor avea indicele 1, iar European Drinks va fi firma 2, cu indicele pentru variabile 2.
Perioada de analiză este o lună.
Funcțiile de cost (exprimate în milioane lei)
C1=6q1 c1=6
C2=5q2 c2=5
Funcțiile de cerere inversă:
p1=18-0,01q1-0,005q2 1=18, 1=0,01 , =0,005
p2=14-0,008q2-0,005q1 2=14, 2=0,008
Observație: Cantitățile q1 și q2 sunt exprimate în mi sticle deci costurile marginale sunt exprimate în mii lei per sticlă.
Modelul Cournot
Să spunem că piața funcționează după cum urmează. Fiecare firmă decide, fără a se consulta cu cealaltă, ce output va produce. Simultan, firmele apar cu bunurile pe piață. Prețurile se ajustează la nivelul ce curăță piața, firmele luându-și profitul rezultat. Întrebarea care se pune este ce nivel al output-ului vor produce.
Să notăm că relația [3.7] oferă firmelor o informație foarte importantă: fiind dat un nivel al output-ului qi al firmei concurente j, cel mai bun răspuns al firmei i este dat de [3.7]: . în conformitate cu aceasta, se definește funcția cel mai bun răspuns pentru firma i:
, [3.8]
cu
; .
Pentru modelul numeric, aceste funcții vor fi:
q1(q2)=600-0,25q2
q2(q1)=562,5-0,3125q1
Pantele negative ale acestor drepte (-Bi) explică faptul că o creștere de output qj reduce cantitatea de output maximizatoare de profit a firmei i.
Punctul de intersecție al acestor drepte e dat de:
[3.9]
rezultat dat de rezolvarea sistemului de ecuații definit de [3.8].
Deci q1c=500 (mii sticle)
q2c=400 (mii sticle)
Prețurile la care se vor desface aceste cantități vor fi:
p1c=18-5-2=11 (mii lei/sticlă)
p1c=14-3,2-2,5=8,3 (mii lei/sticlă)
Profiturile obținute de cele două firme sunt:
1c=11*500-6*500=2500 (milioane lei)
2c=8,3*400-5*400=1320 (milioane lei)
În condiții de omogenitate
(Am folosit [3.3]) [3.10]
Figura 3.1 Modelul Cournot
funcțiile cel mai bun răspuns ale celor două firme și punctul de echilibru E
ajustarea la echilibru
În analiza sa, Augustine Cournot propunea acest punct de intersecția E ca punct de echilibru al pieței. Argumentele sale urmăreau raționamentul următor: firma 1 apare pe piață cu q11; firma 2 reacționează cu output-ul maximizator de profit q21; în urma acestui răspuns, firma 1 își va schimba output-ul în q12, care îi minimizează profitul, …, ș.a.m.d. (figura 1). De vreme ce fiecare firmă reacționează la output-ul celeilalte prin stabilirea output-ului propriu pe baza funcției cel mai bun răspuns (“curba de reacție” în terminologia lui Cournot), singurul echilibru posibil pe piață este punctul de intersecție E(q1c, q1c). Acesta este punctul în care nici una din firme nu dorește să-și schimbe output-ul dat fiind output-ul firmei concurente.
Argumentul lui Cournot nu e convingător. Trebuie notată inconsistența relativă la ipoteza jocului într-o mutare de vreme ce stabilirea output-ului se face secvențial, într-un număr (posibil infinit) de perioade. Acest comportament e denumit de Bruce T. Allen “joc de prețuri cu ochii închiși” (Managerial Economics). Fiecare firmă se așteaptă ca cealaltă să-și păstreze constant output-ul; mai mult decât atât, această convingere e păstrată în continuare, după ce se dovedește (în fiecare perioadă) că e nerealistă.
Abordarea modernă prin teoria jocurilor a acestui model nu furnizează un raționament realist, pentru același output de echilibru. Se presupune că fiecare firmă acționează rațional (lucru cât se poate de normal și de adevărat), socotind consecințele deciziilor sale pe baza faptului că și cealaltă firmă acționează rațional. În aceste condiții, output-urile produse de firme sunt considerate ca fiind un echilibru Nash.
Perechea output-ului (q1*, q2*) e un echilibru Nash, dacă:
fezabile [3.11]
Evident că (q1c, q1c) satisface această definiție și, în plus, e singura astfel de pereche din model. Așadar, echilibrul Nash al acestui joc e echilibrul Cournot, de vreme ce e necesar să fie la intersecția funcțiilor cel mai bun răspuns.
Argumentul ce susține folosirea conceptului de echilibru Nash ca soluție a jocurilor de acest tip constă în următorul raționament. Presupunem că firma 2 crede firma 1 va produce q11; atunci își calculează cel mai bun răspuns q21 relativ la așteptările sale. Însă realizează că și firma 1 poate raționa similar: pentru un output așteptat q21, va dori să producă q12. Ar fi irațional din partea firmei 2 să creadă că firma 1 va păstra nivelul q11. Acest raționament se face în fiecare punct, mai puțin (q1c, q1c). Dacă firma 2 crede că firma 1 va alege q1c, ea va dori să producă q2c. Firma 2 își dă seama că cel mai bun răspuns al firmei 1 la alegerea q2c este tot q1c și deci nu va mai dori să-și schimbe output-ul (e valabil și pentru firma 1).
Echilibrul Nash are proprietatea că dacă i știe că j va alege qj*(=qjc) în condițiile în care i ar alege qi*(=qic)>i totuși nu va dori să-și schimbe output-ul, rămânând la nivelul qi*.
Firmele ajung să facă alegerea (q1*, q2*) în urma aceluiași raționament. Un argument în susținerea echilibrului Nash e acela că orie punct care nu e un echilibru Nash nu va fi ales de un jucător convins că oponentul său e rațional și la fel de bine informat.
Să vedem în continuare ce s-ar întâmpla dacă firmele cooperează. În acest caz, avem de maximizat profitul comun:
<==>
Se arată că qim < qic.
Așadar, nivelul output-urilor e mai ridicat în prețurile mai mici în cazuea că dacă i știe că j va alege qj*(=qjc) în condițiile în care i ar alege qi*(=qic)>i totuși nu va dori să-și schimbe output-ul, rămânând la nivelul qi*.
Firmele ajung să facă alegerea (q1*, q2*) în urma aceluiași raționament. Un argument în susținerea echilibrului Nash e acela că orie punct care nu e un echilibru Nash nu va fi ales de un jucător convins că oponentul său e rațional și la fel de bine informat.
Să vedem în continuare ce s-ar întâmpla dacă firmele cooperează. În acest caz, avem de maximizat profitul comun:
<==>
Se arată că qim < qic.
Așadar, nivelul output-urilor e mai ridicat în prețurile mai mici în cazul soluției Cournot (concurențiale) decât în cazul cooperării.
În cazul output-urilor omogene:
, (căci >c)
Evident .
Observație:
Această relație se păstrează și pentru output-uri diferențiate (neomogene).
Cazul cooperării poate fi asemănat cu cazul de monopol (pe piață e un singur agent: cartelul format din cele 2 firme care cooperează); de aici și notațiile pm, qm, m.
Atunci chiar dacă firmele își doresc maximizarea profitului, de ce nu ajung la o înțelegere pentru a stabili nivelul de output qm. Într-un joc cu o singură mutare, firmele vor coopera doar dacă vor obține din partea concurenței un angajament ferm că se va păstra nivelul de output stabilit. Astfel, încercarea de a coopera va da greș, deoarece (q1m, q2m) nu e un echilibru Nash.
Pentru acesta să presupunem că managerii celor două firme se întâlnesc (nu neapărat într-un cadrul formal) și se înțeleg asupra unui nivel de output (q1m, q2m) (sau orice alt nivel (q1, q2) diferit de (q1c, q2c)). Când ajunge fiecare șa firmă și își stabilește planul de producție, următorul gând ce va trece prin minte: dacă cealaltă firmă produce qjm, ce mai bun răspuns al firmei i nu este qim, ci (e evident că ). Indicele “t” vine de la “trișat”: firma i “trișează”, producând mai mult decât era stabilit, obținând un profit mai mare. Însă firma i își dă seama că și firma j poate urma același raționament și, deci, prin același proces descris mai devreme se ajunge la echilibrul Cournot-Nash.
Cum ar putea totuși firmele să ajungă la o înțelegere, să obțină acel angajament ferm? O posibilitate ar fi încheierea unui contract ce prevede penalități cel puțin în cazul în care i trișează. Oricum, în multe țări astfel de contracte sunt ilegale, deci nu poate obliga părțile. Există posibilitatea pedepsirii prin sancțiuni de piață (război al prețurilor). În jocurile cu o mutare însă nu există o perioadă viitoare în care să fie puse în aplicare sancțiunile. Dacă nu reușesc o altă cale de a obține încrederea în celălalt, firmele nu vor putea să se înțeleagă la o pereche de output-uri mai profitabilă decât (q1c, q2c).
1.2.2 Modelul Stackelberg
Ipoteza de la care pleacă acest model este anunțarea de către firma 1 (leader) a nivelului de output și, odată făcut acest anunț, nu se poate reveni asupra lui (spre deosebire de modelul Cournot în care se pleca de la ipoteza anunțării simultane a nivelului de output). În raționamentul său, firma 1 are în vedere faptul că firma 2 va alege cel mai bun răspuns al său și în raport cu nivelul de output anunțat. Ar fi lipsit de sens din partea firmei 2 să aleagă nivelul său de output Cournot, deoarece firma 1 nu își mai poate schimba output-ul inițial. Așadar, firma 1 are posibilitatea de a obține un angajament credibil asupra unui nivel de output. Atunci, problema este: care e nivelul optim de output al firmei 1?
Pentru orice nivel q1, firma 2 va alege cel mai bun răspuns. În consecință, firma 1 alege q1 astfel încât să-și maximizeze profitul cu .
Rezolvăm sistemul:
Evident q1s>q1c.
Pentru cazul produselor omogene
;
Pentru cazul produselor omogene avem:
q1s = q1m + q2m
dar q1s + q2s > q1m + q2m deci, iarăși profitul total nu este maxim.
.
Deci profitul total e chiar mai mic și decât în cazul echilibrului Cournot-Nash.
Așadar 1s > 1c, deci profitul firmei 1 e mai mare în cazul modelului Stackelberg, decât la echilibrul Cournot-Nash, reflectând avantajul primei mutări.
Figura 3. 2 Stabilirea output-ului Stackelberg
– curbele 10, 1s, 1c reprezintă curbe de izoprofit pentru firma 1 (10>1s>1c)
Profitul firmei 1 scade pe măsură ce urmăm pe figură (dacă păstrăm constant un nivel q1, pentru cantități din ce în ce mai mari q2, profitul 1 va scădea). Pantele de maxim ale acestor curbe vor fi, bineînțeles, pe curba funcției celui mai bun răspuns al său. Firma 1 știe că firma 2 va da cel mai bun răspuns al ei la nivelul său de output. Deci va căuta să găsească acele puncte de pe curba celui mai bun răspuns al firmei 2 care îi maximizează propriul profit. Echilibrul Stackelberg e dat de punctul de tangență al unei curbe de izoprofit la curba de reacție a firmei 2.
Panta curbei de izoprofit:
Panta curbei de reacție:
Echilibrul Stackelberg e de asemenea un echilibru Nash al jocului definit de ipoteza că firma 1 stabilește un output înaintea firmei 2. Dacă firma știe cu siguranță că firma 1 va alege q1s, atunci va dori în continuare să aleagă nivelul de output q2s; dacă firma 1 știe, de asemenea, cu siguranță, că firma 2 va alege cel mai bun răspuns la alegerea sa, ea nu va dori să se angajeze să producă alt nivel de output decât q1s.
Acum ar putea apare următorul contra-argument: dacă firma 1 știe că firma 2 va alege q2s, atunci (ca cel mai bun răspuns la q2s) va produce un profit mai mare decât q1s.acest contra-argument nu are consistență, pentru că ne-am afla într-un alt joc (dat de alte ipoteze). Dacă firma 1 își poate revizui nivelul de output în funcție de alegerea firmei 2, e contrazisă ipoteza modelului Stackelberg; și apoi când firma 1 va anunța, firma 2 va alege cel mai bun răspuns (vezi figura 3.2). În acest caz, însă ne aflăm în jocul dat de ipotezele lui Cournot. Firma 1 nu se va angaja niciodată să producă pentru că firma 1 va alege , obținând un profit mai mic decât în caz (q1s; q2s).
Așadar echilibrul Stackelberg are sens când firma leader se angajează credibil să producă nivelul de output anunțat.
1.2.3 Modelul Bertrand
Până acum s-a propus că firmele să stabilesc nivelul de output, prețurile fiind determinate prin funcția cererii inverse. În multe piețe oligopoliste, firmele stabilesc întâi prețurile și apoi vând cât cere piața. În situația în monopol, nu contează dacă analiza se face prin prețuri sau prin cantități (se ajunge la același rezultat). În oligopol însă, alegerea variabilei de analiză e esențială (J. Bertrand).
Ipoteza modelului: firmele aleg prețurile simultan și independent și vând output-urile generate de funcția de cerere. Ce sistem de prețuri se va alege?
Stabilim curbele de reacție ale celor două firme în acest caz. Pentru firma i avem de rezolvat următorul program de parametru pj:
vezi relația [3.5]
Curbele de reacție sunt drepte cu panta pozitivă. Echilibrul va fi evident (ca și în cazul Cournot) la intersecția celor două drepte:
;
Echilibrul Nash în modelul Bertrand e o pereche de prețuri. Raționamentul ce nu asigură că (p1B, p2B) e un echilibru Nash e asemănător celui de la modelul Cournot. Nici o altă pereche nu are proprietatea de consistență naturală.
Se demonstrează că prețurile de echilibru (p1B, p2B) sunt mai mari decât costurile marginale (c1, c2), de unde rezultă că generează profit; pe de altă parte aceste prețuri sunt mai mici decât în cazul Cournot, deci nivelele de output sunt mai mari. Așadar sistemul de prețuri și de output-uri Bertrand sunt mai competitive decât în cazul Cournot, generând totuși profit.
Să studiem cazul produselor omogene. Se arată că pe o astfel de piață p1B=p2B=c, ca în cazul competiției perfecte. Că acest cuplu de prețuri (p1B=c, p2B=c) e și echilibru Nash se arată urgent. Presupunem că firma i se așteaptă că firma j să aleagă pj1>c. cel mai bun răspuns al lui i este pi1= pj1-, >0. Deoarece, cu acest preț ocupă toată piața, iar pentru destul de mic obține cel mai mare profit posibil. Dar i își dă seama că j gândește la fel și va plăti un preț pj2= pi1-, așa că i alege pi2= pj2-, ș.a.m.d. E clar că, la sfârșit i își dă seama că j nu poate stabili un preț pj>c. Dar nici o firmă nu-și permite să stabilească p<c (ar conduce la pierderi). Așadar (p1=c, p2=c) e singura pereche mutual consistentă și deci este echilibru Nash.
Totuși, acest rezultat obținut pentru o piață cu două firme și produse omogene, identic cu rezultatul de pe o piață cu competiție perfectă e mai puțin plauzibil. Această problemă nu apare neapărat ca o imperfecțiune a ipotezei lui Bertrand conform căreia se aleg prețurile ca variabile de decizie. Principala cauză este ipoteza jocului cu o singură mutare.
Figura 3.3 Echilibrul Bertrand
1.2.4 Modelul Edgeworth
Să presupunem că în modelul Bertrand cu bunuri omogene fiecare firmă are dată exogen o limită superioară a producției (ipoteză realistă, considerând limitarea capacităților de producție). Așadar, în alegerea prețurilor, firmele trebuie să țină cont și de restricțiile , i=1,2.
Pentru simplificarea analizei presupunem . De asemenea, presupunem c1=c2=0. Acesta implică (având în vedere că firmele au o capacitate determinată exogen, deci realizarea unui output de până la implică doar costuri fixe) faptul că maximizarea profitului reprezintă aceeași problemă cu maximizarea venitului.
Resursele sunt omogene, deci cererea este omogenă:
Curbele de reacție sunt date de:
Condiția de gradul I:
Deci
Aceste curbe sunt reprezentate în figura 3.4
Figura 3.4 Curbele de reacție ale firmelor
Nivelurile de output Cournot-Nash sunt (să nu uităm că c=0). Acest punct (dat de ouput-urile Cournot-Nash) se află pe dreaptă la 450, ca și capacitățile firmelor .
În funcție de mărimea capacității , avem trei tipuri de soluții pentru acest joc:
: fiecare firmă are capacitatea de a satisface singură întreaga cerere la prețul egal cu costul marginal p=0;
: capacitatea firmei e mai mică decât în cazul a) dar mai mare decât nivelul de echilibru Cournot-Nash;
: capacitatea firmei e sub nivelul Cournot-Nash.
În cazul a) echilibrul Nash al jocului de stabilire a prețului cu capacități de producție limitate este de p1=p2=0, care este și soluția Bertrand pentru c=0. Restricțiile de capacitate nu au nici un efect deoarece fiecare firmă poate vinde atât cât cere întreaga piață la prețul egal cu costul marginal.
Cazurile interesante, în care apare distincția față de modelul Bertrand sunt b) și c). Înainte de a le analiza, să stabilim două ipoteze:
distribuția egalitară – dacă firmele stabilesc același preț atunci fiecare va vinde jumătate din cantitatea cerută de piață la același preț;
raționalizarea eficientă – dacă firma j stabilește un preț mai mic decât firma i și vinde până la capacitatea maximă , atunci firma i se va confrunta cu curba cererii reziduale:
Figura 3.5 Cererea totală și cererea reziduală
Prețul po la care cererea egalează capacitățile combinate ale celor două firme este
Dacă p0=0.
Să arătăm că firmele nu vor alege un preț mai mic decât po.
Dacă firma j alege prețul pj>=p0, firma i va putea vinde la orice preț pi<=p0; deci firma 1 va alege pi=p0 căci îi aduce un profit mai mare decât orice preț pi<p0.
Dacă firma j alege pj<p0, ea își va vinde întreaga capacitate , însă firma i va putea în continuare să vândă și ea cu prețul cel puțin p0. Deci pi<p0 nu e un răspuns optimal la strategia pj<p0, așa cum nu e un răspuns optimal la strategiile pj>=p0. În consecință, orice preț pi<p0 nu e cel mai bun răspuns la nici o strategie a firmei j. Deci strategiile pi<p0 sunt strategii dominate de strategia p0.
O altă proprietate importantă a lui p0 e aceea că, dacă firma j stabilește un preț pj>p0, cea mai bună strategie nu e de a stabili același preț pi=pj. Ipoteza distribuției egalitare în cazul pi=pj>p0 implică faptul că va vinde o cantitate la prețul pi. Dacă stabilește prețul pi= pj-, firma i va vinde , obținând un profit suplimentar
(pentru destul de mic).
Să considerăm cazul b):
Curbele de reacție au alura din figura 3.6. Dacă firma j alege un preț pjU<peU, cel mai bun răspuns este prețul pn, prețul corespunzător output-ului maximizator de profit.
Figura 3.6 Curbele de reacție ale firmelor 1 și 2
Dacă firma j alege un preț pj între pq și , firma i va răspunde cu pi= pj- (s-a văzut mai devreme).
Dacă firma j alege un preț , atunci firma i va putea alege prețul maxim la care își poate vinde întreaga capacitate .
De vreme ce curbele de reacție nu se intersectează, nu avem un echilibru Nash în acest caz.
Observație: O singură firmă, confruntându-se cu o cerere își manifestă venitul (și profitul căci c=0) alegând dacă e fezabilă alegerea sau , dacă (acest ultim caz corespunde figurii 3.5).
Am notat cu pn prețul pe care firma i îl stabilește în condițiile în care firma j are un preț mai mic și vinde la capacitatea (). În aceste condiții firma i se confruntă cu funcția de cerere reziduală.
Venitul firmei i este .
venitul marginal (vezi figura 3.5).
Firma i își maximizează venitul (=qn notații)
Observație: În termenii dați de figura 3.4, qn e cel mai bun răspuns la stabilirea de către cealaltă firmă a output-ului .
Notăm cu pe prețul pentru care firma i e indiferentă la a vinde întreaga capacitate față de a vinde qn cu pn.
Nu necesită demonstrații faptul că p0<pe<pn
Datorită discontinuității curbelor de reacție în pe, ele nu se vor intersecta și deci nu rezultă nici o pereche de prețuri mutual consistente. Edgeworth a văzut această piață ca pe un proces secvențial de-a lungul mai multor perioade în care prețurile având o evoluție ciclică la nesfârșit, fără a ajunge la un echilibru. Oriunde ar începe procesul, prețurile vor ajunge să evolueze în intervalul [pe, pn]. Din pn, în urma unui proces competitiv de coborâre succesivă a prețurilor, acestea vor ajunge la nivelul pe, de unde vor sări la pn, procesul reluându-se.
Oricum, noi am considerat jocul într-o singură mutare. În aceste condiții, nu ne putem pronunța asupra deciziilor pe care le vor lua firmele, neexistând nici un punct de echilibru Nash. Însă nu s-au luat în considerare strategiile mixte. Într-adevăr, nu există un echilibru Nash de strategii pure în acest joc, așa că vom determina echilibrul Nash în strategii mixte.
Dar mai întâi să studiem și cazul c).
În acest caz
Am văzut că
Dar
Deci în acest caz.
Pe de altă parte:
Deci
Mai sus (în cazul b) s-a văzut că prețurile ciclează în intervalul [pe, pn]. Cum în acest caz pe=pn=p0, rezultă că (p0, p0) e punct de echilibru.
pi= p0 e cel mai bun răspuns al firmei i în cazul în care firma j stabilește un preț la care își vinde capacitatea; deci pi= p0 e cel mai bun răspuns și în cazul pj= p0. Așadar avem un echilibru Nash în punctul (p1= p0; p2= p0).
Să revenim la cazul b). Am văzut că nu există echilibru Nash în strategii pure. Vom arăta că există echilibru Nash în strategii mixte, calculând distribuțiile de probabilitate pe spațiile prețurilor ce determină acest echilibru nash.
Prezentăm determinarea grafică a punctelor pn și pe (intervalul [pe, pn] se va dovedi singurul în care prețurile vor avea probabilități diferite de 0) (vezi figura). Venitul total al celor două firme este dat de:
unde e funcția cererii totale (acesta e venitul pe care l-ar avea un monopolist: . Ne reamintim că aceasta este cantitatea optimă a monopolistului: cu c=0; aceasta în condițiile în care adică ; în caz contrar când este cantitatea optimă a monopolului.)
Notăm cu Rn curba venitului firmei care are un preț mai mare și deci se confruntă cu cererea reziduală (firma concurentă a vândut la capacitate).
Pn va fi soluția programului
și
Mai departe avem:
Figura 3.7
Definim acum strategia mixtă pentru firma i:
Deci e probabilitatea ca firma i să aleagă un preț mai mic decât p.
Astfel, dacă firma i alege strategia mixtă i, atunci firma j, alegând un preț p, acesta va fi mai mare decât prețul ales de firma i cu probabilitatea i(p) și mai mic cu probabilitatea 1-i(p). Venitul așteptat de firma j va fi:
Așa cum s-a văzut anterior, oricare ar fi prețurile de plecare, acestea ajung să varieze între pe și pn. Rezultă că nu va fi ales nici un preț din afara intervalului [pe, pn] ,
și
A avea un echilibru Nash în strategii mixte în acest joc presupune faptul că, oricarear fi prețul ales de firma i firma j să obțină același venit așteptat:
Am folosit faptul că
Egalăm
Să vedem dacă i(p) e o funcție de repartiție:
i(pe)=0 evident
Dacă p>pn, (a)
p>pn, (b)
>0 >0 >0
(Pe [pe, ph) avem )
Deci
Din (a), (b) și (c) i(p) e o funcție de repartiție.
Pentru funcția de repartiție i aleasă de firma i, firma j va fi dispusă să aleagă aleator un preț deci va stabili și ea o funcție de repartiție pe sistemul său de prețuri; mai mult decât atât, firma j va alege aceeași funcție de repartiție.
În acest caz, perechea de strategii mixte ((p), (p)) reprezintă un echilibru Nash.
1.2.5 Variabile de decizie: Prețuri sau Cantități?
Modelele de duopol prezentate anterior ne arată importanța variabilei alese. Bertrand crede că e evident ca firmele să fie privite ca stabilind prețul, considerând modelul lui Cournot în termeni de cantități o greșeală analitică. O perspectivă modernă care prevalează e aceea că nu trebuie făcute astfel de considerații, fiind o chestiune empirică stabilirea modelului potrivit fiecărei piețe în parte. Pe piața analizată, firmele stabilesc producție, permițând apoi prețurilor să se ajusteze până la curățarea pieței sau stabilesc întâi prețul pentru ca apoi să producă nivelul cerut de piață? Răspunsul la această întrebare va determina modelul ce va fi folosit.
O altă idee din literatura economică ce trebuie urmărită este cea a stabilirii endogene a variabilei. În 1983, Kreps și Scheinkman au extins modelul Edgeworth, în sensul că permit firmelor să-și stabilească endogen capacitățile. Se ajunge astfel la o reconciliere între modelele Bertrand și Cournot. Astfel, întâi firmele își stabilesc capacitățile de producție și apoi, cu aceste capacități fixate, se angrenează într-un joc de stabilire a prețurilor (ca în modelul Edgeworth). Capacitățile de echilibru corespund echilibrului Cournot-Nash. Cu aceste capacități se trece la stabilirea prețurilor și s-a văzut că nivelul lor egalează echilibrul Cournot-Nash. Așadar, avem un echilibru Cournot-Nash într-un joc în care se stabilesc prețurile. Acest rezultat nu e destul de robust în cazul variației ipotezelor. În consecință, problema alegerii variabilei de decizie rămân în discuție (vezi Gravelle, Rees – Microeconomics).
1.3 Jocuri cu mai multe mutări
Ipoteza de la care se pornește este aceea că firmele stabilesc prețurile sau output-urile în mod repetat, în fiecare dintr-un număr (finit sau infinit) de perioade de timp. Jocul din fiecare perioadă va fi numit joc constitutiv, iar firmele participante în acest joc cunosc faptul că sunt angajate într-o secvență de repetări a acestui joc. Ele își vor formula strategii pentru un astfel de joc repetitiv și nu doar pentru un joc constitutiv dintr-o anumită perioadă, făcând abstracție de perioadele viitoare.
Într-un fel de context e posibil să luăm în considerație comportamentul cooperativ, în absența unor acorduri formale între firme. Dacă firmele acceptă (tacit sau explicit) să coopereze într-o perioadă și dacă una din firme se abate de la acord, cealaltă firmă o poate “pedepsi” trecând la un proces de coborâre a prețurilor (o creștere a output-ului) sau prin trecerea la alte represalii în perioada următoare. Amenințarea unor previzibile represalii viitoare face ca fiecare firmă să nu se abată de la înțelegerea făcută. Astfel, firmele se pot înțelege în speranța că acordul va fi susținut de interesul fiecăreia.
Această idee mai trebuie supusă, totuși, analizei. În primul rând, câștigul din încălcarea acordului se obține acum în timp ce pierderile de pe urma acțiunii revanșatoare a celeilalte firme va fi înregistrată în viitor. Se pune problema dacă pierderile viitoare vor fi suficiente pentru a compensa câștigurile din abaterea prezentă de la acord. Aceasta depinde de mecanismul prin care acțiunile de pedepsire sunt duse la îndeplinire de nivelul reducerii câștigurilor viitoare, de lungimea perioadei în care firma deviantă poate câștiga după urma comportamentului său. O a doua chestiune o reprezintă aplicarea unei astfel de politici pe o piață (cum ar fi reducerea prețurilor) lovește atât firma care nu a respectat acordul, cât și firma care a aplicat politica respectivă. Amenințarea cu pedepsirea firmei potențial deviante își va avea efectul scontat de intimidare în consecințele în care ar putea fi aplicată efectiv.
O altă problemă se reflectă la caracterul finit sau infinit al numărului de perioade în care jocul se va respecta. Să considerăm că jocul are loc într-un număr finit de perioade. Atunci firmele au cunoștință despre ultima perioadă a jocului. Demonstrăm prin inducție inversă că în acest caz cade ipoteza cooperării între firme. Echilibrul într-un astfel de joc va fi dat de jucarea în fiecare perioadă a echilibrului Nash a jocului constitutiv.
Demonstrația o vom face pe un exemplu (acesta nu înseamnă că nu e valabilă în general). Considerăm un joc Bertrand. În ultima perioadă nu există amenințarea strategiilor de pedepsire viitoare și atunci prețurile stabilite prin acordul firmelor nu reprezintă un echilibru Nash. Așadar, firmele vor alege echilibrul Bertrand-Nash.
În perioada anterioară firmele ar putea fi de acord să coopereze, însă acest acord nu poate fi susținut de strategii credibile de amenințare, deoarece unicul echilibru Nash în subjocul format din ultima perioadă e echilibrul Bertrand. Ambele firme sunt conștiente de acest lucru și vor acționa în consecință, alegând pentru penultima perioadă echilibrul jocului constitutiv, respectiv echilibrul Bertrand-Nash. Aceasta implică în continuare faptul că amenințarea cu stabilizarea de prețuri non-Bertrand în ultimele două perioade nu este credibilă, deci echilibrul în antepenultima perioadă va fi Bertrand-Nash. Raționamentul se extinde perioadă cu perioadă până la începutul jocului. Deci singurul echilibru Nash credibil al jocului respectiv finit este dat de alegerea în fiecare perioadă a strategiilor de echilibru Nash pentru fiecare joc constitutiv.
În jocurile repetitive infinite nu există o ultimă perioadă unde să începem procesul inductiv. Jocul repetitiv va arăta la fel, indiferent de momentul de timp în care va fi analizat. În acest caz vom vedea că o colaborare între firme e echilibrul Nash al jocului repetitiv.
Să studiem posibilitatea reală de existență a unui joc ce se repetă la infinit. Dacă astfel de jocuri nu ar exista în realitatea economică, ar fi lipsit de sens să le analizăm (lipsit de sens din punct de vedere economic). Deși oamenii, ca indivizi, au vieți finite, firmele, ca instituții, au vieți potențiale infinite, iar oamenii care le conduc sunt construiți de aceasta. Mai mult decât atât, dacă un joc are un număr finit, dar incert de perioade, poate fi analizat ca un joc infinit. Astfel, dacă există posibilitatea p că va exista o perioadă viitoare, atunci va fi și o valoare așteptată a pierderilor de pe urma acțiunilor răzbunătoare ale firmei înșelate. Această valoare așteptată a pierderilor susține ideea colaborării între firme.
1.3.1 Posibilitatea cooperării între firme
Vom considera cazurile studiate anterior. Orizontul de timp este F={0, 1, 2, …, }. Se fac alegeri ale output-ului (sau ale prețurilor în fiecare perioadă t din T). O ipoteză pe care o facem e aceea că firmele au același factor de actualizare a câștigurilor, materializat prin rata dobânzii r>0. Ambele firme au drept criteriu maximizarea profitului:
unde (factorul de actualizare), iar e profitul firmei i în perioada t.
Dacă presupunem că firmele cooperează, alocația ce maximizează profitul total va fi cea care nu interesează, pentru că aceasta conferă maxim de câștig în acest caz. Oricum, nu trebuie să ne gândim la acesta ca fiind singura alocație posibilă în cazul cooperării. Nu e dificil de construit un model în care nivelul de output la Counot Nash conduce una din firme la un profit mai mare decât cel obținut în urma acceptării prețului și cantității ce maximizează profitul total. O astfel de firmă nu va fi dispusă să colaboreze, decât dacă plățile laterale sunt fezabile.
Dacă aceste plăți laterale sunt fezabile, firmele își maximizează câștigurile din urma cooperării, producând q1m+q2m (sau qm în cazul produselor omogene) obținându-se astfel profitul total maxim m și apoi efectuând acele plăți laterale (una alteia) care sunt necesare realizării acordului. E evident că profiturile lor , după efectuarea plăților laterale, îndeplinesc relațiile:
, i=1,2 (sau , i=1,2)
Să presupunem acum că plățile laterale nu sunt fezabile. De exemplu, în multe țări cooperarea de acest gen între firme e ilegală și deci astfel de plăți laterale ar fi o dovadă de necontestat a cooperării lor. O modalitate alternativă de transformare a profiturilor este aceea de a varia output-urile de la nivelurile qim; astfel fiecare firmă obține profit din vânzarea propriului output. Se pun atunci două întrebări:
Cum vor realiza firmele acest lucru?
Cât le costă acest lucru, în sensul că, în acest caz, profitul total e mai mic?
În cazul produselor omogene, răspunsurile sunt imediate. Dacă firmele mențin nivelul total de output qm, astfel că prețul să rămână pm, atunci redistribuirea profitului prin variația nivelurilor de output e echivalentă în plățile laterale. Din moment ce costul e constant și identic c, profitul total nu depinde de modul cum firmele își alocă între ele nivelul de output qm.
Aceste considerații nu mai sunt însă valabile în cazul în care firmele nu au costuri marginale constante sau dacă le au constante dar diferite. Astfel, dacă costurile marginale nu sunt constante, creșterea output-ului uneia și scăderea output-ului celeilalte duce la scăderea profitului total. Pe de altă parte, dacă firmele au costuri marginale diferite dar constante, firma cu cel mai mic cost marginal va produce întregul nivel de output.
În modelul de produse diferențiate, firmele vor încerca să-și realoce output-urile și profiturile astfel încât, pentru un nivel dat al profitului firmei i, j să-și maximizeze profitul său. Formal, acesta se scrie:
(*)
Proprietățile funcției i ne asigură că soluția acestui model (q1*, q2*) există și e unică, oricare 10. Deoarece (q1*, q2*) e funcție de 10, atunci și valoarea maximizată a profitului firmei 2, 2*, e funcție de 10.
Setul de perechi (1, P(1)) definește frontiera profitului dând nivelul maxim de profit pentru o firmă, când nivelul de profit pentru cealaltă firmă depășește un nivel dat.
Această curbă este importantă analiza pe care o vom face în continuare, așa că vom studia mai în amănunt.
Scriem Lagrangeanul modelului:
[3.12]
În model apare parametrul 10. Aplicăm teorema plicului.
Pe de altă parte, (3.13)
Din (*)
10 poate lua valori în intervalul , unde e acel nivel de profit pentru firma 1, pentru care valoarea 2 obținută ca soluție a modelului este 0. Se impune această restricție deoarece nici o firmă nu ar accepta un profit negativ atât timp cât opțiunea nulă pentru output și profit este la îndemână.
Dar este panta curbei profitului pentru firma i.
Așadar frontiera profitului se poate defini ca loc geometric al punctelor în care curbele de izoprofit ale celor două firme sunt tangente:
Figura 3.8 Frontiera profitului în sistemul (q1, q2)
Revenim la relația (3.13)
Pentru =0 se obține problema de maximizare a funcției lagrangean: care e echivalentă cu maximizarea profitului în condiții de colaborare perfectă (profitul de monopol). Rezultă că profitul total maxim se obține în punctul în care frontiera profitului are panta –1.
Se duce tangenta 1 de pantă –1 (corespunzătoare lui *=1). Punctul de tangență va fi dat de perechea (1m, 2m), maximizatoare a profitului total.
Putem răspunde acum întrebărilor puse mai devreme. Dacă firmele doresc să obțină profit, altul decât (1m, 2m) și dacă plățile laterale sunt posibile, atunci ele își pot realoca nivelul de profit mișcându-se de-a lungul dreptei L de ecuație 2=m – 1.. dacă plățile laterale nu sunt posibile, atunci realocarea nivelelor de profit prin output le costă pe firme și cel mai rațional comportament în acest caz este să se miște de-a lungul frontierei profitului P(1). Rezultă astfel un profit total inferior lui m.
Sursa pierderii în profitul agregat este mișcarea nivelurilor de output din punctul în care se egalau veniturilor marginale ale celor două firme (veniturile marginale țineau cont de influența output-ului unei firme asupra output-ului celeilalte). Avantajul cooperării constă în internalizarea efectelor externe pe care fiecare firmă le exercită asupra celeilalte. Chiar dacă această internalizare nu este completă ca în cazul maximizării profitului total, se observă (vezi figura 2) că se pot obține profituri mai ridicat pentru ambele firme decât în cazul echilibrelor necooperative.
Am stabilit așadar stimulente la cooperare, dar această cooperare va fi valabilă?
1.3.2 Pedepsirea prin echilibrul Cournot-Nash
Să presupunem că firmele acceptă să producă (q1*, q2*), pereche de output-uri ce le situează pe frontiera de eficiență P(1), undeva pe arcul CC’ (figura 3).
Figura 3.9 Mulțimea alocațiilor de profit ce pot fi susținute
de echilibrul Cournot-Nash
O altă ipoteză pe care o facem e aceea că firmele stabilesc cantități și nu prețuri (joc de tip Cournot).
Pentru susținerea acordurilor, firmele stabilesc următoarele strategii menite să le împiedice să se abată de la cooperare:
dacă firma i produce qi* în perioada t, atunci firma j va produce qj* în perioada t+1;
dacă firma i se abate și produce qiR <>qi* în perioada t, atunci firma j va produce cantitatea sa de echilibru Cournot-Nash qjc în perioada t+1 și în fiecare perioadă ce urmează.
Astfel, o deviație a unei firme de la cantitatea stabilită de comun acord implică automat trecerea celeilalte firme la cantitatea de echilibru Cournot-Nash.
Presupunem că la momentul t=0 firma i se abate de la acordul de cooperare. Din moment ce se așteaptă ca firma j să producă qj*, cel mai bun răspuns este , obținând . Rezultă un câștig imediat. Conform strategiei piedică, firma i se va confrunta cu qjc în fiecare perioadă t>=1, obținând un profit ic. Pierderea viitoare actualizată suferită de firma i va fi:
Firma i nu va fi tentată să devieze în condițiile în care câștigul pe care l-ar obține trișând o dată nu compensează pierderile pe care le va suferi în viitor.
Deoarece un joc repetitiv infinit e identic indiferent de momentul t în care e considerat, dacă această ultimă condiție e satisfăcută la un moment dat, ea va fi satisfăcută în orice moment. Satisfacerea acestei condiții atrage după sine stabilitatea permanentă a output-urilor (q1*, q2*).
Astfel, jocul repetitiv are un echilibru Nash:
dacă , strategiile de amenințare susțin cooperarea și punctul (q1*, q2*) va fi jucat în fiecare perioadă. Dacă firma i se așteaptă ca j să producă qj* atunci va produce qi* și invers.
dacă fiecare firmă gândește că cealaltă va fi tentată să trișeze, și conștientă că același raționament îl face și firma concurentă, va juca direct nivelul de echilibru Cournot-Nash, rezultând echilibrul Nash dat de (q1c, q2c).
Așadar, strategiile piedică prezentate formează un echilibru Nash.
1.4 Amenințări credibile
1.4.1 Credibilitatea strategiilor piedică
Cooperarea susținută de strategiile piedică date de pedepsirea Cournot-Nash e un echilibrului al subjocului perfect, în sensul că amenințarea cu pedepsirea este credibilă. Aceasta presupune că, în momentul în care firma i observă că firma j se dezice de angajamentul luat, strategia piedică a firmei i îi spune să producă qic în fiecare perioadă ce urmează. Cel mai bun răspuns al firmei j este qjc. Alegerea perechii (q1c, q2c) în fiecare perioadă este un echilibru Nash al acestui subjoc. Așadar strategiile piedică satisfac cerințele perfecțiunii subjocului.
Nu mai puțin adevărat este faptul că ne putem îndoi de rezonabilitatea acestor strategii piedică. Pedepsirea permanentă pare a fi extrem de aspră și are efecte negative asupra ambilor jucători, în sensul că nivelul de output Cournot-Nash este mai puțin profitabil pentru firma i decât anumite rezultate dintr-o cooperare. Atunci ne putem aștepta ca firma j să propună firmei i să “ierte și să uite” și să revină la cooperare. Dar, dacă la început aceste strategii piedică păreau de succes, acum, în momentul renegocierii lor, credibilitatea amenințării e pusă sub semnul întrebării.
O altă dificultate cu pedepsirea Cournot-Nash e aceea că nu poate fi foarte severă dacă nivelul de echilibru Cournot-Nash e apropiat de frontiera de eficiență. Acesta înseamnă că există o mulțime relativ restrânsă de puncte pe și sub frontiera de eficiență care să susțină cooperarea pentru o anumită rată a dobânzii r>0.
Să analizăm în continuare câteva strategii de amenințare care să extindă posibilitățile cooperării.
1.4.2 Teorema Folk
Amenințările de tip minimax pot susține orice alocație cooperativă rațională ca echilibru Nash al unui joc infinit. Acesta cunoscută ca fiind teorema Folk.
O pedeapsă minimax este cel mai rău lucru pe care o firmă îl poate face alteia, cunoscut fiind faptul că firma pedepsită va da totuși cel mai bun răspuns la această strategie. Presupunem că firma 1 pedepsește firma 2, perechea de output-uri rezultantă (q1*, q2*) fiind soluția programului:
S-a văzut că curba de reacție a firmei 2 e dată de:
q2=A2-B2q1
Făcând această substituție, rămâne de rezolvat:
Observație:
q2=A2-B2q1 maximizează profitul firmei 2, în condițiile în care q1 este dat; deci
Rezolvăm acest program:
Apar însă mai multe dificultăți. Prima este dată de faptul că această pedepsire poate să nu fie fezabilă. Cu q2=0, cantitatea maximă pe care firma 1 o poate vinde stabilind prețul p1=0 este , care poate fi mai mică decât q1*. Când parametrii modelului conduc la o asemenea situație, firma 1 va minimaximiza profitul firmei 2 producând cantitatea maximă vandabilă q10 la prețul p1=0.
O a doua problemă e aceea că, firma 1 alegând q10 (la prețul p1=0) se alege cu o pierdere (c1q10). Această dificultate poate apărea chiar și în cazul în care ; în acest caz firma 1 va înregistra profit doar dacă p1-c1>0, deci dacă . Însă această condiție nu e în mod necesar satisfăcută. Dacă nu e satisfăcută, pentru a nu înregistra pierderi, firma 1 a putea alege acel nivel de output q1E pentru care veniturile egalează cheltuielile, deci pentru care p1=c1 de unde rezultă:
p1-c1=0
Însă pentru acest nivel firma care pedepsește obține un profit 0, iar firma pedepsită se alege cu un profit pozitiv.
Verificăm condițiile de nenegativitate a profitului:
pentru firma 1:
1-1q1x-c1=18-0,01*1800-6=-6<0
condiție neasatisfăcută
pentru firma 2:
2-2q2x-c2=14-0,008*2400-5=-10*2
condiție nesatisfăcută
Calculăm cantitățile maxim vandabile pentru fiecare firmă, sub restricția de a nu înregistra pierderi:
18 – 0,01*q1E- 0,005(562,5 – 0,3125q1E) – 6 = 0 q1E = 1088,9
14-0,008* q2E – 0,005(600 – 0,25q2E) – 5 = 0 q2E = 888,9
Dacă firma 1 minimaximizează firma 2 obținem:
1=0
q2=562,5 – 0,3125*1088,9 = 222,21
p2=14 – 1,77 – 5,45 = 6,78 2mM = 395,5
Când firma 1 e minimaximizată, obținem:
2=0
q1=600 – 0,25*888,9 = 377,8
p1=18 – 3,77 – 4,45 = 9,78 2mM =1428
Până aici, am arătat că pot exista diferite nivele de output fezabile pentru a pedepsi, depinzând de parametrii modelului.
În continuare vom defini alocația de profit individual rațională. Fie ix (=0) profitul firmei i când e minimaximizată prin nivelul de output qjx și iE (>0) profitul ei corespunzător nivelului qjE. O alocație de profit individual rațională pentru firma i este orice alocație care conduce la i>ix în primul caz sau la i>iE în al doilea caz.
După cum se poate observa în figură, alocările individual raționale de profit pentru firma 2 sunt reprezentate de punctele mulțimii delimitate de axe și frontiera de eficiență în primul caz sau de punctele situate între liniile punctate ce trec prin E și frontiera profitului.
Figura 3.10 Mulțimea alocațiilor de profit individual raționale
Teorema Folk stabilește că strategiile piedică ce includ pedepsirea perpetuă prin minimaximizare pot susține toate alocațiile de profit individual raționale ca echilibru Nash, pentru anumite valori ale ratei dobânzii.
Prin urmare, în comparație cu pedepsirea Cournot-Nash, strategia minimax extinde considerabil mulțimea perechilor de output-uri cooperative ce pot fi susținute cu aceste strategii piedică (sau, cu alte cuvinte, extinde mulțimea de valori a ratei dobânzii cu care, o anumită pereche de output-uri poate fi susținută).
Similar pedepsirii Cournot-Nash, se obține condiția de credibilitate a strategiilor piedică:
(3.14)
Deoarece , avem:
Am arătat astfel că mulțimea ratelor dobânzilor e mai mare în cazul folosirii strategiilor minimax pentru susținerea cooperării.
Strategiile piedică, constituite pe baza teoremei Folk arată astfel:
Pentru Coca-Cola:
dacă European Drinks iese pe piață cu 300 000 de sticle în perioada t, atunci în perioada t+1 va produce 420 000;
dacă European Drinks se abate de la nivelul de 300 000 în perioada t, atunci Coca-Cola va produce 1 088 900 de sticle în fiecare perioadă începând cu t+1.
Pentru European Drinks:
dacă Coca-Cola vinde 420 000 de sticle în perioada t, atunci va produce 300 000 în perioada t+1;
dacă Coca-Cola se abate de la nivelul de 420 000, atunci va produce 889 900 de sticle în fiecare perioadă începând cu perioada t+1.
Aceste strategii determină echilibrul Nash al jocului: dacă i crede că j va juca strategia sa piedică, atunci, în termenii satisfacerii condiției (3.12), cel mai bun răspuns al său va fi propria strategie piedică, rezultând nivelul de output stabilit (q1* q2*) și, implicit, profitul (1*, 2*) jucat în fiecare perioadă. Totuși strategiile piedică minimax nu reprezintă un echilibru al subjocului perfect. Să presupunem că i trișează la momentul t și considerăm subjocul începând de la momentul t+1. Firma j minimaximizează firma i producând qjx; firma i va răspunde evident cu qix; dar qjx nu e cel mai bun răspuns la qix (singurele output-uri mutual consistente sunt qic și qjc ). Așadar perechea (qix qjx) nu e un echilibru Nash al subjocului considerat.
Așadar, pedepsirea Cournot-Nash poate să nu fie prea severă, dar cel puțin e credibilă din punct de vedere al perfecțiunii subjocului, în timp ce pedepsirea minimax e destul de severă, dar nu e credibilă.
1.4.3 Abordarea Abreu
D. Abreu a dezvoltat o idee simplă, dar ingenioasă, care permite pedepsirea mai severă decât prin competiția Cournot-Nash și care oferă strategii perfecte subjocului. Mai mult decât atât, se renunță la pedepsirea perpetuă pentru una mai scurtă și de scurtă durată. Cooperarea e susținută de reducerea profitului prin expansiunea output-ului (pentru pedepsirea firmei deviante), pe de o parte, iar pe de altă parte, de revenirea ulterioară la nivelul cooperativ de output; aceasta din urmă joacă un rol important în acceptarea pierderii de profit din faza de pedepsire.
Considerăm nivelul de output stabilit prin acord de cele două firme ca fiind (q1*, q2*), cu alocația de profit (1*, 2*) (alocație de profit ce poate fi sau nu pe frontiera de eficiență).
Strategiile definite de Abreu sunt următoarele:
firmele produc output-ul stabilit în fiecare perioadă, atât timp cât în perioada precedentă s-a produs aceeași cantitate.
dacă firma i deviază în perioada t, atunci firmele vor produce output-uri de pedepsire (pedeapsa vine din partea firmei j) q1P și q2P în perioada t+1.
Observație:
În general nivelurile q1P și q2P depind de (q1*, q2*)
dacă firmele produc cantitățile q1P și q2P în perioada t+1, atunci se va reveni la nivelul (q1*q2*) în perioada t+2.
Observație:
Devierea în faza de pedepsire va duce la reimpunerea pedepsei, în timp ce acceptarea ei va duce la revenirea la nivelul (q1*q2*).
Notăm. Să stabilim câștigurile și pierderile firmei i în urma devierii de la nivelul de output stabilit. Câștigul imediat este unde , qiR fiind cel mai bun răspuns la nivelul de output qj*. În continuare, ambele firme vor produce (qiP, qjP) astfel că firma i obține profitul iP. Dacă devierea la momentul t e profitabilă, atunci va fi profitabilă și la momentul t+2, ca apoi să fie pedepsită la t+3, ș.a.m.d. Așadar, șirul profiturilor va fi
Firma i nu va devia, dacă:
Dar (3.15)
Există însă niveluri suficient de mari de output care să genereze profituri iP destul de mici, astfel încât câștigul obținut prin devierea într-o perioadă să fie mai mic decât pierderea (actualizată) din perioada imediat următoare.
Să schimbăm acum ipotezele și să presupunem că firma i e tentată să trișeze și în faza pedepsirii. Considerăm subjocul începând la momentul t, în condițiile în care firma i a deviat în perioada t-1. La momentul t, firma i trebuie să producă qiP și să obțină profitul iP. Dacă face într-adevăr așa și condiția (3.15) e satisfăcută, începând cu momentul t+1 cooperarea va fi stabilă, rezultând șirul de profituri pentru firma I .
Valoarea actualizată a acestora la momentul t va fi
Notăm cu qiRP cel mai bun răspuns al firmei i la qjP rezultă profitul
qiRP este așadar profitul pe care firma i îl va obține dacă trișează în faza de pedepsire. Atunci la momentul t+1 se mențin strategiile de pedepsire. Dar, dacă firma i consideră că a meritat să înșele o dată în această fază (la momentul t) o va face în continuare, în fiecare perioadă. Șirul de profituri va fi . Valoarea actualizată la momentul t a acestor profituri va fi .
Pentru ca firma i să nu se abată de la înțelegerea făcută, e necesar ca:
(3.16)
Dacă sunt satisfăcute simultan condițiile (3.15) și (3.16), atunci alocația de profit e susținută de strategiile descrise anterior. De notat că aceste două condiții se întăresc reciproc și trebuie îndeplinite simultan. Condiția (3.15) ne asigură că firmele nu vor devia, în condițiile în care, în acest caz, se va recurge la pedepsire; condiția (3.16) ne asigură că, nu jocul de pedepsire va fi într-adevăr instaurat dacă se deviază, în condițiile în care după aceea se va reinstala și menține cooperare.
Considerăm alocația de profit (2646; 1380) propusă pentru cooperare. Am văzut că aceasta corespunde alocației de output (420; 300).
În construirea strategiilor piedică urmăm următorul principiu în faza de pedepsire, firma deviantă va produce nivelul de output q* din înțelegere, urmând ca firma care pedepsește să producă cantitatea optimă în raport cu nivelul.
Deci:
dacă deviază European Drinks, alocația de output din faza de pedepsire va fi: (600 – 0,25*300, 300), adică (525; 300), corespunzătoare alocației de profit (2756,25; 1192,5) = (1R, 2P)
European Drinks nu va fi tentată să devieze în prima fază dacă .
Dacă deviază în a doua fază, European Drinks va produce
q2RP=562,5 – 0,3125*525=398,44
p2=8,1875 2RP = 1270
Firma nu va devia dacă:
Deci pentru o rată subiectivă a dobânzii mai mică de 69%, European Drinks nu va fi tentată să devieze.
dacă deviază Coca-Cola, alocația de output din faza de pedepsire va fi (420; 562,5 –0,3125*420), adică (420; 431,25); alocația corespunzătoare de profit va fi (2370,5; 1491,26) = (1P, 2R)
Coca-Cola nu va devia, dacă:
Dacă deviază în faza de pedepsire, Coca-Cola va produce:
q1RP=600 – 0,25*431,25 = 492,18
p1=10,922 1RP = 2422,6
Devierea nu va fi profitabilă dacă:
Dacă rata subiectivă a dobânzii nu depășește 128% (corespunzătoare unui factor de actualizare de 19%) firma Coca-Cola nu va dura.
Să arătăm că aceste strategii sunt strategii de echilibru perfect pentru subjocuri. Sunt patru tipuri de subjocuri:
jocul însuși, început la t=0. Dacă i se așteaptă ca j să adere la strategiile specificate, în condițiile (3.15) și (3.16), cel mai bun răspuns al său este să adere la aceste strategii rezultând echilibrul Nash pentru întreg jocul.
un subjoc început la momentul t=1, în care nici o firmă nu a deviat la momentul t-1. Din moment ce acest joc e identic cu primul, strategiile determină un echilibru Nash pentru astfel de subjocuri.
un subjoc începând la momentul t=1, în care una din firme (i) a deviat la momentul t-1. Cu condiția (3.16) satisfăcută, cel mai bun răspuns la qjP e să producă ea însăși qiP la momentul t, ca la t+1 ambele firme să producă qi*qj*. Strategiile definite induc un echilibru Nash în astfel de subjocuri.
un subjoc începând la momentul t=2, în care firma a deviat la momentul t-2, iar la momentul t-1 s-a jucat (q1Pq2P). Acest subjoc e identic cu primul (anterior nu s-a trișat) și deci avem iarăși echilibru Nash.
În concluzie, strategiile definite de Abreu conduc la echilibrul Nash în toate subjocurile posibile, deci sunt strategii de echilibru perfect pentru subjocuri.
Să notăm că în faza de pedepsire, nu doar firma care pedepsește e înclinată să suporte costul acțiunii sale, dar chiar și firma pedepsită prezintă interes în a coopera la propria pedepsire – ambele firme produc cantitatea de pedepsire qiPqjP. În plus, dacă firma i deviază al momentul t și firma j nu adoptă strategia de pedepsire al momentul t+1, atunci din modul de definire al strategiilor, firma i trebuie să pedepsească firma j la momentul t+2; cu alte cuvinte, trișorul îl pedepsește pe cel înșelat pentru că acesta nu l-a pedepsit pentru înșelăciune! Oricum, atât timp cât criteriul folosit pentru credibilitate este perfecțiunea subjocului, amenințările ce derivă din strategii sunt credibile și deci echilibrul Nash va fi dat de jucarea (q1*q2*) în fiecare perioadă.
Susținerea unei alocații de profit prin strategiile propuse de Abreu depinde de funcțiile de cost și cerere ale firmelor și de rata dobânzii, din moment ce primele dau profitul firmei, iar ultima ne dă valoarea actualizată a câștigurilor și pierderilor viitoare. O analiză a abordării lui Debreu au făcut Fredenberg și Maskin (1986), care au arătat că orice alocație de profit individual rațională poate fi susținută ca echilibru perfect pentru anumite valori ale ratei dobânzii. Ei folosesc pentru faza de pedepsire minimaximizarea reciprocă: fiecare firmă produce output-ul ce minimaximizează profitul celeilalte.
Pierderea suferită de firma deviantă va fi mai mare și în general depășește profitul rezultat din deviere. Consecința este aceea că întotdeauna există o durată a perioadei de pedepsire astfel încât orice alocație de profit individual rațională să fie susținută de amenințări credibile, bineînțeles pentru anumite valori ale ratei dobânzii. Însă pedepsirea prin minimaximizare reciprocă e valabilă în general doar pentru două firme. În timp ce toate afirmațiile referitoare la menținerea cooperării prezentate anterior se generalizează ușor la mai multe firme, rezultatele lui Fredenberg și Maskin nu pot fi generalizate.
1.4.4 Strategii rezistente la renegocieri
Criteriul pe baza căruia am stabilit credibilitatea amenințărilor a fost până acum perfecțiunea subjocului. Ideea care se desprinde din strategiile discutate până acum este aceea că firmele se întâlnesc, cad de acord asupra unui echilibru cooperativ (q1*q2*), se înțelege de asemenea asupra strategiilor (să spunem de tipul celor prezentate de Abreu) și apoi își petrec restul timpului implementând aceste strategii, independent una de alta. E ca și cum ar încheia un contract care obligă ambele părți și care nu este renegociabil. Însă, din moment ce acest contract nu leagă părților în mod legal, ci mai degrabă prin propria constrângere, firmele nu pot include și un acord de a nu renegocia strategiile. E imposibil ca părțile să se lege să nu renegocieze; dacă un astfel de acord ar putea fi încheiat și respectat, atunci de ce nu s-ar putea respecta înțelegerea inițială cu privire la nivelul de output, fără a mai fi nevoie de strategiile de amenințare?
Să presupunem că firma i deviază la momentul t. Firma j se confruntă acum cu perspectiva pedepsirii firmei i, pentru că, dacă nu o face, conform strategiei Abreu va fi pedepsită de firma i în perioada t+2. Dar dacă în acest moment firma i sugerează firmei j că, în loc să aplice strategia de pedepsire (care îi afectează pe amândoi), să renegocieze și să înceapă din nou? Cu siguranță că, acest punct, renegocierea unui nou acord ar fi mai bună pentru ambele firme. Însă, dacă această renegociere e anticipată ex ante strategiile Abreu nu mai reprezintă un echilibru Nash.
Necesitatea ca strategiile să fie credibile în sensul că sunt “rezistente” la renegocieri reduce mulțimea de alocații de profit ce pot fi alocații de echilibru la o submulțime de alocații ce pot fi susținute ca echilibru perfect al unui subjoc.
Să presupunem că firmele stabilesc alocația de profit (1*, 2*). Dacă firma i e pusă în situația de a pedepsi, trebuie să fie în interesul său, mai degrabă să o facă, decât să permită o renegociere înapoi la alocația (1*, 2*). Acest lucru este asigurat dacă ip>=ip. În plus, alocația de pedepsire (1p, 2p) trebuie să fie ea însăși rezistentă la renegocieri.
Spunem că alocația de profit (1*, 2*) e slab rezistentă la renegocieri, dacă există o alocație de pedepsire (1P, 2P) slab rezistentă la renegocieri, care:
satisface condițiile (3.15) și (3.16), astfel că strategia de pedepsire determină un subjoc perfect;
satisface condiția iP>=i* astfel că firma i nu poate decât să profite de pe urma pedepsirii, mai mult decât dacă ar reveni la echilibru.
Pentru ca pedepsirea firmei j să aibă într-adevăr efect trebuie să avem jP>=j*. Aceasta înseamnă că alocația (1P, 2P) nu e dominată în sens Pareto de alocația (1*, 2*) și invers.
Pentru o credibilitate sporită sunt utilizate strategiile “tare” rezistente la renegocieri. În acest caz, mulțimea alocațiilor de echilibru la renegocieri se reduce simțitor. O alocație de profit (1*, 2*) e tare rezistentă la renegocieri, dacă e o alocație slab rezistentă la renegocieri și, în plus, poate fi susținută de strategiile de pedepsire, care sunt nedominate Pareto.
Rațiunea rezistenței tari la renegocieri este imediată dacă firmele au posibilitatea de a renegocia la orice moment, ele vor prefera o alocație de output care să le dea ambelor un profit mai mare; astfel o alocație dominată Pareto nu e imună la renegocieri (pentru că oferă posibilitatea unui profit mai ridicat ambelor firme).
1.4.5 Scurtă analiză comparativă
Într-o situație de piață de tip oligopol, firmele sunt înclinate spre cooperare pentru că, în acest mod, pot obține un profit mai mare decât cel rezultat în urma echilibrului unui joc într-o mutare de tip necooperativ. Într-un joc dinamic infinit, se recurge la strategii de amenințare, amenințări care au menirea de a susține cooperarea. Însă aceste amenințări trebuie să fie credibile.
Cel mai slab criteriu de credibilitate este perfecționarea subjocurilor. Am văzut că atât modelul lui Friedman de pedepsire prin competiție Cournot-Nash cât și modelul propus de Abreu satisfac acest criteriu. Putem considera modelul lui Abreu ca fiind mai atractiv pentru firme pentru că dă posibilitatea reluării cooperării, după aplicarea strategiilor de pedepsire. Pe de altă parte, în cazul competiției Cournot-Nash, aplicarea strategiilor de pedepsire are repercusiuni și asupra firmei care recurge la ele, lucru valabil uneori și în cazul aplicării strategiilor lui Abreu. Această parte submină credibilitatea amenințărilor, dacă firmele se pot așeza din nou, în orice moment la masa negocierilor.
În consecință, condițiile de credibilitate sunt întărite prin impunerea condițiilor de rezistență la renegocieri. Pedepsirea se face prin mișcarea spre o alocație de profit care e mai bună pentru firma ce adoptă strategia de pedepsire și mai rea pentru firma pedepsită. În forma sa tare, condiția de rezistență la renegocieri reduce mulțimea alocațiilor de echilibrul la o submulțime a punctelor de pe frontiera profitului.
Teoriile prezentate furnizează ipoteze testabile referitoare la condițiile în care se poate realiza cooperarea; aceste condiții presupun cunoașterea unor parametri referitori la funcțiile de cost și de cerere ale firmelor, ca și estimarea ratei dobânzii. Rămâne totuși o problemă în discuție: existența unui set destul de larg de alocații de echilibru posibile; teoriile referitoare la credibilitatea strategiilor și modul în care acestea susțin echilibrul unic al pieței. Sunt necesare noi ipoteze care să permită precizarea unei singure alocații ca echilibru unic al pieței. Acesta e o chestiune deschisă încă în teoria economică.
În această lucrare, am studiat doar câteva din temele centrale ale teoriei oligopoliste: ipotezele referitoare la alocarea de echilibru pentru produse omogene și diferențiate, în condițiile în care piața e văzută ca un joc de o singură mutare; condițiile în care firmele pot colabora și susține această colaborare, într-o situație în care firmele interacționează repetat pe piață. Restrângerea numărului de firme al două a avut scopul de a simplifica analiza, generalizarea la mai mult de două firme fiind directă.
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: . Studiul Pietelor Oligopoliste Utilizand Teoria Jocului (ID: 132953)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
