Modele Econometrice DE Regresie

MODELE ECONOMETRICE DE REGRESIE

CUPRINS:

LISTA ABREVIERILОR

M.C.M.M.P. – Metoda celor mai mici pătrate

CD – Cobb-Douglas

LISTA FIGURILОR

Fig. 1.1. Tipuri de modele probabiliste ………………………………………………… 13

Fig. 1.2. Tipuri de modele de regresie …………………………………………………. 14

Fig. 1.3. Clasificarea modelelor de regresie …………………………………………… 15

Fig. 1.4. Variația erorilor în jurul dreptei de regresie ………………………………….. 17

Fig. 2.1. Regresia liniară cu o singură ecuație …………………………………………. 21

Fig. 2.2. Îndepărtarea a punctului Xk de la punctul ………………………………….. 26

Fig. 2.3. Modele ce pot fi linearizate …………………………………………………… 32

Fig. 2.4. Variabilele "dummy", care pot lua valori 0 …………………………………… 34

Fig. 2.5. Varianta funcției semilogaritmice ……………………………………………. 35

Fig. 2.6. Polinom de gradul doi ………………………………………………………… 36

Fig. 2.7. Coeficientul unghiular ………………………………………………………… 37

LISTA TABELELОR

Tabelul 2.1. Estimarea semnificației ecuației de regresie ……………………………… 23

Tabelul 2.2. Sumarul formelor funcționale alternative ………………………………… 38

INTRОDUCERE

Actualitatea și impоrtanța temei: Econometria poate fi definită ca analiza cantitativă a fenomenelor economice reale. Profesioniștii în domeniu definesc econometria sub forma unui set de tehnici fascinante care permit măsurarea și analiza fenomenelor economice și previziunea tendințelor economice pe viitor. Econometria constituie o definiție formală și un conținut vast.

Econometria, literal, înseamnă "măsurări economice" și ea se ocupă de măsurarea cantitativă și de analiza economiei reale și a fenomenelor ce țin de business. Ea reprezintă o tentativă de a măsura economia reală și de a construi un pod deasupra prăpastiei ce desparte teoria economică și activitatea de business reală. Econometria ne permite să examinăm datele ce caracterizează firmele din lumea reală și să comăsurăm acțiunile acestor firme cu alți factori, cum ar fi acțiunile consumatorilor și a guvernelor.

La fel ca și în multe alte domenii, în domeniul economic și în particular în cel al afacerilor se întâlnesc deseori situații care presupun luarea unor decizii, care necesită prognoze sau care pun în evidență nevoia de a cunoaște modul în care depind unele de altele anumite mărimi importante la nivel de firmă.

O atenție specială se pune pe punctarea etapelor ce precedă realizarea unei regresii, începând de la fundamentarea teoretică a evenimentului cercetat, stabilirea variabilei dependente și a variabilei (variabilelor) relevante independente, alegerea formei funcționale potrivite, și, în sfirșit, colectarea datelor de încredere, ca apoi sa fie verificate ipotezele care asigură aplicarea metodei celor mai mici pătrate. În cazul în care una sau mai multe ipoteze sunt violate, să se determine metoda de estimare a coeficienților ecuației de regresie aprobate.

Scоpul prоiecului știintifice s-a propus a fi atins doar prin soluționarea următoarelor sarcini de bază: abordarea conceptuală a modelelor econometrice de regresie și analizei modelelor liniare de regresie cu o singură ecuație sau simple și modelelor de regresie liniare multifactoriale.

Оbiectivele prоpuse: constă în a fi prezentate noțiuni și concepte fundamentale ale modelelor econometrice de regresie. De a analiza tipurile și erorile ale modelelor de regresie. De a specifica ecuațiile de regresie și de a fi propuse anumite forme funcționale.

Analiza regresională este utilizată pentru efectuarea estimărilor cantitative a relațiilor economice care în prealabil aveau loc doar din punct de vedere pur teoretic. Pentru prezicerea direcției schimbărilor este necesar de cunoscut teoria economică și caracteristicile generale a produsului în examinare. Iar pentru prezicerea schimbărilor în cantitate, sunt necesare un set de date și o metodă de estimare a relației propuse. În econometrie cea mai frecvent utilizată metodă de estimare a acestor relații este analiza regresională.

Metоdоlоgia cercetării: Știința a cоnstituit dintоtdeauna un factоr principal al prоgresului material și spiritual al sоcietății. Sub acest aspect, prоiectul cоnstituie о cercetare înzestrată cu un ansamblu de principii, prоcedee și tehnici de investigare. Mijlоacele și metоdele cоgnitive, analiza ipоtezelоr, analiza datelоr statistice au fоst aplicate cоncоmitent pentru оbținerea rezultatului.

Revista literaturii de specialitate: s-a ținut cont de propunerile, publicațiile, experiența și cunoștințele vaste ale îndrumătorilor contemporani.

Baza informațională este reprezentată de manual de specialitate a modelelor econometrice, probabilistice, și material de statistică econometrică.

Mоtivele care stau la bază studierii acestei teme au fоst în nenumărate rînduri prezentate în lucrările de specialitate, numerоase articоle științifice din sfera ecоnоmică. Sursele principale din literatura de specialitate au fоst: Patraș M., Jaba E. ș.a.

CAPITОLUL 1. CONCEPTE FUNDAMENTALE A MODELELOR ECONOMETRICE DE REGRESIE

1.1. Abordări econometrice în modele propabiliste de regresie

Orice analiză cantitativă necesită a fi precedată de colectarea, organizarea și introducerea datelor în calculator. Uzual această muncă este ingrată și ocupă mult timp, deoarece este greu de găsit datele, există diferență dintre datele teoretice și cele empirice, este sporită probabilitatea erorilor tipografice și dactilografice [14]. Atunci când sunt cunoscute sursele de informație și datele sunt corect definite, în pofida pierderii de timp la meditarea asupra naturei datelor și colectării lor, e mai mică probabilitatea comiterii greșelilor la utilizarea sau interpretarea rezultatelor regresiei respective.

Când se alege tema pentru cercetare în primul rând trebuie să existe certitudinea că este posibil de le găsit datele pentru variabila dependentă și toate variabilele independente relevante [11]. În orice caz, verificarea disponibilității înseamnă deciderea asupra specificației variabilelor ce vor fi incluse în studiu. Jumătate din timp care cercetătorii începătorii îl petrec colectând datele este irosit în căutarea variabilelor incorecte din surse greșite [5]. Câteva minute de meditație asupra naturii datelor de căutat vor salva ore de nemulțumire pe viitor.

Pentru estimarea coeficienților modelului structural este necesar ca sistemul de ecuații să fie posibil de identificat sau acest sistem de ecuații să fie supraidentificat.

Regula de calcul considerată reprezintă o condiție necesară însă nu și suficientă pentru ca sistemul de ecuații să fie posibil de identificat. O condiție mai perfectă se determină în cazul în care asupra coeficienților matricei formate din parametrii modelului structural se aplică unele condiții. Ecuația poate fi identificată, dacă în baza variabilelor endogene și exogene, care nu fac parte din ecuație, poate fi obținută o matrice din coeficienții ei pe lîngă alte ecuații din sistem, determinantul căreia nu este egal cu zero iar rangul matricei nu e mai mic decât numărul variabilelor endogene din sistem fără una.

Oportunitatea verificării condiției de identificare a modelului prin determinantul matricei formate din coeficienți pe lîngă variabilele ce lipsesc în ecuația examinată, dar care sunt prezente în alte ecuații ai sistemului, se explică prin faptul că e posibilă situația, pentru care regula de calcul este îndeplinită, însă determinantul matricei pe lîngă coeficienții numiți este egal cu zero [18]. În acest caz are loc numai condiția necesară pentru a fi identificată ecuația examinată, în timp ce condiția suficientă este violată.

De exemplu, fie că variabila dependentă este cantitatea televizoarelor solicitate într-un an, atunci și majoritatea variabilelor independente la fel vor fi măsurate anual. Va fi nepotrivit sau pur și simplu greșit să fie definite prețurile TV ca prețuri pentru o lună distinctă. Mai bine înțeles va fi prețul mediu pe parcursul unui an fiind raportat la numărul TV vândute într-o lună. Dacă variabila dependentă include toate televizoarele vândute, indiferent de marcă, atunci prețul cel mai potrivit va fi prețul agregat format în bază prețurilor ale tuturor claselor de TV. Și totuși calcularea unei atare variabile nu este bine venită.

Econometria poate fi definită ca analiza cantitativă a fenomenelor economice reale. Profesioniștii în domeniu definesc econometria sub forma unui set de tehnici fascinante care permit măsurarea și analiza fenomenelor economice și previziunea tendințelor economice pe viitor [12]. Econometria constituie o definiție formală și un conținut vast. Econometria, literal, înseamnă "măsurări economice" și ea se ocupă de măsurarea cantitativă și de analiza economiei reale și a fenomenelor ce țin de busines. Ea reprezintă o tentativă de a măsura economia reală și de a construi un pod deasupra prăpastiei ce desparte teoria economică și activitatea de busines reală [18]. Econometria ne permite să examinăm datele ce caracterizează firmele din lumea reală și să comăsurăm acțiunile acestor firme cu alți factori, cum ar fi acțiunile consumatorilor și a guvernelor.

Econometria are trei direcții de bază de utilizare:

1. descrierea economiei reale;

2. testarea ipotezelor referitor la teoria economică;

3. pronosticarea activității economice pe viitor.

Cea mai simplă direcție de utilizare a econometriei este descrierea. Econometria ne permite să evaluăm activitatea economică; ea ne permite să introducem numere în ecuații care în prealabil conțineau numai simboluri abstracte [16]. De exemplu, cererea consumatorului pentru un anumit bun poate fi prezentată ca o relație dintre cantitatea cerută (C), prețul bunului (P), prețul bunurilor de substituție (Ps) și venitul disponibil (Yd). Pentru majoritatea bunurilor relația dintre consum și venitul disponibil se presupune a fi pozitivă, deoarece creșterea venitului disponibil se asociază cu creșterea consumului de bunuri [6]. Econometria ne permite să estimăm această relație în baza consumului, venitului disponibil și prețurilor înregistrate în trecut.

Cu alte cuvinte, o relație funcțională

C = f(P, Ps, Yd) (1.1)

Se transformă într-o relație explicativă de felul:

C = -60,5 – 0,45 * P + 0,12 * Ps + 12,2 * Yd. (1.2)

Această prezentare ne oferă un tablou mult mai specific și descriptiv. Să comparăm ecuațiile (1.1) și (1.2). Expresia (1.1) ne comunică: consumul se așteaptă să crească "odată" cu creșterea venitului disponibil. În timp ce ecuația (1.2) ne permite să așteptăm o creștere de o cantitate specifică de 12,2 unități la fiecare unitate de creștere a venitului disponibil. Cifra 12,2 se numește coeficientul regresiei estimate [13]. Și abilitatea econometriei de a aprecia acest coeficient este valoarea ei.

Al doilea, și probabil cel mai uzual mod de utilizare a econometriei, este testarea ipotezelor. De exemplu, putem testa, va fi bunul examinat un bun normal (pentru care cererea crește odată cu creșterea venitului disponibil). La prima vedere, se pare că aceasta ipoteză poate fi susținută întrucât semnul coeficientului este pozitiv, însă "semnificația statistică" a acestei estimări urmează a fi investigată înainte de a justifica o atare concluzie [9]. Folosirea econometriei în testarea ipotezelor este, probabil, ceea mai importantă funcție.

A treia, și ceea mai dificilă modalitate de utilizare a econometriei, este pronosticarea sau previziunea: ce e probabil să se întâmple în trimestrul următor, în anul viitor ori mai departe pe viitor. De exemplu, economiștii folosesc modelele econometrice pentru a face previziuni pentru așa variabile ca: volumul vânzărilor, volumul veniturilor, Produsul Intern Brut, rata inflației etc. Precizia acestor previziuni depinde în ceea mai mare măsură de gradul cu care trecutul dirijează viitorul [16]. De exemplu, vom presupune că președentile companiei, care propune produsul modelat în ecuația (1.1), dorește să decidă majorarea prețurilor sau păstrarea lor la același nivel. El va pronostica volumul vânzărilor cu și fără creșterea prețurilor ceea ce îl va ajuta în luarea acestei decizii.i decizii. În acest mod econometria poate fi utilizată nu numai pentru previziune, dar și pentru analiza politicilor.

Abordări econometrice de alternativă

Pentru obținerea unui tablou mai reușit al abordării posibile vom puncta etapele necesare de efectuat pentru orice investigație cantitativă:

a) specificarea modelului sau relației de studiat;

b) colectarea datelor necesare pentru estimarea modelului;

c) estimarea modelului cu ajutorul datelor.

Etapele a) și b) sunt similare în investigațiile cantitative iar tehnicile utilizate la etapa c) – estimarea modelului diferă de la o disciplină la altă disciplină [12]. Alegerea tehnicilor pentru evaluarea modelului, în baza unui set de date specifice, de regulă, se referă la "arta" econometrică. Există diferite abordări alternative pentru evaluarea unei și aceeași ecuații, și fiecare abordare poate oferi rezultate ce diferă unul de altul.

În continuare ne vom referi la abordarea ce ține de analiza regresională. Însă important e ca fiecare econometrician să conștientizeze: regresia este numai una din tehnicile folosite în estimarea econometrică [10].

De cele mai multe ori un model descrie legăturile existente între două sau mai multe variabile. În general, sînt două clase de modele:

Modele deterministe

Modele probabiliste

Modele deterministe:

Exprimă o relație exactă între variabile;

Teoretic, eroarea de previziune este nulă.

Modele probabiliste:

Componenta deterministă;

Componenta aleatoare;

Eroarea de previziune este nenulă;

Componenta aleatoare poate fi datorată factorilor obiectivi, ce nu sînt incluși în model.

Fig. 1.1. Tipuri de modele probabiliste [5]

1.2. Tipuri de modele de regresie

Analiza regresională este utilizată pentru efectuarea estimărilor cantitative a relațiilor economice care în prealabil aveau loc doar din punct de vedere pur teoretic. Pentru prezicerea direcției schimbărilor este necesar de cunoscut teoria economică și caracteristicile generale a produsului în examinare (de exemplu, dependența volumului de vânzări a discurilor floppy în funcție de preț). Iar pentru prezicerea schimbărilor în cantitate, sunt necesare un set de date și o metodă de estimare a relației propuse [4]. În econometrie cea mai frecvent utilizată metodă de estimare a acestor relații este analiza regresională.

Originea regresiei ca metodă statistică se află în studiile sale de genetică aplicată în studiul plantelor – 1877. Plantînd boabe dintr-un anumit soi de mazăre dulce a observat că există o legătură liniară între diametrele acestor boabe și diametrele boabelor recoltate de la noile plante [3]. El a numit inițial panta acestei drepte “coefficient of reversion”, schimbîndu-i apoi numele în “coefficient of regression”.

Termenul de regresie provine de la descoperirile sale în domeniul eredității: în general, progeniturile indivizilor geniali au abilități care îi așază mai degrabă la nivelul mediei; de asemenea, înalțimea copiilor proveniți din tați foarte înalți se apropie mai mult de înălțimea medie decît înălțimea taților [8].

Fig. 1.2. Tipuri de modele de regresie [7]

Există însă un revers al medaliei, pentru că intuiția este totuși intuiție și s-ar putea să nu fie foarte exactă. Desigur că logica lucrurilor ne face să afirmăm că promovarea produsului are ca rezultat creșterea vânzărilor, dar practica ne învață că se poate să nu se fi optat pentru cea mai bună variantă de promovare, că din motive greu de înțeles vânzările nu au crescut sau, în orice caz, nu atât de mult pe cât s-a dorit sau cât să acopere măcar cheltuielile efectuate în scopul reclamei [14]. Din acest motiv ar fi ideal dacă întreprinzătorul ar putea să cunoască din vreme o serie de detalii, ca de exemplu modul în care se va realiza promovarea produsului, măsura în care vânzările preconizate sunt realizabile, natura relației care se stabilește între cheltuielile pentru reclamă și volumul vânzărilor și prin urmare să poată răspunde la întrebarea: „Există posibilitatea ca efortul financiar făcut în scopul publicității să fie acoperit într-un interval de timp convenabil".

Fig. 1.3. Clasificarea modelelor de regresie [1]

Cu siguranță că astfel de lucruri nu vor putea fi cunoscute pur și simplu, pentru că este nevoie de date, date statistice pentru care prelucrarea și analiza prin metode specifice vor putea oferi informațiile necesare. Maniera în care sunt colectate datele și aranjarea lor în forma cea mai potrivită nu reprezintă domeniul nostru de interes [13]. Amănunte despre aceste etape, despre maniera în care sunt duse la îndeplinire, se pot găsi în orice manual de statistică. Econometria poate intra în scenă doar după ce au fost oferite date suficiente, imediat ce a fost stabilită problema care trebuie rezolvată și în măsura în care metodele specifice acestei discipline sunt utilizabile.

Vom face împreună primii pași în econometrie, prin studiul unei metode care poate fi utilizată în scopul determinării unei relații de dependență între două mărimi de interes pe care le vom numi variabile. Este vorba despre Analiza regresiei. Deocamdată ne vom ocupa de cazul cel mai simplu, acela care implică intenția de a descrie o variabilă y, pe care o vom numi variabilă dependentă, sau endogenă, în funcție de o singură variabilă x, care va purta numele de variabilă independentă, sau exogenă [15]. Cel mai simplu tip de analiză de regresie presupune că relația dintre cele două variabile se apropie de o relație liniară care, într-o reprezentare grafică, are foma unei drepte. Cazul care implică o astfel de relație de dependență este cunoscut în literatura de specialitate sub numele de Analiza regresiei liniare simple. Dacă variabilele independente sunt două, sau mai multe, ne situăm în cazul regresiei multiple.

Rezumând, ne vom ocupa de determinarea relației dintre:

y: variabilă dependentă, sau endogenă;

x: variabilă independentă, sau exogenă.

Vom considera că relația este suficient de apropiată de una liniară și din cauza acestei „aproximări" este natural să ne punem problema dacă liniaritatea este o supoziție corectă. Prin studiul corelației dintre x și y se determină gradul în care variabilele sunt, într-adevăr, în relație liniară și nu de altă natură [2]. Analiza de corelație, de care nu ne vom ocupa în această lucrare, este o procedură de stabilire a măsurii în care relația dintre x și y este liniară și, dacă acest lucru se confirmă, tot analiza de corelație ne ajută să determinăm intensitatea relației.

În încheierea acestei prime secțiuni ne vom întoarce pentru o clipă la exemplul întreprinzătorului doritor să știe dacă reclama făcută produsului are efectul scontat și vom observa că variabila dependentă y este volumul vânzărilor, iar variabila independentă x este reprezentată de suma cheltuită pentru publicitate. Pe viitor, dacă nu se fac specificații cu privire la alegerea variabilelor, va trebui să aveți abilitatea să stabiliți singuri cine este exogena și cine este endogena, pentru a putea construi un model viabil.

1.3. Erori ale modelului de regresie

Experiența didactică mi-a dovedit că în foarte multe cazuri persoanele care iau contact cu modelul de regresie întâmpină dificultăți în a înțelege condițiile oarecum abstracte care se impun asupra erorilor ε. De ce sunt ele considerate variabile aleatoare. De unde provin și ce anume trebuie luat în calcul atunci când ne referim la erori?

Logica lucrurilor ne spune că volumul vânzărilor firmei de telefonie mobilă nu este influențat doar de numărul de clienți din supermarket. Există, intuim, și alți factori care își pot pune amprenta, dar pe care nu îi considerăm atât de importanți pentru a fi introduși în model.

Fig. 1.4. Variația erorilor în jurul dreptei de regresie [6]

De exemplu, există clienți care vizitează centrul comercial fără intenția de a pătrunde în supermarket și care manifestă totuși interes față de oferta firmei. Chiar dacă aceștia nu influențează decisiv volumul vânzărilor, ei trebuie luați în seamă pentru că în ansamblu pot produce perturbări asupra rezultatelor așteptate. De asemenea, se întâlnesc și o serie de elemente de natură calitativă, greu sau imposibil de cuantificat, care pot influența clienții supermarketurilor astfel încât să îi determine să nu fie niciodată adeptii firmei de telefonie mobilă sau în orice caz nu ai dealerului din vecinătate: gusturile, înclinația către un anumit dealer, percepția asupra personalului din magazin, fidelitatea față de o altă firmă sunt la rândul lor elemente care fac ca o simplă relație matematică să fie insuficientă pentru descrierea unor rezultate exacte [6]. Și, nu în ultimul rând, pot să apară erori în înregistrarea datelor statistice cu ajutorul cărora se construiește modelul. Pot fi erori în comunicarea valorilor observate ale variabilei observate y, caz în care modelul de regresie se va bucura o dată în plus de prezența lui ε, sau erori în înregistrarea variabilei independente x. Pentru liniștea noastră, nu vom lua în calcul deocamdată această ultimă de posibilitate deosebit de neplăcută din punct de vedere al consecințelor.

În concluzie, variabila eroare este necesară și, din păcate, ea nu poate fi observată efectiv ci doar luată în calcul ca fiind prezentă și dotată cu anumite proprietăți puse în evidență de specialiști în scopul încercării de a conviețui cu ea. Condițiile impuse asupra variabile eroare sunt prezentate în cele ce urmează, împreună cu implicațiile lor.

Condiția 1: Eroarea ε este o variabilă aleatoare normal distribuită, luând valori pozitive sau negative care reflectă devierea dintre valoarea observată a lui y și valoarea rezultată prin înlocuirea lui x în β0 + β1x.

Implicații: Deoarece β0 și β1 sunt constante, deducem că pentru o valoare dată a lui x, y = β0 + β1x + ε, este de asemenea o variabilă aleatoare normal distribuită.

Condiția 2: Media variabilei aleatoare eroare este zero, adică M(ε) = 0. Implicații: Să ne remintim că valoarea medie a unei constante este constanta însăși și faptul că:

M(X + Y) = M(X) + M(Y).

Deducem astfel valoarea medie a variabilei dependente Y, din calculul următor: M(y) = M(β0 + β1x + ε) = M(β0)+ M(β1x) + M(ε).

Pentru că x, β0 și β1 sunt constante și media variabilei aleatoare eroare este zero, obținem:

M(y) = β0 + β1x. (1.3)

Condiția 3: Dispersia variabilei aleatoare ε, pe care o vom nota , este aceeași pentru toate valorile lui x.

Implicații: Pornind de la proprietățile dispersiei, vom demonstra că și variabila aleatoare dependentă y are aceeași dispersie pentru toate valorile lui x.

D2(y) = D2(β0 + β1x + ε) = D2(β0) + D2(β1x) + D2(ε)

Pentru că dispersia unei constante este zero și D2(ε) = obținem, indiferent de valoarea lui x:

D2(y) = . (1.4)

Vom reține această implicație pentru că va fi de natură să explice foarte multe din afirmațiile de mai târziu. Va trebui să reținem, de asemenea, relația (1.3) ca fiind deosebit de importantă și o vom numi ecuația de regresie. Aflăm de aici modul în care se poate calcula media variabilei dependente y, despre care am aflat că este o variabilă aleatoare normală, pentru valori fixate ale lui x.

Deocamdată lucrurile sunt destul de abstracte și de aceea ne vom întoarce pentru o clipă la exemplul firmei de telefonie mobilă. Să ne referim la supermerketul în care există zilnic o mie de clienți [17]. Deci, x = 10. Semnificația relației (1.3) pentru x = 10 este aceea a valorii medii a vânzărilor anuale înegistrate de către toți dealerii situați în vecinătatea suprmerketurilor cu o mie de clienți pe zi. În cazul particular x = 10, eroarea specifică depinde de diferența dintre valoarea observată y relativ la acest x și valoarea medie rezultată din ecuația de regresie, M(y). Pe măsură ce vom avansa în prezentarea modelului de regresie, toate aceste elemente care deocamdată au o conotație destul de teoretică vor căpăta sens.

În finalul acestei secțiuni mă simt datoare să fac câteva comentarii. Pentru aceia dintre cititori care își amintesc faptul că funcția de gradul I a fost predată de profesorul de matematică încă de prin clasa a șaptea, modelul de regresie liniară cu o singură variabilă independentă poate fi considerat pueril și oarecum departe de realitatea înconjurătoare [9]. Complexitatea din viața economică sugerează fenomene care nu au nici un motiv să se comporte atât de simplist încât să ne permită să le modelăm printr-o funcție de gradul întâi. Ajuns în prag de bacalaureat, orice elev cunoaște deja o sumedenie de funcții cu o singură variabilă și atunci se naște, firesc, întrebarea: ce forță mai are regresia liniară simplă, dacă se dovedește că dependența lui y de x are, de exemplu, forma y = β0 + β1×2? Aceeași forță, este răspunsul la întrebare. Pentru că nu vă oprește nimic să faceți o notație, z = x2, cu ajutorul căreia dependența capătă o natură liniară: y = β0 + β1z. Mai departe, veți proceda la fel ca și în modelul discutat până acum, având z pe poziția lui x și încercând să nu uitați ce se află în spatele notației pe care ați făcut-o. Dar trebuie spus și faptul că modelul de regresie liniară nu este atot puternic, lucru despre care nu vom discuta pe larg deocamdată.

Analiza regresională este o tehnică (o metodă) statistică care încearcă să "explice" schimbările unei variabile, variabile dependentă (de explicat) ca funcție de schimbările altei variabile sau set de variabile, așa numite variabile independente (sau explicative), prin evaluarea unei singure ecuații, cum ar fi C = f(P, Ps, Yd). Aici C este variabilă dependentă (de explicat), iar P, Ps,Yd – variabile independente (explicative). Analiza regresională este un instrument bine venit pentru economiști deoarece majoritatea afirmațiilor economice pot fi formulate într-o formă funcțională dintr-o singură ecuație.

CAPITОLUL 2. ANALIZA MODELE ECONOMETRICE DE REGRESIE

2.1. Modelul de regresie liniar

Expresia (2.1)

este cel mai simplu model de regresie de o singură variabilă. Prin ecuația (2.1) se afirmă că variabila dependentă (endogenă) Y este o funcție lineară de o singură variabilă independentă (exogenă) X. Modelul este de o singură ecuație deoarece nu mai sunt alte ecuații pentru Y ca funcție de X (sau de alte variabile). Modelul este liniar deoarece sub forma sa grafică reprezintă o linie dreaptă, dar nu o curbă.

sunt coeficienții (sau parametrii) care determină coordonatele liniei drepte în orice punct. este constantă sau termenul de intersecție, el indică valoarea lui Y pentru X egal cu zero. este coeficientul de înclinație, și el indică valora cu care se va schimba Y, când X se schimbă cu o unitate. Coeficientul unghiular β demonstrează reacția (răspunsul) lui Y față de schimbările în X. Pentru a explica și a prezice schimbările în variabila dependentă, ce e obiectivul major în evaluarea relațiilor comportamentale, accentul principal se pune pe coeficientul de înclinație cum ar fi . Pe desen, de exemplu, dacă X o avut să crească de la X1 până la X2, valoare lui Y conform ecuației (2.1) va crește de la Y1 la Y2. În modelele de regresie liniară răspunsul valorilor pronosticate Y la schimbările în X este determinat de o constantă, egală cu coeficientul de înclinație:

. (2.2)

Este necesar să se facă distincție dintre ecuațiile liniare în variabile și ecuațiile liniare în parametri (coeficienți), deoarece regresia liniară trebuie să fie liniară în coeficienți, ânsă nu neapărat liniară în variabile. Ecuația este liniară în variabile, grafic reprezentând o linie dreaptă, în timp ce ecuația nu este liniară în variabile, deoarece reprezintă grafic o curbă pătratică dar nu o linie dreaptă.

Ecuația este liniară față de coeficienți (parametri) numai în cazul dacă parametrii apar sub forma ceea mai simplă – ei sunt ridicați la putere (nu mai mare decât unu), nu se înmulțesc și nu se împart la alți coeficienți și nu fac parte din careva funcții (cum ar fi log sau exp). Ecuația (2.1) este liniară în coeficienți, dar nu este liniară în coeficienți , deoarece nu există o transformare a ecuației care s-o aducă la forma liniară. În general, din toate ecuațiile posibile cu o singură variabilă explicativă, numai funcția sub formă generală este liniară în coeficienți .

Fig. 2.1. Regresia liniară cu o singură ecuație [11]

Toate cele expuse sunt importante deoarece la aplicarea tehnicii regresiei liniare ecuația necesită să fie liniară în coeficienți. Analiza regresională liniară poate fi aplicată la ecuații care nu sunt liniare în variabile, dar pot fi prezentate în așa mod ca să fie liniare în coeficienți.

Ecuația regresiei evaluată

Odată ce s-a decis specificația ecuației, ea trebuie evaluată, este necesar să se determine parametrii. Aceasta versiune a ecuației de regresie “adevărată” se numește ecuație de regresie estimată și se obține din observațiile Ys, Xs. În timp ce ecuația adevărată este pur teoretică în natură:

(i = 1, 2, …, n). (2.3)

Ecuația de regresie estimată conține numere reale în ea

= 103,4+6,38X (2.4)

Valorile observate a lui X și Y se folosesc la determinarea parametrilor estimați 103,4 și 6,38.

Acești parametri s-au folosit la determinarea Yi – valorilor estimate a lui Yi.

În expresia : pentru fiecare set de observații se vor calcula diferite seturi de parametri de regresie estimați. reprezintă valorile estimate a lui Yi pentru observația i și sunt calculate prin intermediul ecuației de regresie estimată.

Diferența dintre valorile estimate a variabilei dependente () și valoarea reală a variabilei dependente (Yi) este definită drept reziduală:

(2.5)

Vom nota distincția dintre variabila reziduală ui și eroarea de:

. (2.6)

Variabila reziduală este diferența dintre valorile Yi observate și cele estimate prin ecuația de regresie Yi, în timp ce eroarea de specificație (stocastică) este diferența dintre Yi observat și ecuația de regresie “adevărată” (valoarea așteptată a variabilei Y). Cu alte cuvinte eroarea stocastică este o valoare teoretică care nici odată nu poate fi observată însă variabila reziduală este o valoare reală care se calculează pentru fiecare observație de fiecare dată când regresia este lansată. Întradevăr, majoritatea tehnicilor regresionale nu numai evidențiază reziduurile, dar selectează acele valori , care le asigură un nivel cât e posibil de mic. Cu cât e mai mică valoarea variabilei reziduale cu atât mai apropiate vor fi valorile estimate de acelea observate Ys. O altă cale de a exprima ecuația de regresie estimată constă în combinarea ecuațiilor (2.1) și (2.3) și obținerea expresiei .

Evaluarea semnificației ecuației de regresie liniară și a coeficienților ei

După ce a fost estimată ecuația lineară de regresie se efectuează evaluarea semnificației atâta ecuației în întregime, cât și a fiecărui parametrii separat.

Evaluarea semnificației ecuației de regresie în întregime se produce cu ajutorul F – criteriului Fișer, formulând în prealabil ipoteza dependenței direct proporționale H0 : {β0 = 0} și ipoteza independenței variabilelor, H0 : {β1 = 0} contra – ipoteza dependenței lineare specificate.

Suma pătratelor devierilor observațiilor variabilei dependente (de explicat) de la valoarea lor medie Y este cauzată de mai multe evenimente: de variabila explicativă și de alți factori. Dacă variabila explicativă nu influențează rezultatul, atunci linia regresiei este paralelă axei OX și , iar toată dispersia variabilei de explicat este cauzată de alți factori. În cazul când alți factori nu influențează variabila de explicat, atunci Y este legat funcțional de X și suma pătratelor rezidualelor este egală cu 0. Linia de regresie este bună pentru previziune, evident atunci, când suma pătratelor devierilor cauzată de regresia va fi cu mult mai mare decât suma pătratelor rezidualelor, atunci ecuația de regresie este semnificativă și variabila explicativă X influențează esențial variabila de explicat Y. În aceast caz coeficientul de determinație R2YX se va apropia de 1.

Pentru calcularea sumei pătratelor devierilor explicate de regresie se folosesc valorile variabilei dependente calculate în conformitate cu ecuația de regresie .

La utilizarea regresiei liniare este adevărată egalitatea care poate fi confirmată, dacă apelăm la formula coeficientului liniar de corelație , de aici rezultă că .

Determinarea dispersiilor racordate la grad de libertate oferă posibilitatea de a efectua comparații între ele. Examinând raportul dintre dispersia explicată de regresie și dispersia reziduală racordate la un grad de libertate, obținem F – criteriul: , F – criteriul de verificare a ipotezei dependenței liniare a variațiilor. . Dacă ipoteza H0 adevărată, atunci dispersiile nu diferă. Pentru respingerea ipotezei H0 este necesar ca (de câteva ori). Savantul englez Snedecor a elaborat tabele pentru valorile critice a F -criteriului în raport cu diferite nivele de semnificație a ipotezei H0 și diferite grade de libertate.

, atunci .

Estimarea semnificației ecuației de regresie, de regulă, se prezintă sub forma tabelului analizei dispersionale.

Tabelul 2.1. Estimarea semnificației ecuației de regresie [elaborat de autor]

În regresia liniară se analizează nu numai semnificația ecuației în întregime dar și semnificația separată a parametrilor. În acest scop se determină și eroarea standard pentru fiecare parametru: . Eroarea standard a coeficientului de regresie este definită după formula:

.

Valoarea erorii standard în comun cu t – distribuția Student la (n – 2) grade de libertate se aplică la verificarea semnificației coeficientului de regresie și pentru calcularea intervalelor de încredere.

Pentru estimarea semnificației coeficientului de regresie, valoarea lui se compara cu eroarea standard, cu alte cuvinte se determină valoarea efectivă a t – criteriul Student: care se compară cu valoarea tabelară pentru riscul erorii (α) (nivelul de semnificație) și (n – 2) grade de libertate.

Același rezultat îl obținem când extragem rădăcina pătrată din F – criteriul, și anume, . Vom demonstra că .

.

Intervalul de încredere pentru coeficientul de regresie se determină ca , este egal cu valoarea coeficientului estimativă ± valoarea coeficientului Student table înmulțit cu .

Întrucât coeficientul de regresie în investigațiile econometrice are o explicație economică clară, intervalele de încredere pentru el nu trebuie să conțină rezultate contradictorii, de exemplu -10 40. Ceea ce înseamnă că valoarea adevărată a coeficientului de regresie conține simultan valori pozitive și negative și chiar 0, ce nu poate avea loc.

Eroarea standard a parametrului se determină prin formula:

.

Evaluarea semnificației se efectuează la fel ca și pentru , valoarea t – criteriului calculat se compară cu valoarea tabelară la (n – 2) grade de libertate și nivelul de semnificație (α).

Semnificația coeficientului de determinație R se definește în baza valorii erorii coeficientul de determinație .

Valoarea efectivă a t-criteriului student se determină ca: . Aceasta formulă ne mărturisește, că în regresia liniară față de variabile , deoarece s-a notat ca:

, plus la aceasta, , a .

Deci verificarea ipotezei semnificației a coeficienților de regresie și de determinație echivalează cu verificarea ipotezei referitor la validitatea modelului liniar de regresie.

Formula examinată pentru estimarea coeficientului de corelare este recomandată pentru aplicare la un număr mare de observații și dacă r diferă mult de +1 sau -1. În caz contrar distribuția estimațiilor diferă de la aceea normală sau Student, deoarece coeficientul de corelare este limitat de valorile -1 și +1. Fisher a introdus o variabilă pentru evalua semnificația R.

Intervalele de previziune pentru modelul liniar de regresie

În calcule previzionale conform ecuației de regresie se determină valoarea sub formă de previziune punctiferă pentru Xp = Xk, substituind în ecuația de regresie valoarea respectivă a lui X. Dar previziunea punctiferă este evident nereală. De aceea ea este completată cu calculele erorii standard pentru , și cu estimația intervalului de previziune pentru valoarea Y*, .

Întru construirea formulei pentru eroarea standard vom apela la ecuația de regresie . Substituind cu formula pentru calcularea lui , vom obține . De aici rezultă că eroarea standard pentru depinde de eroarea și eroarea coeficientului de regresie , deci .

Din teoria selectării este cunoscut faptul că , folosind în calitate de dispersia reziduală pentru un grad de libertate S2, obținem: . Eroarea standard a coeficientului de regresie este determinată prin formula . Considerăm că valoarea prognozată Xp = Xk, atunci în conformitate cu ecuația de regresie obținem următoarea formulă pentru eroarea standard a valorii , prognozată:

.

Respectiv, . Formula considerată a erorii standard pentru valoarea medie prognozată a lui , fiind dată valoarea Xk, caracterizează eroarea amplasării liniei de regresie. Valoarea erorii standard atinge minimul atunci când Xk = și crește cu îndepărtarea punctului Xk de la în orice direcție. Cu alte cuvinte, cu cât este mai mare diferența dintre Xk și , cu atât este mai mare eroarea . În baza ei fiind evaluată previziunea valorii medii , pentru valoarea Xk dată. Pot fi așteptate previziuni mai reușite dacă punctul Xk se află în centrul regiunii de observare și nu este cazul să așteptăm rezultate de previziune bune la îndepărtarea a punctului Xk de la punctul . În caz că valoarea Xk se află în afară valorilor observate a lui X, folosite la determinarea liniei de regresie, rezultatele previziunii se înrăutățesc pe măsura deplasării Xk de la regiunea valorilor observate pentru variabila explicativă X.

Fig. 2.2. Îndepărtarea a punctului Xk de la punctul [7]

Pentru valoarea prognozată a lui , intervalele de încredere de 95% pentru Xk dat se definesc prin expresia: ± . Pe grafic frontierile de încredere pentru reprezintă două hiperbole situate pe ambele părți de la linia de regresie. Două hiperbole pe ambele părți de la linia de regresie determină intervalele de încredere de 95% pentru valoarea medie a lui pentru X dat.

Însă valorile observate a lui Y variază în jurul valorii medii a lui . Valorile individuale a lui Y pot fi dispersate de la în limita valorii erorii aleatoare u, dispersia ei fiind evaluată ca dispersia reziduală pentru un grad de libertate . Deaceea eroarea valorii individuale prognozate pentru Y necesită includerea nu numai a erorii standard , dar și a erorii aleatoare . Eroarea medie a valorii individuale prognozată este:

. (2.7)

Efectuând previziunea în baza ecuației de regresie este necesar să ținem cont de faptul că valoarea prognozată depinde nu numai de eroarea standard a valorii individuale Y, dar și de precizia previziunii valorii variabilei exogene X. Valoarea ei poate fi definită în baza aplicării altor modele, reieșind din situația concretă și analizând dinamica acestui factor. Formula considerată pentru eroarea medie () a valorii individuale Y poate fi folosită pentru evaluarea semnificației devierii valorii prognozate prin ecuația de regresie și valorii ipotetice înaintate în baza evoluției evenimentelor.

; . (2.8)

2.2. Modelul de regresie liniară multifactorial

Să examinăm cazul când, cu siguranță, mai multe variabile independente pot în plină măsură să explice comportamentul unei variabile dependente. Cazurile când comportamentul variabilei dependente poate fi explicat de o singură variabila independentă sunt rar întâlnite în realitate. Cererea pentru un careva produs este, cu certitudine, influențată de prețuri, însă această explicație nu este una completă, deoarece reclama, venitul agregat, prețurile produselor de substituție, piețele internaționale, calitatea serviciilor comerciale, diverse capricii a cumpărătorilor, schimbarea preferințelor consumatorilor – toate sunt importante în modelarea reală. Prin urmare, se simte necesitatea vitală de a trece de la modelul regresional de două variabile la modelele de regresie cu mai multe variabile.

Modelul liniar de regresie generalizat cu k variabile independente poate fi prezentat sub forma unei ecuații:

Yi = β0 + β1 X1i + β2 X2i + … + βk Xki + εi, (2.9)

unde indică numărul observațiilor, X1i indică observația i a variabilei X1, în timp ce X2i indică observația i a variabilei X2, k – numărul variabilelor independente, εi – termenul erorii stocastice.

Ultima frază subliniată constituie momentul-cheie în înțelegerea regresiei multiple. Coeficientul β1 măsoară impactul asupra lui Y a creșterii de o unitate în X1 menținând constante variabilele X2, X3, …, Xk, dar nu este constantă nici una din variabilele relevante omise din ecuație (cum ar fi Xk+1). Coeficientul β0 este valoarea lui Y pentru toți Xs = 0 și εs = 0, . Cum a mai fost menționat termenul β0 se va include în ecuația de regresie, dar în baza lui nu nu pot fi trase concluzii. Fie căi:

………………………………………….

………………………………………….

,

Atunci modelul liniar de regresie multiplă poate fi înscris sub forma vectorială Y = Xβ + ε, Y – vectorul coloană al variabilei endogene de dimensiunea (n), X – matricea de dimensiunea – (n (k + 1)), β – vectorul de dimensiunea (k +1), ε – vectorul de dimensiunea (n).

.

De exemplu, funcția de consum în cele mai multe cazuri este examinată ca un model de forma: C = f(Y, P, M, Z); unde C – consumul; Y – venitul; P – indicile costului de viață; M – banii în numerar; Z – active lichide, . Regresia multiplă este utilizată pe larg la soluționarea problemelor cererii, venitului pe acțiuni, la studierea cheltuielilor de producere, în calcule macroeconomice. În prezent regresia multiplă este una din cele mai răspândite metode în econometrie. Scopul de bază a regresiei multiple constă în definirea modelului de regresie multiplă, fiind determinată influența fiecărei variabile independente în parte și influența lor în comun asupra variabilei dependente.

Regresia liniară multiplă

Spre deosebire de cazul regresiei liniare simple, în care am încercat sa exprimam o variabila (dependenta) în funcție de o alta variabila (independenta, explicativa, predictor), acum ne punem problema situatiei în care avem de-a face cu cel puțin trei variabile, dintre care una este dependenta iar celelalte sunt independente, predictoare.

Vom prezenta, astfel, un model de regresie liniară multiplă în care variabila dependenta este exprimata ca o combinatie liniară de variabile independente sau variabile predictor/ covariate.

Matematic vorbind, acest fapt se exprima prin ecuația de regresie multiplă:

Y = a + b1 X1 + b2 X2 +…+ bk Xk,

unde Y reprezint variabila dependenta iar variabilele X1,…, Xk sunt variabilele explicative, predictoare. Constantele b1,…, bk reprezintă coeficientii de regresie, iar a este constanta de regresie sau interceptorul.

Atunci când știm dinainte care variabile vor fi incluse în analiza regresivă multiplă, modelul se poate construi fără dificultate, singura problemă rămânând identificarea concretă a ecuației de regresie.

Dacă scopul propus este și stabilirea importanței predictorilor, atunci va trebui să alegem dintre toate variabilele modelului pe cele esențiale, pentru obținerea unui model clar și simplu.

Algoritm pentru regresia pas cu pas anterioară.

(a) Se identifică variabila cu cel mai mare impact asupra variabilei dependente, i.e. variabila cea mai corelată cu variabila dependentă și se introduce în model;

(b) Se găsește variabila din cele rămase care are cea mai mare corelație (ignorând semnul) cu reziduurile modelului de mai sus;

(c) Se repetă pasul (b) până când se ajunge la nivelul de semnificație p = 0.05, corespunzător variabilei curente introdusă în model.

Când nivelul de semnificație p depășește valoarea de 0.05 se oprește procesul de introducere a predictorilor în model (condiția de stop).

În ceea ce privește algoritmul pentru cealaltă metodă (regresia pas cu pas posterioară), vom aborda problema din direcția opusă, adică:

(a) Luăm în considerație inițial toate variabilele și le excludem pas cu pas pe cele care au semnificația cea mai mică. Aici modelul inițial include toate variabilele, considerând că, cel puțin teoretic, toate variabilele pot fi importante.

(b) Se exclude apoi variabila cu cea mai mică influență asupra modelului, adică cu cel mai mare nivel de semnificație p privind corelația. Nivelul p de stop este tot 0.05.

Regresia logistică

Sunt multe domenii de cercetare din: medicină, economie, fizică, meteorologie, astronomie, biologie etc., în care variabila dependenta nu mai este o variabilă continuă ci una binară, categorială.

În acest caz, când variabila dependenta se refera la două valori (categorii), nu mai este de folos regresia multiplă, ci se utilizează o abordare similară -regresia logistica.

În acest caz, în loc sa se prognozeze valoarea variabilei dependente în raport cu valorile variabilelor explicative, se va prognoza o transformare a variabilei dependente.

Transformare se numește transformarea logit, desemnată ca logit (p), unde p este proporția de obiecte cu o anumita caracteristica (p reprezinta probabilitatea ca un individ sa aibă infarct miocardic, sau p reprezintă probabilitatea ca un client să rămână fidel unui anumit supermarket sau produs).

Formula dupa care se calculează logit (p) este:

logit (p) = (2.10)

Atunci când utilizăm metoda regresiei logistice, la sfârșitul calculelor vom obține valoarea logit (p) = sub forma unei combinatii liniare a variabilelor explicative. În aceste condiții, putem calcula valoarea efectiva a probabilității p, utilizând formula:

p = e / (1 + e). (2.11)

Procedee regresionale iterative

Regresia iterativă implică utilizarea produselor program pentru alegerea variabilei independente folosite la estimarea ecuației specificate. Programul de calculator oferă o lista de variabile independente în baza lor fiind apoi după etape construieștă ecuația. În primul rând se alege variabila de explicat, care de una singură explică o mare parte din varianța de la valoarea medie a variabilei dependente. În calitate de a doua variabilă se alege aceia, care cel mai mult contribuie la majorarea R2, ținând cont de faptul că prima variabilă deja este introdusă în ecuație. Procedeul iterativ continue până când variabila ce va urma a fi introdusă în ecuație nu izbutește să atingă careva creștere în R2. Contribuția fiecărei variabile independente presupune o creștere în R2 cauzată de includerea ei în ecuația de regresie.

Spre regret, orice corelare între variabilele independente face această procedură dificilă. În procesul de evaluare a corelației între variabile este greu de separat impactul unei variabile de la impactul altei variabile. Ca rezultat, în prezența multicolinearității este imposibil de determinat contribuția individuală a fiecărei variabile suficientă pentru a afirma că una din ele este mai importantă și deci necesită a fi inclusă în primul rând, și mai rău, nu este o justificare teoretică pentru a alegere combinația variabilelor specificate.

Din cauza acestor probleme, deseori se evită procedeul iterativ. Primejdia cea mai mare este că coeficienții obținuți pot fi deplasați, valorile " t"- calculate nu urmează pe viitor repartiția valorilor „t”- tabelare, variabilele importante pot fi excluse din cauza aranjamentului (ordinea în care a avut loc selecția), semnele coeficienților estimați la fazele intermediare sau finale a procedeului pot să difere de la semnele preconizate. Utilizarea procedeului iterativ este o anumită ignoranță față de faptul ce variabile vor fi introduse.

2.3. Specificația ecuației de regresie

Alegerea formei funcționale pentru ecuația de regresie este o parte vitală în specificarea ecuației de regresie. M.C.M.M.P. la utilizarea sa necesită ca ecuația examinată să fie lineară în conformitate, cu coeficienții, dar există o varietate de forme funcționale care sunt liniare în coeficienți în timp ce nu sunt liniare față de variabile. Se vor prezenta în detalii cele mai frecvent utilizate forme funcționale în scopul de a ajuta utilizatorul în dezvoltarea abilității de a alege corect una din ele la specificarea ecuației.

Alegerea formei funcționale, aproape de fiecare dată, se va baza pe teoria economica sau de busines fundamentală și numai rareori pe aceea formă funcțională care furnizează o previziune mai bună. Relația logică dintre variabila dependentă și variabilele independente în examinare se va compara cu proprietățile diferitor forme funcționale, și numai aceea, care în modul cel mai reușit oglindește teoria va fi aleasă. În continuare, cele mai des utilizate forme funcționale vor fi caracterizate în termeni grafici, ecuații și exemple pentru a face comparație între ele.

Forma liniară

Modelul liniar de regresie, se bazează pe ipoteza că coeficienții unghiulari din relația ce caracterizează variabila dependentă și cele independente sunt constanți și are loc relația , i = 1, 2, k. Dat fiind constant coeficientul unghiular, elasticitatea variabilei Y în respect cu variabila X (schimbarea în procente în variabila dependentă cauzată de schimbarea cu un procent în variabila independentă, restul variabilelor din ecuație rămânând constante) nu este constantă: . Dacă relația, ce se presupune a fi dintre variabila dependentă Y și variabila independentă, X este de așa natură că coeficientul unghiular (de înclinație) al relației se presupune a fi constant, atunci se va folosi forma funcțională liniară.

Spre regret, teoria în mai multe cazuri indică numai semnul relației, dar nu și forma funcțională. Forma liniară se va fi utilizată de fiecare dată când există un oarecare minim de teorie, care poate fi utilizată la fundamentarea acestei forme, până când nu se vor găsi dovezi stricte că această formă nu este potrivită. Este posibilă utilizarea modelului liniar atât timp cât teoria, bunul simț sau experiența nu justifică folosirea unei alte forme funcționale. Deoarece acest model efectiv se utilizează apriori, la el uneori se referă ca la o formă funcțională "default" implicită.

Pasul următor în analiza legăturii dintre două variabile statistice, atunci când acestea sunt corelate, este să se stabilească concret natura legăturii liniare dintre ele, descriind-o printr-o ecuație matematică.

Scopul final al acestei abordări este prognoza valorilor uneia dintre variabile pe baza valorilor celeilalte, prognoză efectuată pe baza ecuației ce descrie legătura dintre cele două seturi de date.

Modul de prezentare a legăturii liniare dintre două variabile, atunci când aceasta există, se numește metoda regresiei liniare (linear regression).

Pentru aceasta se consideră una dintre variabile ca variabilă independentă sau variabilă predictor, iar cealaltă variabilă ca variabilă dependentă sau variabilă răspuns (outcome).

Legătura liniară dintre cele două variabile este descrisă de o ecuație liniară, ecuația de regresie (regression equation) căreia îi corespunde geometric dreapta de regresie (regression line).

Fig. 2.3. Modele ce pot fi linearizate [18]

Ca metodologie, variabila dependentă se distribuie pe axa ordonatelor, în timp ce variabila independentă se distribuie pe axa absciselor. Ecuația dreptei de regresie se stabilește pe baza metodei “celor mai mici pătrate” (least squares method) care, intuitiv, minimizează distanța între punctele reprezentate de perechile de date/observed values și punctele corespunzătoare de pe dreaptă/fitted values (obținute pe verticalele corespunzătoare). Aceasta distanță se numește reziduu (residual).

Forma exponențială sau forma logaritmică completă

Ceea mai răspândită formă funcțională (neliniară în variabile, dar liniară în coeficienți) este forma logaritmică completă. Forma logaritmică completă este des utilizată la specificarea ecuației de regresie. Spre deosebire de modelul liniar, elasticitățile dar nu coeficienții unghiulari sunt constanți în acest model. Dacă se presupune că elasticitățile sunt constante, atunci rezultă că . Forma funcțională exponențială este aceea care satisface ipoteza conform căreia elasticitățile sunt constante.

Aplicând la ecuația menționată transformarea în logaritmi, prin logaritmarea ambelor părți a ecuației obținem ecuația ecuația liniară în logaritmi, care se numește formă funcțională logaritmică completă.

ln Y = β0 + β1 ln X1 + β2 ln X2 + ε, ln Y – logaritmul natural de la Y. În ecuația logaritmică completă, coeficienții individuali de regresie, de exemplu βk, pot fi interpretați ca elasticități, deoarece βk = .

Dat fiind constanți coeficienții de regresie, ecuația logaritmică completă satisface condiția ca modelul sa conțină elasticități constante. Modul de interpretare a parametrilor βk în ecuația logaritmică completă ține de faptul că la schimbarea variabilelei Xk cu un %, restul variabilelor fiind menținute constante, Y se va schimba cu βk%. În situația când elasticitățile sunt constante, coeficienții de înclinație nu mai sunt constanți.

Desenul din stînga demonstrează conceptul economic al funcției de producere-curbele de indiferență. Izocuantele funcției de producere demonstrează diferite combinații posibile ai factorilor X1 capitalul și X2 munca, care pot fi utilizate pentru a fabrica un volum anumit de producție. Atare funcție logaritmică completă de producere se numește funcție de producere de tip CD. Desenul din dreapta demonstrează relațiile dintre Y și X1 care există, dacă X2 se menține constant sau nu a fost inclus în model. De menționat, că în acest caz înclinația curbei depinde de semnul și mărimea coeficientului β1.

Fig. 2.4. Variabilele "dummy", care pot lua valori 0 [11]

Înainte de a utiliza modelul logaritmic complet, este necesar să se verifice toate observațiile ca ele să nu conțină valori de 0. Modelul logaritmic complet poate fi utilizat numai în cazul când toate variabilele primesc valori pozitive. Variabilele "dummy", care pot lua valori 0, nu vor fi percepute chiar dacă vor fi introduse în ecuație.

Formă semilogaritmică

Formă semilogaritmică este o variantă a ecuației logaritmice complete în care unele, dar nu toate variabilele (dependentă și independente), sunt exprimate în termeni de logaritmi. De exemplu, . În acest caz, sensul economic al coeficienților unghiulari este diferit, în timp ce variabila X2 este în dependență liniară față de Y, variabila X1 este în dependență neliniară față de Y. În special, sau , fapt care poate fi demonstrat prin calcule. Cu alte cuvinte, dacă valoarea se vaschimbă cu 1%, atunci valoarea Y se va schimba cu /100, valoarea X2 rămînând intactă (valoarea lui X1 trebuie să fie pozitivă pentru a fi posibilă operația logaritmării). Elasticitatea variabilei Y în respect cu variabila X1 ea forma: , și descrește odată cu creșterea lui Y. Pe desenul ce urmează este prezentată relația dintre Y și X1, X2 fiind menținută constantă.

Fig. 2.5. Varianta funcției semilogaritmice [11]

În economie și busines aplicarea acestei forme semilogaritmice este întâlnită foarte frecvent. De exemplu, majoritatea funcțiilor de consum după un anumit nivel de venit manifestă o creștere cu rată descrescătoare. Aceste, așa numite curbe Engel, tind să devină plate deoarece atunci când venitul crește esențial, un procent mic din venit este îndreptat spre consum și un procent mai mare merge pentru acumulări.

Alt exemplu se referă la varianta funcției semilogaritmice care se obține prin logaritmarea variabilei dependente Y, variabilele independente rămânând sub forma lineară: lnYi = β0 + β1X1i + β2X2i + εi. În acest model nici coeficientul unghiular nu este constant, nici elasticitate nu sunt constante. Dacă variabila independentă X1 se va schimbă cu o unitate, atunci variabila dependentă Y se va schimba cu β1/100%, variabila independentă X2 menținându-se constantă.

Forme polinomiale

În majoritatea funcțiilor de cost coeficientul unghiular al curbei de cost se schimbă în același mod cum se schimbă volumul. Dacă se așteaptă că coeficientul unghiular al relației să depindă de nivelul variației insuși, atunci se va considera modelul polinomial. Forma funcțională polinomială exprimă variabila dependentă Y ca funcție de variabilele independente, unele dintre care sunt ridicate la putere mai mare decât unul. În cazul unei funcții de cost, Y fiind costul mediu a producției, și X1 fiind nivelul de producție al firmei, atunci dacă firma are o curbă de cost cu punct de șa (cum ar fi în figura din stângă), e posibil ca β1 să fie negativ iar β2 să fie pozitiv, pictată în desenul ce urmează.

Fig. 2.6. Polinom de gradul doi [11]

În regresia polinomială interpretarea coeficienților specifici devine dificilă, și ecuația poate produce efecte nedorite pentru domeniu speciale ale variabilei X. De exemplu, coeficientul individual pentru polinomul de ordinul 3 poate fi pozitiv pentru un domeniu al variabilei X, apoi negativ pentru alt domeni ce va urma, și apoi din nou pozitiv. Deci, în orice probă când se folosește ecuația polinomială de regresie este necesară o atitudine de precauție, aste necesară certitudinea că forma funcțională atinge acele obiective care sunt susținute din punct de vedere teoretic și nu altele.

Forma inversă (hiperbola)

Forma funcțională inversă exprimă variabila dependentă Y ca o funcție inversă de una sau mai multe variabile independente (în cazul examinat numai de o singură variabilă independent X1) : Yi = β0 + + β2X2i + εi, forma funcțională inversă se va utiliza atunci când impactul ei asupra unei variabile dependente se așteaptă a fi aproape de 0, în timp ce variabila independentă crește și eventual se apropie de infinit. Vom nota, că în asemenea circumstanțe, odată cu creșterea variabilei independente X1, impactul ei asupra variabilei dependente Y descrește.

În ecuația examinată variabila independentă X1 nu poate lua valori de 0, deoarece atunci prin împărțire la zero se obține valoarea de infinit, sau o valoare nedeterminată. Coeficienții unghiulare sunt: ; ; coeficientul unghiular pentru variabila independent X1 se încadrează în două categorii, fiecare din ele fiind oglindite pe desen:

Fig. 2.7. Coeficientul unghiular [11]

Atunci când βi 0, coeficientul unghiular în respect cu variabila X1 este negativ și descrește după valoarea absolută odată cu creșterea variabilei X1. Ca rezultat, relația dintre Y și X1 (variabila X2 fiind constant) se apropie de β0 + β2X2 atunci când X1 crește.

Atunci când βi 0, curba intersectează axa X1 în punctual , și coeficientul unghiular este ascendent, apropiindu-se spre o linie orizontală (numită asimptotă), apropiată de valorile coeficientul unghiular și în cazul când βi 0.

Estimarea acestei ecuații prin metoda celor mai mici pătrate oferă următoarea ecuație: Wt = 0.00679 + 0.1842(1/Ut); R2 = 0.397

(0.0590)

t = 3.20

Ceea mai bună cale de a selecta pentru modelul de regresie o formă funcțională corectă constă în alegerea specificației care în cel mai reușit mod se potrivește teoriei ce stă la fundamentarea ecuației. În majoritatea cazurilor forma liniară va fi o formă adecvată.

Tabelul 2.2. Sumarul formelor funcționale alternative [elaborat de autor]

În așa caz, forma liniară nu este corectă, și chiar alegerea dintre diverse forme neliniare nu poate fi făcută în baza teoriei economice. Oricum, tocmai în aceste cazuri, rămâne să ne achităm (în termenii înțelegerii relației adevărate) pentru evitarea alegerii formei funcționale numai în baza aproximării reușite. Se pot da două răspunsuri la această problemă:

R2 este greu de comparat atunci când variabilele dependente sunt transformate.

Forma funcțională incorectă poate prezenta o aproximare rezonabilă a observațiilor, dar are potențial mare de a produce erori în pronosticare, când se efectuează previziunea în afara regiunii observabile.

CОNCLUZII ȘI RECОMANDĂRI

În concluzie, se poate reține ideea că metoda econometriei este metoda modelării sau metoda modelelor. Modelul econometric – expresie formală, inductivă a unei legități economice -reprezintă un mijloc de cunoaștere a unui obiect economic, iar modelarea econometrică este o metodă care conduce la obținerea de cunoștiințe sau informații noi privind starea, structura (conexiunile dintre elemente) și evoluția unui proces sau sistem economic.

Eficiența introducerii unei noi variabile explicative în cadrul unui model de regresie liniară este condiționată în principal de doi factori și anume: a) valorile calculate ale testului Fisher pentru regresia liniară cu numărul inițial de variabile explicative și b) creșterea normalizată a coeficientului de determinare ca urmare a adăugării unei noi variabile în cadrul modelului de regresie liniară.

Modelele stabilesc relații între variabile și după estimarea coeficienților sunt utilizate în studiul sistemelor în ipoteze privind atât variațiile variabilelor endogene, cât și variațiile variabilelor exogene.

Modelele liniare se regăsesc în numeroase ramuri ale științei economice întrucât metodele de obținere a indicatorilor agregați presupun efectuarea de operații de adunare.

Marea varietate de modele neliniare produce efecte variate în colectarea și dezvoltarea sistematizată a lor, întrucât descrierea modelelor de acest tip trebuie definite reguli care să conducă la descrieri corecte și la implementări cu grad de cuprindere deosebit de ridicat.

Diversitatea modelelor neliniare este foarte mare, de la caz la caz impunându-se o tratare distinctă pentru fiecare model, chiar dacă este o forma patratică sau include funcții elementare sau funcții compuse.

Modelele liniare se manipulează cu ușurință, au proprietăți interesante privind descompunerea și rafinarea.

Modelul astfel construit reprezintă o verigă intermediară între teorie și realitate. El reprezintă o cale de confruntare a teoriei cu practica, singurul mod de experimentare pe baza căruia știința economică își poate fundamenta ipotezele, din moment ce obiectul său de cercetare poate fi numai observat, nu și izolat și cercetat în laborator.

Prin această experimentare, mijlocită de modelul econometric, științele economice validează, renunță sau elaborează metode noi, își confruntă problemele de semantică și semiotică economică, îmbogățindu-și în felul acesta sistemul de informații privind structura și evoluția obiectului economic.

În prezent, tipologia metodelor econometrice utilizate de științele economice este extrem de vastă. Folosirea din ce în ce mai amplă a acestor modele la investigarea fenomenelor economice se datorează progreselor însemnate făcute în domeniul metodelor de estimare a parametrilor modelelor și al testelor de verificare pe care se fundamentează acestea și, nu în ultimul rând, al utilizării calculatoarelor electronice care permit rezolvarea operativă a celor mai complexe modele econometrice.

Să dezvoltăm construirea modulului care preia forma analitică a modelului.

Să abordăm construirea modulului care analizează corectitudinea formei analitice.

Să contribuim la construirea modulului care încorporează forma analitică ca parametru în proceduri de estimare.

Să contribuim la elaborarea modulului pentru gestionarea modelului neliniar cu coeficienți estimați.

Să susșinem implementarea metodei de estimare a coeficienților modelelor liniare și neliniare.

Să dezvoltăm construirea modelului de analiză a calității estimării.

Să simulăm anumite cazuri reale cu ajutorul modelelor econoemtrice de regresie.

BIBLIОGRAFIE

Candea R. Modele de regresie liniare. În: Revista „Economie și Sociologie”, USM, nr.2, 2012, p. 274-279.

Gujarati N. Basic Econometrics. New York: John Wiley, 2009. 123 p.

Iacob A., Tănăsoiu O. Modele econometrice. Volumul I. București: Editura ASE, 2005. 150 p.

Ivan I., A. Vișoiu. Baza de modele economice. București: Editura ASE, 2005. 207 p.

Jaba E., Jemna D. Econometrie. Iași: Editura Sedcom Libris, 2006. 267 p.

Levy H., Sidi M. Polling systems: Applications, modeling, and optimization, În: IEEE Transactions on Communications, 1990, vol. 38, p. 175-176.

Levy H., Sidi M. Polling systems: Applications, modeling, and optimization, În: IEEE Transactions on Communications, 1990, vol. 38, p. 175-176.

Milodin D. Aplicație informatică orientată spre comerțul de cunoștințe. București: ASE, 2005. 167 p.

Mișcoi Gh., Mitev L. Caracteristice de performanță în evoluția modelelor de așteptare. În: Materialele Conferinței Științifice Internaționale “Modelarea matematică, optimizare și tehnologii informaționale”, ediția a III-a. Chișinău: ATIC, 2012, p. 115-127.

Mișcoi Gh., Mitev L. Metode analitice și numerice în analiza modelelor Polling. În: Materialele Conferinței Științifico-Practice Internaționale „Politici economice și financiare pentru o dezvoltare competitivă”. Chișinău: ULIM, 2013, p. 353-357.

Mishkoy Gh., Giordano S., Bejan A., Benderschi O. Generalized Priority Models for QoS and CoS Network Technologies. În: Computer Science Journal of Moldova, 2007, vol. 15(2), p. 217-242.

Patraș M. Metode econometrice moderne: o analiză critic. Chișinău: Editura Universitas, 1992. 261 p.

Pecican E. Econometrie pentru economiști. București: Editura Economică, 2004. 158 p.

Regresia liniara. http://statisticasociala.tripod.com/regresie.htm (vizualizat 19.04.2015)

Rykov V., Mishkoy Gh. A new approach for analysis of polling systems. In: Proceedings of the International Conference Control Problems. Moscow, 2009, p. 174-175.

Shomrony M. Queues with System Disasters and Impatient Customers when System is Down. In: Queueing Systems, 2007, vol. 56(3/4), p.195-202.

Tănăsoiu O. Modele econometrice. București: Editura ASE, 2001. 253 p.

Țițan E. Statistică. Teorie și aplicații în sectorul terțiar. București: Editura Meteor Press, 2003. 142 p.

DECLARAȚIA PRIVIND ASUMAREA RĂSPUNDERII

Subsemntatul(a) __________________________________________________________

absоlvent(ă) al (a) Universității Libere Internațiоnale din Mоldоva, Facultatea _______________________________________ specialitatea____________________________ ____________________________ prоmоția ___________________________, declar pe prоpria răspundere, că lucrarea de licență cu titlul: ___________________________________________

_____________________________________________________________________________

_____________________________________________________________________________

_____________________________________________________________________________

elabоrată sub îndrumarea dlui/dnei _________________________________________________,

pe care urmează să о susțin în fața cоmisiei, este оriginală, îmi aparține și îmi asum cоnținutul acesteia în întregime.

Declar că nu am plagiat altă lucrare de licență, mоnоgrafii, lucrări de specialitate, articоle etc., publicate sau pоstate pe internet, tоate sursele bibliоgrafice fоlоsite la elabоrarea lucrării de licență fiind mențiоnate în cоnținutul acesteia.

De asemenea, declar că sunt de acоrd ca lucrarea mea de licență să fie verificată prin оrice mоdalitate legală pentru cоnfirmarea оriginalității, cоnsimțînd inclusiv la intrоducerea cоnținutului acesteia într-о bază de date în acest scоp.

Data ________________________ Semnătură student ____________________

* Declarația se va cоmpleta de absоlvent cu pix sau stilоu cu cerneală albastră și se înserează în lucrarea de licență a studentului la sfîrșitul acesteia ca parte integrantă.

GRAFICUL CALENDARISTIC DE EXECUTARE A PRОIECTULUI DE LICENȚĂ

________________________________________________________

(numele și prenumele studentului/ei)

Tema prоiectului de licență ___________________________________________

______________________________________________________________________

Termenul limită de prezentare a prоiectului de licență la catedră ______________

Etapele executării prоiectului de licență:

Student (a)_______________________________

(semnătura)

Cоnducătоr științific ______________________________

(semnătura)

BIBLIОGRAFIE

Candea R. Modele de regresie liniare. În: Revista „Economie și Sociologie”, USM, nr.2, 2012, p. 274-279.

Gujarati N. Basic Econometrics. New York: John Wiley, 2009. 123 p.

Iacob A., Tănăsoiu O. Modele econometrice. Volumul I. București: Editura ASE, 2005. 150 p.

Ivan I., A. Vișoiu. Baza de modele economice. București: Editura ASE, 2005. 207 p.

Jaba E., Jemna D. Econometrie. Iași: Editura Sedcom Libris, 2006. 267 p.

Levy H., Sidi M. Polling systems: Applications, modeling, and optimization, În: IEEE Transactions on Communications, 1990, vol. 38, p. 175-176.

Levy H., Sidi M. Polling systems: Applications, modeling, and optimization, În: IEEE Transactions on Communications, 1990, vol. 38, p. 175-176.

Milodin D. Aplicație informatică orientată spre comerțul de cunoștințe. București: ASE, 2005. 167 p.

Mișcoi Gh., Mitev L. Caracteristice de performanță în evoluția modelelor de așteptare. În: Materialele Conferinței Științifice Internaționale “Modelarea matematică, optimizare și tehnologii informaționale”, ediția a III-a. Chișinău: ATIC, 2012, p. 115-127.

Mișcoi Gh., Mitev L. Metode analitice și numerice în analiza modelelor Polling. În: Materialele Conferinței Științifico-Practice Internaționale „Politici economice și financiare pentru o dezvoltare competitivă”. Chișinău: ULIM, 2013, p. 353-357.

Mishkoy Gh., Giordano S., Bejan A., Benderschi O. Generalized Priority Models for QoS and CoS Network Technologies. În: Computer Science Journal of Moldova, 2007, vol. 15(2), p. 217-242.

Patraș M. Metode econometrice moderne: o analiză critic. Chișinău: Editura Universitas, 1992. 261 p.

Pecican E. Econometrie pentru economiști. București: Editura Economică, 2004. 158 p.

Regresia liniara. http://statisticasociala.tripod.com/regresie.htm (vizualizat 19.04.2015)

Rykov V., Mishkoy Gh. A new approach for analysis of polling systems. In: Proceedings of the International Conference Control Problems. Moscow, 2009, p. 174-175.

Shomrony M. Queues with System Disasters and Impatient Customers when System is Down. In: Queueing Systems, 2007, vol. 56(3/4), p.195-202.

Tănăsoiu O. Modele econometrice. București: Editura ASE, 2001. 253 p.

Țițan E. Statistică. Teorie și aplicații în sectorul terțiar. București: Editura Meteor Press, 2003. 142 p.

Similar Posts