REPROGRAFIA UNIVERSITĂȚII TRANSILVANIA DIN BRAȘOV [628833]

REPROGRAFIA UNIVERSITĂȚII “TRANSILVANIA” DIN BRAȘOV

1CUPRINS

NOȚIUNI INTRODUCTIVE…………………………………………………………………5
1. Econometria, ca știință ……………………………………………………………………….. 6
2. Etapele construirii m odelelor econometrice…………………………………………….6
3. Modele econometrice utilizate în economie …………………………………………… 7

CAPITOLUL 1……….MODELUL REGR ESIEI LINIARE SIMPLE……….9
1. Problema estim ării ………………………………………………………………………….11
2. Metoda celor mai mici p ătrate – ipoteze …………………………………………….11
3. Metoda celor mai mici p ătrate – estimatorii………………………………………..13
4. Propriet ățile estimatorilor metodei celor mai mici p ătrate ……………………15
5. Liniaritatea…………………………………………………………………………………….15 6. Tabela de regresie ………………………………………………………………………….16 7. Funcția de regresie a popula ției ………………………………………………………..19
8. Funcția de regresie a e șantioanelor……………………………………………………24
9. Exerci țiu – Calculul estimatorilor modelului de regresie simpl ă…………..30
10. Consecin țe ale ipotezelor: cons truirea testelor ………………………………….31
10.1. Exerci țiu – Rolul termenului aleator…………………………………………..32
10.2. Testul de semnifica ție al estimatorului……………………………………….35
10.3. Intervalul de încreder e al estimatorilor……………………………………….38
10.4. Tabelul de analiz ă a varianței – testul Fisher ………………………………38
11. Intervalul de încredere al previz iunii cu modelul regresiei simple……….39
11.1. Exerci țiu – Previziuni ale variabilei endogene……………………………..40
12. Exerci țiu – Compararea coeficien ților de regresie ……………………………..43

CAPITOLUL 2 MODELUL REGRESIEI MULTIPLE……………….46
1. Modelul liniar general……………………………………………………………………..47
2. Estimarea coeficien ților de regresie…………………………………………………..48
3. Ipotezele și proprietățile estimatorilor ……………………………………………….49
4. Analiza varian ței și calitatea ajust ării ………………………………………………..51
5. Exercițiu – Modelul regresiei liniare multiple…………………………………….51
5.1. Analiza grafic ă a evoluției în timp a variabil elor considerate………….53
5.2. Analiza grafic ă a influen ței variabilelor explica tive asupra variabilei
dependente y…………………………………………………………………………….57
5.3. Construirea modelului econometric …………………………………………….60
6. Teste statistice și analiza varian ței…………………………………………………….67
6.1. Construirea testel or statistice………………………………………………………67
6.1.1. Compararea unui parametru ai cu o valoare fixat ă a………………68
6.2. Execi țiu – Teste asupra coeficien ților și varianței erorilor………………69
6.3. Analiza varian ței-testul Fisher de semnifica ție globală a regresiei…..73
6.4. Teste pornind de la analiza varian ței modelului liniar ……………………75
6.4.1. Introducerea uneia sau mai multo r variabile explicative în
model……………………………………………………………………………….75 6.4.2. Verificarea stabilit ății în timp a modelului – testul CHOW …….75
6.5. Exerci țiu – Teste pornind de la analiza varian ței …………………………..76
7. Previziuni folosind modelul regresiei multiple……………………………………80
7.1. Exerci țiu – Previziuni folosind modelul regresiei multiple……………..81

2CAPITOLUL 3 MULTICOLINIARITATEA ȘI SELEC ȚIA
VARIABILELOR EXPLICATIVE……………………85
1. Corelația parțială, în modelele econometrice ……………………………………..86
1.1. Calculul coeficien ților de corela ție parțială…………………………………..88
1.2. Relații între coeficien ții de corela ție simplă, parțială și multiplă ……..
1.3. Exerci țiu – Calculul coeficien ților de corela ție parțială………………….89
2. Multicolininiaritatea ……………………………………………………………………….97
2.1. Consecin țele multicoliniarit ății …………………………………………………..98
2.2. Detectarea multicoliniarit ății………………………………………………………98
2.3. Remedierea multicoliniarit ății…………………………………………………..100
3. Selecția variabilelor explicative………………………………………………………101
3.1. Exerci țiu – Metode de selec ție a variabilelor explicative………………103

CAPITOLUL 4 AUTOCORELA ȚIA ERORILOR ………………….108
1. Natura și cauzele autocorela ției erorilor …………………………………………..109
2. Detectarea autocorela ției………………………………………………………………..116
2.1. Exerci țiu – Testul Durbin -Watson …………………………………………….118
3. Estimatorii metodei celor mai mici p ătrate în prezen ța autocorela ției…..123
4. Proceduri de estimare a lui ρ………………………………………………………….123
4.1. Estimarea direct ă a lui ρ pornind de la regresia pe modelul ini țial…124
4.1.1. Exerci țiu – Estimarea parametrilor umui model în prezen ța
autocorela ției erorilor……………………………………………………….124

BIBLIOGRAFIE ……………………………………………………………………………….131

3
NOȚIUNI INTRODUCTIVE

Tema
NOȚIUNI INTRODUCTIVE
Obiectivele 1. Econometria, ca știință
2. Etapele construirii modelelor econometrice
3. Modele econometrice utilizate în economie
Finalitatea –
Competen țe
dobândite 1. Dobândirea de cuno ștințe despre apari ției și dezvoltarea
Econometriei, ca știință
2. Cunoașterea obiectului de studiu și a metodelor de analiz ă
3. Definiții și compara ții ale modelului economic și econometric
4. Cunoașterea modului de construire a modelelor econometrice
5. Noțiuni privind clasificarea mode lor econometrice utilizate în
economie
Mijloace
– citire/înv ățare
– întreb ări, probleme ce apar, explica ții
– definiții, explica ții ce trebuie re ținute
– situații economice concrete, supuse analizei, exemple (sub lup ă)

Evaluarea – parcurgerea întreb ărilor propuse
Timp de lucru
necesar 1. Pentru cunoa șterea problemei: 4 ore
2. Pentru rezolvarea întreb ărilor: 1 ora

41. Econometria, ca știință
Econometria este acea ramur ă a economiei, care presupune aplicarea metodelor
statistice și matematice la analiza datelor economi ce, cu scopul de a oferi un conținut empiric
teoriilor economice pentru verificarea veridicit ății lor.

matematica statistica
economie

• Bazele apari ției econometriei ca știință = contribu țiile timpurii ale unor matematicieni:
Newton și Leibnitz, (secolul al XVII-lea) au elaborat calculul diferen țial; operele unor
oameni de știință economi ști și statisticieni, precum: Keyne s, Jevons, Walras, Hayek,
Pearson, Edgeworth, Pareto, Fisher, etc., care și-au înscris numele în istoria dezvolt ării
omenirii.
• Înființarea în 1932, în SUA a unei Societ ății de Econometrie și editarea revistei
„Econometrica” în 1933, precum și dezvoltarea ulterioar ă a teoriilor economice, a metodelor
matematice și statistice, sus ținute de apari ția calculatoarelor și dezvoltarea rapid ă în
domeniul informaticii, face posibil ă considerarea apari ției econometriei ca fiind, începutul
secolului XX.
• În 1954, Samuelson afirma ca econometria a fost definit ă ca „aplicarea statisticii matematice
la datele economice pentru a furniza suport empiric modelelor cons truite cu ajutorul
economiei matematice și pentru a ob ține estimări numerice”
Econometria constă în:
• formularea unor ipoteze statistice asupra datelor economice observate,
• parcurgerea etapelor în construirea modelelor,
• verificarea validit ății ipotezelor formulate ini
țial și
• utilizarea modelelor econometrice identificat e pentru realizarea de previziuni ale
fenomenelor economice analizate. Econometria este parte integrant ă a unei alte științe economice, recent ap ărută, și anume
previziunea economic ă (în anii ′80 ).
Previziune economic ă a existat din totdeauna, ca parte integrant ă a tuturor tipurilor
de luare a deciziilor de management, dar ca disciplin ă separată de sine st ătătoare, exist ă de numai
câteva decade. În anii ′80, previziunea a devenit un domeniu practic de studiu, începând s ă își
afirme importan ța în planificarea și luarea deciziei în domeniul af acerilor, la nivelul guvernului.
Previziunea este mai mult decât o disciplin ă tehnică sau statistic ă, este un domeniu al
psihologiei, sociologiei, politic ii, managementului, matematicii, informaticii, economiei și altor
discipline înrudite. În timpul anilor ′60, când condi țiile economice și politice erau relativ stabile
pentru țările industrializate ale lumii, se manifesta pu țin interes pentru previz iune. În contrast, în
anii ′70, și la începutul anilor ′80, când mediul economic și social a devenit mai turbulent, s-a
manifestat necesitatea larg recunoscut ă a previziunii.
Abordarea cantitativ ă a previziunii se bazeaz ă fie pe analiza seriilor de timp – studiul datelor
istorice, presupunând c ă „lucrurile nu se vor schimba și istoria se repet ă” (previziune fatalist ă), fie
pe metode explicative , și anume metodele econometrice , care explic ă interdependen ța dintre factori.

5Astfel econometria , apărută inițial ca știință separată, treptat devine parte integrant ă din
știința previziunii, care a ap ărut la îmbinarea interdisciplinar ă a altor științe, pentru a satisface
cerințele cunoa șterii și stăpânirii realit ății economice contemporane.

2. Etapele construirii modelelor econometrice
Un model este o reprezentare simplificat ă a unui proces real, o formulare matematic ă
a unei teorii economice.
• Un model economic este un set de presupune ri care descriu aproximativ comportametul unei
economii sau al unui sector economic.
• Un model econometric constă din:
− un set de ecua ții de comportament, derivate di ntr-un model economic. Aceste ecua ții
conțin variabilele observate, considerate esen țiale pentru scopul analizei și
variabilele neobservate, neesen țiale pentru analiz ă, sub forma unui termen aleator,
numit „disturban ță” sau „eroare”;
− presupunerea c ă variabilele observate sunt f ără erori;
− o specificare a probabilit ății de distribu ție a disturban țelor (și erorilor de m ăsurare).
Principalele etape ale unui demers econometric sunt:
• referirea la o teorie economic ă, pe baza unor ipoteze;
• formalizarea rela țiilor și alegerea formei de func ție – etapa de specificare a modelului ;
• selectarea și observarea variabilelor;
• estimarea modelului econometric și testarea cu datele observate (constituie inferența
modelului);
• validarea modelului și utilizarea pentru previziune sau în scopul unor analize .
Etapa de specificare a modelului trebuie s ă ia în considerare și faptul că unele rela ții între
variabile nu sunt întotdeauna sincrone, ele fiin d deseori decalate în timp (de exemplu influen ța
venitului asupra consumul ui, realizarea investi țiilor și efectul lor asupra nivelului produc ției,
dezvoltarea unei ramuri economice și a activității de comer ț exterior a ramurii respective, etc.).
Selectarea variabilelor explicative din model ține seama de:
– unitățile de măsură în are sunt exprimate variabilele;
– datele pot fi temporale , când sunt observate la anumite in tervale egale de timp sau pot fi
instantanee , când datele sunt observate în acela și timp pentru un grup de indivizi sau
unități administrativ-teritoriale diferite.
Validarea modelului ridic ă probleme referitoare la validitatea rela țiilor, precizia
estimatorilor, dac ă modelul este valid pe întreaga perioad ă analizată, dacă sunt stabili coeficien ții?

6Descrierea schematic ă a etapelor unei analize econometrice a modelelor economice este
reprezentat ă în Figura 1.
Schema etapelor unei analiz e econometrice în anii ’70

1 Teoria economic ă
sau modelul economic
4 Informații 2 Modelul econometric 3 Datele
economice ini țiale sau evaluarea empiric ă observate
a teoriei economice 5 Estimarea modelului Testarea ipotezelor 6 modelului economic Utilizarea modelului 7 pentru previziuni sau decizii
Figura 1. Schema etapelor unei an alize econometrice în anii ’70
Această descriere a analizei ec onometrice a fost criticat ă în anii ’70, argumentându-se c ă:
– nu există feedback-ul test ării econometrice a teoriilor economice la formularea teoriilor
economice (de la pasul 6 la pasul 1);
– stabilirea datelor de colectat car e vor fi folosite la estimarea și testarea modelelor
econometrice, neexistând feedback între pa șii 2 și 5 și pasul 3;
la pasul 6 testarea ipotezelor se refer ă numai la ipotezele sugerate de modelul economic original,
care depind de presupunerea c ă specificarea modelului de la pasul 2 este corect ă. Dar trebuie testat
și dacă modelul a fost corect specificat, faz ă care lipse ște din Figura 1, și care constituie feedback-ul
pentru pasul 2, în cazul în care testele de specificare indic ă necesitatea unei noi specific ări a
modelului econometric.

7Dezvoltările aduse econometriei în anii ’70 au condus la acceptarea unei alte scheme a
etapelor unei analize econometrice, prezentat ă în Figura 2.
Schema revizuit ă a etapelor unei analize econometrice

T e o r i a e c o n o m i c ă
Modelul econometric Date

Estimare
Testarea specific ării și
verificarea E s t e NU adecvat DA m o d e l u l ? Testarea ipotezelor Utilizarea modelului
pentru previziune și
analize, control

Figura 2. Schema revizuit ă a etapelor unei analize econometrice
În schema din Figura 2 se pot distinge rela țiile de feedback:
– de la rezultatele analizei ec onometrice la teoria economic ă,
– de la testarea specific ării la modificarea specific ării modelului economic,
– de la modelul econometric la culegerea datelor.
Schema prezentat ă pornește de la o singur ă teorie economic ă, dar adesea exist ă mai multe teorii
concurente, caz în care econometria ajut ă la alegerea celei mai pertinente.

8u x xxfyn+ = ) ,…,,(2 1
t kt t t t u x xxf y + = ) ,…,,(2 1
t kt t t t t u y yyxf y + =− −− ) ,…, ,,(2 1
t kt t t t t u x xxxf y + =− −− ) …,,,(2 13. Modele econometrice utilizate în economie
Clasificarea modelelor econometrice se face dup ă următoarele criterii:
• Numărul variabilelor factoriale:
– Modele unifactoriale
– Modele multifactoriale

• Forma leg ăturii:
– Modele liniare
– Modele neliniare

• Sfera de cuprindere:
– Modele par țiale
– Modele globale (agregate)

• Considerarea timpului, ca factor:
– Modele statice:
– Modele dinamice:
– Introducerea în mod explic it a variabilei timp:
– Modele autoregresive:
– Modele cu lag distribuit:

• Numărul de ecua ții:
– Cu o singur ă ecuație,
– Cu ecuații multiple.

• Scopul utiliz ării:
– Modele euristice, ra ționale – în teoria economic ă,
– Modele decizionale, opera ționale – în practica economic ă.

Rezumat

Aceast ă secțiune prezint ă apariția Econometriei ca știință, locul ei în rândul altor discipline
la a căror intersec ție a apărut, importan ța studierii Econometriei și apartenen ța sa la o alt ă disciplină
Previziunea economic ă.
Construirea modelelor econometrice pornind de la o teorie economic ă parcurge niste etape,
a căror abordare s-a dez voltat în timp, asigurând feed-back-ul.
Clasificarea modelelor econometrice ofer ă o imagine cuprinz ătoare asupra importantei
construirii și utilizării modelelor econometrice.

Termeni importan ți
Econometrie, Previziune economic ă, model economic, model econometric, etapele
construirii unui model econometric

Întrebări recapitulative
1. Definiți modelul economic.
2. Definiți modelul econometric.
3. Care este rela ția de subordonare dintre Econometrie și Previziunea economic ă
4. Care sunt etapele construirii unui model econometric
5. Enumerati câteva criterii de cl asificare a modelelor econometrice uxfy+= )(
u bVaC ++=uaVCb=
i ki i i i u x xxf y + = ) ,…,,(2 1
t kt t t t utx xxf y + = ), ,…,,(2 1

9CAPITOLUL 1

Tema MODELUL REGRESIEI SIMPLE
Obiectivele 1. Problema estim ării
2. Metoda celor mai mici p ătrate – ipoteze
3. Metoda celor mai mici p ătrate – estimatorii
4. Propriet ățile estimatorilor metodei celor mai mici p ătrate
5. Liniaritatea 6. Tabela de regresie 7. Funcția de regresie a popula ției
8. Funcția de regresie a e șantioanelor
9. Exercițiu – Calculul estimatorilor modelului de regresie simpl ă
10. Consecin țe ale ipotezelor: c onstruirea testelor
10.1. Exerci țiu – Rolul termenului aleator
10.2. Testul de semnifica ție al estimatorilor
10.3. Intervalul de încredere al estimatorilor 10.4. Tabelul de analiz ă a varianței – testul Fisher
11. Intervalul de încredere al previz iunii cu modelul regresiei simple
11.1. Exerci țiu – Previziuni al e variabilei endogene
12. Exerci țiu – Compararea coeficien ților de regresie

Finalitatea –
Competen țe
dobândite 1. Estimarea coeficien ților modelului de regresie simpl ă
2. Cunoașterea unui software si a proc edurii statistice care are ca
rezultat tabela de regresie; con ținutul tabelei de regresie
3. Diferențe dintre modelul la nivelul popula ției și al eșantionului
4. Realizarea de previziuni cu modelul regresiei simple
Mijloace
– citire/înv ățare
– întreb ări, probleme ce apar, explica ții
– definiții, explica ții ce trebuie re ținute
– situații economice concrete, supuse analizei, exemple (sub lup ă)
– teme de cas ă, aplicații practice pentru studen ți
Evaluarea – parcurgerea aplica țiilor propuse
Timp de lucru
necesar 1. Pentru cunoa șterea problemei: 4 ore
2. Pentru rezolvarea temelor: 12 ore + timpul de documentare

10MODELUL REGRESIEI SIMPLE

În funcție de num ărul de factori a c ăror variație se consider ă în explicarea varia ției
fenomenului efect, y, există:
– regresie simpl ă: când se consider ă variația unui singur factor: y=f(x) și
– regresie multipl ă: când se consider ă variația mai multor variabile explicative: y=f(x1, x2,
…, xk) .
Metoda regresiei analizeaz ă relațiile existente între variabila explicat ă și variabilele
explicative, pe baza datelor obser vate pentru aceste variabile.
Se poate stabili care din factori au o influen ță semnificativ ă, gradul lor de esen țialitate și
cunoscând influen ța variabilelor factoriale asupra varia ției fenomenului explicat, se pot face
previziuni ale valorilor variabilei y pentru anumite valori date ale variabilelor x.
Analiza regresiei reprezint ă o metodă analitică de măsurare a intensit ății legăturilor dintre
fenomenele economico-sociale, fiind instrume ntul cel mai utilizat în analiza economic ă. Analiza de
regresie m ăsoară dependen ța statistic ă a unei variabile y, variabilă dependent ă, de una sau mai
multe variabile explicative x, cu scopul de a estima și de a previziona valoarea medie a variabilei y,
pe baza valorilor cunoscute sau fixa te ale variabilelor explicative.
Fenomenul a c ărui variație se analizeaz ă în funcție de influen ța variației unor alte fenomene-
cauză, se mai nume ște variabilă explicată, endogenă, iar fenomenele a c ăror variație influen țează
semnificativ variabila y, se mai numesc variabile independente, exogene, independente , regresori,
factori sau variabile factoriale .
De exemplu, în func ția Keynesian ă a consumului:dcY CC+=0 , unde
C = consumul privat
C0 = consumul privat incompresibil,
c = înclinația marginal ă spre consum
Yd = venitul disponibil,
C este variabila dependent ă, endogen ă, explicată, iar Yd reprezint ă variabila independent ă, exogenă,
explicativ ă, factorul de influen ță, cauza, regresorul.

111. Problema estim ării
Metoda regresiei statistice const ă în stabilirea funcției de regresie care descrie cel
mai bine rela ția dintre variabila explicat ă și variabila sau variabilele independente, dup ă caz.
Fenomenele economico-social e sunt fenomene de mas ă supuse ac țiunii legilor statistice,
care se manifest ă sub form ă de tendin ță (medie) într-un num ăr mare de cazuri individuale, diferite
ca formă de manifestare, sub ac țiunea combinat ă a influen ței mai multor factori, dar care apar țin
aceleași esențe, aceleași colectivit ăți. Fenomenele economico-sociale sunt fenomene stochastice,
care nu pot fi experimentate în laborator. La acelea și valori ale fenomenelor cauz ă, se obțin
întotdeauna valori diferite ale fenomenului efect an alizat. Combinarea diferit ă a factorilor, cu grade
diferite de esen țialitate, confer ă o mare variabilitate fenomenului explicat.
A observa întreaga colectivitate pentru a stabili parametri ecua ției de regresie a popula ției
este o modalitate ineficient ă, care necesit ă un efort mare, atât din punc t de vedere material cât și al
timpului.
Avantajele oferite de s ondajul statistic reprezint ă cea mai bun ă soluție pentru estimarea
parametrilor pe baza date lor observate dintr-un e șantion. Se ob ține astfel ecuația de regresie a
eșantionului . Estimatorii ecua ției de regresie a e șantionului vor furniza rezultate foarte bune,
despre parametrii polula ției, în anumite condi ții de probabilitate și respectând anumite ipoteze pe
care aceștia trebuie s ă le îndeplineasc ă.
Problema estim ării parametrilor este obiectivul prioritar al econometriei. Exist ă mai multe
metode de determinare a estimatorilor parametrilor de regresie: metoda mo mentelor, metoda celor
mai mici p ătrate și metoda maximei verosimilit ăți.
Dintre aceste metode, cea care îndepline ște criteriile de cost minim de aplicare, și de
asigurare a calit ății estimatorilor, în condi țiile respect ării unor ipoteze fundamentale, este metoda
celor mai mici p ătrate (M.C.M.M. P.)

2. Metoda celor mai mici p ătrate – ipoteze
Metoda celor mai mici p ătrate, atribuit ă matematicianului german Carl Friederich Gauss,
este una din cele mai des utilizate metode de estimare a ecua țiilor de regresie a sondajelor statistice.
Principiul acestei metode const ă în minimizarea sumei p ătratelor abaterilor valorilor empirice fa ță
de cele teoretic estimate, adic ă minimizarea sumei p ătratelor reziduurilor.
Aplicarea acestei metode se bazeaz ă pe următoarele ipoteze presupuse adev ărate:
1. Modelul este liniar în xi (sau în oricare transformare a lui xi).

12() ( )[] ()2 2 2/ σεεε ε ==−=i i i i i E E E x V
()2/i i ix V σε=
0) ( )]( )][( [ ), cov( ==− −=ji j j i i j i E E E E εεεεεεεε
0cov
) ( )()( ) ())]( ([ )]( )][( [ ),(
== −==−=− −=
ii i i iii ii i i i i ii
xE ExE xExEx E xEx E E x
εε εε εε ε2. Valorile lui xi sunt observate f ără erori ( xi este nealeator).
3. Media (operatorul E) reziduurilor este zero: E(εi / xi)=0.
Această ipoteză spune de fapt c ă toți factorii neexplicita ți de model, și dealtfel cuprin și în εi, nu
afectează în mod sistematic valoarea medie a lui y, adică valorile lor pozitive se anuleaz ă cu cele
negative astfel încât efectul lor mediu asupra lui y este zero.
4. Homoscedasticitatea sau varia ția (V – dispersia, varian ță) egală a reziduurilor σ2. Varianța
reziduurilor pentru fiecare xi (varianța condiționată a lui εi) este un num ăr pozitiv constant și egal
cu σ2 sau altfel spus, popula țiile lui y, corespunz ătoare valorilor xi, au aceeași varianță.

Situația opusă se numește heteroscedasticitate și se poate nota: , unde varian ța nu
mai este constant ă, i=1,n .

Figura 1.1. Reprezentarea grafic ă a ipotezei de heteroscedasticitate

5. Nu exist ă corelația (covarian ța) erorilor pentru oricare i
≠ j.

Pentru anumite valori date xi, abaterile oric ăror două valori y de la valoarea lor medie nu prezint ă
nici o tendin ță.
6. Erorile sunt independente de variabila explicativ ă. Nu exist ă corelație între erori și valorile x.
Ajustarea liniar ă a profitului în func ție de num ărul de angaja ți
507090110130150170190210230
0 50 100 150 200 250 300 350 400 450 500 550număr angajați (persoane)profit (mii euro )
ymed ymed.teoretic

13() 0=iEε pentru că din ipoteza 3.
7. Modelul de regresie este corect specificat. O investiga ție econometric ă începe prin specificarea
modelului econometric.
Problemele sunt: ce variabile ar trebui incluse în model, care este forma func țională a
modelului (este liniar în parametri, în variabile sau ambele?)

3. Metoda celor mai mici p ătrate – estimatorii
Ecuația de regresie a popula ției se poate scrie: i i i xa ay ε++=1 0 sau t t t xa a y ε++=1 0 .
Cu ajutorul datelor dintr-un e șantion de date i=1,n (pentru serii de date instantanee) sau t=1 ,n
(pentru serii cronologice) se poate aproxima ecua ția de regresie a popula ției prin ecua ția de regresie
a eșantionului astfel: i i i i i ey exa ay +=++= ˆ ˆ ˆ1 0 , unde iyˆ este valoarea estimat ă a iy (media
condițională). Reziduurile ie reprezint ă diferențele dintre valorile observate iy și cele estimate iyˆ:
i i i i i xa ay yy e1 0ˆ ˆ ˆ −−=−= .
Dându-se n perechi de observ ări ale lui y și x, se va construi func ția de regresie a
eșantionului astfel încât s ă minimizeze suma reziduurilor, pe cât posibil.
Cum ()∑∑
===−=n
nin
nii i i yy e 0 ˆ , se alege criteriul minimiz ării pătratelor reziduurilor:
()∑∑
==−=n
in
ii i i yy e
112 2ˆ.
Este evident c ă suma p ătratelor reziduurilor este func ție de valorile estimatorilor
coeficienților dreptei de regresie ()∑
==n
ii aaf e
11 02ˆ,ˆ , pentru orice set de date din e șantioane diferite.
Alegând valori diferite pentru 0ˆa și 1ˆa se vor ob ține valori diferite ale reziduurilor și deci și pentru

=n
iie
12. Derivatele par țiale ale sumei ()( )∑∑
= =−−=−=n
ii in
ii i xa ay yy S
12
1 0
12ˆ ˆ ˆ se egaleaz ă cu 0.
0) ˆ ˆ(2 0ˆ1 0
1 0=−+−=∂∂∑
=i in
iyxa aaS
0 ) ˆ ˆ(2 0ˆ1 0
1 1=−+−=∂∂∑
=i i in
ixyxa aaS
Simplificând cu -2 și aplicând operatorul Σ, se obține sistemul de ecua ții normale, numite și
simultane:

14∑∑
===+n
in
ii i y x a an
111 0ˆ ˆ
∑∑ ∑
== == +n
in
in
iii i i yx x ax a
11 12
1 0 ˆ ˆ
Sistemul se poate rezolva prin metoda determinan ților:
2
1 1211 112
12
1112
11 1


⎠⎞⎜
⎝⎛−−
= =
∑∑∑∑∑∑
∑∑∑∑∑∑∑
= === ==
= === == =
n
iin
iin
in
iii in
in
ii i
n
iin
iin
iin
iin
iiin
iin
ii
x xnyx x y x
x xx nx yxx y
a ;
2
1 1211 1
12
111 11


⎠⎞⎜
⎝⎛−−
= =
∑∑∑∑ ∑
∑∑∑∑∑∑
= === =
= === ==
n
iin
iin
in
in
ii i ii
n
iin
iin
iin
iiin
iin
ii
x xny x yxn
x xx nyx xy n
a
Dacă în sistemul de ecua ții normale, variabilele ix și iy se înlocuiesc cu valorile lor centrate fa ță de
mediile lor, se ob ține:

∑∑
==−=− +n
in
ii i yy xx a an
111 0 ) ( ) ( ˆ ˆ
∑∑∑
== =−−=− +−n
in
in
ii i i i yyxx xx axx a
11 12
1 0 ) )( ( ) ( ˆ) ( ˆ
Cum 0) (
1=−∑
=n
iixx și 0) (
1=−∑
=n
iiyy , din a doua ecua ție, se obține ()()
()∑∑
==
−−−
=n
iin
ii i
xxyyxx
a
121
1ˆ .
Știind că xa ay1 0ˆ ˆ+= , rezultă xay a1 0 ˆ ˆ−= .
Ace ști estimatori 0ˆa și 1ˆa sunt numi ți estimatori “ai celor mai mici p ătrate”, deoarece sunt
obținuți pe baza acestui principiu și sunt estimatori punctuali, pentru c ă furnizeaz ă o singur ă
valoare (punct) relevant ă pentru parametrul popula ției.

15)ˆ(1aE1a
i i xa a xyE ⋅+=1 0)/(
4. Propriet ățile estimatorilor metodei celor mai mici p ătrate
Estimatorii metodei celor mai mici p ătrate au urm ătoarele propriet ăți:
• liniari , adică o funcție liniară a unei variabile aleatoar e, cum ar fi variabila y în modelul de
regresie;
• nedeplasa ți, media estimatorului din toate e șantioanele posibile, de volum n sau valoarea
așteptată a estimatorului este egal ă cu valoarea adev ărată a parametrului, ;
• eficienți, adică are varian ța minimă.
Teorema lui Gauss-Markov se enun ță astfel:
Date fiind ipotezele modelului liniar clasic de regresie, estimatorii celor mai mici p ătrate,
din clasa estimatorilor liniari nedeplasa ți, au varian ță minimă; se poate spune c ă sunt BLUE (Best
Linear Unbiased Estimators).

5. Liniaritatea

• liniaritatea în variabile – cu un în țeles „natural” înseamn ă că media condi țională (în sensul de
valoarea medie a șteptată – în econometrie, apare termenul de speran ță matematic ă) a variabilei y
este o func ție liniară a lui xi. Operatorul de speran ță matematic ă se noteaz ă cu litera E. Dreapta
de regresie a popula ției reprezint ă tendința medie și se scrie:
E(y/x i)=a 0 + a 1xi.
• liniaritatea în parametrii este când distribu ția condițională a variabilei y, E(y/x i) este o func ție
liniară a parametrilor, adic ă toți sunt la puterea 1, in timp ce variabilele x pot sau nu s ă fie
liniare.
• Termenul de regresie liniar ă însemnă întotdeauna, liniaritatea în parametrii necunoscu ți;
indiferent dac ă există liniaritate în vari abilele explicative.
Astfel, exemple de modele liniare sunt:
– E(y/x i)=a 0 + a 1xi, liniar în parametrii și în variabile și
– E(y/x i)=a 0 + a 1xi2, liniar în parametrii și neliniar în variabile.
• Un model neliniar în parametrii este: .
• Pentru regresia liniar ă este relevant termenul de liniaritate în parametrii .

166. Tabela de regresie
În realitate, nu se pot observa colectivit ăți generale, ci numai e șantioane extrase din acestea,
repectând principii probabilistice, pentru a asigura condi ția de reprezentativitate.
Scopul analizei de regresie este descrierea modelului prin estimarea parametrilor, pe baza
datelor de sondaj. Aceast ă metodă calculeaz ă valorile estimatorilor, astfel încât suma p ătratelor
abaterilor valorilor empirice (obs ervate) ale vari abilei dependente y de la valorile ei teoretice
(calculate dup ă funcția liniară obținută), adică suma pătratelor reziduurilor s ă fie minim ă:
min () ∑ ∑
= ==−n
iin
ii i e yy
12
12min ˆ .
Analiza de regresie se poate ob ține automat prin tabela de regresie, în Microsoft Excel.
După efectuarea declara țiilor blocurilor care con ține valorile variabilei explicate y și variabila (sau
variabilele, în cazul regresiei multiple) independent ă x, precum și a locului pe spreadsheet unde se
va obține tabela și eventual a unor alte op țiuni privind probabilitatea de garantare a rezultatelor,
pentru intervalele de încred ere ale estimatorilor sau ob ținerea automat ă a valorilor teoretice, ale
erorilor lor fa ță de valorile y observate, ale graficel or, etc., se confirm ă declarațiile prin OK și tabela
apare instantaneu. Acest criteriu al minimiz ării patratelor abaterilor face ca metoda ce st ă la baza
obținerii estimatorilor, s ă se numeasc ă metoda celor mai mici p ătrate (M.C.M.M.P.).
Tabela de regresie cuprinde în sumarul s ău, SUMMARY OUTPUT, trei p ărți: Regression
Statistics , tabelul ANOVA și informa țiile despre estimatorii coeficien ților modelului liniar.
Regression Statistics conține informa ții cu caracter general despre vari abilele implicate în analiza de
regresie: –
coeficientul de corela ție multipl ă Multiple R , care la regresia simpl ă este coeficientul de
corelație liniară simplă, r;
– coeficientul de determina ție R2, numit R Square arată validitatea modelului. Valoarea sa este
cuprinsă în intervalul [0, 1] și cu cât e mai apropiat ă de 1, cu atât modelul este bine ales, adic ă
explică într-o propor ție mai mare (deseori, în %) varia ția variabilei dependente y.
()
()()
()∑∑
∑∑
==
==
−−
−=
−−
=n
iin
ii i
n
iin
ii
yyyy
yyyy
R
1212
1212


, unde
y este media valorilor empirice yi.
– Adjusted R Square care este R2 ajustat cu un anumit num ăr de grade de libertate;

17- Standard Error este eroarea medie standard a valorilor teoretice ale lui y și se calculeaz ă ca o
abatere medie p ătratică a valorilor empirice fa ță de cele teoretice:
()
2 12
12
ˆ
1 1ˆ
ˆε ε σ σ =−−=−−−
=∑ ∑
= =
kne
knyyn
iin
ii i
, unde
2ˆεσ este estimatorul pentru dispersia reziduurilor, iar n–k–1 este numărul gradelor de libertate,
iar k este numărul variabilelor explicative;
– Observations reprezintă n este numărul de observ ări ale variabilei dependente, care este egal cu
numărul de valori ale variabilei (variabilelor) independente xi.
Tabelul ANOVA este tabelul de analiz ă a varianțelor, a cărui denumire provine din ini țialele
ANalysis Of Variances și are ca scop prezentarea varia ției pe factori de influen ță și calculul testului
Fisher pentru evaluarea semnifica ției globale a regresiei. Analiza varian ței pentru o regresie simpl ă
este prezentat ă în Tabelul 1.1.
În coloana numit ă SS – Sum Squares (sumă de pătrate) – se prezint ă descompunerea varia ției
totale a variabilei explicate y, Total : ()∑
=−n
iiyy
12 pe tipuri de influen ță:
– atribuită și explicată de factorii de regresie, Regression : ()∑
=−n
iiyy
12ˆ ,
– atribuită factorilor reziduali, neînregistra ți în model, Residual : ()∑
=−n
ii iyy
12ˆ.
Sursa varia ției Suma p ătratelor ( SS) Grade
libertate
(df) Sume
modificate
(MS)
x (Regression)

Reziduuri (Residual)

Total (Total) SSE =∑−
ttyy2) ˆ(
SSR =∑ ∑=−
ttt t t e yy2 2)ˆ (
SST =∑−
ttyy2) ( 1

n-2

n-1 SSE/1

SSR/(n-2)
Tabelul 1.1. ANOVA în cazul regresiei simple
Coloana numit ă
df – degrees freedom – se referă la gradele de libertate corespunz ătoare
fiecărui tip de varia ție:
– pentru varia ția explicat ă de regresie, gradele de libertate sunt egale cu num ărul variabilelor
explicative, k; la regresia simpl ă este 1;
– pentru varia ția datorată factorilor reziduali, gradele de libertate sunt egale cu n-k-1 , adică n-2;
– pentru varia ția totală corespunde un num ăr de grade de libertate egal cu n-1.

18Gradele de libertate se calculeaz ă în funcție de termenul constant Intercept astfel: dac ă Intercept =
0, df = n-k și numai dac ă Intercept ≠ 0, df = n-k-1 .
Coloana numit ă MS – Modified Sums – conține dispersiile corectate cu gradele de libertate
corespunz ătoare fiecărui tip de varia ție.
Valoarea calculat ă F se obține raportând varia ția corectat ă datorată modelului la cea
corectată datorată factorilor reziduali, iar Significance F reprezint ă pragul de semnifica ție α de la
care regresia începe s ă devină global semnificativ ă. Regresia este global semnificativ ă cu o
probabilitate P=1 – α.
Testul empiric F de analiz ă a varianței este: )2 /(1/*
−=n SSRSSEF , unde *F urmează o lege
Fisher cu 1 și n-2 grade de libertate.
La regresia liniar ă simplă: 2* *)(t F= , unde *t, este testul Student empiric.
Acest test se poate scrie în func ție de coeficientul de determina ție, astfel:
)2 /() 1(22
*
−−=n RRF . Dacă varianța explicat ă de model este superioar ă varianței reziduale, se
consideră modelul semnificativ pentru expl icarea variabilei dependente.
Dacă 05.0
2,1*
−>nF F , se respinge ipoteza de egalitate a varian țelor (H 0 – ipoteza nul ă), variabila
x fiind semnificativ ă pentru varia ția variabilei y. În caz contrar se accept ă această ipoteză de
egalitate a varian țelor.
A treia parte a tabelei de regresie con ține:
– valorile estimate ale coeficien ților modelului liniar, iaˆ, i=1,k , în coloana Coefficients pentru:
– Intercept – estimatorul termenului constant, â0, care poate fi zero dac ă s-a optat
pentru Constant is Zero și
– estimatorii coeficien ților variabilelor explicative: â1, …, â n la X Variable 1 , X
Variable 2 , … în ordinea declar ării variabilelor explicative;
– Standard Error ,
iaˆˆσabaterile standard ale estimatorilor iaˆ; arată cu cât variaz ă în medie, în plus
sau în minus valorile estimate ale coeficien ților față de parametri pe care îi estimeaz ă. Eroarea
standard de estima ție are caracter de medie a abaterilor va lorilor estimate ale coeficientului fa ță de
parametrul corespondent din popula ție.
– valorile Student, t*, pentru fiecare estimator, pentru verificarea semnifica ției acestuia fa ță de 0;
– P-value , corespunz ătoare pragului de semnifica ție α, începând de la care valoarea estimatorului
este semnificativ diferit ă de zero,

19- limitele intervalului de încredere ale estimatorilor: inferioar ă Lower 95% și superioar ă Upper
95%, cu o probabilitate de 95%, implicit, iar la cerere se pot solicita și alte valori ale probabilit ății:
99%, 90%, etc.
Suma valorilor observate este egal ă cu suma valorilor teoretice: ∑∑
= ==n
iin
ii y y
1 1ˆ, pentru că prin
ajustare se realizeaz ă o redistribuire a influen ței factorului, variabila explicativ ă, x.

7. Funcția de regresie a popula ției
Pentru a ilustra anali za de regresie a popula ției, se consider ă un caz ipotetic al unei țări a
cărei economie este format ă din 120 de societ ăți comerciale, despre car e se cunosc informa ții
referitoare la num ărul mediu lunar de salaria ți și profitul mediu lunar, exprimat în mii euro (€), la
sfârșitul anului.
Societățile comerciale sunt grupate în zece clase dup ă numărul mediu de salaria ți și în
fiecare grup ă este observat un num ăr variabil de societ ăți.
Datele observate sunt prezentate în Tabelul 1.2 (liniile sunt numerotate, iar coloanele numite
cu literele alfabetului, ca în Microsoft Excel). A B C D E F G H I J K
1 Grupe dup ă numărul mediu de angaja ți (x)
2 50 100 150 200 250 300 350 400 450 500
3
4 Profitul 60 74 85 95 110 130 120 140 145 167
5 lunar ( y) 70 78 88 97 112 132 122 148 150 169
6 75 81 90 100 115 134 135 151 160 170
7 (mii €) 85 89 95 110 120 136 149 156 170 180
8 80 90 98 112 125 139 153 160 185 192
9 83 94 104 115 128 141 155 169 190 195
10 87 90 105 120 130 144 160 170 200 197
11 92 95 110 120 135 145 160 170 205 200
12 96 110 125 140 145 165 174 206 202
13 100 115 125 141 146 165 175 204
14 107 114 127 145 147 170 177 208
15 110 117 130 147 152 173 179 208
16 121 130 155 175 180
17 132 189
18 pe grupă:
19 profit mediu 79 92 104 117 129 142 154 167 179 191
20 nr=120 8 12 13 14 12 13 13 14 9 12
21 profit total 632 1104 1352 1638 1548 1846 2002 2338 1611 2292
22 pr.med.teor 79 92 104 117 129 142 154 167 179 191
Tabelul 1.2. Gruparea societ ăților comerciale dup ă numărul mediu lunar de salaria ți și după
profiturile medii lunare

20Pentru a se analiza vaia ția profitului în func ție de num ărul mediu de angaja ți, se va
considera variabila independent ă ca fiind num ărul mediu lunar de salaria ți (x), iar variabila
dependent ă – profitul lunar ( y). Societățile comerciale cuprinse în aceea și grupă după numărul de
angajați, au un profit va riabil. Corespunz ător unui num ăr mediu de 50 de salaria ți (coloana B), de
exemplu, sunt 8 firme (celula B20) ale c ăror profituri medii lunare se situeaz ă între 60 mii € și 92
mii € (blocul de celule B4:B11), ob ținându-se o medie a prof iturilor pentru aceast ă grupă de
angajați, de 79 mii € (B19). Similar, pentru o alt ă variantă a numărului de angaja ți, de 500 salaria ți
(coloana K), exist ă 12 firme (K20), al c ăror profit mediu lunar este cuprins între 167 mii € și 208
mii € (blocul K4:K15), cu o medie a prof iturilor lunare de 191 mii € (K19).
O coloană din tabel reprezint ă distribuția profitului lunar y, la un nivel fixat al num ărului de
angajați, x, adică distribuția condițională a lui y pentru o valoare dat ă a lui x.
În celulele B19:K19 se afl ă profiturile medii lunare pentru fiecare grup ă de angaja ți, adică
mediile blocurilor de celule corespunz ătoare fiec ărei grupe: B4:B17, C4:C17, D4:D17, … K4:K17.
Mediile se calculeaz ă astfel: în celula B19, se scrie func ția statistic ă pentru calculul mediei,
=AVERAGE(B4..B17). Se observ ă că numărul maxim de firme dintr-o grup ă este de 14, pentru
x=200, x=400. De și în prima grup ă sunt 8 firme, se va specifica blocul de dimensiunea maxim ă,
pentru ca prin copierea formulei din celula B19 în celelalte ce lule, de la C19 la K19, s ă se
translateze corespunz ător coloanele celulelor, și să se ia în considerare toate situa țiile grupelor
(indiferent de num ărul de elemente declarate, media se va calcula ținând seama de num ărul efectiv
de elemente existente, în fiecare bloc de celule).
În linia 21, se afl ă profiturile totale lunare ale grupelor, ob ținute prin însumarea profiturilor
individuale observate în fiecare grup ă de salaria ți. La B21 se scrie formula =SUM(B4..B17), care
apoi se copiaz ă pentru restul celul elor de pe aceea și linie, adic ă pentru celelalte nou ă variante date
ale numărului de salaria ți. Profiturile medii pe grupe de salaria ți se pot ob ține și împărțind profitul
total al grupei la num ărul de firme considerate în grupa respectiv ă, de exemplu în linia 18 (care în
Tabelul 1.2 este liber ă), cu formula =B21/B20, și apoi copiat ă pentru restul grupelor; valorile
obținute vor fi identice cu cele din linia 19.
În graficul din Figura 1.2, de tip Scatter XY , s-au reprezentat profiturile firmelor
corespunz ătoare fiec ărei grupe de salaria ți. S-au declarat 14 serii, corespunz ător numărului maxim
de variante de profit în func ție de num ărul de salaria ți, astfel: B4..K4, B5..K5, B6..K6, …,
B17..K17 (cu acela și tip de marcatori – puncte) și a 15-a serie, pentru prof iturile medii calculate ale
celor 10 grupe diferite dup ă numărul de salaria ți, B19..K19. Profiturile me dii sunt reprezentate cu
marcatori diferi ți, cercuri mari.

21Corelația dintre profit și număr de angaja ți
507090110130150170190210230
0 50 100 150 200 250 300 350 400 450 500 550
număr angajați (persoane)profit (mii euro )

Figura 1.2. Corela ția dintre profiturile medii lunare și numărul mediu
lunar de salaria ți

În Figura 1.2, punctele mediilor profitu rilor lunare pe grupe de salaria ți, reprezint ă
distribuția condițională a profiturilor, corespunz ătoare fiec ărei grupe dup ă numărul de salaria ți.
Graficul arat ă tendința relației dintre cei doi indicatori, de form ă liniară și sensul direct al leg ăturii,
profitul mediu cre ște când num ărul mediu al salaria ților crește.
Se poate spune c ă pentru fiecare valoare xi există o popula ție a valorilor y, presupuse a fi
distribuite normal, iar media acestor valori y este medie condi țională. Dreapta sau curba de regresie,
după caz, trece prin mediile condi ționale teoretice (a șteptate) care corespund mediilor condi ționale
calculate.
Pe graficul din Figura 1. 3 se pot vedea distribu țiile condiționale ale valorilor y pentru fiecare
valoare dat ă xi, precum și distribuțiile erorilor în jurul fiec ărei medii condi ționale a variabilei y.
Dreapta de regresie trece prin toat e valorile teoretice ale mediilor condi ționale, ca urmare a ipotezei
că mediile condi ționale ale erorilor pe ntru o valoare dat ă xi sunt 0: 0 )/(=i ix Eε . Acțiunea
factorilor necuprin și în model este asimilat ă erorilor iε, iar ipoteza conform c ăreia media lor este 0,
semnifică faptul că erorile pozitive se anuleaz ă cu cele negative, adic ă nu au o ac țiune sistematic ă
asupra mediei variabilei y. Valorile observate ale profiturilor lunare se abat fa ță de valoarea lor
medie, calculat ă ca medie a grupei din care fac parte, dup ă numărul de salaria ți. Aceste abateri,
numite erori, se datoreaz ă altor factori, decât cel înregistrat – num ărul de salaria ți, numiți factori
reziduali, care ar putea fi: eficien ța activității de management, profilul de activitate al firmei, ramura
economic ă în care activeaz ă, gradul de instruire, nivelul de s ănătate și experien ța salariaților,

22conjunctura pie ței, nivelul na țional și internațional la care activeaz ă firma, deschiderea spre pie țele
externe, etc.

Ajustarea liniar ă a profitului în func ție de num ărul de angaja ți
507090110130150170190210230
0 50 100 150 200 250 300 350 400 450 500 550număr angajați (persoane)profit (mii euro )
ymed ymed.teoretic
Figura 1.3. Distribu țiile condiționale și dreapta de regresie a popula ției
Valorile teoretice corespunz ătoare acestor profituri medii se afl ă pe
dreapta de regresie a
populației, a cărei ecuație este i i xa a xyE1 0 )/( += .
Valorile parametrilor 0a și 1a se pot determina folosind func țiile statistice, în Excel:
=intercept(known_y’s,known_x’s) și =slope(known_y’s,known_x’s) .
Pentru 0a: =INTERCEPT(B19:K19,B2:K2)
și pentru 1a: =SLOPE(B19:K19,B2:K2).
Aceste func ții se pot tasta, de exemplu în celulele N23, respectiv N24.
Modelul de regresie a popula ției este i i x xyE ⋅+= 25.0 86.66)/(.
Coeficientul de determina ție R2=1 indică faptul că modelul liniar explic ă 100% varia ția
profiturilor lunare, y și este evident din faptul c ă s-a efectuat regresia pe valorile medii ale
profiturilor lunare. Coeficientul de corela ție se poate ob ține și prin func ția statistic ă
=correl(array1,array2) , aici =CORREL(B2:K 2,B19:K19). Acelea și rezultate se pot ob ține cu
ajutorul tabelei de regresie.
Regresia nu poate utiliza decât blocuri de tip coloan ă și de aceea trebuie s ă se transpun ă
blocurile linie ale valorilo r variabilelor pe vertical ă. Se poate proceda în felul urm ător:

23- se selecteaz ă blocul B2:K2, al variabilei x;
– se activeaz ă operația de copiere prin <C TRL/C> sau din meniul Edit / Copy sau apăsând
butonul dreapta al mouse-ul ui pe blocul selectat și se alege comanda Copy ;
– se poziționează cursorul în celul a blocului destina ție, de exemplu în N2;
– se apasă butonul dreapta al mouse-ului și se alege Paste Special sau din meniul Edit, comanda
Paste Special , unde se bifeaz ă Values , pentru a transforma în valo ri rezultatul unor formule –
pentru variabila x, nu este cazul, acestea fiind deja va lori, rezultate prin editarea lor – și
Transpose , apoi se confirm ă prin OK.
Blocul N2:N11 va con ține valorile variabilei x, din Tabelul 1.2.
Pentru transpunerea valor ilor medii ale variabilei y se procedeaz ă la fel, selectând blocul
B19:K19, se depune blocul tr anspus în O2:O11, cu men țiunea că la Paste Special se va bifa Values
și Transpose .
Prin transpunere, func țiile de calcul ale mediilor din linia 19, =AVERAGE(…), î și vor schimba
adresele din argumentul lor, ob ținându-se ni ște valori eronate și de aceea, formulele con ținute în
celulele B19:K19 trebuie transformate în valori, cu op țiunea Values.
Pentru că profiturile medii calculate (linia19) se afl ă pe o dreapt ă, regresia între valorile
variabilei x și valorile medii ale variabilei y furnizeaz ă niște parametri, care utiliza ți în calculul
valorilor teoretice corespunz ătoare, au ca rezultat valori identice cu mediile calculate din valorile
observate ale variabilei y.
Modelul liniar determin ă în totalitate, 100%, varia ția acesteia, regresia exprimând chiar
această tendință medie de evolu ție a lui y în funcție de x.
Valorile medii ale profiturilor pe grupe, se afl ă pe dreapta de regresie a popula ției, după
cum se poate vedea și pe graficul din Figura 1.3. Valorile teoretice se ob țin prin modelul liniar
determinat, în linia 22 din Tabelul 1.2. Dac ă, de exemplu, valorile parametrilor 0a și 1a se află în
celulele N23 și N24, atunci în celula B22 se scrie formula =$N$23+$N$24*B2, care se copiaz ă și
pentru restul celulelor C22:K22. Celulele N23 și N24, sunt fixate prin folo sirea simbolului $, astfel
încât prin copierea formul ei în restul celulelor, s ă nu se schimbe coloanele și linii. Cum acestea din
urmă nu se schimb ă, pentru c ă se face copierea pe orizontal ă, formula era la fel de corect ă dacă se
scria =$N23+$N24*B2. Se adaug ă încă o serie pe graficul din Figur a 1.2, cea a valorilor teoretice
din linia 22, și se obține graficul din Figura 1.3.
Mediile profiturilor calculate pe grupe de salaria ți se pot abate de la valorile teoretice ale
acestor medii condi ționale, sub influen ța alegerii modelului. Un model bine ales va minimiza aceste
abateri. Acest tip de varia ție a mediilor condi ționale se datoreaz ă factorului de grupare, num ărul de
salariați, variabila explicativ ă a variației profiturilor, cea înregistrat ă, a cărei influen ță este

24considerat ă în model. În acest caz mediile profitu rilor calculate pe grupe de salaria ți coincid cu
valorile lor teoretice, aflate pe dreapta de regresie a popula ției.
Suma celor dou ă tipuri de varia ție: din interior ul grupelor și dintre variantele de grupare,
reprezintă variația totală a profiturilor datorat ă tuturor factorilor, și se exprim ă prin totalitatea
abaterilor valorilor observate ale profiturilor fa ță de nivelul lor mediu calculat (media mediilor
grupelor).
Acțiunea factorilor reziduali apare în modelul liniar de regresie a popula ției sub termenul de
disturban ță sau eroare , εi, iar la nivel de e șantion, ca reziduu , ei.

8. Funcția de regresie a e șantioanelor
La nivelul popula ției, între valorile teoretice ale modelului liniar i i xa a xyE1 0 )/( += și
valorile observate iy, există abateri, numite la nivel de colectivitate, erori și se noteaz ă iε. Erorile
sunt rezultatul influen ței factorilor neînregistra ți în ecuația de regresie, care fac s ă existe abateri
între valorile empirice și cele teoretice.
Valorile observate ale prof iturilor, la nivel de popula ție statistic ă, se pot scrie
i i i i i xa a xyE y ε ε ++=+ =1 0 )/(.
Funcția de regresie a popula ției E(y / x i) = a 0 + a 1xi se poate estima prin func ția de regresie a
unui eșantion i i xa ay1 0ˆ ˆ ˆ+= și atunci iyˆ reprezint ă un estimator pentru E(y / x i).
La nivel de e șantion, în modelul liniar, erorile se estimeaz ă prin reziduuri și se noteaz ă ie.
Modelul liniar la nivel de e șantion este i i xa ay1 0ˆ ˆ ˆ+= , iar valorile observate în e șantion sunt
descrise de ecua ția i i i i i ey exa ay +=++= ˆ ˆ ˆ1 0 .
În Figura 1.4 se prezint ă grafic termenul de eroare și cel de reziduu , dispunând de un
eșantion oarecare extras din popula ția statistic ă. Se cunosc dreaptele de regresie a e șantionului și a
populației. Se poate exprima funcția de regresie a popula ției cunoscând datele dintr-unul sau mai
multe eșantioane?
Din popula ția de societ ăți comerciale, prezentat ă anterior, s-au extras dou ă eșantioane
aleatoare, prezentate în Tabelu l 1.3. Din cele 120 de societ ăți s-au extras 10 în primul e șantion și 10
în al doilea. S-au înregistrat valorile num ărului mediu lunar de salaria ți, x și profitul mediu lunar, y,
pentru fiecare din cele 10 firme. Pentru fiecare e șantion se va stabili ecuația de regresie a

25Dreapta de regresie a popula ției și a eșantionului
7090110130150170190210
0 50 100 150 200 250 300 350 400 450 500 550
yes ytes ytpopeșantionului . Aceasta va con ține estimatorii 0ˆa și 1ˆa ai parametrilor 0a și 1a ai ecuației de regresie
a populației. Modelul liniar de regresie a e șantionului va fi: i i xa ay1 0ˆ ˆ ˆ+= .

yi
εi ei
iyˆ
E(y/x i)

Figura 1.4. Valorile observate din e șantion, dreapta de regresie a e șantionului și a popula ției
Pentru fiecare din cele dou ă eșantioane valorile estimate ale parametrilor 0a și 1a, diferă
între ele, pentru c ă unitățile statistice au fost extrase la întâmplare și față de parametri, pentru c ă un
eșantion nu poate reproduce identic colectivitatea di n care a fost extras. Folosind pe rând, pentru
fiecare eșantion func țiile intercept și slope se pot determina valo rile estimate pentru 0a și respectiv, 1a.
Pentru primul e șantion, în celula A42: =INTE RCEPT(B31:B40,A31:A40) pentru 1
0ˆa și pentru 1
1ˆa,
în celula A43: =SLOPE (B31:B40,A31:A40).
Pentru al doilea e șantion, în celula D42: =INTE RCEPT(E31:E40,D31:D40) pentru 2
0ˆa și pentru
2
1ˆa, în celula D43: =SLOPE(E31:E40,D31:D40).
Astfel pentru primul e șantion se determin ă următoarele rezultate:
– un coeficient de corela ție liniară între variabilele x și y, de 94301. rxy= , care arat ă o legătură de
intensitate mare și se obține cu func ția =CORREL(B31:B40,A31: A40), în celula A44;
– estimatorii 78.69 ˆ1
0=a și 26 .0 ˆ1
1=a , modelul este i i x y ⋅+= 26.0 78.69 ˆ1;
– un coeficient de determina ție R2=0.8893, care arat ă un model valid, bine ales, care explic ă
variația variabilei y, într-o propor ție de 88.93%;

26Valorile teoretice corespunz ătoare 1ˆiy, se află în coloana C, din Tabelul 1. 3. În celula C31, formula
=A$42+A$43*A31 se copiaz ă în blocul C32:C40.
A B C D E F
29 e șantion 1 e șantion 2
30 xi yi 1ˆiy xi yi 2ˆiy
31 50 60 83 50 92 84
32 50 83 83 150 105 107
33 100 107 96 200 120 119
34 100 110 96 250 125 130
35 200 120 121 300 136 142
36 200 125 121 350 153 153
37 300 152 147 400 156 165
38 300 155 147 400 170 165
39 350 135 160 450 170 176
40 500 204 198 500 202 188
42 69.78361
0ˆa 72.60352
0ˆa
43 0.25731
1ˆa 0.23052
1ˆa
44 0.9430 r xy1 0.9764 r xy2
Tabelul 1.3. Cele dou ă eșantioane extrase din popula ție
Aceste rezultate se pot ob ține și folosind procedura
Regression din meniul Tools, opțiunea
Data Analysis . Se realizeaz ă tabela de regresie pentru primul e șantion, declarându-se variabila
dependent ă (Input Y Range ), blocul B31:B40, variabila independent ă (Input X Range ), blocul
A31:A40, iar la Output Range , celula care va fi din col țul stânga sus al tabe lei de regresie, de
exemplu K27. În Tabelul 1.4 este prezentat ă tabela de regresie ob ținută în Excel pentru primul
eșantion. În tabela de regresie se reg ăsesc estimatorii și indicatorii calcula ți mai sus.
SUMMARY OUTPUT e șantionul 1
Regression Statistics
Multiple R 0.943
R Square 0.8893
Adjusted R Square 0.8755
Standard Error 14.1781
Observations 10
ANOVA df SS MS F Signif. F
Regression 1 12924.74 12924. 7 64.29573 4.29E-05
Residual 8 1608.161 201.02
Total 9 14532.9
Coeff. Standard
Error t Stat P-value Lower 95% Upper
95%
Intercept 69.784 8.2275 8.4817 2.86E-05 50.811 88.756
X Variable 1 0.2573 0.0321 8.0185 4.29E-05 0.183 0.331
Tabelul 1.4. Tabela de regresie pentru e șantionul 1

27Pentru al doilea e șantion se determin ă cu funcții sau din tabela de regresie, urm ătoarele rezultate:
– un coeficient de corela ție liniară între variabilele x și y, de 9764.02=xyr , care arat ă o legătură de
intensitate mare și se poate ob ține cu func ția =CORREL(E31:E40,D31:D40) în D44;
– estimatorii: 6.72 ˆ2
0=a , în celula D42 și 23 .0 ˆ2
1=a , în celula D43, iar modelul este
i i x y ⋅+= 23.06.72 ˆ2;
– un coeficient de determina ție R2=0.9534, care arat ă că modelul liniar este bine ales și explică
variația variabilei y, într-o propor ție de 95.34%, mai mare decât în cazul primului e șantion;
Valorile teoretice corespunz ătoare 2ˆiy se află în coloana F, din Tabelul 1.3 și sunt calculate prin
copierea formulei =D$42+D$43*D31 din celula F31, în F32:F40.
Se realizeaz ă tabela de regresie pentru al doilea e șantion, la Input Y Range se declar ă
E31:E40, la Input X Range , D31:D40, iar la Output Range , de exemplu, celula U27. Tabela de
regresie pentru al doilea e șantion este prezentat ă în Tabelul 1.5.

SUMMARY OUTPUT e șantionul 2
Regression Statistics
Multiple R 0.9764
R Square 0.9534
Adjusted R
Square 0.9475
Standard Err 7.694
Observations 10
ANOVA df SS MS F Signif. F
Regression 1 9681.317 9681.3 17 163.5416 1.32E-06
Residual 8 473.583 59.19787
Total 9 10154.9
Coeff. Standard Err t Stat P-value Lower 95% Upper 95%
Intercept 72.6035 6.0113 12.0778 2.04E-06 58.7414 86.4656
X Variable 1 0.2305 0.0180 12.7883 1.32E-06 0.1889 0.2720
Tabelul 1.5. Tabela de regresie pentru e șantionul 2
Pe graficul din Figura 1.5 s-au reprezentat: dreapta de regresie a popula ției (în legend ă,
ymed. teoretic), declarând la X Values blocul B2:K2, iar la Y Values , blocul B22:K22, valorile
variabilei y pentru primul e șantion (în legend ă, y1), la X Values s-a declarat blocul variabilei x,
adică A31:A40, iar pe axa Oy, la Y Values , B31:B40 și dreapta de regresie a primului e șantion,
valorile teoretice 1ˆiy (în legend ă, yt1), la X Values declarându-se A31:A40, iar la Y Values ,
C31:C40.

28Ajustarea profitului în func ție de num ăr de angaja ți-eșantionul 1
507090110130150170190210230
0 50 100 150 200 250 300 350 400 450 500 550număr angajați (persoane)profit (mii euro)
ymed.teoretic y1 yt1
Figura 1.5. Valorile empirice din e șantionul 1 și ajustarea lor

Graficul din Figura 1.6, con ține: dreapta de regresie a popula ției (în legend ă, ymed.
teoretic), valorile variabilei y pentru e șantionul al doilea (y2), la X Values s-a declarat blocul
variabilei x, adică D31:D40, iar la Y Values , E31:E40 și dreapta de regresie a e șantionului al
doilea, 2ˆiy (yt2), blocul F31:F40.
Ajustarea profitului în func ție de num ărul de angaja ți – eșantionul 2
507090110130150170190210
0 50 100 150 200 250 300 350 400 450 500 550
număr angajați (persoane)profit (mii euro )
ymed.teoretic y2 yt2
Figura 1.6. Valorile empirice din e șantionul 2 și ajustarea lor

29Pe graficul din Figura 1.7 s-au reprezentat: dreapta de regresie a popula ției (în legend ă,
ymed. teoretic), valorile variabilelor y pentru cele dou ă eșantioane (în legend ă, y1 și y2), cele dou ă
drepte de regresie ale e șantioanelor (yt1 și yt2).
Ajustarea liniar ă a profitului în func ție de num ărul de angaja ți
507090110130150170190210230
0 50 100 150 200 250 300 350 400 450 500 550număr angajați (persoane)profit (mii euro )
ymed.teoretic y1 y2 yt1 yt2
Figura 1.7. Valorile empirice din e șantioane și ajustările lor
Legenda graficului arat ă aceeași marcatori pentru valorile em pirice observate ale profiturilor
medii lunare și marcatori diferi ți pentru fiecare din cele trei drepte de regresie.
Comparând ecua țiile de regresie ale celor dou ă eșantioane: i i x y ⋅+= 26.0 78.69 ˆ1,
i i x y ⋅+= 23.06.72 ˆ2 cu ecuația de regresie a popula ției: i i x xyE ⋅+= 25.0 86.66)/( , se observ ă că
estimatorii 1ˆa sunt apropia ți de valoarea 1a, din regresia popula ției.
Dacă s-ar alege un e șantion de volum mai mare, n=20, de exemplu, cele dou ă eșantioane
reunite într-unul singur, în Tabe lul 1.6, atunci noul model ob ținut este: i i x y ⋅+= 24.0 64.71 ˆ3, cu un
coeficient de corela ție r = 0.9566 și un coeficient de determina ție R2=0.9152.

xi yi 3ˆiy
50 60 84
50 83 84
50 92 84
100 107 96
100 110 96
150 105 108
200 120 120
200 125 120
200 120 120
250 125 132
300 152 144
300 155 144 300 136 144
350 135 156
350 153 156
400 156 168
400 170 168
450 170 180
500 204 192
500 202 192
50 60 84
71.643 3
0ˆa
0.239 3
1ˆa
0.956 0.915
rxy3 R2
Tabelul 1.6. E șantionul 3 și ajustarea prin estimatorii s ăi

Dreapta de regresie ob ținută pe baza datelor din e șantionul 3 și prezentat ă în Figura 1.8,
diferă de celelalte dou ă, anterior calculate; valorile te oretice sunt diferite, pentru c ă și valorile
estimate ale coeficien ților 3
0ași 3
1a sunt diferite.

Ajustarea profitului în func ție de num ărul de angaja ți – eșantionul 3
507090110130150170190210230
0 50 100 150 200 250 300 350 400 450 500 550
număr angajați (persoane)profit (mii euro )
ymed.teoretic y yt
Figura 1.8. Valorile empirice din e șantionul 3 și ajustarea lor

Modelul calculat pe baza datelor din e șantionul al doilea are un coeficient de determina ție
mai mare decât celelalte dou ă eșantioane. Acesta poate fi o variant ă mai bun ă, pentru estimarea
parametrilor ecua ției de regresie a popula ției, decât celelalte dou ă modele. Se poate afirma îns ă, că
fiecare din cele trei modele pr ezentate, este bun, datorit ă valorii mari a coeficientului de
determina ție, R2.

9. Exerci țiu – Calculul estimatorilor modelului de regresie simpl ă
Referitor la func ția dintre consum și venit, Keynes spune: “Legea psihologic ă
fundamental ă…este că oamenii sunt dispu și de regul ă și în medie, s ă își crească consumul pe
măsură ce le crește venitul, dar nu tot cu atât cu cât cre ște venitul”; aceasta este înclina ția marginal ă
spre consum, care este mai mare ca 0 și mai mic ă decât 1. De și Keynes nu specific ă forma
funcțională exactă a relației dintre consum și venit, pentru simplitate, se poate presupune c ă este
liniară.

31 Pentru exemplul numeric, va fi considerat un e șantion de 10 familii, dintr-o popula ția
ipotetică, pentru care se cunosc cheltuielile de consum și veniturile lunare, exprimate în € și
prezentat în Tabelul 1.7.
Se cer estima țiile coeficien ților 0ˆa și 1ˆa, dispersia reziduurilor, varian țele și erorile standard
ale estimatorilor, covarian ța lor, coeficientul de corela ție și coeficientul de determina ție.
Se recomand ă utilizarea formulelor prezentate mai sus și apoi pentru verificare, utilizarea
tabelei de regresie din Tools / Data Analysis / Regression .

Cheltuieli de
consum yi Venitul xi iyˆ
70 80 65.18
65 100 75.36
90 120 85.55
95 140 95.73
110 160 105.91
115 180 116.09
120 200 126.27
140 220 136.45
155 240 146.64
150 260 156.82
Tabelul 1.7. Analiza cheltuielilor în func ție de venituri

Valorile teoretice ob ținute, dup ă estimarea coeficien ților 0ˆa și 1ˆa, cu modelul:
i i x y 51.0 45.24ˆ += sunt prezentate în Tabelul 1.7.

10. Consecin țe ale ipotezelor: construirea testelor
Pe baza ipotezelor modelului liniar de regresie se pot construi:
– teste de verificare a semnifica ției estimatorului varian ței erorilor și intervalul de încredere al
estimatorului varian ței erorilor, ca fiind consecin țe ale ipotezei de nor malitate a erorilor;
– teste de verificare a semnifica ției estimatorilor 0ˆa și 1ˆa ai parametrilor 0a și 1a din ecuația de
regresie a popula ției, precum și intervalul lor de încredere, estimat cu o anumit ă probabilitate;
– testul Fisher de verificare a semnifica ției globale a regresiei.

3210.1. Exerci țiu – Rolul termenului aleator
Termenul εt din modelul regresiei simple: t t t xa a y ε++=1 0 (t=1,n – dacă modelul este
specificat în serie temporal ă) sintetizeaz ă ansamblul informa țiilor neexplicate de model,
multitudinea de al ți factori, în afara lui x, care sunt susceptibili de a explica pe y. Acest termen εt,
măsoară diferența între valorile reale observate ale lui y, și valorile care ar fi fost observate, dac ă
relația specificat ă ar fi fost riguros exact ă. Termenul aleator regrupeaz ă trei feluri de erori:
– o eroare de specific are, care se datoreaz ă faptului c ă o singur ă variabilă explicativ ă nu este
suficientă pentru a caracteriza fenomenul de explicat, în ansamblul s ău;
– o eroare de m ăsurare – datele nu reprezint ă exact fenomenul;
– o eroare de fluctua ție a eșantionării – de la un e șantion la altul, observ ările și estimatorii sunt u șor
diferiți.

Exercițiul folosește datele din Tabelul 1.8, care reprezint ă venitul mediu
lunar/locuitor, exprimat în dolari, pentru o țară, în perioada 1993-2002.

Anul Venit
1993
1994
1995 1996 1997 1998
1999
2000 2001 2002 8000
9000
9500 9500 9800
11000
12000
13000 15000 16000
Tabelul 1.8. Evolu ția venitului mediu lunar/locuitor ($)
Știind că înclinația marginal ă spre consum este 0.8 și consumul incompre sibil (sub care nu
se poate asigura un trai no rmal) este 1.000, se cere:
a) Să se calculeze consumul teor etic în perioada 1993 – 2002.
b) Considerând c ă erorile de observare urmeaz ă o lege normal ă de medie 0 și varianță 20000, să se
genereze un consum aleator.

33Consumul teoretic se calculeaz ă prin formula: t t x y 8.0 1000+= , unde xt este
venitul/locuitor, iar yt este consumul/locuitor. Generarea variabilei aleatoare se realizeaz ă cu un
generator de numere aleatoare, εt →N(0; 20000). Media și varianța acestor erori generate, sunt u șor
diferite de valorile teoretice: 19 fa ță de 0, respectiv, 10056, fa ță de 20000. Aceste diferen țe
reprezintă o consecin ță a extragerii unui e șantion de volum mic (zece observ ări).
Consumul observat se calculeaz ă adăugând la consumul teoretic, ob ținut cu modelul de
regresie a popula ției: yt=1000+0.8+ εt., erorile de observare, generate. Acesta este un demers invers,
pentru a pune în eviden ță rolul erorilor și distincția între ecua ția de regresie a popula ției și cea a
eșantionului. În realitate valorile observate con țin deja erorile.
Valorile observate sunt empirice, reale, și nu se pot ob ține invers prin ad ăgarea erorilor
(necunoscute, dealtfel) la valorile teoretice.
Generarea de numere aleatoare se poate realiza, de exemplu, cu o comand ă:
=(RAND()*100+RAND()*100)*(-1 )^(ROUND(RAND()*10,0).
Această formulă poate fi diferit ă, de cea prezentat ă (se poate înmul ți, de exemplu, rezultatul
generării prin func ția RAND(..), care este un num ăr subunitar pozitiv, cu 200, 500 sau 1000), care
conține înmul țirea cu (-1) ridicat la o putere ob ținută ca partea întreag ă a unui num ăr până la 10,
pentru a genera și erori negative. Formula odat ă scrisă pentru primul an 1993, se copiaz ă și pentru
restul anilor. Se vor ob ține rezultate diferite al e erorilor la fiecare nou ă operație pe spreadsheet. De
aceea, se recomand ă ca atunci când s-au generat ni ște erori, care s ă îndeplineasc ă condițiile pentru
medie și dispersie, aceste valori s ă se transforme cu Values , prin copiere în acela și bloc de celule, cu
Paste Special .
Rezultatele ob ținute de cei care lucreaz ă acest exerci țiu nu pot fi identice cu cele din Tabelul
1.9 (cu excep ția cazului când, se prefer ă să se lucreze cu erorile generate aici).
Calculele pentru întreb ările a) și b) sunt prezentate în Tabelul 1.9.
Tabela de regresie y=f(x), unde valorile x
t reprezintă veniturile observate, iar yt, consumurile
observate, furnizeaz ă estimațiile coeficien ților: 56 .971ˆ0=a și 804.0ˆ1=a , un coeficient de
corelație de 0.99893, care indic ă o intensitate puternic ă între consum și venit, precum și un
coeficient de determina ție de 0.9979, foarte apro piat de 1, care arat ă ca modelul liniar al venitului
este foarte bun pent ru explicarea varia ției consumului/locuitor.

34 (date conven ționale)
Anul Venitul xt tyˆ populație Erori et yt observat tyˆ regresie
1993 8000 7400 -103 7297 7405
1994 9000 8200 143 8343 8210
1995 9500 8600 -145 8455 8612
1996 9500 8600 72 8672 8612
1997 9800 8840 65 8905 8853
1998 11000 9800 131 9931 9818
1999 12000 10600 -91 10509 10622
2000 13000 11400 58 11458 11427
2001 15000 13000 64 13064 13035
2002 16000 13800 -2 13798 13839
media 19
dispersia 10056
Tabelul 1.9. Calculel e în ordine invers ă, prin generarea erorilor
Graficul din Figura 1.9 este de tip Scatter (X,Y) și prezintă corelația dintre venitul/locuitor și
consumul/locuitor. Consumul observat este sub forma unor puncte aflate de o parte și de alta a
dreptei de regresie:
t t x y 804.0 56.971ˆ += , după cum erorile au fost pozitive sau negative. Se
observă că estimatorii 0ˆa și 1ˆa, au valori apropiate de parame tri modelului de regresie a popula ției
0a și 1a.

Corelația dintre venitul și consumul pe locuitor
700080009000100001100012000130001400015000
7000 9000 11000 13000 15000 17000
venitul/locuitorconsumul/locuitor
y y teoretic
Figura 1.9. Corela ția dintre venitul și consumul mediu lunar, pe locuitor

35Evolutia in timp a consumului si venitului pe locuitor
600080001000012000140001600018000
1993 1994 1995 1996 1997 1998 1999 2000 2001 2002anii$/locuitor/any
x
yt-regr

Figura 1.10. Evolu ția consumului și venitului mediu lunar, pe locuitor în perioada 1993-2002
Graficul din Figura 1.10, de tip Line, fiind o cronogram ă, prezintă evoluția în timp a
consumului teoretic calculat cu ecua ția de regresie a e șantionului, a consumului observat și a
venitului care fiind cam de acela și ordin de m ărime și aceeași unitate de m ăsură se pot reprezenta
împreună pe acela și grafic. Evolu ția asemănătoare, în timp, a celor dou ă variabile: venitul și
consumul, arat ă existența unei leg ături puternice, între ele.
În exerci țiul prezentat, valorile adev ărate
0a și 1a, sunt perfect cunoscute: 10000=a , și
8.01=a . În realitate, aceste valori nu se cunosc; ci numai consumurile și veniturile medii,
observate pe locuitor în perioada celor 10 ani, adic ă coloanele: xt și yt.
Estimatorii coeficien ților 0ˆa și 1ˆa, sunt variabilele aleatoare, care urmeaz ă aceeași lege de
probabilitate ca și εt, pentru c ă sunt func ție de aceast ă variabilă aleatoare. Mediile și abaterile
standard ale acestor estimatori permit constr uirea testelor de validitate a modelului.

10.2. Testul de semnifica ție al estimatorilor
Ipoteza de normalitate a erorilor ) ;0(2
εσ ε Nt→ permite definirea legii de probabilitate a
estimatorilor. Estimatorul varian ței erorilor 2
εσ, notat: 2ˆεσ este egal cu: 2ˆ2
2
−=∑
ne
ii
εσ . Estimația
varianței estimatorului lui 1a este: ∑−=
iiaxx22
2
ˆ) (ˆˆ
1εσσ .

36Ipoteza de normalitate a erorilor implic ă: 22ˆ)2(
εε
σσ−n urmează o lege2χ cu n-2 grade de libertate.
1ˆ1 1ˆ
aaa
σ− și
0ˆ0 0ˆ
aa a
σ− urmează o lege normal ă centrată redusă N(0,1) .
2
ˆ2
ˆ
22ˆ)2(ˆ)2(
aan nσσ
σσ
εε−=− urmează o lege 2χ cu n-2 grade de libertate.
Rezultă că:
0ˆ0 0
ˆˆ
aa a
σ− urmează o lege Student cu n-2 grade de libertate;

1ˆ1 1
ˆˆ
aaa
σ− urmează o lege Student cu n-2 grade de libertate.
Testul de semnifica ție al estimatorilor și intervalele de încredere ale acestora apar ca fiind
consecințe ale ipotezei de normalitate a erorilor.

Utilizând datele din exerci țiul prezentat, se cere:
a) Înclina ția marginal ă spre consum este semnificativ diferit ă de 0?
b) Care este intervalul de încredere, la un nivel de semnifica ție de 95%, pentru înclina ția marginal ă
spre consum?
În cazul unui r ăspuns negativ la prima întrebare – coeficientul 1a nu este semnificativ diferit
de 0, variabila explicativ ă venitul anual/locuitor, nu va fi considerat ă ca fiind explicativ ă pentru
consum, pentru c ă are un coeficient de ponderare nul. Problema se rezolv ă pornind de la teoria
testelor, folosind urm ătoarele ipoteze:
– ipoteza nul ă H 0: 01=a
– ipoteza alternativ ă H 1: 01≠a
Dacă se respinge ipoteza nul ă H0, la un prag α fixat, atunci înclina ția marginal ă spre consum este
considerat ă, ca fiind semnificativ diferit ă de 0. Pragul de semnifica ție cel mai des utilizat este
α=0.05, adic ă un risc de a respinge H 0, în mod neîntemeiat, de 5%.
Sub ipoteza H 0, relația
1ˆ1 1
ˆˆ
aaa
σ− devine ∗==−
1
1 1ˆ
ˆ1
ˆ1
ˆˆ
ˆ0ˆ
a
a ata a
σσ, care urmeaz ă o lege Student cu n-2
grade de libertate și ∗
1ˆat se numește rație Student.
Distribuția de eșantionaj a estimatorului 1ˆa este, cea din Figura 1.11:

37
H 0 cu probabilitatea P=1- α

H
1 H1

α/ 2 α/2

I
∞− 025.02/
.. 2=
−−α
libgrdnt 1a 025.02/
.. 2=
−+α
libgrdnt ∞+

Figura 1.11. Distribu ția de eșantionare a estimatorului 1ˆa

Regula de decizie pentru un prag α=0.05 este urm ătoarea: dac ă 025.0
2 ˆ1−∗>n at t se respinge H 0; se
acceptă H1 )0 (1≠a . Coeficientul este semnificativ diferit de 0, variabila explicativ ă contribuie la
explicarea varia ției lui y.
Dacă 025.0
2 ˆ1−∗<n at t se accept ă H0 )0 (1=a , se respinge H 1. Coeficientul nu este semnificativ
diferit de 0, variabila explicativ ă nu contribuie la explicarea varia ției lui y.
Cu modelul t t t exa a y ++=1 0ˆ ˆ se pot estima valorile teoretice tyˆ, prin ecua ția de regresie:
t t xa a y1 0ˆ ˆ ˆ+= , concret: t t x y 804.0 56.971ˆ += .
Se pot calcula reziduurile t t t yy e ˆ−= , dispersia lor: 2)ˆ (
2ˆ2 2
2
−−
=−=∑∑
nyy
ne
ii i
ii
εσ .
Aplicând formulele, se pot ob ține: estima ția varian ței estimatorului 1ˆa:
∑−=
iixxaV22
1) (ˆ)ˆ(εσ, abaterea sa: )ˆ( ˆ1 ˆ1aVa=σ și rația Student
11
ˆ1
ˆˆˆ
aaatσ=∗.
Dispersia reziduurilor se poate ob ține și prin ridicarea la puterea a 2-a a valorii Standard
Error din tabela de regresie, care reprezint ă abaterea medie p ătratică a valorilor yt față de valorile
sale teoretice tyˆ. Rația Student este calculat ă și în tabela de regresie, care se poate vedea în Tabelul
1.10, partea referitoare la coeficien ți. Se compar ă valoarea calculat ă a rației Student cu cea
teoretică, din tabelele statistice ale func ției Student, pentru n-2 grade de libertate și un prag de
semnifica ție α/2.
Coeff. Standard
Error t Stat P-value Lower
95% Upper
95%
Intercept 971.556 152.54 6.37 0.000216 619.79 1323.32
X Variable 1 0.804 0.013 60.95 5.83E-12 0.774 0.835
Tabelul 1.10. Estimatorii regresiei liniare simple și intervalele lor de încredere

38Dacă se utilizeaz ă tabela de regresie nu mai este nevoie de compararea amintit ă, pentru ca
Excel-ul furnizeaz ă la P-value , valoarea pragului de semnifica ție α, care aici, este foarte mic ă,
aproape 0, deci probabilitatea P=1- α, de garantare a rezultatelor este de 100%.
306.2 95.600132.08042.0
ˆˆ025.0
8
ˆ1
ˆ
11=>===∗tat
aaσ.
Se respinge ipoteza nul ă, estimatorul coeficientului 1a este semnificativ diferit de 0, se accept ă
ipoteza H 1: 1a 0≠.
Și estimatorul 0ˆa este semnificativ diferit de 0. Valoarea ra ției Student este 6.369 > 2.306,
fapt indicat și de P-value care este de 0.0216%.

10.3. Intervalul de în credere al estimatorilor
Intervalul de încredere al parametrului 1aeste: 2/
2 ˆ 1 11ˆ ˆ ασ−⋅±=n at a aIC .
Fie
1ˆ1 1
ˆˆ
aaa
σ−2/

−=nt, unde
1ˆ1 1
ˆˆ
aaa
σ− urmează o lege Student cu n-2 grade de libertate. Pentru un nivel
de semnifica ție 0.95: 306.2 0132.0 804.0 1 ⋅±=aIC .
Intervalul de încredere este [0.77; 0.83]. În acest exerci țiu, se știe ca valoarea lui 1a este de 0.8,
deci este cuprins ă în interval. Exist ă un risc de 5% ca adev ăratul coeficient s ă se găsească în
exteriorul acestui interval. Se constat ă că acest interval nu cuprinde valo area 0, ceea ce este coerent
cu rezultatul diferen ței semnificative fa ță de 0 a coeficientului.
Intervalul de încredere pentru estimatorul 0ˆaeste de [619.8 , 1323.3]. În acest exerci țiu,
valoarea parametrului 0a este 1000, și este cuprins ă în intervalul de încredere.

10.4. Tabelul de analiz ă a varian ței – testul Fisher
Tabelul de analiz ă a varianței din tabela de regresie este prezentat în Tabelul 1.11.
Testul empiric *Fde analiză a varianței este:
068. 37158/367. 111691/7. 41494953
)2 /(1/*= =−=n SCRSCEF , unde
*F urmează o l e g e F i s h e r c u 1 și 8 grade de libertate. Pentru α=5%, valoarea teoretic ă este
32.505.0
8 1=siF .

39ANOVA df SS MS F Significance F
Regression 1 41494954 4149495 3.7 3715.068 5.83E-12
Residual 8 89354.94 11169.3673
Total 9 41584309
Tabelul 1.11. tabelul ANOVA pentru regresia liniar ă simplă
Testul Fisher în func ție de coeficientul de determina ție, R
2, este:
37150002686.09978.0
)2 10/() 9978.01(9978.0
)2 /() 1(22
*= =− −=−−=n RRF .
Cum 32.505.0
8.1*=>F F , se accept ă ipoteza H 1, varianța explicat ă diferă semnificativ de cea a
reziduurilor, deci coeficient ul variabilei explicative, 1ˆa, este semnificativ, regresia este global
semnificativ ă.
La regresia simpl ă: 068. 3715 ) 95135.60( )(2 2
ˆ1= ==∗∗
at F , pentru c ă semnifica ția global ă a
regresiei se rezum ă la verificarea semnifica ției coeficientului 1ˆa.

11. Intervalul de încredere al prev iziunii cu modelul regresiei simple
După estimarea coeficien ților modelului de regresie simpl ă, se poate trece la calculul unei
previziuni pentru un or izont de previziune h.
Pentru perioada t=1,2,…,n, fie modelul estimat t t t exa a y ++=1 0ˆ ˆ . Dacă valoarea variabilei
explicative xt este cunoscut ă la momentul n+1(x n+1), previziunea este dat ă de: 1 1 0 1 ˆ ˆ ˆ+ ++=n n xa a y .
Eroarea de previziune este: 1 1 1 ˆ+ + +−=n n n y y e și se poate scrie:
1 1 1 1 0 0 1 1 0 1 1 1 0 1 )ˆ ()ˆ () ˆ ˆ() (+ + + + + + +−+−=+−++=n n n n n n xaa a a xa a xa a e ε ε .
Făcând apel la ipotezele modelului 0 )(1=+neE și 0 ) (=+hneE . O previziune nedeplasat ă se
obține prin aplicarea direct ă a modelului de regresie estimat. În practic ă, cunoașterea unei
previziuni este pu țin utilă, dacă nu se știe gradul de încredere care s ă i se acorde.
Se calculeaz ă varianța erorii de previziune care perm ite determinarea unui interval de
încredere pentru previziune.
Abaterea medie p ătratică a erorii de previziune este: 1
) () ( 1ˆ ˆ
122
1
1ˆ +
−−+=

=+
+ n
ttn
ny
xxx x
nεσσ .

40În această formulă, varianța erorii de previziune este func ție de abaterea medie p ătratică
între variabila exogen ă prevăzută și media aceleia și variabile: cu cât acest ă valoare prev ăzută se
abate mai mult de la media sa, cu atât riscul erorii este mai important. Totodat ă se observ ă că
varianța erorii de previziune este o func ție inversă a variabilit ății seriei explicative. Ipoteza de
normalitate a erorilor, εt, permite determinarea intervalului cu o încredere P=1- α:
Fie raportul 2
122
11 1 1 0
122
11 1
1
) () ( 1ˆˆ ˆ
1
) () ( 1ˆˆ

=++ +
=++ + ∗→
+
−−+−+=
+
−−+−=
∑ ∑n
n
ttnn n
n
ttnn nt
xxx x
ny xa a
xxx x
ny yt
ε ε σ σ (care urmeaz ă o lege
Student cu n-2 grade de libertate). Rezult ă intervalul de încredere IC al variabilei y la n+1:
1) () ( 1ˆ ˆ22
1 2/
2 1 1 +−−+⋅±=∑+
−+ +
ttn
n n nxxx x
nt y ICyεασ
Caz particular:
Când se utilizeaz ă modelul regresiei simple pentru o serie cronologic ă, se calculeaz ă dreapta de
tendință după modelul specificat astfel:
t t eta a T ++=1 0ˆ ˆ pentru t=1,2,…,n.
Pentru a calcula previziunea pentru orizontul h, se înlocuie ște valoarea variabilei t cu n+h pentru
extrapolare:t t ehna a T +++= ) (ˆ ˆ1 0 , iar intervalul de încredere se g ăsește pe două brațe de hiperbol ă:
2) ( thn−+ , ilustrate în grafic ul din Figura 1.12:

Figura 1.12. Intervalul de încredere pent ru previziunea prin extrapolarea tendin ței

11.1. Exerci țiu – Previziuni ale variabilei endogene
Tabelul 1.12 con ține cheltuielile de consum medii lunare/locuitor, yt și venitul mediu
lunar/locuitor, xt, exprimat în $, pentru țara A, în perioada 1993-2002.

41 (date conven ționale)
Anul Venitul xt Consumul yt
1993 8000 7410
1994 9000 8267
1995 9500 8664
1996 9500 8645
1997 9800 8921
1998 11000 9766
1999 12000 10645
2000 13000 11425
2001 15000 12963
2002 16000 13714
media 11280
Tabelul 1.12. Venitul și consumul mediu lunar/locuitor
Pentru aceste date, modelul consum – venit estimat este:
t t t ex y ++ = 785.0 45. 1186
(20.97) (160.4) (.) = rația t Student ; n = 10 .
1) Să se calculeze coeficientul de determina ție și să se efectueze testul Fisher, prin care se
determină dacă regresia este global semnificativ ă.
2) Care este consecin ța asupra consumului a unei cre șteri de 8% a venitului?
3) În 2003 și 2004 se prev ăd venituri de 16800$ și 17000$ venit/locuitor. S ă se determine
previziunea consumului pentru cei doi ani, și intervalele de încredere cu o probabilitate de 95%.
Soluție:
1) Pentru a calcula coeficientul de determina ție se utilizeaz ă relațiile testului Fisher empiric,
prezentate în paragraful 1.7. Se utilizeaz ă formulele din paragraful 1.5, în Tabelul 1.13.
Se calculeaz ă dispersia reziduurilor, apoi ab aterea reziduurilor, care se reg ăsește în prima
parte a tabelei de regresie, la Standard Error. Dispersia rezi duurilor se utilizeaz ă în formulele de
calcul ale varian țelor estimatorilor. Abaterile es timatorilor, calculate cu func ția =SQRT(), se
regăsesc în partea a treia a tabelei de regresie; ra ția Student pentru estimatorul 1ˆa se calculeaz ă
raportând estimatorul la abaterea sa și se afl ă în coloana t-Stat .
77 25730 41602 2
1. ). ()t( F*
aˆ*= == , unde *t, este testul Student em piric al estimatorului 1ˆa.
În Tabelul 1.13 s-au calculat valorile: SSR (Sum Squares of Residues)
∑ ∑
= ==−=n
ttn
tt t e yy SSR
12
12)ˆ ( ; SSE (Sum Squares Explained) ∑
=−=n
ttyy SSE
12) ˆ( ; SST (Sum
Squares Total) ∑
=−=n
ttyy SST
12) (.
Se verific ă relația dintre aceste sume: SSE SSR SST += . Testul Fisher se poate calcula ca raport
între dou ă dispersii corectate cu gradele de libertate, întotdeauna cea explicat ă raportată la cea

42reziduală: )2 /(1/
−=n SSRSSEF . Valorile sumelor se reg ăsesc în tabelul ANOVA, unde valoarea foarte
mică a pragului de semnifica ție Significance F arată o probabilitate de 100% de garantare a
semnifica ției globale a regresiei liniare. Acela și rezultat se ob ține și cu formula:
)2 /() 1(22
*
−−=n RRF , 99967.02 2==r R . Se calculeaz ă și 35.5 77. 2573005.0
.. 8. si 1*= > =libgrdF F ,
arată că regresia și implicit variabila explicativ ă (singura) este semnificativ ă. Se observ ă că valoarea
Fisher calculat ă după oricare din formule, este aceea și și este egal ă cu cea furnizat ă de tabela de
regresie. De asemenea se mai poate verifi ca valoarea coeficient ului de determina ție: SSTSSER=2 sau
2 21 1 NSSTSSRR −=−= , unde N2 este coeficientul de nedetermina ție.
Anul Venitul xt Consum yt yteoretic 2) ( xxt− 2)ˆ (t ty y− 2) ˆ( y yt− 2) ( yyt−
1993 8000 7410 7467 10758400 3247.1 6630711.4 6927424
1994 9000 8267 8252 5198400 223.5 3203923.4 3150625
1995 9500 8664 8645 3168400 377.0 1952776.1 1898884
1996 9500 8645 8645 3168400 0.2 1952776.1 1951609
1997 9800 8921 8880 2190400 1672.6 1350006.5 1256641
1998 11000 9766 9822 78400 3156.4 48320.175 76176
1999 12000 10645 10607 518400 1425.2 319504.83 363609
2000 13000 11425 11392 2958400 1068.4 1823347 1912689
2001 15000 12963 12962 13838400 0.3 8529004 8532241
2002 16000 13714 13748 22278400 1123.1 13730819 13483584
2003 16800 14376
2004 17000 14533
medii 11280 10042 SSR SSE SST
sume până în
2002 până în
2002 64156000 12293.8 39541188 39553482
disp. rezid 1536.73 SSR+SSE 39553482
SUMMARY OUTPUT abatere.rez. 39.20
Regression Statistics )ˆvar(0a 3201.41
Multiple R 0.9998 )ˆ( abat.0a 56.58
R Square 0.9997 )ˆvar(1a 2.39E-05
Adj. R Sq. 0.9997 )ˆ( abat.1a 0.00489
Std. Err 39.20 Rațiat)ˆ(1a 160.408
Obs. 10 Fisher 25730.775
ANOVA df SS MS F Signific.F
Regression 1 39541188 39541188 25730.775 2.5522E-15
Residual 8 12293.82 1536.727
Total 9 39553482
Coeff. Std. Error t Stat P-value Lower 95% Upper95%
Intercept 1186.45 56.581 20.969 0.000 1055.978 1316.931
XVariable1 0.785 0.00489 160.408 0.000 0.774 0.796
Tabelul 1.13. Calculele și tabela de regresie

2) Creșterea cu 8% a venitului duce la o cre ștere mai mic ă a consumului, și anume de 6.28%.

43t t xa y∆∆1ˆ= ; 0628 .0 08.0 785.0 785.0 =⋅=∆=∆t t x y
3) Cunoscându-se valorile veniturilor, previz iunile cheltuielilor de consum în anii 2003 și 2004, se
calculează ca previziuni punctuale, utilizând modelul estimat:
14376 16800 785.0 45. 1186 787.0 45. 1186 ˆ2003 2003 =×+ = + = x y
14533 17000 785.0 45. 1186 787.0 45. 1186 ˆ2004 2004 =×+ = + = x y
Se pot calcula intervalele de încreder e, pentru previziunile celor doi ani:
1) () (1ˆ ˆ22
2003 2/
2 2003 2003 +−−+⋅±=∑−
ttnxxx x
nt y ICyεασ ; 1) () (1ˆ ˆ22
2004 2/
2 2004 2004 +−−+⋅±=∑−
ttnxxx x
nt y ICyεασ
Se cunosc informa țiile:
n=10 ;2 .39=εσ , ∑ =−
ttxx 64156000 ) (2, 11280=x , 306 .22/
2=−α
nt .
Pentru anul 2003: 168002003= x ; 2 .49 306.2 143762003 ⋅±= ICy ;
IC2003 = [14262 , 14489]. Previziunea are o șansă de 95%, s ă se afle în interiorul intervalului.
Pentru 2004: 170002003= x ; 74 .49 306.2 145332004 ⋅±= ICy ;
IC2004 = [14418 , 14647], cu o probabilitate de 95%.

12. Exerci țiu – Compararea coeficien ților de regresie
(Problem ă preluată și adaptată din „Econometrie”, Regis Bourbonais, Ed. Dunod, Paris, 1993)
Un economist specialist în management ul resurselor umane se intereseaz ă de legătura
dintre salariu și durata studiilor. El dispune de un e șantion de 40 de b ărbați și 25 de femei, având
aceeași vârstă și cărora le înregistreaz ă salariul pe un an (yi) exprimat în milioane lei și numărul de
studii (xi), exprimat în ani de studiu .
Estima țiile sunt urm ătoarele:
Pentru bărbați:
i i i ex y ++= 8.180.112 , i =1,2,…,40 n i=40, R2=0.42
(9.3) (5.2)
Pentru femei:
i i i ex y ++= 7.0 20.87 , i =1,2,…,25 , n2=25, R2=0.22
(12.8) (2.5)
(·) rația Student
1) Este semnificativ ă durata studiilor asupra salariului?
2) Știind că salariul mediu al b ărbaților este 6.9 milioane lei și cel al femeilor este 5.8 milioane lei,
să se stabileasc ă dacă există diferență semnificativ ă între salariul b ărbaților și cel al femeilor?

44Soluție:
1) Se analizeaz ă fie rațiile Student, fie coeficientul de determina ție.
Rația Student pentru variab ila “anii de studiu” este:
– pentru b ărbați: 05.0
38*2.5 t tB>= , 96.105.0
lib. grd. 38240 ==
=−αt
– pentru femei: 05.0
23*5.2 t tF>= , 06.205.0
lib. grd. 23225 ==
=−αt
Cei doi coeficien ți sunt semnificativi diferi ți de 0. Se observ ă că pentru femei, coeficientul
de ponderare a anilor de studii este mai mic și mai puțin semnificativ ca cel pentru b ărbați. Testul
Fisher conduce la acelea și rezultate.
2) Problema se rezum ă la un test de diferen ță a mediilor variabilelor aleatoare normale
independente și a varianțelor inegale. În acest caz se testeaz ă diferența dintre coeficien ții 1ˆa ai celor
două regresii (valorile1.8, respectiv 0.7). Cunoscând ra țiile Student, std. abatereal estimatorut=∗ și
estimatorii se pot ob ține abaterile lor tip (abaterile standard): 346.0=Bσ și 28.0=Fσ .
Ipoteza nul ă și cea alternativ ă ale unui test bilateral, sunt:
; :0 F Ba a H= 0 :0 =−=F Ba ad H
; :1 F Ba a H≠ 0 :1 ≠−=F Ba ad H
Raportul:
F BaaF B F B a a a a
ˆˆˆ) ()ˆ ˆ(
−−−−
σ urmează o lege Student cu 32 1−+nn grade de libertate.
Sub ipoteza nul ă F Ba a H=:0 și cu 2
ˆ2
ˆ2
ˆ ˆ ˆ ˆ
B F a a dσσσ+= , raportul se scrie:
96.1 49.2
28.0 34.0)7.08.1(
ˆˆ
05.0
622 2ˆ*=>=
+−== tdt
dσ.
Se respinge ipoteza nul ă. Există o diferen ță semnificativ ă între coeficien ții de regresie:
durata studiilor la femei are un impact ma i mic asupra salariului, decât în cazul b ărbaților.

Rezumat:
Aceast capitol prezint ă modelul regresiei multiple, ipoteze de lucru, estimarea coeficien ților
modelului, intervalele lor de încredere, testarea validit ății lor și a regresiei, previziunea cu modelul
regresiei simple.
Exemplele ofer ă explicații pentru în țelegerea obiectivelor capitolului.

45Termeni importan ți:
Model de regresie simpl ă, estimatori, parametri, propriet ările estimatorilor, reziduuri, erori,
ipotezele modelului de regresie, testul F, ANOVA, testul t, tabela de regresie

Întrebări recapitulative
1. Enumerați ipotezele modelului de regresie
2. Stabiliți diferența între modelul de regresie al popula ției și modelul de regresie al
eșantioanelor
3. Ce este liniaritatea?
4. Care sunt propriet ățile estimatoruilor modelului de regresie?
5. Reprezenta ți tabelul de analiz ă a varianței ANOVA si testul F pe ntru regresia simpl ă.
6. La ce se refer ă testul t Student?
7. Cum aprecia ți validitatea unui model?

Teme de cas ă
Parcurgeți exemplele din curs util izând calculatorul; realiza ți graficele și tabela de regresie.

46CAPITOLUL 2
Tema MODELUL REGRESIEI SIMPLE
Obiectivele 1. Modelul liniar general
2. Estimarea coeficien ților de regresie
3. Ipotezele și proprietățile estimatorilor
4. Analiza varian ței și calitatea ajust ării
5. Exercițiu – Modelul regresiei liniare multiple
5.1. Analiza grafic ă a evoluției în timp a variabilelor considerate
5.2. Analiza grafic ă a influen ței variabilelor explicativ e asupra variabilei
dependente y 5.3. Construirea modelului econometric 6. Teste statistice și analiza varian ței
6.1. Construirea te stelor statistice
6.1.1. Compararea unui parametru a
i cu o valoare fixat ă a
6.2. Execi țiu – Teste asupra coeficien ților
6.3. Analiza varian ței – testul Fisher de semnifica ție globală a regresiei
6.4. Teste pornind de la analiza varian ței modelului liniar
6.4.1. Introducerea uneia sau mai mu ltor variabile explicative în model
6.4.2. Verificarea stabilit ății în timp a modelului – testul CHOW
6.5. Exerci țiu – Teste pornind de la analiza varian ței
7. Previziuni folosind modelul regresiei multiple 7.1. Exerci țiu – Previziuni folosind modelul regresiei multiple
Finalitatea –
Competen țe
dobândite 1. Estimarea coeficien ților modelului de regresie multipl ă
2. Obținerea automat ă a tabelei de regresie multipl ă; conținutul tabelei
de regresie multipl ă
3. Analiza grafic ă a corelațiilor între variabile
4. Realizarea de previziuni cu modelul regresiei multiple
Mijloace
– citire/înv ățare
– întreb ări, probleme ce apar, explica ții
– definiții, explica ții ce trebuie re ținute
– situații economice concrete, supuse analizei, exemple (sub lup ă)
– teme de cas ă, aplicații practice pentru studen ți
Evaluarea – parcurgerea aplica țiilor propuse
Timp de lucru
necesar 1. Pentru cunoa șterea problemei: 6 ore
2. Pentru rezolvarea temelor: 12 ore + timpul de documentare

47MODELUL REGRESIEI MULTIPLE

În realitate sunt rare feno menele, care depind de o singur ă variabilă explicativ ă. Regresia
multiplă analizeaz ă legătura dintre o variabil ă explicată y și mai multe variabile explicative x1, x2,
…, x k, unde k > 2 .

1. Modelul liniar general
Modelul liniar general este o generalizare a regresie i simple, în care apar mai multe
variabile explicative. Pentru serii temporale, t = 1,2, …n , modelul este:
t ktk t t t xa xa xa a y ε+++++= …22 11 0 , unde:
yt = variabila de explicat la timpul t;
x1t = variabila explicativ ă 1 la timpul t;
x2t = variabila explicativ ă 2 la timpul t;
… x
kt = variabila explicativ ă k la timpul t;
ka aa ,…,,1 0 = parametri modelului;
tε = eroarea de specificare, necunoscut ă (diferența dintre modelul adev ărat și cel specificat);
n = numărul de observ ări.
Modelul prezentat se poate sc rie sub forma unui sistem cu n ecuații:
1 1 212 111 0 1 … ε+++++=kkxa xa xa a y
2 2 222 121 0 2 … ε+++++=kkxa xa xa a y

t ktk t t t xa xa xa a y ε+++++= …22 11 0

n knk n n n xa xa xa a y ε+++++= …22 11 0
sau sub form ă matriceal ă:
ε +⋅= a X Y , de dimensiunile
(n,1)=(n,k+1)(k+1,1)+(n,1)
Prima coloan ă a matricii X, compus ă numai din valorile 1, corespunde parametrului 0a,
termenul constant al c ărui coeficient este 1. Dimensiunea matricii X este de n linii și k+1 coloane.

48⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=
nt
yyyy
Y
……21
;
⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=
kn n nkt t tkk
x x xx x xx x xx x x
X
… 1… … … ……… 1… … … ……… 1… 1
2 12 12 22 121 21 11
;
⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=
kaaaa
a
……210
;
⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=
nt
εεεε
ε
……21
.

2. Estimarea coeficien ților de regresie
Modelului scris sub form ă matriceal ă ε+⋅= aXY cu n observări și k variabile explicative,
se aplică metoda celor mai mici p ătrate, care cost ă în minimizarea sumei S:
)S min()XaXaYXa YYin(m)XaXa YXa XaYYY min()XaY()XaY min( min minn
it
=′′+′′−′=′′+′′−′−′==−′−=′=∑
=
212εεε
Pentru minimizarea sumei S se deriveaz ă în raport cu vectorul a și derivata par țială se
egalează cu 0: 0ˆ 2 2 =′+′−=∂∂aXX YXaS; YXaXX′=′ˆ ;
YX XX a ′′=−1) (ˆ . ( 1 )
Ecua țiile YXaXX′=′ˆ se numesc ecuații normale . Sistemul de ecua ții normale scris
matriceal este de forma:
⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜
⎝⎛
∑ ∑∑∑∑∑∑∑∑∑∑∑∑∑∑
2
2 122
2 12 21 212
1 12 1
…… … … … …………
kt t kt t kt ktktt t tt tktt t t t tkt t t
x xx xx xxx x xx xxx xx x xx x x n
.
⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
kaaaa
ˆ……ˆˆˆ
210
=
⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜
⎝⎛
∑∑∑∑
t ktttttt
yxyxyxy
…21

sau altfel:
∑ ∑∑ ∑= ++ + +t kt k t t y x a x a x a an ˆ… ˆ ˆ ˆ2 2 1 1 0
∑ ∑ ∑ ∑∑ = ++ + +tt ktt k t t t t yx xx a xx a x a x a1 1 21 22
1 1 1 0 ˆ… ˆ ˆ ˆ
∑ ∑∑ ∑ ∑ = ++ + +tt ktt k t tt t yx xx a x a xx a x a2 22
2 2 12 1 2 0 ˆ … ˆ ˆ ˆ
………………………………………………………………………………………………………………. …………………….
∑ ∑ ∑ ∑∑ = ++ + +t kt kt k t kt t kt kt yx x a xx a xx a x a ˆ… ˆ ˆ ˆ2
2 2 1 1 0

Modelul estimat poate fi scris astfel: ktk t t t xa xa xa a y ˆ… ˆ ˆ ˆ ˆ22 11 0 ++++= ,
iar variabila observat ă, în funcție de model: t ktk t t t e xa xa xa a y +++++= ˆ… ˆ ˆ ˆ22 11 0 .

49Estimatorii parametrilor ka aa ,…,,1 0 , modelului popula ției generale, se ob țin pe baza datelor
unui eșantion. Valorile et sunt reziduurile, abateri între valorile observate al e variabilei de explicat
și valorile sale teoretice, es timate, ajustate. Se face distin ție între eroarea de specificare tε și
reziduurile et.
Dacă se consider ă valorile centrate (fa ță de media lor), vectorul a al estimatorilor se poate scrie:
⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜
⎝⎛
⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜
⎝⎛
=
⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
), cov(…), cov(), cov(), cov(
) var( …), cov(), cov(), cov(… … … … …), cov(… ) var( ), cov(), cov(), cov(…), cov( ) var( ), cov(), cov(…), cov(), cov( ) var(
ˆ……ˆˆˆ
321
3 2 13 3 2 3 1 32 3 2 2 1 21 3 1 2 1 1
321
yxyxyxyx
x xx xx xxxx x xx xxxx xx x xxxx xx xx x
aaaa
k k k k kkkk
k
Estimatorul 0ˆa se obține prin rela ția: kkxa xaxay a ˆ… ˆ ˆ ˆ22 11 0 −−−−=
Efectul varia ției unei singure variabile e xplicative asupra varia ției variabilei explicate y,
cunoscând modelul ktk t t t xa xa xa a y ˆ… ˆ ˆ ˆ ˆ22 11 0 ++++= și noua stare a variabilei explicative, x2, de
exemplu, modificat ă în (t t x x2 2∆+ ), iar toate celelalte k-1 variabile r ămânând neschimbate, se
măsoară prin txa2 2ˆ∆, care reprezint ă modificarea în medie a variabilei explicate y.

3. Ipotezele și propriet ățile estimatorilor
Se formuleaz ă următoarele ipoteze de natur ă stochastic ă și structural ă, în legătură cu
modelul liniar în variabilele explicative, kx xx ,….,,2 1 :
a) ipoteze stochastice
1. valorile xit, i=1,k sunt observate f ără erori,
2. 0)(=tEε , speranța matematic ă a erorilor este nul ă,
3. 2 2)(σε=tE ,varianța erorilor este constant ă pentru orice t=1,n – numit ă și ipoteza de
homoscedascticitate,
4. 0) (=′ttEεε , dacă tt′≠, erorile sunt necorelate (independen ța erorilor),
5. 0), cov( =t itxε , erorile sunt independente de vari abilele explicative, pentru orice i=1,k ;
b) ipoteze structurale
1. absența multicoliniarit ății între variabilele exp licative, aceasta implic ă faptul că matricea ) (XX′
este regulat ă și există inversa 1) (−′XX ,

502. nXX /) (′ tinde către o matrice finit ă nesingular ă,
3. n > k+1 , numărul de observ ări trebuie s ă fie mai mare decât num ărul variabilelor explicative
(când n=k+1 , atunci sistemul este cu n ecuații și n necunoscute, perfect determinat).
Estimatorii ka aa ˆ,…,ˆ,ˆ1 0 au propriet ățile ca și estimatorii regresiei simple: liniari, nedeplasa ți
și eficienți.
Modelul regresiei multiple se poate scrie în urm ătoarele moduri:
ε+=XaY
eaXY+=ˆ de unde reziduurile sunt: YYaXYe ˆ ˆ−=−= (2)
aXY ˆ ˆ=
Pentru a ar ăta că estimatorii sunt nedeplasa ți este suficient s ă se demonstreze c ă a aE=)ˆ(.
Folosind formula de calcul a estimatorilor (1) și ecuațiile unui model liniar multiplu
prezentate se ob ține:
εε ε
X)XX(a X)XX()Xa(X)XX() Xa(X)XX(YX)XX(aˆ
′′+=′′+′′=+′′=′′=
−− − − −
11 1 1 1
(3)
atunci: a EX XX a aE =′′+=−)( ) ( )ˆ(1ε ,
pentru că prin ipotez ă 0 )(=tEε . Estimatorii metodei celor mai mici p ătrate sunt nedeplasa ți pentru
că a aE=)ˆ( .
Matricea de varian ță-covarian ță a estimatorilor , notată cu aˆΩ este util ă pentru c ă va
conține varian țele, pe baza c ărora se calculeaz ă abaterile lor standard, respectiv covarian țele
coeficienților de regresie: ] )ˆ)(ˆ[(ˆ ′−−=Ω aaaaEa
Din ecuația (3): εX XX aa ′′=−−1) ( ˆ și 1) ( )ˆ(−′′=′− XXX aaε , (4)
pentru că 1) (−′XX este simetric ă și ()1 1) ( ) (− −′=′′ XX XX .
Din rela țiile (4) rezult ă: 1 1) ( ) ()ˆ)(ˆ(− −′′′′=′−− XXX X XX aaaa εε , iar matricea de varian ță-
covarianță a estimatorilor, devine:
1 1
ˆ ) ()( ) (])ˆ)(ˆ[(− −′′′′=′−−=Ω XXX EX XX aaaaEa εε .
Matricea )(εε′ E este matricea de varian ță-covarian ță a erorilor ε:
I
E E EE E EE E E
E
nn n nnn
2
222
2 12 22 121 21 11
…0 0……… …0 … 00 …0
) ( …) ( ) (… … … …) ( …) ( ) () ( …) ( ) (
)(ε
εεε
ε σ
σσσ
εε εεεεεε εεεεεε εεεε
εε =
⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜
⎝⎛
=
⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜
⎝⎛
=′=Ω . Atunci matricea de
varianță-covarian ță a estimatorilor, este: 1 2 1 1 2
ˆ ) ( ) ( ) (− − −′=′′′=Ω XX XXXX XXa ε ε σ σ .

51Dispersia erorilor se poate estima nedeplasat prin dispersia reziduurilor: 1ˆ2
−−′=knee
eσ .
Se înlocuie ște varianța erorilor prin estimatorul s ău și se obține o estima ție a matricii de
varianță-covarian ță a estimatorilor: 1 2
ˆ ) (ˆ ˆ−′=Ω XXaεσ .
Când num ărul observ ărilor tinde spre + ∞, varianța reziduurilor tinde spre 0, se spune c ă
estimatorul aˆ este convergent, de varian ță minimă.

4. Analiza varian ței și calitatea ajust ării
Ecuația fundamental ă a analizei varian ței este cea a descompunerii varian ței totale (SST) în
suma varian ței explicate de modelu l de regresie (SSE) și varianța rezidual ă (SSR), neexplicat ă,
datorată factorilor întâmpl ători, neînregistra ți.
∑∑∑
= = =−+−=−n
tt tn
ttn
tt yy yy yy
12
12
12)ˆ ( ) ˆ( ) (
SST = SSE + SSR
Calitatea ajust ării se apreciaz ă cu indicatorul coeficientul de determina ție, R2, care se
calculează ca raport între varian ța explicat ă de model și varianța totală a variabilei dependente y,
arătând ponderea varian ței explicate.
Ponderea varian ței neexplicate se m ăsoară cu indicatorul coeficientul de nedetermina ție N2,
fiind raportul varian ței reziduale în totalul varian ței variabilei dependente
y.
∑∑
∑∑
∑∑
==
==
==
−−=
−−
−=−=
−−
=n
ttn
tt
n
ttn
tt t
n
ttn
tt
yye
yyyy
N
yyyy
R
1212
1212
2
1212
2
) (1
) ()ˆ (
1 1
) () ˆ(
.
5. Exerci țiu – Modelul regresiei liniare multiple
Despre o filial ă a firmei Coca-Cola, din România, se cunosc date referitoare la:
– marfa livrat ă lunar , măsurată în unități fizice exprimate în num ăr de pet-uri de 2l (în cazul livr ării
în alt ambalaj, se transform ă în echivalent-pet de 2l);
– consumul mediu l unar de combustibil , exprimat în €, necesar livr ării produselor;
– valoarea daune/pierderi materiale lunare , măsurată în €;
– pondere m ărfii returnate , măsurat ca procent din total marf ă livrată lunar (maxim 2%);
– capacitatea de înc ărcare auto , se referă la capacitatea de utilizare eficient ă a parcului auto, se
măsoară în număr de unități fizice (pet-uri 2l) înc ărcate într-un camion.

52- fondul mediu net de salarii, al pe rsonalului din departamentul „Distribu ție” măsurat în €.
Variația salariilor este mai mare în peri oadele în care consumul este mare, și necesitatea unei
distribuții mai rapide a produselor, condu ce la apelarea la colaboratori externi. În perioadele de
consum redus și mediu, indicatorul reprezint ă retribuțiile personalului de baz ă.
– Indicele Pre țurilor de Consum (IPC) , față de aceeași lună din anului an terior, în %.
Datele colectate sunt prezentate în Tabelul 2.1.
Se cere s ă se construiasc ă un model econometric pentru analiza și previziunea distribu ției
lunare de b ăuturi răcoritoare. Variabilele semnificative explic ă evoluția și variația mărfii livrate.
Analiza influen ței factorilor începe prin analiza grafic ă a evolu ției variabilelor și a
corelațiilor dintre fiecare variabil ă factorială și variabila explicat ă, y, marfa livrat ă lunar .
Consumul mediu lunar de combustibil – x 1, valoarea daunelor lunare – x 2, pondere marfa
returnată – x 3, capacitatea de înc ărcare auto – x 4, salariile nete medii ale personalului – x 5, și
Indicele Pre țurilor de Consum (IPC) – x 6, reprezint ă variabilele explicative.

Luna
total
distrib.
(nr. pet) consum
comb.
(€) pierderi
materiale
(€) retur
mf.
(%) capacit.
încarc.
(nr. pet) fond
salarii
(€) IPC
(%)
y t x 1 x 2 x 3 x 4 x 5 x 6
Nov-99 131.750 1.523 124 1,510 530 1.887 153.7
Dec-99 225.245 2.525 236 1,532 550 1.965 154.8
Ian-00 76.316 1.114 124 1,480 400 1.942 156.8
Feb-00 104.875 1.369 147 1,500 400 1.958 155.7
Mar-00 159.366 1.945 165 1,580 420 1.913 149
Apr-00 160.124 1.865 167 1,600 430 1.877 148.9
Mai-00 168.745 1.647 172 1,630 480 1.876 144
Iun-00 240.814 2.444 258 1,650 500 1.925 140.9
Iul-00 213.702 2.268 240 1,640 490 1.899 144.5
Aug-00 207.965 2.097 225 1,635 470 1.881 145.4
Sep-00 181.546 1.952 182 1,580 450 1.905 144.9
Oct-00 117.786 1.464 123 1,490 430 1.911 142.9
Nov-01 133.079 1.884 178 1,510 560 2.021 141.3
Dec-01 226.416 2.927 245 1,536 580 2.120 140.7
Ian-01 78.116 1.580 110 1,485 450 1.932 139.9
Feb-01 106.994 1.884 117 1,487 450 2.025 140
Mar-01 161.203 2.355 185 1,530 470 2.030 140.3
Apr-01 164.045 2.208 206 1,550 480 2.050 137.5
Mai-01 170.614 1.999 217 1,620 520 2.057 137.4
Iun-01 243.398 2.630 260 1,640 550 2.070 135.7
Iul-01 214.011 2.325 233 1,638 550 2.012 131.8
Aug-01 208.844 2.545 206 1,636 510 2.043 132.4
Sep-01 183.939 2.355 183 1,580 490 2.050 131.2
Oct-01 118.968 1.884 165 1,550 480 2.069 130.8
Tabelul 2.1. Indicatorii observa ți în perioada nov.99-dec.01, la firma Coca Cola

535.1. Analiza grafic ă a evoluției în timp a variabilelor considerate

În graficul din Fi gura 2.1 se prezint ă evoluția în timp a livr ărilor lunare de marf ă,
exprimată în unități fizice. Se observ ă o sezonalitate lunar ă, deși datele sunt complete numai pe doi
ani. Pe grafic se identific ă anul de afaceri al firmei Co ca Cola care începe din noiembrie și se
termină în octombrie, fiind doi ani comple ți și două luni din anul urm ător. Consumul de Coca-Cola
pe parcusul unui an, are dou ă valori maxime in lunile decembrie și iunie, fapt explicat prin
începutul s ărbătorilor de iarn ă și începutul sezonului cald. Valori mai sc ăzute sunt în linile ianuarie
și octombrie. Din ianuarie începe un trend cresc ător până în iunie, apoi descres ător în iulie, august,
septembrie și octombrie. Cei doi ani au evolu ții asemănătoare, conducând la concluzia existen ței
unei sezonalit ăți lunare.

Evoluția livrărilor de marf ă în perioada
noiembrie 1999-decembrie 2001
50000100000150000200000250000300000
123456789 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2 2 3 2 4 2 5 2 6
luninumar pet 2 l

Figura 2.1. Evolu ția băuturilor răcoritoate livrate

54Evoluția cheltuielilor cu combustibilul
100015002000250030003500
11.99
12.9901.0002.0003.00
04.00
05.0006.0007.00
08.00
09.0010.0011.0012.00
01.01
02.0103.01
04.01
05.01
06.0107.0108.0109.01
10.01
11.0112.01lunaeuro €

Figura 2.2. Evolu ția cheltuielilor lunare cu combustibilul

În Figura 2.2 se poate vedea evolu ția consumul mediu lunar de combustibil , variabila x1.
Valoarea consumului de combusti bil utilizat pentru distribu ția produselor are o evolu ție
asemănătoare cu cantitatea m ărfurilor livrate: în lunile ianuarie se înregistreaz ă valorile cele mai
mici, urmat ă de luna octombrie, iar valorile cele mai mari, în lunile decembrie, urmate apoi de
lunile iunie, pe un trend anual u șor ascendent.
În Figura 2.3 se prezint ă evoluția cronologic ă a a valorii daunelor lunare – variabila x2.
Evoluția valorii pierderilor lunare
100120140160180200220240260280
11.99
12.99
01.00
02.00
03.00
04.00
05.00
06.00
07.00
08.00
09.00
10.00
11.00
12.00
01.01
02.01
03.01
04.0105.01
06.01
07.01
08.01
09.01
10.01
11.0112.01lunaeuro

Figura 2.3. Evolu ția lunară a pierderilor și daunelor

55Evoluția lunară a pierderilor este foarte asem ănătoare cu evolu ția cantității de marf ă vândută
lunar, înregistrându-se valori mai mari în lun ile în care volumul desfacerilor este mai mare
(decembrie și iunie) și valori mai mici în lunile în care se distribuie mai pu țină marfă, (ianuarie și
octombrie). Valoarea daunelor și pierderilor este propor țională cu volumul m ărfii.
Evoluția lunară a ponderii m ărfii returnate
1.451.501.551.601.651.70
11.99
12.9901.0002.0003.0004.00
05.00
06.00
07.00
08.00
09.0010.0011.00
12.00
01.0102.0103.0104.01
05.01
06.01
07.01
08.01
09.01
10.0111.0112.01luna%

Figura 2.4. Ponderea m ărfii returnate lunar, în totalul livr ărilor

În Figura 2.4, graficul evolu ției ponderilor lunare a m ărfii returnate în total livr ări lunare –
variabila x3, arată o evoluție asemănătoare cu cea a livr ărilor fizice de marf ă, dar se observ ă o
pondere mai mare a return ărilor în lunile de var ă, pentru c ă în sezonul cald produsele se
deterioreaz ă mai rapid decât în cel rece.
Graficul din Figura 2.5 arat ă evoluția capacității lunare de înc ărcare auto – variabila x4.
Evoluția capacit ății lunare de transport
350400450500550600
11.99
12.9901.00
02.00
03.0004.0005.00
06.00
07.00
08.00
09.0010.00
11.00
12.0001.0102.01
03.01
04.01
05.01
06.0107.01
08.01
09.0110.0111.01
12.01lunanumăr peturi 2 l

Figura 2.5. Evolu ția lunară a capacit ății de transport

56
Evoluția cheltuielilor lunare cu salariile
1850190019502000205021002150
11.99
12.99
01.00
02.00
03.00
04.00
05.00
06.00
07.00
08.00
09.00
10.00
11.00
12.00
01.01
02.0103.01
04.01
05.01
06.01
07.01
08.01
09.01
10.01
11.01
12.01lunaeuro

Figura 2.6. Evolu ția salariilor medii lunare ale personalului angajat și colaboratori
Ca și celelalte variabile și capacitatea lunar ă de transport are o evolu ție asemănătoare cu cea
a volumului m ărfii livrate, fiind mai mare în lunile decembrie și iunie. Se observ ă valori mai mari în
lunile noiembrie decât în iuni e, vârful din sezonul cald.

Evoluția indicilor pre țurilor de consum
125130135140145150155160
11.99
12.99
01.00
02.00
03.00
04.00
05.00
06.00
07.00
08.00
09.00
10.00
11.00
12.00
01.01
02.01
03.0104.01
05.01
06.01
07.01
08.01
09.01
10.0111.01
12.01luna% față de aceeași luna

Figura 2.7. Evolu ția IPC față de aceeași lună a anului anterior

În Figura 2.6 se prezint ă evoluția cheltuielilor cu salariile medii lunar e ale personalului
angajat și colaboratori externi. Varia țiile mai mari în al doilea an de afaceri, în lunile noiembrie și

57decembrie, situate pe un trend cresc ător al salariilor, se explic ă prin apelarea la serviciile unor
colaboratori externi.
Evoluția IPC prezentat ă în Figura 2.7 este descresc ătoare și considerarea acestei variabile se
explică prin faptul c ă rata infla ției poate influen ța comportamentul de cump ărare al consumatorilor
de băuturi răcoritoare.
5.2. Analiza grafic ă a influen ței variabilelor explicative asupra variabilei
dependente y
Analizând graficul din Figur a 2.8 se poate vedea corela ția directă, pozitivă, și de
formă liniară, dintre variabila dependent ă și cheltuielile cu combustibilil, x1.
Graficul din Figura 2.9 arat ă ca exist ă legătură între variabila dependent ă și valoarea
daunelor și pierderilor, x2 și anume o corela ție directă și de formă liniară, evidentă
Volumul m ărfii livrate și cheltuielile cu combustibilul
50000100000150000200000250000300000
1000 1500 2000 2500 3000 3500×1, valoare combustibil (euro)marfa livrat ă (nr. pet.)

Figura 2.8. Corela ția dintre volumul m ărfii livrate și cheltuielile cu combustibilul

58Corelația dintre marfa livrat ă și valoar ea pier der ilor și daunelor
50000100000150000200000250000300000
100 120 140 160 180 200 220 240 260 280×2, pierderi și daune (euro)marfa livrat ă (nr. pet. )

Figura 2.9. Corela ția dintre marfa livrat ă și valoarea daunelor și pierderilor
În Figura 2.10, corela ția dintre volumul produselor livrate și ponderea returului în totalul
lunar al livr ărilor, x
2, indică o legătură de tip liniar și directă. Norul de puncte mai dispersat din
Figura 2.10 indic ă o corelație mai slab ă decât în cazu l variabilelor x1 și x2.

Corelație ditre marfa livrat ă și ponderea m ărfii re turnate
50000100000150000200000250000300000
1.45 1.50 1.55 1.60 1.65 1.70
x3, retur marf ă (pondere %)marfa livrat ă (nr. pet. )

Figura 2.10. Corela ția dintre volumul m ărfii livrate și ponderea livr ărilor returnate lunar
Graficul din Figure 2.11. indic ă o legătură de aceea și natură directă, ca și în cazul
variabilelor x1, x2 și x3, adică pe măsură ce crește volumul vânz ărilor, crește și capacitatea lunar ă,

59dar nu pe m ăsura necesit ăților, astfel încât norul de pun cte dispersat va indica o leg ătură de
intensitate mai slab ă. Forma leg ăturii poate fi considerat ă liniară.

Corelație ditre marfa livrat ă și capacitatea de transport
50000100000150000200000250000300000
350 400 450 500 550 600
x4, capacitate de transport (nr. pet)marfa livrat ă (nr. pet. )

Figura 2.11. Corela ția dintre marfa vândut ă și capacitatea lunar ă
de încărcare auto
Corelație ditre marfa livrat ă și fondul lunar de salarii
50000100000150000200000250000300000
1850 1900 1950 2000 2050 2100 2150×5, fondul de salarii (euro)marfa livrat ă (nr. pet. )

Figura 2.12. Corela ția dintre volumul lunar al m ărfii livrate și
fondul lunar de salarii

În Figura 2.12, corela ția dintre marfa lunar livrat ă și fondul lunar de sala rii pentru personalul
propriu și colaboratori, este de slab ă intensitate. Norul de puncte este aproape paralel cu axa Ox,

60conducând fie la concluzia lipsei leg ăturii dintre fondul de salarii și volumul m ărfii livrate, fie la
existența unei leg ături de intensitate slab ă, mai degrab ă de sens invers.
Corelația dintre marfa livrat ă și indicii pre țurilor de consum
50000100000150000200000250000300000
130 135 140 145 150 155 160
x6, IPC lunar (%)marfa livrat ă (nr. pet. )

Figura 2.13. Corela ția dintre marfa livrat ă și indicii pre țurilor de consum
Graficul din Figura 2.13 este singurul care indic ă o legătură inversă între marfa vândut ă și
indicii pre țurilor de consum, însemnând c ă livrările de băuturi răcoritoare scad atunci când cresc
indicii pre țurilor de consum. Totu și intensitatea leg ăturii va fi slab ă pentru că norul de puncte este
destul de dispersat. Forma leg ăturii poate fi considerat ă ca fiind liniar ă.

5.3. Construirea modelului econometric

Pentru exemplificarea construiri i modelului econometric sub form ă matriceal ă se începe cu modelul
de regresie a variabilei y și toate variabilele x
i, i=1,6 . Modelul:
t t t t t t t xa xa xa xa xa xa a y66 55 44 33 22 11 0 ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ++++++= se scrie matriceal: eaXY+⋅= ˆ , cu vectorii
Y, e și matricea X, în continuare:

61⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=118.968183.939208.844214.011243.398170.614164.045161.203106.99478.116226.416133.079117.786181.546207.965213.702240.814168.745160.124159.366104.87576.316225.245131.750
y

⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=
130.3 2120 580 1.536 245 2927 1130.7 2021 560 1.510 178 1884 1130.8 2069 480 1.550 165 1884 1131.2 2050 490 1.580 183 2355 1132.4 2043 510 1.636 206 2545 1131.8 2012 550 1.638 233 2325 1135.7 2070 550 1.640 260 2630 1137.4 2057 520 1.620 217 1999 1137.5 2050 480 1.550 206 2208 1140.3 2030 470 1.530 185 2355 1140 2025 450 1.487 117 1884 1139.9 1932 450 1.485 110 1580 1140.7 2120 580 1.536 245 2927 1141.3 2021 560 1.510 178 1884 1142.9 1911 430 1.490 123 1464 1144.9 1905 450 1.580 182 1952 1145.4 1881 470 1.635 225 2097 1144.5 1899 490 1.640 240 2268 1140.9 1925 500 1.650 258 2444 1144 1876 480 1.630 172 1647 1148.9 1877 430 1.600 167 1865 1149 1913 420 1.580 165 1945 1155.7 1958 400 1.500 147 1369 1156.8 1942 400 1.480 124 1114 1154.8 1965 550 1.532 236 2525 1153.7 1887 530 1.510 124 1523 1
X

⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=2625242322321
eeeee………………eee
e
Vectorul aˆ al estimatorilor parametrilo r are dimensiunile: 7 linii și o coloan ă (7, 1):
⎟⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=
6543210
ˆˆˆˆˆˆˆ
ˆ
aaaaaaa
a
Dimensiunile masivelor sunt: e aˆ X Y +⋅=
(26, 1) = (26, 7) x (7, 1) + (26, 1)
Se formeaz ă masivele astfel prezentate și se parcurg pe rând urm ătorii pași:
1. matricea transpus ă X′,

622. matricea produs XX′,
3. inversa matricii produs ()1−′XX ,
4. matricea produs dintre ()1−′XX și X′
5. vectorul produs al estimatorilor aˆ, între ()X XX′′−1 și vectorul Y.
Descrierea opera țiunilor la fiecare pas este prezentat ă în continuare:
1. Transpusa matricii X, se obține prin comanda Copy a blocului de celule ce formeaz ă matricea X,
și într-o celul ă liberă, se alege comanda Paste Special din meniul Edit cu opțiunea Transpose .
Matricea X′ va fi de dimensiunile (7 linii, 26 coloane).
2. Pentru a ob ține produsul matricilor XX′, se știe că X′ are dimensiunea (7,26), iar X, (26,7), iar
matricea produs va fi de dimensiunea (7,7). Se selecteaz ă un bloc de celule libere format din 7
linii și 7 coloane, apoi cu blocul, unde se va de pune rezultatul, astfel selectat, se apeleaz ă funcția
MMULT(array_1, array_2) pentru înmul țirea a dou ă matrici sau vectori și se declar ă pe rând: la
array_1 , matricea X′, iar la array_2 , matricea X. Ordinea declar ării masivelor este foarte
important ă pentru înmul țirea lor. Pentru a ob ține rezultatul – matricea produs – se apas ă
simultan pe trei taste <Ctrl/ Shift/ En ter>, eliberându-se întâi tasta Enter și apoi celelalte dou ă.
3. Inversa matricii produs se ob ține selectând întâi un bloc de celule libere de 7 linii și 7 coloane,
unde se va primi rezultatul opera ției, apoi se apeleaz ă funcția MINVERSE(array) și se declar ă la
array , blocul matricii XX′ de inversat. Se apas ă simultan pe cele trei taste <Ctrl/ Shift/ Enter>
și se obține instantaneu matricea invers ă.
4. Pentru a realiza matricea produs () X XX′′−1 trebuie s ă se cunoasc ă dimensiunea sa, pentru a
putea selecta înainte de apelul func ției MMULT , blocul de celule libere, care va primi rezultatul.
Se știe că matricea ()1−′XX este de dimensiune (7,7), iar matricea X′ de (7,26), iar matricea
produs va fi de dimensi unea (7,26). Se selecteaz ă un bloc de 7 linii și 26 de coloane, se apeleaz ă
funcția de înmul țire și se declar ă la array_1 , matricea ()1−′XX , iar la array_2 , matricea X′. La
apăsarea tastelor <Ctrl/ Shift/ Enter> se ob ține rezultatul dorit.
5. Pentru a ob ține vectorul estimatorilor se înmul țesc matricile ()X XX′′−1 de dimensiune (7,26) cu
vectorul Y de dimensiune (26,1) și se obține aˆ de dimensiunea (7,1). Se selecteaz ă 7 celule
libere pe o coloan ă și 7 linii, se apeleaz ă funcția MMULT și se declar ă în ordine matricele de
înmulțit, se apas ă <Ctrl/ Shift/ Enter> și se obține vectorul estimatorilor:

63⎟⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=
760.8123.4-103.2217262.8305.965.7278825.8-
ˆa
Pentru a determina intervalele de încredere ale estimatorilor și pentru a putea aprecia
calitatea lor și apoi a ajust ării, este necesar s ă se calculeze di spersia reziduurilor 1ˆ2
−−′=knee
eσ și
matricea de varian ță-covarian ță a estimatorilor: 1 2
ˆ ) (ˆ ˆ−′=Ω XXaεσ .
Se determin ă reziduurile ca diferen ță între valorile observate și valorile teoretice ob ținute cu
modelul
t t t t t t t x x x x x x y6 5 4 3 2 1 8.760 4.123 2.103 8. 217262 9.305 7.658. 278825 ˆ + − + + ++ −= .
Deoarece modelul este estimat pentru prima dat ă este de a șteptat să nu fie corespunz ător,
chiar de la început. Dispersia rezi duurilor este prea mare 93960182. Înmul țirea unei constante,
dispersia reziduurilo r, cu matricea 1) (−′XX se realizeaz ă înmulțind constanta cu toate celulele
matricii. Se scrie formula pentru elementul matricii de pe pozi ția (1,1) și se blocheaz ă cu simbolul
$, coloana și linia adesei unde se afl ă 2ˆeσ, apoi se copiaz ă formula pentru toate celulele matricii
rezultate. Pe diagonala principal ă se află varianțele estimatorilor, iar ab aterile acestora se ob țin
extrăgând radicalul de ordinul 2. Se ob țin urmăroarele abateri ale estimatorilor:
Pentru fiecare estimator se calculeaz ă rația Student
ii
ai
aat
ˆˆˆˆ
σ=∗, care se compar ă cu o valoare
critică a testului Student pent ru un prag de semnifica ție α=5% și 26-6-1=19 grade de libertate, care
este 025.02/
.. 19=α
libgrdt = ± 2.093. Astfel se verific ă dacă estimatorii sunt semnificativ diferi ți de 0, ipoteza
alternativ ă H 1. În caz contrar, ipoteza nul ă, H 0, variabilele semnificative corespunz ătoare nu
influențează semnificativ variabila dependent ă y, pentru c ă estimatorii respectivi pot lua și valoarea
0.

64
⎟⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=
425.14957.469723.8124.59.8227794.3
ˆˆaσ
⎟⎟⎟⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜⎜⎜⎜
⎝⎛
=∗
1.7892.515-1.7963.1162.4576.6741.224-
t
Se observ ă pe Figura 2.14, cum se interpreteaz ă rațiile Student calculate fa ță de valorile
teoretice ale testului bilateral.
H
0
H 1 1 – α H 1
2α 2α

– t1-α/2 0 + t1-α/2
-2.093 +2.093
Figura 2.14. Testarea ra țiilor Student ale estimatorilor

Se ajunge la concluzia c ă estimatorii 6 4 0 ˆ și ˆ ,ˆ a aa , nu sunt semnificativ diferi ți de 0 pentru c ă
093.2
4ˆ<∗
at și se va renun ța la variabilele 6 4 și x x . Toți ceilalți estimatori sunt semnificativi diferi ți
de 0, ipoteza alternativ ă, H1, pentru că 093.2
4ˆ>∗
at .
Pentru a verifica aceste calcule se poa te utiliza tabela de regresie furnizat ă de Excel.
Declararea variabilelor independente necesit ă existența unui bloc care s ă cuprindă toate cele șase
variabile explicative dispuse pe vertical ă în coloane adiacente.
Tabela de regresie este prezentat ă în Tabelul 2.2.
Informația Standard Error din prima parte a tabelei de re gresie este abaterea reziduurilor
eσˆ, care ridicat ă la puterea a 2-a rezult ă, dispersia erorilor 2ˆeσ, fiind o verificare a valorii ob ținute
prin formula 1ˆ12
2
−−=∑
=
knen
tt
eσ .
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9855
R Square 0.9712
Adj. R Sq. 0.9622
Std Error 9693.3

65Observations 26
ANOVA df SS MS F Signific.F
Regression 6 6.028E+10 1.005E+10 106.931 1.31E-13
Residual 19 1.785E+10 93960182
Total 25 6.207E+11
Coeff. Std. Error t Stat P-value Low95% Upp95%
Intercept -278826 227794.29 -1.2240 0.2359 -755605 197953
X Variable 1 65.7 9.849 6.6741 0.0000 45.12 86.35
X Variable 2 305.9 124.501 2.4568 0.0238 45.29 566.46
X Variable 3 217262.8 69723.82 3.1160 0.0057 71329 363196
X Variable 4 103.2 57.436 1.7964 0.0884 -17.04 223.39
X Variable 5 -123.4 49.043 -2.5154 0.0210 -226.01 -20.71
X Variable 6 760.8 425.110 1.7896 0.0895 -129.01 1650.52

Tabelul 2.2. Tabela de regresie a modelului econometric ini țial cu șase variabile factoriale
Se observ ă că valoarea coeficientului de determina ție 0.9712 este apropiat ă de 1, arătând că
modelul liniar este valid explicând într-o propor ție de 97.12% varia ția variabilei dependente y de
variabilele explicative. Coeficientul de corela ție multipl ă 0.9855 arat ă o corelație puternic ă între
variabilele explicative și cea explicat ă. Valoarea testului Fisher indic ă o regresie global
semnificativ ă, Significance F , fiind foarte mic ă.
În partea a treia a tabele i de regresie, se reg ăsesc estimatorii ob ținuți prin calcul matriceal,
abaterile lor și rațiile Student identice cu valorile calculate mai sus. Valorile P-value , indică pragul
de semnifica ție α, de la care începând estimatorii se pot considera semnificativ diferi ți de 0.
Probabilitatea ca estimatorii s ă fie semnificativi este de 1- α. Se poate vedea c ă pentru 0ˆa, α este de
23.6%, pentru 1ˆa, α este 0%, pentru 2ˆa – este 2.38%, pentru 3ˆa – este de 0.057%, pentru 4ˆa – de
8.84%, pentru 5ˆa – de 2.1% și pentru 6ˆa – de 8.95%. Deoarece pragul α este de obicei de 5%, se va
renunța la variabilele 6 4 și x x , ale căror estimatori dep ășesc aceast ă valoare a pragului de
semnifica ție. Intervalele de încredere pentru α=5%, ale acestor estimatori schimb ă semnul de la „-”
al limitei inferioare Lower 95% la „+” la limita superioar ă Upper 95% , fiind cea mai evident ă
dovadă a faptului c ă respectivii estimatori pot lua și valoarea 0.
Cu toate c ă informațiile despre calitatea ajust ării, arată un model foarte bun, totu și trebuie s ă
se țină seama de semnifica ția estimatorilor. O alt ă variantă de model va fi cea prin care se elimin ă
variabilele 6 4 și x x , care reprezentau capacitatea de înc ărcare auto pentru transportul produselor și
indicii pre țurilor de consum, calcula ți față de aceeași lună a anului anterior.
Noul model va fi: t t t t t xa xa xa xa a y55 33 22 11 0 ˆ ˆ ˆ ˆ ˆ ˆ ++++= . După obținerea tabelei de regresie,
Tabelul 2.3, se ob ține modelul:
t t t t t x x x x y5 3 2 1 03.170 3. 122802 42.464 79.63 35. 93975ˆ − + + + = .

66SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9818
R Square 0.9639
Adj. R Sq 0.9570
Std. Error 10334
Observations 26
ANOVA df SS MS F Signif. F
Regression 4 5.98E+10 1.5E+10 140.05 8.0E-15
Residual 21 2.24E+09 1.07E+08
Total 25 6.21E+10
Coeff. Std Error t Stat P-value Low 95% Up95%
Intercept 93975.3 126814 0.741 0.4668 -169749 357699
X Variable 1 63.79 10.232 6.234 0.000 42.509 85.065
X Variable 2 464.42 108.204 4.292 0.000 239.402 689.446
X Variable 3 122802 56579.3 2.170 0.042 5139 240465
X Var. 4 (x 5) -170.03 38.296 -4.440 0.000 -249.671 -90.388
Tabelul 2.3. Tabela de regresie pentru modelul cu patru variabile explicative
De și indicatorii calit ății ajustării au valori pu țin mai mici decât în modelul anterior, totu și nu
s-a pierdut mult din calitatea ajust ării: coeficientul de corela ție multipl ă este 0.9818 indic ă o
corelație puternic ă între variabilele explicative și y, coeficientul de determina ție de 0.9639 arat ă
validitatea modelului liniar, iar regresia este global semnificativ ă, după testul Fisher din tabelul
ANOVA. S-au câ știgat, în schimb, valori semnificative pentru to ți ceilalți estimatori, care sunt
semnificativ diferi ți de 0, dup ă cum indic ă rațiile Student, în compara ție cu valoarea critic ă
080.2025.02/
.. 21±==α
libgrdt . Gradele de libertate sunt n-k-1 , adică 26-4-1=21 , unde k=4.
Termenului constant, 0ˆa, care arat ă nivelul mediu al variabilei dependente dac ă toți factorii,
înafara celor înregistra ți, ar avea o ac țiune constant ă, nu este totu și semnificativ diferit de 0, dup ă
cum indic ă valoarea prea mic ă a rației Student, P-value prea mare, de 46.68% și intervalul de
încredere care con ține valoarea 0.
O analiză mai amănunțită a sezonalit ății, a corela țiilor dintre variabilele explicative, a
autocorela ției erorilor, va îndrepta acest neajuns. Se poate totu și în aceast ă fază, să se renun țe la
termenul liber, iar modelul ob ținut:t t t t t x x x x y5 3 2 1 89.146 3. 159285 89.434 14.62ˆ − + + = , va avea to ți
estimatorii parametrilor variabilelor explicative semn ificativi, cu o probabilitate de aproape 100%,
deși se micșoreză încă puțin indicatorii calit ății ajustării: R=0.9812, 9629 .02=R . Valorile teoretice
corespunz ătoare valorilor observate sunt reprezentate în Figura 2.15.

67Evoluția livrărilor de marf ă și ajustarea lor
50000100000150000200000250000300000
11.99
12.99
01.00
02.00
03.00
04.00
05.00
06.0007.00
08.00
09.0010.00
11.00
12.00
01.01
02.0103.01
04.01
05.01
06.01
07.01
08.01
09.01
10.01
11.0112.01
luninr. petur i
y yt
Figura 2.15. Ajustarea folosind modelul liniar f ără constantă
Regresia este global semnificativ ă, dar pân ă nu se parcurg și etapele unei analize mai
amănunțite, nu se poate stabili care este cel mai bun model. Modelul final, trebuie s ă respecte
ipotezele modelului general de regresie liniar ă: lipsa autocorela ției erorilor, variabilele explicative,
cât mai pu țin autocorelate între ele.

6. Teste statistice și analiza varian ței
Testarea semnifica ției individuale a coeficien ților parțiali de regresie, ka aa ˆ,…,ˆ,ˆ1 0 folosind
testul t Student difer ă de testarea semnifica ției globale a regresiei multi ple, prin care se accept ă sau
se infirmă ipoteza nul ă H0: R2=0, pe baza testului Fisher, F. Dacă folosind testul t se găsește unul
sau mai mul ți coeficien ți parțiali de regresie, ca fiind în mod individual nesemnificativi, nu
înseamnă că se poate accepta ipoteza c ă toți coeficien ții sunt de asemenea nesemnificativi (Tabelul
2.2. și Tabelul 2.3).
6.1. Construirea testelor statistice
Testele statistice se refer ă la contribu ția uneia sau mai multor variabile explicative la
regresia multipl ă, testarea egalit ății statistice a unui ansamblu de coeficien ți cu un ansamblu de
valori fixate, restric țiile asupra estimatorilor coeficien ților și testarea validit ății lor, folosirea testului
F pe baza analizei varian ței pentru analiza unor ipoteze asupra regresiei multiple.

686.1.1. Compararea unui parametru ai cu o valoare fixat ă a

Contribu ția marginal ă a fiecărei variabile explicative la formarea variabilei y este
valoarea coeficientului fiec ăreia dintre ele. De exemplu, în modelul liniar cu patru variabile
explicative, din exemplul anterior: t t t t t x x x x y5 3 2 1 89.146 3. 159285 89.434 14.62ˆ − + + = , se poate
spune că lunar cre șterea cu 1 euro a consumului mediu de combustibil conduce la cre șterea
livrărilor lunare, în medie, cu aproximativ 62 de peturi, cre șterea cu 1 euro a valorii daunelor și
pierderilor lunare determin ă o creștere a livr ărilor, în medie, de 435 de peturi, cre șterea cu un
procent a m ărfii returnate, poate influen ța creșterea livrărilor, în medie, cu 159285 de peturi, iar
creșterea cu 1 euro a fondului mediu net de sa larii ale personalului distribuitor genereaz ă o scădere
a livrărilor lunare, în medie, cu 147 de peturi. Se observ ă legătura invers ă între livr ările fizice și
fondul de salarii, care pe graficul din Figura 2.12, nu se putea sesiza.
Pentru a compara un parametru cu o valoare fixat ă a, testul de ipoteze este:
H0: ai = a
H1: ai ≠ a .
Pe baza datelor din e șantionul extras se calculeaz ă raportul critic, care urmeaz ă o lege
Student, și este de forma:
ii
ai
aaat
ˆˆˆ
σ−=∗. Se compar ă această rație Student calculat ă, cu o valoare
teoretică numită critică, pentru un prag de semnifica ție α=5% și n-k-1 grade de libertate. Pentru c ă
testul este bilateral se alege valoarea teoretic ă Student pentru un prag de semnifica ție α/2.
Dacă 2/

−−∗>kn at t
i, se respinge ipoteza nul ă H0; se accept ă ipoteza alternativ ă H1, ai este
semnificativ diferit de valoarea a, la un prag de semnifica ție α, adică o probabilitate de 1- α.
Dacă 2/

−−∗≤kn at t
i, se accept ă ipoteza nul ă H0; ai nu este semnificativ diferit de valoarea a, la
un prag de semnifica ție α.
Un caz particular este când valoarea a=0 și atunci raportul critic devine ra ția Student
calculată a estimatorului respectiv,
ii
ai
aat
ˆˆˆ
σ=∗.
Se verific ă semnifica ția față de zero a coeficientului, care înseamn ă verificarea semnifica ției
variabilei explicative, care apare în model, pentru a ști dacă aceasta contribuie în mod real la
explicarea variabilei endogene y.

696.2. Execi țiu – Teste asupra coeficien ților
Despre o firm ă, se cunosc datele referitoare la vânz ările de marf ă, y, exprimate în mii
euro, pe o perioad ă de 14 luni, num ărul de angaja ți (persoane), x1, cheltuielile de între ținere a
utilajelor, exprimate în euro, x2, și cheltuielile de publicitate pentru promovarea produselor,
exprimate în euro, x3. Datele sunt prezentate în Tabelul 2.4:
t y x 1 x 2 x 3 yt1 yt2
1 17 3 42 115 18 18
2 19 2 40 126 17 17
3 15 4 40 148 18 19
4 21 7 44 139 19 20
5 19 8 39 123 23 22
6 24 9 38 150 23 23
7 26 9 29 126 27 26
8 24 6 30 141 24 24
9 26 6 38 122 22 21
10 21 9 35 157 24 24
11 24 5 29 155 23 23
12 26 10 28 166 27 27
13 30 13 32 168 28 28
14 26 8 26 174 26 26
Tabelul 2.4. Datele referitoare la un agent economic
Sunt semnificative variabilele exogene în explicarea varia ției variabilei endogene? S ă se
argumenteze și prin calculul intervalelor de în credere ale estimatorilor coeficien ților.
Soluție:
În Figurile 2.16, 2.17, și 2.18 sunt prezentate corela țiile dintre variabila dependent ă, stabilită
ca fiind vânz ările de marf ă, influențată de celelalte variabile, considerate factori.
Corelația dintre valoarea vânz ărilor și numărul de
angajați
101520253035
0 2 4 6 8 10 12 14
x1 (nr. persoane)mil. euro

Figura 2.16. Leg ătura direct ă dintre valoarea vânz ărilor și numărul de angaja ți

70
Corelația dintre valoarea vânz ărilor și cheltuielile de
întreținere a utilajelor
101520253035
25 30 35 40 45×2 (e u ro )mil. eur o

Figura 2.17. Leg ătura invers ă: valoarea vânz ărilor și cheltuielile cu utilajele

Corelația dintre valoarea vânz ărilor și cheltuielile de
publicitate
101520253035
100 110 120 130 140 150 160 170 180
x 3 (euro)mil. eur o

Figura 2.18. Leg ătura direct ă dintre valoarea vânz ărilor și cheltuielile de publicitate

Se observ ă în cele trei grafice, leg ăturile de natur ă directă, ale valorii vânz ărilor cu num ărul
de angaja ți și cheltuielile de publicitate și de sens invers cu cheltuielile de între ținere a utilajelor. Cu
cât sunt mai mari aceste cheltuieli de între ținere, cu atât se reduc vânz ările din cauza stagn ărilor în
producție pentru repararea utilajelor, cre șterii costurilor de fabrica ție și implicit a pre țurilor de
vânzare a produselor, reducerii a ltor cheltuieli, cum ar fi cele de aprovizionare cu materii prime și
materiale, salariile personalului angajat, etc.

71SUMMARY OUTPUT
Regression Statistics
Multiple R 0.8383
R Square 0.7027
Adj. R Square 0.6135
Std. Error 2.5971
Observations 14
ANOVA df SS MS F Signif. F
Regression 3 159.4095 53.136 7.87 0.005
Residual 10 67.4477 6.745
Total 13 226.857
Coeff. Std Err t Stat P-value Lower 95% Upper 95%
Intercept 35.722 10.994 3.249 0.0087 11.226 60.219
X Variable 1 0.802 0.298 2.687 0.0228 0.137 1.467
X Variable 2 -0.3814 0.156 -2.435 0.0351 -0.730 -0.032
X Variable 3 -0.037 0.052 -0.714 0.492 -0.153 0.078
Tabelul 2.5. Tabela de regresie a mo delului cu trei variabile explicative

Tabela de regresie este prezentat ă în Tabelul 2.5. În urma analizei de regresie, se a șteaptă un
coeficient negativ pentru variabila explicativ ă a cheltuielilor de între ținere a utilajelor, x2 și
coeficienți pozitivi pentru celelalte dou ă variabile independente x1 și x3. Modelul este:
3 2 1 037.0 381.0 802.0 72.35ˆ x x x yt −−+= ,
iar valorile teoretice, yt1, se află în Tabelul 2.4 și pe acela și grafic care arat ă evoluția în timp a
valorilor observate, în Figura 2.19.
Evoluția vânzărilor
101520253035
123456789 1 0 1 1 1 2 1 3 1 4
lunimil. eur o
y yt1 yt2

Figura 2.19. Evolu ția vânzărilor și ajustarea lor
Rația Student pentru fiecare coeficient de regresie, calculat ă după formula
ii
ai
aat
ˆˆˆ
σ=∗, se compar ă cu
valoarea teoretic ă Student pentru α=5% și 10 grade de libertate, 228.2025.02/
.. 10==α
libgrdt .

72• 228.2 687.2
1ˆ >=∗
at , rezultă că 0ˆ1≠a , variabila x1 contribuie la explicarea varia ției
variabilei y;
• 228.2 435.2
2ˆ >=∗
at , rezultă că 0 ˆ2≠a , variabila x2 contribuie la explicarea varia ției
variabilei y;
• 228.2 714.0
3ˆ <=∗
at , rezultă că 0ˆ3=a , variabila x3 nu contribuie la explicarea varia ției
variabilei y, și poate fi retras ă din model.
Se poate vedea în tabela de regresie din Tabelul 2.5 c ă P-value pentru estimatorul 3ˆa, indică
un prag de semnifica ție de 49%, care este mult prea mare.
Intervalul de încredere al coeficientului ai se stabile ște în func ție de valoarea estimatorului,
estimația abaterii sale și valoarea teoretic ă Student pentru un prag de semnifica ție ales, de obicei
α=5%:
2/
.. ˆ2/
.. ˆ ˆ ˆ; ˆ ˆ[α ασ σlibgrda i libgrda i i t a t a ICa
i i+ −= .
Intervalele de încredere pentru cei trei estimatori ai coeficien ților variabilelor explicative sunt:
• [] 467.1;137.0:1 ICa , semnul „+” indic ă legătura direct ă dintre y și x1;
• [] 032.0;730.0:2 −− ICa , semnul „-” indic ă legătura invers ă dintre y și x2 (Figura 2.17);
• [] 079.0;153.0:3 ICa− , se schimb ă semnul de la „-” la „+”, 3ˆa poate lua valoarea 0, nu este
semnificativ diferit de 0. Numai variabilele x1 și x2 sunt variabile exogene semnificative.
Pentru noul model cu dou ă variabile explicative, se ob ține tabela de regresie prezentat ă în
Tabelul 2.6. Valorile teore tice calculate cu acest model:
2 328.0 715.0 143.29ˆ x x yt −+=
se afă în Tabelul 2.4 și în Figura 2.19.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.8292
R Square 0.6875
Adj. R Sq. 0.6307
Std Error 2.538
Observations 14
ANOVA df SS MS F Signif. F
Regression 2 155.97 77.99 12.10 0.0016
Residual 11 70.88 6.44
Total 13 226.86
Coeff. Std. Error t Stat P-value Low 95% Upp 95%
Intercept 29.143 5.85 4.976 0.0004 16.25 42.03
X Variable 1 0.715 0.26 2.685 0.0212 0.13 1.30
X Variable 2 -0.32811 0.134561 -2.4384 0.03292 -0.6243 -0.0319
Tabelul 2.6. Tabela de regresie a modelului cu dou ă variabile explicative

73Se poate observa c ă acest model are coeficien ții semnificativ diferi ți de 0, dup ă cum indic ă
rațiile Student calculate, care sunt mai mari decât valoarea teoretic ă din tabela Student, valorile P-
value , care sunt mai mici decât 5%, precum și intervalele de încr edere ale coeficien ților, care nu
schimbă semnul de la limita inferioar ă la cea superioar ă, deci nu con țin valoarea 0.
Intervalele de încredere sunt:
[ ]03.42;25.16:0 ICa , [ ]301.1;129.0:1 ICa , [ ]032.0;624.0:2 −− ICa .
Coeficientul de determina ție de 68.7% indic ă validitatea modelului liniar, iar coeficientul de
corelație multipl ă de 0.83 indic ă o corelație puternic ă între cele trei variabile y, x1 și x2.

6.3. Analiza varian ței – testul Fisher
Tabelul de analiz ă a varianței, ANOVA este de forma celui din Tabelul 2.7:

Natura varia ției,
datorată: Sumă de
pătrate (Sum
Squares) SS Grd.lib
df (Modified
Sums) MS
Testul Fisher F
Regresiei (variabilelor
explicative) SSE= ∑
=−n
ttyy
12) ˆ( k SSE/k
Reziduurilor (varian ța
neexplicat ă) SSR= ∑
=−n
tt tyy
12)ˆ ( n-k-1 SSR/(n-k-1)

Totală (toți factorii)
SST= ∑
=−n
ttyy
12) ( n-1 – )1 /(/
−−=kn SSRk SSEF

Tabelul 2.7. Tabelul ANOVA la regresia multipl ă
Testul de semnifica ție globală a regresiei se formuleaz ă astfel: exist ă cel puțin o variabil ă
explicativ ă semnificativ ă?
Ipotezele sunt:
H0: a1 = a 2 = … = a k = 0 (toți coeficien ții sunt nuli, nici o variabil ă explicativ ă nu își aduce
contribuția la explicarea variabilei y; termenul constant a0 nu prezint ă interes, deoarece un model în
care numai termenul constant este se mnificativ, nu are sens economic.)
H1: exista cel pu țin un coeficient nenul.
În cazul în care se accept ă H0 înseamn ă că nu exist ă nici o rela ție liniară semnificativ ă între
variabila y și variabilele xi cu i=1,2, …, k . Testarea H 0 este echivalent ă cu a testa dac ă varianța SSE
este semnificativ diferit ă de 0.
În cazul exerci țiului prezentat, tabelul de analiza varian ței pentru modelul cu dou ă variabile
explicative, dup ă eliminarea variabilei nesemnificative x3, este extras din Tabelul 2.6, în Tabelul
2.8:

74 Natura
variației df SS MS F Significance F
Regression 2 155.9733 77.98663 12.10223 0.001665
Residual 11 70.88389 6.44399
Total 13 226.8571
Tabelul 2.8. Tabelul ANOVA pentru modelul cu dou ă variabile explicative

Ipoteza de normalitate a erorilor implic ă, sub ipoteza H 0, că statistica F* urmează o lege
Fisher cu k și n-k-1 grade de libertate. 10.12)1 /(/* =−−=kn SSRk SSEF se compar ă cu o valoare
teoretică Fisher cu 2 și 11 grade de libertate, care pe ntru un prag de semnifica ție α=5% este
.98.3%5
1 ,==
−−α
knkF Cum Fteoretic F>* ⇒ se accept ă ipoteza alternativ ă, H1, deci regresia este global
semnificativ ă, modelul este bine construit. Valoarea calculat ă F* corespunde unui prag de
semnifica ție de 0.16%, mult mai mic decât 5%.
Și regresia prezentat ă în Tabelul 2.5, cu trei variabile explicative, este global semnificativ ă
pentru că 71.3%5
10,3==αF , iar valoarea calculat ă F*=7.87>3.71, pentru un prag de semnifica ție de
0.54%.
Numai când modelul are termen constant, F* se poate scrie în func ție de coeficientul de
determina ție R2. Din rela ția: SSTSSER=2, se poate exprima: 2R SST SSE ⋅= , iar SSR se poate
exprima în func ție de coeficientul de nedetermina ție:SSTSSRR N =−=2 21, ) 1(2R SST SSR −⋅= .
Înlocuind în formula statisticii F*, valorile astfel exprimate SSE și SSR, se simplific ă cu SST
și rămâne astfel: )1 /() 1(/*22
−−−=kn RkRF .
Pe lângă testul global de semnifica ție, se efectueaz ă testele de semnifica ție individual ă a
coeficienților pentru fiecare variabil ă explicativ ă din model.
Calitatea ajust ării se determin ă în funcție de coeficientul de determina ție: SSTSSER=2. Dacă
12→R înseamnă că varianța totală SST, este aproape în întregime explicat ă de SSE, și modelul
este bine ales. Coeficientul de determina ție multipl ă: 2R R= , arată intensitatea corela ției
simultane a variabilelor explica tive asupra variabilei dependente y.

756.4. Teste pornind de la analiza varian ței modelului liniar
Pe baza analizei varian ței se disting patru teste des utilizate: verificarea semnifica ției
introducerii uneia sau mai multor variabile ex plicative în model, verificarea stabilit ății în timp a
modelului, folosind testul Chow, testarea restric țiilor asupra coeficien ților, semnifica ția creșterii
volumului e șantionului pentru estimarea modelului.
6.4.1. Introducerea uneia sau mai mult or variabile explicative în model
Adăugarea unor variabile e xplicative în model îmbun ătățește semnificativ calitatea ajust ării?
Există oare o diferen ță semnificativ ă între varian ța explicat ă, SSE, de modelul complet și cea
explicată, SSE1, de modelul cu mai pu ține variabile independente? Testul de ipoteze este:

⎪⎩⎪⎨⎧
≠−=−
0 :0 :
1
11
0
SSE SSEHSSE SSE H.
Se calculeaz ă: )1 /() /( (*1 )1
−−− −=kn SSRkk SSE SSEF și se compar ă cu α
1 ,1−−− knkkF , unde k este num ărul de
variabile explicative, inclusiv cele ad ăugate din modelul cel mai cuprinz ător, iar k’ este num ărul
inițial de variabile explicative, k’<k .
Regula de decizie este:
– α
1 , *−−′−<knkkF F se accept ă H0, nu este nici o diferen ță între cele dou ă modele și introducerea
variabilelor suplimentare nu îmbun ătățește calitatea ajust ării;
– α
1 , *−−′−>knkkF F se accept ă H1, introducerea variabilei sau variabilelor suplimentare a contribuit la
o mai bun ă explicare a varian ței variabilei endogene.
6.4.2. Verificarea stabilit ății în timp a modelului – testul CHOW
Problema este dac ă modelul se poate considera ca fiind stabil pe întreaga perioad ă sau este
mai bine s ă se considere dou ă subperioade distincte de estimare? Specificarea modelului este
aceeași, dar valorile coeficien ților pot fi diferite.
Verificarea stabilit ății coeficien ților const ă în a testa dac ă există o diferen ță semnificativ ă
între varian ța neexplicat ă SSR pe ansamblul perioadei și suma varian țelor neexplicate pe cele dou ă
subperioade SSR1 + SSR2? Dacă răspunsul este negativ, înseamn ă că divizarea pe subperioade nu
îmbunătățește calitatea modelului, modelul ini țial este stabil pe întreaga perioad ă. În caz contrar se
declară modelul ca fiind instabil și este mai bine s ă se estimeze pe subperioade.

76Testul de ipoteze este:

⎪⎩⎪⎨⎧
≠+−=+−
0) ( :0) ( :
2 1
12 1
0
SSR SSR SSRHSSR SSR SSR H
Se calculeaz ă valoarea Fisher, considerând n1, numărul de observ ări în prima subperioad ă și n2,
numărul de observ ări în a doua subperioad ă, iar suma lor n nn=+2 1 , este num ărul total de
observări din modelul ini țial:
)]1(2 /[) ()1 /()] ( [)]1 ()1 /[() ()]1 ()1 ()1 /[()] ( [*
2 12 12 12 12 12 1
+− ++ +−==−−+−− +−−−−−−−− +−=
k n SSR SSRk SSR SSR SSRk n kn SSR SSRk n kn kn SSR SSR SSRF

Regula de decizie:
– α
)1(2,1 *+−+≤k nkF F se accept ă H0, nu este nici o diferen ță între varian ța reziduurilor calculat ă pe
întreaga perioad ă și suma varian țelor reziduurilor calculate pe subperioade; coeficien ții sunt stabili
pe întreaga perioad ă;
– α
)1(2,1 *+−+>k nkF F se accept ă H1, există diferențe semnificative între varian ța reziduurilor pe
întreaga perioad ă și suma varian țelor reziduurilor pe subperioade; coeficien ții nu sunt constan ți;
modelul este instabil.
6.5. Exerci țiu – Teste pornind de la analiza varian ței
Reluînd datele din aplica ția anterioar ă, referitoare la modelul cu trei variabile
explicative: 3 2 1 037.0 381.0 802.0 72.35ˆ x x x yt −−+=
(10.99) (0.298 ) (0.156) (0.052)
( ·) abaterea standard a coeficien ților, n=14 , R2=0.7027 .
Să se testeze urm ătoarele ipoteze:
a) Adăugarea variabilelor explicative x2 și x3 amelioreaz ă semnificativ calitatea ajust ării față de
estimarea numai în raport de variabila x1? Dar adăugarea numai a variabilei x2?
b) Se poate considera modelul cu trei variabile, ca fiind stabil pe ansamblu l perioadei sau trebuie
să se procedeze la estimarea pe subp erioade: de la perioada 1 la 7 și de la 7 la 14?
Soluție:
a) Introducerea a dou ă variabile explicative suplimentare
Se execut ă următoarele opera țiuni:

771. Calculul varian ței totale, a celei explicate și a celei reziduale pentru modelul complet cu trei
variabile explicative. Aceste valori se g ăsesc în tabela de regresie din Tabelul 2.5:
SSE=159.409
SSR= 67.448 SST=226.857
2.
Calculul varian ței totale, a celei explicate și a celei reziduale pentru modelul cu o singur ă
variabilă explicativ ă, x1. Aceste valori se g ăsesc în tabela de regr esie din Tabelul 2.9:
SSE=117.659
SSR=109.198 SST=226.857
SST este evident aceea și, indiferent de num ărul variabilelor explicative, pentru c ă măsoară
variația datorată tuturor factorilor (înregistra ți și reziduali).
Se observ ă că R
2=0.5186 este mai mic decât în cazul modelului ini țial, cu trei variabile
explicative.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.7202
R Square 0.5186
Adjusted R
Square 0.4785
Standard
Error 3.0166
Observations 14
ANOVA df SS MS F Signifi. F
Regression 1 117.6589 117.6589 12.92975 0.0036
Residual 12 109.1983 9.099855
Total 13 226.8571
Coeff. Standard
Error t Stat P-value Lower
95% Upper
95%
Intercept 15.559 2.147 7.247 1.02E-05 10.882 20.237
X Variable 1 1.0118 0.281 3.596 0.003674 0.399 1.625
Tabelul 2.9. Tabele de regr esie a modelului cu o singur ă variabilă explicativ ă

3. Testul statistic asupra ipotezelor: H 0: SSE-SSE1=0
H1: SSE-SSE1≠ 0
Valoarea calculat ă Fisher este:
09.3)13 14/(448.67)13/()659.117 409.159(
)1 /() /( (*1 )1
=−−− −=−−− −=kn SSRkk SSE SSEF
10.4%5
10,2%5
1314,13 1 ,1 == == =
−−− −−−α α αF F Fknkk

78Cum 3.09 < 4.10, rezult ă că se accept ă ipoteza nul ă H0, adăugarea variabilelor x2 și x3 nu
este important ă. Introducerea acestor variabile nu contribuie semnificativ la îmbun ătățirea calității
ajustării. S-a discutat deja mai sus, și se poate vedea în tabela de regresie din Tabelul 2.5, c ă
variabila x3, nu este semnificativ ă, deoarece ra ția sa Student este mai mic ă decât valoarea teoretic ă,
fapt care a condus apoi la excluderea sa din model.
Este interesant s ă se analizeze, dac ă introducerea unei singure variabile suplimentare, și
anume x2, îmbunătățește calitatea ajust ării.
Se vor parcurge aceea și pași, ca cei prezenta ți mai sus:
– calculul varian ței totale, a celei explicate și a celei reziduale pentru modelul cu dou ă variabile
explicative, x1 și x2:
SSE=155.973
SSR= 70.884 SST=226.857

calculul varian ței totale, a celei explicate și a celei reziduale pentru modelul cu o singur ă
variabilă explicativ ă, x1. Tabela de regresie este în Tabelul 2.9.
SSE=117.659
SSR=109.198 SST=226.857
Valoarea calculat ă Fisher este:
946.5)12 14/(884.70)12/()659.117 973.155(
)1 /() /( (*1 )1
=−−− −=−−− −=kn SSRkk SSE SSEF
84.4%5
11,1%5
1214,12 1 ,1 == == =
−−− −−−α α αF F Fknkk
Cum 5.946 > 4.84, rezult ă că se respinge ipoteza nul ă H0, și se accept ă ipoteza alternativ ă,
H1, conform c ăreia adăugarea variabilei x2 aduce o modificare semnificativ ă a varianței explicate.
Introducerea variabilei x2 contribuie semnificativ la îmbun ătățirea calității ajustării. Acest fapt este
dovedit și de valoarea coeficientului de determina ție, care în cazul modelului cu dou ă variabile
explicative este R2=0.6875 mai mare decât în modelul cu o singur ă variabilă explicativ ă, x1,
R2=0.5186 .
b) Testul Chow pentru verificarea stabilit ății în timp a modelului

Se va testa stabilitatea modelului cu trei variabile explicative.
Pasul 1 : se estimeaz ă coeficien ții modelului pentru prima subperioad ă, de la 1 la 7. Tabela de
regresie ob ținută este prezentat ă în Tabelul 2.10.

79SUMMARY OUTPUT
Regression Statistics
Multiple R 0.8322 subperioada 1
R Square 0.6926
Adj. R Sq. 0.3851
Std. Error 3.0176
Observations 7
ANOVA df SS MS F Significance F
Regression 3 61.5396 20.5132 2.2527 0.2610
Residual 3 27.3176 9.1059
Total 6 88.8571
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept 28.5471 15.8986 1.7956 0.1704 -22.0494 79.1436
X Variable 1 0.7739 0.5290 1.4629 0.2397 -0.9097 2.4575
X Variable 2 -0.2932 0.3137 -0.9346 0.4189 -1.2914 0.7051
X Variable 3 -0.0125 0.1008 -0.1240 0.9091 -0.3333 0.3083
Tabelul 2.10. Tabela de regresie pentru prima subperioad ă de la 1 la 7
Se observ ă în Tabelul 2.10, c ă nici unul din coeficien ții de regresie nu este semnificativ
diferit de 0, valorile P-value sunt mai mari decât pragul acceptat de 0.05 , toate intervalele de
încredere ale estimatorilor coeficien ților schimb ă semnul de la – la +, deci con țin valoarea 0.
Nici testul Fisher nu indic ă o regresie global semnificativ ă, Significance F având o valoare
mult prea mare, 26.1% fa ță de 5%, cât se accept ă în mod obi șnuit. Varian țele din tabelul ANOVA
sunt:
SSE1=61.54
SSR1=27.32
SST2=88.86
Pasul 2: se estimeaz ă coeficien ții modelului pentru a doua subperioad ă, de la 8 la 14; tabela de
regresie se afl ă în Tabelul 2.11.

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.7375 subperioada 2
R Square 0.5439
Adjusted R Square 0.0877
Standard Error 2.6282
Observations 7
ANOVA df SS MS F Significance F
Regression 3 24.7067 8.2356 1.1923 0.44423
Residual 3 20.7219 6.9073
Total 6 45.4286
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept 63.1390 34.3309 1.8391 0.1632 -46.1175 172.3955
X Variable 1 1.2282 0.6852 1.7924 0.1710 -0.9525 3.4089
X Variable 2 -0.6208 0.5224 -1.188 0.3201 -2.2832 1.0416
X Variable 3 -0.1843 0.1528 -1.206 0.3142 -0.6707 0.3020
Tabelul 2.11. Tabela de regresie pentru a doua subperioad ă de la 8 la 14

80
Concluzia este asem ănătoare cu cea de la prima subperioad ă: că nici unul din coeficien ții de
regresie nu este semnificativ, intervalele de încredere ale estimatorilor coeficien ților conțin valoarea
0, testul Fisher nu indic ă o regresie global semnificativ ă. Varianțele din tabelul ANOVA,
corespunz ător celei de a 2-a subperioade, sunt:
SSE2=24.71
SSR2=20.72
SST2=45.43
Pasul 3 : se calculeaz ă valoarea Fisher:
)]1(2 /[) ()1 /()] ( [*2 12 1
+− ++ +−=k n SSR SSRk SSR SSR SSRF .
606.06/04.484/)04.48 448.67(
)]13(2 14/[)72.20 32.27()13/()]72.20 32.27( 448.67[* =−=+− ++ +−=F
Valoarea teoretic ă Fisher cu care se compar ă este:
53.4%5
6,4%5
)13(214,13 )1(2,1 == == =
+−+ +−+α α αF F Fk nk .
Cum 0.606 < 4.53, rezult ă că se accept ă ipoteza nul ă, H 0, adică nu exist ă diferențe
semnificative între varian ța reziduurilor pe întreaga perioad ă și suma varian țelor reziduale pe cele
două subperioade.
Se poate accepta stabilitatea coeficien ților pe întreaga perioad ă.

7. Previziuni folosind modelul regresiei multiple
Procedura de estimare a valorilo r viitoare ale vari abilei dependente, y, este similar ă cu cea
utilizată la regresia simpl ă. Se cunosc valorile viitoare ale variabilelor explicative și în funcție de
acestea se stabilesc previziunile punctuale, dup ă care, cu o anumit ă probabilitate se estimeaz ă
intervalele de încredere al e acestor valori viitoare.
Pentru perioada de la 1 la n, cu t=1,n , modelul este:
tkk t t t xa xa xa a y, ,22 ,11 0 ˆ… ˆ ˆ ˆ ˆ ++++= .
Previziunea pentru unitatea de timp t+h, unde h este orizontul de previziune, sau i+h, dacă
datele sunt observate în mod instantaneu este:
htkk ht ht ht xa xa xa a y+ + + + ++++=, ,22 ,11 0 ˆ… ˆ ˆ ˆ ˆ .
Eroarea de previziune este: ht ht ht y y e+ + +−= ˆ.

81Conform ipotezelor modelului liniar general, previziunea hty+ˆ este nedeplasat ă și se obține
prin aplicarea direct ă a modelului de regresie estimat. Se calculeaz ă varianța erorii de previziune,
care permite determinarea unui interval de încredere pentru previziune. Aceast ă varianță se
calculează astfel:
]1 ) ( [1 2 2+′′=+−
++ ht ht e X XX X
ht εσσ
Cunoscând vectorul htX+, care con ține valorile viitoare ale va riabilelor explicative, se
dorește obținerea vectorului valo rilor previzionate htY+ˆ.
⎟⎟⎟⎟⎟⎟
⎠⎞
⎜⎜⎜⎜⎜⎜
⎝⎛
=
+++
+
htkhtht
ht
xxx
X
,,2,1
…1

Eroarea de previziune hte+ urmează o lege normal ă de medie 0 și varianță 2
hte+σ , N(0, 2
hte+σ ).
Înlocuind varian ța erorilor 2
εσ cu varian ța estimată, cea a reziduurilor 2ˆεσ, se deduce c ă raportul:
]1 ) ( [ˆˆ
1 2+′′−
+−
++ +
ht htht ht
X XX Xy y
εσ
urmează o lege Student cu n-k-1 grade de libertate, unde k este num ărul variabilelor explicative din
model. Intervalul de încredere pentru un prag de semnifica ție de α,
este: ]1 ) ( [ ˆ1 2 2/
1 +′′ ±=+−
+ −− + + ht ht kn ht ht X XX X t y ICyεασ .

7.1. Exerci țiu – Previziuni folosind modelul regresiei multiple
Pentru exerci țiul anterior, prezentat în paragraf ul 2.6.2. se alege modelul cu dou ă
variabile explicative, dup ă ce s-a eliminat variabila x3, care a fost identificat ă ca fiind
nesemnificativ ă. Tabela de regresie a acestui model t t t x x y,2 ,1 328.0 715.0 143.29ˆ − += se găsește în
Tabelul 2.6.
Știind că valorile variabilelor x1 și x2 pentru urm ătoarele dou ă luni, 15 și 16 sunt: x1,15=3 și
x1,16=6, respectiv x2,15=24 și x2,16=38, să se calculeze previziunea și intervalul s ău de încredere de
95%, pentru lunile 15 și 16.
Soluție:
Pentru o probabilitate de 95%, valoarea teoretic ă Student este:

82201.2025.0
10025.0
12142/
1 ===−− −− t t tknα.
Tabela de regresie din Tabelul 2.6 arat ă că estimatorii coeficien ților sunt to ți semnificativi
diferiți de 0. Previziunile pentru lunile 15 și 16 se ob țin direct prin înlocuirea în model a valorilor
variabilelor explicative. Varianțele reziduur ilor sunt:
]1 ) ([ˆ ˆ151
152 2
15+′′=−X XXXe εσσ și ]1 ) ([ˆ ˆ161
162 2
16+′′=−X XXXe εσσ .
Cei doi vectori ai variabilelor explicative sunt:
⎟⎟⎟
⎠⎞
⎜⎜⎜
⎝⎛
=
2431
15X ,
⎟⎟⎟
⎠⎞
⎜⎜⎜
⎝⎛
=
3861
16X .
Se calculeaz ă 1) (−′XX , fără a se considera și valorile viitoare pentru lunile 15 și 16, ci numai
numărul de observ ări ale celor dou ă variabile explicative care intr ă în estimarea modelului:
⎟⎟⎟
⎠⎞
⎜⎜⎜
⎝⎛
=′
17600 3361 4903361 815 99490 99 14
XX ;
⎟⎟⎟
⎠⎞
⎜⎜⎜
⎝⎛
=′−
0.0028 0.0025 0.1163-0.0025 0.0110 0.1668-0.1163- 0.1668- 5.3223
) (1XX .
() 738.111
2431
0.0028 0.0025 0.1163-0.0025 0.0110 0.1668-0.1163- 0.1668- 5.3223
2431 5385.2 ˆ2 2
15=
⎥⎥⎥
⎦⎤
⎢⎢⎢
⎣⎡
+
⎟⎟⎟
⎠⎞
⎜⎜⎜
⎝⎛
⎟⎟⎟
⎠⎞
⎜⎜⎜
⎝⎛
=eσ ; 426 .3 ˆ
15=eσ .
() 043.7 1
3861
0.0028 0.0025 0.1163-0.0025 0.0110 0.1668-0.1163- 0.1668- 5.3223
3861 5385.2 ˆ2 2
16=
⎥⎥⎥
⎦⎤
⎢⎢⎢
⎣⎡
+
⎟⎟⎟
⎠⎞
⎜⎜⎜
⎝⎛
⎟⎟⎟
⎠⎞
⎜⎜⎜
⎝⎛
=eσ ; 654.2 ˆ
16=eσ .
Valorile punctuale ale va riabilei dependente sunt:
41.23 24 328.03 715.0 143.29 ˆ15 =⋅−⋅+=y
96.20 38 328.06 715.0 143.29 ˆ16 =⋅−⋅+=y .
Intervalele de încredere ale previziunilor sunt:
426.3 201.2 41.23 ˆ ˆ:
15025.0
11 15 15 ⋅±= ±e t y ICy σ , ] 95.30 ; 87.15[15= ICy ;
654.2 201.2 96.20 ˆ ˆ:
16025.0
11 16 16 ⋅±= ±e t y ICy σ , ] 26.80 ; 12.15[16= ICy .

83Evoluția vânzărilor, ajustarea si previziunea lor
101520253035
123456789 1 0 1 1 1 2 1 3 1 4 1 5 1 6
lunimil. eur o
y yt lim.inf. lim.sup.

Figura 2.20. Evolu ția valorii vânz ărilor, ajustarea și previziunea lor

În Figura 2.20 sunt prezentate va lorile teoretice care ajusteaz ă seria inițială și previziunile
pentru urm ăroarele dou ă perioade, precum și intervalul de încredere care la cuprinde.
Pentru a putea reprezenta limitele inferioar ă și superioar ă se creaz ă două serii de date
identice cu cea ajustat ă și se completeaz ă cu limitele inferioare, respectiv superioare, ale celor dou ă
intervale de încredere.
Se are în vedere reprezentarea cu acela și tip de marcator ale cel or trei serii: ajustat ă, a
limitelor inferioare și a limitelor superioare ale interv alelor de încredere, acestea dou ă din urmă
suprapunându-se peste valorile ajustate, pân ă în luna a 14-a.

84Rezumat:
Aceast capitol prezint ă modelul regresiei multiple, ipotezele de lucru, estimarea
coeficienților modelului, intervalele lor de încredere, testarea semnifica ției estimatorilor modelului,
testarea semnifica ției globale a regresiei, construirea de teste pentru verificarea validit ății modelului
și a stabilit ății sale, previziunea cu modelul regresiei multiple.
Exemplele ofer ă explicații pentru în țelegerea obiectivelor capitolului.

Termeni importan ți:
Model de regresie multipl ă, estimatorii modelului de regresie multipl ă, ipotezele modelului
de regresie multipl ă, testul F de verificare a semnifica ției globale a regresiei, ANOVA, testul Chow

Întrebări recapitulative
1. Enumerați ipotezele modelului de regresie multipl ă
2. Scrieți modelul de regresie pe baza unei tabelei de regresie multipl ă.
3. În ce const ă testul Chow?
4. Cum stabili ți daca estimatorii modelului sunt semnificativ diferi ți de zero?
5. Reprezenta ți tabelul de analiz ă a varianței ANOVA si testul F pentru regresia multipl ă.
6. Cum se construiesc intervalele de încredere al e estimatorilor? Dar ale valorilor previzionate?
7. Cum aprecia ți validitatea unui model de regresie multipl ă?

Teme de cas ă
Parcurgeți exemplele din curs util izând calculatorul; realiza ți graficele și tabela de regresie.
Sa se stabileasc ă matriceal estimatorii modelului de regresie multipl ă.

85CAPITOLUL 3

Tema MULTICOLINIARITATEA ȘI SELEC ȚIA VARIABILELOR
EXPLICATIVE
Obiectivele 1. Corelația parțială, în modelele econometrice
1.1. Calculul coeficien ților de corela ție parțială
1.2. Exerci țiu – Calculul coeficien ților de corela ție parțială
2. Multicoliniaritatea 2.1. Consecin țele multicoliniarit ății
2.2. Detectarea multicoliniarit ății
2.3. Remedierea multicoliniarit ății
3. Selecția variabilelor explicative
3.1. Exerci țiu – Metode de selec ție a variabilelor explicative
Finalitatea –
Competen țe
dobândite 1. Estimarea coeficien ților de corela ție parțială
2. Eliminarea din modelul de regresie multipl ă a variabilelor explicative
multicoliniare
3. Cunoașterea și aplicarea metodelor de selec ție a variabilelor explicative
Mijloace
– citire/înv ățare
– întreb ări, probleme ce apar, explica ții
– definiții, explica ții ce trebuie re ținute
– situații economice concrete, supuse analizei, exemple (sub lup ă)
– teme de cas ă, aplicații practice pentru studen ți
Evaluarea – parcurgerea aplica țiilor propuse
Timp de lucru
necesar 1. Pentru cunoa șterea problemei: 3 ore
2. Pentru rezolvarea temelor: 4 ore + timpul de documentare

86MULTICOLINIARITATEA ȘI SELEC ȚIA
VARIABILELOR EXPLICATIVE

În construirea unui model, se caut ă o combina ție optimă de variabile explicative, care s ă
maximizeze coeficientul de corela ție multipl ă cu seria variabilei explicate, și care să fie în acela și
timp cât mai pu țin corelate între ele.

1. Corela ția parțială, în modelele econometrice
Coeficien ții de corela ție parțială permit determinarea aportului fiec ărei variabile
exogene la explicarea variabilei endoge ne. De exemplu, pentru modelul cu dou ă variabile
explicative:
yt = a 0 + a 1x1t + a 2x2t + εt , se pot calcula:
– coeficienți de corela ție simplă:
– ryx1, între y și x1,
– ryx2, între y și x2,
– rx1x2, între x1 și x2;
– coeficienți de corela ție parțială:
– ryx1.x2, între y și x1, când influen ța lui x2 este retras ă (menținută constantă),
– ryx2.x1, între y și x2, când influen ța lui x1 este retras ă (menținută constantă).
Coeficientul de corela ție parțială măsoară legătura dintre dou ă variabile în timp ce influen ța
celei de a treia este men ținută constantă (retrasă).
Coeficien ții de corela ție parțială se interpreteaz ă la fel ca și coeficien ții de corela ție simplă.
Coeficien ții de corela ție parțială se situeaz ă în intervalul [-1, 1]. Valorile apropiate de ⏐1⏐arată o
corelație parțială mare, iar valorile apropiate de 0, o corela ție parțială mică. Cu cât un coeficient de
corelație parțială este mai mare cu atât contribu ția variabilei respective este mai important ă la
explicarea global ă a modelului.
Coeficientul de determina ție parțială are expresia r2
yx1.x2, de exemplu, și semnific ă
proporția din varia ția variabilei y neexplicat ă de variabila x2, care este explicat ă prin considerarea
variației variabilei x1.

87Explicarea grafic ă a coeficien ților de corela ție poate contribui la mai buna în țelegere a
conținutului lor. Fie un model cu dou ă variabile explicative:
t t22 t11 0 t e xaˆ xaˆ aˆ y +++= .
În Figura 3.1 se prezint ă trei situa ții posibile de interac țiune între variabila dependent ă y și
cele două variabile explicative consid erate în model: variabilele x1 și x2 sunt independente între ele
și fiecare influen țează variația variabilei y, cazul a); în cazul b) variabilele x1 și x2 sunt
interdependente, ambele pot influen ța variabila y, sau numai una din ele, ca re la rândul ei se af ă în
interdependen ță cu cealalt ă variabilă explicativ ă. Se spune despre variabile c ă sunt coliniare; se
poate manifesta fenomenul de multicoliniaritate.

y x
2 y y

x2
x1 x 1 x 1
x 2

a) Variabilele x1, x2 sunt b) Variabilele x1, x2 sunt corelate
independente între ele (coliniare)

Figura 3.1. Reprezentarea grafic ă a unor tipuri de rela ții între variabile

În cazul a) se pot calcula coeficien ți de corela ție simplă: ryx1 – între y și x1 și ryx2 – între y și
x2. Coeficientul de determina ție este în acest caz: R2
yx1x2 = r2
yx1 + r2
yx2, iar coeficientul de corela ție
multiplă este: 2
22
1 21 yx yx xyx r r R += .
Pe grafic coeficientul de determina ție este suma suprafe țelor de intersec ție dintre y și x1,
respectiv dintre y și x2. Coeficien ții de corela ție parțială sunt: ryx1.x2 = r y.x1 ; ryx2.x1 = r yx2.
În cazul b) variabilele explic ative sunt interdependente și coeficientul de determina ție este
suma suprafe țelor de intersec ție dintre:
– y și x1 separat, f ără zona influen ței comune a lui x1 și x2 asupra lui y,
– y și x2 separat, f ără zona influen ței comune a lui x1 și x2 asupra lui y,
– y, x1 și x2, zona de influen ță simultană a celor dou ă variabile explicative asupra lui y.
Pentru calculul coefic ientului de determina ție, respectiv a coeficientului de corela ție
multiplă, trebuie s ă se elimine interinfluen ța dintre variabilele explicative, din suma coeficien ților
de determina ție a variabilelor explicative.

88
Generalizând no țiunea de corela ție parțială, pentru modelul cu k variabile
explicative, se poate spune c ă un coeficient de corela ție parțială măsoară legătura dintre dou ă
variabile, în timp ce influen ța uneia sau mai multor variabile este men ținută constant ă (retrasă).
Numărul variabilelor a c ăror influen ță se retrage, stabile ște ordinul coeficientului de
corelație parțială respectiv . Coeficien ții de corela ție simplă se mai numesc de coeficien ți de
corelație de ordinul 0. Într-un model cu k variabile explicativ e, ordinul maxim pân ă la care se pot
calcula coeficien ți de corela ție parțială este k–1, deoarece nu se poate retrage influen ța tuturor
variabilelor explicative.
Fie y, variabila de explicat și x1, x2, x3, variabilele explicative ( k = 3 ). Coeficien ții de
determina ție pentru regresiile dintre y și fiecare variabil ă explicativ ă considerat ă separat, sunt R2
yx1,
R2
yx2, R2
yx3. Aceștia sunt egali cu coeficien ții de corela ție simplă ridicați la pătrat, deoarece leg ătura
este liniar ă. Se pot scrie r2
yx1, r2
yx2, r2
yx3 și arată proporția cu care contribuie fiecare din variabilele
exogene la explicarea varian ței lui y.
Se pot calcula 6 coeficien ți de corela ție parțială de ordinul 1 :
ryx1.x2 ; ryx1.x3 ; ryx2.x1 ; ryx2.x3 ; ryx3.x1 ; ryx3.x2 ;
și 3 coeficienți de corela ție parțială de ordinul 2 :
ryx1.x2x3 ; ryx2.x1x3 ; ryx3.x1x2 ;
Ultimul ordin pân ă la care se pot calcula coeficien ții de corela ție parțială, este 2, când k=3.
1.1. Calculul coeficien ților de corela ție parțială
Coeficien ții de corela ție parțială se poate calcula în dou ă moduri:
A) – pornind de la reziduurile e1 și e2 rezultate în urma a dou ă regresii:
1. regresia dintre variabila de explicat y și variabilele retrase,
2. regresia dintre variabila explicativ ă xi a cărei influen ță se analizeaz ă, și variabilele explicative
retrase.
parcurgându-se urm ătoarele etape: – exemplu pentru calculul r2
yx3.x1x2 :
a) regresia y = f(x 1, x2) , y t = a 0 + a 1x1t + a 2x2t + ε1t, unde t=1, 2, …, n ;
b) calculul reziduurilor ) ˆ ˆ ˆ( ˆ22 11 0 1 t t t t t t xa xa a y yy e ++−=−= ;
c) regresia x3 = f(x 1, x2) , x 3t = b 0 + b 1x1t + b 2x2t + ε2t, unde t=1, 2, …, n ;
d) calculul reziduurilor ) ˆ ˆˆ( ˆ22 11 0 3 3 3 2 t t t t t t xb xbb x x x e ++−=−= ;
e) calculul coeficientului de corela ție simplă între e1 și e2: r2
yx3.x1x2 =r2
e1e2. Coeficientul de corela ție
parțială este coeficientul de corela ție simplă al reziduurilor ob ținute.

89B) – pornind de la testul Student. Aceast ă metodă se utilizeaz ă numai pentru calculul coeficien ților
de corela ție parțială de ordinul k-1. Într-un model cu k variabile explicative, exist ă următoarea
relație între ra țiile Student calculate, ale estimatorilor coeficien ților de regresie ai variabilelor
explicative și coeficien ții de corela ție parțială de ordinul k-1: r2
yxi.(celelalte k-1 variabile) =
)1kn(tt
2
i2
i
−−+ , unde ti reprezintă rația Student empiric ă pentru variabila xi a cărei influen ță asupra
lui y, se analizeaz ă.

1.2. Exerci țiu – Calculul coeficien ților de corela ție parțială

Pentru seriile de date din Tabelul 3.1. s ă se calculeze câte un coeficient de corela ție parțială pentru
fiecare ordin: ryx3.x1, ryx3.x1x2 , ryx3.x1x2x4 .

y x
1 x 2 x 3 x 4
9.5 83.7 18 92.5 92.5
10.7 88.8 21.5 93.6 95.6
11.5 100.7 25.6 96.5 97.5
12.5 105.5 29.5 94 97.4
13.3 118.5 34.6 100.2 100.2
15.3 131.4 40.5 101.5 101.4
16.8 148.5 44.4 105.4 104.6
18.8 162 49.8 112.8 109.8
19.5 174.5 51.5 112.6 111.5
21.5 185.3 53.8 112.7 112.2

Tabelul 3.1. Variabila dependent ă y și variabilele explicative

Coeficientul de corela ție parțială de ordinul 1: ryx3.x1 se obține prin parcurgerea urm ătorilor pași:
a) regresia lui y = f(x 1), prezentat ă în Tabelul 3.2:

90SUMMARY OUTPUT Regression Statistics
Multiple R 0.9969
R Square 0.9939
Adjusted RSquare 0.9931
Standard Error 0.3391
Obs. 10
ANOVA df SS MS F SignificanceF
Regression 1 149.4443 149.444 3 1299.89 3.84E-10
Residual 8 0.9197 0.1150
Total 9 150.364
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept 0.3463 0.4187 0.8270 0.4322 -0.6193 1.3119
XVariable1 0.1124 0.0031 36.0540 0.0000 0.1052 0.1195
Tabelul 3.2. Tabela de regresie y = f(x 1)

b) valorile teoretice
tyˆ și reziduurile e1t = y t – tyˆ= y t – (0.3463 + 0.1124x 1t);
c) regresia x3 = f(x 1), în Tabelul 3.3;

SUMMARY OUTPUT Regression Statistics
Multiple R 0.9780
R Square 0.9565
Adj. R Sq. 0.9510
Standard Error 1.8269
Obs. 10
ANOVA df SS MS F Significance F
Regression 1 586.57 586. 5766 175.7572 1E-06
Residual 8 26.7 3.3374
Total 9 613.27
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept 73.267 2.2561 32.47 0.0000 68.06 78.47
XVariable1 0.223 0.0168 13.26 0.0000 0.18 0.26

Tabelul 3.3. Tabela de regresie x3=f(x1)

d) valorile teoretice
t3xˆ și reziduurile e2t= x 3t – t3xˆ= x3t – (73.267 + 0.223x 1t).
Aceste valori teoretice și reziduurile sunt prez entate în Tabelul 3.4:

91tyˆ(x1) e1t t3xˆ(x1) e2t
9.8 -0.25 91.9 0.60
10.3 0.38 93.0 0.57
11.7 -0.16 95.7 0.82
12.2 0.30 96.8 -2.75
13.7 -0.36 99.6 0.56
15.1 0.19 102.5 -1.02
17.0 -0.23 106.3 -0.92
18.5 0.25 109.3 3.47
20.0 -0.45 112.1 0.49
21.2 0.33 114.5 -1.81

Tabelul 3.4. Calculul reziduurilor celor dou ă regresii

e) calculul r
e1e2 = r yx3.x1, prin formula prezentat ă anterior la paragraful 3.3, punctul e) sau
realizând regresia dintre cele dou ă serii de date e1 și e2, e1 = f(e 2) sau mai simplu, folosind func ția
CORREL pentru cele dou ă serii de reziduuri, se afl ă coeficientul lor de corela ție simplă, care este
egal cu cel de corela ție parțială căutat.
Extr ăgând radicalul din R Squared = 0.04296 , se obține coeficientul de corela ție dintre cele
două variabile, cu semnul coeficientului de re gresie. Deoarece coefic ientul de regresie a1, din
regresia e1t = a 0 + a 1e2t + v t, este negativ, rezult ă că: re1e2 = – 0.20728 și ryx3.x1= – 0.20728 , iar
coeficientul de determina ție parțială este r2
yx3.x1 = 0.04296 , o valoare destul de mic ă, care indic ă o
proporție foarte mic ă din varian ța neexplicat ă de x1 și explicată de x3.
Coeficientul de corela ție parțială al variabilei x3 asupra variabilei dependente y, când se
retrage influen ța variabilei x1 indică lipsa corela ției dintre y și x3. Valoarea acestui coeficient se
obține cel mai simplu folosind func ția CORREL , al cărei argument îl constituie cele dou ă serii de
reziduuri, indiferent de ordinea lor.
Pentru a efectua o analiz ă mai amănunțită a legăturilor dintre y, x1, și x3, se pot interpreta
corelațiile, deja existente, indicate de Multiple R , în Tabelele 3.2 și 3.3:
– între y și x1, considerat ă separat, este o corela ție puternic ă ryx1=0.9969≈0.997 ,
– între y și x3, considerat ă separat, exist ă deasemenea o leg ătură puternică, care se poate ob ține ușor
prin efectuarea regresiei y=f(x 3), în urma c ăreia R2
yx3=0.944 , iar radicalul din acesta este
coeficientul de corela ție simplă ryx3=0.9716 ≈ 0.972 ;
– între x1 și x3, este o corela ție puternic ă rx1x3 = 0.9779 ≈ 0.978 ;

92 Coeficientul de corela ție parțială ryx3.x1=-0.20728 , arată legătura dintre y și x3, menținându-
se constant ă influența lui x1; r2
yx3.x1 = 0.04296 arată cât din varian ța lui y este explic ă x3 din varian ța
rămasă neexplicat ă de x1; valoarea foarte mic ă provine din faptul c ă x1 și x3 sunt puternic corelate
pozitiv între ele.
Urmând procedura de mai sus se poate calcula și coeficientul de corela ție parțială dintre y și
x1, când se elimin ă influența lui x3: ryx1.x3= + 0.9462 . Valoarea apropiat ă de 1 a acestui coeficient,
indică o influen ță puternică a variabilei x1 asupra variabilei dependente y, dar în acela și timp exist ă
o puternic ă legătură între x1 și x3.
Pentru c ă 1 3 yx yx r r< , ambii coeficien ți sunt de acela și semn pozitiv, ar ătând corela ții de
intensitate mare asupra variabilei y, atnci 3.1 1.3 xyx xyx r r< și este firesc ca 03.1>xyxr indicând o
legătură puternică, iar 01.3<xyxr , indică o intensitate slab ă a corelației parțiale. Graficul acestor
corelații, fără a analiza și legăturile cu celelalte variabile, ar putea fi, cel din Figura 3.2:

y

x3
x1

Figura 3.2. Corela ții parțiale ale variabilelor x1 și x3 asupra variabilei y

Pe graficul din Figura 3.2 se poate vedea c ă suprafața influenței dintre y și x1 este mai mare
ca cea dintre y și x3, chiar cu por țiunea hașurată care reprezint ă coeficientul de determina ție parțială
r2
yx3.x1, variația rămasă între y și x3, după ce s-a eliminat influen ța variabilei x1 și explicat ă de x3.
Suprafața dintre y și x1, după ce s-a eliminat influen ța lui x3, măsurată prin r2
yx1.x3 este mai mare.

Coeficientul de corela ție parțială de ordinul 2: ryx3.x1x2 se obține prin parcurgerea etapelor:
a) regresia lui y = f(x 1, x2), prezentat ă în Tabelul 3.5:
Coeficientul de corela ție multipl ă Ryx1x2=0.997 , arată legătură o puternic ă între y, x1 și x2.

93SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9970
R Square 0.9940
Adjusted R Square 0.9922
Std Error 0.3603
Observations 10
ANOVA df SS MS F Signif. F
Regression 2 149.4551 74.7 276 575.5485 1.72E-08
Residual 7 0.9089 0.1298
Total 9 150.364
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept 0.5079 0.7141 0.7113 0.4999 -1.1806 2.1964
X Variable 1 0.1060 0.0221 4.7976 0.0020 0.0538 0.1583
X Variable 2 0.0179 0.0617 0.2894 0.7806 -0.1281 0.1639
Tabelul 3.5. Tabela de regresie y = f(x 1, x2)

b) valorile tyˆ și reziduurile e1t = y t – tyˆ = y t – (0.508 + 0.106x 1t + 0.018x 2t);
c) regresia x3 = f(x 1, x2), prezentat ă în Tabelul 3.6:

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9780
R Square 0.9565
Adjusted R Square 0.9440
Standard Error 1.9528
Observations 10
ANOVA df SS MS F Signif. F
Regression 2 586.583 293.291 5 76.91 1.72E-05
Residual 7 26.6930 3.8133
Total 9 613.276
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept 73.3916 3.8698 18.9653 0.0000 64.2410 82.5421
X Variable 1 0.2177 0.1198 1.8179 0.1119 -0.0655 0.5009
X Variable 2 0.0137 0.3346 0.0411 0.9684 -0.7776 0.8051

Tabelul 3.6. Tabela de regresie x3 = f(x 1, x2)
Coeficientul de corela ție multipl ă
Rx3x1x2 =0.978 , arată o legătură puternică între x3 și x1, x2.
d) valorile t3xˆși reziduurile e2t = x 3t – t3xˆ= x 3t – (73.39 + 0.218x 1t +0.014x 2t).
Valorile teoretice și reziduurile sunt prezentate în Tabelul 3.7:

94
tyˆ(x1,x2) e1t t3xˆ(x1,x2) e2t
9.7 -0.2 91.9 0.6
10.3 0.4 93.0 0.6
11.6 -0.1 95.7 0.8
12.2 0.3 96.8 -2.8
13.7 -0.4 99.7 0.5
15.2 0.1 102.6 -1.1
17.0 -0.2 106.3 -0.9
18.6 0.2 109.3 3.5
19.9 -0.4 112.1 0.5
21.1 0.4 114.5 -1.8
Tabelul 3.7. Valorile teoretice și reziduurile celor dou ă regresii

e) calculul re1e2 = r yx3.x1x2 , prin formula prezentat ă anterior, realizând re gresia dintre cele dou ă serii
de date e1 și e2, e1 = f(e 2) sau cu func ția CORREL .
Rezultă că: re1e2 = -0.2102 ; ryx3.x1x2 = -0.2102 , iar coeficientul de determina ție parțială r2
yx3.x1x2 =
0.0442 , are o valoare foarte mic ă.
Pentru a interpreta rezu ltatul, se pot calcula: rx1x2=0.9887 , rx3x2=0.9674 , ryx2=0.987 .
Se știe de la calculul coeficientului de corela ție parțială de ordinul 1, c ă: rx1x3=0.978 , ryx1= 0.997 ,
ryx3 = 0.972 . Se poate trage concluzia c ă variabilele x1, x2 și x3 sunt puternic corelate între ele și
fiecare din ele separat cu y. Concluzia este c ă între y și x3 nu exist ă corelație, dacă se retrag
variabilele x1 și x2.
Coeficientul de corela ție parțială de ordinul 3: ryx3.x1x2x4 .
a) regresia y = f(x 1, x2, x4), prezentat ă în Tabelul 3.8:
SUMMARY OUTPUT Regression Statistics
Multiple R 0.9970
R Square 0.9940
Adjusted R Sq. 0.9911
Standard Error 0.3863
Observations 10
ANOVA df SS MS F SignificanceF
Regression 3 149.4688 49.8 229 333.9411 4.61E-07
Residual 6 0.8952 0.1492
Total 9 150.364
Coefficients Standard
Error t Stat P-value Lower 95% Upper
95%
Intercept -2.5606 10.1626 -0.2520 0.8095 -27.43 22.31
X Variable 1 0.0980 0.0355 2.7651 0.0326 0.011 0.185
X Variable 2 0.0191 0.0663 0.2879 0.7831 -0.143 0.181
X Variable 3 0.0397 0.1311 0.3028 0.7723 -0.281 0.361
Tabelul 3.8. Tabela de regresie y = f(x 1, x2, x4)

95Coeficientul de corela ție multipl ă Ryx1x2x4 = 0.997 , arată legătura puternic ă între y, x1, x2, x4.
b) valorile tyˆ și e1t = y t – tyˆ= y t – (-2.561+ 0.098x 1t+0.019x 2t + 0.040x 4t);
c) regresia x3 = f(x 1, x2, x4), prezentat ă în Tabelul 3.9;

SUMMARY OUTPUT Regression Statistics
Multiple R 0.9878
R Square 0.9757
Std. Error 1.5776
Obs. 10
ANOVA df SS MS F Signif. F
Regression 3 598.3432 199. 4477 80.14 3.13E-05
Residual 6 14.9328 2.4888
Total 9 613.276
Coefficients Standard
Error t Stat P-
value Lower
95% Upper
95%
Intercept -16.5784 41.5071 -0.3994 0.7034 -118.1427 84.9859
X Variable 1 -0.0165 0.1448 -0.1138 0.9131 -0.3708 0.3379
X Variable 2 0.0495 0.2709 0.1829 0.8609 -0.6132 0.7123
X Variable 3 1.1643 0.5356 2.1738 0.0727 -0.1463 2.4749
Tabelul 3.9. Tabela de regresie x3 = f(x 1, x2, x4)

Coeficientul de corela ție multipl ă Rx3x1x2x4 = 0.987 , arată legătura puternic ă între x3, x1, x2, x4.
d) valorile t3xˆși e2t = x 3t – t3xˆ= x 3t – (-16.578 – 0.016x 1t + 0.049x 2t + 1.164x 4t).
Aceste valori teoretice și reziduurile sunt prezen tate în Tabelul 3.10:

tyˆ(x1x2x4) e2t t3xˆ(x1x2x4)e1t
9.7 -0.2 90.6 1.9
10.4 0.3 94.3 -0.7
11.7 -0.2 96.5 0.0
12.2 0.3 96.5 -2.5
13.7 -0.4 99.8 0.4
15.1 0.2 101.3 0.2
17.0 -0.2 105.0 0.4
18.6 0.2 111.1 1.7
20.0 -0.5 112.9 -0.3
21.1 0.4 113.7 -1.0
Tabelul 3.10. Valorile teoretice și reziduurile celor dou ă regresii
e) calculul re1e2 = r yx3.x1x2x4 , prin formula prezentat ă anterior, realizând regresia dintre cele dou ă serii
de date e1 și e2, e1 = f(e 2) sau cu func ția CORREL aplicată serrilor reziduurilor. Rezult ă că: re1e2 = –
0.3929 ; ryx3.x1x2x4 = -0.3929 , iar coeficientul de determina ție parțială este r2
yx3.x1x2x4 = 0.1544 , o

96valoare mic ă, apropiat ă de 0, indicând o mic ă proporție a variației variabilei y, explicată de variabila
x3, când se retrage influen ța celorlalte variab ile explicative.
Datorită corelației mari dintre variabilele explicative (valorile apropiate de 1 ale
coeficienților de corela ție multipl ă de mai sus) și de asemenea dintre y și x4: ryx4 = 0.9882 ,
coeficientul de corela ție parțială de ordinul 3 al acelea și variabile x3 față de y, este mic și de acela și
semn negativ. Între y și x3 nu există corelație dacă se retrag variabilele x1, x2 și x4.
Coeficientul de corela ție parțială de ordinul 3, fiind ultimul ordin posibil de calculat, se
poate obține și prin modalitatea de calcul pornind de la ra ția t Student . Valoarea sa trebuie s ă fie
aceeași cu cea deja ob ținută prin procedeul an terior prezentat.
Etapele care se parcurg sunt urm ătoarele:
a) regresia complet ă y = f(x 1, x2, x3, x4), prezentat ă în Tabelul 3.11:
b) rația Student a variabilei a c ărei influen ță asupra lui y se studiaz ă, t3, corespunz ătoare lui x3, –
0.9555 se înlocuie ște în formula:
15439.0)14 10() 9555.0() 9555.0(
)1 (22
2
32
3 2
421.3 =−−+ −−=−−+=kn ttrxxxyx
3929.0 15439.0421.3 −= =xxxyxr .
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9975
R Square 0.9950
Adjusted R Square 0.9909
Standard Error 0.3891
Observations 10
ANOVA df SS MS F Signif. F
Regression 4 149.607 37.4 018 247.0493 6.27E-06
Residual 5 0.7570 0.1514
Total 9 150.364
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept -4.1555 10.3724 -0.4006 0.7052 -30.8186 22.5075
X Variable 1 0.0965 0.0358 2.6976 0.0429 0.0045 0.1884
X Variable 2 0.0239 0.0670 0.3561 0.7363 -0.1483 0.1961
X Variable 3 -0.0962 0.1007 -0.9555 0.3832 -0.3550 0.1626
X Variable 4 0.1517 0.1766 0.8590 0.4296 -0.3023 0.6057
Tabelul 3.11. Tabela de regresie y = f(x 1, x2, x3, x4)
Semnul acestui coeficient este dat de sem nul (negativ) coeficientului de regresie
corespunz ător variabilei x3.
Rațiile Student calculate comp arate cu valoarea teoretic ă t5α/2= 2.571 , pentru 5 grade
libertate și un prag de semnifica ție α = 5%, indic ă numai variabila x1, ca fiind semnificativ diferit ă

97de 0. La celelalte se poate renun ța, fapt confirmat și de rezultatele ob ținute pentru coeficien ții de
corelație parțială ai lui x3.
Din cauza puternicei corela ții dintre variabilele e xplicative – fenomen numit
multicoliniaritate – variabila x3 apare cu semnul negativ, chiar dac ă legătura sa cu y este direct ă, și
la fel și cu celelalte variabile explicative.
Ca o consecin ță a multicoliniarit ății, în acest exemplu este evident c ă deși coeficientul de
determina ție este foarte mare, R2=0.9949 , apar ca fiind nesemnificative variabilele explicative. Se
reține în model, ca variabil ă semnificativ ă, numai variabila x1.

2. Multicoliniaritatea
Una din ipotezele modelului liniar clasic de regresie este aceea c ă nu exist ă
multicoliniaritate printre variabilele explicative incluse în model.
Termenul de multicoliniaritate , la originea sa însemna existen ța unei rela ții liniare
″perfecte″ sau ″exacte″ dintre unele sau între toate variab ilele explicative ale unui model de
regresie. Sensul recent al acestui termen este mai larg, referindu-se și la o rela ție mai pu țin
determinist ă.
Despre dou ă serii x1 și x2, se spune c ă sunt ortogonale sau independente dacă au covarian ța
nulă: cov(x 1, x2) = 0 . În acest caz, coeficientul lor de corela ție simplă este 0. Dac ă coeficientul de
corelație simplă dintre dou ă variabile este egal cu ⏐1⏐, seriile sunt perfect corelate, fie pozitiv, fie
negativ. Leg ătura dintre ele este perfect ă sau determinist ă. Când valoarea coeficientului de corela ție
simplă este apropiat ă de⏐1⏐, deși relația lor nu este determinist ă, variabilele sunt puternic corelate.
În practic ă seriile de date sunt mai mult sau mai pu țin corelate între ele. Multicoliniaritatea se referă
strict la existen ța mai multor rela ții liniare, iar termenul de coliniaritate se referă la existen ța unei
singure rela ții liniare. Aceast ă distincție nu se face în practic ă, folosindu-se în ambele situa ții
termenul de multicoliniaritate.
În cazul a dou ă variabile explicative, intercorela ția lor se măsoară cu coeficientul de
corelație simplă dintre ele. Intercorela ția în cazul mai multor variabile explicative se m ăsoară cu
ajutorul coeficien ților de corela ție parțială sau prin coeficientul de corela ție multipl ă R a unei
variabile xi cu toate celelalte variabile x considerate împreun ă.
În esență, multicoliniaritatea este un fenomen de e șantionare, deoarece chiar dac ă în
populație, variabilele xi sunt necorelate liniar , se poate ca într-un e șantion dat, ele s ă fie corelate.
Astfel încât, de și teoretic se poate considera c ă variabilele xi au o influen ță separată sau
independent ă asupra variabilei dependente y, se poate întâmpla ca în e șantionul dat pentru a testa

98funcția de regresie a popula ției, unele variabile xi, să fie atât de puternic corelate, încât s ă nu se
poată izola influen ța lor individual ă asupra lui y.
2.1. Consecin țele multicoliniarit ății
Se pot întâlni urm ătoarele consecin țe ale multicoliniarit ății:
– varianțe și covarian țe mari ale estimatorilor coeficien ților de regresie;
– intervale mari de încredere ale estimatori lor, din cauza abaterilor standard mari;
– rațiile t Student nesemnificative, din cauza abaterilor standard mari;
– un coeficient mare de determina ție R2, dar rațiile t nesemnificative;
– instabilitatea estimatorilor și a abaterilor lor standard la mici schimb ări ale datelor;
– în caz de multicoliniaritate perfect ă matricea XX′ este singular ă (determinatul este 0), estimarea
coeficienților este imposibil ă și varianța lor, infinit ă.
În Tabelul 3.11, regresia y = f(x 1, x2, x3, x4) din exerci țiul prezentat în paragraful 3.1.3,
indică un coeficient de determina ție mare, de 0.995, iar testul Fisher arat ă că regresia este global
semnificativ ă cu o probabilitate de 100% ( Significance F ). Cu excep ția coeficientului variabilei x1,
care este semnificativ, restul coeficien ților au rațiile Student mai mici decât valoarea critic ă pentru
un prag de semnifica ție de 5%. Intervalele de încredere ale estimatorilor, cu excep ția intervalului
pentru 1ˆa, schimbă s e m n u l d e l a m i n u s l a p l u s , c o n ținând valoarea 0 și indicând faptul c ă sunt
nesemnificativi.
2.2. Detectarea multicoliniarit ății
Pentru că în esență, multicoliniaritatea este un fenomen de e șantionare, nu exist ă o metodă
unică de detectare și măsurare a intensit ății sale. Exist ă câteva reguli pentru stabilirea existen ței
sale:
1. R2 mare, dar pu ține rații t semnificative reprezint ă un simptom ″clasic″ de existen ță a
multicoliniarit ății. Testul F de semnifica ție globală a regresiei va fi în majoritatea cazurilor,
mai mare decât valoarea F teoretică, astfel că se va respinge ipoteza nul ă, conform c ăreia
coeficienții parțiali de regresie (estimatorii variabilelor explicative) sunt simultan egali cu
zero. Dar ra țiile t infirmă această concluzie. Prin valorile lor mici arat ă că nici unul sau
foarte pu țini coeficien ți de regresie sunt statistic semnificativ diferi ți de 0. De și acest
diagnostic este sensibil, dezavantajul s ău constă în faptul c ă în acela și timp, este prea
puternic, în sensul c ă se consider ă multicoliniaritatea ca fiind d ăunătoare numai când
influențele tuturor variabilelor explicative asupra lui y nu pot fi separate.

992. Corelațiile perechi puternice (perechi de câte dou ă variabile explicative) reprezintă o altă
regulă pentru detectarea multicoliniarit ății. Coeficien ții de corela ție simplă între doi
regresori pot avea valori mari și atunci multicoliniaritatea devine o problem ă serioasă. Ideea
principală, ce trebuie re ținută, este că nu este necesar ca ace ști coeficien ți să fie mari pentru
a exista coliniaritate. Coeficien ții mari de corela ție de ordinul 0 reprezint ă condiția
suficientă, dar nu și necesar ă pentru existen ța multicoliniarit ății, deoarece aceasta poate
exista chiar dac ă valorile lor sunt comparativ mici . Dacă modelul are numai dou ă variabile
explicative atunci coeficientul lor de corela ție simplă este suficient în aprecierea gradului de
coliniaritate.
Pornind de la aceast ă regulă, testul lui Klein , constă în compararea coeficientului de
determina ție R2, calculat pe modelul cu k variabile explicative:
e xaˆ… xaˆ xaˆ aˆykk 22 11 0 +++++=
cu pătratul coeficien ților de corela ție simplă dintre regresori, r2
xixj, unde i≠j. Dacă R2 < r2
xixj
pentru oricare i≠j, i,j =1,2,…,k , atunci exist ă o prezump ție de multicoliniaritate. Acest test
nu este un test propriu-zis și nici nu este conclude nt în toate cazurile.
3. Examinarea corela țiilor parțiale a fost propus ă de Farrar și Glauber, tocmai datorit ă
problemei men ționate pentru coeficien ții de corela ție simplă dintre regresori. Ei sus țin că, în
regresia dintre y și x1, x2, x3, dacă se găsește că R2
yx1x2x3 este mare, și comparativ r2
yx1.x2x3 ,
r2
yx2.x1x3 , r2
yx3.x1x2 sunt mici, aceasta poate sugera c ă variabilele x1, x2 și x3 sunt puternic
intercorelate și că cel puțin una din variabilele explicative este în plus. De și studiul
coeficienților de corela ție parțială ar putea fi foarte util, totu și nu se poate garanta c ă va
furniza un r ăspuns sigur în ceea ce prive ște multicoliniaritatea. Se poate întâmpla ca atât
R2
yx1x2x3 cât și toate corela țiile parțiale să fie suficient de mari, încât s ă pună sub semnul
întrebării afirmația lui Farrar și Glauber.
4. Regresiile auxiliare . Aflarea variabilei expl icative care este corelat ă cu alte variabile x, într-
o combina ție liniară exactă sau aproximativ ă, se poate realiza prin efectuarea regresiilor
pentru fiecare variabil ă xi și restul variabilelor x. Fiecare din aceste regresii se consider ă ca
fiind auxiliară față de regresia principal ă, considerat ă a fi regresia lui y în funcție de toate
variabilele explicative x. Un coeficient mare de determina ție sugereaz ă că xi este puternic
corelată cu celelalte variabile x. Pentru fiecare din aceste re gresii auxiliare se calculeaz ă
statistica F, după formula: )1kn/() R1()1k/( RF2
xk…3x2x.xi2
xk…3x2x.xi
i−− −−=∗, unde k este num ărul de
variabile regresori di n modelul auxiliar, n este volumul e șantionului, iar R2
xi.x2x3…xk este

100coeficientul de determina ție corespunz ător fiecărei regresii. Se compar ă Fi* cu valoarea
critică din tabela Fisher, pent ru un prag de semnifica ție α și (k-1) , (n-k-1) grade de libertate.
Dacă Fi* > Fα
k-1,n-k-1 acesta înseamn ă că acea variabil ă xi este coliniar ă cu celelalte variabile
x. Dacă Fi* < Fα
k-1,n-k-1 se spune c ă variabila xi nu este coliniar ă cu celelalte variabile x, caz
în care respectiva variabil ă xi se reține în model. Aceast ă metodă are neajunsurile ei, în
sensul că atunci când multicoliniaritatea presupune implicarea a mai pu ține variabile, este
dificil să se identifice inter-rela țiile separate.

2.3. Remedierea multicoliniarit ății

Există mai multe reguli de remediere a multicoliniarit ății, dar care nu reprezint ă metode
sigure de înl ăturare a ei. Câteva dintre aceste reguli sunt:
1. creșterea volumului e șantionului – este eficient ă numai dac ă se adaug ă observări
semnificativ diferite de cele care sunt deja consid erate în model, în caz cont rar, multicoliniaritatea
se menține;
2. înlăturarea variabilei puternic corelate poate conduce la o specificare incorect ă a
modelului. Eroarea de specificare duce la ob ținerea de estimatori erona ți, fiind mai d ăunătoare decât
acceptarea unei multicoliniarit ăți mici;
3. transformarea variabilelor – în serii de diferen țe de ordinul 1. Mode lul de regresie pe
diferențele de ordinul 1, reduce severitatea multicoliniarit ății, deoarece chiar dac ă există corelație
puternică între dou ă variabile, nu exist ă nici un motiv s ă se considere c ă aceasta s-ar men ține și între
diferențele lor de ordinul 1. Acest procedeu are și dezavantajele sale: termenul eroare din forma
transformat ă a diferen țelor de ordinul 1, s-ar putea s ă nu respecte una din ipot ezele modelului liniar
clasic, și anume erorile nu sunt serial corelate (corelație de ordinul 1). Dac ă în seriile ini țiale erorile
sunt independente sau necore late, în seria transformat ă, acestea vor fi serial corelate în majoritatea
cazurilor. Un alt dezavantaj este faptul c ă se pierde o observare prin diferen țiere, ceea ce este
important când volumul e șantionului este mic, și numărul gradelor de libertate se mic șorează cu 1.
Mai mult, în seriile de date instantanee, procedura de diferen țiere nu este corespunz ătoare, deoarece
nu există o ordine logic ă a datelor observate.
4. utilizarea altor metode cum sunt: analiza factorial ă, analiza în componente principale, sunt
deseori folosite pentru a ″rezolva″ problema multicoliniarit ății.
Se observ ă că nu în orice situa ție, când se ob țin valori t nesemnificative pentru estimatorii
coeficienților de regresie, exist ă multicoliniaritate. Lipsa de semnifica ție se poate datora și altor
cauze, cum ar fi:

101- metoda folosit ă pentru culegerea datelor, de exemplu e șantionarea variabilelo r regresori peste
valorile lor limit ă, pe care acestea le iau în popula ție;
– restricții asupra modelului sau asupra popula ției și a metodei de e șantionare folosit ă;
– specificarea modelului;
– supradimensionarea modelului, prin introducerea unui num ăr de variabile explicative, mai mare
decât num ărul de observ ări (în domeniul medical, când num ărul de pacien ți este mai mic decât
informațiile despre ei, cuprinse într-un num ăr mare de variabile).
Aplicarea în practic ă a uneia din modalit ățile de remediere, depinde de natura datelor și de
severitatea multicoliniarit ății. Nu se recomand ă utilizarea regresiei afectat ă de multicoliniaritate,
pentru previziune.

3. Selecția variabilelor explicative
Procedurile statistice de selec ție a variabilelor explicativ e permit determinarea acelor
variabile, care se adaug ă sau se retrag dintr-un mode l. Aceste demersuri exclud ra ționamentul
economic, permi țând găsirea unor modele, care deseori sunt bune din punct de vedere statistic, dar a
căror interpretare economic ă poate fi nul ă sau aberant ă. De aceea tehnicile automate de selec ție a
variabilelor explicative se utilizeaz ă cu pruden ță, completându-se rezultatele cu ra ționamentul
economic. Identificarea variabilelor explicative cele mai corelate cu variabila explicat ă și cel mai pu țin
corelate între ele, se face conform urm ătoarelor cinci proceduri:
1.
– toate regresiile posibile;
2. – eliminarea progresiv ă;
3. – selecția progresiv ă;
4. – regresia pas cu pas;
5. – regresia pe faze.
Toate regresiile posibile . Această metodă constă în efectuarea tuturor regresiilor posibile ( 2k – 1),
unde k este num ărul variabilelor explicative, candidate la intrarea în model. Se re ține acel model
care are coeficientul de determina ție, R2 cel mai mare și toate variabilele exp licative semnificative.
Dezavantajul acestei metode, este legat de num ărul k, de variabile explicative, care cu cât este mai
mare, cu atât duce la realizarea unui num ăr considerabil de regresii (de exemplu: k=10, num ăr
regresii posibile = 1023 ).
1. Eliminarea progresiv ă (Backward Elimination) . Această procedur ă constă în efectuarea
regresiei cu toate variabilele explicative și apoi eliminarea pe rând, a acelora a c ăror rație Student

102este mai mic ă decât valoarea critic ă. Procedura se utilizeaz ă, numai dac ă se poate estima efectiv,
modelul ini țial, ceea ce nu este mereu posibil. Modelul poate avea un num ăr mare de variabile
explicative, și atunci, riscul multicoliniarit ății este mare, iar matricea XX′ poate fi singular ă.
2. Selecția progresiv ă (Forward Regression) . Prin aceast ă procedur ă se parcurge un sens
invers celui descris în eliminarea progresiv ă.
– în prima etap ă, se selecteaz ă în model o variabil ă xi, care are coeficientul de corela ție simplă cu
variabila y, cel mai mare.
– în a doua etap ă se calculeaz ă coeficien ții de determina ție parțială r2
yxj.xi pentru j ≠ i și se reține
acea variabil ă xj, care are cel mai mare coeficient de corela ție parțială.
Selecția variabilelor se opre ște când ra țiile t calculate devin mai mici decât valoarea critic ă citită din
tabela Student.
3. Regresia pas cu pas (Stepwise regression) . Această procedur ă este identic ă cu cea
precedent ă, a selecției progresive , doar că înainte de a incorpora o nou ă variabilă explicativ ă se
examineaz ă rația t* a fiecăreia din variabilele explicative selec ționate în prealabil și se elimin ă din
model cele care au ra țiile t* mai mici decât valoarea critic ă.
4. Regresia pe faze sau pe st adii (Stagewise Regression) . Procedura aceasta permite
minimizarea intercorela țiilor dintre variabilele explicative, prin studiul reziduurilor. Etapele care se
parcurg sunt urm ătoarele:
– etapa 1: se selec ționează acea variabil ă explicativ ă, xi, care are coeficie ntul de corela ție simplă
cu y, cel mai mare;
– etapa a 2-a: se calculeaz ă reziduurile )xaˆ aˆ(y yˆy eit1 0 t t t t1 +−=−= și coeficien ții de corela ție
simplă între e1t și restul variabilelor explicative; se re ține aceea dintre ele, xj, care are acest
coeficient cel mai mare, considerând c ă va explica în continua re, cel mai bine, varian ța
reziduurilor;
– etapa a 3-a: se calculeaz ă un nou reziduu: )xaˆ xaˆ aˆ(y yˆy ejt2 it1 0 t t t t2 ++−=−= și coeficien ții
de corelație simplă între e2t și restul variabilelor explicative; se re ține aceea dintre ele, xk, care
are acest coeficient cel mai mare, ceea ce duce la ob ținerea altor reziduuri; procedura se termin ă
când de coeficien ții de corela ție simplă dintre reziduuri și variabilele explicative r ămase, devin
nesemnificativi.

1033.1. Exerci țiu – Metode de selec ție a variabilelor explicative
Pentru datele din Tabe lul 3.12, se exemplific ă cele cinci proceduri de selec ție a
variabilelor explicative.
y x 1 x 2 x 3 x 4
9.5 83.7 18 92.5 92.5
10.7 88.8 21.5 93.6 95.6
11.5 100.7 25.6 96.5 97.5
12.5 105.5 29.5 94 97.4
13.3 118.5 34.6 100.2 100.2
15.3 131.4 40.5 101.5 101.4
16.8 148.5 44.4 105.4 104.6
18.8 162 49.8 112.8 109.8
19.5 174.5 51.5 112.6 111.5
21.5 185.3 53.8 112.7 112.2
Tabelul 3.12. E șantionul de observ ări

1. Toate regresiile posibile
Pentru datele din Tabelul 3.12, k=4, (2k –1)=(24–1)=16-1=15 modelele.
• regresiile cu o variabil ă explicativ ă
(1) yt = 0.346 + 0.112x 1t + e t R2
yx1 = 0.994
(0.83) (36.05)
(2) yt = 3.466 + 0.311x 2t + e t R2
yx2 = 0.974
(4.96) (17.34)
(3) yt = – 34.219 + 0.481x 3t + e t R2
yx3 = 0.944
(-8.06) (11.62)
(4) yt = – 44.318 + 0.579x 4t + e t R2
yx4 = 0.977
(-13.64) (18.27)
• regresiile cu dou ă variabile explicative
(5) yt = 0.508 + 0.106x 1t + 0.018x 2t + e t R2
yx1x2 = 0.99395
(0.71) (4.80) (0.29)
(6) yt = 3.165 + 0.121x 1t – 0.038x 3t + e t R2
yx1x3 = 0.99414
(0.63) (7.74) (-0.56)
(7) yt = – 2.555 + 0.105x 1t + 0.037x 4t + e t R2
yx1x4 = 0.99396
(- 0.27) (4.49) (0.307)
(8) yt = – 6.850 + 0.231x 2t + 0.130x 3t + e t R2
yx2x3 = 0.9785
(- 0.79) (3.35) (1.20)
(9) yt = – 22.187 + 0.148x 2t + 0.309x 4t + e t R2
yx2x4 = 0.9864
(- 2.18) (2.26) (2.53)
(10) yt = – 45.88 – 0.090x 3t + 0.685x 4t + e t R2
yx3x4 = 0.9774
(- 9.90) (- 0.50) (3.22)

104• regresiile cu trei variabile explicative
(11) yt = 3.355 + 0.114x 1t + 0.018x 2t – 0.039x 3t + e t R2
yx1x2x3 = 0.9942
(0.61) (4.04) (0.28) (-0.53)
(12) yt = – 2.56 + 0.098x 1t + 0.019x 2t + 0.039x 4t + e t R2
yx1x2x4 = 0.9940
(- 0.25) (2.76) (0.28) (0.30)
(13) yt = -23.63 + 0.151x 2t – 0.109x 3t + 0.431x 4t + e t R2
yx2x3x4 = 0.9876
(-2.21) (2.23) (-0.76) (2.11)
(14) yt = -4.105 + 0.105x 1t – 0.093x 3t + 0.146x 4t + e t R2
yx1x3x4 = 0.9948
(- 0.43) (4.50) (-1.00) (0.89)
• regresia cu cele patru variabile explicative
(15) yt= -4.155+0.096x 1t+0.024x 2t–0.096x 3t+0.152x 4t+et R2
yx1x2x3x4 =0.998
(-0.40) (2.70) (0.36) (-0.95) (0.86)
Dintre cele 15 modele se elimin ă acelea care au una sau mai multe ra ții t Student calculate,
mai mici decât valoarea Student critic ă, tα/2
n-k-1, pentru un prag de semnifica ție α =5% și
corespunz ătoare pe rând, fiec ărui număr de grade de libertate: când k=1, tα/2
8=2.306 ; k=2,
tα/2
7=2.365 ; k=3, tα/2
6=2.447 ; k=4 , tα/2
5=2.571 . Se verific ă rațiile Student și pentru termenul
constant. În urma acestei opera ții se înlătură modelele: 1, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15.
Rămân ca fiind satisf ăcătoare trei modele: 2, 3 și 4. Dintre acestea se alege modelul (4)
deoarece are coeficientul de determina ție, R2, cel mai mare. Variabila x4 este singura care se re ține
pentru explicarea variabilei y. Modelul (1) are semnificativ ă variabila x1, are și coeficientul de
determina ție cel mai mare, dar termenul liber are ra ția Student nesemnificativ ă.

2. Eliminarea progresiv ă (Backward Elimination) .
Din modelul complet (regresia cu toate variabilele explicative):
(15) yt= -4.155 + 0.096x 1t + 0.024x 2t – 0.096x 3t + 0.152x 4t + e t
(-0.40) (2.70) (0.36) (-0.95) (0.86) R2
yx1x2x3x4 =0.998
se elimină variabilele x2, x3 și x4 ale căror coeficien ți de regresie au ra țiile t* mai mici decât valoarea
critică, tα/2
5=2.571, fiind astfel nesemnificativ diferi ți de 0. R ămâne de estimat modelul cu o
variabilă explicativ ă, x1 și anume modelul:
(1) yt = 0.346 + 0.112x 1t + e t R2
yx1 = 0.994
(0.83) (36.05)
Procedura se opre ște aici, deoarece variabila explicativ ă din model este semnificativ ă, în
urma aplic ării testului individual de semnifica ție, t. Se alege variabila x1. Dar modelul nu este
suficient de bun, pentru c ă termenul liber nu este semnificativ diferit de 0.

105Din cauza multicoliniarit ății variabilelor explicative, care s unt puternic corelate între ele, nu
se poate alege variabila x4, conform aceastei proceduri.

3. Selecția progresiv ă (Forward Regression) .
Pentru exerci țiul de mai sus, se pot ob ține imediat coeficien ții de corela ție simplă între y și
variabilele x1, x2, x3 și x4, extrăgând radicalul din R2
yx1, R2
yx2, R2
yx3, R2
yx4 pentru modelele 1, 2, 3, 4
sau direct citind Multiple R în tabelele de regresie corespunz ătoare modelelor, sau utilizând func ția
CORREL (array_1,array_2) :
ryx1=0.997; r yx2 =0.983; r yx3=0.975; r yx4=0.988.
În prima etap ă, se selecteaz ă în model variabila x1, care are coefic ientul de corela ție simplă,
ryx1, cu variabila y, cel mai mare.
În etapa a doua, se estimeaz ă trei modele cu dou ă variabile explicative: x1 și x2 (5), x1 și x3
(6), x1 și x4 (7). Se calculeaz ă coeficien ții de corela ție parțială și se reține variabila, care are acest
coeficient cel mai mare. Deoarece în modelele 5, 6, și 7 se observ ă că variabila introdus ă este
nesemnificativ ă, de fiecare dat ă, (privind regresiile cu dou ă variabile explicative) nu este necesar s ă
se mai calculeze coeficien ții de corela ție parțială. Procedura se opre ște și variabila aleas ă rămâne x1.

4. Regresia pas cu pas (Stepwise regression) .
Pentru exemplul prezentat:
– în prima etap ă se calculeaz ă coeficien ții de corela ție simplă dintre y și toate variabilele
explicative; se alege x1 pentru că are ryx1 cel mai mare;
– în etapa a doua se estimeaz ă modelele cu dou ă variabile explicative, prin ad ăugarea la model,
câte una a celor r ămase;
– se examineaz ă rațiile Student cu valoarea critic ă și se ajunge la situa ția descrisă deja.

5. Regresia pe faze sau pe stadii (Stagewise Regression) .
În exercițiul prezentat:
– în prima etap ă se alege variabila x1. Modelul este:
(1) yt = 0.346 + 0.112x 1t + e t R2
yx1 = 0.994
(0.83) (36.05)
– în etapa a 2-a se calculeaz ă reziduurile e1t = y t – (0.346 + 0.112x 1t), în Tabelul 3.13.

106yt x1 tyˆ e1t
9.5 83.7 9.8 -0.3
10.7 88.8 10.3 0.4
11.5 100.7 11.7 -0.2
12.5 105.5 12.2 0.3
13.3 118.5 13.7 -0.4
15.3 131.4 15.1 0.2
16.8 148.5 17.0 -0.2
18.8 162 18.5 0.3
19.5 174.5 20.0 -0.5
21.5 185.3 21.2 0.3
Tabelul 3.13. Calculul valorilor ajustate în func ție de x1 și reziduurile e1t

– în etapa a 3-a se calculeaz ă coeficien ții de corela ție simplă între reziduurile e1t și celelalte
variabile explicative:
re1x2 = 0.016 ; re1x3 = -0.043 ; re1x4 = 0.016 .
Coeficientul de corela ție simplă, re1x1 = 0, între x1 și e1 este nul, prin construc ție, deoarece în
e1 nu mai exist ă informație referitoare la x1. Ceilalți coeficien ți calculați, fiind foarte mici, deci
nesemnificativ diferi ți de 0, procedura de selec ție se termin ă. Variabila explicativ ă aleasă este x1.
Dintre tehnicile prezentate, cea a tuturor regresilor posibile , furnizeaz ă un rezultat diferit de
celelalte proceduri. Aleger ea variabilei explicative x1 este indicat ă de majoritatea procedeelor.

107Rezumat:
Cand variabilele explicative sunt corelate între ele apare fenomenul de multicoliniaritate , ale
cărui consecin țe nu pot fi ignorate în construirea unui model econometric. În aceast ă situație a
nerespect ării ipotezei de independen ță a variabilelor explicative, se identific ă variabilele corelate,
care se elimin ă din model, pastrându-se numai cele pu ternic corelate cu variabila dependent ă y, și
cât mai pu țin corelate între ele. Calculul coeficien ților de corela ție simplă dintre variabilele
explicative și a celor de corela ție parțială oferă informații pentru selec ția variabilelor explicative în
model. Aplicarea metodelor de selec ție a variabilelor explicative se poate face combinat, pentru a
ajunge la cea mai bun ă soluție.
Exemplele ofer ă explicații pentru în țelegerea obiectivelor capitolului.

Termeni importan ți:
Multicoliniaritate, coeficien ți de corela ție parțială de ordinul i, coeficien ți de determina ție
parțială de ordinul i, metode de selec ție a variabilelor explicative

Întrebări recapitulative
1. Explicați semnifica ția coeficientului de corela ție parțială.
2. Scrieți toți coeficien ții de corela ție parțială posibi a se calcula pentru un model cu trei
variabile explicative.
3. Ce este fenomenul de multicoliniaritate?
4. Care sunt consecin țele multicoliniarit ății?
5. Care sunt mijloacele de remediere a multicoliniarit ății?
6. Care sunt metodele de selec ție a variabilelor explicative?
7. Ce se întâmpl ă cand un model de regresie multipl ă prezintă indicatori foarte buni de
validitate, este global semnificativ, conform testului Fisher, dar are majoritatea estimatorilor modelului nesemnificativ diferi ți de zero?

Teme de cas ă
Parcurgeți exemplele din curs,utilizând calculatorul.
Folosi ți ambele metodele de estimare a coeficien ților de corela ție parțială de odinul k-1, într-
un model cu k variabile explicative, pe ntru un exemplu din curs.

108CAPITOLUL 4

Tema AUTOCORELA ȚIA ERORILOR
Obiectivele 1. Natura și cauzele autocorela ției erorilor
2. Detectarea autocorela ției
2.1. Exerci țiu – Testul Durbin –Watson
3. Estimatorii metodei celor mai mici p ătrate în prezen ța autocorela ției
4. Proceduri de estimare a lui ρ
4.1. Estimarea direct ă a lui ρ pornind de la regresia pe modelul ini țial
4.1.1. Exerci țiu – Estimarea parametrilor umui model în prezen ța
autocorela ției erorilor
Finalitatea –
Competen țe
dobândite 1. Detectarea autocorela ției erorilor de ordinul 1
2. Aplicarea metodei grafice pentru detectarea autocorela ției erorilor
3. Estimarea unui model în prezen ța autocorela ției erorilor
Mijloace
– citire/înv ățare
– întreb ări, probleme ce apar, explica ții
– definiții, explica ții ce trebuie re ținute
– situații economice concrete, supuse analizei, exemple (sub lup ă)
– teme de cas ă, aplicații practice pentru studen ți
Evaluarea – parcurgerea aplica țiilor propuse
Timp de lucru
necesar 1. Pentru cunoa șterea problemei: 4 ore
2. Pentru rezolvarea temelor: 4 ore + timpul de documentare

109AUTOCORELA ȚIA ERORILOR

O ipoteză important ă a modelului liniar clasic este aceea a inexisten ței autocorela ției erorilor
de ordinul 1 (corela ție serială). În cazul în care aceast ă ipoteză nu se respect ă este util de cunoscut
care este natura autocorela ției erorilor, care sunt consecin țele practice ale acesteia și cum se
remediază această problemă.

1. Natura și cauzele autocorela ției erorilor
Prin termenul de autocorela ție se define ște corelația dintre termenii unei serii de observ ări
ordonați în timp, dac ă seria este cronologic ă, sau ordona ți în spațiu dacă seria este instantanee. În
modelul liniar clas ic se presupune c ă nu exist ă o astfel de autocorela ție între erorile εt, t=1,n .
Simbolic, E(εt εt′) = 0 , t ≠ t′.
Când autocorela ția erorilor exist ă atunci: E(εt εt′) ≠ 0, t ≠ t′. În Figura 4.1, sunt prezentate diferite
forme de tendin țe, ce se pot manifesta în evolu ția erorilor pentru o serie de timp.
În Figura 4.1, cazul (a) prezint ă tendință ciclică, (b) și (c) – tendin țe liniare cresc ătoare,
respectiv descresc ătoare, (d) – tendin ță parabolic ă, iar (e) nu indic ă nici un trend sistematic printre
erori, prezentând situa ția când se respect ă ipoteza de lips ă a autocorela ție a erorilor.
Existența autocorela ției erorilor semnific ă faptul că o eroare ap ărută la momentul t depinde
de erorile care apar la mo mente anterioare de timp.
Cauzele care determin ă autocorela ția erorilor sunt:
1. inerția ce se manifest ă în majoritatea seriilor economice de timp. Datorit ă ciclurilor economice,
observările succesive sunt interdependente. În ge neral, ciclul economic presupune succesiunea
unor faze de expansiune cu cele de recesiune. O expansi une sau o recesiune început ă durează,
de obicei, mai mul ți ani. Aceste secven țe repetate de cre ștere, sunt urmate de noi cre șteri și
contracțiile sunt urmate de noi contrac ții, care definesc iner ția sau persisten ța ciclurilor
economice.
2. eroarea de specificare datorit ă excluderii unor variabile explicative importante , conduce la
apariția unui trend în comporta mentul erorilor. Influen ța variabilei excluse este asimilat ă
erorilor, ducând la ma nifestarea unei tendin țe sistematice în evolu ția acestora, producând astfel
o ″falsă″ autocorela ție;

110

εt et εt et εt et

(a) (b) (c)

εt et εt et

(d) (e)

Figura 4.1. Forme de evolu ție în timp a erorilor

3. eroarea de specificare datorat ă alegerii incorecte a func ției analitice a modelului . De exemplu,
dacă se alege o func ție liniară în locul uneia de gradul doi, atunci termenul care reprezint ă
pătratul variabilei explicative va fi cuprins în erori. Efectul sistem atic al acestuia face ca erorile
să manifeste autocorela ție din cauza specific ării incorecte a func ției analitice;
4. fenomenul
″pânză de păianjen″, care se reflect ă, în special, în domeniul ofertei de produse
agricole. Oferta acestor produse reac ționează la prețuri cu un lag (întârzi ere) de o perioad ă,
deoarece deciziile de ofert ă durează până se implementez ă (de exemplu: perioada de gesta ție,
perioade de cre ștere a recoltei). La începutul unui an agricol, recolta este influen țată de prețurile
practicate cu un an în urm ă. Astfel func ția ofertei este: yt = a 0 + a 1pt-1 + εt , unde yt este oferta,
iar pt-1 reprezint ă prețurile cu un an în urm ă. Dacă în anul t, prețul pt scade față de pt-1, atunci în
perioada t+1, agricultorii vor produce mai pu țin decât în perioada t. În aceast ă situație erorile εt

111nu se așteaptă să fie aleatoare, pentru c ă, dacă în anul t a fost supraproduc ție, ei tind s ă-și
diminueze produc ția în anul t+1, conducând astfel la fenomenul numit ″pânză de păianjen″ (în
limba englez ă Cobweb phemomenon);
5. întârzierile, numite laguri apar deseori în unele modele în care variabilele dependente observate
cu una, dou ă sau mai multe perioade în urm ă influențează variabila dependent ă din perioada
curentă. De exemplu, consumul la momentul t-1 poate influen ța consumul la momentul t,
deoarece consumatorii nu- și schimbă des comportamentul de consum, din ra țiuni psihologice,
tehnologice, institu ționale, etc. Dac ă se neglijeaz ă termenul întârziat, erorile care apar vor
reflecta sistematic o tendin ță datorită influenței consumului cu lag asupra consumului curent.
Astfel de modele, când variabila dependent ă cu lag devine variabil ă explicativ ă pentru ea îns ăși,
se numesc modele autoregresive .
6. modul de prelucrare a datelor poate produce autocorela ția erorilor în situa țiile când:
– în regresiile care folosesc serii de date trimestriale sub form ă de medii , care se ob țin prin
însumarea observ ărilor pe trei luni și împărțirea sumei la 3. Aceste medii netezesc
fluctuațiile lunare și pot conduce la o tendin ță sistematic ă ce se manifest ă în erori,
introducând autocorela ție;
– interpolarea sau ex trapolarea datelor pot constitui o alt ă sursă de manipulare a datelor.
Datele ob ținute prin interpolare, în interiorul un ui interval de timp, de exemplu, 10 ani,
în cazul recens ămintelor, care au loc din 10 în 10 ani, sau datele extrapolate înafara unei
perioade de timp analizate, impun o manifestare sistematic ă a unei tendin țe în erori, care
nu ar fi existat dac ă s-ar fi folosit datele originale.
Problema autocorela ției erorilor este cel mai adesea întâlnit ă la seriile de timp, dar poate
apărea și la seriile de date instantanee. În seriile instantanee nu poate exis ta o ordine cronologic ă,
dar în unele cazuri poate fi stabilit ă o ordine de similaritate. Astfel tendin ța de consum poate fi
diferită de la o regiune geografic ă la alta, de și este substan țial similar ă în interiorul unei regiuni
date. Reziduurile ob ținute în urma efectuarii unei re gresii, pot manifesta o tendin ță sistematic ă
asociată cu diferen țele regionale. Unii autori numesc aceasta autocorela ție spațială, ceea ce
înseamnă corelație în spațiu mai degrab ă decât în timp. Este important de știut că în analiza seriilor
instantanee, ordonar ea datelor trebuie s ă aibă o logică, un interes economic, care s ă dea sens
existenței autocorela ției erorilor.
Autocorela ția erorilor este fie pozitiv ă, fie negativ ă. Manifest ările în timp ale erorilor, în
ambele situa ții sunt prezentate în Figura 4.2. În general, seriile cronologice manifest ă o
autocorela ție pozitiv ă, pentru c ă majoritatea lor au, fie o evolu ție crescătoare, fie descresc ătoare
pentru o perioad ă de timp – prezentat ă în cazul (a) și nu manifest ă o mișcare constant ă sus – jos, ca

112cea din cazul (b). Autocorela ția este pozitiv ă, când corela ția între εt și εt-1 este direct ă (a), și
negativă, când corela ția între εt și εt-1 este invers ă (b).

εt εt

• •
• • •
• • • • •
• • • • •
0 • • • 0 •
• • timp • • εt-1
• • • •
• •

(a)

εt εt

• •
• • • • • •
• ••
0 • •
• •
• • timp • • εt-1
• • •
• •

(b)

Figura 4.2. Autocorela ția erorilor: pozitiv ă (a) și negativă (b)
În Figurile 4.3 și 4.4 se prezint ă cele dou ă grafice utile pentru a pune în eviden ță corelația
pozitivă a reziduurilor. Graficul din Figura 4.3 este de tip Line și arată evoluția în timp a
reziduurilor.

113

Evolutia erorilor
-200-150-100-50050100150200250300
1 4 7 1 01 31 61 92 22 52 83 13 43 74 04 34 64 95 25 5
timpuleroril e

Figura 4.3. Evolu ția erorilor în cazul corela ției pozitive

Graficul din Figura 4.4. este de tip Scatter și arată corelația de ordinul 1 dintre erorile,
respectiv reziduurile, la timpul t și t-1, care în exemplul prezentat este de 0.888, ar ătând o
intensitate puternic ă a cestei autocorela ții.

Corelația serială a erorilor
-200-150-100-50050100150200250300
-200 -100 0 100 200 300
e t-1e t

Figura 4.4. Autocorela ția pozitivă a erorilor, de ordinul 1

114Figura 4.5 și Figura 4.6 prezint ă aceleași tipuri de grafice, pentru corela ția negativ ă.
Intensitatea corela ției de ordinul 1, prezentat ă în graficul din Fi gura 4.6. este de -0.856.

Corelația inversă a erorilor
-1.0-0.8-0.6-0.4-0.20.00.20.40.60.81.0
123456789 1 0 1 1 1 2 1 3 1 4 1 5timpule t

Figura 4.5. Evolu ția în timp a erorilor, în cazul corela ției negative

Corelația inversă a erorilor
-1.0-0.50.00.51.0
-1.0 -0.5 0.0 0.5 1.0
e t-1e t

Figura 4.6. Corela ția serială a erorilor

În cazul în care nu exist ă autocorela ția erorilor, graficele evolu ției în timp a reziduurilor și
cel al autocorela ției de ordinul 1, vor fi asem ănătoare celor din Figur a 4.7, respectiv 4.8.
Coeficientul de corela ție de ordinul 1 (cu func ția CORREL) este 0.10, o valoare mic ă, apropiat ă de
0, indicând lipsa autocorela ției de ordinul 1.

115 Graficul din Figura 4.7, care arat ă lipsa autocorela ției de ordinul 1, prezint ă succesiuni de
reziduuri pozitive și negative, comparativ cu alternarea strict ă a reziduurilor pozitive cu cele
negative, la autocorela ția negativ ă, în Figura 4.5. Deosebirea între absen ța autocorela ției erorilor
față de corela ția lor pozitiv ă, în Figura 4.3, const ă în lipsa oric ărei tendin țe în evolu ția erorilor.

Evoluția reziduurilor
-80-60-40-20020406080
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55

Figura 4.7. Evolu ția în timp a reziduurilor, în cazul lipsei autocorela ției

Analiza autocorela ției reziduurilor de ordinul 1
-80-60-40-20020406080
-80 -60 -40 -20 0 20 40 60 80
et-1et

Figura 4.8. Lipsa autocorela ției reziduurilor

116Graficul din Figura 4.4 prezint ă „norul de puncte” în cazul autocorela ției pozitive, orientat,
de-a lungul bisectoarei unghiului drept, fiind exact invers orientat în cazul autocorela ției negative,
în Figura 4.6. În cazul lipsei autocorela ției reziduurilor, „norul de puncte” este dispersat și paralel
cu axa Ox, în Figura 4.8. Utilizarea celor dou ă grafice: forma de evolu ție a reziduurilor și
corelograma reziduurilor, c onstituie una din modalit ățile de detectare a prezen ței autocorela ției
erorilor.

2. Detectarea autocorela ției
Detectarea autocorela ției erorilor se face analizând rezi duurile, acestea fiind cunoscute.
Metodele de detectare a autocorela ției erorilor sunt:
a) – examinarea vizual ă a reziduurilor – metoda grafic ă
– dacă reziduurile sunt fie pozitiv e, fie negative pe mai multe perioade, atunci se manifest ă
o autocorela ție pozitivă;
– dacă reziduurile alterneaz ă (pozitive cu negative), schimbându- și semnul, se manifest ă o
autocorela ție negativ ă.
b) – Testul Durbin-Watson (DW)
Acest test permite detectarea autocorela ției erorilor de ordinul 1, adic ă de forma:
t 1t t ν+=−ρεε , cu νt → N(0,σ2
v) , ⏐ρ⏐< 1.
Această relație este cunoscut ă sub denumirea de schema Markov de ordinul 1 sau schema
autoregresiv ă de ordinul 1 – AR(1). Denumirea de model autoregresiv este corespunz ătoare,
deoarece se interpreteaz ă ca fiind regresia erorilor fa ță de ele îns ăși, retardate cu o unitate de timp și
de ordinul 1 , deoarece consider ă valoarea imediat trecut ă, adică de lag maxim 1.
Testul de ipoteze este urm ătorul:
H 0: ρ = 0 – nu exist ă autocorela ția erorilor;
H 1: ρ ≠ 0 – exist ă autocorela ția erorilor ( ρ poate fi ρ > 0 sau ρ < 0).
Pentru a testa ipoteza nul ă se calculeaz ă statistica DW:
()
∑∑
==−−
=n
1t2
tn
2t2
1t t
eee
DW , unde
et sunt reziduurile rezultate în urma estim ării modelului.

117Prin construc ția sa, aceast ă statistică variază între 0 și 4. ρˆ este estimatorul coeficientului de
regresie al variabilei explicative din regresia t 1t t v eρˆe +=− :

() ()
≈+ −
=+−
=−
=
∑∑∑∑
∑∑
∑∑
===−
=−
==−−
==−
n
ttn
tn
ttn
ttt t
n
ttn
tt tt t
n
ttn
tt t
ee ee e
ee ee e
eee
DW
12222
1
21
1222
1 1
1222
1 2 2

()ρ−≈
⎥⎥⎥⎥
⎦⎤
⎢⎢⎢⎢
⎣⎡
−≈⎟
⎠⎞⎜
⎝⎛−
≈ ∑∑
∑∑∑
==−
===−
ˆ12 122
1221
12221
n
ttn
ttt
n
ttn
tn
ttt t
eee
eee e

Coeficientul
∑∑
==−
=n
1t2
tn
2t1tt
eee
ˆρ se mai nume ște coeficient de autocorela ție de ordinul 1 sau coeficient de
autocorela ție de lag 1 . Ca orice coeficient de corela ție ρˆ ia valori în intervalul [-1, +1]:
– când ρˆ= 0, DW = 2 și atunci nu exist ă autocorela ția erorilor;
– când ρˆ= – 1 , DW = 4 și există autocorela ție negativ ă a erorilor;
– când ρˆ= +1 , DW = 0 și există autocorela ție pozitivă a erorilor.

Durbin și Watson au tabelat valorile critice ale testului DW, la un prag de semnifica ție de
5%, în func ție de volumul e șantionului și numărul variabilelor explicative, k. Lectura ascestei tabele
permite determinarea a dou ă valori d1 și d2, cuprinse între 0 și 2, care împart spa țiul cuprins între 0
și 4 astfel:

0 d
1 d2 2 4 – d 2 4 – d 1 4
I I I I I I I ? ? autocorela ție lips ă autocorela ție autocorela ție
pozitiv ă n e g a t i v ă

ρˆ> 0 ρˆ= 0 ρˆ< 0

118
Când d1 < DW < d 2 sau 4 – d 2 < DW < 4 – d 1, se manifest ă o îndoial ă (nedeterminare)
asupra existen ței sau lipsei de autocorela ție.
Pentru a utiliza aceast ă statistică este necesar ă îndeplinirea simultan ă a următoarelor condi ții:
– modelul s ă aibă termen constant (liber);
– numărul de observ ări să fie mai mare decât 15;
– variabila de explicat s ă nu figureze printre variabilele expli cative (nu în modele autoregresive);
– pentru seriile de date observate în mod instantaneu, acestea trebuie s ă fie ordonate dup ă
variabila de explicat.

2.1. Exerci țiu – Testul Durbin -Watson
Pentru modelul cu trei variabile explicative:
t t33 t22 t11 0 t xa xa xa a y ε++++= ,
se dispune de datele anuale ale variabilelor, pe o perioad ă de 20 de ani, în Tabelul 4.1.

Anii y x 1 x2 x3
1977 90 102 102 112
1978 101 104 102 113
1979 100 105 102 113
1980 101 104 114 107
1981 102 105 111 110
1982 104 105 109 108
1983 106 105 113 111
1984 111 105 112 106
1985 100 103 104 106
1986 92 103 84 107 Anii y x 1 x2 x3
1987 78 101 72 102
1988 80 100 74 101
1989 88 100 84 105
1990 94 99 105 97
1991 106 102 108 101
1992 108 103 114 104
1993 99 103 95 105
1994 107 107 92 107
1995 114 108 96 112
1996 130 111 110 114

Tabelul 4.1. Evolu ția variabilelor
Pentru a depista o eventual ă autocorela ție a erorilor:
a) să se estimeze parametrii modelului;
b) să se efectueze analiza grafic ă a reziduurilor;
c) să se calculeze statistica DW și să se efectueze testul de autocorela ție a erorilor.

119
a) Pentru estimarea modelului se ob ține tabela de regresie, prezentat ă în Tabelul 4.2.
Analizând rezultatele din tabela de regresie se ajunge la urm ătorul model:
t 3 2 1 t e x78.0 x39.0x72.3 04.241 y +−++−= , cu rațiile Student:
(-7.57) (8.13) (5.45) (-2.89)

Tabelul 4.2. Tabela de regresie a mode lului cu trei vari abile explicative

Valoarea teoretic ă Student pentru un prag de semnifica ție α=5% și 16 grade de libertate,
este 2.12; comparând ra țiile Student ale estimatorilor coeficien ților de regresie se observ ă că toți
sunt semnificativ diferi ți de 0. Modelul este global semnificativ, dup ă cum indic ă testul Fisher, iar
coeficientul de detremina ție de 0.917 arat ă că modelul liniar este bine al es. Coeficientul de corela ție
muliplă de 0.957 arat ă o intensitate puternic ă a dependen ței variabilei y de variabilele explicative x
1,
x2 și x3.
Graficul evolu ției variabilei y și a valorilor ajustate yt prin regresia liniar ă este prezentat în
Figura 4.9:
SUMMARY OUTPUT Regression Statistics
Multiple R 0.9576
R Square 0.9170
Adjusted R Square 0.9015
Standard Error 3.7045
Observations 20
ANOVA df SS MS F Signif. F
Regression 3 2427.37 809.123 3 58.95788 7.21E-09
Residual 16 219.58 13.72375
Total 19 2646.95
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept -241.039 31.84 -7.570 1.13E-06 -308.54 -173.54
X Variable 1 3.723 0.458 8.131 4.49E-07 2.75 4.69
X Variable 2 0.391 0.072 5.454 5.31E-05 0.24 0.54
X Variable 3 -0.783 0.271 -2.897 0.010505 -1.35 -0.21

120Evolutia variabilei y si ajustarea ei
60708090100110120130140
1 2 3 4 5 6 7 8 9 1 01 11 21 31 41 51 61 71 81 92 0
timpu lvalorile observate si ajustate
y yt
Figura 4.9. Evolu ția variabilei y și a valorilor teoretice corespunz ătoare

b) Analiza grafic ă a reziduurilor utilizeaz ă graficul evolu ției erorilor din Figura 4.10 și cel al
autocorela ției reziduurilor din Figura 4.11.

Evoluția reziduurilor
-8-6-4-202468
123456789 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0
timpulerori

Figura 4.10. Evolu ția reziduurilor

121În Figura 4.10, reziduurile se succed ciclic, conducând la presupunerea existen ței unei
autocorela ții pozitive, de și graficul din Figura 4.11 sugereaz ă o ușoară intensitate a autocorela ției
pozitive, a c ărei existen ță este mai evident ă în Figura 4.10.

Autocorela ția reziduurilor
-8-6-4-202468
– 8 – 6 – 4 – 2 02468
e t-1e t

Figura 4.11. Autocorela ția reziduurilor

c) Datele exerci țiului și modelul specificat îndeplinesc condi țiile pentru aplicarea testului DW.
În Tabelul 4.3 sunt calculate:
• valorile teoretice (ajustate) tyˆ, rotunjite la întreg, pentru a fi similare cu datele observate,
• reziduurile et, calculate ca diferen ță între valorile observate yt și cele teoreticetyˆ,
• diferențele a două erori consecutive et – e t-1,
• pătratele acestor diferen țe și suma lor, care constituie num ărătorul, și
• calculul valorilor et2 și suma lor, care reprezint ă numitorul.

122Pentru n=20 și k=3, se citesc în tabela lu i Durbin-Watson, valorile d1=0.998≈1; d2 =1.676≈1.68.

tyˆ et et – e t-1(et – e t-1)2et2
91 -0.88 0.78
98 3.46 4.34 18.81 11.94
101 -1.27 -4.72 22.31 1.61
107 -5.94 -4.67 21.81 35.25
107 -5.14 0.80 0.64 26.39
108 -3.92 1.22 1.48 15.38
107 -1.14 2.79 7.76 1.29
111 0.34 1.47 2.18 0.11
100 -0.09 -0.42 0.18 0.01
91 0.52 0.61 0.37 0.27
83 -5.26 -5.78 33.37 27.63
81 -1.10 4.16 17.28 1.21
82 6.12 7.22 52.15 37.49
93 1.37 -4.76 22.63 1.86
102 4.16 2.79 7.79 17.27
106 2.44 -1.72 2.96 5.93
97 1.65 -0.78 0.62 2.73
110 -2.50 -4.15 17.24 6.26
111 3.13 5.63 31.68 9.78
126 4.05 0.92 0.85 16.39
262.09 218.80
DW= 1.1978
Tabelul 4.3. Calculul statisticii DW

Valoarea calculat ă DW=1.1978 , se situeaz ă în zona de in certitudine (?): d1 < DW < d 2, mai
aproape de limita inferioar ă și se poate mai degrab ă accepta o autocorela ție pozitiv ă a reziduurilor,
deci o prezump ție de existen ță a autocorela ției erorilor.

0 1 1.19 1.68 2 2.32 3 4
I I I I I I I I ? ? autocorela ție lips ă autocorela ție autocorela ție
pozitiv ă n e g a t i v ă

Această concluzie înt ărește pe cea formulat ă la punctul b), privind graficul din Figura 4.10,
care sugera o intensitate slab ă a autocorela ției pozitive.
Estimatorii g ăsiți sunt nedeplasa ți, dar neeficien ți; nu mai sunt de varian ță minimă. Se
impune utilizarea unei proceduri adecvate de estimare.

123
3. Estimatorii metodei celor mai mici p ătrate în prezen ța autocorela ției

În cazul autocorela ției erorilor, elementele de o parte și de alta a diagonalei matricei
varianță-covarian ță a erorilor, nu sunt 0, deoarece Cov(εt,εt-1)≠0, și I2⋅≠′⋅=εσεε) E(εΩ , unde I
este matricea unitate. Estimatorii ob ținuți cu metoda celor mai mici p ătrate sunt nedeplasa ți, dar nu
mai sunt de varian ță minimă.
Matricea de varian ță-covarian ță a estimatorilor este: () (){}′−−=Ω aaˆaaˆEaˆ
() ( ) () ( )1 1 − −′′=′−′′=− XXX aaˆ ; X XX aaˆ ε ε , ( ) ( ) () ()1 1 − −′′′′=′−− XXX X XX aaˆaaˆ εε , de unde
() ( ) ()() ()()1 1 1 1 − − − −′Ω′′=′′′′=Ω XXX X XX XXX EX XXaˆ ε εε .
În cazul respect ării ipotezei de independen ță a erorilor, aceast ă matrice este ()1 2
aˆ XX−′=εσΩ , dar în
situația autocorel ării, cum I2⋅≠′⋅=εσεε) E(εΩ , aceasta devine ()11
aˆ X X−−′=εΩΩ .
Metoda pentru ob ținerea unor estimatori liniari nedeplasa ți și de varian ță minimă se numește
metoda generalizat ă a celor mai mici p ătrate . Estimatorii ob ținuți prin aceast ă metodă se numesc
estimatorii lui Aitken : ()()Y X X Xaˆ111 −−−′ ′=ε ε Ω Ω
Faptul că în practic ă, nu se cunoa ște εΩ, face ca aceste formule s ă fie inutilizabile și să se
impună necesitatea utiliz ării unor proceduri opera ționale de estimare.

4. Proceduri de estimare a lui ρ
Aceste proceduri sunt valide numai dac ă se consider ă că între erori exist ă o relație exprimat ă
sub forma modelului autoregresiv de ordinul 1, adic ă se cunoa ște structura autocorela ției.
t 1t t ν+=−ρεε , cu νt → N(0,σ2
v) , ⏐ρ⏐< 1.
Substituind succesiv erorile în acest model, se ob ține:
() ()
…33
22
11 22
1 2
+νρ+νρ+ρν+ν=ν+ρ+ρ=ν+ν+ρ=
− − −− − − −
t t t t tt t t t t t t
εεε ερε

124Acest proces tinde c ătre 0, deoarece |ρ| < 1, iar νt îndepline ște condițiile modelului liniar clasic de
regresie: E(νt)=0 ; E(νt2)=σ2
v; E(νt ,νt′ )=0, unde t≠t′.

4.1. Estimarea direct ă a lui ρ pornind de la regresia pe modelul ini țial

Etapa 1 : se estimeaz ă ρ în două moduri:
– fie, prin regresia direct ă a lui et în funcție de et-1:
∑∑
==−
=n
1t2
tn
2t1tt
eee
ˆρ
– fie, pornind de la statistica Durbin-Watson: )ρˆ-1(2 DW= , de unde 2DW1ρˆ−= .
Etapa a 2-a : se transform ă variabilele și se efectuaeaz ă regresia pe cvasi-diferen țe.
(1) t t1 0 t exaˆ aˆ y ++= Dacă este adev ărată pentru unitatea de timp t, atunci, pentru t-1:
(2) 1t 1t1 0 1t e xaˆ aˆ y−− − ++= Se înmul țește cu ρˆ și se obține ecuația (3).
(3) 1t 1t1 0 1t eˆ xaˆˆ aˆˆ yˆ− − − ρ+ρ+ρ=ρ Se scade ecua ția (3) din forma (1) și se obține (4):
(4) 1t t 1t t 1 0 1t t eˆe)xˆx(aˆ)ˆ1(aˆ yˆy− − − ρ−+ρ−+ρ−=ρ− , dar t 1t t v eˆe=ρ−− .
Atunci: t 1t t 1 0 1t t v)xˆx(aˆ)ˆ1(aˆ yˆy +ρ−+ρ−=ρ−− − , unde vt îndeplinește ipotezele pentru a putea
utiliza metoda celor mai mici p ătrate în estimarea coeficien ților de regresie pentru modelul
transformat: t t 1 0 t v xaˆ aˆ y ++=∗∗∗∗, unde )ˆ1(aˆ aˆ xˆx x yˆy y0 0 1t t t 1t t t ρ−= ρ−= ρ−=∗
−∗
−∗ ; ; ,
de unde: )ˆ1/(aˆ aˆ0 0 ρ−=∗ . Parametrii estima ți sunt a0 și a1*.

4.1.1. Exerci țiu – Estimarea parametril or umui model în prezen ța
autocorela ției erorilor

125
Pentru datele din Tabelul 4.1, considerând c ă există prezumția de autocorela ție
pozitivă a erorilor, s ă se corecteze efectul autocorela ției.
Utilizând prima modalitate de ob ținere a lui ρˆ , prin regresia direct ă a lui et în funcție de et-1,
conduce la urm ătoarele rezultate, din Tabelul 4.4:

Coeff. Standard
Error t Stat P-
value Lower
95% Upper
95%
Intercept 0.1308 0.7625 0.1715 0.8658 -1.4780 1.7396
X Variable 1 0.3961 0.2332 1.6986 0.1076 -0.0959 0.8881
Tabelul 4.4. Tabela de regresie et=f(e t-1)

ρˆ = 0.396. În etapa a 2-a se fac transform ările variabilelor: y, x1, x2, x3, în Tabelul 4.5:

y* x 1* x 2* x 3*
65 64 62 69
60 64 62 68
61 62 74 62
62 64 66 68
64 63 65 64
65 63 70 68
69 63 67 62
56 61 60 64
52 62 43 65 42 60 39 60
49 60 45 61
56 60 55 65
59 59 72 55
69 63 66 63
66 63 71 64
56 62 50 64
68 66 54 65
72 66 60 70
85 68 72 70

Tabelul 4.5. Transformarea variabilelor
Regresia ob ținută pe valorile transformate (sunt numai 19 observ ări transformate, se pierde
primul termen pentru fiecare variabil ă) oferă următoarele informa ții, în Tabelul 4.6:

126SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9487
R Square 0.9001
Adj. R Sq. 0.8801
Std. Error 3.2348
Observations 19
ANOVA df SS MS F Signif. F
Regression 3 1413.828 471.276 45.038 9.7E-08
Residual 15 156.960 10.464
Total 18 1570.788
Coeff. Standard
Error t Stat P-value Lower
95% Upper
95%
Intercept -145.84 22.76 -6.4084 0.00001 -194.34 -97.33
X Variable 1 3.1610 0.571 5.5323 0.00006 1.9431 4.3788
X Variable 2 0.4199 0.079 5.2972 0.00009 0.2509 0.5888
X Variable 3 -0.2563 0.323 -0.7935 0.43985 -0.9446 0.4321

Tabelul 4.6. Tabela de regresie a variabilelor transformate

Se calculeaz ă termenul constant: a0 = a 0* / (1 -ρˆ ) = 145.83/(1 – 0.3961) = -241.48 .
Ceilalți estimatori sunt: a1* = 3.16 ; a2* = 0.420 ; a3* = -0.256.
Modelul determinat este: tyˆ= -241.48 + 3.16x 1 + 0.42x 2 – 0.25x 3.
Se observ ă că variabila x3 devine nesemnificativ ă. Valorile teoretice yt1 sunt calculate în Tabelul
4.8 și în Figura 4.12. Se repet ă regresia pe variabilele transformate, eliminând variabila x3 și se
obține tabela de regresie din Tabelul 4.7, valorile teoretice yt2, în Tabelul 4.8 și Figura 4.12:

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9465
R Square 0.8959
Adjusted R Square 0.8829
Standard Error 3.1972
Observations 19
ANOVA df SS MS F Signif. F
Regression 2 1407.239 703.620 68.835 1.38E-08
Residual 16 163.549 10.222
Total 18 1570.788
Coeff. Std.Error t Stat P-value Lower 95% Upper 95%
Intercept -141.31 21.7744 -6.49 0.000007 -187.470 -95.150
X Variable 1 2.815 0.3646 7.72 0.000001 2.042 3.588
X Variable 2 0.432 0.0770 5.61 0.000039 0.269 0.595
Tabelul 4.7. Tabela de regresie a variabilelor transformate, dup ă eliminarea variabilei x3

127Se observ ă că regresia este global semnificativ ă și cele dou ă variabile explicative sunt
individual semnificative.
Termenul constant: a0 = a 0* / (1-ρˆ ) = -141.31 / (1-0.396) = -233.99 .
Ceilalți estimatori sunt: a1* = 2.815 ; a2* = 0.432.
Modelul este: tyˆ= -233.99 + 2.815x 1 + 0.432x 2.
Anii y yt yt1 yt2
1977 90 91 95 97
1978 101 98 101 103
1979 100 101 104 106
1980 101 107 108 108
1981 102 107 109 109
1982 104 108 109 109
1983 106 107 109 110
1984 111 111 110 110
1985 100 100 101 101
1986 92 91 92 92
1987 78 83 82 81
1988 80 81 80 79
1989 88 82 83 84
1990 94 93 91 90
1991 106 102 100 100
1992 108 106 105 105
1993 99 97 97 97
1994 107 110 108 107
1995 114 111 112 111
1996 130 126 126 126
Tabelul 4.8. Valorile observate și ajustate prin regresiile efectuate

Graficul valorilor ajustate cu cele dou ă modele determinate dup ă transformarea variabilelor
este prezentat în Figura 4.12.
Evolutia variabilei y si ajustarea ei
60708090100110120130140
1 2 3 4 5 6 7 8 9 1 01 11 21 31 41 51 61 71 81 92 0
timpu lvalorile observate si ajustate
y yt1 yt2
Figura 4.12. Evolu ția variabilei y și a valorilor teoretice corespunz ătoare

128
Pe graficul din Figura 4.12, se observ ă că cele două modele pe variabilele transformate sunt
foarte apropiate, eliminarea variabilei x3 a avut un impact nese mnificativ asupra modific ării
modelului, pe variabilele transformate. Se va re ține ca fiind cel mai bun, al doilea model, cel stabilit
pe baza variabilelor tr ansformate, cu dou ă variabile explicative x1 și x2.
Deși inițial, modelul cu cele trei variabile explicative, p ărea a fi foarte bun, având toate
variabilele independente semnificative și indicatorii calit ății ajustării foarte buni, totu și analiza
autocorela ției erorilor a condus la identificarea și apoi eliminarea unei variabile nesemnificative și
obținerea unui alt model, ai c ărui estimatori sunt nedeplasa ți și eficienți în același timp.
A doua posibilitate de estimare pentru ρˆ , este cea pornind de la testul Durbin-Watson:
– etapa 1: ρˆ = (1 – 1.1978/2) = 0.4011 , ρˆ = 0.4011
– etapa a 2-a: Se realizeaz ă transform ările variabilelor și se execut ă o nouă regresie pe variabilele
astfel transformate. Tabela de regresie este prezentat ă mai jos și de asemenea calculul și stabilirea
estimatorilor modelului. Valoarea lui ρˆ obținută pornind de la testul Durbin-Watson este foarte
apropiată de cea ob ținută prin regresia direct ă a lui et în funcție de et-1. De aceea valorile
estimatorilor dup ă această regresie pe variabilele transfor mate sunt apropiate de cele ob ținute prin
regresia reziduurilor.
Tabela de regresie pe noile variabile transformate folosind noua valoare ρˆ , se află în
Tabelul 4.9.

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9487
R Square 0.9000
Adj. R Sq. 0.8800
Std. Error 3.2273
Observations 19
ANOVA df SS MS F SignificanceF
Regression 3 1405.93 468.6 44.99 9.8E-08
Residual 15 156.23 10.4
Total 18 1562.16
Coefficients Std. Error t Stat P-value Lower 95% Upper 95%
Intercept -144.67 22.59 -6.40 0.00001 -192.8 -96.5
X Variable 1 3.154 0.57 5.52 0.0001 1.94 4.37
X Variable 2 0.420 0.079 5.31 0.0001 0.252 0.5895
X Variable 3 -0.249 0.322 -0.77 0.4506 -0.937 0.437
Tabelul 4.9. Regresia pe variabilele transformate cu noua valoarea ρˆ

129Se calculeaz ă termenul constant: a0 = a 0* / (1-ρˆ ) = -241.537 .
Estimatorii coeficien ților de regresie sunt: a1* = 3.15 ; a2* = 0.42 ; a3* = -0.25.
Modelul determinat este: tyˆ= -241.54 + 3.15x 1 + 0.42x 2 – 0.25x 3.
Și în acest caz, variabila x3 devine nesemnificativ ă. Se reface regresia folosind numai variabilele
explicative semnificative, și se obține tabela de regresie din Tabelul 4.10.

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9466
R Square 0.8960
Adjusted R
Square 0.8830
Standard
Error 3.1867
Observations 19
ANOVA df SS MS F Significance F
Regression 2 1399.684 699.842 68.915 1.37E-08
Residual 16 162.482 10.155
Total 18 1562.166
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept -140.297 21.598 -6.496 0.000 -186.082 -94.51
X Variable 1 2.817 0.365 7.727 0.000 2.044 3.590
X Variable 2 0.432 0.077 5.624 0.000 0.269 0.595
Tabelul 4.10. Tabela de regresie a modelului cu doua variabile explicative
Se observ ă în Tabelul 4.10, c ă variabilele independente sunt semnificative, la fel și termenul
constant, care devine:
a0 = a 0* / (1 – ρˆ ) = -234.251 .
Estimatorii coeficien ților de regresie sunt: a1* = 2.817 ; a2* = 0.432.
Noul model este: tyˆ= -234.25 + 2.817x 1 + 0.432x 2.
Comparând acest model cu cel ob ținut prin metoda regresiei reziduurilor:
tyˆ= -233.99 + 2.815x 1 + 0.432x 2,
se observ ă că diferențele sunt foarte mici, estimatorii variabile lor explicative, fiind aproape identici.
Valorile teoretice ob ținute cu acest din urm ă model, pentru c ă sunt rotunjite la numere întregi, sunt
identice cu valorile yt2, diferențele mici dintre valorile ajustate sunt la nivelul zecimalelor.
Indiferent de procedeul ales pentru estimarea direct ă a valorii ρˆ , rezultatele sunt aproape
identice, fiind la fel de bune.

130Rezumat
Cand reziduurile sunt corelate între ele apare fenomenul de autocorela ția erorilor , ale cărui
prezență conduce la instabilitatea modelului econometric. În aceast ă situație a nerespect ării ipotezei
de independen ță a reziduurilor, se identific ă natura autocorela ției și se detecteaz ă cu ajutorul testului
Durbin-Watson, în cazul autocorela ției de ordinul 1. Se aplic ă o procedur ă iterativă pentru
estimarea modelului în prezen ța autocorela ției erorilor.
Exemplele ofer ă explicații pentru în țelegerea obiectivelor capitolului.

Termeni importan ți
Autocorela ția erorilor, coeficient de autocorela ție de ordinul 1, corela ția serială a
reziduurilor, testul Durbin-Watson, pro ceduri iterative de estimare a modelului

Întrebări recapitulative
1. Explicați semnifica ția nerespect ării ipotezei de independen ță a erorilor.
2. Scrieți testul Durbin-Watson, intervalul s ău si interpretarea testului.
3. Care sunt metodele de detectare a autocorela ției erorilor ?
4. Care sunt consecin țele autocorela ției erorilor?
5. Care sunt mijloacele de remediere a autocorela ției erorilor?
6. Care sunt metodele grafice de detectare a autocorela ției erorilor?

Teme de cas ă
• Parcurgeți exemplele din curs, utilizând calculatorul.
• Aplicați metoda grafic ă pentru detectarea autocorela ției reziduurilor pe ntru un exemplu
numeric din curs.

131BIBLIOGRAFIE

1. Artus Patric, Michel Deleau, Pierre Ma lgrange, “Modelisation macroeconomique”,
Economica, Paris, 1986
2. Bourbonnais Regis "Économétr ie", Ed. Dunod, Paris, 1993
3. Constantinescu N.N., “Reform ă și redresare economic ă”, Editura Economic ă, 1995
4. Dugulean ă C., „Introducere in economia ap licata”, Ed. Infomarket, Brasov, 2004
5. Dugulean ă C., „Previziuni ale consumul ui agregat pe termen lung”, vol. I, Ed. Universitaria
Craiova, 2004, pag. 56 – 63
6. Dugulean ă C., ”Correlation between Average Produc tivity of Work and Average Wages”,
International Conference Small and Medium Enterprises in European Economies, Babes-
Bolyai University Cluj-Napoca, Faculty of Business, October 17-18, 2003, Cluj-Napoca, Ed.
Alma Mater, pag. 190-196
7. Dugulean ă L., Dugulean ă C., „Economie aplicat ă – econometrie”, Ed. Universit ății, Brașov,
1998
8. Dugulean ă L., Dugulean ă C., Oprei A., „Previziune economic ă. Quattro Pro”, Reprografie,
Brașov, 1995
9. Dugulean ă L., „Statistic ă economic ă și socială”, Ed. Infomarket, Bra șov, 1999
10. Dugulean ă L., „Statistic ă”, Ed. Infomarket, Bra șov, 2002
11. Dugulean ă L., Dugulean ă C., „Sondajul statisti c – probleme intampinate in cercetarile de
marketing industrial”, Revist a de Statistica nr. 4/1997, pag. 32-42, Ed. Comisia Nationala
pentru Statistica
12. Dugulean ă L., „Consideratii privind ineg alitatea distributiei veniturilo r în tarile dezvoltate ale
lumii”, Universitatea OVIDIUS din Consta nta, 15-16 octombrie 2004 , vol. I, Ed.
Universitaria Craiova, 2004, pag. 239-244
13. Dugulean ă L., „Studiul regiunilor din Romania folosind anali za cluster”, Universitatea
Ovidius din Constanta, 15-16 oct. 2004, vol . I, Ed. Universitaria Craiova, 2004, pag. 42-48
14. Makridakis S., “The Accur acy of Extrapolation (Time series) Methods: Results of a
Forecasting Competition”, Journa l of Forecasting, vol.1, 1982, pag.111-153
15. Gujarati Damodar, “Basic Econometrics”, McGraw-Hill Book Company, NewYork, 1988
16. Melard Guy "Methodes de prevision a court term ", University of Brussels, Belgium, 1990
17. Tașnadi Alexandru, Claudiu Doltu, “Monetarismul”, Editura Economic ă, București, 1996
18. "Anuarul Statistic al României ", 1993, 1996, 1997, 1998, 2001, 2002, INSE, Bucuresti, 2002

Similar Posts