CURS STATISTICĂ – Unitatea de învățare nr. 7 [627939]
CURS STATISTICĂ – Unitatea de învățare nr. 7
ANALIZA STATISTICĂ A DISTRIBUȚIILOR DE FRECVENȚE.
INDICATORII VARIAȚIEI ȘI ASIMETRIEI
Cuprins:
1.Obiectivele Unității de învățare.
2.Clasificarea indicatorilor variatiei .
2.1. Indicator ii simpli ai varia ției.
2.2. Indicatori i sintetici ai variaț iei.
3.Indicatorii asimetriei .
4. Răspunsuri și comentarii la testele de autoevaluare.
5. Teme de control.
6. Rezumatul Unității de învățare.
7. Bibliografia Unității de învățare.
1. Obiectivele unității de învățare
În analiza unei serii statistice ne interesează, pe lângă analiza tendinței centrale și
analiza variației sau a variabilității , precum și analiza formei distribuției .
Fenomenele și procesele economico -sociale sunt complexe, aflându -se sub influența
unui număr mare de factori esențiali și întâmplători, ceea ce face ca media, cel mai utilizat
indicator al tendinței centrale, să nu fie suficientă pentru analiza acestor fenomene.
☺ Exemplu l 1
Fie următoarele seturi de date:
2 4 6 8 10 12 14
1 1Me x
5 6 7 8 9 10 11
2 2Me x
Se observă că deși cele două serii au aceeași medie și mediană
2 1 2 1 Me Me x x ,
ele diferă prin modul de împrăștiere a valorilor. De aceea, pe lângă indicatorii tendinței
centrale se impune și calculul indicatorilor de variație.
In urma parcurgerii acestui capitol, studenții vor putea :
studia reprezentativitatea mediei pentru o serie de date;
aprecia gradul de omogeni tate a seriei;
caracteriza gradului de variație a unei serii;
compara în timp și spațiu variația mai multor serii de repartiție pentru aceeași
caracteristică sau pentru caracteristici diferite care au fost înregistrate pentru aceeași
colectivitate;
cunoașt e forma distribuției (repartiției) de frecvențe prin comparație cu distribuția
normală
2. Clasificarea indicatorilor varia ției
Indicatorii variației pentru o serie statistică se clasifică în:
indicatori simpli ai variației – sunt acei indicatori care ara tă împrăștierea valorilor
una față de alta sau împrăștierea valorilor față de o anumită valoare;
indicatori sintetici ai variației – care iau în considerare toți termenii seriei în calculul
lor, sintetizând într -o singură valoare întreaga împrăștiere din s erie.
2.1. Indicatorii simpli ai variației
Indicatorii simpli ai variației se exprimă atât în mărimi absolute (având aceleași unități
de măsură ca și caracteristica studiată), cât și în mărimi relative (obținute prin raportarea
mărimii absolute la medie ).
Indicatorii simpli ai variației sunt:
amplitudinea absolută a variației;
amplitudinea relativă a variației;
abaterile individuale absolute;
abaterile individuale relative.
Amplitudinea absolută a variației (Ax) se determină ca diferență între valoarea
maximă (x max) și valoarea minimă (x min) a caracteristicii și arată câmpul maxim de împrăștiere
a valorilor caracteristicii.
Ax = x max – xmin
Are unitatea de măsură a valorilor caracteristicii și din acest motiv nu poate fi folosită la
compararea seriilor du pă caracteristici exprimate în unități de măsură diferite.
Se utilizează în etapa de grupare a datelor, mai precis la construirea intervalelor de
variație și se mai utilizează și la construirea graficelor.
Amplitudinea este foarte sensibilă la valorile ext reme. Cu cât acestea sunt mai
îndepărtate cu atât câmpul de împrăștiere a valorilor este mai mare.
Amplitudinea relativă a variației (Ax(%)) se obține prin raportarea amplitudinii
absolute la medie. Se exprimă în coeficient sau procente, deci pot fi compar ate serii după
caracteristici exprimate în unități de măsură diferite:
100
xAAx
(%)x
Abaterile individuale absolute care ne arată împrăștierea fiecărei valori de la valoarea
medie:
x x di i
În practică se utilizează mai mult abaterea absolută maximă și abaterea absolută
minimă:
0x x dm ax m ax
0x x dm in m in
Abaterile individuale absolute se exprimă prin aceeași unitate de măsură ca și
caracteristica studiată și pot lua valori negative sau pozitive după cum valoarea ind ividuală
este mai mică sau mai mare ca media.
Dacă d i în valoare absolută au valori mari putem concluziona că datele sunt împrăștiate,
adică există o variație mare în interiorul seriei.
Suma valorilor abaterilor individuale absolute este nulă:
0x x dn
1iin
1ii
Suma abaterilor maxime și minime luate în modul este egală cu amplitudinea absolută a
variației:
x m in m ax A d d
Dacă în cazul unei serii, abaterea maximă absolută diferă mult de valoarea abaterii
minime absolute luată în modul, atunci pe ntru seria respectivă trebuie calculați pe lângă
indicatorii variației și indicatorii de asimetrie.
Într-o serie simetrică:
m ax m in d d
Abaterile individuale relative se exprimă în coeficienți sau procente și se calculează
raportând abaterile in dividuale absolute la medie:
100
xdd100
xdd
100
xdd
min
min(%)max
max(%)i
(%)i
Toți acești indicatori simpli prezintă dezavantajul că nu sintetizează, într-o singură
valoare, împrăștierea tuturor termenilor din seria analizată.
Pentru a elimina acest dezavantaj calculăm indicatorii sintetici ai variației.
2.2. Indicatorii sintetici ai variației
Indicatorii sintetici ai variației sunt:
abaterea medie liniară
d ;
dispersia (varianța);
abaterea medie pătratică (abatere medie standard sau tip);
coeficientul de va riație.
Abaterea medie liniară
d se calculează ca o medie aritmetică simplă (în cazul seriilor
simple) sau ponderată (în cazul seriilor de distribuție de frecvențe) a abaterilor termenilor
seriei de la media lor în valoare absolută.
– pentru o serie simplă:
nx x
dn
1ii
– pentru o serie de distribuție de frecvențe absolute:
k
1iik
1ii i
nnx x
d
În cazul în care seria de distribuție de frecvențe este pe intervale, atunci x i este centrul
intervalului.
– pentru o serie de distr ibuție de frecvențe relative:
100nx x
dk
1i*
i i
– dacă
*
in sunt exprimate în procente
k
1i*
i i nx x d
– dacă
*
in sunt exprimate în coeficienți
În locul mediei, pot fi folosiți și alți indicatori ai tendin ței centrale.
Dezavantaje ale abaterii medii liniare :
se exprimă în aceeași unitate de măsură ca și caracteristica analizată, deci nu poate fi
utilizată la compararea a două sau mai multe serii după caracteristici exprimate în
unități de măsură diferite;
nu ține seama de semnul algebric;
nu ține seama de faptul că abaterile mai mari în valoare absolută influențează în mai
mare măsură gradul de variație al unei caracteristici comparativ cu abaterile mici.
Pentru a înlătura aceste dezavantaje se calculează și alți indicatori sintetici ai variației.
☺ Exemplu l 2
Repartiția salariaților unei întreprinderi după prima obținută la sfârșitul anului este prezentată
în tabelul următor:
Prima (lei) Nr. salariați
ni Centrul
xi xini
x xi
i i nx x
sub 100
100 – 200
200 – 300
300 – 400
peste 400 15
20
30
25
10 50
150
250
350
450 750
3.000
7.500
8.750
7.500 +195
+95
5
105
205 2.925
1.900
150
2.625
2.050
Total 100 – 24.500 – 9.650
salariatlei
nnx
x
iiii i
/ 245100500.24
5
15
1
salariatlei
nnxx
x
iiii i
/5,96100650.9
5
15
1
Prima unui sa lariat se abate în medie de la prima medie cu 96,5 lei.
Dispersia se calculează ca medie aritmetică simplă (în cazul seriilor simple) sau
ponderată (în cazul seriilor de distribuție de frecvență) a pătratelor abaterilor termenilor seriei
de la tendința centrală (cel mai adesea media aritmetică).
– pentru o serie simplă:
nx xn
1i2
i
2
– pentru o serie de frecvențe absolute:
k
1iik
1ii2
i
2
nn x x
– pentru o serie de frecvențe relative:
100n x xk
1i*
i2
i
2
sau
k
1i*
i2
i2n x x
Dacă datele provin din eșantioane de volum redus și le folosim pentru extinderea rezultatelor
la nivelul colectivității generale (le folosim pentru o inferență statistică), atunci în calculul
dispersiei la numitor se va folosi (n -1) și nu “n” fiind astfel dispersia eșantionului un
estimator mai bun al dispersiei în colectivitatea gene rală:
1nx x
sn
1i2
i
2
Dispersia prezintă dezavantajul că este un indicator abstract care nu are o unitate
concretă de măsură. Ea arată modul în care gravitează termenii seriei în jurul tendinței
centrale (de obicei media). Dacă dispersia unei serii este egală cu 0, atunci acea serie nu
prezintă variație, toți termenii ei fiind egali. Cu cât valoarea dispersiei crește față de zero, cu
atât împrăștierea termenilor seriei crește și ea.
Este un indicator deosebit de util în studiile statistice, fiind uti lizată în calculul
asimetriei, excesului, boltirii unei serii, precum și în calculul altor indicatori statistici.
Dispersia caracteristicii alternative :
Varianta xi Frecvența
ni Frecvențe relative
DA
NU 1
0 m
n – m
nm
w1nmn
Total – n 1
w1w ww1w1w)w1( ww w1nmnwnmw1n)mn( w0 m w1
nn x x
2 2 2 22 2
2
1ii2
1ii2
i
2
w
Dispersia caracteristicii alternative este egală cu produsul dintre cele două frecvențe
relative.
☺ Exemplu l 3
Prima (lei) Nr. salariați (n i)
sub 300
300 65
35
Total 100
Să se calculeze dispersia caracte risticii alternative “salariați cu prima sub 300 RON”.
65,010065
nmw
2275,035,065,0)w1(w2
w
Dispersia caracteristicii alternative prezintă următoarele particularități:
dispersia caracteristicii alternative poate lua valori doar în intervalul:
25,0,02
w
când w = 1 – w, adică w = 0,5, dispersia atinge valoarea maximă
25,02
w ;
dacă w 1 – w, adică w 0,5 și w crește uniform în cadrul intervalului (0, 0,5)
atunci
2
w înregistrează o creștere mai rapidă la început și mai lentă când se apropie
de limita superioară;
dacă w 1 – w, adică w 0,5 și w crește uniform în cadrul intervalului (0,5, 1)
atunci
2
w înregistrează o scădere în același ritm în care a avut loc creșterea.
Abaterea me die pătratică (abatere standard, abatere tip sau ecart tip) se calculează
ca o medie pătratică a abaterilor termenilor seriei de la media lor sau ca radical din dispersie.
Abaterea medie pătratică ne arată cu cât în medie se abat termenii unei serii de la
tendința centrală (de obicei media):
– pentru o serie simplă:
nx xn
1i2
i
2
– pentru o serie de frecvențe absolute:
k
1iik
1ii2
i
2
nn x x
– pentru o serie de frecvențe relative:
100n x xk
1i*
i2
i
2
☺ Exemplu l 4
Fie 2 serii:
S1: 1 2 3 4 5 6
S2: 101 102 103 104 105 106
Cele două serii au aceeași amplitudine, aceeași abatere medie liniară și aceeași abatere medie
pătratică. Cu toate acestea, împrăștierea din seria A este mai mare d ecât cea din seria B.
Este foarte dificil să comparăm serii de date după caracteristici exprimate prin aceeași
unitate de măsură deoarece variabilitatea depinde de ordinul de mărime.
Abaterea medie pătratică are aceeași semnificație ca și abaterea medie li niară, dar ea
obținându -se prin ridicarea la pătrat a abaterilor individuale de la tendința centrală (medie)
înlătură dezavantajul acordării aceleiași importanțe atât abaterilor mari cât și celor mici.
Abaterea medie pătratică are aceeași unitate de măsură cu a caracteristicii studiate, de
aici provenind dezavantajul că nu pot fi comparate colectivități după caracteristici exprimate
prin unități de măsură diferite.
Deoarece
pxx rezultă că
d .
În cazul unei serii de dis tribuție de frecvențe simetrică sau ușor asimetrică, adică pentru
o serie cu tendință de normalitate între abaterea medie liniară și abaterea medie pătratică
există relația:
8,0d
☺ Exemplu 5
Se utilizează datele din Exemplul 2 .
salariat/ RON31,120 144752
salariat/ RON5,96d
8,031,1205,96 d
seria este simetrică adică are o repartiție normală.
Abaterea medie pătratică este un indicator care ne oferă informații privind modul de
împrăștiere a termenilor unei serii cu tendință de normalitat e. Astfel, o regulă empirică spune:
– 68,37% din termenii unei serii se situează în intervalul
x, x ;
– 98,45% din termenii unei serii se situează în intervalul
2x,2x ;
– 99,73% din termenii unei serii se situează în interv alul
3x,3x ;
– 99,94% din termeni se găsesc în intervalul
4x,4x
Abaterea medie pătratică este un indicator deosebit de util la estimarea erorilor de
selecție, la calcule de corelație precum și la orice comparație statistică în timp și spațiu.
Coeficientul de variație este cel mai utilizat și mai semnificativ indicator pentru
analiza variației. Se calculează ca raport între abaterea medie pătratică sau liniară și medie.
100
xv sau
100
xd'v
v v’
Coeficientul de variație se exprimă procentual, deci putem aprecia că el reprezintă
exprimarea relativă a lui sau a lui
d .
Dacă v = 0 seria este perfect omogenă, toți termenii seriei sunt egali între ei și s unt egali
cu media: în acest caz nu există variație.
Dacă v 5%, seria este foarte omogenă, variația este foarte mică, media este foarte
reprezentativă, iar gruparea a fost foarte bine executată (în cazul seriilor de distribuție de
frecvențe).
Dacă v 35%, seria este omogenă.
Dacă v 70-75%, seria este eterogenă, variația este foarte mare, media nu este
reprezentativă, iar gruparea trebuie refăcută.
Testul de autoevaluare 1
1.Un auditor bancar a selectat 10 conturi și a înregistrat sumele existente în f iecare dintre
aceste conturi. Sumele sunt date în Euro:
150 175 195 200 235 240 250 256 275 294
Se cere:
a) să se calculeze suma medie de bani existentă într -un cont
b) să se caracterizeze gradul de omogenitatea al seriei.
Deși cel mai a desea coeficientul de variație se calculează utilizând media (deoarece
respectă cele mai multe din condițiile impuse de Yule), acest indicator se poate calcula
utilizând și alți indicatori ai tendinței centrale (mediana, mediala, modul).
Acest indicator nu se poate utiliza (adică este lipsit de semnificație) în cazul în care
media aritmetică este apropiată de zero sau când valorile termenilor seriei sunt foarte
apropiate.
☺ Exemplu l 6
Se utilizează datele din Exemplul 2 și Exemplul 5 .
%35%1,49 10024531,120100
xv
seria nu este omogenă
%3,39 1002455,96100
xd'v
3. Indicatorii de asimetrie
Asimetria unei serii de distribuție empirice poate fi determinată atât prin metoda grafică
cât și prin calculul indicatorilor de asimetrie.
Reprezentarea grafică cea mai utilizată pen tru aprecierea asimetriei este poligonul
frecvențelor, dar graficul ne oferă doar o imagine sugestivă asupra gradului de asimetrie, fără
a putea să -l măsoare printr -o valoare exactă.
x
Pentru d istribuții moderat asimetrice, între
x , Me, Mo există următoarea
relație:
x Me3x Mo
Tipuri de repartiții cu asimetrie pronunțată:
Repartiții în formă de J se întâlnesc în cazul în c are frecvențele sunt maxime la un capăt
sau altul al intervalului de variație.
ni
xi
Mo Mex ni
xi
x Mo Me ni
xi
Mo Me
Serie perfect simetrică
(Clopotul lui Gauss) Serie asimetrică cu
asimetrie de stânga sau
pozit ivă, predomină
valorile mici
Mo Mex
Serie asimetrică cu
asimetrie de dreapta sau
negativă, predomină
valorile mari
Mo Mex
ni
xi 0 ni
xi 0
x
Repartiție în formă de U se întâlnește atunci când frecvențele maxime apar la capetele
intervalului de variație, iar frecvențele minime în centrul intervalului.
Repartiție complexă obținută prin suprapunerea a trei repartiții: una în formă de J și
două moderat asimetrice. Acest tip de repartiții apare frecvent când gruparea nu a fost
executată corect.
Indicatorii asimetriei sunt :
– asimetrie absolută:
Mox As
sau
Mex3 As
Acești indicatori au unitatea de măsură a caracteristicii analizate, deci prezintă
dezavantajul că nu pot fi comparate din punct de vedere a l asimetriei serii după caracteristici
exprimate prin unități de măsură diferite.
Acești indicatori pot fi pozitivi (în cazul asimetriei de stânga) sau negativi (în cazul
asimetriei de dreapta).
Datorită faptului că o distribuție se caracterizează și prin variabilitate, pentru aceeași
asimetrie absolută, o serie care are variabilitatea mai mică va fi mai pronunțat oblică, iar
pentru una cu variabilitatea mai mare, oblicitatea se va atenua.
– asimetrie relativ ă:
De aceea se calculează coeficientul de asimetr ie propus de Pearson (statistician
englez 1857 -1936): ni
xi 0
ni
xi 0
1,1MoxCas
Dacă Cas = 0 seria este perfect simetrică:
Mo Mex
Dacă Cas 0 seria prezintă asimetrie pozitivă sau de stânga:
Mo Mex
(predomină valorile mici)
Dacă Cas 0 seria prezintă asimetrie negativă sau de dreapta:
Mo Mex
(predomină valorile mari)
Cu cât Cas este mai apropiată de 1 seria este mai asimetrică.
Dacă Cas [-0,3; 0,3] seria este ușor sau moderat asimetrică.
Acest coeficient este recomandat numai pentru serii de repartiție ușor asimetrice.
Dacă se cunoaște mediana seriei, coeficientul de asimetrie se poate calcula cu relația:
3,3Mex3Cas
Acest indicator este recomandat numai pentru serii de repartiție ușor asimetric e când
între cei trei indicatori ai tendinței centrale există relația:
x Me3x Mo
Cu cât Cas este mai apropiat de 0 cu atât seria este mai simetrică, iar cu cât se apropie
de extremitățile intervalului, asimetria devine mai pronunțată.
Acești d oi indicatori ai asimetriei sunt cei mai utilizați în practică, dar în afară de aceștia
se mai utilizează și alți indicatori.
☺ Exemplu l 7
Se utilizează datele din Exemplul 2 .
0 RON55,21 66,266 245 Mox As
asimetrie negativă sau de dreapta
66,2665 1010100 200 h x Mo
2 11
0
300,200 Mo
0 18,031,12066,21 MoxCas
3,0,3,0 Cas seria este ușor asimetrică, cu asimetrie negativă sau de dreapta, deci
predomină salariații cu prime mari.
Mo Mex
☺ Exersați în … Excel
Un profesor dorește să vadă care a u fost rezultatele medii obținute de studenții săi la examen. De
asemenea, ar vrea să observe care a fost variația notelor. Calculați mărimile necesare . Notele obținute
de studenți la examen au fost următoarele:
8,1 9,2 3,0 7,9 9,0 6,9 9,6 3,9 9,4 8,8 6,5 7,3 8,4 8,3 9,5 3,8 9,7
9,4 9,3 7,3 7,8 8,6 5,7 9,8 9,3 8,3 9,9 4,2 9,9 5,1 8,4 9,0 8,8 5,9
9,5 7,0 8,1 9,1 7,5 8,2 8,3 6,5 3,4 8,9 4,3 8,5 7,5 6,4 6,4 9,3 8,6
8,4 4,8 8,1 9,6 9,1 9,6 8,3 4,1 10,0 2,5 4,8 7,1 8,9 6,1 7,7 7,6 1,8
5,3 6,9 6,6 9,4 8,0 5,5 8,4 6,6 3,4 9,8 7,2 1,1 3,8 8,5 7,7 9,6 5,0
7,2 8,3 8,7 7,4 9,4 9,0 8,4 9,5 9,0 7,3 9,9 8,5 7,1 3,7 1,6
Rezolvare folosind EXCEL:
1. Se introduc datele. În A1 tastați „Nota“.
2. Apăsați Tools/Data Analysis și Descriptive Statistics .
3. Introduceți Input Range (A1:A101) conținând și numele variabilei. Selectați Labels in First
Row.
4. Apăsați Summary Statistics și OK.
Se obțin rezultatele:
Note
Mean
7.398
Standard Error 0.215022
Median 8.1
Mode 8.4
Standard Deviation 2.150216
Sample Variance 4.62343
Kurto sis 0.393661
Skewness -1.0731
Range 8.9
Minimum 1.1
Maximum 10
Sum 739.8
Count 100
Media notelor obținute la examen este 7,398 ( Mean ) cu mediana 8,1 ( Median ). Modulul este
8,4 ( Mode ). Acesta este posibil să nu fie singurul, deoarece EXCEL nu afișea ză decât o singură
valoare.
Cea mai mică notă obținută a fost 1,1 ( Minimum ) iar cea mai mare Maximum = 10.
Amplitudinea (diferența între valoarea minimă și cea maximă) este 8,9 ( Range ).
Variația măsurată prin dispersie este 4,62 ( Sample Variance ) iar abate rea medie pătratică este
2,15 ( Standard deviation ). Eroarea standard (acest indicator va fi explicat la capitolul de sondaj
statistic) este 0,215 ( Standard Error ).
Deoarece Skewness este negativ și mult diferit de zero ( -1,07) seria de date este puternic
asimetrică negativ, curba fiind alungită spre stânga.
Kurtosis este 0,39, pozitiv, ceea ce înseamnă că avem o curbă ascuțită (distribuție
leptocurtică).
Testul de autoevaluare 2
Pentru 200 de agenți economici se cunosc datele:
Grupe de agenți economici după mărimea
profilului (mil. lei) Structura agenților economici
(%)
sub 6
6-12
12-18
18-24
24-30
30 și peste 10
22
25
23
17
3
Total 100
Se cere:
a) să se aprecieze dacă media e reprezentativă ;
b) caracterizați asimetria distribuției ;
c) să se calculeze media și dispersia caracteristicii „profitul ≥18 mil lei” .
Testul de autoevaluare 3
1.Distribuția salariaților unui magazin în funcție de numărul de zile de concediu de odihnă
dintr -un an se prezintă astfel:
Zile concediu 14 15 16 17 18 19 20
Nr. salariați 2 6 10 15 8 5 4
Se cere:
a) să se calculeze indicatorii sintetici ai variației;
b) să se caracterizeze gradul de asimetrie;
c) să se calculeze media și dispersia caracteristicii “salariați care au avut un număr de zile de
concediu mai mare sau ega l cu 17” .
2.Un studiu efectuat asupra unui număr de 50 de cutii de brânză topită la cutie dintr -un
magazin a reliefat următoarele informații cu privire la numărul de calorii conținute:
Calorii 75-85 85-95 95-105 105-115 115-125
Nr. cutii cu
brânză topit ă 5 10 15 14 6
Se cere:
a) să se aprecieze omogenitatea seriei;
b) să se caracterizeze gradul de asimetrie;
c) să se calculeze media și dispersia caracteristicii “cutii de brânză care au sub 95 de
calorii”
4. Răspunsuri și comentarii la testele de autoev aluare
Testul de autoevaluare 1
Notăm cu x i = suma existentă în contul i
10,1i
a) Media se calculează ca o medie aritmetică simplă întrucât avem date negrupate:
Euro22710227010294 275 256 250 240 235 200 195 175 150
10x
x10
1ii
b) Gradul de omoge nitate al seriei se apreciază prin coeficienții de variație (v, v’).
%12,20 10022768,45100
xv
%56,16 1002276,37100
xd'v
68,45 889, 20862
889, 20861010
12
2
iixx
Deoarece v, v’ 35%, apreciem că seria este omogenă, variația este mică, media este
reprezentativă.
Testul de autoevaluare 2
1. a) Pentru a aprecia dacă media este reprezentativă, vom utiliza coeficientul de variație.
Pentru a calcula coeficientul de variație trebuie mai întâi să calculăm media și abaterea medie
pătratică.
6
16
1
iiiii
nnx
x
Putem lucra cu relația de mai su s dacă calculăm din
*
in (din ipoteza, din tabel) și
200 in
(din enunț) pe
in .
100* ii
innn, rezultă:
20 20010010
1 n
agenți economici;
44 20010022
2 n
50 20010025
3 n
46 20010023
4 n
34 20010017
5 n
6 2001003
6 n
ix
reprezintă centrele de interval
sau putem calcula media utilizând relația:
44,16100333 172723212515229103
1006
1*
iiinx
x
mil. lei
Profitul mediu al unui agent economic este egal cu 16,44 mil lei.
Centrele de interval
ix se determină ca o medie aritmetică simplă a capetelor fiecărui
interval. Rezultatele sunt prezentate în tabelul următor
Mărimea profitului (mil lei) Frecvenț e relative ni*(%) Centre d e interval
ix
0-6 10 3
6-12 22 9
12-18 25 15
18-24 23 21
24- 17 27
30-36 3 33
Total 100 –
Indicatorul cu ajutorul căruia se apreciază dacă media e reprezentativă este coeficientul de
variație.
%17,48 10044,1692,7100
xv
leimil. 92,74726,622
7264.621003)44,1633( 17)44,1627( 23)44,1621( 25)44,1615(10022)44,169( 10)44,163(
100
2 2 2 22 26
1*2
2
ii i nxx
Interpretarea coeficientului de varia ție 35%<v≤75% media e slab reprezentativă.
b) Asimetria se caracterizează cu ajutorul indicatorilor de a simetrie prop uși de Pearson .
– asimetria absolută:
as x Mo =16,44-15,6=0,84 mil. lei
– coeficientul de a simetrie:
106,092,784,0asCas
Cas
>0 deci avem serie ușor a simetrică cu asimetrie pozitivă sau de stânga, deci predomină
agenții economici cu v alori mici ale profitului.
c) media și dispersia caracteristicii „profitul≥18 mil lei”
Avem o caracteristică alternativă sau binară:
– profi tul ≥18 mil lei
– profi tul <18 mil lei
Varianta xi Frecvențele relative (
*
in)
DA (profitul ≥18 mil lei)
NU (profitul <18 mil lei) 1
0 m = 43
n – m = 57
Total – n = 100
Media caracteristicii alternative:
43,010043nmw
43% dintre agenții economici au profitul ≥18 mil. lei.
Dispersia caracteristicii alternative:
2451,0)43,01(43,0) 1(2 w ww
Testul de autoevaluare 3
1. a) Pentru a calcula indicato rii sintetici ai variației, va trebui să calculăm mai întâi
media – care se calculează ca o medie aritmetică ponderată:
concediu zile 04,1750852504205198181517 1016615214
nnx
x7
1ii7
1iii
Indicatorii sintetici ai variației sunt:
– abaterea medie liniară:
zile 1728,15064,5850404,1720504,1719804,1718 1504,17 17501004,1716604,1715204,1714
nnx x
d7
1ii7
1ii i
Numărul de zile de conc ediu a l unui salariat se abate în medie de la numărul mediu de
zile de concediu cu 1,1728 zile.
– dispersia:
3184,25092,115
504 04,17205 04,1719508 04,1718 15 04,17 17 10 04,1716506 04,17152 04,1714
nn x x
2 22 2 22 2
7
1ii7
1ii2
i
2
– abaterea medie pătratică:
zile 5226,1 3184,22
Numărul de zile de concediu a l unui salariat se abate în medie de la nu mărul mediu de
zile de concediu cu 1,5226 zile.
– coeficientul de variație:
%93,8 10004,175226,1100
xv
%88,6 10004,171728,1100
xd'v
Deoarece v, v’ 35% seria este omogenă, variația este mică, media este
reprezentativă.
b) Aprecierea asime triei:
026,05226,11704,17 MoxCas
Deoarece Cas 0 avem asimetrie pozitivă sau de stânga, adică mediana și modul se
găsesc în stânga mediei pe grafic, deci în această serie predomină valorile mici ale
caracteristicii.
Cas [-0,3; 0,3] seria este ușor asimet rică (Cas este foarte apropiat de zero).
c) Avem o caracteristică alternativă:
– salariați care au avut un concediu 17 zile;
– salariați care au avut un concediu 17 zile.
Varianta xi Frecvențele absolute
ni
DA (peste 17 zile)
NU (sub 17 zile) 1
0 m = 32
n – m = 18
Total – n = 50
Media caracteristicii alternative:
64,05032
nmw
64% dintre salariați au avut un concediu 17 zile
Dispersia caracteristicii alternative:
2304,0)64,01(64,0)w1(w2
w
2. Se observă că avem o serie de repartiție de frecve nță pe intervale egale.
Notăm cu: xi = numărul de calorii
ni = numărul de cutii de brânză topită
Media – se calculează ca o medie aritmetică ponderată
xi reprezintă centrul de interval calculat ca medie aritmetică simplă între limita
inferioară și limit a superioară a fiecărui interval:
calorii 2,101505060
506 12014 11015 1001090580
nnx
x5
1ii5
1iii
Omogenitatea seriei se apreciază cu ajutorul coeficientului de variație:
%46,11 1002,1016,11100
xv
calorii6,11 56,1342
56,134506728
nn x x
5
1ii5
1ii2
i
2
Deoarece v 35% seria este omogenă, variația este mică , media este reprezentativă.
b) Gradul de asimetrie :
18,06,1133,1032,101 MoxCas
Deoarece Cas 0 seria prezintă o asimetrie negativă sau de dreapta, deci pe grafic
mediana și modul se găsesc în dreapta mediei, ceea ce înseamnă că predomină cutiile de
brânză cu multe calorii.
Cas [-0,3; 0,3] seria este ușor asimetrică.
c) Avem o caracteristică alternativă:
– cutii care au sub 95 calorii;
– cutii care au peste 95 calorii.
Varianta xi Frecvențele absolute
ni
DA (sub 95 calorii)
NU (peste 95 calorii) 1
0 m = 15
n – m = 35
Total – n = 50
Media caracteristicii alternative:
3,05015
nmw
30% dintre cutii au sub 95 calorii.
Dispersia caracteristicii alternative:
21,0)3,01(3,0)w1(w2
w
5. Teme de control
1. Presupunând că la fiecare termen al unei ser ii se adaugă aceeași constantă “a”:
a) cum se va modifica amplitudinea absolută?
b) cum se va modifica media?
c) cum se va modifica dispersia, dar abaterea medie pătratică?
d) cum se va modifica abaterea medie liniară?
2. Presupunem că fiecare termen al unei serii se multiplică cu aceeași constantă “k”:
a) cum se va modifica amplitudinea absolută?
b) cum se va modifica media?
c) cum se va modifica dispersia și abaterea medie pătratică?
d) cum se va modifica abaterea medie liniară?
3. Prețurile de vânzare pentru un calculator ști ințific cu aceleași caracteristici, fabricat de
aceeași firmă, au fost înregistrate în 20 de magazine. Rezultatele sunt redate mai jos și sunt
exprimate în lei:
10,50 12,75 11,00 16,50 19,30 20,00 16,50 13,90 17,50 18,00
13,50 17,75 18,50 20,00 15,00 14,45 17,85 15,00 17,50 13,50
Se cere:
a) să se caracterizeze gradul de asimetrie al seriei;
b) să se caracterizeze gradul de variație al seriei;
4.Despre angajații unei sucursale a unei bănci comerciale se cunosc datele:
Grupe de salariați după vechime (ani) Nr. salariați
0 – 4
4 – 8
8 – 12
12 – 16
16 – 20 2
6
10
8
4
Total 30
Se cere:
a) să se verifice dacă distribuția salariaților după vechime este omogenă;
b) să se caracterizeze gradul de asimetrie;
c) să se calculeze media și dispersia caracteristicii “salariați cu v echimea sub vechimea
medie”.
5.Un studiu privind durata de viață în ore a unui produs electrocasnic efectuat pe 100 aparate
a condus la următoarele rezultate:
Durata de viață (ore) Structura numărului de aparate electrocasnice
0 – 1000
1000 – 2000
2000 – 3000
3000 – 4000
4000 – 5000
5000 – 6000 8
20
26
22
18
6
Total 100
Se cere:
a) să se aprecieze dacă media este reprezentativă;
b) să se caracterizeze gradul de asimetrie;
c) să se determine media și dispersia caracteristicii “aparate care au durata de viață mai
mică de 3000 ore”.
6. În tabelul următor este prezentată repartiția gospodăriilor dintr -o localitate în funcție de
numărul de copii:
Nr. copii 0 1 2 3 4 5 6 7 8
Nr. gospodării 286 380 416 258 112 62 47 12 7
Se cere:să se calculeze numărul mediu de copii pe gospodărie și să se verifice dacă
media este reprezentativă;
6. Rezumatul Unității de învățare
Fenomenele și procesele economico -sociale sunt complexe, aflându -se sub influența unui număr mare
de factori esențiali și întâmplători, ceea ce face ca me dia, cel mai utilizat indicator al tendinței
centrale, să nu fie suficientă pentru analiza acestor fenomene. De aceea, pe lângă indicatorii tendinței
centrale se impune și calculul indicatorilor de variație.
Indicatorii variației pentru o serie statistică se clasifică în:
indicatori simpli ai variației – sunt acei indicatori care arată împrăștierea valorilor una
față de alta sau împrăștierea valorilor față de o anumită valoare;
indicatori sintetici ai variației – care iau în considerare toți termenii seriei în calculul lor,
sintetizând într -o singură valoare întreaga împrăștiere din serie.
Cu ajutorul indicatorilor variației putem:
studia reprezentativitatea mediei pentru o serie de date;
aprecia gradul de omogenitate a seriei;
caracteriza gradului de variaț ie a unei serii;
compara în timp și spațiu a mai multor serii de repartiție pentru aceeași caracteristică sau
pentru caracteristici diferite care au fost înregistrate pentru aceeași colectivitate;
cunoaște gradul de influență a factorilor după care s -a efe ctuat gruparea;
cunoaște forma distribuției (repartiției) de frecvențe prin comparație cu distribuția normală
7. Bibliografia Unității de învățare
1.Chauvat G., Reau J.P., Statistiques descriptives , Armand Colin, Paris, 2004
2. Danciu A.,Niculescu I., G ruiescu M., Statistică economică , Editura Enciclopedică,
București, 2009
3. Isaic -Maniu Al., Mitrut C., Voineagu V., Statistică , Editura Universitară, București, 2003;
4. Voineagu V., Țițan E., Ghiță S., Boboc C., Todose D. – Statistică. Baze teoretice și
aplicații, Editura Economică, București, 2007;
5.Wonnacott T.H., Wonnacott R.J., Statistique , Economica, Paris,1995
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: CURS STATISTICĂ – Unitatea de învățare nr. 7 [627939] (ID: 627939)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
