1CURS STATISTICĂ ( Unitatea de învățare nr. 4 [625583]
1CURS STATISTICĂ ( Unitatea de învățare nr. 4
SISTEMATIZAREA, PREZENTAREA ȘI REPREZENTAREA
DATELOR STATISTICE
Cuprins:
1. Obiectivele Unității de învățare.
2. Sistematizarea datelor statistice (gruparea/clas ificarea).
2.1. Clasificarea datelor statistice.
2.2. Gruparea datelor statistice
3. Modalități de prezentare și reprezentare a datel or statistice.
3.1. Serii statistice.
3.2. Tabele statistice.
3.3. Grafice statistice.
4. Răspunsuri la testele de autoevaluare.
5. Teme de control.
6. Rezumatul Unității de învățare.
7. Bibliografia Unității de învățare.
1. Obiectivele unității de învățare
În urma parcurgerii acestei unități de învățare stu dentul va înțelege:
Î cum se poate face trecerea de la etapa de culegere a datelor la cea de
prelucrare propriuzisă a lor;
Î cum se pot transpune seturile mari de date colectat e dintrÎo formă aleatoare,
neregulată, întrÎo formă ordonată, organizată;
Î cum se efectuează sistematizarea seturilor largi de date statistice, după o
variabilă calitativă sau după o variabilă cantitati vă;
Î care sunt principalele tipuri de serii statistice;
Î cum să alegem tipul cel mai potrivit de grafic nece sar pentru reprezentarea
datelor statistice.
22. Sistematizarea datelor statistice (gruparea/clasifi carea).
Am văzut că statistica operează cu volume mari de date. Dacă aceste date sunt
prezentate întrÎo formă aleatoare neregulată, este dificil, investigând vizual setul de date, săÎl
caracterizăm prin trăsăturile sale esențiale, prin valorile extreme, tendința centrală sau gradul
de dispersare. De aceea, putem întâi supune setul d e date unor operații de prezentare
sistematică, de organizare, de ordonare a acestor d ate după unul sau mai multe criterii , întrÎ
un cuvânt de sistematizare .
Această operație face trecerea de la observarea st atistică (în urma căreia sÎau obținut
datele necesare realizării obiectivelor investigați ei statistice, verificate sub aspectul volumului
și calității) și prelucrarea propriuzisă.
Sistematizarea este parte a prelucrării primare a datelor statistice.
Sistematizarea datelor se realizează prin gruparea și clasificarea datelor statistice.
Atunci când criteriul (caracteristica) după care s e realizează această operație este unul
numeric, cantitativ, ea se numește grupare , iar când operația se realizează după un criteriu
(caracteristic) calitativ, nenumeric, ea se numește clasificare .
La realizarea unei grupări/clasificări, trebuie, p e cât posibil, să îndeplinim următoarele
condiții:
a) omogenitate (în sensul că unitățile statistice care au aceeași valoare sau valori
apropiate, asemănătoare, ale caracteristicii după c are se efectuează sistematizarea vor
fi incluse în aceeași clasă; în felul acesta, se do rește ca variația valorilor caracteristicii
incluse în aceeași grupă/clasă să fie cât mai mică) ;
b) unicitate (în sensul că o unitate statistică trebuie inclusă întrÎo singură clasă sau grupă,
ea nu se poate regăsi simultan în două sau mai mult e clase/grupe);
c) completitudine (în sensul că toate unitățile statistice să fie in cluse în grupe/clase, să nu
fie exclusă vreo unitate din operația de sistematiz are). Sistematizarea datelor statistice cuprinde operații le de prezentare sistematică, de
organizare, de ordonare a acestor date după unul sa u mai multe criterii.
Gruparea/clasificarea datelor statistice presupune împărțirea unităților populației
statistice observate în grupe sau clase distincte o mogene, după unul sau mai multe
criterii.
3Sunt cazuri în care nu este posibilă îndeplinirea s imultană a tuturor acestor condiții (de
exemplu: dacă sunt unități la care sÎau înregistrat valori extreme, aberante, ale caracteristicii
după care se face sistematizarea, este de dorit, un eori, să se evidențieze separat aceste cazuri,
să se scoată în afara grupării aceste unități și să se sistematizeze restul unităților, la care sÎau
înregistrat valori mai apropiate ale variabilei).
2.1 . Clasificarea datelor statistice.
Se construiește un număr de clase egal cu numărul c ategoriilor existente, iar prin
numărarea unităților statistice incluse în fiecare clasă obținem frecvența acelei clase (volumul
ei).
Unele clasificări au caracter oficial, altele au c aracter neoficial.
Dacă datele sunt sistematizate după o variabilă cat egorială (nominală), ordinea
claselor este lăsată la îndemâna cercetătorului.
☺☺ ☺☺ Exemplul 1
Distribuția absolvenților unei facultăți economice după domeniul în care sÎau angajat este:
Domeniu Număr de absolvenți ( ni)
Contabilitate 95
Marketing 72
Finanțe 55
Management economic 43
Altele sau fără loc de muncă 35
Total 300
Dacă datele se referă la variabile ordinale, clasel e vor respecta criteriul de ordine:
☺☺ ☺☺ Exemplul 2
Distribuția studenților unei grupe după calificativ ul obținut la un proiect este :
Calificativ ( xi) Număr de studenți ( ni)
Insuficient 3
Satisfăcător 4
Bine 15 Sistematizarea datelor efectuată după o variabilă n e4numerică se numește clasificare . Ea
presupune împărțirea unităților în clasele/categori ile variabilei nenumerice considerate.
4Foarte bine 6
Excelent 2
Total 30
2.2 . Gruparea datelor statistice.
În funcție de tipul variabilei de grupare (discretă sau continuă) și de plaja valorilor pe
care le poate caracteristica, gruparea se poate fac e:
Î pe variante (atunci când grupăm datele după o variabilă discre tă sau când plaja
valorilor pe care le poate lua caracteristica nu es te foarte mare);
Î pe intervale de variație (atunci când sistematizăm datele după o variabilă
continuă, care are o plajă largă de valori.
A). Gruparea datelor statistice pe variante.
În acest caz, se va forma un număr de grupe egal cu numărul de variante. Prin
numărarea unităților incluse în fiecare grupă se ob ține frecvența grupei (numită și frecvență
absolută).
☺☺ ☺☺ Exemplul 3
Pentru 20 de familii sÎa înregistrat numărul de cop ii: 1, 2, 3, 0, 2, 0, 1, 2, 1, 3, 2, 2, 0, 2, 1, 3,
1, 2, 4, 2. Să se realiezeze o sistematizare a date lor.
Număr de copii ( xi) Număr de familii ( ni)
0 3
1 5
2 8
3 3
4 1
Total 20
Observăm că variabila de grupare este numărul de co pii, variabilă discretă cu puține variante
(cinci variante), deci sÎa realizat o grupare pe va riante.
B). Gruparea pe intervale de variație. Gruparea reprezintă sistematizarea datelor după o v ariabilă (caracteristică)
numerică.
5Se poate efectua pe intervale de mărime egală sau d iferită. În continuare vom trata
numai cazul grupării datelor statistice pe interval e egale de variație.
Pentru realizarea grupării pe intervale egale de v ariație se recomandă parcurgerea
următorilor pași:
a) se determină amplitudinea variației caracteristicii , ca diferență între valoarea
maximă și valoarea minimă a caracteristicii.
min max x xA−=
b) se stabilește numărul de grupe. În acest caz pot exista două situații:
Î numărul de grupe ( r) este prestabilit, pe baza experienței căpătate di n studii anterioare
asupra domeniului de interes.
Î numărul de grupe ( r) nu este prestabilit; în acest caz, dacă unitățile se repartizează
aproximati normal după caracteristica studiată, se poate utiliza pentru determinarea
numărul de grupe relația lui Sturges :
n r lg 322, 31⋅+=
unde n este numărul total de unități ale colectivității.
Este recomandat a se folosi un număr potrivit de g rupe (de regulă între 4 și 10).
Utilizarea unui număr prea mare de grupe ar duce la fărâmițarea excesivă a colectivității
(putând apare, în acest caz și grupe cu frecvențe n ule, iar gruparea ar trebui refăcută);
utilizarea, dimpotrivă, a unui număr prea mic de gr upe ar putea să nu pună în evidență
principalele tipuri calitative ale populației după variabila urmărită).
c) se determină mărimea intervalului de grupare (h), c a raport între amplitudinea
caracteristicii și numărul de grupe:
rAh=
Pentru ușurarea calculelor, se recomandă a se folo si mărimi rotunjite de interval, de
aceea, dacă valoarea reieșită din calcul este fracț ionară, cu mai multe zecimale, ea se poate
rotunji prin adaos la o valoare imediat superioară, aleasă în mod convenabil.
De exemplu: dacă h = 4,4225, se poate rotunji valoarea la h = 4,5 sau chiar la h = 5.
d) se formează intervalele de grupare, prin precizarea limitelor exacte ale acestora.
xmin xmin +h
xmin +h xmin +2h
…………………………………………… ..
xmin + (r — 1) .h xmin + r ⋅ h
6Limitele intervalelor vor avea același grad de prec izie ca și datele grupate (același
număr de zecimale), primul interval putând începe c hiar de la valoarea minimă a
caracteristicii, sau de la o valoare ușor inferioar ă acesteia, aleasă în mod convenabil. Este bine
să nu existe suprapuneri de limite, astfel încât la efectuarea grupării să poată fi respectată
condiția de unicitate.
Î Dacă limita superioară a unui interval coincide cu limita inferioară a intervalului
următor, intervalele se numesc continue ;
Î Dacă între limita superioară a unui interval și lim ita inferioară a intervalului următor
există o diferență de o unitate întreagă sau zecima lă, intervalele se numesc
discontinue sau discrete.
Rezultatele sistematizării pot fi redate cu ajutoru l unui tabel asemănător celui din
exemplul următor.
☺☺ ☺☺ Exemplul 4
În vederea analizei oportunității deschiderii unui magazin ce vinde aparatură
electrocasnică, un analist financiar este interesat în cunoașterea nivelului vânzărilor zilnice ale
magazinelor de profil. Pentru 50 de astfel de magaz ine alese întâmplător, înregistrează
valoarea facturilor emise zilnic. Datele sunt următ oarele (mii lei):
10,5 8,0 8,2 9.6 7,1
8,4 7,9 8,0 7,2 5,2
10,5 6,8 7,7 8,8 7,7
9,0 9,5 7,4 11,3 5,9
9,2 8,1 6,5 8,5 5,2
9,7 11,5 9,5 9,4 5,6
6,6 9,9 8,2 10,5 11,7
10,6 6,9 6,9 6,9 6,0
10,1 7,5 7,2 6,5 7,8
7,1 11,1 8,2 7,5 6,5
Să se sistematizeze datele, grupânduÎse pe interval e egale de variație
Rezolvare
Se notează cu X – caracteristica de grupare ( valoarea facturilor emise zilnic ). Se parcurg
următorii pași:
• se calculează amplitudinea variației caracteristi cii ( Ax): Ax = x max 4 xmin =11,7–5,2=6,5 mii
lei;
• se stabilește numărul de grupe ( r): r=1+3,32 ln =1+3,322lg 50 =6,64 ≈7 (formula lui
Sturges);
• se stabilește mărimea intervalului de grupare ( h): h = A x / r =6,5/7 ≈1 mii lei ;
• se stabilesc intervalele de variație și se efectu ează gruparea
7 Varianta I Varianta II
Intervale de variație a valorii
facturilor emise zilnic (mii lei) Nr.
magazine
(ni) Intervale de variație a valorii
facturilor emise zilnic (mii lei) Nr.
magazine
(ni)
5,0 – 6,0 4 5,0 – 6,0 5
6,0 – 7,0 9 6,0 – 7,0 8
7,0 – 8,0 11 7,0 – 8,0 13
8,0 – 9,0 9 8,0 – 9,0 8
9,0 – 10,0 8 9,0 – 10,0 7
10,0 – 11,0 5 10,0 – 11,0 5
11,0 Î 12,0 4 11,0 Î 12,0 4
Total 50 Total 50
Notă : limita inferioară inclusă în interval. Notă : limita superioară inclusă în interval.
Varianta III
Intervale de variație a valorii facturilor emise
zilnic (mii lei) Nr. magazine
(ni)
5,0 – 5,9 4
6,0 – 6,9 9
7,0 – 7,9 11
8,0 – 8,9 9
9,0 – 9,9 8
10,0 – 10,9 5
11,0 – 11,9 4
Total 50
Notă : intervale discontinue.
Se recomandă utilizarea intervalelor continue (vari anta I sau varianta II).
3. Modalități de prezentare și reprezentare a datel or statistice.
Rezultatul sistematizării datelor prin grupare/clas ificare se prezintă sub formă de:
Î serii statistice;
Î tabele statistice;
Î grafice statistice.
3.1. Serii statistice.
Seriile statistice se pot clasifica după următoare le criterii:
a) în funcție de conținutul variabilei după care se fa ce sistematizarea, avem:
i. serii cronologice (se referă la o variabilă de timp );
ii. serii teritoriale (se referă la o variabilă de spaț iu); Seria statistică reprezintă un mod organizat de pre zentare a datelor, sub forma a două
șiruri: primul se referă la criteriul de sistematiz are iar al doilea cuprinde datele numerice
sau frecvențele de apariție și depinde de ordinea d e apariție din primul șir.
8iii. serii de distribuție de frecvențe (sau repartiții d e frecvențe, care se referă la o
variabilă atributivă).
b) după natura variabilei, seriile de distribuție pot fi.
i. distribuții heterograde (după o variabilă cantitati vă);
ii. distribuții homograde (după o variabilă calitativă) ;
c) după numărul variantelor, distribuțiile pot fi:
i. distribuții pe variante sau valori;
ii. distribuții pe grupe de variante (în cazul distribu țiilor homograde) sau pe
intervale de valori (în cazul distribuțiilor hetero grade).
d) în funcție de numărul variabilelor după care se fac e sistematizarea, întâlnim:
i. distribuții de frecvențe unidimensionale (când sist ematizarea datelor sÎa
efectuat după o singură variabilă);
ii. distribuții de frecvențe bidimensionale (când siste matizarea datelor sÎa efectuat
în funcție de două variabile);
iii. distribuții multidimensionale (când sistematizarea datelor sÎa efectuat în
funcție de trei sau mai multe variabile);
Serii de distribuție de frecvențe (repartiții de fr ecvențe)
A. Serii de distribuție de frecvențe unidimensional e
A1. Distribuții heterograde (după o variabilă numer ică).
Se pot reprezenta sub forma:
Î pentru o caracteristică discretă (repartiții de frecvențe pe variante/valori):
r ir i
n n nnx x xxX… …… …:
2 12 1,
unde ni ( r i, 1= ) sunt frecvențele de apariție ale variantei xi.
Seria de distribuție de frecvențe unidimensională r eprezintă o serie în care primul șir
cuprinde variantele/valorile sau intervalele de var iație ale unei variabile, iar al doilea șir
– frecvențele de apariție ale variantelor sau volum ul grupelor.
9Î pentru o caracteristică continuă (repartiție de frecvențe pe intervale de valori):
<< << << <<
r ir r i i
n n n nxX x xX x xX x xX xX
… … … …:
2 1sup inf sup inf sup
2inf
2sup
1inf
1
sau
r ir i
n n nnx x xxX… …… …:
2 12 1
unde xi , r i, 1= sunt centrele intervelor de variație.
Serii de repartiție de frecvențe pe intervale de va riație
Se prezintă sub forma:
Intervale de variație ale caracteristicii de grupar e Număr de unități statistice ( ni)
sup
1inf
1 x x− n1
sup
2inf
2 x x− n2
… …
sup inf
i i x x− ni
… …
sup inf
r r x x− nr
Total ∑
==r
iin n
1
unde: sup inf,i ix x reprezintă limita inferioară, respectiv superioară , a intervalului de variație „ i”.
Vom considera doar cazul intervalelor egale și cont inue.
Centrul intervalului este determinat ca medie aritmetică simplă a limit elor intervalului
și este considerat reprezentativ pentru datele din acel interval. Se determină cu una din
relațiile:
2sup inf
i i
ix xx+= sau 2inf i
i ihx x+= , unde hi este mărimea intervalului.
Frecvența absolută a grupei (n i) este egală cu numărul de unități statistice care a u
valoarea caracteristicii mai mare (sau egală) cu li mita inferioară a intervalului și mai mică
(sau egală) cu limita superioară a acesteia. Suma f recvențelor absolute este notată cu n și
reprezintă numărul total de unități sau volumul eșa ntionului. ∑
==r
iin n
1
Frecvența relativă a unei grupe (*
in) reprezintă ponderea unităților statistice în
volumul total al colectivității care au valoarea ca racteristicii cuprinsă între limita inferioară și
10 cea superioară a grupei respective. Se determină ca raport între frecvența absolută a grupei și
volumul eșantionului (eventual înmulțit cu 100).
nn
nnni
r
iii
i==
∑
=1* și se exprimă în coeficienți,
sau
100 100
1*
% ⋅=⋅=
∑
=nn
nnni
r
iii
i și se exprimă în procente.
Suma frecvențelor relative este 1 sau 100, după cum sunt exprimate în coeficienți sau
în procente.
1
1*=∑
=r
iin sau 100
1*
%=∑
=r
iin
Frecvențele cumulate.
Sunt de două tipuri: cumulate crescător și cumulate descrescător.
Frecvența absolută cumulată crescător a unei grupe este egală cu numărul unităților
care au valoarea variabilei mai mică (sau egală) cu limita superioară a grupei (mai exact între
inf
1xși sup
ix).
∑
==i
kk i n Fc
1
Frecvența absolută cumulată crescător a ultimei gru pe este egală cu volumul colectivității (cu
n).
Frecvența absolută cumulată descrescător a unei grupe este egală cu numărul
unităților pentru care valoarea caracteristicii est e mai mare (sau egală) cu limita inferioară a
grupei (mai exact între inf
ixși sup
rx):
∑
==r
ikk i n Fd
Frecvența absolută cumulată descrescător a primei g rupe este egală cu numărul total de unități
statistice (cu n):
Asemănător se determină și frecvențele relative cum ulate crescător și descrescător,
conform relațiilor:
11 ∑
==i
kk i n Fc
1* * , ∑
==r
ikk i n Fd* *
Frecvențele absolute, relative și cumulate oferă o imagine de ansamblu asupra tendinței de
distribuție a valorilor în colectivitate, asupra no rmalității, simetriei ori asimetriei repartiției de
frecvențe.
☺☺ ☺☺ Exemplu 5
Pentrul datele din exemplul 4 (varianta I) sÎau det erminat: frecvențele absolute,
frecvențele relative, centrele de interval și frecv ențele absolute cumulate:
Intervale de
variație a valorii
facturilor emise
zilnic (mii lei) Nr. magazine
(ni) Ponderea
magazinelor
(*%
in) Centre de
interval ( xi) Frecvențe absolute cumulate
Crescător Descrescător
[5,0 – 6,0) 4 8 5,5 4 50
[6,0 – 7,0) 9 18 6,5 13 46
[7,0 – 8,0) 11 22 7,5 24 37
[8,0 – 9,0) 9 18 8,5 33 26
[9,0 – 10,0) 8 16 9,5 41 17
[10,0 – 11,0) 5 10 10,5 46 9
[11,0 – 12,0) 4 8 11,5 50 4
Total 50 100 Î ( (
Serii de repartiție de frecvențe pe variante (discr ete)
Se prezintă astfel:
Variantele/valorile caracteristicii de grupare ( xi) Număr de unități statistice ( ni)
x1 n1
x2 n2
… …
xi ni
… …
xr nr
Total ∑
==r
iin n
1
unde: ni reprezintă numărul unităților care prezintă valoar ea xi a caracteristicii de grupare (se
mai numesc frecvențe absolute);
Prin însumarea frecvențelor grupelor ( ni) se obține volumul total al colectivității ( n).
Și pentru această serie se determină toate tipurile de frecvențe prezentate anterior.
☺☺ ☺☺ Exemplul 6
12 Pentrul situația din exemplul 3 sÎau determinat: fr ecvențele absolute, frecvențele relative,
și frecvențele absolute cumulate:
Număr de copii
(xi) Număr de
familii ( ni) Frecvențe relative
(*
in) Frecvențe absolute cumulate
Crescător Descrescător
0 3 0,15 3 20
1 5 0,25 8 17
2 8 0,40 16 12
3 3 0,15 19 4
4 1 0,05 20 1
Total 20 1,00 Î Î
A2. Distribuții homograde (după o variabilă nenumer ică).
Și pentru distribuțiile homograde, în care sistemat izarea datelor este realizată după o
variabilă calitativă, se pot calcula frecvențe abso lute și relative (vezi exemplul 1).
Dacă sistematizarea sÎa efectuat după o variabilă o rdinală, se pot calcula și frecvențe
cumulate.
☺☺ ☺☺ Exemplul 7
Pentrul clasificarea din exemplul 2 sÎau determinat : frecvențele absolute, frecvențele
relative, și frecvențele absolute cumulate:
Calificativ
(xi) Număr de
studenți ( ni) Frecvențe relative
(*
in) Frecvențe absolute cumulate
Crescător Descrescător
Insuficient 3 0,10 3 30
Satisfăcător 4 0,13 7 27
Bine 15 0,50 22 23
Foarte bine 6 0,20 28 8
Excelent 2 0,07 30 2
Total 30 1,00 Î Î
B. Serii de distribuție de frecvențe bidimensionale .
Forma generală a unei distribuții de frecvențe bid imensionale, în care sÎau luat în
considerare două variabile statistice X și Y este p rezentată în tabelul următor.
13 Distribuția de frecvențe bidimensională
Variante sau centre de
interval pt. variabila X Variante sau centre de interval pt. variabila Y Total
unități y1 y 2 … y j … y p
x1 n 11 n 12 … n1j … n1p n 1.
x2 n21 n 22 … n2j … n2p n 2.
… … … … … … … …
xi n i1 n i2 … nij … nip n i.
… … … … … … … …
xr n r1 n r2 … nrj … nrp n r.
Total unități n.1 n .2 … n .j … n .p n..
Tabelul de mai sus reprezintă un tabel de corelație , în care avem:
xi, r i, 1= este varianta sau centrul de interval pentru grupa „ i”, formată după valorile
variabilei X;
yj, p j, 1= este varianta sau centrul de interval al grupei „ j”, formată după valorile variabilei
Y;
nij , r i, 1= ; p j, 1= reprezintă numărul unităților statistice la care în tâlnim simultan valoarea
xi a caracteristicii X și valoarea yj a caracteristicii Y;
∑
==p
jij i n n
1. este numărul de unități statistice care au valoarea xi a caracteristicii X, indiferent
de valoarea caracteristicii Y;
∑
==r
iij j n n
1. este numărul de unități statistice care au valoarea yj a caracteristicii Y, indiferent
de valoarea caracteristicii X;
∑∑∑∑
== = =====p
jjr
iir
ip
jij n n n n n
1.
1.
1 1.. este volumul total al colectivității.
☺☺ ☺☺ Exersați în … Excel
Nivelul profitului anual (mii RON) pentru 50 de fir me producătoare de mobilă este:
62 90 91 93 95
82 99 102 105 110
89 123 133 145 164
97 65 72 76 79
114 84 86 87 89
63 91 92 94 96
83 101 104 107 113
119 132 134 146 174
64 69 74 77 98
84 85 86 88 102
14 Să se sistematizeze datele pe 7 intervale egale de variație și să se reprezinte grafic, folosind metod ele
statistice implementate în Excel.
Rezolvare folosind EXCEL:
1. În celula A1 tastați textul „Profit“ și începând de la celula A2 introduceți datele.
2. În celula B1 tastați textul „Bin“. În celula B2 introduceți limita superioară a primului interval: 78
(62+16=78), în B3 a celui deÎal doilea interval: 94 (78+16=94) etc.
3. Apăsați Tools/Data Analysis și Histogram.
4. Introduceți Input Range (A1:A51 ) și Bin Range (B1:B8 ). Selectați Labels.
5. Selectați Chart Output, New Workbook și apăsați OK .
6. Se va obține o histogramă cu spații între coloane. Pentru a obține o histogramă cu coloanele lipite se
parcurg următorii pași.
7. Se poziționează cursorul pe coloanele histogramei. Se apasă de două ori pe butonul din stânga al
mouseÎului. Se va deschide o fereastră Format Data Series . În această fereastră se merge pe
Options și la Gap width se trece 0. Se apasă OK .
Se obțin rezultatele:
Bin Frequency Histogram
0510 15 20
78 94 110 126 142 158 174 More
Bin Frequency
78 9
94 18
110 12
126 4
142 3
158 2
174 2
Din histogramă se poate observa că variabila studia tă nu are o distribuție normală.
Dacă se dorește afișarea frecvențelor relative cumu late se selectează la pasul 5 și Cumulative
Percentage .
Pentru realizarea curbei cumulative a frecvențelor se apasă Insert/Chart.
Se selectează Line iar la Data Range se introduc celulele corespunzătoare frecvențelor cumulate.
La Series/Category (X) axis labels se introduc celulele corespunzătoare capetelor de interval (coloana
Bin). Se apasă Next/Next/FINISH .
Se obține curba cumulativă a frecvențelor relative:
Cumulative %
,00% 20,00% 40,00% 60,00% 80,00% 100,00% 120,00%
78 94 110 126 142 158 174
15 Testul de autoevaluare nr. 1.
1. Frecvența absolută cumulată crescător a unei grupe reprezintă:
a) ponderea unităților care se încadrează în grupa respectivă;
b) ponderea unităților care au valoarea caracterist ică mai mică sau eventual egală cu limita
superioară a grupei;
c) numărul unităților care au valoarea caracteristi cii mai mică sau egală cu limita
inferioară a grupei;
d) numărul unităților care au valoarea caracteristi cii mai mică sau egală cu limita
superioară a grupei;
e) numărul unităților care au valoarea caracteristi cii mai mare sau egală cu limita
inferioară a grupei.
2. Se cunosc datele următoare:
Număr de piese realizate zilnic (bucăți) Muncitori (%)
10 5
15 20
17 45
20 15
22 15
Tabelul prezintă:
a) o distribuție heterogradă de frecvențe absolute;
b) o distribuție homogradă de frecvențe absolute;
c) o distribuție heterogradă de frecvențe relative, pe variante;
d) o distribuție homogradă de frecvențe relative;
e) nici una dintre variantele de mai sus.
3. Frecvența relativă cumulată crescător a ultimei gru pe este egală cu:
a) numărul unităților statistice din grupa respectivă;
b) ponderea unităților statistice din grupa respectivă în total colectivitate;
c) 100%;
d) numărul total de unități statistice din colectivita te;
e) 1,00.
16 3.2. Tabele statistice.
Așa cum am arătat, alături de grafice, și tabelele statistice joacă un rol important în
prezentarea dateor, căci ele pot releva anumite asp ecte pe care graficele nu le pot pune în
valoare. În unele situații, este mai importantă pre zentarea valorilor numerice ale datelor, decât
o vizualizare grafică a acestora. În felul acesta, tabelele reprezintă un instrument
complementar graficelor, de prezentare rapidă și ef icientă a datelor, dar și de sistematizare a
acestora.
Pentru ca un tabel statistic să fie corect elabora t și săÎși atingă scopul, trebuie să
conțină un set de elemente obligatorii sau opțional e și să respecte unele reguli:
Î titlul tabelului este un element obligatoriu plasat înaintea tabelului, care descrie clar și
concis conținutul datelor pe care le cuprinde;
Î macheta tabelului este o rețea de linii ce alcătuie sc rubricile tabelului;
Î subiectul tabelului este format din populația la ca re se referă datele înscrise în tabel;
Î predicatul tabelului este format din sistemul de in dicatori redați în tabel;
Î rubricile tabelului sunt spațiile create la întretă ierea liniilor orizontale cu cele verticale,
în care sunt înscrise datele;
Î datele statistice înscrise în tabel pot fi sub form ă numerică sau textuală;
Î unitatea de măsură trebuie precizată pentru fiecare din indicatorii înscriși în tabel; dacă
toți sunt exprimați în aceeași unitate de măsură, a tunci aceasta se poate trece deasupra
tabelului;
Î sursa datelor;
Î numărul tabelului – este necesar mai ales atunci câ nd se folosesc mai multe tabele,
pentru identificarea lor;
Î note explicative, metodologice
3.3. Grafice statistice.
Alegerea tipului de grafic depinde de tipologia dat elor pe care vrem să le reprezentăm.
Astfel, putem utiliza:
Î grafice întrÎun sistem de coordonate;
Î grafice cu ajutorul unor figuri geometrice; Tabelul statistic cuprinde una sau mai multe serii statistice, ai căror termeni sunt înscriși
într 4o rețea de linii și coloane.
17 Î grafice cu ajutorul hărțior sau al altor figuri nat urale sau simbolice.
Pentru ca un grafic săÎși atingă scopul pentru ca re a fost proiectat, el trebuie să fie
corect întocmit, să respecte anumite reguli general e, să cuprindă o serie de elemente
obligatorii sau opționale și anume:
/head2right titlul graficului ;
/head2right sistemul de coordonate;
/head2right scara de reprezentare;
/head2right rețeaua graficului;
/head2right legenda;
/head2right note explicative, sursa datelor etc.
Tipuri de reprezentări grafice utilizate în cazul s eriilor de distribuție de frecvențe
1. Histograma:
Histograma conține o succesiune de dreptunghiuri, cu bazele corespunzătoare lungimii
inÎtervalelor și înălțimile egale cu numărul de obs ervații din fiecare interval (sau cu ponderea
lor). Dacă intervalele au mărime egală, atunci și c oloanele vor avea lățime egală.
Permite vizualizarea distribuției de frecvențe ab solute sau relative, după o variabilă
numerică continuă (pe intervale).
2. Poligonul frecvențelor:
Poligonul frecvențelor este și el utilizat pentru reprezentarea grafică a distribuțiilor de
frecvențe absolute sau relative, atunci când sistem atizarea datelor sÎa făcut după o
caracteristică numerică continuă sau discontinuă. P entru construirea lui, din fiecare valoare a
caracteristicii sau din fiecare centru de interval se ridică câte o perpendiculară și se marchează
pe ea punctul aflat la o distanță egală cu frecvenț a variantei sau intervalului respectiv. Unind
toate punctele astfel găsite rezultă un poligon num it „ poligonul frecvențelor ”.
Poligonul frecvențelor se poate suprapune peste his togramă în cadrul aceluiași grafic,
sau se poate trasa întrÎun grafic separat.
3. Curbele frecvențelor cumulate:
Curbele frecvențelor cumulate (ogivele ), numite și „ curbele cumulative ale
frecvențelor ”, reprezintă o a treia modalitate de reprezentare grafică a distribuțiilor de
18 frecvențe pe intervale de variație sau pe variante. Ele se trasează atât pentru distribuții de
frecvențe absolute, cât și pentru distribuții de fr ecvențe relative.
În cazul distribuțiilor de frecvențe după o variabi lă continuă:
Î reprezentarea grafică a frecvențelor cumulate cresc ător : pe axa Ox se reprezintă
limitele superioare ale intervalelor, iar pe axa Oy – frecvențele cumulate crescător;
prin unirea punctelor astfel obținute se trasează o curbă ascendentă.
Î reprezentarea grafică a frecvențelor cumulate descr escător : pe axa Ox se reprezintă
limitele inferioare ale intervalelor, iar pe axa Oy – frecvențele cumulate descrescător;
prin unirea punctelor astfel obținute se trasează o curbă descendentă.
În cazul distribuțiilor de frecvențe după o variabi lă discretă reprezentarea grafică a
frecvențelor cumulate crescător va avea, de această dată, aspectul unei scări, pentru că nici o
unitate statistică nu poate avea valoarea caracteri sticii situată între variantele stabilite
☺☺ ☺☺ Exemplul 8
Pentru distribuția de frecvențe din exemplul 4, obț inută după o variabilă continuă,
histograma, poligonul frecvențelor și curbele frecv ențelor cumulate se prezintă astfel:
0246810 12
5,0-6,0 6,0-7,0 7,0-8,0 8,0-9,0 9,0-
10,0 10,0-
11,0 11,0-
12,0
mii RON Nr. magazine
0246810 12
3 4 5 6 7 8 9 10 11 12 13
Valoarea facturilor (mii lei) Nr. magazine (ni)
Din graficele realizate reiese că distribuția maga zinelor după valoarea facturilor emise
este o distribuție cu tendință de normalitate. Distribuția magazinelor după valoarea facturilor
Histograma Poligonul frecvențelor
19 Curbele cumulative ale frecventelor
010 20 30 40 50 60
5.0 6.0 7.0 8.0 9.0 10.0 11.0 12.0
mii RON frecvente cumulate
frecvente cumulate crescator frecvente cumulate descrescator
☺☺ ☺☺ Exemplul 9
Pentru distribuția de frecvențe din exemplul 3, obț inută după o variabilă discretă,
poligonul frecvențelor și graficul frecvențelor cum ulate crescător se prezintă astfel:
0246810
0 1 2 3 4 5
nr. copiinr. familii
0510 15 20 25
0 1 2 3 4 5
Nr. copiiFrecvente cumulate
4. Graficul (diagrama) prin coloane sau benzi (bare )
Este folosit pentru reprezentarea distribuțiilor de frecvențe absolute sau relative, în
care sistematizarea sÎa făcut după o variabilă cate gorială, calitativă, măsurată pe scală
nominală. Graficul se trasează în sistemul de axe o rtogonale Ox și Oy, pe Ox se reprezintă
categoriile variabilei calitative, iar pe Oy frecve nțele (absolute sau relative) sau nivelul
indicatorului. Așadar, graficul constă dintrÎo suc cesiune de coloane de lățime egală, câte o
coloană pentru fiecare categorie/variantă a variabi lei nominale, egal distanțate între ele (la
distanțe, de regulă, mai mici decât grosimea coloan elor) și cu înălțimea proporțională cu
frecvențele sau nivelul indicatorului corespunzător categoriei respective. Dacă dreptunghiurile a) Poligonul frecvențelor b)Frecvențe cumulate crescător
20 sunt răsturnate cu 90% (și au baza situată pe axa v erticală) atunci reprezentarea grafică este o
diagramă prin benzi , cu axele inversate față de diagrama prin coloane.
☺☺ ☺☺ Exemplul 10
Pentru distribuția de frecvențe din exemplul 1, obț inută după o variabilă calitativă,
diagrama prin coloane și cea prin benzi se prezintă astfel:
Distributia absolventilor dupa domeniul de
ocupare
020 40 60 80 100
Contabilitate Marketing Finanțe Management
ec. Altele
DomeniulPersoane
0 20 40 60 80 100 Contab. Market. Finanțe Manag. Altele Domeniu
Persoane
5. Diagrama de structură.
Diagrama de structură este folosită pentru a reprez enta grafic structura unei
colectivități, sistematizate după valorile unei var iabile cantitative sau calitative. Graficul arată,
așadar, modul în care întregul se subdivide în părț i componente. De obicei, diagrama se
trasează cu ajutorul cercului, a cărui arie reprezi ntă întregul; acesta se împarte în mai multe
bucăți („felii”), unghiul la centru corespunzător a cestei părți de cerc este proporțional cu
raportul dintre frecvența absolută și volumul total al colectivității (adică cu frecvența relativă)
a acelei clase/grupe.
☺☺ ☺☺ Exemplul 11
Pentru distribuțiile de frecvențe din exemplele 1 ș i 4, diagrama de structură se prezintă
astfel: a) Diagrama prin coloane b) Diagrama prin benzi
21 32%
24% 18% 14% 12%
Contab.
Market.
Finanțe
Manag.
Altele
Structura magazinelor dupa valoarea facturilor
emise zilnic
5,0 – 6,0
8%
6,0 – 7,0
18%
7,0 – 8,0
22%
8,0 – 9,0
18% 9,0 – 10,0
16% 10,0 – 11,0
10% 11,0 – 12,0
8%
Testul de autoevaluare nr. 2.
1. Subiectul unui tabel statistic reprezintă:
a) rețeaua de linii ce alcătuiesc rubricile tabelu lui;
b) colectivitatea la care se referă datele;
c) sistemul de indicatori cuprinși în tabel;
d) datele numerice sau denumirile textuale care se completează în rubricile tabelului;
e) nici una dintre variantele de mai sus.
2. Presupunem că o firmă ce produce trei produse simi lare, dorește să compare, prin
intermediul reprezentărilor grafice, ponderea vânză rilor pe produse în totalul vânzărilor, în doi
ani consecutivi. Reprezentarea grafică va fi:
a) histograma frecvențelor relative;
b) diagrama de structură
c) cronograma
d) corelograma
e) diagrama prin suprafețe
3. Care dintre următoarele reprezentări grafice sunt incorecte și de ce? Structura absolvenților după domeniul de ocupare
22 0FilialaVânzãri
(mil)
102030
A C B
a)0
b)FilialaVânzãri
(mil)
102030
A C B
c)0FilialaVânzãri
(mil)
102030
A C B
AniStoc
(mii□buc.)
1011121314
mai apr. mar. feb. ian.
d)AniStoc
(mii□buc.)
010111213
mai apr. mar. feb. ian.
e)AniStoc
(mii□buc.)
mai apr. mar. feb. ian.
f)
4. Răspunsuri la testele de autoevaluare
Răspunsuri la testul de autoevaluare nr. 1
1. d)
2. c)
3. c), e)
Răspunsuri la testul de autoevaluare nr. 2
1. b)
2. b). Se construiește câte o diagramă de structură pentr u fiecare an
3. )
a) este incorect, deoarece pe axa Ox sunt reprezentat variantele unei variabile calitative, și de
aceea coloanele ar trebui să aibă lățimi egale;
b) este incorect, deoarece coloanele ar trebui să fie disparate, puțin distante unele de altele,
pentru a nu da senzația de continuitate pe axa Ox.
c) este corect;
23 d) este incorect, deoarece axa Oy își are originea în 10, nu în 0, așa cum este cazul scalei de
raport;
e) este incorect, deoarece scările de reprezentare nu au fost alese echilibrat pe cele 2 axe,
(graficul este prea extins pe orizontală, ceea ce d uce la falsa aplatizare, alternare a variației
fenomenului);
f) este incorect deoarece pe axa Oy trebuie figurată o întrerupere de scară (între 0 și 10).
Așadar, incorecte sunt graficele a), b), d), e), f) .
5. Teme de control
1. Se cunoaște durata sejurului întrÎo stațiune montan ă (zile) pentru 30 de turiști:
12 4 16 13 5 8
9 9 11 3 12 6
10 8 11 7 10 20
15 12 9 16 18 12
6 11 10 7 6 14
a) Să se grupeze datele pe 6 intervale egale și să se reprezinte grafic rezultatele
sistematizării;
b) Pentru distribuția obținută la punctul anterior, să se calculeze frecvențele relative;
c) Să se reprezinte grafic structura colectivității de turiști după durata sejurului.
2. Pentru 200 de agenți economici se cunosc datele:
Grupe de agenți economici după numărul
salariaților (pers.) Sub 10 10Î20 20Î30 30Î40 40Î50 50Î60
Ponderea agenților economici (%) 7 8 12 62 6 5
a) Să se reprezinte grafic structura agenților econ omici în funcție de numărul salariaților ;
b) Să se reprezinte grafic distribuția de frecvențe absolute ;
c) Să se calculeze frecvențele absolute cumulate și să se reprezinte grafic.
3. La o societate comercială se analizează contractelo r după valoarea acestora, astfel :
Intervale de variație a valorii contractelor
(mii lei) 150Î
250 250Î
350 350Î
450 450Î
550 550Î
650 650Î
750
Număr de contracte 25 50 18 9 5 3
a) Să se reprezinte grafic distribuția de frecvențe relative;
b) Să se calculeze frecvențele absolute cumulate și să se reprezinte grafic;
c) Să se calculeze centrele intervalelor de variați e.
24 6. Rezumatul Unității de învățare
În acest capitol am învățat să supunem setul de dat e unor operații de prezentare sistematică,
de organizare, de ordonare după unul sau mai multe criterii, într4un cuvânt de sistematizare .
Includem aici operațiile de grpare/clasificare.
Gruparea / clasificarea datelor statistice presupune împărțirea unităților populației statist ice
observate în grupe sau clase distincte omogene, dup ă unul sau mai multe criterii. Dacă efectuăm
sistematizarea datelor după o variabilă nenumerică, spunem că efectuăm o clasificare, iar dacă
sistematizăm datele după o variabilă numerică, spun em că realizăm o grupare.
Clasificarea datelor se poate face:
Î pe variante (dacă sunt puține variante)
Î pe grupe de variante (în cazul existenței mai multor variante).
Gruparea după o variabilă numerică se poate face:
Î pe variante (atunci când grupăm datele după o variabilă discre tă sau când plaja
valorilor pe care le poate lua caracteristica nu es te foarte mare);
Î pe intervale de variație (atunci când sistematizăm datele după o variabilă continuă,
care are o plajă largă de valori). Intervalele de v ariație pot fi egale sau neegale.
Modalitățile de prezentare și reprezentare a datelo r statistice sunt:
4 seriile statistice.
4 tabelele statistice
4 graficele statistice.
7. Bibliografia Unității de învățare
1. Anderson D., Sweeney D.,Williams T., Statistics for Business and Economics , Thomson
South Western, 2008
2. Ghiță S. – “ Statistică ”, Editura Meteor Press, București, 2006.
3. IsaicÎManiu Al., Mitruț C., Voineagu V., Statistică , Editura Universitară, București, 2003;
4. Țițan, E.Î Statistică. Teorie și aplicații în sectorul terțiar , Ed. Meteor Press, București,
5. Voineagu V., Țițan E., Ghiță S., Boboc C., Todos e D. – Statistică. Baze teoretice și
aplicații, Editura Economică, București, 2007;
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: 1CURS STATISTICĂ ( Unitatea de învățare nr. 4 [625583] (ID: 625583)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
