ORDONAREA, GRUPAREA ȘI PREZENTAREA DATELOR STATISTICE 3.1. Serii ( distribuții ) statistice 3.2. Gruparea (sistematizarea ) datelor 3.3. Prezentarea… [605329]

Analiza Datelor
Curs – 3
1

ORDONAREA, GRUPAREA ȘI PREZENTAREA

DATELOR STATISTICE

3.1. Serii ( distribuții ) statistice
3.2. Gruparea (sistematizarea ) datelor
3.3. Prezentarea datelor sub formă de tabele
3.4. Reprezentarea grafică a datelor statistice
3.5. Utilizarea SPSS pentru ordonarea și gruparea datelor statistice
3.6. Utilizarea SPSS pentru prezentarea datelor statistice sub formă de tabele
3.7. Utilizarea SPSS pentru reprezentarea grafică a datelor statistice

2

1) SERII (DISTRIBUȚII) STATISTICE

Atunci când avem un număr mare (foarte mare) de date este imposibil să fie
analizată fiecaare valoare în parte și din acest motiv , înaintea prelucrării datelor
și analizei acestora trebuie ca datele statistice să fie ordonate, grupate și
organizate, iar rezultatul acestor operații îl constituie seriile ( distribuțiile )
statistice de frecvențe .

Acestea sunt formate din două șiruri paralele de date din care unul
reprezintăvariantele /valorile variabilei (sau grupele de variante) iar celălalt
numărul de unități statistice corespunzătoare fiecărei valori sau variante.
Frecvențele sunt de două feluri:
absolute
relative.

Observație : Fiecare frecvență asociată unei valori care are caracteristica
studiată reprezintă un termen al seriei statistice.
3

Definiție : Seria statistică–reprezintă o paralelă între două sau mai multe șiruri
de date dintre care cel puțin unul vizează variabila de grupare

Exemplu_1:
4

În funcție de modul de prezentare al variantelor , și al seriilor statistice , acestea
se împart în:

a) SERII SIMPLE care sunt obținute prin simpla înșiruire a valorilor
individuale. Ulterior, acestea sunt supuse operațiilor de ordonare și grupare
(dacă numărul lor este suficient de mare), obținându -se una din cele două tipuri
de serii , și anume:

• serii de ( pe) variante – când fiecărei variante îi revine un anumit număr de
unități .

• serii de ( pe) intervale – când fiecărui interval, mărginit de o limită inferioară
și de una superioară , îi revine un anumit număr de unități .
Observație : Aceste două serii se mai numesc și serii ( repartiții ) de frecvențeși
formează ceea ce numim distribuție statistică .
5

b) SERII COMPLEXE – atunci când sunt construite dintr- o paralelă între trei
sau mai multe șiruri de date și conțin cel puțin o variabilă de grupare ;
Seriile complexe sunt constituite , în general, din mai multe serii simple.

Având în vedere tipurile de variabile de grupare și dependența tipului de serie de
tipul variabilei de grupare se pot distinge următoarele tipuri de serii statistice:
a) serii de distribuție (repartiții );
b) serii cronologice (de timp );
c) serii de spațiu (teritoriale)

În funcție de natura și modul de manifestare ale variabilei studiate distingem
două tipuri principale de serii statistice :
• serii statistice cantitative
• serii statistice calitative.

6

Exemplu_2 :
Figura … – Serie de distribuție simplă , după intervale.
7

Figura … – Serie de distribuție simplă , după variante
8

La acestea putem adăuga alte două tipuri de distribuții statistice, la care criteriul
dupăcare se face diferențierea este spațiul sau timpul:
•serii statistice spațiale
•serii statistice cronologice.

Observație :
Atunci când variabilele sunt cantitative vom vorbi despre tehnici
statisticeparametrice; în celălalt caz, al caracteristicilor calitative, prelucrările
ce le vom efectua vor fi de tip non-parametric.

În concluzie, seria statistică de frecvențe este rezultatul operațiilor de ordonare
și grupare.

9

Reamintim următoarele notații cu care operăm în prezentarea și prelucrarea
distribuțiilor statistice :
:
10

În cazul seriilor statistice de intervale se presupune că toate valorile din
interiorul fiecărei grupe (clase) se concentrează în valoarea centrală a clasei,
notatătot cu xi.
Această valoare va înlocui în seria statistică intervalul respectiv și se
calculează ca medie aritmetică a valorilor extreme ale intervalului:
Menționăm faptul că o distribuție statistică poate reda pe lângă
frecvențele absolute (ƒ sau ƒa) și pe cele relative ( ƒr).
Acestea sunt absolut necesare când se dorește compararea unor eșantioane
cu numărul total de variante (n) diferit (deexemplu: în cazul a două clase cu
număr total de elevi diferit).
11

12 3.2) GRUPAREA DATELOR

Gruparea statistică reprezintă o operație de sistematizare a populației pe părți
statistic omogene în funcție de variația 1 unei variabile (sau a mai multora).
Importanța acestei operații inițiale derivă din erorile ce pot fi induse fie în cazul
stabilirii unui număr foarte mare de grupe (clase) – situație în care se ajunge la
„fărâmițarea” colectivității –, fie în situația alegerii unui număr prea mic de grupe,
cu intervale foarte mari în cadrul lor – situație în care nu vom surprinde tipurile
calitative existente.

În cazul variabilelor numerice (cantitative) putem realiza
1) grupări pe variante – utilizate în cazul variabilelor de tip discret, când ele pot
lua doar valori întregi (exemple: numărul membrilor unei familii, notele școlare ).
2) grupări pe intervale – utilizate în cazul variabilelor de tip continuu, când ele
pot lua orice valoare într- un interval finit sau infinit (exemple: timpul de reacție ,
mediile școlare anuale, înălțimea ).

13 Mărimea intervalului (K) se obține cu ajutorul formulei lui H.A. Sturges:
unde ,
n – reprezintă numărul total de variante
În situația în care numărul de grupe este ales de cercetător (bazându-se pe
experiență și intuiție ), mărimea intervalului (K) rezultă astfel :

-în cazul variabilelor de tip continuu, prin
raportarea amplitudinii variației (A = xmax –
xmin) la numărul de grupe:
– în cazul variabilelor de tip discret , prin
raportarea numărului valorilor diferite ale
variabilei ( Nx = xmax – xmin +1 = A + 1) la
numărul de grupe

14 3.3) PREZENTAREA DATELOR SUB FORMĂ DE TABELE

Prezentarea datelor sub forma unui tabel statistic permite at ât o bună
vizualizare cât și, mai ales, efectuarea diverselor calcule în procesul de
prelucrare a datelor. În elaborarea unui tabel pot fi identificate următoarele
elemente și reguli principale (Novak, 1995 ):

•titlul tabelului – care trebuie să fie clar, scurt și să definească exact
fenomenul pe care îl reprezintăși , după caz, perioada la care se referă ;

•macheta tabelului – formată din liniile orizontale (rânduri) și liniile verticale
(coloane) din întretăierea cărora apar rubricile (celulele, căsuțele ) care conțin
datele numerice și/sau denumirile textuale;

• subiectul tabelului – înscris de obicei la capătul rândurilor, este constituit
din unitățile populației statistice (ex.: grupe de note, grupe de puncte etc);

•predicatul tabelului – înscris de obicei la capătul coloanelor, cuprinde
ansamblul indicatorilor care se înregistrează la nivelul unităților populației
statistice;

15 •indicarea obligatorie a sursei de date, atunci când este cazul (de obicei sub
tabel);

•se recomandă indicarea unităților de măsură în care se exprimă datele (de
obicei, între titlul și macheta tabelului);

•se recomandă numerotarea tabelelor – pentru identificarea mai ușoară a
acestora în textul de analiză .

16 Graficul trebuie să cuprindă :

•titlul – care poate fi plasat sub / deasupra graficului și sintetizează conținutul
graficului

•Scara de reprezentare – este unul dintre elementele esențiale , dat fiind faptul
că el asigură proporționalitatea indicatorilor reprezentați grafic

•Rețeaua graficului – este compusă din mulțimea segmentelor de dreaptă duse
din dreptul diviziunilor scării de reprezentare.

•Figura propriu- zisă – elementul esențial , de conținut al graficului. Forma și
dimensiunile sale sunt determinate exclusiv de nivelurile și tendințele
variaționale ale indicatorilor reprezentați grafic, prin intermediul scării de
reprezentare.

•Legenda și nota explicativă
Legenda – utilizată pentru specificarea anumitor simboluri sau convenții
utilizate;
Nota explicativă – apare atunci când trebuie prezentate anumite particularități ale
indicatorilor reprezentați : perioada de referință , lipsa de date, sursa datelor etc

17

18 Pentru seriile statistice se folosesc mai frecvent următoarele TIPURI DE
REPREZENTĂRI GRAFICE:

1) HISTOGRAMA – poate fi:
 prin batoane – se utilizează mai frecvent în cazul seriilor construite după
variante, dar se poate utiliza și pentru seriile după intervale respectând
modul de poziționare al figurii
 prin dreptunghiuri – este specifică seriilor construite după intervale de
variație (care au la bază variabile continue). Între figurile geometrice
utilizate (dreptunghiuri) nu se lasă nici un spațiu . Dacă se utilizează pentru
reprezentarea seriilor construite după variante, între figurile geometrice
utilizate se lasă un spațiu liber egal ca mărime .

2) POLIGONUL FRECVENȚELOR – se obține prin unirea vârfurilor
batoanelor din histograma prin batoane sau a mijloacelor b azelor superioare ale
dreptunghiurilor, din histograma prin dreptunghiuri

3) CURBA FRECVENȚELOR CUMULATE – re același principiu de
construcție ca cel al histogramei prin dreptunghiuri cu deosebirea că pe ordonată
se folosesc frecvențele cumulate.

19 Exemplu

Distribuția după greutate a coletelor poștale transportate pe calea ferată ,
ianuarie 2019

20 Etape realizare histograma:

Etapa 1: M. Excel – M. Office – Excel Options

21 Etapa 2 : Add – Ins – Go

22 Etapa 3 : Se bifeaza Analysis ToolPak – se apasa OK

23 Etapa 4:
Etapa 5 : Selectăm Histogram – apasăm OK

24 Etapa 6 : Apare fereastra

25 Etapa 7:

26 Etapa 8:

27 Etapa 9 : Click dreapta pe grafic si alegem Format Data Series
Figura – Histograma prin batoane

28 Etapa 10. Apare fereasta si modificam No Gap – devine 0%

29 Etapa 11: Fereastra devine

30 Etapa 12: Graficul devine
Figura – Histograma prin dreptunghiuri

31 Exemplu

Distribuția după categoria de calificare a muncitorilor din firma Y
martie 2002

Similar Posts