SPECIALIZAREA MATEMATIC A DIDACTIC A LUCRARE DE DISERTAT IE APLICAT II ALE STATISTICII ^IN MEDICIN A Coordonator S tiint i c, Prof. Univ. Dr…. [629286]

UNIVERSITATEA BABES -BOLYAI CLUJ-NAPOCA
FACULTATEA DE MATEMATIC A S I INFORMATIC A
SPECIALIZAREA MATEMATIC A DIDACTIC A
LUCRARE DE DISERTAT IE
APLICAT II ALE STATISTICII ^IN MEDICIN A
Coordonator S tiint i c,
Prof. Univ. Dr. Octavian Agratini
Masterand: [anonimizat],
2018

Cuprins
1 Introducere 1
2 Elemente de statistic a descriptiv a 3
2.1. Scurt istoric . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2. Not iuni intoductive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3. Culegerea datelor statistice . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.4. Repartit ii de frecvent e . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5. Parametrii repartit iilor statistice . . . . . . . . . . . . . . . . . . . . . . 15
2.6. Reprezentarea datelor statistice . . . . . . . . . . . . . . . . . . . . . . 24
2.6.1. Reprezentare prin puncte . . . . . . . . . . . . . . . . . . . . . . 24
2.6.2. Reprezentarea stem-and-leaf . . . . . . . . . . . . . . . . . . . . 25
2.6.3. Reprezentarea cu bare . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.4. Histograme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.6.5. Reprezentare prin sectoare de disc (pie charts) . . . . . . . . . . 30
2.6.6. Ogive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.6.7. Diagrama Q-Q . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3 Veri carea ipotezelor statistice 33
3.1. Ipoteze statistice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2. Tipuri de teste statistice . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.3. Testul Z pentru media teoretic a . . . . . . . . . . . . . . . . . . . . . . 35
3.3.1. Datele problemei . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Bibliogra e 100
iii

Capitolul 1
Introducere
Statistica este  stiint a care culege, sintetizeaz a, descrie  si interpreteaz a datele refe-
ritoare la fenomene generale. Folosind calculul probabilit at ilor, ea se ocup a de studiul
cantitativ al fenomenelor de mas a, prezentate de elemente care au anumite caracteristici
comune.
Din punct de vedere istoric, cre sterea  si dezvoltarea statisticii moderne este legat a
de dou a direct ii distincte:
{ necesitatea statelor de a str^ ange date referitoare la dezvoltarea economic a  si so-
cial a;
{ dezvoltarea teoriei probabilit at ilor, ca ind o ramur a distinct a a matematicii.
^In antichitate, civilizat iile roman a, greac a  si egiptean a, dar  si cele a
ate ^ n Asia, au
colectat informat ii despre evolut ia datelor populat iilor respective. ^In evul mediu, biser-
ica se ocupa cu ^ nregistrarea datelor referitoare la na steri, c as atorii  si decese. Statistica
modern a apare, pentru prima dat a ca  stiint  a, ^ n secolul al XVIII-lea, ^ n cursul Collegium
politico-statisticum a lui Martin Schmeitzel sust inut la Universitatea din Halle.
Rolul  si important a cunoa sterii metodelor  si procedeelor puse la dispozit ie de statis-
tic a au o valoare deosebit a pentru procesul cunoa sterii. Nu este lipsit de important  a
aportul statisticii ^ n domenii ca medicin a, biologie, zic a, chimie, economie.
Utilizarea statisticii ^ n medicin a ofer a generaliz ari pentru ca publicul s a ^ nt eleag a
mai bine riscurile pentru anumite boli, cum sunt, de exemplu, leg aturile dintre anu-
mite comportamente  si bolile de inim a sau cancer. Statistica descriptiv a ne arat a o
parte a populat iei care sufer a de o anumit a boal a, iar statistica inferent ial a ne ajut a la
determinarea cauzelor bolilor.
Medicina modern a nu poate conceput a f ar a cercetare medical a, iar un segment
din ce ^ n ce mai consitent al acestei cercet ari are la baz a statistica. Nu se mai poate
1

2
face cercetare clinic a sau de laborator, iar rezulatele s a e raportate doar prin com-
par ari puerile ^ ntre num arul de cazuri, procente sau medii. F ar a analiz a statistic a nicio
cercetare nu are valoare. Simple compar ari ^ ntre valorile medii pot duce la concluzii
total gre site.
Prezenta lucrare de disertat ie este alc atuit a din trei capitole. ^In primul capitol,
intitulat Elemente de statistic a descriptiv a , este prezentat un scurt istoric legat de
aparit ia statisticii, dup a care sunt amintite principalele elemente  si not iuni ale statisticii
descriptive. Capitolul al doilea este dedicat veri c arii ipotezelor statistice, testelor
aplicate unei populat ii  si testelor referitoare la dou a populat ii. Aplicat iile expuse ^ n
capitolul al treilea vin s a ^ nt areasc a important a rolului pe care ^ l joac a statistica ^ n
medicin a.

Capitolul 2
Elemente de statistic a descriptiv a
2.1. Scurt istoric
Statistica este  stiint a care se ocup a cu colectarea, clasi carea, interpretarea
datelor numerice  si cu folosirea acestora pentru a formula concluzii  si a lua decizii.
Ea studiaz a fenomenele  si procesele din societate  si natur a, relat iile dintre fenomenele
sociale  si economice, precum  si leg aturile cantitative ^ n dependent  a cu cele calitative[6].
Statistica este fundamentat a pe calculul probabilit at ilor. Denumirea de statistic a
este derivat a din cuvantul latin \status"care se traduce prin stat sau stare de lucruri.
La origini, statistica avea rolul de a descrie situat ia genaral a a unui stat din punct de
vedere geogra c  si politic [1].
^Inc a din antichitate dateaz a primele preocup ari statistice. ^In China  si ^ n Egiptul
antic se culegeau  si se \prelucrau"date referitoare la populat ie, recolte, cadastru, ^ n
scopul unei colect ari mai bune a impozitelor  si a p astr arii unei evident e a b arbat ilor
capabili s a poarte arme. Anchetele  si recens amintele efectuate de c atre romani au
reprezentat un apogeu pentru acest tip de activit at i.
Datele statistice au ^ nceput s a e tratate  stiint i c ^ n Germania secolelor XVII-
XVIII. Termenul de statistic a apare pentru prima dat a ^ n cursul lui Martin Schmeitzel,
intitulat Collegium politico-statisticum pe care l-a sust inut la Universitatea din Halle.
Martin Schmeitzel s-a n ascut la Bra sov ^ n data de 28 mai 1679  si a decedat ^ n data
de 20 iulie 1747 ^ n Germania, ^ n localitatea Halle. Educat mai ^ nt^ ai ^ n t ara sa natal a
p^ an a  si-a ^ ncheiat studiile liceale, el a studiat apoi la diferite universit at i germane. Din
anul 1700 a frecventat studiile Universit at ii din Jena, p^ an a ^ n anul 1702 c^ and s-a mutat
la Universitatea din Wittenberg. Dup a put in timp acesta s-a mutat la Universitatea
din Greisfwald, iar ^ n anul 1706 a devenit asistent la Universitatea din Halle. ^In anul
3

4 Elemente de statistic a descriptiv a
1712 a dob^ andit diploma universitar a de master ^ n lozo e. Din anul 1731 el a predat
dreptul constitut ional  si istoria la universitatea din Halle p^ an a ^ n 1747 c^ and a murit.
Imaginea 1: Gottfried AchenwallUn alt autor care a dat form a termenu-
lui de statistic a a fost Gottfried Achen-
wall (1719-1772) prin intermediul cursu-
lui Staatskunde pe care l-a sust inut la
Universitatea din G ottingen.
Termenul de statistic a a aprimit un loc
permanent ^ n G ottingen  si a fost adoptat
 si de alte universit at i germane. Achenwall
a exercitat o in
uent  a stimulativ a asupra
politicii  stiint i ce  si istoriei culturale.
Un moment important pentru dez-
voltarea statisticii ^ l reprezint a cristaliza-
rea calculului probabilit at ilor. Acesta  si-a
pus din plin amprenta asupra statisticii ^ n ultimii 200 de ani. Un statistician important
al secolului al XIX-lea a fost Adolphe Qu etelet care s-a n ascut la 22 februarie 1796
^ n Gent, Belgia  si a decedat la data de 17 februarie 1874 ^ n Bruxelles la v^ arsta de 77
de ani. Qu etelet a fost un astronom, matematician, statistician  si sociolog belgian, de
numele c aruia se leag a not iunile de repartit ie, medie, dispersie, observare de mas a  si
regularitate. Adept a lui Laplace, a fost membru al Academiei de S tiint e din Bruxelles,
pre sedinte al Comisiei centrale de statistic a a Belgiei. El a considerat c a statistica este
singura metod a ce se poate aplica fenomenelor de mas a.
Imaginea 2: Karl PearsonTrecerea de la statistica descriptiv a la
studierea  stiint i c a a populat iilor statis-
tice a fost realizat a, la ^ nceputul secolu-
lui XX, de c atre Karl Pearson (1857-1936)
[5].
Pearson  si elevii s ai au ^ nceput s a con-
sidere caracteristicile unei populat ii ca
reprezent^ and variabile aleatoare. Aceast a
viziune a deschis drumul c atre utilizarea
intens a a Teoriei probabilit at ilor ^ n pro-
blemele statistice, de unde a luat int  a
ceea ce numim ast azi Statistic a mate-
matic a .

Not iuni introductive 5
2.2. Not iuni intoductive
Statistica descriptiv a se ocup a cu colectarea datelor asupra unui fenomen,
^ nregistrarea, gruparea, analiza  si interpretarea acestora, ^ n vederea obt inerii unor
predict ii privind comportamentul viitor al fenomenului. ^Intr-o form a general a, pro-
cesul de cunoa stere statistic a se prezint a sub forma schemei urm atoare
Figura 1: Procesul de cunoa stere statistic a ([1])

6 Elemente de statistic a descriptiv a
Principalele not iuni utilizate ^ n statistic a sunt: populat ie statistic a, unitate statis-
tic a, caracteristic a statistic a  si indicator statistic.
De nit ia 2.2.1. Populat ia statistic a este o mult ime de indivizi, obiecte sau m asur a-
tori ale c aror propriet at i urmeaz a a analizate.
Pentru a forma o populat ie, o mult ime trebuie s a aib a o caracteristic a comun a.
Populat ia ^ n cauz a trebuie s a e foarte atent de nit a  si este considerat a complet de nit a
doar atunci c^ and se poate da lista tuturor elementelor ei.
De nit ia 2.2.2. Num arul elementelor unei populat ii se nume ste volulmul populat iei .
Exemplul 2.2.3. Mult imea student ilor unei universit at i este un exemplu de populat ie
bine de nit a.
De regul a ne g^ andim la o populat ie ca la o colect ie de oameni. Totu si ^ n statistic a,
populat ia poate o colect ie de obiecte, de animale sau de m asur atori.
Exemplul 2.2.4. Mult imea valorilor numerice care sunt rezultatele unor analize de
laborator pentru calciu constituie o populat ie.
De nit ia 2.2.5. Unitatea statistic a este forma individual a de manifestare a fenome-
nelor supuse cercet arii. Unit at ile statistice sunt elementele care alc atuiesc o populat ie
statistic a.
De nit ia 2.2.6. E santionul sauselect ia este o submult ime a unei populat ii.
O select ie trebuie s a ^ ndeplineasc a urm atoarele condit ii:
(a) s a e aleatoare (orice select ie s a aib a  sansa de a aleas a –  sansa poate
calculat a);
(b) toate elementele colectivit at ii s a aib a aceea si probabilitate de a alese;
(c) structura select iei s a e c^ at mai apropiat a de structura populat iei, adic a
select ia s a e reprezentativ a ;
(d) volumul select iei s a e su cient de mare.
De nit ia 2.2.7. Numim statistic a o caracteristic a numeric a a unei select ii (e santion).
De nit ia 2.2.8. Caracteristica statistic a este tr as atura comun a tuturor unit at ilor
unei populat ii care ne intereseaz a ^ n cadrul unei analize statistice.

Culegerea datelor statistice 7
Deoarece unit at ile unei populat ii sunt purt atoare ale unor caracteristici variabile
ca form a de manifestare sau ca nivel de dezvoltare, caracteristicile se mai numesc  si
variabile statistice .
Caracteristicile statistice pe care le putem ^ nt^ alni se clasi c a astfel:
(a) cantitative – posibilit at ile sale se pot m asura, deci se exprim a numeric (de
exemplu ^ n alt imea, greutatea, concentrat ia);
(b) calitative – posibilit at ile sale nu sunt m asurabile, ci numai constatate. Ele
se mai numesc atributive (de exemplu sexul, starea civil a, profesia).
De nit ia 2.2.9. Indicatorul statistic reprezint a expresia numeric a a unei deter-
min ari calitative obt inut a ^ n urma efectu arii unei cercet ari statistice, raportat a la a-
numite condit ii speci ce de timp sau spat iu.
Deci indicatorul statistic cuprinde at^ at not iunea care determin a cont inutul s au, c^ at
 si expresia sa numeric a. Deoarece fenomene-le studiate sunt variabile ^ ntre ele, acestea
nu pot caracterizate printr-un singur indicator. De aceea se folose ste un sistem
de indicatori capabil s a exprime multitudinea relat iilor cantitative dintre fenomenele
studiate. Acest sistem este elementul care une ste cele trei faze ale cercet arii statistice
(observare, prelucrare  si analiz a).
2.3. Culegerea datelor statistice
Una dintre problemele cu care se confrunt a statistica este culegerea datelor.
Tehnica de select ie are un rol extrem de important, deoarece inferent ele pe care le facem
se bazeaz a, ^ n cele din urm a, pe statistici obt inute din datele de select ie . Culegerea
datelor pentru o analiz a statistic a este un proces complex care presupune urm atorii
pa si important i:
1. De nirea obiectivelor experimentului sau studiului (de exemplu compararea efecte-
lor unui anumit medicament cu cele ale unui medicament standard sau estimarea
cheluielilor gospod are sti medii ^ n judet ul nostru);
2. De nirea populat iei de interes  si a variabilelor (de exemplu timpul de recuperare
pentru pacient ii care sufer a de o anumit a boal a sau veniturile totale pe persoan a);
3. De nirea colect iilor de date  si a schemelor de m asurare (aici intr a procedurile de
select ie, dimensiunea select iei, procedeul sau instrumentele de m asurare – ches-
tionar, telefon etc.);

8 Elemente de statistic a descriptiv a
4. Determinarea tehnicilor potrivite (descriptive sau inferent iale) de analiz a a datelor.
Exemplul 2.3.1. Compartimentul economic al universit at ii dore ste s a estimeze cos-
turile pentru educat ie. Una dintre componentele costului total pe semestru este reprezen-
tat a de costul de tip arire sau litogra ere a cursurilor de c atre editura universit at ii. Con-
ducerea universit at ii dore ste media cursurilor pentru ecare student.
Dac a ecare element al unei populat ii este enumerat sau listat vorbim despre
unrecens am^ ant . Totu si recens amintele sunt rar utilizate, deoarece sunt di cil de
alc atuit, consumatoare de resurse de timp  si costisitoare. Ori de c^ ate ori este nerealist
s a realiz am un recens am^ ant trebuie s a analiz am numai o parte a populat iei (o select ie).
C^ and alegem o select ie avem nevoie de un cadru de selet ie.
De nit ia 2.3.2. Cadrul de select ie este o list a de elemente apart in^ and populat iei
din care se extrage select ia.
Acesta poate identic cu populat ia, dar ^ n multe situat ii nu este practic sau este
imposibil s a select am direct din populat ia total a.
Observat ia 2.3.3. Odat a ce s-a de nit cadrul de select ie este necesar s a se de neasc a
 si procedura de culegere a datelor de select ie numit a plan de select ie . Toate planurile
de selct ie pot ^ ncadrate ^ n una din urm atoarele categorii: select ii probabilistice  si
select ii bazate pe judecat a.
De nit ia 2.3.4. Select iile probabilistice sunt select ii ale c aror elemente sunt ex-
trase pe baza unor probabilit at i.
Fiecare element al unei unei populat ii are o anumit a  sans a de a extras ca parte a
select iei.
De nit ia 2.3.5. Select iile bazate pe judecat a sunt extrase pe baza faptului c a sunt
tipice. Persoana care construie ste o select ie bazat a pe judecat a alege elementele pe care
le consider a reprezentative din populat ie.
Observat ia 2.3.6. Inferent a statistic a (estimat iile  si veri carea ipotezelor) nece-
sit a ca planul de select ie s a e o select ie probabilistic a.
Cea mai cunoscut a dintre select iile probabilistice este select ia aleatoare ^ n
care ecare select ie de dimensiune nare aceea si probabilitate de a aleas a.

Culegerea datelor statistice 9
De nit ia 2.3.7. Select ia aleatoare simpl a este o select ie aleatoare aleas a astfel
^ nc^ at ecare element al populat iei s a aib a aceea si probabilitate de a ales.
Gre seli frecvente apar deoarece se face confuzie ^ ntre aleator (la ^ nt^ amplare)  si
anarhic (dezorganizat, far a niciun  sablon). Atunci c^ and se dore ste s a se construiasc a
corect o select ie aleatoare simpl a se poate utiliza un tabel sau un generator de numere
aleatoare, proced^ and astfel: se numeroteaz a elementele populat iei c si se extrag nnu-
mere aleatoare; elementele numerotate cu num arul aleator corespunz ator sunt extrase
din select ie.
De nit ia 2.3.8. Select ia sistematic a este o select ie din care se extrage tot al k-lea
element din cadrul de select ie.
Aceast a metod a de select ie folosest e o singur a dat a tabelul sau generatorul de nu-
mere aleatoare pentru punctul de pornire. Aceast a procedur a se preteaz a pentru select ia
unui procentaj dintr-o populat ie mare. Nu este recomandat a atunci c^ and populat ia este
ciclic a sau repetitiv a. Pentru a selecta un e santion(select ie) de p%dintr-o populat ie
trebuie selectat din 100/p ^ n100/p elemente, iar dac a 100/p nu este^ ntreg se rotunje ste.
De exemplu, primul element(punctul de pornire) este selectat aleator, folosind tabelul
sau generatorul de numere aleatoare, din primele 17 (100/6) elemente din cadrul de
select ie  si apoi ecare al 17-lea element din cadrul de select ie.
C^ and select am populat ii foarte mari, este posibil s a e nevoie s a ^ mp art im
populat ia pe baza unor caracteristici. Aceste subpopulat ii se numesc straturi .
De nit ia 2.3.9. Select ia strati cat a se obt ine strati c and cadrul de select ie, iar
apoi se selecteaz a un num ar nit din ecare strat.
C^ and se construie ste o select ie strati cat a, populat ia se ^ mparte ^ n straturi  si din
ecare strat se realizeaz a o select ie simpl a, sistematic a sau aleatoare (dup a caz). Subselect ile
se combin a ^ ntr-o select ie care va utilizat a ulterior.
De nit ia 2.3.10. Select ia proport ional a se obt ine strati c^ and cadrul de select ie  si
apoi select^ and un num ar de elemente din ecare strat ^ n funct ie de o proport ie stabilit a
sau direct proport ional cu dimensiunea stratului.
De nit ia 2.3.11. Select ia grupat a se obt ine strati c^ and cadrul de select ie  si apoi
select^ and elemente doar din anumite straturi, nu din toate straturile.

10 Elemente de statistic a descriptiv a
2.4. Repartit ii de frecvent e
O prim a sistematizare a datelor asociate unei caracteristici se face prin intermediul
tabelelor, iar tabelul ^ n care apar datele ^ n ordinea obt inerii lor se nume ste tabel simplu .
Plec^ and de la acesta se pot ordona datele ^ n anumite grupe sauclase , dup a anumite
criterii, ajung^ andu-se la un tabel sistematizat.
De nit ia 2.4.1. Num arul elementelor care apart in unei clase este frecvent a clasei nu-
mit a frecvent  a absolut a .
Observat ia 2.4.2. Suma frecvent elor absolute ale tuturor valorilor caracteristicii este
egal a cu efectivul total al populat iei exprimate.
Fie X o caracteristic a ce poate lua valorile xk;k2INdintr-un interval [a;b).
Pe baza unor considerente impuse de studiul statistic se ^ mparte intervalul [a;b)^ nN
subintervale care reprezint a clase de date,  si anume: Ji= [ai1;ai);i=1;N, unde
a0=a siaN=b. Evident
N[
i=1Ji= [a;b); Ji\
Jk=?pentru oricare din indicii i6=k.
Not^ and cunifrecvent a clasei Jitabelul de date va cont ine dou a coloane: clasa  si
frecvent a. De asemenea va cont ine N linii, pe linia i ap ar^ and elementele Ji sini;(i=
1;N).
De nit ia 2.4.3. Analiza statistic a a unui fenomen ^ n raport cu o carcateristic a ne
conduce la o serie de perechi de valori care se nume ste serie statistic a simpl a sau
unidimensional a.
Dac a se grupeaz a mai multe serii statistice se obt in serii multidimensionale.
^In Tabelul 1 respectiv Tabelul 2 sunt prezentate astfel de perechi. Se poate
observa c a dac a prima valoare a perechii din Tabelul 1 este numeric a, ^ n Tabelul 2
prima pereche nu mai are aceast a proprietate.
De nit ia 2.4.4. Seria statistic a reprezint a corespondent a ^ ntre valorile sau vari-
antele caracteristicii de grupare  si frecvent ele de aparit ie ale acestora.
Dup a cont inutul caracteristicii de grupare, seriile statistice pot

Repartit ii de frecvent e 11
Tabelul 1 Tabelul 2
^Imp art irea unui grup de 100 ^Imp art irea unui grup de 100
de persoane dup a colesterolul LDL persoane dup a culoarea ochilor
clase de valori Nr.
(pentru Colesterol LDL) persoane
<100 35
[100-129) 28
[130-159) 19
[160-189) 12
190 6culoarea Nr.
ochilor persoane
negri 27
c aprui 46
verzi 14
alba strii 13
A.de distribut ie – reprezint a o corespondent  a ^ ntre valorile caracteristicii atributive
 si frecvent ele unit at ilor la care se ^ nregistreaz a aceea si variant a.
B.de timp – reprezint a variat ia unei caracteristici ^ n funct ie de timp. Sunt dou a
tipuri:
(i)serii dinamice de intervale – prezint a valorile unei caracteristici urm arit a ^ n
intervale de timp egale (zile, luni, trimestre, ani, etc.).
(ii)serii dinamice de momente – se obt in pentru caracteristici pentru care este
necesar s a se prezinte nivelul la un moment dat. Termenii acestor serii nu se
pot ^ nsuma direct deoarece ar conduce la ^ nregistr ari repetate.
Exemplul 2.4.5. Product ia unei intreprinderi farmaceutice, num arul de nou-n ascut i,
pro tul unei unit at i farmaceutice sunt c^ ateva exemple de serii dinamice de intervale.
Termenii unei serii de intervale sunt ^ nsumabili, obt in^ andu-se o valoare centralizat a
a caracteristicii pe ^ ntreaga perioad a de timp. (vezi Tabelul 3)
Tabelul 3
V^ anz arile de medicamente realizate de societatea "S" ^ n anul 2017
Luna 01 02 03 04 05 06 07 08 09 10 11 12
Milioane 115,7 86,9 111,1 90,2 80,3 65,4 81,7 65,8 121 155,4 137,6 113,2
lei
Exemplul 2.4.6. Stocul de medicamente existent la o societate farmaceutic a ^ ntr-un
anumit trimestru este un exemplu de serie dinamic a de moment.

12 Elemente de statistic a descriptiv a
Tabelul 4
Stocul de medicamente existent la societatea farmaceutic a "S" ^ n trimestrul II 2017
Data aprilie mai iunie
Stoc existent 33,2 25,9 19,4
(milioane lei)
De nit ia 2.4.7. O caracteristic a X care ia o mult ime cel mult num arabil a de valori
se nume ste caracteristic a de tip discret . Dac a ia valori dintr-un interval nit sau
in nit se nume ste caracteristic a de tip continuu .
Observat ia 2.4.8. Diferent a dintre o variabil a discret a  si una continu a este arti cial a.
Variabilele statistice care fac referire la realitatea economic a, zic a etc. posibilit at ile
variabilelor continui vor date sub form a discret a. ^In practic a, numele de variabi a
discret a ^ l vor primi acele variabile ale c aror posibilit at i sunt individualizate; numele de
variabil a continu a ind atribuit celor ale c aror posibilit at i sunt grupate ^ n clase.
Revenim la caracteristica X ce ia valori ^ ntr-un interval [ a;b) care a fost partit ionat
^ n N clase ( Jk=1;N,Jk=[ak1;ak),a0=a,aN=b. Fienkfrecvent a absolut a a clasei Jk
 sixkvaloarea corespunz atoare mijlocului (centrului) intervalului de valori al clasei Jk.
Decixk= (ak1+ak)=2,k=1;N. Tabelul care indic a repartit ia frecvent elor pe clase
(tabelul de frecvent e sau tabelul statistic) se poate prezenta ^ n una din urm atoarele
forme
X frecvent a
[a0;a1)n1
[a1;a2)n2
. .
. .
. .
[aN1;aN)nNX frecvent a
x1n1
x2n2
. .
. .
. .
xNnN
Se observ a c a a doua variant a are aceea si form a ca  si ^ n cazul unei caracteristici
discrete.

Repartit ii de frecvent e 13
De nit ia 2.4.9. Numim amplitudinea clasei de nit a pe intervalul [ai1;ai), lungimea
acestui interval, adic a di=aiai1.
Observat ia 2.4.10. C^ and amplitudinile claselor sunt egale, pentru a stabili num arul
claselor N putem folosi formula lui Sturges :
N= [1 +10
3lgn];
unde n este volumul seriei statistice, iar [a]este partea ^ ntreag a a lui a.
^In practic a, ^ n afara frecvent ei absolute se utilizeaz a frecvent a relativ a notat a cu fk
 si de nit a prin formula:
fk=nk
n; k =1;N:
Lu^ and ^ n considerare de nit ia frecvent ei relative  si observat ia (1.4.2) este evident
c a
NX
i=1fi= 1
Uneori frecvent a relativ a poate dat a ^ n procente. De exemplu, din Tabelul 1
rezult a c a frecvent a relativ a a clasei [130 159) este de 19/100=0.19. Deci 19% din
persoanele care au  si-au realizat analiza pentru Colesterolul LDL au avut rezultatele
analizei cuprinse ^ ntre 130 mg/dL  si 159 mg/dL.
Observat ia 2.4.11. Not unile de variabil a aleatoare  si probabilitate sunt modele teoret-
ice ale not iunilor de caracteristic a  si respectiv frecvent  a relativ a.^ n loc de caracteristic a
se poate utiliza termenul de variabil a statistic a sau, pe scurt, variabil a.
Observat ia 2.4.12. Dac a nnu este cel put in de ordinul zecilor spunem c a select ia
este de un volum mic. ^In acest caz, ^ mp art irea pe clase are o important  a redus a  si ^ n
ceea ce prive ste prelucrarea statistic a a datelor, deci renunt  am la ea.
De nit ia 2.4.13. Amplitudinea absolut a este diferent a dintre valorile extreme ale vari-
abilei X. Acesta se noteaz a cu A(X)  si deci:
A(X) =xmaxxmin,
undexmaxreprezint a cea mai mare valoare pe care o ia X, iar xminreprezint a cea mai
mic a valoare pe care o ia X.

14 Elemente de statistic a descriptiv a
Exemplul 2.4.14. La un laborator de analize medicale, cele 20 de persoane care au
fost testate pentru Colesterolul LDL au obt inut urm atoarele rezultate (mg la 100 ml de
s^ ange):
106 157 134 102
89 160 82 95
70 167 162 134
112 95 102 216
173 106 103 165
a) Scriet i tabelul sistematizat al datelor statistice, consider^ and clase de aplitudini
egale.
b) Scriet i distribut ia statistic a a caracteristicii X  si stabilit i amplitudinea absolut a
A(x).
Solut ie
Volumul populat iei este n=20. Pentru a determina num arul claselor, N, vom aplica
formula lui Sturges.
N= [1 +10
3lg 20] , unde lg 201;301)
)1 +10
3lg 205;33)N= [5;33] = 5:
xmin= 70;xmax= 216:A(X) =xmaxxmin)A(X) = 21670 = 146:
Amplitudinea unei clase i va di=A(X)
N= 29;2, undei=1;5:
Tabelul 5
clasa mijlocul clasei frecvent a absolut a frecvent a relativ a
Ji xi ni fi
[70; 99;2) 84,6 5 0,25
[99;2; 128;4) 113,8 6 0,30
[128;4; 157;6) 143 3 0,15
[157;6; 186;8) 172,2 5 0,25
[186;8; 216] 201,4 1 0,05
Deducem
X84;6 113;8 143;0 172;2 201;4
0;25 0;30 0;15 0;25 0;05
 siA(X) = 201;484;6 = 116;8

Parametrii repartit iilor statistice 15
2.5. Parametrii repartit iilor statistice
De nit ia 2.5.1. Fie datele statistice primare y1;y2;:::;y nrelative la caracteristica X.
1)Media aritmetic a este num arul xade nit astfel:
xa=1
nnX
i=1yi
2)Dac ayi0;i=1;n,media geometric a este num arul xgde nit astfel:
xg= (y1y2:::yn)1
n
3)Dac ayi6= 0;i=1;n sinX
i=1y1
i6= 0,media armonic a este num arul xhde nit
astfel:
xh=n
nP
i=1y1
i
Teorema 2.5.2. Fie datele statistice primare strict pozitive y1;y2;:::;y n.^Intre cele trei
medii introduse prin de nit ia (2.5.1) exist a relat iile:
xhxgxa(*)
Demonstrat ie
Fief: (0;1)!R;f(x) = lnx. Deoarece f00(x) =1
x2<0 oricare ar
x>0 deducem c a f este concav a. Aplic am inegalitatea lui Jensen, deci
8n0 ,8t1;t2;:::;t nstrict pozitive: f(1
nnX
i=1ti)1
nnX
i=1f(ti):
Vom alegeti=yi;i=1;n. Se obt ine astfel:
lny1+y2+:::+yn
n1
n(lny1+ lny2++ lnyn), adic a lnxa1
nln(y1y2:::yn)
De aici deducem c a xa(y1y2:::yn)1
n=xgobt in^ andu-se a doua inegaliatate
enunt at a.
Pentru a obt ine prima inegalitate vom alege ^ n relat ia:

16 Elemente de statistic a descriptiv a
y1+y2+:::+yn
nnpy1y2:::yn
demonstrat a mai sus, yi:=1
yi;undei=1;n.
Astfel:xh1xg1, adic axgxh, ceea ce ^ ncheie demonstrat ia.
Preciz am c a inegaliat at ile (*) devin egaliat at i dac a  si numai dac a y1=y2=:::=yn.
De nit ia 2.5.3. Se consider a datele statistice primare yk; k=1;n, relative la carac-
teristica X din care se obt ine distribut ia statistic a
Xxk
fk
k=1;N
undexksunt clasele considerate, iar nk sifksunt frecvent a absolut a  si, respectiv
frecvent a relativ a a clasei k,k=1;N
1)Media aritmetic a a lui X este:
xa=1
nNX
k=1nkxk=NX
k=1fkxk
2)Dac axk0;k=1;N,media geometric a a lui X este:
xg= (NY
k=1xknk)1
n=NY
k=1xkfk
3)Dac axk6= 0;k=1;N siNX
k=1nkx1
k6= 0,media armonic a a lui X este:
xh=n
NP
i=1nkx1
k=1
NP
i=1fkx1
k
Observat ia 2.5.4. Dac a variabila este continu a, media calculat a din datele grupate nu
coincide cu media calculat a din date negrupate, dar cele dou a medii pot apropiate.Vom
lua ^ n considerare datele din exemplul (2.4.14) pentru a exempli ca acest fapt pentru
media aritmetic a.

Parametrii repartit iilor statistice 17
{media aritmetic a a celor 20 de date este:
1
20(106 + 157 + 134 + 102 + 89 + 160 + 82 + 95 + 70 + 167 + 162+
+134 + 112 + 95 + 102 + 216 + 173 + 106 + 103 + 165) =2530
20= 126;5
{media aritmetic a a distribut iei statistice a caracteristicii X este:
xa= 84;60;25 + 113;80;30 + 1430;15 + 172;20;25 + 201;40;05 =
= 21;15 + 34;14 + 21;45 + 43;05 + 10;07 = 129;86
Teorema 2.5.5. (Propriet at ile mediei aritmetice )
Fie n date primare relative la caracteristica X din care se obt ine distribut ia
Xxi
fi
i=1;N;cuN2:
Atunci au loc urm atoarele:
(1)xmin<xa<xmax:
(2)suma algebric a a abaterilor termenilor seriei de la media lor xaeste nul a.
(3)suma p atratelor abaterilor este minim a c^ and abaterile sunt calculate fat  a de xa:
Demonstrat ie .
(1)xmin=Nxmin
N<x1+x2+:::+xN
N=xa, deoarece din ipotez a X ia cel put in
dou a valori distincte. Analog se demonstreaz a xmax>xa:
(2) Se cere s a ar at am c aNX
i=1(xixa) = 0,  stiind c a xa=1
NNX
i=1xi
NX
i=1(xixa) =NX
i=1xiNX
i=1xa=
=NxaNxa
= 0

18 Elemente de statistic a descriptiv a
(3) Se cere s a veri c am stabilitatea valorii 2Rastfel ^ nc^ atNX
i=1(xi )2s a e
minim a.
Fieu:R!R,u( ) =NX
i=1(xi )2=N 22 NX
i=1xi+NX
i=1xi2:
Minimul acestei funct ii de gradul al doilea se va atinge pentru =2NP
i=1xi
2N, adic a
pentru =xa:
De nit ia 2.5.6. Fie distribut ia statistic a Xxi
fi
i=1;N, undefieste frecvent a relativ a
a clasei i, cu i=1;N.
Media p atratic a a lui X este:
xp= (NX
i=1(x2
ifi)1
2:
Teorema 2.5.7. Fie distribut ia statistic a Xxi
fi
i=1;N:Atunci are loc :
xaxp:
Demonstrat ie
^In inegalitatea Cauchy-Buniakovsky
(nX
i=1aibi)2(nX
i=1a2
i)(nX
i=1b2
i)
se ian:=N,aj=p
fj,bj=p
fjxj si obt inem
(NX
i=1fjxj)2NX
i=1fjx2
j; deoareceNX
i=1fj= 1:
Astfel obt inem c a xa2xp2, de undexaxp, deoarecexp>0.
Fiexi; i=1;Ntermenii unei serii dinamice  si ti; i=1;N1 intervalele dintre
momente. Reprezentarea pe ax a arat a astfel:

Parametrii repartit iilor statistice 19
t1t2 ti tN1
x1x2x3::: x ixi+1::: x N1xN
Calcularea nuvelului mediu ^ n cazul seriei de momente (termenii ne ind ^ nsumabili
direct) presupune transformarea acesteia ^ ntr-o serie de intervale.
Pentru calculul mediei se consider a c a modi carea termenilor de la un moment
la altul se realizeaz a uniform, ceea ce ^ nseamn a c a ecare termen se pondereaz a cu
jum atate din m arimea intervalelor al aturate.
x1t1
2; x2t1+t2
2; :::; x iti1+ti
2; :::; x N1tN2+tN1
2; xNtN1
2
De nit ia 2.5.8. Fie seria dinamic a de momente cu termenii (xi)i=1;N si(ti)i=1;N1
intervalele dintre termeni. Media cronologic a este dat a de
xc=x1t1
2+x2t1+t2
2+:::+xN1tN2+tN1
2+xNtN1
2
N1P
i=1ti:
Vom calcula media cronologic a a seriei prezentate ^ n Tabelul 4 pag. 12.
DeducemN= 3,×1= 33;2,×2= 25;9,×3= 19;4,t1=t2= 1. Astfel:
xc=33;2
2+ 25;9 +19;4
2
2= 26;1 milioane lei
De nit ia 2.5.9. Fie distribut ia Xxi
fi
i=1;N, undeni sifisunt frecvent a absolut a,
respectiv frecvent a relativ a a clasei i, i=1;N:
Frecvent ele absolute cumulate sunt determinate cu ajutorul relat iilor
n0
k=kX
i=1ni; k =1;N
Frecvent ele relative cumulate sunt determinate cu ajutorul relat iilor
f0
k=kX
i=1fi; k =1;N
Deducem imediat c a n0
Neste efectivul total al populat iei examinate  si f0
N= 1:

20 Elemente de statistic a descriptiv a
De nit ia 2.5.10. Fie datele statistice primare ordonate nedescresc ator
y1y2:::yn
Se nume ste median a valoarea numeric a dat a prin relat ia
me=(yik ,n= 2k1
1
2(yik+yik1),n= 2k
Se observ a c a me^ mparte datele statistice ordonate nedescresc ator ^ n dou a p artt i
egale.
Observat ia 2.5.11. Dac a datele statistice sunt grupate atunci determin am mai ^ nt^ ai
clasa median a j; aceasta are proprietatea c a pentru frecvent ele absolute cumulate n0
j1
 sin0
jsunt satisf acute inegalit at ile n0
j1<n
2 sin0
j>n
2:
Cunosc^ and clasa median a va rezulta c a [aj1;aj)este intervalul median. Mediana
mese va calcula cu ajutorul relat iei
me=aj1+dj
nj(n
2n0
j1)
undedj=ajaj1este amplitudinea clasei mediane.
De nit ia 2.5.12. Fie caracteristica X. Prin modulul (moda) lui X ^ ntelegem acea
valoare a caracteristicii, notat a cu mo, cu frecvent a cea mai mare.
Caracteristica X poate avea una sau mai multe valori modale. ^In primul caz X este
unimodal a , iar al doilea caz plurimodal a .
Observat ia 2.5.13. Dac a datele statistice sunt grupate se determin a mai ^ nt^ ai inter-
valul modal (cel cu frecvent a maxim a). Fie acesta [aj1;aj). Se va alege
mo=aj1+djnj
njnj+1
undedj=ajaj1 sink=nknk1; k2fj;j+ 1g
Geometric, modulul moreprezint a abscisa punctului de intersect ie al segmentelor
[Aj1Aj]  si [Bj1Bj], undeAk(ak;nk);Bk(ak;nk+1)  sik=j1;j.
Ret inem c a mediana ( me) depinde de num arul datelor ordonate dup a m arimea lor,
iar modulul ( mo) de varianta caracteristicii cu frecvent a cea mai mare.

Parametrii repartit iilor statistice 21
Exemplul 2.5.14. S a se calculeze me simodistribut iei statistice a lui X de nit ^ n
exemplul 2.4.14 folosind
(i) date statistice primare
(ii) date statistice sistematizate (grupate)
Solut ie
(i) Vom ordona cresc ator cele 20 de date statistice.
70<82<89<9595<102102<103<106106<112<
<134134<157<160<162<165<167<173<216
La mijlocul acestei ordon ari (n=20 – par) sunt valorile 106  si 112. Conform de nit iei,
me=106 + 112
2= 109 . De asemenea mo2f95;102;106;134g.
(ii) Din tabelul asociat lui X vom determina clasa j ^ nc^ at n0
j1<20
2 si
n0
j>20
2. Deducem c a j= 3deoarecen0
2= 6 + 3 = 9 <10 sin0
3= 6 + 3 + 5 >10. Deci
intervalul median este [128;4; 157;6)cu amplitudinea d3= 29;2. Obt inem
me=a2+d31
n3(10n0
2) = 128;4 +29;2
31138;1
Al doilea interval are frecvent  a maxim a (n2= 6) deci acesta devine interval modal.
n2= 65 = 1;n3= 36 =3;d2= 29;2:Obt inem
mo= 99;2 + 29;21
1(3)106;5
De nit ia 2.5.15. Numim cuartile ale distribut iei statistice a caracteristicii X valorile
numericeq1;q2;q3care ^ mpart datele statistice, ordonate nedescresc ator, ^ n patru p art i
egale.
q1este cuartila inferioar a ,q2este mediana (me), iarq3este cuartila superioar a .
Observat ia 2.5.16. Dac a avem datele statistice grupate proced am astfel:
{determimn am intervalul cuartilic inferior [ai1;ai)astfel ^ nc^ at s a aib a loc
n0
i1<n
4 sin0
i>n
4

22 Elemente de statistic a descriptiv a
{determimn am intervalul cuartilic superior [aj1;aj)astfel ^ nc^ at s a aib a loc
n0
j1<3n
4 sin0
j>3n
4
{calcul am ^ n continuare
q1=ai1+di
ni(n
4n0
i1)
q2=me
q3=aj1+dj
nj(3n
4n0
j1)
De nit ia 2.5.17. Fie caracteristica X  si q1;q2;q3cuartilele distribut iei statistice a ca-
racteristicii X. Atunci:
1)q3q1se nume ste abatere cuartil a
2)q=(q3q2) + (q2q1)
2=q3q1
2se nume ste variat ia intercuartil a
3)qr=q3q1
q2=2q
mese nume ste abatere cuartil a relativ a
Dac aq<0;25A(X) atunci distribut ia este considerat a intens concentrat a.
Pentru repartit ia statistic a Xxi
fi
i=1;Nvom de ni momentul de sondaj de ordinul
k simomentul centrat de sondaj de ordinul k .
De nit ia 2.5.18. Momentul de sondaj de ordinul k se calculeaz a astfel:
Mk=NX
i=1xk
ifi:
.
Momentul de sondaj de ordinul 1 al distribut iei X se numet e valoare medie de sondaj .
M1este defapt media aritmetic a xaa sa cum a fost introdus a ^ n de nit ia (2.5.3) punctul
(1). Pentru aceas a not iune se poat folosi urm atoarea notat ie M1,xasaux.^In continuare
vom p astra ultima notat ie.

Parametrii repartit iilor statistice 23
De nit ia 2.5.19. Momentul centrat de sondaj de ordinul k se calculeaz a astfel:
mk=NX
i=1(xix)kfi:
Momentulm2se noteaz a cu 2 si se numet e dispersie de sondaj . Radical de ordinul
2 din dispersia de sondaj se nume ste abatere medie p atratic a  si se noteaz a cu .
Formula de calcul a dispersiei este 2=M2x2:
De nit ia 2.5.20. Fie distribut ia statistic a Xxi
fi
i=1;N. Prin abatere medie abso-
lut a a distribut iei statistice X ^ ntelegem num arul real
=NX
i=1fijxixj:
De nit ia 2.5.21. Coe cientul de variat ie al distribut iei statistice X este num arul
real
v=
x;x6= 0:
Uneori coe cientul de variat ie vse exprim a ^ n procente (100 v%).
Din formula de calcul a dispersiei se observ a c a v2=M2
M121.
De nit ia 2.5.22. Fie distribut ia statistic a neconstat a X.
Num arul (X) =m3
3se nume ste asimetria lui X.
Num arul (X) =m4
43 se nume ste excesul lui X.
Teorema 2.5.23. Fie variabilele neconstante X  si Y astfel ^ nc^ at Y=aX+b;cu a  si
b numere reale, a6= 0. Atunci:
i) (X) = (Y)
ii) pentrua>0; (X) = (Y)
Demonstrat ie
Din propriet at ile momentelor avem c a:
M1(Y) =M1(aX+b) =aM1(X) +b si
mk(Y) =M1[YM1(Y)]k=M1[aXaM1(X)]k=akM1(XM1(X))k=akmk(X)

24 Elemente de statistic a descriptiv a
Pentruk= 2 :2(Y) =a22(X) de unde(Y) =jaj(X):
Aleg^ andk= 4 obt inem
(Y) =m4(Y)
4(Y)=a4m4(X)
a44(X)= (X):
Aleg^ andk= 3 obt inem
(Y) =m3(Y)
3(Y)=a3m3(X)
jaj33(X)=m3(X)
3(X)= (X) c acia>0:
Pe scurt teorema indic a faptul c a cei doi coeicient i (asimetria  si excesul) sunt
invariant i fat  a de o transformare de forma Y=aX+b;cua>0 .
^In mult imea parametrilor statistici care sunt caracteristici datelor experimen-
tale distingem dou a clase mai importante:
1parametrii de tendint  a x;q1;q2=me;q3;mo.
2parametrii de ^ mpr a stiere 2;;v; A(X); (X); (X).
2.6. Reprezentarea datelor statistice
Un tabel de frecvent e sau o distribut ie de frecvent e (absolute sau relative) sunt
de cele mai multe ori baza unor reprezent ari gra ce, pentru o mai bun a vizualizare a
datelor. Aceste reprezent ari pot facute ^ n diferite moduri, dintre care amintim pe cele
mai uzuale [2].
2.6.1. Reprezentare prin puncte
Reprezentarea prin puncte (en., dot plot) este utilizat a, ^ n general, pentru select ii
de date de tip discret de dimensiuni mici. Sunt reprezentate puncte a sezate unul dea-
supra celuilalt, reprezent^ and num arul de aparit ii ale unei valori pentru caracteristica
dat a. Un astfel de gra c este reprezentat ^ n Figura 4. Aceste reprezentari sunt utile
atunci c^ and se dore ste scoaterea ^ n evident  a a anumitor grupuri de date (en., clus-
ters) sau chiar lipsa unor date (goluri). Avantajul acestor reprezent ari este c a se poate
conserva valoarea numeric a a datelor reprezentate.

Reprezentarea datelor statistice 25
Figura 2: Reprezentare prin puncte
2.6.2. Reprezentarea stem-and-leaf
Este folosit a, de asemenea, pentru date de tip discret, de select ii de volum relativ
mic. A  sarea datelor se realizeaz a sub forma unui tabel cu dou a coloane. Prima coloan a,
(tulpina) este format a din una sau mai multe cifre, iar cea de-a doua coloan a (frunza)
este o ^ n siruire de cifre care ocup a pe r^ and ultima pozit ie a ec arei valori. A sadar, dac a
citim datele pe linie 8 j2 3 3 6, defapt avem valorile 82, 83, 83  si 86. Urm atorul set
de date negrupate reprezint a rezultatele analizelor de laborator pentru Glucoza seric a,
efectuate asupra a 20 de pacient i.
52 63 74 94 113
54 69 85 97 118
54 68 82 94 116
58 71 88 99 129

26 Elemente de statistic a descriptiv a
Steam Leaf
5 2 4 4 8
6 3 8 9
7 1 4 6 8
8 2 5 8
9 4 4 7 9
10
11 3 6 8
12 9
Tabelul 6: Tabel stem-and-leaf
Figura 3: Reprezentare steam pentru date discrete
2.6.3. Reprezentarea cu bare
Aceast a reprezentare este folositoare pentru reprezentarea variabilelor discrete cu
un num ar mic de valori diferite. Barele sunt dreptunghiuri ce reprezint a frecvent ele
 si nu sunt unite ^ ntre ele. Fiecare dreptunghi reprezint a o singur a valoare. ^Intr-o
reprezentare cu bare, categoriile sunt plasate, de regul a, pe orizontal a, iar frecvent ele

Reprezentarea datelor statistice 27
pe vertical a. ^In Figura 4 sunt reprezentate datele din tabelul cu rezultatele pacient ilor
pentru Glucoza seric a. Se poate schimba orientarea categoriilor  si a claselor; ^ n acest
caz barele vor aparea pe orizontal a (ca ^ n Figura 5).
Figura 4: Reprezentare cu bare verticale
Figura 5: Reprezentare cu bare orizontale

28 Elemente de statistic a descriptiv a
Figura 6 cont ine acela si set de date (rezultatele analizelor de laborator pentru
Glucoza seric a) reprezentate folosind bare 3D.
Figura 6: Reprezentare cu bare 3D
2.6.4. Histograme
Cuv^ antul histogram a a fost introdus pentru prima oar a de Karl Pearson ^ n anul
1895. Acesta deriv a din cuvintele grece sti histos (gr., ridicat ^ n sus)  si gramma (gr.,
desen, ^ nregistrare). O histogram a este foarte util a pentru select ii mari de date de
tip continuu  si reprezint a o forma pictorial a a unui tabel de frecvent e. Se aseam an a
cu reprezentarea prin bare, cu urm atoarele dou a diferent e: nu exist a spat ii ^ ntre bare
(de si, pot aparea bare de ^ nalt ime zero ce arat a a spat iu liber)  si ariile barelor sunt
proport ionale cu frecvent ele corespunz atoare. Num arul de dreptunghiuri este egal cu
num arul de clase, l at imea dreptunghiului este intervalul clasei, iar ^ n alt imea este a sa
^ nc^ at aria ec arui dreptunghi reprezint a frecvent a. Aria total a a tuturor dreptunghi-
urilor este egal a cu num arul total de observat ii. Dac a barele unei histograme au toate
aceea si l at ime, atunci ^ n alt imile lor sunt proport ionale cu frecvent ele. ^In alt imile barelor
unei histogramei se mai numesc  si densit at i de frecvent  a. ^In cazul^ n care l at imile barelor
nu sunt toate egale, atunci ^ n alt imile lor satisfac relat ia:
^ n alt imea= kf
li
undek= factor de proport ionalitate, f= frecvent a  si li= l at imea clasei i[2].

Reprezentarea datelor statistice 29
Hemoglobina(g/dL) frecvent a
[0; 5) 5
[5; 10) 13
[10; 15) 23
[15; 20) 17
[20; 25) 10
[25; 30) 2
Tabelul 7: Tabel cu valorile Hemoglobinei
^In Tabelul 7 avem datele statistice grupate ^ n 6 clase echidistante.
Figura 7: Histograma pentru datele din Tabelul 7
^In general, pentru a construi o histograma, vom avea ^ n vedere urmatoarele:
{ datele vor ^ mp art ite (unde este posibil) ^ n clase de lungimi egale. Uneori aceste
diviz ari sunt naturale, alteori va trebui sa le fabric am.
{ numarul de clase este, ^ n general, ^ ntre 5 si 20.
{ ^ nregistrat i num arul de date ce cad ^ n ecare clas a (numite frecvent e).
{ gura ce cont ine histograma va avea clasele pe orizontal a  si frecvent ele pe vertical a
[2].

30 Elemente de statistic a descriptiv a
Figura 8: Histograma 3D pentru datele din Tabelul 7
2.6.5. Reprezentare prin sectoare de disc (pie charts)
Distribut ia unei caracteristici se mai poate reprezenta  si folosind sectoare de disc
(diagrame circulare). Fiecare sector de disc reprezint a c^ ate o frecvent  a relativ a. Aceast a
variant a de reprezentare este util a ^ n special pentru reprezentarea datelor calitative.
Avem posibilitatea de a reprezenta datele prin sectoare 3 dimensionale. ^In gura 12
avem reprezentate datele din Tabelul 5 (exemplul 2.4.14).
Figura 9: Reprezentarea pe disc a datelor din Tabelul 5

Reprezentarea datelor statistice 31
Figura 10: Reprezentarea pe disc a datelor 3D
2.6.6. Ogive
Pentru frecvent ele cumulate pot folosite ogive . O ogiv a reprezint a gra cul unei
frecvent e cumulate (absolut a sau relativ a).
Figura 11: Ogiva pentru frecvent ele absolute cumulate din Tabelul 5
2.6.7. Diagrama Q-Q
Diagrama Q-Q (diagrama cunatil a-cunatil a) sau diagrama P-P(diagrama probabilitate-
probabilitate) este utilizat a pentru a determina apropierea dintre dou a seturi de date
(repartit ii). Dac a datele provin dintr-o accea si repartit ie, atunci ele se aliniaz a dupa o

32 Elemente de statistic a descriptiv a
dreapt a ca  si cea desenat a ^ n gura 12. Diagrama Q-Q se bazeaz a pe rangurile valorilor,
iar diagrama P-P se bazeaz a pe funct iile de repartit ie empirice [2].
Figura 12: Diagrama Q-Q pentru datele din Tabelul 7

Capitolul 3
Veri carea ipotezelor statistice
3.1. Ipoteze statistice
^In geometria euclidian a putem lua ca ipotez a a rmat ia c a suma unghiurilor unui
paralelogram este de 360. Cu ajutorul procedeelor general acceptate de demonstrat ie
se veri c a dac a aceast a ipotez a este adev arat a sau fals a. ^ n aceast a situat ie avem de-
a face cu o demonstrat ie matematic a a ipotezei  si dac a demonstrat ia este riguroas a
avem certitudinea c a ipoteza este adev arat a sau fals a. ^In alte  stiint e dec^ at matematica,
pot propuse ipoteze sau teorii referitoare la o anumit a populat ie. Aceste ipoteze le
vom numi ipoteze statistice . Singura metod a de a absolut siguri de valiaditatea sau
falsitatea lor este de a cerceta ^ ntreaga populat ie. Aceast a metod a nu este practic a (sau
chiar imposibil a)  si de aceea suntem nevoit i s a consider am o select ie dintr-o populat ie
 si s-o folosim pentru a decide asupra adev arului sau falsit at ii ipotezei.
Observat ia 3.1.1. O ipotez a statistic a nu este o presupunere asupra select iei ci asupra
populat iei; ea este o presupunere f acut a asupra repartit iilor teoretice pe baza repartit iilor
statistice.
De nit ia 3.1.2. Metoda prin care se decide acceptarea  si respingerea unei ipoteze
statistice se nume ste test statistic .
Dac a sunt vizat i parametrii de care depinde legea de probabilitate a caracteristicii
X testul statistic se va numi test parametric , iar ^ n caz contrar test neparametric .
Cele mai uzuale forme de ipoteze statistice sunt:
a)Ipoteza nul a (notat aH0): ipoteza init ial a asupra repartit iei populat iei studiate
ce urmeaz a a acceptat a sau respins a pe baza rezultatului testului utilizat;
33

34 Veri carea ipotezelor statistice
b)Ipoteza alternativ a (notat aH1): este opus a ipotezei H0.
Exemplul 3.1.3. Dac a veri c am pe baza unui test adecvat dac a variabila aleatoare X
are varint a 2cel put in egal a cu num arul t0atunci putem considera
H0: (2t0)  siH1: (2<t 0).
Presupunem c a X este caracteristica unei populat ii statistice  si c a legea sa de proba-
bilitate depinde de un parametru .^In continuare vom considera dou a ipoteze admisibile
H0(=0)  siH0(=1), cu 2(0;1), apropiat mult de zero un num ar xat pe care
^ l vom numi prag (nivel) de semni cat ie . Veri carea ipotezei H0se face pe baza unei
select ii de volum n X1;X 2;;Xnreferitoare la caracteristica X. Consider am select ia
aceasta ca ind una repetat a. Contruim o mult ime RcRncu proprietatea
P((x1;x2;;xn)2RcjH0) = ;
undex1;x2;;xnsunt valorile variabilelor X1;X 2;;Xnobservate ^ n cadrul
select iei.
Dac a (x1;x2;;xn)2Rc, ipotezaH0se repinge  si se accept a H1.
Dac a(x1;x2;;xn)2eRc, ipotezaH1se repinge  si se accept a H0.
De nit ia 3.1.4. Mult imea Rcse nume ste regiune critic a , iar mult imeaeRcse
nume ste regiune de acceptare (putem utiliza  si notat ia Ra).
Evident Rc\Ra=?.
Observat ia 3.1.5. Prin alegerea prgului de semni cat ie , regiunea critic a Rcnu este
unic determinat a, deoarece se pot g asi mai multe regiuni critice care stisfac relat ia ()
de mai sus. Oricare dintre solut ii reprezint a construirea unui test pentru veri carea
ipotezelor nule.
Nu exist a certitudinea c a nu vom comite o eroare. ^Intr-adev ar exist a dou a tipuri de
erori pe care le putem face ^ n luarea deciziei referitoare la admiterea sau respingerea
unei ipoteze statistice.
a)Eroare de spet a ^ nt^ ai – daca a se ^ nt^ ampl a ca ipoteza cercetat a s a e adev arat a, iar
noi decidem c a este fals a. Probabilitatea acestei erori este notat a cu . Valorile
uzuale ale nivelului de semni cat ie sunt: = 0;1, = 0;05  si = 0;01 care
corespund unor probabilit at i de respingere a ipotezei nule de 10%, 5% respectiv
1%.

35
b)Eroare de spet a a dou a – ipoteza cercetat a este fals a, iar noi decidem c a ea este
adev arat a. Probabilitatea acestei erori este notat a cu .
Observat ia 3.1.6. Testul este cu at^ at mai puternic cu c^ at probabilit at ile  si sunt
mai mici.
Ment ion am faptul c a nu se poate face ca ambele riscuri s a e arbitrar de mici.
Aleg^ and un test  si regl^ and volumul select iei astfel ^ nc^ at primul risc s a e un num ar
dat, probabilitatea ca rezulta ca o consecint  a  si reciproc, aleg and num arul va
rezulta ca o consecint  a. Probabilitatea cu care ipoteza H0poate respins a este funct ie
de. Aceast a probabilitate se nume ste funct ia de putere a testului  si se noteaz a
(~) =P((x1;x2;;xn)2Rcj=~):
Evident(0) =  si(1) = 1 .
3.2. Tipuri de teste statistice
Tipul unui test statistic este determinat de ipoteza alternativ a ( H1). Avem astfel:
a) test unilateral dreapta, atunci c^ and ipoteza alternativ a este > 0;
b) test unilateral st^ anga, atunci c^ and ipoteza alternativ a este < 0;
c) test bilateral, atunci c^ and ipoteza alternativ a este 6=0.
A sadar, pentru a construi un test statistic vom avea nevoie de o regiune critic a. Vom
utiliza metoda intervalelor de ^ ncredere pentru a construi aceasta regiune critic a. Dac a
valoarea observat a se a
a ^ n regiunea critic a (adic a^ n afara intervalului de ^ ncredere),
atunci respingem ipoteza nul a.
3.3. Testul Z pentru media teoretic a
3.3.1. Datele problemei
1) Se consider a caracteristica X ce urmeaz a legea normal a N(m;) undem2Reste
un parametru necunoscut  si >0 este cunoscut.

36 Veri carea ipotezelor statistice
2) Se xeaz a nivelul de semni cat ie 2(0;1):
3) Se consider a o select ie repetat a de volum ncu datele de select ie x1;x2;;xn
respectiv variabilele de select ie X1;X 2;;Xn.
Relativ la X se introduc urm atoarele ipoteze:
H0: (m=m0)  si H1: (m6=m0) unde m0este precizat.

Bibliogra e
[1]Agratini, O. Capitole speciale de matematici , Litogra ata UBB CLUJ, Cluj-
Napoca, 1996.
[2]Stoleriu, I. Statistic a aplicat a , Universitatea Alexandru Ioan Cuza, Ia si, 2018.
[3]Stoleriu, I. Statistic a prin MATLAB , Editura MatrixRom, Bucure sti, 2010
[4]Tr^ mbit a s, R. T. Metode statistice , Editura Presa Universitar a Clujean a, Cluj-
Napoca, 2000.
[5] http://www.hamhigh.co.uk/news/heritage-former-ucs-schoolboy-and-statistician-
karl-pearson-was-revered-by-einstein-1-2304978
[6] https://dexonline.ro/de nitie/statistica
37

Similar Posts