SPECIALIZAREA MATEMATIC A DIDACTIC A LUCRARE DE DISERTAT IE APLICAT II ALE STATISTICII ^IN MEDICIN A Coordonator S tiint i c, Prof. Univ. Dr…. [629285]

UNIVERSITATEA BABES -BOLYAI CLUJ-NAPOCA
FACULTATEA DE MATEMATIC A S I INFORMATIC A
SPECIALIZAREA MATEMATIC A DIDACTIC A
LUCRARE DE DISERTAT IE
APLICAT II ALE STATISTICII ^IN MEDICIN A
Coordonator S tiint i c,
Prof. Univ. Dr. Octavian Agratini
Masterand: [anonimizat],
2018

Cuprins
1 Introducere 1
2 Elemente de statistic a descriptiv a 3
2.1. Scurt istoric . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2. Not iuni intoductive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3. Culegerea datelor statistice . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.4. Repartit ii de frecvent e . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5. Parametrii repartit iilor statistice . . . . . . . . . . . . . . . . . . . . . . 15
Bibliogra e 100
iii

Capitolul 1
Introducere
Statistica este  stiint a care culege, sintetizeaz a, descrie  si interpreteaz a datele refe-
ritoare la fenomene generale. Folosind calculul probabilit at ilor, ea se ocup a de studiul
cantitativ al fenomenelor de mas a, prezentate de elemente care au anumite caracteristici
comune.
Din punct de vedere istoric, cre sterea  si dezvoltarea statisticii moderne este legat a
de dou a direct ii distincte:
{ necesitatea statelor de a str^ ange date referitoare la dezvoltarea economic a  si so-
cial a;
{ dezvoltarea teoriei probabilit at ilor, ca ind o ramur a distinct a a matematicii.
^In antichitate, civilizat iile roman a, greac a  si egiptean a, dar  si cele a
ate ^ n Asia, au
colectat informat ii despre evolut ia datelor populat iilor respective. ^In evul mediu, biser-
ica se ocupa cu ^ nregistrarea datelor referitoare la na steri, c as atorii  si decese. Statistica
modern a apare, pentru prima dat a ca  stiint  a, ^ n secolul al XVIII-lea, ^ n cursul Collegium
politico-statisticum a lui Martin Schmeitzel sust inut la Universitatea din Halle.
Rolul  si important a cunoa sterii metodelor  si procedeelor puse la dispozit ie de statis-
tic a au o valoare deosebit a pentru procesul cunoa sterii. Nu este lipsit de important  a
aportul statisticii ^ n domenii ca medicin a, biologie, zic a, chimie, economie.
Utilizarea statisticii ^ n medicin a ofer a generaliz ari pentru ca publicul s a ^ nt eleag a
mai bine riscurile pentru anumite boli, cum sunt, de exemplu, leg aturile dintre anu-
mite comportamente  si bolile de inim a sau cancer. Statistica descriptiv a ne arat a o
parte a populat iei care sufer a de o anumit a boal a, iar statistica inferent ial a ne ajut a la
determinarea cauzelor bolilor.
Medicina modern a nu poate conceput a f ar a cercetare medical a, iar un segment
din ce ^ n ce mai consitent al acestei cercet ari are la baz a statistica. Nu se mai poate
1

2
face cercetare clinic a sau de laborator, iar rezulatele s a e raportate doar prin com-
par ari puerile ^ ntre num arul de cazuri, procente sau medii. F ar a analiz a statistic a nicio
cercetare nu are valoare. Simple compar ari ^ ntre valorile medii pot duce la concluzii
total gre site.
Prezenta lucrare de disertat ie este alc atuit a din trei capitole. ^In primul capitol,
intitulat Elemente de statistic a descriptiv a , este prezentat un scurt istoric legat de
aparit ia statisticii, dup a care sunt amintite principalele elemente  si not iuni ale statisticii
descriptive. Capitolul al doilea este dedicat veri c arii ipotezelor statistice, testelor
aplicate unei populat ii  si testelor referitoare la dou a populat ii. Aplicat iile expuse ^ n
capitolul al treilea vin s a ^ nt areasc a important a rolului pe care ^ l joac a statistica ^ n
medicin a.

Capitolul 2
Elemente de statistic a descriptiv a
2.1. Scurt istoric
Statistica este  stiint a care se ocup a cu colectarea, clasi carea, interpretarea
datelor numerice  si cu folosirea acestora pentru a formula concluzii  si a lua decizii.
Ea studiaz a fenomenele  si procesele din societate  si natur a, relat iile dintre fenomenele
sociale  si economice, precum  si leg aturile cantitative ^ n dependent  a cu cele calitative[4].
Statistica este fundamentat a pe calculul probabilit at ilor. Denumirea de statistic a
este derivat a din cuvantul latin \status"care se traduce prin stat sau stare de lucruri.
La origini, statistica avea rolul de a descrie situat ia genaral a a unui stat din punct de
vedere geogra c  si politic [1].
^Inc a din antichitate dateaz a primele preocup ari statistice. ^In China  si ^ n Egiptul
antic se culegeau  si se \prelucrau"date referitoare la populat ie, recolte, cadastru, ^ n
scopul unei colect ari mai bune a impozitelor  si a p astr arii unei evident e a b arbat ilor
capabili s a poarte arme. Anchetele  si recens amintele efectuate de c atre romani au
reprezentat un apogeu pentru acest tip de activit at i.
Datele statistice au ^ nceput s a e tratate  stiint i c ^ n Germania secolelor XVII-
XVIII. Termenul de statistic a apare pentru prima dat a ^ n cursul lui Martin Schmeitzel,
intitulat Collegium politico-statisticum pe care l-a sust inut la Universitatea din Halle.
Martin Schmeitzel s-a n ascut la Bra sov ^ n data de 28 mai 1679  si a decedat ^ n data
de 20 iulie 1747 ^ n Germania, ^ n localitatea Halle. Educat mai ^ nt^ ai ^ n t ara sa natal a
p^ an a  si-a ^ ncheiat studiile liceale, el a studiat apoi la diferite universit at i germane. Din
anul 1700 a frecventat studiile Universit at ii din Jena, p^ an a ^ n anul 1702 c^ and s-a mutat
la Universitatea din Wittenberg. Dup a put in timp acesta s-a mutat la Universitatea
din Greisfwald, iar ^ n anul 1706 a devenit asistent la Universitatea din Halle. ^In anul
3

4 Elemente de statistic a descriptiv a
1712 a dob^ andit diploma universitar a de master ^ n lozo e. Din anul 1731 el a predat
dreptul constitut ional  si istoria la universitatea din Halle p^ an a ^ n 1747 c^ and a murit.
Imaginea 1: Gottfried AchenwallUn alt autor care a dat form a termenu-
lui de statistic a a fost Gottfried Achen-
wall (1719-1772) prin intermediul cursu-
lui Staatskunde pe care l-a sust inut la
Universitatea din G ottingen.
Termenul de statistic a a aprimit un loc
permanent ^ n G ottingen  si a fost adoptat
 si de alte universit at i germane. Achenwall
a exercitat o in
uent  a stimulativ a asupra
politicii  stiint i ce  si istoriei culturale.
Un moment important pentru dez-
voltarea statisticii ^ l reprezint a cristaliza-
rea calculului probabilit at ilor. Acesta  si-a pus din plin amprenta asupra statisticii ^ n
ultimii 200 de ani. Un statistician important al secolului al XIX-lea a fost Adolphe
Qu etelet care s-a n ascut la 22 februarie 1796 ^ n Gent, Belgia  si a decedat la data de
17 februarie 1874 ^ n Bruxelles la v^ arsta de 77 de ani. Qu etelet a fost un astronom,
matematician, statistician  si sociolog belgian, de numele c aruia se leag a not iunile de
repartit ie, medie, dispersie, observare de mas a  si regularitate. Adept a lui Laplace, a
fost membru al Academiei de S tiint e din Bruxelles, pre sedinte al Comisiei centrale de
statistic a a Belgiei. El a considerat c a statistica este singura metod a ce se poate aplica
fenomenelor de mas a.
Imaginea 2: Karl PearsonTrecerea de la statistica descriptiv a la
studierea  stiint i c a a populat iilor statis-
tice a fost realizat a, la ^ nceputul secolului
XX, de c atre Karl Pearson(1857-1936) [3].
Pearson  si elevii s ai au ^ nceput s a con-
sidere caracteristicile unei populat ii ca
reprezent^ and variabile aleatoare. Aceast a
viziune a deschis drumul c atre utilizarea
intens a a Teoriei probabilit at ilor ^ n pro-
blemele statistice, de unde a luat int  a
ceea ce numim ast azi Statistic a mate-
matic a .

Not iuni introductive 5
2.2. Not iuni intoductive
Statistica descriptiv a se ocup a cu colectarea datelor asupra unui fenomen,
^ nregistrarea, gruparea, analiza  si interpretarea acestora, ^ n vederea obt inerii unor
predict ii privind comportamentul viitor al fenomenului. ^Intr-o form a general a, pro-
cesul de cunoa stere statistic a se prezint a sub forma schemei urm atoare
Figura 3: Procesul de cunoa stere statistic a ([1])

6 Elemente de statistic a descriptiv a
Principalele not iuni utilizate ^ n statistic a sunt: populat ie statistic a, unitate statis-
tic a, caracteristic a statistic a  si indicator statistic.
De nit ia 2.2.1. Populat ia statistic a este o mult ime de indivizi, obiecte sau m asur a-
tori ale c aror propriet at i urmeaz a a analizate.
Pentru a forma o populat ie, o mult ime trebuie s a aib a o caracteristic a comun a.
Populat ia ^ n cauz a trebuie s a e foarte atent de nit a  si este considerat a complet de nit a
doar atunci c^ and se poate da lista tuturor elementelor ei.
De nit ia 2.2.2. Num arul elementelor unei populat ii se nume ste volulmul populat iei .
Exemplul 2.2.3. Mult imea student ilor unei universit at i este un exemplu de populat ie
bine de nit a.
De regul a ne g^ andim la o populat ie ca la o colect ie de oameni. Totu si ^ n statistic a,
populat ia poate o colect ie de obiecte, de animale sau de m asur atori.
Exemplul 2.2.4. Mult imea valorilor numerice care sunt rezultatele unor analize de
laborator pentru calciu constituie o populat ie.
De nit ia 2.2.5. Unitatea statistic a este forma individual a de manifestare a fenome-
nelor supuse cercet arii. Unit at ile statistice sunt elementele care alc atuiesc o populat ie
statistic a.
De nit ia 2.2.6. E santionul sauselect ia este o submult ime a unei populat ii.
O select ie trebuie s a ^ ndeplineasc a urm atoarele condit ii:
(a) s a e aleatoare (orice select ie s a aib a  sansa de a aleas a –  sansa poate
calculat a);
(b) toate elementele colectivit at ii s a aib a aceea si probabilitate de a alese;
(c) structura select iei s a e c^ at mai apropiat a de structura populat iei, adic a
select ia s a e reprezentativ a ;
(d) volumul select iei s a e su cient de mare.
De nit ia 2.2.7. Numim statistic a o caracteristic a numeric a a unei select ii (e santion).
De nit ia 2.2.8. Caracteristica statistic a este tr as atura comun a tuturor unit at ilor
unei populat ii care ne intereseaz a ^ n cadrul unei analize statistice.

Culegerea datelor statistice 7
Deoarece unit at ile unei populat ii sunt purt atoare ale unor caracteristici variabile
ca form a de manifestare sau ca nivel de dezvoltare, caracteristicile se mai numesc  si
variabile statistice .
Caracteristicile statistice pe care le putem ^ nt^ alni se clasi c a astfel:
(a) cantitative – posibilit at ile sale se pot m asura, deci se exprim a numeric (de
exemplu ^ n alt imea, greutatea, concentrat ia);
(b) calitative – posibilit at ile sale nu sunt m asurabile, ci numai constatate. Ele
se mai numesc atributive (de exemplu sexul, starea civil a, profesia).
De nit ia 2.2.9. Indicatorul statistic reprezint a expresia numeric a a unei deter-
min ari calitative obt inut a ^ n urma efectu arii unei cercet ari statistice, raportat a la a-
numite condit ii speci ce de timp sau spat iu.
Deci indicatorul statistic cuprinde at^ at not iunea care determin a cont inutul s au, c^ at
 si expresia sa numeric a. Deoarece fenomene-le studiate sunt variabile ^ ntre ele, acestea
nu pot caracterizate printr-un singur indicator. De aceea se folose ste un sistem
de indicatori capabil s a exprime multitudinea relat iilor cantitative dintre fenomenele
studiate. Acest sistem este elementul care une ste cele trei faze ale cercet arii statistice
(observare, prelucrare  si analiz a).
2.3. Culegerea datelor statistice
Una dintre problemele cu care se confrunt a statistica este culegerea datelor.
Tehnica de select ie are un rol extrem de important, deoarece inferent ele pe care le facem
se bazeaz a, ^ n cele din urm a, pe statistici obt inute din datele de select ie . Culegerea
datelor pentru o analiz a statistic a este un proces complex care presupune urm atorii
pa si important i:
1. De nirea obiectivelor experimentului sau studiului (de exemplu compararea efecte-
lor unui anumit medicament cu cele ale unui medicament standard sau estimarea
cheluielilor gospod are sti medii ^ n judet ul nostru);
2. De nirea populat iei de interes  si a variabilelor (de exemplu timpul de recuperare
pentru pacient ii care sufer a de o anumit a boal a sau veniturile totale pe persoan a);
3. De nirea colect iilor de date  si a schemelor de m asurare (aici intr a procedurile de
select ie, dimensiunea select iei, procedeul sau instrumentele de m asurare – ches-
tionar, telefon etc.);

8 Elemente de statistic a descriptiv a
4. Determinarea tehnicilor potrivite (descriptive sau inferent iale) de analiz a a datelor.
Exemplul 2.3.1. Compartimentul economic al universit at ii dore ste s a estimeze cos-
turile pentru educat ie. Una dintre componentele costului total pe semestru este reprezen-
tat a de costul de tip arire sau litogra ere a cursurilor de c atre editura universit at ii. Con-
ducerea universit at ii dore ste media cursurilor pentru ecare student.
Dac a ecare element al unei populat ii este enumerat sau listat vorbim despre
unrecens am^ ant . Totu si recens amintele sunt rar utilizate, deoarece sunt di cil de
alc atuit, consumatoare de resurse de timp  si costisitoare. Ori de c^ ate ori este nerealist
s a realiz am un recens am^ ant trebuie s a analiz am numai o parte a populat iei (o select ie).
C^ and alegem o select ie avem nevoie de un cadru de selet ie.
De nit ia 2.3.2. Cadrul de select ie este o list a de elemente apart in^ and populat iei
din care se extrage select ia.
Acesta poate identic cu populat ia, dar ^ n multe situat ii nu este practic sau este
imposibil s a select am direct din populat ia total a.
Observat ia 2.3.3. Odat a ce s-a de nit cadrul de select ie este necesar s a se de neasc a
 si procedura de culegere a datelor de select ie numit a plan de select ie . Toate planurile
de selct ie pot ^ ncadrate ^ n una din urm atoarele categorii: select ii probabilistice  si
select ii bazate pe judecat a.
De nit ia 2.3.4. Select iile probabilistice sunt select ii ale c aror elemente sunt ex-
trase pe baza unor probabilit at i.
Fiecare element al unei unei populat ii are o anumit a  sans a de a extras ca parte a
select iei.
De nit ia 2.3.5. Select iile bazate pe judecat a sunt extrase pe baza faptului c a sunt
tipice. Persoana care construie ste o select ie bazat a pe judecat a alege elementele pe care
le consider a reprezentative din populat ie.
Observat ia 2.3.6. Inferent a statistic a (estimat iile  si veri carea ipotezelor) nece-
sit a ca planul de select ie s a e o select ie probabilistic a.
Cea mai cunoscut a dintre select iile probabilistice este select ia aleatoare ^ n
care ecare select ie de dimensiune nare aceea si probabilitate de a aleas a.

Culegerea datelor statistice 9
De nit ia 2.3.7. Select ia aleatoare simpl a este o select ie aleatoare aleas a astfel
^ nc^ at ecare element al populat iei s a aib a aceea si probabilitate de a ales.
Gre seli frecvente apar deoarece se face confuzie ^ ntre aleator (la ^ nt^ amplare)  si
anarhic (dezorganizat, far a niciun  sablon). Atunci c^ and se dore ste s a se construiasc a
corect o select ie aleatoare simpl a se poate utiliza un tabel sau un generator de numere
aleatoare, proced^ and astfel: se numeroteaz a elementele populat iei c si se extrag nnu-
mere aleatoare; elementele numerotate cu num arul aleator corespunz ator sunt extrase
din select ie.
De nit ia 2.3.8. Select ia sistematic a este o select ie din care se extrage tot al k-lea
element din cadrul de select ie.
Aceast a metod a de select ie folosest e o singur a dat a tabelul sau generatorul de nu-
mere aleatoare pentru punctul de pornire. Aceast a procedur a se preteaz a pentru select ia
unui procentaj dintr-o populat ie mare. Nu este recomandat a atunci c^ and populat ia este
ciclic a sau repetitiv a. Pentru a selecta un e santion(select ie) de p%dintr-o populat ie
trebuie selectat din 100/p ^ n100/p elemente, iar dac a 100/p nu este^ ntreg se rotunje ste.
De exemplu, primul element(punctul de pornire) este selectat aleator, folosind tabelul
sau generatorul de numere aleatoare, din primele 17 (100/6) elemente din cadrul de
select ie  si apoi ecare al 17-lea element din cadrul de select ie.
C^ and select am populat ii foarte mari, este posibil s a e nevoie s a ^ mp art im
populat ia pe baza unor caracteristici. Aceste subpopulat ii se numesc straturi .
De nit ia 2.3.9. Select ia strati cat a se obt ine strati c and cadrul de select ie, iar
apoi se selecteaz a un num ar nit din ecare strat.
C^ and se construie ste o select ie strati cat a, populat ia se ^ mparte ^ n straturi  si din
ecare strat se realizeaz a o select ie simpl a, sistematic a sau aleatoare (dup a caz). Subselect ile
se combin a ^ ntr-o select ie care va utilizat a ulterior.
De nit ia 2.3.10. Select ia proport ional a se obt ine strati c^ and cadrul de select ie  si
apoi select^ and un num ar de elemente din ecare strat ^ n funct ie de o proport ie stabilit a
sau direct proport ional cu dimensiunea stratului.
De nit ia 2.3.11. Select ia grupat a se obt ine strati c^ and cadrul de select ie  si apoi
select^ and elemente doar din anumite straturi, nu din toate straturile.

10 Elemente de statistic a descriptiv a
2.4. Repartit ii de frecvent e
O prim a sistematizare a datelor asociate unei caracteristici se face prin intermediul
tabelelor, iar tabelul ^ n care apar datele ^ n ordinea obt inerii lor se nume ste tabel simplu .
Plec^ and de la acesta se pot ordona datele ^ n anumite grupe sauclase , dup a anumite
criterii, ajung^ andu-se la un tabel sistematizat.
De nit ia 2.4.1. Num arul elementelor care apart in unei clase este frecvent a clasei nu-
mit a frecvent  a absolut a .
Observat ia 2.4.2. Suma frecvent elor absolute ale tuturor valorilor caracteristicii este
egal a cu efectivul total al populat iei exprimate.
Fie X o caracteristic a ce poate lua valorile xk;k2INdintr-un interval [a;b).
Pe baza unor considerente impuse de studiul statistic se ^ mparte intervalul [a;b)^ nN
subintervale care reprezint a clase de date,  si anume: Ji= [ai1;ai);i=1;N, unde
a0=a siaN=b. Evident
N[
i=1Ji= [a;b); Ji\
Jk=?pentru oricare din indicii i6=k.
Not^ and cunifrecvent a clasei Jitabelul de date va cont ine dou a coloane: clasa  si
frecvent a. De asemenea va cont ine N linii, pe linia i ap ar^ and elementele Ji sini;(i=
1;N).
De nit ia 2.4.3. Analiza statistic a a unui fenomen ^ n raport cu o carcateristic a ne
conduce la o serie de perechi de valori care se nume ste serie statistic a simpl a sau
unidimensional a.
Dac a se grupeaz a mai multe serii statistice se obt in serii multidimensionale.
^In Tabelul 1 respectiv Tabelul 2 sunt prezentate astfel de perechi. Se poate
observa c a dac a prima valoare a perechii din Tabelul 1 este numeric a, ^ n Tabelul 2
prima pereche nu mai are aceast a proprietate.
De nit ia 2.4.4. Seria statistic a reprezint a corespondent a ^ ntre valorile sau vari-
antele caracteristicii de grupare  si frecvent ele de aparit ie ale acestora.
Dup a cont inutul caracteristicii de grupare, seriile statistice pot

Repartit ii de frecvent e 11
Tabelul 1 Tabelul 2
^Imp art irea unui grup de 100 ^Imp art irea unui grup de 100
de persoane dup a colesterolul LDL persoane dup a culoarea ochilor
clase de valori Nr.
(pentru Colesterol LDL) persoane
<100 35
[100-129) 28
[130-159) 19
[160-189) 12
190 6culoarea Nr.
ochilor persoane
negri 27
c aprui 46
verzi 14
alba strii 13
A.de distribut ie – reprezint a o corespondent  a ^ ntre valorile caracteristicii atributive
 si frecvent ele unit at ilor la care se ^ nregistreaz a aceea si variant a.
B.de timp – reprezint a variat ia unei caracteristici ^ n funct ie de timp. Sunt dou a
tipuri:
(i)serii dinamice de intervale – prezint a valorile unei caracteristici urm arit a ^ n
intervale de timp egale (zile, luni, trimestre, ani, etc.).
(ii)serii dinamice de momente – se obt in pentru caracteristici pentru care este
necesar s a se prezinte nivelul la un moment dat. Termenii acestor serii nu se
pot ^ nsuma direct deoarece ar conduce la ^ nregistr ari repetate.
Exemplul 2.4.5. Product ia unei intreprinderi farmaceutice, num arul de nou-n ascut i,
pro tul unei unit at i farmaceutice sunt c^ ateva exemple de serii dinamice de intervale.
Termenii unei serii de intervale sunt ^ nsumabili, obt in^ andu-se o valoare centralizat a
a caracteristicii pe ^ ntreaga perioad a de timp. (vezi Tabelul 3)
Tabelul 3
V^ anz arile de medicamente realizate de societatea "S" ^ n anul 2017
Luna 01 02 03 04 05 06 07 08 09 10 11 12
Milioane 115,7 86,9 111,1 90,2 80,3 65,4 81,7 65,8 121 155,4 137,6 113,2
lei
Exemplul 2.4.6. Stocul de medicamente existent la o societate farmaceutic a ^ ntr-un
anumit trimestru este un exemplu de serie dinamic a de moment.

12 Elemente de statistic a descriptiv a
Tabelul 4
Stocul de medicamente existent la societatea farmaceutic a "S" ^ n trimestrul II 2017
Data aprilie mai iunie
Stoc existent 33,2 25,9 19,4
(milioane lei)
De nit ia 2.4.7. O caracteristic a X care ia o mult ime cel mult num arabil a de valori
se nume ste caracteristic a de tip discret . Dac a ia valori dintr-un interval nit sau
in nit se nume ste caracteristic a de tip continuu .
Observat ia 2.4.8. Diferent a dintre o variabil a discret a  si una continu a este arti cial a.
Variabilele statistice care fac referire la realitatea economic a, zic a etc. posibilit at ile
variabilelor continui vor date sub form a discret a. ^In practic a, numele de variabi a
discret a ^ l vor primi acele variabile ale c aror posibilit at i sunt individualizate; numele de
variabil a continu a ind atribuit celor ale c aror posibilit at i sunt grupate ^ n clase.
Revenim la caracteristica X ce ia valori ^ ntr-un interval [ a;b) care a fost partit ionat
^ n N clase ( Jk=1;N,Jk=[ak1;ak),a0=a,aN=b. Fienkfrecvent a absolut a a clasei Jk
 sixkvaloarea corespunz atoare mijlocului (centrului) intervalului de valori al clasei Jk.
Decixk= (ak1+ak)=2,k=1;N. Tabelul care indic a repartit ia frecvent elor pe clase
(tabelul de frecvent e sau tabelul statistic) se poate prezenta ^ n una din urm atoarele
forme
X frecvent a
[a0;a1)n1
[a1;a2)n2
. .
. .
. .
[aN1;aN)nNX frecvent a
x1n1
x2n2
. .
. .
. .
xNnN
Se observ a c a a doua variant a are aceea si form a ca  si ^ n cazul unei caracteristici
discrete.

Repartit ii de frecvent e 13
De nit ia 2.4.9. Numim amplitudinea clasei de nit a pe intervalul [ai1;ai), lungimea
acestui interval, adic a di=aiai1.
Observat ia 2.4.10. C^ and amplitudinile claselor sunt egale, pentru a stabili num arul
claselor N putem folosi formula lui Sturges :
N= [1 +10
3lgn];
unde n este volumul seriei statistice, iar [a]este partea ^ ntreag a a lui a.
^In practic a, ^ n afara frecvent ei absolute se utilizeaz a frecvent a relativ a notat a cu fk
 si de nit a prin formula:
fk=nk
n; k =1;N:
Lu^ and ^ n considerare de nit ia frecvent ei relative  si observat ia (1.4.2) este evident
c a
NX
i=1fi= 1
Uneori frecvent a relativ a poate dat a ^ n procente. De exemplu, din tabelul 1
rezult a c a frecvent a relativ a a clasei [130 159) este de 19/100=0.19. Deci 19% din
persoanele care au  si-au realizat analiza pentru Colesterolul LDL au avut rezultatele
analizei cuprinse ^ ntre 130 mg/dL  si 159 mg/dL.
Observat ia 2.4.11. Not unile de variabil a aleatoare  si probabilitate sunt modele teoret-
ice ale not iunilor de caracteristic a  si respectiv frecvent  a relativ a.^ n loc de caracteristic a
se poate utiliza termenul de variabil a statistic a sau, pe scurt, variabil a.
Observat ia 2.4.12. Dac a nnu este cel put in de ordinul zecilor spunem c a select ia
este de un volum mic. ^In acest caz, ^ mp art irea pe clase are o important  a redus a  si ^ n
ceea ce prive ste prelucrarea statistic a a datelor, deci renunt  am la ea.
De nit ia 2.4.13. Amplitudinea absolut a este diferent a dintre valorile extreme ale vari-
abilei X. Acesta se noteaz a cu A(X)  si deci:
A(X) =xmaxxmin,
undexmaxreprezint a cea mai mare valoare pe care o ia X, iar xminreprezint a cea mai
mic a valoare pe care o ia X.

14 Elemente de statistic a descriptiv a
Exemplul 2.4.14. La un laborator de analize medicale, cele 20 de persoane care au
fost testate pentru Colesterolul LDL au obt inut urm atoarele rezultate (mg la 100 ml de
s^ ange):
106 157 134 102
89 160 82 95
70 167 162 134
112 95 102 216
173 106 103 165
a) Scriet i tabelul sistematizat al datelor statistice, consider^ and clase de aplitudini
egale.
b) Scriet i distribut ia statistic a a caracteristicii X  si stabilit i amplitudinea absolut a
A(x).
Solut ie
Volumul populat iei este n=20. Pentru a determina num arul claselor, N, vom aplica
formula lui Sturges.
N= [1 +10
3lg 20] , unde lg 201;301)
)1 +10
3lg 205;33)N= [5;33] = 5:
xmin= 70;xmax= 216:A(X) =xmaxxmin)A(X) = 21670 = 146:
Amplitudinea unei clase i va di=A(X)
N= 29;2, undei=1;5:
clasa mijlocul clasei frecvent a absolut a frecvent a relativ a
Ji xi ni fi
[70; 99;2) 84,6 5 0,25
[99;2; 128;4) 113,8 6 0,30
[128;4; 157;6) 143 3 0,15
[157;6; 186;8) 172,2 5 0,25
[186;8; 216] 201,4 1 0,05
Deducem
X84;6 113;8 143;0 172;2 201;4
0;25 0;30 0;15 0;25 0;05
 siA(X) = 201;484;6 = 116;8

Parametrii repartit iilor statistice 15
2.5. Parametrii repartit iilor statistice
De nit ia 2.5.1. Fie datele statistice primare y1;y2;:::;y nrelative la caracteristica X.
1)Media aritmetic a este num arul xade nit astfel:
xa=1
nnX
i=1yi
2)Dac ayi0;i=1;n,media geometric a este num arul xgde nit astfel:
xg= (y1y2:::yn)1
n
3)Dac ayi6= 0;i=1;n sinX
i=1y1
i6= 0,media armonic a este num arul xhde nit
astfel:
xh=n
nP
i=1y1
i
Teorema 2.5.2. Fie datele statistice primare strict pozitive y1;y2;:::;y n.^Intre cele trei
medii introduse prin de nit ia (2.5.1) exist a relat iile:
xhxgxa(*)
Demonstrat ie
Fief: (0;1)!R;f(x) = lnx. Deoarece f00(x) =1
x2<0oricare ar
x>0deducem c a f este concav a. Aplic am inegalitatea lui Jensen, deci
8n0,8t1;t2;:::;t nstrict pozitive: f(1
nnX
i=1ti)1
nnX
i=1f(ti):
Vom alegeti=yi;i=1;n. Se obt ine astfel:
lny1+y2+:::+yn
n1
n(lny1+ lny2++ lnyn), adic a lnxa1
nln(y1y2:::yn)
De aici deducem c a xa(y1y2:::yn)1
n=xgobt in^ andu-se a doua inegaliatate
enunt at a.
Pentru a obt ine prima inegalitate vom alege ^ n relat ia:

16 Elemente de statistic a descriptiv a
y1+y2+:::+yn
nnpy1y2:::yn
demonstrat a mai sus, yi:=1
yi;undei=1;n.
Astfel:xh1xg1, adic axgxh, ceea ce ^ ncheie demonstrat ia.
Preciz am c a inegaliat at ile (*) devin egaliat at i dac a  si numai dac a y1=y2=:::=yn.
De nit ia 2.5.3. Se consider a datele statistice primare yk; k=1;n, relative la carac-
teristica X din care se obt ine distribut ia statistic a
Xxk
fk
k=1;N
undexksunt clasele considerate, iar nk sifksunt frecvent a absolut a  si, respectiv
frecvent a relativ a a clasei k,k=1;N
1)Media aritmetic a a lui X este:
xa=1
nNX
k=1nkxk=NX
k=1fkxk
2)Dac axk0;k=1;N,media geometric a a lui X este:
xg= (NY
k=1xknk)1
n=NY
k=1xkfk
3)Dac axk6= 0;k=1;N siNX
k=1nkx1
k6= 0,media armonic a a lui X este:
xh=n
NP
i=1nkx1
k=1
NP
i=1fkx1
k
Observat ia 2.5.4. Dac a variabila este continu a, media calculat a din datele grupate nu
coincide cu media calculat a din date negrupate, dar cele dou a medii pot apropiate.Vom
lua ^ n considerare datele din exemplul (2.4.14) pentru a exempli ca acest fapt pentru
media aritmetic a.

Parametrii repartit iilor statistice 17
{media aritmetic a a celor 20 de date este:
1
20(106 + 157 + 134 + 102 + 89 + 160 + 82 + 95 + 70 + 167 + 162+
+134 + 112 + 95 + 102 + 216 + 173 + 106 + 103 + 165) =2530
20= 126;5
{media aritmetic a a distribut iei statistice a caracteristicii X este:
xa= 84;60;25 + 113;80;30 + 1430;15 + 172;20;25 + 201;40;05 =
= 21;15 + 34;14 + 21;45 + 43;05 + 10;07 = 129;86
Teorema 2.5.5. (Propriet at ile mediei aritmetice )
Fie n date primare relative la caracteristica X din care se obt ine distribut ia
Xxi
fi
i=1;N;cuN2:
Atunci au loc urm atoarele:
(1)xmin<xa<xmax:
(2)suma algebric a a abaterilor termenilor seriei de la media lor xaeste nul a.
(3)suma p atratelor abaterilor este minim a c^ and abaterile sunt calculate fat  a de xa:
Demonstrat ie .
(1)xmin=Nxmin
N<x1+x2+:::+xN
N=xa, deoarece din ipotez a X ia cel put in
dou a valori distincte. Analog se demonstreaz a xmax>xa:
(2)Se cere s a ar at am c aNX
i=1(xixa) = 0 ,  stiind c axa=1
NNX
i=1xi
NX
i=1(xixa) =NX
i=1xiNX
i=1xa=
=NxaNxa
= 0

18 Elemente de statistic a descriptiv a
(3)Se cere s a veri c am stabilitatea valorii 2Rastfel ^ nc^ atNX
i=1(xi )2s a e
minim a.
Fieu:R!R,u( ) =NX
i=1(xi )2=N 22 NX
i=1xi+NX
i=1xi2:
Minimul acestei funct ii de gradul al doilea se va atinge pentru =2NP
i=1xi
2N, adic a
pentru =xa:
De nit ia 2.5.6. Fie distribut ia statistic a Xxi
fi
i=1;N, undefieste frecvent a relativ a
a clasei i, cu i=1;N.
Media p atratic a a lui X este:
xp= (NX
i=1(x2
ifi)1
2:
Teorema 2.5.7. Fie distribut ia statistic a Xxi
fi
i=1;N:Atunci are loc :
xaxp
Demonstrat ie
^In inegalitatea Cauchy-Buniakovsky
(nX
i=1aibi)2(nX
i=1a2
i)(nX
i=1b2
i)
se ian:=N,aj=p
fj,bj=p
fjxj si obt inem
(NX
i=1fjxj)2NX
i=1fjx2
j; deoareceNX
i=1fj= 1:
Astfel obt inem c a x2
ax2
p, de undexaxp, deoarecexp>0.
Fiexi; i=1;Ntermenii unei serii dinamice  si ti; i=1;N1 intervalele dintre
momente. Reprezentarea pe ax a arat a astfel:

Parametrii repartit iilor statistice 19
t1t2 ti tN1
x1x2x3::: x ixi+1::: x N1xN
Calcularea nuvelului mediu ^ n cazul seriei de momente (termenii ne ind ^ nsumabili
direct) presupune transformarea acesteia ^ ntr-o serie de intervale.
Pentru calculul mediei se consider a c a modi carea termenilor de la un moment
la altul se realizeaz a uniform, ceea ce ^ nseamn a c a ecare termen se pondereaz a cu
jum atate din m arimea intervalelor al aturate.
x1t1
2; x2t1+t2
2; :::; x iti1+ti
2; :::; x N1tN2+tN1
2; xNtN1
2
De nit ia 2.5.8. Fie seria dinamic a de momente cu termenii (xi)i=1;N si(ti)i=1;N1
intervalele dintre termeni. Media cronologic a este dat a de
xc=x1t1
2+x2t1+t2
2+:::+xN1tN2+tN1
2+xNtN1
2
N1P
i=1ti:
Vom calcula media cronologic a a seriei prezentate ^ n Tabelul 4 pag. 12.
DeducemN= 3,×1= 33;2,×2= 25;9,×3= 19;4,t1=t2= 1. Astfel:
xc=33;2
2+ 25;9 +19;4
2
2= 26;1 milioane lei
De nit ia 2.5.9. Fie distribut ia Xxi
fi
i=1;N, undeni sifisunt frecvent a absolut a,
respectiv frecvent a relativ a a clasei i, i=1;N:
Frecvent ele absolute cumulate sunt determinate cu ajutorul relat iilor
n0
k=kX
i=1ni; k =1;N
Frecvent ele relative cumulate sunt determinate cu ajutorul relat iilor
f0
k=kX
i=1fi; k =1;N

20 Elemente de statistic a descriptiv a
Deducem imediat c a n0
Neste efectivul total al populat iei examinate  si f0
N= 1:
De nit ia 2.5.10. Fie datele statistice primare ordonate nedescresc ator
y1y2:::yn
Se nume ste median a valoarea numeric a dat a prin relat ia
me=(yik ,n= 2k1
1
2(yik+yik1),n= 2k
Se observ a c a me^ mparte datele statistice ordonate nedescresc ator ^ n dou a p artt i
egale.
Observat ia 2.5.11. Dac a datele statistice sunt grupate atunci determin am mai ^ nt^ ai
clasa median a j; aceasta are proprietatea c a pentru frecvent ele absolute cumulate n0
j1
 sin0
jsunt satisf acute inegalit at ile n0
j1<n
2 sin0
j>n
2:
Cunosc^ and clasa median a va rezulta c a [aj1;aj)este intervalul median. Mediana
mese va calcula cu ajutorul relat iei
me=aj1+dj
nj(n
2n0
j1)
undedj=ajaj1este amplitudinea clasei mediane.
De nit ia 2.5.12. Fie caracteristica X. Prin modulul (moda) lui X ^ ntelegem acea
valoare a caracteristicii, notat a cu mo, cu frecvent a cea mai mare.
Caracteristica X poate avea una sau mai multe valori modale. ^In primul caz X este
unimodal a , iar al doilea caz plurimodal a .
Observat ia 2.5.13. Dac a datele statistice sunt grupate se determin a mai ^ nt^ ai inter-
valul modal (cel cu frecvent a maxim a). Fie acesta [aj1;aj). Se va alege
mo=aj1+djnj
njnj+1
undedj=ajaj1 sink=nknk1; k2fj;j+ 1g
Geometric, modulul moreprezint a abscisa punctului de intersect ie al segmentelor
[Aj1Aj]  si [Bj1Bj], undeAk(ak;nk);Bk(ak;nk+1)  sik=j1;j.
Ret inem c a mediana ( me) depinde de num arul datelor ordonate dup a m arimea lor,
iar modulul ( mo) de varianta caracteristicii cu frecvent a cea mai mare.

Parametrii repartit iilor statistice 21
Exemplul 2.5.14. S a se calculeze me simodistribut iei statistice a lui X de nit ^ n
exemplul 2.4.14 folosind
(i) date statistice primare
(ii) date statistice sistematizate (grupate)
Solut ie
(i) Vom ordona cresc ator cele 20 de date statistice.
70<82<89<9595<102102<103<106106<112<
<134134<157<160<162<165<167<173<216
La mijlocul acestei ordon ari (n=20 – par) sunt valorile 106  si 112. Conform de nit iei,
me=106 + 112
2= 109 . De asemenea mo2f95;102;106;134g.
(ii) Din tabelul asociat lui X vom determina clasa j ^ nc^ at n0
j1<20
2 si
n0
j>20
2. Deducem c a j= 3deoarecen0
2= 6 + 3 = 9 <10 sin0
3= 6 + 3 + 5 >10. Deci
intervalul median este [128;4; 157;6)cu amplitudinea d3= 29;2. Obt inem
me=a2+d31
n3(10n0
2) = 128;4 +29;2
31138;1
Al doilea interval are frecvent  a maxim a (n2= 6) deci acesta devine interval modal.
n2= 65 = 1;n3= 36 =3;d2= 29;2:Obt inem
mo= 99;2 + 29;21
1(3)106;5
De nit ia 2.5.15. Numim cuartile ale distribut iei statistice a caracteristicii X valorile
numericeq1;q2;q3care ^ mpart datele statistice, ordonate nedescresc ator, ^ n patru p art i
egale.
q1este cuartila inferioar a, q2este mediana ( me), iarq3este cuartila superioar a.
Observat ia 2.5.16. Dac a avem datele statistice grupate proced am astfel:
{determimn am intervalul cuartilic inferior [ai1;ai)astfel ^ nc^ at s a aib a loc
n0
i1<n
4 sin0
i>n
4
{determimn am intervalul cuartilic superior [aj1;aj)astfel ^ nc^ at s a aib a loc
n0
j1<3n
4 sin0
j>3n
4

22 Elemente de statistic a descriptiv a
{calcul am ^ n continuare
q1=ai1+di
ni(n
4n0
i1)
q2=me
q3=aj1+dj
nj(3n
4n0
j1)
De nit ia 2.5.17. Fie caracteristica X  si q1;q2;q3cuartilele distribut iei statistice a ca-
racteristicii X. Atunci:
1)q3q1se nume ste abatere cuartil a
2)q=(q3q2) + (q2q1)
2=q3q1
2se nume ste variat ia intercuartil a
3)qr=q3q1
q2=2q
me
Dac aq<0;25A(X) atunci distribut ia este considerat a intens concentrat a.
Pentru repartit ia statistic a Xxi
fi
i=1;Nvom de ni momentul de sondaj de ordinul
k simomentul centrat de sondaj de ordinul k .
De nit ia 2.5.18. Momentul de sondaj de ordinul k se calculeaz a astfel:
Mk=NX
i=1xk
ifi:
.
Momentul de sondaj de ordinul 1 al distribut iei X se numet e valoare medie de sondaj .
M1este defapt media aritmetic a xaa sa cum a fost introdus a ^ n de nit ia (2.5.3) punctul
(1). Pentru aceas a not iune se poat folosi urm atoarea notat ie M1,xasaux.^In continuare
vom p astra ultima notat ie.
De nit ia 2.5.19. Momentul centrat de sondaj de ordinul k se calculeaz a astfel:
mk=NX
i=1(xix)kfi:

Parametrii repartit iilor statistice 23
Momentulm2se noteaz a cu 2 si se numet e dispersie de sondaj . Radical de ordinul
2 din dispersia de sondaj se nume ste abatere medie p atratic a  si se noteaz a cu .
Formula de calcul a dispersiei este 2=M2x2:
De nit ia 2.5.20. Fie distribut ia statistic a Xxi
fi
i=1;N. Prin abatere medie abso-
lut a a distribut iei statistice X ^ ntelegem num arul real
=NX
i=1fijxixj:
De nit ia 2.5.21. Coe cientul de variat ie al distribut iei statistice X este num arul
real
v=
x;x6= 0:
Uneori coe cientul de variat ie vse exprim a ^ n procente (100 v%).
Din formula de calcul a dispersiei se observ a c a v2=M2
M121.

24

Bibliogra e
[1]Agratini, O. Capitole speciale de matematici , Litogra ata UBB CLUJ, Cluj-
Napoca, 1996.
[2]Tr^ mbit a s, R. T. Metode statistice , Editura Presa Universitar a Clujean a, Cluj-
Napoca, 2000.
[3] http://www.hamhigh.co.uk/news/heritage-former-ucs-schoolboy-and-statistician-
karl-pearson-was-revered-by-einstein-1-2304978
[4] https://dexonline.ro/de nitie/statistica
25

Similar Posts