SPECIALIZAREA MATEMATIC A DIDACTIC A LUCRARE DE DISERTAT IE APLICAT II ALE STATISTICII ^IN MEDICIN A Coordonator S tiint i c, Prof. Univ. Dr…. [629285]
UNIVERSITATEA BABES -BOLYAI CLUJ-NAPOCA
FACULTATEA DE MATEMATIC A S I INFORMATIC A
SPECIALIZAREA MATEMATIC A DIDACTIC A
LUCRARE DE DISERTAT IE
APLICAT II ALE STATISTICII ^IN MEDICIN A
Coordonator S tiint ic,
Prof. Univ. Dr. Octavian Agratini
Masterand: [anonimizat],
2018
Cuprins
1 Introducere 1
2 Elemente de statistic a descriptiv a 3
2.1. Scurt istoric . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2. Not iuni intoductive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3. Culegerea datelor statistice . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.4. Repartit ii de frecvent e . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5. Parametrii repartit iilor statistice . . . . . . . . . . . . . . . . . . . . . . 15
Bibliograe 100
iii
Capitolul 1
Introducere
Statistica este stiint a care culege, sintetizeaz a, descrie si interpreteaz a datele refe-
ritoare la fenomene generale. Folosind calculul probabilit at ilor, ea se ocup a de studiul
cantitativ al fenomenelor de mas a, prezentate de elemente care au anumite caracteristici
comune.
Din punct de vedere istoric, cre sterea si dezvoltarea statisticii moderne este legat a
de dou a direct ii distincte:
{ necesitatea statelor de a str^ ange date referitoare la dezvoltarea economic a si so-
cial a;
{ dezvoltarea teoriei probabilit at ilor, ca ind o ramur a distinct a a matematicii.
^In antichitate, civilizat iile roman a, greac a si egiptean a, dar si cele a
ate ^ n Asia, au
colectat informat ii despre evolut ia datelor populat iilor respective. ^In evul mediu, biser-
ica se ocupa cu ^ nregistrarea datelor referitoare la na steri, c as atorii si decese. Statistica
modern a apare, pentru prima dat a ca stiint a, ^ n secolul al XVIII-lea, ^ n cursul Collegium
politico-statisticum a lui Martin Schmeitzel sust inut la Universitatea din Halle.
Rolul si important a cunoa sterii metodelor si procedeelor puse la dispozit ie de statis-
tic a au o valoare deosebit a pentru procesul cunoa sterii. Nu este lipsit de important a
aportul statisticii ^ n domenii ca medicin a, biologie, zic a, chimie, economie.
Utilizarea statisticii ^ n medicin a ofer a generaliz ari pentru ca publicul s a ^ nt eleag a
mai bine riscurile pentru anumite boli, cum sunt, de exemplu, leg aturile dintre anu-
mite comportamente si bolile de inim a sau cancer. Statistica descriptiv a ne arat a o
parte a populat iei care sufer a de o anumit a boal a, iar statistica inferent ial a ne ajut a la
determinarea cauzelor bolilor.
Medicina modern a nu poate conceput a f ar a cercetare medical a, iar un segment
din ce ^ n ce mai consitent al acestei cercet ari are la baz a statistica. Nu se mai poate
1
2
face cercetare clinic a sau de laborator, iar rezulatele s a e raportate doar prin com-
par ari puerile ^ ntre num arul de cazuri, procente sau medii. F ar a analiz a statistic a nicio
cercetare nu are valoare. Simple compar ari ^ ntre valorile medii pot duce la concluzii
total gre site.
Prezenta lucrare de disertat ie este alc atuit a din trei capitole. ^In primul capitol,
intitulat Elemente de statistic a descriptiv a , este prezentat un scurt istoric legat de
aparit ia statisticii, dup a care sunt amintite principalele elemente si not iuni ale statisticii
descriptive. Capitolul al doilea este dedicat veric arii ipotezelor statistice, testelor
aplicate unei populat ii si testelor referitoare la dou a populat ii. Aplicat iile expuse ^ n
capitolul al treilea vin s a ^ nt areasc a important a rolului pe care ^ l joac a statistica ^ n
medicin a.
Capitolul 2
Elemente de statistic a descriptiv a
2.1. Scurt istoric
Statistica este stiint a care se ocup a cu colectarea, clasicarea, interpretarea
datelor numerice si cu folosirea acestora pentru a formula concluzii si a lua decizii.
Ea studiaz a fenomenele si procesele din societate si natur a, relat iile dintre fenomenele
sociale si economice, precum si leg aturile cantitative ^ n dependent a cu cele calitative[4].
Statistica este fundamentat a pe calculul probabilit at ilor. Denumirea de statistic a
este derivat a din cuvantul latin \status"care se traduce prin stat sau stare de lucruri.
La origini, statistica avea rolul de a descrie situat ia genaral a a unui stat din punct de
vedere geograc si politic [1].
^Inc a din antichitate dateaz a primele preocup ari statistice. ^In China si ^ n Egiptul
antic se culegeau si se \prelucrau"date referitoare la populat ie, recolte, cadastru, ^ n
scopul unei colect ari mai bune a impozitelor si a p astr arii unei evident e a b arbat ilor
capabili s a poarte arme. Anchetele si recens amintele efectuate de c atre romani au
reprezentat un apogeu pentru acest tip de activit at i.
Datele statistice au ^ nceput s a e tratate stiint ic ^ n Germania secolelor XVII-
XVIII. Termenul de statistic a apare pentru prima dat a ^ n cursul lui Martin Schmeitzel,
intitulat Collegium politico-statisticum pe care l-a sust inut la Universitatea din Halle.
Martin Schmeitzel s-a n ascut la Bra sov ^ n data de 28 mai 1679 si a decedat ^ n data
de 20 iulie 1747 ^ n Germania, ^ n localitatea Halle. Educat mai ^ nt^ ai ^ n t ara sa natal a
p^ an a si-a ^ ncheiat studiile liceale, el a studiat apoi la diferite universit at i germane. Din
anul 1700 a frecventat studiile Universit at ii din Jena, p^ an a ^ n anul 1702 c^ and s-a mutat
la Universitatea din Wittenberg. Dup a put in timp acesta s-a mutat la Universitatea
din Greisfwald, iar ^ n anul 1706 a devenit asistent la Universitatea din Halle. ^In anul
3
4 Elemente de statistic a descriptiv a
1712 a dob^ andit diploma universitar a de master ^ n lozoe. Din anul 1731 el a predat
dreptul constitut ional si istoria la universitatea din Halle p^ an a ^ n 1747 c^ and a murit.
Imaginea 1: Gottfried AchenwallUn alt autor care a dat form a termenu-
lui de statistic a a fost Gottfried Achen-
wall (1719-1772) prin intermediul cursu-
lui Staatskunde pe care l-a sust inut la
Universitatea din G ottingen.
Termenul de statistic a a aprimit un loc
permanent ^ n G ottingen si a fost adoptat
si de alte universit at i germane. Achenwall
a exercitat o in
uent a stimulativ a asupra
politicii stiint ice si istoriei culturale.
Un moment important pentru dez-
voltarea statisticii ^ l reprezint a cristaliza-
rea calculului probabilit at ilor. Acesta si-a pus din plin amprenta asupra statisticii ^ n
ultimii 200 de ani. Un statistician important al secolului al XIX-lea a fost Adolphe
Qu etelet care s-a n ascut la 22 februarie 1796 ^ n Gent, Belgia si a decedat la data de
17 februarie 1874 ^ n Bruxelles la v^ arsta de 77 de ani. Qu etelet a fost un astronom,
matematician, statistician si sociolog belgian, de numele c aruia se leag a not iunile de
repartit ie, medie, dispersie, observare de mas a si regularitate. Adept a lui Laplace, a
fost membru al Academiei de S tiint e din Bruxelles, pre sedinte al Comisiei centrale de
statistic a a Belgiei. El a considerat c a statistica este singura metod a ce se poate aplica
fenomenelor de mas a.
Imaginea 2: Karl PearsonTrecerea de la statistica descriptiv a la
studierea stiint ic a a populat iilor statis-
tice a fost realizat a, la ^ nceputul secolului
XX, de c atre Karl Pearson(1857-1936) [3].
Pearson si elevii s ai au ^ nceput s a con-
sidere caracteristicile unei populat ii ca
reprezent^ and variabile aleatoare. Aceast a
viziune a deschis drumul c atre utilizarea
intens a a Teoriei probabilit at ilor ^ n pro-
blemele statistice, de unde a luat int a
ceea ce numim ast azi Statistic a mate-
matic a .
Not iuni introductive 5
2.2. Not iuni intoductive
Statistica descriptiv a se ocup a cu colectarea datelor asupra unui fenomen,
^ nregistrarea, gruparea, analiza si interpretarea acestora, ^ n vederea obt inerii unor
predict ii privind comportamentul viitor al fenomenului. ^Intr-o form a general a, pro-
cesul de cunoa stere statistic a se prezint a sub forma schemei urm atoare
Figura 3: Procesul de cunoa stere statistic a ([1])
6 Elemente de statistic a descriptiv a
Principalele not iuni utilizate ^ n statistic a sunt: populat ie statistic a, unitate statis-
tic a, caracteristic a statistic a si indicator statistic.
Denit ia 2.2.1. Populat ia statistic a este o mult ime de indivizi, obiecte sau m asur a-
tori ale c aror propriet at i urmeaz a a analizate.
Pentru a forma o populat ie, o mult ime trebuie s a aib a o caracteristic a comun a.
Populat ia ^ n cauz a trebuie s a e foarte atent denit a si este considerat a complet denit a
doar atunci c^ and se poate da lista tuturor elementelor ei.
Denit ia 2.2.2. Num arul elementelor unei populat ii se nume ste volulmul populat iei .
Exemplul 2.2.3. Mult imea student ilor unei universit at i este un exemplu de populat ie
bine denit a.
De regul a ne g^ andim la o populat ie ca la o colect ie de oameni. Totu si ^ n statistic a,
populat ia poate o colect ie de obiecte, de animale sau de m asur atori.
Exemplul 2.2.4. Mult imea valorilor numerice care sunt rezultatele unor analize de
laborator pentru calciu constituie o populat ie.
Denit ia 2.2.5. Unitatea statistic a este forma individual a de manifestare a fenome-
nelor supuse cercet arii. Unit at ile statistice sunt elementele care alc atuiesc o populat ie
statistic a.
Denit ia 2.2.6. E santionul sauselect ia este o submult ime a unei populat ii.
O select ie trebuie s a ^ ndeplineasc a urm atoarele condit ii:
(a) s a e aleatoare (orice select ie s a aib a sansa de a aleas a – sansa poate
calculat a);
(b) toate elementele colectivit at ii s a aib a aceea si probabilitate de a alese;
(c) structura select iei s a e c^ at mai apropiat a de structura populat iei, adic a
select ia s a e reprezentativ a ;
(d) volumul select iei s a e sucient de mare.
Denit ia 2.2.7. Numim statistic a o caracteristic a numeric a a unei select ii (e santion).
Denit ia 2.2.8. Caracteristica statistic a este tr as atura comun a tuturor unit at ilor
unei populat ii care ne intereseaz a ^ n cadrul unei analize statistice.
Culegerea datelor statistice 7
Deoarece unit at ile unei populat ii sunt purt atoare ale unor caracteristici variabile
ca form a de manifestare sau ca nivel de dezvoltare, caracteristicile se mai numesc si
variabile statistice .
Caracteristicile statistice pe care le putem ^ nt^ alni se clasic a astfel:
(a) cantitative – posibilit at ile sale se pot m asura, deci se exprim a numeric (de
exemplu ^ n alt imea, greutatea, concentrat ia);
(b) calitative – posibilit at ile sale nu sunt m asurabile, ci numai constatate. Ele
se mai numesc atributive (de exemplu sexul, starea civil a, profesia).
Denit ia 2.2.9. Indicatorul statistic reprezint a expresia numeric a a unei deter-
min ari calitative obt inut a ^ n urma efectu arii unei cercet ari statistice, raportat a la a-
numite condit ii specice de timp sau spat iu.
Deci indicatorul statistic cuprinde at^ at not iunea care determin a cont inutul s au, c^ at
si expresia sa numeric a. Deoarece fenomene-le studiate sunt variabile ^ ntre ele, acestea
nu pot caracterizate printr-un singur indicator. De aceea se folose ste un sistem
de indicatori capabil s a exprime multitudinea relat iilor cantitative dintre fenomenele
studiate. Acest sistem este elementul care une ste cele trei faze ale cercet arii statistice
(observare, prelucrare si analiz a).
2.3. Culegerea datelor statistice
Una dintre problemele cu care se confrunt a statistica este culegerea datelor.
Tehnica de select ie are un rol extrem de important, deoarece inferent ele pe care le facem
se bazeaz a, ^ n cele din urm a, pe statistici obt inute din datele de select ie . Culegerea
datelor pentru o analiz a statistic a este un proces complex care presupune urm atorii
pa si important i:
1. Denirea obiectivelor experimentului sau studiului (de exemplu compararea efecte-
lor unui anumit medicament cu cele ale unui medicament standard sau estimarea
cheluielilor gospod are sti medii ^ n judet ul nostru);
2. Denirea populat iei de interes si a variabilelor (de exemplu timpul de recuperare
pentru pacient ii care sufer a de o anumit a boal a sau veniturile totale pe persoan a);
3. Denirea colect iilor de date si a schemelor de m asurare (aici intr a procedurile de
select ie, dimensiunea select iei, procedeul sau instrumentele de m asurare – ches-
tionar, telefon etc.);
8 Elemente de statistic a descriptiv a
4. Determinarea tehnicilor potrivite (descriptive sau inferent iale) de analiz a a datelor.
Exemplul 2.3.1. Compartimentul economic al universit at ii dore ste s a estimeze cos-
turile pentru educat ie. Una dintre componentele costului total pe semestru este reprezen-
tat a de costul de tip arire sau litograere a cursurilor de c atre editura universit at ii. Con-
ducerea universit at ii dore ste media cursurilor pentru ecare student.
Dac a ecare element al unei populat ii este enumerat sau listat vorbim despre
unrecens am^ ant . Totu si recens amintele sunt rar utilizate, deoarece sunt dicil de
alc atuit, consumatoare de resurse de timp si costisitoare. Ori de c^ ate ori este nerealist
s a realiz am un recens am^ ant trebuie s a analiz am numai o parte a populat iei (o select ie).
C^ and alegem o select ie avem nevoie de un cadru de selet ie.
Denit ia 2.3.2. Cadrul de select ie este o list a de elemente apart in^ and populat iei
din care se extrage select ia.
Acesta poate identic cu populat ia, dar ^ n multe situat ii nu este practic sau este
imposibil s a select am direct din populat ia total a.
Observat ia 2.3.3. Odat a ce s-a denit cadrul de select ie este necesar s a se deneasc a
si procedura de culegere a datelor de select ie numit a plan de select ie . Toate planurile
de selct ie pot ^ ncadrate ^ n una din urm atoarele categorii: select ii probabilistice si
select ii bazate pe judecat a.
Denit ia 2.3.4. Select iile probabilistice sunt select ii ale c aror elemente sunt ex-
trase pe baza unor probabilit at i.
Fiecare element al unei unei populat ii are o anumit a sans a de a extras ca parte a
select iei.
Denit ia 2.3.5. Select iile bazate pe judecat a sunt extrase pe baza faptului c a sunt
tipice. Persoana care construie ste o select ie bazat a pe judecat a alege elementele pe care
le consider a reprezentative din populat ie.
Observat ia 2.3.6. Inferent a statistic a (estimat iile si vericarea ipotezelor) nece-
sit a ca planul de select ie s a e o select ie probabilistic a.
Cea mai cunoscut a dintre select iile probabilistice este select ia aleatoare ^ n
care ecare select ie de dimensiune nare aceea si probabilitate de a aleas a.
Culegerea datelor statistice 9
Denit ia 2.3.7. Select ia aleatoare simpl a este o select ie aleatoare aleas a astfel
^ nc^ at ecare element al populat iei s a aib a aceea si probabilitate de a ales.
Gre seli frecvente apar deoarece se face confuzie ^ ntre aleator (la ^ nt^ amplare) si
anarhic (dezorganizat, far a niciun sablon). Atunci c^ and se dore ste s a se construiasc a
corect o select ie aleatoare simpl a se poate utiliza un tabel sau un generator de numere
aleatoare, proced^ and astfel: se numeroteaz a elementele populat iei c si se extrag nnu-
mere aleatoare; elementele numerotate cu num arul aleator corespunz ator sunt extrase
din select ie.
Denit ia 2.3.8. Select ia sistematic a este o select ie din care se extrage tot al k-lea
element din cadrul de select ie.
Aceast a metod a de select ie folosest e o singur a dat a tabelul sau generatorul de nu-
mere aleatoare pentru punctul de pornire. Aceast a procedur a se preteaz a pentru select ia
unui procentaj dintr-o populat ie mare. Nu este recomandat a atunci c^ and populat ia este
ciclic a sau repetitiv a. Pentru a selecta un e santion(select ie) de p%dintr-o populat ie
trebuie selectat din 100/p ^ n100/p elemente, iar dac a 100/p nu este^ ntreg se rotunje ste.
De exemplu, primul element(punctul de pornire) este selectat aleator, folosind tabelul
sau generatorul de numere aleatoare, din primele 17 (100/6) elemente din cadrul de
select ie si apoi ecare al 17-lea element din cadrul de select ie.
C^ and select am populat ii foarte mari, este posibil s a e nevoie s a ^ mp art im
populat ia pe baza unor caracteristici. Aceste subpopulat ii se numesc straturi .
Denit ia 2.3.9. Select ia straticat a se obt ine stratic and cadrul de select ie, iar
apoi se selecteaz a un num ar nit din ecare strat.
C^ and se construie ste o select ie straticat a, populat ia se ^ mparte ^ n straturi si din
ecare strat se realizeaz a o select ie simpl a, sistematic a sau aleatoare (dup a caz). Subselect ile
se combin a ^ ntr-o select ie care va utilizat a ulterior.
Denit ia 2.3.10. Select ia proport ional a se obt ine stratic^ and cadrul de select ie si
apoi select^ and un num ar de elemente din ecare strat ^ n funct ie de o proport ie stabilit a
sau direct proport ional cu dimensiunea stratului.
Denit ia 2.3.11. Select ia grupat a se obt ine stratic^ and cadrul de select ie si apoi
select^ and elemente doar din anumite straturi, nu din toate straturile.
10 Elemente de statistic a descriptiv a
2.4. Repartit ii de frecvent e
O prim a sistematizare a datelor asociate unei caracteristici se face prin intermediul
tabelelor, iar tabelul ^ n care apar datele ^ n ordinea obt inerii lor se nume ste tabel simplu .
Plec^ and de la acesta se pot ordona datele ^ n anumite grupe sauclase , dup a anumite
criterii, ajung^ andu-se la un tabel sistematizat.
Denit ia 2.4.1. Num arul elementelor care apart in unei clase este frecvent a clasei nu-
mit a frecvent a absolut a .
Observat ia 2.4.2. Suma frecvent elor absolute ale tuturor valorilor caracteristicii este
egal a cu efectivul total al populat iei exprimate.
Fie X o caracteristic a ce poate lua valorile xk;k2INdintr-un interval [a;b).
Pe baza unor considerente impuse de studiul statistic se ^ mparte intervalul [a;b)^ nN
subintervale care reprezint a clase de date, si anume: Ji= [ai 1;ai);i=1;N, unde
a0=a siaN=b. Evident
N[
i=1Ji= [a;b); Ji\
Jk=?pentru oricare din indicii i6=k.
Not^ and cunifrecvent a clasei Jitabelul de date va cont ine dou a coloane: clasa si
frecvent a. De asemenea va cont ine N linii, pe linia i ap ar^ and elementele Ji sini;(i=
1;N).
Denit ia 2.4.3. Analiza statistic a a unui fenomen ^ n raport cu o carcateristic a ne
conduce la o serie de perechi de valori care se nume ste serie statistic a simpl a sau
unidimensional a.
Dac a se grupeaz a mai multe serii statistice se obt in serii multidimensionale.
^In Tabelul 1 respectiv Tabelul 2 sunt prezentate astfel de perechi. Se poate
observa c a dac a prima valoare a perechii din Tabelul 1 este numeric a, ^ n Tabelul 2
prima pereche nu mai are aceast a proprietate.
Denit ia 2.4.4. Seria statistic a reprezint a corespondent a ^ ntre valorile sau vari-
antele caracteristicii de grupare si frecvent ele de aparit ie ale acestora.
Dup a cont inutul caracteristicii de grupare, seriile statistice pot
Repartit ii de frecvent e 11
Tabelul 1 Tabelul 2
^Imp art irea unui grup de 100 ^Imp art irea unui grup de 100
de persoane dup a colesterolul LDL persoane dup a culoarea ochilor
clase de valori Nr.
(pentru Colesterol LDL) persoane
<100 35
[100-129) 28
[130-159) 19
[160-189) 12
190 6culoarea Nr.
ochilor persoane
negri 27
c aprui 46
verzi 14
alba strii 13
A.de distribut ie – reprezint a o corespondent a ^ ntre valorile caracteristicii atributive
si frecvent ele unit at ilor la care se ^ nregistreaz a aceea si variant a.
B.de timp – reprezint a variat ia unei caracteristici ^ n funct ie de timp. Sunt dou a
tipuri:
(i)serii dinamice de intervale – prezint a valorile unei caracteristici urm arit a ^ n
intervale de timp egale (zile, luni, trimestre, ani, etc.).
(ii)serii dinamice de momente – se obt in pentru caracteristici pentru care este
necesar s a se prezinte nivelul la un moment dat. Termenii acestor serii nu se
pot ^ nsuma direct deoarece ar conduce la ^ nregistr ari repetate.
Exemplul 2.4.5. Product ia unei intreprinderi farmaceutice, num arul de nou-n ascut i,
protul unei unit at i farmaceutice sunt c^ ateva exemple de serii dinamice de intervale.
Termenii unei serii de intervale sunt ^ nsumabili, obt in^ andu-se o valoare centralizat a
a caracteristicii pe ^ ntreaga perioad a de timp. (vezi Tabelul 3)
Tabelul 3
V^ anz arile de medicamente realizate de societatea "S" ^ n anul 2017
Luna 01 02 03 04 05 06 07 08 09 10 11 12
Milioane 115,7 86,9 111,1 90,2 80,3 65,4 81,7 65,8 121 155,4 137,6 113,2
lei
Exemplul 2.4.6. Stocul de medicamente existent la o societate farmaceutic a ^ ntr-un
anumit trimestru este un exemplu de serie dinamic a de moment.
12 Elemente de statistic a descriptiv a
Tabelul 4
Stocul de medicamente existent la societatea farmaceutic a "S" ^ n trimestrul II 2017
Data aprilie mai iunie
Stoc existent 33,2 25,9 19,4
(milioane lei)
Denit ia 2.4.7. O caracteristic a X care ia o mult ime cel mult num arabil a de valori
se nume ste caracteristic a de tip discret . Dac a ia valori dintr-un interval nit sau
innit se nume ste caracteristic a de tip continuu .
Observat ia 2.4.8. Diferent a dintre o variabil a discret a si una continu a este articial a.
Variabilele statistice care fac referire la realitatea economic a, zic a etc. posibilit at ile
variabilelor continui vor date sub form a discret a. ^In practic a, numele de variabi a
discret a ^ l vor primi acele variabile ale c aror posibilit at i sunt individualizate; numele de
variabil a continu a ind atribuit celor ale c aror posibilit at i sunt grupate ^ n clase.
Revenim la caracteristica X ce ia valori ^ ntr-un interval [ a;b) care a fost partit ionat
^ n N clase ( Jk=1;N,Jk=[ak 1;ak),a0=a,aN=b. Fienkfrecvent a absolut a a clasei Jk
sixkvaloarea corespunz atoare mijlocului (centrului) intervalului de valori al clasei Jk.
Decixk= (ak 1+ak)=2,k=1;N. Tabelul care indic a repartit ia frecvent elor pe clase
(tabelul de frecvent e sau tabelul statistic) se poate prezenta ^ n una din urm atoarele
forme
X frecvent a
[a0;a1)n1
[a1;a2)n2
. .
. .
. .
[aN 1;aN)nNX frecvent a
x1n1
x2n2
. .
. .
. .
xNnN
Se observ a c a a doua variant a are aceea si form a ca si ^ n cazul unei caracteristici
discrete.
Repartit ii de frecvent e 13
Denit ia 2.4.9. Numim amplitudinea clasei denit a pe intervalul [ai 1;ai), lungimea
acestui interval, adic a di=ai ai 1.
Observat ia 2.4.10. C^ and amplitudinile claselor sunt egale, pentru a stabili num arul
claselor N putem folosi formula lui Sturges :
N= [1 +10
3lgn];
unde n este volumul seriei statistice, iar [a]este partea ^ ntreag a a lui a.
^In practic a, ^ n afara frecvent ei absolute se utilizeaz a frecvent a relativ a notat a cu fk
si denit a prin formula:
fk=nk
n; k =1;N:
Lu^ and ^ n considerare denit ia frecvent ei relative si observat ia (1.4.2) este evident
c a
NX
i=1fi= 1
Uneori frecvent a relativ a poate dat a ^ n procente. De exemplu, din tabelul 1
rezult a c a frecvent a relativ a a clasei [130 159) este de 19/100=0.19. Deci 19% din
persoanele care au si-au realizat analiza pentru Colesterolul LDL au avut rezultatele
analizei cuprinse ^ ntre 130 mg/dL si 159 mg/dL.
Observat ia 2.4.11. Not unile de variabil a aleatoare si probabilitate sunt modele teoret-
ice ale not iunilor de caracteristic a si respectiv frecvent a relativ a.^ n loc de caracteristic a
se poate utiliza termenul de variabil a statistic a sau, pe scurt, variabil a.
Observat ia 2.4.12. Dac a nnu este cel put in de ordinul zecilor spunem c a select ia
este de un volum mic. ^In acest caz, ^ mp art irea pe clase are o important a redus a si ^ n
ceea ce prive ste prelucrarea statistic a a datelor, deci renunt am la ea.
Denit ia 2.4.13. Amplitudinea absolut a este diferent a dintre valorile extreme ale vari-
abilei X. Acesta se noteaz a cu A(X) si deci:
A(X) =xmax xmin,
undexmaxreprezint a cea mai mare valoare pe care o ia X, iar xminreprezint a cea mai
mic a valoare pe care o ia X.
14 Elemente de statistic a descriptiv a
Exemplul 2.4.14. La un laborator de analize medicale, cele 20 de persoane care au
fost testate pentru Colesterolul LDL au obt inut urm atoarele rezultate (mg la 100 ml de
s^ ange):
106 157 134 102
89 160 82 95
70 167 162 134
112 95 102 216
173 106 103 165
a) Scriet i tabelul sistematizat al datelor statistice, consider^ and clase de aplitudini
egale.
b) Scriet i distribut ia statistic a a caracteristicii X si stabilit i amplitudinea absolut a
A(x).
Solut ie
Volumul populat iei este n=20. Pentru a determina num arul claselor, N, vom aplica
formula lui Sturges.
N= [1 +10
3lg 20] , unde lg 201;301)
)1 +10
3lg 205;33)N= [5;33] = 5:
xmin= 70;xmax= 216:A(X) =xmax xmin)A(X) = 216 70 = 146:
Amplitudinea unei clase i va di=A(X)
N= 29;2, undei=1;5:
clasa mijlocul clasei frecvent a absolut a frecvent a relativ a
Ji xi ni fi
[70; 99;2) 84,6 5 0,25
[99;2; 128;4) 113,8 6 0,30
[128;4; 157;6) 143 3 0,15
[157;6; 186;8) 172,2 5 0,25
[186;8; 216] 201,4 1 0,05
Deducem
X84;6 113;8 143;0 172;2 201;4
0;25 0;30 0;15 0;25 0;05
siA(X) = 201;4 84;6 = 116;8
Parametrii repartit iilor statistice 15
2.5. Parametrii repartit iilor statistice
Denit ia 2.5.1. Fie datele statistice primare y1;y2;:::;y nrelative la caracteristica X.
1)Media aritmetic a este num arul xadenit astfel:
xa=1
nnX
i=1yi
2)Dac ayi0;i=1;n,media geometric a este num arul xgdenit astfel:
xg= (y1y2:::yn)1
n
3)Dac ayi6= 0;i=1;n sinX
i=1y 1
i6= 0,media armonic a este num arul xhdenit
astfel:
xh=n
nP
i=1y 1
i
Teorema 2.5.2. Fie datele statistice primare strict pozitive y1;y2;:::;y n.^Intre cele trei
medii introduse prin denit ia (2.5.1) exist a relat iile:
xhxgxa(*)
Demonstrat ie
Fief: (0;1)!R;f(x) = lnx. Deoarece f00(x) = 1
x2<0oricare ar
x>0deducem c a f este concav a. Aplic am inegalitatea lui Jensen, deci
8n0,8t1;t2;:::;t nstrict pozitive: f(1
nnX
i=1ti)1
nnX
i=1f(ti):
Vom alegeti=yi;i=1;n. Se obt ine astfel:
lny1+y2+:::+yn
n1
n(lny1+ lny2++ lnyn), adic a lnxa1
nln(y1y2:::yn)
De aici deducem c a xa(y1y2:::yn)1
n=xgobt in^ andu-se a doua inegaliatate
enunt at a.
Pentru a obt ine prima inegalitate vom alege ^ n relat ia:
16 Elemente de statistic a descriptiv a
y1+y2+:::+yn
nnpy1y2:::yn
demonstrat a mai sus, yi:=1
yi;undei=1;n.
Astfel:xh 1xg 1, adic axgxh, ceea ce ^ ncheie demonstrat ia.
Preciz am c a inegaliat at ile (*) devin egaliat at i dac a si numai dac a y1=y2=:::=yn.
Denit ia 2.5.3. Se consider a datele statistice primare yk; k=1;n, relative la carac-
teristica X din care se obt ine distribut ia statistic a
Xxk
fk
k=1;N
undexksunt clasele considerate, iar nk sifksunt frecvent a absolut a si, respectiv
frecvent a relativ a a clasei k,k=1;N
1)Media aritmetic a a lui X este:
xa=1
nNX
k=1nkxk=NX
k=1fkxk
2)Dac axk0;k=1;N,media geometric a a lui X este:
xg= (NY
k=1xknk)1
n=NY
k=1xkfk
3)Dac axk6= 0;k=1;N siNX
k=1nkx 1
k6= 0,media armonic a a lui X este:
xh=n
NP
i=1nkx 1
k=1
NP
i=1fkx 1
k
Observat ia 2.5.4. Dac a variabila este continu a, media calculat a din datele grupate nu
coincide cu media calculat a din date negrupate, dar cele dou a medii pot apropiate.Vom
lua ^ n considerare datele din exemplul (2.4.14) pentru a exemplica acest fapt pentru
media aritmetic a.
Parametrii repartit iilor statistice 17
{media aritmetic a a celor 20 de date este:
1
20(106 + 157 + 134 + 102 + 89 + 160 + 82 + 95 + 70 + 167 + 162+
+134 + 112 + 95 + 102 + 216 + 173 + 106 + 103 + 165) =2530
20= 126;5
{media aritmetic a a distribut iei statistice a caracteristicii X este:
xa= 84;60;25 + 113;80;30 + 1430;15 + 172;20;25 + 201;40;05 =
= 21;15 + 34;14 + 21;45 + 43;05 + 10;07 = 129;86
Teorema 2.5.5. (Propriet at ile mediei aritmetice )
Fie n date primare relative la caracteristica X din care se obt ine distribut ia
Xxi
fi
i=1;N;cuN2:
Atunci au loc urm atoarele:
(1)xmin<xa<xmax:
(2)suma algebric a a abaterilor termenilor seriei de la media lor xaeste nul a.
(3)suma p atratelor abaterilor este minim a c^ and abaterile sunt calculate fat a de xa:
Demonstrat ie .
(1)xmin=Nxmin
N<x1+x2+:::+xN
N=xa, deoarece din ipotez a X ia cel put in
dou a valori distincte. Analog se demonstreaz a xmax>xa:
(2)Se cere s a ar at am c aNX
i=1(xi xa) = 0 , stiind c axa=1
NNX
i=1xi
NX
i=1(xi xa) =NX
i=1xi NX
i=1xa=
=Nxa Nxa
= 0
18 Elemente de statistic a descriptiv a
(3)Se cere s a veric am stabilitatea valorii 2Rastfel ^ nc^ atNX
i=1(xi )2s a e
minim a.
Fieu:R!R,u() =NX
i=1(xi )2=N2 2NX
i=1xi+NX
i=1xi2:
Minimul acestei funct ii de gradul al doilea se va atinge pentru =2NP
i=1xi
2N, adic a
pentru=xa:
Denit ia 2.5.6. Fie distribut ia statistic a Xxi
fi
i=1;N, undefieste frecvent a relativ a
a clasei i, cu i=1;N.
Media p atratic a a lui X este:
xp= (NX
i=1(x2
ifi)1
2:
Teorema 2.5.7. Fie distribut ia statistic a Xxi
fi
i=1;N:Atunci are loc :
xaxp
Demonstrat ie
^In inegalitatea Cauchy-Buniakovsky
(nX
i=1aibi)2(nX
i=1a2
i)(nX
i=1b2
i)
se ian:=N,aj=p
fj,bj=p
fjxj si obt inem
(NX
i=1fjxj)2NX
i=1fjx2
j; deoareceNX
i=1fj= 1:
Astfel obt inem c a x2
ax2
p, de undexaxp, deoarecexp>0.
Fiexi; i=1;Ntermenii unei serii dinamice si ti; i=1;N 1 intervalele dintre
momente. Reprezentarea pe ax a arat a astfel:
Parametrii repartit iilor statistice 19
t1t2 ti tN 1
x1x2x3::: x ixi+1::: x N 1xN
Calcularea nuvelului mediu ^ n cazul seriei de momente (termenii neind ^ nsumabili
direct) presupune transformarea acesteia ^ ntr-o serie de intervale.
Pentru calculul mediei se consider a c a modicarea termenilor de la un moment
la altul se realizeaz a uniform, ceea ce ^ nseamn a c a ecare termen se pondereaz a cu
jum atate din m arimea intervalelor al aturate.
x1t1
2; x2t1+t2
2; :::; x iti 1+ti
2; :::; x N 1tN 2+tN 1
2; xNtN 1
2
Denit ia 2.5.8. Fie seria dinamic a de momente cu termenii (xi)i=1;N si(ti)i=1;N 1
intervalele dintre termeni. Media cronologic a este dat a de
xc=x1t1
2+x2t1+t2
2+:::+xN 1tN 2+tN 1
2+xNtN 1
2
N 1P
i=1ti:
Vom calcula media cronologic a a seriei prezentate ^ n Tabelul 4 pag. 12.
DeducemN= 3,×1= 33;2,×2= 25;9,×3= 19;4,t1=t2= 1. Astfel:
xc=33;2
2+ 25;9 +19;4
2
2= 26;1 milioane lei
Denit ia 2.5.9. Fie distribut ia Xxi
fi
i=1;N, undeni sifisunt frecvent a absolut a,
respectiv frecvent a relativ a a clasei i, i=1;N:
Frecvent ele absolute cumulate sunt determinate cu ajutorul relat iilor
n0
k=kX
i=1ni; k =1;N
Frecvent ele relative cumulate sunt determinate cu ajutorul relat iilor
f0
k=kX
i=1fi; k =1;N
20 Elemente de statistic a descriptiv a
Deducem imediat c a n0
Neste efectivul total al populat iei examinate si f0
N= 1:
Denit ia 2.5.10. Fie datele statistice primare ordonate nedescresc ator
y1y2:::yn
Se nume ste median a valoarea numeric a dat a prin relat ia
me=(yik ,n= 2k 1
1
2(yik+yik 1),n= 2k
Se observ a c a me^ mparte datele statistice ordonate nedescresc ator ^ n dou a p artt i
egale.
Observat ia 2.5.11. Dac a datele statistice sunt grupate atunci determin am mai ^ nt^ ai
clasa median a j; aceasta are proprietatea c a pentru frecvent ele absolute cumulate n0
j 1
sin0
jsunt satisf acute inegalit at ile n0
j 1<n
2 sin0
j>n
2:
Cunosc^ and clasa median a va rezulta c a [aj 1;aj)este intervalul median. Mediana
mese va calcula cu ajutorul relat iei
me=aj 1+dj
nj(n
2 n0
j 1)
undedj=aj aj 1este amplitudinea clasei mediane.
Denit ia 2.5.12. Fie caracteristica X. Prin modulul (moda) lui X ^ ntelegem acea
valoare a caracteristicii, notat a cu mo, cu frecvent a cea mai mare.
Caracteristica X poate avea una sau mai multe valori modale. ^In primul caz X este
unimodal a , iar al doilea caz plurimodal a .
Observat ia 2.5.13. Dac a datele statistice sunt grupate se determin a mai ^ nt^ ai inter-
valul modal (cel cu frecvent a maxim a). Fie acesta [aj 1;aj). Se va alege
mo=aj 1+djnj
nj nj+1
undedj=aj aj 1 sink=nk nk 1; k2fj;j+ 1g
Geometric, modulul moreprezint a abscisa punctului de intersect ie al segmentelor
[Aj 1Aj] si [Bj 1Bj], undeAk(ak;nk);Bk(ak;nk+1) sik=j 1;j.
Ret inem c a mediana ( me) depinde de num arul datelor ordonate dup a m arimea lor,
iar modulul ( mo) de varianta caracteristicii cu frecvent a cea mai mare.
Parametrii repartit iilor statistice 21
Exemplul 2.5.14. S a se calculeze me simodistribut iei statistice a lui X denit ^ n
exemplul 2.4.14 folosind
(i) date statistice primare
(ii) date statistice sistematizate (grupate)
Solut ie
(i) Vom ordona cresc ator cele 20 de date statistice.
70<82<89<9595<102102<103<106106<112<
<134134<157<160<162<165<167<173<216
La mijlocul acestei ordon ari (n=20 – par) sunt valorile 106 si 112. Conform denit iei,
me=106 + 112
2= 109 . De asemenea mo2f95;102;106;134g.
(ii) Din tabelul asociat lui X vom determina clasa j ^ nc^ at n0
j 1<20
2 si
n0
j>20
2. Deducem c a j= 3deoarecen0
2= 6 + 3 = 9 <10 sin0
3= 6 + 3 + 5 >10. Deci
intervalul median este [128;4; 157;6)cu amplitudinea d3= 29;2. Obt inem
me=a2+d31
n3(10 n0
2) = 128;4 +29;2
31138;1
Al doilea interval are frecvent a maxim a (n2= 6) deci acesta devine interval modal.
n2= 6 5 = 1;n3= 3 6 = 3;d2= 29;2:Obt inem
mo= 99;2 + 29;21
1 ( 3)106;5
Denit ia 2.5.15. Numim cuartile ale distribut iei statistice a caracteristicii X valorile
numericeq1;q2;q3care ^ mpart datele statistice, ordonate nedescresc ator, ^ n patru p art i
egale.
q1este cuartila inferioar a, q2este mediana ( me), iarq3este cuartila superioar a.
Observat ia 2.5.16. Dac a avem datele statistice grupate proced am astfel:
{determimn am intervalul cuartilic inferior [ai 1;ai)astfel ^ nc^ at s a aib a loc
n0
i 1<n
4 sin0
i>n
4
{determimn am intervalul cuartilic superior [aj 1;aj)astfel ^ nc^ at s a aib a loc
n0
j 1<3n
4 sin0
j>3n
4
22 Elemente de statistic a descriptiv a
{calcul am ^ n continuare
q1=ai 1+di
ni(n
4 n0
i 1)
q2=me
q3=aj 1+dj
nj(3n
4 n0
j 1)
Denit ia 2.5.17. Fie caracteristica X si q1;q2;q3cuartilele distribut iei statistice a ca-
racteristicii X. Atunci:
1)q3 q1se nume ste abatere cuartil a
2)q=(q3 q2) + (q2 q1)
2=q3 q1
2se nume ste variat ia intercuartil a
3)qr=q3 q1
q2=2q
me
Dac aq<0;25A(X) atunci distribut ia este considerat a intens concentrat a.
Pentru repartit ia statistic a Xxi
fi
i=1;Nvom deni momentul de sondaj de ordinul
k simomentul centrat de sondaj de ordinul k .
Denit ia 2.5.18. Momentul de sondaj de ordinul k se calculeaz a astfel:
Mk=NX
i=1xk
ifi:
.
Momentul de sondaj de ordinul 1 al distribut iei X se numet e valoare medie de sondaj .
M1este defapt media aritmetic a xaa sa cum a fost introdus a ^ n denit ia (2.5.3) punctul
(1). Pentru aceas a not iune se poat folosi urm atoarea notat ie M1,xasaux.^In continuare
vom p astra ultima notat ie.
Denit ia 2.5.19. Momentul centrat de sondaj de ordinul k se calculeaz a astfel:
mk=NX
i=1(xi x)kfi:
Parametrii repartit iilor statistice 23
Momentulm2se noteaz a cu 2 si se numet e dispersie de sondaj . Radical de ordinul
2 din dispersia de sondaj se nume ste abatere medie p atratic a si se noteaz a cu .
Formula de calcul a dispersiei este 2=M2 x2:
Denit ia 2.5.20. Fie distribut ia statistic a Xxi
fi
i=1;N. Prin abatere medie abso-
lut a a distribut iei statistice X ^ ntelegem num arul real
=NX
i=1fijxi xj:
Denit ia 2.5.21. Coecientul de variat ie al distribut iei statistice X este num arul
real
v=
x;x6= 0:
Uneori coecientul de variat ie vse exprim a ^ n procente (100 v%).
Din formula de calcul a dispersiei se observ a c a v2=M2
M12 1.
24
Bibliograe
[1]Agratini, O. Capitole speciale de matematici , Litograata UBB CLUJ, Cluj-
Napoca, 1996.
[2]Tr^ mbit a s, R. T. Metode statistice , Editura Presa Universitar a Clujean a, Cluj-
Napoca, 2000.
[3] http://www.hamhigh.co.uk/news/heritage-former-ucs-schoolboy-and-statistician-
karl-pearson-was-revered-by-einstein-1-2304978
[4] https://dexonline.ro/denitie/statistica
25
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: SPECIALIZAREA MATEMATIC A DIDACTIC A LUCRARE DE DISERTAT IE APLICAT II ALE STATISTICII ^IN MEDICIN A Coordonator S tiint i c, Prof. Univ. Dr…. [629285] (ID: 629285)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
