Alexei Leahu, Ion Pâr tachi [604573]
1
Alexei Leahu, Ion Pâr¸ tachi
STATISTICA MATEMATIC ¼A
ÎN ECONOMIE ¸ SI AF ACERI
(Prin exemple ¸ si probleme propuse)
Partea II. ANALIZA INFEREN¸ TIAL ¼A A
DATELOR STATISTICE
Chi¸ sin ¼au
c
2018
CUPRINS
2
5. No¸ tiuni de baz ¼a din Statistica Matemat-
ica
5.1. Statistica, Teoria Probabilitatilor, Statistica Matemat-
ica, obiectele lor de studiu si legatuara dintre ele
5.2. Statistici, estimatori, estimatori punctuali nedeplasati,
consistenti si e
cien¸ ti. Caracteristici de selec¸ tie si propriet ¼a¸ tile
lor
5.3. Estimatori punctuali de verosimilitate maxim ¼a
6.Estimatori de interval (intervale de con
–
den¸ t¼a sau de încredere)
6.1. Întroducere
6.2. De
ni¸ tia no¸ tiunii de estimator de interval
6.3. Intervale de încredere pentru medie
6.4. Intervale de încredere pentru dispersie
7. Veri
carea ipotezelor statistice
7.1. Întroducere
7.2. Veri
carea ipotezelor statistice: notiuni de baz ¼a
7.3. Veri
carea ipotezelor statistice despre valoarea medie
7.4. Veri
carea ipotezelor statistice despre dispersie
7.5. Veri
carea ipotezelor statistice ¸ si p valoarea
7.6. Veri
carea ipotezelor statistice despre diferen¸ te legate
de date împerecheate (E¸ santioane dependente)
7.7. Veri
carea ipotezelor despre diferen¸ ta mediilor a dou ¼a
popula¸ tii statistice independente
7.7. Criterii (teste) de veri
care a ipotezelor bazate pe dis-
tribu¸ tia 2
7.9. Detectarea caracterului nealeator/aleator a datelor
BIBLIOGRAFIE
3
5. No¸ tiuni de baz ¼a din Statistica Matematica
5.1. Întroducere: Statistica, Teoria Probabilitatilor, Statistica
Matematica, obiectele lor de studiu si legatuara dintre ele
In liceu am avut posibilitatea sa facem cuno¸ stinta cu acea parte a Statis-
ticii care se numeste Statistica Descriptiv ¼a. De acolo am a at ca Statistica
Descriptiv ¼a (analiza exploratorie a datelor sau analiza primar ¼a a datelor)
are drept scop prelucrarea ¸ si prezentarea datelor statistice într-o form ¼a cât
mai compact ¼a ¸ si propice analizei ¸ si interpret ¼arii acestor date. Prezentarea
vizeaz ¼a, de regul ¼a, o prezentare a datelor in form ¼a numeric ¼a pentru a putea
folosi din plin posibilit ¼a¸ tile calculatoarelor moderne. Datele statistice reprez-
int¼a rezultatele m ¼asur¼atorilor sau observa¸ tiilor f ¼acute asupra unui fenomen
aleator. Statistica modern ¼a, mai ales acea parte a ei care se nume¸ ste Sta-
tistica Matematic ¼a, bazându-se esen¸ tial pe realiz ¼arile ¸ stiin¸ telor matematice,
folose¸ ste din plin Teoria probabilit ¼a¸ tilor . Ca sa ne convingem, vom trece
in revista cateva no¸ tiuni de baz ¼a din Statistica Descriptiv ¼a ¸ si vom preciza
care este echivalentul lor in Teoria Probabilit ¼a¸ tilor si Statistica Matematic ¼a
(TP&SM). Este vorba de notiunile de popula¸ tie statistic ¼a, unitati statistice,
e¸ santion (selectie) de volum nsi caracteristica statistica.
Astfel, prin popula¸ tie (colectivitate) statistic ¼ain Statistica Descriptiv ¼a se
în¸ telege orice mul¸ time
nevid ¼a de elemente (obiecte, indivizi, etc.) supus ¼a
cercet ¼arii cu condi¸ tia c ¼a aceste elemente s ¼a
e omogene în raport cu acee¸ si
proprietate sau caracteristic ¼a. In TP&SM aceasta no¸ tiune este modelat ¼a,
din punct de vedere matematic, de no¸ tiunea de spa¸ tiu de evenimente ele-
mentare
. Elementele !2
in Statistica Descriptiva se numesc unit¼a¸ tiale
popula¸ tiei statistice
;iar in TP&SM se numesc evenimente elementare .
Denumirea de popula¸ tie statistic ¼a din Statistica Descriptiva este con-
ven¸ tional ¼a ¸ si provine din faptul c ¼a ini¸ tial, statistica avea de-a face cu studiul
popula¸ tiilor de persoane. Unit ¼a¸ tile unei popula¸ tii interesante din punct de
vedere statistic sunt considerate, conform de
ni¸ tiei popula¸ tiei statistice, omo-
gene în raport cu acea proprietate sau caracteristic ¼a care prezint ¼a interes
din punct de vedere al cercet ¼arii. O cercetare exhaustiv ¼a a unei popula¸ tii
statistice în raport cu una sau mai multe caracteristici date se nume¸ ste re-
cens¼amânt . Realizarea practic ¼a a unui recens ¼amânt este, de regul ¼a, extrem
de costisitoare, de aceea cercetarea se limiteaz ¼a doar la o parte a acestei
popula¸ tii numita esantion de volum n. Mai exact, orice submul¸ time
nit ¼aA
de elemente/unit ¼a¸ ti extrase dintr-o popula¸ tie statistic ¼a
se nume¸ ste e¸ san-
tion sau selectie .În cazul când card(A) = nspunem c ¼a e¸ santionul este
4
devolum n. Ca ¸ si în Statistica Descriptiva, în TP&SM, interes din punct
de vedere a cercet ¼arii prezinta, de regul ¼a, carectiristicile unit ¼a¸ tilor incluse
în e¸ santion, apelând in directa legatura cu aceasta la no¸ tiunea de variabil ¼a
aleatoare ce reprezint ¼a echivalentul matematic al no¸ tiunii de caracteristic ¼a
statistic ¼a din Statistica Descriptiva . Astfel, înloc de caracteristica statistic ¼a
sau variabil ¼a statistic ¼aasociat ¼a unei popula¸ tii, prin care în Statistica Descrip-
tiv¼a se in¸ telege orice însu¸ sire, tr ¼as¼atur¼a sau proprietate caracteristic ¼a tuturor
unit¼a¸ tilor popula¸ tiei date, în TP&SM vom avea în vedere no¸ tiunea de vari-
abil¼a aleatoare. Or, din cate vedem, si in Statistica Descriptiva si in TP&SM
v.a. reprezinta o aplicatie univoca de
nita pe
cu valori in multimea de val-
ori posibile a acestei caracteristici. Deoarece datele statistice de orice natura
calitativ ¼a/categorial ¼a sunt, de regula, transformate in date numerice pentru
a putea
prelucrate cu calculatorul, putem considera ca multimea de valori
posibile a unei caracteristici statistice/variabile aleatoare este o multime nu-
merica.Astfel, in Statistica Matematica, notiunea de esantion sau selectie de
volum nde observatii facute asupra v.a. X, adica (x1; x2; :::; x n)X, este
privita ca un set de nrealizari independente ale uneia si aceleiasi v.a X. Aici
putem, in functie de scopul urmarit, adopta oricare din urmatoarele doua
puncte de vedere. Din punctul de vedere al Observatorului/ experimen-
tatorului (x1; x2; :::; x n)pot
privite ca realizari (numere) concrete
ale v.a. X,iar din punct de vedere al Matematicianului (x1; x2; :::; x n)
pot
privite ca variabile aleatoare independente, identic repartizate
(v.a.i.i.r.) ca ¸ si v.a. X.Punctul de vedere al Matematicianului are drept
la existenta macar si pentru faptul ca o colectare repetata a setului de date
(x1; x2; :::; x n)se va solda de
ecare data cu valori diferite, deoarece acestea
reprezinta realizari ale v.a. X:In continuarie vor
adoptate ambele puncte
de vedere in functie de situatie, dar, si intr-un caz si in altul, scopul urmarit
va
a area f.d. FXa v.a. Xsau a parametrilor ei, daca aceasta devine o
functie cunoscuta deindata ce se cunosc parametrii de care depinde ea (cum
ar
cazul tuturor distribu¸ tiilor uzuale studiate in cap.3 al cursului nostru).
Insfarsit, putem spune ca TP&SM au acelasi obiect de studiu :mod-
elele matematice ale fenomenelor (experimentelor aleatoare) ce poseda pro-
prietatea Regularitatii Statistice .Cu toate acestea, Statistica Matematica se
deosebeste, totusi, de Teoria probabilitatilor prin faptul ca problemele ei
sunt, intr-un fel, inverse in raport cu cele din Teoria Probabilitatilor. Astfel,
in Teoria Probabilitatilor modelul (repartitia) probabilista a unei v.a. Xeste
cunoscuta apriori, ceea ce permite calcularea probabilitatii ca v.a. Xva lua,
de exemplu, valoarea x. Dimpotriva, in Statistica Matematica sunt cunos-
5
cute, aposteriori, realizarile (valorile observate experimental) x1; x2; :::; x na
unei v.a. X, punandu-se problema reconstituirii (
e si cu aproximare), in
aceasta baza, a modelului ei probabilist. In acest sens se spune, pe buna
dreptate ca, Statistica (inclusiv Statistica Matematica) studiaza partea ca sa
cunoastem intregul.
Fie(x1; x2; :::; x n)X;cu f.d. FXeste necunoscuta, i.e., (x1; x2; :::; x n)
X:FX=?. In acest caz se mai spune ca (x1; x2; :::; x n)Xreprezinta
unesantion sau selectie de volum ndintr-o populatie satatistic ¼a a v.a. X
guvernat ¼a de f.d. FXnecunoscut ¼a. Daca se stie cum arat ¼a în forma ei
exterioar ¼aFXsi se mai ¸ stie c ¼aFXeste o func¸ tie ce depinde de un parametru
; 2Rk, adica FX(x) =FX(x; ),8x2R, valoarea adevarat ¼a a lui
ind necunoscuta, spunem ca avem de a face cu un caz parametric , in caz
contrar spunem ca avem de a face cu un caz neparametric . In continuare
ne vom referi, cu precadere, la cazul parametric, adica FX(x) =FX(x; ),
8x2R,; 2Rk,=?.
Remarc ¼a:Modelul probabilist necunoscut poate
, înloc de f.d., consid-
erat distribu¸ tia probabilista, daca v.a. cercetata este de tip discret sau den-
sitatea ei de distribu¸ tie, daca aceasta este de tip (absolut) continuu,
ecare
din aceste modele,
ind (asa cum am aratat în TP) echivalente cu f.d. ca
modalitate de descriere a modelului probabilist.
5.2. Statistici, estimatori, estimatori punctuali nedeplasati,
consistenti si e
cien¸ ti. Caracteristici de selec¸ tie si propriet ¼a¸ tile
lor
De
ni¸ tia 1. Functia f(x1; x2; :::; x n)se numeste statistica daca aceasta,
privita ca functie de v.a. x1; x2; :::; x n, este, la randul ei, o v.a..
Orice problema de Statistica Matematica se reduce, in fond, la cercetarea
statisticilor ca functii de v.a. x1; x2; :::; x n. Drept exemplu de statistici putem
lua indicatorii statistici in Economie.
Daca dorim sa estimam (evaluam) f.d. a v.a. Xsau orice alta marime
legata de ea, atunci o statistica fdevine estimator iar valoarea ei concreta
f(x1,x2, …,xn);devine estimatie. Deoarece valoarea f(x1; x2; :::; x n)poate
interpretata ca
ind un punct pe axa numerelor reale, estimatorii (estima¸ tiile)
de acest tip se mai numesc estimatori (estima¸ tii) punctuali (punctuale) .
Consideram estimatorul fpentru parametrul necunoscut ;parametru
cunoasterea caruia face cunoscuta, exhaustiv, f.r. a v.a X.
6
De
ni¸ tia 2. Vom spune c ¼afeste un estimator nedeplasat pentru
parametrul daca valoarea medie a acestuia, calculata in presupunerea ca
(x1; x2; :::; x n)reprezinta o selectie de volum ndin populatia statistica a v.a.
Xguvernata de f.d. FX(x; ), coincide chiar cu valoarea lui , i.e.,
Ef(x1; x2; :::; x n) =,8; 2Rk:
De
ni¸ tia 3. Vom spune c ¼afeste un estimator consistent pentru
parametrul daca
P(jf(x1; x2; :::; x n) j ") !
n!11,8" >0.
De
ni¸ tia 4. Vom spune c ¼afeste un estimator e
cient pentru para-
metrul daca acesta este un estimator nedeplasat si in plus acesta are dis-
persia cea mai mica printre to¸ ti estimatorii nedeplasati ai lui .
De
ni¸ tia 5. Vom numi distribu¸ tie (reparti¸ tie) de selectie construit ¼a in
baza e¸ santionului (x1; x2; :::; x n)Xreparti¸ tia
^
X:x0
(1) x0
(2)::: x0
(k)
n1=n n 2=n ::: n k=n
;
unde x0
(1)x0
(2)::: x0
(k)sunt valorile ¸ sirului variational de valori distincte
(valorile distincte ale e¸ santionului scrise in ordine crescatoare), iar nifrecventa
absoluta cu care valoarea x0
(i)se intalneste in esantion, i=1; k,kn.
Un interes aparte pentru analiza mai avansat ¼a a datelor satistice îl prez-
int¼a media, dispersia si f.d. de selectie (functia empirica de distribu¸ tie),
adica:
x=1
nnX
i=1xi=kX
i=1ni
nx0
(i);
S2=1
nnX
i=1(xi x)2=kX
i=1ni
n
x0
(i) x2;
si
^
Fn(x1; x2; : : : ; x n;x) =num arul de valori observate x i:xix
num arul total de valori=
=cardfxi2 fx1; x2; : : : ; x ng jxixg
n=
=1
nnX
i=1I( 1;x](xi);pentru orice x2R;
7
respectiv.
Remarc ¼a.Calculele directe, bazate pe distribu¸ tia de selectie privit ¼a ca
o distribu¸ tie probabilist ¼a a unei v.a. de tip dicret, mai exact a v.a.^
X, arat ¼a
c¼a valoarea medie, dispersia si f.d. a v.a.^
Xcoincid cu media, dispersia si
f.d. de selec¸ tie (functia empiric ¼a de distribu¸ tie) respectiv, adic ¼a
E^
X==kX
i=1ni
nx0
(i)= x;
D^
X=E^
X x2
=kX
i=1ni
n
x0
(i) x2=S2;
¸ si
F^
X(x) =X
i:x0
(i)xni
n=kX
i=1ni
nI( 1;x](x0
(i)) =^
Fn(x1; x2; : : : ; x n;x);
fapt care justi
c ¼a denumirea de caracteristici numerice de selectie . Pe de alt ¼a
parte media, dispersia si f.d. de selec¸ tie, ca func¸ tii de (x1; x2; : : : ; x n)sunt
v.a., cu alte cuvinte, conform de
ni¸ tiei, sunt statistici, prin urmare, sunt
estimatori ale c ¼aror propriet ¼a¸ ti sunt expuse în urm ¼atoarea
Teorem ¼a (Propriet ¼a¸ tile caracteristicilor numerice de selec¸ tie ).
a) Media de selectie xeste un estimator nedeplasat si consistent pentru
valoarea medie teoretica EXa v.a. X,deîndat ¼a ce aceasta din urm ¼a exist ¼a;
b) Dispersia de selec¸ tie este un estimator deplasat, mai exact
ES2=n 1
nDX
dar consistent, pentru dispersia teoretic ¼aDXa v.a. X;deîndat ¼a ce
aceasta din urm ¼a exist ¼a;
c) Func¸ tia empiric ¼a de distribu¸ tie F^
X(x)este un estimator nedeplasat si
consistent pentu functia teoretica de distribu¸ tie F(x)a v.a. X,în plus exist ¼a
dispersia DF^
X(x) =1
nF(x)[1 F(x)],pentru orice x2R.
Din punctul b)rezult ¼a ca statistica
s2=n
n 1S2=1
n 1nX
i=1(xi x)2=1
n 1kX
i=1ni
x0
(i) x2
8
reprezinta un estimator nedeplasat pentru DX, fapt ce explica inlocuirea lui
S2cus2in aplicatii practice. Insa, pentru nsu
cient de mare, S2sis2se
egaleaza valoric, asa ca s2devine util, mai ales, pentru esantioane de volum
mic.
Propozitia urmatoare scoate in evidenta cateva exemple de estimatori
e
cienti.
Propozitie. a)Daca esantionul (x1; x2; :::; x n)X;unde Xeste o v.a.
distribuit ¼a Poisson cu parametrul 2 = (0 ;+1)R,
ind necunoscut,
atunci media de selectie x=1
nnP
i=1xi;reprezinta un estimator e
cient pentru
parametrul ;acesta avand cea mai mica dispersie egala cu Dx==n;
b)Daca esantionul (x1; x2; :::; x n)X;unde Xeste o v.a. distribuit ¼a
Bernoulli cu parametrul 2 = (0 ;1)R,
ind necunoscut, atunci media
de selectie x=1
nnP
i=1xi;reprezinta un estimator e
cient pentru parametrul ;
acesta avand cea mai mica dispersie egala cu Dx=(1 )=n:
c)Daca esantionul (x1; x2; :::; x n)X;unde Xeste o v.a. distribuit ¼a
Normal cu media 2Rsi dispersia 2,
ind necunoscut iar dispersia 2
ind cunoscuta, atunci media de selectie x=1
nnP
i=1xi;reprezinta un estimator
e
cient pentru parametrul ;acesta avand cea mai mica dispersie egala cu
Dx=2=n.
5.3. Estimatori punctuali de verosimilitate maxim ¼a
Una din cele mai r ¼aspândite metode de estimare punctual ¼a este metoda
ce are la baz ¼a
Principiul Verosimilit ¼a¸ tii Maxime. Dac¼a într-un experiment aleator
Es-a produs evenimentul aleator A, aceasta înseamn ¼a c¼a s-a produs eveni-
mentul cu probabilitatea cea mai mare.
Un exemplu tipic de aplicare a acestui Principiu poate
reg ¼asit în inter-
pretarea solu¸ tiilor furnizate de modelele probabiliste versus situa¸ tiile reale.
Exemplul 1 ( Veri
carea unei ipoteze statistice ).Un profesor de
la Universitatea Cornell (SUA) a fost amendat de dou ¼asprezece ori pentru
parcare neregulamentar ¼a, pe timp de noapte, a autoturismului sau, toate
aceste amenzi nimerind în ziua de mar¸ ti sau joi. Ar
fost oare justi
cat ¼a
arendarea unui garaj anume in aceste zile?
9
Solu¸ tie. Prima ipotez ¼a
reasc ¼a ar
c ¼a aceste amenzi se distribuie întâm-
pl¼ator pe zilele s ¼apt¼amânii. În presupunerea c ¼a acest ¼a ipotez ¼a este adev ¼arat¼a,
putem calcula, folosind probabilitatea clasic ¼a, probabilitatea evenimentului
A=fcele 12 amenzi vor nimeri in ziua de mar¸ ti sau joi g. Cum cele 12amenzi
se pot distribui pe cele 7zile în 712modalit ¼a¸ ti, din care doar 212modalit ¼a¸ ti
favorizeaz ¼a evenimentul nefericit în cauz ¼a, rezult ¼a c¼a
P(A) =212
7120:0000003 .
Concluzie: ree¸ sind din Principiul Verosimilit ¼a¸ tii Maxime, dat
ind faptul
c¼a probabiliatea evenimentului Aeste foarte mic ¼a, ipoteza noastra nu este
plauzibil ¼a, prin urmare se justifc ¼a arendarea unui garaj, anume in zilele de
mar¸ ti ¸ si joi, poli¸ tia ac¸ tionând, mai degraba, dup ¼a un sistem ce nu corespunde
ipotezei c ¼a aceste amenzi se distribuie întâmpl ¼ator pe zilele s ¼apt¼amânii.
Pentru a valori
ca Principiul Verosimilit ¼a¸ tii Maxime într-o metod ¼a de
ob¸ tinere a estimatorilor punctuali, presupunem c ¼aXeste o populatie statis-
tic¼a a v.a. X;cu alte cuvinte Xeste mul¸ timea de valori posibile a v.a. X
care este o v. a. cu distribu¸ tia sau densitatea de probabilitate f(x;),
ind
un parametru necunoscut. Cu alte cuvinte: f(x;) =P(X=x), pentru
orice x2 X în caz discret, sau f(x;)coincide cu d. d. a v.a. Xcu valori
dinX R.
Cazul
ind parametric cunoastem doar forma matematic ¼a a functiei f(x;).
De exemplu dac ¼a ¸ stim c ¼aXeste o v.a. distribuit ¼a normal cu media 12R¸ si
abaterea standard 22(0;+1)neunoscute, atunci f(x;)=1
2p
2e (x 1)2
22
2,
= (1; 2)2R(0;+1),= (1; 2) =?
De
ni¸ tia 1. Vom numi func¸ tie de verosimilitate determinat ¼a în baza
e¸ santionului (x1; x2; :::; x n)X:f(x;),2Rk,
ind necunoscut,
func¸ tia L(x1; x2; :::; x n;)=f(x1;)f(x2;)…f(xn;):
Remarca 1. Conform de
ni¸ tiei de mai sus, x1; x2; :::; x n
ind valori ale
v.a. i.i.d. X1; X2, …, Xnca ¸ si v.a. X, rezult ¼a c¼a func¸ tia de verosimilitate
coincide cu distribu¸ tia probabilist ¼a în ansamblu
P(X1=x1; X2=x2; :::; X n=xn) =nY
i=1P(Xi=xi);
în caz discret sau cu d.d. în ansamblu
f(x1; x2; :::; x n;) =f(x1;)f(x2;):::f(xn;);
10
în caz (absolut) continuu. Deci, L(x1; x2; :::; x n;)în caz discret sau
L(x1; x2; :::; x n;)dx1dx2:::dx n=P(x1< X 1x1+dx1; :::; x n< X nxn+dxn)
în caz (absolut) continuu, sunt probabilit ¼a¸ ti ale unor evenimente care s-
au produs. Conform Principiul Verosimilit ¼a¸ tii Maxime este
resc sa lu ¼am
în calitate de estimator^
a parametrului necunoscut acea func¸ tie^
=
^
(x1; x2; :::; x n)care, pentru orice e¸ santion (x1; x2; :::; x n), maximizeaz ¼afunc¸ tia
de verosimilitate L(x1; x2; :::; x n;). De aici ¸ si
De
ni¸ tia 2. Vom numi estimator de verosimilitate maxim ¼a (e.v.m.) a
parametrului necunoscut func¸ tia^
=^
(x1; x2; :::; x n)cu proprietatea c ¼a
L(x1; x2; :::; x n;^
) = max
2RkL(x1; x2; :::; x n;)
pentru orice e¸ santion (x1; x2; :::; x n)X. Pentru valorile concrete ale e¸ san-
tionului (x1; x2; :::; x n)X, valoarea^
=^
(x1; x2; :::; x n)se nume¸ ste estima¸ tie
de verosimilitate maxim ¼aa parametrului .
Remarca 2. Dat
ind faptul ca func¸ tia lnxeste o func¸ tie strict monoton
cresc ¼atoare putem spune ca a gasi estimatorul de verosimilitate maxim ¼a este
echivalent cu a g ¼asi acea func¸ tie^
=^
(x1; x2; :::; x n)cu proprietatea c ¼a
lnL(x1; x2; :::; x n;^
) = max
2RklnL(x1; x2; :::; x n;)
pentru orice e¸ santion (x1; x2; :::; x n)X. Or, Metoda Verosimilit ¼a¸ tii Maxime
rezid ¼a în a area punctului maxim^
pentru func¸ tia L(x1; x2; :::; x n;), privit ¼a
ca functie de variabila = (1; 2; :::; k)2Rk, algoritmul presupunând,
atunci când func¸ tia de verosimiliate este derivabil ¼a fa¸ t¼a de ,conform rezul-
tatelor din Analiza Matematic ¼a, rezolvarea urmatorului sistem de kecua¸ tii
cuknecunoscute:
@L(x1; x2; :::; x n;)
@i= 0,i=1; k;
sau a sistemului echivalent acestuia
@lnL(x1; x2; :::; x n;)
@i= 0,i=1; k:
11
Acestea din urm ¼a se numesc ecua¸ tiile verosimilit ¼a¸ tii maxime pentru func¸ tia
de verosimilitate sau logaritmul func¸ tiei de verosimilitate respectiv.
Vom implementa, drept exemple, aceast ¼a metod ¼a pentru a ob¸ tine estima-
tori de verosimilitatea maxim ¼a pentru parametrii necunoscu¸ ti în cazul unor
modele probabiliste uzuale (clasice).
Exemplul 2. Presupunem c ¼a e¸ santionul (x1; x2; :::; x n)vizeaz ¼a o v.a.
XPoisson (), >0, dar este necunoscut.
Atunci func¸ tia de verosimilitate
L(x1; x2; :::; x n;) =nY
k=1xk
xk!e =nP
k=1xke nnY
k=11
xk!;
ceea ce înseamn ¼a c¼a
lnL(x1; x2; :::; x n;) = n+ (nX
k=1xk) ln+ lnnY
k=11
xk!,
¸ si ecua¸ tia verosimilit ¼a¸ tii maxime are forma
dL(x1; x2; :::; x n;)
d= n+nP
k=1xk
= 0:
De unde g ¼asim c ¼a estimatorul de verosimilitate maxim ¼a
^
=^
(x1; x2; :::; x n) =1
nnX
k=1xk=x.
Remarca 3. Conform propozi¸ tiei din p. 5.2. ¸ si rezultatului din exemplul
1, deducem c ¼a, atunci când XPoisson (), media de selectie xeste un
estimator e
cient pentru parametrul , estimator ce coincide cu e.v.m. a
acestui parametru. De fapt aceasta este o consecin¸ t ¼a a a
rma¸ tiei din
Propozi¸ tia 1 ( Rao-Kramer ).Daca pentru e¸ santionul (x1; x2; :::; x n)
X;unde Xeste o v.a. cu d.d. f(x;);ce depinde de un parametru necunoscut
2Rexist¼a un estimator e
cient^
=^
(x1; x2; :::; x n)pentru , atunci
estimatorul e
cient este, totodat ¼a, ¸ si e.v.m. cu dispersia
D^
(x1; x2; :::; x n) =1
E
dL(x1;x2;:::;x n;)
d2.
12
Remarca 4. Un e.v.m. nu întotdeauna este ¸ si estimator nedeplasat,
prin urmare un e.v.m. nu întotdeauna este ¸ si estimator e
cient. Aducem, în
acest sens
Exemplul 2. Consider ¼am e¸ santionul (x1; x2; :::; x n)X;unde v.a.
Xreprezint ¼a durata vie¸ tii unui dispozitiv electronic, adic ¼aXexpfg,
2(0;+1),
ind necunoscut. Func¸ tia corespunz ¼atoare de verosimilitate
L(x1; x2; :::; x n;) =nY
k=1e xk=ne (x1+x2+:::+xk);
iar ecua¸ tia de verosimilitate este
n 1e (x1+x2+:::+xk)[n (x1+x2+:::+xk)] = 0 :
De unde deducem c ¼a e.v.m.
^
=^
(x1; x2; :::; x n) =n
(x1+x2+:::+xk)=1
x:
Cu toate c ¼a1
xnu este un estimator nedeplast pentru parametrul , observ ¼am
c¼axeste, totu¸ si, un estimator nedeplasat pentre1
.
Exemplul 3. Fie(x1; x2; :::; x n)un e¸ santion dintr-o popula¸ tie statis-
tic¼a a v.a. Xdistribuit ¼a normal ce reprezint ¼a gradul de umplere automata
a unei sticle de lapte de 1litru pe o band ¼a rulant ¼a de îmbuteliere, cu alte
cuvinte, v.a. Xeste normal distribuit ¼a cu media 1¸ si dispersia 2
1,(1,
2
1)2R(0;+1), ambii parametri
ind necunoscu¸ ti. S ¼a se determine
e.v.m. pentru media si dispersia gradului de umplere.
Solu¸ tie. Func¸ tia de verosimilitate
L(x1; x2; :::; x n;1; 2
2) =nY
k=11
2p
2exp[ (xk 1)2
22
2] =
=1
(22
2)n
2exp[ 1
22
2nX
k=1(xk 1)2];
deci
lnL(x1; x2; :::; x n;1; 2
2) = n
2ln 2 n
2ln2
2 1
22
2nX
k=1(xk 1)2:
13
Atunci ecua¸ tiile verosimilit ¼a¸ tii sunt urm ¼atoarele:
@lnL(x1; x2; :::; x n;1; 2
2)
@1=1
2
2nX
k=1(xk 1) = 0 ;
@lnL(x1; x2; :::; x n;1; 2
2)
@2
2= n
22
2+1
24
2nX
k=1(xk 1)2:
Acestea dau solutiile^
1=1
nnP
k=1xk=x,^
2
2=1
nnP
k=1(xk x)2=S2, prin urmare
e.v.m. pentru medie ¸ si dispersie este dat de media si respectiv dispersia de
selectie. Dac ¼a media de selec¸ tie este un estimator nedeplasat, apoi dispersia
de selectie nu este (vezi propriet ¼a¸ tile ei din paragraful anterior). Or, în cazul
nostru e.v.m. (^
1,^
2
2);privit ca estimator pentru parmetrul vectorial (1; 2
2)
nu este e
cient.
Remarca 5. Algoritmul de a are a e.v.m. nu presupune, în mod oblig-
atoriu, utilizarea ecua¸ tiilor de verosimilitate.
Exemplul 4. În controlul calit ¼a¸ tii unui lot de piese de volum N, num ¼arul
N
ind cunoscut, se pune problema determin ¼arii unui estimator de verosimil-
itate maxim ¼a a num ¼arului de piese defecte, având la baz ¼a un e¸ santion de
volum nde piese extrase la întâmplare, f ¼ar¼a repetare, e¸ santion în care s-au
depistat exact xpiese defecte.
Solu¸ tie. Cum num ¼arulXde piese defecte depistate într-un e¸ santion de
volum nextrase la întâmplare, f ¼ar¼a repetare dintr-un lot de Npiese, din care
sunt defecte, este o v.a. distribuit ¼aHypergeom (N; ; n ), rezult ¼a c¼a func¸ tia
de verosimilitate este
L(x;) =Cx
Cn x
N
Cn
N,unde 2 f0;1;2; :::; Ng; =?
În acest caz vom g ¼asi e.v.m.^
(x)nemijlocit din condi¸ tia
L(x;^
) = max
2f0;1;2;:::;NgL(x;) = max
2f0;1;2;:::;NgCx
Cn x
N
Cn
N.
Pentru aceasta observ ¼am c ¼a
L(x;)
L(x; 1)=!
x!( x)1(N )!
(n x)!(N (n x))!
( 1)!
x!( x 1)!(N +1)!
(n x)!(N (n x)+1)!=(N (n x) + 1)
( x)(N + 1):
14
Or,L(x;)=L(x; 1)1deîndat ¼a ce(N (n x)+1)( x2)(N
+1), sau dupa simpli
c ¼ari, deîndat ¼a cen 1x(N+1). Aeasta înseamn ¼a,
de fapt, c ¼a func¸ tia de verosimilitate cre¸ ste odat ¼a cu cre¸ sterea lui , dar atâta
timp cât n 1x(N+1). Prin urmare e.v.m. coincide^
(x)cu cel mai mare
întreg n 1x(N+ 1), adic ¼a cu partea întreag ¼a:^
(x)=[n 1x(N+ 1)] . De
exemplu, pentru N= 10000 piese, n= 500 piese incluse în e¸ santion, x= 50
piese depistate ca
ind defecte, g ¼asim c ¼a estima¸ tia de verosimilitate maxim ¼a
a num ¼arului de piese defecte în întreg lotul este egal ¼a cu^
(50)=[500 150
10001)] = 1000 .
Exemplul 5. Consider ¼am(x1; x2; :::; x n)un e¸ santion de volum nce
reprezint ¼a rezultatele unor m ¼asur¼atori bazate pe scala Rockwell a durit ¼a¸ tii
Xa o¸ telului produs de un anumit produs, X
ind o v.a. uniform distribuit ¼a
pe[1; 2], unde
= (1; 2)2 =f(x; y)2(0;+1)(0;+1) 😡 < yg,=?
S¼a se determine un e.v.m. pentru grani¸ ta de jos 1¸ si grani¸ ta de sus 2pentru
duritatea admisibil ¼a a o¸ telului produs.
Solu¸ tie. Func¸ tia de verosimilitate este
L(x1; x2; :::; x n;1; 2) =1
(2 1)n
k=1I[1;2](xi) =
=1
(2 1)I[1;+1)( min
1inxi)I(0;2]( max
1inxi):
Pentru maximizarea acestei func¸ tii, ca func¸ tie de (1; 2)2, observ ¼a c¼a
aceasta ea valoarea cea mai mare atunci cand (2 1)ia valoarea cea mic ¼a
posibil ¼a, dar concomiutent cu aceasta s ¼a
e respectat ¼a condi¸ tia
I[1;+1)( min
1inxi)I(0;2]( max
1inxi) = 1 :
E clar c ¼a acestor condi¸ tii satisface^
1(x1; x2; :::; x n) = min
1inxi¸ si^
1(x1; x2; :::; x n) =
max
1inxi,^
= (^
1,^
2)reprezentând, astfel, e.v.m. pentru parametrul vectorial
.
6. Estimatori de interval (intervale de con
den¸ t ¼a sau
de încredere)
15
6.1. Întroducere
Considerentul principal care conduce la necesitatea g ¼asirii unei alterna-
tive la estimatorul punctual^
=^
(x1; x2; :::; x n)pentru parametrul necunos-
cuteste urm ¼atorul. Cel putin în caz (absolut) continuu, probabilitatea
P(^
(x1; x2; :::; x n)) = 0 , cu alte cuvinte nu este deloc sigur a estima c ¼a
este egal cu^
. În plus, de¸ si estima¸ tia punctual ¼a a unui parametru , necunos-
cut la nivelul unei popula¸ tii constituie o informa¸ tie în leg ¼atur¼a cu popula¸ tia
în cauz ¼a, aceasta nu poate
utilizat ¼a f¼ar¼a a avea o imagine ¸ si asupra m ¼arimii
probabilistice a erorii de estimare. De aceea se impune no¸ tiunea de estimator
de interval.
6.2. De
ni¸ tia no¸ tiunii de estimator de interval
Fie(x1; x2; :::; x n)X:FX(x; ),2R,=?,X2X. .
De
ni¸ tia 1. Vom numi estimator de interval (interval de con
den¸ t ¼a sau
de încredere) pentru parametrul intervalul (
(x1; x2; :::; x n);
(x1; x2; :::; x n))
cu proprietatile
(x1; x2; :::; x n)
(x1; x2; :::; x n);8(x1; x2; :::; x n)2Xn;
P(
(x1; x2; :::; x n)
(x1; x2; :::; x n) = 1 ;
unde 2(0;1)este dat. Valoarea 1 se numeste probabilitate de incredere,
iarprag de semni
catie.
Remarca 1. Adoptând punctul de vedere al Matematicianului,
(x1; x2; :::; x n)¸ si
(x1; x2; :::; x n)
pot
privite ca v.a., prin urmare evenimentul aleator f
(x1; x2; :::; x n)
(x1; x2; :::; x n)gcoincide cu evenimentul A=fintervalul aleator (
;
)acop-
er¼a valoarea adev ¼arat¼a a parametrului necunoscut g. Ín cazul cand 2
16
Rk; k > 1;intervalul de incredere devine domeniu (regiune de incredere) . Din
de
nitia 1 rezulta ca, a
rmand c ¼a intervalul (domeniul) de incredere acopera
valoarea necunoscuta putem comite o eroare de probabilitate :Faptul c ¼a
(
(x1; x2; :::; x n);
(x1; x2; :::; x n))
este un interval de incredere pentru parametrul cu probabilitatea de in-
credere 1 admite, conform Principiului Regularit ¼a¸ tii Statistice (sau Legii
Numerelor Mari), urmatoarea interpretare: efectuând un numari su
cient de
mare de esantionari de acelasi volum ndintr-o populatie statistica a v.a. X:
FX(x; ),2R,=?, vom inregistra, aproximativ, (1 )100% de
cazuri când acest interval va acoperi valoarea adevarata a parametrului ¸ si
doar în aproximativ 100% de cazuri vom da gre¸ s.
De
nitia 2. Un interval de incredere de forma ( 1;
(x1; x2; :::; x n))se
numeste unilateral de stanga iar de forma (
(x1; x2; :::; x n);+1)se numeste
unilateral de dreapta . In caz contrar acesta se numeste bilateral.
Pentru a construi un interval de incredere procedam astfel:
a)determinam o statistic ¼afce depinde numai de valorile e¸ santionului ¸ si
formal de parametrul , distribu¸ tia careia este cunoscuta si nu depinde de
acest parametru;
b)pentru 2(0;1)dat, determin ¼am (in cazul bilateral) valorile f=2si
f1 =2astfel incat
P(f(x1; x2; :::; x n;)f=2) ==2;P(f(x1; x2; :::; x n;)f1 =2) = 1 =2.
c)dupa aceasta deducem intervalul (regiunea) de încredere pentru para-
metrul in presupunerea c ¼a func¸ tia f(x1; x2; :::; x n;)are proprietatile nece-
sare ce permit acest lucru.
In paragrafele care urmeaz ¼a vom exempli
ca acest aceasta idee, luand ca
exemplu cazul cand v.a. XN(m; 2);acest caz
ind reprezentativ în mai
multe situa¸ tii, deoarece în virtutea Teoremei Limit ¼a Central ¼a, atunci când
volumul e¸ santionului este su
cient de mare f.d. a multor dintre statisticile
utilizate poate
aproximat ¼a de f.d. normal ¼a. Concludent în acest sens este
Exemplul 1 ( Intervalul de incredere pentru parametrul pal dis-
tribu¸ tiei Bernoulli ).Consider ¼am(x1; x2; :::; x n)un e¸ santion de volum n
dintr-o popula¸ tie statistic ¼a a unei v.a. XBernoulli (p),p2(0;1),p
ind
necunoscut. Cum EX=p, iar media de selec¸ tie^p(x1; x2; :::; x n)=x=1
nnP
i=1xi
17
este un estimator e
cient pentru p;vom folosi în calitate de statistic ¼a
f(x1; x2; :::; x n;p) = (x p)=p
p(1 p)=n:
Dar
(x p)=p
p(1 p)=n= (1
nnX
i=1xi p)=p
p(1 p)=n= (nX
i=1xi np)=p
np(1 p);
aceasta din urm ¼a având, conform T.L.C. în forma Moivre-Laplace, pentru
pentru nsu
cient de mare, f.d. aproximat ¼a de f.d. gaussian ¼a
(x) =1p
2xZ
1e u2
2du.
Cu alte cuvinte, pentru nsu
cient de mare, indiferent de valoarea adev ¼arat¼a
a lui , statistica noastr ¼a are proprietatea c ¼a
P( x1 =2(x p)=p
p(1 p)=nx1 =2) =
P
x x1 =2p
p(1 p)=npx+x1 =2p
p(1 p)=n
= 1
pentru orice 2(0;1);unde x1 =2este 1 =2cuantila pentru distribu¸ tia
N(0;1), adic ¼a(x1 =2) = 1 =2. Deoarece în exemplul nostru
S2=1
nnX
i=1×2
i (1
nX
xi)2=1
nnX
i=1xi (1
nX
xi)2=^p(1 ^p)
este de a¸ steptat ca, înlocuind p(1 p)cu^p(1 ^p), vom avea în continuare
P
x x1 =2q
^p(1 ^p)=nx+x1 =2q
^p(1 ^p)=n
= 1 .
Astept ¼arile noastre sunt con
rmate de urm ¼atoarea
Propozi¸ tie ( Estimator de interval pentru parametrul (propor¸ tia)
pa unei popula¸ tiei statistice ).Dac¼a(x1; x2; :::; x n)este un e¸ santion de
volum ndintr-o popula¸ tie statistic ¼a a unei v.a. XBernoulli (p),p2(0;1),
18
p
ind necunoscut, atunci f.d. a v.a. (x p)=q
^p(1 ^p)=npoate
aproximat ¼a
cu f.d. (x), iar intervalul
^p x1 =2q
^p(1 ^p)=n;^p+x1 =2q
^p(1 ^p)=n
devine un interval de incredere pentru cu probabilitatea de încredere 1 ,
pentru orice 2(0;1), deîndat ¼a ce n>50,n^p>5,n^p(1 ^p)>5, unde .
^p(x1; x2; :::; x n) = x=1
nnX
i=1xi=fn(X= 1)
este un estimator e
cient pentru propor¸ tia pal unit ¼a¸ tilor !din popula¸ ta
statistic ¼a pentru care X(!) = 1 :
Exemplul 1 ( Continuare ).În condi¸ tiile enun¸ tate se pune problema
a¼arii num ¼arului minimal n0de valori incluse în e¸ santion pentru a garanta
c¼a, pentru probabilitatea dat ¼a1 ,2(0;1)¸ si exactitatea dat ¼a" > 0;
vom avea c ¼aP(j^
j")1 , pentru orice nn0. Pentru aceasta
observ ¼am ca pentru orice prag de semni
ca¸ tie dat 2(0;1), din modul cum
am g ¼asit intervalul corespunz ¼ator de încredere, deducem c ¼a
P
j^
jx1 =2r
^
(1 ^
)=n!
= 1
pentru orice nsu
cient de mare. Condi¸ tia ca j^
j"coroborat ¼a cu
probabiliatea de mai sus arat ¼a c¼an0poate
determinat din inegalitatea
x1 =2r
^
(1 ^
)=n".
De unde g ¼asim c ¼an0
x1 =2q
^
(1 ^
)
"!2
;cea ce înseamn ¼a c¼a
n0=2
640
B@x1 =2q
^
(1 ^
)
"1
CA23
75+ 1;
19
unde prin [x]se noteaz ¼a partea întreag ¼a a num ¼arului x.
Exemplul 2. Dintr-un lot de piese de acela¸ si tip controlului calit ¼a¸ tii
au fost supuse 100de piese,
ind rebutate 10piese. a)S¼a se construiasc ¼a
un interval de încredere cu probabilitatea de încredere 1 = 0:95pentru
propor¸ tia pa pieselor defecte din întregul lot. b)S¼a se determine num ¼arul
minimal n0de piese care trebuie supuse controlului pentru a garanta, cu
probabilitatea 1 = 0:95, c¼a frecven¸ ta relativ ¼a a pieselor defecte calculat ¼a
în baza e¸ santionului de volum n0va estima valoarea necunoscut ¼a a lui pcu
exactitatea "= 0:01.
Solu¸ tie. Dac¼a vom lua
xk=1;daca piesa cu nr. ke defect ¼a,
0;în caz contrar,k= 1;2; :::;
atunci (x1; x2; :::; x n)reprezint ¼a un e¸ santion de volum ndintr-o popula¸ tie
statistic ¼a a unei v.a. XBernoulli (p),p2(0;1),p
ind necunoscut, iar
frecven¸ ta a pieselor defecte calculat ¼a în baza e¸ santionului de volum ncoincide
cu
^p(x1; x2; :::; x n) = x=1
nnX
i=1xi=fn(X= 1),
Or, conform cu solu¸ tia general ¼a dedus ¼a în exemplul 1, deoarece n=100>5,
n^p=10>5¸ sin(1 ^p)=90>5, iarx1 =2=x0:975= 1:96, rezult ¼a c¼a:a)inter-
valul de încredere c ¼autat coincide cu intervalul 0:041< p < 0:159;b)volumul
minimal n0al e¸ santionului, ce garanteaz ¼a exactitatea "= 0:01a estimatoru-
lui^p(x1; x2; :::; x n0)=fn0(X= 1) pentru propor¸ tia necunoscut ¼ap, coincide
cu
n0=2
640
@x1 =2q
^p(1 ^p)
"1
A23
75+ 1 =
=2
4
1:96p
0:10:9
0:01!23
5+ 1 = [3457 :44] + 1 = 3458 :
6.3. Intervale de încredere pentru medie
20
Pentru început vom aborda construirea intervalelor de încredere pentru
cazul când e¸ santionul (x1; x2; :::; x n)X:N(m; ); m2R, >0:
Exemplul 1. Valoarea medie EX=mestenecunoscut ¼a, abaterea
standard
indcunoscut ¼a, ne intereseaza intervalul de incredere pentru
parametrul mcu probabilitatea de incredere 1 ,2(0;1):
Vom pleca de la urmatoarea a
rmatie ce tine de Teoria Probabilitatilor:
Propozitia 1. Daca X1; X2; :::; X nsunt v.a.i.i.d. normal cu media msi
dispersia 2atunci media aritmetica a acestor v.a.
X=1
n(X1+X2+:::+Xn)
normata corespunzator are repartitia normala standart, mai exact
X m
pnN(0;1);8m2R.
Aceasta insemna ca media de selectie x=1
n(x1+x2+:::+xn)are propri-
etatatea c ¼a statistica
f((x1; x2; :::; x n) =x m
pnN(0;1);8m2R,
adic¼a func¸ tia ei de distribu¸ tie nu depinde de m. Prin urmare, daca valoarea
lui; 2(0;1);atunci are loc proprietatea c ¼a
P(x=2x m
pnx1 =2) = 1 ,
unde x=2; x1 =2sunt acele valoari pentru care (x=2) ==2,(x1 =2) =
1 =2,
(x) =xZ
1e u2
2du:
De unde, stiind ca x=2= x1 =2, deducem ca
P(x pnx1 =2mx+pnx1 =2) = 1 ;
ceea ce inseamna ca intervalul
x pnx1 =2;x+pnx1 =2
21
este un interval de incredere pentru parametrul mcu probabilitatea de in-
credere 1 . Valoarea pnx1 =2se nume¸ ste marj¼a de eroare a estima-
torului xpentru media mnecunoscut ¼a.
Exemplul 2. Valoarea medie EX=mestenecunoscut ¼a, abaterea
standard
ind, la fel, necunoscut ¼a, ne intereseaza intervalul de incredere
pentru parametrul mcu probabilitatea de incredere 1 ,2(0;1).
Mai întâi reamintim o v.a. a c ¼arei distribu¸ tie probabilist ¼a este legat ¼a de
distribu¸ tia normal ¼a. Este vorba de v.a. T(n)care are distribu¸ tia Student
(distribu¸ tia T) cu ngrade de libertate daca T(n)are aceeasi distribu¸ tia ca
¸ si v.a.
X =vuut1
nnX
i=1X2
i;
unde X; X i,i=1; n;sunt v.a.i.i.r. N(0;1). Distribu¸ tia lui T(n), este o
distribu¸ tie de tip (absolut) continuu, dar valorile func¸ tiei ei de distribu¸ tie nu
pot
calculate decât prin metode aproximative, îns ¼a exist ¼a tabele numerice
corespunzatoare ca ¸ si pentru distribu¸ tia normal ¼a. Dealtfel, conform Teoremei
Limit ¼a Central ¼a si distribu¸ tia lui T(n), pentru nsu
cient de mare, poate
aproximat ¼a de distribu¸ tia normala, prin urmare, incepand de la un anumit
ndistribu¸ tia lui T(n)se reduce la distribu¸ tia normal ¼a.
Vom bene
cia de urmatorul rezultat teoretic ce tine de Teoria Probabili-
tatilor:
Propozitia 2. Daca X1; X2; :::; X nsunt v.a.i.i.d. normal repartizate
cu media msi dispersia 2iar
X=1
nnX
i=1Xi; S2
X=1
nnX
i=1(Xi X)2;
atunci
T(n 1) =X m
SXpnStudent (n 1);8m2R.
Aceasta propozi¸ tie arat ¼a, de fapt, ca pentru problema noastr ¼a, in care
(x1; x2; :::; x n)X:N(m; 2); m2R, >0iarx,S2reprezinta, respectiv,
media si dispersia de selectie, statistica urmatoare, mai exact v.a.
x m
SpnT(n 1);8m2R;
22
are f.d. ce nu depinde de parametrul estimat. Aceasta insemna ca
P(t=2(n 1)x m
Spnt1 =2(n 1)) = 1 ,
unde t=2(n 1); t1 =2(n 1)sunt acele valoari pentru care
P(x m
Spnt=2(n 1)) = =2;P(x m
Spnt1 =2(n 1)) = 1 =2:
De unde, stiind ca x=2= x1 =2¸ si în cazul distribu¸ tiei Student, deducem
c¼a
P(x Spnt1 =2(n 1)mx+Spnt1 =2(n 1)) = 1 ;
ceea ce inseamna ca intervalul
x Spnt1 =2(n 1);x+Spnt1 =2(n 1)
este un interval de incredere pentru parametrul mcu probabilitatea de in-
credere 1 . Valoarea Spnt1 =2(n 1)se nume¸ ste marj¼a de eroare a
estimatorului xpentru media mnecunoscut ¼a.
Exemplul 3. Fie(x1; x2; :::; x 25)un e¸ santion dintr-o popula¸ tie statistic ¼a
a v.a. Xdistribuit ¼a normal ce reprezint ¼a gradul de umplere automata a
unei sticle de lapte de 1litru pe o band ¼a rulant ¼a de îmbuteliere, pentru care
media mestenecunoscut ¼a,
ind cunoscut ¼a, în schimb, c ¼a media de selec¸ tie
x= 997 ml. S ¼a se construiasc ¼a un interval de încredere pentru media mcu
probabilitatea de încredere 1 = 0:95în
ecare din urmatoarele cazuri: a)
abaterea standard = 10 ml;b)abaterea standard este necunoscut ¼a,dar
se cunoa¸ ste abaterea standard de selec¸ tie S= 11 ml.
Solu¸ tie. Cazul a)reprezint ¼a, de fapt, un caz particular al exemplului 1.
Cu alte cuvinte, deoarece n= 25, iar din Anexa 1 g ¼asim c ¼ax1 =2=x0:975=1:96,
intervalul de incredere corespunz ¼ator coincide cu
x pnx1 =2;x+pnx1 =2
=
997 10p
251:96;997 +10p
251:96
=
= [993 :08;1000:9]:
23
Cu alte cuvinte, putem a
rma, cu o marj ¼a de eroare de 10p
251:96 =3:92
ml ¸ si o probabilitate de încredere egal ¼a cu 0:95cam= 997 ml.
Analogic, cazul b)reprezint ¼a, de fapt, un caz particular al exemplului 2.
Cu alte cuvinte, deoarece volumul e¸ santionului n= 25 , abaterea standard
de selectie S= 11 ml, iar din anexa 2 pentru distribu¸ tia Student g ¼asim c ¼a
t1 =2(n 1)=t0:975(24)=2:064, intervalul de incredere corespunz ¼ator coincide
cu
x Sp
25t1 =2(n 1);x+Spnt1 =2(n 1)
=
=
997 11p
252:064;997 +11p
252:064
= [992 :46;1001:5]:
Cu alte cuvinte, putem a
rma, cu o marj ¼a de eroare de 11p
252:064 = 4:5401
ml ¸ si o probabilitate de încredere egal ¼a cu 0:95cam= 997 ml. Observ ¼am,
astfel, c ¼a necunoa¸ sterea valorii adev ¼arate a parametrului are, drept efect,
cre¸ sterea margei de eroare a estimatorului x.
Acum ne putem permite, în baza T.L.C., s ¼a abord ¼am problema con-
struirei intervalelor de încredere pentru medie în cazul când ¸ stim c ¼a exist ¼a
valoarea medie si dispersia v.a. observate X, dar valoarea adev ¼arat¼a a mediei
este necunoscut ¼a, volumul e¸ santionului
ind su
cient de mare.
Exemplul 4 ( Intervale de încredere pentru medie în cazul e¸ san-
tioanelor de volum mare ).Fie(x1; x2; :::; x n)X:EX=m=?, volumul
e¸ santionului n
ind su
ciuent de mare. Presupunem, suplimentar, ca dis-
tribu¸ tia v.a. X, chiar dac ¼a este necunoscut ¼a, este de a¸ sa natur ¼a încât exist ¼a
¸ si dispersia ei. Atunci din T.L.C. rezult ¼a c¼a:
a) statistica
f((x1; x2; :::; x n) =x m
pn'N(0;1);8m2R,
adic¼a func¸ tia ei de distribu¸ tie nu depinde de m, în cazul când abaterea stan-
dard a v.a. Xestecunoscut ¼a¸ si
b) statistica
x m
Spn'T(n 1);8m2R
adic¼a func¸ tia ei de distribu¸ tie nu depinde de m, în cazul când abaterea stan-
dard a v.a. este necunoscut ¼a,dar în schimb este cunoscut ¼a abaterea
standard Sde selec¸ tie.
24
Atunci intervalul de incredere pentru media necunoscut ¼amcu probabili-
tatea de încredere 1 ,2(0;1), coincide, in cazul a)cu cel din Exemplul
1, iar în cazul b)coincide cu cel din exempul 2.
Exemplul 5. Un e¸ santion format din 532de abona¸ ti ai s ¼apt¼amânalului
Business Week arat¼a c¼a un abonat acceseaz ¼a Internetul ¸ si serviciile online
in medie 6:7ore pe s ¼apt¼amân ¼a (Business Week 1996 World Wide Subscriber
Study ). Dac ¼a se ¸ stie c ¼a abaterea standard de selec¸ tie este egal ¼a cu 5:8ore,
care este intervalul de ¼ ¬ ncredere cu probabilitatea de íncredere egala cu 0:95
pentru durata medie de accesare a Internetului ¸ si seviciilor online la nivel de
întreaga popula¸ tie a abona¸ tilor pentru Business Week.
Solu¸ tie. Conform cu exemplul 4, ne a ¼am în condi¸ tiile cazului b): me-
diaEX=meste necunoscut ¼a, necunoscut ¼a
ind ¸ si abaterea standard, dar
se cunoaste abaterea standard de selec¸ tie S= 5:8ore. Prin urmare, având
volumul e¸ santionului n= 532 , probabilitatea de încredere 1 = 0:95;iar
t1 =2(n 1)=t0:975(531) =t0:975(1)=1:96, putem g ¼aasi intervalul în cauz ¼a:
x Spnt1 =2(n 1);x+Spnt1 =2(n 1)
=
=
5:8 5:8p
5321:96;5:8 +5:8p
5321:96
= [5:307 1 ;6:292 9] :
Cu alte cuvinte, putem a
rma, cu o marj ¼a de eroare de 5:8p
5321:96=
0:492 87 ore ¸ si o probabilitate de încredere egal ¼a cu 0:95cam= 6:7ore.
6.4. Intervale de încredere pentru dispersie
Înainte de abordarea problemei de construire a intervalelor pentru dis-
persie, men¸ tion ¼am c ¼a acestea au la baz ¼a urm ¼atioarea v.a. Este vorba despre
v.a.X2(n)(se citeste Hi-p ¼atrat) care are distribu¸ tia Hi-p ¼atrat cu ngrade de
libertate daca aceasta are acea¸ si distribu¸ tie ca ¸ si v.a.
nX
i=1X2
i,
unde Xi,i=1; n;sunt v.a.i.i.d. N(0;1).
Or, putem considera ca
X2(n) =nX
i=1X2
i;unde Xi; i=1; n,sunt v.a.i.i.r :N(0;1):
25
Mai ¸ stim ca aceasta este o v.a. de tip (absolut) continuu, dar valorile func¸ tiei
ei de distribu¸ tie nu pot
calculate decât prin metode aproximative, îns ¼a ex-
ist¼a tabele numerice corespunzatoare ca si pentru repartitia normal ¼a. Dealt-
fel, conform Teoremei Limit ¼a Central ¼a, atunci cand n! 1 ;distribu¸ tia v.a.
X2(n) np
2nconverge c ¼atre catre distribu¸ tia N(0;1), prin urmare, pentru nsu
-
cient de mare distribu¸ tia lui X2(n)se reduce la distribu¸ tia normala.
Exemplul 1. Consider ¼am e¸ santionul (x1; x2; :::; x n)X:N(m; );
m2R, > 0, abaterea standard
indnecunoscut ¼a:Ne intereseaza
intervalul de incredere pentru dispersia 2cu probabilitatea de
incredere 1 ,2(0;1):
Cazul 1. Valoarea medie EX=mestecunoscut ¼a.
Vom pleca de la statistica
nX
i=1(xi m)
22
:
Din de
nitia repartitiei Hi-patrat cu ngrade de libertate si din faptul ca
XN(m; 2)implica ( X m)=N(0;1), rezulta ca
nX
i=1(xi m)
22
=nS2
0
2 X2(n);8 >0.
unde
S2
0=1
nnX
i=1(xi m)2.
Aceasta insemna ca
P(X2
=2(n)nS2
0
2 X2
1 =2(n)) = 1 ,
undeX2
=2(n);X2
1 =2(n)sunt acele valoari pentru care P(X2(n) X2
=2(n)) =
=2,P(X2(n) X2
1 =2(n)) = 1 =2:Cu alte cuvinte, X2
=2(n);X2
1 =2(n)
sunt =2¸ si1 =2cuantile ale distribu¸ tiei X2(n). De unde deducem ca
P(X2
=2(n)nS2
0
2 X2
1 =2(n)) =
P(nS2=X2
1 =2(n)2nS2
0=X2
=2(n)) = 1 .
26
ceea ce inseamna ca intervalul
[nS2
0=X2
1 =2(n);nS2
0=X2
=2(n)]
este un interval de incredere pentru parametrul 2cu probabilitatea de in-
credere 1 .
Cazul 2. Valoarea medie EX=mestenecunoscut ¼a.
Vom bene
cia de urmatorul rezultat teoretic ce tine de Teoria Probabili-
tatilor:
Propozitia 3. Daca X1; X2; :::; X nsunt v.a.i.i.r. normal repartizate
cu media msi dispersia 2iar
X=1
nnX
i=1Xi; s2
X=1
n 1nX
i=1(Xi X)2;
atunciX
i=1(Xi X)2
2=(n 1)s2
X
2 X2(n 1);8 >0.
Propozi¸ tia aceasta, aplicat ¼a la statistica
nX
i=1(xi x)
22
:
ne arat ¼a c¼a
nX
i=1(xi x)
22
=(n 1)s2
2 X2(n 1);8 >0,
unde
s2=1
n 1nX
i=1(xi x)2.
Aceasta insemna ca
P(X2
=2(n 1)(n 1)s2
2 X2
1 =2(n 1)) = 1 ,
undeX2
=2(n 1);X2
1 =2(n 1)sunt acele valoari pentru care P(X2(n 1)
X2
=2(n 1)) = =2,P(X2(n 1) X2
1 =2(n 1)) = 1 =2:De unde
deducem ca
P(X2
=2(n 1)(n 1)s2
2 X2
1 =2(n 1)) =
27
=P((n 1)s2=X2
1 =2(n 1)2(n 1)s2=X2
=2(n 1)) = 1 .
ceea ce inseamna ca intervalul
(n 1)s2=X2
1 =2(n );(n 1)s2=X2
=2(n 1)
este un interval de incredere pentru parametrul mcu probabilitatea de in-
credere 1 .
Exemplul 1. M¼asur¼atorile care vizeaza gradul de duritate a 16mostre
de o¸ tel aliat (in unit ¼a¸ ti conven¸ tionale) s-au soldat cu urm ¼atoarele rezultate:
13:1,12:8,11:9,12:04,13:5,13:7,12:0,13:8,10:6,12:4,13:5,11:7,13:9,11:5,12:5,11:9.
În presupunerea c ¼a aceste date reprezint ¼a un e¸ santion de volum 16dintr-
o popula¸ tie statistic ¼a a unei v.a. normal repartizate cu media msi disper-
sia2necunoscute , sa se construiasca intervalele corespunzatoare de con
-
denta pentru ace¸ sti parametri cu probabilitatea de incredere 1 = 0:95.
Solu¸ tie. Intervalele cautate corespund cazurilor 2 si 4 descrise mai sus.
Prin urmare avem nevoie de media de selectie x, dispersia de selectie S2si
estimatia corectata a dispersiei de selectie s2. Calculele arata ca x'12:57,
S2'0:93,S'0:96,s2'0:87. Din tabelele de calcul pentru repartitiile
Student cu n 1 = 16 1 = 15 grade de libertate si repartitia Chi-patrat cu
acelasi numar de grade de libertate a am valorile t1 =2(n 1) = t0:975(15) =
2:131¸ siX2
=2(n 1) =X2
0:025(15) = 6 :26,X2
1 =2(n 1) =X2
0:975(15) = 27 :49.
A am, astfel, ca intervalul de incredere pentru parametrul meste egal cu
x Spnt1 =2(n 1);x+Spnt1 =2(n 1)
'
'
12:57 0:96p
152:131;12:57 +0:96p
152:131
'[12:042;13:1];
iar intervalul de incredere pentru dispersia 2este egal cu
(n 1)s2=X2
1 =2(n 1);(n 1)s2=X2
=2(n 1)
'
'[150:87=27:49;150:87=6:26]'[0:47;2:08].
7. Veri
carea ipotezelor statistice
7.1. Întroducere
28
Orice investiga¸ tie statistic ¼a devine una temeinic ¼a atunci când, in baza
datelor statistice ce vizeaz ¼a v.a. Xcercetat ¼a (variabila care poate
¸ si mul-
tidimensional ¼a), este abordat ¼a si rezolvat ¼a problema valid ¼ari sau invalid ¼arii
distribu¸ tiei (legit ¼a¸ tii) probabiliste care guveneaz ¼a comportamentul proba-
bilist al acestei v.a., valid ¼arii sau invalid ¼arii unor aser¸ tiuni privind valoarea
adev¼arat¼a a unor parametri (valoarea medie, dispersia, coe
cientul de core-
la¸ tie, etc.) lega¸ ti de v.a. X. Aceast ¼a etap ¼a a unei cercet ¼ari statistice ¸ tine de
analiza inferen¸ tial ¼a a datelor statistice ¸ si implica testarea ipotezelor statistice
prin intermediul unor proceduri dedicate veri
c ¼arii ipotezelor statistice.
7.2. Veri
carea ipotezelor statistice: notiuni de baz ¼a
Drept punct de plecare pentru veri
carea unor supozi¸ tii (ipoteze) ce
vizeaza anumite proprietati ale distribu¸ tiei popula¸ tiei statistice a v.a. X
va servi un e¸ santion (x1; x2; :::; x n)de volum nce const ¼a din rezultatele ob-
serva¸ tiilor facute asupra v.a. X:
De
nitia 1. Vom numi ipoteza statistic ¼aorice presupunere Hce vizeaza
parametrii sau distribu¸ tia v.a. X. Ipoteza statistica Hse numeste simpla
daca ea vizeaza o distribu¸ tie unic ¼a a v.a. Xsau o valoare unica a parametru-
lui legat de aceast ¼a v.a., in caz contrar ipoteza Hse numeste compusa.
De exemplu daca stim ca Xexp(), atunci simpla este ipoteza H:
Xexp(1) sau, altfel spus, simpl ¼a este ipoteza H:= 1;iar ipoteza
H:1estecompus ¼a.
Deseori forma distribu¸ tiei v.a. Xeste cunoscuta si atunci ipotezele vizeaza
valorile parametrilor care de
nesc distribu¸ tia data. In acest caz ipotezele se
numesc parametrice . In continuare vom avea in vedere anume acest caz.
Ipoteza care se veri
ca se numeste ipoteza nul ¼asauipoteza de baza si se
noteaza cu H0:Împreun ¼a cu ipoteza nula este considerata si ipoteza alterna-
tiv¼anotata cu H1;aceste
ind ipoteze ce se exclud , dar care se completeaza
reciproc (tertium non datur).
Un test statistic are menirea de a recomanda acceptarea ipotezei H0(¸ si
deci respingerea lui H1) sau respingerea lui H0(¸ si deci acceptarea lui H1).
Regula sau procedura Kîn baza careia se ia decizia de acceptare sau
respingere a ipotezei nule se numeste criteriu . La fel ca in cazul constru-
irii intervalelor de incredere la baza unui criteriu Kse a a o statistica Z
corespunzatoare si care se numeste statistic ¼a a criteriului K.
29
Veri
carea ipotezelor statistice se bazeaza pe principiul in conformitate
cu care un eveniment de probabilitate mica este considirat imposibil iar un
eveniment de probabilitate mare este considirat sigur, cu alte cuvinte, vom
respecta Principiul Verosimilit ¼a¸ tii maxime. Înainte de analiza e¸ santionului se
xeaz ¼a o probabilitate mica numita prag de semni
catie. Fie Vdomeniul
de valori al statisticii Z, iar VKVo submultime pentru care, in conditia
ca ipoteza nula este adevarata, probabiliatatea ca valoarea lui Zva nimeri
inVKeste egala cu .
Daca vom nota prin zvaloarea statisticii Z;ca func¸ tie de valorile e¸ san-
tionului, atunci criterul poate
formulat astfel: ipoteza H0se respinge daca
z2VK, in caz contrar, adica daca z2VnVK, atunci ipoteza H0se accepta.
Aceasta justi
ca denumirile de multime (regiune, domeniu) critica pentru
VKsidomeniu de acceptare a ipotezei H0pentru VnVK. Acum suntem in
stare sa descriem Algoritmul de veri
care a ipotezelor H0; H1:
Pasul 1. Formulam ipotezele nula H0si alternativa H1;
Pasul 2. Fixam pragul de semni
catie ;
Pasul 3. Alegem statistica Zpentru criteriul de veri
care a ipotezei H0.
Pasul 4. Determinam distribu¸ tia v.a. Zin functie de valorile e¸ santionului
privite ca v.a.;
Pasul 5. Alegem multimea critica VKin dependenta de forma ipotezei
alternative;
Pasul 6. In baza valorile observate (x1; x2; :::; x n)calculam valoarea de
selectie z;
Pasul 7. Se ia decizia de
a)respingere a ipotezei H0daca z2VK;
b)acceptare a ipotezei H0daca z2VnVK.
In mod logic dupa aplicarea unui criteriu de veri
care a ipotezelor sunt
posibile urmatoarele 4 variante:
1. Ipoteza H0este acceptata, ea
ind in realitate justa;
2. Ipoteza H0este respinsa, ea
ind in realitate justa;
3:Ipoteza H0este respinsa, ea
ind in realitate falsa;
4:Ipoteza H0este acceptata, ea
ind in realitate falsa;
De
nitia 2. Spunem ca avem de a face cu o eroare de speta I daca
ipoteza H0este respinsa, ea
ind in realitate justa si ca avem de a face cu o
eroare de speta II daca ipoteza H0este acceptata, ea
ind in realitate falsa.
Probabilitatea P(Z2VK= H 0) =, care coincide cu pragul de semni
ca¸ tie
este, de fapt, probabilitatea erorii de speta I. Probabilitatea P(Z2VrVK
30
= H 1) =se numeste probabilitatea erorii de speta II , iar valoarea 1 se
numeste puterea testului.
Desigur c ¼a dorim s ¼a proiect ¼am teste pentru care probabilit ¼a¸ tile de eroare
¸ sis¼a
e mici. În anumite situa¸ tii, se caut ¼a minimizarea sumei +.
În alte cazuri se
xeaz ¼a nivelul de semni
ca¸ tie ¸ si se caut ¼a testul pentru
cares¼a
e minim ¼a. În cazuri complexe calculul lui este di
cil sau chiar
imposibil, a¸ sa c ¼a se
xeaz ¼a doar nivelul de semni
ca¸ tie .
7.3.Veri
carea ipotezelor statistice despre valoarea medie
Ca ¸ si în cazul intervalelor de încredere, deoarece distribu¸ tia normal ¼a
ocup ¼a, gra¸ tie Legii Numerelor Mari si Teoremei Limit ¼a Central ¼a, un loc
aparte, exemplele aduse în continuare sunt reprezentative ¸ si pentru e¸ san-
tioanele de volum mare ce ¸ tin de popula¸ tii statistice diferite de cele ale
v.a. distribuite normal. De aceea vom exempli
ca procedura de veri
care
a ipotezelor, în primul, prin exemple legate de distribu¸ ta normal ¼a.
Exemplul 1 ( Veri
carea ipotezelor despre media v.a. repartizate
normal cu dispersia cunoscuta ).
Fie, a¸ sadar, (x1; x2; :::; x n)X:N(m; 2),m2R
ind necunoscut ¼a
iar2cunoscut ¼a.Vom analiza 3 subcazuri:
a)H0:m=m0,H1:m < m 0;numit Test de Stânga ;
b)H0:m=m0,H1:m6=m0, numit Test Bilateral ;
c)H0:m=m0,H1:m > m 0;numit Test de Dreapta :
Criteriile de veri
care a ipotezelor in cazurile a)-c) se numesc criterii de
stanga, bilateral si dreapta respectiv. In toate aceste cazuri ne vom baza pe
statistica
Z=x m
pn
despre care stim ca ZN(0;1),8m2R.
Cazul a) Cum mul¸ timea de valori Va statistici Zcoincide cu R, ipoteza
H1:m < m 0indica asupra faptului ca multimea critica VKtrebuie sa
e de
forma VK= ( 1; x):
Din condi¸ tia
P(Z2VK= H 0) =P(x m
pn2VK= H 0) =P(x m0
pn< z ) =
gasim ca zare proprietatea z: (z) =;adic¼azeste cuantila v.a.
Z,
ind valoarea pragului de semni
catie dat, 2(0;1). Dar
31
P(x m0
pn< z ) =P(x < m 0+pnz) =
Prin urmare daca x < m 0+pnz, atunci ipoteza H0se respinge, în caz
contrar se accepta. Cu alte cuvinte, in raport cu statistica xmultimea critica
a criteriului este multimea ( 1; m 0+pnz)iar domeniul de acceptare a
ipotezei H0este multimea [m0+pnz;+1)
Cazul b) Cum multimea de valori Va statisticii Zcoincide cu R, ipoteza
H1:m6=m0indica asupra faptului ca multimea critica VKtrebuie sa
e de
forma VK= ( 1; z=2)[(z1 =2;+1), ceea ce corespunde Testului Bilateral .
Din condi¸ tia
P(Z2VK= H 0) =P(x m
pn2VK= H 0) =
P(x m0
pn< z =2) +P(x m0
pn> z 1 =2) =
gasim ca z=2are proprietatea z=2: (z=2) ==2;iarz1 =2are propri-
etatea z1 =2: (z1 =2) = 1 =2;
ind valoarea pragului de semni
catie
dat,2(0;1). Dar
P(x m0
pn< z =2) =P(x < m 0+pnz=2)
=P(x < m 0 pnz1 =2)
iar
P(x m0
pn> z 1 =2) =P(x > m 0+pnz1 =2)
Prin urmare daca x < m 0 pnz1 =2sauP(x > m 0+pnz1 =2), atunci
ipoteza H0se respinge si se accepta in caz contrar. Cu alte cuvinte, in
raport cu statistica xmultimea critica a criteriului este multimea ( 1; m 0
pnz1 =2)[(m0+pnz1 =2;+1)iar domeniul de acceptare este multimea
[m0 pnz1 =2; m 0+pnz1 =2]
Cazul c) Prin analogie cu cazul c) gasim ca in raport cu statistica x
multimea critica a criteriului este multimea (m0+pnz1 ;+1)iar domeniul
de acceptare este multimea
32
( 1; m 0+pnz1 ]:
Exemplul 2. Conform datelor tehnice ale unui motor auto, acesta con-
sum¼a10lde carburan¸ ti la 100km. Constructorul a operat anumite modi
cari
asupra acestui motor in scopul diminuarii consumului de carburanti. Pentru
veri
care au fost alese la intamplare 25de automobile cu motor modernizat,
constatându-se, astfel, ca media de selectie a acestui consum x= 9:3lla
100km. În presupunerea ca selec¸ tia a fost facut ¼a dintr-o popula¸ tie statistic ¼a
a unei v.a. XN(m;2l), s¼a se veri
ce ipoteza c ¼a modi
c ¼arile de construc¸ tie
aduse motorului nu au afectat consumul de carburant in sensul diminu ¼arii
lui, luând in calitate de prag de semni
ca¸ tie = 0:05.
Solutie. Avem de a face, a¸ sadar, cu o problema de veriv
care a ipotezelor
despre media ma unei populatii statistice legate de o v.a. normal repartizate
cu dispersia cunoscuta 2= 4l2, ipoteze de baza si alternativa
ind, respec-
tiv,H0:m= 10 ,H1:m < 10, iar pragul de semni
catie = 0:05:Primii
doi pasi ai Algoritmului de veri
care a ipotezelor
ind cunoscuti, trecem la
Pasul 3 . Lu¼am
Z=x m
pn
in calitate de statistica a criteriului de veri
care a ipotezelor unde media de
selectie. xeste estimatorul valorii medii teoretice m;
Pasul 4. În presupunerea ca este adevarata ipoteza H0:m= 10 sta-
tistica Z= (x m)=(pn)are repartitia normala standard, cu media 0si
dispersia 1.
Pasul 5. Deoarece ipoteza alternativa are forma H1:m < 10, rezulta
ca avem de a face cu un criteriu de stanga cu multimea critica de vorma
VK= ( 1; z), unde zare proprietatea z: (z) =:
Din tabelul de calcul al valorilor (z)in functie de za am ca (z0:05) =
0:05atunci cand z0:05= 1:645;
Pasul 6. Valoarea de selectie za statisticii Zeste egala cu
z=9:3 10
2p
25= 1:75;
Pasul 7. Deoarece valoarea de selectie z= 1:752VK= ( 1; 1:645)
rezulta ca ipoteza de baza H0:m= 10 este respinsa, prin urmare este
valabila ipoteza alternativa H1:m < 10. Cu alte cuvinte, modi
c ¼arile de
construc¸ tie a motorului au drept efect diminuarea consumului de carburanti.
33
Deoarece pragul critic al statisticii de selec¸ tie Zeste egal cu zK=z0:05=
1:645, din ecua¸ tia z0:05= 1:645 = ( xK 10)=(2p
25)a am si pragul critic
pentru media de selectie xK= 9:342, cu alte cuvinte multimea critica pentru
statistica xeste data de relatia x <9:342l.
Exemplul 3 ( Veri
carea ipotezelor despre media v.a. repartizate
normal cu dispersia necunoscuta ).
Fie(x1; x2; :::; x n)X:N(m; 2),m2R
ind necunoscut ¼adar ¸ si 2
necunoscut ¼a. Din cele 3 subcazuri:
a)H0:m=m0,H1:m < m 0;
b)H0:m=m0,H1:m6=m0;
c)H0:m=m0,H1:m > m 0;
vom analiza doar subcazul b) celelalte
ind asem ¼an¼atoare, iar în toate
aceste cazuri ne vom baza pe statistica
T(n 1) =x m
SpnStudent (n 1);8m2R;
unde xeste media de selec¸ tie, iar Seste abaterea standard de selec¸ tie, la
baz¼a a ându-se Propozitia 2 din paragraful anterior.
A¸ sadar, cu referire la cazul b), cum multimea de valori Va statisticii
T(n 1)coincide cu R, ipoteza H1:m6=m0indica asupra faptului ca mul-
timea critica VKtrebuie sa
e de forma VK= ( 1; t=2(n 1)[(t1 =2(n
1);+1):
Din condi¸ tia
P(T(n 1)2VK= H 0) =P(x m
Spn2VK= H 0) =
P(x m0
Spn< t=2(n 1)) +P(x m0
Spn> t 1 =2(n 1)) =
gasim ca t=2(n 1)are proprietatea t=2(n 1) :P(T(n 1)< t=2(n 1)) =
=2;iart1 =2are proprietatea t1 =2:P(T(n 1)< t 1 =2(n 1)) = 1 =2;
ind valoarea pragului de semni
catie dat, 2(0;1). Dar
P(x m0
Spn< t=2(n 1)) =P(x < m 0+Spnt=2(n 1))
=P(x < m 0 Spnz1 =2)
34
iar
P(x m0
Spn> t 1 =2(n 1)) =P(x > m 0+Spnt1 =2(n 1)):
Prin urmare daca x < m 0 Spnt1 =2(n 1)sauP(x > m 0+Spnt1 =2),
atunci ipoteza H0se respinge si se accepta in caz contrar. Cu alte cuvinte, in
raport cu statistica xmul¸ timea critica a criteriului este multimea ( 1; m 0
Spnt1 =2(n 1))[(m0+Spnt1 =2(n 1);+1)iar domeniul de acceptare
este multimea
[m0 Spnt1 =2(n 1); m 0+Spnt1 =2(n 1)]
Remarc ¼a.Prin analogie cu ra¸ tionamentele care stau la baza extinderii
intervalelor de incredere, construite în cazul popula¸ tiilor statistice, asupra
popula¸ tiilor statistice diferite de cele normal distribuite, folosind faptul c ¼a
e¸ santioanele au un volum su
cient de mare, la fel se procedeaz ¼a ¸ si cu proce-
durile de testare a ipotezelor statistice.
Exemplul 4. ( Veri
carea ipotezelor statistice despre parametrul
(propor¸ tia) pal unei popula¸ tiei statistice ).Fie(x1; x2; :::; x n)un e¸ san-
tion de volum ndintr-o popula¸ tie statistic ¼a a unei v.a. XBernoulli (p),
p2(0;1),p
ind necunoscut. Situa¸ tia este tipica pentru orice popula¸ tie sta-
tistic ¼a atunci când masur ¼atorile/observa¸ tiile statistice depisteaz ¼a dac ¼a uni-
tatea inclus ¼a în e¸ santion posed ¼a nivelul dat (conven¸ tional notat cu 1,dac¼a-l
posed ¼a) sau nu posed ¼a acest nivel (conven¸ tional notat cu 0dac¼a nu-l posed ¼a)
al unei caracteristici statistice, preprezentând propor¸ tia acelor unit ¼a¸ t din
popula¸ tie care posed ¼a nivelul dat. Având la dispozi¸ tie doar estimatorul e
-
cient^p(x1; x2; :::; x n)=xal parametrului pputem putem veri
ca, de exemplu,
ipotezele: H0:p=p0,H1:p6=p0. Într-adev ¼ar, conform Propozi¸ tiei din
Exemplul 1, p.6.1., f.d. a v.a. (x p)=q
^p(1 ^p)=npoate
aproximat ¼a cu
f.d. normal ¼a standard (x), mai exact (x p)=q
^p(1 ^p)=n'N(0;1)pen-
tru orice p2(0;1);deîndat ¼a ce n>50,n^p>5,n^p(1 ^p)>5. Prin urmare
problema noastr ¼a devine un caz particular de veri
care a ipotezelor despre
medie a unei popula¸ tii statistice normal distribuite cu dispersia cunoscuta (a
se vedea cazul b) din exemplul 1 analizat anterior. În concluzie, in raport
cu statistica^p(x1; x2; :::; x n)=x, multimea critica a criteriului cu pragul de
35
semni
ca¸ tie ,2(0;1)este mul¸ timea
( 1; p0 z1 =2q
^p(1 ^p)=n)[(m0+z1 =2q
^p(1 ^p)=n;+1)
iar domeniul de acceptare este multimea
[p0 z1 =2q
^p(1 ^p)=n; m 0+z1 =2q
^p(1 ^p)=n]:
Prin analogie se veri
ca ¸ si ipotezele H0:p=p0,H1:p < p 0, dar si ipotezele
H0:p=p0,H1:p > p 0.
Exemplul 5. La o universitate american ¼a Senatul sustine c ¼a nu se
face discriminare pe criteriu de gen la admitere. Se aleg la întâmplare 500
studenti, constatându-se c ¼a din ei 267sunt baie¸ ti. S ¼a se testeze cu pragul de
semni
ca¸ tie = 0:05daca Senatul universitatii spune adevarul sau nu.
Solu¸ tie. Problema noastr ¼a reprezint ¼a un caz particular al problemei
generale, rezolvate în exemplul anterior, unde
X=1;dac¼a studentul ales este b ¼aiat,
0;dac¼a studentul ales este fat ¼a,
XBernoulli (p),p2(0;1),p
ind necunoscut , dar sunt cunoscute volu-
mul e¸ santionului n= 500 ¸ si propor¸ tia b ¼aie¸ tilor în e¸ santion^p=267=500=
0:534. Atunci, a testa dac ¼a Senatul universitatii spune adevarul sau nu, este
echivalent cu veri
carea ipotezelor H0:p= 1=2,H1:p6= 1=2, având un
prag de semni
ca¸ tie = 0:05, adic ¼az1 =2=z0:975= 1:96. Cum domeniul
de acceptare este mul¸ timea
[1
2 1:96p
0:534(1 0:534)p
500;1
2+1:96p
0:534(1 0:534)p
500] = [0 :456 27 ;0:543 73] ;
iar propor¸ tia e¸ santionului^p=0:534nimere¸ ste în el, rezult ¼a ca putem accepta,
cu probabilitatea 1-= 0:95, c¼a Senatul spune adev ¼arul.
Exemplul 6. ( Veri
carea ipotezelor statistice despre medie atunci
când volumul e¸ santionului este mic ).
7.4.Veri
carea ipotezelor statistice despre dispersie
36
Ca ¸ si în cazul mediei, în acest paragraf ne vom concentra asupra veri
–
carii ipotezelor despre dispersie atunci când e¸ santionul (x1; x2; :::; x n)provine
dintr-o popula¸ tie statistic ¼a a unei v.a. XN(m; 2), deoarece algoritmul
veri
carii r ¼amâne neschimbat, deîndat ¼a ce volumul nal e¸ santionului este su-
cient de mare iar x1; x2; :::; x n, privite ca v.a.i.i.d., sunt guvernate de Legea
Numerelor Mari si Teorema Limit ¼a Central ¼a.
Remarca 1. Evident, atunci când XN(m; 2), algoritmul de veri-
care a ipotezelor despre dispersie, ca ¸ si despre medie, nu se schimb ¼a chiar
dac¼a e¸ santionul nu are volum destul de mare.
Exemplul 1 ( Veri
carea ipotezelor despre dispersia v.a. dis-
tribuite normal cu media cunoscut ¼a).
A¸ sadar,
e (x1; x2; :::; x n)X:N(m; 2), media m2R
ind cunos-
cut¼a,dar dispersia 2necunoscut ¼a. Din cele 3 subcazuri:
a)H0:2=2
0,H1:2< 2
0;
b)H0:2=2
0,H1:26=2
0;
c)H0:2=2
0,H1:2> 2
0.
vom analiza, de exemplu, subcazul a) celelalte
ind asem ¼an¼atoare, iar
în toate aceste subcazuri ne vom baza, ca ¸ si la construirea intervalului de
incredere pentru 2(Exemplul1, p.6.2.), pe statistica
nX
i=1(xi m)
22
=nS2
0
2 X2(n);8 >0.
unde S2
0=1
nnP
i=1(xi m)2.
A¸ sadar, cu referire la cazul a), cum multimea de valori Vposibile ale
statisticii X2(n)coincide cu [0;+1), ipoteza H1:2< 2
0indica asupra
faptului ca multimea critica VKtrebuie sa
e de forma VK= [0;X2
(n)),
undeX2
(n):P(X2(n) X2
(n)) =, pragul de semni
ca¸ tie 2(0;1).
Din condi¸ tia
P(X2(n)2VK= H 0) =P(nS2
0
22VK= H 0) =
P(nS2
0
2
0<X2
(n)) =:
Prin urmare, dac ¼a valoarea calculat ¼anS2
0
2
02[0;X2
(n)), atunci ipoteza de
baz¼a este respins ¼a, în caz contrar este acceptat ¼a.
37
Cu alte cuvinte, in raport cu statisticanS2
0
2
0, mul¸ timea critic ¼a a criteriului
este multimea [0;X2
(n));iar domeniul de acceptare este multimea [X2
(n),
+1).
Prin analogie se arat ¼a c¼a, în raport cu aceea¸ si statistic ¼a, în subcazul b),
avem c ¼a mul¸ timea critic ¼a a criteriului este mul¸ timea [0;X2
=2(n))[(X2
1 =2(n)),
iar domeniul de acceptare este multimea [X2
=2(n),(X2
=2(n)], iar în subcazul
c),avem c ¼a mul¸ timea critic ¼a a criteriului este mul¸ timea (X2
1 (n),+1), iar
domeniul de acceptare este mul¸ timea [0,X2
1 (n)].
Exemplul 2 ( Veri
carea ipotezelor despre dispersia v.a. dis-
tribuite normal cu media necunoscut ¼a).
Fie(x1; x2; :::; x n)X:N(m; 2), media m2R
ind necunoscut ¼a,
dar ¸ si dispersia 2necunoscut ¼a.
¸ Si aici sun posibile 3 subcazuri:
a)H0:2=2
0,H1:2< 2
0;
b)H0:2=2
0,H1:26=2
0;
c)H0:2=2
0,H1:2> 2
0.
Spre deosebire de exemplul anterior, în toate aceste subcazuri ne vom
baza, ca ¸ si la construirea intervalului de incredere pentru 2(Exemplul 2,
p.6.2.), pe statistica
nX
i=1(xi x)
s22
=(n 1)s2
2 X2(n 1);8 >0.
unde s2=1
n 1nP
i=1(xi x)2. Algoritmul de construire a criteriului de veri
care
a ipotezelor
ind similar cu cel din exemplul anterior, atâta doar c ¼a statistica
de referin¸ t ¼a va
(n 1)s2
2distribuit ¼aX2(n 1);8 >0, putem reproduce cum
arat¼a mul¸ timea critic ¼a ¸ si someniul de acceptare cu pragul de semni
ca¸ tie ,
2(0;1);în
ecare subcaz, în urm ¼atorul tabel:
Domeniul critic Domeniul de acceptare
Subcazul a) [0;X2
(n 1)) [ X2
(n 1),+1)
Subcazul b) [0;X2
=2(n 1))[(X2
1 =2(n 1)) [X2
=2(n 1);(X2
1 =2(n 1)]
Subcazul c) (X2
1 (n 1);+1) [0 ;X2
1 (n 1)]
Exemplul 3. Pentru a valida valorile ce corespund valorii medii ¸ si a dis-
persiei în ¼al¸ timii unui b ¼arbat adult ales la întâmplare din Republica Moldova,
38
s-a efectuat un sondaj de volum n= 100 în baza c ¼aruia media de selec¸ tie
s-a dovedit a
egal ¼a cux=169:7cm,s2=38:3cm2. Deoarece în ¼al¸ timea unui
b¼arbat (ca ¸ si a unei femei) este o v.a. XN(m; 2), cu media m¸ sidis-
persia 2necunoscute , putem, de exemplu, veri
ca ipotezele H0:m= 170 ,
H1:m6= 170 , folosind criteriul dedus în Exemplul 3 (subcazul b), p. 7.2.,
luând ca prag de semni
ca¸ tie = 0:05:Statistica de referin¸ ta
ind x, iar
S's=p
38:3=6:188 7 ,t0:975(100 1)'z0:975= 1:96, deducem c ¼a domeniul
de acceptare, care este egal cu
[m0 Spnt0:975(n 1); m 0 Spnt0:975(n 1)] = [170 6:1887p
1001:96;170+6:1887p
1001:96] =
= [168 :9;170;38
acoper ¼a valoarea x= 169 :95calculat ¼a în baza e¸ santionului men¸ tionat. Prin
urmare ipoteza ca media m= 170 cm este acceptata.
La fel, putem veri
ca ipotezele H0:2= 36 ,H1:26= 36 ;folosind
criteriul dedus în Exemplul 2 (anterior) (subcazul b), luând ca prag de sem-
ni
ca¸ tie = 0:05:CumX2
=2(n 1) =X2
0:025(999) = 74 :2iarX2
1 =2(n
1) =X2
0:975(999) = 129 :6, deducem ca domeniul de acceptare
ind egal cu
[74:2;129:6]este acoperitor pentru valoarea calculata a statisticii de referin¸ ta
(n 1)s2
2
0=9938:3
36= 105 :33. În concluzie, putem considera cu o probabilitate
de încredere 1 = 0:95c¼aXN(170; 36) , cu alte cuvinte c ¼a în¼al¸ timea
unui b ¼arbat adult ales la întâmplare din Republica Moldova este o v.a. X
cu media 170cm ¸ si dispersia 36cm2:
7.5. Veri
carea ipotezelor statistice ¸ si p valoarea
Din câte am v ¼azut, pragul de semni
ca¸ tie , folosit la veri
carea ipotezelor,
reprezint ¼a eroarea de spe¸ ta I, mai exact este probabilitatea respingerii
ipotezei nule atunci când ea este adev ¼arat¼a. Experimentatorul î¸ si
xeaz ¼a
valoarea pentru char la începutul procesului de testare a ipotezelor. Cu
alte cuvinte, el folose¸ ste acest prag de semni
ca¸ tie pentra a determina dac ¼a
ipoteza H0este sau nu respins ¼a. Dealtfel, dup ¼a cum vom vedea din exem-
plul urm ¼ator, în baza unuia ¸ si aceluia¸ si e¸ santion de date, în dependen¸ ta de
valoarea utilizat ¼a a lui , putem ajunge la concluzii diferite dupa testare.
Într-adev ¼ar, sa lu ¼am
39
Exemplul 2 din p.7.3. (Continuare). Conform datelor tehnice ale
unui motor auto, acesta consum ¼a10lde carburan¸ ti la 100km. Construc-
torul a operat anumite modi
cari asupra acestui motor in scopul diminuarii
consumului de carburanti. Pentru veri
care au fost alese la intamplare 25de
automobile cu motor modernizat, constatându-se, astfel, ca media de selectie
a acestui consum x= 9:3lla100km. În presupunerea ca selec¸ tia a fost facut ¼a
dintr-o popula¸ tie statistic ¼a a unei v.a. XN(m;2l), s¼a se veri
ce ipoteza
c¼a modi
c ¼arile de construc¸ tie aduse motorului nu au afectat consumul de
carburant in sensul diminu ¼arii lui, luând in calitate de prag de semni
ca¸ tie
= 0:05.
În concordan¸ t ¼a cu scopul formulat în problem ¼a, veri
carea ipotezelor H0:
m= 10,H1:m < 10cu pragul de semni
ca¸ tie = 0:05are drept rezultat
resingerea ipotezei H0, deoarece multimea critica raportat ¼a la statistica de
referin¸ ta Z=x m
pn,
ind egala cu VK= ( 1; 1:645) este acoperitoare
pentru valoarea z=9:3 10
2p
25= 1:75, unde zeste valoarea lui Z=x m
pn
calculat ¼a în baza datelor e¸ santionului, dar si a cunoa¸ sterii faptului c ¼a abaterea
standard = 2.
Surprinz ¼ator este faptul c ¼a, pentru = 0:01;care este mai mic decât
0:05, ipoteza de baz ¼aH0nu mai este respinsa,
ind acceptat ¼a. Într-adev ¼ar,
repetând pas cu pas procedura de veri
care a ipotezelor, g ¼asim ca pentru =
0:01multimea critic ¼a este egala cu VK= ( 1; 2:34), valoarea calculat ¼a
z=9:3 10
2p
25= 1:75
ind aceea¸ si, nu mai nimere¸ ste în mul¸ timea critic ¼a. Prin
urmare ipoteza H0este accepat ¼a:
În direct ¼a leg ¼atur¼a cu exemplul analizat apare o întrebare
reasc ¼a: dar
care este cea mai mic ¼a valoare a pragului de semni
ca¸ tie pentru care datele
din e¸ santion ne vor conduce la respingerea ipotezei de baz ¼a. R¼aspunsul rezid ¼a
înp valoare, no¸ tiune dat ¼a în urm ¼atoarea
De
ni¸ tie. Pentru distribu¸ tia probabilist ¼a vizat ¼a de ipoteza nul ¼avom
numi p valoare cea mai mic ¼a valoare a pragului de semni
ca¸ tie pentru care
valoarea statisticii de referin¸ t ¼a, valoare calculat ¼a în baza datelor incluse în
e¸ santion, implic ¼a respingerea lui H0.
Din de
ni¸ tie deducem algoritmul de calcul al p valorii pornind de la sta-
tistica de referin¸ t ¼a pe care o vom nota cu Y=Y(x1,x2, …,xn), v¼azut¼a ca v.a.,
atunci când e¸ santionul (x1,x2, …,xn)este interpretat ca v.a. n dimensional ¼a
(din punct de vedere matematic), valoarea ei calculat ¼a
ind not ¼a cuy=y(x1,
x2, …,xn), atunci când e¸ santionul (x1,x2, …,xn)este interpretat ca un set
de valori numerice (din punctul de vedere al experimentatorului).
40
Cazul 1. Test de Stânga. p valoarea =P(Y < y );
Cazul 2. Test Bilateral. p valoarea =P(jYj> y), atunci când distribu¸ tia
v.a.Yeste simetric ¼a fa¸ ta de 0saup valoarea =2P(Y < y ), în caz contrar;
Cazul 3. Test de Dreapta. p valoarea =P(Y > y ).
Odat ¼a
ind calculat ¼ap valoarea, regula de veri
care a ipotezei de baz ¼a
este urm ¼atoarea: ipoteza nul ¼aH0este respins ¼a dac ¼ap valoarea < .
Drept continuare la exemplul anterior, având de a face cu un Test de
Stânga, gasim ca p valoarea =P(Z 1:75) = 0 :04006 . Comparând succe-
siv aceasta valoare cu valorile lui = 0:05, într-un caz ¸ si = 0:01, în alt
caz, se con
rm ¼a concluziile trase ¸ si f ¼ar¼a a apela la no¸ tiunea de p valoare.
Îns¼a, avantajul calcul ¼ariip valorii const ¼a în faptul ca putem a a limita de
jos pân ¼a la care poate
mic¸ sorat ¼a probabilitatea erorii de spe¸ ta I. În exem-
plul citat cea mai mic ¼a probabilitate a eroarii de spe¸ ta I pe care ne-o putem
permite este egala cu =p valoarea =0:04006 :Altfel spus, testul cu cea mai
mare probabilitate de încredere pe care ni-l putem permite este cel care
corespunde lui =0:04006 , aceast ¼a probabilitatea de încredere
ind egal ¼a cu
1 =0:959 94 .
7.6.Veri
carea ipotezelor statistice despre diferen¸ te legate de
date
împerecheate (E¸ santioane dependente)
Multe din aplicatiile analizei inferen¸ tiale au de a face cu e¸ santioane,
elementele c ¼arora reprezint ¼a date împerecheate, având ca scop formularea
unor concluzii despre diferen¸ ta dintre mediile a doua popula¸ tii. Datele îm-
perecheate apar, în mod
resc, în situa¸ tiile de tipul "înainte ¸ si dup ¼a" sau de
tipul "potrivirilor", aceste
ind situa¸ tiile în care unul ¸ si acela¸ si obiect sau
item este m ¼asurat de dou ¼a ori, o dat ¼a înainte iar a doua oar ¼a dup ¼a trata-
ment", sau masurarile se refer ¼a la doi itemi pereche de acela¸ si fel, dar supu¸ si
unor condi¸ tii diferite de tratament. De exemplu, cantitatea medie de porumb
la hectar, pentru unul si acela¸ si tip de porumb, dar crescut pe soluri diferite
sau in conditii diferite.
Atunci când avem de a face cu perechi de date este foarte important ca
acestea s ¼a
e ob¸ tinute în baza unei metode bine de
nite de creare de perechi
de date ¸ si care folose¸ ste în mod clar caracteristici de potrivire natural ¼a. De
exemplu, pentru a veri
ca a
rma¸ tia producatorilor de panto
, precum ca
lungimea medie a t ¼alpii piciorului stâng e mai mare decât cea a piciorului
41
drept vizavi de populatia statistica a adultilor din Republica Moldova putem
lua, sa zicem, un e¸ santion de 15 adul¸ ti, luând drept date împerecheate, datele
ce corespund masurarii lungimei t ¼alpii la piciorul stâng si la piciorul drept
pentru
ecare adult în parte.
Remarc ¼a.Pentru compararea mediilor a dou ¼a popula¸ tii nu întotdeauna
putem aplica testul diferen¸ telor pentru date împerecheate, dar atunci când e
posibil, aceasta reprezinta un avantaj. De ce? Deoarece, operând cu date îm-
perecheate, excludem, deseori, pericolul in uien¸ telor externe sau a factorilor
incontrolabili atunci când colect ¼am datele împerecheate în baza m ¼asur¼arilor.
Mai mult, se poate ar ¼ata ca datele împerecheate au, din punct de vedere teo-
retic, un efect bene
c asupra diminu ¼arii gradului de împr ¼a¸ stiere a datelor,
adic¼a asupra dispersiei, ceea ce confer ¼a o acurate¸ te sporit ¼a a concluziilor trase
în urma analizei inferen¸ tiale.
Un e¸ santioan de volum nde date împerecheate arat ¼a, formal, astfel:
((x0
1; x00
1),(x0
2; x00
2), …, (x0
n; x00
n)(X0; X00), unde X0; X00pot
considerate, de
regula, v.a. independente deoarece acestea viziaza sau acela¸ s item, inainte
si dupa, sau caracteristicele a doi itemi inruditi/asocia¸ ti, dar supu¸ si trata-
mentelor diferite, etc. Deoarece testarea vizeaz ¼a analiza diferentei X=X0
X00, criteriul de veri
care se va baza, de fapt, pe un e¸ santion de forma:
(x1; x2; :::; x n)X=X0 X00, unde xi=x0
i x00
i; i=1; n.
Considerân media de selec¸ tie a diferen¸ telor x¸ si abaterea standart corectat ¼a
a acestora
s=vuut1
n 1nX
i=1(xi x)2;
atunci în calitate de baz ¼a pentru formularea criteriului de veri
care a ipotezelor
despre diferen¸ te legate de date împerecheate putem lua urm ¼atoarea
Teorem ¼a. Statisticax m
spnpoate
privit ¼a ca o v.a. Student sau
T distribuit ¼a cun 1grade de libertate, unde mreprezint ¼a valoarea medie
teoretic ¼a a v.a. X=X0 X00.
În concluzie, daca vrem sa veri
c ¼am, în baza mediei de selec¸ tie a difer-
en¸ telor x, faptul c ¼a exist ¼a sau nu diferen¸ t ¼a de medii ale popula¸ tiilor v.a.
X0; X00, atunci ipoteza de baz ¼a este H0:m= 0, iar alternativ ¼a poate varia
în func¸ tie de problem ¼a:H1:m < 0(test de stânga); H1:m > 0(test de
dreapta) sau H1:m6= 0(test bilateral).
42
Exemplul 1. Echipa de medici specializa¸ t în chirurgia inimii de Spitalul
Republican din Chi¸ sinau cunosc faptul ca pacien¸ tii care au trecut prin faza
primului atac de cord, inainte de o eventuala opera¸ tie pe cord programat ¼a
în cazul lor, ace¸ stea dezvolt ¼a un grad sporit de anxietate. Echipa de psihi-
atri a acestui spital si-au propus sa testeze un program de consiliere pentru
reducerea anxiet ¼a¸ tii acestui tip de pacien¸ ti. Pentru aceasta, înainte ¸ si dupa
consiliere,
ecarui pacient i se m ¼asoar ¼a, dupa o anumita metodic ¼a, gradul
de anxietate. În tabelul de mai jos sunt reproduse datele împerecheate ale
masur ¼arilor efectuate pe baza unui e¸ santion de 9 pacien¸ ti.
Prenume
pacientX0
Scorul inregistrat
inainte de consiliereX00
Scorul inregistrat
dup¼a consiliereX=X0 X00
Diferen¸ ta
Ion 121 76 45
Petru 93 93 0
Maria 105 64 41
Elena 115 117 2
Gheorghe 130 82 48
Mircea 98 80 18
Ana 142 79 63
Ecaterina 118 67 51
Stefan 125 89 36 :
În baza datelor de mai sus, putem noi oare conchide ca sesiunile de con-
siliere reduc din anxietate? Sa se foloseasca un prag de semni
ca¸ tie egal cu
0.01. Sa se g ¼aseasca p valoarea.
Solu¸ tie. Pas 1. Volumul e¸ santionului de date împerechiate
ind egal cu
n= 9, g¼asim c ¼a media de selectie a diferentelor x= 33 :333iar abaterea
standart corectata s=22:924.
Pas 2. Deoarece ipotezele vizeaza media diferentelor m, ipoteza de baza
esteH0:m= 0. Deoarece ne intereseaza dac ¼a dup ¼a consilere anxietatea scade,
adic¼am=E(X0 X00)<0, ipoteza alternativa devine H1:m > 0.
Pas 3. Pentru = 0:01;din anexa 2 pentru distribu¸ tia Student cu n 1 =
8grade de libertate, deoarece multimea critica are forma (t1 (8),+1), a¼am
cuantila t1 (8) = 2 :896:
Pas 4. În presupunerea c ¼a este adev ¼arat¼a ipoteza de baz ¼aH0:m= 0,
a¼am valoarea calculat ¼a a statisticii de referin¸ t ¼a:
43
t0(8) =x m
spn=33:333 0
22:924p
9= 4:362 2 .
Pas 5. Deoarece t0(8)=4:362 2 > t 1 (8) = 2 :896, rezult ¼a c¼a valoarea
calculat ¼at0(8)a statisticii de referin¸ t ¼a nimere¸ ste în mul¸ timea critic ¼a, rezult ¼a
c¼a ipoteza de baz ¼a este respins ¼a, ceea ce însemna ca a¸ stept ¼arile psihologilor,
conform c ¼arora consilierea reduce din anxietate, sunt întemeiate.
Pas 6. Pentru a calcula p valoarea , apeland la calculatorul online de la
adresa https://www.danielsoper.com/statcalc/calculator.aspx?id=8 ,observ ¼am
c¼ap=P(T(8)> t 0(8)) = P(T(8)>4:362) = 0 :00120309 . Aceasta in-
seamn ¼a c¼a Testul con
rma acela¸ si rezultat chiar pragul de semni
ca¸ tie este
si mai mic decat 0.01, mai exact, daca 0:00120309 0:01.
7.7.Veri
carea ipotezelor despre diferen¸ ta mediilor a dou ¼a
popula¸ tii statistice independente
În acest paragraf vom utiliza distribu¸ tiile statistice ce apar în leg ¼atur¼a
cu veri
carea ipotezelor despre diferen¸ ta mediilor a dou ¼a popula¸ tii statistice
pornind de la mediile de selec¸ tie a dou ¼a e¸ santioane ce provin, respectiv,
ecare
din aceste popula¸ tii.
Vom începe cu cazul când ambele e¸ santioane provin din popula¸ tii sta-
tistice normal distribuite ¸ si independente deoarece acest caz testul nu este
sensibil la marimea e¸ santioanelor, în schimb, dac ¼a volumele ambelor e¸ san-
tioane n1¸ sin2sunt su
cient de mari, atunci testul se aplic ¼a, gra¸ tie Teoremei
Limit ¼a Centrale, far ¼a modi
care ¸ si pentru popula¸ tiile distribu¸ tia c ¼arora difer ¼a
de cea normal ¼a.
Fie, a¸ sadar, dou ¼a e¸ santioane (x0
1; x0
2; :::; x0
n1)X0:N(m1; 2
1),m12R,
1>0,(x00
1; x00
2; :::; x00
n2)X00:N(m2; 2
2),m22R,2>0, unde X0,X00sunt
v.a. independente. Se pune problema ca în baza acestor date s ¼a se veri
ce
ipoteza despre coinciden¸ ta sau noncoinciden¸ ta mediilor necunoscute m1,m2.
Vom reda sumar pentru
ecare caz in parte, cum arat ¼a statistica de refer-
in¸ ta, cum este distribuit ¼a aceasta, cum arata domeniul de acceptare a ipotezei
H0:m1-m2= 0in cazurile testului bilateral si a testului de dreapta.
Cazul 1. Dispersiile 2
1¸ si2
2sunt cunoscute . Atunci in calitate de
statistic ¼a de referin¸ t ¼a se ia v.a. (x1 x2)=q
2
1
n1+2
2
n2N(0;1). Drept con-
secin¸ t ¼a, pentru testul bilateral domeniul de acceptare a ipotezei de baz ¼aH0
44
cu pragul de semni
ca¸ tie 2(0;1)coincide cu VnVK=f(x;x2):jx1 x2j
=q
2
1
n1+2
2
n2< z 1 =2g, iar pentru testul de stânga domeniul de acceptare a
ipotezei de baz ¼aH0cu pragul de semni
ca¸ tie 2(0;1)coincide cu Vn
VK=f(x;x2):(x1 x2)=q
2
1
n1+2
2
n2< z 1 g, unde z1 =2¸ siz1 sunt, re-
spectiv 1 =2¸ si1 cuantile ale distribu¸ tiei N(0;1),iarx1;x2sunt mediile
corepunz ¼atoare ambelor e¸ santioane. .
Cazul 2. Dispersiile 2
1¸ si2
2sunt necunoscute, dar se ¸ stie c ¼a sunt egale .
Atunci in calitate de statistic ¼a de referin¸ t ¼a se ia v.a. (x1 x2)=(sq
2
1
n1+2
2
n2)
T(n1 n2 2). Drept consecin¸ t ¼a, pentru testul bilateral domeniul de ac-
ceptare a ipotezei de baz ¼aH0cu pragul de semni
ca¸ tie 2(0;1)coin-
cide cu VnVK=f(x1;x2):jx1 x2j=(sq
1
n1+1
n2)< t 1 =2(n1 n2 2)g,
iar pentru testul de stânga domeniul de acceptare a ipotezei de baz ¼aH0cu
pragul de semni
ca¸ tie 2(0;1)coincide cu VnVK=f(x1;x2):(x1 x2)
=(sq
1
n1+1
n2)< t 1 (n1 n2 2)g, unde t1 =2(n1 n2 2)¸ sit1 (n1 n2 2)
sunt, respectiv 1 =2¸ si1 cuantile ale distribu¸ tiei Student cu n1 n2 2
grade de libertate, x1;x2
ind mediile de selec¸ tie corespunz ¼atoare ambelor
e¸ santioane, iar s=(n1 1)s2
1+(n2 1)s2
2
n1 n2 2,s2
1,s2
2
ind dispersiile de selec¸ tie corec-
tate corespunz ¼atoare ambelor e¸ santioane.
Cazul 3. Dispersiile 2
1¸ si2
2sunt necunoscute, dar se ¸ stie, in plus,
c¼a nu sunt egale . Atunci in calitate de statistic ¼a de referin¸ t ¼a se ia v.a.
(x1 x2)=q
s2
1
n1+s2
2
n2. În acest caz, conform criteriului Cochran-Cox [6] , pen-
trutestul bilateral domeniul de acceptare a ipotezei de baz ¼aH0cu pragul de
semni
ca¸ tie 2(0;1)coincide cu VnVK=f(x1;x2):jx1 x2j=q
s2
1
n1+s2
2
n2<
t1 =2(k)g, iar pentru testul de stânga domeniul de acceptare a ipotezei de
baz¼aH0cu pragul de semni
ca¸ tie 2(0;1)coincide cu VnVK=f(x1;x2)
:(x1 x2)=q
s2
1
n1+s2
2
n2< t 1 (k)g, unde pragul critic t1 (k)în func¸ tie de
se calculeaz ¼a dupa formula t1 (k) =t1 (n1 1)s2
1
n1+t1 (n2 1)s2
2
n2
s2
1
n1+s2
2
n2,t1 (n1
1); t1 (n2 1)
ind, respectiv 1 cuantilele distribu¸ tiilor Student cu n1 1
¸ sin2 1grade de libertate, x1;x2
ind mediile de selec¸ tie corespunz ¼atoare
ambelor e¸ santioane, iar s2=s2
1
n1+s2
2
n2,s2
1,s2
2
ind dispersiile de selec¸ tie corec-
tate corespunz ¼atoare ambelor e¸ santioane.
Remarc ¼a.Aplicabilitatea criteriilor de vei
care a ipotezelor despre difer-
45
en¸ ta mediilor descrise mai sus în cazurile 2-3 este valabil ¼a ¸ si pentru e¸ santioane
de volum mic.
Exemplul 1. Consider ¼am dou ¼a e¸ santioane de date ordonate cresc ¼ator,
unul de volum n1=10,(2,4,6,7,9,12,14,16,19,24), altul de volum
n2=9,(9,14,19,21,25,29,35,41,46), dispersiile popula¸ tiilor respective
ind necunoscute, dar despre care se ¸ stie ca acestea sunt diferite. Ne a ¼am
în condi¸ tiile cazului 3. Calul ¼am mediile de selec¸ tie x1=11:3,×2=26:556,
dispersiile de selec¸ tie corectate s2
1=49:122,s2
2=152:53. Pentru pragul de sem-
ni
ca¸ tie = 0:05, din Anexa 2, a ¼am cuantilele t1 =2(n1 1) = t0:975(9)
=2:2iart1 =2(n2 1) = t0:975(8) = 2 :306;prin urmare pentru testul bilateral
Cochran-Cox valoarea
t1 =2(k) =t1 =2(n1 1)s2
1
n1+t1 =2(n2 1)s2
2
n2
s2
1
n1+s2
2
n2=
2:26249:122
10+ 2:306152:53
9
49:122
10+152:53
9= 2:2961.
Cum valoarea statisticii de referin¸ ta calculat ¼a în presupunerea ca ipoteza H 0
diferen¸ ta mediilor popula¸ tiilor este egal ¼a cu zero (adic ¼a mediile coincid) este
egal¼a cu
(x1 x2)=s
s2
1
n1+s2
2
n2= (11 :3 25:556)=r
49:122
10+152:53
9= 3:0491
iar valoarea ei absoluta nu nimere¸ ste in domeniul de acceptare a ipotezei
H0, aceasta este respins ¼a,
ind acceptata ipoteza alternativ ¼a, conform c ¼areia
mediile in cauz ¼a difer ¼a.
7.8. Criterii (teste) de veri
care a ipotezelor bazate pe
distribu¸ tia 2
1. Testul de concordan¸ t ¼a2: veri
carea ipotezelor despre dis-
tribu¸ tia popula¸ tiei statistice a unei v.a. X.Fie(x1; x2; :::; x n)un
e¸ santion de volum ndin popula¸ tia statistic ¼a a v.a. Xcu f.d. F(x)ne-
cunoscut ¼a. Se veri
c ¼a ipoteza ca f.d. F(x)coincide cu f.d. F0(x), cu alte
cuvinte H0:F(X)=F0(x),H1:F(X)6=F0(x), unde F0(x)sau este cunos-
cut¼a în totalitate sau este cunoscut ¼a forma ei, ca
ind o func¸ tie ce depinde
46
de parametrii 1,2, …, lnecunoscu¸ ti. Dac ¼a se ¸ stie c ¼aF0(x)depinde de
parametrii 1,2, …, l, atunci în baza datelor din e¸ santion se a a esti-
ma¸ tiile acestor parametri b1=b1(x1; x2; :::; x n),b2=b2(x1; x2; :::; x n), …,
bl=bl(x1; x2; :::; x n), luând în calitate de F0(x) = F0(x;b1;b2; :::;bl)iar
ca ipoteze H0:F(x)=F0(x;b1;b2; :::;bl),H1:F(x)6=F0(x;b1;b2; :::;bl).
Atunci, criteriul, intitulat citeriul 2de concordan¸ t ¼a, de veri
care a ipotezei
H0se poate realiza urmând urm ¼atoarele etape.
a)Dac¼aXeste o v.a.de tip discret, atunci trebuie calculate frecven¸ tele nk,
k=1,2, …,r, cu care
ecare valoare sau grup ¼a de valori apare în e¸ santion.
Dac¼a, îns ¼a, v.a. Xeste de tip (absolut) continue, atunci mul¸ timea ei de
valori posibile este divizat ¼a în rintervale 1,2, …, r, disjuncte dou ¼a
câte doua, dup ¼a care determin ¼am num ¼arulnkde elemente din e¸ santion care
nimeresc în intervalul k,k=1,2, …,r. Evident, în ambele cazuri,rX
k=1nk=
n.
b)În caz c ¼a v.a. Xe de tip discret, presupunând c ¼a aceasta este guvernat ¼a
de f.d. F0(x), calcul ¼am probabilit ¼a¸ tilepkpentru care v.a. Xia
ecare valoare
sau grup ¼a de valori, k=1,2, …, r. În caz c ¼a v.a. Xe de tip (absolut)
continue, calcul ¼am probabilit ¼a¸ tile pkcu care v.a. Xnimere¸ ste în intervalul
k:pk=P(X2k),k=1,2, …,r. Evident, în ambele cazuri,rX
k=1pk=1
c)Deoarece criteriul se bazeaz ¼a pe faptul ca statisticarX
k=1(nk npk)2
npkeste
distribuit ¼a2cur l 1de libertate, unde leste num ¼arul de parametri de
care depinde f.d. F0(x),l
ind egal cu zero daca func¸ tia F0(x)este cunoscut ¼a
(adic ¼a este neparametric ¼a), avem c ¼a mul¸ timea critic ¼a cu pragul de semni
-
ca¸ tie 2(0;1)are forma VK=(2
1 (r l 1),1). Mai exact, daca
valoarea calculata 2
calca statisticiirX
k=1(nk npk)2
npknimere¸ ste în mul¸ timea crit-
ic¼aVK, atunci ipoteza de baz ¼a este respins ¼a, în caz contrar este acceptat ¼a.
Remarca 1. La baza a
rma¸ tiei c ¼a statisticarX
k=1(nk npk)2
npk2(r l 1)
se a ¼a Teorema Limit ¼a Central ¼a conform c ¼areia, pentru nsu
cient de mare,
v.a.(nk npk)pnpk'N(0;1)pentru orice k=1,2, …, r, acestea
ind, totodat ¼a
independente.
Exemplul 1. Presupunem c ¼a în uma arunc ¼arii unei monede de 50de ori
47
succesiv, stema a ap ¼arut de 20 de ori. Cu pragul de semni
ca¸ tie = 0:05s¼a
se veri
ce ipoteza c ¼a moneda este simetric ¼a.
Solu¸ tie. Variabila aleatoare Xa at¼a în studiu este repartizat ¼a Bernoulli
cu parametrul p2(0;1), mai exact: p1=P(X= 0)=1 p,p2=P(X= 1) =
p, considerând ca apari¸ tia stemei este echivalenta cu evenimentul fX= 1g,
iar apari¸ tia banului cu fX= 0g, moneda
ind simetrica atunci ¸ si numai
atunci când p= 1=2. Prin urmare ipoteza c ¼a moneda este simetric ¼a este
echivalent ¼a cu ipoteza ca v.a. XBernoulli (1=2). Adic ¼a f.d. F0(x)este
cunoscut ¼a în totalitate ¸ si corespunde distribu¸ tiei p1=P(X= 0)=1 p=p2=
P(X= 1) = 1 =2. Cazul
ind discret, conform datelor din problem ¼a, avem
ca valoarea 0apare de n1= 30 de ori iar valoarea 1den1= 20 de ori.
Mul¸ timea critic ¼aVK=(2
1 (r l 1),1)=(2
0:95( 2 0 1),+1)=(2
0:95(1),
1)=(3:841;+1). Valoarea calculat ¼a2
calca statisticiirX
k=1(nk npk)2
npkeste egal ¼a
cu2
calc=(20 500:5)2
500:5+(30 500:5)2
500:5= 2:Valoarea 2nu nimere¸ ste în mulî¸ timea
critica (3:841;+1), ceea ce înseamn ¼a c¼a ipoteza c ¼a moneda este simetric ¼a
este acceptat ¼a.
2. Veri
carea ipotezelor despre independen¸ ta a dou ¼a variabile
aleatoare. Presupunem c ¼anobserva¸ tii f ¼acute asupra unei v.a. (X; Y )
bidimensionale de tip discret au fost centralizate în urm ¼atorul tabel de con-
tingen¸ t ¼a:
XY y 1y2::: y llP
j=1nij=ni
x1 n11n12::: n 1l n1
x2 n21n22::: n 2l n2
::: ::: ::: ::: ::: :::
xk nk1nk2::: n kl nk
kP
i=1nij=njn1n2::: n l n=n
unde prin nijsunt notate frecven¸ tele absolute ale cazurilor când X=xi,
Y=yj,i=1; k; j =1; l.
Tabelul de contingen¸ t ¼a de mai sus poate
adaptat si la cazul când v.a.
(X; Y )este de tip (absolut) continue, divizând mul¸ timea de valori posibile
a
ec ¼arei v.a. intr-un num ¼ar
nit de intervale, nijreprezentând num ¼arul
48
cazurilor în care Xnimere¸ ste în intervalul i,i=1; k, iar Xnimere¸ ste în
intervalul j,j=1; l.
Se pune problema veri
c ¼arii ipotezei H0precum c ¼a v.a. X¸ siYsunt
independente în caz discret, de exemplu, dac ¼a ipoteza H0este adev ¼arat¼a,
atunci, prin de
ni¸ tie
P(X=xi,Y=yj) =P(X=xi)P(Y=yj) =piqj.
Darbpi=ni=n,bqj=nj=nsunt estimatori ai probabilit ¼a¸ tilor pi,qj, respectiv.
Or, în caz c ¼a ipoteza H0este adev ¼arat¼a, conform Legii Numerelor Mari media
teoretic ¼a a cazurilor când X=xi,Y=yj,i=1; k; j =1; lcare este egal ¼a
cunpiqjpoate
considerat ¼a c¼anpiqjnbpibqj=ninj=n=bnij. Prin urmare,
pentru veri
carea ipotezei H0putem apela la statistica
kX
i=1lX
j=1(nij bnij)2
bnij.
Urmare a considerentelor men¸ tionate în remarca 1 de mai sus, cu condi¸ tia
c¼a ipoteza H0este adev ¼arat¼a iar toate frecven¸ tele bnij4,i=1; k; j =1; l,
statistica de mai sus este distribuit ¼a2[(k 1)(l 1)]. În concluzie, ipoteza
H0despre independen¸ ta v.a. X; Y va
acceptat ¼a cu pragul de semni
ca¸ tie ,
2(0;1)deîndat ¼a ce valoarea calculata a acestei statistici 2
calc< 2
1 [(k
1)(l 1)]. În caz contrar, ipoteza H0este respins ¼a.
Remarca 2. a)Dac¼a unele valori bnijnu satisfac condi¸ tiei bnij4,
atunci linia si coloana respectiv ¼a trebuie comasat ¼a cu una din linia si coloana
învecinat ¼a, astfel încât sa
e respectat ¼a condi¸ tia men¸ tionat ¼a.
b)Dac¼a(k 1)(l 1)8¸ sin40, atunci valoarea minimal ¼a admisibil ¼a
pentrubnijpoate
egal ¼a cu ¸ si cu 1.
Exemplul 2. Produc ¼atorul unui medicament nou a
rm ¼a c¼a rezultatul
actiunii acestuia depinde de modul de administrare. În baza datelor de mai
jos s¼a se veri
ce aceast ¼a a
rma¸ tie cu pragul de semni
ca¸ tie =0:05:
Rezultatul Modul de administrare A B C
Nefavorabil 11 17 16
Favorabil 20 23 19
Solu¸ tie. Din tabel deducem c ¼a, formal, putem identi
ca dou ¼a v.a. X2
f1;2g,fX= 1g=frezultatul va
nefavorabil g,fX= 2g=frezultatul va
49
favorabil g¸ siY2 f1;2;3g,fY= 1g=fva
aplicat modul Ade adminis-
trareg,fY= 2g=fva
aplicat modul Bde administrare g,fY= 3g=fva
aplicat modul Cde administrare g. Totodat ¼a,n1=44,n2=62,n1=31,
n2=40,n3=35,n=n:=212,bn11=4431=212=6:434 0 ,bn12=4440=212=8:
301 9 ,bn13=4435=212 = 7 :264,bn21=6231=212=9:066,bn22=6240=212 =
11:698,bn23=6235=212=10:236. Prin urmare 2
calc=[(11 6:434)2+(17
8:3019)2+(16 7:264)2+(20 9:066)2+(23 11:968)2+(19 10:236)2]=212 =
2:315 5 . In cazul nostru
2
1 [(k 1)(l 1)] = 2
1 [(2 1)(3 1)] = 2
0:95(2) = 5 :991:
Prin urmare este acceptat ¼a ipoteza H0c¼a v.a. X,Ysunt independente,
adic¼a, in po
da a
rma¸ tiei produc ¼atorului, este admis ¼a ipoteza ca rezultatul
ac¸ tiunii medicamentului nu depinde de modul lui de aplicare, deoarece 2
calc=
23155 <2
0:95(2)=5:991.
7.9. Detectarea caracterului nealeator/aleator a datelor
Problema caracterului nealeator/aleator a datelor trebuie rezolvat ¼a, mai
ales atunci când exist ¼a suspiciuni c ¼a aceste date nu sunt aleatoare, deoarece
analiza inferen¸ tial ¼a a datelor bazat ¼a pe metode statistico-matematice pre-
supune, inplicit, valabilitatea Principiului Regularit ¼a¸ tii Statistice, speci
c
datelor cu caracter aleator. Conceptul de "caracter aleator"
ind foarte larg,
este destul de di
cil s ¼a construim criterii exacte ¸ si puternice pentru testarea
caracterului întâmpl ¼ator a datelor. De cele mai dese ori este mai u¸ sor s ¼a se
veri
ce caracterul nealeator a datelor.
Din multitudine de criterii de veri
care a caracterului nealeator a datelor,
am ales urmatorul test descris in lucrarea [4] ca
ind su
cient de sensibil la
majoritatea factorilor ce imprima datelor un caracter nealeator.Fie, a¸ sadar,
e¸ santionul de date (x1,x2, …, xn)de volum n, unde n25. Ipoteza de
baz¼a este ca aceste date au un caracter aleatoar , cea alternativa-c ¼a aceste
date au un caracter nealeator . Criteriul const ¼a în urm ¼atoarele. În calitate de
statistica de referin¸ ta se ia
2
2s2 1
=n 2
n2 1
50
care pentru n25, atunci când ipoteza de baz ¼a este adev ¼arat¼a, este aprox-
imativ standard normal distribuit ¼a, adic ¼a de clas ¼aN(0;1), unde
2=1
n 1n 1X
i=1(xi+1 xi)2; s2=1
n 1nX
i=1(xi x)2;x=1
nnX
i=1xi:
Prin urmare, domeniul de acceptare cu pragul de semni
ca¸ tie a ipotezei
de baz ¼a este multimea acelor valori calculate a statisticii de referin¸ t ¼a care
nimeresc în intervalul [ z1 =2; z1 =2];unde z1 =2este 1 =2cuantil ¼a a
distribu¸ tiei N(0;1).
Exemplul 1. PARTEA 1. Ne propunem s ¼a veri
c ¼am caracterul
nealeator/aleator al zecimalelor num ¼arului . Vom pleca de la primele n=100
zecimale care pot
gasite la adresa http://www.eveandersson.com/pi/digits/100
(1,4,1,5,9,2,6,5,3,5,8,9,7,9,3,2,3,8,4,6,2,6,4,3,3,8,3,2,7,9,5,0,2,8,
8,4,1,9,7,1,6,9,3,9,9,3,7,5,1,0,5,8,2,0,9,7,4,9,4,4,5,9,2,3,0,7,8,1,
6,4,0,6,2,8,6,2,0,8,9,9,8,6,2,8,0,3,4,8,2,5,3,4,2,1,1,7,0,6,7,9).
E¸ santionul patratelor tuturor diferen¸ telor perechilor învecinate (xi+1
xi)2; i=1;99arat¼a astfel:
(9,9,16,16,49,16,1,4,4,9,1,4,4,36,1,1,25,16,4,16,16,4,1,0,25,25,
1,25,4,16,25,4,36,0,16,9,64,4,36,25,3,36,0,36,16,4,9,36,4,49,4,
9,25,25,0,1,16,49,1,9,49,1,49,25,4,16,36,16,36,4,16,36,4,16,4,64,
1,0,1,4,16,36,64,9,1,16,36,9,4,1,4,1,0,36,49,36,1,4) .
Prin urmare
x= 4:77; s2= 8:663 7 ; 2=807
49= 16:469;
iar valoarea calculata a statisticii
2
2s2 1
=n 2
n2 1
=16:49
28:6637 1
=98
1002 1
= 4:9309:
Observ ¼am c ¼a pentru = 0:05, domeniul de acceptare a ipotezei despre car-
acterul aleator [ z1 =2; z1 =2] = [ 1:96;196]nu acoper ¼a valoarea calculat ¼a
4:6026:Prin urmare aceasta ipotez ¼a este respinsa,
ind acceptat ¼a ipoteza
c¼a zecimalele num ¼arului nu sunt întâmpl ¼atoare, chiar dac ¼a o analiz ¼a ex-
ploratorie a datelor sugereaz ¼a contrariul.
51
PARTEA 2. Pe de alt ¼a parte,suntem tenta¸ ti sa test ¼am dac ¼a, s¼a zicem,
n= 50 de numere generate de Generatorul de Numere Aleatoare (GNA) de
la adresa https://www.random.org/integers/ auun caracter aleator, aces-
tea
ind numere pe care le-am cerut sa
e uniform distribuite pe multimea
{0,1,..,9}:
(3,1,1,6,8,7,5,4,7,1,9,4,6,5,9,4,6,6,1,9,7,4,0,5,7,4,6,8,5,5,6,2,1,1,9,6,5,3,7,6,
6,7,3,5,1,3,4,2,6,4).
În baza lor gasim ca media de selectie x=4:8, iar dispersia de selec¸ tie
corectat ¼as2=5:959 2 :
E¸ santionul patratelor tuturor diferen¸ telor perechilor învecinate (xi+1
xi)2; i=1;49arat¼a astfel:
4,0,25,4,1,4,1,9,36,64,25,4,1,16,25,4,0,25,64,4,9,16,25,4,9,4,4,9,0,1,16,1,0,
64,9,1,4,16,1,0,1,16,4,4,4,1,4,16,4.
Prin urmare 2=1
n 1n 1X
i=1(xi+1 xi)2= 11:490, iar valoarea calculat¯ a a
statisticii noastre de referin¸ t ¼a,
2
2s2 1
=n 2
n2 1
=11:49
25:959 1
=23
252 1
= 0:974 31
nimere¸ ste în domeniul de acceptare [ 1:96;196] a ipotezei de baza cu
probabilitatea de încredere 0:95, ceea ce con
rm ¼a caracterul aleator al nu-
merelor generate cu ajutorul (GNA) de la adresa https://www.random.org/integers/.
8. Proiecte propuse.
Proiectul 1. Inteprinderea "Ionel" din Chisinau are nevoie ca, pen-
tru loturile de costume barbatesti destinate vânz ¼ariii pe piata interna, sa
formeze un program (plan) adecvat de fabricare a costumelor in functie de
inaltimea Xa barbatilor explrimata in centimetri, marimile
ind categorisite
pe intervalele: [150; 155), [155; 160), [160; 165), [165; 170), [170; 175), [175;
180), [180; 185), [185; 190), [190; 195), [195; 200]. Se stie, in acest caz doar
ca repartitia probabilista (modelul matematic) cea mai potrivita pentru v.a.
X-inaltimea unui barbat ales la intamplare este distribuita normal cu media
msi dispersia 2. Parametrii acestea
ind necunoscuti, în scopul a ¼arii lor,
52
prin sondaj, au fost masurate în ¼altimile a 100de barbati, potentiali cump ¼ar¼a-
tori ai costumelor produse de fabrica "Ionel" , alesi la intamplare din Rep.
Moldova. Rezultatele inregistrate sunt prezentate mai jos.
a) Sa se efectueze analiza exploratorie a acestor date.
b) Sa se scoata in evidenta cei mai buni estimatori pentru parametrii m
sisi sa justi
ce alegerea din p. de vedere a Analizei Inferentiale a datelor.
c) Sa se construiasca intervalele de incredere (con
denta) pentru msi
cuprobabilitatea de incredere 1 =0:95, adica cu pragul de semni
catie
=0:05:
d) Sa se formuleze ipotezele adecvate pentru
ecare parametru msiin
parte si sa se veri
ce aceste ipoteze cu probabilitatea erorii de speta 1 egala
0:05:
e) Distributia
ind validata, sa se alcatuiasca planul cerut de confec-
tionare.
167:52;173:17;165:14;169:77;165:98;173:94;165:05;168:56;
178:85;158:12;166:54;165:64;164:73;170:64;160:78;173:60;
169:38;164:63;163:60;173:55;173:06;176:15;165:17;160:41;
160:3;166:48;178:72;173:51;176:24;164:95;175:11;179:48;
162:28;171:62;173:19;175:43;166:78;159:15;184:45;165:79;
171:98;177:32;162:60;165:45;163:29;161:50;161:45;175:53;
175:04;175:29;169:20;172:37;174:49;176:79;185:01;176:05;
178:19;167:93;170:56;165:82;173:48;164:84;170:52;169:63;
159:65;175:62;160:07;163:40;168:88;171:08;167:93;181:47;
168:71;158:16;170:99;166:78;170:20;167:68;170:03;163:16;
169:49;174:8;160:44;167:88;174:24;166:48;176:54;171:01;
161:62;182:25;168:91;171:02;167:29;175:17;161:43;173:25;
181:35;166:95;178:30;167:07
Proiectul 2. Pentru estimarea cantit ¼a¸ tii zilnice Qde combustibil, solici-
tate unei
rme de aprovizionare cu combustibil auto,
rma în cauz ¼a folose¸ ste
formula Q=100 10p+E, unde p2[0;8].Ereprezdntând eroarea de es-
timare/prognozare a cantitatii Q, aceasta este o v.a. dat ¼a de d.d. f(x) =
I[ a;b](x),a; b > 0. Cantitatea Qsolicitata se masoar ¼a în mii de galoane,
iar pre¸ tul peste exprimat în dolari per galon. Firma caut ¼a raspunsuri la
urmatoarele intrebari: a)Cu ce este egal ¼a probabilitatea c ¼a va
solicitat ¼a o
cantitate de combustibil mai mare decât 70 000 de galoane, dac ¼a pre¸ tul este
egal cu 3$galonul? Dar pentru pre¸ tul de 4$per galon? b)Dac¼a ¸ stim costul
53
mediu variabil de furnizare a benzinei f ¼ar¼a plumb, c ¼a este dat de formula
C(Q)=pQ=2, ce v.a. poate
utilizat ¼a pentru a reprezenta pro
tul zilnic în
func¸ tie de pre¸ tul variabil p?c)Cu ce este egal ¼a probabilitatea c ¼a pro
tul
zilnic va
unul pozitiv dac ¼a pret¸ tul de vânzare este stabilit s ¼a
e 4$per
galon/ Dar daca pre¸ tul este egal cu 5$? Dar 3$?
Deoarece raspunsurile pot
a ate doar daca se stie valoarea adevarata
a parametrului a,
rma a inregistrat pe parcursul a doi ani de zile date
statistice ce vizeaza eroarea Ede prognozare, ca
ind diferenta dintre val-
oarea prognozata a cantitatii Qsi valoarea reala a cantitatii de combustibil
vandut ¼a in ziua data. Inainte de a purcede la rezolvarea pp. a)-c), in baza
celor 730de valori inregistrate se cere:
1. Sa se faca o analiza exploratorie a acestor date.
2. Sa se ia in calitate de estimatori punctuali ai parametrilor asib
estimatoriibasibbobtinuti prin Metoda Verosimilitatii Maxime.
3. Folosind criteriul Pearson ( 2) de concordanta, valida¸ ti ipoteza c ¼a v.a.
EU[ ba,bb], adica parametrii asib;ce de
nesc d.d. f(x);pot
considera¸ ti
ca
ind egali cu basibbrespectiv.
4:785 3 ;11:456;7:645 1 ; 15:494;8:480 1 ;7:069 9 ; 18:576;
7:836 0 ;9:860 8 ;12:644;3:126; 14:48;8:509 7 ; 5:310 0 ;
7:405 4 ; 4:504 0 ; 11:909; 15:959; 1:851 8 ; 14:453;15:0;
5:759 8 ; 1:832 9 ;15:065;1:336 1 ;7:283 1 ; 3:387 3 ; 1:537 7 ;
15:435;19:309;16:980; 12:870; 8:661 1 ; 1:895 2 ;19:111;
11:378; 16:856; 17:284;5:788 5 ;6:326 8 ; 17:119; 7:714 3 ;
0:247 43 ; 17:456;1:749 4 ; 4:574 0 ;0:903 84 ; 3:473 9 ;
7:534 510 3;10:906;18:805;2:627 6 ;5:057 3 ; 13:737;17:554;
5:750 9 ; 16:597; 5:115 2 ; 10:369; 19:126;7:359 7 ; 1:118 1 ;
4:599 3 ; 1:828 2 ; 17:677; 14:251; 4:245 4 ; 16:077;0:659 86 ;
3:291;19:557;10:302;0:231 59 ; 19:471; 12:126;11:327;
9:242 6 ; 8:798 7 ;2:033 4 ; 14:988;3:001 6 ; 3:022 2 ;2:122 3 ;
1:585 7 ; 4:616 6 ; 5:380 1 ; 15:542; 8:126 4 ;2:641 5 ; 18:143;
8:184 4 ;10:925;18:692;2:623 6 ;3:913;9:850 5 ; 18:387;1:092 2 ;
12:647;17:807;14:166; 4:149; 15:335; 6:460 2 ;4:126 3 ;
2:289 7 ; 19:266;9:108 1 ; 9:447 7 ; 16:583;15:266;8:572 9 ;
13:006; 5:041 4 ;0:550 37 ; 10:213;8:600 9 ;7:598 7 ;13:838;
19:949; 8:315 7 ;4:897; 2:959 7 ; 17:544;8:925 5 ;18:055;
12:834; 11:305;11:016; 2:712 5 ; 8:54; 8:964 9 ;9:492 9 ;
18:962; 1:281 1 ; 8:414 8 ;8:861 2 ;0:203 96 ; 0:207 06 ;11:597;
54
11:650;17:568; 11:629;10:234; 5:922 8 ; 11:765;7:693 3 ;
4:113 8 ; 14:174; 0:678 18 ; 0:157 84 ;18:874; 7:187 7 ;
12:909; 12:986;19:626; 17:966; 12:837; 13:462;
0:621 96 ;6:053 8 ; 11:947; 7:053 7 ; 19:434;19:372; 18:000;
12:686; 17:452;19:951; 10:214; 17:577;16:625; 12:357;
13:624; 10:408;17:249; 15:932;5:793 5 ; 9:054 4 ; 15:845;
8:666 4 ;16:920; 7:439 6 ;6:265 5 ;0:861 99 ; 4:102 6 ; 19:631;
6:368 7 ;19:506; 14:127;1:616; 2:328 8 ;10:913;0:662 79 ;
13:624; 2:320 7 ;2:938 3 ;15:849; 18:916;13:746;9:292 5 ;
18:963; 13:45; 11:211; 8:568 5 ;7:924 8 ;3:446 9 ;15:681;
7:893 4 ; 9:825 7 ; 6:012 8 ; 15:579;16:907;18:151; 14:216;
8:674;16:341; 3:114 9 ; 10:613;15:473;8:724 5 ;7:130 0 ;
11:354; 1:299 0 ;12:099; 18:716; 16:997;14:060;9:440 9 ;
19:812;10:222;18:982; 8:385 4 ;1:228 7 ; 2:799 6 ; 9:419 6 ;
14:119;10:275; 10:204; 7:39; 15:144; 0:829 05 ;11:155;
13:830;17:27;16:379; 8:239 5 ;4:546 7 ; 1:015 6 ;18:127;
12:399; 6:787 4 ; 8:658 0 ;8:916 5 ;3:268 7 ;4:509 6 ; 14:447;
11:541; 2:747 8 ; 9:371 9 ;10:991; 18:968;14:534;10:391;
17:841; 8:173 4 ; 3:155 0 ; 2:777 2 ; 8:362 9 ; 13:559;
16:194; 9:610 3 ;4:413 4 ; 12:195; 5:139 3 ;9:398 7 ; 6:721 9 ;
5:120 0 ;18:173;7:683 6 ;3:734 5 ;3:117 9 ; 6:771 0 ;13:826;
14:160;2:125;12:611;2:001 5 ; 9:721 8 ; 11:196;5:218 1 ;
10:132;17:381;11:467;12:572; 0:187 07 ;2:843 5 ;10:445;
7:097 3 ;14:399;7:072 3 ; 6:149 1 ; 15:127; 11:542;15:908;
5:846 4 ; 13:608;10:250;4:235 1 ;7:110 3 ; 11:86;17:576;
4:749 7 ; 15:430;12:632; 5:917 6 ; 10:133; 13:796; 17:887;
17:279; 6:944 4 ;18:493;18:601;1:023 1 ; 6:733 1 ; 4:752 9 ;
13:611;5:589 6 ;1:972 2 ;13:251;10:301; 5:927 4 ; 15:916;
16:762;5:866 7 ; 0:469 28 ; 17:013;17:043;5:494; 3:714 9 ;
0:462 24 ; 0:613 54 ;3:293 3 ; 1:253 3 ;3:913 8 ;6:983 2 ;11:675;
1:078 9 ; 19:049;5:544; 13:547; 3:47;5:061 1 ;17:598;
17:142;16:555; 14:351; 14:036;19:171;2:298 7 ; 1:564 6 ;
19:770;14:431; 3:156 1 ;0:405 68
Proiectul 3. O Companie de asigur ¼ari are asigurate 10000 de autotur-
isme, probabilitatea unei avarieri ce intr ¼a sub inciden¸ ta poli¸ tei de asigurare,
ind egal ¼a cu p=0:006. Fiecare proprietar de automobil asigurat pl ¼ate¸ ste
o poli¸ t ¼a de asigurare anual ¼a de 50de euro, primind, în caz de avariere o
55
sum¼a de 4000 de euro. S ¼a se calculeze probabilit ¼a¸ tile urm ¼atoarelor eveni-
mente: A=fla sfâr¸ sit de an Compania fa
în pierdere g,Bm=fla sfâr¸ sit de
an Compania va avea un pro
t de meurog,m=160000 ,240000 ,320000 .
Deoarece raspunsurile pot
a ate doar daca se stie valoarea adevarata
a parametrului p,
rma a foloseste datele statistice inregistrate de Politia
Rutiera, vizavi de avarierile pe parcursul anului a autoturismelor a ate in
evidenta Registrului Auto, alegând prin sondaj 1000 de autoturisme.
1. Sa se faca o analiza exploratorie a acestor date.
2. Sa se ia in calitate de estimator punctual al parametrului pestimatorul
bpobtinuti prin Metoda Verosimilitatii Maxime.
3. Construiti un interval de incredere pentru parametrul pcu probabili-
tatea de incredere 1 = 0:95(pragul de semni
catie = 0:05).
4. Veri
cati si validati ipoteza de baza H0:p=bpimpotriva ipotezei
alternative H1:p6=bp.
5. Rezolvati problema formulata, luînd p=bp.
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
56
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;1;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;1;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;
0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0
Problema 4. O banca, ce are printre serviciile sale ¸ si emiterea de car-
duri de credit, a diminuat dobânda anuala cu 1%. Datele înregistrate de
banc¼a pâna la mic¸ sorarea dobânzii arat ¼a c¼a suma medie datorat ¼a de catre
posesorii de carduri era egal ¼a cum0=576$. Pentru a studia efectul diminu ¼arii
dobânzii asupra parametrului m, banca a examinat, dup ¼a scurgerea a 6luni
de aplicare a dobânzii reduse, 36de conturil de carduri alese la întâmplare.
Datele rezultate (x1,x2…,x36);privind datoriile acumulate pe card de catre
posesori,
nd prezentate mai jos, se cere ca in baza lor sa se efectueze :
a) Analiza exploratorie a acestor date.
b) Considerând ca datoria acumulat ¼a pe un card ales la întâmplare, dupa
6luni de la reducerea dobânzii, este o v.a. XN(m; 2), construi¸ ti un
interval de încredere pentru parametrul m, luând în calitate de dispersie
2=s2, adic ¼a dispersia de selectie corectat ¼a.
c) Formulati ipotezele corespunz ¼atoare, daca interes prezinta raspunsul
la intrebarea: a avut sau nu reducerea dobanzii, drept efect, cresterea mediei
datorate pe card?
d) Calcula¸ ti p valoarea Testului corespunzator de veri
care a ipotezelor
si comentati rezultatul in functie de diverse valori ale pragului de semni
catie
2(0;1).
632:13;665:70;556:69;598:05;565:67;696:76;812:2;
57
690:75;723:89;597:60;504:9;741:73;766:83;583:71;
767:14;588:93;771:50;533:16;630:16;452:67;820:03;
713:01;620:43;557:87;544:3;695:3;474:38;532:59;
986:2;796:14;631:27;657:08;711:89;425:56;508:57;
672:22
Proiectul 5. A fost adoptat ¼a o nou ¼a lege care s ¼a ofere mai multe puteri
poli¸ tiene¸ sti în ceea ce prive¸ ste re¸ tinerea criminalilor suspecta¸ ti.
Pentru ¸ sapte cartiere, num ¼arul de infrac¸ tiuni raportate cu 1 an înainte ¸ si
1 an dup ¼a noua lege este prezentat în tabelul urm ¼ator:
Cartierul nr. 1 2 3 4 5 6 7
Pân¼a la noua lege 31 27 25 36 34 29 38
Dup¼a noua lege 19 30 10 20 28 29 19
Folosind un prag de semni
catie de = 0:05testa¸ ti veridicitatea a¸ step-
t¼arilor conform c ¼arora numarul de infrac¸ tiuni raportate a sc ¼azut dupa apli-
carea noii legi.
a) Formula¸ ti ipotezele de baz ¼a si alternativ ¼a.
b) Care va
statistica de referin¸ t ¼a?
c) Descrie¸ ti mul¸ timea critic ¼a în func¸ tie de pragul de semni
ca¸ tie.
d) Calcula¸ ti p valoarea Testului folosit ¸ si explica¸ ti semni
c ¼a ea în acest
context.
Proiectul 6. Comparatia generatorului de numere aleatoare de la
adresa https://www.random.org/integers/ cu zecimalele
numarului pe post de generator de numere aleatoare.
Cu ajutorul generatorilor de numere aleatoare de la adresa https://www.random.org/integers/
,genera¸ ti 100de valori ale unei v.a. Xuniform distribuite pe multimea de
valori f0,1,2, …, 9g. Pe de alta parte, luati in calitate de esantion de volum
100, primele 100de cifre zecimale dupa virgula a numarului , folosind datele
de la adresa https://www.piday.org/million/
a) Pentru
ecare set de date, efectuati o comparatie priliminara folosind
analiza exploratorie a datelor pentru
ecare set de date in parte.
b) Pentru
ecare set de date in parte, veri
cati ipoteza despre caracterul
aleator a datelor cu pragul de semni
catie = 0:05.
58
c) Pentru
care set in parte, pentru care ipoteza despre caracterul aleator
a fost acceptata, sa se veri
ce ipoteza ca acesta corespunde sau nu distributiei
uniforme pe multimea de valori f0,1,2, …, 9g, folosind pragul de semni
catie
= 0:05.
c) Sa se calculeze p valoarea.
Proiectul 7. Comparatia a doua metodici de predare.
Un profesor universitar a decis sa compare noua sa metodica de predare
versus metodicei sale anterioare. Pentru aceasta el a divizat studentii in doua
grupe. Grupei 1 i s-a aplicat metodica veche, iar grupei 2-metodica noua.
La sfarsitul procesului de predare toti studentii au fost supusi unui examen
amplu.
Grupa 1 enumera 49iar grupa 2 enumera 50de studenti. Rezultatele
nale al unuia si acelasi examen pentru
ecare grupa in parte sunt date mai
jos. In baza lor, sa veri
ce daca asteptarile profesorului, conform carora
media notelor la examen va
mai mare in cazul aplicarii metodicii noi,
sunt intemeiate din punct de vedere statistic. Sa se foloseasca un prag de
semni
ca¸ tie egal cu 0:05.
a) Sa formuleze ipotezele adecvate.
b) Sa se aplice criteriul corespunzator de testare a ipotezelor.
c) Sa se calculeze p-valoarea.
d) Sa se comenteze rezultatul.
Rezultatele examenului in Grupa 1:
9.27, 7.79, 6.66, 8.94, 7.42, 7.78, 1.07, 10.00, 8.17, 6.73, 7.74, 4.40, 10.00,
7.01, 8.89, 7.91,
8.40, 6.44, 6.71, 7.11, 6.71, 8.23, 5.96, 5.85, 9.18, 8.70, 7.54, 8.88, 7.09,
8.94, 7.80, 7.65,
7.21, 8.88, 6.24, 4.75, 5.55, 7.60, 7.37, 8.79, 5.29, 7.51, 7.26, 6.62, 10.00,
8.63, 7.05 , 5.31, 7.37
Rezultatele examenului in Grupa 1:
9.28, 8.39, 8.35, 8.08, 4.66, 6.57, 9.18, 8.27, 8.90, 7.15, 6.65, 8.14, 8.34,
9.94, 7.76, 6.44, 8.56,
8.25, 7.60, 8.62, 8.88, 8.06, 9.99, 6.10, 10.00, 8.36, 9.12, 6.68, 7.33, 7.49,
9.28, 8.85, 8.66,
7.83, 5.98, 8.85, 10.00, 8.83, 8.78, 9.93, 6.51, 9.00, 6.97, 5.90, 8.29, 7.08,
9.11, 9.61, 9.03, 8.56
59
BIBLIOGRAFIE
1. Iosifescu M., Mihoc Gh., Theodorescu R., Teoria probabilit ¼a¸ tilor si
statistica matematic ¼a,Ed. Tehnic ¼a, Bucure¸ sti, 1966.
4. Mittelhammer R. C., Mathematical statistics for economics and bussi-
ness, Ed. Springer-Verlag, N.-Y. Inc., 1996.
3. Andersen D. R., Sweeney D. J., Williams T.A., Statistics for bussiness
and economics (7-Ed), Cincinnati SouthWestern College Pub., N-Y., 1999.
4. Iliescu d. V., Vod ¼a V. Gh., Statistic ¼a ¸ si toleran¸ te, Ed. Tehnic ¼a,
Bucure¸ sti, 1977.
5.Probabilit ¼a¸ ti ¸ si Statistic ¼a, http://www.edumanager.ro/community/documente/probabilitati%20si%20statistica.pdf
6. Kobzari A.I., Statistica Matematica pentru ingineri si cercet ¼atori ¸ sti-
in¸ ti
ci, Ed. Fizmatlit, Moscova, 2006, 816 pp., l. rus ¼a.
60
ANEXA 1
Tabelul de valori a distribu¸ tiei normale standard:
(x) =1p
2xR
1e u2
2du
x.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
-3.9 .00005 .00005 .00004 .00004 .00004 .00004 .00004 .00004 .00003 .00003
-3.8 .00007 .00007 .00007 .00006 .00006 .00006 .00006 .00005 .00005 .00005
-3.7 .00011 .00010 .00010 .00010 .00009 .00009 .00008 .00008 .00008 .00008
-3.6 .00016 .00015 .00015 .00014 .00014 .00013 .00013 .00012 .00012 .00011
-3.5 .00023 .00022 .00022 .00021 .00020 .00019 .00019 .00018 .00017 .00017
-3.4 .00034 .00032 .00031 .00030 .00029 .00028 .00027 .00026 .00025 .00024
-3.3 .00048 .00047 .00045 .00043 .00042 .00040 .00039 .00038 .00036 .00035
-3.2 .00069 .00066 .00064 .00062 .00060 .00058 .00056 .00054 .00052 .00050
-3.1 .00097 .00094 .00090 .00087 .00084 .00082 .00079 .00076 .00074 .00071
-3.0 .00135 .00131 .00126 .00122 .00118 .00114 .00111 .00107 .00104 .00100
-2.9 .00187 .00181 .00175 .00169 .00164 .00159 .00154 .00149 .00144 .00139
-2.8 .00256 .00248 .00240 .00233 .00226 .00219 .00212 .00205 .00199 .00193
-2.7 .00347 .00336 .00326 .00317 .00307 .00298 .00289 .00280 .00272 .00264
-2.6 .00466 .00453 .00440 .00427 .00415 .00402 .00391 .00379 .00368 .00357
-2.5 .00621 .00604 .00587 .00570 .00554 .00539 .00523 .00508 .00494 .00480
-2.4 .00820 .00798 .00776 .00755 .00734 .00714 .00695 .00676 .00657 .00639
-2.3 .01072 .01044 .01017 .00990 .00964 .00939 .00914 .00889 .00866 .00842
-2.2 .01390 .01355 .01321 .01287 .01255 .01222 .01191 .01160 .01130 .01101
-2.1 .01786 .01743 .01700 .01659 .01618 .01578 .01539 .01500 .01463 .01426
-2.0 .02275 .02222 .02169 .02118 .02068 .02018 .01970 .01923 .01876 .01831
-1.9 .02872 .02807 .02743 .02680 .02619 .02559 .02500 .02442 .02385 .02330
-1.8 .03593 .03515 .03438 .03362 .03288 .03216 .03144 .03074 .03005 .02938
-1.7 .04457 .04363 .04272 .04182 .04093 .04006 .03920 .03836 .03754 .03673
-1.6 .05480 .05370 .05262 .05155 .05050 .04947 .04846 .04746 .04648 .04551
-1.5 .06681 .06552 .06426 .06301 .06178 .06057 .05938 .05821 .05705 .05592
-1.4 .08076 .07927 .07780 .07636 .07493 .07353 .07215 .07078 .06944 .06811
-1.3 .09680 .09510 .09342 .09176 .09012 .08851 .08691 .08534 .08379 .08226
-1.2 .11507 .11314 .11123 .10935 .10749 .10565 .10383 .10204 .10027 .09853
-1.1 .13567 .13350 .13136 .12924 .12714 .12507 .12302 .12100 .11900 .11702
-1.0 .15866 .15625 .15386 .15151 .14917 .14686 .14457 .14231 .14007 .13786
-0.9 .18406 .18141 .17879 .17619 .17361 .17106 .16853 .16602 .16354 .16109
-0.8 .21186 .20897 .20611 .20327 .20045 .19766 .19489 .19215 .18943 .18673
61
-0.7 .24196 .23885 .23576 .23270 .22965 .22663 .22363 .22065 .21770 .21476
-0.6 .27425 .27093 .26763 .26435 .26109 .25785 .25463 .25143 .24825 .24510
-0.5 .30854 .30503 .30153 .29806 .29460 .29116 .28774 .28434 .28096 .27760
-0.4 .34458 .34090 .33724 .33360 .32997 .32636 .32276 .31918 .31561 .31207
-0.3 .38209 .37828 .37448 .37070 .36693 .36317 .35942 .35569 .35197 .34827
-0.2 .42074 .41683 .41294 .40905 .40517 .40129 .39743 .39358 .38974 .38591
-0.1 .46017 .45620 .45224 .44828 .44433 .44038 .43644 .43251 .42858 .42465
-0.0 .50000 .49601 .49202 .48803 .48405 .48006 .47608 .47210 .46812 .46414
0.0 .50000 .50399 .50798 .51197 .51595 .51994 .52392 .52790 .53188 .53586
0.1 .53983 .54380 .54776 .55172 .55567 .55962 .56356 .56749 .57142 .57535
0.2 .57926 .58317 .58706 .59095 .59483 .59871 .60257 .60642 .61026 .61409
0.3 .61791 .62172 .62552 .62930 .63307 .63683 .64058 .64431 .64803 .65173
0.4 .65542 .65910 .66276 .66640 .67003 .67364 .67724 .68082 .68439 .68793
0.5 .69146 .69497 .69847 .70194 .70540 .70884 .71226 .71566 .71904 .72240
0.6 .72575 .72907 .73237 .73565 .73891 .74215 .74537 .74857 .75175 .75490
0.7 .75804 .76115 .76424 .76730 .77035 .77337 .77637 .77935 .78230 .78524
0.8 .78814 .79103 .79389 .79673 .79955 .80234 .80511 .80785 .81057 .81327
0.9 .81594 .81859 .82121 .82381 .82639 .82894 .83147 .83398 .83646 .83891
1.0 .84134 .84375 .84614 .84849 .85083 .85314 .85543 .85769 .85993 .86214
1.1 .86433 .86650 .86864 .87076 .87286 .87493 .87698 .87900 .88100 .88298
1.2 .88493 .88686 .88877 .89065 .89251 .89435 .89617 .89796 .89973 .90147
1.3 .90320 .90490 .90658 .90824 .90988 .91149 .91309 .91466 .91621 .91774
1.4 .91924 .92073 .92220 .92364 .92507 .92647 .92785 .92922 .93056 .93189
1.5 .93319 .93448 .93574 .93699 .93822 .93943 .94062 .94179 .94295 .94408
1.6 .94520 .94630 .94738 .94845 .94950 .95053 .95154 .95254 .95352 .95449
1.7 .95543 .95637 .95728 .95818 .95907 .95994 .96080 .96164 .96246 .96327
1.8 .96407 .96485 .96562 .96638 .96712 .96784 .96856 .96926 .96995 .97062
1.9 .97128 .97193 .97257 .97320 .97381 .97441 .97500 .97558 .97615 .97670
2.0 .97725 .97778 .97831 .97882 .97932 .97982 .98030 .98077 .98124 .98169
2.1 .98214 .98257 .98300 .98341 .98382 .98422 .98461 .98500 .98537 .98574
2.2 .98610 .98645 .98679 .98713 .98745 .98778 .98809 .98840 .98870 .98899
2.3 .98928 .98956 .98983 .99010 .99036 .99061 .99086 .99111 .99134 .99158
2.4 .99180 .99202 .99224 .99245 .99266 .99286 .99305 .99324 .99343 .99361
2.5 .99379 .99396 .99413 .99430 .99446 .99461 .99477 .99492 .99506 .99520
2.6 .99534 .99547 .99560 .99573 .99585 .99598 .99609 .99621 .99632 .99643
2.7 .99653 .99664 .99674 .99683 .99693 .99702 .99711 .99720 .99728 .99736
2.8 .99744 .99752 .99760 .99767 .99774 .99781 .99788 .99795 .99801 .99807
2.9 .99813 .99819 .99825 .99831 .99836 .99841 .99846 .99851 .99856 .99861
62
3.0 .99865 .99869 .99874 .99878 .99882 .99886 .99889 .99893 .99896 .99900
3.1 .99903 .99906 .99910 .99913 .99916 .99918 .99921 .99924 .99926 .99929
3.2 .99931 .99934 .99936 .99938 .99940 .99942 .99944 .99946 .99948 .99950
3.3 .99952 .99953 .99955 .99957 .99958 .99960 .99961 .99962 .99964 .99965
3.4 .99966 .99968 .99969 .99970 .99971 .99972 .99973 .99974 .99975 .99976
3.5 .99977 .99978 .99978 .99979 .99980 .99981 .99981 .99982 .99983 .99983
3.6 .99984 .99985 .99985 .99986 .99986 .99987 .99987 .99988 .99988 .99989
3.7 .99989 .99990 .99990 .99990 .99991 .99991 .99992 .99992 .99992 .99992
3.8 .99993 .99993 .99993 .99994 .99994 .99994 .99994 .99995 .99995 .99995
3.9 .99995 .99995 .99996 .99996 .99996 .99996 .99996 .99996 .99997 .99997
63
ANEXA 2
Tabelul de valori ale t1 -cuantilelor pentru care v.a. T(n)Student
distribuit ¼a cu ngrade de libertate are probabilitatea
P(T(n)t1 )=1 ; 2(0;1):
n t 0:9 t0:95 t0:975 t0:990 t0:999
64
ANEXA 3
Tabel pentru cuantilele uzuale Q(),2(0;1)ale v.a. 2()distribuite
Hi-p¼atrat cu grade de libertate:
P(2()Q(; )) =, unde pentru 40quantilele Q(; )Q(;40)
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Alexei Leahu, Ion Pâr tachi [604573] (ID: 604573)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
