Expunerea Riguroasa a Metodelor Statistice

După Yule și Kendall, statistica este definită ca fiind “expunerea riguroasă a metodelor statistice”. După aceiași autori, metodele statistice sunt definite ca proceduri adoptate pentru studiul datelor statistice. Datele statistice se prezintă sub forma unor șiruri de observații privind mărimea diferitelor variabile sau caracteristici analizate.

CAPITOLUL 1

DISTRIBUȚII DE FRECVENȚE

Statistica operează cu grupuri și foarte des cu grupuri mari de observații. Observațiile se găsesc într-o mare varietate de forme. Ele pot fi de natură cantitativă (temperatura zilnică, înălțimea indivizilor etc.) sau de natură calitativă (culoarea ochilor, oameni politici favoriți etc.). Indiferent de natura sau originea lor, datele trebuie să fie organizate sau sintetizate în așa fel încât să li se discearnă sensul sau semnificația. O modalitate de a realiza acest lucru constă în construirea distribuției de frecvențe. O distribuție de frecvențe evidențiază valorile unei mulțimi de date statistice asociate cu frecvențele de apariție ale acestora.

1.1 DISTRIBUȚII DE FRECVENȚE PENTRU VARIABILE CANTITATIVE

Să presupunem că în urma susținerii examenului de psihologie generală de către un număr de 30 de studenți, profesorul titular dorește să știe cum au aprofundat studenții materia predată. Cum s-au prezentat studenții în general? În ce interval de grupare sunt cuprinse cele mai multe note? Câți studenți nu au trecut examenul? Să admitem că scorul unui student este de 75. Cum putem compara acest scor cu scorurile realizate de ceilalți colegi? La aceste întrebări se poate răspunde cu dificultate dacă datele nu sunt prelucrate în prealabil.

Să presupunem că rezultatele obținute la examen de către studenți sunt cele prezentate în tabelul de mai jos.

Scorurile obținute de studenți la examenul de psihologie generală

Cea mai simplă cale de a vedea ce spun datele statistice constă în ordonarea scorurilor. Se poate începe prin identificarea celui mai mare și a celui mai mic scor, identificare urmată de ordonarea descrescătoare a tuturor scorurilor posibile, incluzând extremele. Fiecărui scor i se poate atașa frecvența de apariție corespunzătoare, rezultând următoarea distribuție de frecvențe a scorurilor.

Distribuția de frecvențe a scorurilor

Odată ce datele statistice au fost organizate în acest mod, pot fi făcute o serie de observații interesante. Analizând datele statistice se constată că deși amplitudinea scorurilor este de 80 (), totuși cea mai mare parte a scorurilor se înregistrează în intervalul (45-90) cu un vârf la scorul de 60. De asemenea se remarcă scorul maxim obținut de un student care se detașează de celelalte scoruri și zece studenți care nu au trecut baremul de promovare a examenului (50). În ce privește scorul de 75 obținut de către un student, el este superior scorului la „modă” (=60), nouă studenți obținând scoruri mai mari.

1.2 SCORURI GRUPATE

Distribuția de frecvențe rezultată mai sus este o distribuție de frecvențe a datelor ne-grupate. Când seriile de date sunt foarte lungi, interpretarea informațiilor chiar în serii cu distribuție de frecvențe după modelul de mai sus rămâne dificilă. O modalitate de a sintetiza și mai mult conținutul informațional al unei serii de date statistice constă în gruparea scorurilor pe grupe de scoruri. Mărimea intervalelor de grupare se poate calcula, din relația:

cu n reprezentând numărul intervalelor de grupare.

Pentru un număr de 4 intervale de grupare (n=4) Mig-ul pentru seria scorurilor obținute la examenul de psihologie generală este egal cu (100-20)/4=20 iar pentru n=8, Mig=10.

Scorurile convertite în distribuții de frecvențe pentru Mig=20 și Mig=10

Când se recurge la gruparea datelor după modelul prezentat mai sus se pierd anumite informații. De exemplu, în distribuția A nu avem idee unde se plasează scorul de 70 și cel de 65 în intervalul (80-60]. Ar putea fi foarte bine plasate în zona superioară după cum la fel de bine ar putea fi plasate în zona inferioară. Singurul mod în care am putea afla aceste informații este să ne întoarcem la distribuția de frecvențe a datelor ne-grupate. În al doilea rând, dintr-o mulțime de scoruri individuale nu rezultă neapărat o singură mulțime de scoruri grupate. Așa cum se constată și din tabelul de mai sus, sunt prezentate două mulțimi de scoruri grupate care au rezultat din aceeași mulțime de date ne-grupate.

1.3 REGULILE DE FORMARE ALE INTERVALELOR DE GRUPARE

Dacă o mulțime de scoruri individuale poate fi grupată în mai multe moduri, cum se poate decide asupra unui anumit mod? Din fericire există convenții larg acceptate pentru organizarea și sintetizarea datelor statistice cu scopul de a fi mai bine înțelese. Acestea sunt:

toate intervalele de grupare trebuie să aibă aceeași lungime;

intervalele trebuie să fie continue;

intervalul conținând cel mai mare scor trebuie să fie plasat la începutul distribuției;

este de dorit ca într-o distribuție de frecvențe să existe între 10 și 20 de intervale;

limitele intervalelor trebuie să fie multiplii ai lungimii intervalelor.

1.4 DISTRIBUȚII DE FRECVENȚE RELATIVE

În urma unei campanii de sensibilizare a populației în legătură cu donarea de sânge în spitale, pe parcursul unei săptămâni s-au prezentat la serviciile specializate 200 de persoane. Reprezintă numărul de donatori înregistrați un procent apreciabil care să ne permită să emitem ipoteze cu privire la sensibilitatea populației vis-a-vis de inițiativa de ajutorare a persoanelor cu probleme de sănătate? În măsura în care campania de sensibilizare a fost ascultată de toți membrii unei comunități în număr de 2000 de persoane, atunci disponibilitatea populației față de donarea de sânge poate fi apreciată la 10%, ceea ce constituie un procent apreciabil. Dacă însă campania a fost ascultată de un număr de 2000000 de persoane, atunci atitudinea populației poate fi catalogată ca “una slabă”. Pentru multe scopuri, cea mai relevantă întrebare este „cât de mult?”, în timp ce pentru altele este „ce procent?”, sau „ce proporție?”.

Frecvențele absolute ale intervalelor de grupare dintr-o distribuție de frecvențe pot fi ușor transformate în frecvențe relative prin convertirea frecvențelor absolute în proporții sau procente.

O distribuție de frecvențe relative arată scorurile și proporțiile sau procentele pe care aceste scoruri le reprezintă în ansamblul distribuției scorurilor. Pentru a obține proporția fiecărui interval de grupare, se împarte frecvența intervalului la numărul total de cazuri (f/n). Procentele se obțin, multiplicând proporțiile obținute cu 100. În tabelul de mai jos este prezentată distribuția de frecvențe relative (distribuția A), folosind datele exemplului prezentat în paragraful 1.2.

Distribuția de frecvențe relative (A)

Analizând datele din tabel, se constată că aproximativ 2/3 din studenții analizați au obținut scoruri cuprinse între 60 și 100 iar aproape un sfert, între 20 și 40.

De regulă, frecvențele relative sunt folosite pentru compararea a două sau mai multe distribuții de frecvențe de mărimi diferite.

Să presupunem că un profesor ține zilnic două cursuri, unul dimineața iar celălalt seara. Numărul de cursanți care frecventează cursul de dimineață este de 40, în timp ce cursul seral este frecventat de 20. Rezultatele obținute la examenul de evaluare pentru cele două grupuri de studenți sunt prezentate mai jos.

Distribuțiile de frecvențe relative asociate scorurilor obținute de cele două grupuri de studenți

Așa cum se poate observa, compararea frecvențelor nu este deloc simplă. Însă transformarea frecvențelor absolute în frecvențe relative face ambele distribuții comparabile.

1.5 DISTRIBUȚIA FRECVENȚELOR PROCENTUALE CUMULATE

Deseori este folositor să se știe procentul cazurilor care se plasează sub un anumit scor înregistrat într-o distribuție. De exemplu, care este procentul studenților care obțin scoruri mai mici de 80? Sau care este procentul bărbaților în vârstă de 40 de ani care au o înălțime mai mică de 180 cm.? La întrebările de acest gen se poate răspunde cel mai ușor atunci când se dispune de distribuții de frecvențe procentuale cumulate. O asemenea distribuție prezintă procentele cazurilor care se plasează sub limita maximă a fiecărui interval de grupare (exceptând limita maximă a primului interval).

Procentele și frecvențele cumulate pentru o serie cu distribuție de frecvențe

Pașii necesari pentru construirea distribuției frecvențelor procentuale cumulate sunt:

construirea distribuției de frecvențe pentru datele grupate în intervale de grupare;

calculul frecvențelor cumulate;

transformarea frecvențelor cumulate în procente cumulate.

Procentele cumulate indică numărul de cazuri care înregistrează scoruri mai mici decât limita superioară a intervalelor de grupare. Din tabelul prezentat mai sus rezultă că 95% din studenți au obținut scoruri mai mici de 90 iar 62,5% au obținut scoruri mai mici de 70. De asemenea procentele cumulate se dovedesc utile în comparații, atunci când se pune problema analizării criteriilor de grupare a scorurilor în intervale de grupare. Din tabelul referitor la distribuția de frecvențe relative (A), rezultă că 70% din studenți au obținut scoruri mai mici de 80 în timp ce din tabelul de mai sus, 87,5% din studenți au obținut punctaje inferioare celui menționat. Punctajul mediu realizat de studenți (66,25) se află plasat undeva în intervalul (70-60].

1.6 SCORURILE ȘI RANGURILE PERCENTILE

Scorurile și rangurile percentile sunt larg utilizate în evaluări psihologice și educaționale pentru a relata poziția unei performanțe individuale în cadrul unui grup de performanțe. Un rang percentil este procentul de cazuri care înregistrează un scor inferior scorului dat. Dacă într-o distribuție, 60% din cazuri obțin scoruri inferioare lui 32 atunci rangul percentil al acestui scor este de 60. În contrast cu rangul percentil, scorul percentil este scorul sub care se plasează un anumit număr de cazuri. Prin urmare scorul percentil de 32 este scorul pentru care 60% din studenți obțin un scor mai mic decât acesta. Notația atribuită este următoarea: unde este procentul cazurilor care înregistrează scoruri inferioare unui anumit scor. De exemplu, scorul percentil al lui 32 se notează . Dacă datele statistice sunt prezentate sub forma unei distribuții ca cea de mai sus, atunci nu este posibil să determinăm direct scorurile și rangurile percentile. De exemplu rangul percentil al unui scor de 62 se află plasat undeva între 25 și 62,5. Pentru această situație, determinarea rangului percentil trebuie să urmeze o procedură de interpolare, pornind de la presupunerea că frecvențele în interiorul fiecărui interval de grupare sunt distribuite uniform.

1.7 DISTRIBUȚII DE FRECVENȚE PENTRU VARIABILE CALITATIVE

Distribuțiile de frecvențe pot fi construite și pentru variabile calitative. Să presupunem că dorim să aflăm preferința unui număr de 20 de subiecți pentru aprofundarea psihologiei cognitive. Se poate începe prin chestionarea fiecărui subiect, înregistrând o singură preferință. Preferințele exprimate sunt: aprofundarea studiului teoretic, prezentarea de cercetări recente și studiu practic.

Distribuția de frecvențe pentru variabila calitativă

“Preferința de aprofundare a psihologiei cognitive”

Preferința pentru aprofundarea studiului este o variabilă calitativă (nominală), cele trei preferințe înregistrate, diferind prin gen și nu prin cantitate.

De regulă, reprezentarea unei distribuții de frecvențe pentru o variabilă nominală presupune parcurgerea următorilor pași:

listarea tuturor categoriilor înregistrate pentru o variabilă;

înregistrarea frecvențelor asociate fiecărei categorii și, dacă se dorește, înregistrarea procentelor corespunzătoare.

Este potrivit să folosim frecvențele și procentele cumulate pentru o astfel de distribuție? Categoric nu, pentru că este un non-sens să vorbim despre un student care se situează sub aprofundare de studiu teoretic sau sub orice altă categorie a oricărei variabile calitative. Procedura de cumulare pornește de la ideea unui continuum de scoruri.

CAPITOLUL 2

REPREZENTĂRI GRAFICE

Reprezentarea seriilor cu distribuție de frecvențe în tabele statistice de genul celor prezentate în capitolul anterior relevă mai clar natura și sensul informațiilor statistice comparativ cu reprezentarea tabelară a seriilor statistice simple. Surprinderea esențialului este însă mult ușurată dacă se recurge la reprezentări grafice. Deși se bazează pe informații tabelate, întotdeauna un grafic va releva “viul” dintr-o mulțime de cifre ceea ce un tabel, cel mult poate oferi o idee sau o sugestie legată de aceasta.

Există multe tipuri de grafice. În acest capitol ne vom opri asupra graficelor cu bare folosite la reprezentările datelor calitative, continuând cu histograma și poligonul frecvențelor utilizate la reprezentările datelor cantitative.

2.1 REPREZENTAREA DATELOR CALITATIVE; GRAFICUL CU BARE

În cazul graficelor cu bare, categoriile variabilei sunt prezentate pe axa orizontală iar frecvențele pe care acestea le înregistrează, pe axa verticală.

Să presupunem ca în urma unui sondaj realizat pe 100 de subiecți nevrotici au fost înregistrate următoarele preferințe pentru:

consum de alcool …..20 de subiecți;

consum de țigări ……50 de subiecți;

consum de droguri …30 de subiecți.

Graficul corespunzător este cel prezentat mai jos.

Fig. 2.1 Preferințele subiecților nevrotici.

2.2 REPREZENTAREA DATELOR CANTITATIVE

HISTOGRAMA

Histograma se construiește utilizând o serie de bare, de aceleași lățimi, fiecare bară reprezentând frecvența asociată intervalului corespunzător. Ca și în cazul graficelor prin bare, frecvențele absolute sau relative se reprezintă pe axa verticală. Însă spre deosebire de graficele prin bare, barele unei histograme sunt continue. Valorile dispuse pe axa orizontală sunt ordonate de la stânga la dreapta și de la cea mai mică valoare până la cea mai mare.

Cu titlu de exemplu, prezentăm scorurile ipotetice înregistrate la un test psihologic, scoruri dispuse în distribuția de frecvențe de mai jos.

SCORURILE ÎNREGISTRATE LA UN TEST PSIHOLOGIC

Fig. 2.2 Histograma scorurilor înregistrate la testul psihologic.

Se observă cu ușurință atât din reprezentarea tabelară cât și din reprezentarea grafică, frecvența cea mai mare care se înregistrează în intervalul 75-79.

POLIGONUL FRECVENȚELOR

Reprezentarea grafică a unei distribuții de frecvențe se poate realiza de asemenea, folosind poligonul frecvențelor. Tehnica de reprezentare este asemănătoare cu cea folosită la histograme. Sunt totuși câteva deosebiri de esență. Pe axa absciselor se reprezintă centrele de interval iar pe ordonată frecvențele. Punctele rezultate se unesc printr-o linie dreaptă. Pentru datele din tabelul anterior, poligonul frecvențelor este cel reprezentat în figura 2.3.

Fig. 2.3 Poligonul frecvențelor pentru scorurile înregistrate la testul psihologic.

Comparând figurile 2.2 și 2.3 se constată că reprezentarea prin poligonul frecvențelor este mai netedă decât în cazul histogramei. Acest fapt se datorează eliminării colțurilor histogramei. Consecința directă și imediată este că poligonul frecvențelor este mai apropiat de forma unei distribuții comparativ cu histograma.

2.3 COMPARAREA DISTRIBUȚIILOR

Compararea a două sau mai multe distribuții de frecvențe poate fi făcută mai ușor, recurgând la metodele grafice și în particular la poligonul frecvențelor. Când distribuțiile sunt de mărimi inegale, compararea se poate realiza cu ușurință dacă se utilizează frecvențele relative.

2.4 FRECVENȚELE RELATIVE

În cazul histogramelor și poligoanelor de frecvențe, înălțimea graficelor depinde de frecvențele înregistrate. În acest subcapitol vom vedea că zonele plasate sub grafic reprezintă de asemenea frecvențe. Pentru a ilustra relația “zonă-frecvență” să considerăm următoarea distribuție:

Aria fiecărei bare din histograma distribuției este egală cu frecvența înmulțită cu lățimea fiecărei bare (folosind datele exemplului prezentat considerăm lățimea barelor egală cu 4). Calculele sunt prezentate în tabelul de mai jos:

Fig. 2.4 Histograma distribuției de frecvențe

Comparând valorile obținute în ultima coloană din tabelul de mai sus cu cele obținute în ultima coloană din tabelul anterior constatăm că sunt identice! Cu alte cuvinte, proporția ariei fiecărei bare este egală cu proporția scorurilor cuprinse între limitele asociate.

Ceea ce este adevărat pentru o histogramă rămâne adevărat și pentru o curbă netedă de frecvențe. Explicația este aceea că zona delimitată de orice curbă netedă și axa absciselor poate fi aproximată printr-o histogramă cu bare foarte înguste. Concluzia care rezultă este că proporția zonei delimitate de o curbă de frecvențe și două scoruri plasate pe axa absciselor este egală cu frecvența relativă a cazurilor care înregistrează scoruri cuprinse între cele două limite (de scoruri).

2.5 CARACTERISTICILE DISTRIBUȚIILOR DE FRECVENȚE

Distribuțiile de frecvențe cuprind o serie de caracteristici importante, ușor de observat din grafice.

TENDINȚA CENTRALĂ

Unde este localizat pe scala scorurilor centrul unei distribuții? În jurul cărui scor se grupează majoritatea scorurilor? Ambele întrebări vizează caracteristica “tendința centrală”. În figura 2.5 sunt prezentate două distribuții care diferă în raport cu tendința centrală.

Fig. 2.5 Distribuții care diferă în raport cu tendința centrală.

VARIABILITATEA

Sunt scorurile grupate strâns în jurul unui scor central sau acestea se distribuie pe o zonă mai largă de-a lungul axei orizontale? Întrebarea are în vedere variabilitatea scorurilor. În fig. 2.6 se prezintă două distribuții care diferă prin variabilitate.

Fig. 2.6 Distribuții care diferă în raport cu variabilitatea.

FORMA

Ce se înțelege prin forma unei distribuții? Scorurile se distribuie uniform în jurul tendinței centrale sau într-o altă manieră? În figura 2.7 sunt prezentate câteva distribuții care diferă prin formă.

Fig. 2.7 Distribuții care diferă prin formă.

DISTRIBUȚIA NORMALĂ

Curba normală (fig. 2.7 a), respectând cu strictețe toate detaliile ei este întâlnită la un număr extrem de limitat de variabile. Majoritatea variabilelor nu urmează caracteristicile curbei normale dar se apropie semnificativ de acestea. Distribuția normală are o mare importanță în statistica inferențială.

DISTRIBUȚIA BIMODALĂ

O distribuție bimodală (fig.2.7 b) poate fi construită din două distribuții normale, ușor diferite, pe aceeași scală. Cele două “cocoașe” ale distribuției indică două locații ale tendinței centrale ceea ce sugerează faptul că dispunem de două grupuri distincte în mulțimea de observații.

DISTRIBUȚII ASIMETRICE

Cele două tipuri de distribuții asimetrice (cu asimetrie negativă și pozitivă) sunt reprezentate în figurile 2.7 c) și d).

DISTRIBUȚIA J

Distribuția J (fig. 2.7 e) prezintă o formă extremă de asimetrie negativă. Așa cum se prezintă distribuția, cele mai multe scoruri se distribuie în zona scorurilor mari. Un exemplu de variabilă care urmează distribuția J este volumul de cunoștințe acumulate de studenți la o anumită disciplină. Evident, vom întâlni și excepții nefericite dar cea mai mare parte a studenților vor tinde să asimileze cât mai multe cunoștințe. În practică se întâlnesc și forme inverse ale distribuției J, unde scorurile tind să se distribuie în zona celor mici. Un exemplu de variabilă este rapiditatea reacției la un stimul (scoruri exprimate în unități de timp).

DISTRIBUȚIA RECTANGULARĂ

Într-o distribuție rectangulară (fig.2.7 f) fiecare scor are frecvența 1. În practică se întâlnesc foarte rar variabile care să prezinte o asemenea de distribuție.

CAPITOLUL 3

TENDINȚA CENTRALĂ

Unde localizăm centrul unei distribuții pe o scală de scoruri? În jurul cărui scor se distribuie celelalte scoruri? Răspunsul la ambele întrebări necesită utilizarea conceptului de tendință centrală.

De regulă când se compară două distribuții se au în vedere aspecte legate de tendința centrală, evaluabilă prin măsuri specifice.

Media este unul din cele mai utilizate concepte în statistică. Cu toate acestea, media este un termen imprecis pentru măsura tendinței centrale după cum vom vedea în continuare. În acest capitol prezentăm trei măsuri frecvent utilizate în caracterizarea tendinței centrale; modulul, mediana și media aritmetică. Este important să se înțeleagă proprietățile lor, diferențele dintre acestea și felul în care diferențele angajează interpretări specifice.

3.1 MODULUL

Cea mai simplă măsură a tendinței centrale este modulul. Modulul (MO) este scorul cu frecvența cea mai mare. Din tabelul de mai jos rezultă că cel mai la modă scor este 8 cu 12 apariții.

Scoruri obținute de studenți la examenul de statistică

Datorită simplității sale matematice, modulul este folosit rar în proceduri statistice pretențioase. Totuși, poate fi utilizat cu succes ca descriptor. Mai mult, modulul este o măsură apropiată tendinței centrale pentru variabile calitative, nominale.

3.2 MEDIANA

Scorul median este scorul central (ca poziție) când scorurile sunt ordonate în raport cu mărimea lor. O consecință directă a acestei definiții este faptul că numărul scorurilor mai mici decât scorul median este egal cu numărul scorurilor mai mari decât scorul median. Cu alte cuvinte, mediana împarte seria de observații în două părți egale.

Exemple:

Pentru seria ordonată de observații 9, 10, 11, 12, 13, 14, 15 scorul central este 12, trei scoruri fiind mai mici decât 12 și trei mai mari.

Dacă seria de observații este formată dintr-un număr par de observații, scorul median este egal cu media celor două scoruri centrale. Pentru seria de observații 14, 15, 17, 19, 20, 21 scorurile centrale sunt 17 și 19 și prin urmare scorul median este egal cu 18. Un caz particular este acela în care seria conține două valori centrale egale. Mediana este egală cu valorile centrale. De exemplu în seria 4, 8, 12, 12, 16, 20 mediana este egală cu 12.

Așa cum se poate constata, uneori mediana corespunde unui scor real (din seria de observații) iar alteori nu. Însă acest lucru nu contează atâta timp cât mediana divide seria de observații în două părți egale.

Mediana prezintă o proprietate importantă care o transformă într-o măsură atractivă în descrierea tendinței centrale. Întrucât este definită ca scor central, mediana permite calcularea numărului de scoruri inferioare și superioare acesteia. Ea nu este afectată de scorurile extreme. Cu titlu de exemplu, dacă în seria 9, 10, 11, 12, 13, 14, 15, primul termen se schimbă cu 1, mediana rămâne neschimbată (12). Mediana ca scor rămâne neschimbată atâta timp cât scorul (scorurile centrale) nu se schimbă. Neafectarea medianei de către scorurile extreme constituie un avantaj mai ales atunci când se dorește descrierea tendinței centrale a unei distribuții asimetrice.

De asemenea, folosind definiția, rezultă că mediana este punctul care împarte curba de frecvențe în două regiuni (zone) egale.

Totodată mediana este o măsură apropiată a tendinței centrale dacă scala de măsură a variabilei este cel puțin una ordinală.

3.3 MEDIA ARITMETICĂ

De obicei cuvântul “medie” este asociat cu media aritmetică. Din nefericire, oamenii folosesc deseori cuvântul “medie” cu adresă directă la orice măsură a tendinței centrale în ciuda profundelor diferențe existente în definițiile măsurilor specifice acesteia.

Media aritmetică este suma tuturor scorurilor înregistrate, împărțită la numărul de scoruri. Relația de calcul este:

Exemplu:

Fie seria scorurilor X: 8, 10, 20, 25, 30. Media este egală cu .

Media poate fi interpretată ca “punct de echilibru” al unei distribuții. Orice schimbare intervenită în termenii seriei de scoruri afectează media aritmetică. Din această proprietate rezultă următorul principiu important:

SUMA ABATERILOR SCORURILOR DE LA MEDIE ESTE ÎNTOTDEAUNA EGALĂ CU ZERO ().

În mod categoric este lipsit de sens să se calculeze media aritmetică a unei variabile nominale. Excepție de la acestă afirmație face calculul mediei unei variabile dihotomice.

MEDII COMBINATE

Există situații când dispunând de mediile unor serii distincte de observații se cere calculul mediei generale. Presupunem că avem două serii de date, având mediile și . Se poate spune că media combinată este Sau, altfel spus se poate calcula media celor două medii? Da, dar numai în situația în care volumul de observații al celor două serii este același (n1=n2). Ce se întâmplă când ? În acest caz, media combinată se calculează utilizând relația:

Folosind datele exemplului cu și , media este egală cu

3.4 TENDINȚA CENTRALĂ ȘI DISTRIBUȚIA SIMETRICĂ

Având în vedere definițiile celor trei măsuri ale tendinței centrale este de așteptat ca într-o distribuție, valorile lor să difere. În cazul distribuției perfect simetrice valorile mediei, medianei și modulului coincid, fapt care nu mai este întâlnit în cazul distribuției simetrice bimodale unde, deși media și mediana sunt egale, ele sunt flancate de cele două moduri. Dacă cele trei măsuri nu sunt egale, atunci distribuția rezultată este una asimetrică.

Ca mărime a tendinței centrale, folosirea predominantă a mediei aritmetice este solicitată de următoarele proprietăți:

– Maleabilitatea matematică. Media aritmetică prezintă proprietăți care facilitează manipularea aritmetică și algebrică în moduri nepermise în cazul medianei și modulului. Consecința este faptul că media aritmetică este mai accesibilă procedurilor și formulelor statistice utilizate.

– Stabilitatea selecției. Presupunând că au fost colectate scorurile la testarea a cinci grupuri diferite de subiecți selectate aleator, este posibil să găsim diferențe minore între cele cinci medii, diferențe mai mari între mediane și ceva mai mari între module. Prin urmare cea mai stabilă măsură din cele trei evaluate este media aritmetică iar ca și consecință, ea va reflecta cea mai mică variație de selecție. Această observație este de mare importanță în inferența statistică unde eșantioanele sunt utilizate în construirea ipotezelor despre populațiile studiate.

CAPITOLUL 4

VARIABILITATE

Există o poveste probabil adevărată, probabil imaginară a unui explorator care înainte de a se deplasa în ținuturile arctice solicită informații legate de temperatura lunii octombrie pentru a se putea aproviziona cu materiale adecvate transportului (combustibil, antigel etc.). Cunoscând că media temperaturilor lunii octombrie în zonă este de -10C, exploratorul își cumpără un antigel care să reziste acestei temperaturi. Ajungând în zona arctică el își continuă incursiunea până într-o zi când temperatura scade brusc la -40C iar gelul achiziționat nu mai funcționează. Fiind la o distanță apreciabilă de cea mai apropiată stație de explorare, pe fondul unui viscol iscat din senin care a durat 4 zile, exploratorul a murit de hipotermie. Marea eroare a exploratorului a fost că s-a încrezut în temperatura medie, ne-consultând mediile zilnice de temperatură pe perioada de explorare.

Tendința centrală este o abstracție a realității. Mai concret, ea nu spune întreaga poveste sau o spune incomplet. Pentru o mai profundă înțelegere a oricărei distribuții este nevoie de informații privind variabilitatea scorurilor.

Variabilitatea prezintă interes particular în științele comportamentale. Aici, cercetarea nu produce informație atâta timp cât nu se ia în considerare variabilitatea manifestată între indivizi, variabilitatea condițiilor experimentale, co-variabilitatea variabilelor etc. Ne vom opri în acest capitol asupra a trei măsuri ale variabilității: amplitudinea, varianța și abaterea standard.

4.1 AMPLITUDINEA

Amplitudinea este definită ca diferență între cel mai ridicat și cel mai scăzut scor înregistrat într-o distribuție. Ca măsură a variației, amplitudinea semnifică o distanță, ceea ce este în contrast cu măsurile tendinței centrale care reflectă poziția. Însă amplitudinea are două limitări serioase. În primul rând, ea nu spune nimic despre ceea ce se întâmplă în interiorul celor două scoruri extreme. În al doilea rând, întrucât operează doar cu cele două scoruri extreme (xmax și xmin) care pot varia în limite largi de la eșantion la eșantion, stabilitatea amplitudinii lasă mult de dorit. În concluzie se poate spune că amplitudinea este insuficientă în evaluarea variabilității. Este nevoie de o măsură care să fie sensibilă la fiecare scor al distribuției.

4.2 VARIABILITATE ȘI ABATERILE DE LA MEDIE

Abaterile scorurilor față de medie măsoară distanța scoruri-medie. Suma abaterilor negative (determinate de scorurile inferioare mediei) este egală cu suma abaterilor pozitive (determinate de scorurile superioare mediei). În consecință . Întrucât scorurile abatere măsoară distanțele față de medie, rezultă că ele pot fi folosite într-o măsură care să reflecte variabilitatea. Cu cât scorurile brute prezintă o plajă de valori mai largă cu atât mai mari vor fi abaterile față de medie. Să analizăm această implicație pe cele trei distribuții prezentate mai jos.

Deși cele trei distribuții au aceeași amplitudine, totuși ele diferă în raport cu modul în care scorurile se plasează în jurul mediei. Referitor la distribuția 1, se observă că cele 5 scoruri de 2 sunt egale cu media și prin urmare, variabilitate produce scorul de 4 și scorul de 0. Distribuția 2 prezintă o variabilitate mai pronunțată, determinată de existența a șase scoruri care diferă de medie. La fel și în cazul distribuției 3. Problema pe care o ridică acest exemplu este cum pot fi combinate scorurile abatere într-o singură măsură a variabilității. Însă în toate cele trei distribuții! O soluție general acceptată este ridicarea la pătrat a fiecărui scor abatere.

4.3 VARIANȚA

Varianța notată cu S2 este media pătratelor scorurilor abatere. Relația de calcul folosită pentru evaluarea sa, este:

unde n este numărul de observații.

Revenind la exemplul de mai sus, suma pătratelor scorurilor abatere este pentru distribuția 1- 4+0+0+0+0+0+4=8, pentru distribuția 2 – 1+4+1+0+1+1+4=12 iar pentru distribuția 3 – 4+1+0+4+1+4+4=18. În consecință varianțele celor trei distribuții sunt:

Având în vedere faptul că varianța este sensibilă la valoarea fiecărui scor al distribuției, ea scoate în evidență diferențele de variabilitate între distribuții.

Varianța este des utilizată în proceduri statistice complicate. Totuși, ea prezintă un inconvenient fatal ca mijloc de descriere sau de interpretare pentru că valoarea calculată a varianței este exprimată în unități pătrate de măsură. Presupunând că scorurile înregistrate în cele trei distribuții se referă la itemii memorați, rezultă spre exemplu că în cazul distribuției 2, media este de 2 itemi iar varianța este de 1,71 itemi pătrați. Itemul pătrat este dificil de înțeles și din acest motiv varianța este puțin folosită în scopuri de interpretare.

4.4 ABATEREA STANDARD

Remediul pentru a elimina “slăbiciunile” varianței constă în extragerea rădăcinii pătrate. Prin extragerea rădăcinii pătrate, rezultatul statistic – abaterea standard – este exprimat în unități originale de măsură. Folosind exemplul de mai sus, dacă varianța distribuției 2 este 1,71 itemi pătrați, abaterea standard este de 1,307… itemi.

Relația de calcul a abaterii standard este:

Pașii necesari calculării abaterii standard după relația de mai sus, sunt:

calcularea mediei aritmetice;

calculul diferențelor ;

ridicarea la pătrat a fiecărei diferențe ;

sumarea pătratelor diferențelor ;

folosirea rezultatului obținut în 4 la calcularea abaterii standard, cunoscând numărul de observații n.

Pentru seria de date; 20, 17, 13, 12, 10, 8, 6, 5, 2, 1 calculul abaterii standard este prezentat în tabelul de mai jos.

Calculul abaterii standard folosind relația .

La calculul abaterii standard poate fi folosită și formula echivalentă

Calculele necesare determinării lui S folosind această formulă sunt prezentate mai jos.

Calculul abaterii standard folosind formula

4.5 ABATEREA STANDARD ȘI DISTRIBUȚIA NORMALĂ

În următoarele prezentări ne vom folosi de utilizarea abaterii standard ca măsură a distanței. Într-o distribuție normală ideală, intervalul conține 68% din scoruri, intervalul conține 95% din scoruri iar intervalul conține 99,7% din scoruri. Figura de mai jos prezintă o distribuție normală a scorurilor IQ înregistrate pe o populație ipotetică de 10 ani, având media de 100 iar abaterea standard de 15.

Fig. 4.1 Distribuția normală și procentele cazurilor delimitate de abaterile standard.

CAPITOLUL 5

CORELAȚIA STATISTICĂ

5.1 CONCEPTUL DE ASOCIERE STATISTICĂ

Până la acest capitol au fost tratate proceduri și statistici univariate ca și aspecte referitoare la distribuția de frecvențe a unei variabile, tendința centrală și variabilitate. În acest capitol vom prezenta elemente de “lume bivariată” în care interesul va fi focalizat pe examinarea simultană a două variabile.

Se găsesc performanțele pe care le înregistrează studenții la examenul de licență într-un anumit raport cu rezultatele obținute la examenul de admitere în facultate? Ce relație există între cheltuielile per-copil și realizările academice ale acestuia? Aceste întrebări și multe altele care se pot pune în aceeași manieră au în vedere modul în care valorile unei variabile X “merg” cu valorile celeilalte variabile Y. Se asociază valori scăzute ale statusului socio-economic cu valori scăzute ale coeficienților IQ și invers, valori ridicate ale statusului socio-economic cu valori ridicate ale coeficienților IQ? Cu alte cuvinte sunt variabilele acestui exemplu variate sau covariate? La întrebările expuse nu se poate răspunde folosind informații univariate, sau altfel exprimat, nu se poate spune ceva legat de asocierea dintre două variabile doar prin simpla examinare a două distribuții de frecvențe, a două medii sau varianțe. Pentru acest scop trebuie folosite metodele bivariate.

Coeficientul de corelație este o statistică bivariată care măsoară gradul de asociere liniară dintre două variabile cantitative și se bucură de o mare popularitate în științele comportamentale. În cadrul acestui capitol vom acorda o atenție specială unei măsuri particulare de asociere. Este vorba de coeficientul de corelație Pearson.

5.2 REPREZENTAREA GRAFICĂ A ASOCIERII

Orice problemă de corelație începe cu un set de perechi de scoruri. Aceste perechi ar putea fi: cunoștințele educaționale ale părinților și cunoștințele educaționale ale urmașilor, sau, scorurile self-esteem și evaluările de popularitate și exemplele ar putea continua. Întotdeauna vor fi implicate două grupuri ca în primul exemplu sau două seturi de măsurători ca în cel de-al doilea exemplu și, întotdeauna datele statistice constau din scoruri pereche. Dacă scorurile nu sunt dispuse în perechi, asocierea nu poate fi examinată și în consecință coeficientul de corelație nu poate fi evaluat.

În tabelul de mai jos sunt prezentate scorurile unui număr de 10 studenți referitoare la raționamentele spațiale și abilitățile matematice. Se poate vorbi de asociere între aceste două variabile?

Analizând perechile de scoruri, cu siguranță că nu vom putea spune nimic despre existența unei asocieri între cele două variabile. Se asociază scoruri mici ale variabilei X cu scoruri mici ale variabilei Y și invers? Este dificil de spus doar inspectând datele din tabel. Apelând însă la analiza grafică, putem da cu ușurință un răspuns la aceste întrebări. Pentru reprezentarea grafică se utilizează două axe de lungimi egale, câte una pentru fiecare variabilă. Pe axa orizontală sunt reprezentate scorurile înregistrate la testul de raționament spațial iar pe ordonată, scorurile înregistrate la testul de abilitate matematică. Fiecare punct din graficul de mai jos reprezintă cele două scoruri simultane ale unui student. De exemplu studentul 4 a obținut scorurile X=80 și Y=84. Reprezentarea grafică a unui set de perechi de date ca în acest exemplu constituie o etapă a muncii de evaluare a corelației dintre două variabile.

Fig. 5.1 Reprezentarea norului de puncte

ASOCIEREA

În primul rând, reprezentarea grafică a setului de valori relevă prezența asocierii între două variabile. Cu cât este mai puternică relația dintre două variabile cu atât punctele de pe grafic tind să se distribuie de-a lungul unei linii imaginare. Reprezentarea grafică a norului de puncte din graficul de mai sus sugerează faptul că în general valorile variabilei X “merg la fel” cu cele ale variabilei Y. În figurile 5.2 b) și d) sunt prezentate forme particulare ale norului de puncte. Dacă nu există asociere între variabile, punctele din nor se distribuie aleator ca în figura 5.2 a). Dacă asocierea dintre variabile este perfectă, atunci punctele graficului se distribuie în întregime pe o linie imaginară (fig. 5.2 c) și d)). De regulă, în practica psihologică asemenea asocieri perfecte nu există.

Fig. 5.2 Grafice ilustrând diferite distribuții bivariate.

DIRECȚIA

Dacă există asociere între două variabile atunci reprezentarea grafică a norului de puncte va oferi informații legate de direcția asocierii. În măsura în care norul de puncte se distribuie pe direcția stânga-jos, dreapta-sus, atunci distribuția norului de puncte sugerează o direcție pozitivă a asocierii (fig. 5.2 b și c). Distribuția norului de puncte pe direcția stânga-sus, dreapta-jos pune în evidență o direcție negativă a asocierii (fig. 5.2 d și e). Direcția legăturii este independentă de tăria (intensitatea) ei. De exemplu fig. 5.2 c) și d) reflectă legături la fel de puternice dar care diferă prin direcția lor.

NON-LINIARITATEA

Figura 5.1 sugerează faptul că asocierea dintre raționamentele spațiale și abilitățile matematice este una de tip liniar. Dar acest lucru nu înseamnă că norul de puncte se distribuie după o linie dreaptă. O legătură statistică se spune că este de tip liniar dacă o linie dreaptă reprezintă fidel distribuția norului de puncte. Legături de tip liniar sunt prezentate în fig. 5.2 b, c, d și e. Legăturile care nu sunt liniare sunt curbilinii de tipul celor indicate în fig. 5.2 f și g.

Există cel puțin un motiv serios de evaluare grafică a non-liniarității. Este vorba de coeficientul de corelație Pearson, care conform definiției poate oferi semnificație statistică doar în măsura în care reflectă o asociere liniară între variabile. Așadar demersul de a calcula coeficienți Pearson în investigarea asocierilor neliniare este total eronat.

5.3 COVARIANȚA

Graficele distribuțiilor bivariate sunt într-adevăr informative dar nu și suficiente. Înainte de a introduce noțiunea de covarianță trebuie să avem în vedere faptul că atenția noastră este concentrată asupra măsurării legăturilor liniare. Din fericire, o mare majoritate a legăturilor statistice din câmpul științelor comportamentale sunt liniare, iar peste 90% din coeficienții de corelație calculați sunt coeficienți Pearson. Totuși, trebuie reținut faptul că este întotdeauna important să analizăm graficele norilor de puncte pentru a ne asigura de prezența liniarității.

Relația de calcul a covarianței este:

unde n este numărul perechilor de observații.

Pașii necesari calculării covarianței sunt:

Pasul 1: Evaluarea mediilor și ;

Pasul 2: Evaluarea abaterilor respectiv ;

Pasul 3: Evaluarea sumei ;

Pasul 4: Împărțirea sumei obținute la numărul perechilor de observații.

EXEMPLU

Rezultatele înregistrate la un test de evaluare a atenției distributive de către patru persoane sunt cele prezentate în tabelul de mai jos:

5.3.1 LOGICA COVARIANȚEI

Ca măsură a asocierii, cum lucrează covarianța și de ce? Vom trata acest subiect prin a explica ce înseamnă faptul că două variabile sunt pozitiv asociate.

Când există o asociere pozitivă între două variabile, scorurile situate deasupra mediei variabilei X tind să fie asociate cu scorurile plasate deasupra mediei variabilei Y și invers, scorurile inferioare mediei variabilei X tind să fie însoțite de scoruri inferioare mediei variabilei Y. Din acest motiv, abaterea scorurilor constituie o importantă componentă a covarianței. Figura 5.3 este împărțită în patru cadrane

Fig. 5.3 Semnul produselor în cele patru cadrane.

prin două linii corespunzătoare mediilor celor două variabile și . În cadranul I abaterile respectiv sunt pozitive și așa va fi și produsul lor. În cadranul II produsul este negativ datorită abaterilor . În cadranul III întrucât ambele scoruri se situează sub nivelul mediilor, produsul va fi pozitiv. În cadranul IV, scorurile variabilei Y fiind plasate sub medie, produsul abaterilor este negativ. Întrucât n este întotdeauna pozitiv, rezultă că semnul covarianței depinde de semnul numărătorului . În general, cu cât se vor concentra mai multe puncte în cele două cadrane (fie I și III, fie II și IV) cu atât vor exista mai multe produse de același semn față de celelalte de semn contrar. Cu cât este mai mare suma , cu atât este mai mare covarianța. Analizând graficul de mai sus se constată că absolut toate punctele din nor se distribuie în cadranele I și III, și prin urmare, ne așteptăm ca și mărimea covarianței să fie mare. Pentru calculul ei, folosim tabelul de mai jos:

Întrucât Cov=+624,64 rezultă că raționamentul spațial și abilitatea matematică sunt asociate pozitiv. Așadar, covarianța oferă informații despre direcția asocierii prin semnul acesteia.

Să analizăm în continuare trei distribuții bivariate A, B și C prezentate în tabelele de mai jos.

DISTRIBUȚIA BIVARIATĂ “A” (ASOCIERE PERFECT POZITIVĂ)

DISTRIBUȚIA BIVARIATĂ “B” (ASOCIERE PERFECT NEGATIVĂ)

DISTRIBUȚIA BIVARIATĂ “C” (LIPSĂ DE ASOCIERE)

Urmărind distribuția bivariată A, se constată că toate produsele sunt pozitive. În schimb, în distribuția B produsele sunt în întregime negative. Efectul cifrelor este acela că cele două distribuții au aceeași valoare absolută a covarianței dar semnul este opus: +46,(6) și –46,(6). În distribuția bivariată C unde nu există asociere între variabile, covarianța este nulă. Calculele făcute nu spun însă nimic despre tăria asocierii. Acest lucru se datorează faptului că mărimea covarianței este dependentă de scalele metrice ale variabilelor implicate. Să ne întoarcem la distribuția A și să multiplicăm fiecare valoare a variabilei Y cu 10. Această operație nu va altera legătura dintre X și Y, ele continuând să fie perfect asociate. Însă covarianța va fi de 10 ori mai mare! În aceste condiții covarianța este un indicator dificil de interpretat.

Revenind la exemplul cu asocierea dintre raționamentele spațiale și abilitățile matematice, ce am putea spune despre mărimea covarianței (=624,64)? Este mare? Este mică? Mai mult, covarianțele nu sunt ușor de comparat. Chiar dacă mărimea covarianței de 624,64 este mai mare decât 46,(6) nu putem trage concluzia că în primul caz asocierea este mai puternică decât în al doilea caz.

5.4 COEFICIENTUL DE CORELAȚIE PEARSON

În eforturile de găsire a unei soluții pentru evaluarea tăriei asocierii dintre două variabile s-a constatat că efectele dependenței covarianței de scalele metrice dispar dacă covarianța se împarte la produsul celor două abateri standard. Mărimea rezultată este cunoscutul coeficient de corelație Pearson, pentru care formula de calcul este:

Pentru distribuțiile bivariate A și B valorile coeficienților de corelație sunt:

5.4.1 PROPRIETĂȚILE COEFICIENTULUI PEARSON

semnul coeficientului indică direcția asocierii (semnul pozitiv pentru asocierea pozitivă și semnul negativ pentru asocierea negativă);

lipsa asocierii între două variabile este semnalată de prezența unui coeficient de corelație nul (ca în cazul distribuției bivariate C);

asocierea perfectă între două variabile conduce la un coeficient de corelație egal cu +1 sau –1;

asocierile de intensitate intermediară conduc la obținerea unor r-uri cuprinse între 0 și 1 respectiv 0 și –1.

În figurile 5.4 sunt prezentate grafice care pun în evidență diferite grade de asociere.

Fig. 5.4 Grafice ilustrând diferite grade corelație.

5.4.2 O ALTĂ RELAȚIE DE CALCUL PENTRU COEFICIENTUL DE CORELAȚIE PEARSON

Coeficientul Pearson poate fi calculat utilizând doar scorurile brute. Relația de calcul în acest caz este:

Formula de calcul de mai sus elimină necesitatea evaluării diferențelor respectiv . Pentru distribuția bivariată A, calculul coeficientului Pearson folosind ultima relație de calcul presupune dispunerea operațiilor în maniera indicată de tabelul de mai jos.

Calcule necesare evaluării coeficientului Pearson

5.5 CORELAȚIE ȘI CAUZALITATE

De la bun început trebuie spus următorul lucru: corelația nu implică neapărat cauzalitate. Când un experimentator variază dozajul unui drog și găsește o variație corespondentă în răspunsul fiziologic, concluzia argumentată este că diferența de dozaj a cauzat diferența de răspuns. Putem vorbi în acest caz de un raport de cauzalitate. Dar, în absența unor experimente controlate în care participanții sunt repartizați aleator la diferite grupuri de tratamente, invocarea cauzalității se poate face cu riscuri foarte mari. Există în principiu trei posibile explicații, altele decât “întâmplarea” când putem vorbi de corelație între X și Y:

X cauzează Y;

Y cauzează X;

un al treilea factor Z sau un complex de factori cauzează atât X cât și Y.

Fig. 5.5 Posibile motive pentru invocarea corelației dintre X și Y.

De exemplu, s-a constatat că între entuziasmul profesorilor (X) și realizările studenților (Y) există corelație. Înseamnă oare acest lucru că entuziasmul este întreținut de succesele studenților (YX) sau invers (XY)? Un simplul calcul de corelație nu poate susține această afirmație. Mai mult, poate exista un al treilea factor Z, cum ar fi nivelul de sprijin al comunității pentru educație, care să susțină atât entuziasmul profesorilor cât și succesele studenților. În general o simplă evaluare numerică a corelației nu înseamnă în mod necesar faptul că există o legătură de cauzalitate între cele două variabile. Oricine vorbește de cauzalitate trebuie să o argumenteze logic dincolo de orice demonstrație statistică de asociere.

Există proceduri statistice sofisticate cum ar fi corelația parțială, regresia multiplă etc. care încearcă să depășească impedimentele cauzate de limitările coeficientului de corelație. Însă oricât de sofisticate ar fi analizele statistice, argumentarea logică a cauzei și efectului trebuie să rămână întotdeauna o prioritate.

5.6 LINIARITATEA ȘI COEFICIENTUL PEARSON

Există câțiva factori majori care influențează mărimea lui r și de care trebuie să se țină seama în interpretarea rezultatelor obținute. Cel mai important dintre ei se referă la liniaritate.

Nimeni nu trebuie să uite că r reflectă mărimea și direcția asocierii liniare dintre două variabile. Dacă o distribuție bivariată se abate de la liniaritate, r va subestima legătura dintre variabile.

Fig. 5.6 Efectul non-liniarității asupra coeficientului Pearson.

De exemplu, figurile 5.6 a) și b) descriu până la un anumit punct aceeași tărie a legăturii dintre variabilele X și Y. Constatăm însă că în figura 5.6 b) liniaritatea este compromisă de la un anumit nivel al variabilei X iar acest lucru contribuie la obținerea a două valori diferite pentru coeficientul Pearson (0,85 și 0,54). În figura 5.6 c) care descrie o legătură perfect curbilinie, coeficientul de corelație este 0. Semnifică oare această valoare că nu există asociere între variabile? Răspunsul este categoric NU! Mai mult, există chiar o asociere puternică! Însă nu liniară! Concluzia este că nu trebuie confundată absența asocieri liniare cu absență asocierii.

5.7 : PROPORȚIA VARIANȚEI COMUNE

Să presupunem că am obținut un r de 0,5 între rezultatele obținute de către candidații admiși la admiterea în învățământul superior și rezultatele obținute la examenul de licență de către aceiași subiecți. r-ul rezultat ne indică faptul că unele tipuri variații ale rezultatelor obținute la admitere se asociază cu aceleași tipuri de variații ale rezultatelor obținute la examenul de licență. Acest lucru înseamnă că rezultatele covariază între ele. Însă cu toate acestea, putem spune că suntem departe de a vorbi despre o covarianță perfectă. Reprezentarea grafică a rezultatelor va scoate în evidență multe excepții individuale, în sensul că rezultate mari la examenul de admitere sunt însoțite de rezultate mici la examenul de licență și invers. Însă pentru covariații se poate spune că există o bază explicativă comună și anume nivelul de pregătire dobândit în primii 12 ani de școală. Pe de altă parte, în toate excepțiile întâlnite, variația rezultatelor de la examenul de admitere nu poate explica toată variația rezultatelor înregistrată la examenul de licență. Problema care se pune este cât de mult variația rezultatelor înregistrată la examenul de admitere se regăsește în variația rezultatelor înregistrată la examenul de licență. Cu alte cuvinte, ce proporție de varianță înregistrată în rezultatele de la admitere și licență este varianță comună. Coeficientul de determinare dă proporția de varianță comună împărțită între cele două variabile. În exemplul prezentat , ceea ce arată că 25% din varianța înregistrată la examenul de licență se regăsește în varianța înregistrată la examenul de admitere. Calculul diferenței scoate în evidență faptul că 75% din varianța înregistrată într-o variabilă este asociată cu factori ne-relevați în cealaltă variabilă. Această diferență este cunoscută sub numele de coeficient de nedeterminare.

Dacă reprezentăm varianța fiecărei variabile printr-un cerc, atunci suprapunerea lor va corespunde proporției de varianță comună. În cazul în care , nu va exista suprapunere între cercuri (fig. 5.7 a). Pentru , suprapunerea va fi de 25% (fig. 5.7 b) în timp ce pentru , suprapunerea este totală (fig. 5.7 c).

Fig. 5.7 Reprezentarea lui r2 și varianța comună.

CAPITOLUL 6

DISTRIBUȚII NORMALE ȘI SCORURI STANDARD

Prelucrarea și interpretarea datelor statistice este eficientă în studiul sistemelor multidimensionale unde non-tipicalitatea este cvasi-prezentă și controlul experimental posibil. Pentru surprinderea cât mai fidelă a caracteristicilor oricărui fenomen sau proces analizat este nevoie de o cantitate cât mai mare de informație statistică. Cât de mare sau cât de amplă poate fi informația statistică? Teoretic, volumul de date statistice poate fi infinit. Nevoia de cunoaștere în detalii fine a realității care ne înconjoară și la care avem acces, asociată cu imposibilitatea de a opera pe serii infinite de date statistice a canalizat efortul statisticienilor în direcția elaborării unor proceduri de evaluare a proprietăților unei populații pe baza unui volum limitat de informație.

Nu de puține ori, seriile statistice supuse prelucrării sunt extrem de lungi. Pentru a surprinde ceea ce este esențial într-un volum mare de informație statistică, aparent fără semnificație, este necesară comprimarea seriilor statistice simple în serii cu distribuții de frecvențe.

Distribuțiile de frecvențe sunt extrem de variate. O formă particulară este distribuția normală. Deși în realitate distribuția normală este întâlnită în foarte puține cazuri, există un număr extrem de mare de variabile care au tendințe să urmeze caracteristicile sale. Dăm câteva exemple:

abilitatea mentală a copiilor;

greutatea indivizilor;

înălțimea indivizilor;

etc.

În ultima perioadă a secolului XIX, Sir Francis Galton a început să se preocupe de studiul diferențelor individuale care constituie o importantă zonă de studiu în psihologie și educație. În investigațiile sale asupra modului în care oamenii diferă în zona activităților mentale și trăsăturilor fizice, Galton a sesizat că distribuția normală constituie un bun și rezonabil descriptor.

Există însă o serie de variabile care nu urmează în dinamica lor distribuția normală, cum ar fi: impozitul anual, mărimea familiei, aptitudinile educaționale etc. Mai mult, variabilele care sunt distribuite normal într-un anumit context pot prezenta o distribuție ne-normală dacă situația sau contextul se schimbă. De exemplu, distribuția greutății este modală pentru femei și bărbați luați separat. Însă când cele două grupuri sunt combinate, distribuția este bimodală.

În ciuda acestor excepții este de reținut faptul că distribuția normală oferă o descriere rezonabilă și convenabilă a unui număr mare de variabile. Totodată, curba normală poate descrie distribuția multor statistici ale eșantioanelor. De exemplu, dacă se dispune de 100 de eșantioane aleatoare de la o populație de adolescenți – unde se urmărește greutatea acestora – și se calculează greutatea medie în fiecare eșantion, se constată că distribuția celor 100 de medii aproximează curba normală. În asemenea situații este recomandabilă folosirea curbei normale în elaborarea “judecăților statistice”. Proprietatea numeroaselor caracteristici de a urma “normalitatea statistică” este de importanță majoră în statistica inferențială.

6.1 PROPRIETĂȚILE CURBEI NORMALE

Distribuția normală reprezintă un model matematic, un concept idealizat al formei distribuției. Nici o distribuție empirică nu satisface perfect proprietățile curbei normale. Cu toate acestea, distribuțiile empirice oferă adesea o aproximare rezonabilă a curbei normale și din acest motiv, pare acceptabil să spunem că datele sunt distribuite normal. Trebuie însă surprinsă o nuanță importantă. Dacă ecuația unui cerc descrie o familie de cercuri, unele mai mari, altele mai mici, ecuația curbei normale descrie o familie de distribuții. Curbele normale pot diferi între ele. Responsabile de aceste diferențieri sunt mediile și abaterile standard ale distribuțiilor.

Care sunt proprietățile curbei normale? În primul rând, acestea sunt simetrice, în sensul că jumătatea stângă a distribuției este oglinda imaginii jumătății drepte. În al doilea rând, aceste curbe sunt unimodale, prezentând o modă în centru. Media, mediana și modulul au aceeași valoare. În al treilea rând, aceste curbe au forma de clopot. În al patrulea rând, curbele normale nu intersectează niciodată abscisa. Această proprietate ilustrează de ce o distribuție empirică nu poate fi niciodată perfect normală. În graficele de mai jos sunt prezentate elementele de diferențiere ale distribuțiilor normale.

6.2 DEVIAȚIA STANDARD ȘI DISTRIBUȚIA NORMALĂ

Prezentăm în continuare un rezultat important și frecvent utilizat în statistică. Proporția zonei delimitate de abaterile standard de o parte și de alta a mediei (în ansamblul zonei delimitate de curba normală) este egală cu proporția cazurilor care înregistrează scoruri cuprinse în acea zonă. De exemplu, într-o distribuție normală, 34,13% din cazuri înregistrează scoruri cuprinse între medie și o abatere standard față de medie. În graficul de mai jos sunt evidențiate frecvențele relative ale cazurilor cuprinse în interiorul intervalelor deviațiilor standard.

Fig. 6.4 Graficul frecvențelor relative a cazurilor cuprinse între intervalele deviațiilor standard pentru o medie și o abatere standard .

6.3 SCORURILE Z

Relația dintre zonele curbei normale și unitățile de deviație standard poate fi utilizată pentru a răspunde anumitor întrebări care sunt fundamentale în statistică. De exemplu: fiind dată o distribuție normală cu media 100 și deviația standard 15, care este procentul cazurilor care înregistrează scoruri IQ mai mari de 115? Știm că un scor de 115 provenit de la o distribuție a scorurilor având media de 100 și abaterea standard de 15, reprezintă o deviație standard față de medie (). Mai mult, știm din figura 1.4 că 34,13% din cazuri prezintă un scor IQ cuprins între 100 și 115 iar în 50% din cazuri, scorurile sunt mai mici de 100. Deci, în aproximativ 16% din cazuri vom întâlni scoruri IQ mai mari de 115. Figura de mai sus, nu mai poate fi utilizată dacă se urmărește evaluarea procentuală a cazurilor care înregistrează scoruri IQ superioare scorului de 117. Tabelele statistice sunt astfel construite încât să elimine acest impediment. Însă problema care se ridică constă în identificarea unei modalități de exprimare a locației scorurilor în termeni care să fie echivalenți pentru toate distribuțiile normale. Spre exemplu, un scor IQ de 115 care are o deviație standard deasupra mediei de 15 va avea o cu totul altă localizare într-o distribuție cu și . Soluția oferită de statistică este aceea de a transforma scorurile originale în scoruri standard (scoruri z).

Un scor standard exprimă poziția unui scor în raport de media distribuției, utilizând deviația standard ca unitate de măsură. Scorul z stabilește numărul de deviații standard prin care scorul original se plasează deasupra sau sub media distribuției.

Într-o distribuție unde și , scorul de 115 corespunde unui scor z de 1.00, indicând faptul că scorul este situat la o deviație standard deasupra mediei.

Scorurile z se calculează după relația:

Să ne oprim asupra scorului IQ de 115 înregistrat în două distribuții diferite, una în care și iar cealaltă în care și . Valorile lui z sunt:

pentru distribuția cu și

pentru distribuția cu și

Chiar dacă scorurile originale sunt identice, ele au poziții diferite în distribuțiile menționate. Acest lucru se poate constata ușor din analiza graficelor următoare:

Fig. 6.5 Scorul original și scorul z pentru două distribuții normale având medii și abateri standard diferite.

O situație interesantă apare atunci când pentru distribuția normală și . Aici un scor de 60 reprezintă o deviația standard deasupra mediei și cade în aceeași poziție relativă ca și scorul de 115 din distribuția originală ( și ).

Fig. 6.6 Scorul original de 60 și scorul z asociat într-o distribuție cu și .

Să calculăm acum scorurile standard corespunzătoare scorurilor IQ egale cu 120 și 95. Dacă și , atunci scorurile z corespunzătoare sunt:

Scorul IQ de 120 reprezintă 1,33 deviații standard deasupra mediei, în timp ce scorul IQ de 95 reprezintă 0,33 deviații standard sub medie. Proporțiile corespunzătoare acestor cote sunt precis specificate în tabelele statistice.

Distribuțiile normale diferă prin valorile variabilelor, medie și abatere standard. Ceea ce este comun acestor distribuții este repartiția proporțiilor pe un orizont de variații. Distribuțiile normale pot fi reduse la o distribuție standardizată de medie 0 și abatere standard 1 prin transformarea scorurilor originale în scoruri standard (z). Motivația unei asemenea transformări constă în faptul că, dată fiind distribuția standardizată, se pot determina cu ușurință proporțiile valorilor care se găsesc de o parte și de alta a unei valori z date.

TIPURI DE PROBLEME

Pentru o distribuție normală având și , care este procentul cazurilor ce înregistrează scoruri mai mici de 80?

Calculăm:

Valoarea corespunzătoare cotei z din anexa A este de 15,87%. Prin urmare în 15.87% din cazuri scorurile vor fi mai mici de 80.

Pentru o distribuție normală cu și , care este procentul cazurilor ce înregistrează scoruri mai mari de 120?

În anexa A se găsește ca și în exemplul de mai sus valoarea de 15,87%.

Fig. 6.7 Distribuția normală a scorurilor pentru și .

Pentru o distribuție cu și , se cere procentul cazurilor care înregistrează scoruri mai mari de 80.

Cota z corespunzătoare este:

Figura de mai jos sugerează necesitatea determinării procentelor corespunzătoare celor două zone marcate.

Fig. 6.8 Zonele corespunzătoare cotelor standard pentru determinarea proporției cazurilor care înregistrează scoruri mai mari de 80.

Prima coloană a anexei A oferă răspunsul pentru prima zonă cuprinsă între scorurile 80 și 100. Este vorba de un procent de 34,13%. Întrucât curba normală este simetrică, zona cuprinsă dincolo de medie reprezintă ½ din totalul zonei aflată sub grafic, adică 50%. În consecință, zona marcată reprezintă din totalul zonei plasate sub grafic. Prin urmare, în aproximativ 84% din cazuri se înregistrează scoruri IQ mai mari de 80.

Pentru o distribuție normală cu și , care este procentul subiecților care înregistrează scoruri IQ cuprinse între 90 și 120?

Calculăm cotele z corespunzătoare scorurilor de 90 și 120:

și

Analizând figura de mai jos, reiese necesitatea determinării procentelor corespunzătoare celor două zone marcate: una cuprinsă între scorurile de 90 și 100 și cealaltă cuprinsă între 100 și 120.

Fig. 6.9 Determinarea proporției cazurilor care înregistrează scoruri cuprinse între 90 și 120.

În anexa A, procentele corespunzătoare celor două zone sunt de 19,15% respectiv de 34,13%. Deci procentul subiecților care înregistrează scoruri cuprinse între 90 și 120 (pentru distribuția N( și )) este de 53,28%.

Pentru o distribuție normală cu și , care este proporția cazurilor care înregistrează scoruri cuprinse între 110 și 120?

Această problemă este similară problemei 4, mai puțin faptul că ambele scoruri sunt poziționate dincolo de medie. O soluție ar fi să determinăm proporția cazurilor care înregistrează scoruri mai mari de 110 și apoi proporția cazurilor care înregistrează scoruri mai mari de 120. Având aceste informații, pentru determinarea proporției cazurilor care înregistrează scoruri cuprinse între 110 și 120 este suficient să facem diferența dintre procentele rezultate. Pentru datele de care dispunem, scorurile z sunt:

și

Procentele corespunzătoare scorurilor mai mari de 110 și 120 sunt de 30,85% respectiv de 15,87%. Rezultă că în 30,85%-15,87%=14,98% din cazuri se vor înregistra scoruri cuprinse între 110 și 120.

SITUAȚIA INVERSĂ

Problema pe care o propunem în continuare este de a găsi scorul care separă două zone aflate sub graficul curbei normale. Există în principiu trei tipuri de probleme.

1.Pentru o distribuție normală cu și , să se găsească scorul care separă zona scorurilor mai mari prezente într-un procent de 20% de celelalte scoruri prezente într-un procent de 80%.

În anexa A coloana 3, se caută valoarea cea mai apropiată de 20% care este 20,05%, iar cota z corespunzătoare este de 0,84. În continuare se convertește scorul z în scor original x. În cazul de față, scorul original se află la 0,84 abateri standard deasupra mediei și este egal cu . Acesta este scorul care separă cele două zone. Graficul corespunzător este cel prezentat mai jos.

Fig. 6.10 Scorul care separă zona scorurilor mai mari aflate într-un procent de 20% de restul scorurilor.

2. Pentru o distribuție normală cu și să se găsească scorul care separă zona scorurilor mai mici prezente într-un procent de 20% de celelalte scoruri (prezente într-un procent de 80%). Grafic, situația este cea prezentată mai jos.

Fig. 6.11 Scorul care separă zona scorurilor mai mici aflate într-un procent de 20% de restul scorurilor.

Ca și în exemplul de mai sus, în anexa A coloana a treia se urmărește valoarea cea mai apropiată de 20%. Întrucât trebuie delimitată o zonă care cuprinde scorurile mai mici aflate într-un procent 20% de cealaltă zonă care cuprinde restul de 80% din scoruri, scorul se va plasa în stânga mediei și deci va corespunde unei zone z negative (). Acum există condițiile de a converti scorul z în scor original. Astfel, .

3. Pentru o distribuție normală cu și , care sunt limitele (exprimate în scoruri) în interiorul cărora se înregistrează 95% din scoruri?

Situația este prezentată în graficul mai jos:

Fig. 6.12 Limitele în interiorul cărora se întâlnesc 95% din scoruri pentru o distribuție N().

Având în vedere simetria curbei normale, rezultă că zonele care se exclud trebuie să reprezinte fiecare un procent de 2,5% din zona aflată sub grafic. În coloana a treia a anexei A se găsește cota z de 1,96 corespunzătoare procentului de 2,5%, respectiv de –1,96 pentru cota z negativă. Scorurile originale sunt:

și

Între scorurile de 60,8 respectiv de 139,2 se cuprind, în condițiile distribuției menționate, 95% din scoruri.

6.4 COMPARAREA SCORURILOR DIFERITELOR DISTRIBUȚII

Convertirea scorurilor originale în scoruri z conduce la distribuția normală centrată și redusă, de medie 0 și abatere standard egală cu 1. Deci, indiferent de media și abaterea standard a distribuției originale, convertirea în scoruri z conduce la o unică distribuție statistică. Acest lucru este foarte important întrucât permite compararea scorurilor diferitelor distribuții. Pentru o mai bună înțelegere prezentăm următorul exemplu.

Să presupunem că se înregistrează un scor de 60 la un examen pentru care media este de 40 și abaterea standard este de 10 și un scor de 80 la același examen în anul următor pentru care media este de 65 și abaterea standard de 15. Se pune întrebarea care rezultat este mai „bun”?

Scorul mai mare de 80 este relativ înșelător, date fiind mediile și abaterile standard diferite la cele două examene.

Transformând cele două scoruri în cote z, obținem:

;

Grafic, situația este prezentată mai jos.

Fig. 6.13 Compararea scorurilor a două distribuții având medii și abateri standard diferite.

Întrucât la primul examen doar 2% din note au fost mai mari față de media de 60 comparativ cu al doilea examen unde 16% din note au fost superioare mediei de 80, rezultă că la primul examen performanța obținută a fost mai bună.

6.5 ALTE SCORURI STANDARD

Utilizarea scorurilor z poate constitui un inconvenient din cel puțin două puncte de vedere:

în primul rând se lucrează cu ambele valori, pozitive și negative;

în al doilea rând, scorurile z nu sunt foarte familiare, mai ales când se încearcă comunicarea rezultatelor unui public ne-familiarizat cu proprietățile acestor scoruri.

Având în vedere aceste inconveniente, scorurile t constituie o alternativă mai bună, fiind accesibile înțelegerii. Ca și scorurile z, scorurile t sunt standardizate la o medie și abatere standard fixate. Când convertim toate scorurile în scoruri t, media lor este 50 iar abaterea standard este 10. Scorurile t se calculează după relația:

De exemplu, pentru un scor , scorul t corespunzător este:

sau, dacă pentru un scor z abaterea standard este de +1.00, atunci scorul t este 60.

În figura de mai jos sunt prezentate comparativ diverse scale ale scorurilor standard.

Fig. 6.14 Scale de scoruri într-o distribuție normală.

Ceea ce trebuie reținut este că standardizarea unei scale nu duce la modificarea formei distribuției; se schimbă doar valorile corespunzătoare lui ,și .

CAPITOLUL 7

PROBABILITĂȚI ȘI DISTRIBUȚII DE PROBABILITATE

7.1 EFECTUL ÎNTÂMPLĂRII ÎN DENATURAREA REZULTATELOR OBȚINUTE

Să presupunem că administrația unei universități se gândește la posibilitatea trecerii de la un sistem de evaluare semestrială la un sistem de evaluare trimestrială. În acest scop, pentru a evalua reacția studenților se procedează la realizarea unei anchete în care unui număr de 100 de studenți li se cere părerea în această privință. Rezultatele obținute arată că 40% din studenți sunt favorabili schimbării iar 60% sunt împotriva schimbării. Se poate concluziona că 40% din studenții universității sunt favorabili schimbării? Este foarte probabil ca procentele rezultate în urma investigării celor 100 de studenți să difere întrucâtva de procentele rezultate în urma investigării tuturor studenților din universitate sau că, șansa (sau întâmplarea) a condus la obținerea celor 40% de studenți favorabili schimbării. Când ne referim la șansă avem în vedere posibilitatea ca în eșantionul de 100 de studenți să fi fost mai mulți studenți favorabili schimbării decât dacă ar fi fost investigată întreaga masă de studenți din universitate. Acest exemplu ilustrează următorul principiu fundamental: Factorii „șansă” inerenți în formarea eșantioanelor afectează întotdeauna rezultatele eșantioanelor.

Au fost dezvoltate o serie de tehnici și teorii legate de problemele de eșantionare. În esență, problema eșantionării urmărește să surprindă ce caracteristici rămân dacă variația datorată factorilor întâmplători a fost eliminată. Cheia rezolvării problemelor de inferență statistică se găsește în răspunsul la întrebarea: „Ce fel de rezultate pot fi obținute în eșantionul format dacă avem în vedere doar acțiunea întâmplării?” Când eșantioanele sunt formate într-o modalitate care permite întâmplării să opereze integral, tehnicile de inferență statistică pot sesiza acest lucru. Întâmplarea este de obicei tratată în termeni de probabilitate iar teoria care se ocupă de studiul întâmplării și a efectelor ei poartă numele de teoria probabilității.

7.2 PROBABILITATE. STUDIUL ÎNTÂMPLĂRII

Este relativ greu de văzut măsura în care raționamentul probabilistic este implicat în viața de zi cu zi. Toți trăim într-o lume a incertitudinii. Pentru a lua decizii bune trebuie să distingem între evenimentele care se produc, cele care nu au șanse de a se produce și cele care se găsesc între (evenimente probabile). De exemplu, porți umbrela în diminețile în care cerul este acoperit de nori și se prognozează ploaie, dar poți decide să nu o iei dacă cerul dimineții nu arată amenințător și sunt șanse doar de 20% ca ploaia să înceapă. Sau, te duci la școala de șoferi doar pe presupunerea că acolo îl vei întâlni pe instructorul X. Și exemplele pot continua. Ceea ce este de reținut este faptul că toate deciziile implică estimări ale probabilității producerii evenimentelor. Așa cum putem constata, evaluările probabilităților sunt subiective și conțin ceva mai mult decât o impresie generală asupra felului în care ceva probabil se produce.

Construirea unei baze științifice a inferenței statistice cere (impune) tratarea probabilităților într-o manieră precisă și obiectivă.

7.3 DEFINIȚIA PROBABILITĂȚII

Deja avem fără îndoială o impresie asupra felului în care noțiunea de probabilitate lucrează. De exemplu, care este probabilitatea ca aruncând o dată o monedă aceasta să pice pe „stemă”? Probabilitatea este de 50% pentru că sunt doar două rezultate posibile care pot surveni în urma aruncării monedei, respectiv „stemă” sau „ban” iar un astfel de rezultat nu este mai probabil decât celălalt. Mai mult, suntem siguri că la o aruncare a monedei, „stema” sau „banul” va apărea (probabilitate 1), după cum suntem convinși că ambele rezultate nu pot să apară simultan (probabilitate 0). Dar să revenim la chestiunea a ceea ce înseamnă probabilitatea ca un eveniment particular să se producă. Să presupunem că la un concurs, un săritor urmează să sară în lungime, de nouă ori. Rezultatele obținute sunt cele de mai jos:

Probabilitatea ca un eveniment să se producă este dată de proporția cazurilor în care evenimentul așteptat se produce într-o serie infinit de lungă și identică de experimente. În cazul de față, se constată existența a trei tipuri de sărituri – de evenimente – (de 2,9 m., 3m., 3,1m.), fiecare înregistrându-se de câte trei ori. Probabilitatea evenimentului “săritură de 2,9 m.” este de 33%, la fel ca și pentru evenimentele “săritură de 3,1 m.”, respectiv “săritură de 3 m.”. Trebuie reținută o concluzie importantă: Dacă toate realizările posibile sunt egal probabile, probabilitatea de apariție a unui eveniment este egală cu proporția de apariție a evenimentului. Există o oarecare similaritate între acest exemplu și cel legat de aruncarea monedei.

Să presupunem că la cursul de psihologie clinică sunt 100 de studenți și profesorul dă fiecăruia un calificativ, rezultând următoarea situație statistică.

Problema care se pune este de a găsi probabilitatea ca alegând la întâmplare un student din cei 100, acesta să fie un student cu calificativul „foarte bine”. În termenii definiției de mai sus, problema se poate reformula astfel: în ce procent ne putem aștepta să selectăm un student cu calificativul „foarte bine” din șirul de 100 de studenți examinați, dacă selectăm un student la întâmplare, îl reașezăm la locul lui, selectăm un altul, îl reașezăm ș.a.m.d.. Răspunsul este de 20/100=20%.

7.4 DISTRIBUȚII DE PROBABILITATE

Distribuția frecvențelor relative poate fi considerată ca distribuție de probabilitate. Fiecare distribuție arată toate realizările posibile și evenimentele la care sunt asociate realizările. Folosind exemplul de mai sus, frecvențele relative ne permit să stabilim probabilitățile de selecție aleatoare a unui student cu un anumit calificativ. Atâta timp cât se cunoaște distribuția de probabilitate sau o distribuție de probabilitate apropiată este ușor de răspuns la orice întrebare legată de probabilitate.

Abilitatea de a face inferențe statistice are la bază cunoștințe legate de distribuția de probabilitate apropiată situației analizate.

Revenind la exemplul cu aruncarea monedei, care este probabilitatea ca în urma aruncării acesteia de patru ori să cadă numai „ban”, o singură dată stema, de două ori „stema”, de trei ori „stema” sau de patru ori „stema”? Nu este nevoie să repetăm aruncarea de patru ori într-o infinitate de experimente pentru a răspunde la aceste întrebări. Întrucât se lucrează cu o variabilă dihotomică („ban” sau „stemă”), pentru a răspunde la întrebare se face apel la dezvoltarea binomială. Aplicată situației aruncării monedei de patru ori, cunoscându-se probabilitatea de apariție a „banului” de 50% și a „stemei” de 50%, dezvoltarea identifică probabilități teoretice care în cazul de față sunt:

Coloana 1 din tabel arată că sunt posibile cinci evenimente asociate aruncării monedei de patru ori. Astfel se pot obține 0 steme, 1 stemă, 2 steme, 3 steme sau 4 steme. Coloana 2 de frecvențe absolute indică numărul de realizări asociate evenimentului particular. Distribuția celor 16 realizări de-a lungul celor cinci evenimente arată că unele evenimente sunt mai probabile decât altele. De exemplu există o singură modalitate de a nu obține nici o „stemă” și anume situația în care în toate cele patru aruncări rezultă numai „ban”. Cu alte cuvinte, repetând experimentul de aruncare a monedei de patru ori, ne putem aștepta să obținem numai „ban” în 6% din cazuri. Opusă este situația în care se dorește să se afle probabilitatea de apariție a unui număr de două steme, situație în care identificăm șase cazuri posibile. Notând cu „s” evenimentul „stemă” și cu „b” evenimentul „ban”, situația “număr de cazuri”, în sensul celor menționate poate fi redată grafic astfel:

Probabilitatea de apariție a unui eveniment sau a altuia se obține prin adunarea probabilităților individuale.

În exemplul de mai sus, P0steme sau 4steme=0,0625+0,0625=0,125 sau, probabilitatea de obținere a cel puțin trei steme este egală cu P3steme+P4steme=25%+6,25%=31,25%, sau, probabilitatea de a obține cel mult o stemă este egală cu P0steme+P1stemă=31,25%.

Dacă vorbim de producerea evenimentului i și a evenimentului j și a evenimentului k ș.a.m.d. atunci calcularea probabilității de realizare necesită înmulțirea probabilităților. Să admitem că se administrează unor studenți un test cuprinzând cinci itemi, fiecare item având patru opțiuni de răspuns. Dorim să aflăm probabilitatea ca un student total nepregătit să ghicească întâmplător răspunsul corect la toți cei cinci itemi. Probabilitatea unui răspuns corect pe item este de 25% (1/4). Atunci probabilitatea de a da răspuns corect pe itemii 1, 2, 3, 4 și 5 este de 0,25·0,25·0,25·0,25=0,004. Într-adevăr improbabil! Aceasta înseamnă că studentul în cauză poate da răspuns corect la toți cei cinci itemi în numai 4 teste din 1000 administrate!

7.5 CURBA NORMALĂ CA DISTRIBUȚIE DE PROBABILITATE

Curba normală poate fi privită ca o distribuție teoretică de probabilitate. Așa cum am văzut, curba normală este un model matematic care specifică relația dintre suprafață și unitățile de deviație standard. Frecvențele relative ale curbei normale ca și cele ale dezvoltării binomiale sunt valori teoretice obținute prin aplicarea legilor probabilității. Dacă o distribuție de frecvențe poate fi aproximată fidel printr-o curbă normală, atunci proporția cazurilor întâlnite între două valori (scoruri) poate fi determinată folosind anexa A. Mai mult, așa cum o frecvență teoretică este echivalentă unei probabilități obținute din tabelul valorilor teoretice, tot așa putem privi curba normală ca o distribuție teoretică de probabilitate. În situațiile de mai jos vom explica cum poate fi utilizată curba normală pentru a răspunde întrebărilor care se pot pune în legătură cu probabilitățile evenimentelor.

PROBLEMA 1

Să presupunem că avem o distribuție normală de medie 100 și abatere standard de 15. Care este probabilitatea de selecție aleatoare a unui scor mai mare sau egal cu 115?

Calculăm cota z:

În anexa A căutăm corespunzător cotei z=1,00 valoarea asociată din coloana a treia și găsim că aceasta este de 0,1587. Deci, probabilitatea selectării unui scor mai mare sau egal cu 115 este de 15,87%. Reprezentarea grafică corespunzătoare acestei situații este cea de mai jos:

Fig. 7.1 Distribuția normală a scorurilor pentru și . Probabilitatea de selecție aleatoare a unui scor mai mare sau egal cu 115.

PROBLEMA 2

Care este probabilitatea de selecție aleatoare a unui scor mai mic sau egal cu 91?

Cota z corespunzătoare este:

Se caută valoarea corespunzătoare cotei în coloana a treia a anexei A și găsim valoarea de 0,2743. Deci probabilitatea de selecție aleatoare a unui scor mai mic sau egal cu 91 este de 27,43%.

Fig. 7.2 Probabilitatea de selecție aleatoare a unui scor mai mic sau egal cu 91.

PROBLEMA 3

Care este probabilitatea de selecție aleatoare a scorurilor situate la o distanță mai mare de două abateri standard de medie pentru o distribuție N()?

Căutăm valorile corespunzătoare în coloana a treia a anexei A și găsim că probabilitatea căutată este de sau de 4,56%.

Fig. 7.3 Probabilitatea de selecție aleatoare a scorurilor situate la o distanță mai mare de două abateri standard față de medie.

CAPITOLUL 8

DISTRIBUȚIILE DE SELECȚIE

Un eșantion aleator poate fi gândit în termeni generali ca unul pentru care șansa face selecția. Scala Stanford-Binet, după cum se știe, este normată având media de 100 și abaterea standard de 16. Astfel, un IQ de 116 pentru o vârstă de 10 ani reprezintă o deviație standard deasupra mediei în distribuția tuturor scorurilor IQ corespunzătoare vârstei de 10 ani.

Să presupunem că am selectat aleator un eșantion de volum n=64 din populația națională a scorurilor IQ pentru 10 ani și calculăm media. Reașezăm eșantionul în populație și selectăm aleator un al doilea eșantion de același volum pentru care calculăm media. Repetăm experimentul de mai multe ori. Mediile eșantioanelor vor diferi de media scorurilor din scala Stanford-Binet. Întrucât fiecare eșantion din populația națională a fost selectat aleator, ne așteptăm ca cele mai multe medii ale eșantioanelor să fie foarte apropiate de 100. Însă anumite medii rezultate ca urmare a variației de selecție se pot situa departe de media 100 (mai sus sau mai jos). Se pune întrebarea la ce medii de eșantion ne putem aștepta dacă procesul de selecție continuă? Care este probabilitatea de obținere a unei medii IQ de eșantion mai mari sau egale cu 110? Dar a unei medii mai mici sau egale cu 90? Dar a unei medii situate între 95 și 105? Răspunsurile la aceste întrebări constituie chei în evaluarea variației de selecție când se fac inferențe asupra unui grup mai mare, pornind de la datele parțiale ale grupului.

8.1 EȘANTIOANE ȘI POPULAȚII

Numim populație mulțimea indivizilor care au în comun cel puțin o caracteristică. Un eșantion este o submulțime a populației. Pentru scorurile statistice, eșantioanele și populațiile țin de resortul observațiilor. Dacă ne preocupă evaluarea inteligenței se are în vedere eșantionul și populația din care a fost selectat eșantionul. Mai mult, populația nu se referă în mod necesar la o întreagă țară, județ, sau oraș. O populație simplă se referă la orice grup despre care dorim să facem inferențe, nu contează cât de mare sau cât de mic este. De asemenea, o populație poate reflecta o mulțime teoretică de observații. Întrebarea care se pune este de ce totuși avem nevoie de eșantion? Răspunsul este că în multe cazuri este prea scump sau chiar imposibil de colectat fiecare observație din întreaga populație.

8.2 PARAMETRII ȘI STATISTICI

O statistică sintetizează o caracteristică a unui eșantion. Un parametru sintetizează o caracteristică a unei populații. Dacă de exemplu 34% din studenții unei facultăți în număr de 1000 sunt favorabili trecerii sistemului de evaluare de la note la calificative, acest fapt ne relevă o statistică care rezumă caracteristica unui eșantion, și anume, cum au reacționat cei 1000 de studenți la ideea schimbării sistemului de evaluare. Statistica este utilizată ca indicator al parametrului corespondent – „procentul tuturor studenților favorabili schimbării”.

Statisticile și parametri se notează folosind diverse simboluri. De exemplu, simbolizează statistica – “ media eșantionului ”, parametrul corespondent, „media populației” se reprezintă prin simbolul grecesc , – reprezintă „abaterea standard a eșantionului”, – „abaterea standard a populației”, r – „valoarea coeficientului de corelație în eșantion” iar – „valoarea coeficientului de corelație în populație”. Relația dintre aceste simboluri este cea redată mai jos:

8.3 MODELUL SELECȚIEI ALEATOARE

Modelul selecției aleatoare este folosit pentru a evalua influența factorilor întâmplării atunci când rezultatele eșantioanelor sunt supuse interpretării. Trebuie să ne asigurăm că eșantionul a fost selectat aleator dintr-o anumită populație de interes. Eșantionul este studiat în detaliu, și pe baza statisticilor și a ceea ce știm despre modul în care întâmplarea afectează eșantioanele aleatorii putem face inferențe despre caracteristicile populației.

Un eșantion aleator este un eșantion obținut dintr-o populație în așa fel încât fiecare eșantion posibil de mărimea specificată să aibă aceeași șansă de a fi extras.

8.3.1 REPARTIȚIA (DISTRIBUȚIA) DE SELECȚIE A MEDIILOR

Se pune întrebarea des formulată în statistica inferențială: ce rezultate probabile se pot obține în selecția aleatoare ca efect al implicării factorilor întâmplători? Revenim la scorurile IQ Stanford-Binet pentru care media este de 100 și abaterea standard de 16.

Să presupunem că la primul eșantion aleator de mărime n=64 înregistrăm o medie a scorurilor . La al doilea eșantion de aceeași mărime înregistrăm o medie . Pentru al treilea eșantion și procesul se poate continua la infinit.

Putem obține repartiția de selecție a mediilor dacă pentru mediile eșantioanelor se calculează frecvențele relative corespunzătoare. O repartiție de selecție a mediilor este o distribuție de probabilitate. În esență, este vorba de distribuția de frecvențe relative ale mediilor obținute de la un număr nelimitat de serii de experimente de selecție, fiecare experiment, constând din extragerea unui eșantion dintr-o anumită populație. Mai jos este prezentat intuitiv modul de formare a repartiției de selecție a mediilor.

Fig. 8.1 Formarea repartiției de selecție a mediilor.

Așa cum se poate observa din figură, repartiția de selecție a mediilor urmează o distribuție normală, cu mediile distribuite în jurul mediei populației (=100). Este evident că suntem în imposibilitatea de a construi distribuția din figura de mai sus datorită numărului infinit de experimente de selecție care sunt necesare acestui demers. Din fericire, matematicienii au fost capabili să obțină caracteristicile definitorii ale distribuției (media, abaterea standard și forma) și să spună ce se întâmplă dacă se realizează un șir infinit de experimente de selecție aleatoare.

8.3.2 CARACTERISTICILE REPARTIȚIEI DE SELECȚIE A MEDIILOR

Orice repartiție de selecție a mediilor este complet definită prin caracteristicile sale: media, abaterea standard și forma.

8.3.2.1 MEDIA REPARTIȚIEI DE SELECȚIE A MEDIILOR

Simbolizată prin , media repartiției de selecție a mediilor este egală cu media populației scorurilor, adică . Intuim că prin efectul întâmplării, anumite medii de eșantion se vor situa deasupra mediei populației și vor echilibra mediile inferioare mediei populației.

8.3.2.2 ABATEREA STANDARD A REPARTIȚIEI DE SELECȚIE A MEDIILOR

Abaterea standard a mediei într-o repartiție de selecție este cunoscută sub numele de eroarea standard a mediei și reflectă mărimea variației dintre mediile eșantioanelor. Eroarea standard a mediei se calculează din relația:

Pentru exemplul de mai sus unde =16 și n=64, eroarea standard a mediei este:

Efectele mărimii eșantioanelor asupra repartiției de selecție a mediilor sunt redate grafic în figura de mai jos.

Fig. 8.2 Distribuția scorurilor populației și distribuțiile de selecție ale mediilor pentru eșantioane de volum 3 și 9.

8.3.2.3 FORMA REPARTIȚIEI DE SELECȚIE A MEDIILOR

Dacă populația observațiilor este distribuită normal, repartiția de selecție a mediilor va fi de asemenea distribuită normal. Ce se întâmplă însă dacă distribuția populației nu urmează legea normală? Pentru această situație folosim următorul rezultat:

TEOREMA LIMITĂ CENTRALĂ

Repartiția de selecție a mediilor tinde către forma normală dacă mărimea eșantioanelor crește, indiferent de forma distribuției populației de la care eșantioanele au fost selectate aleator.

Cum lucrează mai exact această mărime? Teoria statistică spune că o mărime a eșantionului de n=25, ..,n=30 pare suficientă. În figura 8.3 este ilustrată tendința repartiției de selecție a mediilor de a se apropia de normalitate când n crește.

Fig. 8.3 Teorema limită centrală. Efectele mărimii eșantioanelor în reproducerea normalității repartițiilor de selecție a mediilor.

Așa cum se poate constata există două populații de scoruri; una dreptunghiulară și cealaltă pozitiv asimetrică.

Constatăm că pentru diferite volume ale eșantioanelor, formele distribuțiilor rezultate diferă de distribuțiile originale ale scorurilor. Folosind teorema limită centrală, curba normală poate fi utilizată la aproximarea repartiției de selecție a mediilor într-o mare varietate de situații practice.

8.4 UTILIZAREA REPARTIȚIEI DE SELECȚIE A MEDIILOR LA DETERMINAREA PROBABILITĂȚILOR; TIPURI DE PROBLEME

PROBLEMA 1

Care este probabilitatea de obținere a unui scor IQ mediu de eșantion mai mare sau egal cu 105?

Se știe că probabilitatea unui eveniment este egală cu proporția tuturor realizărilor posibile care favorizează producerea evenimentului. Întrebarea de mai sus poate fi reformulată astfel: Care este proporția tuturor eșantioanelor de volum 64 (de exemplu) care au medii mai mari sau egale cu 105? Presupunând că distribuția este caracterizată prin parametrii și, situația grafică pe care o reclamă problema este cea prezentată 8.4.

Fig. 8.4 Proporția eșantioanelor care înregistrează medii mai mari sau egale cu 105.

Pașii necesari pentru a răspunde problemei sunt:

Calculul erorii standard a mediei

Întrucât se utilizează curba normală la aproximarea repartiției de selecție a mediilor, trebuie stabilită poziția mediei eșantionului (=105). Într-o repartiție de selecție a mediilor, media eșantionului este scorul, media populației este media iar eroarea standard a mediei este abaterea standard. Deci, pentru media eșantionului, scorul z se determină din relația:

adică

Prin urmare, mediile eșantioanelor mai mari de 105 vor avea scoruri z mai mari de 2,5. Din coloana a treia a anexei A se găsește că proporția eșantioanelor care înregistrează medii mai mari sau egale cu 105 este de 0,62%.

PROBLEMA 2

Care este probabilitatea de obținere a mediilor scorurilor IQ (corespunzătoare eșantioanelor formate) care diferă de media populației (=100) prin cel puțin 5 puncte?

Pentru un scor IQ de 105, scorul z corespunzător este de +2,5 (dacă ) iar proporția eșantioanelor care înregistrează scoruri mai mari sau egale cu 105 este de 0,62%.

Fig. 8.5 Determinarea proporției eșantioanelor care înregistrează medii ce se abat de la media populației prin cel puțin 5 puncte.

Solicitarea problemei impune să se aibă în vedere și zona eșantioanelor care înregistrează medii mai mici sau egale cu 95. Având în vedere simetria curbei normale, probabilitatea de obținere a mediilor corespunzătoare care diferă de media populației prin cel puțin 5 puncte este de 0,62%+0,62%=1,24%.

PROBLEMA 3

Ce medie de eșantion se poate obține în așa fel încât probabilitatea de selecție aleatoare a uneia mai mari sau egale cu aceasta să fie de 0,05? Se cunoaște că și .

Procedura este acum inversată în sensul că se știe de probabilitatea de selecție aleatoare și trebuie determinată media eșantionului. Din anexa A identificăm scorul z dincolo de care aria curbei normale este de 5% din aria totală. Este vorba de scorul .

Presupunând că există interes doar pentru partea dreaptă a distribuției, semnul scorului z este pozitiv. Media eșantionului trebuie să se situeze la 1,65 abateri standard deasupra mediei populației. Relația de calcul a mediei corespunzătoare eșantionului are în vedere relația menționată mai sus:

de unde .

Fig. 8.6 Determinarea proporției eșantioanelor care înregistrează medii mai mari sau egale cu 103,3.

Concluzia este că printr-o selecție aleatoare nelimitată (a eșantioanelor de volum 64) ne așteptăm ca 5% din mediile eșantioanelor să fie mai mari sau egale cu 103,3.

PROBLEMA 4

Între ce limite întâlnim 95% din mediile eșantioanelor?

Dacă 95% din mediile eșantioanelor se situează în zona centrală, rezultă că celelalte 5% trebuie să se distribuie în mod egal în celelalte două zone (proxime zonei de 95%).

Fig. 8.7 Delimitarea zonei în interiorul căreia se înregistrează 95% din mediile eșantioanelor.

În anexa A, trebuie găsite z-turile corespunzătoare dincolo de care 5% din eșantioane înregistrează medii mai mari și mai mici decât mediile corespunzătoare identificate. Acestea sunt . În continuare, pentru determinarea celor două limite ale mediilor ne folosim de relația:

deci: limita inferioară

limita superioară

Concluzia este că 95% din medii vor fi cuprinse între 96,08 și 103,2.

8.5 IMPORTANȚA MĂRIMII EȘANTIONULUI

În exemplul de mai sus, 95% din mediile eșantioanelor sunt plasate într-un interval de 8 puncte în jurul mediei populației. Folosindu-ne de relația , intervalul în interiorul căruia se găsesc 95% din mediile eșantioanelor posibile va fi cu atât mai mare cu cât volumul eșantionului este mai mic. De exemplu, pentru n=16 eroarea standard a mediei este mai mare:

și prin urmare, limitele în care sunt cuprinse 95% din medii vor fi:

Din motive ușor de înțeles numim acest interval, interval de încredere pentru media populației. Pentru diferite mărimi ale eșantionului sunt prezentate mai jos limitele intervalelor de încredere pentru media populației, limite estimate cu o cotă de risc de 5%

Urmărind variația intervalelor de încredere ca urmare a variației volumului de eșantion, rezultă un principiu important utilizat în inferența statistică: creșterea volumului eșantionului conduce la creșterea acurateței în estimarea parametrilor populației.

CAPITOLUL 9

TESTAREA IPOTEZELOR STATISTICE

Dacă în capitolul anterior au fost expuse principalele aspecte ale teoriei selecției, în acest capitol vom trata modalitatea de aplicare a teoriei în testarea ipotezelor statistice. Este foarte important felul în care se formulează o problemă de testare a ipotezelor. Prezentăm în continuare un exemplu.

În țara noastră, învățământul la distanță a devenit învățământ de masă. Studiind situațiile rezultatelor la examenul de licență ne-am putea întreba dacă ar trebui ceva schimbat în politica acestui tip de învățământ. În măsura în care rezultatele obținute la examenul de licență de către studenții de la ID nu diferă semnificativ de cele obținute de studenții care urmează cursurile în mod regulat, acest fapt ar putea fi de natură să acrediteze ideea că exigențele la cele două tipuri de învățământ nu diferă și prin urmare ne putem aștepta la aceeași reușită a absolvenților celor două forme de învățământ pe piața muncii. Dacă da, atunci raționamentul imediat ne-ar putea duce la concluzia că scopul învățământului la distanță nu este unul de a oferi șanse egale în reușita pe piața muncii, urmărindu-se cu totul alte finalități.

Să presupunem că media națională de absolvire la examenul de licență este de 7,5. Emitem ipoteza că și media absolvenților învățământului la distanță (ID) este de 7,5. Pot rezulta două situații posibile: acceptarea ipotezei lansate sau respingerea ei.

9.1 IPOTEZELE STATISTICE

Ipoteza nulă – notată cu H0 susține că toate măsurătorile pe care dorim să le comparăm sunt egale iar eventualele diferențe se datorează exclusiv întâmplării. Este ipoteza care se testează statistic. În funcție de rezultatul testării se ia decizia de acceptare sau respingere a ei. Pentru exemplul de mai sus, ipoteza nulă este H0: =7,5.

Ipoteza alternativă – notată cu H1. În situația în care ipoteza este acceptată, decizia susține faptul că variația fenomenului studiat nu se datorează doar întâmplării ci și unor factori manipulați. Cu alte cuvinte, diferențele constatate sunt atât de mari încât nu pot fi explicate integral doar prin efectul întâmplării. Pentru exemplul dat, ipoteza alternativă se scrie: H1:≠7,5.

Există o anumită legătură între acceptarea sau respingerea ipotezei nule și riscul de eroare (pragul de semnificație) asumat de cercetător în luarea deciziei. În statistică riscul de eroare se fixează de obicei la 5%.

Așa cum se poate constata, ambele ipoteze se referă la populație și parametru și nu la eșantioane și statistică. Prin urmare în ambele ipoteze se menționează parametrul populației .

Să presupunem că am selectat aleator un eșantion de 100 studenți care urmează cursurile ID. Parametrii rezultatelor naționale la examenul de licență sunt: și . Media rezultatelor pentru cei 100 studenți investigați este de 6,3. Cât de probabilă este media acestui eșantion dacă în realitate media populației este de 7,5? Altfel spus, dacă eșantioane repetate de 100 studenți sunt selectate aleator din „populația națională” în care media absolvirii este de 7.5, ne întrebăm care sunt proporțiile mediilor care se abat de la media națională?

Pentru a răspunde la această întrebare avem nevoie să determinăm poziția relativă a mediei eșantionului între toate mediile eșantioanelor posibile dacă ipoteza H0 este adevărată. Cum putem determina ușor eroarea standard a mediei . Pentru distribuția de selecție se găsește:

În continuare, convertim media eșantionului de 6,3 în scor z.

Numărătorul fracției ne arată că media eșantionului de 6,3 se situează la 1,2 puncte sub media așteptată a tuturor mediilor eșantioanelor posibile iar aceste 1,2 puncte sunt echivalente cu –7,059 erori standard. Având determinată cota z, putem localiza poziția mediei eșantionului în distribuția de selecție și mai mult, putem evalua probabilitatea asociată valorii z calculate.

Cunoscând probabilitatea asociată mediei de 6,3 se pune întrebarea dacă aceasta are vreun efect în ceea ce privește ipoteza H0. O medie de eșantion care se abate la fel de mult ca media eșantionului de 6,3 este extrem de puțin probabilă. Într-adevăr, având un număr infinit de mare de eșantioane obținute din populația pentru care media națională este de 7.5, un procent extrem de mic din mediile eșantioanelor se vor abate mai mult sau la fel de mult ca media de 6,3. Poate fi aceasta o sugestie că H0 este falsă? Pentru a da un răspuns la această întrebare avem nevoie în sensul celor enunțate mai sus de o cotă de risc cu care vom lua decizia. În esență, cota α arată cât de rare trebuie să fie rezultatele eșantioanelor pentru a susține respingerea ipotezei nule. Să presupunem că se alege o cotă de risc de 5%.

Fig. 9.1 Regiunile de respingere pentru testul bilateral la valoarea critică .

Media eșantionului de 6,3 se plasează în afara regiunii de acceptare (7,50,171,96). Decizia statistică se formulează în termenii respingerii ipotezei nule. Concluzia este că rezultatele obținute de absolvenții formei de învățământ ID diferă semnificativ de media națională, concluzie susținută la o cotă de risc de 5%.

9.2 NIVELUL DE SEMNIFICAȚIE ȘI EROAREA DECIZIEI

Decizia de acceptare sau respingere a ipotezei nule depinde de “criteriul de raritate a apariției” și de faptul că nivelurile de semnificație de 0,05 și 0,01 sunt valori comune în această privință. Într-un anumit sens aceste valori sunt arbitrare. Nivelul de semnificație α este de fapt riscul cercetătorului de a-și asuma luarea unei decizii în privința ipotezei nule. În figura de mai jos se prezintă comportarea unui test bilateral în condițiile unei cote de risc de 5%. Dacă H0 este adevărată, acest lucru înseamnă că 5% din mediile eșantioanelor posibile vor conduce la concluzia că H0 este falsă!

Fig. 9.2 Test bilateral pentru . 5% din rezultate arată ca eronată decizia de respingere a ipotezei H0 când de fapt H0 este adevărată.

Când stabilim , ne asumăm de fapt riscul ca 5% din rezultate să cadă în zona de respingere a ipotezei nule. Respingerea unei ipoteze nule adevărate este o eroare de decizie și, exceptând revelația divină, nu avem nici o idee când o asemenea eroare se produce. Toate aceste aspecte ne conduc la următoarea concluzie:

Nivelul de semnificație α dă probabilitatea de respingere a lui H0 când în realitate aceasta este adevărată.

Pentru a reduce riscul luării unei decizii eronate, cercetătorul poate stabili α la un nivel mai scăzut, de pildă α=0,01 sau 0,0001. Să presupunem că am obținut un rezultat care se abate atât de mult de la medie încât probabilitatea de producere (apariție) este doar de p=0,002. În baza acestui criteriu putem spune că valoarea obținută nu este suficient de rară încât să ne conducă la respingerea lui H0 (0,002 > 0,0001). De cele mai multe ori însă, admitem ipoteza nulă chiar dacă intuim că decizia este falsă. Deci coborârea lui α crește probabilitatea de a face un alt gen de eroare; acceptarea ipotezei nule când de fapt aceasta este falsă. Nu este surprinzător faptul că acest „comportament decizional” este cunoscut ca un alt tip de eroare. Putem rezuma formularea acestei erori astfel: ”Reținerea unei ipoteze H0 false”.

Pentru a concretiza cele spuse într-un exemplu, să presupunem că ipoteza nulă (H0: μ=150) este testată bilateral la un nivel de semnificație α=0,05. Media eșantionului extras este de 152. Este însă posibil ca media reală a populației să fie de 154. În figura de mai jos, repartiția trasată prin linia continuă este repartiția de selecție corespunzătoare mediei de 150.

Fig. 9.3 Ipoteza nulă este falsă dar conduce la acceptarea ipotezei nule!

Repartiția corectă este cea reprezentată punctat, având media de 154. În testarea ipotezei nule pentru care μ=150, reprezentăm media eșantionului de 152 în repartiția desenată cu linie îngroșată. Relativ la această distribuție, valoarea nu se abate atât de mult încât să se plaseze în zona de respingere a ipotezei H0. Vom fi deci în situația acceptării ipotezei nule. Dar acceptarea este o decizie eronată. Putem constata că nivelurile (pragurile) de semnificație α=0,05 și α=0,001 sunt într-un anume sens valori compromise. Aceste valori tind să ne dea asigurarea că H0 nu va fi respinsă când în realitate se respinge (primul tip de eroare) sau că ele nu sunt suficient de mici să ridice probabilitatea de acceptare a ipotezei nule (al doilea tip de eroare). Trebuie să fim conștienți de faptul că în orice testare de ipoteză nulă nu putem ști dacă a fost făcută o eroare de decizie.

CAPITOLUL 10

ESTIMAREA STATISTICĂ

10.1 TESTAREA IPOTEZELOR VERSUS ESTIMAREA

Inferența statistică este procesul de extrapolare a rezultatelor înregistrate, de la nivelul eșantioanelor selectate la nivelul întregii populații (din care au fost selectate eșantioanele). Pe lângă testarea ipotezelor statistice, inferența statistică are în vedere estimarea statistică. Am văzut în paragraful anterior modul în care că am testat o medie de eșantion pe ipoteza nulă H0: μ=7,5. Cum media eșantionului a fost de 6,3 am respins ipoteza nulă la pragul de semnificație =0,05. Însă întrebările nu sunt epuizate. Ne-am putea întreba cât de mult s-ar putea abate media eșantionului de la media populației pentru a accepta ipoteza nulă? Sau, ar putea fi valoarea de 7,6 o valoare plauzibilă pentru media populației? Ce putem spune despre valorile 8, 8.5,.., ș.a.m.d.? Ce estimări rezonabile am putea da pentru media populației? Cele mai multe din întrebările statisticii pentru care testările de ipoteze ar putea oferi soluții mulțumitoare își găsesc răspuns și prin tratarea estimării. Totuși, există probleme pentru care testarea ipotezelor nu este indicată iar singura abordare relevantă rămâne estimarea statistică.

Să presupunem că directorul unei biblioteci universitare dorește să afle cât de mulți bani pe cap de student, în medie, sunt necesari pentru cumpărarea cursurilor. Procedurile de estimare sunt mult mai potrivite pentru a răspunde acestei întrebări. Să încercăm să ne gândim asupra înțelesului pe care l-ar putea avea formularea următoarelor ipoteze nule: H0: μ=50€ sau H0: μ=100€ sau … De fapt interesul directorului de bibliotecă este mai mult unul de ordin explorator. El dorește să estimeze media veniturilor studenților, pornind de la rezultatele eșantionului și nu testarea unei valori specifice mediei veniturilor indicată de H0.

10.2 ESTIMAREA CARACTERISTICII VERSUS ESTIMAREA INTERVALULUI

Am văzut anterior că o statistică este o estimare a unui parametru ( estimează ; estimează ; estimează și estimează ). Există numeroase exemple din viața cotidiană care solicită estimarea caracteristicilor. De exemplu, dacă în urma unui sondaj de opinie printre subiecții care s-au drogat rezultă că 60% dintre aceștia ar reveni la consumul de droguri, de fapt, dispunem de o estimare a caracteristicii “preferința celor care au consumat droguri”. O privire corectă asupra unei estimări făcute trebuie să aibă în vedere și alte aspecte, cum ar fi cele datorate variației de selecție. Este de acum un fapt bine cunoscut în statistică că eroarea de selecție generează eroare în estimarea caracteristicii. Dar cât de mult afectează eroarea de selecție estimarea caracteristicii? Am văzut că media de 6,3 nu este o estimare a mediei naționale și că, fără îndoială, aceasta se situează fie de o parte, fie de cealaltă parte a mediei populației.

În esență, un interval estimat este o plajă de valori în interiorul cărora pot fi stabilite cu încredere rezonabilă pozițiile parametrilor populației. De exemplu, am putea spune că media absolvenților ID la examenul de licență se situează între 5,8 și 6,9.

Există un raport de inversă proporționalitate între mărimea intervalului estimat și riscul cu care facem această estimare. Cu cât intervalul estimat este mai strâns cu atât și riscul pe care ni-l asumăm în a afirma că o caracteristică va lua valori în acest interval este mai mare.

10.3 ESTIMAREA INTERVALULUI DE ÎNCREDERE PENTRU MEDIE

În distribuția normală a scorurilor individuale, 95% din observații nu se situează la o distanță mai mare de 1,96 deviații standard față de medie. Sau, cu alte cuvinte media±1,96 abateri standard cuprinde 95% din toate scorurile. Examinând figura de mai jos, se constată că media se poziționează în interiorul intervalului .

Fig. 10.1 Distribuția mediilor eșantioanelor de volum n=100 extrase de la o populație pentru care și .

În figura de mai jos sunt prezentate intervalele pentru fiecare din cele 10 posibile eșantioane aleatoare de volum n=100, extrase din populația ale cărei caracteristici sunt menționate în figura de mai sus.

Fig. 10.2 Intervalul pentru fiecare din cele 10 eșantioane aleatoare de volum n=100 extrase dintr-o populația pentru care .

Revenind la exemplul cu media de absolvire a examenului de licență se pune întrebarea care ar fi plaja de valori în interiorul căreia se apreciază cu o probabilitate de 95% că se găsește media populației? Procedura este cea indicată mai jos.

Pasul I. Determinăm eroarea standard a mediei ():

Pasul II. Evaluăm relația:

Pasul III. Specificăm limitele intervalului

Pentru o cotă de risc de 1%, intervalul de încredere corespunzător este . În general, relația pentru calcularea intervalului de încredere al mediei, relație corespunzătoare unui nivel de semnificație este .

10.4 ESTIMAREA INTERVALULUI DE ÎNCREDERE ȘI TESTAREA IPOTEZELOR

Estimarea intervalului de încredere pentru medie și testarea ipotezelor statistice sunt două fațete ale aceleiași probleme.

Să presupunem că pentru un set particular de date statistice am aplicat un test bilateral ipotezei nule H0: μ=μ0 și am construit un interval de încredere pentru medie cu o cotă de risc de 5%. Două lucruri interesante rezultă din această practică:

dacă media se situează în afara limitelor de încredere ale intervalului pentru valoarea specificată, atunci ipoteza nulă se respinge.

dacă media se situează în interiorul intervalului de încredere pentru valoarea specificată, ipoteza nulă se acceptă.

Să revenim încă o dată la exemplul cu media de licență a absolvenților învățământului la distanță. Ipoteza testată a fost H0: μ=7,5 cu ipoteza alternativă H1: μ≠7,5. Media eșantionului studiat corespunde unui z statistic de -7.059, ceea ce conduce la respingerea ipotezei nule. Să comparăm această decizie cu intervalul de încredere de 95% pentru media absolvenților ID, respectiv. Observăm că intervalul construit nu cuprinde media națională ceea ce ne plasează în situația primei observații menționate mai sus.

Fig. 10.3 Testarea ipotezelor statistice și estimarea intervalului de încredere pentru valoarea specificată; ipoteza nulă H0: μ=7,5 este respinsă.

Să presupunem acum că „media națională” înregistrată la examenul de licență este de 6,4. Ea se regăsește în intervalul de încredere (5.96 ; 6.63) și prin urmare putem concluziona că este o valoare rezonabilă pentru media absolvenților ID. Calculând din nou cota z, obținem:

Cum -0,588-1,96 ipoteza nulă se acceptă, ceea ce încadrează acest caz în cea de-a doua observație menționată.

Fig. 10.4 Testarea ipotezei statistice și estimarea intervalului de încredere pentru media absolvenților ID. Ipoteza nulă H0: μ=6,4 este acceptată.

CAPITOLUL 11

TESTAREA IPOTEZELOR STATISTICE PENTRU MEDIE CÂND ABATEREA MEDIE PĂTRATICĂ ESTE NECUNOSCUTĂ

11.1 σ ESTE RAREORI CUNOSCUT

În paragrafele anterioare au fost prezentate principalele aspecte referitoare la testarea ipotezelor statistice și la estimare, luând în considerare o situație ideală în care abaterea standard a populației (σ) este cunoscută. Situația ideală menționată este nerealistă pentru că în practică σ este necunoscut, mai ales în cazul aspectelor comportamentale explorate de cercetători. În cazul în care σ este necunoscut, procedurile pentru verificarea ipotezelor statistice se schimbă, dar, secvența de etape este similară situației când σ este cunoscut, respectiv:

precizarea ipotezei nule, a celei alternative și stabilirea nivelului de semnificație;

construirea eșantionului și calcularea statisticilor necesare;

stabilirea cotei de risc pentru analiza statisticii testului;

luarea deciziei referitoare la ipoteza nulă.

Să presupunem că în urma unei examinări la scară națională în care s-a urmărit motivația pentru studiu a studenților, s-a constatat că în medie, studentul român dedică zilnic 4 ore pregătirii. Rectorul unei anumite universități este interesat de a avea un punct de vedere argumentat cu privire la motivarea studenților din universitatea sa. În acest scop el găsește că fiecare student alocă din timpul său 3,2 ore studiului (a se vedea tabelul de mai jos) și pornind de la această constatare dorește să afle dacă motivarea manifestată se abate sau nu de la „motivarea națională”.

11.2 ESTIMAREA ERORII STANDARD A MEDIEI

Dacă σ ar fi cunoscut, rectorul ar putea lua fără dificultate decizia cu privire la ipoteza nulă, folosind relația:

Cum σ este necunoscut, rectorul nu poate calcula și din acest motiv nu poate determina cota z corespunzătoare. Însă o estimare a lui σ poate fi utilizată pentru estimarea lui . Relația:

unde SS este suma pătratelor abaterilor de la medie este o bună estimare a abaterii standard a populației. Însă în general, abaterea standard a populației se calculează din relația:

Folosind datele exemplului prezentat mai sus, rezultă:

Estimarea erorii standard a mediei este:

ca eroare standard a mediei este abaterea standard estimată a tuturor mediilor eșantioanelor posibile de volum n=10, extrase aleator din populație.

11.3 TESTUL STATISTIC “t”

Când σ nu este cunoscut, trebuie utilizat un alt test statistic iar acest test este testul t. Relația corespunzătoare statisticii t este:

Folosind datele exemplului, obținem pentru tcalculat valoarea:

Așa cum se poate constata, singura diferență în calcularea lui t și z este substituirea lui prin . Din acest punct de vedere, ambele formule (pentru z și t) sunt aproape similare în sensul că fiecare reflectă diferența dintre media eșantionului () și valoarea mediei populației în unități de eroare standard a mediei ( sau ). Putem constata că t folosește două statistici ( și ) în timp ce z folosește o singură statistică (). Aceste aspecte ne arată că repartiția de selecție a lui t se abate semnificativ de la distribuția normală în cazul eșantioanelor mici. Distribuția (repartiția t) este cunoscută și sub numele de repartiția Student.

Calculul prezentat anterior arată că diferența dintre media eșantionului de care dispune rectorul și media populației este de 1,563 erori standard.

11.3.1 GRADE DE LIBERTATE

Înainte de a continua discuția pe marginea distribuției Student este nevoie să clarificăm problema gradelor de libertate.

Gradele de libertate (gdl) indică numărul de informații independente dintr-un eșantion. În calcularea statisticii t trebuie utilizate informațiile provenite din eșantion pentru evaluarea estimărilor și . Câte informații independente poate furniza eșantionul pentru acest scop? Răspunsul îl găsim în faptul că și deci se bazează pe abaterile observațiilor de la media eșantionului.

Să presupunem că avem un eșantion constituit din trei observații 3; 3 și 9. Media eșantionului este egală cu 5 iar deviațiile de la medie sunt –2; –2 și 4. Sunt aceste deviații independente între ele? Răspunsul este negativ pentru că suma lor trebuie să fie întotdeauna egală cu zero. Cu alte cuvinte, în măsura în care cunoaștem două dintre abaterile scorurilor (–2 și –2), a treia abatere trebuie să fie egală cu +4 pentru ca suma lor să fie nulă. Rezultă că ultima abatere este întotdeauna complet determinată de celelalte. În cazul nostru, din cele trei scoruri doar două sunt independente care sunt și gradele de libertate pe care ne bazăm în estimarea lui și . Generalizând, gradele de libertate disponibile într-un eșantion de volum n sunt în număr de n-1.

11.3.2 REPARTIȚIA DE SELECȚIA A LUI STUDENT

Când eșantioanele aleatoare sunt de volum mare, s este un bun estimator a lui , estimează bine pe și în consecință, t este apropiat de z. În acest caz, distribuția t va avea o comportare foarte asemănătoare cu distribuția normală. Pe de altă parte, când volumul eșantionului este mic, valoarea corespunzătoare va diferi substanțial de , deci și distribuția lui t în raport cu distribuția normală. Făcând legătura cu gradele de libertate, trebuie spus că pe măsură ce numărul gradelor de libertate scade, aplatizarea distribuției t este mai pronunțată (a se urmări graficul de mai jos).

Fig. 11.1 Trei distribuții Student pentru 5, 11 și grade de libertate.

Pentru volume de eșantion , distribuția t nu se deosebește practic de distribuția normală iar pentru un volum nelimitat, distribuția t și distribuția normală sunt una și aceeași.

11.3.2.1 OBȚINEREA VALORILOR CRITICE PENTRU STATISTICA “t”

În anexa B este prezentată tabelat repartiția lui Student utilizată pentru obținerea valorilor critice ale lui t. Tabelul cuprinde valorile critice dincolo de care se găsesc zonele de respingere atât în cazul unilateral cât și în cel bilateral. Prezentăm mai jos o secvență a acestui tabel, corespunzând unui număr de 8 grade de libertate.

În figura de mai jos se poate constata că 2,5% din aria plasată sub distribuția lui Student se află dincolo de cota t=2,306 în cazul unilateral și 5% în cazul bilateral. Similar și pentru cota t=3,355.

Fig. 11.2 Zonele critice ale repartiției lui Student pentru un număr de 8 grade de libertate (gdl=8).

EXEMPLU

Presupunem că dorim să testăm ipoteza nulă H0: μ=7,3 versus ipoteza alternativă H1: μ≠7,3 în condițiile în care media eșantionului este , volumul eșantionului n=10, eroarea standard estimată a mediei iar tcalculat=-0,278. Cota de risc pentru luarea deciziei o fixăm la α=0,05. În anexa B, valorile critice ale lui t pentru 9 grade de libertate sunt ±2,262. Aceste valori delimitează zonele de respingere de zona de acceptare (vezi figura de mai jos).

Fig. 11.3 Decizia asupra ipotezei nule H0 bazată pe distribuția Student cu nouă grade de libertate.

Cum |tcalculat|<tcritic se acceptă ipoteza nulă ceea ce înseamnă că media eșantionului () nu diferă semnificativ de media populației (μ=7,3).

11.4 NIVELURILE DE SEMNIFICAȚIE VERSUS VALORILE PROBABILITĂȚII “ P ”

Să admitem că ne aflăm într-un demers de testare a ipotezei nule H0: μ=100 iar pentru un eșantion de 25 observații obținem un tcalculat de +2,00. Distribuția t pentru 24 grade de libertate arată că un t de +2,00 este poziționat între valorile 1,711 și 2,064 (a se vedea figura de mai jos).

Fig. 11.4 Determinarea valorii P pentru un tcalculat când gdl=24.

Prin urmare dacă adoptăm ipoteza alternativă H1: μ>100, valoarea probabilității P se află undeva între 2,5% și 5%. Pentru ipoteza H1: μ≠100 valoarea P se situează între 5% și 10%. Dacă un rezultat este semnificativ din punct de vedere statistic, valoarea P este plasată sub nivelul reperelor de semnificație (α=0,05 sau 0,1) în timp ce dacă rezultatul este nesemnificativ, P-ul se plasează peste nivelul reperelor (a se vedea tabelul de mai jos).

VALOAREA “P”

Cercetătorul consideră că rezultatul este:

Limbajul utilizat de anumiți cercetători în descrierea rezultatelor poate fi confuz, tinzând să estompeze distincția dintre valoarea P și nivelul de semnificație. Spre exemplu putem întâlni un cercetător care să afirme că primul set de rezultate a fost semnificativ la un nivel de .05, al doilea set a fost semnificativ la un nivel de .001 iar pentru al treilea set, datele nu au fost semnificative la un nivel de .10. Înseamnă oare acest lucru că α=0,05 sau α=0,10 au fost utilizate pentru evaluarea celor trei seturi de rezultate? Aproape sigur nu, mai degrabă aceasta este o modalitate de raportare a celor trei valori P: P<.05 sau P<.001 și P>.10.

11.5 CONSTRUCȚIA UNUI INTERVAL DE ÎNCREDERE PENTRU MEDIE CÂND σ NU ESTE CUNOSCUT

Dacă σ este cunoscut, intervalul de încredere pentru medie se construiește folosind formula . Această relație necesită două modificări când σ nu este cunoscut; respectiv care substituie pe și care substituie pe , așa încât relația generală pentru construirea intervalului de încredere al mediei devine.

Exemplu:

Se cunosc următoarele date statistice: ; . Media populației se va găsi în intervalul la un prag de semnificație .

CAPITOLUL 12

COMPARAREA MEDIILOR A DOUĂ POPULAȚII ÎN CAZUL EȘANTIOANELOR INDEPENDENTE

12.1 DE LA O MEDIE LA DOUĂ MEDII

Există vreo deosebire între femei și bărbați în ceea ce privește abilitățile matematice? Afișează pacienții obsesiv – compulsivi simptome de febră atunci când primesc un medicament experimental comparativ cu cei ce primesc un placebo? Aceste întrebări și multe altele conduc la cele mai importante modalități de investigare statistică, constând în studierea diferenței dintre grupurile de observații. În fiecare caz trebuie selectate două eșantioane iar aceste eșantioane vor face obiectul comparării celor două populații corespunzătoare. Demersul este oarecum în contrast cu construirea ipotezelor pentru o singură populație, folosind un eșantion prelevat. Chiar dacă demersul pare oarecum schimbat (trecerea de la o medie la două) logica generală a testării ipotezelor statistice nu se schimbă.

Înainte de a începe compararea populațiilor, să clarificăm ce înseamnă faptul că eșantioanele sunt independente. Două eșantioane spunem că sunt independente dacă nici una din observațiile unui grup nu se află în vreun raport cu observațiile celuilalt grup. În contrast cu eșantioanele independente există eșantioanele dependente asupra cărora vom reveni mai târziu.

Să presupunem că sunt selectate aleator două grupuri de studenți pentru a fi supuse unui test de memorie. Primului grup i se prezintă elemente ajutătoare (relații, poziții etc.) care favorizează memorarea itemilor. Cel de-al doilea grup nu beneficiază de o asemenea asistență. Testul de memorie administrat constă în memorarea unui număr de 50 de itemi pe o durată de două zile. După ce grupurilor li s-au prezentat itemii, la două zile testul este reluat, de data aceasta cu sarcina de a solicita membrilor celor două grupuri reproducerea lor verbală sau scrisă. Mediile itemilor memorați de cele două grupuri sunt: și . În medie, primul grup reține mai mulți itemi decât al doilea. Înseamnă oare în mod necesar că diferența dintre cele două populații () este o diferență “adevărată” între cele două condiții în care s-a desfășurat experimentul, deci o diferență între mediile a două populații teoretice de observații? Dacă da, atunci ar trebui să susținem concluzia că memoria este „ajutată” de stabilirea unor relații între itemi. Dacă nu, putem fi siguri de acest lucru prin simpla inspectare a datelor pentru care suntem convinși că au fost afectate de variația de selecție întâmplătoare. Pentru a determina dacă diferența dintre cele două medii este suficient de mare pentru a indica diferența dintre , vom folosi aceeași logică generală ca și în cazul testării ipotezelor statistice referitoare la mediile populațiilor individuale.

12.2 IPOTEZELE STATISTICE

Folosind exemplul de mai sus, cele două ipoteze statistice sunt:

H0: μ1-μ2=0

H1: μ1-μ2≠0

Cea de-a doua ipoteză poate fi detaliată astfel:

H1: μ1-μ2>0 sugerează un efect pozitiv al înțelegerii relației dintre itemi.

H1: μ1-μ2<0 sugerează un efect negativ al acumulării de informație suplimentară despre itemi.

12.3 REPARTIȚIA DE SELECȚIE A DIFERENȚELOR DINTRE MEDII

Noțiunea de “repartiție de selecție a diferențelor dintre medii” nu este diferită de repartiția de selecție a mediilor. Vom admite că prezentarea relațiilor dintre itemi nu diferențiază cele două populații () și repetăm experimentul de mai multe ori. Reluarea experimentului de un număr nelimitat de ori conduce la distribuția de selecție a diferențelor dintre medii, care schematic este prezentată în figura de mai jos. Ceea ce trebuie reținut este faptul că distribuția de selecție a diferențelor dintre medii este dată de distribuția frecvențelor relative a diferențelor .

Fig. 12.1 Formarea repartiției de selecție a diferențelor dintre medii.

12.3.1 PROPRIETĂȚILE REPARTIȚIEI DE SELECȚIE A DIFERENȚELOR DINTRE MEDII

Distribuția de selecție a mediilor este definită prin medie, abatere standard și formă. Situația este similară și în cazul distribuției diferențelor dintre medii. Repartiția reprezentată mai sus descrie diferențele așteptate dintre mediile eșantioanelor dacă ipoteza nulă este adevărată. Utilizarea lui ca simbol pentru distribuția de selecție a diferențelor , impune ca .

Abaterea standard a diferenței dintre cele două medii () se calculează prin relația:

Expresia de mai sus, care se aplică doar la eșantioanele independente, arată că abaterea standard depinde de eroarea standard a fiecărei medii de eșantion. Dar , și, ridicând la pătrat, obținem . Prin urmare relația de calcul pentru poate fi scrisă în termeni de dispersii astfel:

12.4 ESTIMAREA

Sunt rare situațiile în care σ este cunoscut. În consecință trebuie calculată o estimare pentru eroarea standard () a mediei. Chiar dacă sunt implicate două eșantioane, necesitatea estimării erorii standard rămâne actuală. O importantă presupunere pe care o facem în demersul de estimare este aceea că dispersiile populațiilor sunt egale (). O extensie logică a acestei presupuneri este folosirea unei estimații a “varianței combinate” care să ia în considerare și și pe care o vom utiliza în evaluarea lui .

CALCULAREA LUI

Varianța este pătratul abaterii standard. Prin urmare varianța se calculează ca abaterea standard, exceptând extragerea rădăcinii pătrate. Deci

și

Pentru situația de față în care se lucrează cu dispersiile a două eșantioane este nevoie de o singură estimație . În acest sens va trebui să adunăm sumele pătratelor din ambele eșantioane și să împărțim rezultatul obținut la numărul gradelor de libertate . Deci

sau altfel exprimat

CALCULAREA LUI

Înlocuind în relația , prin , rezultă:

sau sau

unde sumele pătratelor SS1 și SS2 se pot calcula din relațiile:

respectiv .

12.5 TESTUL „t” PENTRU DOUĂ EȘANTIOANE INDEPENDENTE

Valoarea tcalculat pentru un singur eșantion depinde de diferența și de eroarea standard ().

Statistica t pentru două eșantioane independente are aceeași structură generală în sensul că se compară rezultatul cu condiția specificată de ipoteza nulă () iar ceea ce rezultă se împarte la eroarea standard ().

Cum însă , rezultă că statistica t se scrie:

și urmează distribuția Student cu grade de libertate.

12.6 TESTAREA IPOTEZELOR STATISTICE PENTRU MEDIILE A DOUĂ POPULAȚII INDEPENDENTE

Pașii necesari testării ipotezelor statistice sunt următorii:

Pasul 1

Formularea ipotezelor și stabilirea nivelului de semnificație .

H0: μ1-μ2=0

H1: μ1-μ2≠0

Pentru pragurile de semnificație se iau în considerare de regulă valorile α=0,05 și α=0,01.

Pasul 2

Stabilirea mărimii eșantionului și selectarea acestuia.

Pasul 3

Calculul statisticilor necesare.

Pasul 4

Identificarea regiunilor de respingere.

Pasul 5

Formularea deciziei statistice și a concluziei.

EXEMPLU

Succesul profesional al profesorilor este semnificativ influențat de trăsăturile individuale de personalitate. Folosind scalele CPI, o serie de cercetări au relevat ca semnificative pentru succesul profesional scalele de responsabilitate și comunalitate. Pentru a verifica acest rezultat presupunem că se extrag aleator două eșantioane de profesori (unul de profesori performanți (prin rezultate), iar celălalt de profesori ne-performanți). Rezultatele testărilor pentru un număr de 30 de profesori/eșantion au condus la obținerea următoarelor valori standard ale scalelor prezentate în tabelul de mai jos.

Calcule necesare pentru evaluarea statisticii “t”

Pentru profesorii performanți, sumele pătratelor abaterilor sunt:

Pentru profesorii ne-performanți, sumele pătratelor abaterilor sunt:

În continuare se obține:

Numărul gradelor de libertate este de 30+30-2=58

Deciziile statistice: Se respinge ipoteza nulă H0: μ01-μ02;

Se respinge ipoteza nulă H0: μ11-μ12;

Se acceptă ipoteza nulă H0: μ21-μ22.

CONCLUZII:

Responsabilitatea și comunalitatea influențează succesul profesional al profesorilor. Nu același lucru se poate spune despre autocontrol, cele două populații înregistrând valori sensibil egale.

Figura 12.2 Testarea ipotezelor nule H0i: μi1-μi2=0 versus ipotezele alternative H1i: μi1-μi2≠0 pentru o distribuție Student cu 58 grade de libertate.

12.7 ESTIMAREA INTERVALULUI DE ÎNCREDERE PENTRU DIFERENȚA μ1-μ2

Logica care stă la baza estimării intervalului de încredere pentru diferența μ1-μ2 este aceeași ca și cea care stă la baza estimării intervalului de încredere pentru μ. Intervalul de încredere pentru diferența se determină din relația:

Formula de mai sus este structural echivalentă cu , relație utilizată în determinarea intervalului de încredere pentru μ.

Folosind datele din exemplul prezentat, intervalele de încredere pentru diferențele dintre mediile celor două populații (profesori performanți și profesori ne-performanți) se determină după cum urmează:

În cazul scalei de responsabilitate:

În cazul scalei de comunalitate:

În cazul scalei de autocontrol:

În cazul scalei de responsabilitate, cu o încredere de 95% se apreciază că diferența dintre mediile populațiilor se află cuprinsă între 0,621 și 8,065. Prin urmare efectul responsabilității în succesul profesional este cuprins între 0,621 și 8,065. Așa cum putem constata, intervalul de încredere pe scala de responsabilitate nu include valoarea “0” specificată în ipoteza nulă și deci H0 se respinge. Raționamente similare se pot face și pentru celelalte două scale cu mențiunea că pentru scala de autocontrol, intervalul de încredere cuprinzând și valoarea „0”, ipoteza nulă se acceptă.

MĂRIMEA EFECTULUI

La calculul mărimii efectului se recurge pentru a aprecia statistic diferența dintre două medii. Mărimea efectului poate fi evaluată prin exprimarea sa ca măsură a abaterii standard combinate. Relația de calcul a mărimii efectului este:

Așa cum este calculată această mărime, ea pare a fi un scor z. Presupunând că fiecare distribuție este normală, putem utiliza anexa A pentru a interpreta mărimea efectului.

Datele din exemplul de mai sus conduc la următoarele rezultate: scombinat1=51,952; scombinat2=79,282; scombinat3=58,268; d1=0,084; d2=0,07 și d3=0,012. Diferențele dintre medii corespund unor deviații standard de 0,084; 0,07 și 0,012. Rezumându-ne la scala de responsabilitate, rezultatele obținute arată că media corespunzătoare profesorilor performanți este cu +0,084 abateri standard mai ridicată decât media profesorilor ne-performanți. Diferența de +0,084 este ilustrată în figura de mai jos unde se poate observa o nesemnificativă ne-sincronizare între cele două distribuții.

Fig. 12.3 Mărimea efectului: d=0,084.

Urmărind figura 12.3. b) se constată că 3,39% din subiecți, indiferent că sunt profesori performanți sau ne-performanți, înregistrează niveluri cotate pentru scala de responsabilitate cuprinse între cele două medii.

CAPITOLUL 13

COMPARAREA MEDIILOR PROVENIND DE LA EȘANTIOANE DEPENDENTE

Anterior s-a analizat problema evaluării diferențelor dintre mediile obținute de la două eșantioane independente. Câteodată designul cercetărilor necesită eșantioane dependente. În acest caz, observațiile unui eșantion se găsesc într-un anumit raport cu cele provenite din celălalt eșantion. Există două posibilități în care eșantioanele pot fi dependente. În primul caz, cele două medii și sunt calculate folosind evaluările acelorași indivizi, ceea ce este cunoscut sub numele de „designul măsurărilor repetate”. Scenariul „înainte-după” este un posibil exemplu: se selectează un eșantion, toți participanții completează un pre-test după care în cercetare se introduce o variabilă independentă, aceeași participanți supunându-se ulterior unui post-test. Interesul cercetătorului este orientat în acest caz în direcția evaluării și interpretării diferenței dintre media pre-testului și media post-testului. Să presupunem că se dorește testarea eficacității unui procedeu de slăbire în greutate. Pentru acest demers se selectează 30 de voluntari cărora li se înregistrează greutatea corporală înaintea aplicării procedeului și după. Dar participanții mai grei pot fi mai înalți decât ceilalți și vor tinde indiferent de efectul intervenției să se regăsească printre subiecții mai grei la sfârșitul procedurii. Același raționament și pentru participanții cu o greutate mai mică determinată de înălțimea mai mică. Dacă se calculează coeficientul de corelație Pearson pentru cele 30 de perechi de scoruri, ne așteptăm la o corelație pozitivă, ceea ce conduce la concluzia că scorurile ante și post nu sunt independente.

Eșantioanele pot fi dependente și altfel. Aici, indivizi diferiți sunt folosiți în două modalități ale studiului, dar, anterior formării grupurilor, cercetătorul caută să îi grupeze individ cu individ după anumite caracteristici esențiale și comune.

Să considerăm cazul în care se urmărește evaluarea capacităților de memorare la copii preșcolari cărora li se solicită participarea la două tipuri de teste. Înainte ca fiecare copil să primească un astfel de tip se va încerca o grupare a lor în perechi de câte doi în funcție de rezultatele înregistrate la un test de evaluare a ușurinței memorării. Admițând că studiul include un număr de 100 copii, ar rezulta 50 de perechi de copii cu abilități de memorare sensibil egale. Apoi se vor selecta aleator copii care se vor supune primului test și cei care se vor supune celui de-al doilea test. În urma evaluării rezultatelor înregistrate la cele două teste A și B se vor calcula mediile obținute la fiecare test. Pentru cei 100 de copii împărțiți în 50 de perechi ne așteptăm la scoruri ridicate în variantele A și B pentru perechile care manifestă abilități de memorare și scoruri scăzute în variantele A și B pentru perechile care manifestă abilități scăzute. Astfel, identificăm o tendință de asociere a scorurilor „de tip A” cu scorurile de „tip B”. Constatând o corelație pozitivă între perechile de scoruri, apreciem că cele două eșantioane nu sunt independente.

13.1 EROAREA STANDARD A DIFERENȚEI DINTRE MEDIILE DEPENDENTE

Când eșantioanele sunt dependente, eroarea standard a diferenței dintre medii trebuie să ia în considerare gradul de corelare dintre perechile de scoruri. Formula de estimare a erorii standard este în acest caz:

unde , sunt estimațiile dispersiilor celor două populații, – corelația dintre scorurile și , și – estimațiile abaterilor standard iar este numărul de perechi de observație. Dacă scriem fracția de sub rădăcina pătrată sub forma , formula de mai sus poate fi comparată cu eroarea standard estimată pentru eșantioane independente:

EȘANTIOANE DEPENDENTE EȘANTIOANE INDEPENDENTE

Pentru aceste formule diferă, având în vedere următorul aspect: în cazul eșantioanelor dipendente, estimările și sunt utilizate separat la calculul dispersiilor pentru cele două populații, în timp ce pentru eșantioanele independente, estimarea este utilizată pentru ambele populații.

În cazul eșantioanelor perechi unde se poate arăta că:

Prin urmare unica diferență între cele două formule de mai sus este termenul în care apare , așa încât dacă eșantioanele sunt dependente, eroarea standard a diferenței dintre medii este mai mică decât cea corespunzătoare situației în care eșantioanele sunt independente ca urmare a corelației pozitive .

13.2 GRADE DE LIBERTATE

Dacă eșantioanele sunt dependente, numărul gradelor de libertate este unde este numărul de perechi. Când se dispune de două eșantioane independente de același volum, numărul gradelor de libertate este . Deci este același!

13.3 TESTUL “ t ” PENTRU DOUĂ EȘANTIOANE DEPENDENTE

Structura unui test t pentru eșantioane dependente este identică cu cea folosită la eșantioane independente.

Statistica t urmează distribuția Student cu grade de libertate. Utilizarea relației de mai sus poate fi greoaie întrucât este nevoie de calcularea coeficientului de corelație . Pentru ușurarea calculelor, de regulă se recurge la metoda diferențelor directe, metodă pe care o prezentăm în continuare.

METODA DIFERENȚELOR DIRECTE

Metoda diferențelor directe utilizează în contrast cu formula statisticii t, caracteristicile unei singure distribuții, distribuția diferențelor dintre scorurile celor două populații. În primul rând se evaluează diferențele între scoruri conform modelului de mai jos.

Dacă ipoteza nulă este adevărată, atunci media diferențelor dintre valorile pereche μD este egală cu zero. Prin urmare, ipoteza nulă H0:μ1-μ2=0 poate fi reformulată în termenii unei singure populații de diferențe H0:μD=0.

Eroarea standard, folosind metoda diferențelor se determină din relația:

unde este suma pătratelor diferențelor dintre scoruri, egală cu expresia .

Statistica t va avea o formă simplificată întrucât ipoteza nulă impune ca . Aceasta este:

EXEMPLU

Performanța matematică poate fi privită ca stare a deplinei concordanțe între capacitățile intelectuale ale subiectului și exigențele disciplinei matematice. La clasele inferioare se presupune că pe lângă metodele didactice tradiționale și jocul didactic (ca variabilă independentă) poate contribui la cristalizarea performanței. Pentru a verifica această ipoteză presupunem că avem la dispoziție două grupuri; unul experimental iar celălalt de control. La grupul experimental se îmbină metodele tradiționale și jocul didactic în timp ce la grupul de control se dispune predarea prin metode tradiționale. Atât participanții din grupului experimental cât și cei din grupul de control sunt supuși unor teste docimologice în variantele pre-test și post-test. Rezultatele sunt cele prezentate mai jos:

tcritic (0,05) – unilateral =+1,708

tcritic (0,05) – bilateral =+2,06

Decizia: Se respinge ipoteza nulă.

tcalculat (D1) și tcalculat (E1) urmează distribuția t a lui Student cu 25 grade de libertate. Datele din anexa B arată că în cazul testului bilateral, valoarea critică pentru statistica t la un nivel de semnificație de 0,05 este .

Fig. 13.1 Testarea ipotezei H0:μ=0.

Figura 13.1 arată că ambele valori pentru tcalculat sunt situate mult sub nivelul critic și deci, ipoteza alternativă se acceptă. Acest lucru ne indică faptul că variabila independentă a avut un aport semnificativ în dinamica performanței matematice, fapt relevat de altfel și de punctajele obținute la pre-test și post-test de subiecții ambelor grupuri.

Mergând mai departe cu analiza, putem emite ipoteza că performanța matematică este susținută prin abilități de atenție, capacități de memorie și evident prin inteligență.

EXEMPLU

Să presupunem că în urma unor evaluări, un număr de subiecți investigați au fost împărțiți în două grupuri; grupul 1 de performanță superioară și grupul 2 de performanță inferioară. Componenții fiecărui grup sunt supuși unui test de memorie, de atenție și bateriei de teste PORTEUS. Rezultatele prelucrărilor sunt cele prezentate în tabelul de mai jos:

Mediile și abaterile standard obținute în urma aplicării testelor de memorie, atenție și PORTEUS.

Pentru a evalua influența atenției, inteligenței și memorării testăm ipotezele nule H0i:μi1-μi2. Fiecare din cele două grupuri – grupul de performanță superioară (1) și grupul de performanță inferioară (2) – este format din 12 subiecți. Calculele corespunzătoare statisticii t sunt:

unde ASC este abaterea standard comună.

Memorie:

Atenție:

PORTEUS:

Întrucât tM, tA, și tP sunt mai mari decât , ipoteza nulă se respinge, ceea ce înseamnă că raportat la cele două grupuri, atenția, memoria și inteligența sunt factori care susțin performanța matematică.

Fig. 13.2 Testarea ipotezei nule H0i:μi1-μi2=0 versus H1i:μi1-μi2≠0.

ESTIMAREA INTERVALULUI DE ÎNCREDERE PENTRU MEDIA DIFERENȚELOR

Estimarea intervalului de încredere pentru media diferențelor provenite din evaluările participanților grupați în eșantioane dependente urmează aceeași procedură ca și în cazul eșantioanelor independente. Limitele intervalului de încredere rezultă din relația:

Folosind datele exemplului de mai sus, unde ; , și , se obține:

pentru grupul experimental, media diferențelor este cuprinsă între:

pentru grupul de control, media diferențelor este cuprinsă între:

Întrucât , și , relația extinsă a intervalului de încredere se scrie astfel:

CAPITOLUL 14

COMPARAREA MEDIILOR A TREI SAU MAI MULTE EȘANTIOANE INDEPENDENTE

În paragrafele anterioare s-au prezentat procedurile statistice de testare a ipotezei nule în cazul a două eșantioane independente. Ce se întâmplă dacă cercetătorul dispune de un număr mai mare de eșantioane independente? De exemplu, în cercetarea modului în care un stimul luminos amplifică sau diminuează viteza timpului de reacție pot fi ușor implicate trei sau mai multe grupuri. Ne-am putea întreba de ce nu folosim testul t și în aceste situații? Pentru aceste situații, folosirea testului t se dovedește a fi inadecvată după cum vom vedea în continuare.

Să presupunem că se dorește o analiză a modului în care subiecții „catalogați” în patru structuri de personalitate răspund la un test de atenție concentrată. Derularea cercetării va evidenția următoarele probleme:

în general, dacă am avea k structuri de personalitate implicate, numărul comparațiilor posibile ar fi de . În cazul exemplului prezentat este nevoie de comparații separate dacă fiecare structură de personalitate este comparată cu alta;

fiecare comparație utilizează informația provenită din două structuri (grupuri) implicate. Grupurile rămase conțin informații care vor face testele, statistic mai tari;

când cele șase comparații sunt finalizate, dispunem de șase biți de informație care vor indica ce structuri de personalitate se vor comporta mai bine în raport cu celelalte;

ultimul aspect, dar nu și cel din urmă, probabilitatea unei erori de decizie este crescută când cele șase comparații sunt finalizate. Cu alte cuvinte, există o probabilitate mai mare ca să fie declarate „diferențe semnificative” acolo unde în realitate nu există. Cele șase comparații nu sunt independente. Într-adevăr, dacă este mai mare decât și este mai mare decât , atunci trebuie să fie mai mare decât . Când comparațiile nu sunt independente, probabilitatea de a comite o eroare de decizie de genul celei indicate mai sus este mai mare.

Soluția la problemele semnalate a oferit-o Sir Ronald Aylmer Fisher prin așa numita analiză de varianță. În literatura de specialitate, analiza de varianță este cunoscută sub numele de ANOVA (analysis of variance).

14.1 TESTAREA IPOTEZELOR STATISTICE ÎN ANOVA UNIFACTORIAL

Analiza de varianță unifactorială permite compararea mediilor a două sau mai multe grupuri independente. Această analiză este foarte apropiată de cea realizată prin testul t la eșantioane independente iar dacă se dispune de două grupuri, analiza conduce la aceleași concluzii ca și testul t. De altfel, ne putem gândi la testul t ca la un caz particular al analizei de varianță unifactoriale, sau, dacă ne referim la ANOVA unifactorial ca la o extensie a unui test t la problemele implicând un număr mai mare de două grupuri. Dacă avem k grupuri, atunci la mediile corespunzătoare , , …, li se vor asocia mediile populațiilor , , …,. Pentru , putem formula ipoteza nulă versus ipoteza alternativă .

Să considerăm un experiment în care un număr de subiecți urmează trei tipuri de tratament. Dacă cele trei tratamente nu produc efecte diferite atunci se acceptă ipoteza nulă , iar cele trei distribuții corespunzătoare vor avea o reprezentare apropiată de cea de mai jos.

Fig. 14.1 Distribuțiile scorurilor înregistrate ca urmare a tratamentelor administrate dacă se acceptă ipoteza nulă . Factorul „tratament” nu produce efecte diferite.

După cum se poate observa, diferențele dintre cele trei medii sunt mici. În situația opusă, dacă există efecte ale celor trei tratamente în așa fel încât valorile mediilor să fie diferite, atunci ipoteza nulă se respinge iar distribuțiile asociate ar putea avea o reprezentare similară cu cea din figura de mai jos.

Fig. 14.2 Distribuțiile scorurilor înregistrate ca urmare a tratamentelor administrate. Ipoteza nulă se respinge. Efectul factorului tratament este observabil.

Să analizăm în continuare figurile prezentate în legătură cu tipurile de variație posibile: în interiorul grupurilor și între grupuri.

VARIAȚIA ÎN INTERIORUL GRUPURILOR

În interiorul fiecărui grup, observațiile individuale variază în raport cu media grupului. Acest fenomen este cunoscut sub numele de „variația intragrupuri” și este o consecință directă a variației inerente între indivizi care reacționează diferit la același tratament. Fiecare dintre cele trei grupuri de mai sus conține „variația intragrupuri”. Putem concluziona că variația intragrupuri este o variație inerentă care nu se datorează diferențelor produse de factorul tratament.

Tehnica ANOVA este legată de varianță ca măsură de bază a variației. Varianța înregistrată în cadrul unui grup este utilizată ca o estimare a varianței inerente generate de tratamentul particular în populație. (). Dacă facem presupunerea că varianța inerentă este aceeași pentru toate tratamentele (), atunci varianța inerentă „curățată” de influența „factorului tratament” poate fi reprezentată prin simbolul . Ca și în cazul estimării varianței combinate pe care am întâlnit-o la testul t pentru eșantioane independente (), cea mai bună estimare a lui se poate determina prin medierea sau combinarea celor trei varianțe (care contribuie la estimarea „varianței intragrupuri”).

VARIAȚIA ÎNTRE GRUPURI

Analiza celor două figuri de mai sus scoate în evidență variația mediilor , și , variație cunoscută sub numele de „variația intergrupuri”. Chiar dacă reflectă variația dintre mediile eșantionului, variația intergrupuri este de asemenea o reflectare a variațiilor inerente individuale. Să luăm cazul . Toți indivizii din cele trei populații vor obține același scor și deci mediile celor trei eșantioane nu variază între ele. Pe de altă parte, cu cât este mai mare variația inerentă dintre indivizi, cu atât este mai mare șansa de a se înregistra medii care să difere unele față de altele. Figura 14.2 prezintă situația când ipoteza nulă este falsă. Dacă se respinge ipoteza nulă, variația între , și va fi în consecință mai mare decât în cazul în care înregistrăm doar variație inerentă între indivizi. Aceasta este o altă modalitate de a spune că variația intergrupuri reflectă variația inerentă + efectul diferențiat al factorului tratament. Ca și variația intragrupuri, variația intergrupuri poate fi exprimată în termenii unei varianțe estimate („estimația varianței intergrupuri”). Dacă ipoteza nulă se respinge, atunci

.

RAPORTUL F

Raportul se numește raportul F. Acesta joacă un rol important în testarea ipotezei nule . Când admitem ipoteza nulă, și vor avea același conținut întrucât vor estima doar varianța inerentă , iar ca o consecință directă, raportul F va fi aproximativ egal cu 1. Când H0 este falsă, F este semnificativ mai mare decât 1 datorită efectului adițional din .

14.2 DIVIZAREA SUMEI PĂTRATELOR

Orice varianță poate fi calculată ca raport între suma pătratelor abaterilor de la medie și numărul gradelor de libertate. De exemplu, în cazul estimării varianței unui singur eșantion

sau, în cazul varianței combinate utilizate la testul t

În mod similar putem determina varianța intragrupuri și intergrupuri astfel:

;

SUMA PĂTRATELOR ABATERILOR INTRAGRUPURI (SSINTRAGRUPURI)

Pentru a calcula suma pătratelor abaterilor intragrupuri este nevoie să se evalueze la nivelul fiecărui grup pătratele abaterilor valorilor de la medie. Suma pătratelor abaterilor intragrupuri se determină prin cumularea tuturor pătratelor abaterilor calculate.

Numărul gradelor de libertate este egal cu (număr de observații din primul grup –1)+…+ (număr de observații din grupul k–1).

SUMA PĂTRATELOR ABATERILOR INTERGRUPURI (SSINTERGRUPURI)

Suma pătratelor abaterilor intergrupuri este egală cu suma pătratelor abaterilor dintre mediile grupurilor și media generală.

Numărul gradelor de libertate asociat sumei pătratelor abaterilor intergrupuri este egal cu numărul de grupuri –1.

SUMA PĂTRATELOR ABATERILOR TOTALE

Suma pătratelor abaterilor totale se determină din relația:

Această sumă se compune din SSintergrupuri și SSintragrupuri

Numărul gradelor de libertate asociate sumei pătratelor abaterilor totale este egal cu numărul total de observații –1.

EXEMPLU

Se consideră următoarele date statistice:

Pentru a determina suma pătratelor abaterilor totale, suma pătratelor abaterilor intragrupuri și suma pătratelor abaterilor intergrupuri folosim următoarele calcule:

nr. gradelor de libertate intragrupuri = (3-1)+(3-1)+(3-1)+(3-1)=8

nr. gradelor de libertate intergrupuri = 4-1=3

nr. gradelor de libertate (total) = 12-1=11

14.3 ESTIMAȚIA PENTRU VARIANȚA INTRAGRUPURI ȘI VARIANȚA INTERGRUPURI

(varianța inerentă)

Pentru exemplul de mai sus și . Dacă ipoteza nulă este adevărată, atât cât și vor estima varianța inerentă. Dacă ipoteza nulă se respinge, atunci acest lucru se datorează lui care este mai mare decât . Respingerea ipotezei nule marchează prezența efectului factorului analizat.

14.4 TESTUL F

Statistica F (Fisher) se calculează prin raportul:

Dacă ipoteza nulă este adevărată atunci raportul F urmează distribuția teoretică F prezentată în Anexa C. Ca și distribuția t, distribuția F reprezintă o familie de curbe cu diferite grade de libertate. Însă în cazul distribuției F trebuie luate în considerare gradele de libertate corespunzătoare lui și . Pentru și , distribuția F este cea prezentată mai jos.

Fig. 14.3 Distribuția lui F pentru 3, respectiv 8 grade de libertate.

Întrucât , ipoteza nulă se respinge.

ANEXA C

Anexa C conține valorile statisticii teoretice F corespunzătoare pragurilor de semnificație și numărului gradelor de libertate pentru variația intragrupuri și intergrupuri reprezentate pe linii respectiv pe coloane.

TABELUL ANOVA UNIFACTORIAL

Rezultatele calculelor, de regulă, se prezintă într-un tabel având următoarea structură:

sau, folosind datele exemplului

14.5 ANOVA UNIFACTORIAL ÎN SCORURI BRUTE

Sumele pătratelor obținute mai sus pot fi determinate folosind scorurile brute. În acest caz, calculele devin mai facile. Relațiile de calcul pentru sunt:

Pentru datele exemplului de mai sus, sumele pătratelor se calculează astfel:

Pentru calculul abaterilor standard intragrupuri se folosesc relațiile:

și . Deci

Raportul conduce la respingerea ipotezei nule în favoarea ipotezei alternative.

14.6 TESTUL LUI TUKEY (HSD)

Ne-am putea întreba care sunt sau unde identificăm diferențe semnificative? Între și ? Între și ? Între și ? Pentru a răspunde la aceste întrebări prezentăm în continuare testul HSD a lui Tukey. Acest test este folosit pentru a aprecia semnificația diferențelor dintre mediile populațiilor. Testul lui Tukey necesită determinarea valorii critice HSD pentru datele de care se dispune. Ipoteza egalității mediilor populațiilor se respinge pentru orice pereche de grupuri pentru care valoarea absolută a diferenței între medii este mai mare sau cel puțin egală cu valoarea critică calculată. Testul HSD este un test bilateral. Valoarea critică HSD se calculează folosind formula

unde q este o valoare care se preia din anexa F în funcție de nivelul de semnificație ales, numărul gradelor de libertate intragrupuri și numărul de grupuri. Pentru exemplul dat, și iar în anexa F valoarea critică identificată este de 4,53 la pragul de semnificație de 0,05. Deci valoarea HSD este

Determinarea tuturor diferențelor posibile se obține ușor dacă se construiește tabelul de mai jos.

În baza testului lui Tukey diferențele semnificative sunt , , și .

CAPITOLUL 15

ANOVA BIFACTORIAL

15.1 INTRODUCERE

Dacă în cazul ANOVA unifactorial grupurile analizate reprezintă niveluri ale unui singur factor sau ale unei variabile independente, în cazul ANOVA bifactorial cercetătorul investighează influența simultană a doi factori asupra caracteristicii (variabilei) rezultative.

Să ne plasăm în situația unui psiholog care vrea să știe dacă subiecții depresivi diferă de cei hiperemotivi în privința performanțelor înregistrate la un test de atenție concentrată, și, dacă diferite măsuri luate în timpul experimentului vizând creșterea presiunii de soluționare a sarcinii (eventual prin reducerea timpului acordat soluționării) afectează punctajele realizate. Am putea studia efectele separat, prin analiza influenței tipului de subiect și a efectului de creștere a presiunii timpului de soluționare asupra scorurilor înregistrate. Dar cea mai bună strategie pe care o poate adopta psihologul este cea a analizării simultane a efectelor celor doi factori într-un singur experiment și nu în două.

Există mai multe argumente favorabile recurgerii la ANOVA bifactorial, însă cel mai serios este acela că permite pe lângă surprinderea influențelor separate ale celor doi factori și surprinderea interacțiunii dintre factori. De exemplu, ne-am putea întreba cum sunt influențate performanțele depresivilor sau ale hiperemotivilor sub influența relaxării sau creșterii presiunii „timpului” de soluționare a testului. Strategia studierii influenței fiecărui factor în experimente separate nu permite evaluarea influenței interacțiunii dintre factori.

15.2 PROCEDURĂ

În linii mari, logica unui ANOVA bifactorial este similară unui ANOVA unifactorial, însă introducerea celui de-al doilea factor conduce la câteva calcule suplimentare după cum vom vedea în continuare.

Să presupunem că designul experimental adoptat solicită studierea influenței a doi factori, A și B. În cazul ANOVA unifactorial suma pătratelor abaterilor totale se compune din suma pătratelor abaterilor intragrupuri și suma pătratelor abaterilor intergrupuri. Pentru ANOVA bifactorial, suma pătratelor abaterilor intergrupuri este împărțită în trei surse de variație; factorul A, factorul B și factorul de interacțiune. Prin urmare, suma pătratelor abaterilor totale este egală cu

În continuare, estimațiile varianțelor asociate se determină din relațiile:

; ; ;

și estimează:

(varianța inerentă);

;

;

.

Dacă ipoteza nulă referitoare la factorul A este adevărată, și ar trebui să fie comparabile întrucât ambele măsoară varianța inerentă. Judecăți similare se pot face și în ce privește factorul și factorul interacțiune. Raporturile F corespunzătoare se determină din relațiile:

; ;

În cazul admiterii ipotezei nule, cele trei raporturi nu se abat semnificativ de la valoarea 1. Dacă însă F este cu mult mai mare decât 1 atunci variația de selecție nu va putea explica plauzibil această abatere, apreciindu-se că factorul pentru care este semnificativ în dinamica mărimii analizate.

15.3 Exemplu de design factorial de tipul

Să revenim la exemplul de mai sus. Presupunem că s-au oferit 16 voluntari care au fost repartizați în opt grupuri de câte doi. Opt voluntari prezintă hiperemotivitate iar ceilalți opt prezintă simptomele depresivului. Cele două manifestări vor fi grupate în factorul „afectare”. Pentru celălalt factor „presiunea timpului” sunt prevăzute patru niveluri (scăzută, moderată, crescută și foarte crescută). Datele sunt prezentate în tabelele de mai jos:

Repartizarea voluntarilor în condițiile derulării experimentului de tipul 2 x 4

Scorurile și mediile scorurilor realizate de participanții la experiment

În paranteză sunt prezentate scorurile corespunzătoare celor doi participanți pentru fiecare modalitate a presiunii timpului și tipului de afectare.

15.3.1 EFECTELE PRINCIPALE

Ipotezele nule corespunzătoare fiecărui efect principal* sunt:

efectul principal al factorului A (afectare):

efectul principal al factorului B (presiunea timpului):

Raportul statistic F corespunzător ipotezei ne arată dacă mediile și sunt semnificativ diferite. Similar, testul statistic F corespunzător ipotezei semnalează dacă mediile , , și sunt semnificativ diferite. Analizând datele din tabelul de mai sus, se constată că diferența generală de 9 puncte () în favoarea subiecților depresivi este egală cu media dintre 6 puncte în cazul unei presiuni scăzute a timpului (40-46), 7 puncte pentru o presiune moderată (43-50), 10 puncte în situația unei presiuni crescute (40-50) și 13 puncte în cazul unei presiuni foarte mari (39-52). Concluzia este că efectul principal al unui factor are semnificația unui efect mediu.

15.3.2 INTERACȚIUNEA

Folosind contextul exemplului prezentat, întrebarea pe care o ridică „interacțiunea dintre factori” este dacă diferența dintre subiecții depresivi și cei hiperemotivi manifestată în testarea atenției concentrate este aceeași indiferent de modalitățile factorului „presiunea timpului”. Dacă testul pentru evaluarea interacțiunii conduce la concluzia că aceasta este semnificativă atunci se poate concluziona că diferențele comportamentale dintre depresivi și hiperemotivi nu sunt aceleași pentru toate modalitățile factorului „presiunea timpului”. Prin urmare, referitor la problema interacțiunii se poate formula următoarea concluzie generală; atunci când nu există interacțiune, diferențele dintre populații înregistrate în raport cu nivelurile unui factor sunt aceleași indiferent de nivelurile celuilalt factor. Situația este inversă în cazul respingerii ipotezei nule corespunzătoare.

Noțiunea de interacțiune devine mai clară dacă se recurge la reprezentarea grafică. În figura 15.1, cele opt puncte reprezintă comportamentele medii la sarcina de atenție concentrată pentru subiecții depresivi și cei hiperemotivi.

Fig. 15.1 Diferențele dintre mediile celulelor într-un experiment de tipul

Se remarcă pe grafic diferențe comportamentale între hiperemotivi și depresivi, fapt care atestă prezența interacțiunii între cei doi factori menționați. Interacțiunile pot fi slabe (nesemnificative) sau puternice (semnificative). Sunt aceste diferențe suficient de mari pentru a atesta statistic prezența unei interacțiuni semnificative? Pentru a înțelege mai bine prezența interacțiunii, lipsa absolută a acesteia este marcată de prezența aceleiași diferențe comportamentale (având în vedere scorurile înregistrate la testul de atenție concentrată) indiferent de nivelurile factorului „presiunea timpului” (figura de mai jos).

Fig. 15.2 Lipsa absolută a interacțiunii într-un experiment de tipul .

15.3.3 CALCULE NECESARE

Relațiile de calcul pentru ANOVA bifactorial sunt:

cu – numărul total de observații

unde r – numărul de linii, c – numărul de coloane, ncel – numărul de observații pe celulă.

Datele din exemplul prezentat sunt prelucrate în tabelul de mai jos.

Calcule necesare determinării sumelor pătratelor abaterilor în cazul ANOVA bifactorial

; ; ; , ; ;

; ;; ; ; ; ;

Sumele pătratelor abaterilor:

ESTIMAȚIILE VARIANȚELOR

Intragrupuri: estimează varianța inerentă

Factorul A: estimează + efectul factorului A

Factorul B: estimează + efectul factorului B

Interacțiunea: estimează +efectul interacțiunii

CALCULUL STATISTICILOR

Tabelul ANOVA bifactorial

STATISTICILE “F”TEORETICE

Întrucât pentru factorul afectare , concluzia este că acest factor prezintă o influență semnificativă în scorurile obținute la testarea atenției concentrate. În schimb, atât măsurile de gradare a presiunii timpului cât și factorul de interacțiune nu dețin aceeași influență. Concluzia este că indiferent de intensitatea măsurilor de reducere a timpului de soluționare, hiperemotivii și depresivii nu reacționează semnificativ diferit la sarcină.

CAPITOLUL 16

DISTRIBUȚIA ȘI FRECVENȚA OBSERVAȚIILOR

Până acum tratarea inferențelor statistice s-a făcut pe baza scorurilor unei variabile sau mai multor variabile. Însă nu întotdeauna cercetările statistice fac apel la scoruri. Vom vedea în acest capitol că în locul scorurilor, frecvențele marcând numărul de subiecți care aparțin categoriilor unei variabile pot fi utilizate cu succes în anumite condiții fixate de restricțiile cercetării. În acest caz, scopul fixat este acela de a face inferențe pe marginea repartiției de frecvențe a populației.

Deseori cercetarea psihologică face apel la caracteristici calitative. Exemple de caracteristici calitative sunt numeroase în psihologie (hiperemotivitatea, depresia endogenă, nevrotismul etc.). Evaluarea acestor caracteristici se face exclusiv prin prisma frecvențelor. Motivația evaluării caracteristicilor calitative prin frecvențe este dată de imposibilitatea măsurării lor directe.

Deși forma generală a “datei statistice” este schimbată – de la scoruri la frecvențe – logica de principiu a inferenței statistice nu se schimbă. De data aceasta avem de a face cu testarea ipotezei nule legate de proporțiile populației. În principiu dacă frecvențele observate se abat semnificativ de la cele așteptate, ipoteza nulă se respinge.

În timp ce statisticile z, t și F sunt utilizate pentru testarea ipotezelor referitoare la mediile populațiilor, testul statistic utilizat pentru evaluarea frecvențelor este testul χ2. Mărimea lui χ2 reflectă cantitatea de discrepanță existentă între frecvențele observate și cele așteptate.

Să presupunem că într-o competiție de selecție pentru un program spațial se prezintă 5 candidați care sunt evaluați de 200 de specialiști. Rezultatele sunt cele prezentate mai jos.

Preferința examinatorilor

unde f0 sunt frecvențele observate iar Si sunt cei cinci subiecți competitori.

Întrebarea care se pune este dacă există diferențe semnificative între voturile acordate candidaților de asemenea manieră încât să clarifice problema desemnării câștigătorului. Menționăm faptul că frecvențele observate sunt date de numărul votanților favorabili fiecărui competitor.

Ipoteza nulă poate fi formulată astfel: nu există diferențe între cei 5 candidați din perspectiva voturilor favorabile pe care aceștia le primesc din partea examinatorilor, sau, fiecare candidat primește 20% voturi favorabile din totalul voturilor exprimate ( cu – proporțiile voturilor pentru competitorul ).

Ipoteza alternativă nu se poate exprima la fel de simplu. În esență se apreciază că proporțiile voturilor diferă și deci nu toate vor fi egale cu 0,20. Există mai multe forme ale ipotezei alternative. De exemplu dar ele sunt diferite de sau sau sau ș.a.m.d. Rezultă că cuprinde toate posibilitățile mai puțin cea pentru care proporțiile observate sunt egale.

Pe lângă frecvențele observate, statistica χ2 operează și cu frecvențele așteptate. Notate cu , ele se calculează prin multiplicarea proporției de 0,20 cu volumul eșantionului (în cazul nostru 200). De exemplu, pentru subiecții 1, 2, 3, 4, 5 acestea sunt:

cu .

Dacă se acceptă ipoteza nulă, atunci ne așteptăm să găsim valori apropiate sau sensibil apropiate între frecvențele observate și cele așteptate. Cât de rezonabile ar trebui să fie diferențele pentru a accepta ipoteza nulă? Definirea unei măsuri a discrepanței dintre frecvențele observate și cele așteptate este necesară.

16.1 STATISTICA : O MĂSURĂ A DISCREPANȚEI DINTRE FRECVENȚELE OBSERVATE ȘI CELE AȘTEPTATE

Introdusă de K. Pearson, statistica χ2 furnizează măsura discrepanței dintre frecvențele observate și cele așteptate. Relația de calcul a statisticii χ2 este cea prezentată mai jos:

Aplicând relația de calcul datelor din exemplu, se obține:

Formula de calcul a statisticii scoate în evidență următoarele proprietăți:

nu poate fi negativ;

cu cât discrepanța dintre frecvențele observate și cele așteptate este mai mare cu atât este mai mare;

este egal cu zero în cazul în care frecvențele observate sunt egale cu cele așteptate.

16.2 REPARTIȚIA DE SELECȚIE A LUI

Valoarea de 85 obținută pentru statistica exprimă discrepanța dintre frecvențele observate și cele așteptate. Ce valori pot fi anticipate rezonabil pentru această situație ca rezultat al acțiunii variației de selecție? Care este valoarea minimă a lui pentru ca ipoteza nulă să fie respinsă? Unde se poziționează valoarea obținută pentru în raport cu valoarea minimă (critică) menționată? Pentru a da un răspuns acestor întrebări este necesară analiza repartiției de selecție a lui . Să admitem că ipoteza nulă este adevărată. Admitem de asemenea că repetăm experimentul de mai multe ori în manieră identică. Ne așteptăm ca valorile lui să varieze de la eșantion la eșantion datorită acțiunii factorilor întâmplători implicați în selecția aleatoare. Distribuția valorilor obținute pentru dacă este adevărată urmează distribuția teoretică pentru 4 grade de libertate (conform exemplului prezentat). Ca și în cazul distribuției t, distribuția teoretică reprezintă o familie de distribuții.

Fig. 16.1 Repartiția de selecție a lui pentru 4 grade de libertate și valoarea critică pentru problema de selecție a candidaților.

Fig. 16.2 Repartiția de selecție a lui pentru

16.3 PROCEDURA DE APLICARE A TESTULUI

Aplicarea testului necesită parcurgerea următoarelor etape:

Etapa 1

Formularea ipotezelor statistice și fixarea nivelului de semnificație:

orice posibilitate în afara celei menționate mai sus.

Etapa 2

Stabilirea volumului eșantionului și selectarea unui eșantion de volum egal cu cel stabilit. În cazul exemplului prezentat, este vorba de selectarea a cinci candidați în vederea desemnării câștigătorului pentru participarea la programul spațial.

Etapa 3

Calculul statisticii

Etapa 4

Identificarea valorii critice. Dacă ipoteza nulă este adevărată, valorile urmează repartiția de selecție a lui cu grade de libertate. Folosind datele exemplului de mai sus, . Pentru a găsi valoarea critică a lui trebuie identificată valoarea corespunzătoare în anexa D, localizată la intersecția liniei care desemnează cele 4 grade de libertate cu coloana corespunzătoare pragului de semnificație . Folosindu-ne de datele exemplului, această valoare este de 9,49.

Etapa 5

Construirea deciziei statistice și formularea concluziilor. Valoarea calculată pentru (=85) depășește cu mult valoarea critică și deci, ipoteza nulă se respinge. Concluzia care se poate trage este aceea că preferințele celor 200 de examinatori se abat semnificativ de la valorile așteptate în situația în care cei 5 concurenți ar fi fost la fel de bine pregătiți. Prin urmare, șeful comisiei de examinare va avea o misiune mult mai ușoară în alegerea câștigătorului.

16.4 APLICAREA TESTULUI ÎN CAZUL ÎN CARE CERCETAREA PSIHOLOGICĂ INCLUDE DOUĂ CARACTERISTICI.

EXEMPLU

Există un raport de cauzalitate între atitudinea copiilor și atitudinea părinților față de fumat? Aceasta este o posibilă întrebare, susceptibilă de a i se răspunde prin aplicarea testului în cazul în care se studiază un posibil raport de asociere între cele două atitudini. Pentru această problemă presupunem că se dispune de datele prezentate în tabelul de mai jos.

Frecvențe observate

Scopul studiului este de a vedea dacă există diferențe între atitudinea părinților și atitudinea copiilor față de fumat.

Tabelul de mai sus așa cum este el construit este un tabel de contingență în care este prezentată o distribuție de frecvențe bivariată cu liniile reprezentând atitudinea părinților (fumători / ne-fumători) iar coloanele reprezentând atitudinea copiilor (fumători / ne-fumători). Constatăm că dintr-un număr de 320 de subiecți 100 sunt părinți fumători și 220 sunt părinți ne-fumători. De asemenea, din cei 320 de subiecți, 50 sunt copii fumători iar 270 sunt copii ne-fumători.

Pasul următor al analizei urmărește calcularea proporțiilor observate, cunoscând frecvențele. Pentru acest exemplu, proporțiile sunt cele prezentate în tabelul de mai jos.

Proporțiile observate

Analizând rezultatele, se constată că există proporții diferite în ceea ce privește fumătorii și ne-fumătorii. Este de remarcat faptul că alegând la întâmplare un părinte fumător, șansa de a avea un copil ne-fumător este mai mică comparativ cu situația în care ar fi selectat un părinte ne-fumător. La fel în situația în care selectăm la întâmplare un părinte ne-fumător, șansa de a avea un copil care fumează este mai mică decât în situația în care am selecta un părinte fumător. Cu alte cuvinte atitudinea copiilor este contingentă (dependentă) de atitudinea părinților, ceea ce pune în evidență un caz de asociere între cele două caracteristici.

IPOTEZA NULĂ

Ipoteza nulă în cazul studierii „asocierii” dintre două caracteristici pornește de la supoziția că acestea sunt independente. Pentru a trata independența caracteristicilor A și B, urmărim tabelul de contingență de mai jos.

Tabel de contingență pentru analiza asocierii dintre caracteristicile A și B

Cantitățile din paranteză sunt frecvențele observate iar literele grecești mici ( și ) desemnează non-caracteristicile.

Spunem despre două caracteristici și că sunt independente dacă:

(1)

(2)

(3)

(4)

Respectând proprietățile proporțiilor putem scrie de exemplu, relația (4) sub forma:

de unde (5)

Similar, relațiile (1), (2) și (3) pot fi scrise astfel:

(6)

(7)

(8)

Frecvențele din membrul stâng care apar în (5), (6), (7) și (8) se numesc frecvențe așteptate și semnifică frecvențele pe care le-am putea înregistra dacă cele două caracteristici și ar fi independente. Folosind datele exemplului de mai sus, frecvențele observate și cele așteptate (notate în paranteză) sunt prezentate în următorul tabel:

Frecvențele observate și așteptate

Cu aceste date putem determina statistica :

Numărul gradelor de libertate pentru un tabel de contingență cu N linii și M coloane este egal cu . În cazul tabelului de mai sus, . Dacă se reține ipoteza nulă atunci valorile urmează distribuția de selecție cu grade de libertate. Din anexa D, pentru un grad de libertate și un prag de semnificație , . Cum ipoteza nulă se respinge și deci se concluzionează că atitudinea copiilor față de fumat este dependentă de atitudinea părinților față de același subiect.

CAPITOLUL 17

TESTE NEPARAMETRICE

17.1 TESTE PARAMETRICE VERSUS TESTE NEPARAMETRICE

Testele statistice abordate anterior sunt cunoscute ca teste parametrice. Acestea implică ipoteze și / sau presupuneri referitoare la parametrii și distribuțiile populațiilor. Din fericire aceste teste sunt destul de robuste. O abatere reală de la presupunerile menționate nu poate invalida testul atâta timp cât volumul eșantionului este mare. Totuși, o problemă serioasă apare atunci când presupunerile făcute pe marginea distribuțiilor sunt profund afectate și mărimea eșantioanelor este mică. Pentru a compensa aceste neajunsuri statistica face apel la testele ne-parametrice. Aceste teste au calitatea de a fi mai puțin restrictive în sensul nuanțat mai sus (distribuție normală + volum mare de date). Ele se dovedesc mai puțin senzitive decât testele parametrice dacă distribuțiile de frecvențe sunt relativ normale iar volumul de date este mare. Prezentăm mai jos trei dintre cele mai utilizate teste ne-parametrice (testul Mann-Whitney, testul Kruskal-Wallis și testul semnului).

17.1.1 TRANSFORMAREA SCORURILOR ÎN RANGURI

Anumite teste solicită transformarea scorurilor în ranguri. Utilizarea rangurilor nu necesită nici un fel de condiții referitoare la forma distribuției populației, cu toate că cele mai multe (distribuții) pornesc de la ipoteza că „variabila” este continuă. Altfel, ne plasăm în domeniul variabilei discrete. În acest ultim caz apar situații de scoruri identice ceea ce ridică problema stabilirii rangurilor. Cea mai simplă procedură de determinare a rangurilor constă în atribuirea pentru fiecare scor identic a unui rang mediu, calculat ca medie a rangurilor care ar fi fost înregistrate dacă acestea ar fi fost diferite.

Suma rangurilor astfel fixate trebuie să fie egală cu , în cazul nostru . Într-adevăr .

17.2 TESTUL MANN-WHITNEY

Testul Mann-Whitney este o alternativă la testul t pentru eșantioane independente. Se aplică în situațiile în care eșantioanele sunt mici, distribuțiile datelor nu sunt normale iar datele pot fi prezentate sub formă de clasament. Logica testului este simplă și fără complicații.

Să presupunem că se dispune de două grupuri de câte 10 subiecți fiecare, pentru care distribuțiile scorurilor sunt cele indicate în tabelul de mai jos.

Așa cum se poate constata, scorurile grupului 1 sunt mai mici decât cele ale grupului 2 ceea ce explică și diferența dintre sumele rangurilor (). Refăcând componența grupurilor prin trecerea unor subiecți din grupul 2 în grupul 1 și invers, distribuția scorurilor, evident se modifică ca de altfel și diferența dintre sumele rangurilor (vezi tabelul de mai jos).

În ciuda acestor „intercalări” rămâne mai mică decât . O altă re-aranjare, ca în tabelul de mai jos, ne conduce la o echilibrare perfectă a celor două sume ale rangurilor:

Aceste exemple ilustrează semnificativ efectul întâmplării în dinamica rangurilor.

Testul Mann-Whitney este utilizat pentru a evalua discrepanța dintre sumele rangurilor a două eșantioane. Practic se urmărește să se vadă dacă discrepanța este suficient de mare pentru a nu mai putea fi explicată prin efectul întâmplării.

Pașii urmăriți pentru aplicarea testului Mann-Whitney sunt:

Stabilirea celor două grupuri. Dacă cele două grupuri nu sunt egale în volum, atunci grupul cel mai mic va fi considerat grupul 1;

Combinarea tuturor scorurilor într-o distribuție de volum . În situația identificării unor scoruri identice, pentru stabilirea rangurilor se aplică procedura de mai sus;

Se calculează suma rangurilor tuturor scorurilor în grupul 1. În anexa E sunt date valorile critice pentru , corespunzând testului unilateral la pragurile de: 0.005 ; 0.1 ; 0.025 și 0.05;

Localizarea liniei din anexa E corespunzătoare lui și luarea deciziei în funcție de următoarele situații:

a) . Dacă ipoteza alternativă este bidirecțională, se găsește intervalul pentru corespunzător pragului de semnificație egal cu . Ipoteza nulă (în situația în care nu există diferențe între cele două populații) este respinsă dacă este egală sau mai mică decât limita inferioară în anexă sau dacă este egală sau mai mare decât limita superioară;

b) . În cazul acestei ipoteze alternative unidirecționale se găsește intervalul pentru corespunzător pragului de semnificație egal cu . Ipoteza nulă se respinge dacă este egală sau mai mică decât limita inferioară indicată în anexă;

c). . Se aplică același raționament de mai sus cu deosebirea că ipoteza nulă se respinge dacă limita superioară indicată.

Pentru testul Mann-Whitney statistica utilizată dacă nu se urmăresc situațiile a), b) și c) este:

Se acceptă ipoteza nulă dacă .

EXEMPLU

Presupunem că două grupuri de subiecți hiperemotivi sunt supuse la două tipuri de tratamente de psihoterapie, rezultatele post-terapii fiind cele indicate prin scorurile de mai jos (scorurile mari – indică hiperemotivitate ridicată, scorurile mici – hiperemotivitate apropiată de nivelurile liminale ale emotivității).

Se solicită un punct de vedere argumentat statistic referitor la cele două grupuri, urmărindu-se în realitate eficacitatea terapiilor.

Calculăm rangurile pentru scorurile celor două grupuri.

În anexa E pentru n1=11, n2=11 și , valoarea critică corespunzătoare este cuprinsă între 87 și 166. Întrucât , se reține ipoteza nulă iar concluzia care se trage este că cele două terapii au fost relativ de aceeași eficacitate.

La același rezultat se poate ajunge calculând statistica z.

Valoarea critică a statisticii z la un prag de semnificație este . Cum se acceptă ipoteza nulă.

17.3 TESTUL KRUSKAL-WALLIS

Testul Kruskal-Wallis este o alternativă la analiza de varianță pentru cazul unifactorial. Logica de bază a testului Kruskal-Wallis este similară cu cea a testului Mann-Whitney.

Presupunând că urmăm procedura de combinare a scorurilor de la grupuri, scorurile fiind marcate cu ranguri de la la , în situația în care eșantioanele provin de la populații similare ne așteptăm ca sumele rangurilor pentru toate grupurile să fie relativ egale, eventualele diferențe datorându-se întâmplării. Dacă însă grupurile provin de la populații diferite ne așteptăm ca sumele rangurilor să difere semnificativ. Testul Kruskal-Wallis este destinat să măsoare aceste discrepanțe. Statistica necesară aplicării acestui test se determină din relația:

cu – suma rangurilor grupului k;

– numărul de cazuri în grupul k;

– număr total de cazuri.

Distribuția de selecție teoretică a lui aproximează distribuția . Pentru a aplica testul Kruskal-Wallis este nevoie să dispunem de cel puțin trei grupuri, fiecare având un volum . În testarea ipotezei nule se compară valoarea calculată a lui cu valorile critice pentru grade de libertate.

EXEMPLU

15 studenți de la 3 specializări diferite sunt solicitați să rezolve o problemă de atenție distributivă. Rezultatele sunt prezentate în tabelul din pagina alăturată.

Se solicită un punct de vedere statistic referitor la gradul în care cele trei specializări cultivă studenților capacități de atenție distributivă.

Se construiește distribuția tuturor scorurilor obținute. Fiecărui scor i se atribuie un rang de la 1 la 15.

Timpii de soluționare a sarcinii de atenție distributivă (min.) și rangurile corespunzătoare

Numărul gradelor de libertate = k-1=3-1=2, . Cum se acceptă ipoteza nulă, ceea ce înseamnă că la nivelul celor trei specializări studenții dispun de capacități sensibil egale de atenție distributivă.

17.4 TESTUL SEMNULUI

Testul semnului este o alternativă la testul t pentru eșantioane dependente. Este utilizat pentru a compara „calitatea” a două distribuții în condiții de dependență a eșantioanelor.

EXEMPLU

Un grup de subiecți incapabili de încredere în forțele proprii sunt evaluați pe o scala de încredere cu note de la 1 la 7. După evaluare, aceștia beneficiază de terapie de specialitate la sfârșitul căreia sunt supuși din nou evaluării. Rezultatele sunt cele prezentate în tabelul de mai jos.

Nivelul de încredere al subiecților ante și post terapie

Se cere să se aprecieze eficacitatea terapiei aplicate.

Pentru fiecare subiect se evaluează diferența dintre stările post și ante-terapie. Se calculează numărul diferențelor pozitive și negative. Ipoteza nulă se formulează astfel: Proporția diferențelor pozitive este egală cu proporția diferențelor negative (). În cazul exemplului prezentat, diferența pozitivă semnalează eficacitatea terapiei iar cea negativă – ineficacitatea. Folosirea testului solicită evaluarea valorile așteptate pentru numărul diferențelor pozitive și negative. Acestea vor fi așteptateașteptate, numărul de subiecți chestionați fiind de 10. Valorile observate sunt și . Calculând statistica , obținem:

Dar pentru un grad de libertate () și cum , se respinge ipoteza nulă. Întrucât rezultă că eficacitatea terapiei aplicate este dovedită.

Similar Posts