Statistica Psihologica Si Prelucrarea Informatica a Datelor
1 INTRODUCERE
Dicționarul explicativ al limbii române consemnează mai multe înțelesuri ale cuvântului statistică. Unul dintre acestea este „evidență numerică referitoare la diverse fenomene”. La sfârșitul unei transmisiuni televizate a unui meci de fotbal, de pildă, ni se prezintă o „statistică” privind numărul de șuturi pe poartă, numărul de cornere, numărul de cartonașe galbene și roșii etc. Într-un alt înțeles al acestui cuvânt, statistica este o ramură a matematicii, numită adesea statistică teoretică sau chiar statistică matematică, al cărei obiect de studiu îl reprezintă elaborarea unor metodele matematice de analiză a așa-numitelor „fenomene de masă”, indiferent de natura acestora. Cercetătorii din domeniul științelor omului și ale naturii vorbesc despre statistică într-un fel diferit, dar legat de primele două înțelesuri menționate, având în vedere aplicarea unor metode statistice pentru prezentarea și interpretarea rezultatelor unor investigații specifice.
În această carte se prezintă, în principal, statistica aplicată în psihologie. După evidențierea rolul statisticii în cercetarea psihologică, se trec în revistă câteva operații matematice de bază, necesare pentru a înțelege statistica. În restul acestui capitol sunt introduse câteva noțiuni fundamentale, folosite în statistică.
1.1 ROLUL STATISTICII ÎN CERCETAREA PSIHOLOGICĂ
Pentru psiholog și, în general, pentru cercetătorul în domeniul științelor omului, statistica este un set de metode și tehnici matematice de organizare și prelucrare a datelor, folosite cu scopul de a răspunde la anumite întrebări și de a testa anumite ipoteze. Datele sunt informații, în principal numerice, care reprezintă anumite caracteristici. De pildă, dacă dorim să cunoaștem nivelul de anxietate al unui grup, datele pot fi scoruri pe o scală de anxietate, iar tehnicile statistice ne ajută să descriem și să înțelegem aceste scoruri.
Științele omului folosesc o mare cantitate de date pentru testarea ipotezelor și formularea unor teorii. Este important de subliniat, însă, că strângerea datelor nu este, prin sine, suficientă pentru cercetarea științifică. Chiar și cele mai obiective și mai atent culese informații, luate ca atare, nu ne pot „spune” mare lucru. Pentru a fi utile, datele trebuie să fie organizate, evaluate și analizate. Fără o bună înțelegere a principiilor analizei statistice și fără o aplicare corespunzătoare a tehnicilor statistice, cercetătorul nu va putea înțelege semnificația datelor culese.
Analiza statistică este esențială în psihologie, ca și în celelalte științe ale omului. Se poate spune, chiar, că psihologia nu poate exista fără statistică. Pe de altă parte, rolul statisticii este limitat. Aceste trăsături pot fi explicate în raport cu cele trei etape principale ale unei cercetări. Astfel, în etapa formulării problemei de cercetare, cercetătorul formulează un enunț al unei probleme sau al unei întrebări la care cercetarea va încerca să dea un răspuns. Problema cercetării poate să provină din diferite surse, incluzând teorii, cercetări anterioare și comenzi de cercetare. Odată ce a fost formulată problema cercetării, procesul intră într-o a doua etapă, în care se iau decizii despre proiectul de cercetare și se aleg metodele și tehnicile de cercetare. În această etapă, cercetătorul decide ce tipuri de cazuri vor fi incluse în cercetare, cât de multe cazuri vor fi luate în considerare și în ce mod vor fi investigate acestea. După ce au fost investigate toate cazurile și au fost culese toate datele relevante, statistica devine realmente și în mod direct importantă pentru analiza rezultatelor. Este important de reținut că dacă cercetătorul și-a formulat greșit problema sau a proiectat greșit cercetarea, atunci cele mai sofisticate analize statistice sunt lipsite de valoare. Împrumutând un „principiu” din știința computerelor, putem spune că metodele și tehnicile statistice se supun regulii IGIG = „introduci gunoaie, ies gunoaie”. Oricât ar fi de utilă, statistica nu se poate substitui conceptualizării riguroase și nici alcătuirii unui proiect de cercetare corespunzător problemei avută în vedere.
Multe persoane care nu sunt cercetători trebuie să fie consumatori avizați de rezultate de cercetare prelucrate statistic. Statistica oferă adesea suport rațional pentru decizii ale managerilor din sistemul educațional, pentru consilierii educaționali, pentru psihologii clinicieni și pentru alte persoane ale căror profesii sunt legate într-un fel sau altul de științele omului. Oricare ar fi motivul pentru care se utilizează metode și tehnici statistice, atât cercetătorii, cât și „consumatorii” cercetărilor trebuie să înțeleagă ce fel de informații oferă statistica și ce fel de concluzii pot fi trase din aceste informații.
În această carte, statistica va fi privită ca un set de „instrumente”, indispensabil pentru creșterea cunoașterii în științele omului, iar nu ca un scop în sine. Ca atare, acest subiect nu va fi abordat „matematic”. Tehnicile statistice prezentate în capitolele care urmează sunt văzute ca instrumente folosite pentru a răspunde unor probleme de cercetare specifice psihologiei (altfel spus, această carte nu este destinată statisticianului profesionist, ci psihologului). Pe de altă parte, aceasta nu înseamnă că nu vor fi folosite anumite metode matematice. Această carte a fost scrisă cu intenția de a furniza îndeajuns material matematic pentru a se putea înțelege ce poate face statistica și cum face statistica ceea ce face. După ce veți parcurge întregul material, vă veți familiariza cu avantajele și limitele celor mai frecvent utilizate tehnici statistice și veți ști care dintre acestea sunt aplicabile unei mulțimi date de informații și unui scop dat al cercetării. În cele din urmă, veți putea întreprinde singuri analize statistice de bază ale datelor strânse din cercetări proprii.
1.2 MATEMATICA DE BAZĂ
În statistică sunt folosite metode matematice, de la cele mai simple până la cele mai complexe. Înțelegerea materialului prezentat în această carte nu cere o cunoaștere avansată a matematicii, ci doar o familiarizare cu aritmetica, algebra elementară și cu unele simboluri matematice folosite cu precădere în statistică. În această secțiune se întreprinde o scurtă trecere în revistă a unor concepte și operații aritmetice, pe care orice cititor cu o pregătire medie în domeniul matematicii o poate neglija.
1.2.1 OPERAȚII ARITMETICE DE BAZĂ
Statistica folosește din plin cele patru operații aritmetice de bază: adunarea (+), scăderea (), înmulțirea și împărțirea. Rezultatul unei adunări se numește sumă, iar rezultatul operației de scădere se numește diferență. Înmulțirea a două numere poate fi denotată algebric în trei feluri: X Y, (X) (Y) sau pur și simplu XY. Numerele care sunt înmulțite se numesc factori, iar rezultatul operației de înmulțire se numește produs. Împărțirea a două numere poate fi, de asemenea, denotată în trei feluri: X Y, X/Y sau . În notația folosită aici, X este numărătorul, Y fiind numitorul. Rezultatul operației de împărțire se numește cât.
Este important de reținut relația dintre înmulțire și împărțire. Astfel, câtul X/Y poate fi exprimat ca produsul (X) (1/Y). De exemplu, 15/5 = (15) (1/5) = 3.
1.2.2 OPERAȚII ARITMETICE CU NUMERE REALE
În aritmetica elementară suntem familiarizați cu numerele pozitive, i.e. numerele mai mari sau egale cu 0. statistica trebuie să folosească ceea ce matematicienii numesc numere reale. Numerele reale sunt toate numerele pozitive și negative, de la ∞ la +∞. Astfel, numerele reale includ nu numai numerele întregi pozitive și negative, ci și fracțiile și numerele zecimale.
Atunci când se folosesc atât numere pozitive, cât și numere negative într-o operație aritmetică, se vorbește despre numere cu semn. Uneori este nevoie să ignorăm semnul algebric, + sau , și să considerăm doar valoarea absolută a numărului – valoarea numărului indiferent de semnul algebric. De pildă, valoarea absolută (modulul) numărului 7, notată 7, este 7. În valori absolute, 7 = +7 = 7.
Semnul algebric din fața unui număr afectează rezultatul operațiilor algebrice. În cele ce urmează aceste efecte vor fi urmărite pe măsură ce se expun regulile pentru operațiile aritmetice.
Adunarea Dacă două numere au același semn, se adună valorile absolute și se reține semnul respectiv:
(10) + (25) = 35
(+15) + (+5) = +20
Dacă se adună două numere care au semne opuse, se scade valoarea absolută a numărului mai mic din valoarea absolută a celuilalt număr și se reține semnul numărului care are valoarea absolută mai mare:
(10) + (+15) = +5
(+5) + (25) = 20
Scăderea Când se scad numere, se schimbă semnul numărului de scăzut, după care se aplică regulile adunării:
(10) (+5) = (10) + (5) = 15
(10) (25) = (10) + (+25) = +15
Înmulțirea Dacă se înmulțesc două numere care au același semn, produsul este pozitiv, iar dacă se înmulțesc două numere care au semne diferite, produsul este negativ:
(10) (25) = +250
(10) (+15) = 150
Împărțirea Dacă se împart două numere care au același semn, câtul este pozitiv, iar dacă se împart două numere care au semne diferite, câtul este negativ:
1025 = +0,40
+1510 = 1,50
1.2.3 PROPRIETĂȚI ALE NUMERELOR REALE
Numerele reale au trei proprietăți importante, care sunt utilizate în formulele și calculele statistice: comutativitatea, asociativitatea și distributivitatea înmulțirii fașă de adunare.
Comutativitatea Două numere pot fi adunate sau înmulțite în orice ordine, rezultatul fiind același:
15 + 5 = 5 + 15 = 20
15 5 = 5 15 = 75
Asociativitatea Termenii unei adunări sau factorii unui produs pot fi grupați oricum, rezultatul fiind același:
10 + (15 + 5) = (10 + 15) + 5 = 10
(10) (15 5) = (10 15) 5 = 750
Distributivitatea Produsul unui număr X cu suma a două numere, Y și Z, este egal cu suma produselor lui X cu Y și lui X cu Z:
5(10 + 15) = 5(10) + (5 15) = 25
1.2.4 INDICATORI SPECIALI AI OPERAȚIILOR ARITMETICE
Doi indicatori speciali ai operațiilor aritmetice apar frecvent în statistică: exponentul, radicalul și operatorul însumării. Exponentul indică puterea la care este ridicat un număr. Astfel, X2 desemnează ridicarea la pătrat a numărului X sau, altfel spus, înmulțirea numărului X cu sine: X X, iar X4 desemnează ridicarea la puterea a pătrat a numărului X: X X X X.
Radicalul indică extragerea rădăcinii unui număr. În statistică apare cel mai frecvent extragerea rădăcinii pătrate a unui număr. Rădăcina pătrată a unui număr, indicată de simbolul √, este numărul real prin a cărui ridicare la pătrat se obține numărul inițial. Astfel, = 6, deoarece 62 = 36. Rădăcina pătrată a unui număr poate fi indicată și prin exponentul fracțional ½. De pildă, = 61/2 = 6.
Operatorul însumării, simbolizat de majuscula din alfabetul grecesc sigma, Σ, indică însumarea a ceea ce urmează imediat în expresia respectivă. Date fiind, de pildă, numerele
X1 = 3, X2 = 7, X3 = 4, X4 = 2, X5 = 8,
expresia , citită „sumă de X indice i de la i = 1 la 5” stă pentru suma
X1 + X2 +X3 + X4 + X5 = 3 + 7 + 4 + 2 + 8 = 24
Xi este simbolul general pentru numerele din seria de mai sus. Notația de sub Σ, i = 1, indică primul număr din sumă, X1 = 3, iar numărul înscris deasupra simbolului Σ arată până la al câtelea număr are loc însumarea, X5 = 8. În general, expresia
arată că însumarea începe cu primul număr din seria respectivă și se încheie cu cel de-al N-lea număr. Adesea, notațiile aflate deasupra și dedesubtul simbolului Σ sunt omise. Într-un astfel de caz, Σ indică însumarea de la primul număr până la ultimul.
Prezentăm în continuare două reguli privind operatorul însumării:
Regula 1 Rezultatul obținut prin aplicarea operatorului Σ la produsul dintre o constantă și o serie de numere este egal cu rezultatul obținut prin înmulțirea constantei cu suma numerelor din serie. În simboluri, dacă C este o constantă,
=
Fie constanta 2 și numerele X1 = 1, X2 = 3, X3 = 4, X4 = 7; atunci,
ste 7. În valori absolute, 7 = +7 = 7.
Semnul algebric din fața unui număr afectează rezultatul operațiilor algebrice. În cele ce urmează aceste efecte vor fi urmărite pe măsură ce se expun regulile pentru operațiile aritmetice.
Adunarea Dacă două numere au același semn, se adună valorile absolute și se reține semnul respectiv:
(10) + (25) = 35
(+15) + (+5) = +20
Dacă se adună două numere care au semne opuse, se scade valoarea absolută a numărului mai mic din valoarea absolută a celuilalt număr și se reține semnul numărului care are valoarea absolută mai mare:
(10) + (+15) = +5
(+5) + (25) = 20
Scăderea Când se scad numere, se schimbă semnul numărului de scăzut, după care se aplică regulile adunării:
(10) (+5) = (10) + (5) = 15
(10) (25) = (10) + (+25) = +15
Înmulțirea Dacă se înmulțesc două numere care au același semn, produsul este pozitiv, iar dacă se înmulțesc două numere care au semne diferite, produsul este negativ:
(10) (25) = +250
(10) (+15) = 150
Împărțirea Dacă se împart două numere care au același semn, câtul este pozitiv, iar dacă se împart două numere care au semne diferite, câtul este negativ:
1025 = +0,40
+1510 = 1,50
1.2.3 PROPRIETĂȚI ALE NUMERELOR REALE
Numerele reale au trei proprietăți importante, care sunt utilizate în formulele și calculele statistice: comutativitatea, asociativitatea și distributivitatea înmulțirii fașă de adunare.
Comutativitatea Două numere pot fi adunate sau înmulțite în orice ordine, rezultatul fiind același:
15 + 5 = 5 + 15 = 20
15 5 = 5 15 = 75
Asociativitatea Termenii unei adunări sau factorii unui produs pot fi grupați oricum, rezultatul fiind același:
10 + (15 + 5) = (10 + 15) + 5 = 10
(10) (15 5) = (10 15) 5 = 750
Distributivitatea Produsul unui număr X cu suma a două numere, Y și Z, este egal cu suma produselor lui X cu Y și lui X cu Z:
5(10 + 15) = 5(10) + (5 15) = 25
1.2.4 INDICATORI SPECIALI AI OPERAȚIILOR ARITMETICE
Doi indicatori speciali ai operațiilor aritmetice apar frecvent în statistică: exponentul, radicalul și operatorul însumării. Exponentul indică puterea la care este ridicat un număr. Astfel, X2 desemnează ridicarea la pătrat a numărului X sau, altfel spus, înmulțirea numărului X cu sine: X X, iar X4 desemnează ridicarea la puterea a pătrat a numărului X: X X X X.
Radicalul indică extragerea rădăcinii unui număr. În statistică apare cel mai frecvent extragerea rădăcinii pătrate a unui număr. Rădăcina pătrată a unui număr, indicată de simbolul √, este numărul real prin a cărui ridicare la pătrat se obține numărul inițial. Astfel, = 6, deoarece 62 = 36. Rădăcina pătrată a unui număr poate fi indicată și prin exponentul fracțional ½. De pildă, = 61/2 = 6.
Operatorul însumării, simbolizat de majuscula din alfabetul grecesc sigma, Σ, indică însumarea a ceea ce urmează imediat în expresia respectivă. Date fiind, de pildă, numerele
X1 = 3, X2 = 7, X3 = 4, X4 = 2, X5 = 8,
expresia , citită „sumă de X indice i de la i = 1 la 5” stă pentru suma
X1 + X2 +X3 + X4 + X5 = 3 + 7 + 4 + 2 + 8 = 24
Xi este simbolul general pentru numerele din seria de mai sus. Notația de sub Σ, i = 1, indică primul număr din sumă, X1 = 3, iar numărul înscris deasupra simbolului Σ arată până la al câtelea număr are loc însumarea, X5 = 8. În general, expresia
arată că însumarea începe cu primul număr din seria respectivă și se încheie cu cel de-al N-lea număr. Adesea, notațiile aflate deasupra și dedesubtul simbolului Σ sunt omise. Într-un astfel de caz, Σ indică însumarea de la primul număr până la ultimul.
Prezentăm în continuare două reguli privind operatorul însumării:
Regula 1 Rezultatul obținut prin aplicarea operatorului Σ la produsul dintre o constantă și o serie de numere este egal cu rezultatul obținut prin înmulțirea constantei cu suma numerelor din serie. În simboluri, dacă C este o constantă,
=
Fie constanta 2 și numerele X1 = 1, X2 = 3, X3 = 4, X4 = 7; atunci,
= (2 1) + (2 3) + (2 4) + (2 7) = 2 + 6 + 8 + 14 = 30
= 2(1 + 3 + 4 + 7) = 2 15 = 30
Regula 2 Rezultatul obținut prin aplicarea operatorului Σ la suma a două sau mai multe serii de câte N numere este egal cu rezultatul obținut prin aplicarea operatorului Σ la fiecare serie în parte și adunarea sumelor astfel obținute. În simboluri:
Fie seriile X1 = 2, X2 = 5, X3 = 3, X4 = 1 și Y1 = 1, Y2 = 3, Y3 = 4, Y4 = 7; atunci,
(X1 + Y1) + (X2 + Y2) + (X3 + Y3) + (X4 + Y4) =
= (2 + 7) + (5 + 9) + (3 + 6) + (1 + 5) = 9 + 1 + 4 + 9 + 6 + = 38
= (X1 + X2 + X3 + X4) + (Y1 + Y2 + Y3 + Y4) =
= (2 + 5 + 3 + 1) + (7 + 9 + 6 + 5) = 11 + 27 = 38
1.3 STATISTICI DESCRIPTIVE ȘI STATISTICI
INFERENȚIALE
Pentru cele ce urmează, este necesar să definim termenii variabilă, populație și eșantion. O variabilă este orice trăsătură care își poate schimba valoarea de la caz la caz. De pildă, trăsăturile sex, vârstă și venit sunt variabile O populație este un grup ce include toate cazurile de care este interesat cercetătorul. De pildă, toți cetățenii români cu drept de vot, toți studenții unei universități și toate țările europene sunt populații în înțelesul dat acestui cuvânt în statistică. În cele mai multe situații de cercetare, populațiile sunt prea mari pentru a fi cercetate. În astfel de cazuri se selectează o submulțime strictă a populației de referință, numită eșantion.
Tehnicile statistice se împart în două mari clase: statistici descriptive și statistici inferențiale. Statisticile descriptive sunt utilizate pentru a prezenta, clasifica și însuma scorurile (valorile) unei variabile. Dacă ne interesează descrierea unei singure variabile, atunci vom folosi statistici descriptive pentru a aranja și prelucra scorurile acelei variabile astfel încât informația relevantă să poată fi înțeleasă și evaluată rapid.
Statisticile inferențiale sunt utilizate pentru a face generalizări despre o populație pe baza studiului unui eșantion din acea populație sau, altfel spus, pentru a trage concluzii despre caracteristicile unei populații pe baza caracteristicilor corespunzătoare ale unui eșantion din acea populație.
1.4 NIVELE DE MĂSURĂ
Orice tehnică statistică implică utilizarea unor operații, precum ordonarea unor cazuri sau însumarea scorurilor unei variabile. Înainte de a utiliza o tehnică statistică, este necesară măsurarea variabilei de interes într-un mod sau, altfel spus, la un nivel de măsură care să justifice aplicarea operațiilor respective. De pildă, multe tehnici statistice cer adunarea scorurilor unei variabile. Aceste tehnici pot fi utilizate numai dacă variabila este măsurată într-un mod care permite operația matematică a adunării. Astfel, alegerea unei tehnici statistice depinde de nivelul la care a fost măsurată variabila. Nivelele de măsură ale variabilelor sunt clasificate într-o ierarhie, în funcție de complexitatea lor. Această ierarhie include, în ordinea crescătoare a complexității, nivelele nominal, ordinal, de interval și de raport.
1.4.1 NIVELUL NOMINAL
Măsurarea unei variabile la nivel nominal constă din clasificarea diferitelor cazuri în categoriile prestabilite ale unei variabile. La nivel nominal, clasificarea este singura procedură de măsurare permisă. Variabilele sex, denominația religioasă (apartenența religioasă declarată) și culoarea ochilor sunt exemple de variabile măsurabile numai la nivel nominal. La acest nivel categoriile nu pot fi ordonate după vreun criteriu, putând fi comparate unele cu altele exclusiv după numărul de cazuri clasificate în fiecare categorie. De pildă, dacă dorim să măsurăm denominația religioasă pentru un grup de persoane, prestabilim categorii precum Creștin–ortodox, Catolic, Protestant ș.a., dar nu putem ordona aceste categorii de la „superior” la „inferior” sau în vreun alt fel.
Criteriile (regulile) măsurării nominale corecte sunt următoarele:
Regula excluderii categoriilor Categoriile variabilei trebuie să fie reciproc exclusive, ceea ce înseamnă că nici un caz nu trebuie să facă parte din mai mult de o categorie. În raport cu această regulă, distingem două tipuri de erori: (1) cel puțin două categorii au cazuri în comun, fiecare categorie conținând și cazuri care nu aparțin celeilalte categorii; (2) cel puțin două categorii se află în raport de incluziune – orice caz care face parte dintr-o categorie face parte și din cealaltă categorie, nu și reciproc.
Regula exhaustivității categoriilor Trebuie să apară câte o categorie pentru fiecare manifestare a variabilei respective sau, altfel spus, fiecare caz de interes trebuie să facă parte dintr-o categorie. Având în vedere complexitatea manifestărilor variabilelor considerate în științele omului, pentru respectarea acestei reguli se obișnuiește să se adauge o categorie „Alții”/”Altele”.
Regula omogenității categoriilor Categoriile trebuie să fie omogene în termenii proiectului de cercetare urmărit, ceea ce înseamnă că proprietățile comune cazurilor repartizate în aceeași categorie trebuie să fie mai importante în raport cu scopurile cercetării decât proprietățile care diferențiază acele cazuri. Să presupunem, de pildă, că indivizii dintr-o colectivitate sunt clasificați în categoriile: folosește de obicei aspirină efervescentă, folosește de obicei aspirină obișnuită, folosește uneori un tip de aspirină și alteori celălalt tip de aspirină, nu folosește de loc aspirină. Aceste categorii vor fi apreciate ca omogene de un distribuitor de produse farmaceutice, în timp ce un distribuitor de cafea va prefera clasificarea acelorași indivizi în categoriile: consumă de obicei cafea naturală, consumă de obicei cafea solubilă, consumă uneori un tip de cafea și alteori celălalt tip de cafea, nu consumă de loc cafea.
În legătură cu măsurarea nominală, trebuie considerat și un al patrulea criteriu de acceptabilitate, conform căruia o clasificare trebuie să aibă sens teoretic sau, altfel spus, categoriile trebuie să poată fi folosită pentru explicație și înțelegere. Putem repartiza, de pildă, orice în univers în clasa bursucilor sau în clasa non-bursucilor, dar o astfel de clasificare nu ar avea nici o importanță pentru cunoaștere.
1.4.2 NIVELUL ORDINAL
În cazul măsurării la nivel ordinal, pe lângă clasificarea cazurilor în categorii, cazurile repartizate într-o categorie sau alta pot fi ordonate, comparându-le unul cu altul, de la „inferior” la „superior”, în funcție de gradul calitativ în care acestea posedă trăsătura măsurată. De pildă, variabila nivel de școlarizare este măsurabilă la nivel ordinal. Categoriile acestei variabile sunt adesea ordonate conform următoarei scheme: 1. nu a absolvit nici o școală; 2. a absolvit cel mult ciclul obligatoriu de învățământ;
3. a absolvit cel mult liceul; 4. a absolvit cel mult cursuri postliceale, neuniversitare; 5. a absolvit cel mult cursuri universitare; 6. a absolvit cursuri post universitare. Aceste categorii sunt exhaustive și reciproc exclusive și pot fi comparate în termenii numărului de cazuri pe care le conțin. În plus, categoriile și cazurile individuale pot fi comparate sub aspectul trăsăturii măsurate. Putem spune, de pildă, că un individ clasificat în categoria 2 are un nivel de școlarizare inferior unui individ clasificat în categoria 4, respectiv că un individ clasificat în categoria 4 are un nivel de școlarizare superior unui individ clasificat în categoria 2.
La nivel ordinal, deși există o „distanță” între oricare două cazuri aflate în categorii diferite, această distanță nu poate fi descrisă în termeni preciși. În exemplul nostru, nu suntem îndreptățiți să spunem, de pildă, că distanța dintre un individ aflat în categoria 2 și un individ aflat în categoria 3 este egală cu distanța dintre un individ aflat în categoria 3 și un individ aflat în categoria 4 și nici că un individ aflat în categoria 4 are un nivel de școlarizare de două ori mai mare decât un individ aflat în categoria 2.
Întrucât la nivel ordinal nu suntem îndreptățiți să presupunem că distanțele dintre cazuri sau scoruri sunt egale, iar operațiile de adunare, scădere, înmulțire și împărțire pot fi aplicate în mod legitim numai dacă intervalele dintre scoruri sunt egale, aceste operații nu pot fi aplicate variabilelor măsurate la nivel ordinal.
1.4.2 NIVELUL DE INTERVAL
În măsurarea la nivel de interval, pe lângă clasificare și ordonare, distanțele (intervalele) dintre oricare două cazuri aflate în categorii succesive sunt egale. Cu alte cuvinte, la acest nivel variabilele sunt măsurabile în unități care au intervale egale. În legătură cu timbrele dintr-o colecție, anul emiterii este un exemplu de variabilă măsurabilă la nivel de interval: timbrele repartizate într-o categorie sau alta pot fi numărate, se poate spune că un timbru emis, să zicem, în 1990 este mai recent decât unul emis în 1930, iar intervalele dintre două clase succesive sunt egale (un an). Pe de altă parte, deși distanțele dintre oricare două cazuri aflate în categorii succesive sunt egale, la acest nivel nu se poate determina măsura exactă (proporția) în care un caz aflat într-o categorie satisface trăsătura măsurată față de un caz aflat în altă clasă. În exemplul nostru, nu suntem îndreptățiți să spunem, de pildă, că un timbru emis în 1990 este de 60 de ori mai recent decât un timbru emis în 1930.
Este de remarcat că dacă într-o măsurare de interval apare un punct zero, acesta este doar un punct de referință arbitrar și nu un punct zero natural sau absolut, adică un punct care să reflecte absența caracteristicii măsurate. De pildă, un termometru cu lichid dilatabil (mercur, alcool etc.) măsoară temperatura pe o scală de interval (Celsius sau Fahreinheit) în care punctul zero (0C sau 0F) este doar unul dintre punctele de pe scala de măsură folosită și nu indică absența temperaturii. Ca atare, nu suntem îndreptățiți să spunem, de pildă, că dacă ieri temperatura a fost de +1C și astăzi sunt +10C, astăzi este de zece ori mai cald ca ieri.
Un exemplu de scală de interval în psihologie este dat de măsurarea unei trăsături de personalitate, precum nivelul de stabilitate emoțională. Nu suntem îndreptățiți să spunem că o persoană care a obținut un scor de 20 pe o scală de personalitate în privința acestei trăsături este de două ori mai stabil emoțional decât o persoană care a obținut scorul 10, deoarece nu există un punct zero absolut care să indice absența trăsăturii măsurate.
La acest nivel sunt permise toate operațiile matematice.
1.4.3 NIVELUL DE RAPORT
În măsurarea la nivel de raport, pe lângă toate trăsăturile unei măsurări de interval, se poate determina măsura exactă (proporția) în care un caz aflat într-o categorie satisface caracteristica măsurată, în raport cu un caz aflat într-o altă categorie și apare un punct zero natural, care reflectă absența caracteristicii măsurate. De pildă, înregistrarea vechimii în muncă a angajaților unei firme în ani împliniți produce date de raport, deoarece unitatea de măsură determină intervale egale, suntem îndreptățiți să spunem că un angajat cu 10 ani de vechime în muncă, să zicem are o vechime de două ori mai mare decât un angajat cu cinci ani de vechime în muncă și există un punct zero natural (0 ani vechime în muncă). Venitul, numărul de copii și numărul de ani de căsnicie sunt alte exemple de variabile măsurabile la nivel de raport.
Nivelul de măsură al variabilei (variabilelor) de interes reprezintă un criteriu necesar (nu și suficient) de selecție a tehnicilor statistice. De pildă, calcularea mediei aritmetice este justificată numai pentru variabilele măsurate la nivelele de interval și de raport, deoarece media aritmetică a unei mulțimi de date impune adunarea tuturor datelor respective și împărțirea sumei astfel obținute la numărul total de date.
De notat că în psihologie este uneori dificil de a stabili dacă o variabilă a fost măsurată la nivel ordinal sau la nivel de interval. Într-un astfel de caz, este util să se presupună că variabila a fost măsurată la nivel de interval, căci acest nivel permite aplicarea unor tehnici statistice mai sofisticate decât cele permise la nivel ordinal. O decizie de acest fel, însă, nu este lipsită de riscuri. În anumite situații este nevoie să se dovedească faptul că analiza statistică respectivă este corectă, de pildă prin analize separate ale datelor la ambele nivele de măsură și compararea rezultatelor. Dacă rezultatele astfel obținute sunt substanțial diferite, supoziția măsurării la nivel de interval trebuie să fie abandonată.
Stimulat de predarea statisticii la Facultatea de Psihologie a Universității Titu Maiorescu, am conceput această carte ca o introducere clară și concisă în statistica aplicată în psihologie. Măsura în care am reușit îndeplinirea acestui obiectiv o va da, firește, cititorul. Pentru aprofundarea unor concepte și metode statistice prezentate aici, recomand cu deosebire următoarele lucrări, din care am preluat multe exemple de analiză statistică: Joseph F. Healey, Statistics: A Tool for Social Research, Belmont, California, Wadsworth Publishing Company, 1984; Dennis E. Hinkle, William Wiersma și Stephen G. Jurs, Applied Statistics for the Behavioral Sciences, Boston, Houghton Mifflin Company, 1988; Gerald Keller și Brian Warrack, Essentials of Business Statistics, Belmont, California, Wadsworth Publishing Company, 1991; Leon F. Marzillier, Elementary Statistics, Wm. C. Brown Publishers, 1990.
GLOSAR
Date: informații, în principal numerice, care reprezintă anumite caracteristici.
Eșantion: o submulțime strictă a unei populații.
Nivel de măsură: ansamblu de proprietăți matematice ale unei variabile, determinat de procesul prin care variabila a fost măsurată.
Populație: grup care include toate cazurile de care este interesat cercetătorul..
Statistica: set de metode și tehnici matematice de organizare și prelucrare a datelor, folosite cu scopul de a răspunde la anumite întrebări și de a testa anumite ipoteze.
Statistici descriptive: tehnici statistice utilizate pentru a prezenta, clasifica și însuma scorurile (valorile) unei variabile.
Statistici inferențiale: tehnici statistice utilizate pentru a face generalizări despre o populație pe baza studiului unui eșantion din acea populație sau, altfel spus, pentru a trage concluzii despre caracteristicile unei populații prin caracteristicilor corespunzătoare ale unui eșantion din acea populație.
Variabilă: orice trăsătură care își poate schimba valoarea de la caz la caz.
2 PREZENTAREA DATELOR STATISTICE
Funcția de bază a statisticii descriptive este prezentarea clară și concisă a rezultatelor cercetării. În acest capitol sunt expuse o serie de tehnici de organizare și prezentare rezumativă a datelor: procente, proporții, raporturi, rate, distribuții de frecvențe, diagrame și grafice.
2.1 PROCENTE ȘI PROPORȚII
Imaginați-vă că sunteți șeful unui departament al unei mari companii de asigurări și că, dorind să prezentați directorului executiv al companiei o problemă de personal cu care vă confruntați, îi spuneți următoarele: „Oamenii din departamentul meu nu sunt suficient de bine plătiți. Deși din cei 154 de angajați permanenți ai companiei numai 37 sunt în departamentul meu, din cele 17832 de contracte de asigurare încheiate în companie anul trecut, 7321 au fost aduse de angajații din departamentul pe care îl conduc”. Probabil că după o astfel de prezentare, directorul executiv ar schița o grimasă de plictiseală și ar amâna elegant discuția pentru o dată neprecizată. Întrucât este vorba de compararea a câte două numere (personalul departamentului față de numărul total de angajați ai companiei și volumul de muncă din departament față de volumul total de muncă din companie pe timp de un an), procentele și proporțiile ar fi fost modalități mai convingătoare de prezentare a informației.
Definițiile matematice ale proporției și procentului sunt următoarele:
Formula 2.1 Proporție () =
Formula 2.2 Procent (%) =
în care = frecvența sau numărul de cazuri în fiecare categorie
n = numărul total de cazuri (numărul de cazuri din toate categoriile)
Următorul tabel ilustrează calcularea proporțiilor și procentelor:
Tabelul 2.1 Opinia față de interzicerea fumatului
în locurile publice (date fictive)
Pentru a afla proporția cazurilor din prima categorie (De acord cu interzicerea fumatului în locurile publice), notăm că avem aici 167 de cazuri (= 167) față de 269 de cazuri în eșantion (n = 269). Astfel:
Proporție () = = = 0, 621
Procedând la fel, aflăm proporțiile cazurilor din celelalte categorii. Rezultatele pot fi exprimate sub formă de procente. Astfel, procentul de cazuri din cea de-a treia categorie (Nu știu/Nu răspund) este
Procent (%) = = = 11,1%
Exprimarea rezultatelor prin procente și proporții este cu deosebire utilă atunci când dorim să comparăm grupuri de mărimi diferite. Să presupunem, de pildă, că am adunat următoarele date privind două universități:
Tabelul 2.2 Numărul de studenți înscriși pe specializări
la două universități (date fictive)
Întrucât numărul total de studenți înscriși diferă mult de la o universitate la alta, compararea numărului relativ de studenți înscriși pe specializări la cele două universități este greu de făcut numai pe baza frecvențelor. Care universitate, de pildă, are cel mai mare număr relativ de studenți înscriși la specializarea Psihologie? Pentru a înlesni comparațiile de acest fel, calculăm procentele de studenți înscriși pe specializări la cele două universități:
Tabelul 2.3 Procentul de studenți înscriși pe specializări
la două universități (date fictive)
Procentele prezentate în acest tabel permit identificarea atât a diferențelor, cât și a asemănărilor dintre cele două universități. De pildă, Universitatea A are un procent mai mare de studenți înscriși la specializarea Psihologie, deși numărul absolut de studenți înscriși la acest profil este mai mic decât la Universitatea B, iar la specializarea Sociologie, procentele sunt aproape aceleași.
Remarcați că sub fiecare coloană de procente am menționat totalul în date absolute sau, altfel spus, am menționat dimensiunea eșantionului. În general, dacă nu se menționează baza de comparație, atunci procentele și proporțiile nu ne spun nimic sau chiar ne pot induce în eroare. Să presupunem, de pildă, că o firmă care produce băuturi răcoritoare anunță că ultimul său produs are cu 20% mai puține calorii. Problema este: 20% mai puțin față de ce? Fără menționarea bazei de comparație, pretenția firmei respective este lipsită de sens. Unele reclame impresionează prin prezentarea unor proporții, cum ar fi „Două din trei persoane preferă marca X de produs mărcii Y”. Ce ați gândi despre o astfel de reclamă, dacă ați afla că, de fapt, au fost chestionate doar trei persoane? Cunoștințele de statistică își dovedesc utilitatea și în mai buna înțelegere și evaluare a informațiilor „statistice” prezentate în presa scrisă sau pe posturile de radio și televiziune.
O eroare care poate să apară în folosirea procentelor constă din încercarea de a aduna procentele ca și cum ar fi numere cardinale. Să presupunem de pildă, că producătorul național de energie electrică anunță creșterea prețului pe kilowatt cu 50%. Pentru „justificarea” acestei creșteri, producătorul arată că au crescut costurile de producție a energiei electrice, după cum urmează: prețul combustibilului folosit în termocentrale cu 10%, costurile investițiilor în retehnologizare cu 20% și cheltuielile cu forța de muncă cu 10%, în total, o creștere a costurilor cu 50%. O astfel de justificare este greșită. Doar o creștere cu 50% a tuturor costurilor ar justifica o creștere cu 50% a prețului pe kilowatt.
Revenind la exemplul dat la începutul aceste secțiuni, informația prezentată directorului executiv al companiei ar fi fost mai convingătoare dacă i-ați fi spus: „Deși în departamentul meu lucrează doar 24% din angajații companiei, oamenii mei au adus 41% din contractele de asigurare încheiate anul trecut în companie”.
2.2 RAPORTURI ȘI RATE
Să considerăm din nou tabelul 2.2. Cât de mulți studenți sunt înscriși la Științe economice în comparație cu cei înscriși la Psihologie în Universitatea B? Putem folosi frecvențele pentru a răspunde la această întrebare, dar un răspuns mai ușor de înțeles poate fi dat folosind un raport. Raporturile se calculează împărțind frecvența cazurilor dintr-o categorie la frecvența cazurilor din altă categorie, permițând astfel compararea categoriilor în termeni de frecvență relativă. Definiția matematică a raportului este următoarea:
Formula 2.3 Raport =
în care = numărul de cazuri din categoria i
= numărul de cazuri din categoria j
Raportul ne spune exact în ce măsură categoria i depășește în număr de cazuri categoria j. În exemplul nostru, raportul studenților înscriși la Științe Economice față de cei înscriși la Psihologie în Universitatea B este:
Raport = = = 1,48
Aceasta înseamnă că pentru fiecare student înscris la Psihologie există 1,48 studenți înscriși la Științe Economice.
Raporturile pot fi multiplicate cu 100 pentru a elimina virgulele. Astfel, raportul calculat mai sus poate fi prezentat ca 148, ceea ce înseamnă că pentru fiecare 100 de studenți înscriși la psihologie există 148 de studenți înscriși la Științe Economice.
Ratele se calculează împărțind numărul de cazuri reale (efective) la numărul de cazuri posibile pentru variabila de interes pe o anumită unitate de timp. De pildă, rata brută a natalității pentru o populație se calculează împărțind numărul de născuți vii la numărul total de persoane din acea populație pe an, câtul astfel obținut fiind înmulțit cu 1000. Se spune că rezultatul este exprimat în promile (0/00). Dacă, de pildă, într-un oraș cu 7000 de locuitori s-au înregistrat într-un anumit an 100 de născuți vii, rata brută a natalității este
Rata brută a natalității (0/00) = 0/00
Aceasta înseamnă că pentru fiecare mie de locuitori au fost în acel an 14,3 născuți vii.
Ca modalități de a exprima frecvențe relative, procentele, proporțiile, raporturile și ratele sunt utile în special atunci când dorim să comparăm diferite grupuri sau/și același grup în momente diferite.
2.3 DISTRIBUȚII DE FRECVENȚE
O distribuție de frecvențe este o dispunere a valorilor unei variabile care arată câte cazuri sunt conținute în fiecare categorie a variabilei respective. Construirea unei distribuții de frecvențe este, de regulă, primul pas în orice analiză statistică. Să presupunem că următoarele date reprezintă scorurile obținute de 180 de subiecți la un test de cunoștințe:
Tabelul 2.4 Scoruri obținute la un test de cunoștințe
Datele brute din tabelul 2.4 sunt greu de urmărit și greu de înțeles. Sub supoziția că este vorba despre date de interval, putem construi o distribuție de frecvențe listând scorurile diferite în ordine crescătoare și înregistrând frecvența de apariție a fiecărui scor. Distribuția de frecvențe astfel obținută este următoarea:
Tabelul 2.5 Distribuția de frecvențe a scorurilor
obținute la un test de cunoștințe
De notat că această distribuție de frecvențe redă și informația conform căreia în eșantionul considerat nu au fost obținute scorurile 26, 27, 28, 31 și 66, aflate între cel mai mic scor și cel mai mare scor.
În distribuția de frecvențe din tabelul 2.5 am inclus toate scorurile diferite cuprinse între cel mai mic scor și cel mai mare scor. Cu alte cuvinte, am clasificat datele într-un număr de grupuri sau clase egal cu numărul de scoruri distincte. După cum arată și acest exemplu, construirea unei distribuții în acest fel are drept rezultat o listă destul de lungă și nu tocmai clarificatoare. Atunci când numărul de scoruri distincte este mare, se optează pentru o prezentare mai compactă (mai puțin detaliată) a datelor, prin gruparea acestora în categorii mai largi, care, în cazul datelor de interval sau de raport, se numesc intervale de clasă. În tabelul 2.6 se prezintă o distribuție de frecvențe pentru datele din tabelul 2.4, în care apar 10 intervale de clasă, mărimea fiecărui interval fiind egală cu 5 unități. Adăugând și o coloană de procente pentru scorurile din fiecare categorie față de numărul total de scoruri vom spori claritatea prezentării.
Tabelul 2.6 Distribuția de frecvențe a scorurilor
obținute la un test de cunoștințe
(mărimea intervalului = 5)
Distribuția de frecvențe din tabelul 2.6 evidențiază predominanța relativă a scorurilor din intervalele 45–49 (23,33%) și 55–59 (20,56%). Pe de altă parte, gruparea scorurilor în acest tabel conduce la o pierdere de informație față de prezentarea din tabelul 2.5. Nu știm, de pildă, câți subiecți au obținut, respectiv, scorurile 35, 36, 37, 38 și 39, ci doar că sunt 18 scoruri în intervalul 35–39. Apoi, din tabelul 2.6 nu reiese că în eșantionul considerat nu au fost obținute scorurile 26, 27, 28, 31 și 66. Să mai notăm că, la rigoare, se poate spune că în distribuția de frecvențe din tabelul 2.5, mărimea fiecărui interval este egală cu o unitate.
În general, regulile de construire a unei distribuții de frecvențe pentru date de interval sau de raport în care se utilizează intervale de clasă de mărime diferită față de datele inițiale sunt următoarele:
Se decide asupra numărului de intervale de clasă care vor fi utilizate. Numărul de intervale de clasă nu trebuie să fie atât de mare încât să nu permită sesizarea predominanței relative a anumitor grupări de scoruri, dar nici atât de mic încât să conducă la pierderea unor informații semnificative. De regulă, se utilizează între 5 și 20 de intervale, în funcție de numărul de scoruri din mulțimea inițială de date și de scopurile cercetării.
În funcție de numărul de intervale de clasă ales, se stabilește mărimea intervalelor de clasă. În mod obișnuit, pentru a se înlesni interpretarea distribuției de frecvențe, se folosesc intervale de clasă de aceeași mărime. Mărimea unui interval de clasă se stabilește împărțind diferența dintre cel mai mare scor și cel mai mic scor din mulțimea scorurilor date, numită amplitudine a mulțimii respective, la numărul intervalelor de clasă și rotunjind rezultatul până la un număr întreg convenabil.
Se stabilește primul interval astfel încât să conțină cel mai mic scor (limita sa inferioară să fie mai mică sau egală cu cel mai mic scor). Ultimul interval va fi acela care conține cel mai mare scor. Intervalele nu trebuie să se suprapună.
Se numără scorurile din fiecare interval de clasă și se înregistrează rezultatele într-o coloană etichetată („frecvența”). La sfârșitul acestei coloane se prezintă numărul total de scoruri. Pentru mai multă claritate, se poate adăuga o coloană de procente.
Să vedem cum au fost aplicate aceste reguli pentru construirea distribuției de frecvențe din tabelul 2.6. Scorul cel mai mare și scorul cel mai mic fiind, respectiv, 69 și 24, amplitudinea scorurilor este 69 – 24 = 45. Alegând un număr de 10 intervale de clasă, mărimea fiecărui interval de clasă este 45 10 = 4,5 5. Primul interval, care trebuie să includă cel mai mic scor, poate fi oricare dintre următoarele:
20–24, 21–25, 22–26, 23–27, 24–28
Fiecare dintre aceste intervale conține cinci scoruri, inclusiv scorul 24, deci poate fi ales. În exemplul nostru am ales intervalul 20–24. Ca atare, următorul interval este 25–29 ș.a.m.d. până la ultimul interval, 65–69, care conține cel mai mare scor. De notat că intervalele din tabelul 24 par a nu fi reciproc exclusive. În realitate lucrurile nu stau așa. Dacă, după intervalul 20–24 ar fi urmat 24–28, 28–32 ș.a.m.d., am fi obținut intervale suprapuse două câte două. Scorul 24, de pildă, ar fi făcut parte atât din intervalul 20–24, cât și din intervalul 24–28. Intervalele de clasă din tabelul 2.6 sunt exhaustive (acoperă toate scorurile din mulțimea inițială de scoruri) și reciproc exclusive (fiecare scor face parte dintr-un singur interval).
Distribuțiile de frecvențe pentru date de interval sau de raport pot conține două instrumente ajutătoare în prezentarea datelor: frecvențe cumulate și procente cumulate. Frecvențele cumulate prezintă numărul de cazuri dintr-un interval de clasă și din toate intervalele de clasă precedente, iar procentele cumulate prezintă procentul de cazuri dintr-un interval de clasă și din toate intervalele precedente. Tabelul următor prezintă o coloană de frecvențe cumulate și o coloană de procente cumulate pentru distribuția de frecvențe din tabelul 2.6.
Tabelul 2.7 Distribuția de frecvențe a scorurilor
obținute la un test de cunoștințe
Pentru a construi distribuția de frecvențe cumulate din tabelul 2.7 începem cu primul interval de clasă, 20–24. Pentru acest interval, intrarea în coloana de frecvențe cumulate este identică cu numărul de scoruri din interval, 1. Pentru intervalul imediat următor, 25–29, se adună numărul de scoruri din interval, 2, cu numărul de scoruri din primul interval, 1, obținându-se frecvența cumulată a intervalului, 3. Se procedează la fel pentru fiecare interval, adunând frecvența din intervalul respectiv cu frecvența cumulată în intervalul imediat anterior. Evident, frecvența cumulată în ultimul interval de clasă este egală cu numărul total de scoruri.
Construirea coloanei de procente cumulate urmează același model aditiv cu cel folosit pentru frecvențe cumulate. Astfel, pentru primul interval, intrarea în coloana de procente cumulate este identică cu procentul din interval. Pentru intervalul imediat următor, procentul cumulat este procentul scorurilor din interval plus procentul scorurilor din primul interval ș.a.m.d. până la ultimul interval, în care, evident, procentul cumulat este egal cu 100%. De notat că aceleași rezultate se obțin prin aplicarea formulei 2.2, în care se înlocuiește cu pentru fiecare interval de clasă, n fiind numărul total de scoruri.
Frecvențele și procentele cumulate arată felul în care sunt distribuite cazurile în plaja de scoruri. De pildă, tabelul 2.7 arată că o majoritate semnificativă de subiecți din eșantion – 122, respectiv 67,78% – au obținut scoruri mai mici de 55.
Până acum am considerat scorurile înregistrate la testul de cunoștințe ca fiind date discrete. Măsurarea unei variabile produce date discrete, dacă înregistrarea acestora se face în categorii reciproc exclusive (nesuprapuse). Pentru anumite scopuri, distribuția unei variabile măsurabilă la nivel de interval sau de raport trebuie construită ca o serie continuă de categorii parțial suprapuse. Pentru a obține o distribuție continuă de scoruri ale unei astfel de variabile, se pornește de la limitele intervalele de clasă stabilite inițial, numite limite stabilite și, pe baza acestora, se determină așa-numitele limite reale sau exacte. Pentru determinarea acestor limite, se împarte la doi „distanța” aritmetică dintre intervalele de clasă stabilite inițial, iar rezultatul astfel obținut se scade din fiecare limită inferioară stabilită și se adună la fiecare limită superioară stabilită. Tabelul 2.8 prezintă rezultatele aplicării aceste proceduri la intervalele de clasă stabilite în tabelul 2.6. Întrucât „distanța” aritmetică dintre intervalele de clasă din tabelul 2.4 este de o unitate, limitele reale se află scăzând 0,5 din fiecare limită inferioară și adunând 0,5 la fiecare limită superioară. În tabelul 2.8 este adăugată o coloană etichetată centre de interval. Centrele de interval sunt punctele situate exact la mijlocul unui interval și se află împărțind la doi suma limitelor inferioară și superioară ale intervalului. De notat că centrele de interval sunt aceleași, indiferent dacă folosim limite stabilite sau limite reale.
Tabelul 2.8 Distribuția de frecvențe a scorurilor
obținute la un test de cunoștințe (incluzând
limite reale și centre de interval)
Se poate observa că intervalele de clasă cu limite reale se suprapun parțial două câte două, astfel că distribuția apare ca fiind continuă.
Distribuțiile de frecvențe se pot construi și pentru variabile măsurate la nivelele nominal sau ordinal. Pentru fiecare categorie a variabilei respective se numără cazurile și se prezintă subtotalurile, precum și numărul total de cazuri (n). Să presupunem, de pildă, că suntem interesați de măsurarea variabilei nivel de școlarizare pentru cei 180 de subiecți care au răspuns la un test de cunoștințe și că decidem să folosim următoarea scală ordinală de măsură: 1. nu a absolvit nici o școală; 2. a absolvit cel mult ciclul obligatoriu de învățământ; 3. a absolvit cel mult liceul; 4. a absolvit cel mult cursuri postliceale, neuniversitare; 5. a absolvit cel mult cursuri universitare; 6. a absolvit cursuri post universitare. Folosind numerele de ordine ale categoriilor drept coduri (etichete), tabelul 2.9 ilustrează construirea unei distribuții de frecvențe pentru variabila menționată.
Tabelul 2.9 Nivelul de școlarizare
pentru cei 180 de subiecți
Adăugarea unei coloane de procente pentru categorii aduce un spor de claritate a prezentării. De notat că la nivelele nominal și ordinal, frecvențele cumulate și procentele cumulate sunt lipsite de sens. De asemenea, întrucât la aceste nivele categoriile sunt întotdeauna discrete, nu are sens să se determine limitele de clasă reale și centrele de interval. Singura coloană care poate fi adăugată la distribuțiile de frecvențe pentru variabile la orice nivel de măsură este coloana de procente.
2.4 DIAGRAME ȘI GRAFICE
Diagramele și graficele sunt modalități de prezentare vizuală a datelor statistice și furnizează o imagine globală a formei unei distribuții. Alegerea unei modalități sau a alteia depinde, în principal, de nivelul de măsură folosit și de scopurile cercetării.
Diagrame circulare
O diagramă circulară este pur și simplu un cerc împărțit într-un număr de sectoare egal cu numărul de categorii ale variabilei de interes, mărimea fiecărui sector fiind proporțională cu procentajul de cazuri din categoria respectivă. Diagramele circulare pot fi folosite pentru variabile măsurate la nivelele nominal și ordinal.
Să presupunem că am înregistrat statusul marital al celor 180 de subiecți care au răspuns la un test de cunoștințe și că am obținut următoarele date:
Tabelul 2.10 Statusul marital pentru cei 180 de subiecți
Persoană care nu a fost niciodată căsătorită
Să construim o diagramă circulară pentru datele din acest tabel. Întrucât circumferința unui cerc are 3600, vom aloca 1260 (35% din 3600) pentru prima categorie, 1800 (50% din 3600) pentru cea de-a doua categorie și 540 (15 % din 3600) pentru cea de-a treia categorie. Obținem următoarea diagramă circulară:
Figura 2.1 Statusul marital al celor 180 de subiecți
Diagrama din figura 2.1 evidențiază vizual preponderența relativă a subiecților căsătoriți și lipsa relativă a subiecților divorțați din eșantionul considerat.
Diagrame cu coloane și diagrame cu linii
Diagramele cu coloane reprezintă o altă modalitate de prezentare vizuală a datelor statistice. Ca și diagramele circulare, diagramele cu coloane pot fi folosite pentru variabile măsurate la nivelele nominal și ordinal. Într-o astfel de diagramă, categoriile variabilei de interes apar pe o axă orizontală (axa absciselor), iar frecvențele (relative) apar pe axa verticală corespunzătoare (axa ordonatelor). Pe axa orizontală se construiesc atâtea coloane (dreptunghiuri) cu baze egale câte categorii sunt de prezentat. Înălțimea unei coloane este proporțională cu frecvența (relativă) a cazurilor din categoria respectivă. Întrucât la nivelele nominal și ordinal categoriile variabilelor sunt discrete, coloanele sunt separate între ele de o distanță egală, de regulă, cu ½ din lățimea lor.
Diagrama cu coloane din figura 2.2 prezintă în procente față de total statusul marital al subiecților din tabelul 2.9.
Figura 2.2 Statusul marital al celor 180 de subiecți
Decizia de a utiliza o diagramă circulară sau o diagramă cu coloane depinde de numărul de categorii ale variabilei de interes și de scopul cercetării. Dacă o variabilă are mai mult de șase sau șapte categorii, atunci este preferabilă o diagramă cu coloane, căci o diagramă circulară cu prea multe categorii devine prea aglomerată și deci greu de citit.
Diagramele cu coloane sunt utile în special pentru a prezenta frecvențele (relative) pentru două sau mai multe categorii ale unei variabile, cu scopul de a face unele comparații. Să presupunem, de pildă, că dorim să facem o comparație pe sexe a numărului de angajați ai unei firme care, în primele șase luni ale unui an, au apelat la serviciile centrului de consiliere psihologică al firmei. Figura 2.3 prezintă datele (fictive) obținute.
Figura 2.3 Numărul de angajați care au apelat la serviciile
centrului de consiliere psihologică
Această diagramă arată că, în timp ce numărul de angajați care au apelat la serviciile centrului de consiliere psihologică în perioada menționată a fost în creștere, numărul de apelanți femei a crescut mai repede decât numărul de apelanți bărbați. Aceeași informație este prezentată printr-o diagramă cu linii în figura 2.4.
Figura 2.4 Numărul de angajați care au apelat la serviciile
centrului de consiliere psihologică
Ca și diagramele circulare și diagramele cu coloane, diagramele cu linii, îndeobște cunoscute sub denumirea de „grafice”, sunt larg folosite în mass–media pentru prezentarea diferitelor date statistice.
Histograme și poligoane de frecvențe
Histogramele sunt modalități de prezentare vizuală a distribuțiilor de frecvențe pentru date de interval sau de raport, asemănătoare diagramelor cu coloane. Întrucât într-o histogramă se folosesc limitele de clasă reale ale intervalelor considerate, coloanele apar în contact două câte două. Figura 2.5 prezintă o histogramă pentru datele din tabelul 2.7.
Figura 2.5 Histograma scorurilor obținute
la un test de cunoștințe
În general, o histogramă se construiește după cum urmează:
Intervalele de clasă sau scorurile se dispun pe axa orizontală (axa absciselor), utilizând limite de clasă reale.
Frecvențele se dispun pe axa verticală (axa ordonatelor).
Se construiește câte o coloană pentru fiecare interval, cu înălțimea corespunzătoare numărului de cazuri din interval și cu lățimea corespunzătoare limitelor reale ale intervalului.
Se etichetează axele.
Altă modalitate obișnuită de prezentare vizuală a distribuțiilor de frecvențe pentru variabile de interval sau de raport este poligonul de frecvențe. Un poligon de frecvențe utilizează centrele de interval și se construiește după cum urmează:
Se plasează câte un punct în dreptul fiecărui centru de interval, la înălțimea corespunzătoare frecvenței din intervalul respectiv.
Punctele astfel obținute se unesc prin linii drepte.
Se închide poligonul, considerându-se câte un interval suplimentar cu frecvența zero la fiecare capăt al distribuției și unind prin linii drepte punctele extreme cu centrele de interval (aflate pe abscisă) ale intervalelor suplimentare.
Se etichetează axele.
Pentru simplificarea construcției, pe axa absciselor se pot marca direct centrele de interval, în locul limitelor de clasă. Deși redă aceeași informație ca și histogramele, poligoanele de frecvențe sunt utile pentru a da o imagine generală a unei distribuții de frecvențe.
Figura următoare prezintă un poligon de frecvențe care redă aceeași informație ca și histograma din figura precedentă.
Figura 2.6 Poligonul de frecvențe al scorurilor
obținute la un test de cunoștințe
Ogive
Ogivele, numite și „curbe cumulative ale frecvențelor” sau „poligoane de frecvențe cumulate”, prezintă vizual frecvențele cumulate sau procentele cumulate ale unei distribuții O ogivă utilizează limitele de clasă reale superioare ale intervalelor (LCRS) și se construiește după cum urmează:
LCRS se dispun pe axa absciselor.
Frecvențele cumulate sau procentele cumulate se dispun pe axa ordonatelor.
Se plasează câte un punct în dreptul fiecărei LCRS, la înălțimea corespunzătoare frecvenței cumulate sau procentului cumulat în intervalul corespunzător acelei LCRS.
Punctele astfel obținute se unesc prin linii drepte.
Ogiva se închide la stânga, extinzând o linie dreaptă către limita de clasă reală inferioară a primului interval.
Se etichetează axele.
Figura 2.7 prezintă o ogivă pentru datele din tabelul 2.6.
Figura 2.7 Ogivă pentru scorurile obținute
la un test de cunoștințe
După cum vom vedea în capitolul 3, o ogivă poate fi utilizată pentru a afla diferite puncte de interes într-o distribuție de frecvențe.
În capitolul 11 vom folosi diagrame de împrăștiere, numite și „diagrame ale norilor de puncte” sau „scatergrame”, care sunt modalități de prezentare vizuală a corelației dintre două variabile măsurate la nivel de interval sau de raport.
GLOSAR
Centre de interval: puncte situate exact la mijlocul unui interval de clasă.
Diagramă circulară: cerc împărțit într-un număr de sectoare egal cu numărul de categorii ale variabilei de interes, mărimea fiecărui sector fiind proporțională cu procentul de cazuri din categoria respectivă..
Diagramă cu coloane: modalitate de prezentare vizuală a distribuției unei variabile, în care categoriile sunt reprezentate prin coloane cu baza egală, înălțimea fiecărei coloane fiind proporțională cu procentul de cazuri din categoria respectivă.
Distribuție de frecvențe: dispunere a valorilor unei variabile, care arată câte cazuri sunt conținute în fiecare categorie a variabilei respective.
Frecvență cumulată: numărul de cazuri dintr-un interval de clasă și din toate intervalele precedente.
Histogramă: modalitate de prezentare vizuală a distribuțiilor de frecvențe pentru variabile de interval sau de raport, în care categoriile sunt reprezentate prin coloane continue cu baza egală cu limitele reale ale inervalelor de clasă respective, înățimea fiecărei coloane fiind proporțională cu procentul de cazuri din interval.
Intervale de clasă: categorii utilizate în cazul distribuțiilor de frecvențe pentru variabile de interval sau de raport.
Limite de clasă reale: limitele superioară și inferioară ale intervalelor de clasă, folosite atunci când distribuția de frecvențe respectivă este considerată ca fiint continuă.
Limite stabilite: limitele superioară și inferioară ale intervalelor de clasă, așa cum apar acestea în distribuția de frecvențe inițială.
Ogivă: modalitate de prezentare vizuală a frecvențelor cumulate sau a procentelor cumulate ale unei distribuții de frecvențe pentru variabile de interval sau de raport.
Procent: numărul de cazuri dintr-o categorie a unei variabile împărțit la numărul de cazuri din toate categoriile variabilei respective, rezultatul fiind înmulțit cu 100.
Procent cumulat: procentul de cazuri dintr-un interval de clasă și din toate intervalele precedente.
Proporție: numărul de cazuri dintr-o categorie a unei variabile împărțit la numărul de cazuri din toate categoriile variabilei respective.
Raport: numărul de cazuri dintr-o categorie a unei variabile împărțit la numărul de cazuri din altă categorie a variabilei respective.
Rată: numărul de cazuri reale (efective) împărțit la numărul de cazuri posibile pentru variabila de interes pe o anumită unitate de timp.
3 MĂRIMILE TENDINȚEI CENTRALE
ȘI ALE DISPERSIEI
Utilizarea distribuțiilor de frecvențe și a tehnicilor grafice de prezentare a acestora permite relevarea formelor globale ale distribuțiilor unor scoruri. Pentru descrierea mai detaliată a unei distribuții de scoruri, statisticienii folosesc două tipuri de mărimi numerice descriptive. Este vorba despre ideea de caz tipic sau central într-o distribuție, redată prin mărimile tendinței centrale, și despre ideea de varietate sau eterogenitate a unei distribuții, redată prin mărimile dispersiei. Determinarea acestor mărimi furnizează valori precise care por fi ușor interpretate și comparate între ele.
3.1 MĂRIMILE TENDINȚEI CENTRALE
Mărimile folosite în mod obișnuit pentru măsurarea tendinței centrale sunt media aritmetică, mediana și modul. Fiecare dintre aceste mărimi rezumă o întreagă distribuție de scoruri, descriind cea mai tipică sau centrală valoare a distribuției respective sub forma unui singur număr sau a unei singure categorii.
3.1.1 MEDIA ARITMETICĂ
Media aritmetică se calculează doar pentru variabile măsurate la nivel de interval sau de raport și se definește ca rezultat al împărțirii sumei tuturor scorurilor dintr-o mulțime de scoruri la numărul total de scoruri din acea mulțime. Simbolul folosit pentru media aritmetică a unui eșantion este, iar pentru media aritmetică a unei populații se folosește litera grecească μ (miu). Întrucât deocamdată va fi vorba numai despre eșantioane, vom folosi simbolul . Formula matematică a mediei aritmetice este următoarea:
Formula 3.1 =
în care = suma scorurilor
n = numărul total de scoruri.
Să presupunem, de pildă, că am înregistrat vârstele pentru un eșantion de 11 persoane și că am obținut următoarea distribuție de frecvențe:
Tabelul 3.1 Vârstele pentru un eșantion de 11 persoane
Să remarcăm că avem 11 scoruri, câte unul pentru fiecare persoană din eșantion. Pentru a afla media aritmetică a vârstelor persoanelor din eșantion sau, pe scurt, vârsta medie, trebuie să însumăm toate cele 11 scoruri și să împărțim rezultatul obținut la 11. Pentru a scurta procedura, înmulțim fiecare scor cu frecvența cu care apare, adunăm rezultatele înmulțirilor și împărțim suma astfel obținută la 11:
Astfel, media aritmetică a vârstelor persoanelor din eșantionul considerat este 19.
Media aritmetică este mărimea statistică folosită cel mai des în aprecierea tendinței centrale a unei mulțimi de scoruri de interval sau de raport deoarece este ușor de calculat și în plus are următoarele proprietăți importante, pe care le vom folosi în unele aplicații ulterioare.
1. Pentru orice distribuție de scoruri, suma abaterilor scorurilor de la media lor aritmetică este egală cu zero. Abaterea unui scor Xi față de media aritmetică este diferența Xi – , astfel că această proprietate se exprimă simbolic după cum urmează:
–) = 0
În cuvinte, suma diferențelor dintre scoruri și media lor aritmetică este egală cu 0. Această proprietate, care este folosită în obținerea unor formule statistice mai complicate, poate fi exprimată și spunând că pentru orice distribuție de scoruri, media aritmetică este punctul în jurul căruia toate scorurile se anulează, ceea ce face din media aritmetică o mărime descriptivă adecvată în măsurarea centralității scorurilor.
2. Pentru orice distribuție de scoruri, suma pătratelor abaterilor scorurilor față de media lor aritmetică este mai mică decât suma pătratelor abaterilor scorurilor față de oricare alt scor din distribuție, în simboluri:
–)2 – Xj)2
În cuvinte, suma pătratelor diferențelor dintre scoruri și media lor aritmetică este mai mică decât suma pătratelor diferențelor dintre scoruri și oricare alt scor din distribuție. Această proprietate, care este folosită pentru a defini unele mărimi ale dispersiei și pentru a calcula unele mărimi ale corelației, poate fi exprimată și spunând că media aritmetică este punctul în jurul căruia suma abaterilor pătratice ale scorurilor este minimă.
Tabelul 3.2 ilustrează cele două proprietăți ale mediei aritmetice pentru distribuția de scoruri din tabelul 3.1, în care = 19.
Tabelul 3.2 Proprietăți ale mediei aritmetice
pentru datele din tabelul 3.1
Se poate constata că suma abaterilor pătratice ale scorurilor față de media aritmetică (74) este mai mică decât suma abaterilor pătratice ale scorurilor față de scorul 17 (118). Această relație are loc pentru oricare alt scor din distribuție.
Este important de reținut că în cazul în care o distribuție are foarte puține scoruri extreme (foarte mari sau foarte mici), media aritmetică poate deveni o mărime înșelătoare în aprecierea centralității. De pildă, mulțimea de scoruri 15, 20, 25, 30, 35 are media aritmetică 25, în timp ce media aritmetică a mulțimii 15, 20, 25, 30, 3500 este 718, iar media aritmetică a mulțimii 1, 15, 20, 25, 30, este 18,2. Se poate constata că media aritmetică este afectată disproporționat de prezența scorurilor 3500 și, respectiv, 1. Media aritmetică este „trasă” întotdeauna în direcția scorurilor extreme, mai ales în direcția celor relativ mari. Acesta este un motiv pentru care se recurge uneori la o altă mărime a tendinței centrale: mediana.
3.1.2 MEDIANA
Mediana poate fi determinată atât pentru variabile măsurate la nivel de interval sau de raport, cât și pentru variabile măsurate la nivel ordinal. Ca și în cazul mediei aritmetice, și în cazul medianei vom folosi două simboluri: pentru mediana unui eșantion și pentru mediana unei populații. De asemenea, întrucât deocamdată va fi vorba numai despre eșantioane, vom folosi simbolul .
Mediana a unei mulțimi de scoruri este „punctul de mijloc” al acelei mulțimi, în sensul că numărul de cazuri cu scoruri mai mici sau egale cu este egal cu numărul de cazuri cu scoruri mai mari sau egale cu . Pentru a afla mediana unei mulțimi de n scoruri, scorurile respective se aranjează mai întâi în ordine crescătoare sau descrescătoare. Dacă n este impar, atunci mediana este, evident, scorul cazului de mijloc. Dacă n este par, atunci vor fi două cazuri de mijloc și orice valoare cuprinsă între cele două scoruri ale cazurilor de mijloc satisface definiția medianei. Într-un astfel de situație, dacă scorurile sunt de interval sau de raport, prin convenție, se ia drept mediană media aritmetică a celor două scoruri ale cazurilor de mijloc.
În exemplu din tabelul 3.1 avem de-a face cu 11 cazuri. Vârsta mediană este 18, deoarece avem în eșantion cinci persoane cu vârste mai mici de 18 ani și cinci persoane cu vârste mai mari de 18 ani. Să presupunem acum că am înregistrat vârstele pentru un eșantion de 7 persoane și că am obținut următoarea distribuție de frecvențe:
Tabelul 3.3 Vârstele pentru un eșantion de 7 persoane
Pentru datele din acest tabel, = 29: trei persoane au vârste mai mici de 29 de ani și alte trei persoane au vârste mai mari de 29 de ani. De remarcat că vârsta tipică a persoanelor din acest eșantion este mai bine reprezentată de vârsta mediană decât de media aritmetică a vârstelor, 33, care este „trasă” în sus de scorul 60. Acum, dacă adăugăm la acest eșantion o persoană de 31 de ani, avem 8 cazuri cu scorurile 26, 26, 28, 29, 30, 31, 32 și 60. Astfel, apar două cazuri de mijloc, unul cu scorul 29 și celălalt cu scorul 30, și orice număr cuprins între aceste două scoruri satisface definiția medianei. Ca atare, mediana este media aritmetică a scorurilor celor două cazuri de mijloc: 29,5.
Următoarele două exemple arată de ce este inclusă expresia „sau egale” în definiția medianei. Să presupunem că am înregistrat numărul de copii pentru un eșantion de 16 familii, rezultatele obținute fiind următoarele:
Tabelul 3.4 Numărul de copii pentru un
eșantion de 16 familii
În eșantionul considerat în tabelul 3.4, 8 familii au 0, 1 sau 2 copii, iar celelalte 8 familii au câte 2 sau 3 copii, astfel că cea de-a 8-a și cea de-a 9-a familie (cele două cazuri de mijloc) au același număr de copii: 2. Ca atare, mediana aceste mulțimi de scoruri este 2: 8 familii au fiecare un număr de copii mai mic sau egal cu 2, iar celelalte 8 familii au fiecare un număr de copii mai mare sau egal cu 2. Tot așa, în mulțimea impară de scoruri
1, 2, 3, 5, 5, 5, 7, 10, 12
scorul median este 5, căci avem patru scoruri mai mici sau egale cu 5 (1, 2, 3, 5) și patru scoruri mai mari sau egale cu 5 (5, 7, 10, 12).
Următorul exemplu ilustrează determinarea medianei pentru variabile de nivel ordinal. Să presupunem că într-o cercetare privind modul de petrecere a timpului liber, 11 subiecți au fost solicitați să răspundă la întrebarea „Cât de des ați fost la cinematograf în ultimele șase luni?” Răspunsurile la această întrebare au fost înregistrate pe o scală ordinală cu următoarele categorii: 1. Deloc, 2. Foarte rar, 3. Rar, 4. Des, 5. Foarte des. Aranjând scorurile în ordine descrescătoare, datele sunt următoarele:
Tabelul 3.5 „Cât de des mergeți la cinematograf?”
Având un total de 11 cazuri, cazul de mijloc este al 6-lea, F, așa încât răspunsul median este scorul celui de-al șaselea caz: Des. Dacă adăugăm un subiect care dă răspunsul De loc, avem două cazuri de mijloc: cel de-al 6-lea, F, și cel de-al 7-lea, G. În această situație, teoretic vorbind, orice răspuns între Des și Foarte rar satisface definiția medianei. Practic, pe scala menționată, între Des și Foarte rar avem răspunsul Rar, pe care îl vom considera drept răspuns median: 6 subiecți merg la cinematograf foarte des sau des, iar ceilalți șase subiecți merg la cinematograf foarte rar sau deloc.
Dacă numărul de cazuri din eșantion este relativ mic, identificarea cazului sau cazurilor de mijloc este neproblematică. Pentru eșantioane mari, identificarea menționată poate fi înlesnită prin folosirea unor calcule simple. Astfel, după ordonarea scorurilor, dacă n este impar, cazul de mijloc este dat de formula ; dacă n este par, primul caz de mijloc este dat de formula , iar cel de-al doilea caz de mijloc de formula . Ca exercițiu, determinați mediana scorurilor din tabelul 2.4 din capitolul anterior. (Puteți folosi tabelul 2.5? Dacă da, cum?)
De notat că mediana nu este „trasă” în direcția valorilor extreme, deoarece această mărime ia în considerare doar ordinea scorurilor, nu și magnitudinea efectivă a acestora. Reluând un exemplu dat mai sus, mulțimea de scoruri 15, 20, 25, 30, 35 are aceeași mediană ca și mulțimea 15, 20, 25, 30, 3500: scorul 25. Să mai remarcăm că mediana și media aritmetică ale unei mulțimi de scoruri pot să coincidă, acesta fiind, de pildă, cazul mulțimii 15, 20, 25, 30, 35.
Mediana nu poate fi determinată pentru variabile de nivel nominal, deoarece aceste variabile nu au scoruri care să poată fi ordonate. Mărimea tendinței centrale care poate fi folosită la nivel nominal, ca și la toate celelalte nivele de măsură, este modul.
3.1.3 MODUL
Modul unei mulțimi de scoruri (Mo) este scorul care apare cel mai frecvent în acea mulțime. De pildă, modul datelor din tabelul 3.4 este 2, deoarece este scorul care apare de cele mai multe ori în eșantionul considerat, iar modul datelor din tabelul 3.5 sau, altfel spus, răspunsul modal, este Foarte des, deoarece este răspunsul care apare de cele mai multe ori în raport cu celelalte răspunsuri.
Modul este singura mărime care poate fi folosită în măsurarea tendinței centrale pentru variabile de nivel nominal. Modul unei astfel de variabile este cea mai mare categorie a sa sau, altfel spus, categoria cu cele mai multe cazuri. De pildă, modul variabilei status marital pentru distribuția din tabelul 2.10 din capitolul anterior este categoria Căsătorit.
Exemplele date până acum ilustrează cazul mulțimilor unimodale de scoruri, adică a mulțimilor în care există un singur scor care apare mai frecvent decât celelalte. Dacă într-o mulțime de scoruri există două astfel de scoruri, ca în exemplul
3, 3, 3, 5, 5, 5, 7, 10, 12,
atunci se spune că mulțimea respectivă este bimodală. Desigur, este posibil ca o mulțime de scoruri să aibă trei sau mai multe moduri, după cum este posibil ca o mulțime de scoruri să nu aibă mod, fiecare scor din mulțimea respectivă apărând de un număr egal de ori. Pe de altă parte, este posibil ca o mulțime unimodală să nu aibă modul localizat „la mijloc”. Fie, de pildă, următoarea mulțime de scoruri:
44, 44, 46, 46, 46, 48, 50, 50, 50, 50, 50.
Modul aceste mulțimi este 50, în timp ce mediana este 48, iar media aritmetică este aproximativ 47,6. Pretenția că modul este o mărime a tendinței centrale trebuie să fie înțeleasă în sensul că această mărime indică localizarea celei mai mari grupări sau concentrări de scoruri dintr-o mulțime unimodală, ceea ce se poate dovedi important în special pentru date de nivel nominal. Să presupunem că ultima mulțime de scoruri de mai sus reprezintă o înregistrare a măsurilor sacourilor vândute într-un magazin timp de o săptămână. Astfel, modul măsurilor de sacouri vândute sau, altfel spus, măsura modală a acestora este de mai mare interes pentru directorul magazinului decât mediana măsurilor de sacouri vândute. Pe de altă parte, să observăm că în acest caz, media aritmetică a scorurilor nu este în nici un fel semnificativă: numerele care indică măsuri de sacouri sunt convenționale, astfel că ele puteau fi înlocuite, de pildă, cu litere.
3.1.4 DISTRIBUȚII SIMETRICE ȘI DISTRIBUȚII ASIMETRICE
După cum am arătat, dacă lucrăm cu date nominale, singura mărime a tendinței centrale pe care o putem folosi este modul, dacă datele sunt ordinale, putem folosi atât modul, cât și mediana, iar dacă datele sunt de interval sau de raport, putem folosi toate cele trei mărimi ale tendinței centrale.
După cum vom vedea în capitolele dedicate statisticii inferențiale, la nivel de interval sau de raport media aritmetică este cu deosebire utilă pentru trage concluzii despre caracteristicile unei populații pe baza caracteristicilor corespunzătoare ale unui eșantion din acea populație. Pentru scopuri descriptive însă, dacă lucrăm cu date de interval sau de raport, este recomandabil să folosim toate mărimile tendinței centrale, deoarece, pe de o parte, ele pot furniza informații relativ diferite și, pe de altă parte, compararea valorilor mediei aritmetice și medianei furnizează informație despre forma unei distribuții. Astfel, media aritmetică și mediana au aceeași valoare numai atunci când distribuția este simetrică. Într-un astfel de caz, dacă distribuția este unimodală, atunci și modul are aceeași valoare cu celelalte două mărimi. Să considerăm următorul poligon de frecvențe „rotunjit”, care prezintă o distribuție de frecvențe simetrică:
Figura 3.1 O distribuție simetrică (=)
În această distribuție, media aritmetică, mediana și modul apar împreună în cel mai înalt punct al curbei. Acest punct este modul, deoarece este punctul în care sunt înregistrate cele mai multe cazuri, este mediana, deoarece numărul de cazuri înregistrate la stânga acestui punct este egal cu numărul de cazuri înregistrat la dreapta sa și este media aritmetică, deoarece scorurile aflate în partea dreaptă întrec scorul median în aceeași măsură în care scorurile aflate în partea stângă sunt mai mici decât scorul median.
Atunci când o distribuție are doar câteva scoruri foarte mari sau, altfel spus, scorurile relativ mici sunt predominante, media aritmetică este mai mare decât mediana. Într-un astfel de caz, se spune că distribuția respectivă prezintă o asimetrie pozitivă. Figura 3.2 ilustrează cazul unei distribuții cu asimetrie pozitivă.
Figura 3.2 O distribuție cu asimetrie pozitivă ()
Atunci când o distribuție are doar câteva scoruri foarte mici sau, altfel spus, scorurile relativ mari sunt predominante, media aritmetică este mai mică decât mediana. Într-un astfel de caz, se spune că distribuția respectivă prezintă o asimetrie negativă. Figura 3.3 ilustrează cazul unei distribuții cu asimetrie negativă.
Figura 3.3 O distribuție cu asimetrie negativă ( )
După cum se poate constata, compararea mediei aritmetice cu mediana ne indică imediat dacă distribuția respectivă este sau nu simetrică și dacă nu, ne indică sensul asimetriei.
3.1.5 MEDIA ARITMETICĂ PONDERATĂ
Să presupunem că într-o serie de 140 de studenți sunt 86 de băieți și 54 de fete. Știm că la examenul de statistică, media aritmetică a notelor obținute de fete este 8,45 și media aritmetică a notelor obținute de băieți este 7,33. Ne interesează media aritmetică a celor două grupuri combinate. Dacă am calcula pur și simplu media aritmetică a celor două medii, am greși, deoarece grupurile diferă în privința numărului de studenți și deci de scoruri. Pentru a afla media aritmetică a celor două grupuri combinate, vom calcula media aritmetică ponderată. Pentru aceasta, înmulțim numărul de scoruri din fiecare grup cu media aritmetică a grupului respectiv, adunăm produsele astfel obținute, iar rezultatul îl împărțim la numărul total de scoruri. În simboluri:
Formula 3.2
în care ni = numărul de scoruri din fiecare grup
= media aritmetică a fiecărui grup
N = numărul total de scoruri
În exemplul nostru avem:
= = = 7,76
Dacă am fi făcut media aritmetică a valorilor 7,33 și 8,45 am fi obținut 7,89, ceea ce ar fi fost incorect, căci grupurile diferă în privința numărului de scoruri. Evident, media aritmetică ponderată poate fi calculată și pentru mai mult de două grupuri.
Este important de remarcat că, aplicate la aceeași mulțime de scoruri, formulele 3.1 și 3.2 produc același rezultat. Pentru ilustrare, fie următoarea mulțime de 10 scoruri, împărțită în două grupuri: n1 = 5, 5, 5, 6, 7, 7, n2 = 7, 8, 9, 10. Media aritmetică pentru întreaga mulțime este
= = = = 6,90
Acum, mediile aritmetice ale celor două grupuri sunt, respectiv, = 5,83 și = 8,50, astfel că media aritmetică ponderată a celor două grupuri este
= = = = 6,90
Încă odată, calculul mediei aritmetice a celor două medii conduce la un rezultat greșit: 7,16.
3.1.6 MĂRIMILE TENDINȚEI CENTRALE PENTRU DATE GRUPATE
În cele ce urmează sunt expuse tehnicile statistice de aflare a mărimilor tendinței centrale pentru date de interval sau de raport grupate în distribuții de frecvențe. Aceste tehnici își dovedesc utilitatea în două situații. O primă situație apare atunci când trebuie să lucrăm cu o mulțime mare de scoruri brute și nu dispunem de un calculator sau de un computer sau decidem că valorile aproximative ale acestor mărimi sunt suficiente pentru scopurile noastre. O a doua situație apare atunci când avem de-a face cu date din surse secundare, deja organizate în distribuții de frecvențe cu intervale de clasă, fără să avem acces la scorurile brute inițiale. Într-o astfel de situație, întrucât nu cunoaștem modul în care scorurile sunt realmente distribuite, nu putem decât să aproximăm mărimile tendinței centrale ale distribuțiilor respective.
Pentru ilustrare, să considerăm exemplul privind scorurile obținute de 180 de subiecți la un test de cunoștințe, pe care am lucrat în capitolul anterior. Înainte de a trece mai departe, prezentăm valorile calculate pentru scorurile brute, pentru a le putea compara cu cele calculate pentru datele grupate. Astfel, în exemplul nostru avem:
= 49,22 = 49 Mo = 56
Să considerăm acum distribuția de frecvențe a scorurilor obținute de 180 de subiecți la un teste de cunoștințe:
Tabelul 3.6 Distribuția de frecvențe a scorurilor
obținute la un test de cunoștințe
Media aritmetică pentru date grupate
Pentru a calcula media aritmetică a unei mulțimi de scoruri trebuie să cunoaștem două valori: suma tuturor scorurilor, ΣXi, și numărul de scoruri, n. În cazul distribuției din tabelul 3.6, nu știm decât că n = 180. Deoarece datele au fost grupate, nu cunoaștem distribuția exactă a scorurilor individuale și deci nu putem determina exact ΣXi.
Să considerăm primul interval (20–24). În acest interval se află un singur caz, dar nu știm care este scorul acestuia. Pentru a depăși această lacună, vom presupune că scorul acestui caz este situat în centrul intervalului. Această presupunere revine la a spune că scorul cazului din acest interval este 22, acest număr aproximând scorul său efectiv. În cel de-al doilea interval (25–29) se află două cazuri. Și aici vom presupune că scorurile celor două cazuri sunt situate în centrul intervalului, presupunere care revine la a spune că fiecare dintre cele două cazuri are scorul 27. Sub această presupunere, suma scorurilor individuale din cel de-al doilea interval este 54 (272), acest număr aproximând suma reală a scorurilor individuale din interval. Procedând la fel pentru celelalte intervale și adunând apoi rezultatele, vom obține un număr care aproximează suma reală a tuturor scorurilor individuale. În fine, împărțind valoarea astfel obținută la numărul de scoruri (180), vom obține media aritmetică aproximativă a scorurilor.
În general, supoziția calculului mediei aritmetice pentru date grupate este că în fiecare interval de clasă, toate scorurile sunt situate în centrul intervalului respectiv. Sub această supoziție, procedura de calcul este următoarea:
Pentru fiecare interval i, se calculează centrul mi.
Numărul de cazuri din fiecare interval, fi, se înmulțește cu centrul intervalului respectiv, mi: fimi.
Se calculează Σfimi, iar valoarea astfel obținută se împarte la numărul de scoruri n.
Întrucât Σfimi ΣXi, vom avea:
Formula 3.3
Pentru a aplica această procedură la exemplul nostru, vom adăuga două coloane la distribuția de frecvențe din tabelul 3.6, una pentru centrele de interval și una pentru produsele dintre centrele de interval și frecvențe:
Tabelul 3.7 Calculul mediei aritmetice
pentru date grupate
Totalul ultimei coloane este valoarea pentru Σfimi. Împărțind această valoare la numărul total de cazuri obținem media aritmetică aproximativă a scorurilor:
= = 49,25
După cum se poate constata, valoarea obținută în acest fel reprezintă o deosebit de bună aproximare a valorii efective a mediei aritmetice.
Mediana pentru date grupate
Știm că pentru a afla mediana unei distribuții ordonate de scoruri trebuie să identificăm mai întâi cazul sau cazurile de mijloc al distribuției respective. Atunci când se lucrează cu date grupate, se introduce o simplificare: cazul de mijloc este identificat la n2, indiferent dacă n este par sau impar. În exemplul nostru, având 180 de cazuri în eșantion, cazul de mijloc va fi identificat la 1802, i.e. al 90-lea caz. Mai departe, problema este de a localiza acest caz și apoi de a afla scorul asociat lui. Evident, atunci când datele sunt grupate, cazul de mijloc se află într-un interval de clasă. Supoziția calculului medianei pentru date grupate este că în fiecare interval de clasă, toate scorurile sunt distribuite uniform între limitele reale ale intervalului. Astfel, după ce identificăm intervalul care conține cazul de mijloc, vom afla scorul respectiv pe baza acestei supoziții. Pentru identificarea intervalului de clasă care conține cazul de mijloc, adăugăm o coloană de frecvențe cumulate la distribuția de frecvențe inițială:
Tabelul 3.8 Calculul medianei
pentru date grupate
Inspectând coloana de frecvențe cumulate, constatăm că 50 de cazuri s-au cumulat sub limita superioară a intervalului 40–44 și că 92 de cazuri s-au cumulat sub limita superioară a intervalului 45–49. Știm acum că mediana – scorul asociat celui de-al 90-lea caz – este o valoare cuprinsă între limita reală inferioară și limita reală superioară ale intervalului 45–49, adică între 44,5 și 49,5. Mai departe, presupunem că toate cele 42 de cazuri situate în acest interval sunt distribuite uniform între limitele reale ale intervalului, cazul 51 fiind situat la limita reală inferioară (44,5), iar cazul 92 la limita reală superioară (49,5). În intervalul care conține mediana sunt 42 de cazuri, cazul 92, cumulat în acest interval, fiind al 42-lea; prin urmare, cazul 90 este al 40-lea din cele 42 din interval. Aceasta revine la a spune că, pentru a afla al câtelea caz este cazul 90, scădem din 90 frecvența cumulată a cazurilor aflate sub intervalul în care se află mediana: 90 – 50 = 40. Dacă, așa cum am presupus, scorurile sunt distribuite uniform, atunci cazul 90 se află la 4042 din distanța dintre 44,5 și 49,5. Acum, 4042 din 5 (mărimea intervalului) este 4,76, astfel încât putem aproxima mediana la 44,5 + 4,76 sau 49,26.
În general, sub supoziția că în fiecare interval de clasă toate scorurile sunt distribuite uniform între limitele reale ale intervalului, procedura de calcul a medianei pentru date grupate este următoarea:
Se află cazul de mijloc, dat de n/2.
Se construiește o coloană de frecvențe cumulate și cu ajutorul acesteia se identifică intervalul care conține cazul de mijloc.
Se află al câtelea caz din interval este cazul de mijloc, scăzând din n/2 frecvența cumulată a cazurilor aflate sub intervalul identificat în pasul2.
Numărul obținut în pasul 3 se împarte la numărul de cazuri din interval.
Numărul obținut în pasul 4 se înmulțește cu mărimea intervalului.
Numărul obținut în pasul 5 se adună cu limita de clasă reală inferioară a intervalului care conține cazul de mijloc. Rezultatul reprezintă valoarea aproximativă a medianei.
Formula următoare rezumă acești pași:
Formula 3.4
în care = limita de clasă reală inferioară a intervalului care conține al n2-lea caz
n = numărul total de cazuri
fci = frecvența cumulată sub intervalul care conține al n2-lea caz
fi = numărul de cazuri din intervalul care conține al n2-lea caz
i = mărimea intervalului care conține al n2-lea caz
Aplicând această formulă la exemplul nostru, avem:
= = 44,5 + 4,76 = 49,26
Vom spune că aproximativ jumătate din subiecții din eșantion au obținut un scor mai mic de 49,26 și jumătate mai mare de 49,26. Și de data aceasta se poate constata că valoarea obținută în acest fel reprezintă o foarte bună aproximare a valorii efective a medianei.
Intervalul modal
Atunci când datele sunt grupate, scorul modal efectiv al distribuției de frecvențe respective nu poate fi determinat. Într-o astfel de situație se poate determina doar intervalul modal – intervalul care conține cel mai mare număr de cazuri –, centrul acestui interval fiind considerat modul distribuției. Pentru o mai bună aproximare a modului unei distribuții cu date grupate, în cazul în care distribuția are două sau mai multe intervale neadiacente în care numărul de scoruri este mai mare decât în intervalele adiacente, atunci distribuția respectivă este considerată multimodală (bimodală, trimodală etc.). În exemplul nostru, conform definiției stricte, intervalul modal este 45–49, astfel că centrul acestui interval, 47, apare ca mod al distribuției. Totuși, întrucât aici apar două intervale neadiacente, 45–49 și 55–59, în care numărul de scoruri este mai mare decât în intervalele adiacente, 42 și respectiv 37, vom considera că distribuția este bimodală, cele două moduri fiind centrele de interval respective: 47 și 57. Se poate constata că intervalul 55–59 conține modul efectiv al distribuției de frecvențe, 56.
3.2 PERCENTILE
Mărimile tendinței centrale furnizează informații despre mulțimi de scoruri. În anumite cazuri însă, cercetătorul poate fi interesat de descrierea poziției unui scor individual în raport cu celelalte scoruri dintr-o distribuție. Dacă, de pildă, un subiect a obținut scorul 47 la un test de cunoștințe, semnificația acestui scor poate fi explicată inclusiv în termenii numărului de subiecți din eșantionul considerat care au obținut scoruri mai mici decât 47.
Poziția unui scor individual într-o distribuție poate fi determinată cu ajutorul percentilelor. Cea de-a m-a percentilă a unei mulțimi de scoruri, Pm, este valoarea față de care cel mult m% din scoruri sunt mai mici decât m și cel mult (100 – m)% din scoruri sunt mai mari decât m. Întrucât mediana unei mulțimi de scoruri este valoarea față de care cel mult 50% din scoruri sunt mai mici și cel mult 50% din scoruri sunt mai mari, mediana este cea de-a 50-a percentilă a acelei mulțimi. Tot așa cum există un nume special pentru cea de-a 50-a percentilă a unei mulțimi de scoruri, există nume speciale pentru percentilele care împart o mulțime ordonată de scoruri în sferturi și în zecimi: cuartile și, respectiv, decile. Lista următoare prezintă cele mai utilizate percentile, împreună cu simbolurile uzuale pentru cuartile și decile (considerând că este vorba despre o mulțime de scoruri ordonată crescător):
D1 = Prima decilă = P10
Q1 = Prima cuartilă = P25
Q2 = A doua cuartilă = P50 =
Q3 = A treia cuartilă = P75
D9 = A noua decilă = P90
Pentru ilustrare, fie următoarea mulțime ordonată de 15 scoruri:
2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, 27, 29, 30
Q1 Q3
Prima cuartilă este valoarea față de care cel mult 25% din scoruri, i.e. cel mult (15/100)25 = 3,75 scoruri sunt mai mici și cel mult 75% din scoruri, i.e. cel mult (15/100)75 = 11,25 scoruri sunt mai mari. Singurul scor care satisface acest criteriu este 5, deci Q1 = 5. Cea de-a doua cuartilă, mediana, este scorul central, i.e. 12. Cea de-a treia cuartilă este valoarea față de care cel mult 75% din scoruri, i.e. cel mult 11, 25 scoruri sunt mai mici și cel mult 25% din scoruri, i.e. 3,75 scoruri sunt mai mari. Singurul scor care satisface acest criteriu este 21, deci Q3 = 21.
De notat că (n/100)25 = n(0,25), iar (n/100)75 = n(0,75). Ca atare, pentru Q1 putem folosi formula n(0,25), iar pentru Q3 formula n(0,75) sau, echivalent, n – n(0,25). În exemplul nostru, n(0,25) = 3,75 și n(0,75) = n – n(0,25) = 11,25.
Uneori, percentila căutată „cade” între două scoruri din mulțimea respectivă. Într-un astfel de caz, prin convenție, se alege media aritmetică a celor două scoruri pentru a aproxima percentila căutată. Să presupunem că ne interesează ce-a de-a 20-a percentilă din mulțimea de mai sus. Aceasta ar fi valoarea față de care cel mult 3 scoruri sunt mai mici și cel mult 12 scoruri sunt mai mari. Întrucât orice număr cuprins între 4 și 5 (inclusiv) satisface acest criteriu, vom alege 4,50 drept ce-a de-a 20-a percentilă.
Procedura de calcul a percentilelor pentru date grupate este asemănătoare procedurii de calcul a medianei pentru date grupate. Să considerăm din nou distribuția de frecvențe a scorurilor obținute la un test de cunoștințe de 180 de subiecți și să presupunem că ne interesează cea de-a 75-a percentilă. Pentru a o afla, vom folosi tabelul 3.8, care include o coloană de frecvențe cumulate.
Mai întâi, identificăm intervalul de clasă care conține percentila căutată. Având 180 de scoruri individuale în eșantion, P75 este valoarea față de care cel mult 135 (180 0,75) de scoruri sunt mai mici și cel mult 45 (180 – 135) de scoruri sunt mai mari. Ca atare, intervalul de clasă care conține percentila căutată este cel care conține valoarea față de care cel mult 135 (180 0,75) de scoruri sunt mai mici. Inspectând coloana de frecvențe cumulate din tabelul 3.8, constatăm că 122 de cazuri sau scoruri s-au cumulat sub limita superioară a intervalului 50–54 și că 159 de cazuri sau scoruri s-au cumulat sub limita superioară a intervalului 55–59. Știm acum că P75 este o valoare cuprinsă între limita reală inferioară și limita reală superioară ale intervalului 55–59, adică între 54,5 și 59,5. Mai departe, presupunem că toate cele 37 de cazuri situate în acest interval sunt distribuite uniform între limitele reale ale intervalului, cazul 123 fiind situat la limita reală inferioară (54,5), iar cazul 159 la limita reală superioară (59,5). În intervalul care conține P75 sunt 37 de cazuri, cazul 135 fiind al 13-lea: cazul 123 este primul, 124 al doilea, …, 135 al 13-lea. Aceasta revine la a spune că, pentru a afla al câtelea caz este cazul 135, scădem din 135 frecvența cumulată a cazurilor aflate sub intervalul în care se află cazul 135: 135 – 122 = 13. Dacă, așa cum am presupus, scorurile sunt distribuite uniform, atunci cazul 135 se află la 1337 din distanța dintre 54,5 și 59,5. Acum, 1337 din 5 (mărimea intervalului) este 1,75, așa încât putem aproxima P75 la 54,5 + 1,75 sau 56,25.
Formula următoare rezumă pașii de calcul al percentilelor pentru date grupate:
Formula 3.5 Pm LCRIm +
în care LCRIm = limita de clasă reală inferioară a intervalului care conține Pm
n = numărul total de scoruri
p = proporția corespunzătoare percentilei căutate Pm
fci = frecvența cumulată sub intervalul care conține Pm
fi = numărul de cazuri din intervalul care conține Pm
i = mărimea intervalului
Aplicând formula 3.5 la exemplul nostru, avem:
P75 54,5 + = 54,5 + 1,75 = 56,25
Să presupunem acum că ne interesează procentul de subiecți care au obținut un scor mai mic sau egal cu 47 și că nu dispunem decât de datele grupate din tabelul 3.8. Procentul de cazuri care au un scor mai mic sau egal cu un scor dat se numește rangul percentilei scorului respectiv.
Pentru a afla rangul percentilei pentru scorul 47, notat RP47, observăm mai întâi că acest scor este cuprins în intervalul 45–49 și că 50 de cazuri s-au cumulat sub limita reală inferioară a acestui interval, 44,5. Ca și până acum, vom presupune că toate cele 42 de cazuri situate în acest interval sunt distribuite uniform între limitele reale ale intervalului. Sub această presupunere, proporția de cazuri din interval care au scoruri mai mici sau egale cu 47 este (47,0 – 44,5)/5 = 2,5/5 = 0,5. Ca atare, în acest interval sunt 42 0,5 = 21 de scoruri mai mici sau egale cu 47. Prin urmare, numărul total de scoruri mai mici sau egale cu 47 este 50 + 21 = 71, iar rangul percentilei scorului 47 poate fi aproximat la (71/180) 100 = 39,4. Aceasta înseamnă că 39,4% din cazuri au un scor mai mic sau egal cu scorul 47.
Următoarea formulă rezumă pașii de calcul al rangului percentilelor pentru date grupate:
Formula 3.6 RPX
în care fci = frecvența cumulată sub intervalul care conține scorul X
X = scorul pentru care se determină RPX.
LCRIX = limita de clasă reală inferioară a intervalului care conține scorul X
i = mărimea intervalului
fi = numărul de cazuri din intervalul care conține scorul X
n = numărul total de cazuri
Aplicând această formulă la exemplul nostru, avem:
RP47 = = 39,4
Percentilele și rangul percentilelor pentru date grupate pot fi aproximate și folosind ogivele. Pentru exemplificare, să folosim ogiva construită în capitolul anterior pentru scorurile celor 180 de subiecți:
Figura 3.4 Ogivă pentru scorurile obținute
la un test de cunoștințe
Pentru a afla, de pildă, P58, din punctul 58 de pe axa procentelor trasăm o paralelă cu axa scorurilor care să intersecteze curba, iar din punctul de intersecție trasăm o perpendiculară pe axa scorurilor. Punctul de intersecție al acestei perpendiculare cu axa scorurilor este P58. Pentru a afla RP62, din punctul 62 de pe axa scorurilor trasăm o paralelă cu axa procentelor care să intersecteze curba, iar din punctul de intersecție trasăm o perpendiculară pe axa procentelor. Punctul de intersecție al acestei perpendiculare cu axa procentelor este RP62.
3.3 MĂRIMILE DISPERSIEI
Descrierea unei distribuții de scoruri cu ajutorul mărimilor tendinței centrale nu epuizează informația relevantă statistic despre distribuția respectivă. Pentru descrierea completă a unei distribuții de scoruri trebuie să considerăm și mărimile dispersiei. Aceste mărimi furnizează informație despre eterogenitatea sau varietatea unei distribuții de scoruri.
De pildă, o medie aritmetică de 6,33 poate fi obținută dintr-o mulțime de scoruri similare, concentrate în jurul acestei valori – precum 6, 6, 7 – sau dintr-o mulțime de scoruri nesimilare, împrăștiate în raport cu această valoare – precum 1, 8, 10. În cazul unor scoruri similare sau cu variabilitate scăzută, media aritmetică este mai adecvată pentru măsurarea tendinței centrale decât în cazul unor scoruri nesimilare sau cu variabilitate înaltă. Luând un exemplu pur didactic, informația conform căreia media aritmetică a vârstelor dintr-un eșantion este de 25 de ani este relevantă dacă vârstele subiecților din eșantion sunt relativ grupate în jurul aceste valori și este neimportantă dacă eșantionul respectiv este alcătuit din două grupuri, unul cu vârste cuprinse între 1 și 10 ani, celălalt cu vârste cuprinse între 40 și 50 de ani.
În această secțiune sunt introduse cele mai des folosite mărimi ale dispersiei: indicele variației calitative, amplitudinea și amplitudinea intercuartilică, abaterea medie, varianța, abaterea standard și coeficientul de variație. Fiecare dintre aceste mărimi furnizează o indicație precisă a eterogenității unei distribuții de scoruri.
3.3.1 INDICELE VARIAȚIEI CALITATIVE
Indicele variației calitative (IQV) reprezintă raportul dintre variația observată efectiv într-o distribuție de scoruri și variația maxim posibilă pentru acea distribuție. IQV poate lua valori cuprinse între 0,00 (nici o variație sau variație nulă) și 1,00 (variație maximă). Acest indice se folosește în mod obișnuit pentru variabile măsurate la nivel nominal, putând fi utilizat și pentru variabile măsurate la celelalte nivele, dacă scorurile respective sunt grupate în distribuții de frecvențe.
Pentru ilustrare, să presupunem că un cercetător este interesat în compararea eterogenității religioase a trei colectivități – A, B și C –, datele obținute fiind cele din tabelul următor:
Tabelul 3.9 Apartenența religioasă în trei colectivități
Simpla inspecție a datelor din acest tabel arată că, dintre cele trei colectivități, A este cea mai puțin eterogenă. Mai exact, eterogenitatea religioasă în colectivitatea A este nulă, întrucât toți membrii acestei colectivități sunt creștin–ortodocși. Apoi, colectivitatea C este cea mai eterogenă, B situându-se între A și C. Să vedem acum cum sunt reflectate aceste observații de către IQV, a cărui formulă de calcul este următoarea:
Formula 3.7 IQV =
în care k = numărul de categorii
n = numărul total de cazuri din cele k categorii
= suma pătratelor frecvențelor din fiecare categorie
Să aplicăm această formulă la fiecare dintre cele trei distribuții de frecvențe. Pentru aceasta, trebuie să calculăm mai întâi suma pătratelor frecvențelor respective. Astfel, pentru colectivitatea A, avem:
= 902 + 02 + 02 = 8100
IQV =
Întrucât valorile pentru k și n sunt aceleași în toate cele trei distribuții, IQV pentru celelalte două colectivități poate fi calculat schimbând doar valorile pentru . Pentru colectivitatea B, avem:
= 602 + 202 + 102 = 4100
IQV =
Pentru colectivitatea C:
= 302 + 302 + 302 = 2700
IQV =
După cum se poate constata, IQV reflectă cantitativ și precis observațiile de mai sus. Colectivitatea A prezintă o variație nulă a variabilei măsurate (IQV = 0), colectivitatea C prezintă variația maxim posibilă pentru aceste date (IQV = 1,00), iar colectivitatea B se situează între A și C, cu o variație substanțială (IQV = 0,74).
3.3.2 AMPLITUDINEA ȘI AMPLITUDINEA INTERCUARTILICĂ
Amplitudinea (A) este o mărime a dispersiei ușor de calculat, cu care ne-am întâlnit deja în capitolul anterior, definită drept diferența dintre cel mai mare scor și cel mai mic scor din mulțimea scorurilor date:
A = Xmax – Xmin
Pentru datele din tabelul 2.4, de pildă, A = 69 – 24 = 45. În cazul unei distribuții de frecvențe cu date grupate, amplitudinea absolută se aproximează prin diferența dintre limita de clasă reală superioară a ultimului interval și limita de clasă reală inferioară a primului interval:
A = LCRSmax – LCRImin
Astfel, pentru datele din tabelul 3.6, A 69,5 – 19,5 = 50.
Amplitudinea intercuartilică (Q) se definește ca diferența dintre cea de-a treia și prima cuartilă a unei distribuții de scoruri ordonate crescător:
Q = Q3 – Q1
Să considerăm din nou un exemplu prezentat în secțiunea 3.2. Fie următoarea mulțime ordonată de 15 scoruri:
2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, 27, 29, 30
Q1 Q3
În acest exemplu, A = 30 – 2 = 28 și Q = 21 – 5 = 16.
Întrucât ia în considerare doar scorurile extreme dintr-o distribuție, A nu este o mărime suficient de semnificativă a dispersiei. Pot fi întâlnite distribuții în care scorurile extreme sunt foarte depărtate de scorurile intermediare, caz în care aprecierea dispersiei pe baza amplitudinii este o greșeală. De asemenea, amplitudinea nu oferă informații despre natura scorurilor dintre cele două extreme: dacă scorurile sunt grupate în centrul distribuției, dacă sunt împrăștiate omogen între cele două scoruri extreme, dacă sunt concentrate în două grupe, câte una lângă fiecare extremă, distribuția fiind bimodală etc. Q ia în considerare 50% dintre cazurile aflate în centrul distribuției și astfel evită problema de a fi o mărime bazată pe scorurile extreme. Pe de altă parte, întrucât, ca și A, ia în considerare doar două scoruri dintr-o distribuție, Q nu oferă informație despre natura scorurilor dintre cele două scoruri considerate, astfel că împărtășește celelalte dezavantaje asociate cu A. Totuși, aceste mărimi sunt utile atunci când dorim să obținem rapid o măsură a variabilității unei distribuții și, mai ales, atunci când dorim să realizăm rapid o comparație între variabilitățile a două distribuții cu un număr egal de scoruri. Să presupunem, de pildă, că am înregistrat vârstele subiecților din două eșantioane, obținând următoarele date:
Eșantionul 1 11, 16, 18, 23, 29, 31, 37
Eșantionul 2 18, 19, 21, 23, 24, 26, 29
Mediile aritmetice pentru cele două eșantioane sunt și , mediana fiind aceeași pentru ambele eșantioane: 23. Întrucât amplitudinea vârstelor din primul eșantion, 26, este mai mare decât amplitudinea vârstelor din cel de-al doilea eșantion, 11, primul eșantion este mai eterogen din punctul de vedere al vârstelor.
3.3.3 ABATEREA MEDIE ȘI VARIANȚA
Mărimile dispersiei expuse în continuare captează ideea de variabilitate a unei distribuții de scoruri de interval sau de raport față de centrul acelei distribuții, mai precis, față de media sa aritmetică și folosesc toate scorurile distribuției.
Știm că într-o distribuție de scoruri de interval sau de raport cu media aritmetică , diferența Xi – reprezintă abaterea scorului Xi față de media aritmetică . O sugestie pentru a obține o mărime mai adecvată a dispersiei ar fi să însumăm toate abaterile scorurilor individuale față de medie și să împărțim suma astfel obținută la numărul total de scoruri, n. Mai știm, însă, că pentru orice distribuție de scoruri, suma abaterilor scorurilor de la media lor aritmetică este egală cu zero, –) = 0, astfel că rezultatul împărțirii acestei sume la n ar fi întotdeauna 0. Pentru a folosi cumva sugestia menționată, avem la dispoziție două posibilități: sau neglijăm semnele abaterilor, considerând valorile absolute ale acestora, sau ridicăm la pătrat abaterile, întrucât dacă se înmulțesc două numere care au semnul minus, produsul este pozitiv.
Prima posibilitate conduce la o mărime a dispersiei, numită abaterea medie și notată cu , a cărei formulă de calcul este următoarea:
Formula 3.8
Cea de-a doua posibilitate conduce la o altă mărime a dispersiei, numită varianță, notată cu s2 atunci când este vorba despre un eșantion și cu σ2 atunci când este vorba despre o populație. Formula de calcul a varianței pentru populații este următoarea:
Formula 3.9
în care μ = media aritmetică a populației
N = numărul total de scoruri din populație
Formula de calcul a varianței pentru eșantioane diferă de formula 3.9 sub două aspecte: în locul mediei aritmetice a populației (μ) apare media aritmetică a eșantionului (), iar la numitor, în locul numărului total de scoruri din populație (N) apare numărul total de scoruri din eșantion diminuat cu o unitate (n – 1).
Formula 3.10
Pentru a ilustra calculul abaterii medii și al varianței, vom folosi datele din tabelul 3.2, adăugând o coloană pentru modulele diferențelor și, pentru o simplificare pe care o vom folosi ulterior, o coloană pentru pătratele scorurilor individuale, Xi2:
Tabelul 3.10 Calculul abaterii medii și al varianței ()
Pentru datele din acest exemplu, avem:
De notat că varianța calculată cu ajutorul formulei 3.9 reprezintă pătratul mediu al abaterilor, i.e. media aritmetică a pătratelor abaterilor scorurilor populației de la media lor aritmetică μ.
În cazul eșantioanelor mari, aplicarea formulei definiționale 3.10 poate fi greoaie, mai ales dacă valoarea pentru conține zecimale, ceea ce presupune multe rotunjiri. Din formula 3.10 se pot deduce alte formule de calcul care, aplicate la aceleași date, produc aceleași rezultate ca și formula 3.10 și care permit calcularea mai ușoară și mai rapidă a varianței. Prezentăm în continuare două astfel de formule, în care nu mai este nevoie de calcularea diferențelor Xi – .
Formula 3.11
Formula 3.12
Aplicând formula 3.11 la datele din exemplul de mai sus, avem:
Deși pare mai complicată decât formula 3.10, formula 3.12 ne scutește de calcularea mediei aritmetice a scorurilor, astfel încât pentru calcularea varianței cu ajutorul acestei formule este nevoie doar de scorurile individuale. În exemplul nostru:
Formulele de calcul simplificat al varianței pentru populații diferă de formulele de mai sus prin aceea că se înlocuiește cu μ, iar n – 1 devine N.
3.3.4 ABATEREA STANDARD ȘI COEFICIENTUL DE VARIAȚIE
Calculul varianței implică ridicarea la pătrat a abaterilor scorurilor individuale față de media lor aritmetică (formulele 3.9 și 3.10). În consecință, unitatea atașată varianței este pătratul unității atașate scorurilor individuale respective. Dacă, de pildă, este vorba despre scoruri exprimate în ani, varianța va fi exprimată în ani la pătrat. Pentru a se obține o mărime a variabilității care să fie exprimată în aceleași unități în care sunt exprimate scorurile respective, se ia rădăcina pătrată a varianței, s sau σ. Această mărime statistică se numește abatere standard și, în cazul eșantioanelor, se definește cu ajutorul următoarei formule:
Formula 3.13
Relația dintre abaterea standard și varianță fiind , valoarea abaterii standard pentru datele din tabelul 3.10 este = 2,72.
Corespunzător formulelor 3.11 și 3.12, avem următoarele formule de calcul simplificat al abaterii standard:
Formula 3.14
Formula 3.15
Coeficientul de variație al unei distribuții de scoruri (CV) se definește ca raportul dintre abaterea standard a distribuției și media sa aritmetică. De obicei, coeficientul de variație se înmulțește cu 100 și se prezintă ca procent. Astfel, avem:
Formula 3.16
În exemplul folosit până acum, CV = (2,72/19) · 100 = 143,16. Evident, în cazul populațiilor, s se înlocuiește cu σ, iar cu μ. Coeficientul de variație este cu deosebire util atunci când se dorește compararea variabilității a două distribuții de scoruri cu medii aritmetice sensibil diferite.
3.3.5 CALCULUL ABATERII STANDARD PENTRU DATE GRUPATE
Formula de calcul a abaterii standard pentru date grupate se obține pe baza formulei 3.15. Pentru a aplica formula 3.15 trebuie să cunoaștem trei valori: suma scorurilor, ΣXi, suma pătratelor scorurilor, ΣXi2, și numărul de scoruri, n. Atunci când datele au fost grupate în distribuții de frecvențe nu cunoaștem distribuția exactă a scorurilor individuale și deci nu putem determina exact primele două valori. Într-un astfel de caz, suma scorurilor se aproximează, ca și pentru media aritmetică, înmulțind numărul de cazuri din fiecare interval, fi, cu centrul intervalului respectiv, mi, și însumând aceste produse: Σfimi. Suma pătratelor scorurilor se aproximează ridicând la pătrat centrele de interval, înmulțind fiecare pătrat astfel obținut cu numărul de cazuri din intervalul respectiv și însumând aceste produse: Σfimi2. Avem astfel:
ΣXi Σfimi
ΣXi2 Σfimi2
Formula care dă valoarea aproximativă a abaterii standard pentru date grupate se obține făcând substituțiile corespunzătoare în formula 3.15. Obținem astfel:
Formula 3.17
Pentru ilustrare, vom folosi datele din tabelul 3.7, în care vom adăuga două coloane: una pentru pătratele centrelor de interval și una pentru produsele dintre pătratele centrelor de interval și frecvențe:
Tabelul 3.11 Calculul abaterii standard
pentru date grupate
Totalul ultimei coloane este valoarea pentru Σfimi2. Aplicând formula 3.17 la aceste date obținem:
===
=== 9,43
De notat că, pentru datele negrupate corespunzătoare acestui exemplu, abaterea standard calculată cu ajutorul uneia dintre formulele 3.13 – 3.15 este egală cu 9,00.
Pentru a descrie adecvat o distribuție de scoruri trebuie să răspundem la trei întrebări: Care este forma distribuției? Care este scorul său mediu? Cât de variate sunt scorurile? Modalitățile de răspuns la prima întrebare au fost discutate în capitolul 2. Răspunsurile la ce-a de-a doua întrebare au fost abordate în prima parte a acestui capitol. Am văzut că în statistică, „scor mediu” are trei înțelesuri diferite, cărora le corespund trei mărimi statistice: media aritmetică, mediana și modul. Media aritmetică, aplicabilă numai pentru date de interval sau de raport, exprimă scorul tipic al unei distribuții. Mediana poate fi folosită și pentru nivelul ordinal de măsură și reflectă scorul central al unei distribuții. Modul poate fi folosit la orice nivel de măsură și reprezintă cel mai întâlnit scor într-o distribuție. În plus, am prezentat modalități de descriere a poziției scorurilor individuale într-o distribuție de interval sau de raport: percentilele și rangul percentilelor. În capitolul următor vom prezenta un alt cadru de referință pentru interpretarea scorurilor individuale: scorurile standard.
În cea de-a doua parte a acestui capitol am prezentat modalități de a răspunde la cea de-a treia întrebare: indicele variației calitative, amplitudinea și amplitudinea intercuartilică, abaterea medie, varianța, abaterea standard și coeficientul de variație. Abaterea standard este cea mai des folosită mărime a dispersiei pentru date de interval și de raport, având avantajul de a fi exprimată în aceleași unități de măsură ca și scorurile respective. Valoarea abaterii standard este cu atât mai mare, cu cât distribuția scorurilor este mai eterogenă sau, altfel spus, cu cât variabilitatea distribuției este mai mare. Reciproc, valoarea abaterii standard este cu atât mai mică, cu cât distribuția scorurilor este mai omogenă sau, altfel spus, cu cât variabilitatea distribuției este mai mică. Dacă fiecare caz într-o distribuție ar avea același scor, atunci abaterea standard pentru distribuția respectivă ar fi 0. Astfel, abaterea standard nu are limită superioară, iar limita sa inferioară este 0. Abaterea standard își dovedește utilitatea mai ales atunci când se dorește compararea a două sau mai multe distribuții. De asemenea, după cum vom vedea în capitolul următor, abaterea standard este implicată și în calculul scorurilor standard și în noțiunea de distribuție normală standard.
GLOSAR
Abatere standard: rădăcina pătrată a câtului dintre suma abaterilor pătratice ale scorurilor față de media lor aritmetică și n 1 pentru eșantioane sau N pentru populații.
Abatere medie: media aritmetică a sumei abaterilor absolute ale scorurilor față de media lor aritmetică.
Amplitudinea absolută: diferența dintre cel mai mare scor și cel mai mic scor dintr-o mulțime de scoruri.
Amplitudine intercuartilică: diferența dintre cea de-a treia și prima cuartilă a unei distribuții de scoruri ordonate crescător.
Asimetrie: proprietatea unei mulțimi de scoruri de a avea puține scoruri foarte mari (asimetrie pozitivă) sau puține scoruri foarte mici (asimetrie negativă).
Coeficient de variație: raportul dintre abaterea standard a unei distribuții de scoruri și media sa aritmetică. De obicei, coeficientul de variație se înmulțește cu 100 și se prezintă ca procent.
Indicele variației calitative: raportul dintre variația observată efectiv într-o distribuție de scoruri și variația maxim posibilă pentru acea distribuție.
Interval modal: intervalul de clasă care conține cel mai mare număr de cazuri.
Mărimile tendinței centrale: mărimi statistice care rezumă o întreagă distribuție de scoruri, descriind cea mai tipică sau centrală valoare a distribuției respective sub forma unui singur număr sau a unei singure categorii.
Mărimile dispersiei: mărimi statistice care furnizează informație despre eterogenitatea sau varietatea unei distribuții de scoruri.
Medie aritmetică ponderată: media aritmetică a mai multor grupuri combinate.
Medie aritmetică: rezultatul împărțirii sumei tuturor scorurilor dintr-o mulțime de scoruri la numărul total de scoruri din acea mulțime.
Mediană: punct într-o mulțime de scoruri față de care numărul de cazuri cu scoruri mai mici sau egale este egal cu numărul de cazuri cu scoruri mai mari sau egale .
Mod: scorul care apare cel mai frecvent într-o mulțime de scoruri.
Percentilă: valoarea Pm a unei mulțimi de scoruri față de care cel mult m% din scoruri sunt mai mici decât m și cel mult (100 – m)% din scoruri sunt mai mari decât m.
Varianță: câtul dintre suma abaterilor pătratice ale scorurilor față de media lor aritmetică și n 1 pentru eșantioane sau N pentru populații.
4 DISTRIBUȚIA NORMALĂ
Noțiunea de distribuție normală este de mare importanță în statistică. Pe de o parte, distribuția normală poate fi folosită în combinație cu abaterea standard pentru a formula enunțuri descriptive precise despre distribuțiile scorurilor unor variabile. Pe de altă parte, distribuția normală stă la baza multor tehnici statistice inferențiale.
4.1 CARACTERISTICILE DISTRIBUȚIEI NORMALE
Distribuția normală este o distribuție teoretică de scoruri unimodală, simetrică și continuă. Graficul unei distribuției normale are formă de clopot cu ambele extremități extinse la infinit. Ca atare, un astfel de grafic, numit și curba normală, nu atinge axa orizontală sau, altfel spus, este asimptotic față de axa orizontală, după cum se ilustrează în figura 4.1.
Figura 4.1 Un exemplu de curbă normală
Distribuția normală este un model teoretic ce poate fi folosit pentru a descrie distribuții particulare ale scorurilor unor variabile măsurate la nivel de interval sau de raport, despre care s-a constatat că aproximează suficient normalitatea într-o populație, precum coeficientul de inteligență, rezultatele obținute la diferite teste de cunoștințe sau numărul de erori comise în îndeplinirea anumitor sarcini. Scorurile unor astfel de variabile tind să se grupeze simetric în jurul scorului central, dând naștere unui grafic de distribuție în formă de clopot. Dacă distribuția scorurilor unei variabile într-o populație aproximează normalitatea, se spune că variabila respectivă este normal distribuită în populația respectivă sau, pe scurt, că variabila respectivă este normală. Pe de altă parte, după cum vom vedea în capitolele următoare, distribuția normală poate fi folosită pentru a reprezenta diferite mărimi statistice care rezultă din studierea unor eșantioane dintr-o populație dată, ceea ce permite obținerea unor concluzii despre valorile pentru populație pe baza valorilor cunoscute pentru eșantioane. Utilizarea distribuției normale în statistică face apel la așa–numitele scoruri standard sau scoruri Z.
4.2 CALCULUL SCORURILOR STANDARD
Scorurile standard, numite și scoruri Z, folosesc abaterea standard ca unitate de măsură și descriu poziția relativă a unui scor individual în raport cu întreaga mulțime de scoruri din care face parte. Formula de calcul pentru scorurile Z ale unei populații este următoarea:
Formula 4.1
Această formulă transformă orice scor „brut” X în scorul Z corespunzător. Numărătorul fracției, X – μ, indică distanța în unități brute a scorului X față de media aritmetică. Prin împărțirea acestei distanțe la σ aflăm distanța în abateri standard sau fracțiuni de abateri standard a scorului X față de medie. Corespunzător, formula de calcul pentru scorurile Z ale unui eșantion este următoarea:
Formula 4.2
Pentru ilustrare, să considerăm o distribuție de scoruri pentru un eșantion, în care = 100 și s = 20. În acest caz, scorurile Z corespunzătoare scorurilor brute 85, 120 și 150 sunt:
Fiecare dintre aceste scoruri Z arată la câte abateri standard față de media aritmetică se află scorul brut corespunzător. Un scor Z negativ arată că scorul brut se află sub media aritmetică, iar un scor Z pozitiv arată că scorul brut este mai mare decât media aritmetică. Evident, un scor Z egal cu 0 arată că scorul brut corespunzător este egal cu media aritmetică.
Se demonstrează că dacă toate scorurile unei distribuții particulare se transformă în scoruri Z, atunci:
Forma distribuției scorurilor Z este aceeași cu cea a distribuției inițiale;
Media aritmetică a distribuției scorurilor Z este 0, indiferent de valoarea mediei aritmetice a distribuției inițiale;
Abaterea standard a distribuției scorurilor Z este 1, indiferent de valoarea abaterii standard a distribuției inițiale.
Aceste proprietăți au fost generalizate în studiul distribuției normale standard.
4.3 DISTRIBUȚIA NORMALĂ STANDARD
Ca și în cazul unei distribuții particulare de scoruri de interval sau de raport, distribuția normală poate fi descrisă cu ajutorul mediei sale aritmetice și a abaterii standard. Întrucât oricărei perechi de valori pentru media aritmetică și abaterea standard îi corespunde o distribuție normală, matematic vorbind există o infinitate de distribuții normale, ale căror forme exacte depind de mărimile menționate. Pentru a descrie efectiv distribuțiile unor variabile normale, în analiza statistică se consideră o distribuție normală particulară, numită distribuția normală standard. Variabila corespunzătoare distribuției normale standard este numită variabila normală standard, valorile acestei variabile fiind scoruri Z. Din acest motiv, această distribuție se mai numește și distribuția Z. Prin convenție, media aritmetică a distribuției normale standard se ia ca origine a variației variabilei normale standard, ceea ce înseamnă că această distribuție are media aritmetică egală cu 0. De asemenea, se consideră că abaterea standard a distribuției normale standard este egală cu unitatea.
Graficul corespunzător distribuției normale standard este numit curba normală standard. Aria delimitată de curba normală standard este proporțională cu frecvența scorurilor, astfel că proporția de cazuri cuprinse între un scor Z și media aritmetică poate fi aflată cu ajutorul calculului integral. Statisticienii au determinat cu precizie aceste arii, rezultatele fiind organizate sub forma unui tabel, numit tabelul curbei normale standard sau tabelul ariilor de sub curba normală standard (vezi Anexa A). Schema generală a acestui tabel este prezentată în figura 4.2.
Figura 4.2 Schema tabelului curbei normale standard
În corpul tabelului apar numere alcătuite din patru cifre. Aceste numere reprezintă ariile cuprinse între un scor Z dat și media aritmetică. Numerele înscrise în prima coloană din stânga, etichetată Z, reprezintă primele două cifre ale unui scor Z, iar numerele înscrise pe primul rând de sus reprezintă cea de-a treia cifră. De pildă, pentru a afla aria cuprinsă între un scor Z = 0,45 și media aritmetică, se coboară în prima coloană din stânga până la 0,4 (primele două cifre ale scorului Z considerat) și apoi se parcurge spre dreapta rândul respectiv până când se ajunge sub 0,05 (cea de-a treia cifră). Numărul găsit la intersecția acestor două coordonate este 1736, care poate fi citit sau ca un procent (17,36%), sau ca o proporție (0,1736). În primul caz vom spune că 17,35% din aria totală a curbei normale standard se află între scorul Z = 0,45 și media aritmetică (punct în care Z = 0); în cel de-al doilea caz vom spune că proporția din aria totală a curbei normale standard cuprinsă între scorul Z = 0,45 și media aritmetică este de 0,1736. Întrucât orice curbă normală este simetrică, aceeași procedură se aplică și pentru afla aria cuprinsă între un scor Z negativ și media aritmetică. Astfel, rezultatul de mai sus poate fi interpretat spunând că 17,35% din aria totală a curbei normale standard se află între scorul Z = 0,45 și media aritmetică.
4.4 UTILIZAREA DISTRIBUȚIEI NORMALE STANDARD
Figura 4.3 ilustrează utilizarea tabelului distribuției normale standard pentru determinarea procentelor din aria delimitată de curba normală, aflate între un scor Z dat și media aritmetică (Z = 0).
Figura 4.3 Procente din aria de sub curba normală
Abateri standard față de media aritmetică
De pildă, din tabel aflăm că între Z = +1 și media aritmetică se află 34,13% din aria de sub curbă (v. intersecția coordonatelor 1,0 și 0,00). Întrucât curba este simetrică, procentul din arie cuprins între Z = 1 și media aritmetică este tot de 34,13%. Astfel, între 1 abateri standard față de medie se află 68,26% din aria totală. Similar, între Z = +2 și medie se află 47,72% din arie, astfel că între 2 abateri standard față de medie se află 94,44% din arie.
Întrucât un procent relativ mic din aria totală se află peste +3 abateri standard sau sub 3 abateri standard (0,13%), pentru scopuri practice, ilustrate în cele ce urmează, se consideră că distribuția normală se extinde de la Z 3,59 la Z +3,59 sau, altfel spus, la 3,59 abateri standard de o parte și de cealaltă a mediei aritmetice, scorurile Z aflate dincolo de aceste limite fiind considerate a fi egale cu 0.
În cazul variabilelor normal distribuite pentru care cunoaștem media aritmetică și abaterea standard, distribuția normală standard poate fi folosită pentru a determina diferite procente sau proporții de cazuri în distribuții particulare, precum și pentru a determina probabilitatea de a selecta la întâmplare un scor cuprins într-o plajă dată de scoruri ale unei distribuții aproximativ normale.
4.4.1 DETERMINAREA PROCENTELOR DE CAZURI
Să considerăm o distribuție de scoruri a variabilei coeficient de inteligență (IQ) pentru un eșantion de1000 de subiecți cu = 100 și s = 20, ilustrată în figura 4.4.
Figura 4.4 Distribuția scorurilor IQ pentru
un eșantion de 1000 de subiecți
Unități IQ
Să presupunem că ne interesează procentul de cazuri cu scoruri IQ mai mici decât 115. Calculăm mai întâi scorul Z corespunzător scorului brut 115:
Din tabelul curbei normale aflăm că aria dintre scorul Z = +0,75 și media aritmetică reprezintă 27,34% din aria totală. Întrucât aria aflată sub media aritmetică reprezintă 50% din aria totală, procentul de subiecți cu scoruri IQ mai mici decât 115 este de 74,34% (27,34% + 50%). Acest rezultat poate fi exprimat și în număr de cazuri, spunând că aproximativ 743 de subiecți din eșantionul considerat (74,34% din 1000) au scoruri IQ mai mici decât 115.
Să presupunem acum că ne interesează procentul de cazuri cu scoruri IQ mai mici decât 75. Scorul Z corespunzător scorului brut 75 este
Pentru a afla aria de sub un scor Z negativ, aria dintre scor și media aritmetică se scade din 50% (aria aflată la stânga mediei). Din tabelul curbei normale aflăm că aria dintre scorul Z = 1,25 și media aritmetică reprezintă 39,44% din aria totală. Astfel, procentul de subiecți cu scoruri CI mai mici decât 75 este de 10,56% (50% 39,44%), ceea ce înseamnă că aproximativ 394 de subiecți (39,44% din 1000) au scoruri IQ mai mici decât 75.
Același model de calcul se utilizează pentru a afla aria situată deasupra unui scor Z pozitiv. Să presupunem că ne interesează procentul de cazuri cu scoruri mai mari decât 150. Știm că scorul Z corespunzător acestui scor brut este +2,50. Din tabelul curbei normale aflăm că aria dintre scorul Z = +2,50 și media aritmetică reprezintă 47,98% din aria totală, astfel că procentul de subiecți cu scoruri mai mari decât 150 este de 2,02% (50% 47,98%). Aceasta înseamnă că aproximativ 20 de subiecți (2,02% din 1000) au scoruri IQ mai mari decât 150.
În general, ariile situate peste sau sub un anumit scor Z se determină conform următoarelor reguli:
Pentru a determina aria aflată sub un scor Z negativ sau peste un scor Z pozitiv, aria dintre scorul respectiv și media aritmetică se scade din 50%.
Pentru a determina aria aflată sub un scor Z pozitiv sau peste un scor Z negativ, aria dintre scorul respectiv și media aritmetică se adună cu 50%.
Să vedem acum felul în care se determină ariile, respectiv procentele de cazuri dintre două scoruri. Să presupunem că ne interesează procentul de subiecți cu scoruri IQ cuprinse între 95 și 125. Scorurile Z corespunzătoare acestor scoruri brute sunt
Din tabelul curbei normale aflăm că aria dintre scorul Z = 0,25 și media aritmetică reprezintă 9,87% din aria totală și că aria dintre scorul Z = +1,25 și media aritmetică reprezintă 39,44% din aria totală. Fiind vorba despre scoruri aflate de o parte și de alta a mediei, aria dintre scoruri se determină adunând ariile dintre fiecare scor și media aritmetică. Astfel, procentul de subiecți cu scoruri IQ cuprinse între 95 și 125 este de 49,31% (9,87% + 39,44%). Aceasta înseamnă că aproximativ 439 de subiecți au scoruri IQ cuprinse între 95 și 125.
Pentru a determina aria dintre două scoruri aflate de aceeași parte a mediei aritmetice, se determină mai întâi ariile dintre fiecare scor și medie, după care aria mai mică se scade din aria mai mare. Să presupunem că ne interesează procentul de subiecți cu scoruri IQ cuprinse între 115 și 125. Știm că scorul Z corespunzătoare scorurilor brute 115 și 125 sunt, respectiv, +0,75 și +1,25. Știm, de asemenea, că între Z = +0,75 și media aritmetică se află 27,34% din aria totală și că între Z = +1,25 și media aritmetică se află 39,44% din aria totală. Prin urmare, procentul de subiecți cu scoruri IQ cuprinse între 115 și 125 este de 12,10% (39,44% 27,34%), ceea ce înseamnă că aproximativ 121 de subiecți au scoruri IQ cuprinse între 115 și 125. Același model de calcul se utilizează atunci când ambele scoruri se află sub medie.
4.4.2 DETERMINAREA PROBABILITĂȚILOR PENTRU SCORURI
Tabelul curbei normale standard poate fi utilizat pentru a determina probabilitatea de a selecta la întâmplare un scor cuprins într-o plajă dată de scoruri ale unei distribuții aproximativ normale. Înainte de a considera acest tip de utilizare, să examinăm pe scurt noțiunea de probabilitate.
Pentru a estima probabilitatea producerii unui eveniment, trebuie să definim evenimentele care reprezintă cazuri favorabile. Un caz favorabil este un caz în care se produce evenimentul a cărui probabilitate de apariție dorim să o estimăm sau, pe scurt, un caz care realizează acel eveniment. Să presupunem că într-o urnă sunt n bile de culori diferite, dintre care exact m sunt albe și că ne interesează probabilitatea de a extrage de la prima încercare o bilă albă. Evenimentul fiind apariția unei bile albe, cazul favorabil este extragerea unei bile albe. Față de cazul favorabil, vom spune că extragerea unei bile de orice culoare este un caz egal posibil. Avem astfel m cazuri favorabile și n cazuri egal posibile. Probabilitatea teoretică a unui eveniment E, notată Pr(E) se definește ca raportul dintre numărul m al cazurilor favorabile și numărul n al cazurilor egal posibile:
Pentru ilustrare, să presupunem că în urnă se află 52 de bile de culori diferite, dintre care una singură este albă. Întrucât m = 1 și n = 52, probabilitatea de a extrage de la prima încercare o bilă albă este 1/52. Această fracție poate fi exprimată și ca proporție, împărțind numărătorul la numitor: (1/52) = 0,0192. Vom spune că apariția bilei albe la o singură extragere se produce în proporție de 0,0192. În științele omului, probabilitățile sunt exprimate în mod obișnuit ca proporții și vom urma această convenție în continuare.
Este important de remarcat că, gândite astfel, probabilitățile au un înțeles precis: pe termen lung, cazurile favorabile se află într-o anumită relație proporțională cu numărul total de cazuri. În exemplul nostru, probabilitatea de 0,0192 ca bila albă să apară la o singură extragere înseamnă de fapt că din 10000 de extrageri a câte unei bile din urna completă, proporția de extrageri a bilei albe va fi de 0,0192 sau, altfel spus, că din 10000 de extrageri a câte unei bile din urna completă, bila albă va apărea de 192 de ori, celelalte 9808 extrageri producând bile de alte culori.
Acum, din cele de mai sus știm că pentru orice distribuție particulară aproximativ normală, proporțiile prezentate în tabelul curbei normale standard ne dau frecvența relativă a cazurilor cu scoruri cuprinse între un anumit scor și media aritmetică, precum și că probabilitatea unui eveniment este frecvența relativă a cazurilor care realizează acel eveniment. Prin urmare, proporțiile din tabelul curbei normale standard pot fi interpretate ca probabilități și pot fi folosite pentru a determina probabilitatea de selecție a unui scor cuprins într-o plajă dată de scoruri ale unei distribuții aproximativ normale.
Considerând din nou distribuția variabilei coeficient de inteligență cu care am lucrat mai sus, să presupunem că ne interesează probabilitatea ca un subiect ales la întâmplare să aibă un scor IQ cuprins între 95 și scorul mediu de 100 (aici, cazul favorabil este selectarea unui subiect al cărui scor se află în amplitudinea de scoruri specificată). Scorul Z corespunzător scorului brut de 95 este 0,25 și, conform tabelului curbei normale standard, proporția din arie cuprinsă între scorul Z = 0,25 și media aritmetică este de 0,0987. Această proporție este probabilitatea căutată. Vom spune că probabilitatea ca un subiect ales la întâmplare să aibă un scor IQ cuprins între 95 și 100 este de 0,0987 sau, rotunjit, de 0,1 sau de unu la zece.
De notat că pentru determinarea probabilităților de selectare a scorurilor se utilizează aceleași proceduri ilustrate mai sus pentru determinarea procentelor de cazuri, diferența fiind aceea că proporțiile din tabelul curbei normale standard sunt interpretate ca probabilități. De pildă, probabilitatea ca un subiect ales la întâmplare din eșantionul considerat să aibă un scor IQ peste 95 este de 0,5987 (0,5000 + 0,0987).
Să mai notăm că, întrucât în distribuția normală standard cele mai multe scoruri sunt grupate în jurul mediei aritmetice, frecvența acestora scăzând pe măsură ce ne îndepărtăm de medie, dacă vom selecta la întâmplare un număr de scoruri dintr-o distribuție aproximativ normală, vom selecta mai des scoruri apropiate de media aritmetică și mai rar scoruri aflate mult sub sau peste medie.
GLOSAR
5 EȘANTIONAREA ȘI DISTRIBUȚII DE
EȘANTIONARE
După cum am arătat în capitolul 1, cercetătorii folosesc statistici inferențiale pentru a trage concluzii despre caracteristicile unei populații pe baza caracteristicilor corespunzătoare ale unui eșantion din acea populație. Folosirea adecvată a acestor tehnici statistice cere ca eșantioanele să fie selectate aleatoriu din populațiile de referință. În cazul cel mai general, un eșantion este aleatoriu dacă fiecare caz din populația de referință are aceeași probabilitate de a fi selectat în eșantion cu a oricărui alt caz și selectarea fiecărui caz este independentă de selectarea tuturor celorlalte cazuri. Dacă populația are, să zicem, 1000 de membri, atunci fiecare membru trebuie să aibă o probabilitate de 1/1000 de a fi selectat. Supoziția fundamentală a statisticilor inferențiale este aceea că investigarea unui eșantion aleatoriu dintr-o populație conduce la rezultate apropiate de cele care ar fi obținute dacă ar fi investigată întreaga populație și, după cum vom vedea, noțiunea de distribuție de eșantionare furnizează o măsură a acestei apropieri. Eșantioanele nealeatorii pot fi foarte ușor alcătuite, dar nu permit formularea unor concluzii despre populațiile respective, ci doar despre eșantioane.
De notat că în acest context, „aleatoriu” este un termen tehnic, care nu are același înțeles cu termenul „întâmplător”, așa cum este utilizat acesta în limbajul obișnuit. Un eșantion aleatoriu nu este alcătuit la întâmplare, ci printr-un proces bine determinat și precis de selecție. De pildă, intervievarea unor persoane pe care se întâmplă să le întâlnim într-un supermagazin nu constituie o eșantionare aleatorie.
Selecția aleatorie este o condiție necesară pentru obținerea unor eșantioane care să ofere imagini cât mai precise ale populațiilor de referință sau, altfel spus, a unor eșantioane reprezentative pentru populațiile de referință, dar nici măcar cele mai sofisticate proceduri de selecție aleatorie nu garantează 100% că eșantionul respectiv este o reprezentare exactă a populației din care a fost alcătuit. Totuși, probabilitatea ca eșantioanele aleatorii să fie reprezentative pentru populațiile de referință este foarte mare, iar tehnicile statistice permit determinarea precisă a probabilităților erorilor de reprezentativitate.
Înainte de a prezenta rolul eșantionării în statisticile inferențiale, vom prezenta pe scurt câteva dintre cele mai utilizate procedee de eșantionare aleatorie.
5.1 PROCEDEE DE EȘANTIONARE ALEATORIE
Procedeul fundamental de eșantionare aleatorie se numește eșantionare aleatorie simplă. În procesul de selecție a unui eșantion aleatoriu simplu, fiecare caz din populația de referință are o probabilitate egală de a fi inclus în eșantion, iar selectarea fiecărui caz este independentă de selectarea tuturor celorlalte cazuri. Procesul de selecție aleatorie simplă se poate baza pe diferite tipuri de operații. În mod tipic, se folosesc tabele cu numere selectate aleatoriu de un computer. Un exemplu de astfel de tabel este dat în Anexa B. Aceste tabele conțin numere alcătuite din cinci cifre, de la 0 la 9. Pentru a folosi un astfel de tabel, se atribuie fiecărui caz din populația de referință un număr unic de identificare, după care se alege la întâmplare un rând și o coloană din tabel și, pornind de la acel punct la dreapta sau la stânga, în sus sau în jos, se citesc numerele, selectând în eșantion cazurile ale căror numere de identificare corespund cu numerele citite în tabel. Selecția se oprește atunci când s-a ajuns la dimensiunea dorită a eșantionului. Pentru ilustrare, să presupunem că dorim să alcătuim un eșantion de dimensiune n = 20 dintr-o populație de dimensiune N = 600. Mai întâi, numerotăm membrii populației într-o ordine oarecare 001, 002, …, 600. Pentru a forma eșantionul, considerăm doar ultimele trei cifre ale numerelor din tabel și, evident, ignorăm numerele mai mari de 600. Alegem la întâmplare un rând și o coloană și începem selecția pornind de la numărul respectiv și mergând, de pildă, în jos pe coloana aleasă, până când obținem 20 de numere. Dacă un număr de identificare este selectat mai mult decât o singură dată, se ignoră repetarea și se trece la următorul număr din secvență. Eșantionul va fi alcătuit din acei membri ai populației ale căror numere de identificare au fost astfel selectate.
Statisticienii atrag atenția asupra necesității de a schimba des tabelul cu numere aleatorii, dacă cercetătorul folosește des procedeul menționat: „Natura umană este în așa fel, încât fiecare dintre noi are tendința de a porni aproximativ din același loc și de a parcurge repetat aproximativ aceeași cale. De aceea, folosirea repetată a aceluiași tabel poate să conducă la selectarea aceluiași șir de numere”.
Să vedem acum cum poate fi folosit tabelul cu numere aleatorii pentru a repartiza aleatoriu un număr de subiecți în grupuri. Să presupunem că avem 15 subiecți și, în vederea unui experiment, dorim să alcătuim trei grupuri cu câte cinci subiecți în fiecare grup. Pentru aceasta, alegem la întâmplare un rând și o coloană și, urmând o anumită direcție, atribuim un număr fiecărui subiect, considerând doar ultimele două cifre ale numerelor din tabel. Apoi, considerăm subiecții în ordinea crescătoare a numerelor atribuite și repartizăm primii cinci subiecți în grupul 1, următorii cinci subiecți în grupul 2 și ultimii cinci subiecți în grupul 3. Tabelul următor prezintă o posibilă repartizare de felul menționat:
Evident, procedeul poate fi folosit pentru orice număr de grupuri într-un experiment.
Procedura de eșantionare aleatorie simplă devine incomodă, atunci când dimensiunea populației de referință este foarte mare (10000, de pildă). Într-un astfel de caz se poate folosi eșantionarea sistematică, numită și selecție mecanică. Mai întâi, se stabilește o fracție de selecție (fracție de eșantionare, pas de numărare): K = N/n, în care N este numărul total de cazuri din populația de referință, iar n este dimensiunea dorită a eșantionului. De pildă, dacă N = 10000 și n = 300, K = 34 (K se rotunjește întotdeauna până la un număr întreg). După ce s-a stabilit pasul de numărare, se listează la întâmplare membrii populației de referință și se alege la întâmplare, eventual prin tragere la sorți, un caz din primele K cazuri care se include în eșantion și apoi se alege fiecare al Klea caz pentru a fi inclus în eșantion până se ajunge la dimensiunea dorită a eșantionului. În exemplul nostru, dacă din primele 34 de cazuri a fost ales la întâmplare cazul cu numărul 5, atunci se vor include în eșantion următoarele cazuri: 5, 39, 73, 107, ș.a.m.d. până la n = 300.
De notat că în cazul eșantionării sistematice, selecția nu mai este independentă, deoarece, cu excepția primului caz, fiecare caz selectat depinde de numărul de ordine al cazului precedent. De aceea, acest procedeu este considerat ca fiind cvasialeatoriu. Caracterul aleatoriu este asigurat prin alcătuirea întâmplătoare a listelor din care sunt selectate cazurile.
Un al treilea procedeu de eșantionare, eșantionarea stratificată, conduce la creșterea cantității de informație despre populație. Pentru a alcătui un eșantion aleatoriu stratificat, se clasifică populația de referință după criterii relevante și se alcătuiesc eșantioane aleatorii simple din fiecare clasă (strat). De pildă, pot fi folosite criterii precum sexul, vârsta sau ocupația.
Cititorul interesat de detalii privitoare la procedurile de eșantionare descrise sumar mai sus sau/și de alte procedee de eșantionare poate consulta cărți despre eșantionare sau manuale de metodologie a cercetării psihologice.
5.2 DISTRIBUȚIA DE EȘANTIONARE
Scopul principal al statisticilor inferențiale este generalizarea unor caracteristici ale eșantionului la populația din care a fost alcătuit. Strategia generală a acestor tehnici statistice constă din trecerea de la distribuția unui eșantion la distribuția unei populații prin intermediul noțiunii de distribuție de eșantionare. Știm că informația necesară pentru caracterizarea adecvată a unei distribuții include forma distribuției, unele mărimi ale tendinței centrale și unele mărimi ale dispersiei Distribuția unui eșantion este empirică (există în realitate) și cunoscută, eșantionul fiind alcătuit de cercetător, în timp ce distribuția populației este empirică, dar este necunoscută. După cum vom vedea, distribuția de eșantionare este non-empirică (teoretică – nu poate fi obținută niciodată în realitate de către cercetător), iar pe baza legilor de probabilitate pot fi deduse forma, tendința centrală și dispersia acestei distribuții, astfel că proprietățile sale pot fi exact cunoscute. Să explicăm.
În capitolul anterior am folosit distribuția normală standard pentru a descrie distribuții de scoruri ale unor variabile aproximativ normale. În cele ce urmează vom considera mediile aritmetice, nu scorurile individuale, și vom folosi distribuția normală standard (distribuția Z) pentru a descrie distribuția mediilor aritmetice () pentru toate eșantioanele posibile de dimensiune dată (n), care pot fi obținute aleatoriu dintr-o populație. Cu alte cuvinte, vom considera că media aritmetică este ea însăși o variabilă, ale cărei scoruri sunt mediile aritmetice ale tuturor eșantioanelor aleatorii posibile de dimensiune constantă n dintr-o populație.
Să presupunem că ne interesează media aritmetică a vârstelor dintr-o populație de dimensiune comparabilă cu populația României. Selectăm un eșantion aleatoriu de 100 de persoane din această populație și înregistrăm vârstele pentru acest eșantion. Evident, ceea ce am obținut este distribuția vârstelor pentru eșantionul considerat, pentru care putem calcula media aritmetică. Acum, să presupunem că am selectat (cu înlocuire) toate eșantioanele posibile de dimensiune 100 din populația respectivă și că am calculat media aritmetică pentru fiecare eșantion. Rezultatele pe care, în principiu, le-am obține în acest fel constituie distribuția mediilor aritmetice pentru toate eșantioanele posibile de dimensiune 100 din populația de referință. Această distribuție este numită distribuția de eșantionare a mediilor aritmetice ale tuturor eșantioanelor aleatorii de dimensiune 100 din populația de referință. În general, distribuția de eșantionare a mediilor aritmetice se definește ca distribuția mediilor aritmetice ale tuturor eșantioanelor aleatorii de dimensiune constantă n din populația de referință. În mod similar, se definesc distribuțiile de eșantionare pentru alte mărimi statistice (proporții, coeficienți de corelație etc.), pe care le vom considera în unele dintre capitolele care urmează. În continuare, ne vom concentra atenția asupra distribuției de eșantionare a mediilor aritmetice.
Ca și distribuțiile de frecvențe considerate până acum, distribuția de eșantionare a mediilor aritmetice (și cele ale celorlalte mărimi statistice) are (1) o formă, (2) o medie aritmetică și (3) o abatere standard. Pentru media aritmetică și abaterea standard a distribuției de eșantionare a mediilor aritmetice vom folosi, respectiv, simbolurile și .
Cei trei parametri menționați ai distribuției de eșantionare a mediilor aritmetice sunt dați de următoarea teoremă, numită teorema limitei centrale:
Dacă se alcătuiesc toate eșantioanele posibile de dimensiune n dintr-o populație cu media aritmetică μ și abaterea standard σ, atunci distribuția de eșantionare a mediilor aritmetice ale acestor eșantioane are următoarele trei proprietăți:
Media sa aritmetică,, este egală cu media aritmetică a populației, μ..
Abaterea sa standard,, este egală cu .
Cu cât n este mai mare, cu atât forma sa aproximează mai bine normalitatea, indiferent de forma distribuției populației.
Demonstrarea acestei teoreme depășește cadrul propus pentru lucrarea de față. Pentru concizia exprimării, în loc de „distribuția de eșantionare a mediilor aritmetice” vom scrie în continuare „distribuția de eșantionare a ”.
Teorema limitei centrale arată că, indiferent de forma distribuției unei variabile într-o populație, distribuția de eșantionare a va fi aproximativ normală pentru eșantioane suficient de mari. De pildă, dacă lucrăm cu o variabilă care prezintă o distribuție asimetrică, precum venitul, putem să presupunem că distribuția de eșantionare a este aproximativ normală pentru eșantioane cu n 100, având media aritmetică egală cu cea a populației și abaterea standard egală cu . Astfel, teorema limitei centrale elimină constrângerea normalității pentru populații. Dacă distribuția unei variabile este aproximativ normală, atunci distribuția de eșantionare a va fi aproximativ normală chiar și pentru valori mai mici ale lui n. În fine, teoretic vorbind, dacă distribuția unei variabile este riguros normală, atunci distribuția de eșantionare a va fi normală indiferent de dimensiunea eșantionului.
5.3 DETERMINAREA PROBABILITĂȚILOR PENTRU
MEDII ARITMETICE
Teorema limitei centrale poate fi utilizată pentru a determina probabilitatea de a selecta la întâmplare o medie aritmetică a unui eșantion de dimensiune dată, cuprinsă într-o anumită plajă de medii aritmetice. Pentru ilustrare, să considerăm o populație cu media aritmetică a unei caracteristici aproximativ normale μ = 117 și σ = 14. Să presupunem că ne interesează probabilitatea ca un eșantion aleatoriu cu n = 36 selectat din această populație să aibă media aritmetică a caracteristicii respective cuprinsă între 115 și 120. Întrucât variabila considerată este aproximativ normală, conform punctului 3 al teoremei limitei centrale distribuția de eșantionare a aproximează normalitatea pentru n = 36. Conform punctelor 1 și 2 ale acestei teoreme, avem:
= 117
În paragraful 4.4.2 am lucrat cu formula
pentru a determina probabilitatea de selecție a unui scor cuprins într-o plajă dată de scoruri ale unei distribuții aproximativ normale. Aici, valorile 115 și 120 sunt medii aritmetice. Scorurile Z corespunzătoare acestor valori se calculează cu ajutorul următoarei formule:
În exemplul nostru, avem:
Din tabelul curbei normale aflăm că probabilitatea corespunzătoare scorului Z = 0,85 este 0,3023 și că probabilitatea corespunzătoare scorului Z = +1,28 este 0,3997. Ca atare, probabilitatea ca un eșantion cu n = 36 să aibă media aritmetică între 115 și 120 este de 0,7020 (0,3023 + 0,3997).
Să notăm și aici că pentru determinarea probabilităților de selectare a mediilor aritmetice se utilizează aceleași proceduri ilustrate pentru determinarea procentelor de cazuri. De pildă, probabilitatea ca un eșantion aleatoriu cu n = 36 selectat din populația considerată mai sus să aibă media aritmetică peste 120 este de 0,1003 (0,5000 0,3997).
5.4 STRATEGIA INFERENȚIALĂ
În statisticile inferențiale, mărimile statistice pentru populații sunt numite parametri și, prin contrast, mărimile statistice pentru eșantioane sunt numite pur și simplu statistici. Figura 5.1 ilustrează strategia generală a statisticilor inferențiale, pe care o vom folosi în capitolele care urmează.
Figura 5.1 Strategia inferențială
Astfel, în general, în statisticile inferențiale avem o populație ai cărei parametri se doresc a fi determinați. Pentru aceasta, selectăm un eșantion aleatoriu din acea populație și calculăm statisticile care reflectă parametrii corespunzători, după care, pe baza distribuțiilor de eșantionare ale acelor statistici și a legilor de probabilitate inferăm asupra parametrilor populației.
GLOSAR
Distribuția de eșantionare a mediilor aritmetice: distribuția mediilor aritmetice ale tuturor eșantioanelor aleatorii de dimensiune constantă n din populația de referință. În mod similar, se definesc distribuțiile de eșantionare pentru alte mărimi statistice (proporții, coeficienți de corelație etc.).
Eșantionare aleatorie simplă: metodă de selecție a unui eșantion în care fiecare caz din populația de referință are o probabilitate egală de a fi inclus în eșantion, iar selectarea fiecărui caz este independentă de selectarea tuturor celorlalte cazuri.
Eșantionare sistematică: metodă de selecție a unui eșantion în care primul caz dintr-o listă a populației de referință este selectat aleatoriu, după care este selectat fiecare al k-lea caz.
Eșantionare stratificată: metodă de selecție a unui eșantion în care populația de referință este clasificată după criterii relevante și se alcătuiesc eșantioane aleatorii simple din fiecare clasă (strat).
Parametri: mărimi statistice pentru populații; prin contrast, mărimile statistice pentru eșantioane sunt numite statistici.
Teorema limitei centrale: teoremă care specifică media aritmetică, abaterea standard și forma distribuției de eșantionare a mediilor aritmetice.
6 PROCEDURI DE ESTIMARE STATISTICĂ
Statisticile inferențiale se clasifică în două categorii principale: proceduri de estimare și proceduri de testare a ipotezelor. În procedurile de estimare, care fac obiectul acestui capitol, pe baza unei statistici calculate pentru un eșantion se face o apreciere despre parametrul corespunzător al populației de referință. În testarea ipotezelor, care face obiectul capitolelor următoare, se verifică (se testează) o ipoteză despre populație prin raportare la rezultatele obținute pe un eșantion.
La rândul lor, procedurile de estimare sunt de două tipuri: puncte estimate și intervale estimate. Un punct estimat este o singură valoare calculată pentru un eșantion și folosită pentru a estima parametrul corespunzător al populației de referință. Un interval estimat este o amplitudine de valori în care este probabil să se afle un parametru al populației de interes. Luând drept exemplu sondajele electorale, a spune că 38% din electorat va vota pentru candidatul X înseamnă a raporta un punct estimat, în timp ce a spune că între 35% și 42% din electorat va vota pentru candidatul X înseamnă a raporta un interval estimat. În ambele tipuri de proceduri, statisticile calculate pentru eșantioane servesc drept estimatori. De pildă, media aritmetică pentru un eșantion este un estimator al mediei aritmetice a populației de referință.
6.1 CARACTERISTICI ALE ESTIMATORILOR
Un estimator trebuie să satisfacă două condiții: să fie nedistorsionat și relativ eficient. Se spune că un estimator este nedistorsionat, dacă media aritmetică a distribuției sale de eșantionare este egală cu media aritmetică a populației de referință. Conform teoremei limitei centrale, mediile aritmetice ale eșantioanelor satisfac această condiție: media aritmetică a distribuției de eșantionare a mediilor aritmetice, , este egală cu media aritmetică a populației, μ. Statisticienii au demonstrat că și proporțiile eșantioanelor, p, sunt nedistorsionate, întrucât media aritmetică a distribuției de eșantionare a proporțiilor pentru eșantioane, μp, este egală cu proporția populației, P. Prin contrast, un estimator este distorsionat, dacă media aritmetică a distribuției sale de eșantionare este diferită de media aritmetică a populației. De pildă, abaterea standard a unui eșantion este un estimator distorsionat al abaterii standard a populației: de regulă, dispersia unui eșantion este mai mică decât cea a populației de referință, astfel că s tinde să subestimeze pe σ. După cum am menționat în capitolul 3, această distorsiune poate fi corectată.
Un estimator nedistorsionat permite, între altele, determinarea probabilității ca o mărime statistică a unui eșantion să se afle la o anumită distanță față de parametrul corespunzător pe care încercăm să-l estimăm. Pentru ilustrare, să presupunem că ne interesează venitul mediu al unei populații. Pentru aceasta, alcătuim un eșantion aleatoriu cu n = 500 și calculăm media aritmetică pentru acest eșantion. Să presupunem că am găsit . După cum am arătat, variabila venit prezintă o distribuție asimetrică. Cu toate acestea, conform teoremei limitei centrale, distribuția de eșantionare a pentru eșantioane mari (n 100) aproximează normalitatea, având media aritmetică, , egală cu media aritmetică a populației, . Știm că toate curbele normale conțin aproximativ 68% din cazuri între 1Z, 95% din cazuri între 2Z și 98% din cazuri între 3Z față de medie. Aici, cazurile sunt medii aritmetice ale eșantioanelor, astfel că există o probabilitate mare (aproximativ 68 de șanse din 100) ca media aritmetică a eșantionului considerat, 5000000, să se afle între 1Z, o probabilitate foarte mare (95 din 100) ca această medie să se afle între 2Z și o probabilitate extrem de mare (98 din 100) ca această medie să se afle între 3Z față de media aritmetică a distribuției de eșantionare , care are aceeași valoare cu :
Figura 6.1 Procente din aria de sub curba normală
De remarcat că în aproximativ 2% din cazuri, media aritmetică de 5000000 se află la mai mult de 3Z față de media aritmetică a distribuției de eșantionare. Practic, putem spune că media aritmetică de 5000000 nu se află în acea „minoritate”.
Cea de-a doua condiție pe care trebuie să o satisfacă un estimator, eficiența, este legată de dispersie. Un estimator este cu atât mai eficient, cu cât distribuția de eșantionare este mai grupată în jurul mediei sale aritmetice sau, altfel spus, cu cât este mai mică abaterea standard a distribuției de eșantionare. Să considerăm mediile aritmetice ale eșantioanelor. Din teorema limitei centrale știm că abaterea standard a distribuției de eșantionare a mediilor aritmetice ale eșantioanelor, , este egală cu , deci este invers proporțională cu n: cu cât dimensiunea eșantionului este mai mare, cu atât este mai mică . Ca atare, eficiența mediei aritmetice ca estimator poate fi îmbunătățită (= poate fi micșorată) prin mărirea dimensiunii eșantionului. Pentru ilustrare, să considerăm următorul exemplu:
Să presupunem că abaterea standard a populației, σ, este de 275000 (evident, valoarea lui σ este rareori cunoscută în realitate). În privința primului eșantion, abaterea standard a distribuției de eșantionare a mediilor aritmetice ale tuturor eșantioanelor cu n = 100 este = 27500. În privința celui de-al doilea eșantion, abaterea standard a distribuției de eșantionare a mediilor aritmetice ale tuturor eșantioanelor cu n = 1000 este considerabil mai mică: = 8697. Cea de-a doua distribuție de eșantionare este mult mai grupată decât prima distribuție.
Rezumând, întrucât este invers proporțională cu n, cu cât eșantionul este mai mare, cu atât distribuția de eșantionare este mai grupată și eficiența estimatorului este mai mare.
6.2 ESTIMAREA MEDIEI ARITMETICE CÂND σ ESTE
CUNOSCUT
Atunci când se estimează un punct, se alcătuiește un eșantion aleatoriu, se calculează o medie aritmetică sau o proporție și se estimează că valoarea parametrului respectiv este egală cu valoarea calculată pentru eșantion. În acest tip de estimare se ține cont faptul că eficiența estimatorului este direct proporțională cu dimensiunea eșantionului, ceea ce înseamnă că probabilitatea ca estimatorul să fie aproximativ egal cu parametrul corespunzător este cu atât mai mare, cu cât dimensiunea eșantionului este mai mare.
Procedura de estimare a intervalelor este relativ mai complicată, dar este mai sigură, în sensul că, atunci când se estimează un interval, probabilitatea ca în acel interval să se afle parametrul de interes este mai mare și poate fi stabilită cu precizie.
Fie o populație cu media aritmetică μ și cu abaterea standard σ. Selectăm aleatoriu un eșantion de dimensiune n din această populație și calculăm media aritmetică pentru eșantion, . Conform teoremei limitei centrale, distribuția de eșantionare a mediilor aritmetice ale tuturor eșantioanelor posibile de dimensiune n din populația de referință este aproximativ normală, cu media aritmetică egală cu cea a populației de referință și cu abaterea standard egală cu . Pe baza caracteristicilor distribuției de eșantionare și a tabelului distribuției normale standard putem formula enunțuri de probabilitate despre mediile aritmetice ale eșantioanelor. De pildă, din tabel aflăm că proporția de cazuri (medii aritmetice ale eșantioanelor) cuprinse între Z = 1,96 și media aritmetică este de 0,475. Întrucât curba este simetrică, proporția de cazuri cuprinse între Z = 1,96 și media aritmetică este tot de 0,475. Astfel, proporția de cazuri cuprinse între 1,96 abateri standard față de medie este de 0,95, iar proporția de cazuri aflate sub 1,96 și peste 1,96 abateri standard față de medie este de 0,05 (0,025 + 0,025):
Același lucru ca mai sus poate fi exprimat spunând că 95% din mediile aritmetice ale eșantioanelor se află în intervalul dintre și sau, pe scurt, în intervalul . Structura acestui tip de enunț de probabilitate poate fi folosită pentru a estima valoarea parametrului μ, prin construirea unui interval centrat pe valoarea cunoscută pentru eșantion, . Rezultatul este un interval de încredere estimat – o amplitudine de valori în care este probabil (nu sigur) să se afle μ. Astfel, putem estima că există o probabilitate de 0,95 (sau 95%) ca media aritmetică a populației să se afle în intervalul , ceea ce înseamnă că probabilitatea ca media aritmetică a populației să nu se afle în acest interval este de 0,05 (sau 5%).
Probabilitatea ca media aritmetică a populației să nu se afle în intervalul estimat sau, altfel spus, probabilitatea de eroare a estimării se numește nivel de semnificație sau nivel alfa (α), iar probabilitatea ca intervalul estimat să conțină media aritmetică a populației se numește nivel de încredere. După cum reiese și din cele de mai sus, nivelul de încredere este complementarul nivelului alfa, fiind egal cu 1 α sau, în procente, cu (1 α)100. A stabili, de pildă, că α = 0,05 înseamnă același lucru cu a spune că nivelul de încredere este de 95%. Întrucât probabilitatea de eroare este împărțită în mod egal în extremitatea inferioară și cea superioară a distribuției de eșantionare, stabilindu-se astfel limita inferioară și limita inferioară de încredere, vom nota scorul Z corespunzător nivelului α ales cu Zα/2. Astfel, în cazul în care σ este cunoscut, formula de construire a unui interval de încredere estimat (IE) bazat pe media aritmetică a unui eșantion este următoarea:
Formula 6.1
Ca exemplu, să presupunem că dorim să estimăm media aritmetică zilnică a orelor de vizionare a programelor TV de către femeile casnice. Pentru aceasta, alcătuim un eșantion aleatoriu de 200 de femei casnice (n = 200) și aflăm că acestea petrec în medie 6 ore pe zi vizionând programe TV (). Prin testări extensive știm că abaterea standard a populației pentru vizionarea programelor TV este de aproximativ 0,7 (σ = 0,7). În această cercetare suntem dispuși să asumăm o șansă de a greși de 10%, stabilind α = 0,10. Pentru a determina limitele de încredere inferioară și superioară, trebuie să scădem 0,05 (i.e. α/2) din 0,5 (proporția de cazuri aflate de o parte și de alta a mediei aritmetice a distribuției de eșantionare). Rezultatul scăderii este 0,450, ceea ce reprezintă proporția de cazuri dintre o limită de încredere și medie:
Astfel, pentru α = 0,10 trebuie să căutăm proporția 0,4500 în tabelul distribuției normale standard. Găsim însă o proporție de 0,4495, corespunzătoare scorului Zα/2 = 1,64 și o proporție de 0,4505, corespunzătoare scorului Zα/2 = 1,65. Scorul Zα/2 pe care îl căutăm se află undeva între aceste două scoruri. În aceste condiții, se ia cel mai mare dintre cele două scoruri: 1,65. În acest fel, intervalul de încredere va fi cel mai mare posibil în circumstanțele date. Prin urmare, vom avea:
6 1,65(0,7/14,14) =
= 6 1,65 0,0495 = 6 0,08
Pe baza mediei aritmetice a eșantionului, estimăm că femeile casnice petrec în medie între 5,92 (6 0,08) și 6,08 (6 0,08) ore pe zi vizionând programe TV. O altă modalitate de a enunța acest interval este 5,92 μ 6,08. Această estimare are o șansă de 10% de a fi greșită, adică de a nu conține media aritmetică a populației.
În principiu, cercetătorul poate folosi orice valoare pentru nivelul de încredere. Totuși, nivelurile de încredere folosite în mod obișnuit sunt 90%, 95% și 99%. În cazul nivelului de încredere de 99% ne confruntăm cu aceeași problemă ca în ultimul exemplu de mai sus. În acest caz, α = 0,01 și scăzând 0,005 (α/2) din 0,5 obținem 0,495. În tabel nu apare proporția 0,4950, dar apar proporțiile 0,4949 (Zα/2 = 2,57) și 0,4951 (Zα/2 = 2,57). Ca mai sus, se ia cel mai mare dintre cele două scoruri: 2,58. Tabelul următor rezumă toate datele de care avem nevoie:
Tabelul 6.1 Niveluri de încredere și scoruri Zα/2
6.3 ESTIMAREA MEDIEI ARITMETICE CÂND σ ESTE
NECUNOSCUT. DISTRIBUȚIA t–STUDENT
În aproape toate situațiile reale de cercetare, valoarea abaterii standard a populației este necunoscută. Se disting aici două cazuri: cazul în care dimensiunea eșantionului este relativ mare, ceea ce înseamnă eșantioane cu n 30, și cazul n 30.
În cazul eșantioanelor cu n 30, σ se poate estima prin s (abaterea standard a eșantionului). Întrucât, după cum am văzut, s este un estimator distorsionat pentru σ, formula de construire a intervalului de încredere estimat este ușor modificată față de formula 6.1, pentru a se corecta distorsiunea. Astfel, formula modificată pentru cazurile (reale) în care σ este necunoscut și n 30 este următoarea:
Formula 6.2
Înlocuirea lui cu reprezintă corecția cerută de faptul că s este un estimator distorsionat.
Pentru ilustrare, să presupunem că venitul mediu al unui eșantion aleatoriu cu n = 500 este de 5000000 de lei () cu s = 125000. Care este intervalul de încredere estimat pentru media aritmetică a populației respective, la un nivel de încredere de 95% (α = 0,05)?
5000000 1,96 5595,34 =
= 5000000 10967
Pe baza mediei aritmetice a eșantionului, estimăm că media aritmetică a veniturilor populației este cuprinsă între 4989033 lei (5000000 10967) și 5010967 lei (5000000 10967) și există doar 5% șanse ca acest interval să nu conțină media aritmetică a populației.
Atunci când eșantioanele sunt mici (n 30) și valoarea lui σ este necunoscută, distribuția normală standard nu poate fi folosită pentru a descrie distribuția de eșantionare a mediilor aritmetice. Pentru a construi intervale estimate semnificative în cazul n 30 se folosește o altă distribuție teoretică: distribuția tStudent. Ca și în cazul distribuției normale, graficul distribuției tStudent, numit și curba t, este simetric și are formă de clopot cu ambele extremități extinse la infinit. Spre deosebire de graficul distribuției normale, forma exactă a graficului distribuției t depinde de dimensiunea eșantionului. Pentru eșantioane mici, graficul distribuției t este mult mai aplatizat decât cel al distribuției normale (comparați figura următoare cu oricare dintre graficele de mai sus).
Figura 6.2 Un exemplu de curbă t
Pe măsură ce dimensiunea eșantionului crește, distribuția t seamănă din ce în ce mai mult cu distribuția normală, identificându-se cu aceasta pentru eșantioane practic foarte mari (și teoretic infinite). Astfel, întrucât există o distribuție t specifică pentru fiecare eșantion de dimensiune dată, distribuția t este, de fapt, o familie de distribuții.
Distribuția t particulară cerută pentru rezolvarea unei anumite probleme depinde de un concept matematic numit grade de libertate. Acest concept se referă la numărul de valori libere să varieze într-o distribuție. De pildă, dacă știm că o distribuție de cinci scoruri are media aritmetică egală cu 3 și că patru dintre aceste scoruri sunt 1, 2, 3, și 4, atunci valoarea celui de-al cincilea scor este fixată: 5. În general, pentru media aritmetică a unui eșantion de dimensiune n, o distribuție are n 1 grade de libertate. Fiecare distribuție t este asociată cu un număr unic de grade de libertate. Mai precis, dacă se selectează toate eșantioanele posibile de dimensiune n dintr-o populație normală, atunci distribuția de eșantionare a cantității
este distribuția tStudent cu n 1 grade de libertate.
Distribuția t va fi utilizată îndeosebi în testarea ipotezelor. Deocamdată vom descrie tabelul valorilor critice ale distribuției t, prezentat în Anexa C, și vom ilustra utilizarea acestui tabel pentru estimarea intervalelor. Schema generală a acestui tabel este prezentată în figura 6.3.
Figura 6.3 Schema tabelului valorilor critice ale distribuției t
Tabelul valorilor critice ale distribuției t specifică valorile pentru tα, ceea ce înseamnă valorile lui t pentru care aria aflată la dreapta sub curba t este egală cu α:
Nivelele α sunt dispuse pe primul rând al tabelului Valorile tα sunt date pentru grade de libertate (gl), dispuse pe prima coloană din stânga, de la 1 la 30 și apoi 40, 60, 120 și . De notat că, pe măsură ce numărul de grade de libertate crește, diferența dintre distribuția t și distribuția normală descrește, precum și că pentru o infinitate de grade de libertate, distribuția t este identică cu distribuția normală. Pentru estimarea intervalelor, ca și pentru alte scopuri, avem nevoie de tα/2. Această valoare se localizează înmulțind cu 2 valoarea α aflată pe primul rând. De pildă, pentru n = 30 și α = 0,05, numărul de grade de libertate este 29; la intersecția coloanei de sub tα = 0,025 și liniei corespunzătoare pentru gl = 29 găsim valoarea 2,045. Astfel, în acest caz, vom spune că valoarea lui tα/2 este 2,045.
Formula pentru cazurile în care σ este necunoscut și n 30 este următoarea:
Formula 6.3
Pentru ilustrare, să presupunem că un eșantion aleatoriu de 20 de adolescenți cu dificultăți de învățare au obținut următoarele rezultate la un test de cunoștințe la care scorul maxim ce poate fi obținut este de 40:
Tabelul 6.2 Scoruri obținute la un test de cunoștințe
de către 20 de adolescenți cu dificultăți de învățare
Presupunând că variabila măsurată este normal distribuită în populația de adolescenți cu dificultăți de învățare, care este intervalul de încredere estimat pentru media aritmetică a acestei populații, la un nivel de încredere de 99%? Calculăm mai întâi media aritmetică a scorurilor din eșantion:
=
Abaterea standard la nivelul eșantionului este:
Pentru n = 20, numărul de grade de libertate este 19; având α = 0,01, la intersecția coloanei de sub tα = 0,005 și liniei corespunzătoare pentru gl = 19 găsim valoarea 2,861. Astfel, valoarea lui tα/2 este 2,861. Aplicând formula 6.3, obținem:
Astfel, estimăm că media aritmetică pe care o căutăm este cuprinsă între 21,03 și 27,91 și există doar 1% șanse ca acest interval să nu conțină media aritmetică a populației.
De reținut că formula 6.3 poate fi aplicată doar dacă variabila de interes este normal distribuită.
6.4 ESTIMAREA PROPORȚIILOR
Pe baza teoremei limitei centrale se demonstrează că proporțiile pentru eșantioane (p) au distribuții de eșantionare aproximativ normale, cu media aritmetică (μp) egală cu proporția pentru populație (P) și abaterea standard (σp) egală cu . Teoretic, formula pentru construirea unui interval estimat bazat pe proporții ale eșantioanelor este următoarea:
Formula 6.4
În această formulă, valorile pentru p și n provin de la eșantion, iar valoarea lui Zα/2 se determină la fel ca mai sus. Problema cu această formulă este că valoarea proporției pentru populație, P, nu este cunoscută. Pentru a rezolva această problemă, se poate proceda în două moduri.
Un prim mod de a rezolva problema constă în a stabili că P = 0,5. În această situație, 1 P = 0,5 iar P(1 P) = 0,5 0,5 = 0,25. Este important de remarcat că 0,25 este valoarea maximă pe care o poate lua numărătorul fracției de sub radical, P(1 P). Stabilind pentru P orice altă valoare diferită de 0,5, valoarea expresiei P(1 P) va fi mai mică decât valoarea pentru P = 0,5. De pildă, dacă P = 0,4, atunci 1 P = 0,6 și
P(1 P) = 0,4 0,6 = 0,24. Întrucât P(1 P) are valoarea maximă când P = 0,5, ne asigurăm că intervalul obținut va fi cel mai mare posibil pentru p, Zα/2 și n date. Practic, adoptând această soluție, lucrăm cu formula următoare:
Formula 6.5
A doua soluție a problemei menționate constă din a estima valoarea lui P prin p, lucrând cu formula următoare:
Formula 6.6
Oricum, formulele de mai sus pot fi folosite doar dacă dimensiunea eșantionului considerat estre destul de mare, astfel încât np 5 și n(1 p) 5.
Să presupunem, de pildă, că ne dorim să estimăm proporția de studenți de la universitatea X care au lipsit cel puțin o zi pe motiv de boală într-un anumit semestru și că dintr-un eșantion aleatoriu de 200 de studenți, găsim 30 în această situație. Astfel, proporția eșantionului pe care ne bazăm estimarea este p = 30/200 = 0,15. La un nivel de încredere de 95%, intervalul estimat cu ajutorul formulei 6.5 este următorul:
Pe baza proporției de 0,30 a eșantionului, estimăm că proporția căutată este cuprinsă între 0,08 și 0,22. Estimarea poate fi exprimată și în termeni de procente, spunând că între 8% și 22% dintre studenții universității X au lipsit cel puțin o zi pe motiv de boală în semestrul considerat.
Să aplicăm acum formula 6.6 la aceleași date, păstrând nivelul de încredere de 95%:
În acest caz, estimăm că proporția căutată este cuprinsă între 0,10 și 0,20 sau, altfel spus, că între 10% și 20% dintre studenții universității X au lipsit cel puțin o zi pe motiv de boală în semestrul considerat.
De notat că intervalul estimat cu ajutorul formulei 6.5 este mai larg decât cel estimat cu ajutorul formulei 6.6, astfel că prima estimare este cea mai conservatoare soluție posibilă, căci este mult mai probabil ca intervalele mai largi să conțină parametrul estimat. Prin urmare, din punct de vedere statistic, prima estimare este preferabilă celei de-a doua estimări.
6.5 DIMENSIUNI ALE EȘANTIOANELOR ȘI NIVELE DE
PRECIZIE
Formulele 6.1 și 6.5 pot fi manipulate algebric pentru a determina dimensiunea unui eșantion la orice nivel de precizie dorit sau, altfel spus, pentru orice limită de eroare stabilită.
6.5.1 CONTROLUL MĂRIMII INTERVALULUI ESTIMAT
Mărimea unui interval de încredere estimat pentru medii aritmetice sau proporții poate fi controlat prin intermediul a doi termeni ai ecuației respective: nivelul de încredere, care determină scorul Zα/2 sau tα/2 corespunzător, și dimensiunea eșantionului.
Relația dintre nivelul de încredere și mărimea intervalului este de proporționalitate directă: cu cât nivelul de încredere crește, cu atât intervalul este mai mare. Intuitiv, este mult mai probabil ca intervalele mai largi să conțină valoarea pentru populație, prin urmare putem avea mai multă încredere în astfel de intervale. Pentru a ilustra această relație, să considerăm din nou exemplul privind estimarea venitului mediu al unei populații: n = 500, , s = 125000. La un nivel de încredere de 95% am găsit intervalul 5000000 10967 (i.e. acest interval se extinde la 10967 lei în jurul mediei aritmetice a eșantionului). Acum, dacă luăm un nivel de încredere de 99%, scorul Zα/2 corespunzător crește la 2,58, iar intervalul se mărește:
IE = 5000000 2,58 5595,34 = 5000000 14436
(intervalul estimat la un nivel de încredere de 99% se extinde la 14436 lei în jurul mediei). Exact aceeași relație se aplică și la proporții.
Relația dintre dimensiunea eșantionului și mărimea intervalului este de proporționalitate inversă: cu cât dimensiunea eșantionului este mai mare, cu atât intervalul este mai îngust. Intuitiv, eșantioanele mai mari permit estimări mai precise. Pentru ilustrare, să considerăm din nou exemplul privind estimarea venitului mediu, modificând doar dimensiunea eșantionului: n = 1000 (95%).
Pentru n = 500, la un nivel de încredere de 95%, intervalul estimat se extinde la 10967 lei în jurul mediei; pentru n = 1000, toate celelalte rămânând aceleași, intervalul estimat se extinde doar la 7753 lei în jurul mediei. Exact aceeași relație se aplică și la proporții.
De notat că îngustarea intervalului (= creșterea preciziei) nu depinde în mod liniar de dimensiunea eșantionului. În exemplul nostru am dublat dimensiunea eșantionului, dar cel de-al doilea interval nu este de două ori mai îngust decât primul, ci de aproximativ 1,41 de ori mai îngust. Aceasta înseamnă că n trebuie să crească de trei sau patru ori pentru a obține o dublare a preciziei. Întrucât costul unei cercetări este direct proporțional cu dimensiunea eșantionului, un eșantion de, să zicem, 10000 de persoane costă aproximativ de două ori mai mult decât unul de 5000 de persoane, dar estimarea bazată pe eșantionul mai mare nu va fi de două ori mai precisă decât cea bazată pe eșantionul mai mic.
6.5.2 DETERMINAREA DIMENSIUNII EȘANTIONULUI PENTRU
ESTIMAREA MEDIILOR ARITMETICE
Să considerăm formula 6.1:
În această formulă, membrul reprezintă, în fapt, limita de eroare sau nivelul de precizie a estimării: este limita inferioară, iar este limita superioară. Notând limita de eroare cu L, putem scrie următoarea ecuație:
Ridicând la pătrat ambii membri ai ecuației, egalitatea se păstrează:
Din această egalitate îl putem obține pe n:
Formula 6.7
Pentru a folosi această formulă trebuie să cunoaștem valoarea lui σ, or, după cum am mai menționat, în aproape toate cazurile această valoare nu este cunoscută. Totuși, valoarea lui σ poate fi aproximată, dacă cunoaștem amplitudinea variabilei măsurate, A. Astfel, o aproximare conservatoare a lui σ este σ A/4.
Să ilustrăm. Un psiholog industrial dorește să estimeze durata medie în care un muncitor de la o firmă de produse electronice execută un anumit reglaj. Observând un număr de muncitori care execută reglajul respectiv, psihologul constată că durata cea mai mică este de 10 minute, iar cea mai mare de 22 de minute. Cât de mare trebuie să fie eșantionul selectat, dacă psihologul dorește să estimeze durata medie de execuție a acelui reglaj cu o precizie de 20 de secunde, la un nivel de încredere de 95%? În această problemă, L = 20 și amplitudinea variabilei măsurate este A = 22 – 10 = 12 minute, astfel că
σ A/4 = 12/4 = 3 minute = 180 secunde
Acum îl putem obține pe n:
Prin urmare, psihologul trebuie să selecteze un eșantion aleatoriu de aproximativ 300 de muncitori pentru a estima durata medie de executare a reglajului respectiv cu o precizie de 20 de secunde, la un nivel de încredere de 95%.
Să presupunem acum că se dorește dublarea preciziei de la 20 de secunde la 10 secunde, la același nivel de încredere. În acest caz avem:
Se observă că dimensiunea eșantionului crește mai repede decât precizia: pentru a dubla precizia de la 20 de secunde la 10 secunde, dimensiunea eșantionului trebuie să crească de aproximativ patru ori. Această relație este importantă pentru planificarea costurilor unei cercetări. Eșantioanele impresionant de mari pot constitui o irosire de resurse fără un câștig semnificativ în privința preciziei, în raport cu eșantioanele mai mici și deci mai ieftine.
6.5.3 DETERMINAREA DIMENSIUNII EȘANTIONULUI PENTRU
ESTIMAREA PROPORȚIILOR
Am văzut că, practic, în construirea unui interval estimat pentru proporții lucrăm cu formula
Aici, limita de eroare a estimării este . Notând tot cu L limita de eroare a estimării, avem ecuația:
Ridicând la pătrat ambii membri, avem:
Din această egalitate îl obținem pe n:
Formula 6.8
Să presupunem că un institut de sondare a opiniei publice dorește să estimeze rezultatul unor alegeri prezidențiale înăuntrul unei marje de eroare de 3%. Cât de mare trebuie să fie eșantionul cerut pentru a sigura acest nivel de precizie la un nivel de încredere de 95%? Exprimând limita de eroare sub formă de proporție, obținem:
Prin urmare, pentru a obține o precizie (o limită de eroare a estimării) de 3%, este nevoie de un eșantion de aproximativ 1000 de persoane.
Și aici se poate constata ușor că dimensiunea eșantionului crește mai repede decât precizia. Tabelul următor prezintă relațiile dintre precizie și dimensiunea eșantionului pentru proporții ale eșantioanelor:
Tabelul 6.3 Precizia și dimensiunea eșantionului
(α = 0,05, P = 0,5)
Se poate observa, de pildă, că pentru a dubla precizia de la 10% la 5%, dimensiunea eșantionului trebuie să crească de patru ori.
GLOSAR
Curba t: grafic al unei distribuții t; ca și curba normală, curba t este simetrică și are formă de clopot cu ambele extremități extinse la infinit; spre deosebire curba normală, forma exactă a curbei t depinde de dimensiunea eșantionului.
Distorsiune: criteriu folosit pentru selectarea unei mărimi statistice ca estimator; o mărime statistică este nedistorsionată, dacă media aritmetică a distribuției sale de eșantionare este egală cu media aritmetică a populației de referință.
Distribuția t: distribuție teoretică ce descrie distribuția de eșantionare a mediilor aritmetice în cazul în care eșantioanele sunt mici (n 30) și valoarea lui σ este necunoscută.
Eficiență: criteriu folosit pentru selectarea unei mărimi statistice ca estimator; o mărime statistică este cu atât mai eficientă, cu cât distribuția de eșantionare este mai grupată în jurul mediei sale aritmetice sau, altfel spus, cu cât este mai mică abaterea standard a distribuției de eșantionare.
Grade de libertate: concept care se referă la numărul de valori libere să varieze într-o distribuție.
Interval de încredere estimat: amplitudine de valori în care este probabil să se afle un parametru al populației de interes.
Nivel alfa (α): Probabilitatea ca un parametru să nu se afle în intervalul estimat sau, altfel spus, probabilitatea de eroare a estimării.
Nivel de încredere: probabilitatea ca intervalul estimat să conțină parametrul de interes.
Proceduri de estimare: tehnici statistice în care pe baza unei statistici calculate pentru un eșantion, numită estimator, se face o apreciere despre parametrul corespunzător al populației de referință.
Punct estimat: o singură valoare calculată pentru un eșantion și folosită pentru a face o apreciere despre parametrul corespunzător al populației de referință.
7 TESTAREA IPOTEZELOR DESPRE
O SINGURĂ POPULAȚIE
În acest capitol sunt expuse tehnici statistice de testare a ipotezelor despre o singură populație. Într-un astfel de caz, pe baza unei statistici calculate pentru un eșantion, cel mai adesea o medie aritmetică sau o proporție, se trage o concluzie despre parametrul corespunzător al populației de referință. Mai precis, cercetarea constă din alcătuirea unui eșantion aleatoriu din populația de referință, culegerea informației relevante din eșantion, calcularea valorii unei statistici și compararea acestei valori cu valoarea presupusă a parametrului corespunzător. În aproape toate situațiile de cercetare vom găsi o anumită diferență între cele două valori, iar tehnicile de testare a ipotezelor permit să se decidă dacă diferența este atât de mare, încât să justifice respingerea presupunerii făcute pentru populație.
Tehnicile de testare a ipotezelor prezentate în acest capitol și în capitolele care urmează sunt teste despre valoarea parametrilor unei populații și cer îndeplinirea unor condiții sau supoziții despre populațiile respective, cum este, în principal, normalitatea. Testele de acest fel se numesc teste parametrice.
7.1 TESTUL SCORURILOR Z PENTRU MEDII ARITMETICE
CÂND σ ESTE CUNOSCUT
Vom prezenta acest test cu ajutorul unui exemplu, pe care îl vom folosi și pentru a introduce noțiunile fundamentale ale testelor parametrice: ipoteză de nul, ipoteză alternativă, statistică a testului și regulă de decizie.
Un cercetător presupune că într-un anumit an, media aritmetică a punctajelor obținute la examenul de rezidențiat al medicilor este de 800. Pentru a testa această ipoteză, cercetătorul alcătuiește un eșantion aleatoriu de 130 de medici care și-au susținut rezidențiatul în acel an și constată că la nivelul acestui eșantion media aritmetică a punctajului obținut este de 755. Prin investigații extensive, cercetătorul știe că abaterea standard la nivelul populației de referință este de aproximativ 152. Problema care se pune este dacă diferența dintre media aritmetică a eșantionului și valoarea presupusă pentru populație este sau nu statistic semnificativă. Dacă răspunsul este afirmativ, atunci ipoteza făcută poate fi respinsă. Dacă, însă, răspunsul este negativ, atunci diferența poate fi pusă pe seama întâmplării, astfel că ipoteza cercetătorului nu poate fi respinsă. După cum vom vedea, testul scorurilor Z permite determinarea matematică a înțelesului termenului „statistic semnificativ”. Datele problemei sunt, deci, următoarele:
Am notat cu μH media aritmetică presupusă a populației, pentru a o deosebi de media aritmetică efectivă a populației, μ.
Ipoteza de nul, pe care o vom nota H0, specifică o anumită valoare pentru parametrul respectiv. În general, ipoteza de nul despre media aritmetică a unei populații are forma
H0: μ = μH
Denumirea de „ipoteză de nul” se justifică prin aceea că forma sa poate fi redată echivalent prin
H0: μ μH = 0
În cuvinte, ipoteza de nul enunță că nu există nici o diferență semnificativă între valoarea efectivă a parametrului respectiv și valoarea presupusă a acelui parametru. Dacă ipoteza de nul este adevărată, atunci diferența dintre eșantion și populație nu este semnificativă, putând fi atribuită întâmplării.
În mod obișnuit, cercetătorul este de părere că există o diferență semnificativă între eșantion și populație și dorește să respingă ipoteza de nul ca neadevărată. Această opinie constituie ipoteza alternativă, pe care o vom nota cu Ha. Dacă cercetătorul nu are posibilitatea sau nu dorește să prezică sensul diferenței, atunci ipoteza alternativă ia forma
Ha: μ μH
Dacă, însă, sensul diferenței dintre eșantion și populație poate fi prezis sau dacă cercetătorul este interesat doar de un singur sens al diferenței, atunci ipoteza alternativă poate lua una dintre următoarele două forme:
Ha: μ μH
Ha: μ μH
În cazul în care Ha are forma μ μH, se spune că testul este bilateral sau non-direcțional, iar în cazurile în care Ha are una dintre celelalte două forme, se spune că testul este unilateral sau direcțional. Vom reveni la aceste noțiuni ceva mai departe. Să reținem deocamdată că în orice test se decide dacă se respinge sau nu se respinge ipoteza de nul, pe baza dovezilor aduse în sprijinul ipotezei alternative. Astfel, dacă putem respinge H0 ca neadevărată, atunci vom accepta Ha.
Revenind la exemplul nostru, ipoteza de nul este H0: μ = 800. Din enunțul problemei rezultă că nu este vorba despre un sens al diferenței menționate, astfel că ipoteza alternativă este Ha: μ 800.
Termenul statistică a testului se referă la formula a cărei aplicare în testul respectiv permite obținerea unei valori ce formează baza deciziei asupra ipotezei de nul. Pentru mediile aritmetice, atunci când se cunoaște sau se poate aproxima valoarea lui σ, statistica testului este dată de următoarea formulă:
Formula 7.1
Să notăm că această formulă este analoagă structural formulelor de calcul pentru transformarea unui scor „brut” X în scorul Z corespunzător (v. secțiunea 4.2), aici fiind vorba despre scorul Z al unei medii aritmetice. Ca atare, în numitorul formulei 7.1 apare abaterea standard a distribuției de eșantionare a , astfel că această formulă ne dă distanța în abateri standard sau fracțiuni de abateri standard a mediei aritmetice a eșantionului, , față de valoarea presupusă pentru populație. În exemplul nostru, avem
Din motive care vor deveni imediat evidente, vom desemna rezultatul aplicării formulei 7.1 prin Z (obținut). Aici, Z (obținut) = 3,36.
Regula de decizie se referă la o anumită amplitudine de valori pentru rezultatul statisticii testului, numită zonă critică sau zonă de respingere, care conduce la respingerea ipotezei de nul. În cazul testului scorurilor Z pentru medii aritmetice, zona critică se stabilește cu ajutorul distribuției de eșantionare a . Astfel, în exemplul de mai sus, eșantionul alcătuit este unul dintre toate eșantioanele posibile cu n = 130 din populația de referință. Să presupunem că H0 este adevărată, Dacă s-ar calcula toate mediile aritmetice posibile, atunci teorema limitei centrale asigură următorul rezultat:
În general, cu cât este mai aproape de centru (diferența dintre și este mai mică), cu atât vom fi mai înclinați să nu respingem ipoteza de nul și cu cât este mai departe de centru (diferența dintre și este mai mare), cu atât vom fi mai înclinați să respingem ipoteza de nul. Cu alte cuvinte, ipoteza de nul poate fi respinsă dacă rezultatul statisticii testului este un număr negativ „prea mare” sau un număr pozitiv „prea mare”. Înțelesul expresiei „prea mare” se fixează prin alegerea unui nivel de încredere sau nivel α (revedeți capitolul anterior). În cazul ipotezei alternative de forma Ha: μ μH, nivelul α ales se împarte în mod egal în cele două extremități ale distribuției de eșantionare:
Aria de sub Zα/2 plus aria de peste +Zα/2 reprezintă zona critică: dacă scorul Z corespunzător mediei aritmetice a unui eșantion cade în această arie (i.e. sub Zα/2 sau peste +Zα/2), atunci media aritmetică respectivă are prin definiție o probabilitate de apariție mai mică decât α. Scorurile Zα/2 și +Zα/2 se numesc scoruri Z critice și se desemnează, respectiv, prin Zα/2 (critic) și +Zα/2 (critic).
Să revenim iarăși la exemplul nostru și să stabilim α = 0,05. Știm că pentru această valoare a lui α, Zα/2 = 1,96. Z (obținut) se află în zona critică (3,36 1,96), după cum se ilustrează în figura următoare:
Ca atare, suntem îndreptățiți să respingem ipoteza de nul: probabilitatea de apariție a mediei aritmetice a eșantionului considerat este mai mică decât 0,05 și deci nu poate fi atribuită întâmplării. Cu alte cuvinte, diferența dintre media aritmetică a eșantionului și media aritmetică presupusă pentru populație este statistic semnificativă (eșantionul de rezidenți diferă semnificativ de populația din care a fost selectat), astfel că ipoteza de nul poate fi respinsă.
De notat că decizia pe care am luat-o (respingerea ipotezei de nul) comportă un element de risc: această decizie poate fi greșită, întrucât este posibil ca eșantionul considerat să fie unul dintre puținele eșantioane nereprezentative pentru populația de medici rezidenți. O trăsătură foarte importantă a testării ipotezelor constă din aceea că probabilitatea de a lua o decizie greșită este cunoscută, fiind dată de nivelul α ales. În exemplul nostru, probabilitatea de a lua o decizie greșită este de 0,05. A spune că probabilitatea de a fi respins greșit ipoteza de nul este de 0,05 revine la a spune că dacă am repeta acest test de o infinitate de ori, vom respinge greșit H0 doar de 5 ori la fiecare 100 de repetări. Rezultatul de mai sus poate fi enunțat și spunând că diferența menționată este statistic semnificativă la un nivel de încredere de 95%. Ca și pentru estimarea intervalelor, nivelurile de încredere folosite în mod obișnuit în testarea ipotezelor sunt 90%, 95% și 99%.
Testul întreprins în acest exemplu este bilateral sau nedirecțional. În general, într-un astfel de test, ipoteza alternativă enunță doar că există o diferență între valoarea efectivă a parametrului respectiv și valoarea presupusă pentru acel parametru. După cum am văzut, în cazul unui test bilateral, zona critică specificată de nivelul α se împarte în mod egal în cele două extremități ale distribuției de eșantionare. Într-un test bilateral, indiferent de nivelul α ales, regula de decizie este următoarea:
Se respinge H0, dacă Z (obținut) +Zα/2 (critic) sau dacă Z (obținut) Zα/2 (critic)
Într-un test unilateral sau direcțional, dacă cercetătorul crede că valoarea efectivă a parametrului este mai mare decât valoarea presupusă, Ha ia forma μ μH, iar pentru un test în sensul opus, Ha ia forma μ μH.. În cazul unui test unilateral, întreaga zonă critică specificată de nivelul α este plasată în extremitatea de interes a distribuției de eșantionare. De pildă, într-un test bilateral în care α = 0,05, zona critică începe de la Zα/2 (critic) = 1,96. Într-un test unilateral, la același nivel α, Zα (critic) este +1,65 dacă este vorba despre extremitatea superioară (dacă Ha este de forma μ μH) și este 1,65 dacă este vorba despre extremitatea inferioară (dacă Ha este de forma μ μH). De notat că aici folosim Zα în loc de Zα/2, întrucât întreaga zonă critică este plasată într-o singură extremitate a distribuției de eșantionare.
Într-un test unilateral, indiferent de nivelul α ales, dacă Ha este de forma μ μH („test unilateral dreapta”), atunci regula de decizie este
Se respinge H0, dacă Z (obținut) +Zα (critic)
Dacă Ha este de forma μ μH („test unilateral stânga”) atunci regula de decizie este
Se respinge H0, dacă Z (obținut) Zα (critic)
După cum rezultă și din cele de mai sus, un test unilateral este mai „bun” decât unul bilateral, deoarece zona critică este „trasă” mai aproape de media aritmetică, îmbunătățind astfel probabilitatea de a respinge H0. Astfel, dacă cercetătorul are mai multă experiență și mai multe cunoștințe în legătură cu variabila investigată, atunci se recomandă folosirea unui test unilateral, ceea ce cere o ipoteză alternativă direcțională.
Se obișnuiește ca testarea ipotezelor statistice să fie organizată sub forma unui „model în n pași”, numărul de pași diferind de la un autor la altul în funcție de anumite opțiuni de compactare sau de detaliere a informației. În cele ce urmează vom folosi un model în 4 pași, pe care îl exemplificăm pentru problema tratată mai sus:
Pasul 1. Enunțarea ipotezelor
H0: μ = 800
Ha: μ 800
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția Z
α = 0,05 (test bilateral)
Zα/2 (critic) = 1,96
(Zona critică este notată prin scorurile Z care îi marchează începuturile).
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât Z (obținut) se află în zona critică (3,36 1,96), ipoteza de nul poate fi respinsă. Diferența dintre eșantionul de medici rezidenți și populația de referință nu poate fi atribuită întâmplării sau, altfel spus, această diferență este statistic semnificativă (la un nivel de încredere de 95%).
Pentru a ilustra aplicarea unui test unilateral, să presupunem că cercetătorul din exemplul de mai sus dorește să testeze ipoteza că media aritmetică a populației de rezidenți este mai mică decât 800, toate celelalte date fiind aceleași. În acest caz, cercetătorul este interesat doar de extremitatea stângă a distribuției de eșantionare și va plasa întreaga zonă critică în această extremitate. În termenii modelului în patru pași, testul decurge după cum urmează:
Pasul 1. Enunțarea ipotezelor
H0: μ = 800
Ha: μ 800
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția Z
α = 0,05 (test unilateral stânga)
Zα (critic) = 1,65
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât Z (obținut) se află în zona critică (3,36 1,65), ipoteza de nul poate fi respinsă și se poate accepta că media aritmetică a populației de rezidenți este mai mică decât 800 (la un nivel de încredere de 95%).
7.2 ERORI ÎN TESTAREA IPOTEZELOR
Atunci când decidem să respingem sau să nu respingem ipoteza de nul, sunt posibile patru situații, descrise în figura următoare:
Figura 7.1 Rezultatele unui test al ipotezelor
După cum se indică în figura 7.1, H0 este în realitate adevărată sau falsă și sunt posibile două decizii: se respinge H0 sau nu se respinge H0. Ca atare, sunt posibile două decizii corecte: respingerea unei ipoteze de nul false și nerespingerea unei ipoteze de nul adevărate. Corespunzător, sunt posibile două decizii greșite: respingerea unei ipoteze ne nul care este adevărată, numită eroare de tipul I, și nerespingerea unei ipoteze de nul care este falsă, numită eroare de tipul II. Probabilitatea de a comite o eroare de tipul I este desemnată prin α, iar probabilitatea de a comite o eroare de tipul II este desemnată prin β.
Probabilitatea de a comite o eroare de tipul I este determinată de nivelul α ales. Astfel, atunci când se alege un nivel α, distribuția de eșantionare este împărțită în două mulțimi de rezultate ale eșantioanelor posibile: zona critică, ce include toate rezultatele definite ca improbabile sau rare și care îndreptățesc respingerea H0, și zona necritică, ce constă din toate rezultatele definite drept „non-rare”. Cu cât nivelul α este mai mic, cu atât este mai mică zona critică și, corespunzător, este mai mare distanța dintre media aritmetică a distribuției de eșantionare și începuturile (în cazul unui test bilateral) sau începutul (în cazul unui test unilateral) zonei critice. De pildă, dacă se alege α = 0,05, probabilitatea de a comite o eroare de tipul I este de 0,05: dacă H0 este respinsă, există 5 șanse din 100 ca această decizie să fie greșită; dacă α = 0,01, probabilitatea de a comite o eroare de tipul I este de 0,01: dacă H0 este respinsă, există doar 1 șansă din 100 ca această decizie să fie greșită. Prin urmare, pentru a minimiza probabilitatea de a comite o eroare de tipul I, trebuie să folosim nivele α foarte mici.
Pe de altă parte, cu cât nivelul α este mai mic, cu atât este mai mare zona necritică și, păstrând celelalte date constante, este mai puțin probabil ca rezultatul obținut pe eșantion să cadă în zona critică, deci este mai mare probabilitatea de a comite o eroare de tipul II.
Prin urmare, cele două probabilități sunt invers proporționale, nefiind posibil să le minimizăm pe amândouă: dacă alegem un nivel α foarte mic pentru a pentru a minimiza probabilitatea de a comite o eroare de tipul I, crește probabilitatea de a comite o eroare de tipul II. Cu alte cuvinte, dacă creștem dificultatea de a respinge ipoteza de nul, probabilitatea de a nu respinge ipoteza de nul atunci când aceasta este falsă crește. În mod normal, în științele omului se dorește minimizarea probabilității erorii de tipul I, socotită a fi mai gravă decât eroarea de tipul II, astfel că se aleg valori mici pentru α.
În tabelul următor sunt prezentate câteva scoruri Z critice pentru nivele α mai des folosite, atât pentru teste bilaterale, cât și pentru teste unilaterale:
Tabelul 7.1 Scoruri Z critice
De regulă, nivelul α = 0,05 este considerat drept un indicator bun al unui rezultat semnificativ.
7.3 TESTAREA IPOTEZELOR PENTRU MEDII ARITMETICE
CÂND σ ESTE NECUNOSCUT
Ca și în privința estimării intervalelor, în aproape toate situațiile reale de cercetare, valoarea abaterii standard a populației este necunoscută. Și aici vom distinge două cazuri: cazul în care dimensiunea eșantionului este mare, ceea ce înseamnă eșantioane cu n 30, și cazul n 30. În cazul eșantioanelor cu n 30, σ se poate estima prin s, iar în pasul 3 se folosește următoarea formulă:
Formula 7.2
Această formulă diferă de formula 7.1 prin aceea că σ este înlocuit cu s, iar n este înlocuit cu n – 1 pentru a se corecta distorsiunea lui s.
În cazul eșantioanelor cu n 30, distribuția de eșantionare este distribuția tStudent, prezentată în capitolul 6, iar în pasul 3 se folosește următoarea formulă:
Formula 7.3
Vom spune că este vorba despre testul scorurilor t pentru medii aritmetice și vom desemna rezultatul aplicării formulei 7.3 prin t (obținut).
Să presupunem că un cercetător primește informația neverificată conform căreia media aritmetică a coeficientului de inteligență al participanților la fazele naționale ale olimpiadelor de matematică din ultimii 10 ani este de aproximativ 125. Pentru a testa această ipoteză, cercetătorul selectează un eșantion aleatoriu de 20 de olimpici la matematică din ultimii 10 ani și constată că media aritmetică a coeficientului de inteligență la nivelul eșantionului este de 123, abaterea standard la nivelul eșantionului fiind de 8. Cercetătorul este interesat să determine la un nivel de încredere de 99% dacă media aritmetică a coeficientului de inteligență al participanților la fazele naționale ale olimpiadelor de matematică din ultimii 10 ani este mai mare de 125. Datele problemei sunt, deci, următoarele:
Pasul 1. Enunțarea ipotezelor
H0: μ = 125
Ha: μ 125
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția t
α = 0,01 (test unilateral dreapta)
gl = 20 1 = 19
tα (critic) = +2,539
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât t (obținut) nu cade în zona critică (+1,09 +2,539), cercetătorul nu poate respinge ipoteza de nul. Pe baza mediei aritmetice a eșantionului nu se poate conchide la un nivel de încredere de 99% că media aritmetică a coeficientului de inteligență al participanților la fazele naționale ale olimpiadelor de matematică din ultimii 10 ani este mai mare de 125. Rezultatul acestui test este prezentat grafic în figura următoare:
În cazul folosirii distribuției t ca distribuție de eșantionare, regulile de decizie au aceeași structură cu cele ale testului scorurilor Z. Astfel, într-un test bilateral, indiferent de nivelul α ales și de numărul de grade de libertate, regula de decizie este următoarea:
Se respinge H0, dacă t (obținut) +tα/2 (critic) sau dacă t (obținut) tα/2 (critic)
Într-un test unilateral dreapta (μ μH), regula de decizie este
Se respinge H0, dacă t (obținut) +tα (critic)
În fine, într-un test unilateral stânga (μ μH), regula de decizie este
Se respinge H0, dacă t (obținut) tα (critic)
7.4 TESTUL SCORURILOR Z PENTRU PROPORȚII
Atunci când variabila de interes nu este de interval sau de raport, astfel încât să se justifice calcularea mediei aritmetice, se poate utiliza proporția eșantionului (p) în loc de media aritmetică. În cele ce urmează, prezentăm un test al ipotezelor pentru proporții, aplicabil în cazul eșantioanelor pentru care np 5 și n(1 p) 5.
În acest test, formula de calcul pentru Z (obținut) are aceeași structură cu formula 7.1: Z (obținut) este egal cu mărimea pentru eșantion minus valoarea presupusă pentru parametrul corespunzător, totul de împărțit la abaterea standard a distribuției de eșantionare. Din capitolul anterior, știm că proporțiile pentru eșantioane (p) au distribuții de eșantionare aproximativ normale, cu media aritmetică (μp) egală cu proporția pentru populație (P) și abaterea standard (σp) egală cu . Teoretic, formula de calcul al testului scorurilor Z pentru proporții este următoarea:
Formula 7.4
unde PH este proporția presupusă pentru populație. Acum, valoarea proporției pentru populație, P, nu este cunoscută. Ca și în cazul estimării intervalelor pentru proporții, putem estima valoarea lui P prin p, lucrând cu formula următoare:
Formula 7.5
Să considerăm un exemplu. Se pretinde că aproximativ 10% din studenții unei mari universități sunt căsătoriți. Pentru testarea acestei ipoteze, se selectează un eșantion aleatoriu de 200 de studenți de la universitatea respectivă și se constată că 24 de studenți din eșantion sunt căsătoriți. În baza acestui rezultat, se poate spune la un nivel de încredere de 95% că mai mult de 10% din studenți sunt necăsătoriți? Datele problemei sunt următoarele:
Folosind formula 7.5, testul decurge după cum urmează:
Pasul 1. Enunțarea ipotezelor
H0: P = 0,10
Ha: P 0,10
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția Z
α = 0,05 (test unilateral dreapta)
Zα (critic) = +1,65
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât Z (obținut) nu cade în zona critică (+1,06 +1,65), ipoteza de nul nu poate fi respinsă. La nivelul de încredere de 95% nu se poate spune că mai mult de 10% din studenți sunt necăsătoriți.
GLOSAR
Eroare de tipul I: respingerea unei ipoteze de nul care este adevărată; probabilitatea de a comite o eroare de tipul I este desemnată prin α.
Eroare de tipul II: nerespingerea unei ipoteze de nul care este falsă; probabilitatea de a comite o eroare de tipul II este desemnată prin β.
Ipoteză alternativă: în contextul statisticilor inferențiale, ipoteză care enunță că există o diferență între valoarea efectivă a unui parametru și valoarea presupusă pentru acel parametru; dacă sensul diferenței poate fi prezis, ipoteza alternativă este direcțională, în caz contrar este nedirecțională.
Ipoteză de nul: în contextul statisticilor inferențiale, ipoteză care enunță nu există nici o diferență semnificativă între valoarea efectivă a unui parametru și valoarea presupusă a acelui parametru.
Regulă de decizie: enunț referitor la o anumită amplitudine de valori pentru rezultatul statisticii testului, numită zonă critică sau zonă de respingere, care conduce la respingerea ipotezei de nul.
Statistică a testului: formula a cărei aplicare în testul respectiv permite obținerea unei valori ce formează baza deciziei asupra ipotezei de nul.
Teste parametrice: teste statistice despre valoarea parametrilor unei populații, care cer îndeplinirea unor condiții sau supoziții despre populațiile respective, cum este, în principal, normalitatea.
Test bilateral: test statistic în care ipoteza alernativă este non-direcțională.
Test unilateral: test statistic în care ipoteza alternativă este direcțională.
8 TESTAREA IPOTEZELOR DESPRE
DIFERENȚELE DINTRE DOUĂ POPULAȚII
Problema de cercetare abordată în capitolul 7 viza semnificația diferenței dintre valoarea unei statistici (medie aritmetică sau proporție) calculată pentru un eșantion și valoarea presupusă a parametrului corespunzător al populației de referință. În acest capitol sunt expuse procedee de testare a ipotezelor privind diferențele dintre mediile aritmetice a două populații, μ1 μ2, și dintre proporțiile a două populații, P1 P2. Problema centrală în acest caz poate fi formulată după cum urmează: diferența dintre două eșantioane sub aspectul variabilei de interes este suficient de mare pentru a putea conchide, cu o probabilitate de eroare cunoscută, că populațiile reprezentate de eșantioane sunt diferite sub aspectul variabilei respective?
Toate testele statistice prezentate în continuare sunt aplicabile sub supoziția că eșantioanele selectate aleatoriu din cele două populații de referință sunt independente. Două eșantioane sunt independente dacă selectarea cazurilor pentru un eșantion nu influențează selectarea cazurilor pentru celălalt eșantion. Astfel, testele prezentate în acest capitol nu pot fi aplicate atunci când între cele două eșantioane există o dependență de vreun fel sau altul, de pildă în situațiile experimentale în care aceeași subiecți sunt testați înainte și după aplicarea unui tratament.
8.1 TESTUL SCORURILOR Z PENTRU DIFERENȚA
DINTRE DOUĂ MEDII ARITMETICE
Testul expus în această secțiune este aplicabil dacă, pe lângă independența eșantioanelor, sunt satisfăcute următoarele două condiții (i) nivelul de măsură al variabilei de interes este de interval sau de raport și (ii) cele două eșantioane sunt relativ mari, ceea ce înseamnă n1 30 și n2 30.
Distribuția de eșantionare la care ne vom referi în continuare este distribuția de eșantionare a diferențelor dintre mediile aritmetice ale eșantioanelor, despre care se demonstrează că este normală dacă distribuțiile de eșantionare separate ale mediilor aritmetice ale eșantioanelor sunt normale. Teorema limitei centrale garantează că aceste distribuții de eșantionare aproximează cu atât mai bine normalitatea, cu cât dimensiunile eșantioanelor sunt mai mari. Astfel, atunci când eșantioanele sunt mari, pentru descrierea acestei distribuții de eșantionare se poate folosi distribuția Z.
Ipoteza de nul este și în acest caz un enunț de tipul „nici o diferență”, numai că este vorba despre diferența dintre două populații sub aspectul variabilei de interes. Astfel, forma ipotezei de nul este H0: μ1 = μ2 sau, echivalent, H0: μ1 μ2 = 0.
Ipoteza alternativă corespunde tipului de test, bilateral sau unilateral, intenționat de cercetător. Pentru un test bilateral, ipoteza alternativă este de forma Ha: μ1 μ2. Dacă testul este unilateral, atunci ipoteza de nul poate lua una dintre următoarele două forme:
Ha: μ1 μ2
Ha: μ1 μ2
Prima formă corespunde unui test unilateral în care întreaga zonă critică este plasată în extremitatea dreaptă a distribuției de eșantionare, iar cea de-a doua formă corespunde unui test unilateral în care întreaga zonă critică este plasată în extremitatea stângă a distribuției de eșantionare. Dacă rezultatul statisticii testului cade în zona critică, atunci ipoteza de nul poate fi respinsă, fiind acceptată ipoteza diferenței sub aspectul variabilei de interes.
Teoretic, formula de calcul al testului scorurilor Z pentru diferența dintre două medii aritmetice este următoarea:
Formula 8.1
în care = diferența dintre mediile aritmetice ale eșantioanelor
μ1 – μ2 = diferența dintre mediile aritmetice ale populațiilor
= abaterea standard a distribuției de eșantionare a diferențelor dintre
mediile aritmetice ale eșantioanelor
În formula 8.1, cel de-al doilea termen al numărătorului, μ1 – μ2, este necunoscut. Acest termen se reduce însă la zero, întrucât testul are loc sub presupunerea că ipoteza de nul, μ1 μ2 = 0, este adevărată. Mai departe, pentru eșantioane mari, distribuția de eșantionare a diferențelor dintre mediile aritmetice ale eșantioanelor se definește astfel:
Întrucât valorile abaterilor standard ale populațiilor, σ1 și σ2, nu sunt aproape niciodată cunoscute, se utilizează abaterile standard ale eșantioanelor, cu corecțiile corespunzătoare pentru distorsiune. Astfel, formula folosită pentru estimarea abaterii standard a distribuției de eșantionare în această situație este următoarea:
Formula 8.2
Prin urmare, vom lucra practic cu formula următoare pentru Z (obținut):
Formula 8.3
Ca și până acum, vom considera un exemplu. Un cercetător presupune că bărbații și femeile diferă sub aspectul capacității de rezolvare de probleme. Pentru a verifica această ipoteză, cercetătorul alcătuiește un eșantion aleatoriu de 127 de subiecți și le administrează un test de rezolvare de probleme. Eșantionul este apoi împărțit în două subeșantioane după criteriul sex, iar mărimile statistice sunt calculate pentru fiecare subeșantion, datele obținute fiind următoarele:
Presupunând că testul de rezolvare de probleme furnizează date de interval sau de raport, se poate aplica testul scorurilor Z pentru semnificația diferenței dintre două medii aritmetice. Se poate observa că scorul mediu al eșantionului 1 este mai mic decât cel al eșantionului 2. Prin aplicarea testului menționat se poate afla dacă această diferență este suficient de mare pentru a îndreptăți concluzia că există o diferență semnificativă între bărbați și femei sub aspectul capacității de rezolvare de probleme și nu o intervenție a unor factori întâmplători.
Pasul 1. Enunțarea ipotezelor
H0: μ1 = μ2
Ha: μ1 μ2
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția Z
α = 0,05 (test bilateral)
Zα/2 (critic) = 1,96
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât Z (obținut) se află în zona critică (2,63 1,96), ipoteza de nul poate fi respinsă, ceea ce reprezintă o dovadă în sprijinul ipotezei că bărbații și femeile diferă sub aspectul capacității de rezolvare de probleme. Decizia de a respinge ipoteza de nul are o probabilitate de doar 0,05 de a fi greșită.
8.2 TESTUL SCORURILOR t PENTRU DIFERENȚA
DINTRE DOUĂ MEDII ARITMETICE
Atunci când abaterile standard ale populațiilor nu sunt cunoscute și eșantioanele sunt mici (n1 30 sau/și n2 30), distribuția de eșantionare folosită este distribuția tStudent, cu n1 + n2 2 grade de libertate. Teoretic, formula de calcul al testului scorurilor t pentru diferența dintre două medii aritmetice este următoarea:
Formula 8.4
Ca mai sus, termenul μ1 – μ2 se reduce la zero, întrucât testul are loc sub presupunerea că ipoteza de nul, μ1 μ2 = 0, este adevărată. În cazul testului prezentat în această secțiune, formula folosită pentru estimarea abaterii standard a distribuției de eșantionare este următoarea:
Formula 8.5
Astfel, pentru a afla valoarea lui t (obținut) vom folosi următoarea formulă:
Formula 8.6
Este important de notat că testul scorurilor t pentru două medii aritmetice poate fi folosit doar dacă cele două populații sunt egal dispersate sau, altfel spus, au abaterile standard egale (σ1 = σ2). Această condiție este necesară pentru a justifica supoziția de normalitate a distribuției de eșantionare și a estima abaterea standard a acesteia. Egalitatea dispersiilor poate fi testată formal. Pentru scopuri practice, putem considera că supoziția σ1 = σ2 este satisfăcută în măsura în care eșantioanele au dimensiuni apropiate.
Un cercetător presupune că o anumită metodă modernă de predare a matematicii conduce la rezultate mai bune decât metodele tradiționale. Pentru a verifica această ipoteză, cercetătorul alcătuiește un eșantion aleatoriu de 25 de elevi, pe care îl împarte aleatoriu în două grupuri. Un grup de 12 elevi este repartizat într-o clasă în care matematica este predată după metoda modernă, iar celălalt grup de 13 elevi este repartizat într-o clasă în care matematica este predată după metode tradiționale. După un an, ambele grupuri primesc același test la matematică, obținând următoarele rezultate:
Mediile aritmetice ale grupurilor diferă în sensul prezis (μ1 μ2). Aplicarea testului t arată dacă această diferență este sau nu statistic semnificativă. Fie α = 0,05.
Pasul 1. Enunțarea ipotezelor
H0: μ1 = μ2
Ha: μ1 μ2
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția t
α = 0,05 (test unilateral)
gl = 12 + 13 2 = 23
tα (critic) = +1,714
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât t (obținut) nu se află în zona critică (+0,31 +1,714), ipoteza de nul nu poate fi respinsă la un nivel de încredere de 95%. Diferența dintre cele două grupuri nu este statistic semnificativă.
8.3 TESTUL SCORURILOR Z PENTRU DIFERENȚA
DINTRE DOUĂ PROPORȚII
Testul scorurilor Z pentru semnificația diferenței dintre două proporții este aplicabil atunci când eșantioanele sunt mari (n1 30 și n2 30) și este asemănător cu testul pentru medii aritmetice. Ipoteza de nul enunță că nu există nici o diferență semnificativă între populațiile din care sunt alcătuite eșantioanele, ipoteza alternativă putând fi direcțională sau non-direcțională.
Teoretic, formula de calcul al testului scorurilor Z pentru diferența dintre două proporții este următoarea:
Formula 8.7
în care p1 p2 = diferența dintre proporțiile eșantioanelor
P1 P2 = diferența dintre proporțiile populațiilor
σp1 p2 = abaterea standard a distribuției de eșantionare a diferențelor dintre
proporțiile eșantioanelor
Ca și pentru medii aritmetice, cel de-al doilea termen al numărătorului, P1 P2, se reduce la zero, întrucât testul are loc sub presupunerea că ipoteza de nul, P1 P2 = 0, este adevărată. Formula folosită pentru estimarea abaterii standard a distribuției de eșantionare este următoarea:
Formula 8.8
Cantitatea se numește estimare combinată a proporțiilor pentru cele două populații și este dată de următoarea formulă:
Formula 8.9
Prin urmare, pentru a afla valoarea lui Z (obținut) vom folosi următoarea formulă:
Formula 8.10
Să presupunem că au fost alcătuite două eșantioane de studenți, unul de 83 de studenți de la Universitatea A și celălalt de 103 studenți de la Universitatea B, fiecare student fiind chestionat în legătură cu problema interzicerii avorturilor și clasificat într-una dintre categoriile: De acord, Împotrivă, Nedecis. Proporția studenților care s-au declarat de acord cu interzicerea avorturilor a fost de 0,34 în primul eșantion (A) și de 0,25 în cel de-al doilea (B). Există o diferență semnificativă între studenții celor două universități sub acest aspect?
Pasul 1. Enunțarea ipotezelor
H0: P1 = P2
Ha: P1 P2
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția Z
α = 0,05 (test bilateral)
Zα/2 (critic) = 1,96
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât Z (obținut) nu cade în zona critică (+1,29 +1,69), nu se poate respinge ipoteza de nul. Studenții de la cele două universități nu diferă semnificativ în privința acordului cu interzicerea avorturilor.
GLOSAR
Eșantioane aleatorii independente: eșantioane aleatorii alcătuite în așa fel încât selectarea cazurilor pentru un eșantion nu influențează selectarea cazurilor pentru celălalt eșantion.
9 ANALIZA DE VARIANȚĂ (ANOVA)
Am expus până acum proceduri pentru testarea ipotezelor privind o populație sau două populații. În acest capitol se prezintă o procedură de testare a ipotezei conform căreia mediile aritmetice ale k populații (k 2) sunt egale. Această procedură este numită analiza de varianță (ANOVA). Ipoteza de nul testată în ANOVA are următoarea formă:
H0: μ1 = μ2 = … = μk
Conform ipotezei alternative, Ha, cel puțin o medie aritmetică diferă de celelalte.
9.1 ANOVA PENTRU O VARIABILĂ INDEPENDENTĂ
Înainte de a trece la expunerea testului ANOVA pentru o variabilă independentă să notăm că într-un experiment psihologic, cercetătorul manipulează cel puțin o variabilă și înregistrează răspunsurile subiecților în privința unei alte variabile, cu scopul de a constata eventualul efect al primei variabile asupra celei de-a doua. De pildă, cercetătorul poate expune un grup de subiecți unor condiții de stres și un alt grup unor condiții normale, pentru a constata dacă stresul influențează îndeplinirea unei anumite sarcini. Variabila manipulată este numită variabilă independentă, iar variabila care este observată și măsurată este numită variabilă dependentă.
Un cercetător presupune că subiecții supuși unui interviu vor furniza cu atât mai multe informații cu caracter personal, cu cât se află mai aproape de intervievator. Pentru a verifica această presupunere, cercetătorul montează un experiment la care participă 15 subiecți. Fiecare subiect primește aceleași întrebări de la același intervievator. Variabila independentă (A) este distanța față de intervievator, cu următoarele categorii: mică (0,5 metri), medie (1,5 metri), mare (2 metri). Pentru a fi intervievați, subiecții sunt repartizați aleatoriu într-una dintre cele trei categorii ale variabilei independente. Variabila dependentă (B) este numărul de răspunsuri cu caracter personal date de subiect. Datele obținute, împreună cu mărimile necesare pentru ANOVA sunt prezentate în următorul tabel:
Tabelul 9.1 Calcule inițiale pentru ANOVA, o variabilă independentă
Pentru fiecare grup i, Ti este totalul scorurilor individuale, ni este numărul de subiecți, este media aritmetică a scorurilor, Σ este suma pătratelor scorurilor individuale, iar este pătratul totalului scorurilor. De notat că grupurile obținute sunt independente, precum și că formulele de calcul care urmează sunt aplicabile și în cazul în care este vorba despre un număr diferit de subiecți în fiecare grup.
În ANOVA pentru o variabilă independentă se consideră două surse de variație: (i) variația mediilor aritmetice ale grupurilor și (ii) variația datorată diferențelor dintre subiecții din fiecare grup, care poate fi atribuită procesului de eșantionare. Pentru început, se calculează trei sume de pătrate ale abaterilor față de medie sau, pe scurt, sume de pătrate. Vom desemna generic prin SS aceste sume de pătrate: (1) SSTOTAL – suma pătratelor abaterilor fiecărui scor individual față de media aritmetică a tuturor scorurilor, numită și marea medie; (2) SSA – suma pătratelor abaterilor fiecărei medii de grup față de marea medie; (3) SSEROARE – suma pătratelor abaterilor fiecărui scor individual față de media aritmetică a grupului respectiv. Litera „A” din SSA arată că lucrăm cu varianța sistematică a variabilei independente A. SSA reflectă prima sursă de variație, iar SSEROARE pe cea de-a doua.
Putem calcula aceste abateri direct pe baza datelor din tabel. Întrucât astfel de calcule sunt greoaie, vom utiliza formule simplificate.
Formula 9.1
în care Σ= suma pătratelor scorurilor individuale ale tuturor subiecților din
experiment = Σ + Σ + Σ
= pătratul totalului tuturor scorurilor =
N = numărul total de subiecți din experiment.
Dacă se efectuează calculele pe hârtie sau cu un calculator de buzunar, este convenabil să se afle mai întâi Σ pentru scorurile din fiecare grup, așa cum am făcut în tabelul de mai sus, după care să se adune aceste sume. Aplicăm formula 9.1:
Atunci când calculăm SSTOTAL este recomandabil să reținem termenii diferenței, 8545 și 7752,07, pe care îi vom folosi pentru simplificarea calculelor ulterioare.
Odată de am calculat SSTOTAL, putem calcula SSA după următoarea formulă:
Formula 9.2
În această formulă, Ti este un simbol general pentru T1, T2 și T3, iar ni este un simbol general pentru n1, n2 și n3. Astfel, odată ce cantitatea este calculată pentru fiecare grup, cantitățile sunt adunate, după cum arată simbolul Σ. Să notăm că a doua parte a formulei 2, G2/N, a fost deja calculată, atunci când am obținut SSTOTAL, așa încât vom prelua direct rezultatul respectiv în calculul SSA:
Și aici vom reține unul dintre termenii diferenței, și anume 8381,80, pe care îl vom folosi pentru calculul SSEROARE, după următoarea formulă:
Formula 9.3
Ambele cantități cerute de această formulă au fost calculate anterior, când am obținut SSTOTAL și, respectiv, SSA, așa încât vom prelua direct rezultatele respective în calculul SSEROARE:
De notat că SSTOTAL = SSA + SSEROARE. Această relație poate fi utilizată pentru a controla corectitudinea calculelor.
Pasul următor în calculul ANOVA constă în calcularea a două medii aritmetice ale sumelor de pătrate ale abaterilor față de medie sau, pe scurt, medii aritmetice ale sumelor de pătrate. Vom desemna generic prin MS aceste medii: (1) MSA – media aritmetică pentru SSA, numită varianța sistematică și (2) MSEROARE – media aritmetică pentru SSEROARE, numită varianța de eroare.
Formula 9.4
În această formulă, k este numărul de grupuri, k 1 fiind numărul de grade de libertate asociate SSA, pe care îl vom nota în continuare cu glA.
Formula 9.5
Aici, N k reprezintă numărul de grade de libertate asociate SSEROARE, pe care îl vom nota în continuare cu glEROARE.
Distribuția de eșantionare în ANOVA este distribuția F (numită astfel în onoarea britanicului Ronald Fisher (1890-1962), biolog și statistician, inventatorul ANOVA). Forma aproximativă a unei curbe F este următoarea:
Figura 9.1 Un exemplu de curbă F
Forma exactă a unei curbe F depinde de valorile pentru glA și, respectiv, pentru glEROARE. De notat că folosirea distribuției F cere ca variabila dependentă să fie normal distribuită în cele k populații și ca aceste populații să fie egal dispersate. În tabelul distribuției F (vezi Anexa D) în prima coloană din stânga sunt trecute gradele de libertate pentru MSEROARE (glEROARE = N – k), de la 1 la 120 și . Pe cea de-a doua coloană din stânga apar nivelele α. Pe primul rând al tabelului apar gradele de libertate pentru MSA (glA = k – 1), de la 1 la 120 și .
Figura 9.2 Schema tabelului valorilor critice ale distribuției F
La intersecția rândului pentru N – k grade de libertate și nivelul α ales cu coloana pentru k – 1 grade de libertate se găsește F (critic), adică valoarea care marchează începutul zonei critice în distribuția F. În exemplul nostru, pentru N – k = 12 și k – 1 = 2, alegând un nivel α = 0,05, F (critic) = 3,8853 sau, rotunjit, 3,89. Valoarea pentru F (obținut) se calculează cu formula următoare:
Formula 9.6
Dacă intervin doar factori întâmplători, valoarea așteptată pentru F (obținut) este 1,0. Cu cât este mai mare valoarea pentru F (obținut), cu atât este mai mică probabilitatea ca rezultatele experimentului să se datoreze întâmplării. Regula de decizie este următoarea:
Se respinge H0, dacă F (obținut) F (critic)
În exemplul nostru,
Întrucât F (obținut) cade în zona critică (23,15 3,89), vom conchide că rezultatele experimentului sunt semnificative și vom respinge ipoteza că mediile aritmetice sunt egale la nivelul populației.
În termenii modelului în patru pași, testul ANOVA pentru o variabilă independentă, în exemplul nostru, decurge după cum urmează:
Pasul 1. Enunțarea ipotezelor
H0: μ1 = μ2 = μ3
Ha: Cel puțin o medie aritmetică diferă de celelalte
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția F
α = 0,05
glEROARE = N – k = 12
glA = k – 1 = 2
F(critic) = 3,89
Pasul 3. Calcularea statisticii testului
Organizarea calculului ANOVA se face cu ajutorul unui tabel de calcule inițiale (v. tabelul 9.1), precum și al unui tabel ANOVA rezumativ, numit tabel al surselor de variație. Forma generală a unui astfel de tabel este următoarea:
În exemplul nostru, avem următorul tabel:
Tabelul 9.2 ANOVA rezumativ, o variabilă independentă
Pasul 4. Luarea deciziei
Întrucât, F (obținut) cade în zona critică (23,15 3,89), ipoteza de nul este respinsă. La nivelul populației, mediile aritmetice ale scorurilor corespunzătoare celor trei distanțe diferă semnificativ. Enunțul de probabilitate asociat acestei concluzii este următorul: probabilitatea ca diferența observată între mediile aritmetice ale grupurilor să apară din întâmplare, dacă H0 ar fi în realitate adevărată, este mai mică de 0,05.
De notat că în cazul în care se consideră mai mult de două categorii ale variabilei independente (ca în exemplul nostru în care avem trei grupuri), F (obținut) nu arată care este grupul care diferă semnificativ de celelalte. O modalitate de a examina diferența dintre două grupuri este de a utiliza formula SSA pentru a calcula suma pătratelor și media sumei de pătrate pentru cele două grupuri (numărul de grade de libertate în acest caz fiind 2 – 1) și de a utiliza cantitatea MSEROARE, calculată anterior, ca eroare de varianță pentru calcularea F (obținut). Au fost dezvoltate și metode mai sofisticate pentru a evalua diferența dintre două grupuri, după ce s-a determinat un F (obținut) semnificativ, numite teste de comparare multiplă post hoc, precum și metode de testare a unor ipoteze specifice privind diferențele dintre medii, numite comparații a priori sau comparații planificate.
9.2 ANOVA PENTRU DOUĂ VARIABILE INDEPENDENTE
Testul ANOVA pentru două variabile independente este o extindere a testului ANOVA pentru o singură variabilă independentă, cu excepția faptului că formulele testului expus în această secțiune sunt aplicabile doar în cazul grupurilor independente cu același număr de subiecți în fiecare grup. Vom folosi aceeași manieră de expunere ca mai sus: vom prezenta un exemplu ipotetic, un tabel de calcule inițiale, formulele de calcul ale testului ANOVA pentru două variabile independente, precum și modelul în patru pași specific acestui test.
20 de elevi sunt supuși unui experiment privind metodele de instruire în matematică. Variabila independentă, A, este, deci, metoda de instruire. Elevii sunt repartizați aleatoriu în două clase: o clasă la care se utilizează metoda tradițională (A1) și o clasă la care se utilizează o metodă modernă (A2). Variabila independentă, B, este nivelul IQ, cu categoriile : B1 ( 90) și B2 ( 90). Informația prezentată la cele două clase este aceeași. La sfârșitul perioadei de instruire elevii dau același test. Rezultatul (scorul) obținut la acest test este variabila dependentă. Experimentul permite evaluarea a trei efecte: (i) efectul principal al variabilei A (dacă una dintre metode conduce la rezultate diferite față de cealaltă), (ii) efectul principal al variabilei B (dacă elevii cu un IQ superior obțin rezultate diferite față de ceilalți), (iii) interacțiunea A B (dacă efectul unei variabile independente diferă în funcție de un anumit nivel al celeilalte variabile independente).
După cum reiese și din cele de mai sus, un astfel de experiment are mai multe avantaje. Mai întâi, prin analiza simultană a două variabile independente se realizează, de fapt, două cercetări altfel distincte. Pe lângă investigarea modului în care diferitele categorii ale celor două variabile independente afectează variabila dependentă, se poate verifica dacă nivelele uneia dintre variabilele independente afectează variabila dependentă în același fel ca și nivelele celeilalte variabile independente. Apoi, este vorba despre investigarea interacțiunii dintre două variabile independente. Întrucât, în situațiile reale, efectul unei variabile independente este adesea afectat de una sau mai multe variabile independente, studiul interacțiunii dintre variabilele independente poate fi un obiectiv foarte important al cercetării.
Revenind la exemplul nostru ipotetic, datele obținute, împreună cu mărimile necesare pentru ANOVA sunt prezentate în următorul tabel:
Tabelul 9.3 Calcule inițiale pentru ANOVA, două variabile independente
În ANOVA pentru două variabile independente se testează trei ipoteze de nul, fiecare corespunzând unei surse de variație:
H01: La nivelul populației nu există nici o diferență între mediile aritmetice ale
rezultatelor obținute prin cele două metode.
H02: La nivelul populației nu există nici o diferență între mediile aritmetice ale
rezultatelor obținute de elevii cu nivele IQ diferite.
H03: La nivelul populației nu există interacțiune între cele două variabile.
H01 corespunde variației mediilor aritmetice ale scorurilor variabilei dependente din fiecare categorie a variabilei A. H02 corespunde variației mediilor aritmetice ale scorurilor variabilei dependente din fiecare categorie a variabilei B. H03 corespunde variației mediilor aritmetice ale scorurilor variabilei dependente din categoriile combinate A B.
În acest caz, se calculează cinci sume de pătrate: (1) SSTOTAL, (2) SSA, (3) SSB,
(4) SSA B și (5)SSEROARE.
SSTOTAL se calculează cu ajutorul formulei 9.1:
Și aici, atunci când calculăm SSTOTAL, este recomandabil să reținem termenii diferenței, 144789 și 143312,45, pe care îi vom folosi pentru simplificarea calculelor ulterioare.
Formula 9.2 este modificată corespunzător pentru calculul SSA și SSB. Astfel, SSA se calculează cu ajutorul următoarei formule:
Formula 9.7
În această formulă, Ta este un simbol general pentru TA1 și TA2, iar na este un simbol general pentru nA1 și nA2. Prin urmare, atunci când calculăm SSA, luăm în considerare doar grupurile variabilei independente A.
SSB se calculează cu ajutorul următoarei formule:
Formula 9.8
În această formulă, Tb este un simbol general pentru TB1 și TB2, iar nb este un simbol general pentru nB1 și nB2. Prin urmare, atunci când calculăm SSB, luăm în considerare doar grupurile variabilei independente B.
Calculăm acum SSA B, cu ajutorul următoarei formule:
Formula 9.9
În această formulă, Tab este un simbol general pentru TA1B1, TA1B2, TA2B1 și TA2B2, iar nab este un simbol general pentru nA1B1, nA1B2, nA2B1 și nA2B2. Prin urmare, atunci când calculăm SSA B, luăm în considerare grupurile constituite după categoriile combinate
A B.
=
Și aici vom reține unul dintre termenii diferenței, și anume 144639,40, pe care îl vom folosi pentru calculul SSEROARE, după următoarea formulă:
Formula 9.10
Ambele cantități cerute de această formulă au fost calculate anterior, când am obținut SSTOTAL și, respectiv, SSA B, așa încât vom prelua direct rezultatele respective în calculul SSEROARE:
De notat că SSTOTAL = SSA + SSB + SSA B + SSEROARE. Această relație poate fi utilizată pentru a controla corectitudinea calculelor.
Mediile aritmetice ale sumelor de pătrate pentru fiecare sursă de varianță se calculează prin împărțirea sumei de pătrate respectivă la numărul corespunzător de grade de libertate.
Formula 9.11
În această formulă, kA este numărul de grupuri constituite după categoriile variabilei A, iar kA – 1 este numărul de grade de libertate asociate SSA, notat cu glA. În exemplul nostru,
Formula 9.12
În formula 12, kB – 1 este numărul de grupuri constituite după categoriile variabilei B, iar kB – 1 este numărul de grade de libertate asociate SSB, notat cu glB. În exemplul nostru,
Formula 9.13
În formula 13, (kA – 1)(kB – 1) este numărul de grade de libertate asociat SSA B, notat cu glA B. În exemplul nostru,
Formula 9.14
În formula 14, N – kAkB este numărul de grade de libertate asociat SSEROARE, notat cu glEROARE.
Valoarea pentru F (obținut) se calculează pentru fiecare sursă de varianță sistematică (efectele principale pentru A, pentru B și pentru interacțiunea A B). Prezentăm în continuare formulele de calcul pentru FA (obținut), FB (obținut) și FAB (obținut), împreună cu calculele respective, corespunzătoare exemplului nostru.
Formula 9.15
Formula 9.16
Formula 9.17
Pentru luarea deciziei, fiecare valoare pentru F (obținut) se compară cu F (critic). Întrucât în fiecare caz din exemplul nostru, glEROARE = 16, iar numărul de grade de libertate din numărător pentru media aritmetică este egal cu 1 (glA = glB = glAB = 1), pentru α = 0,05, F (critic) = 4,4940 sau, rotunjit, 4,49. Deoarece fiecare F (obținut) este mai mare decât F (critic), toate cele trei ipoteze de nul pot fi respinse. De notat că toate cele trei ipoteze de nul pot fi respinse (rezultatele experimentului sunt semnificative) și pentru α = 0,01, pentru care F (critic) = 8,53.
În termenii modelului în patru pași, testul ANOVA pentru două variabile independente decurge astfel:
Pasul 1 Enunțarea ipotezelor
H01: La nivelul populației nu există nici o diferență între mediile aritmetice ale rezultatelor obținute prin cele două metode.
Ha1: La nivelul populației mediile aritmetice ale rezultatelor obținute prin cele două metode diferă.
H02: La nivelul populației nu există nici o diferență între mediile aritmetice ale rezultatelor obținute de elevii cu nivele IQ diferite.
Ha2: La nivelul populației mediile aritmetice ale rezultatelor obținute de elevii cu nivele IQ diferite diferă.
H03: La nivelul populației nu există interacțiune între cele două variabile.
Ha3: La nivelul populației există interacțiune între cele două variabile.
Pasul 2 Selectarea distribuției de eșantionare și stabilirea zonelor critice.
Distribuția de eșantionare = distribuția F
α = 0,05
glEROARE = 16
glA = glB = glAB = 1
F (critic) = 4,49
Pasul 4 Calcularea statisticii testului
Organizarea calculului ANOVA pentru două variabile independente se face cu ajutorul unui tabel de calcule inițiale (v. tabelul 9.3), precum și al unui tabel ANOVA rezumativ (tabel al surselor de variație). În acest caz, forma generală a unui astfel de tabel este următoarea:
În exemplul nostru, avem următorul tabel:
Tabelul 9.4 ANOVA rezumativ, două variabile independente
Pasul 4 Luarea deciziei
Întrucât fiecare valoare pentru F (obținut) este mai mare decât valoarea pentru F (critic), se resping cele trei ipoteze de nul. Pentru efectul principal al variabilei A, concluzia este că la nivelul populației, mediile aritmetice ale rezultatelor obținute prin cele două metode diferă semnificativ. Pentru efectul principal al variabilei B, concluzia este că la nivelul populației, mediile aritmetice ale rezultatelor obținute de elevii cu nivele IQ diferite diferă semnificativ. Enunțul de probabilitate asociat ambelor concluzii este următorul: probabilitatea ca diferențele observate între mediile aritmetice ale grupurilor constituite după categoriile unei variabile independente să apară din întâmplare, dacă H0 respectivă ar fi în realitate adevărată, este mai mică de 0,05 (și după cum am văzut, chiar decât 0,01).
Pentru interacțiune, concluzia este că la nivelul populației există o interacțiune între metoda de instruire și nivelul IQ al subiecților. Enunțul de probabilitate asociat acestei concluzii este următorul: probabilitatea ca diferențele observate între mediile aritmetice ale scorurilor din categoriile combinate ale celor două variabile să apară din întâmplare, dacă H03 ar fi în realitate adevărată, este mai mică de 0,05 (și decât 0,01).
9.3 ANOVA PENTRU EȘANTIOANE DEPENDENTE
Calculele ANOVA considerate până acum sunt aplicabile doar în cazul eșantioanelor independente. În această secțiune se prezintă calculele ANOVA pentru cazul eșantioanelor dependente. Amintim că în acest caz este vorba fie despre alcătuirea unor eșantioane astfel încât selectarea cazurilor pentru un eșantion influențează selectarea cazurilor pentru un alt eșantion, fie despre situațiile experimentale în care aceeași subiecți sunt testați repetat.
Un cercetător presupune că atractivitatea fizică a candidaților la obținerea unei slujbe influențează judecata asupra competenței profesionale a candidaților. Variabila independentă este deci atractivitatea fizică a candidaților, variabila dependentă fiind judecata asupra competenței profesionale, măsurată pe o scală cu zece puncte. Cercetătorul alcătuiește un eșantion aleatoriu cu opt subiecți și le prezintă două filme, în fiecare film apărând o femeie care răspunde la un test de aptitudini mecanice (îmbinarea unor piese). Cele două femei îndeplinesc sarcinile testului la fel de bine, dar una dintre ele este atractivă fizic, în timp ce cealaltă nu este atractivă fizic. Filmele sunt prezentate de mai multe ori, pentru a se controla efectul ordonării. Datele obținute, împreună cu mărimile necesare pentru ANOVA sunt prezentate în următorul tabel:
Tabelul 9.5 Calcule inițiale pentru ANOVA, eșantioane dependente
În acest tabel, se referă la totalul scorurilor acordate de fiecare subiect pentru cele două femei, este pătratul acestui total, iar Σ este suma acestor pătrate pentru toți subiecții.
Principala diferență dintre ANOVA pentru eșantioane dependente și ANOVA pentru o variabilă independentă constă în aceea că efectul diferențelor dintre subiecți devine o sursă de varianță. În ANOVA pentru eșantioane dependente apar patru surse de varianță și deci se calculează patru sume de pătrate: (1) SSTOTAL, (2) SSA, (3) SSSUBIECȚI și
(4)SSEROARE. SSTOTAL se calculează cu ajutorul formulei 9.1:
= (201 + 352) – = 553 – 517,56 = 35,44
SSA se calculează cu ajutorul formulei 97:
= 517,56 = 10,57
SSSUBIECȚI se calculează cu ajutorul următoarei formule:
Formula 9.18
Termenul nS se referă la numărul de eșantioane dependente din experiment sau la numărul de scoruri pe care le dă fiecare subiect, astfel că în exemplul nostru, nS = 2.
În fine, SSEROARE se calculează cu ajutorul următoarei formule:
Formula 9.19
Conform ipotezei de nul, atractivitatea fizică nu influențează judecata asupra competenței profesionale. Forma generală a unui tabel ANOVA rezumativ pentru eșantioane dependente este următoarea:
Procedurile de calcul pentru mediile sumelor de pătrate și pentru F (obținut) sunt similare cu cele deja cunoscute. De notat că, în acest caz, media sumei de pătrate și F (obținut) pentru SSSUBIECȚI nu se calculează. În mod obișnuit, nu este necesar să cunoaștem dacă există diferențe semnificative între subiecți. Aflarea cantității corespunzătoare sursei de varianță SSSUBIECȚI contribuie, însă, la reducerea sursei de variație SSEROARE (formula 9.19). În exemplul nostru, avem următorul tabel:
Tabelul 9.6 ANOVA rezumativ, eșantioane dependente
Lăsăm ca exercițiu pentru cititor formularea în termenii modelului în patru pași a testului ANOVA aplicat aici, în principal a deciziei pentru α = 0,05, precum și a enunțului de probabilitate asociat concluziei.
GLOSAR
analiza de varianță (ANOVA): procedură de testare a ipotezei conform căreia mediile aritmetice ale k populații (k 2) sunt egale. Testul ANOVA poate fi considerat drept o extensie a testului privind diferența dintre două medii aritmetice.
curbe F: grafic al distribuției F.
Distribuția F: distribuția de eșantionare în testul ANOVA.
10 TESTE NONPARAMETRICE
Toate testele statistice prezentate până acum se bazează pe anumite supoziții privind parametrii populațiilor din care sunt selectate eșantioanele, și anume supoziția de normalitate și de omogenitate a abaterilor standard ale populațiilor respective. Testele nonparametrice sunt teste de semnificație care nu necesită supoziții particulare despre forma distribuției populațiilor de referință, astfel că pot fi aplicate în special atunci când se lucrează cu eșantioane mici. În al doilea rând, testele nonparametrice sunt cu deosebire utile în psihologie, întrucât pot fi aplicate pentru variabile măsurate la nivel nominal sau ordinal.
10.1 TESTUL CHIPĂTRAT (χ2)
Testul chipătrat (χ2) este aplicabil atunci când nivelul de măsură este nominal, datele fiind frecvențe – numărul de cazuri care fac parte din categoriile variabilelor (variabilei) considerate. Esența acestui test constă din compararea frecvențelor observate – frecvențele efective obținute empiric de către cercetător – cu frecvențele teoretice sau așteptate – frecvențele calculate sub presupunerea că ipoteza de nul este adevărată. Testul examinează măsura în care frecvențele observate sunt sau nu semnificativ diferite de frecvențele care sunt așteptate dacă ipoteza de nul este adevărată.
Distincția dintre frecvențele observate și cele așteptate poate fi înțeleasă cu ajutorul următorului exemplu intuitiv. Să presupunem că avem un zar și dorim să verificăm ipoteza că zarul este nemăsluit. Pentru aceasta, aruncăm zarul de 300 de ori și observăm frecvența de apariție a fiecărei fețe. Dacă ipoteza menționată este adevărată, ne-am aștepta ca fiecare față să apară de aproximativ 50 de ori. Acum, să presupunem că observăm următoarele frecvențe de apariție:
Comparând frecvențele observate cu cele teoretice, suntem îndreptățiți să spunem că zarul respectiv este măsluit sau diferențele pot fi puse pe seama fluctuațiilor întâmplătoare?
Testul chipătrat poate fi folosit pentru verificarea independenței a două variabile sau pentru verificarea concordanței dintre frecvențele observate și frecvențele așteptate ale unei singure variabile. Corespunzător, se vorbește despre testul chipătrat pentru independență și despre testul chipătrat pentru concordanță.
10.1.1 TESTUL CHIPĂTRAT PENTRU INDEPENDENȚĂ
Două variabile sunt independente reciproc dacă, pentru toate cazurile din eșantionul considerat, clasificarea unui caz într-o categorie a unei variabile nu are nici un efect asupra probabilității ca acel caz să fie clasificat în oricare dintre categoriile celeilalte variabile. De pildă, să presupunem că variabilele de interes sunt sexul și dominanța funcționaloperativă a mâinilor pentru un eșantion de 50 de bărbați și 50 de femei. Aceste două variabile sunt independente reciproc în condițiile în care clasificarea subiecților în categoriile unei variabile (masculin feminin) nu are nici un efect asupra clasificării cazurilor în categoriile celeilalte variabile (dreapta, stânga, ambidextru). Acum, să presupunem că am efectuat un astfel de studiu și am obținut următoarele date:
Tabelul 10.1 Sexul și dominanța funcționaloperativă a mâinilor
Un astfel de tabel rectangular, în care cazurile dintr-un eșantion sunt clasificate concomitent după categoriile a două variabile, se numește tabel al contingențelor. Denumirile categoriilor unei variabile sunt folosite drept titluri de coloane, iar denumirile categoriilor celeilalte variabile sunt folosite drept titluri de rânduri. În corpul tabelului, intersecția unui rând cu o coloană se numește celulă. Celulele indică numărul de cazuri clasificate concomitent în câte două categorii ale celor două variabile. Subtotalurile pentru fiecare coloană și rând se numesc marginale. Marginalele indică distribuțiile de frecvențe pentru fiecare categorie a variabilei respective sau, altfel spus, distribuțiile univariate de frecvențe ale fiecărei variabile. La intersecția marginalelor de pe linii și coloane se prezintă numărul total de cazuri din eșantion (n).
În cazul testului chipătrat pentru independență, ipoteza de nul enunță că variabilele sunt reciproc independente. În exemplul nostru, ipoteza de nul este că sexul nu are nici o influență asupra dominanței funcționaloperative a mâinilor. Sub supoziția că ipoteza de nul este adevărată, se calculează frecvențele din celule la care ne-am aștepta, dacă ar interveni doar întâmplarea. Aceste frecvențe așteptate sunt apoi comparate, celulă cu celulă, cu frecvențele observate în tabel. Dacă ipoteza de nul este adevărată, atunci diferențele dintre frecvențele așteptate și cele observate vor fi mici. Dacă, însă, ipoteza de nul este falsă, atunci aceste frecvențe vor fi relativ mari. Cu cât sunt mai mari diferențele dintre frecvențele așteptate și cele observate, cu atât este mai puțin probabil ca variabilele să fie în fapt reciproc independente și deci este cu atât mai probabil că vom putea respinge ipoteza de nul.
Pentru a afla frecvența așteptată pentru fiecare celulă a tabelului, folosim următoarea formulă:
Formula 10.1
în care marginalul rândului pe care este situată celula respectivă
marginalul coloanei pe care este situată celula respectivă
n = numărul total de cazuri din eșantion
În cazul tabelului 10.1, frecvențele așteptate sunt următoarele:
Calcularea statisticii testului chipătrat pentru independență se face cu ajutorul următoarei formule, care dă valoarea pentru χ2 (obținut):
Formula 10.2
în care frecvențele observate în celulele tabelului
frecvențele așteptate
Astfel, odată calculate frecvențele așteptate, formula 10.2 ne conduce la scăderea frecvenței așteptate din frecvența observată pentru fiecare celulă, ridicarea la pătrat a acestei diferențe, împărțirea rezultatului la frecvența așteptată pentru acea celulă și apoi la însumarea valorilor rezultate ale tuturor celulelor. Calculele pentru exemplul nostru sunt ilustrate în tabelul 10.2.
Tabelul 10.2 Calculul χ2 pentru datele din tabelul 10.1
De notat că suma frecvențelor observate este egală cu suma frecvențelor așteptate și că suma diferențelor este egală cu 0. Aceste relații pot fi folosite la verificarea calculelor pentru χ2 (obținut).
Distribuția de eșantionare folosită în acest test este distribuția χ2. Ca și în cazul distribuției tStudent, este vorba despre o familie de distribuții χ2, fiecare fiind o funcție de un anumit număr de grade de libertate. În cazul testului chipătrat pentru independență, numărul de grade de libertate se calculează cu ajutorul următoarei formule:
Formula 10.3 gl = (r 1)(c 1)
în care r = numărul de rânduri din tabelul contingențelor
c = numărul de coloane din tabelul contingențelor
Un tabel cu trei rânduri și două coloane (un tabel 3 2) are (3 1)(2 1) = 2 grade de libertate. Spre deosebire de distribuția tStudent, care este simetrică, distribuția χ2 prezintă, ca și distribuția F, o asimetrie pozitivă, după cum se ilustrează în figura 10.1.
Figura 10.1 Un exemplu de curbă χ2
Valorile pentru χ2 (critic) marchează începuturile zonelor critice și sunt date în tabelul valorilor critice ale distribuției χ2 (Anexa E). Acest tabel este similar cu tabelul distribuției tStudent, având nivelele α dispuse pe primul rând și gradele de libertate pe prima coloană din stânga. Regula de decizie este
Se respinge H0, dacă χ2 (obținut) χ2 (critic)
Întrucât în exemplu nostru gl = 2, dacă stabilim α = 0,05, scorul χ2 (critic) este 5,991. Deoarece χ2 (obținut) cade în zona critică (18,00 5,991), se poate respinge ipoteza de nul și se poate conchide că variabilele respective nu sunt reciproc independente: sexul influențează dominanța funcționaloperative a mâinilor.
În termenii modelului în patru pași, testul decurge după cum urmează:
Pasul 1. Enunțarea ipotezelor
H0: Variabilele sex și dominanța funcțional–operativă a mâinilor sunt reciproc
independente.
Ha: Variabilele sex și dominanța funcțional–operativă a mâinilor sunt reciproc
dependente.
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția χ2
α = 0,05
gl = 2
χ2 (critic) = 5,991
Pasul 3. Calcularea statisticii testului. După cum am văzut,
Pasul 4. Luarea deciziei
Întrucât χ2 (obținut) cade în zona critică (18,00 5,991), se poate respinge ipoteza de nul și se poate conchide că variabilele respective nu sunt independente: sexul influențează dominanța funcționaloperative a mâinilor (la un nivel de încredere de 95%).
10.1.1 TESTUL CHIPĂTRAT PENTRU CONCORDANȚĂ
Testul chipătrat poate fi folosit și pentru verificarea concordanței dintre frecvențele observate și frecvențele așteptate (teoretice) ale unei singure variabile. Astfel, dacă χ2 (obținut) χ2 (critic) pentru numărul corespunzător de grade de libertate și un nivel α dat, atunci diferențele dintre frecvențele observate și cele așteptate pot fi atribuite întâmplării, concordanța dintre cele două tipuri de frecvențe fiind apreciată drept bună. În caz contrar, diferențele dintre frecvențele observate și cele așteptate pot fi considerate prea mari pentru a putea fi atribuite întâmplării sau, altfel spus, aceste diferențe sunt statistic semnificative.
Pentru ilustrare, să presupunem că un cercetător opinează că distribuția populației după ocupație într-o anumită zonă geografică este aproximativ următoarea:
20% țărani
30% muncitori industriali
30% funcționari
15% mici întreprinzători
5% manageri industriali
Cercetătorul alcătuiește un eșantion aleatoriu de 864 de persoane ocupate din zona respectivă și le clasifică în categoriile menționate. Frecvențele observate pentru aceste categorii sunt următoarele:
145 țărani
310 muncitori industriali
305 funcționari
78 mici întreprinzători
26 manageri industriali
Cercetătorul dorește să știe dacă rezultatele obținute pe acest eșantion confirmă distribuția presupusă a populației sau, altfel spus, dacă diferențele dintre frecvențele observate și cele presupuse sunt sau nu statistic semnificative. Calcularea statisticii testului se face cu ajutorul formulei 10.2:
Pentru a afla frecvența așteptată pentru fiecare categorie a variabilei considerate, folosim următoarea formulă:
Formula 10.4
în care n = numărul total de cazuri din eșantion
p = proporția presupusă de cazuri din categoria respectivă
De pildă, pentru țărani, .
Calculele pentru exemplul nostru sunt ilustrate în tabelul 10.3.
Tabelul 10.3 Calculul χ2 pentru datele privind ocupația
De notat că frecvențele așteptate sunt exact acele frecvențe pe care le-am întâlni dacă proporțiile cazurilor din eșantion ar fi același cu proporțiile cazurilor pentru populație.
În cazul testului chipătrat pentru concordanță, numărul de grade de libertate se calculează cu ajutorul următoarei formule:
Formula 10.5 gl = k 1
în care k = numărul de categorii ale variabilei de interes.
Întrucât în exemplul nostru sunt considerate cinci categorii ale variabilei ocupație, avem patru grade de libertate. Pentru α = 0,05 și gl = 4, χ2 (critic) = 9,488.
Testul formal este următorul:
Pasul 1. Enunțarea ipotezelor
H0: Nu există nici o diferență între proporțiile din eșantion și cele pentru populație
Ha: Proporțiile din eșantion diferă de cele pentru populație
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția χ2
α = 0,05
gl = 4
χ2 (critic) = 9,488
Pasul 3. Calcularea statisticii testului. După cum am văzut,
Pasul 4. Luarea deciziei
Întrucât χ2 (obținut) cade în zona critică (49,91 9,448), se poate respinge ipoteza de nul. Diferențele dintre eșantion și populație sunt prea mari pentru a putea fi atribuite întâmplării (la un nivel de încredere de 95%).
De notat că, deși aici valoarea pentru χ2 (obținut) este statistic semnificativă, această valoare este calculată ținând cont de toate categoriile, astfel că nu putem spune care categorie are cea mai mare contribuție la semnificația statistică. Atunci când avem χ2 (obținut) χ2 (critic), pentru a afla care categorie are cea mai mare contribuție la semnificația statistică, se calculează reziduul standard pentru fiecare categorie cu ajutorul următoarei formule:
Formula 10.6
Valorile reziduurilor standard pentru fiecare categorie din exemplul de mai sus se găsesc în tabelul 10.3. Atunci când valoarea absolută (modulul) reziduului standard pentru o categorie este mai mare decât 2,00, se poate conchide că acea categorie are o contribuție majoră la valoarea semnificativă a lui χ2 (obținut). În exemplul de mai sus, toate reziduurile standard în valoare absolută sunt mai mari decât 2,00. Prin urmare, toate categoriile contribuie major la valoarea semnificativă a lui χ2 (obținut), ceea ce înseamnă că întreaga distribuție din eșantion nu concordă cu distribuția presupusă de cercetător.
10.2 TESTUL McNEMAR
Testul McNemar este un test nonparametric pentru semnificația schimbării. Acest test utilizează distribuția χ2 și este aplicabil pentru variabile de nivel nominal, în cazul a două eșantioane dependente.
Să presupunem că am alcătuit un eșantion aleatoriu de 38 de femei salariate și am solicitat în două momente diferite răspunsul la întrebarea „Credeți că organizațiile feministe vă apără interesele?” Întrebarea a fost pusă înainte și după ce femeile din eșantion au citit o serie de documente despre astfel de organizații. Datele obținute sunt prezentate în următorul tabel 2 2:
Tabelul 10.4 Date pentru calculul χ2 în cazul a două eșantioane dependente pentru opinia despre organizațiile feministe
Înainte de lectura documentelor
Este important să remarcăm ordinea intrării datelor în acest tabel. Astfel, celulele A și D trebuie să fie cele care indică schimbarea răspunsurilor de la un moment la altul – de la Da la Nu (A) și, respectiv, de la Nu la Da (D) –, iar celulele B și C trebuie să fie cele care indică absența schimbării răspunsurilor de la un moment la altul. Întrucât în testul McNemar este vorba despre tabele 2 2, gl = 1.
În acest test ne interesează doar celulele care reflectă schimbarea opiniei despre apărarea intereselor femeilor salariate de către organizațiile feministe, i.e. celulele A și D. ipoteza de nul pentru testul McNemar enunță că, în cazul populației de referință, numărul de schimbări într-o direcție este egal cu numărul de schimbări în cealaltă direcție. Aceasta înseamnă că, presupunând că ipoteza de nul este adevărată, frecvența așteptată în celula A va fi egală cu frecvența așteptată în celula D. ipoteza alternativă enunță că numărul de schimbări într-o direcție este diferit de numărul de schimbări în cealaltă direcție.
Testul statistic este testul χ2 și se poate folosi formula 10.2 pentru calcularea valorii lui χ2 (obținut), dar formula va fi aplicată doar celulelor A și D. Întrucât se presupune că frecvențele așteptate din aceste două celule sunt egale, valoarea așteptată în fiecare dintre aceste două celule este egală cu (A + D)/2. astfel, formula de calcul a valorii χ2 (obținut) pentru testul McNemar se simplifică după cum urmează:
Formula 10.6
Pentru exemplul de mai sus, testul formal este următorul:
Pasul 1. Enunțarea ipotezelor
H0: Există un număr egal de schimbări în ambele direcții
Ha: Numărul de schimbări într-o direcție este semnificativ diferit
față de numărul de schimbări în cealaltă direcție
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția χ2
α = 0,05
gl = 1
χ2 (critic) = 3,841
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât χ2 (obținut) cade în zona critică (9,00 3,841), se poate respinge ipoteza de nul. Există o diferență statistic semnificativă între numărul de schimbări într-o direcție și numărul de schimbări în cealaltă direcție (o diferență care nu poate fi pusă pe seama întâmplării). Din tabelul 10.4 rezultă că mai multe femei salariate și-au schimbat opinia de la Da la Nu decât de la Nu la Da, iar testul arată că această diferență este statistic semnificativă.
10.3 TESTUL MANNWHITNEY U
Testul MannWhitney U este asemănător în multe privințe cu testele parametrice pentru diferența dintre mediile aritmetice a două eșantioane independente. În ambele cazuri, comparăm două eșantioane independente pentru a face inferențe despre diferențele dintre cele două populații de referință și comparăm rezultatul calculării testului statistic cu distribuția de eșantionare a rezultatelor tuturor eșantioanelor posibile. Pe de altă parte, acest test se bazează pe ordonarea scorurilor eșantioanelor, astfel că este aplicabil la date de nivel ordinal.
Ca și alte teste statistice aplicabile la date de nivel ordinal, testul Mann-Whitney U folosește atribuirea de ranguri. A atribui ranguri unei mulțimi de scoruri de nivel ordinal înseamnă a pune în corespondență respectiva mulțime de scoruri cu numere naturale din mulțimea 1, 2, … în așa fel încât succesiunea scorurilor să se păstreze. Să presupunem, de pildă, că într-un inventar de personalitate li se cere subiecților să evalueze o serie de propoziții după următoarea scală: Acord puternic, Acord, Nedecis, Dezacord, Dezacord puternic. Putem atribui ranguri acestor scoruri după cum urmează:
Întrucât singura semnificație a atribuirii de ranguri este reflectarea ierarhiei scorurilor, o altă modalitate de a atribui ranguri în acest exemplu este următoarea:
Cu toate acestea, se obișnuiește ca diferența dintre două ranguri imediat succesive să fie egală cu unitatea.
Testul MannWhitney U comportă două variante, în funcție de dimensiunile eșantioanelor. Prezentăm mai întâi testul pentru eșantioane mici (n1 20 și n2 20).
Să presupunem că ne preocupă diferența pe sexe privind nivelul de satisfacție în raport cu serviciile sociale oferite într-un campus universitar. Pentru aceasta, selectăm aleatoriu două eșantioane de studenți, băieți și fete, cu n1 = 10 și n2 = 10, și administrăm o scală în care un scor înalt indică un nivel înalt de satisfacție. Scorurile obținute sunt prezentate în tabelul 10.5.
Tabelul 10.5 Scoruri ale satisfacției exprimate în raport cu
serviciile sociale oferite într-un campus universitar
Mai întâi, aranjăm scorurile din fiecare eșantion în ordine crescătoare (sau descrescătoare). Apoi, considerăm scorurile combinate ale celor două eșantioane ca și cum ar fi vorba despre un singur eșantion și atribuim ranguri scorurilor combinate, de la cel mai mic la cel mai mare scor. Astfel, atribuim rangul 1 celui mai mic scor (5), rangul 2 scorului imediat următor (9) ș.a.m.d. până la cel mai mare scor (45). Dacă întâlnim două sau mai multe scoruri identice (două sau mai multe cazuri cu același scor), procedăm după cum urmează:
considerăm rangurile pe care aceste scoruri le-ar fi avut dacă ar fi fost diferite și imediat succesive;
calculăm media aritmetică a acestor ranguri;
atribuim fiecărui scor rangul mediu astfel obținut.
În exemplul nostru, cazurile 8 și 17 au același scor, 30. Scorului cazului 8 I-am fi atribuit rangul 14, iar scorului cazului 17 I-am fi atribuit scorul 15. Prin urmare, atribuim ambelor scoruri rangul 14,5 ((14 + 15)/2), iar scorului imediat următor în ordine crescătoare (32) îi atribuim rangul 16 (rangul pe care l-ar fi avut acest scor, dacă cele două scoruri 30 ar fi fost diferite). După această operație, calculăm suma rangurilor pentru fiecare eșantion. Intuitiv vorbind, dacă cele două eșantioane reprezintă populații care nu diferă semnificativ între ele sub aspectul variabilei măsurate, atunci cele două sume sunt apropiate ca valoare. Dacă, însă, cele două eșantioane reprezintă populații care diferă semnificativ între ele sub aspectul variabilei măsurate, atunci cele două sume sunt mult diferite.
Calcularea statisticii testului presupune mai întâi calcularea a două mărimi statistice, U1 și U2, cu ajutorul următoarelor formule:
Formula 10.7
Formula 10.8
În aceste formule, n1 și n2 sunt, respectiv, dimensiunile celor două eșantioane, iar ΣR1 și ΣR2 sunt, respectiv, sumele rangurilor pentru cele două eșantioane.
Odată calculate cele două mărimi, U1 și U2, se ia drept valoare pentru U (obținut) cea mai mică dintre valorile U1, U2: U (obținut) = min (U1, U2).
Pentru a stabili valoarea critică din distribuția de eșantionare a valorilor U, folosim tabelul valorilor critice pentru testul MannWhitney U (Anexa F). Pe primul rând și pe prima coloană din stânga ale acestui tabel sunt trecute dimensiunile a două eșantioane. Nivelele α sunt date pentru un test unilateral (direcțional). În cazul unui test bilateral (non-direcțional), nivelul α dat se localizează înmulțind cu doi valoarea lui α. Valoarea critică, U (critic), se află la intersecția liniei corespunzătoare dimensiunii unui eșantion cu coloana corespunzătoare dimensiunii celuilalt eșantion la nivelul α ales. În exemplul nostru, având n1 = 10 și n2 = 10, pentru α = 0,05 (test non-direcțional), U (critic) = 23.
Ipoteza de nul este, ca întotdeauna, un enunț de tipul „nici o diferență”, dar este formulată în termeni mai generali decât în cazul testelor parametrice: nu există nici o diferență în privința scorurilor populațiilor respective sub aspectul variabilei de interes. În exemplul nostru, ipoteza de nul enunță că nu există nici o diferență între studente și studenți sub aspectul satisfacției exprimate în raport cu serviciile sociale oferite în campus. De regulă, ipoteza alternativă enunță că populațiile din care au fost selectate eșantioanele sunt diferite sub aspectul variabilei de interes. Această formă a ipotezei de nul conduce la un test nondirecțional. Desigur, putem apela la un test direcțional, atunci când sensul diferenței poate fi prezis, i.e. atunci când putem prezice că scorurile unei populații sunt mai mari sau mai mici decât scorurile celeilalte populații. Într-un test nondirecțional, regula de decizie este următoarea:
Se respinge H0, dacă U (obținut) U (critic)
De remarcat că ipoteza de nul se respinge dacă valoarea obținută este mai mică decât cea critică. Această regulă diferă de regulile de decizie din cele mai multe teste de semnificație, în care ipoteza de nul este respinsă dacă valoarea obținută este mai mare decât cea critică.
Dacă se poate prezice că scorurile populației 1 sunt mai mari decât cele ale populației 2, regula de decizie este
Se respinge H0, dacă U1 U (critic),
iar dacă se poate prezice că scorurile populației 1 sunt mai mici decât cele ale populației 2, regula de decizie este
Se respinge H0, dacă U2 U (critic)
Testul formal decurge după cum urmează:
Pasul 1. Enunțarea ipotezelor
H0: Satisfacția1 = Satsfacția2
Ha: Satisfacția1 Satisfacția2
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția U
α = 0,05 (test nedirecțional)
U (critic) = 23
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât U (obținut) U (critic) (30,5 23), nu putem respinge ipoteza de nul. Studentele nu diferă semnificativ de studenți sub aspectul nivelului de satisfacție în raport cu serviciile sociale oferite în campus (la un nivel de încredere de 95%).
Atunci când n1 20 și n2 20, distribuția de eșantionare pentru U se apropie de distribuția normală, astfel încât putem folosi tabelul scorurilor Z pentru a stabili zona critică. Luând drept cadru modelul în patru pași, în pasul 2, distribuția de eșantionare este distribuția Z, zona critică fiind cea marcată de Z (critic), în funcție de nivelul α ales și de tipul de test (unilateral sau bilateral). Formula pentru Z (obținut) este următoarea:
Formula 10.10
în care μU = media aritmetică a distribuției de eșantionare a valorilor U pentru toate
eșantioanele posibile
σU = abaterea standard a distribuției de eșantionare a valorilor U pentru toate
eșantioanele posibile
Valorile pentru μU și σU se calculează cu ajutorul următoarelor formule:
Formula 10.11
Formula 10.12
Prin urmare, în pasul 3 lucrăm cu următoarea formulă:
Formula 10.13
În fine, în pasul 4 se utilizează procedura de decizie cunoscută pentru testul Z.
10.4 TESTUL MEDIANEI
Testul medianei este un test nonparametric pentru egalitatea a două mediane. Acest test utilizează distribuția χ2 și este aplicabil în cazul a două eșantioane independente, pentru variabile măsurate la nivel ordinal.
Să presupunem că ne interesează atitudinea femeilor salariate și a celor casnice față de mișcările feministe. Alcătuim un eșantion de 10 femei salariate și un eșantion de 10 femei casnice și administrăm un chestionar adecvat. Scorurile obținute sunt prezentate în tabelul 10.6.
Tabelul 10.6 Atitudinea față de mișcările feministe
a femeilor salariate și a casnicelor
Mai întâi, aranjăm scorurile din fiecare eșantion în ordine crescătoare (sau descrescătoare). Apoi, considerând scorurile combinate ale celor două eșantioane ca și cum ar fi vorba despre un singur eșantion și aflăm mediana scorurilor combinate. Pentru a înlesni aflarea medianei scorurilor combinate este recomandabil să acordăm ranguri scorurilor. Întrucât avem un număr par de cazuri (20), mediana va fi media aritmetică a scorurilor celor două cazuri de mijloc, 31 și 32:
Cu ajutorul unui tabel 2 2, prezentăm pentru fiecare eșantion numărul de scoruri aflate deasupra și sub mediana scorurilor combinate:
Fiind un tabel 2 2, numărul de grade de libertate este egal cu 1.
Ipoteza de nul pentru testul medianei enunță că populațiile din care au fost selectate cele două eșantioane au aceeași mediană (), iar ipoteza alternativă enunță că medianele celor două populații sunt diferite ().
În general, formula de calcul a valorii χ2 (obținut) pentru testul medianei este formula 10.2. Pentru un tabel 2 2, notând celulele ca mai sus, formula de calcul poate fi simplificată, după cum urmează:
Formula 10.14
În termenii modelului în patru pași, testul decurge după cum urmează:
Pasul 1. Enunțarea ipotezelor
H0:
Ha:
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția χ2
α = 0,05
gl = 1
χ2 (critic) = 3,841
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât χ2 (obținut) nu cade în zona critică (3,20 3,841), nu se poate respinge ipoteza de nul, ceea ce înseamnă că nu există nici o diferență statistic semnificativă între femeile salariate și cele casnice în privința atitudinii față de mișcările feministe (la un nivel de încredere de 95%).
10.5 TESTUL ITERAȚIILOR
Testul iterațiilor este similar ca logică și formă cu testul Testul MannWhitney U. Ipoteza de nul enunță că nu există o diferență semnificativă între populațiile de referință sub aspectul variabilei de interes. Pentru a aplica acest test, se combină scorurile celor două eșantioane, după care aceste scoruri se ordonează crescător (sau descrescător) ca și cum ar fi vorba despre un singur eșantion. Dacă ipoteza de nul este adevărată, atunci scorurile vor fi foarte amestecate și vom avea multe iterații. O iterație (repetare) este orice succesiune de R elemente de același fel, cu R 1. Dacă ipoteza de nul este falsă, populațiile fiind diferite sub aspectul variabilei de interes, atunci vor fi foarte puține iterații.
Pentru a ilustra noțiunea de iterație, să considerăm datele din tabelul 10.5 și să folosim F pentru studente și B pentru studenți. Obținem următoarele iterații:
F F B F F F F B B F B B B B F B F B F B
1 2 3 4 5 6 7 8 9 10 11 12
Cele două litere F din extrema stângă reprezintă două studente care au cele mai mici scoruri din ambele eșantioane; următoarea literă, B, reprezintă un student cu scorul următor în ordine crescătoare ș.a.m.d. De notat că nici o iterație alcătuită din elemente de un anumit tip nu se învecinează cu o iterație alcătuită din elemente de același tip. Dacă, de pildă, am considera primul element al iterației 3 drept o iterație distinctă, atunci aceasta s-ar învecina la dreapta cu o iterație alcătuită din elemente de același tip, F.
Diferența dintre eșantioane, și deci dintre populații, este cu atât mai semnificativă, cu cât numărul de iterații este mai mic. Cel mai mic număr de iterații posibil este, desigur, 2. În exemplul de mai sus, dacă toți studenții ar exprima o satisfacție mai mare decât studentele în raport cu serviciile sociale din campus, am fi obținut următoarele două iterații:
B B B B B B B B B B F F F F F F F F F F
1 2
Evident, numărul maxim posibil de iterații este egal cu numărul de cazuri din cele două eșantioane.
Este important de reținut că în aplicarea acestui test, cazurile care nu fac parte din același eșantion și au scoruri identice pot crea probleme serioase, deoarece numărul de iterații poate fi mult afectat de felul în care sunt aranjate cazurile cu scoruri identice. Dacă întâlnim multe cazuri cu scoruri identice în eșantioane diferite este recomandabil să folosim alt test de semnificație.
Distribuția de eșantionare pentru iterații aproximează normalitatea. Media aritmetică a acestei distribuții () și abaterea sa standard () se calculează cu ajutorul următoarelor formule:
Formula 10.15
Formula 10.16
Statistica testului iterațiilor, Z (obținut), se calculează cu următoarea formulă:
Formula 10.17
în care R = numărul de iterații.
Pentru a ilustra aplicarea acestui test, să presupunem că două eșantioane aleatorii alcătuite, respectiv, din bărbați și femei au fost chestionate cu privire la atitudinea față de politică și politicieni. Scorurile sunt prezentate în următorul tabel:
Tabelul 10.7 Atitudinea față de politică și politicieni pentru
două eșantioane de bărbați și, respectiv, femei
Să observăm că aici nu există scoruri identice în eșantioane diferite (scorurile identice în același eșantion nu au nici o influență asupra numărului de iterații). Folosind tot literele B și F, obținem următoarele iterații:
F F B B B B B F F B B F F B F B B B F F F F B F F
1 2 3 4 5 6 7 8 9 10 11
B B B B F F F B B B F F F F
12 13 14 15
În aceste date se află 15 iterații și putem acum să aplicăm testul formal pentru semnificație.
Pasul 1. Enunțarea ipotezelor
H0: Atitudinea1 = Atitudinea2
Ha: Atitudinea1 Atitudinea2
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția Z
α = 0,05
Z (critic) = 1,96
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât Z (obținut) Z (critic) (1,92 1,96), rezultatul statisticii testului nu cade în zona critică. Prin urmare nu putem respinge ipoteza de nul. În exemplul de mai sus, bărbații și femeile nu diferă semnificativ în privința atitudinii față de politică și politicieni.
10.6 TESTUL WILCOXON T
Testul Wilcoxon T este un test pentru semnificația diferenței dintre două eșantioane dependente, aplicabil pentru date de nivel ordinal. Astfel, testul este folosit în mod obișnuit atunci când selectarea cazurilor pentru un eșantion influențează selectarea cazurilor pentru celălalt eșantion, având ca rezultat considerarea unor perechi de cazuri, unul dintr-un eșantion, altul din celălalt eșantion, sau în situații în care aceeași subiecți sunt testați înainte și după un anumit tratament.
Ca și Testul MannWhitney U, testul Wilcoxon T comportă două variante, în funcție de dimensiunile eșantioanelor. Prezentăm mai întâi testul pentru eșantioane mici (n1 25 și n2 25).
Pentru ilustrare, să presupunem că ne interesează comportamentul agresiv al adolescenților cu dificultăți de învățare, înainte și după o serie de ședințe de consiliere. Pentru aceasta, am selectat un eșantion aleatoriu de 12 adolescenți cu dificultăți de învățare. Măsura comportamentului agresiv reprezintă media aprecierilor oferite de cinci consilieri. Aprecierile au fost făcute înainte și după tratament. Problema pe care ne-o punem este următoarea: comportamentul agresiv al adolescenților cu dificultăți de învățare poate fi diminuat prin astfel de ședințe de consiliere? După cum se poate constata, ca și în cazul altor teste nonparametrice, ipoteza de nul și ipoteza alternativă în cazul testului Wilcoxon T se enunță în termeni generali.
Datele obținute sunt prezentate în tabelul 10.8, în care un scor înalt indică un comportament agresiv.
Tabelul 10. 8 Scoruri ale comportamentului agresiv pentru
adolescenți cu dificultăți de învățare
Pentru calcularea statisticii testului se procedează după cum urmează:
Pentru fiecare caz, se calculează diferența dintre scorul pretratament și scorul posttratament; rezultatul scăderii se numește scor diferență.
Se atribuie ranguri valorilor absolute ale scorurilor diferență (modulelor scorurilor diferență), începând cu cea mai mică valoare absolută; rangurile scorurilor diferență pozitive primesc semnul +, iar rangurile scorurilor diferență negative primesc semnul .
Se însumează valorile absolute ale rangurilor cu semnul care are cele mai puține apariții; rezultatul însumării reprezintă valoarea pentru T (obținut).
Ca și în cazul testului iterațiilor, în aplicarea testului Wilcoxon T, cazurile care nu fac parte din același eșantion și au scoruri identice pot crea probleme serioase. Dacă întâlnim multe cazuri cu scoruri identice în eșantioane diferite este recomandabil să folosim alt test de semnificație.
Pentru a stabili valoarea critică din distribuția de eșantionare a valorilor T, folosim tabelul valorilor T critice, elaborat de Frank Wilcoxon (Anexa G). În acest tabel sunt date valorile T critice pentru diferite nivele α și diferite dimensiuni ale eșantioanelor–perechi . În exemplul de față, cu n = 12, pentru α = 0,01 (test unilateral), T (critic) = 10.
Ipoteza de nul enunță că nu există nici o diferență în privința comportamentului agresiv al populației de adolescenți cu dificultăți de învățare, înainte și după o serie de ședințe de consiliere. Ipoteza alternativă, în conformitate cu datele problemei, enunță că agresivitatea adolescenților cu dificultăți de învățare este diminuată după respectivele ședințe de consiliere. Această ipoteză alternativă conduce la un test unilateral stânga, în care vom respinge ipoteza de nul dacă T (obținut) T (critic). În cazul unui test unilateral dreapta, se respinge ipoteza e nul dacă T (obținut) T (critic). Pentru un test bilateral, se respinge ipoteza de nul dacă T (obținut) T (critic) sau T (obținut) T (critic).
În termenii modelului în patru pași, testul decurge după cum urmează:
Pasul 1. Enunțarea ipotezelor
H0: Nu există nici o diferență în privința comportamentului agresiv al populației de adolescenți cu dificultăți de învățare, înainte și după o serie de ședințe de consiliere
Ha: Comportamentul populației de adolescenți cu dificultăți de învățare
este mai puțin agresiv după ședințele de consiliere.
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția T
α = 0,01 (test unilateral stânga)
T (critic) = 10
Pasul 3. Calcularea statisticii testului
După cum am văzut în tabelul 10.8, calculăm scorurile diferență și atribuim ranguri valorilor absolute ale acestor scoruri începând cu cea mai mică valoare absolută, păstrând semnele corespunzătoare. Rangurile cu semnul care are cele mai puține apariții, considerate în valoare absolută, sunt 1 și 3; prin însumarea acestor valori, găsim T (obținut) = 4.
Pasul 4. Luarea deciziei
Întrucât T (obținut) T (critic) (4 10), respingem ipoteza de nul și conchidem că agresivitatea adolescenților cu dificultăți de învățare poate fi diminuată prin ședințele de consiliere.
Atunci când n1 25 și n2 25, distribuția de eșantionare pentru T se apropie de distribuția normală, astfel încât putem folosi tabelul scorurilor Z pentru a stabili zona critică. În pasul 3, după ce determinăm valoarea pentru T (obținut), folosim mai întâi următoarele formule pentru determinarea mediei aritmetice a distribuției de eșantionare a valorilor T () și, respectiv, a abaterii standard a acestei distribuții ():
Formula 10.18
Formula 10.19
În aceste formule, n reprezintă numărul de cazuri din fiecare eșantion sau, altfel spus, numărul de perechi de cazuri alcătuite din cele două eșantioane. Z (obținut) se calculează cu următoarea formulă:
Formula 10.20
Procedura de decizie este cea uzuală pentru testul Z.
10.7 TESTUL KRUSKAL–WALLIS H
Testul KruskalWallis H este analogul nonparametric al testului ANOVA pentru o variabilă independentă și este aplicabil la date de nivel ordinal
Să presupunem că ne interesează diferențele dintre cadrele didactice din învățământul primar, cel gimnazial și cel liceal sub aspectul comportamentului autoritar față de elevi. Alcătuim eșantioane din cele trei populații cu, respectiv, n1 = 6, n2 = 5 și n3 = 6 și administrăm subiecților o scală de autoritate. Datele obținute sunt prezentate în tabelul 10.9, în care scorurile mari indică un comportament mai autoritar.
Tabelul 10.9 Comportamentul autoritar al cadrelor didactice
din învățământul primar, gimnazial și liceal
Considerând scorurile combinate ale celor trei eșantioane și ordonate crescător, atribuim rangul 1 celui mai mic scor (46), rangul 2 scorului imediat următor (48) ș.a.m.d. până la cel mai mare scor (73). Dacă întâlnim două sau mai multe scoruri identice, procedăm în maniera indicată în cazul testului MannWhitney U. Calculăm apoi suma rangurilor pentru fiecare eșantion.
Ipoteza de nul pentru testul KruskalWallis H este analogă ipotezei de nul pentru testul ANOVA unifactorial, fiind însă enunțată în termeni mai generali: nu există nici o diferență în privința scorurilor celor k populații din care au fost alcătuite eșantioanele sau, altfel spus, populațiile din care au fost alcătuite eșantioanele sunt identice sub aspectul variabilei de interes. Ipoteza alternativă enunță că cel puțin două dintre cele k populații diferă sub aspectul variabilei de interes.
De notat că o condiție de aplicabilitate a acestui test este ca fiecare eșantion j să conțină un număr de cazuri nj 5.
Calcularea statisticii testului constă din aflarea valorii unei mărimi statistice, H, cu ajutorul următoarei formule:
Formula 10.21
în care N = numărul total de cazuri din cele k eșantioane
ΣRj = suma rangurilor din eșantionul j, j = 1,2, …, k
nj = numărul de cazuri din eșantionul j, j = 1,2, …, k
Distribuția de eșantionare în testul KruskalWallis H este distribuția χ2 cu k – 1 grade de libertate. Ipoteza de nul este respinsă dacă valoarea lui H este mai mare decât valoarea critică χ2 corespunzătoare nivelului α ales și numărului de grade de libertate.
În termenii modelului în 4 pași, testul pentru exemplul de mai sus decurge după cum urmează:
Pasul 1. Enunțarea ipotezelor
H0: Nu există nici o diferență în privința comportamentului autoritar față de elevi al cadrelor didactice de la cele trei nivele de învățământ.
Ha: Cel puțin două din cele trei populații de cadre didactice diferă sub aspectul comportamentului autoritar față de elevi.
Pasul 2. Selectarea distribuției de eșantionare și stabilirea zonei critice
Distribuția de eșantionare = Distribuția χ2
α = 0,05
gl = k – 1 = 3 – 1 = 2
χ2 (critic) = 5,991
Pasul 3. Calcularea statisticii testului
Pasul 4. Luarea deciziei
Întrucât H (7,86) χ2 (critic) (5,991), putem respinge ipoteza e nul. Examinarea datelor indică faptul că profesorii de liceu sunt mai autoritari decât cei din învățământul gimnazial și primar și profesorii din învățământul gimnazial sunt mai autoritari decât cei din învățământul primar, iar testul arată că aceste diferențe sunt statistic semnificative.
GLOSAR
Celulă: intersecția unui rând cu o coloană într-un tabel al contingențelor. Celulele indică numărul de cazuri clasificate concomitent în câte două categorii ale celor două variabile.
Iterație: orice succesiune de R elemente de același fel, cu R 1.
Marginal: subtotal pentru o coloană și un rând într-un tabel al contingențelor. Marginalele indică distribuțiile de frecvențe pentru fiecare categorie a variabilei respective sau, altfel spus, distribuțiile univariate de frecvențe ale fiecărei variabile.
Tabel al contingențelor: tabel rectangular în care cazurile dintr-un eșantion sunt clasificate concomitent după categoriile a două variabile. Denumirile categoriilor unei variabile sunt folosite drept titluri de coloane, iar denumirile categoriilor celeilalte variabile sunt folosite drept titluri de rânduri.
Teste nonparametrice: teste de semnificație care nu necesită supoziții particulare despre forma distribuției populațiilor de referință, astfel că pot fi aplicate în special atunci când se lucrează cu eșantioane mici. Testele nonparametrice sunt cu deosebire utile în psihologie, întrucât pot fi aplicate pentru variabile măsurate la nivel nominal sau ordinal.
Testul chipătrat (χ2): test non-parametric pentru două variabile măsurate la nivel nominal și organizate într-u tabel al contingențelor. Esența acestui test constă din compararea frecvențelor observate – frecvențele efective obținute empiric de către cercetător – cu frecvențele teoretice sau așteptate – frecvențele calculate sub presupunerea că ipoteza de nul este adevărată.
Testul iterațiilor: test non-parametric pentru două variabile măsurate la nivel ordinal.
Testul KruskalWallis H: este analogul nonparametric al testului ANOVA unifactorial, aplicabil la date de nivel ordinal.
Testul MannWhitney U: test non-parametric pentru două variabile măsurate la nivel ordinal.
Testul McNemar: test nonparametric pentru semnificația schimbării; acest test utilizează distribuția χ2 și este aplicabil pentru variabile de nivel nominal, în cazul a două eșantioane dependente.
Testul medianei: test nonparametric pentru egalitatea a două mediane; acest test utilizează distribuția χ2 și este aplicabil în cazul a două eșantioane independente, pentru variabile măsurate la nivel ordinal.
Testul Wilcoxon T: test non-parametric pentru semnificația diferenței dintre două eșantioane dependente, aplicabil pentru date de nivel ordinal.
Variabile independente reciproc: două variabile sunt independente reciproc dacă, pentru toate cazurile din eșantionul considerat, clasificarea unui caz într-o categorie a unei variabile nu are nici un efect asupra probabilității ca acel caz să fie clasificat în oricare dintre categoriile celeilalte variabile.
11 MĂRIMI ALE CORELAȚIEI
Mărimile corelației sunt mărimi statistice complementare testelor de semnificație și permit cuantificarea importanței (tăriei) unei relații între variabile. Psihologii sunt interesați să descopere dacă există relații între variabile precum inteligența și creativitatea, vechimea în muncă și satisfacția față de profesia practicată, timpul afectat vizionării emisiunilor TV și performanțele școlare etc. Mărimile corelației sunt folosite în principal pentru înțelegerea relațiilor cauzale dintre variabile și pentru predicția de la o variabilă la alta. Să precizăm. Deși mărimile corelației nu pot fi folosite pentru a dovedi existența relațiilor cauzale, informațiile furnizate de acestea pot fi folosite ca argumente în favoarea sau împotriva existenței relațiilor cauzale. Pe de altă parte, dacă două variabile sunt corelate, atunci putem aprecia scorurile unei variabile pe baza cunoașterii scorurilor în privința celeilalte variabile. În psihologie, o astfel de apreciere se numește predicție. O predicție este cu atât mai precisă, cu cât corelația dintre cele două variabile este mai puternică.
În cele ce urmează, vom folosi tabelele cu dublă intrare pentru a introduce noțiunea de corelație, vom prezenta calcularea și interpretarea diferitelor mărimi ale corelației bivariate (corelația dintre două variabile) și vom aborda unele aspecte ale corelației multivariate (corelația dintre mai mult de două variabile).
11.1 NOȚIUNEA DE CORELAȚIE
Se spune că două variabile sunt corelate, dacă distribuția scorurilor uneia dintre acestea se schimbă sub influența scorurilor celeilalte.
Să presupunem că ne interesează relația dintre satisfacția față de meseria practicată și productivitatea muncii pentru muncitorii unei fabrici. Dacă aceste două variabile sunt corelate, atunci nivelele de productivitate a muncii vor varia sub influența nivelelor de satisfacție. Tabelul 11.1 prezintă relația în discuție pentru un eșantion de 173 de muncitori (date fictive).
Tabelul 11.1 Productivitatea și satisfacția față de meseria practicată
Ca și până acum, într-un tabel cu dublă intrare vom urma convenția tacită de a lua denumirile categoriilor variabilei independente (X) drept capete de coloane, iar denumirile categoriilor variabilei dependente (Y) drept capete de rânduri.
Într-un astfel de tabel, distribuțiile de frecvențe „pe coloană” sunt numite distribuții condiționate ale variabilei dependente, deoarece prezintă distribuția scorurilor variabilei dependente pentru fiecare scor (condiție) al (a) variabilei independente. De pildă, în tabelul 11.1, prima coloană din stânga arată că din 60 de muncitori cu satisfacție scăzută față de meseria practicată, 10 sunt înalt productivi, 20 sunt mediu productivi, iar 30 au o productivitate scăzută. Inspectarea acestor distribuții condiționate ne permite să observăm efectele variabilei independente asupra variabilei dependente. Astfel, constatăm că distribuțiile condiționate ale variabilei productivitate se schimbă în funcție de diferitele scoruri ale variabilei satisfacție. De pildă, jumătate dintre muncitorii cu satisfacție scăzută față de meserie (30) au o productivitate scăzută, în timp ce peste jumătate dintre muncitorii cu satisfacție înaltă față de meserie (27) au o productivitate înaltă. Aceasta arată că productivitatea în muncă și satisfacția față de meseria aleasă sunt corelate.
În tabelul 11.1, compararea distribuțiilor condiționate ale variabilei dependente este ușor de făcut, deoarece marginalele coloanelor au valori apropiate. În mod obișnuit, nu aceasta este situația și de aceea este util să controlăm distribuțiile condiționate care dau totaluri diferite prin calcularea procentelor corespunzătoare în sensul variabilei independente (pe coloane) și apoi să le comparăm în sensul variabilei dependente (pe rânduri). În tabelul 11.2 sunt prezentate procentele pentru datele din tabelul 11.1 (valori rotunjite), calculate în modul indicat.
Tabelul 11.2 Productivitatea și satisfacția față de meseria practicată
(în procente)
Să observăm că în tabelul 11.2, marginalele rândurilor au fost omise, iar marginalele coloanelor, față de care au fost calculate procentele, sunt prezentate între paranteze.
Putem vedea imediat că poziția celulei cu cea mai mare frecvență relativă se schimbă de la o coloană la alta. Astfel, pentru muncitorii cu un nivel de satisfacție scăzut, celula cu cea mai mare frecvență relativă (50%) se află pe ultimul rând; pentru muncitorii cu un nivel mediu de satisfacție, celula cu ea mai mare frecvență relativă (41%) se află pe rândul din mijloc; în fine, pentru muncitorii cu un nivel înalt de satisfacție, celula cu cea mai mare frecvență relativă se află pe primul rând. Aceste rezultate întăresc concluzia că există o corelație între cele două variabile.
Dacă două variabile nu sunt corelate, atunci distribuțiile condiționate ale variabilei dependente nu se vor modifica de la o coloană la alta sau, altfel spus, distribuțiile variabilei dependente vor fi aceleași pentru fiecare condiție a variabilei independente. Dacă, de pildă, în loc de variabila satisfacție am lua variabila culoarea părului, am obține în fiecare celulă, probabil, un procent de aproximativ 33,3%.
Dacă două variabile sunt corelate, iar variabilele respective se află cel puțin la nivel ordinal, atunci se poate indica un sens al corelației. Acesta poate fi pozitiv (direct) sau negativ (invers). De pildă, dacă se constată că performanțele școlare ale unui eșantion de elevi într-o anumită perioadă sunt cu atât mai bune cu cât elevii respectivi au afectat un număr mai mare de ore pe săptămână studiului individual în acea perioadă, atunci se spune că între studiul individual și performanțele școlare există o corelație pozitivă. Dacă se constată că performanțele școlare ale unui eșantion de elevi sunt cu atât mai slabe cu cât elevii respectivi au afectat un număr mai mare de ore pe săptămână vizionării emisiunilor TV, atunci se spune că între vizionarea emisiunilor TV și performanțele școlare există o corelație negativă. În general, două variabile sunt corelate pozitiv la nivelul unui eșantion, dacă subiecții din eșantion care au scoruri înalte în privința unei variabile au scoruri înalte și în privința celeilalte variabile, iar cei care au scoruri joase în privința unei variabile au scoruri joase în privința celeilalte variabile. Altfel spus, într-o corelație pozitivă, o variabilă crește sau descrește în valoare după cum crește sau descrește cealaltă. Tabelul 11.2. arată că variabilele satisfacție și productivitatea muncii sunt corelate pozitiv: un nivel înalt de satisfacție este asociat cu un nivel înalt de productivitate, satisfacția medie este asociată cu productivitatea medie, iar satisfacția scăzută cu productivitatea scăzută. Două variabile sunt corelate negativ la nivelul unui eșantion, dacă subiecții din eșantion care au scoruri înalte în privința unei variabile au scoruri joase în privința celeilalte variabile. Altfel spus, într-o corelație negativă, creșterea valorii unei variabile este însoțită de descreșterea valorii celeilalte variabile. Tabelul 11. 3 prezintă o corelație negativă între nivelul de educație și vizionarea programelor TV (date fictive).
Tabelul 11.3 Nivelul de educație și vizionarea programelor TV
(ilustrare pentru „corelație negativă”)
Orice corelație, pozitivă sau negativă, poate fi apreciată după tăria sau puterea sa. Un caz extrem este cel al corelației perfecte. Corelația dintre două variabile este perfectă, dacă fiecare scor al unei variabile este asociat cu un singur scor al celeilalte variabile, astfel că scorurile unei variabile pot fi determinate exact pe baza cunoașterii scorurilor celeilalte variabile. Dacă, de pildă, între nivelul de educație și vizionarea programelor TV ar fi o corelație (negativă) perfectă, atunci într-un tabel cu dublă intrare pentru aceste variabile, toate cazurile de pe fiecare coloană ar fi localizate într-o singură celulă, ceea ce ar arăta că nu există nici o variație a variabilei Y pentru orice scor dat al variabilei X. O astfel de situație este prezentată în tabelul 11.4.
Tabelul 11.4 Nivelul de educație și vizionarea programelor TV
(ilustrare pentru „corelație negativă perfectă”)
O corelație perfectă ar putea fi luată drept o dovadă puternică pentru o relație cauzală între variabile, cel puțin pentru eșantionul respectiv. Rezultatele prezentate în tabelul 11.4 ar indica faptul că, pentru eșantionul considerat, este foarte probabil ca singura cauză a gradului de urmărire a programelor TV să fie nivelul de educație. De asemenea, o corelație perfectă ar permite predicții fără eroare de la o variabilă la alta. De pildă, dacă am ști că o persoană din eșantion are un nivel înalt de educație, am putea prezice cu exactitate că gradul de urmărire a programelor TV pentru acea persoană este scăzut. Corelația perfectă este un caz ideal, care nu se întâlnește în practica cercetării psihologice, dar care este luat ca reper pentru aprecierea tăriei corelațiilor dintre variabilele de interes.
În cele ce urmează, vom prezenta o serie de mărimi ale corelației, numite coeficienți de corelație, pentru diferite nivele de măsură. Aproape toate aceste mărimi sunt concepute astfel încât să aibă limita inferioară 0, indicând cazul „nici o corelație”, și limita superioară 1 pentru nivelul nominal, respectiv 1 pentru celelalte nivele, indicând cazurile „corelație pozitivă perfectă„ (+1) sau cazul „corelație negativă perfectă”. Acum, valorile coeficienților de corelație diferite de 0 și 1 nu au o interpretare directă precisă. Să presupunem, de pildă, că valoarea unui astfel de coeficient pentru două variabile este de 0,40. Aceasta înseamnă că între cele două variabile există o corelație importantă? A decide ce valoare a unui coeficient de corelație indică o legătură importantă între variabile este o chestiune care, pe de o parte, depinde de natura variabilelor considerate și care, pe de altă parte, este întrucâtva arbitrară. În plus, după cum vom vedea, doi coeficienți de corelație pot avea valori diferite pentru aceleași date. Cu toate acestea, se admite că o interpretare rezonabilă a valorii unui coeficient de corelație se poate da conform următorului tabel:
Interpretarea valorii unui coeficient de corelație
De notat că intervalele de valori se suprapun la extremități, ceea ce arată că interpretarea valorii unui coeficient de corelație rămâne relativ vagă.
11.2 MĂRIMI ALE CORELAȚIEI LA NIVEL NOMINAL
Cele mai utilizate mărimi ale corelației dintre variabile măsurate la nivel nominal sunt coeficientul φ, coeficientul de contingență C, coeficientul V al lui Cramer și coeficientul λ.
Coeficienții φ, C și V sunt mărimi ale corelației bazate pe χ2. Coeficientul φ se calculează cu ajutorul următoarei formule:
Formula 11.1
Să considerăm din nou tabelul 10.1, în care se prezentau datele (fictive) ale unui studiu privind sexul și dominanța funcțional–operativă a mâinilor, reprodus aici ca tabelul 11.5.
Tabelul 11.5 Sexul și dominanța funcționaloperativă a mâinilor
După cum am constatat prin aplicarea testului χ2, relația dintre cele două variabile este statistic semnificativă, i.e valoarea χ2 (obținut) = 18 s-a dovedit a fi semnificativă la un nivel de încredere de 95%. Ceea ce ne interesează acum este tăria corelației. Aplicând formula 11.1, obținem:
Valoarea φ = 0,42 indică o corelație cel mult moderată între sex și dominanța funcțional–operativă a mâinilor. Relația dintre aceste variabile este statistic semnificativă (χ2), dar nu este puternică. Problema este că φ ia valori cuprinse între 0 (nici o corelație) și 1 (corelație perfectă) numai pentru tabele 2 2. Pentru tabelele de mare dimensiune, φ poate depăși valoarea 1, ceea ce face ca interpretarea acestui coeficient să devină problematică. Oricum, după cum vom vedea, valoarea lui φ obținută pentru exemplul de mai sus este foarte apropiată de valorile obținute prin calcularea celorlalți coeficienți de corelație menționați.
Coeficientul C se calculează cu ajutorul următoarei formule:
Formula 11.2
Aplicând această formulă la datele din tabelul 11.5, obținem:
Deficiența coeficientului C este aceea că, fiind o mărime subunitară, nu poate lua niciodată valoarea 1. Se demonstrează că pe măsură ce dimensiunea tabelului crește, C tinde către 1. De pildă, valoarea maximă a lui C este 0,82 pentru un tabel 3 3 și 0,87 pentru un tabel 4 4. De aceea, se recomandă folosirea acestui coeficient numai pentru tabele de mare dimensiune (aproximativ de la 10 linii sau/și coloane în sus).
Coeficientul V se calculează cu ajutorul următoarei formule:
Formula 11.3
în care q este cea mai mică dintre valorile numerice r (număr de rânduri) și c (număr de coloane) pentru tabelul respectiv. Aplicând formula 11.3 la datele din tabelul 11.5 obținem:
După cum se poate constata, rezultatul obținut prin calcularea coeficientului V este același cu cel obținut prin calcularea coeficientului φ. Coeficientul V are valoarea maximă 1, dar numai pentru tabele mai mari de 2 2.
Cu toate deficiențele lor, întrucât sunt ușor de calculat, coeficienții φ, C și V pot fi folosiți în calitate de primi indici ai importanței unei corelații.
În situații de cercetare mai pretențioase se obișnuiește să se utilizeze coeficientul λ., care ia valori cuprinse între 0 și 1. În cazul în care nu se dorește sau nu se poate identifica variabila independentă, se folosește varianta simetrică a coeficientului λ, a cărui formulă de calcul este următoarea:
Formula 11.4
în care nmx = cea mai mare frecvență în coloana x
nmy = cea mai mare frecvență în rândul y
nmc = cel mai mare marginal de coloană
nmr = cel mai mare marginal de rând
Să presupunem că într-o cercetare privind relația dintre apartenența religioasă și atitudinea față de pedeapsa capitală s-au obținut rezultatele din tabelul 11.6.
Tabelul 11.6 Apartenența religioasă și atitudinea
față de pedeapsa capitală
Pentru datele din acest tabel avem:
Aplicând formula 11.4, obținem:
Dacă se poate identifica variabila independentă, atunci se folosește varianta asimetrică a coeficientului λ, notat λy, a cărui formulă de calcul este următoarea:
Formula 11.5
Considerând exemplul de mai sus, dacă cercetătorul identifică drept variabilă independentă apartenența religioasă, atunci se obține:
Pentru cele mai multe situații de cercetare, interpretarea celor două variante ale coeficientului λ este similară interpretării coeficienților C și V. Pentru exemplul considerat aici, putem conchide că cele două variabile sunt corelate, dar că această corelație este foarte slabă.
11.3 MĂRIMI ALE CORELAȚIEI LA NIVEL ORDINAL
Vom prezenta patru coeficienți ai corelației, utilizabili la nivel ordinal: γ al lui Goodman și Kruskal, d al lui Somer, τb al lui Kendall și ρs al lui Spearman. Acești coeficienți iau valori cuprinse între 0 și 1 (τb numai pentru cazul r = c).
Coeficientul γ se utilizează în situații de cercetare în care avem două variabile măsurate la nivel ordinal cu un număr mic de valori (nu mai mult de cinci sau șase). Să presupunem că am obținut următoarele date privind vechimea în muncă și descurajarea profesională pentru un eșantion de 100 de cadre didactice din învățământul primar:
Tabelul 11.7 Vechimea în muncă și descurajarea profesională
În cele ce urmează, cazurile care fac parte din aceeași categorie a unei variabile vor fi numite cazuri legate ale variabilei respective.
Pentru a calcula coeficientul γ, sunt necesare două cantități, notate cu Na și respectiv Nd. Cantitatea Na reprezintă numărul total de perechi de cazuri nelegate și dispuse în aceeași ordine în privința ambelor variabile. Cantitatea Nd reprezintă numărul total de perechi de cazuri nelegate și ordonate diferit în privința celor două variabile. Pentru aflarea acestor două cantități, vom lucra cu frecvențele celulelor, considerând celulă cu celulă.
Pentru înlesnirea referirii la celulele unui tabel n m vom numerota rândurile de la 1 la n începând de sus în jos și, de asemenea, coloanele de la 1 la m începând de la stânga la dreapta; pentru fiecare celulă, vom folosi o notație de forma cij, în care i este numărul rândului, iar j numărul coloanei. Pentru un tabel 3 3, cum este 11.7, avem:
Să observăm că dacă alcătuim perechi selectând un caz dintr-o celulă cij și un caz dintr-o celulă situată pe același rând cu cij, obținem perechi de cazuri legate ale variabilei Y, iar dacă alcătuim perechi selectând un caz dintr-o celulă cij și un caz dintr-o celulă situată pe aceeași coloană cu cij, obținem perechi de cazuri legate ale variabilei X. Evident, dacă alcătuim perechi din aceeași celulă, obținem perechi de cazuri legate în privința ambelor variabile. Dacă, însă, alcătuim perechi selectând un caz dintr-o celulă cij și un caz dintr-o celulă situată deasupra și la dreapta celulei cij, cazurile din perechile astfel obținute sunt nelegate și dispuse în aceeași ordine în privința ambelor variabile. De pildă, dacă alcătuim o pereche selectând un caz din celula c31 și un caz din celula c12, cazul din celula c31 are o vechime mai mică decât cazul din celula c12 și la fel, cazul din celula c31 are un nivel de descurajare profesională mai mic decât cazul din celula c12. Numărul total de perechi de cazuri alcătuite selectând un caz din celula c31 și un caz din celula c12 se află înmulțind frecvențele din cele două celule: 20 11 = 220. Cu alte cuvinte, contribuția acestor două celule la cantitatea Na este de 220 de perechi. Procedând la fel pentru fiecare dintre celelalte trei celule situate deasupra și la dreapta celulei c31 (c13, c22 și c23) și adunând produsele astfel obținute aflăm numărul total de perechi de cazuri alcătuite selectând un caz din celula c31 și un caz din fiecare celulă situată deasupra și la dreapta celulei c31:
(20 11) + (20 21) +(20 15) + (20 5) = 1040
Același calcul îl putem efectua după cum urmează:
20(11 + 21 + 15 + 5) = 1040
Prin urmare, pentru a afla cantitatea Na, se înmulțește frecvența din fiecare celulă cu suma frecvențelor din toate celulele situate deasupra și la dreapta celulei respective, după care se adună produsele astfel obținute. De notat că nici una dintre celulele situate pe primul rând sau pe ultima coloană nu poate contribui la Na, deoarece nu există celule situate deasupra și la dreapta acestora. Calcularea Na pentru tabelul 11.7 decurge după cum urmează:
Pentru c31: 20(11 + 21 + 15 +5) = 1040
Pentru c32: 6(21 + 5) = 156
Pentru c21: 10(11 + 21) = 320
Pentru c22: 15 21 = 315
Na = 1831
Procedeul de calculare a Nd urmează o schemă simetrică față de cel pentru Na, căci dacă alcătuim perechi selectând un caz dintr-o celulă cij și un caz dintr-o celulă situată deasupra și la stânga celulei cij, cazurile din perechile astfel obținute sunt nelegate și ordonate diferit în privința ambelor variabile. De pildă, dacă alcătuim o pereche selectând un caz din celula c33 și un caz din celula c11, cazul din celula c33 are o vechime mai mare decât cazul din celula c11 și un nivel de descurajare profesională mai mic decât cazul din celula c11. Prin urmare, pentru a afla cantitatea Nd, se înmulțește frecvența din fiecare celulă cu suma frecvențelor din toate celulele situate deasupra și la stânga celulei respective, după care se adună produsele astfel obținute. Ca mai sus, să observăm că nici una dintre celulele situate pe primul rând sau pe prima coloană nu poate contribui la Nd, deoarece nu există celule situate deasupra și la stânga acestora. Calcularea Nd pentru tabelul 11.7 decurge după cum urmează:
Pentru c33: 4(8 + 11 + 10 +15) = 176
Pentru c32: 6(8 + 10) = 108
Pentru c23: 5(8 + 11) = 95
Pentru c22: 15 8 = 120
Nd = 499
În tabelul 11.7, un număr total de 1831 de perechi de cazuri sunt nelegate și dispuse în aceeași ordine în privința ambelor variabile și un număr total de 499 de perechi de cazuri sunt nelegate ordonate diferit în privința celor două variabile.
Coeficientul γ se calculează cu ajutorul următoarei formule:
Formula 11.6
Valoarea coeficientului γ pentru datele din tabelul 11.7 este:
Vom conchide că vechimea în muncă este corelată moderat cu nivelul de descurajare profesională, această corelație fiind pozitivă: dacă, de pildă, știm că A are o vechime mai mare în muncă decât B, suntem îndreptățiți să spunem că este probabil ca A să aibă un nivel de descurajare profesională mai înalt decât B.
Este important de observat că aplicarea coeficientului γ presupune (pentru a obține cantitățile Na și Nd) ca tabelul pe care se lucrează să fie construit în maniera tabelului 11.7, cu categoriile de pe coloane dispuse în ordine crescătoare de la stânga la dreapta și categoriile de pe linii dispuse în ordine crescătoare de jos în sus. γ este o mărime simetrică a corelației: valoarea acestui coeficient va fi aceeași indiferent de variabila care este luată ca independentă.
Ca și γ, coeficienții d al lui Somer și τb al lui Kendall se utilizează în situații de cercetare în care avem două variabile măsurate la nivel ordinal cu un număr mic de valori și necesită calcularea cantităților Na și Nd. În plus, acești coeficienți necesită calcularea a două cantități, notate Ly și respectiv Lx. Cantitatea Ly reprezintă numărul total de perechi de cazuri legate ale variabilei dependente. Cantitatea Lx reprezintă numărul total de perechi de cazuri legate ale variabilei independente.
Numărul total de perechi de cazuri legate ale variabilei dependente, Ly, se determină aflând numărul de perechi de cazuri de pe fiecare rând (prin definiție, toate cazurile aflate pe același rând sunt legate în privința variabilei dependente) și adunând cantitățile astfel obținute. Pentru a afla contribuția fiecărui rând la Ly, se înmulțește frecvența din fiecare celulă cu suma frecvențelor din toate celulele situate la dreapta (pe rândul respectiv), după care e adună produsele astfel obținute. Evident, celulele situate pe ultima coloană nu pot contribui la Ly, deoarece nu există celule situate la dreapta acestora. Calcularea Ly pentru tabelul 11.7 decurge după cum urmează:
Pentru rândul 1: 8(11 + 21) + (11 21) = 487
Pentru rândul 2: 10(15 + 5) + (15 5) = 275
Pentru rândul 3: 20(6 + 4) + (6 4) = 224
Ly = 986
Numărul total de perechi de cazuri legate ale variabilei independente, Lx, se determină analog, lucrând însă pe coloane. Pentru a afla contribuția fiecărei coloane la Lx, se înmulțește frecvența din fiecare celulă cu suma frecvențelor din toate celulele situate dedesubt (pe coloana respectivă), după care e adună produsele astfel obținute. Evident celulele situate pe ultimul rând nu pot contribui la Lx, deoarece nu există celule situate dedesubtul acestora. Calcularea Lx pentru tabelul 11.7 decurge după cum urmează:
Pentru coloana 1: 8(10 + 20) + (10 20) = 440
Pentru coloana 2: 11(15 + 6) + (15 6) = 321
Pentru coloana 3: 21(5 + 4) + (5 4) = 209
Lx = 970
În tabelul 11.7 avem un număr total de 986 de perechi de cazuri legate ale variabilei dependente și un număr total de 970 de perechi de cazuri legate ale variabilei independente.
Coeficientul d al lui Somer se calculează cu ajutorul următoarei formule:
Formula 11.7
Să observăm că această formulă diferă de formula pentru γ numai prin adunarea cantității Ly la numitor, ceea ce face ca d să fie o mărime a corelației mai conservatoare decât γ, deoarece valoarea lui d va fi întotdeauna mai mică decât valoarea lui γ pentru același tabel. Pentru tabelul 11.7, avem:
Această valoare a coeficientului d indică o corelație pozitivă cel mult moderată între cele două variabile.
După cum se poate constata, coeficientul d este o mărime asimetrică a corelației. Dacă variabila ale cărei categorii sunt capete de rânduri este luată drept variabilă independentă, atunci se calculează numărul de perechi de cazuri pe coloane și nu pe rânduri (în notația noastră, în formula 11.7 se ia Lx în loc de Ly ). În cazul datelor din tabelului 11.7, valorile cantităților Lx și Ly sunt apropiate, ceea ce înseamnă că o astfel de schimbare nu ar afecta mult valoarea coeficientului d. În cazul în care cele două cantități sunt sensibil diferite, trebuie să fim precauți în privința alegerii variabilei dependente, deoarece valoarea lui d poate fi considerabil afectată de această decizie.
Coeficientul τb al lui Kendall este o mărime simetrică a corelației, întrucât ține cont atât de Ly, cât și de Lx. Formula sa de calcul este următoarea:
Formula 11.8
Pentru tabelul 11.7 avem:
Particularitatea coeficientului τb constă din aceea că poate lua valori cuprinse între 0 și 1 doar pentru tabele pătratice (r = c), deci nu se recomandă calcularea sa pentru orice tabel rectangular.
Coeficientul ρs al lui Spearman se utilizează, de regulă, în situații de cercetare în care avem două variabile măsurate la nivel ordinal, care au o amplitudine relativ largă de scoruri diferite și puține cazuri legate în privința fiecărei variabile. Să presupunem că dorim să verificăm ipoteza conform căreia persoanele care practică jogging au un sentiment mai puternic de respect față de sine. Pentru aceasta, 10 persoane care practică jogging au fost chestionate cu ajutorul a două scale, prima măsurând gradul de implicare în practicarea jogging-ului, cealaltă măsurând nivelul respectului față de sine. Datele obținute, împreună cu o serie de calcule cerute de determinarea coeficientului ρs, sun prezentate în tabelul 11.8.
Tabelul 11.8 Practicarea jogging-ului și respectul față de sine
Mai întâi, atribuim ranguri scorurilor fiecărei valori, începând cu cel mai mare scor. Apoi, pentru fiecare caz, calculăm diferența dintre rangul scorului în privința primei variabile (X) și rangul scorurilor în privința celeilalte variabile (Y) (în tabel, coloana etichetată d). Să observăm că suma acestor diferențe este 0, ceea ce înseamnă că diferențele negative sunt egale cu cele pozitive, acesta fiind întotdeauna cazul. Dacă obținem ∑d 0, atunci am greșit în atribuirea rangurilor sau/și în calcularea diferențelor. Fiecare diferență astfel obținută este apoi ridicată la pătrat pentru a elimina semnele minus (în tabel, coloana d2), după care se calculează suma acestor diferențe ridicate la pătrat, ∑d2.
Formula de calcul a coeficientului ρs al lui Spearman este următoarea:
Formula 11.9
în care n este numărul de perechi de ranguri. Aplicând această formulă la datele din tabelul 11.8, obținem:
Acest rezultat indică o corelație pozitivă puternică între cele două variabile, ceea ce sprijină ipoteza cercetării.
În anumite situații de cercetare ne interesează să aflăm dacă două variabile sunt corelate la nivelul populației de referință. În cazul variabilelor măsurate la nivel nominal, semnificația statistică a unei corelații este judecată, de obicei, prin intermediul testului χ2. De asemenea, testul χ2 poate fi aplicat și în cazul corelațiilor dintre variabile măsurate la nivel ordinal. Totuși, acest test evidențiază doar probabilitatea ca frecvențele observate să se datoreze doar întâmplării și, ca atare, nu reprezintă un test direct al corelației. Pentru coeficienții γ și ρs au fost elaborate teste de semnificație specifice, în care ipoteza de nul enunță că nu există nici o corelație la nivelul populației, deci că valorile mărimilor respective sunt egale cu 0: γ = 0, respectiv ρs = 0. Corespunzător, ipoteza alternativă enunță că γ 0 sau, respectiv, că ρs 0. Astfel, pentru eșantioane cu n 30, distribuția de eșantionare pentru γ aproximează distribuția Z și se folosește următoarea formulă pentru calcularea statisticii testului:
Formula 11.10
Regulile de decizie sunt cele cunoscute pentru testul Z.
În cazul coeficientului ρs, dacă 5 n 30, atunci se folosește tabelul valorilor critice pentru ρs (anexa H). Pentru a folosi acest tabel, se identifică valoarea critică a lui ρs corespunzătoare numărului de perechi de ranguri, n, și nivelului α ales. Pentru a putea respinge ipoteza de nul și a conchide că variabilele respective sunt corelate la nivelul populației, valoarea obținută pentru ρs trebuie să fie mai mare decât valoarea critică. Dacă n 30, atunci distribuția de eșantionare pentru ρs aproximează distribuția t cu gl = n 2 și se folosește următoarea formulă pentru calcularea statisticii testului:
Formula 11.11
Regulile de decizie sunt cele cunoscute pentru testul t – Student.
11.4 MĂRIMI ALE CORELAȚIEI LA NIVEL DE
INTERVAL SAU DE RAPORT
Tehnicile statistice folosite pentru analiza corelației dintre variabile măsurate la nivel de interval sau de raport se bazează pe alte concepte și modalități de calcul față de cele prezentate în secțiunea anterioară, dar urmăresc să răspundă la aceleași întrebări privind existența, sensul și tăria unei corelații. În cele ce urmează, vom prezenta diagramele de împrăștiere, ecuația de regresie și coeficientul de corelație r al ui Pearson.
Diagramele de împrăștiere sunt modalități de prezentare vizuală a corelației dintre două variabile măsurate la nivel de interval sau de raport și sunt analoage funcțional tabelelor bivariate, întrucât permit sesizarea rapidă a multor trăsături importante ale unei corelații.
Vom ilustra construirea unei diagrame de împrăștiere cu ajutorul unui exemplu. Să presupunem că ne interesează dacă există o relație între abilitățile de limbaj și cele aritmetice pentru un eșantion de 9 elevi din învățământul primar. Rezultatele obținute prin aplicarea testelor corespunzătoare sunt prezentate în tabelul 11.9.
Tabelul 11.9 Abilități de limbaj și abilități aritmetice
Pentru a construi o diagramă de împrăștiere, folosim un sistem de axe rectangulare, dispunând valorile variabilei X pe axa orizontală (abscisa) și valorile variabilei Y pe axa verticală (ordonata). Ambele axe se calibrează în unități corespunzătoare, respectiv, scalelor de măsură folosite pentru strângerea datelor. Pentru fiecare pereche de valori (pentru fiecare caz) se plasează un punct la intersecția perpendicularelor respective pe cele două axe. Diagrama de împrăștiere pentru datele din tabelul 11.9 este prezentată în figura 11.1.
Figura 11.1 Abilități de limbaj și abilități aritmetice
Fiecare elev este reprezentat printr-un punct plasat la intersecția celor două scoruri obținute de acesta. Dispunerea punctelor poate fi pusă în evidență prin trasarea unei linii drepte care să atingă fiecare punct sau să treacă cât se poate mai aproape posibil de fiecare punct. După cum vom vedea, această linie, numită linie de regresie, poate fi descrisă precis printr-o ecuație, dar deocamdată este suficientă trasarea sa aproximativă:
Punctele situate deasupra fiecărei valori X pot fi considerate distribuții condiționate ale lui Y; cu alte cuvinte, punctele reprezintă scoruri ale variabilei Y pentru fiecare scor al variabilei X. Figura 11.1 arată că aceste distribuții condiționate ale lui Y se modifică după cum se modifică X (scorurile Y variază în funcție de scorurile X), ceea ce înseamnă că cele două variabile sunt corelate. Existența unei corelații este evidențiată și de faptul că linia de regresie formează un unghi cu axa X (abscisa). Dacă cele două variabile nu ar fi corelate, scorurile variabilei Y nu s-ar modifica în funcție de scorurile X, astfel că linia de regresie ar fi paralelă cu abscisa.
Sensul corelației poate fi detectat prin panta (înclinarea) liniei de regresie față de abscisă. În exemplul nostru avem o corelație pozitivă, deoarece elevii cu scoruri mari în privința variabilei X (abilități de limbaj) tind să aibă scoruri mari în privința variabilei Y (abilități aritmetice). Dacă între cele două variabile ar fi fost o corelație negativă, linia de regresie ar fi fost înclinată în direcția opusă, indicând că scorurile înalte ale unei variabile sunt asociate cu scoruri mici ale celeilalte variabile.
Tăria corelației poate fi aproximativ apreciată observând împrăștierea punctelor în jurul liniei de regresie. Într-o corelație perfectă, toate punctele s-ar afla pe linia de regresie. Prin urmare, cu cât punctele sunt mai puțin împrăștiate în jurul liniei de regresie, cu atât corelația este mai puternică.
O supoziție esențială care stă la baza tehnicilor statistice prezentate în continuare este aceea că între cele două variabile considerate este o corelație lineară, ceea ce înseamnă că dispunerea punctelor poate fi aproximată printr-o linie dreaptă. Această supoziție poate fi testată prin construirea unei diagrame de împrăștiere înaintea aplicării unei tehnici statistice. Dacă respectiva corelație nu este liniară, atunci supozițiile nivelului de măsură de interval sau de raport nu sunt satisfăcute, ceea ce înseamnă că variabilele trebuie să fie tratate ca și cum ar fi de nivel ordinal.
Se demonstrează că linia care prezintă cel mai bine corelația dintre două variabile este descrisă de următoarea formulă, numită ecuația de regresie bivariată:
Formula 11.12
în care Y = scor al variabilei dependente
a = punctul în care linia de regresie intersectează axa Y
b = panta liniei de regresie
X = scor al variabilei independente
Parametrul b, numit coeficient de regresie, arată cantitatea de schimbare a lui Y care corespunde unei unități de schimbare a lui X. Panta unei linii de regresie poate fi pozitivă, negativă sau egală cu 0. În cazul b = 0, linia de regresie este paralelă cu abscisa (este orizontală), ceea ce înseamnă că între cele două variabile nu există nici o corelație. Coeficientul de regresie se calculează cu ajutorul următoarei formule:
Formula 11.13
în care n = numărul de cazuri
ΣXY = suma produselor dintre cele două scoruri ale fiecărui caz
ΣX = suma scorurilor variabilei X
ΣY = suma scorurilor variabilei Y
ΣX2 = suma pătratelor scorurilor variabilei X
Pentru determinarea valorii coeficientului de regresie se poate folosi un tabel de calcule, ilustrat aici pentru datele din tabelul 11.9.
Tabelul 11.10 Calcule pentru coeficientul de regresie (b)
Astfel, în exemplul nostru, avem:
Această valoare a parametrului b arată că pentru fiecare unitate de schimbare a lui X, există o creștere de 0,56 unități în privința lui Y. Cu alte cuvinte, o creștere cu o unitate a scorului în privința abilităților de limbaj are drept rezultat o creștere cu 0,56 a scorului în privința abilităților aritmetice.
Parametrul a, numit constanta de regresie, se calculează cu ajutorul următoarei formule:
Formula 11.14
În exemplul nostru, avem:
Această valoare a parametrului a arată că linia de regresie intersectează axa Y (ordonata) în punctul în care Y = 30,8. De notat că a poate fi calculat și cu ajutorul următoarei formule, echivalentă algebric cu formula 11.14:
Formula 11.15
În fine, ecuația de regresie pentru exemplul nostru este:
Linia de regresie poate fi folosită pentru a face predicții asupra scorului unui caz în privința unei variabile, pornind de la scorul celuilalt caz în privința celeilalte variabile. Dacă se folosește variabila X pentru a face predicții despre variabila Y, atunci linia de regresie este denumită regresia lui Y asupra lui X. Pentru ilustrare, să presupunem că, pe baza corelației prezentate în figura 11.1, ne interesează să aflăm scorul în privința abilităților aritmetice al unui elev cu scorul 100 în privința abilităților de limbaj (observați că eșantionul nu conține nici un elev cu scorul 100 la testul privind abilitățile de limbaj). Notăm scorul pe care dorim să în aflăm („scorul prezis”) cu , pentru a-l distinge de scorurile Y efective. Folosind ecuația de regresie din exemplul nostru pentru X = 100, obținem:
Prin urmare, pe baza regresiei lui Y asupra lui X, prezicem că un elev cu scorul 100 în privința abilităților de limbaj va obține scorul 86,8 în privința abilităților aritmetice.
Coeficientul r al lui Pearson este o mărime a corelației lineare dintre două variabile măsurate la nivel de interval sau de raport, care ia valori cuprinse între 0 și 1. Valoarea acestui coeficient poate fi calculată cu ajutorul următoarei formule:
Formula 11.16
Pentru a afla valoarea coeficientului r în cazul exemplului de mai sus, folosim tabelul 11.10, în care am adăugat deja o coloană pentru Y2 și am calculat suma corespunzătoare. Astfel, avem:
Ca și în cazul celorlalți coeficienți ai corelației, valorile coeficientului r diferite de 0 și de 1 nu au o interpretare directă precisă. Valorile apropiate de 0 pot fi interpretate ca indicând o corelație foarte slabă, iar cele care se apropie de 1 ca indicând o corelație foarte puternică. O interpretare mai directă este dată de calcularea coeficientului de determinare bivariată, care este pur și simplu r2. În exemplul nostru, r2 = 0,435. Această valoare arată că scorurile obținute în privința abilităților de limbaj (X) explică aproximativ 43,5% din variația totală a scorurilor obținute în privința abilităților aritmetice, restul de 56,5% din această variație datorându-se probabil influenței altor variabile, erorilor de măsurare sau întâmplării.
În condițiile în care eșantionul respectiv a fost alcătuit aleatoriu, valoarea coeficientului r al lui Pearson poate fi testată pentru semnificația la nivelul populației de referință, distribuția de eșantionare fiind distribuția t cu gl = n – 2. Calcularea statisticii testului se face cu ajutorul următoarei formule:
Formula 11.17
Dacă variabilele sunt corelate la nivelul eșantionului și valoarea lui t (obținut) cade în zona critică, atunci vom respinge ipoteza de nul și vom conchide că variabilele respective sunt corelate și la nivelul populației (cu probabilitatea dată de nivelul α ales); dacă, însă, valoarea lui t (obținut) nu cade în zona critică, atunci nu suntem îndreptățiți să conchidem că variabilele sunt corelate la nivelul populației. Într-un astfel de caz, testul arată că valoarea coeficientului r la nivelul eșantionului poate să apară numai datorită întâmplării, dacă ipoteza de nul este adevărată, i.e. dacă variabilele respective nu sunt corelate la nivelul populației.
Este important de reținut că semnificația valorii coeficientului r poate fi testată cu ajutorul formulei 11.6 numai dacă, pe lângă supozția de linearitate a corelației, este satisfăcută atât supoziția că ambele variabile au o distribuție normală (distribuție bivariată normală), cât și supoziția că abaterile standard ale distribuțiilor condiționate ale variabilei Y sunt aproximativ egale. Pentru această ultimă supoziție se folosește conceptul de homoscedasticitate. În mod obișnuit, inspectarea vizuală a unei diagrame de împrăștiere este suficientă pentru a aprecia dacă o corelație se conformează supozițiilor de linearitate și homoscedasticitate. După cum am arătat, dacă dispunerea punctelor poate fi aproximată printr-o linie dreaptă, atunci corelația poate fi apreciată ca fiind lineară. Pe de altă parte, dacă scorurile Y sunt relativ uniform împrăștiate deasupra și dedesubtul liniei de regresie, atunci corelația este homoscedastică. De pildă, după cum se poate constata imediat, corelația prezentată în figura 11.1 este homoscedastică: din cele 9 cazuri, cinci se află deasupra liniei de regresie, iar patru dedesubt.
11.5 ELEMENTE DE ANALIZĂ MULTIVARIATĂ
Unele situații de cercetare necesită analiza mai multor variabile, chiar dacă cercetătorul este interesat în principal de o anumită corelație bivariată. Tehnicile prezentate în această secțiune se referă la corelația multivariată dintre variabile măsurate la nivel de interval sau de raport și se bazează pe coeficientul r al lui Pearson.
11.5.1 CORELAȚIA PARȚIALĂ
Metoda corelației parțiale poate fi folosită atunci când cercetătorul dorește să observe influența unei a treia (a patra etc.) variabile asupra unei corelații bivariate. În cele ce urmează vom folosi următoarele simboluri, numite coeficienți de corelație parțială de ordinul zero:
ryz = coeficientul de corelație dintre variabila Y și variabila Z
rxy = coeficientul de corelație dintre variabila X și variabila Y
rxz = coeficientul de corelație dintre variabila X și variabila Z
Acești coeficienți se calculează cu formula 11.16, făcând înlocuirile corespunzătoare.
Atunci când controlăm influența unei singure variabile X asupra corelației dintre variabilele Y și Z folosim simbolul ryzx, numit coeficient de corelație parțială de ordinul întâi. ryzx se referă la coeficientul de corelație parțială dintre variabilele Y și Z sub influența variabilei X („variabila de control”). ryzx se calculează cu ajutorul următoarei formule:
Formula 11.18
Pentru ilustrare, să considerăm datele din tabelul 11.11, în care se prezintă distribuția a trei variabile, X, Y și Z, împreună cu valorile parțialilor de ordinul zero. Să presupunem că ne interesează influența variabilei X asupra corelației dintre Y și Z.
Tabelul 11.11 O ilustrare a corelației parțiale
Valoarea ryz = 0,50 indică o corelație pozitivă moderată între variabilele Y și Z. Aplicând formula 11.18, obținem:
Această valoare a coeficientului parțial de ordinul întâi este mult mai mică decât valoarea coeficientului parțial de ordinul zero ryz = 0,50. Acest rezultat, pe care îl vom nota prin ryzx ryz, arată că dacă eliminăm influența variabilei X asupra variabilelor Y și Z, corelația dintre variabilele Y și Z se reduce de la 0,5 la aproape 0. Într-un astfel de caz, se poate ca X să determine atât variația lui Y, cât și variația lui Z, relația dintre Y și Z fiind inautentică (aparentă) sau ca variabilele Y și Z să fie corelate, dar nu direct, ci prin intermediul variabilei X:
sau
În exemplul nostru, valorile rxy = 0,78 și rxz = 0,70 pot fi luate drept un indiciu probabil al tipului de relație reprezentat prin diagrama din stânga. De notat că distincția dintre cele două tipuri de relație nu poate fi făcută cu precizie doar pe baza metodelor statistice. Într-o situație reală de cercetare, distincția se poate face pe criterii de conținut al cercetării respective (ordinea temporală dintre variabile ș.a).
Un al doilea tip de rezultat posibil este acela în care ryzx și ryz au valori apropiate. Acest rezultat, pe care îl vom nota prin ryzx ryz, arată că dacă eliminăm influența variabilei X asupra variabilelor Y și Z, corelația dintre variabilele Y și Z rămâne neschimbată, sau, altfel spus că X nu influențează semnificativ corelația dintre Y și Z, relația dintre variabilele Y și Z fiind directă.
Al treilea tip de rezultat posibil este acela în care valoarea lui ryzx este mult mai mare decât valoarea lui ryz. Acest rezultat, pe care îl vom nota prin ryzx ryz, arată că variabila luată inițial drept independentă și variabila de control (X) au fiecare în parte o influență separată asupra variabilei dependente și nu sunt corelate una cu alta. Următoarea diagramă prezintă acest tip de relație pentru cazul în care Z este variabila dependentă:
Dacă se obține acest rezultat, concluzia este că atât Y, cât și X sunt variabile independente, iar următoarea etapă în analiza statistică este, probabil, utilizarea regresiei multiple și a corelației multiple. Metoda regresiei multiple permite izolarea influențelor separate ale mai multor variabile independente asupra variabilei dependente și astfel permite identificarea variabilei independente care are cea mai puternică influență asupra variabilei dependente, iar metoda corelației multiple permite evidențierea influențelor combinate ale tuturor variabilelor independente asupra variabilei dependente.
11.5.2 REGRESIA MULTIPLĂ
Ecuația de regresie poate fi modificată pentru a include (teoretic) un număr oricât de mare de variabile independente. Această tehnică statistică se numește regresie multiplă. În cazul a două variabile independente, linia de regresie multiplă este descrisă de următoarea formulă, numită ecuația de regresie multiplă:
Formula 11.19
în care b1 = panta parțială a corelației dintre prima variabilă independentă și Y
b2 = panta parțială a corelației dintre a doua variabilă independentă și Y
Parametrii b1 și b2 se calculează cu ajutorul următoarelor formule:
Formula 11.20
Formula 11.21
în care sy = abaterea standard a variabilei Y
s1 = abaterea standard a variabilei independente X1
s2 = abaterea standard a variabilei independente X2
r1y = coeficientul de corelație dintre X1 și Y
r2y = coeficientul de corelație dintre X2 și Y
r12 = coeficientul de corelație dintre X1 și X2
Pentru a ilustra calcularea parametrilor b1 și b2, să considerăm datele din tabelul 11.12, în care, pentru un eșantion de 15 subiecți, se prezintă scorurile obținute înaintea unui test (X1), numărul mediu de răspunsuri corecte date la șase încercări preliminare (X2) și scorurile post-test (Y).
Tabelul 11.12 O ilustrare pentru două variabile independente
Aplicând formulele 11.20 și 11.21, obținem:
Parametrul a se calculează cu ajutorul următoarei formule:
Formula 11.22
În exemplul nostru, avem:
În fine, ecuația de regresie multiplă pentru exemplul nostru este:
Acum, să presupunem că ne interesează să prezicem scorul post-test al unui subiect cu scorul pre-test de 25 și media răspunsurilor corecte la încercările preliminare de11,16. Folosind ecuația de regresie multiplă din exemplul nostru pentru X1 = 25 și X2 = 11,16 obținem:
Prin urmare, prezicem că un subiect cu scorurile X1 = 25 și X2 = 11,16 va obține un scor post-test de 45.
În cele ce urmează prezentăm o modalitate simplificată de utilizare a metodei regresiei multiple pentru evaluarea influențelor separate ale variabilelor dependente asupra variabilei dependente. Pentru o astfel de evaluare se consideră scorurile standardizate ale variabilelor și se utilizează coeficienții de regresie standardizați, simbolizați în general prin β. Aceste mărimi, numite și „pante parțiale standardizate”, arată cantitatea de schimbare a abaterii standard a variabilei Y corespunzătoare unei unități de schimbare a abaterii standard a unei variabile independente, în timp ce influențele celorlalte variabile independente sunt controlate. În cazul a două variabile independente, acești coeficienți se calculează cu ajutorul următoarelor formule:
Formula 11.23
Formula 11.24
în care β1 = panta parțială standardizată a corelației dintre X1 și Y
β2 = panta parțială standardizată a corelației dintre X2 și Y
Ecuația de regresie multiplă standardizată este dată de următoarea formulă:
Formula 11.24
în care simbolul Z arată că toate scorurile au fost standardizate. Amintim că formula de calcul pentru standardizarea scorurilor unui eșantion este
Acum, formula 11.24 poate fi simplificată, întrucât definiția algebrică a parametrului az este și, după cum știm, media aritmetică a oricărei distribuții standardizate de scoruri este 0. Ca atare, az se reduce la 0, astfel că pentru ecuația de regresie multiplă standardizată putem folosi următoarea formulă:
Formula 11.25
Pentru exemplul de mai sus, valorile coeficienților de regresie standardizați sunt:
Astfel, ecuația de regresie multiplă standardizată pentru acest exemplu este:
Concluzia este că variabila X2 are o influență mult mai puternică asupra variabilei dependente decât variabila X1, astfel că predicțiile asupra scorurilor standardizate Zy nu vor fi influențate semnificativ de scorurile Z1.
Inspectarea datelor din tabelul 11.12 oferă unele indicii privind explicația rezultatului obținut. Astfel, putem observa că X2 este puternic corelată cu Y (r2y = 0,77), în timp ce X1 prezintă o corelație slabă până la moderat cu Y (r1y = 0,39).
De notat că dacă am fi obținut β1 β2, am fi tras concluzia că variabila X1 are o influență mult mai puternică asupra variabilei dependente decât variabila X2, iar dacă am fi obținut β1 β2, am fi tras concluzia că cele două variabile independente au aproximativ aceeași influență asupra variabilei dependente.
11.5.3 CORELAȚIA MULTIPLĂ
Metoda corelației multiple permite evidențierea influențelor combinate ale tuturor variabilelor independente asupra variabilei dependente. Pentru aceasta, se calculează coeficientul de corelație multiplă R și coeficientul de determinare multiplă R2.
O formulă de calcul pentru coeficientul R în cazul a două variabile independente este următoarea:
Formula 11.26
Pentru datele din exemplul de mai sus, avem:
Acest rezultat indică o corelație puternică între influențele combinate ale variabilelor X1 și X2 și variabila Y.
Coeficientul de determinare multiplă R2 se interpretează în același fel ca și coeficientul de determinare bivariată r2. În exemplul nostru, R2 = 0,59, ceea ce arată că influența combinată a celor două variabile independente explică aproximativ 59%din variația totală a scorurilor post-test, restul de 41% din această variație datorându-se probabil influenței altor variabile, erorilor de măsurare sau întâmplării.
GLOSAR
Coeficientul d al lui Somer: mărime asimetrică a corelației adecvată pentru cazul a două variabile măsurate la nivel ordinal cu un număr mic de valori.
Coeficientul de contingență C: mărime a corelației bazată pe χ2, adecvată pentru cazul a două variabile măsurate la nivel nominal; se recomandă calcularea acestui coeficient numai pentru tabele de mare dimensiune.
Coeficientul r al lui Pearson: mărime a corelației lineare dintre două variabile măsurate la nivel de interval sau de raport.
Coeficientul V al lui Cramer: mărime a corelației bazată pe χ2, adecvată pentru cazul a două variabile măsurate la nivel nominal; se recomandă calcularea acestui coeficient numai pentru tabele mai mari de 2 2.
Coeficientul γ: mărime simetrică a corelației adecvată pentru cazul a două variabile măsurate la nivel ordinal cu un număr mic de valori.
Coeficientul ρ al lui Spearman: mărime a corelației adecvată pentru cazul a două variabile măsurate la nivel ordinal cu o amplitudine relativ largă de scoruri diferite și puține cazuri legate în privința fiecărei variabile.
Coeficientul τb al lui Kendall: mărime simetrică a corelației adecvată pentru cazul a două variabile măsurate la nivel ordinal cu un număr mic de valori; se recomandă calcularea acestui coeficient numai pentru tabele pătratice.
Coeficientul φ: mărime a corelației bazată pe χ2, adecvată pentru cazul a două variabile măsurate la nivel nominal; se recomandă calcularea acestui coeficient numai pentru tabele 2 2.
Corelație: relație între două sau mai multe variabile; se spune că două variabile sunt corelate dacă distribuția scorurilor uneia dintre acestea se schimbă sub influența scorurilor celeilalte.
Corelație negativă: corelație între două variabile caracterizată prin aceea că scoruri înalte ale unei variabile sunt asociate cu scoruri joase ale celeilalte variabile sau, altfel spus, variabilele variază în sensuri opuse.
Corelație pozitivă: corelație între două variabile caracterizată prin aceea că scoruri înalte ale unei variabile sunt asociate cu scoruri înalte ale celeilalte variabile, iar scoruri joase ale unei variabile sunt asociate cu scoruri joase ale celeilalte variabile sau, altfel spus, variabilele variază în același sens.
Corelație liniară: corelație între două variabile de interval sau de raport caracterizată prin aceea că dispunerea punctelor în diagrama de împrăștiere poate fi aproximată printr-o linie dreaptă.
Corelație perfectă: corelația dintre două variabile caracterizată prin aceea că fiecare scor al unei variabile este asociat cu un singur scor al celeilalte variabile.
Diagrame de împrăștiere: modalități de prezentare vizuală a corelației dintre două variabile măsurate la nivel de interval sau de raport.
Ecuația de regresie bivariată: ecuație care descrie matematic o linie de regresie.
Linie de regresie: linie dreaptă care rezumă cel mai bine corelația dintre două variabile de interval sau de raport.
Mărimile corelației: mărimi statistice care permit cuantificarea importanței (tăriei) unei relații dintre variabile.
Metoda corelației multiple: tehnică multivariată de evidențiere a influențelor combinate ale tuturor variabilelor independente asupra variabilei dependente.
Metoda corelației parțiale: tehnică multivariată de evidențiere a influenței unei a treia (a patra etc.) variabile asupra unei corelații bivariate.
Metoda regresiei multiple: tehnică multivariată care permite izolarea influențelor separate ale mai multor variabile independente asupra variabilei dependente și astfel permite identificarea variabilei independente care are cea mai puternică influență asupra variabilei dependente.
Predicție: apreciere a scorurilor unei variabile pe baza cunoașterii scorurilor în privința altei variabile; o predicție este cu atât mai precisă, cu cât corelația dintre cele două variabile este mai puternică.
EXERCIȚII ȘI PROBLEME
1 INTRODUCERE
1.1 Următorii itemi sunt selectați dintr-o anchetă de opinie publică. Indicați nivelul de măsură pentru fiecare item.
Ocupația dvs. _________
Credeți că, față de orice alt copil, șansele copilului dvs. de a crește în această lume sunt egale, mai mici sau mai mari?
Egale __________ Mai mici __________
Mai mari _______ Nu știu ___________
Ultima formă de învățământ absolvită:
Învățământ obligatoriu __________
Școală profesională ____________
Liceu __________
Școală postliceală ______________
Învățământ superior ____________
Cursuri postuniversitare _________
Dacă vi s-ar cere să folosiți una dintre următoarele denumiri pentru categoria dvs. socială, pe care ați alege-o?
Inferioară __________ Medie __________
Superioară _________ Nu știu _________
Vârsta (în ani împliniți) __________
Când lucrurile nu vă merg bine, cine credeți că poartă vina?
Mai curând eu __________ Mai curând alții __________
Atât alții, cât și eu _______ Nu știu __________
1.2 Descrieți pe scurt o modalitate de măsurare pentru fiecare dintre variabilele din lista de mai jos. Ce nivel de măsură se obține prin modalitatea de măsurare pe care ați ales-o? Există și alte modalități de a măsura variabila, prin care s-ar obține nivele de măsură diferite? Dacă da, specificați care ar fi acestea.
Naționalitate Venit
Înălțime Onestitate
Număr de copii Distanța de la facultate până acasă
Produs Național Brut Număr de medici la mia de locuitori
1.3 În 1972, un grup de cercetători francezi au realizat o cercetare privind mobilitatea sistemului social din Franța. Variabila categorie socioprofesională a fost măsurată după cum urmează: 1. Salariați agricoli, 2. Agricultori, 3. Muncitori și personal de serviciu, 4. Funcționari, 5. Patroni de industrie și comerț, 6. Cadre medii, 7. Cadre superioare. La ce nivel a fost măsurată variabila? Variabila a fost măsurată corect? Dacă nu, indicați erorile comise.
2 PREZENTAREA DATELOR STATISTICE
2.1 Tabelul următor prezintă numărul de studenți înscriși pe domenii de studiu la Universitatea X:
Care este procentul de băieți înscriși la Științe sociale?
Care este proporția de băieți înscriși la Medicină?
Care este proporția de fete înscrise la Științe economice?
Care este procentul de studenți înscriși la științe sociale?
În cazul Științelor juridice, care este raportul dintre numărul de băieți și numărul de fete?
Care este procentul de băieți înscriși la Universitatea X?
Care este raportul dintre numărul de studenți înscriși la Științe juridice față de numărul de studenți înscriși la Științe economice?
Care este raportul dintre numărul de băieți și numărul de fete pe întreaga universitate?
Care este raportul dintre numărul de fete înscrise la Științe economice față de numărul de fete înscrise la Medicină?
Care este proporția de băieți înscriși la Științe inginerești?
2.2 50 de persoane au completat un chestionar care măsoară atitudinea față de violența interpersonală. Respondenții cu scoruri înalte consideră că în multe situații o persoană este îndreptățită să folosească forța fizică împotriva altei persoane. Respondenții cu scoruri joase consideră că în foarte puține situații se justifică folosirea forței fizice împotriva altei persoane. Datele obținute sunt următoarele:
Construiți o distribuție de frecvențe pentru a prezenta aceste date.
Care sunt limitele reale ale intervalelor de clasă?
Adăugați coloane pentru procente, frecvențe cumulate și procente cumulate.
Construiți o histogramă și un poligon de frecvențe pentru aceste date.
Redactați un scurt comentariu asupra acestei distribuții de scoruri.
2.3 Într-un studiu grafologic, a fost făcută o analiză a lungimii cuvintelor folosite de o persoană. Datele obținute sunt următoarele:
Construiți o histogramă, un poligon de frecvențe și o ogivă pentru aceste date.
3 MĂRIMILE TENDINȚEI CENTRALE ȘI ALE DISPERSIEI
3.1 O grupă de 25 de studenți au participat la un test psihologic. Scorurile următoare reprezintă numărul de încercări cerute pentru completarea unui test de memorie:
Calculați media aritmetică, mediana și modul.
Calculați amplitudinea, amplitudinea intercuartilică și abaterea standard.
Calculați, decilele D2 și D9 și percentilele P14 și P21.
3.2 La o testare psihologică au participat 51 de subiecți. În urma aplicării testului matricii progresive RAVEN, au fost înregistrate următoarele rezultate, care reprezintă numărul de erori provenite din potrivirea răspunsurilor în mod incorect în matrice:
Calculați media aritmetică, mediana și abaterea standard pentru aceste date.
3.3 Calculați media aritmetică ponderată a următoarelor două grupe de date:
G1: 9, 6, 8, 8, 1, 1, 3, 3, 6, 5, 1, 5, 7, 8, 3, 5, 2, 3, 6, 8
G2: 7, 5, 1, 4, 7, 4, 2, 4, 2, 5, 5, 6, 6, 7,4, 4, 1, 4
3.4 12 subiecți au participat la un test de inteligență non-verbală – proba de trasaj Thurstone. Următorul tabel prezintă numărul de greșeli înregistrate de fiecare subiect la proba de trasaj liber:
Calculați abaterea medie și coeficientul de variație pentru aceste date.
3.5 Un colectiv de 50 de studenți au luat decizii în legătură cu trei probleme. Prima este cea a materiilor opționale de studiu, unde au avut 5 posibilități de alegere, cea de-a doua problemă este repartizarea pe grupe de lucru la laborator, tot cu 5 opțiuni, a treia problemă fiind studierea limbilor străine, cu 4 posibilități de alegere. Rezultatele deciziilor sunt prezentate în următorul tabel:
Folosiți indicele variației calitative (IQV) pentru a stabili omogenitatea deciziilor în privința celor trei probleme.
3.6 Un grup de 57 de cercetători au avut de ales pentru două domenii distincte D1 și D2 între 4 și 5 teme de cercetare, repartizarea finală fiind următoarea:
Stabiliți domeniul în cadrul căruia s-au întâlnit cele mai mari dificultăți în alegerea temei de cercetare.
4 DISTRIBUȚIA NORMALĂ
4.1Un student a avut de susținut examene la 3 discipline. La primul examen (Filosofia minții) a obținut nota 9, media grupei fiind 8, iar abaterea standard pentru grupă fiind 1,25. La al doilea examen (Introducere în psihologie) a obținut nota 8,75, media grupei fiind 8,50, iar abaterea standard pentru grupă fiind 0,25. La al treilea examen (Statistică psihologică) a obținut nota 8,50, media grupei fiind 8, iar abaterea standard pentru grupă fiind 1. La care din cele 3 discipline studentul a obținut o performanță mai bună?
4.2 Trei persoane cu aproximativ aceeași pregătire profesională s-au prezentat pentru ocuparea a trei posturi diferite la o firmă. Scopul psihologului era de a determina care dintre cei trei era cel mai potrivit pentru fiecare post în parte. Primul post era de responsabil cu imaginea pentru firmă (caracteristica cerută: creativitate), al doilea de responsabil al departamentului tehnic (caracteristica: îndemânare), iar cel de-al treilea de responsabil al departamentului de marketing (caracteristica: dinamism). Subiecții au fost supuși la trei probe distincte, care vizau punerea în evidență a celor trei caracteristici. Următorul tabel prezintă punctajul obținut de fiecare dintre cei trei candidați la cele trei probe:
Stabiliți ordinea aptitudinilor predominante pentru fiecare din cei trei candidați. Pentru care dintre cele trei posturi considerați că ar fi bun fiecare dintre candidați?
4.3În urma unui test de reacție la stimuli, 100 de subiecți au obținut medie aritmetică de 100 ms, cu o abatere standard de 20 ms. Să se calculeze:
Procentul de cazuri cu scoruri mai mari de 140 ms.
Procentul de cazuri cu scoruri mai mici de 140 ms.
Procentul de cazuri cu scoruri cuprinse între 80 ms și 90 ms.
Procentul de cazuri cu scoruri cuprinse între 120 ms și 140 ms.
Exprimați rezultatele obținute și în număr de cazuri.
4.4 La un examen s-au prezentat 80 de candidați, care au obținut o medie a punctajului de 8, abaterea standard fiind 1. Să se calculeze:
Probabilitatea ca un candidat luat la întâmplare să obțină o notă mai mare de 8.
Probabilitatea ca un candidat luat la întâmplare să obțină o notă mai mică de 5.
Probabilitatea ca un subiect luat la întâmplare să obțină o notă situată în intervalul 7 –9?
Dacă într-un caz similar cu cel prezentat în problemă știm că probabilitatea de a obține la examen o notă mai mică de 6 a fost de 0,403, iar media colectivității a fost de 8, care este abaterea standard în acest caz ?
5 EȘANTIONARE ȘI DISTRIBUȚII DE EȘANTIONARE
5.1 Folosiți teorema limitei centrale pentru a descrie distribuția de eșantionare a mediilor aritmetice pentru două eșantioane, n1 = 144 și n2 = 400, selectate aleatoriu dintr-o populație cu media aritmetică a unei caracteristici aproximativ normale μ = 120 și σ = 25.
5.2 Determinați următoarele probabilități pentru eșantionul n1 = 144 din exercițiul 5.1:
a. Pr( 121,4) c. Pr( 120,8)
b. Pr( 118,2) d. Pr( 119,4)
5.3 Determinați următoarele probabilități pentru eșantionul n1 = 400 din exercițiul 5.1:
a. Pr( 121,4) d. Pr( 119,4)
b. Pr( 118,2) e. Pr(119,4 121,4)
c. Pr( 120,8) f. Pr(118,2 120,8)
6 PROCEDURI DE ESTIMARE STATISTICĂ
6.1Într-un studiu privind petrecerea timpului liber, efectuat pe un eșantion de 226 de subiecți, s-a constatat că media aritmetică a numărului de ore/săptămână dedicat vizionării programelor TV este de 6,2, cu o abatere standard de 0,7. La un nivel de încredere de 95%, care este intervalul de încredere estimat pentru media aritmetică a populației de referință?
6.2 Un psiholog dorește să determine scorul mediu la un test standardizat. Psihologul administrează testul pe un eșantion de 250 de subiecți și găsește că scorul mediu al acestui eșantion este de 134,6, cu o abatere standard de 20. La un nivel de încredere de 99%, care este intervalul de încredere estimat pentru media aritmetică a populației de referință?
6.3Dintr-un eșantion de 150 de persoane, 45% au declarat că mersul pe jos este aproape singura activitate fizică efectuată. La un nivel de încredere de 95%, care este intervalul de încredere estimat pentru valoarea corespunzătoare populației de referință?
Date fiind și s = 2,34, calculați și comparați intervalele de încredere estimate pentru n = 150 și n = 10 la un nivel de încredere de 95%.
6.5Care este dimensiunea eșantionului cerută pentru a estima media coeficientului de inteligență a unei populații cu o precizie de 5 unități la un nivel de încredere de 95%?.
7 TESTAREA IPOTEZELOR DESPRE O SINGURĂ POPULAȚIE
Pentru fiecare dintre următoarele ipoteze, specificați în care extremitate a distribuției de eșantionare se află zona critică:
Media coeficientului de inteligență a tuturor studenților din facultățile umaniste este mai mare de 110.
Venitul mediu lunar al rezidenților din orașul X este mai mare de 5000000 de lei.
Greutatea medie a bărbaților născuți în 1956 este mai mică de 90 kg.
Punctajul obținut la examenele de admitere în Baroul de Avocați din ultimii 5 ani este mai mic de 60.
Un psiholog presupune că rezolvarea sarcinilor cerute de un anumit test de creativitate se poate face doar în mai mult de o oră. Pentru a verifica această ipoteză, psihologul alcătuiește un eșantion aleatoriu de 80 de subiecți, le administrează testul respectiv și constată că media timpului de rezolvare a testului este de 50 de minute. Își va modifica psihologul ipoteza la un nivel de încredere de 99%, dacă abaterea standard a populației de referință poate fi estimată a fi de 15 minute?
7.3Un responsabil din Ministerul Învățământului lansează un studiu pilot pentru a stabili dacă micșorarea grupelor de studenți la 15 persoane are drept efect creșterea calității activităților de seminar. Implicația studiului constă în acea că dacă activitățile de seminar desfășurate cu grupe mai mici sunt calitativ superioare celor desfășurate cu grupe mai mari, atunci grupele de studenți vor fi micșorate în întregul învățământ superior. Ce tip de eroare în testarea ipotezei menționate considerați a fi mai gravă? Comentați răspunsul.
7.4250 de subiecți au fost supuși unui test al timpului de reacție și au obținut o medie de 0,92 secunde cu o abatere standard de 0,23 secunde. Testați ipoteza conform căreia media timpului de reacție pentru populația de referință este de o secundă, la un nivel de încredere de 95%.
7.5 Un cercetător presupune că studenții de la facultățile umaniste pot da în medie mai mult de 10 răspunsuri corecte la 20 de întrebări privind istoria universală. Scorurile pentru un eșantion de 14 studenți care au răspuns la un astfel de chestionar sunt următoarele:
Testați ipoteza cercetătorului la un nivel de încredere de 99%.
7.6 Într-un studiu privind timpul de reacție la persoanele afectate de parkinson s-a raportat o medie de 1,6 secunde la o anumită sarcină. Un cercetător presupune că timpul de reacție poate fi redus, dacă se folosește un set de îndrumări de motivare. Pentru a verifica această ipoteză, un cercetător selectează un eșantion de 12 persoane afectate de parkinson și le administrează sarcina respectivă împreună cu setul de îndrumări de motivare. Timpul de reacție pentru cei 12 subiecți este următorul:
Testați ipoteza cercetătorului la un nivel de încredere de 99%.
7.7Un deputat decide să voteze împotriva unei legi numai dacă mai mult de 60% dintre alegătorii din circumscripția sa electorală nu sunt de acord cu legea respectivă. Într-o cercetare asupra 200 de alegători selectați aleatoriu din circumscripția sa electorală, 140 s-au declarat împotriva legii respective. Ce trebuie să facă deputatul? (α = 0,05).
8 TESTAREA IPOTEZELOR DESPRE DIFERENȚELE DINTRE DOUĂ POPULAȚII
8.1Unui eșantion aleatoriu de persoane căsătorite i s-a administrat o scală care măsoară la nivel de interval satisfacția față de viața de familie. Eșantionul a fost împărțit în persoane fără copii și persoane cu cel puțin un copil și s-au calculat mediile aritmetice și abaterile standard pentru ambele grupuri. Rezultatele sunt următoarele:
Există o diferență semnificativă între cele două grupuri în privința satisfacției față de viața de familie? (α = 0,05).
8.2Un număr de 160 piloți ai unei școli de aviație din București se relaxau înainte de zbor printr-o metodă specială, riguros controlată științific, obținând la probele de zbor o medie a notelor de 9,18 cu o abatere standard de 1,15. Stabiliți dacă această metodă este superioară celei de relaxare individuală necontrolată, practicată de 190 de elevi ai unei școli de aviație din Bacău, care au obținut o medie a notelor la probele de zbor de 9,05 cu abaterea standard de 1,25.
8.3 Două universități, una din București și una din Timișoara, au aplicat două metode diferite cu scopul de a îmbunătăți rezultatele studenților la diferite materii de specialitate. În urma aplicării acestor metode, rezultatele înregistrate au fost următoarele:
La un nivel de încredere de 95%, se poate spune că rezultatele obținute prin metoda folosită la UB sunt mai bune decât cele obținute prin metoda folosită la UT?
8.4 Un psiholog industrial este interesat de diferența dintre muncitorii cu productivitate înaltă și cei cu productivitate scăzută în raport cu o serie de factori psihologici. Psihologul selectează eșantioane aleatorii din cele două categorii de muncitori și le administrează o baterie standardizată de teste, rezultatele fiind următoarele:
Productivitate înaltă: 8, 6, 4, 12, 16, 17, 12, 10, 11, 13
Productivitate scăzută: 23, 11, 17, 16, 6, 14, 15, 19
Este semnificativă diferența dintre cele două categorii de muncitori? (α = 0,01).
8.5Un cercetător dorește să determine dacă copii învață mai bine concepte asociate doar cu exemple pozitive sau asociate atât cu exemple pozitive, cât și cu exemple negative. 20 de copii au fost repartizați aleatoriu în două grupuri corespunzătoare celor două condiții experimentale. Scorurile la un test privind formarea conceptelor sunt următoarele:
Există o diferență semnificativă între cele două metode? (α = 0,01).
8.6Într-o cercetare privind efectele anti-anxiolitice a două medicamente, X și Y, s-a constatat că 75 din 100 de persoane tratate cu medicamentul X au prezentat ameliorări ale episoadelor anxioase și din 160 de peroane tratate cu medicamentul Y, 105 au prezentat ameliorări. La un nivel de încredere de 95%, testați dacă diferența dintre cele două tratamente este semnificativă.
9 ANALIZA DE VARIANȚĂ
În termenii modelului în patru pași, formulați testul ANOVA aplicat în secțiunea 9.3 (α = 0,05).
9.2Într-un experiment privind strategiile de rezolvare de probleme, 26 de subiecți sunt repartizați aleatoriu în cinci grupuri, fiecare grup fiind instruit să folosească o anumită strategie. După instruire, subiecților li se dă o listă de probleme de rezolvat cu ajutorul strategiei învățate. Timpul în care subiecții au rezolvat problemele, măsurat în minute, este prezentat în următorul tabel:
Formulați și testați ipoteza de nul corespunzătoare experimentului la un nivel α = 0,05.
9.3Să presupunem că la experimentul menționat în exercițiul 9.2 participă 40 de subiecți, repartizați câte 8 în fiecare grup. Tabelul ANOVA incomplet pentru acest experiment este următorul:
Completați acest tabel și interpretați rezultatul, folosind un nivel α = 0,01.
Un psiholog montează un experiment privind stocarea în memoria de lucru, după cum urmează. 30 de subiecți sunt clasificați aleatoriu în trei grupuri de câte 10 subiecți fiecare. Subiecților din fiecare grup li se prezintă aceeași listă de „cuvinte” fără sens pentru a fi reținute, după care li se distrage atenția printr-o metodă diferită față de metoda folosită în cazul celorlalte două grupuri. După un anumit interval de timp, tuturor subiecților li se cere să-și amintească „cuvintele” reținute, răspunsurile corecte fiind înregistrate sub formă de procente. Datele obținute sunt următoarele:
Stabiliți dacă cele trei metode diferite de distragere a atenției influențează semnificativ memoria de lucru la un nivel α = 0,01. Dar la un nivel α = 0,05?
9.5 Patru eșantioane aleatoare de subiecți voluntari au fost supuse, respectiv, la 0, 24, 48 și 72 de ore de privare de somn, pentru a se verifica efectul lipsei de somn asupra timpului de reacție. Timpul de reacție a fost măsurat pe o scală de la 1 la 10, 10 fiind cel mai rapid timp de reacție. Rezultatele obținute sunt următoarele:
Stabiliți dacă există diferențe semnificative în privința timpului de reacție în funcție de perioada de privare de somn la un nivel α = 0,05.
9.6 Un cercetător studiază performanțele a șase subiecți în cinci încercări privind o anumită sarcină de învățare. Datele obținute sunt următoarele:
Formulați și testați ipoteza de nul corespunzătoare experimentului la un nivel α = 0,01.
9.7 Trei grupe de studenți s-au pregătit pentru susținerea unui examen, învățând în trei moduri diferite .Astfel, prima grupă a învățat în liniște deplină, a doua grupă a învățat cu muzica dată în surdină, iar cea de-a treia a învățat cu un nivel de sonorizare ridicat. La examen s-au înregistrat următoarele rezultate:
Grupa 1: 9, 8, 8,7,8
Grupa 2: 9,8,6
Grupa 3: 9,7,7,6
La un nivel de încredere de 95%, stabiliți dacă rezultatele celor trei grupe diferă semnificativ.
9.8Un eșantion de 10 persoane a participat la un experiment privind o sarcină de învățare (variabila independentă) sub trei condiții experimentale. Datele obținute sunt următoarele:
La un nivel de încredere de 95%, verificați dacă rezultatele obținute sub cele trei condiții experimentale diferă semnificativ.
10 TESTE NONPARAMETRICE
10.1Un cercetător este interesat de posibilele influențe ale statusului marital asupra pregătirii studenților. Un eșantion aleatoriu de 453 de studenți a fost clasificat, pe de o parte în categoriile căsătorit/necăsătorit, pe de altă parte în categoriile bun/mediu/slab. Datele sunt prezentate în următorul tabel:
La un nivel de încredere de 95%, stabiliți dacă nivelul de pregătire al studenților depinde de statusul lor marital.
10.2 Fericirea în viață depinde de statusul marital? Pentru a se răspunde la această întrebare, au fost colectate următoarele date:
Cum ați răspunde la această întrebare la un nivel de încredere de 95%?
10.3Următoarele date au fost obținute în urma unui studiu proiectat să examineze relația dintre statusul marital și modul de petrecere a timpului liber (MPTL):
La un nivel de încredere de 95%, stabiliți dacă cele două variabile sunt independente. Dacă nu, calculați reziduurile standard.
10.4Un cercetător pretinde că 65% din populația adultă a României respinge interzicerea prin lege a avorturilor, precum și că procentul de 65% este același, indiferent de sex sau status marital. Cercetătorul alcătuiește patru eșantioane aleatorii după cum urmează:
100 bărbați căsătoriți
150 femei căsătorite
80 bărbați necăsătoriți
50 femei necăsătorite
Împotriva interzicerii prin lege a avorturilor s-au pronunțat 54 de subiecți din primul eșantion, 102 din cel de-al doilea eșantion, 59 din cel de-al treilea eșantion și 32 din cel de-al patrulea eșantion. La un nivel de încredere de 95%, stabiliți dacă proporțiile observate confirmă ipoteza cercetătorului.
10.5În perioada unei campanii electorale pentru alegeri generale, subiecții dintr-u eșantion aleatoriu de 50 de persoane au fost solicitați să răspundă prin Da sau Nu la întrebarea „Intenționați să votați pentru candidatul X?”. Întrebarea a fost pusă înainte și după ce persoanele din eșantion au vizionat o serie de emisiuni TV în care X și-a prezentat programul. Rezultatele obținute sunt următoarele:
Înainte de vizionare
La un nivel de încredere de 95%, stabiliți dacă este semnificativă diferența dintre persoanele care și-au schimbat opinia de la Da la Nu și cele care și-au schimbat opinia de la Nu la Da.
10.6 Subiecții din două eșantioane aleatorii de câte 10 copii (clasele IIV) au fost evaluați cu ajutorul unei scale de agresivitate de la 25 (foarte agresiv) la 1 (puțin agresiv). Eșantionul 1 este alcătuit din copii singuri la părinți, iar eșantionul 2 din copii care au cel puțin un frate sau o soră. Scorurile obținute sunt următoarele:
Eșantionul 1: 15, 12, 8, 7, 6, 4, 3, 2, 2, 1
Eșantionul 2: 23, 16, 10, 8, 7, 7, 5, 4, 3, 2
La un nivel de încredere de 95%, folosiți testul Mann-Whitney U pentru a stabili dacă există o diferență semnificativă în privința agresivității între copii singuri la părinți și copii care au cel puțin un frate sau o soră (MannWhitney U).
10.7 Un psiholog dorește să știe dacă există o diferență semnificativă între copii de sex masculin și cei de sex feminin în privința nivelului de reacție la stimuli de comunicare non-verbală. Psihologul presupune că fetele vor sesiza mai mulți stimuli și astfel vor obține scoruri mai mici, luând în considerare atât acuratețea, cât și profunzimea interpretării stimulilor. Scorurile obținute de două eșantioane, băieți (1) și fete (2), sunt următoarele:
Eșantionul 1: 26, 25,23, 22, 21, 19, 16, 15, 13, 10
Eșantionul 2: 24, 20, 18, 17, 14, 12, 11, 9, 8, 7
Verificați ipoteza psihologului, folosind testul medianei.
10.8Un cercetător dorește să afle dacă există o diferență pe sexe privind sancționarea actelor considerate a fi necinstite. Pentru aceasta, alcătuiește un eșantion aleatoriu de 12 bărbați (1) și un eșantion aleatoriu de 12 femei (2) și prezintă subiecților din cele două eșantioane câteva scurte descrieri ale unor acte care pot fi considerate necinstite (de pildă, a nu spune vânzătorului sau casierului că suma de bani primită ca rest este mai mare decât cea cuvenită). Fiecare act este apreciat cu ajutorul unei scale, de la 50 (foarte necinstit) la 0 (deloc necinstit):
Eșantionul 1: 47, 44, 40, 35, 32, 31, 30, 29, 25, 24, 20, 12
Eșantionul 2: 48, 45, 43, 42, 39, 36, 33, 28, 23, 21, 15, 14
La un nivel de încredere de 95%, este statistic semnificativă diferența dintre bărbați și femei sub aspectul sancționării actelor considerate a fi necinstite?
10.9 Un eșantion aleatoriu de 12 paciente suferind de anorexie nervoasă au urmat un tratament psihanalitic. Înainte și după tratament, celor 12 paciente le-a fost administrat un test care evidențiază nivelul de încredere în sine. Scorurile pre și post-tratament sunt următoarele (un scor mic reprezintă un nivel scăzut de încredere în sine):
La un nivel de încredere de 99%, există o influență semnificativă a tratamentului psihanalitic asupra nivelului de încredere în sine al pacientelor?
10.10Într-o cercetare privind nivelul de acomodare emoțională a elevilor din învățământul primar în funcție de antecedentele preșcolare, au fost alcătuite patru eșantioane aleatorii după cum urmează: 1. copii de a căror educație s-au ocupat părinții, 2. copii de a căror educație s-au ocupat bunicii, 3. copii care au fost la grădiniță, 4. copii de a căror educație s-a ocupat o baby-sitter. Presupunând că variabila nivel de acomodare emoțională a fost măsurată la nivel ordinal, datele obținute sunt următoarele:
La un nivel de încredere de 95%, stabiliți dacă există diferențe semnificative în privința nivelului de acomodare emoțională în funcție de antecedentele preșcolare.
11 MĂRIMI ALE CORELAȚIEI
11.1 Un psiholog investighează relația dintre statusul marital și nivelul perceput de satisfacție în viață pentru un eșantion de 115 subiecți:
Calculați coeficientul φ pentru aceste date.
11.2 Calculați coeficienții de corelație C și V pentru datele din exercițiul 10.1.
11.3 Un eșantion aleatoriu de studenți au fost clasificați ca „tradiționali” (1823 de ani și necăsătoriți) sau „netradiționali” (cel puțin 24 de ani sau căsătoriți) și, pe de altă parte, ca „vocaționali” (motivația principală pentru studii superioare este practicarea profesiei respective) sau „academici” (motivația principală pentru studii superioare este cariera universitară sau de cercetare științifică). Calculați coeficientul λ pentru datele obținute:
11.4Tabelul următor prezintă scorurile obținute la un test de aptitudini dat la angajare și aprecierile privind eficiența profesională după un an de activitate pentru un eșantion aleatoriu de 75 de salariați ai unei firme:
Sunt corelate cele două variabile? Dacă da, care este tăria și sensul corelației?
Coeficientul de corelație calculat pentru acest eșantion este statistic semnificativ la un nivel de încredere de 95%?.
11.5 Tabelul următor prezintă scorurile obținute în privința variabilelor stare materială și consum de băuturi alcoolice pentru un eșantion de 300 de subiecți:
Calculați coeficienții γ, d și τb pentru acest tabel și interpretați rezultatele obținute.
11.6Tabelul următor prezintă indicele de calitate a vieții și cel de coeziune socială pentru 10 orașe (scorurile mari reprezintă indici înalți în privința ambelor variabile):
Sunt corelate cele două variabile? Dacă da, care este tăria și sensul corelației?
Coeficientul de corelație calculat pentru acest eșantion este statistic semnificativ la un nivel de încredere de 95%?.
11.7 Cinci orașe au fost ordonate în privința indicelui de calitate a vieții și a fost calculat procentul populației care s-a mutat în fiecare oraș în anul precedent. Datele sunt următoarele:
Există o corelație între cele două variabile? Dacă da, care este tăria și sensul corelației?
11.8 Următorul tabel prezintă coeficienții de inteligență pentru un eșantion de 15 elevi și aprecierea subiectivă a unui profesor despre inteligența elevilor din eșantion:
Există o corelație între aprecierea subiectivă a profesorului și coeficienții de inteligență?
11.9 Testați pentru semnificație valoarea coeficientului γ = 0,57 obținută pentru datele din tabelul 11.7.
11.10 Testați pentru semnificație valoarea coeficientului ρs = 0,86 obținută pentru datele
din tabelul 11.8.
11.11 Următoarele valori au fost observate pentru cinci subiecți în privința variabilelor X și Y:
Construiți diagrama de împrăștiere pentru aceste date și apreciați sensul corelației dintre cele două variabile.
11.12 Tabelul următor prezintă scorurile la două teste care măsoară capacitatea de comunicare verbală:
Calculați coeficientul r pentru datele din acest tabel.
Calculați coeficientul r doar pentru primii cinci subiecți.
Comparați rezultatele obținute la punctele a și b și comentați această comparație.
11.13Un cercetător crede că există o corelație între numărul de țigări fumate pe zi și inteligență. Următorul tabel prezintă date strânse pentru un eșantion aleatoriu de 15 fumători. Calculați r și r2 pentru aceste date și comentați rezultatele.
11.14Pentru un eșantion de 12 familii au fost colectate următoarele date privind numărul de copii, numărul de ore pe care soțul le afectează treburilor gospodărești și nivelul de educație al acestuia (măsurat în ani de școală). Datele obținute sunt următoarele:
Construiți diagramele de împrăștiere pentru relația dintre numărul de copii și numărul de ore/săptămână afectat treburilor gospodărești și pentru relația dintre numărul de copii și nivelul de educație.
Determinați ecuația de regresie bivariată pentru relația dintre numărul de copii și numărul de ore/săptămână afectat treburilor gospodărești.
Câte ore/săptămână afectează soțul treburilor gospodărești într-o familie cu 6 copii?
Calculați r și r2 pentru corelația bivariată menționată la punctul b și interpretați rezultatele.
Testați pentru semnificație valoarea coeficientului de corelație parțială de ordinul zero obținut la punctul d la un nivel de încredere de 95%.
Corelația dintre numărul de copii și numărul de ore/săptămână afectat treburilor gospodărești este influențată de nivelul de educație al soțului?
Determinați ecuația de regresie multiplă nestandardizată și stabiliți câte ore/săptămână afectează treburilor gospodărești un soț cu 11 ani de școală într-o familie cu 4 copii.
Determinați ecuația de regresie multiplă standardizată și stabiliți care dintre variabilele independente are o influență mai puternică asupra variabilei dependente.
Calculați R și R2 și interpretați rezultatele.
11.15 Pentru 18 orașe din România au fost colectate următoarele date privind rata delincvenței juvenile (RDJ), procentul de familii intacte (cu ambii părinți), și nivelul mediu de educație al părinților (măsurat în ani de școală). Datele obținute sunt următoarele:
Construiți diagrame de împrăștiere pentru relația dintre nivelul de educație și RDJ și pentru relația dintre procentul de familii intacte și RDJ.
Determinați ecuația de regresie bivariată pentru relația dintre fiecare variabilă independentă și RDJ.
Calculați r și r2 pentru fiecare corelație bivariată și interpretați rezultatele.
Testați pentru semnificație valoarea coeficienților de corelație parțială de ordinul zero obținuți la punctul d la un nivel de încredere de 95%.
Corelația dintre procentul de familii intacte și RDJ este influențată de nivelul de educație?
Determinați ecuația de regresie multiplă nestandardizată și stabiliți RDJ pentru un oraș cu 70% familii intacte și un nivel mediu de educație de 14 ani.
Determinați ecuația de regresie multiplă standardizată și stabiliți care dintre variabilele independente are o influență mai puternică asupra variabilei dependente.
Calculați R și R2 și interpretați rezultatele.
SOLUȚII ȘI INDICAȚII DE REZOLVARE
CAPITOLUL 3
a. ; ; Mo = 14.
b. A = 13; Q = Q3 – Q1 = 14,5 –9,5=5; s = 3,16.
c. D2 = 9; D9 = 16,5; P14 = 8; P21 = 9
Tabelul de calcule pentru mărimile cerute este următorul:
; ; .
IQV1 = 0,971; IQV2 = 0,984; IQV3 = 0,980. Întrucât IQV2 IQV3 IQV1, cea mai mare omogenitate în luarea deciziei a fost întâlnită în privința primei probleme, unde a fost înregistrată cea mai mică valoare pentru indicele variației calitative; mai dificilă decât prima a fost soluționarea celei de-a treia probleme, iar cea mai complexă, conform opțiunilor înregistrate a fost cea de-a doua problemă (cu gradul cel mai mare de eterogenitate în luarea deciziei).
CAPITOLUL 4
Standardizând scorurile obținute la cele trei discipline obținem; Z1 = 0,8; Z2 = 1,0; Z3 = 0,50. Întrucât Z2 Z1 Z3, putem concluziona că studentul a obținut cea mai bună performanță la a doua disciplină de studiu (Introducere în psihologie) iar cea mai slabă la a treia (Statistică psihologică), unde a înregistrat cel mai mic scor standard.
a. 2,3%: aproximativ 2 subiecți au obținut un timp de reacție mai mare de 140 ms.
b. 97,7%: aproximativ 98 de subiecți au obținut un timp de reacție mai mic de 140 ms.
c. 15,03%: aproximativ 15 subiecți au obținut un timp de reacție cuprins între 80 ms și 90 ms.
d. 13,57%: aproximativ 14 subiecți au obținut un timp de reacție cuprins între 120 ms și 140 ms.
CAPITOLUL 5
5.2 a. Pr( 121,4) = 0,2514 c. Pr( 120,8) = 0,6480
b. Pr( 118,2) = 0,1922 d. Pr( 119,4) = 0,6141
CAPITOLUL 6
6.1 .
6.3 .
6.5
CAPITOLUL 7
Gravitatea unui tip de eroare sau a celuilalt depinde de costurile relative ale erorilor. Probabil că o eroare de tipul II este mai gravă aici, deoarece ar conduce la pierderea posibilității de crește a calității activităților de seminar. Pe de altă parte, dacă costul micșorării grupelor de studenți este foarte mare, atunci consecințele unei erori de tipul II pot fi, de asemenea, serioase, deoarece s-ar cheltui foarte mulți bani care, altfel, ar putea fi folosiți pentru îmbunătățirea mediului de predare/învățare.
H0: = 1s; Ha: 1s. Z (obținut) = 5,51. Z/2 (critic) = 1,96. Ipoteza conform căreia media timpului de reacție pentru populația de referință este de o secundă poate fi respinsă la un nivel de încredere de 95%.
7.7 H0: P = 0,60; Ha: P 0,60. Z (critic) = +1,645; Z (obținut) = +3,08. H0 poate fi respinsă la un nivel de încredere de 95%, deci deputatul poate vota împotriva legii respective.
CAPITOLUL 8
H0: μ1 = μ2; Ha: μ1 μ2. Z (obținut) = +5,55. Z/2 (critic) = 1,96. Se poate respinge H0. Diferența dintre cele două grupuri este statistic semnificativă la un nivel de încredere de 95%.
H0: μ1 = μ2; Ha: μ1 μ2. Z (obținut) = +1,031. Z/2 (critic) = 1,96. Nu se poate respinge H0. Mediile înregistrate de piloții celor două școli de aviație nu diferă în mod semnificativ la un nivel de încredere de 95%.
H0: μ1 = μ2; Ha: μ1 μ2. t (obținut) = 0,657. t/2 (critic) = 2,878. Nu se poate respinge H0. Diferența dintre cele două metode nu este statistic semnificativă la un nivel de încredere de 99%.
8.6 H0: P1 = P2; Ha: P1 P2. Z (obținut) = +1,59. Zα/2 (critic) = 1,96. Nu se poate respinge H0. Diferența dintre proporțiile pacienților care au prezentat ameliorări nu este statistic semnificativă la un nivel de încredere de 95%.
CAPITOLUL 9
9.2 H0: μ1 = μ2 = μ3 = μ4 = μ5; Ha: Cel puțin o medie aritmetică diferă de celelalte.
Întrucât F (critic) = 2,84, se poate respinge H0. La nivelul populației, mediile aritmetice ale scorurilor corespunzătoare celor cinci strategii de învățare de probleme diferă semnificativ la un nivel de încredere de 95%
9.3 H0: μ1 = μ2 = μ3 = μ4 = μ5; Ha: Cel puțin o medie aritmetică diferă de celelalte.
Întrucât F (critic) = 2,84, se poate respinge H0 la un nivel de încredere de 99%.
9.8 H0: μ1 = μ2 = μ3; Ha: Cel puțin o medie aritmetică diferă de celelalte.
Întrucât F (critic) = 3,55, Se poate respinge H0. rezultatele obținute sub cele trei condiții experimentale diferă semnificativ la un nivel de încredere de 95%.
CAPITOLUL 10
10.1 H0: Variabilele status marital și nivel de pregătire sunt independente; Ha: Variabilele status marital și nivel de pregătire sunt dependente. χ2 (obținut) = 2,79. χ2 (critic) = 5,991. Nu se poate respinge H0. La un nivel de încredere de 95%, frecvențele observate nu diferă semnificativ de frecvențele la care ne-am aștepta dacă variabilele ar fi independente și ar interveni doar întâmplarea.
10.3 H0: Variabilele status marital și MPTL sunt independente; Ha: Variabilele status marital și MPTL sunt dependente. χ2 (obținut) = 18,389. χ2 (critic) = 12,592. Se poate respinge H0 la un nivel de încredere de 95%. Reziduurile standard:
10.4 H0: Nu există nici o diferență între proporțiile de cazuri pentru eșantioane și proporțiile pentru populație; Ha: Proporțiile de cazuri pentru eșantioane diferă de cele pentru populație. χ2 (obținut) = 3,00. χ2 (critic) = 7,815. Nu se poate respinge H0. Diferențele dintre proporțiile pentru eșantioane și proporția presupusă de 0,65 pot fi atribuite întâmplării. Ipoteza cercetătorului nu se confirmă la un nivel de încredere de 95%.
10.5 H0: Există un număr egal de schimbări în ambele direcții (diferența este nesemnificativă); Ha: Numărul de schimbări într-o direcție este semnificativ diferit față de numărul de schimbări în cealaltă direcție.
χ2 (critic) = 3,841. Se poate respinge H0. Din tabel rezultă că mai multe persoane din eșantion își schimbă opinia de la Nu la Da, decât de la Da la Nu, iar testul arată că această diferență este semnificativă la un nivel de încredere de 95%.
10.7 H0: Nu există nici o diferență între copii de sex masculin și cei de sex feminin în privința nivelului de reacție la stimuli de comunicare non-verbală; Ha: ScoruriF ScoruriM. χ2 (obținut) = 0,80. χ2 (critic) = 2,706. Nu se poate respinge H0 la un nivel de încredere de 95%.
10.8 Obiectivul urmărit este compararea a două populații sub aspectul unei variabile, datele fiind nonparametrice. Eșantioanele aleatorii sunt independente, nivelul de măsură este ordinal, iar cele două eșantioane sunt mici. Prin urmare, se poate folosi testul MannWhitney U pentru eșantioane mici sau testul iterațiilor, ținând cont și de faptul că nu întâlnim scoruri identice în eșantioane diferite.
10.10 Obiectivul urmărit este compararea a 4 populații sub aspectul unei variabile măsurate la nivel ordinal, eșantioanele aleatorii fiind indepentente. Prin urmare, se poate folosi testul KruskalWallis H.
CAPITOLUL 11
11.4 (a) Na = 767; Nd = 491; γ = 0,22. Între cele două variabile există o corelație pozitivă foarte slabă. Testul de aptitudini nu este satisfăcător.
(b) H0: γ = 0,00; Ha: γ 0,00. Z (obținut) = 0,92. Z (critic) = 1,96. Nu se poate respinge H0 la un nivel de încredere de 95%. Valoarea coeficientului γ obținută pentru eșantion nu este statistic semnificativă.
11.6 (a) ρs = 0,59. Între cele două variabile există o corelație negativă moderată. Orașele cu un indice mare al calității vieții tind să aibă un indice mic de coeziune socială.
(b) H0: ρs = 0,00; Ha: ρs 0.00. t (obținut) = 2,056. t (critic) = 2,306. Nu se poate respinge H0 la un nivel de încredere de 95%. Valoarea coeficientului ρs obținută pentru eșantion nu este statistic semnificativă.
11.13 r = 0,22. r2 = 0,048. Corelația dintre numărul de țigări fumate pe zi și inteligență este pozitivă, dar foarte slabă. Doar un foarte mic procent de variație este împărtășit de ambele variabile (aproximativ 5%). Alți factori sunt mult mai importanți în determinarea scorurilor subiecților în privința acestor variabile.
11.14 b. Y = 1,49 + (0,69 X)
c. Într-o familie cu 6 copii, soțul afectează 5,53 ore/săptămână treburilor gospodărești.
d. r = 0,50. r2 = 0,25. Între cele două variabile există o corelație pozitivă moderată. Numărul de copii explică doar 25% din variația totală a numărului de ore afectat treburilor gospodărești de către soți.
e. H0: ρ = 0,00; Ha: ρ 0.00. t (obținut) = 1.83. t (critic) = 2,228. Nu se poate respinge H0 la un nivel de încredere de 95%. Valoarea coeficientului r obținută pentru eșantion nu este statistic semnificativă.
f. . ryzx = 0,43. ryz = 0,50. Întrucât ryzx ryz, nivelul de educație al soțului nu afectează corelația bivariată constatată inițial.
g. Y = 2,5 + (0,65 X1) + (0,07 X2). Un soț cu 11 ani de școală într-o familie cu 4 copii afectează 4,3 ore/săptămână treburilor gospodărești.
h. Zy = (0,46 Z1) + (0,09 Z2). Numărul de copii are o influență mai puternică asupra variabilei dependente decât nivelul de educație al soțului.
i. R = 0,5. R2 = 0,25. Influența combinată a celor două variabile independente explică 25% din variația variabilei dependente.
ANEXA A: Tabelul ariilor de sub curba normală standard
ANEXA B: Tabel cu numere aleatorii
2 3 4 3 9 9 8 5 0 7 3 9 9 1 0 0 0 5 6 0 3 2 6 2 6 1 0 3 8 9
5 4 8 2 4 3 9 8 2 5 4 1 2 5 5 9 2 2 9 2 4 2 7 9 2 4 7 0 4 4
0 8 8 8 7 5 3 4 6 2 2 7 0 6 1 9 1 1 2 4 0 0 8 2 1 0 6 7 3 9
3 6 0 0 9 7 1 6 1 3 5 9 2 9 0 3 9 3 0 7 8 1 3 8 2 9 0 0 6 5
1 1 5 7 9 1 1 8 6 6 2 3 9 8 2 0 7 1 8 4 4 8 7 5 4 2 3 7 3 0
1 5 9 9 9 5 6 9 0 9 6 3 5 2 6 5 8 4 4 2 6 5 0 1 8 6 7 2 1 6
3 5 3 1 3 5 2 5 0 2 2 0 5 4 2 1 8 1 6 1 0 8 1 4 8 2 6 2 7 4
7 1 1 4 5 2 6 4 7 8 5 7 6 5 7 1 1 2 5 9 2 3 7 4 2 1 1 1 3 0
0 1 1 8 2 2 8 8 4 1 6 3 9 2 5 1 6 9 8 7 4 5 4 5 0 0 3 0 2 4
2 4 8 3 0 3 1 9 1 3 9 2 6 9 7 2 1 4 6 4 7 6 2 2 3 2 3 0 5 0
7 0 8 8 4 7 4 4 3 8 6 3 1 3 9 8 2 7 0 0 8 0 1 3 6 3 6 9 9 5
2 3 3 3 7 7 2 6 9 3 5 6 7 5 1 8 1 4 5 4 8 7 6 3 7 0 1 5 4 5
7 2 0 5 2 5 7 0 7 8 6 2 4 4 8 6 1 9 5 7 4 7 3 2 7 0 5 1 3 1
6 3 4 2 3 1 1 9 1 9 8 1 1 3 5 8 3 1 8 5 7 9 7 7 1 4 1 2 9 1
1 3 6 5 6 5 2 0 7 5 7 2 0 7 3 2 6 3 9 5 8 7 2 7 5 9 4 6 6 9
2 8 6 2 6 6 1 5 4 7 7 1 3 2 2 5 2 3 1 8 4 4 2 1 1 2 8 1 6 8
3 6 6 3 3 5 3 0 2 5 0 0 7 5 1 3 1 9 5 1 1 7 7 0 5 6 1 3 9 4
4 0 7 8 2 3 4 0 3 0 4 3 9 0 5 1 7 6 8 6 6 4 3 9 7 7 8 9 9 9
3 2 3 9 4 5 4 5 2 7 4 5 4 1 7 3 3 3 8 4 5 7 1 2 9 6 7 0 0 3
9 3 0 9 8 6 5 0 6 0 3 4 9 2 2 4 0 0 6 2 0 7 7 9 4 1 7 8 6 6
9 8 8 5 8 5 0 2 0 8 5 4 7 8 4 6 0 0 1 2 4 8 8 7 1 5 4 3 7 9
7 7 5 4 9 6 2 9 8 8 9 8 0 7 4 4 1 3 2 6 0 9 2 3 2 6 4 6 3 5
3 1 9 4 5 0 3 2 8 2 2 4 2 3 9 0 8 5 6 2 2 2 7 5 0 7 7 8 0 5
2 5 7 9 4 7 6 1 6 9 0 1 0 9 9 8 9 4 4 3 0 0 1 0 5 6 7 1 2 5
9 7 6 6 4 4 2 6 0 7 7 4 7 2 3 8 0 5 3 6 2 0 4 7 5 2 5 9 9 6
9 0 6 3 0 9 4 6 3 5 1 0 3 5 0 7 0 8 2 4 9 0 2 2 8 9 2 7 5 3
0 5 4 3 6 6 7 3 7 0 2 3 9 2 5 7 6 4 3 9 0 8 3 9 7 5 6 9 5 2
1 9 4 4 3 0 7 0 0 8 2 7 4 4 5 5 3 3 9 0 3 7 9 4 1 8 7 8 5 3
7 9 3 3 1 7 6 9 2 5 4 4 9 5 3 6 6 7 9 0 9 0 2 5 4 1 8 8 5 8
0 0 2 5 7 3 4 0 5 7 7 7 2 2 0 0 4 8 7 5 9 3 3 3 6 8 7 9 4 5
5 4 3 6 1 1 7 4 0 4 2 1 5 6 5 3 6 9 0 0 8 4 1 7 1 8 5 4 6 2
9 2 0 7 0 5 0 4 5 9 4 6 0 4 4 3 4 8 4 1 4 1 3 3 6 2 6 3 5 1
9 4 7 2 7 9 6 3 8 6 4 7 1 0 9 4 5 1 9 3 8 1 4 2 9 8 4 4 9 4
0 7 6 9 0 6 7 8 0 0 7 2 6 7 5 8 9 0 1 2 6 8 1 2 4 7 6 3 4 5
3 2 6 9 7 6 8 9 3 2 4 9 1 1 5 2 5 6 5 5 1 2 6 1 9 7 6 2 3 3
7 6 1 2 1 7 7 2 8 0 0 2 4 4 6 2 7 5 3 9 4 6 4 1 8 2 9 3 0 1
1 0 6 0 8 4 4 9 0 6 6 3 2 4 8 9 2 7 6 9 4 2 8 0 5 5 2 6 4 9
9 5 0 5 8 3 2 1 4 7 4 6 4 9 8 4 5 7 4 6 6 9 1 8 4 0 5 7 5 8
3 8 9 5 7 4 0 5 9 7 8 8 6 1 1 7 7 6 6 4 4 7 7 0 4 0 5 8 5 9
6 7 8 9 9 3 2 9 0 2 2 7 6 5 1 2 3 9 7 1 3 8 9 3 8 9 7 3 4 7
1 4 0 1 2 1 9 7 9 3 0 1 1 1 4 1 8 7 7 7 8 2 5 1 7 0 5 6 9 5
0 0 5 2 7 7 8 7 4 8 1 2 8 0 7 5 4 5 6 6 7 1 5 0 3 9 9 3 2 2
1 1 3 3 2 5 4 1 8 5 2 4 0 7 7 7 7 4 5 3 2 1 4 3 5 0 3 7 1 5
9 4 2 8 5 9 2 2 3 0 5 0 2 4 9 1 0 4 3 9 7 4 5 4 7 0 9 9 7 4
9 7 5 4 3 9 8 1 5 3 3 1 7 3 6 2 9 6 8 8 2 0 0 1 5 7 1 7 4 7
6 1 7 1 3 5 5 2 7 4 8 3 1 1 8 7 4 8 1 3 2 2 4 4 4 6 2 9 7 9
4 0 1 7 5 4 8 5 0 7 9 7 2 1 8 3 5 7 0 0 5 2 3 9 5 5 9 1 3 1
5 1 8 4 7 0 2 5 7 7 8 4 2 9 5 7 0 2 6 3 7 5 9 8 8 3 5 2 9 9
8 2 0 9 5 4 0 6 0 3 5 3 6 6 2 6 3 5 8 1 3 5 4 1 6 1 1 1 9 2
9 1 3 3 0 6 9 9 1 5 5 0 0 0 2 2 6 5 3 9 2 2 9 3 2 2 0 7 3 6
7 1 8 4 7 3 6 5 0 2 8 1 1 1 4 0 2 9 2 3 1 0 5 0 4 7 0 5 2 3
3 6 0 3 2 3 2 7 9 9 2 0 6 8 7 2 7 3 1 3 2 9 7 8 1 3 2 9 0 4
0 8 2 2 6 4 4 7 2 3 5 2 3 9 7 0 3 9 8 4 2 4 2 9 4 0 4 9 9 0
7 0 7 7 8 9 2 7 3 4 4 3 0 5 7 3 0 7 9 7 8 2 3 4 9 4 5 9 1 6
0 7 3 7 4 3 1 1 8 7 0 9 2 2 9 4 3 3 2 6 4 9 1 4 2 7 8 2 3 8
5 8 8 5 3 7 2 1 0 1 8 1 0 4 2 2 6 4 9 3 4 9 8 9 0 0 1 3 8 9
2 5 6 0 7 7 6 3 0 9 2 6 4 4 0 0 1 5 4 8 2 8 8 3 8 3 7 1 2 9
8 7 9 0 2 1 6 1 1 7 4 7 0 3 8 5 6 6 3 9 8 7 8 6 7 6 3 6 0 8
0 3 4 7 4 3 6 7 0 2 6 4 7 2 9 5 6 5 0 4 2 9 7 2 9 3 7 9 3 6
3 7 3 5 0 9 0 0 6 9 7 8 6 9 2 2 6 1 6 9 5 7 3 2 0 4 3 2 3 1
1 5 9 9 7 5 5 7 8 6 1 2 5 7 7 2 0 2 6 5 7 9 4 3 2 0 7 7 8 7
7 0 8 0 1 3 9 5 6 4 7 0 5 2 7 2 0 0 0 8 7 0 9 4 7 4 8 6 0 2
6 6 2 6 6 3 7 2 6 2 6 2 2 8 0 4 9 9 2 2 4 8 8 5 8 7 0 3 0 9
5 9 9 0 6 1 0 8 5 2 8 2 5 4 1 0 5 2 6 7 0 5 9 1 2 1 8 0 4 6
6 7 8 8 5 8 0 1 0 7 7 5 2 9 3 3 2 8 1 4 7 2 9 9 0 0 5 8 7 3
2 7 1 5 3 8 2 9 5 6 5 8 0 7 1 4 2 0 6 2 7 6 2 8 1 5 7 1 1 1
1 5 9 8 0 0 8 5 1 7 9 2 2 6 2 2 1 8 3 5 3 5 4 2 3 7 1 9 0 2
7 2 7 0 7 3 1 5 3 5 9 3 3 4 5 4 7 6 6 4 9 5 9 9 0 7 6 1 6 1
0 5 9 2 2 4 4 2 4 5 7 0 7 7 7 6 7 0 7 0 9 2 1 2 9 6 7 9 2 5
6 3 9 1 2 7 2 1 0 8 8 4 7 9 9 3 4 6 0 0 5 1 2 7 3 4 0 9 1 0
ANEXA C: Tabelul valorilor critice ale distribuției t
ANEXA D: Tabelul valorilor critice ale distribuției F
α = 0.10
α = 0.05
α = 0.025
α = 0.01
ANEXA E: Tabelul valorilor critice ale distribuției χ2
ANEXA F: Tabelul valorilor critice pentru testul MannWhitney U
ANEXA G: Tabelul valorilor critice pentru testul Wilcoxon T
ANEXA H: Tabelul valorilor critice pentru ρs
ANEXA I: Ghid de utilizare a principalelor tehnici statistice
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Statistica Psihologica Si Prelucrarea Informatica a Datelor (ID: 166295)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
