▪ oferă noțiuni, explica ții și aplicații pentru a în țelege și opera eficient cu pr ogramul SPSS 10.0 în scopul prelucr ării statistice a datelor…. [631276]

SCOPUL UNIT ĂȚII DE CURS
▪ oferă noțiuni, explica ții și aplicații pentru a în țelege și opera eficient cu pr ogramul SPSS 10.0 în
scopul prelucr ării statistice a datelor.

OBIECTIVE OPERA ȚIONALE
În urma studierii acestei unit ăți de curs, studen ții:
▪ vor putea s ă definească variabilele și să conceapă o bază de date adecvat ă;
▪ vor redefini și transforma variabile;
▪ vor prelucra datele statistice la nivel descriptiv;
▪ vor realiza analiza corela țională a datelor și vor interpreta rezultatele ob ținute;
▪ vor folosi testul t p entru compararea unui e șantion cu o popula ție și a două eșantioane (perechi sau
independente) și vor interpreta rezultatele ob ținute;
▪ vor utiliza analiza de varian ță pentru analiza efectulu i unui singur factor și vor interpreta rezultatele
obținute;
▪ vor utiliza analiza de varian ță pentru analiza efectelor de interac țiune;
▪ vor utiliza metode non-parametrice de analiz ă a datelor.

EVALUARE
▪ 40% din nota final ă examen practic care presupune prelucrarea și interpretarea datelor;
▪ 60% din nota final ă evaluările de pe parcursul seminariilor, care vor presupune prelucr ări și analize
statistice ale datelor.

OBSERVAȚIE !!!
Cursul nu epuizeaz ă opțiunile programului SPSS și nu supline ște lipsa informa țiilor statistice teoretice.

ANALIZA COMPUTERIZAT Ă A DATELOR

251

I. FAMILIARIZAREA CU PROGRAMUL SPSS 10.0

I.1. TIPURI DE VARIABILE . DIFERENȚA DINTRE VARIABILE , VALORI ȘI SCORURI

Variabile sunt definite ca propriet ăți ale fenomenelor, obiectelor sau proceselor, care pot lua
diferite valori. Exist ă mai multe criterii în func ție de care se pot clasifica variabilele: dup ă natura măsurii
variabilele pot fi: cantitative (variază cantitativ, cum ar fi de exem plu greutatea sau vârsta subiec ților)
sau calitative (sunt cele care variaz ă calitativ, cum ar fi genul sau etnia subiec ților); după felul varia ției,
variabilele pot fi: continui (teoretic pot lua or ice valoarea, între dou ă valori ale variabilei putând s ă apară
o a treia valoare; vârsta subiec ților este un exemplu de variabil ă continuă) sau discrete (pot avea numai
anumite valori, între care nu mai apar altele; relig ia, tipurile temperamentale sunt exemple de variabile
discontinui); dup ă scopul folosirii lor în studii experimentale: independente (sunt variabilele manipulate
de experimentator și care se presupune c ă influențează variabila dependent ă) sau dependente
(reprezintă răspunsurile subiec ților).
O variabilă poate lua diferite valori. Valoarea reprezint ă o măsură calitativă sau cantitativ ă a
unui fenomen. Spre exemplu, pentru variabila “nota școlară” valorile acesteia sunt toate notele de la 1 la
10. Pentru variabila “zilele s ăptămânii” valorile sunt toate cele șapte zile ale s ăptămânii. În psihologie se
face distinc ția între valori și scoruri . Scorul este valoarea ob ținută de o persoan ă, fenomen sau obiect
atunci când ne referim la o anume variabil ă. Spre exemplu, nota pe care o ob ține un elev la o materie
(să zicem 7) reprezint ă scorul subiectului la variabila “nota școlară”.

I.2. PREZENTAREA APLICA ȚIEI SPSS

SPSS (în traducere Pachet statistic pentru științele sociale ) este numele unui pachet de
programe care ajut ă la analiza datelor ob ținute în cercet ările din domeniul științelor sociale.
Deschiderea programului se poate face cu ajutorul mous e-ului, cu dublu-click asupra
pictogramei programului
de pe desktop. Aplica ția mai poate fi deschis ă de la butonul
START/PROGRAME, op țiunea SPSS FOR WINDOWS, ca în imaginea de mai jos:

Oricare ar fi metoda de deschider e a programului, pe ecran va ap ărea următoarea fereastr ă:

LOREDANA GHERASIM

252

Prima bară din partea de sus a ferestrei ofer ă informații despre denumirea aplica ției și numele
fișierului cu care se lucreaz ă. Urmează bara de meniuri a programului și cea cu butoane.
Foia cu date este organizat ă tabelar. Întotdeauna coloanele tabelului reprezint ă variabilele
studiului, în timp ce liniile, rândurile numerotate ale tabelului reprezint ă subiecții cercetării. În partea de
jos a ferestrei sunt dou ă opțiuni: DATA VIEW și VARIABLE VIEW. Putem vizualiza datele brute ale
subiecților, dacă este activă opțiunea DATA VIEW sau putem vizualiz a descrierea variabilelor introduse
în baza de date, dac ă este
activată op țiunea
VARIABLE VIEW. De obicei,
atunci când deschidem programul, este activ ă
opțiunea DATA VIEW, cum se
poate observa și în imaginea
de mai sus. Printr-un simplu click stânga pe op țiunea
VARIABLE VIEW, pe ecran apare un alt tabel care permite definirea variabilelor din baza de date:

Din meniul FILE putem al ege comanda deschidere a unei
noi baze de date (op țiunea NEW DATA) sau a unei noi foi de
rezultate (NEW OUTPUT):
Acest program prezint ă rezultatele prelucr ărilor
statistice într-o pagin ă separată, numită OUTPUT. Comenzile
care sunt colorate în gri sunt comenzi inactive pentru c ă baza de
date nu con ține, deocamdat ă, nici o informa ție.
Din acest meniu putem deschide, folosind op țiunea
OPEN, o baz ă de date care a fost creat ă anterior (DATA) sau un
fișier cu rezultatele prelucr ărilor statistice anteriore (OUTPUT).

ANALIZA COMPUTERIZAT Ă A DATELOR

253 Comanda SAVE permite salvarea obi șnuită a fișierului cu
date sau cu rezultate, comanda SAVE AS permite salvarea unui
fișier modificându-i numele. Op țiunile RECENTLY USED DATA și
RECENTLY USED FILES deschid bazele de date și foile cu
rezultate recent create sau utilizate în programul SPSS.
Din meniul EDIT, comenzile COPY, CUT și PASTE sunt
folosite pentru copierea sau mutar ea datelor din celule, rânduri sau
coloane. Copierea sau mutarea datelor presupune selectarea
datelor, activarea comenzii COPY/CUT din meniul EDIT, plasarea
cursorului în noua loca ție și apoi activarea comenzii PASTE.

I.3. DESCHIDEREA UNEI BAZE DE DATE

Pentru deschiderea unei baze de da te create anterior se activeaz ă meniul FILE/OPEN op țiunea
DATA. Dup ă activarea comenzii
pe ecran apare o caset ă de
dialog care permite selectarea directorului și respectiv fi șierului
care conține baza de date. Vom
deschide fi șierul opinii.sav (în
aplicația SPSS, fi șierele cu
baze de date au întotdeauna extensia sav) care se g ăsește la
adresa
C:\MY DOCUMENTS\EXEMPLE
SPSS . În momentul înc ărcării
bazei de date pe ecran va
apărea următoarea imagine:
Valorile din baza de
date reprezint ă răspunsurile brute ale subiec ților. Pe coloane sunt definite variabilele. În aceast ă bază
de date avem pe coloan ă variabile
(ca de exemplu, gr_mult, prezent, viitor, directie, guv, parlam), valorile numerice din fiecare coloan ă
reprezentând scorurile subiec ților la
aceste variabile. Rândurile con țin
răspunsurile subiec ților la diferi ți
itemi. De exemplu, subiectul de pe rândul 9 are valoare 3 la variabila
gr_mult, valoarea 3 la variabila
prezent, 4 la variabila viitor etc.
Pentru a vedea ce înseamn ă
fiecare dintre aceste variabile trebuie activată opțiunea VARIABLE VIEW:

LOREDANA GHERASIM

254Variabilele sunt a șezate pe rânduri, coloan ele reprezentând diferite caracteristici ale
variabilelor. De exemplu, vari abila gr_mult este o variabil ă de tip numeric, cu 20 de caractere la partea
întreaga și 0 zecimale, reprezentând itemul „ Cât de mul țumit sunte ți în general de felul în care tr ăiți?”.
I.4.
CREAREA UNEI NOI BAZE DE DATE
Pentru a crea o nou ă bază de date trebuie activat ă opțiunea DATA VIEW. Vom crea o baza de
date care s ă conțină rezultatele la anxietate ob ținute de un num ăr de subiec ți, înainte și după intervenția
terapeutică (anxietatea a fost m ăsurată cu ajutorul unei scale de anxietate). La studiu au participat
subiecți de gen feminin și masculin. Baza de date va con ține patru variabile: num ărul subiecților (nrsub),
nivelul anxiet ății subiecților înaintea terapiei (ANX1) și nivelul
anxietății subiecților după terapie (ANX2) și genul subiec ților
(1-subiecți de gen masculin și 2-subiecți de gen feminin).
Pentru introducerea datelor se plaseaz ă cursorul în
celulă și se introduce valoarea cu ajutorul tastelor. Spre
exemplificare, vom introduce prima valoare (1) a primei
variabile. Dup ă introducerea primei valo ri automat programul
a denumit prima variabil ă (var0001), iar indicativul primei linii
devine activ.

La fel se vor introduce și celelalte valori ale primei variabile. Pentru a utiliza cu u șurință datele
este indicat ă definirea sau redenumirea va riabilelor cu care lucr ăm.
Definirea variabilelor presupune activarea câ mpului VARIABLE VIEW, prin executarea unui
dublu click pe numele variabilei (în cazul nostru var 0001) sau prin activarea butonului VA RIABLE VIEW
din partea de jos a câmpului. Rezultatul va fi urm ătorul:

Numele variabilei poate s ă cuprindă maxim opt caractere, f ără spațiu sau semne de
punctuație. Pentru a defini o variabil ă, trebuie plasat cursorul în celula în care este trecut numele
(NAME) generic al variabilei (var0001), apoi se intr oduce numele variabilei NRSU B folosind tastatura.
Opțiunea TYPE permite specificarea tipului de date. Aceast ă opțiune poate fi activat ă cu
ajutorul mouse-ului cu un click st ânga pe butonul gri din celula corespunz ătoare variabilei.

ANALIZA COMPUTERIZAT Ă A DATELOR

255

Tipul NUMERIC permite intr oducerea valorilor cu sau f ără zecimale. Tipurile COMMA și DOT
permit introducerea valo rilor cu orice num ăr de zecimale (mai mare de 16), re ținând întreaga valoare.
Tipul SCIENTIFIC NOTATION transform ă logaritmic valorile introduse, DATE permite folosirea spa țiilor,
punctelor, virgulelor, a barelor de separ area pentru a delimita zilele, lunile și anii, respectiv orele și
minutele. Tipul DOLLAR insereaz ă în fața valorilor simbolul dolarul ui, iar CUSTOM CURRENCY permite
introducerea de valorilor pozitive dar și a celor negative, cu sau f ără separator pentru mii. Ultima op țiune
STRING permite introducerea variabilelor alfanumerice.
Este posibil ă alegerea num ărului de cifre pentru partea întreag ă (WIDTH) și a numărului de
zecimale (DECIMAL PLACES). De și sunt mai multe tipuri de variab ile, în psihologie se utilizeaz ă două
tipuri de variabile, NUMERIC și STRING (foarte rar). Automat la crearea unei noi baze de date, apare
selectat tipul NUMERIC, presupunându-se c ă noile variabile vor fi numerice. Op țiunea TYPE este de
obicei folosit ă pentru modifica acest tip de date.
Caracteristica LABELS pe rmite definirea detaliat ă a variabilei (pot fi folosite pân ă la maxim 256
caractere, inclusiv spa țiul). Definirea detaliat ă a variabilei apare în pagina de rezultate.
VALUE LABEL permite descrierea valor ile pe care le poate lua o variabil ă. Opțiunea este
folosită pentru variabile care folosesc coduri numerice pen tru a reprezenta categorii (de exemplu, se pot
folosi valorile 1 și 2 pentru a codifica genul feminin și masculin).
MISSING VALUES permite stabilirea valorilor care nu vor fi luate în seam ă la prelucrarea
datelor.
COLUMN permite specificarea num ărului de caractere pentru o coloan ă, afectând vizualizarea
datelor.
ALIGNMENT permite modificarea modului în care sunt prezentate datele pe ecran, aliniate la
stânga, dreapta sau central.
În exemplu nostru, vom def ini numele variabilei NRSUB și vom detalia eticheta la op țiunea
LABEL ca în imaginea de mai jos:

Vom introduce valorile și vom defini și următoarele variabile, ANX1, ANX2 și Gen. Variabila Gen
este de tip categorial, în func ție de aceast ă caracteristic ă subiecții fiind împ ărțiți în două categorii
distincte, femei și bărbați. Din acest motiv trebuie precizat ă semnifica ția valorilor variabilei. Acest lucru
presupune atribuirea de valori și etichete celor dou ă grupuri de subiec ți. Astfel, subiec ții de sex masculin
îi vom codifica cu valoarea 1, iar pe cei de gen feminin cu valoarea 2. În acest scop vom activa op țiunea
VALUE:

LOREDANA GHERASIM

256

Se trece valoarea în câmpul VALUE și numele grupului sau cat egoriei în câmpul VALUE
LABEL, dup ă care se apas ă butonul ADD. Astfel, vom scrie „1” în câmpul VALUE și „subiecți de gen
masculin” în câmpul VALUE LABEL și activăm butonul ADD, apoi vom scrie „2” în câmpul VALUE și
„subiecți de gen feminin” în câmpul VALUE LABEL și activăm butonul ADD.

Se activeaz ă butonul OK pentru a salva modific ările și închide caseta de dialog.

Această opțiune se folose ște numai pentru variabilele categoriale, care împart subiec ții în
grupuri distincte.

Salvarea fi șierelor se face fie ac ționând butonul SAVE care se g ăsește în bara de instrumente,
fie din meniul FILE se alege op țiunea SAVE. Reamintim c ă trebuie ales mai întâi directorul în care
vream să salvăm fișierul si apoi scriem numele fi șierului. Vom salva fi șierul cu numele Baza1.sav în
subdirectorul EXEMPLE SPSS care se g ăsește în directorul MY DOCUMENTS.

ANALIZA COMPUTERIZAT Ă A DATELOR

257

II. ELEMENTE DE STATISTIC Ă DESCRIPTIV Ă

II.1. ANALIZA FRECVEN ȚELOR
Tabelele de frecven ță ajută la descrierea unui grup de scoruri , fiind cele mai simple procedee
ale statisticii descriptive, care permit în țelegerea tendin ței unui grup de scoruri. Tabelele de frecven ța
grupează scorurile subiec ților, informa ția devenind, astfel, mai comprehensibil ă. Histogramele,
reprezentări grafice ale tabelelor de frecven ță permit o mai bun ă înțelegere a tendin ței grupului de
rezultate. Acestea presupun transfo rmarea intervalelor de frecven ță în bare, în ălțimea barelor
corespunzând frecven ței fiecărui interval de frecven ță din tabelul de frecven ță. Poligoanele de frecven ță
sunt o altă modalitate de reprezentare grafic ă a datelor din tabelele de frecven ță. Acestea se ob țin, prin
unirea mijloacelor p ărților superioare ale barelor histogramelor.
Tabelul de frecven ță, histograma și poligonul de frecven ță descriu o distribu ție de frecven ță,
prezentând modul în care se distribuie sau se împr ăștie cazurile sau frecven țele. Modalitatea, înclinarea
și turtirea sunt indicatori care descriu forma distribu ție scorurilor. Modalitatea indic ă câte “vârfuri” are o
distribuție, cu alte cuvinte, arat ă valorile în jurul c ărora se grupeaz ă rezultatele subiec ților. Din aceast
ă
perspectivă, distribuțiile pot fi unimodale (au un si ngur vârf), bimodale (au dou ă vârfuri) sau multimodale
(au mai multe vârfuri). Înclinarea arat ă dacă în distribu ție apar mai multe valori mari sau mai multe valori
mici. Cele mai multe aspecte m ăsurate în psihologie prezint ă un număr aproximativ egal de cazuri de o
parte și de alta a mijlocului, distribu țiile fiind aproximativ simetrice (nu prezint ă tendință de înclinare). O
distribuție este înclinat ă atunci când are o extrem ă (o parte) mai împr ăștiată și mai lungă. Atunci când
curba este înclinat ă spre dreapta, distribu ția este înclinat ă pozitiv, iar când curba este înclinat ă spre
stânga, distribu ția este înclinat ă negativ. Spre exemplu, notele școlare au o distribu ție înclinată spre
dreapta, adic ă elevii au tendin ța de a obține mai multe note mari. Turtirea unei distribu ții se raporteaz ă
la curba normal ă. Față de curba normal ă o distribuție poate fi mai turtit ă (scorurile din cadrul ei variaz ă
foarte mult de la medie) sau mai ascu țită (scorurile variaz ă foarte puțin de la medie).

Analiza de frecven ță cu ajutorul programului SPSS
Opțiunea FREQUENCIES permite r ealizarea tabelului de frecven ță și a distribu ției de frecven ță
a rezultatelor. Aceasta se g ăsește la meniul ANALYZE –
DESCRIPTIVE STATIASTICS:

LOREDANA GHERASIM

258După activarea op țiunii pe ecran apare urm ătoarea caset ă de dialog:
În câmpul din stânga al casetei
FREQUENCIES sunt afi șate toate variabilele
din baza de date, în ordinea introducerii lor în baza de date, împreun ă cu denumirea extins ă
a variabilei. Câmpul din dreapta reprezint ă
câmpul de analiz ă. Astfel, analiza statistic ă se
realizează doar pentru variabi lele trecute în
acest câmp. Trecerea variabilelor în câmpul de analiză se realizeaz ă cu ajutorul butonului cu
săgeată care se g ăsește între câmpuri. Se
selectează din câmpul din stânga va riabila pe care vrem s ă analizăm apoi se activeaz ă butonul de
trecere. Acest mod de organizare în dou ă câmpuri apare la aproape toate op țiunile de prelucrare a
datelor.
Bifarea op țiunii DISPLAY FREQUECY T ABLES are ca efect afi șarea în foaia de rezultate a
tabelul de frecven ță. Opțiunea STATISTICS deschide o fereastr ă cu opțiuni de prelucrare statistic ă,
butonul CHARTS permite afi șarea histogramei de frecven ță. Opțiunea FORMAT permite modificarea
formei de prezentare a datelor în foia cu rezultate (OUTPUT).
Pentru exemplul nostru, dorim
realizarea tabelului de frecven ță și
histogramei pentru variabila „nivelul anxietății înainte de terapie” (ANX1). Se
selectează variabila ANX1 din câmpul din
stânga ș
i se activeaz ă butonul de trecere:
Pentru ca în foaia de rezultate s ă
apară tabelul de frecven ță se selecteaz ă
opțiunea DISPLAY FREQUECY TABLES. Pentru afi șarea histogramei de frecven ță se activeaz ă
butonul CHARTS:

Opțiunea CHART TYPE permite alegerea unu i tip de grafic (cu bare, pl ăcintă sau histogram ă).
CHART VALUES permite alegerea tipului de valori afi șate în grafic (Frecven țe sau Procentaje).
Pentru exemplul nostru se selecteaz ă opțiunea HISTOGRAMS, se bifeaz ă afișarea curbei
normale (WITH NORMAL CURVE), apoi se activeaz ă butonul CONTINUE.
Opțiunea FORMAT permite modificarea formei OU TPUT-ului. Activarea acestui buton are ca
efect apari ția următoarei casete de dialog:

ANALIZA COMPUTERIZAT Ă A DATELOR

259

Câmpul din stânga al ferestrei con ține opțiuni de aranjare a rezu ltatelor (în ordine
descrescătoare sau cresc ătoare a valorilor sau cantit ăților), iar cel din dreapta con ține opțiuni de
prezentare comparativ ă a rezultatelor și de organizare separat ă a foii de rezultate, pentru fiecare
variabilă. Pentru exemplu nostru, vom p ăstra opțiunile selectate automat.
După selectarea op țiunilor de realizare a tabelului de frecven ță și histogramei, se activeaz ă
butonul OK al casetei FREQUENCIES. Pe ecr an apare o fereastra cu rezultate, numit ă OUTPUT:

Fereastra OUPUT este organizat ă în două câmpuri, cel din stânga, afi șează structura sau
cuprinsul OUPUT-ului, iar cel din dreapta arat ă conținutul foii cu rezultate. Re zultatele sunt organizate în
două tabele. În primul tabel se precizeaz ă numărul de subiec ți și numărul de răspunsuri. Pentru
exemplul nostru, avem 20 de subiec ți care au răspuns la chestionar (nu lipse ște nici o valoare).
Al doilea tabel este organizat în cinci coloane. Co loana VALID prezint ă valorile variabilei,
prezentate în ordine cresc ătoare (fără a ține seama de cazurile lips ă). Coloana FREQUENCY prezint ă
frecvența, adică numărul de subiec ți care obțin o anumit ă valoare.
Coloana PERCENT transform ă frecvența obținută pentru fiecare valoare în procentaj ținând
cont de num ărul total de subiec ți luați în calcul, indiferent dac ă aceștia au sau nu scoruri la aceast ă
variabilă. Spre exemplu, doi subiec ți au obținut scorul 103, ceea ce reprezint ă 10% din totalul num ărului
de răspunsuri ob ținute. VALID PERCENT prezint ă procentajul luând în calcul doar subiec ții care au
răspuns la aceast ă variabilă. În cazul nostru coloanele PERCENT și VALID PERCENT sunt identice
deoarece to ți subiecții au scoruri la aceast ă variabilă. Dacă unii subiec ți nu ar fi răspuns la chestionarul
de anxietate, atunci cele dou ă coloane ar fi con ținut valori diferite.
Coloana CUMULATIVE PERCENT prezint ă procentajul cumulat, de la cel mai mic scor la pân ă
la cel mai mare. De exemplu, 60% dintre subiec ți au note mai mici sau egale cu 106.
Derulând pagina cu rezultate sau select ând HISTOGRAM în câmpul din stânga, putem
vizualiza reprezentarea grafic ă a frecvenței scorurilor:

LOREDANA GHERASIM

260

Histograma de frecven ță se mai poate ob ține folosind meniul GRAPHS – HISTOGRAM.
Activarea op țiunii duce la apari ția următoarei casete de dialog:

Elementele principale ale ferestrei sunt:
1. câmpul în care sunt prezentat e toate variabilele din baza de date
2. câmpul în care se introduce variabila pentru care dorim s ă realizăm histograma de frecven ță
3. selectarea acestei op țiuni va duce la afi șarea curbei normal ă de distribu ție a rezultatelor.
Pentru exemplificare introducem variabila ANX1, cu ajutorul butonului cu s ăgeată, în câmpul
VARIABLE și bifăm opțiunea DISPLAY NORMAL CURVE. Se ob ține aceeași reprezentare grafic ă ca și
în cazul folosirii butonului CHART al ferestrei FREQUENCIES.
Vizualizarea ferestrei OUTPUT sau DATE (baza1.sav) se poate face
folosind meniul WINDOW, marcând op țiunea dorit ă (baza de date sau foaia
de rezultate):

II.2.
IDENTIFICAREA TENDIN ȚEI CENTRALE ȘI A VARIABILIT ĂȚII SCORURILOR
Metodele descriptive pent ru identificarea tendin ței centrale și de împrăștiere indică tendința
centrală a unui grup de scoruri, folosind ca indicatori media, mediana și modul și tendința de împrăștiere
a grupului de scoruri, folosi nd ca indicatori varian ța și abaterea standard.
Media aritmetic ă descrie tendin ța centrală într-un grup de rezultate, arat ă valoarea tipic ă,
reprezentativ ă a unui grup de scoruri. Media este punctul fa ță de care scorurile sunt egal dep ărtate,
deoarece abaterile de la medie într-o direc ție (abaterile scorurilor mici de la medie) sunt egale cu 1 2
3

ANALIZA COMPUTERIZAT Ă A DATELOR

261abaterile în cealalt ă direcție (abaterile scorurilor mari de la medie). Mediana împarte distribu ția în două
părți egale, jum ătate dintre scorurile distribu ție având valori mai mici ca mediana, iar cealalt ă jumătate
valori mai mari. Modul reprezint ă valoarea cu frecven ța cea mai mare. Este indicatorul care este cel mai
puțin afectat de schimb ările structurii (modific ări ale num ărului de scoruri sau m ărimii scorurilor
distribuției). Mediana este și ea destul de pu țin afectată de modific ările structurii distribu ției. Media, îns ă,
este cea mai “sensibil ă” la modificarea num ărului de scoruri sau m ărimii scorurilor, fiind indicatorul cel
mai descriptiv (deoarece indic ă orice modificare survenit ă în distribu ție). Se recomand ă utilizarea mediei
în distribuțiile simetrice și unimodale. Mediana și modulul, care sunt mai stabile sunt recomandate
pentru descrierea distribu țiilor asimetrice și multimodale. Cu toate acestea, media aritmetic ă rămâne
metoda cel mai des utilizat ă pentru descrierea tendin ței grupului de scoruri, acest indicator intrând în
componen ța multor metodele statistice. Exist ă însă metode statistice (cum a fi testele neparametrice) în
care se utilizeaz ă doar mediana și modul.
Cunoașterea acestor indicatori nu este suficient ă pentru a descrie complet o distribu ție. Trebuie
să cunoaștem gradul de variabilitate a scorurilor noastre. Mai precis, trebuie s ă știm cât de mult (sau cu
cât) se împr ăștie scorurile în jurul valorii medii.
Varianța (SD2=(∑(X-M)2/N) unei distribu ții arată cât de “împr ăștiate” sunt scorurile în jurul
valorii centrale, indic ă gradul de variabilitate a unui grup de rezultate. Este o m ăsură a gradului de
variabilitate a scorurilor și arată cât de mult se abat sco rurile de la tendin ța centrală. Cu cât este mai
mare aceast ă valoare, cu atât mai mult se împr ăștie scorurile în jurul valorii centrale. Pentru a cunoa ște
exact cu cât variază scorurile în medie este nevoie s ă calculăm deviația standard. Abat erea standard ne
arată cu cât se împr ăștie scorurile în jurul valorii centrale și se măsoară în aceleași unități de măsură ca
și scorurile ini țial. Abaterea standard este r ădăcina pătrată a varianței (SD =2SD ).
În intervalul cuprins între medie și o abatere standard la stânga și dreapta mediei g ăsim
aproximativ 2/3 din totalul scorurilor. Aceste rezultate sunt considerate tipice sau normale pentru o
distribuție. Ilustrăm grafic acest lucru:
Scorurile care sunt mai mari decât media cu o abatere standard sunt considerare scoruri mari
iar cele mai mici decât media cu mai mult de o abater e standard sunt considerate ca fiind scoruri slabe.
Calculul tendin ței centrale și a variabilit ății folosind SPSS
Meniul din SPSS care permite calculul indicatorilor tendin ței centrale și ai împrăștierii se
găsește la ANALYZE – DESCRIPTIVE STATIS TICS – FREQUENCIES. Pentru analiz ă vom folosi baza
de date realizat ă anterior, „Baza1.sav”.
Vom calcula parametrii tendin ței centrale și ai variabilit ății pentru variabila ANX1 (nivelul
anxietății înaintea terapiei). Se trece variabila în câmpul din dreapta apoi se activeaz ă butonul
STATISTICS. Dup ă cum se poate vede și în imaginea de mai jos, caset ă de dialog care se deschide
cuprinde patru câmpuri cu op țiuni: m m-SD m+SD
scoruri medii, tipice, normale scoruri mici scoruri mari

LOREDANA GHERASIM

262

Câmpul PERCENTILE VALUES con ține opțiuni care permit calculul valorilor corespunz ătoare
împărțirii subiecților în grupuri egale, prin afi șarea valorilor care delimiteaz ă aceste grupuri. Aceast ă
opțiune permite calculul cuartilelor (QUARTILES) sau altor cuartile (de exemplu CUT POINTS FOR 10
EQUAL GROUPS) sau centile (PERCENTILE).
Opțiunile din câmpul DISPERSIO N permit calcularea diferi ților parametri referitori la dispersia
(împrăștierea) scorurilor în jurul valorii centra le: abatere standard (STD. DEVIATION), varian ță
(VARIANCE), amplitudine (RANGE ), valori minime (MINIMUM) și maxime (MAXIMUM) și eroare
standard (S.E. MEAN care reprezint ă abaterea standard a distribu ții tuturor mediilor posibile calculate
pentru eșantioane aleatoare repetate).
CENTRAL TENDENCY con ține opțiunile folosite pentru ca lculul indicatorilor tendin ței centrale
ale distribu ției: media (MEAN), medi ana (MEDIAN), mod (MODE) și suma valorilor seriei (SUM).
Câmpul DISTRIBUTION ofer ă posibilitatea afl ării indicatorilor de turtire (KURTOSIS) și înclinare
ai unei distribu ții în compara ție cu cea normal ă (SKEWNESS).
Pentru exemplu nostru ne intereseaz ă calculul parametrilor tendin ței centrale ai distribu ției și de
împrăștiere. În consecin ță se bifeaz ă (cu un simplu click stânga al mouse-ului) op țiunile MEAN,
MEDIAN, MODE din câmpul CENTRAL TENDENCY și opțiunile STD DEVIATION și VARIANCE din
câmpul DISPERSION:

Activăm butonul CONTINUE și apoi cel OK al casetei FREQUENCIES. Valorile indicatorilor
sunt grupate în tabelul Statistics:

ANALIZA COMPUTERIZAT Ă A DATELOR

263

Astfel, M=107,90, Med=105,5, Mod=104, ceea ce însemn ă că distribuția este unimodal ă (apare
o singură valoare la mod) și ușor înclinată spre dreapta spre valorile mai mari ale variabilei (valoarea
mediei este mai mare decât a medianei). Reprezentarea grafic ă indică apariția unui singur vârf
(distribuție unimodal ă) și o alungire și împrăștiere a extremei drepte a distribu ției (distribu ție înclinată
spre dreapta).

La fel se calculeaz ă indicatorii tendin ței centrale și de împrăștiere pentru variabila ANX2 (nivelul
anxietății subiecților după terapie). Rezultatele ob ținute sunt urm ătoarele:

Astfel, M=107,95, Med=109,5, Mod=102, Mod=110 (a doua valoare a modul se extrage din
tabelul de frecven ță). Distribuția scorurilor este bimodal ă (apar dou ă valori cu frecven ța cea mai mare)
și înclinată spre valorile mici ale variabilei (media este mai mic ă decât mediana). Distribu ția scorurilor
subiecților la aceast ă variabilă indică aceeași formă.

LOREDANA GHERASIM

264

Comparând reprezent ările histogramele de frecven ță pentru variabilele ANX1 și ANX2, putem
analiza variabilitatea rezultatelor la cele dou ă variabile. Astfel, distribu ția scorurilor pentru prima
variabilă este mai ascu țită, valorile fiind mai grupate în jurul medie ( și varianța și abaterea standard au
valori mai mici). La variabila ANX2 se constat ă o mai mare variabilitate a rezultatelor, distribu ția fiind
mai turtită (în acest caz varian ța și abaterea standard au valori mai mari).

II.3. SCORURILE Z
Nota Z indic ă deviația unui scor (x) de la medie (m) exprimat ă în deviații standard. Nota
standard Z arat ă cu câte devia ții standard se abate un scor de la medie (Z=(X-M)/SD). Distribu ția în
note Z este o distribu ție ideală în care media are întotdeauna valo area 0, iar abaterea standard valoarea
1.
Schema de mai jos prezint ă notele standard Z corespunz ătoare mediei și limitelor de varia ție
maximă și minimă. Mediei îi corespunde întotdeauna mereu sco rul standard 0, limitei minime de varia ție
tipică îi corespunde scorul standard -1, iar limitei maxime de varia ție normală îi corespunde nota
standard +1.
Aceasta distribu ție ne permite s ă stabilim cum este scorul x în raport cu media (care este 0) și
abaterea standard (care ar e valoarea 1). Trebuie ținut seama de o serie de reguli. Astfel, un scor x
raportat la distribu ția Z este considerat “mic”, dac ă scorul său Z are valoare mai mic ă decât –1; un scor
x este considerat “mediu” dac ă scorul său Z este cuprins în inte rvalul [–1, +1]; un scor x este considerat
“mare” raportat la distribu ția Z, dacă scorul său
Z va fi mai mare decât +1.
Scorurile Z îndeplinesc o serie de func ții. Permit compararea unui scor cu o distribu ție la care
cunoaștem parametrii (media și deviația standard), astfel, ne ajut ă să precizăm dacă un scor este mic,
mediu sau mare. De asemenea, notele Z arată de câte ori acel scor este mai mare sau mai mic decât
media (ținând cont de variabilitate). Spre exemplu, dac ă scorurile la un test de inteligen ță într-o
populația sunt descrise de media m=100 și deviația standard SD=15, o persoan ă cu scorul brut 130
este „de dou ă ori mai de șteptă ca media celorlal ți”, deoarece acestui scor îi corespunde un scor Z de +2
(ceea ce înseamn ă că scorul este mai mare ca media cu dou ă deviații standard). O alt ă funcție a notelor
z este aceea c ă permit compararea scorurilor ob ținute de aceea și persoană la probe diferite , întrucât
notele Z arată raporturi și sunt adimensionale (nu depind de ceea ce m ăsurăm). m m-SD m+SD
scoruri medii, tipice normale x
Z 0 +1 -1 scoruri”mari” scoruri”mici”

ANALIZA COMPUTERIZAT Ă A DATELOR

265Calculul notelor Z folosind SPSS
Comanda DESCRIPTIVES care se g ăsește în meniul ANALYZE – DESCRIPTIVE
STATISTICS, permite calculul notelor Z cu ajutorul SPSS. Vom folosi baza de date creat ă anterior
(„Baza1.sav”).

Activarea comenzii duce la apari ția pe ecran a casetei de dialog urm ătoare:

Prezent ăm principalele elemente ale ferestrei DESCRIPTIVES:
1. câmpul în care sunt prezentate variabilele din baza de date 2. câmpul în care se introduc variabilele care vor fi analizate 3. opțiunea SAVE STANDARDIZED VALUES AS VARIABLES permite salvarea în baza de date
a scorurilor standard sub forma unei noi variabile.
4. cuprinde op țiuni de calcul ai parametrilor distribu ției.
Pentru exemplificare, vom calcula notele Z pentru variabila ANX1. Se bifeaz ă opțiunea SAVE
STANDARDIZED VALUES AS VARIABLES. Se activeaz ă butonul OPTIONS, care deschide
următoarea fereastr ă:

Automat sunt selectate de computer op țiunile de calcul al mediei, abaterii standard și al valorii
minime și maxime. Vom activa butonul CONTINUE și apoi butonul OK al ferestrei pentru a putea face 1
3 2
4

LOREDANA GHERASIM

266analiza statistic ă. Rezultatele ob ținute în urma comenzii DESCRIPTIVES sunt mai sumare și prezentate
într-un singur tabel.

Vom vizualiza baza de date pentru a vedea dac ă apare noua variabil ă care conține rezultatele
subiecților transformate în note Z.

Se observă apariția unei noi variabile, pe ultima coloan ă, cu numele ZANX1.
Putem analiza rezultatele ob ținute. Se constat ă că cel mai mare scor z este 2,6 care
corespunde unui scor standard 124 ob ținută de subiectul 15, iar cea mai mic ă valoare la anxietate a
obținut-o subiectul 8, care are un scor z–0,98 pentru o valoare brut ă de 102. Scorul primului subiect
este atipic, nivelul anxiet ății acestuia fiind de 2 ori și jumătate mai mare decât media, ceea ce semnific ă
faptul că subiectul are un nivel ridicat al anxiet ății raportat la ceilal ți subiecți. Subiectul al doilea are un
nivel normal al anxiet ății, rezultatul fiind aproape cu o unitate ma i mic decât media, dar plasându-se în
limita (–1 – +1).
II.4.
COEFICIENTUL DE CORELA ȚIE PEARSON

Notele Z fac posibil ă analiza legăturii dintre două variabile. De exemplu, putem analiza leg ătura
dintre nivelul stre sului unui manager și numărul de subordona ți. Prin transformarea notelor brute
obținute de subiec ți la cele dou ă variabile putem s ă identificăm dacă exista sau nu o leg ătură între
aceste dou ă variabile.
Corelația este o metod ă statistică descriptivă, întrucât ea descrie ce se petrece într-un grup de
rezultate (r =( NZZ /)2*1(∑ ). Corelația indică existența unei leg ături între variabile, leg ătură care
poate fi pozitiv ă (când scorurile slabe la prima variabil ă se asociaz ă cu scoruri slabe la a doua variabil ă,
scorurile medii la prima variabil ă se asociaz ă cu scoruri medii la a doua variabil ă și scorurile mari la

ANALIZA COMPUTERIZAT Ă A DATELOR

267prima variabil ă se asociaz ă cu scoruri mari la a doua variabil ă), negativă (când scorurile slabe la prima
variabilă se asociaz ă cu scoruri mari la a doua variabil ă, scorurile medii la prima variabil ă se asociaz ă
cu scoruri medii la a doua variabil ă și scorurile mari la prima variabil ă se asociaz ă cu scoruri mici la a
doua variabil ă). Bineînțeles că între variabile poate s ă nu apară nici o legătură.
Coeficientul de corela ție (r) indică gradul în care apare paternul unei rela ții între cele dou ă
variabile. Acest coeficient poate l ua valori de la -1 la +1, corela ția pozitivă poate lua valori de la 0 la 1,
iar corelația negativă poate lua valori la de -1 la 0.
Analiza corela ției dintre dou ă variabile nu permite stabilirea rela ției de cauzalitate între aceste
variabile. Exist ă trei modalit ăți de interpretare a unui coeficient de corela ție obținut între dou ă variabile
(x și y): fie x poate fi cauz ă pentru y, fie y poate fi cauz ă pentru x, fie a apărut a o treia variabil ă care a
determinat apari ția simultan ă a celor doua variabile.
Pragul de semnifica ție (p)
În psihologie este necesar ă generalizarea concluziile studiilor. Astfel, dup ă analiza rezultatelor
corelației ne intereseaz ă să vedem dac ă legătura găsită (la un grup de oameni) poate fi extins ă la
întreaga popula ție. Mai precis, ne intereseaz ă să știm în ce m ăsură rezultatele se datoreaz ă întâmplării.
Pragul de semnifica ție, p, indică în ce măsură ne înșelăm atunci când afirm ăm ceva. În cazul corela ției,
pragul de semnifica ție, indică dacă există o legătură între două sau mai multe variabile.
În cercetarea științifică se lucreaz ă de obicei cu dou ă praguri de semnifica ție, corespunz ătoare
procentajului de eroare: pragul de 0,01 (1% eroare) ș
i pragul de 0,05 (5% eroare). În general, când se
fac predicții pot să apară patru situa ții, prezentate în tabelul de mai jos:

Evenimentul
Apare Nu apare
Apare Corect Eroarea I Predicția
Evenimentului Nu apare Eroarea II Corect

Sunt două situații în care se poate gre și: când afirm ăm că un eveniment se va produce și în
realitate acesta nu va ap ărea (eroare de tip I) sau când afirm ăm că un eveniment nu se va produce și
aceste va apare (Eroare de tip II). Situa ția I corespunde minciunii, iar situa ția II corespunde ignoran ței.
Dacă vrem să evităm primul tip de gre șeală care are consecin țe mai grave (de a demonstra ceva ce nu
există în realitate), alegem pragul de semnifica ție de 0,010 (prag de eroare de 1%). Dac ă dorim însă să
avem mai multe șanse în a demonstra ceva și consecințele nu sunt grave în caz de gre șeală, atunci se
preferă pragul de eroare de 5% (deci un p=0,050). În conc luzie, vom considera un test statistic ca fiind
semnificativ dac ă pragul de semnifica ție este mai mic sau cel mult egal cu valoarea 0,050.
În psihologie se lucreaz ă cu două modalități de formulare a ipotezelor (non-direc ționale sau
direcțional). Ipotezele non-direc ționale sunt cele în care nu se precizeaz ă tipul de rela ție dintre variabile.
În testarea acestor ipoteze probabilitatea de eroare de 1% sau 5% se împarte la cele extremit ăți (cozi)
ale distribu ției scorurilor. Testul de semnifica ție pentru verificarea acestui tip de ipotez ă este
TWO-TAILED. În cazul nostru ipoteza ar putea fi formulat ă non-direcțional astfel: exist ă o legătură între
salariul ini țial și final al subiec ților. Ipotezele direc ționale sunt cele în care se precizeaz ă tipul de
modificare, cercet ătorul se a șteaptă la un anumit rezultat. Pentru aceste ipoteze probabilitatea de
eroare se stabile ște la una dintre extremit ățile distribu ției. Testul de semnifica ție pentru verificarea
acestui tip de ipotez ă este ONE-TAILED. Ipoteza din ex emplul nostru ar putea fi formulat ă direcțional,

LOREDANA GHERASIM

268astfel: legătura dintre salariul ini țial și final este pozitiv ă, cu cât salariul ini țial este mai mare cu atât și
salariul final va fi mai mare.

Calcularea corela ției Pearson cu ajutorul SPSS
Pentru a calcula acest coeficient de corela ție cu ajutorul aplica ției SPSS vom crea o nou baz ă
de date “Baza2.sav”, care va cuprinde 3 vari abile: STUDII (nivelul de studii al subiec ților) cu trei valori 1
(studii generale), 2 (studii medii) și 3 (studii superioare), Sal_in (salariul ini țial al subiec ților) și sal_fin
(salariul final al subiec ților). aceste variabile au urm ătoarele valori:
• studii:1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3
• sal_in: 189, 198, 197, 168, 201, 185, 156, 175, 201, 220, 210, 214, 205, 301, 332, 341, 221,
206, 298, 301, 654, 214, 258, 245
• sal_fin: 201, 220, 205, 203, 185, 168, 178, 260, 280, 274, 298, 305, 582, 542, 392, 445, 401,
502, 403, 954, 425, 725, 625, 199 Pentru calculul corela ției se activeaz ă opțiunea BIVARIATE din meniul ANALIZE-
CORRELATE:

Activarea comenzii va deschide urm ătoarea fereastr ă:

Elementele principale ale ferestrei sunt:
1. câmpul care prezint ă lista variabilelor din baza de date;
2. câmpul de analiz ă, unde se introduc variabilele ce vor fi analizate; se pot introduce mai multe
variabile, calculatorul afi șând corela țiile între variabilele luate dou ă câte două;
3. în câmpul CORRELATION COEFFI CIENTS se alege tipul de corela ție: coeficientul Pearson
se folosește pentru date parametrice (variabile cantitative și continui), coeficien ții KENDALL și
SPEARMAN se folosesc pentru date categoriale și ordinale. 1 2
3
4
5 5

ANALIZA COMPUTERIZAT Ă A DATELOR

2694. câmpul TEST OF SEGNIFICA NCE permite selectar ea modului de testate a ipotezei (TWO-
TAILED sau ONE-TAILED); de obicei se folose ște pragul TWO-TAILED în testarea ipotezelor de
cercetare cu ajutorul SPSS.
5. opțiunea FLAG SIGNIFICANCE CORR ELATIONS are ca efect apari ția unui asterisc (*) în
dreptul corela țiilor semnificative;
6. butonul OPTIONS este urmat de apari ția unei casete de dialog.

Aceasta permite realizarea unei analize descriptive a datelor (STATISTICS) și precizarea
modalității de tratament a datelor lips ă MISSING VALUES, pr in excluderea din analiz ă a perechilor de
rezultate în care avem doar una dintre valori (EXCLUDE CASES PAIRWISE) sau de a exclude din
analiză un rând întreg dac ă doar una dintre valori lipse ște (EXCLUDE CASES LISTWISE). Se
recomandă utilizarea primei variante selectat ă implicit.
Pentru baza de date creat ă vom analiza leg ătura dintre variabilele salariu ini țial și final al
subiecților. Vom introduce variabilele SAL_INI și SAL_FIN în câmpul din dreapta.

Coeficientul de corela ție Pearson este selectat implicit de c ătre calculator, la fel ca și celelalte
opțiuni test de semnifica ție TWO-TAILED și marcarea cu asterisc a corela țiilor semnificative FLAG
SIGNIFICANCE CORRELATIONS. Dup ă activarea butonului OK, în foaia OUTPUT sunt afi șate
următoarele rezultate:

LOREDANA GHERASIM

270

Se observă că cele două variabile apar pe coloane da și pe linii.
Pe rândul 1 – PEARSON CORRELATION se g ăsesc valorile coeficien ților de corela ție dintre
două variabile
Pe rândul 2 – SIG. (2-TAILED) apare probabilitatea de eroare la respingerea ipotezei de nul și
acceptare a ipotezei de cercetare
Rândul 3 – N con ține numărul de subiec ți care au scoruri la ambele variabile
În tabel apare leg ătura dintre fiecare variabil ă și ea însăși (ANX1 și ANX1 și respectiv între
ANX2 și ANX2) dar și legătura dintre cele dou ă variabile (între ANX1 și ANX2 dar și între ANX2 și
ANX1).
Prima celul ă din stânga (notat ă cu 4) prezint ă coeficientul de corela ție între variabila salariul
inițial și salariul ini țial (ANX1 și ANX1). Între o variabil ă și ea însăși apare o corela ție perfect pozitiv ă
(r=1,0), dar lipsit ă de semnifica ție (nu apare nici un prag de semnifica ție). Acest coeficient de corela ție
nu aduce nici un fel de informa ție și în consecin ță nu se analizeaz ă. La fel nu se analizeaz ă corelația
dintre variabila salariul final și salariul final (ANX2 și ANX2).
În celula din dreapta sus apare coeficientul de corela ție dintre salariul ini țial și salariul final
(ANX1 și ANX2), semnifica ția acestuia și numărul de perechi de scoruri. Acela și rezultate apar și în
celula din stânga jos care prezint ă coeficientul de corela ție dintre salariul final și salariul ini țial (ANX2 și
ANX1). Rezultatele sunt identice deoarece corela ție este bidirec țională (corelația dintre variabilele A și B
este acela și lucru cu cea dintre variabilele B și A). În consecin ță rezultatul poate fi extras din oricare din
cele două celule.
Vom extrage datele pentru leg ătura dintre salariul ini țial și salariul final al subiec ților:
Interpretarea corela ției: r=0,81 (coeficientul de corela ție), p<0,001 (pragul de semnifica ție), N=24
(numărul de subiec ți).
Sunt mai multe elemente de care trebuie s ă se țină seama în interpretarea corela ției:
• semnul corela ției: arată natura leg ăturii care exist ă pozitive (dac ă semnul este pozitiv) sau
negative (dac ă semnul este negativ). În cazul nostru, semnul este pozitiv, ceea ce înseamn ă că un salar
inițial mic se asociaz ă, după cinci ani, cu un salariu tot mic, un salar ini țial mediu se asociaz ă cu un
salar final mediu și un salar mare ini țial se asociaz ă cu salariu mare final.
• mărimea absolut ă a coeficientului : descrie t ăria legăturii care apare între variabile. Se
consideră, astfel, că legătura este slab ă dacă valoarea absolut ă a lui r nu dep ășește 0,30, leg ătura este
medie la o valoare a lui r cuprins ă între 0,30-0,50, leg ăturile puternice având o m ărime absolut ă mai 1 2
3 4
5

ANALIZA COMPUTERIZAT Ă A DATELOR

271mare de 0,50. În exemplul nostru, t ăria legăturii este ridicat ă (r=0,81) coeficientul având valoare mi
mare de 0,50
• pragul de semnifica ție dacă este mai mic de 0,05, atunci putem considera c ă există o relație
între variabilele studiate. În exemplu nost ru, valoarea este 0,000. În aceste situa ții se raporteaz ă un
p<0,001, pentru a ar ăta că probabilitatea de a gre și este mai mic ă decât 0,1% (calculatorul ne afi șează
doar primele trei zecimale). Putem spune c ă există o legătură semnificativ ă între nivelul ini țial și final al
salariului subiec ților, pragul de semnifica ție fiind mai mic de 0,05.
• proporția de varian ță. Coeficientul de corela ție ridicat la p ătrat ne indic ă proporția de varian ță
explicată de relația găsită. Proporția de varian ță indică la ce procent din popula ția general ă apare
relația. Pentru exemplu nostru propor ția de varian ță are valoarea 0,65 (r=0,81, deci r2=0,65). Se
observă că abia 65% din varia ția observat ă se întâlne ște în realitate, deci rela ția găsită este prezent ă la
65% dintre subiec ți.
Toate aceste elemente trebuie să apară în interpretare, pentru ca ea s ă fie complet ă.

Comanda SELECT CASES
Uneori este necesar ă selectarea anumitor cazuri din popula ție pentru a face o prelucrare
statistică. Spre exemplu, vrem s ă vedem dac ă legătura dintre salariul ini țial și salariul final are aceea și
valoare la subiec ții care au studii generale. Subiec ții sunt împ ărțiți în grupe în func ție de nivelul de studii
(studii), fiind codifica ți cu 1 în baza de date.
Pentru a selecta numai subiec ții care au studii generale, se folose ște comanda SELECT
CASES din meniul DATA. Acti varea meniului este urmat ă de apariția următoarei ferestre:

În câmpul din stânga al ferestrei sunt prezentate toate variabilele din ba za de date. În dreapta
ferestrei apar mai multe op țiuni. Pe noi ne intereseaz ă opțiunea IF CONDITION IS SATISFIED,
deoarece vrem s ă selectăm numai cazurile care îndeplinesc o anumit ă condiție (să aibă valoarea 1 la
variabila studii adic ă să fie numai subiec ți cu studii generale).
Această opțiune se alege cu un simplu click stânga al mouse-ului:

Se activeaz ă butonul IF, care deschide urm ătoarea caset ă de dialog:

LOREDANA GHERASIM

272

Se selecteaz ă variabila în func ție de cre se face selec ția și se trece în câmpul dintre dreapta
sus. În cazul nostru se selecteaz ă variabila STUDII și se trece în câmpul din dreapta:

Se adăugă condiția. Pentru exemplul nostru, variabila Studii trebuie s ă aibă numai valoarea 1
(STUDII=1). Se poate folosi tastatura sau se pot activa butoanele cu cifre și semne ce se g ăsesc sub
acest câmp. Condi ția va arăta astfel:

Se apasă apoi butonul CONTINUE pentru a salva condi ția:

Se activeaz ă butonul OK, baza de date modificâ ndu-se, cum se poate observa și în imaginea
de mai jos:

ANALIZA COMPUTERIZAT Ă A DATELOR

273

La sfârșitul bazei de date apare o nou ă variabilă, intitulată FILTER_$, care indic ă rezultatul
selecției. Cazurile neselectate sunt “t ăiate”, adică ele vor fi ignorate de la analiz ă. În partea din dreapta-
jos a ecranului apare anun țul FILTER ON, care avertizeaz ă utilizatorul cu privire la activarea unei
comanzi de selec ție

Atenție! Selectarea datelor nu implic ă și efectuarea analizei statistice . După selecție
trebuie făcută prelucrarea statistic ă a datelor. În cazul nostru trebuie utilizat ă comanda de analiz ă a
corelației dintre salariul ini țial și cel final. Se ob ține următorul tabel în fereastra cu rezultate:

Rezultatul ob ținut este urm ătorul: r=0,69, p=0,056. În continuare vom interpreta aceste
rezultate:
• semnul corela ției: corelație pozitivă, legătura este direct propor țională. În cazul subiec ților cu studii
generale se constat ă că nivelul mic al salariului ini țial se asociaz ă cu un nivel mic al salariului final,
salariul inițial mediu se asociaz ă cu un salar final mediu, salariul ini țial mare se asociaz ă cu un salar
final mare.
• mărimea absolut ă a coeficientului : puterea leg ăturii dintre cele dou ă variabile este ridicat ă, valoarea
lui r depășește valoarea de 0,50.
• pragul de semnifica ție: valoarea pragului de semnifica ție este mai mare de 0,050, deci nu exist ă o
legătură semnificativ ă între salariul ini țial și final al subiec ților care au studii generale.
• proporția de varian ță explicată de relația este r2=0,47, deci rela ția găsită apare la 47% dintre
subiecții cu studii generale. Explica ția lipsei de semnifica ție a corela ției dintre cele dou ă variabile (în
condițiile în care coeficientul de corela ție are valoare ridicat ă) este num ărul mic de subiec ți. Numărul
de subiecți din analiz ă influențează valoarea pragului de semnifica ție al corela ției dar nu și puterea
legăturii dintre variabile.

LOREDANA GHERASIM

274După folosirea acestui “filtru” este indicat ă dezactivarea. Pentru dezactivarea selec ției, se
deschide din nou în meniul ini țial DATA – SELECT CASES. În partea de jos a ferestrei se g ăsește buton
RESET. Se activeaz ă apoi butonul OK, astfel, comanda de filtrare a datelor dispare.

Comanda SPLIT FILE
Uneori îns ă dorim să vedem ce se întâmpl ă pentru fiecare subgrup de subiec ți în parte. Pentru
baza de date BAZA2.sav, vom analiza leg ătura dintre variabilele salariul ini țial și salariul final pentru
toate categoriile de subiec ți în funcție de variabila STUDII (nu numai pentru subiec ții cu studii generale
dar și pentru cei cu studii medii și superioare). Pentru a nu repet a comanda SELECT CASES de multe
ori se poate utiliza o alt ă comandă din meniul DATA, și anume comanda SPLIT FILE. Activarea
comenzii SPLIT FILE deschide urm ătoarea fereastr ă:

Dintre opțiunile din dreapta alegem ORGANIZE OUTPUT BY GROUPS și apoi, cu ajutorul
săgeții, introducem variabila de grupare (S TUDII) în câmpul care se activeaz ă sub aceast ă opțiune:

După apăsarea butonului OK, în partea dreapt ă-jos a bazei de date apare anun țul SPLIT FILE
ON, care avertizeaz ă utilizatorii c ă baza de date este împ ărțită în funcție de condi țiile (nivelurile)
variabilei de grupare
. La fel ca și în cazul comenzii SELECT CASES, simpla împ ărțire a bazei de
date nu asigur ă prelucrarea statistic ă. De aceea, trebuie folosit ă comanda CORRELATIOS pentru a
analiza leg ătura dintre variabilele salariu ini țial și final al subiec ților.
Rezultatele analizei statistice sunt prezentate separat, în fi șierul OUTPUT, pentru fiecare
condiție a variabilei independent e: studii generale, medii și superioare:

ANALIZA COMPUTERIZAT Ă A DATELOR

275nivelul de studii al subiec ților = studii generale

nivelul de studii al subiec ților = studii medii

nivelul de studii al subiec ților = studii superioare

Graficul corela ției
Relația dintre dou ă variabile poate fi reprezentat ă grafic sub forma unui nor de puncte. Practic,
graficul îl alegem din meniul GRAPHS, comanda SCATTER, care deschide fereastra:

Vom alege un grafic simplu, care s ă ilustreze rela ția dintre dou ă variabile, deci vom selecta
opțiunea SIMPLE. Se activeaz ă apoi butonul DEFINE, care deschide urm ătoarea fereastr ă:

LOREDANA GHERASIM

276

Se introduc cele dou ă variabile în câmpurile axei X și axei Y (nu conteaz ă ordinea în care se
introduc variabilele deoarece corela ția este bidirec țională) și apoi se apas ă butonul OK.

Reprezentarea grafic ă a corelației este urm ătoarea:

Reprezentarea grafic ă a corelației apare sub forma unui nor de pu ncte. Pentru exemplul nostru
norul de puncte este ascendent cresc ător (din stânga-jos spre dreapta-sus) deoarece rela ția dintre
variabile este pozitiv ă, iar punctele sunt apr opiate, grupate deoarece coeficientul de corela ție are
valoare ridicat ă (r=0,81). Dac ă relația ar fi fost invers propor țională, norul de puncte ar fi fost orientat

ANALIZA COMPUTERIZAT Ă A DATELOR

277descrescător (din stânga-sus spre dreapta-jos). În cazul în care nu ar fi nici o rela ție, punctele ar fi fost
distribuite uniform pe grafic.

II.5. COEFICIENTUL DE CORELA ȚIE KENDALL 'S TAU -B
Reprezintă o măsură non-parametric ă a asocierii variabilelor ordinale sau rangate care
presupun cantit ăți. La fel ca și în cazul corela ției Pearson, semnul c oeficientului de corela ție Kendall's
tau-b indic ă direcția relației, iar valoarea absolut ă a coeficientului indic ă puterea rela ției. Cu cât valoarea
coeficientului este mai mare cu atât rela ția dintre variabile este mai mare. Acest coeficient de corela ție
poate lua valori doar intre -1 și 1.
Calcularea corela ției Kendall cu ajutorul SPSS
Pentru a calcula acest coeficient de corela ție cu ajutorul aplica ției SPSS vom crea o nou baz ă
de date “Baza3.sav”, care va cuprin de 3 variabile: elevi (codul de id entificare al elevilor), Prof_1
(evaluarea interesului elevilor fa ță de școală de către primul profesorul) și Prof_2 (evaluarea interesului
elevilor față de școală realizată de al doilea profes or). În tabelul urm ător prezent ăm valorile acestor
variabile.

Pentru a analiza leg ătura dintre evaluarea f ăcută de primul profesorul și evaluarea realizat ă de
al doilea profesor (prof_1 și prof_2), trebuie s ă folosim coeficientul de corela ție Kendall's.
Pentru calculul acestei corela ții se activeaz ă opțiunea BIVARIATE din meniul ANALIZE-
CORRELATE, apoi se introduc variabilele prof_1 și prof_2 în câmpul di n dreapta. Din câmpul
CORRELATION COEFFICIENTS se bifeaz ă coeficientul de corela ție Kendall's:

După confirmarea comenzii în foaia cu rezultate apare urm ătorul tabel:

LOREDANA GHERASIM

278

Se constat ă că apare o asociere pozitiv ă între variabile (r=0,60), elevii clasa ți pe primele locuri
de către primul profesor ocup ă tot o pozi ție fruntașă din perspectiva celui de al doilea profesor.
Asocierea nu este îns ă semnificativ ă, p=0,091 posibila explica ție fiind num ărul mic de subiec ți din baza
de date.
Dac ă ar fi apărut o asociere negativ ă dintre variabile (coeficientul de corela ție ar fi fost negativ)
s-ar fi interpretat astfel: elevii plasa ți pe primele locuri de c ătre primul profesor s-ar fi plasat în coada
clasamentului din perspectiva celui de al doilea profesor.

II.6. COEFICIENTUL DE CORELA ȚIE SPEARMAN
Este o măsurare non-parametric ă a corelației dintre dou ă variabile ordinale. Pentru toate
cazurile, valorile fiec ărui tip de variabil ă sunt rangate, de la cele mai mi ci la cele mai mari. Se folose ște
atunci când nu este posibil ă măsurarea caracteristicilor analizate ci doar evaluarea lor, în asemenea
manieră încât indivizii statistici s ă fie ordona ți în funcție de dou ă criterii X și Y. Această evaluare
presupune atribuirea de valori care indic ă ierarhia subiec ților (cum ar fi primul, al doilea, al treilea).
Modalitatea de calcul a corela ției Spearman este similar ă coeficientului Pear son (de fapt de aplic ă
formula coeficientului Pearson). Acest coeficient de corela ție mai este denumit și coeficient de corela ție
a rangurilor.
Calcularea corela ției Spearman cu ajutorul SPSS
Pentru a calcula acest coeficient de corela ție cu ajutorul aplica ției SPSS vom crea o nou baz ă
de date “Baza4.sav”, care va cuprinde 3 variabile: elevi (codul de identificare al elevilor), eval_i
(evaluarea de c ătre profesori a interesul pentru școală) și eval_re (evaluarea de c ătre profesori a
relațiilor cu ceilal ți elevi).

Pentru a analiza leg ătura dintre evaluarea interesului fa ță de școală al elevilor și evaluarea
relațiilor cu ceilal ți colegi (eval_i și eval_re) se folose ște coeficientul de corela ție Spearman.
Pentru calculul acestei corela ții se activeaz ă opțiunea BIVARIATE din meniul ANALIZE-
CORRELATE. Se introduc variabilele eval_i și eval_re în câmpul di n dreapta. Din câmpul
CORRELATION COEFFICIENTS se bifeaz ă coeficientul de corela ție Spearman:

ANALIZA COMPUTERIZAT Ă A DATELOR

279

După confirmarea comenzii în foaia cu rezultate apare urm ătorul tabel:

Se constat ă că apare o inversare a clasamentului, corela ția având semn negativ, ceea ce
semnifică faptul că elevii plasa ți pe primele locuri ale variabilei interes pentru școală ocupă ultimele
locuri după cel de al doilea criteriu, rela ții bune cu ceilal ți elevi. Inversarea clasamentului nu este
semnificativ ă, pragul de semnifica ție fiind mai mare de 0,050 (p=0,260).

II.7. RECODIFICAREA ȘI TRANSFORMAREA VARIABILELOR

Uneori este necesar ca scorurile brute ob ținute de subiec ții unui studiu s ă fie transformate
pentru a putea verifica i poteza studiului. Aplica ția SPSS are o serie de comenzi care permit
transformarea sau recodificarea unei va riabile cantitative într-o variabil ă calitativă, prin crearea unei noi
variabile în baza de date sau modificarea valor ilor unei variabile existente în baza de date.
Pentru a exemplifica utilizarea comenzilor de recodificare vom crea o nou ă bază de date
(baza5.sav) care con ține mediile ob ținute de elevi la sfâr șitul anului școlar. Valorile variabilei sunt:
Media: 8,03, 8,73, 9,19, 8,81, 7, 88, 9,06, 9,04, 6,86, 7,69, 7,80, 8,06, 9,06, 7,71, 7,16, 8,88,
8,49, 7,78, 9,76, 8,10, 7, 49, 7,79, 6,91, 6,81, 7,54
Vom împărți elevii în dou ă grupe (grupul elevilor cu performan țe bune și grupul elevilor cu
performanțe slabe). Împ ărțirea elevilor în dou ă grupe se realizeaz ă în funcție de median ă, acest
indicator statistic împ ărțind șirul de scoruri în dou ă parți egale (proba medianei). Deci vom calcula mai
întâi valoarea medianei și apoi vom împ ărți subiecții în grupe în func ție de valoarea acestui indicator.
Pentru calculul medianei vom folosi com anda DESCRIPTIV STATIS TICS– FREQUENCIES:

LOREDANA GHERASIM

280Pentru exemplul nostru medi ana are valoar e 7,95. Subiec ții care au valori ma i mici ca mediana
(7,95) vor forma grupul celor cu performan țe scăzute, iar subiec ții care au valori mai mari decât
mediana vor forma grupul celor cu performan țe ridicate. Pentru recodifi carea variabilei MEDIA se
utilizează opțiunea RECODE care se g ăsește la meniul TRANSFORM:

Comanda RECODE are dou ă opțiuni de recodificare. Se poate p ăstra variabila ce urmeaz ă să
fie recodificat ă (INTO SAME VARIABLES) sau se poate crea o nou ă variabilă (INTO DIFFERENT
VARIABLES).
Comanda RECODE INTO DIFFERENT VARIABLES
Selectăm opțiunea de creare a unei noi variabile care s ă cuprindă grupele ob ținute în urma
recodificării. Se selecteaz ă opțiunea INTO DIFFERENT VARIABLES, ceea ce are ca urmare apari ția
următoarei casete de dialog:

1. câmpul care con ține variabilele din baza de date;
2. în câmpul NAME de la OUT VARIABLE se introduce numele variabilei create;
3 în câmpul INPUT VARIABLE →OUTPUT VARIABLE se introduce atât variabila ce urmeaz ă
să fie recodificat ă cât și numele noii variabile;
4. butonul OLD AND NEW VALUE permi te recodificarea variabilei ini țiale
5 butonul IF permite crearea unei noi variabile doar prin selec ția anumitor valori ale variabilei
inițiale
Pentru exemplul nostru vom trece
variabila pe care dorim s ă o recodific ăm,
MEDIA, în câmpul din mijloc al ferestrei cu
ajutorul butonului de trecere. Vom denumi
noua variabil ă NIVPERF. Noul nume se
tastează în câmpul NAME al câmpului
OUTPUT VARIABLE:
1 2 3
45

ANALIZA COMPUTERIZAT Ă A DATELOR

281Pentru ca noul nume al variabilei s ă apară în câmpul din mijloc INPUT VARIABLE →OUTPUT
VARIABLE și astfel să aibă loc recodificarea, se activeaz ă butonul CHANGE din câmpul OUTPUT
VARIABLE:

Se activeaz ă butonul OLD AND NEW VALUE pentru a defin i valorile noii variabile. Activarea
acestui buton deschide urm ătoarea caset ă de dialog:

Această fereastră prezintă mai multe câmpuri:
1. câmpul OLD VALUE se refer ă valorile variabilei ini țiale
2. câmpul NEW VALUE face referire la valorile noii variabile 3. în câmpul OLD →NEW se reunesc op țiunile de recodificarea a variabilelor
În exemplul nostru, trebuie ca valori le variabilei MEDIA (variabila ini țială) să le redefinim,
formând o nou ă variabilă. Astfel, subiec ții care au ob ținut scoruri mai mici decât mediana (7,95) vor
forma grupul subiec ților cu performan ța scăzută, care va reprezenta val oarea 1 a variabilei NIVPERF
(ce va fi creat ă). În consecin ță, vom activa op țiunea RANGE, LOWEST TH ROUGH din câmpul OLD
VALUE și vom trece în câmpul
activat valoarea medianei (7,95). Cu alte cuvinte aceast ă
opțiune va însemna c ă toate
valorile variabilei MEDIA mai mici de 7,95 vor fi recodificate, prind valoarea în cadrul noii variabile NIVPERF. În câmpul NEW VALUE, în câmpul de lângă opțiunea VALUE, vom
tasta valoarea 1:
1 2
3

LOREDANA GHERASIM

282Se apasă apoi butonul ADD al câmpului OLD →NEW, pentru a putea recodifica urm ătoarele
valori. Apoi se activeaz ă opțiunea RANGE, THROUGH HIGHEST din câmpul OLD VALUE și se trece în
câmpul activat valoarea medianei
(7,95). Aceast ă opțiune va însemna
că valorile mai mari de 7,95 ale
variabilei MEDIA vor fi recodificate în variabila NIVPERF primind valoarea
2. În consecin ță, în câmpul NEW
VALUE, în câmpul de lâng ă opțiunea
VALUE, vom tasta valoarea 2, dup ă
cum se poate observa și în imaginea
din dreapta.
Pentru a fi re ținută și această a doua condi ție de recodificare, se ac ționează din nou butonul
ADD din câmpul OLD →NEW. În concluzie, scorurile mai mici de 7,95 ale variabilei MEDIA vor primi
valoarea 1 în cadrul variabilei NIVPERF, iar va lorile mai mari de 7,95 ale variabilei MEDIA vor
reprezenta valoarea 2 al variabilei
NIVPERF, imaginea din stânga.
Se activeaz ă apoi butonul
CONTINUE și butonul OK al
ferestrei RECODE INTO A DIFFERENT VARIABLES, ceea ce duce la modificarea bazei de date, cum se poate observa și în
imaginea din mai jos.
Se observă că în baza de
date apare noua variabil ă NIVPERF, cu dou ă valori. Pute ți verifica dac ă
recodificarea a fost corect realizat ă.
Există posibilitatea de a împ ărți valorile unei variabile în mai mult de
două
grupe. Pentru exemplificare vom împ ărți scorurile la variabila MEDIA în
trei parți egale. Prima treime va alc ătui grupul subiec ților cu performan ță
scăzută, a doua treime grupul subiec ților cu performan ță medie, iar ultima
treime grupul subiec ților cu performan ță ridicată. Pentru a putea face
împărțirea, mai întâi trebuie s ă calculăm valorile corespunz ătoare percentilelor
care împart șirul de scoruri în 3 par ți egale (fiecare parte reprezentând 33,33%
din total). Se folose ște comanda
DESCRIPTIV STATISTICS– FREQUENCIES. Din câmpul PERCENTILE VALUES se bifeaz ă
opțiunea PERCENTILE și se introduc
centilele care împart șirul de scoruri în 3
parți egale (adic ă 33,33% și 66,66%).
Subiecții cu valori mai mici de 7,73 vo r forma grupul celor cu performan ța scăzută (grupul 1), cei
cu valori cuprinse între 7,73 și 8,64 vor forma grupul subiec ților cu performan ță de nivel mediu (grupul
2), iar cei cu medii mai mari de 8, 64 vor reprezenta grupului cu performan ța ridicată (grupul 3).

ANALIZA COMPUTERIZAT Ă A DATELOR

283Pentru a crea aceast ă nouă variabilă se activeaz ă meniul TRANSFORM – RECODE – INTO
DIFFERENT VARIABLES. Vom denumi noua variabila NIVPERF2, tastând noul nume în câmpul NAME
al câmpului OUT VARIABLE și
apoi activând butonul CHANGE.
În acest exemplu, scorurile
mai mici de 7,73 ale variabilei MEDIA vor forma primul grupului 1, adică nivelul 1 al noii variabile
NIVPERF2. Vom activa op țiunea
RANGE, LOWEST THROUGH din câmpul OLD VALUE și vom trece
în câmpul activat valoarea 7,73, iar în câmpul NEW VALUE vom trece valoarea 1. Se activeaz ă apoi butonul ADD al câmpului OLD →NEW, pentru a putea introduce
următoarea condi ție.
Valorile variabilei MEDIE
cuprinse între 7,73 și 8,64 vor
reprezenta nivelul 2 al variabilei NIVPERF2. Se activează prima op țiune
RANGE THROUGH și se
tastează valorile minime și
maxime. În câmpul NEW VALUE se trece valoarea 2, cum se poate observa și în
imaginea al ăturată.

Activăm apoi butonul ADD al câmpului OLD →NEW. Pentru
crearea ultimului grup, care cuprinde valori mai mari de 8,64 se activeaz ă
opțiunea RANGE, THROUGH HIGHEST din câmpul OLD VALUE. În
câmpul NEW VALUE se trece valoarea 3, apoi se activeaz ă butonul ADD.
Se activeaz ă apoi butonul CONTINUE și butonul OK al ferestrei
RECODE INTO A DIFFERENT VARIABL ES, ceea ce duce la modificarea
bazei de date, cum se poate observa și în imaginea al ăturată:
Se observă că în baza de date apare noua variabil ă NIVPERF2,
cu trei valori.
Comanda RECODE INTO SAME VARIABLES Rezultate similare se ob țin dacă se utilizeaz ă comanda RECODE
opțiunea INTO SAME VARIABLES, cu excep ția faptului c ă se păstrează
numele ini țial al variabilei recodificate. Pentru exemplificare vom utiliza
aceeași bază de date (baza5.sav) și vom împ ărți în două scorurile
subiecților. Activarea comenzii duce la apari ția casete de dialog:

LOREDANA GHERASIM

284

În câmpul din stânga apar toate variabilele din baz a de date, în câmpul din dreapta se introduc
variabilele pe care dorim s ă le recodific ăm. În exemplu nostru vrem s ă recodificăm variabil Media.
Trecem variabila în câmpul din dreapta:

Se activeaz ă butonul OLD AND NEW VALUES, care are acelea și opțiuni ca în cazul op țiunii
anteriore de transform are într-o variabil ă diferită:

Recodificare se realiz ă la fel ca în exemplu ant erior, când am utilizat op țiunea de recodificare
într-o altă variabilă:

ANALIZA COMPUTERIZAT Ă A DATELOR

285

După confirmarea recodific ării să vedem modific ările din baza de date. Se constat ă că s-au
modificat valorile variabilei ME DIA, aceasta având acum acelea și valori ca și variabila NIVPERF. Acest
lucru demonstreaz ă că cele două opțiuni duc la acela și rezultat.

Inversarea valorilor variabilelor
Comanda de recodificare poate fi utilizat ă și pentru recodificarea valorilor scorurilor ob ținute la
diferiți itemi.
Pentru a exemplifica utilizarea acestor comenzi de
recodificare vom crea o nou ă bază de date (baza6.sav)
care con ține patru variabile: NRCHEST (codul de
identificare), PRES (Cât ă încredere ave ți în președinte?),
GUV (Cât ă încredere ave ți în guvern?), PARLAM (Cât ă
încredere ave ți în parlament?). Prezent ăm scorurile
obținute de 16 dintre subiec ți.
Pentru itemii 1 și 3 subiecții au răspuns pe o scal ă
de la 1 (foarte pu țin) la 4 (foarte mult). La itemul 2, îns ă,
subiecții au răspuns pe o scal ă de la 1 (foarte mult) la 4
(foarte puțin). Pentru a vedea atitudinea subiec ților față de
instituțiile statului ar trebui s ă însumăm răspunsurile subiec ților de la cei 3 itemi. Pentru a putea face

LOREDANA GHERASIM

286acest lucru ar trebui ca r ăspunsurile de la itemul 2 s ă fie transformate, pentru ca scala de evaluare s ă
aibă aceeași semnifica ție cu a ceilal ți doi itemi (valoarea 1 s ă însemne foarte pu țin iar valoare 4 s ă
însemne foarte mult).
Recodificarea în acest caz presupune inversar ea scalei de evaluare pentru itemul 2, adic ă
valoarea 1 a itemului s ă devină 4 (ceea ce înseamn ă foarte mult), valoarea 2 s ă devină 3, valoarea 3 s ă
devină 2, iar valoarea 4 a itemului s ă devină 1 (ceea ce înseamn ă foarte puțin).
Pentru recodificare ar putea fi utilizat ă oricare dintre cele dou ă opțiuni prezentate anterior
RECODE INTO SAME VARIABLES sau INTO DIFFERENT VARIABLES. Vom folosi comanda RECODE INTO DIFFERENT VARIABLES pentru a putea verifica dac ă recodificarea a
fost realizat ă. Vom redenumi
variabila recodificat ă GUV_R:
Vom activa butonul OLD AND NEW VARIABLES. Pentru inve rsarea scalei de evaluare a
itemului vom folosi numai opțiunile VALUE din câmpul
OLD VALUE și NEW VALUE.
Astfel, valoarea 1 a vechii variabile devine 4 pentru noua variabilă, deci se tasteaz ă 1 în
dreptul op țiunii VALUE din
câmpul OLD VALUE și cifra 4 în
dreptul op țiunii VALUE din
câmpul NEW VALUE.
Se activeaz ă butonul
ADD din câmpul OLD →NEW. Apoi se tasteaz ă 2 în câmpul de la op ț
iunea VALUE din câmpul OLD
VALUE și cifra 3 în câmpul de la op țiunea VALUE din câmpul NEW VALUE:

La fel se procedeaz ă și pentru celelalte valori care tre buie recodificate. În final trebuie s ă avem
următoarele transform ări în câmpul OLD →NEW:

ANALIZA COMPUTERIZAT Ă A DATELOR

287

După activarea butonului CONTINUE și butonului OK al ferestrei principale, baza de date va
conține o nouă variabilă (GUV_R) care con ține valorile inversate ale itemului 2:

Comanda TRANSFORM COMPUTE Pentru a calcula scorul total la atitudinea fa ță de institu țiile statului, trebuie s ă însumăm
scorurile subiec ților obținute la cei trei itemi. Pentru a putea face acest lucru se folose ște meniul
TRANSFORM, op țiunea COMPUTE:

Prezentăm caracteristicile principale ale acestei ferestre:
1. în câmpul TARGET VARIABLE se tasteaz ă numele noii variabile
2. în acest câmp sunt prezentate variabilele din baza de date 1
2 3

LOREDANA GHERASIM

2883. în câmpul NUMERIC EXPRESSI ON se introduce formula de calcul a noii variabile; sub acest
câmp se g ăsesc butoane cu cifre și semne, dar și un câmp cu func ții complexe care pot fi utilizate
pentru calculul noilor variabile.
Pentru exemplu nostru vom numi noua variabila AT IT, deci vom tasta numele noii variabile în
câmpul TARGET VARIABLE:

Apoi vom scrie formula de calcul care va consta în însumarea scorurilor ob ținute la cele trei
variabile: PRES, GUV_R și PARLAM. Variabile sunt trecute în câmpul NUMERIC EXPRESSION
folosind butonul de trecere. Semnul plus se introduce de la tastatur ă sau folosind butoanele care se
găsesc sub câmpul NUMERIC EXPRESSION:

După activarea butonului OK în baza de date apare o nou ă variabila, cu numele ATIT.

Aceast ă nouă variabilă reprezintă atitudinea subiec ților față de instituțiile statului și reprezintă
suma răspunsurilor la cei trei itemi.

ANALIZA COMPUTERIZAT Ă A DATELOR

289

III. ELEMENTE DE STATISTIC Ă INFEREN ȚIALĂ

III.1. DISTRIBUȚIA NORMAL Ă
Variabilitatea rezu ltatelor urmeaz ă reguli care pot fi modelate matematic. Dac ă un fenomen
social observat este urm ărit o perioad ă de timp mai îndelungat ă, distribuția rezultatelor se va face dup ă
o curbă normală, iar acest lucru poate fi demonstrat matematic.
Există trei parametri ai unei distribu ții: modalitatea (indic ă valorile în jurul c ărora se grupeaz ă
scorurile subiec ților), înclinarea (indic ă tendința scorurilor de a fi mai mari sau mai mici) și turtirea (arat ă
cât de mult variaz ă scorurile distribu ției). Din perspectiva celor trei parametri, curba normal ă este
unimodală, simetrică și mediu turtit ă. În plus, curba normal ă mai posed ă anumite propriet ăți speciale.
Astfel, matematicienii au pus la punct formule care permit calcularea diferitelor suprafe țe ale curbei.
Pentru a în țelege mai u șor despre ce este vorba, s ă luăm drept exemplu distribu ția rezultatelor
la un test de inteligen ță. La acest test media rezultatelor este 100, iar devia ția standard este 16. În
imaginea de mai jos ilustr ăm grafic aceast ă distribuție:

Dacă urmăriți cu atenție forma curbei normale ve ți constata prezen ța unor „puncte de
inflexiune”, puncte în care linia curb ă își modifică forma. Aceste puncte corespund devia țiilor standard.
Întrucât distribu ția normală este simetric ă, exact 50% din cazuri vor avea scoruri sub valoarea medie.
Aproximativ 34% din cazuri se vor afla între medie și o abatere standard la stânga sau la dreapta
mediei. Astfel, vom ști că 34% dintre subiec ți au scoruri cuprinse între medie (100) și o deviație
standard. Având o devia ție standard de 16, vom ști că 34% dintre indivizi vor avea scorul cuprins între
100 și 116 (cei cu IQ situat deasupra mediei) sau între 84 și 100 (cei cu IQ situat dedesubtul mediei).
Observați, de asemenea, c ă și mai puține cazuri sunt mai dep ărtate de medie. Abia 16% din popula ție
vor avea scoruri mai mici sau mai mari de o devia ție standard. Cu alte cuvi nte, numai 16% dintre
oameni au coeficientul de inteligen ță mai scăzut de 84 sau mai ridicat de 116. Mai mult, doar
aproximativ 2% dintre in divizi vor avea scoruri și mai extreme, mai mici sau mai mari decât dou ă deviații
standard fa ță de medie (adic ă sub valoarea 68 sau peste valoarea 132).
Există o strânsă legătură între scorurile standard (notele z) și diferite procentaje sau frecven țe
relative. Cunoscând nota Z a unui subiect putem ști cu precizie câ ți indivizi din popula ție au scoruri mai 100 116 84 132 68 34%
14%
2% 34%
14%
2%
-2 0 -1 +2 +1 Scoruri brute
Scoruri z

LOREDANA GHERASIM

290mici sau mai mari decât al subiectulu i investigat. Orice manual de statistic ă are la sfâr șit un tabel care
permite calcularea acestor procentaje cu pr ecizie. În acel tabel, pentru fiecare not ă Z, este precizat un
procent, care arat ă câți subiecți au scorurile cupr inse între medie și nota Z. Să presupunem c ă o
persoană obține la testul de inteligen ță scorul 125, putem calcula nota Z a acestui subiect, care are
valoarea 1,56 (dup ă formula: (125-100)/16). Dac ă vom consulta unul din tabelele de care aminteam
anterior, vom vedea în dreptul lui 1, 56 valoarea 44,06%. Aceasta înseamn ă că de la medie (100) și
până la scorul nostru (125) sunt 44,06% dintre subiec ți. Aceasta arat ă că doar 5,94% dintre indivizi vor
avea scoruri mai mari (50%-44,06%) și 94,06% (50%+44,06%) vor avea scoruri mai mici decât
subiectul ales de noi.
III.2.
ETAPELE TEST ĂRII UNEI IPOTEZE . TESTUL Z
Pentru a vedea cum se realizeaz ă inferența statistică, vom analiza cel mai simplu test, testul z,
în care se compar ă un eșantion format dintr-un singur caz cu o popula ție a cărei parametri sunt
cunoscuți. Ca exemplu vom folosi un studiu (Aron & Aron, 1995), în care un grup de farmaci ști a
sintetizat o vitamin ă care accelereaz ă procesele de asimila ție la copii nou-n ăscuți, aceștia
dezvoltându-se mai rapid. U nul dintre efecte este sc ăderea vârstei la care copii încep s ă meargă.
Farmaciștii au dorit s ă omologheze vitamina, dar pentru aceasta ei trebuie s ă demonstreze c ă
într-adevăr vitamina accelereaz ă mersul copiilor. Farmaci știi au primit dreptul s ă administreze vitamina
unui singur copil nou-n ăscut, ales aleatoriu din popula ție. Copilul respectiv, dup ă administrarea
vitaminei, a început s ă meargă de la vârsta de 8 luni. Pot farmaci știi să susțină că vârsta precoce la
care a mers copilul se datoreaz ă vitaminei, știind că vârsta la care merg copii prima dat ă, în popula ția
normală este de 14 luni, cu o abatere standard de 3 luni?
Pentru a r
ăspunde cu dovezi statistice la o astfel de întrebare, trebuie s ă facem apel la
distribuția normală a variabilei alese în cadrul popula ției și să respectăm anumite etape pentru
verificarea ra ționamentului. Prezent ăm în continuare curba normal ă corespunz ătoare vârstei de debut
de la care copiii încep s ă meargă:

Pentru testarea ipotezei trebuie s ă parcurgem mai multe etape:
Etapa I: Reformularea problem ei în termenii popula țiilor de compara ție. Deși avem doar un singur caz
pe care trebuie s ă îl compar ăm cu o popula ție ai cărei parametri sunt cunoscu ți, ipotezele trebuie
reformulate în termen ii generali ai popula țiilor de comparat pentru a putea face generalizarea
ulterioară. Astfel, în exemplul nostru avem de comparat dou ă populații: P0 – populația copiilor 14 luni 17 luni 11 luni 20 luni 8 luni 34%
14%
2% 34%
14%
2%

ANALIZA COMPUTERIZAT Ă A DATELOR

291normali care nu iau vitaminele și P1 – populația copiilor normali care iau vitaminele . Vom formula
două ipoteze:
Ipoteza de lucru (experimental ă): afirmă că noii născuți care iau vitamina vor merge mai repede
decât cei care nu iau vitamina (H1: P 0 < P 1)
Ipoteza de nul: Este ipoteza care descrie situa ția în care interven ția noastră (vitamina) nu are nici
un efect. Dac ă vitamina nu ar avea nici un efect, cele dou ă populații de copii ar merge la aceea și
vârstă. H0: P 0 = P 1
Într-o cercetare se testeaz ă de fapt ipotez a de nul pentru c ă ea descrie situa ția deja existent ă
înainte interven ției sau situa ția în care nu am ob ține nici un efect. Dac ă ipoteza de nul este
respinsă, atunci putem accepta ipoteza de lucru.
Etapa II: Stabilirea parametrilor popula ției de compara ție și a distribu ției de compara ție. Această etapă
presupune cunoa șterea parametrilor (media și abaterea standard) popula ției la care ne raport ăm (în
cazul nostru distribu ția copiilor care nu iau vitamina). În mod obi șnuit, fără nici o altă intervenție,
copiii din popula ția normală merg la vârsta de 14 luni, cu o abatere standard de 3 luni. Distribu ția
acestei variabile este normal ă.
Etapa III: Stabilirea prag ului de semnifica ție și a notei z a punctului de „t ăiere”. Orice ipotez ă, mai ales în
domeniul științelor sociale, este testat ă la un anumit prag de semnifica ție. Acest prag de
semnificație arată probabilitatea de eroare cu care noi test ăm ipoteza. Pragul de semnifica ție poate
fi de 1% (când dorim s ă fim mai preci și) sau de 5% (atunci când putem fi mai pu țin exacți).
Pentru aceast ă cercetare vom stabili un prag de semnifica ție de 1% întrucât efectele ei sunt
importante. Dup ă stabilirea pragului, trebuie s ă vedem care este nota Z corespunz ătoare acestuia. Am
precizat anterior c ă fiecărui punct de pe curba de distribu ție normală îi corespunde o anumit ă notă
standard și o anume distribu ție a cazurilor din popula ție față de acel punct. De exem plu, la o valoare Z
de 1 (adic ă 17 luni) se constat ă că 84% dintre copii merg la vârste mai mici de 17 luni, abia 16%
mergând mai târziu de aceast ă vârstă.
Există două de valori Z de corespunz ătoare pragului 1%, una referitoare la scorurile mici (în
partea stâng ă a distribuției), care arat ă cei 1% dintre copii care merg cel mai timpuriu și o altă valoare
referitoare la scorurile mari (în partea dreapt ă a distribuției) care arat ă acei 1% dintre copii care merg
cel mai târziu. Pe noi ne intereseaz ă prima dintre aceste valori.

În tabelele statistice g ăsim valoarea scorului z (z=2,33) corespunz ătoare probabilit ății de 1%
(numită și punct de t ăiere). În cazul nostru ea va fi –2,33 pentru c ă ne referim la scorurile mai mici decât
media, aflate în partea stâng ă a curbei de distribu ție.
Etapa IV: Colectarea datelor și transformarea lor în scoruri z. În cazul nostru colectarea datelor
înseamnă a observa vârsta la care va merge copilul pentru prima dat ă (8 luni). Vom transforma scorul 14 luni 17 luni 11 luni 20 luni 8 luni 34%
14%
2% 34%
14%
2%
0 +1 + 2 -1 -2 Note z -2,33

LOREDANA GHERASIM

292subiectului la variabila vârst ă în scor Z, prin raportare la distribu ția populației normale de comparat
folosind formula notei Z (X-M)/SD), adic ă pentru exemplu nostru: Z=(8-14)/3)=-2
Etapa V: Compararea notei z astfel ob ținută cu nota z a punctului de t ăiere. După obținerea
scorul Z corespunz ător datelor colectate, acesta trebuie comparat cu scorul Z corespunz ător punctului
de tăiere. În cazul nostru, nota Z (-2) corespunz ătoare scorului brut este mai mare decât a notei Z a
punctului de t ăiere (–2,33). În ipoteza noastr ă experimental ă ne așteptam ca nota Z corespunz ătoare
scorului brut s ă fie mai mic ă decât valoare Z a punctului de t ăiere. În consecin ță, acceptăm ipoteza de
nul, ipoteza experimental ă neconfirmându-se. Cu al te cuvinte, farmaci știi nu au reu șit să dovedeasc ă, la
un prag de probabilitate de 1% c ă vitamina lor are efectul scontat.
Am prezentat testul Z pentru a în țelege logica test ării ipotezelor și înțelesul pragului de
semnificație. Vom prezenta în continuare, succint testele de compara ție cele mai frecvent folosite.

III.3.
TESTUL T PENTRU COMPARAREA UNUI E ȘANTION CU MEDIA POPULA ȚIEI

Acest test se aplic ă atunci când dorim s ă comparăm rezultatele unui e șantion cu media
populației (fără să avem informa ții despre varian ța rezultatelor popula ției).
Pentru a vedea cum anume se folose ște programul SPSS în aceast ă situație vom crea o nou ă
bază de date (baza7.sav), care con ține trei variabile: regiune (zona geografic ă, cu valorile: 1-
europeană, 2-asiatică și 3-africană), ind_d (procentul anual de cre ștere a popula ției) și dens (densitatea
populației pe km2). Prezentăm în continuare valorile acestor variabile:
dens: 94, 800, 87, 79, 36, 216, 55, 27, 2,8, 5, 124, 36, 47, 39, 105, 4,2, 86, 81, 227, 80, 54, 94, 111, 2,5,
283, 102, 51, 188, 330, 49, 40, 29, 58, 63, 189, 102, 143, 221,
ind_d: 0,2, 2,4, 0,7, -0,2, 2,8, 2,3, 2,9, 2, 9, 0,7, 2,4, 1,1, 0,5, 3,1, 0,3, 0,5, 1,5, 3,1, 0,8, 0,4, 0,8, -0,1, –
0,3, 1,1, 1,9, 1,6, 0,3, 0, 2, 0,3, 3,1, 0,5, 3,3, 2,3, 2,1, 1,8, 3,1, 2,8, 1,9
reg: 1, 2, 1, 1, 3, 3, 2, 3, 1, 3, 2, 1, 3, 1, 1, 3, 3, 1, 1, 1, 2, 1, 1, 2, 2, 1, 1, 2, 3, 1, 3, 2, 3, 2, 3, 2, 2
Dorim să comparăm scorurile e șantionului la variabila indice demografic cu media popula ției,
care are valoarea 2,3. Media e șantionului nostru este mai mare sau mai mic ă comparativ cu cea a
populației cu valoarea 2,3? Deoar ece nu avem acces la al ți parametri ai popula ției, în afar ă de medie
va trebui s ă estimăm variabilitatea sa. Vom aplica testul t pentru a compara un e șantion cu o popula ție
la care cunoa ștem media.
Ipoteza de cercetare : Indicele demografic al e șantionul nostru va avea o avea o valoare diferit ă
de indicele demografic al popula ției
Ipoteza de nul : indicele demografic al e șantionului va avea aceea și valoare cu cel al popula ției
Folosirea SPSS pentru compararea unui e șantion cu media unei popula ții
Aplicarea testului t se face activând din meniul ANALYZE-COMPARE MERANS op țiunea ONE
SIMPLE T TESTS:

ANALIZA COMPUTERIZAT Ă A DATELOR

293

După activarea acestei comenzi pe ecran apare urm ătoarea fereastr ă:

Această fereastră are trei elementele importante:
1. câmpul cu toate variabilele din baza de date;
2. câmpul unde vom introduce variabilele pe care vrem s ă le analizăm
3. câmpul în care se intr oduce valoarea medie a popula ției cu care compar ăm eșantionul (cu
valoarea 2,3 pentru exemplul nostru).
Activare butonului OPTIONS duce la deschiderea urm ătoarei ferestre:

Se observă că automat calculatorul a ales un inte rval de încredere (CONFIDENCE INTERVAL)
de 95%, ceea ce implic ă un prag de semnifica ție de 5%. Nu vom modifica pragul de semnifica ție. După
activarea butonului CONTINUE și apoi a butonului OK al ferestre i principale, pe ecran va apare
fereastra de OUTPUT:

One-Sample Statistics
37 1,489 1,149 ,189procentul de crestere
anuala a populatieiN Mean Std. DeviationStd. Error
Mean
12
3
1 2
3

LOREDANA GHERASIM

294One-Sample Test
-4,294 36 ,000 -,811 -1,195 -,428procentul de crestere
anuala a populatieit df Sig. (2-tailed)Mean
Difference Lower Upper95% Confidence
Interval of the
DifferenceTest Value = 2.3

Rezultatele sunt grupate în dou ă tabele. Primul tabel, ONE SAMPLE STATISTICS, con ține
elemente de statistic ă descriptiv ă. Al doilea tabel, ONE SAMPLE TEST, con ține date despre testul t
propriu-zis. În continuare vom analiza elementele OUTPUT-ului: 1. în aceast ă celulă este afișată media eșantionului, în cazul nostru m=1,49
2. în aceast ă celulă este afișată abaterea standard a e șantionului, SD=1,1
3. celula cuprinde eroarea standar d a mediei, mai precis devia ția standard a popula ției de eșantioane
de aceeași mărime cu al nostru (37), popula ție din care provine e șantionul nostru,
σm=0,19
4. nota t a e șantionului nostru comparat la popula ția de eșantioane care are media ( µm) 2,3 și abaterea
standard ( σm) de 0,19. Valoarea lui t este ob ținută după formula t=(m-mµ)/mσ=(1,49-2,3)/0,19 ≈-
4,26. Valoarea nu este identic ă cu cea din tabel datorit ă aproximărilor făcute.
5. cuprinde gradele de liberat e pentru care a fost calculat ă valoarea lui t și probabilitatea de respingere
a ipotezei de nul; în cazul nostru df=36
6. prezintă pragul de semnifica ție real, care ne spune care este probabilitatea cu care gre șim dacă
respingem ipoteza de nul și acceptăm ipoteza de cercetare. În ex emplu nostru valoarea pragului de
semnificație este 0,000, dar se raporteaz ă ca un p<0,001, pentru a ar ăta că probabilitatea de a
greși este mai mic ă de 0,1% (calculatorul ne afi șează doar primele trei zecimale).
7. celula con ține diferen ța dintre media e șantionului și cea a popula ție la care ne raport ăm.
8. prezintă intervalul de încredere al diferen ței dintre cele dou ă medii (-1,1 și -0,4) corespunz ător
pragului de semnifica ție de 5%.
În interpretarea statistic ă a notei t, oricare ar fi tipul de test ales , sunt câte elemente pe care de
acre trebuie s ă ținem seama:
• pragul de semnifica ție: care ne indic ă probabilitatea de eroare atunci când respingem ipoteza de
nul. Pentru a confirma ipoteze de cercetare, pragul de semnifica ție trebuie s ă fie mai mic sau cel
mult egal cu 0,05 (adic ă eroarea nu trebuie s ă fie mai mare de 5%).
• gradul de libertate : arată care este m ărimea eșantionului pe care s-a f ăcut testarea ipotezei. Cu cât
eșantionul este mai mare, cu atât putem avea mai mult ă încredere în rezultatele ob ținute, indiferent
dacă ele confirm ă sau nu ipoteza;
• sensul diferen ței: este dat de valoarea mediilor comparate s au de semnul notei t și arată în ce sens
apare diferen ța (care medie este mai mare).
Rezultatele pentru exemplul anterior sunt: Mediile: Me ș=1,4, Mpop=2,3,
Valoarea lui t și pragul de semnifica ție: t(36)=-4,29, p <0,001.
Aceste rezultate indic ă faptul că diferența dintre medii este semnificativ ă, în sensul c ă media
eșantionului nostru este semnificativ mai mic ă comparativ cu cea a popula ție. Putem afirm ă că 4 5 6 7 8

ANALIZA COMPUTERIZAT Ă A DATELOR

295procentul de cre ștere a popula ție eșantionului nostru este mai mic semnificativ în compara ție cu cel al
populației.
Să analizăm acum dac ă scorurile la variabila densitate din e șantionul nostru difer ă de cea a
populației cu valoarea de 0,9. Rezultatele testului ONE SIMPLE T TEST indic ă următoarele rezultate:
One-Sample Statistics
37 261,797 895,096 147,153Numar de oameni/
kilometru patratN Mean Std. DeviationStd. Error
Mean
One-Sample Test
1,167 36 ,251 171,797 -126,643 470,237Numar de oameni/
kilometru patratt df Sig. (2-tailed)Mean
Difference Lower Upper95% Confidence
Interval of the
DifferenceTest Value = 90

Mediile: Me ș=261,7, Mpop=90
Valoarea lui t și pragul de semnifica ție: t(36)=1,16, p=0,251.
Rezultatele indic ă faptul că nu exist ă diferențe semnificative între densitatea medie a
eșantionului și cea a popula ție, cu valoarea 90 (dac ă am accepta ipoteza de cercetare am gre și în
25,1% din cazuri). Putem spune c ă avem densitatea e șantionului studiat de noi este aceea și cu cea a
populației.

III.4.
TESTUL T PENTRU COMPARAREA A DOU Ă EȘANTIOANE PERECHI

În psihologia experimental ă se face distinc ție între grupele independente și dependente de
subiecți. Atunci când cercet ătorul împarte subiec ții în grupe în func ție de variabi la independent ă, fiecărui
grup prezentându-i un grad de intens itate al variabilei indepen dente, avem de a face cu grupe
independente de subiec ți. Pentru fiecare nivel al variabi lei independente vom avea câte un grup de
subiecți. Astfel, dac ă variabila independent ă are două grade de intensitate, subiec ții vor fi împ ărțiți în
două grupe, în final comparându-se rezultatele subiec ților. Fiecare subiect va face parte dintr-un singur
grup experimental. S ă presupunem c ă variabila independent ă este tipul de feed-back, cu dou ă grade de
intensitate, pozitiv și negativ. Subiec ții vor fi împ ărțiți în două grupe, condi ția de feed-back pozitiv și
respectiv condi ția de feed-back pozitiv.
Există posibilitatea ca toate nive lurile variabilei independente s ă fie prezentate aceluia și
eșantion de subiec ți. Aceeași subiecți vor trece prin toate condi țiile experimentale. În aceast ă situație
vom avea grupe perechi sa u dependente de subiec ți. Subiecții cărora le măsurăm anxietatea înainte și
după intervenția terapeutic ă formează eșantioane perechi. Cea mai simpl ă situație de comparare a
eșantioanelor este în situa ția de test-retest. De exemplu, m ăsurăm nivelul anxiet ății subiecților înainte și
după terapie, pentru a vedea schimb ările care apar ca urmare a interven ției terapeutice.
Nu cunoaștem nivelul mediu anxiet ății populație de subiec ți anxioși înainte de a veni la terapie
și nici nivelul mediu al anxiet ății după terapie. Ceea ce știm este nivelul anxiet ății subiecților care au

LOREDANA GHERASIM

296venit la terapie, înainte și după intervenția terapeutic ă. Ceea ce ne intereseaz ă pe noi este de fapt
diferența dintre cele dou ă măsurători ale anxiet ății, înainte și după terapie.
Ipoteza de cercetare : susține că vor fi diferen țe între cele dou ă măsurători; ne așteptăm ca
nivelul anxiet ății după terapie să fie mai mic decât cel ini țial.
Ipoteza de nul: diferențele dintre cele dou ă măsurători sunt nule, nu exist ă nici o diferen ță între
nivelul inițial și cel final al anxiet ății.
Diferențele dintre mediile celor dou ă eșantioane vor forma un e șantion de compara ție. Acest
eșantion al diferen țelor se compar ă cu o popula ție la care cunoa ștem media (media are valoarea 0
conform ipotezei de nul).
Folosirea SPSS pentru compararea a dou ă eșantioane perechi
Pentru a demonstra modul de ut ilizare a testului t pentru e șantioane perechi, vom folosi baza
de date Baza1.sav. Se utilizeaz ă testul t pentru e șantioane perechi, pentru c ă avem rezultatele
acelorași subiecți înainte și după terapie.
Aplicarea testului t se face activând din meniul ANALYZE – COMPARE MEANS op țiunea
PAIRED-SAMPLES T TEST:

Odată activată comanda va apare fereastra de mai jos:

Prezent ăm principalele op țiuni ale ferestrei:
1. câmpul din stânga cuprinde variabilele din baza de date
2. indică selecția curentă, variabilele selectate pentru analiz ă; pentru acest tip de test se
selectează o pereche de variabile;
3. câmpul în care se introduc cele dou ă variabile pereche
După introducerea variabilelor în câmpul de analiz ă fereastra ar trebui s ă arate astfel: 1
3 2

ANALIZA COMPUTERIZAT Ă A DATELOR

297

Butonul OPTIONS este identic cu cel de la testul t care permite compararea unui e șantion cu o
populație. Vom păstra intervalul de încredere de 95%.
După apăsarea butonului OK fereastra OUTPUT ne va prezenta urm ătoarele rezultate:

Paired Samples Statistics
107,9000 20 6,0166 1,3454
107,9500 20 5,3062 1,1865nivelul anxietatii
inainte de terapie
nivelul anxietatii
dupa terapiePair
1Mean N Std. DeviationStd. Error
Mean

Paired Samples Correlations
20 -,259 ,270nivelul anxietatii inainte
de terapie & nivelulanxietatii dupa terapiePair1N Correlation Sig.

Paired Samples Test
-0.05 8,9940 2,0111 -4,2593 4,1593 -,025 19 ,980nivelul anxietatii in a
de terapie – nivelul
anxietatii dupa teraPair
1Mean Std. Deviatio nStd. Error
Mean Lower Upper95% Confidence
Interval of the
DifferencePaired Differences
t df Sig. (2-tailed)

Rezultatele sunt organizate în trei tabele, pent ru fiecare dintre acestea vom analiza celulele.
Tabelul PAIRED SAMPLES STATISTICS:
1. conține perechea de variabile analizat ă; variabilele trebuie s ă fie perechi, adic ă să provină de la
aceeași subiecți și fie cuantificate cu aceea și unitate de m ăsură
2. conține mediile celor dou ă grupe analizate: M ini=107,9, M fin=107,95
3. prezintă numărul de subiec ți din fiecare e șantion, N=20
4. conține deviațiile standard a scorurilor fiec ărui eșantion: S ini=60,1, S fin=5,3 1 2 3 4
5
6
7
8 9 10 11
12 13
14 15

LOREDANA GHERASIM

2985. conține abaterile standard ale popula țiilor de e șantioane de N subiec ți din care provin
eșantioanele noastre
Tabelul PAIRED SAMPLES CORRELATIONS
6. coeficientul de corela ție dintre cele dou ă variabile pereche
7. pragul de semnifica ție al corela ției, adică probabilitat ea de eroare dac ă am afirma c ă există o
legătură între cele dou ă variabile
Tabelul PAIRED SAMPLES TESTS
8. conține numele perechii de variabile și precizeaz ă diferența dintre variabile, în cazul nostru
anx1-anx2
9. cuprinde diferen ța medie dintre cele dou ă grupe de subiec ți. Valoarea negativ ă indică faptul că
anxietatea ini țială este mai mic ă comparativ cu cea final ă
10. cuprinde abaterea standard a e șantionului rezultat din diferen țele celor dou ă eșantioane
11. indică abaterea standard a popula ției de eșantioane care cuprinde toate e șantioanele de
aceeași mărime
12. indică intervalul de încredere de 95%al diferen ței dintre mediile celor dou ă grupe
13. valoarea lui t, adică nota t a eșantionului de diferen țe în cadrul popula ției de eșantioane:
t(19)=-0,02
14. gradele de libertate pentru care este calculat ă nota t, df=19
15. pragul de semnifica ție sau probabilitatea de eroare atunci când respingem ipoteza de nul:
p=0,980 În continuare prezent ăm rezultatele ob ținute în urma analizei realizat ă anterior:
Mediile inițiale și finale ale subiec ților: M
ini=107,9, M fin=107,95
Valoarea lui t și a pragului de semnifica ție: t(19)=-0,02, p=0,980.
Interpretarea se face în func ție de valoarea lui t și pragul de semnifica ție. Reamintim c ă pentru
a respinge ipoteza de nul trebuie s ă avem cel mult 5% erori (p ≤0,05). În cazul nostru se constat ă că nu
apare o diferen ță semnificativ ă între nivelul ini țial și cel final al anxiet ății (dacă am respinge ipoteza de
nul am gre și în 98% din cazuri sau cu alte cuvinte valoarea lui t se plaseaz ă în zona de încredere a
ipotezei de nul). Subiec ții au acela și nivel al anxiet ății după intervenția terapeutic ă, astfel că putem
spune că terapia nu a avut efect, nu a îmbun ătățit starea subiec ților.
Corelația ne arată dacă subiecții își schimbă ierarhia unii fa ță de alții, nu numai nive lul variabilei
dependente. Avem trei situa ții posibile:
• lipsa corela ției semnificative: în acest caz nu exist ă o legătură între ierarhia subiec ților la prima cu
cea de al dou ă măsurare. Putem afirma c ă diferențele între m ăsurători nu sunt sistematice,
intervenția acționând oarecum haotic.
• corelație pozitivă semnificativ ă: indică faptul că ierarhia subiec ților se păstrează de la o m ăsurare la
alta. Cei care aveau rezu ltate mici la prima m ăsurare au rezultate mici și la a doua, iar cei care aveau
rezultate mari la prima m ăsurare au rezultate mari și la a doua m ăsurare.
• corelație negativă, semnificativ ă: indică faptul că ierarhia subiec ților se inverseaz ă de la o m ăsurare
la alta. Cei care aveau rezultate mici la prima m ăsurare au rezultate mari la a doua, iar cei care
aveau rezultate mari la prima m ăsurare au rezultate mici la a doua m ăsurare.
În exemplu nostru avem prima situa ție corelație nesemnificativ ă, r=-0,25, p=0,270, ceea ce
indică faptul că cele două variabile sunt independente una de cealalt ă, deoarece diferen țele nu sunt
sistematice.

ANALIZA COMPUTERIZAT Ă A DATELOR

299III.5. TESTUL T PENTRU COMPARAREA A DOU Ă EȘANTIOANE INDEPENDENTE

Acest test se folose ște când dorim s ă analizăm influența unei variabile independente, care
presupune e șantioane independente de subiec ți. Pentru a demonstrat modul de utilizare a testului vom
folosi datele din baza de date baza1.sav. Vom analiza dac ă genul subiec ților influen țează nivelul inițial
al anxietății pacienților. În acest caz variabila independent ă este genul subiec ților (cu dou ă grade de
intensitate, 1 – subiec ți de sex masculin și 2 – subiec ți de gen feminin), variabila dependent ă fiind nivelul
inițial al anxiet ății. În funcție de variabila independent ă se creeaz ă două grupe de subiec ți independen ți
sau diferiți (grupul 1 va fi fo rmat numai din subiec ții de gen masculin, iar gr upul 2 numai din subiec ți de
gen feminin). Fiecare subiect va putea fa ce parte doar dint r-un singur grup.
Ipoteza de cercetare : subiecții de sex masculin vor av ea un nivel al anxiet ății inițiale diferit de
cel al subiec ților de gen feminin
Ipoteza de nul : subiecții de gen masculin și feminin vor avea acela și nivel al anxiet ății inițiale.

Folosirea SPSS pentru compararea a dou ă eșantioane independente
Aplicarea testului t pentru eșantioane independente se face ac tivând meniul ANALYZE –
COMPARE MEANS, op țiunea INDEPENDENT SAMPLES T TEST:

Vom introduce variabila dependent ă (nivelul anxiet ății înainte terapiei) în câmpul TEST
VARIABLE și variabila independent ă în câmpul GROUPING VARIABLE:

Sunt trei câmpurile importante pe care trebuie s ă le avem în vedere:
1. câmpul cu variabilele din baza de date 2. câmpul în care vom introduce variabila dependent ă, adică variabila asupra c ăreia dorim s ă
analizăm influența variabilei independente. 1
2
3
4

LOREDANA GHERASIM

3003. câmpul unde introducem variabila independent ă sau variabila de grupare (cea dup ă care
grupăm subiecții).
4. butonul care permite precizarea celor dou ă niveluri ale variabile i independente; chiar dac ă
variabila independent ă are mai multe grade de intensit ate, se pot preciza doar dou ă dintre acestea.
Activarea butonului DEFINE GROUPS deschide o fereastr ă unde vom trece valorile
corespunz ătoare celor dou ă grupuri alese pentru compara ție (în acest caz variabila independent ă are
doar două niveluri 1 și 2):

În fereastra OUTPUT sunt prezentate urm ătoarele rezultate:

Group Statistics
9104,8889 2,5712 ,8571
11 110,3636 6,9753 2,1031sexul subiectilor
subiecti de gen masculin
subiecti de gen femininnivelul anxietatii
inainte de terapieN Mean Std. DeviationStd. Error
Mean

Independent Samples Test
6,683 ,019 -2,225 18 ,039 -5,4747 2,4605 -10,6442 -,3053
-2,411 13,144 ,031 -5,4747 2,2711 -10,3756 -,5739Equal varianc e
assumed
Equal varianc e
not assumednivelul anxietat i
inainte de tera pF Sig.Levene's Test for
Equality of Variance s
t df Sig. (2-tailed)Mean
DifferenceStd. Error
Difference Lower Upper5% Confidence Inter v
of the Differencet-test for Equality of Means

Vom prezenta succint semnifica ția datelor din tabele:
1. celula indic ă variabila dependent ă (nivelul anxiet ății înainte de terapie) care este analizat ă în
funcție de nivelurile variabilei independente (sexul subiec ților)
2. indică numărul de subiec ți din fiecare grup independent; în cazul nostru avem 9 subiec ți de
sex masculin și 11 de gen feminin
3. conține media fiec ărui grup independent, se observ ă că media grupului de subiec ți de gen
feminin este mai mare: Mgr1=104,8, Mgr2=110,3
4. conține deviația standard pentru fiecare grup în parte: Sgr1=2,5, Sgr2=6,9 1 2 3 4 5
6 7
8 9 10 11

ANALIZA COMPUTERIZAT Ă A DATELOR

3015. precizeaz ă deviația standard pentru popula țiile de eșantioane de N subiecți din care provin
grupele noastre
6. precizeaz ă cele două situații posibile în urma test ării varianței populațiilor: varian țe egale
(primul rând) sau varian țe inegale (al doilea rând)
7. arată valoarea testului F, Levene. Înainte de a analiza al do ilea tabel, vom preciza faptul c ă
testul LEVENE testeaz ă egalitatea varian țelor popula țiilor din care provin e șantioanele noastre. Testul,
notat cu F, testează ipoteza de nul care afirm ă că varianțele popula țiilor din care provin e șantioanele
sunt egale
8. probabilitatea de eroare pentru respingerea i potezei de nul în cazul testului Levene
9. celula con ține valorile lui t pentru varian țe egale sau inegale ale popula țiilor; semnul lui t ne
indică sensul diferen ței dintre medii, fapt de care ne putem da seama uitându-ne la valorile mediilor
10. arată gradele de libertate pentru care a fost calculat ă semnifica ția notei t; indiferent de
rândul pe care îl citim, în func ție de testul Levene, conven ția este ca s ă raportăm gradele de libertate de
pe primul rând (în cazul nostru df=18)
11. conține pragul de semnifica ție sau probabilitatea de eroare care apare atunci când
respingem ipoteza de nul și acceptăm ipoteza de cercetare. Pentru a respinge ipoteza de nul pragul de
semnificație trebuie s ă fie cel mult egal cu 0,05.
Interpretarea rezultatelor ob ținute:
Mediile: subiec ții de gen masculin – Mgr1=104,8, subiec ți de gen feminin – Mgr2=110,3
Testul Levene are valoarea F= 6,6, p=0,019, ceea ce indic ă faptul că putem respinge ipoteza de
nul (care afirm ă că varianțele sunt egale). Gre șim doar în 1,9% din cazuri dac ă respingem ipoteza de
nul. Concluzia este c ă variantele celor dou ă populații sunt diferite, vom extrage nota t și semnifica ția de
pe rândul EQUAL VARIAN CES NOT ASSUMED.
Valoarea lui t și semnifica ția: t(18)=-2,4, p=0,031. Putem resp inge ipoteza de nul, pentru c ă
greșim doar în 3,1% din cazuri și s acceptăm ipoteza de cercetare. Deci, apar diferen țe semnificative
între nivelul anxiet ății inițiale a subiec ților de gen masculin și feminin. Subiec ții de sex masculin au un
nivel al anxiet ății semnificativ mai mic comparativ cu a celor de gen feminin.
Vom analiza efectul variabilei gen asupra nivelului anxiet ății subiecților după terapie.
Rezultatele ob ținute sunt:
Group Statistics
9106,1111 4,0449 1,3483
11 109,4545 5,9053 1,7805sexul subiectilor
subiecti de gen masculin
subiecti de gen femininnivelul anxietatii
dupa terapieN Mean Std. DeviationStd. Error
Mean

Independent Samples Test
1,326 ,265 -1,441 18 ,167 -3,3434 2,3201 -8,2178 1,5309
-1,497 17,545 ,152 -3,3434 2,2334 -8,0444 1,3575Equal varia n
assumed
Equal varia n
not assume dnivelul anxi e
dupa terapi eF Sig.Levene's Test for
quality of Varianc e
t df ig. (2-taile dMean
Differenc eStd. Error
Differenc eLower Upper95% Confidence
Interval of the
Differencet-test for Equality of Means

LOREDANA GHERASIM

302Mediile celor dou ă grupe: Mgr1=106,1, Mgr2=109,4
Testul LEVENE (F=1,3, p=0,256) este nesemnificativ (am gre și în 26,5% din cazuri dac ă am
respinge ipoteza de nul care afirm ă ă varianțele sunt egale). Deci varian țele celor dou ă populații sunt
egale și vom extrage rezultatele din primul rând.
t(18)=1,44, p=0, 167. Valoarea lui t este nesemnificativ ă (am greși în 16,7% din cazuri dac ă am
respinge ipoteza de nul și am accepta ipoteza de cerc etare). Deci nu apar diferen țe semnificative între
nivelul anxiet ății bărbaților și femeilor dup ă terapie.

III.6.
ANALIZA DE VARIAN ȚĂ – ANOVA UNIFACTORIAL
Se folosește atunci când vrem s ă analizăm efectul unei variabile independente, care are mai
mult de dou ă grade de intensitate (sau nivele), as upra variabilei dependente. Pentru a în țelege logica
acestei metode s ă luăm un exemplu. S ă presupunem c ă suntem interesa ți dacă salariul românilor
depinde de nivelul de studi i (nivel general, mediu și superior). Mai precis ne a șteptăm ca subiec ții cu
studii medii s ă aibă un salar mai mic comparativ cu cei cu studii, dar s ă aibă un salariu mai mare
comparativ cu cei cu studii generale.
Reprezentarea grafic ă a situației descrisă anterior este prezentat ă în imaginea de mai jos:

Cele trei linii curbe mici descriu distribu ția salariilor pentru cele trei categorii de studii, iar linia
curbă mai mare descrie distribu ția salariului pentru toate cele trei niveluri de studii luate la un loc. M1,
M2 și M3 reprezint ă salariul mediu pentru fiecare nivel de stud ii, iar MG este salariul mediu total al
tuturor salaria ților. Distanța a reprezintă poziția scorului x fa ță de media grupului din care apar ține, iar
distanța b exprimă poziția scorului x fa ță de valoarea medie a popula ției totale (format ă din cele trei
niveluri de studii la un loc).
Variația totală a salariului popula ției poate fi descompus ă în două părți: o parte din varia ție se
datorează abaterilor fiec ărui scor de la media grupului din care face parte (distan ța a), iar cealalt ă parte
din variație este produs ă de abaterile fiec ărui scor de la media total ă a populației. Pentru a distinge între
grupuri ar trebui ca prima component ă a variației să fie mai mic ă decât cea de a doua, adic ă persoanele
aflate în acela și grup să difere mai pu țin între ele și mai mult de subiec ții din celelalte grupe. Atunci când
variația intragrup este mai mic ă decât varia ția intergrup înseamn ă grupele sunt diferite. M1 M2
MG M3 x
a
b

ANALIZA COMPUTERIZAT Ă A DATELOR

303Analiza de varian ță (simbolul este F, coeficientul Fisher), calculeaz ă raportul între varia ția
provocată de diferen țele întergrupuri, MS B, și variația cauzată de diferen țele intragrup, MS W, (formula de
calcul este F=MS B/MS W) și stabilește dacă acest raport este suficient de mare pentru a putea distinge
între grupe. Semnifica ția coeficientului F se stabile ște în funcție de două grade de liber tate: gradele de
libertate intergrup (valoare dat ă de numărul de grupuri minus 1) și gradele de liberate intragrup (valoare
dată de suma gradelor de liber tate a grupurilor sau de num ărul total de subiec ți mai puțin numărul
grupurilor).
Folosirea SPSS – ANOVA unifactorial
Vom folosi baza de date Baza7.sav și vom analiza efectul variabile i regiune (care are trei grade
de intensitate: 1-european ă, 2-asiatică și 3-africană) asupra indicelui de cre ștere al popula ție.
Ipoteza de cercetare : variabila regiune influen țează valoarea densit ății populație sau indicele de
creștere va varia în func ție de regiune.
Ipoteza de nul : indicele de cre ștere (densitatea) va avea aceea și valoare, indiferent de zona
geografică.
Pentru realizarea acestei analize se desch ide meniul ANALYZE – COMPARE MEANS,
opțiunea ONE WAY ANOVA:

Vom introduce variabila dependent ă (procentul de cre ștere al popula ție) în câmpul
DEPENDENT LIST și variabila independent ă în câmpul FACTOR:

Să analizăm fereastra:
1. câmpul în care sunt afi șate variabilele din baza de date;
2. câmpul în care sunt introduse vari abilele dependente (în ca zul nostru densitatea);
3. este câmpul în care se introduce variabila independent ă sau factor (în exemplul nostru
factorul este regiunea); 1 2
3
4 5 6

LOREDANA GHERASIM

3044. butonul CONTRAST permit e realizarea unor compara ții între grupe în func ție de variabila
independent ă;
5. butonul POST HOC permite alegerea unui anumit tip de contrast post-hoc;
6. butonul OPTIONS con ține elemente de statistic ă descriptivă.
Vom descrie pe scurt op țiunile butonului POST-HOC:

Toate testele de la aceast ă opțiune indică dacă diferențele obținute pe ansamblu prin analiza
testului F se reg ăsesc și la nivelul compara țiilor dintre grupuri luate dou ă câte două. Pragurile de
semnificație a acestor teste sunt ajustate în func ție de num ărul de grupe. Testele sunt prezentate în
ordinea descresc ătoare a puterii lor. Pentru a analiza ef ectul variabilei in dependente asupra celei
dependente se folose ște testul BONFERRONI.
Activarea butonului descriptiv deschide urm ătoarea caset ă:

Op țiunile pe care le vom bifa sunt DESCRIPT IV pentru a vedea mediile celor trei grupe și
reprezentarea grafic ă a efectului MEANS PLOT.
Dup ă activarea butonului OK al ferestrei prin cipale în foia cu rezultate apr urm ătoarele tabele:
Descriptives
procentul de crestere anuala a populatiei
15 ,433 ,376
11 1,724 ,956
11 2,693 ,564
37 1,489 1,149europa
asia
africa
TotalN Mean Std. Deviation

ANALIZA COMPUTERIZAT Ă A DATELOR

305ANOVA
procentul de crestere anuala a populatiei
33,261 2 16,630 39,532 ,000
14,303 34 ,421
47,564 36Between Groups
Within Groups
TotalSum of
Squares df Mean Square F Sig.

Multiple Comparisons
Dependent Variable: procentul de crestere anuala a populatiei
Bonferroni
-1,290* ,257 ,000 -1,939 -,642
-2,259* ,257 ,000 -2,908 -1,611
1,290* ,257 ,000 ,642 1,939
-,969* ,277 ,004 -1,666 -,273
2,259* ,257 ,000 1,611 2,908
,969* ,277 ,004 ,273 1,666(J) regiunea geografi c
asia
africa
europa
africa
europa
asia(I) regiunea geografi c
europa
asia
africaMean
Difference
(I-J) Std. Error Sig. Lower Bound Upper Bound95% Confidence Interval
The mean difference is significant at the .05 level.*.

Vom prezenta succint semnifica ția datelor din tabele:
1. în prima coloan ă sunt trecute cele dou ă componente ale varia ției totale: cea intergrup și
intragrup;
2. în a doua coloan ă sunt trecute devia țiile pătratice care intr ă în componen ța fiecărui tip de
varianță (intergrup și intragrup);
3. în aceast ă coloană sunt prezentate gradele de liber tate pentru care se calculeaz ă valoarea
prag a lui F, gradul de libertate intergrup (sau between) este 2 (3 grupe-1), iar cel intragrup este 34
(numărul total de subiec ți este 37 minus 3 num ărul de grupe);
4. în aceast ă coloană sunt prezentate componente ale testului F;
5. conține valoarea testului F ob ținută prin împărțirea mediei varian ței intragrup la media
varianței intergrup (în exemplul nostru: 16,6/0,4=39,5);
6. conține semnifica ția testului F sau probabilitatea de eroare când respingem ipoteza de nul.
Din datele pe care le avem pân ă acum, F(2,34)=39,5, p <0,001, putem concluziona c ă pe
ansamblu, regiunea influen țează valoarea indicelui demografic. Putem spune c ă doar pe ansamblu se
întâmplă acest lucru pentru c ă rezultatele analizei A NOVA se referă doar la existen ța diferențelor globale
dintre grupe, f ără a preciza care sunt grupele între care apar diferen țe semnificative.
Pentru a vedea diferen țele dintre grupuri trebuie s ă analizăm rezultatele prezentate în tabelul
POST HOC TESTS:
7. prima coloan ă indică nivelul de referin ță al variabilei independente, fa ță de care se face
comparația. Coloana este notat ă cu I.
8. coloana a doua indic ă nivele variabilei inde pendente care sunt comparate cu nivelurile de
referință. Coloana este notat ă cu J.
9. coloana afi șează valorile diferen țelor dintre coloana I și J. 1 2
3 4 5 6
7 8 9 11
10

LOREDANA GHERASIM

30610. steluța care apare în dreptul diferen țelor dintre medii indic ă existența unor diferen țe
semnificative între acestea.
11. coloana con ține valoarea exact ă a pragului de semnifica ție pentru fiecare diferen ță.
Astfel, în exemplul nostru observ ăm următoarele rezultate:
Mgr1(Europa)-Mgr2(Asia)=-1,2, p <0,001
Mgr1(Europa)-Mgr3(Africa)=-2,2, p <0,001
Mgr2(Asia)-Mgr3(Africa)=-0,96, p=0,004
Între toate grupele apa diferen țe semnificative, cea mai mare va loarea a indicelui demografic îl
are regiunea african ă (indicele este semnificativ mai mare comparativ cu celelalte dou ă regiuni),
urmează apoi regiunea asiatic ă (indicele este semnificativ mai mare decât cel al regiunii europene, dar
mai mici decât cel al regiunii africane). Pe ultimul loc se plaseaz ă Europa cu cel mai mic (semnificativ
mai mic comparativ cu zona asiatic ă și africană) indice demografic.
În imaginea de mai jos apare grafic ă a efectului:

În continuare vom analiza efectu l variabilei regiune asupra densit ății. Rezultatele ob ținute sunt
următoarele:

ANOVA
Numar de oameni/ kilometru patrat
3133461 2 1566730,638 2,072 ,142
25709646 34 756166,057
28843107 36Between Groups
Within Groups
TotalSum of
Squares df Mean Square F Sig.

ANALIZA COMPUTERIZAT Ă A DATELOR

307Multiple Comparisons
Dependent Variable: Numar de oameni/ kilometru patrat
Bonferroni
-627,447 345,186 ,234
21,172 345,186 1,000
627,447 345,186 ,234
648,618 370,789 ,268
-21,172 345,186 1,000
-648,618 370,789 ,268(J) regiunea geografica
asia
africa
europa
africa
europa
asia(I) regiunea geografica
europa
asia
africaMean
Difference
(I-J) Std. Error Sig.

Din tabelul ANOVA extragem valoarea și semnifica ția lui F: F(2,34)=2, 07, p=0,142. Const ăm nu
există un efect al variabilei regiune asupra densit ății populației (nu putem respinge ipoteza de nul pentru
că am greși în 14,2% din cazuri). Deci, densitatea popula ției este aproximativ aceea și indiferent de
regiune: european ă, asiatică sau african ă.
Testul POST HOC Bonferroni nu semnaleaz ă diferențe semnificative între cele trei grupe care
se formeaz ă în funcție de intensit ățile variabilei independente.

III.7. ANOVA UNIVARIATE

Cele mai multe studii realizate în domeniul psihologiei studiaz ă efectul mai multor factori
(variabile independente) asupra une ia sau mai multor variabile dependente. Metodele prezentate pân ă
acum (testele t și ANOVA unifactorial) permit doar eviden țierea influen ței separate a fiec ărui factor.
Pentru a analiza efectelor mai multor variabi le independente se poate fo losi analiza de varian ță
factorială. Logica acestei metode este identic ă cu a modelului ANOVA unifactorial, la fel coeficientul F
măsoară raportul dintre varia ția cauzată de împărțirea pe grupuri și variația intrinsec ă a grupurilor.
Acest tip de analiz ă prezintă două tipuri de note F corespunz ătoare celor dou ă tipuri de efecte
pe care le m ăsoară. Efectele principale m ăsoară influența unei variabile indepen dente asupra variabilei
dependente, indiferent de ac țiunea celorlalte variabile inde pendente. Efectele de interac țiune măsoară
influența combinat ă a două sau mai multor variabile in dependente asupra variabilei dependente.

Folosirea SPSS – GENERAL LINEAR MODEL – UNIVARIATE
Pentru a prezenta modul de folosire al progr amului SPSS pentru aplicarea acestei metode vom
crea o nou ă bază de date (baza8.sav) care con ține trei variabile: nota (notele ob ținute de studen ți la
examen), niv_stim (nivelul stimei de sine, cu dou ă valori: 1 – nivel sc ăzut al stimei de sine și 2 – nivel
ridicat al stimei de sine), niv_anx (nivelul de anxietate cu dou ă valori: 1 – nivel sc ăzut de anxietate
scăzut și 2 nivel ridicat de anxietate). Prezent ăm mai jos datele care trebuie introduse în programul
SPSS:
Nota: 9, 9, 8, 10, 9, 10, 6, 8, 7, 7, 6, 5, 6, 7, 8, 8, 8, 7, 10, 7, 8, 7, 8, 9, 6, 5, 7, 5, 6, 5, 8
Niv_stim: 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2
Niv_anx: 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 1, 1, 1, 1, 1,1, 1, 1, 2, 2, 2, 2, 2, 2, 2

LOREDANA GHERASIM

308În acest exemplu avem dou ă variabile independente niv_stim (nivelul stimei de sine) și niv_anx
(nivelul de anxietate), fiecare din ele având dou ă grade de intensitate. Variabila dependent ă este nota
obținută la examen.
Vom analiza efectul de interac țiune (sau combinat) al nivelului de anxietate și al stimei de sine
asupra notei ob ținute la examen.
Pentru analiza efectului combinat voma acti va meniul ANALYZE – GENERAL LINEAR MODEL
opțiunea UNIVARIATE. Odat ă activată comanda pe ecran apare urm ătoarea fereastr ă:

Vom explica aceast ă fereastră:
1. conține variabilele din baza de date
2. în câmpul DEPENDENT VARIABLE se introduce variabila dependent ă; se poate introduce o
singură variabilă dependent ă
3. în câmpul FIXED RACTOR se introduc variabilele independente (sau factorii) a c ăror efect
este controlat (nu este cauzat de întâmplare)
4. în câmpul RANDOM FACTOR pot si trecute variabilele independente, care nu ne intereseaz ă
în mod direct sau a c ăror acțiune nu o putem controla
5. în câmpul COVARIATE pot fi trecute va riabile independente sau va riabile dependente care
ar putea avea o leg ătură sau un efect asupra variabile i dependente; astfel vom vedea dac ă variabilele
noastre independente (trecute în câ mpul FIXED FACTORS) influen țează variabila dependent ă
indiferent de ac țiunea factorilor covarian ți.
6. aici se trec valorile pe ca re le putem folosi atunci când b ănuim că unele variabile
independente (factori) ar corela între ele; este o op țiune pentru utilizatorii avansa ți și nu recomand ăm
folosirea metodei f ără cunoașterea precis ă a semnifica ției sale.
Pentru exemplul nostru, variabilele independent e sunt nivelul stimei de sine (NIV_STIM) și
nivelul anxiet ății (NIV_ANX), deci vom trece aceste variab ile în câmpul FIXED FACTORS. Variabila
dependent ă este NOTA (vom trece aceast ă variabilă în câmpul DEPENDENT VARIABLE: 1
5 4 3 2
6

ANALIZA COMPUTERIZAT Ă A DATELOR

309

În partea dreapt ă fereastra principal ă există o serie de butoane care con țin opțiuni complexe de
analiză. Precizăm nu vom folosi în analiz ă toate opțiunile, acestea putând fi folosite pentru design-uri
experimentale mult mai complexe.
Butonul MODEL activeaz ă următoarea fereastr ă:

Opțiunile din aceast ă fereastră folosesc la construir ea unor modele de analiz ă în condițiile în
care situația investigat ă este complicat ă (conține multe variabile independente). S ă analizăm fereastra:
1. opțiunea FULL FACTORIAL este marcat ă implicit, ceea ce înseamn ă că se vor lua în calcul
toate efectele principale și combinațiile posibile de factor i. Pentru modelele simple se recomandat ă
utilizarea acestei op țiuni
2. opțiunea CUSTOM se folose ște dacă se dorește simplificarea modelul cu care se lucreaz ă,
bifarea acestei op țiune activeaz ă automat câmpurile și butoanele care se g ăsesc dedesubt, permi țând
calculul anumitor efecte pentru anumi ți factori
3. folosind op țiunile care se deschid din câmpul IN TERACTION, putem alege efectele pe care
vrem să le analizăm; cu ajutorul butonului cu s ăgeată se pot selecta factor ii pentru care dorim s ă se
calculeze efectele. 1 2
4 3

LOREDANA GHERASIM

3104. permite alegerea tipului de interac țiune dintre variabilele independente (cât de complex ă să
fie interacțiunea) și calculul unor coeficien ți de regresie ai modelului (exist ă o legătură strânsă între
Regresia liniar ă și analiza de varian ță).
Pentru exemplul nostru, vom p ăstra opțiunea marcat ă implicită FULL FACTORIAL. Se apas ă
butonul CONTINUE pentru a reveni la fereastra principal ă.
Butonul CONTRAST deschide urm ătoarea fereastr ă:

Opțiunile acestei ferestre permit comparar ea diferitelor grupuri rezultate din împ ărțirea
subiecților în func ție de valorile sau categoriile variabile lor independente. Aici sunt trecute doar
variabilele independente. Se alege variabila independent ă pentru care se dore ște calculul contrastul
(diferența dintre nivelele sale de varia ție). Apoi, se alege tipul de co ntrast din câmpul CONTRAST. Se
recomandă tipul de contrast DIFFERENCE.
Pentru exemplificare, am ales variabi la NIV_STIM (nivelul stimei de sine).

Prin tipul de contrast DIFFERE NCE, se cere programului s ă analizeze dac ă între cele dou ă
nivele ale variabilei nivel al stimei de sine vor ap ărea diferen țe în ceea ce prive ște notele ob ținute. Cu
alte cuvinte vom vedea dac ă cei cu stim ă de sine ridicat ă obțin note diferite de cei cu stim ă de sine
scăzută). După alegerea tipului de contrast trebuie activat butonul CHANGE.

La fel se procedeaz ă și pentru variabila independent ă nivelul anxiet ății.

ANALIZA COMPUTERIZAT Ă A DATELOR

311

Butonul PLOTS activeaz ă o fereastră dedicată reprezentărilor grafice:

Pe axa HORIZONTAL AXIS se introduce variabila independent ă ale cărei categorii dorim s ă le
reprezentăm pe axa X.
Pe axa SEPARATE LINES se introduce variabila pent ru care se vor trasa linii ce vor reprezenta
categorii diferite ale factorului.
SEPARATE PLOTS se folose ște introducerea celui de al tre ilea factor, ceea ce permite
obținerea mai multor grafice, care indic ă relația dintre variabilele introdus e anterior pentru fiecare nivel
al factorului trei.
În exemplul nostru avem doar doi factori. În consecin ță vom reprezenta notele la examen în
funcție de nivelul stimei de sine, NIV_ST IM (pe care o vom trece pe axa X) și nivelul anxiet ății,
NIV_ANX (reprezentat ă prin linii separate), ca în imaginea de mai jos:

LOREDANA GHERASIM

312Se activeaz ă butonul ADD. Acest buton permite realizar ea mai multor grafice, deoarece în urma
activării acestuia câmpurile ferestrei se golesc.

Revenim din nou în fereastra principal ă pentru a activa butonul POST HOC care va deschide
fereastra:

Acest buton are op țiuni similare cu butonul POST HOC din fereastra ANOVA ONE-WAY.
Această opțiune se folose ște doar când variabile i ndependente au mai mult de dou ă nivele de varia ție.
Pentru a analiza diferen țele dintre grupe se folose ște testul Bonferroni.
Pentru exemplul nostru nu avem nevoie de compara ții POST HOC, deoarece ambele variabile
independente au doar dou ă nivel. Vom reveni la fereastra principal ă fără a activa vreo op țiune.
Butonul SAVE activeaz ă următoarea fereastr ă:
Opțiunile la care face refe rire acest buton se refer ă la o
altă metodă statistică numită Regresia liniar ă. Nu vom mai
comenta aceste op țiuni, dar men ționăm că ele faciliteaz ă
tratarea analizei de variant ă ca un model particular de regresie.
Recomand ăm folosirea acestor op țiuni doar celor care cunosc
regresia.
Butonul OPTIONS activeaz ă o fereastr ă specifică
acestei analize de varian ță:

ANALIZA COMPUTERIZAT Ă A DATELOR

313

Prezentăm elementele principale ale ferestrei:
1. prezintă toate combina țiile de factori pentru care avem grupuri diferite de subiec ți, permițând
calcularea mediei pentru fiecare grup de subiec ți în parte. Op țiunea OVERALL se refer ă la media
calculată pentru toți subiecții, neîmpărțiți în grupuri
2. este câmpul în care se tr ec factorii pentru care dorim s ă calculăm mediile grupurilor de
subiecți
3. prezintă opțiuni ce permit calcularea mai multor parametri. Dintre toate, ne intereseaz ă
calculul parametrilor de scriptivi (media, devia ția standard, minimul și maximul), precum și testele de
omogenitate (care trebuie s ă nu fie semnificative pentru a putea aplica acest model ANOVA).
După selecția opțiunilor fereastr ă arată astfel:

În continuare vom prezenta foaia cu rezultat e. Primele elemente ale output-ului se refer ă la
parametrii descriptivi ai modelului. Primul tabel precizeaz ă numărul de subiec ți pentru fiecare grup
obținut în func ție de nivelurile fiec ărei variabile independente. De exemplu, sunt 16 subiec ți în grupul
celor cu nivel sc ăzut al stimei de sine. 1
3 2

LOREDANA GHERASIM

314

Al doilea tabel precizeaz ă mediile totale precum și cele corespunz ătoare fiecărui subgrup de
subiecți, subgrup determinat de catego riile factorilor din model. Ac este date sunt rezultatul op țiunilor
marcate de noi din fereastra butonului OPTIONS.

Mai departe, în foaia de rezultate sunt pr ezentate elementele cele mai importante ale
outputului, rezultatele testului F.

Tabelul cu testul lui Levene reprezint ă tocmai testul de omogenitate, care trebuie s ă fie
nesemnificativ pentru a utiliza aceast ă metodă.

Cele mai importante element e ale tabelului se refer ă la testul F. Ne intereseaz ă numai liniile
marcate prin acolade.
1. arată variabilele ale c ăror efecte le lu ăm în calcul: 1 2 3 4

ANALIZA COMPUTERIZAT Ă A DATELOR

315• linia cu NIV_STIM arat ă efectul principal al factorului ni velul stimei de sine, indiferent de
acțiunea celuilalt factor;
• NIV_ANX arat ă efectul principal al factorului nivel de anxietate, indiferent de ac țiunea
celuilalt factor;
• linia NIV_STIM*NIV_ANX se refer ă la efectul de interac țiune al celor dou ă variabile
asupra variabilei dependente;
2. conține notele F corespunz ătoare efectelor principale și de interac țiune;
3. conține pragurile de semnifica ție ale testelor F.
4. conține gradele de libertate between subjects și within subjects
Pentru exemplu nostru s-a ob ținut doar un singur F semnificativ (p<0,05) și anume cel
corespunz ător liniei NIV_STIM (F(1,30)= 22,13, p<0,001). Deci apare un ef ect principal al variabilei
nivelul stimei de sine asupra notel or la examen. Restul efectelor sunt nesemnificative. Nu apare un
efect principal al variabilei nivelul anxiet ății (F(1,30)=2,7, p=0,107), deci notele subiec ților nu depinde de
cât de anxio și sunt ace știa. De asemenea, nu apare un efect de interac țiune al variabilelor
independente nivelul stimei de sine și nivelul anxiet ății (F(1,30)=0,02, p=0,881) , deci nota la examen nu
este influen țată de efectul
combinat al nivelului de
anxietate și al stimei de sine.
Pentru a vedea modul
în care nivelul stimei de sine
(NIV_STIM) influen țează nota la
examen, trebuie s ă ne uităm în
tabelul de contrast:
Testul de contrast
calculează diferența între media
notelor ob ținute de subiec ții cu
nivel ridicat al stimei de sine și a celor cu nivel sc ăzut al stimei de sine (LEVEL 2 vs. LEVEL l). Aceast ă
diferență a fost comparat ă cu situa ți a î n c a r e c e l e d o u ă grupuri ar fi ob ținut valoarea zero
(HYPOTHESIZED VALUE). Pragul de semnifica ție (notat cu SIG) indic ă apariția unei diferen țe
semnificative. Sensul diferen ței
(-1,93) indic ă faptul că cei cu
nivel ridicat al stimei de sine
(LEVEL 2) au ob ținut note mai
semnificativ mai mici
comparativ cu cei cu nivel
ridicat al stimei de sine (LEVEL
1).
Tabelul al ăturat reia
analiza contrastelor pentru
factorul nivelul anxiet ății:
Aici nu mai apar diferen țe semnificative (fapt confirmat și de lipsa unui efect principal pentru
această variabilă), deci nivelul anxiet ății nu afecteaz ă nota la examen (Mdif=-0,68, p=0,107).
Următoarele tabelele prezint ă media ob ținută pe ansamblu (tabelul l), mediile ob ținute pentru
fiecare factor în parte (tabelele 2 și 3) și cele pentru grupurile de subiec ți rezultat al combin ării nivelurilor
celor două variabile independente. Aceste tabele ajut ă la interpretarea sensului diferen țelor la testele de

LOREDANA GHERASIM

316contrast și interacțiunii variabilelor. Tabelele prezint ă și deviațiile standard și limitele valorii medii pentru
un interval de încredere de 95%.

La finalul foii de rezultat e apare reprez entarea grafic ă a interac țiunii dintre variabilele
independente:

Liniile graficul ui reprezint ă nivelurile diferite de anxietate. Efectul principal al variabilei
NIV_STIM poate fi observat grafic cu u șurință: notele ob ținute de subiec ții cu stimă de sine ridicat ă au
valoare mai mic ă comparativ cu cei care au stim ă de sine sc ăzută. Putem concluziona, pentru exemplul
nostru, că nota la examen este influen țată de nivelul stimei de sine dar nu și de nivelul anxiet ății. Mai
mult, nivelul stimei de sine ac ționează asupra notei la examen în acela și mod indiferent de nivelul
anxietății.

ANALIZA COMPUTERIZAT Ă A DATELOR

317III.8. ANOVA REPETED MEASURES

Modelul ANOVA UNIVARIATE prezentat anterio r permite analiza efectului de interac țiune a
două variabile independente care presupun grupe in dependente de subiec ți. Atunci când una dintre
variabilele independente presupune e șantioane perechi sau m ăsurări repetate, trebuie s ă utilizăm un alt
model de analiz ă de varianță, și anume modelul ANOVA cu măsurări repetate. Acest model de analiz ă de
varianță se utilizeaz ă atunci când se dore ște analiza efectului de interac țiune a dou ă variabile
independente, una presupunând e șantioane independente, iar cealalt ă măsurări repetate. La fel ca și
modelul de varian ță prezentat anterior și acest tip de analiz ă prezintă două tipuri de note F
corespunz ătoare tipurilor de efect m ăsurate. Efectele principale m ăsoară influența fiecărei variabile
independente asupra variabilei de pendente, indiferent de ac țiunea altei variabile independente. Efectele
de interac țiune măsoară influența combinat ă a două sau mai multor variabile independente asupra
variabilei dependente.

Folosirea SPSS – GENERAL LINE AR MODEL – REPETED MEASURES
Pentru a prezenta modul de utilizare a program ului SPSS pentru aplicarea acestei metode vom
crea o nou ă bază de date (baza 8.sav) care con ține trei variabile: ANX1 (scorurile pacien ților la scala de
anxietate înaintea terapiei , ANX2 (scorurile pacien ților la scala de anxietate dup ă terapie), și TERAPIE
(tipul de terapie utilizat, cu dou ă valori care corespund celor dou ă tipuri de interven ții terapeutice 1- tip 1
de terapie și 2 – tip 2 terapie). Prezent ăm mai jos datele, care trebui e introduse în programul SPSS:
ANX1: 109, 110, 104, 106, 112, 105, 121, 102, 103, 104, 106, 104, 105, 108, 124, 115, 109,
103, 104, 104,
ANX2: 110, 102, 103, 105, 115, 116, 110, 110, 112, 103, 102, 104, 110, 110, 102, 102, 102,
109, 115, 117,
TERAPIE: 1, 2, 1, 2, 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2
Variabila dependent ă este reprezentat de scorurile ob ținute la scala de m ăsurare a anxiet ății
înainte și după terapie. Variabila independent ă tip de terapie (TERAPIE) are dou ă nivele (tip 1 de
terapie și tip 2 terapie) și presupune e șantioane independente. Pentru a analiza efectul terapiei asupra
stării pacienților trebuie s ă comparăm nivelul ini țial și cel final al anxiet ății pacienților. Astfel, se
formează o nouă variabilă independent ă, cu măsurări repetate, pe care o vom denumit TRT. Aceast ă
variabilă independente se refer ă la momentul m ăsurării anxietății pacienților și are două niveluri, 1 –
pretest (înainte terapiei) și 2 posttest (dup ă terapie).
Scopul cercet ării ar putea fi analiza eficien ței interven țiilor
terapeutice asupra nivelului anxiet ății.
Activarea comenzilor pentru acest model ANOVA
se face din meniul ANALYZE – GENERAL LINEAR
MODEL op țiunea REPETED MEASURES. Dup ă activarea
comenzii, pe ecran apare fereastra al ăturată:

Pentru a putea face analiza trebuie definit ă variabila care presupune m ăsurări repetate, în cazul
nostru aceast ă variabilă este măsurarea repetat ă a anxietății înainte și după terapie (sau test-retest). Cu
alte cuvinte trebuie denumit ă variabila independent ă care presupune m ăsurări repetate și trebuie
precizate nivelurile acesteia. În locu l denumirii generice a variabilei care presupune m ăsurări repetate,
care apare în câmpul WITHIN-SUB JECTS FACTOR NAME (factor 1) vom trece numele noii variabile

LOREDANA GHERASIM

318TRT. În câmpul NUMBER OF LEVEL trebuie trecut
numărul de măsurători repetate. Pentru exemplul nostru
vom trece valoarea 2 pentru c ă anxietatea este m ăsurată
înainte și după terapie (vezi imaginea din dreapta):

Se activeaz ă butonul ADD, pentru a putea
utiliza metoda și defini variabilele independente (vezi
imaginea din stânga):

După salvarea definirii factorului cu m ăsurări repetate se activeaz ă butonul DEFINE, care
activat deschide o nou ă fereastră:

Vom prezenta câmpurile acestei ferestre:
1. este câmpul ce con ține variabilele din baza de date;
2. aici se introduc variabilele care reprezint ă niveluri ale variab ilei independente cu m ăsurări
repetate;
3. în acest câmp introducem variabilele independente care presupun e șantioane independente;
4. se introduc variabile independente sau dep endente care ar putea avea leg ătură sau ar
influența variabila dependent ă.
În cazul nostru variabilele ANX1 și ANX2 reprezint ă nivelurile variabilei TRT, în consecin ță
aceste variabile se introduc în câm pul WITHIN-SUBJECTS VARIABLES (TRT).
Variabila tip de terapie (TERAPIE) se intr oduce în câmpul BETWEEN-SUBJECTS FACTOR,
această variabilă presupunând grupe in dependente de subiec ți și reprezentând variabila factor. 1 2
3
4

ANALIZA COMPUTERIZAT Ă A DATELOR

319

În partea de jos a ferestrei princi pale apar o serie de butoane care con țin opțiuni complexe de
analiză. Opțiunile sunt similare celor care au ap ărut în modelul de analiz ă de varianță prezentat anterior
ANOVA UNIVARIATE.
Butonul MODEL activeaz ă următoarea fereastr ă:

Opțiunile din aceast ă fereastră folosesc la construirea unor modele în condi țiile în care situa ția
investigată este prea complicat ă. Pentru exemplul nostru, vom
păstra opțiunea selectat ă implicit FULL FACTORIAL, ceea ce
va însemna c ă în foia cu rezultate vor ap ărea atât efectele
principale ale celor dou ă variabile independente cât și efectul
de interacțiune al acestora.
Butonul CONTRAST activeaz ă următoarea caset ă de
dialog:

LOREDANA GHERASIM

320Se observă că deja este selectat tipul de c ontrast pentru variabila independent ă care presupune
măsurări repetate (TRT Polynomial). Trebuie s ă alegem tipul de
contrast pentru variabila TERAPIE, care presupune dou ă
niveluri. Vom selecta tipul de contrast Difference.
Butonul PLOTS activeaz ă o fereastr ă dedicată
reprezentărilor grafice. Vom r eprezenta nivelul anxiet ății
pacienților în func ție de tipul terapiei (pe care o vom trece pe
axa X) și momentul evalu ării anxietății TRT (reprezentat ă prin
linii separate):
Se activeaz ă apoi butonul ADD pentru ca aplica ția SPSS s ă rețină reprezentarea grafic ă a
interacțiunii dintre variabilele independente:

Butonul POST HOC deschide urm ătoarea fereastr ă:

Acest buton are op țiuni similare butonul ui POST HOC din fereastra ANOVA ONE-WAY și
UNIVARIATE. Op țiunea se folose ște atunci când variabile independente au mai mult de dou ă nivele de
variație. De asemenea, pentru a analiza diferen țele dintre grupe se folose ște testul Bonferroni.
Pentru exemplul nostru nu avem nevoie de compara ții POST-HOC, pentru c ă variabilele
independente au dor dou ă niveluri. În consecin ță, vom reveni la fereastra principal ă fără a activa vreo
opțiune.

ANALIZA COMPUTERIZAT Ă A DATELOR

321 Butonul SAVE activeaz ă următoarea fereastr ă:

La fel ca la ANOVA UNIVARIATE, butonul
se referă la o altă metodă statistică numită Regresia
liniară, facilitând tratarea analizei de variant ă ca un
model particular de regresie. Recomand ăm
folosirea acestor op țiuni doar celor care cunosc
regresia.
Butonul OPTIONS activeaz ă o fereastr ă
specifică analizei de variant ă:
La OPTIONS avem posib ilitatea de a cere
calculatorului s ă ne afișeze mediile grupelor de
subiecți în funcție de fiecare variabil ă independent ă,
precum și în funcție ambele variabile, deci pentru
fiecare grup experimental.
În continuare vom prezenta foaia cu rezultat e. Primele elemente ale output-ului se refer ă la
parametrii descriptivi ai model ului. Primul tabel precizeaz ă nivelurile (ANX1 și ANX2) variabilei cu
măsurări repetate (TRT).

Al doilea tabel precizeaz ă numărul de subiec ți pentru fiecare grup ob ținut în func ție de nivelurile
factorului care presupune e șantioane independente:

Următorul tabel precizeaz ă mediile pentru fiecare subgrup de subiec ți format în func ție de toate
categoriile factorilor din model.

LOREDANA GHERASIM

322

Următoarele dou ă tabele prezint ă efectele principale și de interac țiune ale variabilelor
independente. La fel ca și la modelul de analiz ă de varianță anterior se extrag valorile coeficien ților F,
pragul de semnifica ție și gradele de libertate.

În primul tabel se constat ă că nu apare un efect al variabile i TRT (p>0,050), ceea ce indic ă
faptul că nivelului ini țial al anxiet ății pacienților nu difer ă de nivelul final al anxiet ății pacienților după
terapie (F(1,18)=0,006, p=0,940). Faptul c ă subiecții au acela și nivel al anxiet ății după intervenția
terapeutică indică faptul că terapia utilizat ă nu a avut efect.
De asemenea, nu apare un efect combinat al variabilelor independente, TRT*TERAPIE
(F(1,18)=0,267, p=0,661). Deci subiec ții au acela și nivel al anxiet ății înainte și după terapie, indiferent
de tipul de terapie utilizat.
Următorul tabel indic ă efectul variabilei independente tip de terapie, f ără a ține seama de
momentul m ăsurării F(1,18)=13,23, p= 0,002. Se constat ă că apare un efect principal al acestei
variabilei independente asupra nivelului anxiet ății pacienților după terapie.
Pentru a vedea cum
influențează tipul de terapie nivelul
anxietății pacienților vom analiza
tabelul Custom Hypothesis.
Astfel, pacien ții care au primit
tipul 2 de terapie au un nivel al
anxietății semnificativ mai ridicat
comparativ cu pacien ții care au primit
terapia de tip 1 (Mdif=4,40, p=0,002).

ANALIZA COMPUTERIZAT Ă A DATELOR

323Următoarele tabelele prezint ă media ob ținută pe ansamblu (tabelul l), mediile ob ținute pentru
fiecare factor în parte (tabelele 2 și 3) și pentru grupele de subiec ți obținute în urma combin ării
nivelurilor celor dou ă variabile independente (tabel ul 4). Aceste tabele ajut ă la interpretarea sensului
diferențelor la testele de contrast și interacțiunii variabilelor. Tabelele prezint ă și deviațiile standard și
limitele valorii medii pentru un interval de încredere de 95%.

La finalul foii de rezultat e apare reprez entarea grafic ă a interac țiunii dintre variabilele
independente:

Liniile graficului reprezint ă momentele m ăsurării anxietății. Efectul principal al variabilei
TERAPIE poate fi observat grafic cu u șurință.

LOREDANA GHERASIM

324

IV. DATELE NEP ARAMETRICE

Datele non-parametrice sunt mai frecvent utilizat e în sociologie decât în psihologie, Deoarece
avem de a face cu scale nomi nale sau ordinale, parametrii obi șnuiți pe care i-am folosit pân ă acum în
analiză, precum media sau abaterea st andard, nu mai pot fi utiliza ți. În consecin ță, datele pe care le
obținem folosind aceste scale de m ăsură nu mai pot fi analizate folosind metodele prezentate anterior.
Aceste date se analizeaz ă pornind de la frecven țele de apari ție ale diferitelor categorii sau de la
probabilitățile de apari ție ale acestor categorii. Metodele statis tice utilizate pentru analiza acestor date
sunt numite teste neparametrice.
Aplicarea acestor teste este mai facil ă decât folosirea testelor parametrice, deoarece nu exist ă
restricții cu privire la distribuirea normal ă a rezultatelor. Totu și, aceste metode pot e șua mai ușor în
demonstrarea diferen țele, acolo unde acestea exist ă în realitate. Din acest motiv, recomand ăm
conceperea instrumentelor utilizând scalele de interval în locul celor nominale sau ordinale. De
exemplu, în locul m ăsurării preferinței pentru un anume tip de muzic ă folosind o scal ă ordinală de tipul
„1-deloc, 2-pu țin, 3-mediu, 4-mult, 5-foarte mult", este mai indicat ă măsurarea pe o scal ă de interval de
tipul „1-deloc -2-3-4-5 – foarte mult". În acest fel, pot fi u șor detectate diferen țele folosind metodele
parametrice.
Vom prezenta câteva dintre metodele neparametrice, f ără a intra în detaliile teoretice privind
aceste teste.

IV.1. TESTUL CHI PĂTRAT

Testul chi-p ătrat permite compararea distribu ției frecven țelor unei variabile pe mai multe
categorii, prin raportare la o distribu ție teoretică stabilită de cercet ător. Testul compar ă abaterile de la
această distribuție teoretică obținute în realitate și estimează probabilitatea ca ele s ă apară aleatoriu.

Folosirea SPSS
Pentru a demonstrat modul de aplicare a acestei metode vom crea o nou ă bază de date
(baza9.sav) care cuprinde urm ătoarele variabile: VRST (vârsta subiec ților), GEN (genul subiec ților, cu
două valori: 1 semnific ă subiecți de gen masculin și 2 subiec ți de gen feminin) și VOT (cuprinde
răspunsurile subiec ților la întrebarea „Cu cine a ți votat la ultimele alegeri preziden țiale?, cu dou ă valori:
1 indicând persoanele care au votat pe Geoan ă, iar 2 indicând pe cei care au votat B ăsescu) și variabila
GR_MULT (con ține răspunsurile subiec ților la întrebarea „Cât de mul țumiți sunteți de situația actuală a
țării?”, cu dou ă valori: 1 – deloc mul țumit, 2 – pu țin mulțumit și 3 – foarte mul țumit). Prezent ăm scorurile
subiecților la cele patru variabile:

ANALIZA COMPUTERIZAT Ă A DATELOR

325VRST: 45, 23, 54, 19, 22, 34, 37, 62, 36, 41, 47, 51, 38, 27, 35, 43, 32, 29
GEN: 1, 1, 2, 2, 1, 2, 1, 1, 2, 2, 2, 2, 1, 1, 1, 1, 2, 2
VOT: 2, 2, 1, 2, 2, 2, 2, 1, 2, 2, 2, 2, 1, 21, 2, 2, 2
GR_MULT: 1, 2, 3, 1, 1, 1, 3, 3, 3, 2, 2, 2, 1, 3, 2, 2, 2, 1
În exemplul nostru, dorim s ă vedem cu cine au votat aleg ătorii din lotul nostru la ultimele alegeri
prezidențiale. Deci, vom compara frecven ța cu care oamenii au votat cei doi candida ți, folosind testul chi
pătrat.
Vom activa fereastra specific ă testului din meniul ANAL YZE – NONPARAMETRIC TESTS
opțiunea CHI-SQUARE:

Vom introduce variabila VOT în câmpul pentru analiz ă (TEST VARIABLES LIST).
Se observ ă faptul că în câmpul EXPECTED VALUES este bifat ă opțiunea ALL CATEGORIES
EQUAL, ceea ce semnific ă faptul că se va compara situa ția reală a votului cu situa ția în care candida ții
ar obține același număr de voturi.
Dacă însă doream să comparăm distribuția cu o alta, în care catego riile nu s-ar mai fi distribuit
egal, atunci foloseam op țiunea VALUES și butonul ADD.
Rezultatele testului apar în f oaia cu rezultate sub forma a dou ă tabele:

În primul tabel sunt trecute elementele descr iptive ale testului, ca tegoriile sale, frecven ța
observată, cea teoretic ă la care se face raportarea și abaterile frecven ței observate de la frecven ța
teoretică (coloana RESIDUALS).

LOREDANA GHERASIM

326Valoarea statistic ă a testului, prezentat ă în tabelul al doilea ( 55,52=χ ), este semnificativ ă
(p=0,018) la un grad de libertate. Deci oamenii au vo tat în mod semnificativ diferit cei doi candida ți la
președinție. Semnificativ mai mul ți oameni au votat pe B ăsescu ca pre ședinte comparativ cu cei care l-
au votat pe Geoan ă.

IV.2. TWO INDEPENDENT SAMPLES

Aceste teste sunt echivale ntul testului t pentru e șantioane independente, doar c ă în acest caz
variabila dependent ă măsurată nu este cantitativ ă, ci calitativ ă și ordinală. Toate testele neparametrice
ce compar ă două eșantioane indepen dente au la baz ă comparații ale rangurilor diferitelor intervale
observate.

Folosirea SPSS
Pentru a ilustra aplicarea testului vom utiliza baza de date creat ă anterior (baza9.sav). Vom
analiza dac ă apr diferen țe între subiec ții de gen masculin și cei de gen feminin în ceea ce prive ște
gradul de mul țumire față de situația actuală a țării.
Testul se activeaz ă din meniul ANALYZE – NON-PARAMETRIC TESTS op țiunea TWO
INDEPENDENT SAMPLES:

Fereastra care apare pe ecran sem ănă foarte mult cu cea care apare la activarea testului t
pentru eșantioane independente. Dintre cele patru tipuri de teste, vom folosi MANN-WHITNEY U, care
se bazează pe ierarhia rangurilor observa țiilor din cele dou ă grupuri.
Vom trece variabila dependent ă (GR_MULT) în câmpul TEST VARIABLE LIST, iar variabila
independent ă (GEN) în câmpul GROUPING VARIABLE. Grupurile variabilei in dependente se definesc
folosind butonul DEFINE GROUPS, la fel ca și în cazul testului t.
În foaia cu rezultate apar urm ătoarele tabele:

ANALIZA COMPUTERIZAT Ă A DATELOR

327

Observați că stilul de prezentare al re zultatelor este similar cu cel de la testul chi-p ătrat. în
primul tabel este prezentat ă situația „descriptiv ă" (media rangurilor), iar valoarea pragului de
semnificație a testului este dat ă în tabelul al doilea (linia denumit ă ASYMP. SIG).
Astfel, rangul mediu pentru subiec ții de gen masculin are valoare 9,83, pentru cei de gen
feminin are valoarea 9,17. Valoarea pragului de semnifica ție (p=0,778) este mai mare de 0,050, deci
putem trage concluzia c ă femeile și bărbații din studiul nostru nu difer ă semnificativ în ceea ce prive ște
gradul de mul țumire cu privire la situa ția actuală a țării.
Dacă diferențele ar fi fost semnificative (p<0,05), sensul diferen ței ar fi fost dat de semnul notei
Z, scrisă imediat deasupra valor ii pragului de semnifica ție.

IV.3. TWO RELATED SAMPLES

Metodele care compar ă două eșantioane perechi sunt similare aplic ării testului t pentru
eșantioane perechi. Pentru a ilustra aplicarea acestui test vom folosi o nou ă bază de date (baza10.sav)
care cuprinde dou ă variabile: ALINATA (cuprinde r ăspunsurile subiec ților la itemul „ Evaluați contribuția
alianței în integrarea european ă”; variabila are trei valori 1 – importanta, 2 – medie și 3 – slabă) și PSD
(cuprinde r ăspunsurile subiec ților la itemul „ Evaluați contribuția alianței în integrarea european ă”,
variabila are trei valori 1 – importanta, 2 – medie și 3 – slabă). Prezentăm rezultatele subiec ților:
Alinata: 1, 1, 2, 3, 1, 1, 3, 2, 2, 2, 1, 1, 2, 2, 3, 3, 1, 3, 1, 1, 3, 2, 2, 2, 2, 2
PSD: 2, 3, 1, 1, 3, 2, 2, 1, 1, 1, 2, 2, 3, 1, 1, 1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2
Dorim să vedem dac ă subiecții au o părere mai bun ă despre unul dintre cele dou ă partide
politice. Deoarece subiec ții răspund la ambele întreb ări trebuie aplicat ă o metodă care să permită
compararea e șantioanelor perechi.
Se folosește din meniul NON PARAMETRIC TESTS op țiunea TWO RELATED SAMPLES.
Fereastra seam ănă cu cea a testului t pentru eșantioane perechi. Ca și la acest test, trebuie
selectată o pereche de variabile pentru analiz ă, pentru a se activa op țiunile ferestrei.
Pentru exemplul nostru vom selecta variabile ALIANTA și PSD și le vom trece în câmpul din
stânga:

LOREDANA GHERASIM

328

Vom utiliza testul WILCOXON, care se bazeaz ă pe rangul valorilor absolute al diferen țelor
dintre două variabile, comparând separat diferen țele pozitive și negative.
Prezentarea rezultatelor testului, în foaia cu rezultate, se face în dou ă tabele, unul pentru
valorile descriptive și altul pentru semnifica ția testului, ca mai jos:

În primul tabel apare media și suma rangurilor diferen țelor pozitive și negative, precum și
cazurile în care scorurile sunt la egalitate. Indicii de sub acest tabel arat ă sensul diferen țelor.
Din al doilea tabel observ ăm că testul este nesemnificativ (p=0,281). Aceste rezultat indic ă
faptul că oamenii consider ă ca ambele partide contribuie la fel de mult la integrarea României în
Uniunea European ă.

Similar Posts