Introducere în SPSS 2011 Mihaela Naidin [616890]
Introducere în SPSS 2011 Mihaela Naidin
INTRODUCEREINTRODUCERE
________________________________________________________________ _________________________________________________
Aplicația SPSS („Statistical Package for the Social Science s” – „pachet
de programe statistice aplicate științelor sociale”) a fost elaborată în anul 1965
de către Universitatea Stanford din California.
Programul SPSS ( Statistical Package for the Social Sciences ) este
unul dintre cele mai utilizate în analiza statistică a datelor și a evoluat până la
versiunea 16, aria de aplicabilitate extinzându-se de la versiune la versiune,
odată cu modul de operare și cu facilitățile oferite. Programul este utilizat în
foarte multe domenii: în marketing, cercetare experimentală, educație, sănătate
etc. În afară de analizele statistice posibile, programul are componente puternice
pentru managementul datelor (selectare, reconfigurare, creare de date noi) și
pentru documentarea datelor (există un dicționar metadata, care reține
caracteristici ale datelor). Se mai poate adăuga flexibilitatea privind tipurile de
date acceptate ca și modul de construire a rapoartelor.
Această carte prezintă un mod de abordare a analizei statistice folosind
SPSS for Windows și este destinată studenților care doresc să analizeze date din
psihologie, sociologie, criminologie, sau date similare. Cartea se dorește a fi un
îndrumător pentru analiza datelor, fiind o carte completă, de sine stătătoare care
satisface nevoile studenților la toate nivelele.
Manualul este structurat pe XVII capitole, oferind astfel posibilitatea
parcurgerii pas cu pas a informațiilor prezentate dar și o privire de ansamblu
asupra procedurilor de calcul din SPSS.
1
Introducere în SPSS 2011 Mihaela Naidin
Curs 1.
I. . Noțiuni de bază despre introducerea Noțiuni de bază despre introducerea
și analiza statistică folosind SPSS și analiza statistică folosind SPSS
________________________________________________ __________________________________________________________________________________________________________________________________________________________________________________
I.1. Accesarea SPSS-ului.
SPSS-ul for Windows este accesat în general prin folosirea butoanelor și
meniurilor folosind pentru aceasta clicuri ale mouse-u lui. Astfel, cea mai rapidă
modalitate de învățare este de a urma pașii prezentați și capturile de ecran.
P asul 1:
Se dă dublu clic pe im agine
–dacă imaginea nu apare pe
ecran atunci accesați „Start”
→Programe→SPSS.
Pasul 2:
Această fereastră va apărea
după câteva momente și se
pot alege oricare dintre
opțiunile din fereastră. (Fereastra se
numește „Data Editor”.
Fereastra de editare ( Data Editor) se deschide
implicit la lansarea SPSS și este folosită pentru
introducerea, modificarea sau ștergerea datelor
în format spreadsheet. Într-o fereastră de editare
poate fi prezentat conținutul unui fișier de date
care a fost selectat dintr-o listă de fișiere creat anterior (în SPSS, Excel, Statistica etc.) sau
poate fi creată o nouă foaie de lucru. Această fereastră recunoaște fișierele de date care au
extensia implicită .sav.
În fereastra Data Editor sunt afișate datele de lucru. Acestea sunt aranjate în format tabel
(spreadsheet), care conține coloane și linii. La intersecția acestora sunt celulele (casetele,
căsuțele) în care se introduc datele. La un moment dat este activă (curentă) o singură celulă,
cea în care este plasat cursorul. Celula curentă este scoasă în evidență printr-un chenar
îngroșat. Trecerea de la o celulă la alta se realizează prin clic de mouse în noua celulă sau de
la tastatură cu ajutorul tastelor de control (taste săgeți, Page Up, Page Down).
2
Introducere în SPSS 2011 Mihaela Naidin
I.2. Introducerea datelor.
Pasul 3:
Aceasta este fereastra Data Editor a SPSS-ului și este un spațiu de lucru
cu linii și coloane în care pot fi introduse
datele.
Coloanele sunt folosite pentru a
desemna diferite variabile.
Liniile sunt cazurile sau indivizii
despre care se dețin date.
Pasul 4:
Pentru a introduce date in SPSS
se selectează una dintre celule și se dă
clic pe celula respectivă.
* În SPSS există întotdeauna o singură celulă
selectată.
Pasul 5:
Se introduce un număr folosind tastatura
calculatorului. La apăsarea tastei „Enter” sau
la selectarea cu mouse-ul a unei alte celule
numărul va fi introdus în foaia de lucru la fel
cum este arătat aici.
Valoarea 10 este înregistrarea pentru primul
rând (primul caz) al variabilei VAR00001.
•Se observă că această variabilă a primit
automat un nume standard. Pentru a
efectua schimbarea se dă clic pe numele
variabilei.
3
Introducere în SPSS 2011 Mihaela Naidin
Pasul 6:
Corectarea erorilor se face folosind
mouse-ul: se selectează celula unde
este eroarea și se introduce valoarea
corectă. La apăsarea tastei „Enter”
sau deplasarea pe o altă celulă
valoarea corectată va fi introdusă.
I.3. Salvarea datelor .
Pasul 7:
Selectând „File”→ „Save As”
datele se vor salva sub forma
unui fișier. Fișierul salvat va
primi automat de la SPSS
extensia „.sav”.
* Se recomandă folosirea unor nume
de fișiere distincte (ex. date1) pentru
a face conținutul lor cât mai clar. Salvarea datelor este recomandat sa se facă într-un fișier
diferit de cel
al SPSS-ului.
Pasul 8:
Pentru a alege locația unde
va fi salvat fișierul de date,
se alege calea în mediul
„Save In” (se folosește
săgeata pentru a ajunge
la locația dorită).
Salvarea unui fișier se realizează prin
pictograma Save din bara de instrumente Standard sau cu ajutorul comenzilor Save sau Save
As și meniul File. Aceste comenzi deschid fereastra Save Data As în care se pot stabili:
numele fișierului (File name); tipul fișierului (Save as type); locația în care să aibă loc
salvarea (Save In).
4
Introducere în SPSS 2011 Mihaela Naidin
I.4. Folosirea „Variabilei View” pentru crearea și etichetarea variabilelor
Pasul 9:
Apăsarea meniului „Variable View”,
situat în josul paginii, schimbă fereastra
„Data View” (spațiul de lucru pentru
introducerea datelor) în altă fereastră în
care pot fi introduse infor mații despre
variabilele create.
5
Introducere în SPSS 2011 Mihaela Naidin
Pasul 10:
Acesta este spațiul de lucru „ Variable View”. În acest caz, o variabilă este
deja înscrisă fiind introdusă la pasul 8. Variabila poate fi redenumită și pot fi
adăugate alte variabile destul de ușor selectând celula corespunzătoare și tastând
numele variabilei.
Aici
se
modifică Aici se modifică
lățimea coloanei. numărul de zecimale.
Pasul 11:
La versiunea SPSS 12-16 (față de
cele anterioare unde se permit
maxim 8 caractere) nu există
limită pentru lungimea numărului
unei variabile.
Se selectează o celulă din coloana
„Name” și se scrie un nume diferit
de variabilă. Celelalte variabile
vor primi valori care vor fi
implicit schimbate ulterior.
Acesta este numărul de zecimale
care va apărea pe ecran.
*La editarea unei variabile trebuie să se țină cont de următoarele restricții: numele variabilei
să fie unic, primul caracter să fie o literă, sa nu conțină simboluri speciale folosite în SPSS
sau spații.
Pasul 12:
Apare acest buton: se dă
clic pe el.
6
Introducere în SPSS 2011 Mihaela Naidin
Pasul 13:
Va apărea această fereastr ă. În
continuare se vor urmări pașii
care vor arăta cum genul
biologic „masculin” și
„feminin” este introdus
folosind codul „1” (masculin)
respectiv „2” (feminin).
Pasul 14:
Se scrie „1” în dreptul
câmpului „value”
și „masculin” în dreptul
câmpului „value Label”.
Apoi se apasă „Add”.
Pasul 15:
Aceasta operație de adăugare
transferă informația în câmpul
aflat dedesubt.
* La fel se procedează și pentru
introducerea celeilalte variabile (Ex.
2 – feminin).
* Cele mai frecvent utilizate ferestre
in SPSS sunt „data Editor”, „Syntax Editor” și „Output Viewer”, „Pivot Table (Pivot Table
Editor)”, “Chart Editor”.
Fereastra de sintaxă ( Syntax Editor) este folosită pentru a genera programe de comenzi
pe care le vom executa asupra datelor (exemplu: calculul unor noi variabile). Opțiunile
selectate în casetele de dialog sunt afișate în fereastra de sintaxă sub formă de comenzi.
Aceste ferestre îi sunt specifice fișierele de tip .sps.
Fereastra de rezultate ( Output Viewer) devine disponibilă automat după ce a fost
efectuată o comandă de analiză a datelor. În această fereastră, sunt afișate rezultatele
statistice, tabele și grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor
(Text Output Editor ) este folosită pentru modificarea textului rezultat, care nu a fost afișat în
tabele pivot.
* Fereastra de rezultate ( Output Viewer) devine disponibilă automat după ce a fost efectuată o
comandă de analiză a datelor. În această fereastră, sunt afișate rezultatele statistice, tabele și
grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor ( Text Output
Editor) este folosită pentru modificarea textului rezultat, care nu a fost afișat în tabele pivot.
Toate rezultatele obținute din analizele statistice sunt afișate în fereastra Output Viewer.
7
Introducere în SPSS 2011 Mihaela Naidin
Această fereastră se aseamănă cu fereastra Windows Explorer și se deschide doar dacă s-au
lansat comenzi din meniurile Statistics sau Graphs.
Fereastra Output Wiewer este structurată în două cadre/zone. Cadrul din stânga
(cuprinsul/structura) prezintă, sub forma unei schițe, obiectele conținute în fereastră.
Elementele din schiță se referă la titlu, note și denumirea rezultatelor statistice propriu-zise.
Fereastra Pivot Table (Pivot Table Editor ) oferă multiple posibilități de modificare a
tabelelor pivot: editare text, schimbarea datelor din rânduri și coloane, adăugarea de culori,
crearea unor tabele multidimensionale, ascunderea sau afișarea selectivă a rezultatelor.
Fereastra de editare a graficelor ( Chart Editor) permite modificarea elementelor unui
grafic (axe, scale, diagramă, legendă etc.)
I.5. Exemplu de calcul statistic.
Pasul 16:
Pentru a calcula media de vârstă
se urmăresc următoarele etape:
-se dă clic pe „Analyze”;
-Se selectează „Descriptive
statistics”;
-Se selectează „Descriptive…”
Pasul 17:
Se selectează „vârsta”.
Se apasă butonul ► pentru a
muta „vârsta” în căsuța
„Variable(s)”.
Se dă clic pe „OK”.
Pasul 18:
Fereastra „Data Editor” este înlocuită de output-ul SPSS-ului. Acest tabel
apare pentru analiza realizată anterior.
Media scorului pentru vârstă este încercuită.
*Ferestrele în SPSS reprezintă zone de pe ecran tratate ca elemente de sine stătătoare,
cu caracteristici proprii, care determină acțiunile ce se pot executa în cadrul lor.
8
Introducere în SPSS 2011 Mihaela Naidin
I.6. Concepte statistice esențiale în analizele cu ajutorul SPSS-ului.
Elementele de statistică sunt foarte simple dar apar probleme la
asamblarea elementelor, abilitățile matematice având un mic rol în analiza
statistică a datelor.
Conceptele de bază pe care cercetătorii trebuie să le înțeleagă înainte de a trece
la analizele SPSS sunt:
Variabila.
Definiție: O variabilă este orice concept care poate fi măsurat și care
variază de la un studiu la altul.
Tipurile de variabile.
Variabilele pot fi clasificate ca fiind de două tipuri:
Scoruri: Vorbim despre scoruri atunci când o valoarea numerică este atribuită
unei variabile, pentru fiecare caz în parte din eșantion. Această valoare indică
cantitatea sau valoarea caracteristicii (variabilei) în cauză.
Exemplul. Vârsta este o variabilă numerică deoarece valoarea –scor indică o
cantitate în creștere a variabilei vârstă.
Variabile nominale sau categoriale: Sunt variabile care se măsoară
clasificând cazurile în unul sau mai multe categorii.
Exemplul 1: Genul biologic are două categorii: masculin și feminin
*Este foarte important să se hotărască pentru fiecare variabilă în parte dacă este
variabilă nominală (categorială) sau variabilă cantitativă.
Definirea atributelor unei variabile este prima operație din procesul de pregătire a
setului de date. Definirea presupune precizarea atributelor unei variabile: numele variabilei,
tipul, lungimea (numărul de caractere), numărul de zecimale (pentru cele numerice), eticheta,
valorile etichetei, valorile lipsă, alinierea și modalitățile de măsurare a variabilei. Variabilele
se definesc în coloanele foii Variabile View din fereastra Data Editor.
Tipul variabilei – variabilele pot fi de mai multe tipuri: numerice (Numeric, Coma, Dot,
Scientific notation), alfanumerice (String), date calendaristice, simbol monetar.
9
Introducere în SPSS 2011 Mihaela Naidin
1.Realizați o bază de date și introduceți 10 subiecți cu vârste cuprinse între
10 și 15 ani astfel: primul subiect are vârsta de 10 ani, al doilea subiect
are vârsta de 13 ani, al treilea subiect are vârsta de 12 ani, al patrulea
subiect are vârsta de 11 ani, al cincilea subiect are vârsta de 15 ani, al
șaselea subiect are vârsta de 14 ani, al șaptelea subiect are vârsta de 13
ani, al optulea subiect are vârsta de 15 ani, al nouălea subiect are vârsta de
10 ani și ultimul subiect are vârsta de 13 ani.
Salvați fișierul cu denumirea „subiect” pe desktop.
2.La o cercetare „percepția socială asupra consumului de droguri” participă
10 persoane dintre care: 4 studenți, 2 profesori și 4 elevi. Aceștia au vârste
cuprinse între 15 și 35 de ani astfel: cei 4 studenți au 21, 22, 25, 26 ani,
elevii au 15, 16, 17, 17 ani și profesorii au 34 de ani și 35 de ani. (a se
vedea figura de mai jos).
Se cere:
1.să se calculeze media de
vârstă a participanților la
studiu;
2.să se calculeze și să se
interpreteze media
obținută.
3.să se salveze fișierul
creat în „My
documents”cu
denumirea „cercetare”.
10 I.7. Exerciții
Introducere în SPSS 2011 Mihaela Naidin
1. Fereastra de editare (Data Editor):
a. se deschide implicit la lansarea SPSS;
b. este folosită pentru introducerea, modificarea sau ștergerea datelor în
format spreadsheet;
c. este folosită pentru a genera programe de comenzi pe care le vom
executa asupra datelor;
d. este folosită pentru modificarea textului rezultat, care nu a fost afișat în
tabele pivot;
2. Fereastra de rezultate (Output Viewer):
a. afișează rezultatele statistice, tabele și grafice care au asocia te ferestre
distincte;
b. permite modificarea elementelor unui grafic (axe, scale, diagramă,
legendă etc.);
c. este folosită pentru a genera programe de comenzi pe care le vom
executa asupra datelor.
3. Ferestrele în SPSS reprezintă:
a. zone de pe ecran tratate ca elemente de sine stătătoare, cu caracteristici
proprii, care determină acțiunile ce se pot executa în cadrul lor ;
b. elemente constitutive ale programului SPSS;
c. elemente prin care i se conferă utilizatorului posibilitatea selectării unei
anumite opțiuni.
4. Care sunt cele mai frecvent utilizate ferestre în SPSS
a. data editor;
b. output editor;
c. syntax editor;
d. syntax viewer;
e. output viewer.
5. În SPSS fereastra SPSS Output Viewer este utilizată pentru:
a. afișarea rezultatelor;
b. editarea de date;
11 I.8. Alegeți răspunsul corect
Introducere în SPSS 2011 Mihaela Naidin
c. editarea de date și tabele;
6. La editarea unei variabile trebuie să se țină cont de următoarele
restricții:
a. să conțină spații sau simboluri folosite în SPSS;
b. să conțină numai litere;
c. să aibă cel puțin 8 caractere;
d. primul caracter trebuie să fie o cifră;
e. să fie unic.
7. Numele variabilei trebuie să țină c ont de câteva restricții:
a. să aibă cel mult 6 caractere ;
b. se poate repeta;
c. primul caracter să fie literă;
d. poate să conțină simboluri speciale folosite în SPSS sau spații.
8. Pentru a introduce date în SPSS se selectează:
a. o celulă dând clic pe celula respectivă;
b. meniul data, split file;
c. meniul transform, compute.
9. Prin apăsarea butonului “Variable View”:
a. se schimbă fereastra “Data View”;
b. apare fereastra output;
c. se poate introduce o variabilă diferită.
10. Care dintre următoarele afirmații este adevărată?
a. indicatorul “medie” reprezintă media aritmetică a unui scor și se obține
prin însumarea va lorilor și înmulțirea cu numărul de valori;
b. modul este valoarea cu cea mai mare frecvență si este frecvența cu care
apare cel mai frecvent scor;
c. mediana este valoarea din centrul distribuției, dacă variabilele numerice
sunt ordonate după mărime, de la cea mai mică la cea mai mare.
11. Pentru a calcula media aritmetică alegem
a. SE Mean;
b. Median;
c. Mean;
d. Rouge.
12
Introducere în SPSS 2011 Mihaela Naidin
1. a. se deschide implicit la lansarea SPSS;
2. a. afișează rezultatele statistice, tabele și grafice care au asociate
ferestre distincte;
3. a. zone de pe ecran tratate ca elemente de sine stătătoare, cu
caracteristici proprii, care determină acțiunile ce se pot executa în
cadrul lor ;
4. a. data editor;
c. syntax editor;
e. output viewer;
5. a. afișarea rezultatelor;
6. e. să fie unic;
7. c. primul caracter să fie literă;
8. a. o celulă dând clic pe celula respectivă;
9. a. se schimbă fereastra “Data View”;
10. c. mediana este valoarea din centrul distribuției, dacă variabilele
numerice sunt ordonate după mărime, de la cea mai mică la cea mai
mare;
11. c. mean.
13 I.9. Răspunsuri corecte
Introducere în SPSS 2011 Mihaela Naidin
Curs 2
IIII.. Descrierea variabilelor.Descrierea variabilelor.
Tabele și diagrame. Tabele și diagrame.
________________________________________________________
II.1. Frecvența procentuală.
Pentru realizarea unui tabel de frecvență este necesară o coloană căreia i
se va da un nume.
Pasul 1:
Se definește variabila.
Se etichetează valorile variabilei.
Valorile pentru ocupație se definesc așa
cum este descris în pașii 13-15 din
capitolul I.
Pasul 2:
Se selectează:
„Analize”,
„Descriptive Statistics”
„Frequencies…”
14
Introducere în SPSS 2011 Mihaela Naidin
Pasul 3:
Se selectează ocupația și se mută
în partea dreaptă a tabelului așa
cum a fost descris la pasul 17
din capitolul I.
Se apasă „OK”
Pasul 4:
1. Prima coloană a tabelului
conține eticheta celor 5 categorii de
ocupații.
2. A treia coloană afișează
procentul de frecvență pentru 3. A patra coloană afișează procentul
fiecare categorie. de frecvență excluzând valorile lipsă
Exemplu: 5 (psiholog) reprezintă * Deoarece nu sunt valori lipsă, procentajul
33,3% din totalul de 15 persoane. este același ca în coloana a treia.
4. A cincea coloană adună procentele în josul tabelului.
•În ceea ce privește raportarea rezultatelor se prezintă numai etichetele categoriale,
frecvențele și frecvențele procentuale.
II.2. Diagrama circulară pentru date categoriale.
15
Introducere în SPSS 2011 Mihaela Naidin
Pasul 1:
Se selectează:
„Graphs”
„Pie”.
Pasul 2:
Se selectează „Define”.
Pasul 3:
Se selectează „Ocupația”
prin apăsarea butonului ►(◄).
Se apasă „OK”.
Diagrama Pie este un cerc divizat în
sectoare. Fiecare sector de cerc reprezintă
o categorie, aria acestuia fiind
proporțională cu numărul de cazuri din
această categorie a variabilei nominale.
Pasul 4:
Acesta este felul în care apare o
diagramă circulară folosind
opțiunile din SPSS. Sectoarele
din cerc sunt codate cu diferite
culori.
* Caracteristicile din această
diagramă pot fi modificate cu „Chart
Editor”.
16
Introducere în SPSS 2011 Mihaela Naidin
II.3. Adăugarea etichetelor unei diagrame circulare
Pasul 1:
Se dă dublu clic oriunde în
dreptunghiul care conține diagrama,
pentru a selecta „Chart Editor”.
Se selectează:
„Elements”
„Show Data Labels”.
* Diagrama de structură „pie” este folosită
pentru reprezentarea frecvențelor absolute
(numere) și/sau relative (procente) pe
categorii/grupe.
Pasul 2:
Se selectează „Count” și
„X”-ul roșu pentru a nu afișa.
Se selectează „Ocupație” și săgeata
verde curbată în sus pentru a afișa
denumirile ocupațiilor.
Se procedează asemănător pentru
„Procent” pentru a afișa procentajul
fiecărei ocupații în parte.
Seselectează „Apply” și „ Close”.
17
Introducere în SPSS 2011 Mihaela Naidin
Pasul 3:
Pentru a înlătura legenda,
se selectează „Options”
și „Hide Legend”.
Diagrama circulară cu
sectoarele
denumite și frecvența
procentuală afișată.
II.4. Diagrama cu bare pentru date categoriale.
Pasul 1:
Se selectează:
„Graphs”
„Bar…”.
Pasul 2:
Selectați „Define”.
„Simple” este preselectat.
*Selectare unei alte variante se face prin
clic cu mouse-ul pe varianta respectivă.
18
Introducere în SPSS 2011 Mihaela Naidin
Pasul 3:
Se selectează ocupația și se apasă
butonul ► de lângă „Category Axis”
pentru a introduce acolo ocupația.
Se selectează „% of cases”.
Se apasă „OK”
Diagrama cu bare.
* Diagrama cu bare este folosită pentru a reprezenta grafic mediile diferitelor grupe dintr-o
colectivitate (Summaries for groups of cases ) sau valorile medii ale diferitelor variabile pentru
aceeași colectivitate ( Summaries of separate variables ).
Diagrama Bar este folosită pentru a ilustra categoriile unei distribuții în formă convenabilă.
Diagrama prezintă atâtea bare câte categorii are o variabilă. Barele au aceeași bază, egală cu
unitatea, iar înălțimea proporțională cu frecvența categoriei astfel încât aria fiecărei bare
reprezintă numărul cazurilor categoriei considerate.
Pentru a fi interpretat un grafic trebuie să conțină următoarele elementele:
-titlul graficului – oferă informații asupra fenomenului reprezentat (Titlul
graficului coincide cu titlul tabelului de date);
-axele de coordonate sunt folosite pentru a reprezenta variabilele. Pe abscisă se
înscrie variabila de distribuție, iar pe ordonată frecvența.
-legenda – este folosită pentru a explica elementele din diagramă;
-sursa – precizează originea datelor reprezentate.
II.5. Histograme.
19
Introducere în SPSS 2011 Mihaela Naidin
Pentru a ilustra procesul de realizare a unei histograme vom folosi datele
obținute din răspunsurile subiecților la întrebarea „Vă place statistica?”.
(răspunsuri: a. foarte mult; b. mult; c. Puțin d. foarte puțin; e. deloc).
Pasul 1:
Se introduc datele în „Data Editor” (așa
cum a fost prezentat la începutul
capitolului).
Se selectează:
„Graphs”
„Hitogram”
Pasul 2:
Se selectează întrebarea „Vă place
statistica?” și se apasă butonul ►de
lângă „Variable” pentru a duce
întrebarea în căsuța din dreapta.
Se apasă „OK”.
Histograma.
* Pentru a schimba denumirile axelor se dă clic
pe ele și se editează.
* Histograma este folosită pentru a arăta
forma unei distribuții după o variabilă înregistrată asupra unei colectivități (frecvența de
apariție pentru diferite clase de valori ale variabilei observate).
Alte tipuri de grafice:
Line – diagrama liniară este folosită pentru a reprezenta de regulă valori medii.
Boxplot – diagrama „cutia cu mustăți” este folosită pentru a prezenta amplitudinea, intervalul
intercuartilic și mediana unei distribuții.
Error Bar – diagrama „bara erorilor” este folosită pentru a arăta media și intervalul de
variabile.
Scatter – diagrama „norul de puncte” este folosită pentru a reprezenta relațiile dintre încredere
de 95% pentru media respectivă.
20
Introducere în SPSS 2011 Mihaela Naidin
3.La o cercetare „percepția socială asupra consumului de droguri” participă
10 persoane dintre care: 4 studenți, 2 profesori și 4 elevi. Aceștia au vârste
cuprinse între 15 și 35 de ani astfel: cei 4 studenți au 21, 22, 25, 26 ani,
elevii au 15, 16, 17, 17 ani și profesorii au 34 de ani și 35 de ani. (a se
vedea figura 1).
Se cere:
4.să se realizeze un tabel
de frecvențe pentru
variabila „subiecți”;
5.să se realizeze tabel de
frecvențe pentru
variabila „vârstă”;
6.să se realizeze diagrama
de structură pentru
variabila „subiecți”;
7.să se adauge etichete diagramei;
8.să se realizeze diagrama de bare și histograma pentru variabila „vârstă”.
9.să se calculeze media pentru variabila „vârstă și să se interpreteze.
10. să se salveze fișierul creat pe „Desktop” cu denumirea „cercetare”;
21 II.6. Exerciții
Introducere în SPSS 2011 Mihaela Naidin
1. Care sunt graficele folosite pentru o distribuție după o variabilă
calitativă?
a. diagrama Bar si diagrama Pie
b. diagrama Boxplot
c. Scatter sau Line
2. Diagrama de bare este folosită pentru:
a. a reprezenta valori medii;
b. a reprezenta frecvențe absolute (numere) și/sau relative (procente);
c. a reprezenta relațiile dintre variabile;
d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate.
3. Diagrama de structură este folosită pentru:
a. a reprezenta frecvențele absolute (numere) și/sau relative (procente);
b. a arăta forma unei distribuții după variabila înregistrată asupra unei
colectivități;
c. a prezenta amplitudinea și mediana unei distribuții;
d. a reprezenta relația dintre variabile.
4. Histograma este folosită pentru:
a. a reprezenta grafic valorile medii ale diferitelor variabile pentru aceeași
colectivitate;
b. a arăta forma unei distribuții după o variabilă înregistrată asupra unei
colectivități;
c. a reprezenta relația dintre variabile;
d. a reprezenta intervalul intercuartilic.
5. Pentru o distribuție după o variabilă cantitativă se folosesc
următoarele grafice:
a. scatter (norul de puncte) și histograma;
b. pie (diagrama de structută) și line (diagrama liniară);
c. histograma și curba frecvențelor;
d. bar (diagrama de bare) și curba frecvențelor.
22 II.7. Alegeți răspunsul corect
Introducere în SPSS 2011 Mihaela Naidin
6. Media aritmetică se calculează pentru:
a. variabile categoriale
b. variabile categoriale și cantitative
c. variabile cantitative.
7. Prima coloană a tabelului de frecvențe conține:
a. etichetele categoriilor introduse;
b. procentul de frecvență pentru fiecare categorie;
c. valorile lipsă.
8. Pentru a realiza o diagramă circulară se selectează:
a. analize/ descrip tive statistics/descriptives;
b. graphs/ pie;
c. graphs/ area.
9. Indicatorii tendinței centrale sunt:
a. modul, mediana, abaterea standard
b. medie, mod, mediană
c. dispersie, abaterea standard
10. Care dintre următoarele afirmații este adevărată?
a. indicatorul “medie” reprezintă media aritmetică a unui scor și se obține
prin însumarea valorilor și înmulțirea cu numărul de valori;
b. modul este valoarea cu cea mai mare frecvență si este frecvența cu care
apare cel mai frecvent scor;
c. mediana este valoarea din centrul distribuției, dacă variabilele numerice
sunt ordonate după mărime, de la cea mai mică la cea mai mare.
23
Introducere în SPSS 2011 Mihaela Naidin
1. a. diagrama Bar și diagrama Pie
2. d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate.
3. a. a reprezenta frecvențele absolute (numere) și/sau relative (procente);
4. b. a arăta forma unei distribuții după o variabilă înregistrată asupra unei
colectivități;
5. c. histograma și curba frecvențelor;
6. c. variabile cantitative.
7. a. etichetele categoriilor introduse;
8. b. graphs/ pie;
9. b. medie, mod, mediană
10. c. median a este valoarea din centrul distribuției, dacă variabilele
numerice sunt ordonate după mărime, de la cea mai mică la cea mai mare.
24 II.8. Răspunsuri corecte
Introducere în SPSS 2011 Mihaela Naidin
Curs 2
III. III. Descrierea numerică a variabilelorDescrierea numerică a variabilelor
– – Medie, variație și dispersie – Medie, variație și dispersie –
_________________________________________________________________________________________________________________
III.1. Introducerea datelor și efectuarea analizei
Pentru realizarea acestui exemplu am selectat un număr de 0 subiecți cu vârste
cuprinse între 15-35 ani.
Pasul 1:
În „Variable View” din „Data Editor” se denumește prima coloană „Vârstă”.
* Se îndepărtează cele 2 zecimale și se scrie 0.
Pasul 2: Pasul 3:
În “Data View” Se selectează “Analize” →
din “Data Editor” “Descriptives statistics” și
se introduc vârstele “Frequencies…”
în prima coloană.
Pasul 4:
25
Introducere în SPSS 2011 Mihaela Naidin
Se selectează „vârsta”
și butonul ► pentru a
introduce în lista de
variabile.
Se deselectează
butonul „Display frequency s
tables” și se ignoră mesajul
de avertizare.
Se dă clic pe „Statistics…”
Pasul 5:
Se selectează
„Mean”;
„Median”;
„Mode”.
Se dă clic pe „Continue”.
Se apasă „OK” din ecranul
anterior, care reapare.
III.2. Interpretarea
output-ului.
Există 10 cazuri cu date valide pe care se
bazează analiza.
Nu sunt date lipsă (0).
Media de vârstă, media aritmetică
=22,8 ani.
Mediana de vârstă (vârsta persoanei
26
Introducere în SPSS 2011 Mihaela Naidin
aflate la mijlocul liniei de vârste de la cea
mai mică la cea mai mare) este de 21.5 ani.
Valoarea mod de vârstă este 17.
III.3. Alte caracteristici.
În căsuțele de d ialog de la pasul 5 se pot observa mai multe valori
statistice adiționale care pot fi calculate:
1. centilele – indică punctele de separație pentru procentajele scorurilor.
Exemplu: Al 90-lea centil este valoarea numerică care separă cele 90%
de valori de dedesubt, din punct de vedere al mărimii.
2. Cvartilele – sunt valorile distribuției care indică punctele de separare
pentru cele ai mici 20%, cele mai mici 50% și cele mai mici 75% dintre scoruri.
3. Suma – indică totalul scorurilor pentru o variabilă.
4. Skewness – Este un indicator de asimetrie sau înclinare a distribuției
scorurilor pentru o variabilă. Valoarea este pozitivă dacă valorile sunt asimetrice
spre stânga, sau negativă dacă valorile sunt asimetrice spre dreapta.
5. Kurtosis – este un index care arată cât de ascuțită sau turtită este
distribuția scorurilor pentru o variabilă, comparativ cu distribuția normală. Va fi
cu semnul „+” pentru curbe de frecvențe ascuțite și cu semnul „-” pentru curbe
de frecvențe „turtite”.
6. Abaterea standard (estimată) – este o evaluare a măsurii în care
scorurile diferă în medie față de media scorurilor pentru o variabilă particulară.
7. Variația (estimată) – este o evaluare a măsurii în care scorurile
variază în medie față de media scorurilor pentru variabila respectivă.
8. Rang – diferența dintre cel mai mare și cel mai mic scor obținut
pentru o variabilă.
9. Minim (scor) – valoarea celui mai mic scor al datelor pentru o
variabilă particulară.
10. Maxim (scor) – valoarea celui mai mare scor al datelor pentru o
variabilă particulară.
27
Introducere în SPSS 2011 Mihaela Naidin
11. Eroarea standard (ES medie) – valoarea medie cu care mediile
eșantioanelor extrase dintr-o populație, diferă față de media populației.
1. Cum putem calcula mediana?
a. alegând din meniul Transform / Compute;
b. statistics / summarize / case summaries / statistics;
c. statistics / Compare Means / Means;
2. Pentru a calcula eroarea medie de selecție alegem:
a. Mean;
b. Std Deviation;
c. S.E. mean;
d. Range;
3. Pentru a calcula asimetria alegem una din opțiunile:
a. Range;
b. Std Deviation;
c. Skewness;
d. Kurtosis;
e. Variance;
4. Într-un calcul statistic, media reprezintă:
a. valoarea cu cea mai mare frecvență;
b. valoarea din centrul distribuției;
c. media aritmetică a unui set de scoruri, care se obține prin însumarea valorilor
și împărțirea rezultatului la numărul de valori;
d. media aritmetică a unui set de scoruri, care se obține prin diferența valorilor
și împărțirea rezultatului la numărul de valori.
5. Într-un calcul statistic, abaterea standard este:
a. valoarea a măsurii în care scorurile diferă în medie față de media scorurilor
pentru o variabilă particulară;
b. diferența numerică între cel mai mare și cel mai mic scor obținut pentru o
variabilă;
c. valoarea cu frecvența cea mai mare
28 III.4. Alegeți răspunsul corect
Introducere în SPSS 2011 Mihaela Naidin
6. Kurtosis, ca indicator al formei distribuției, indică:
a. cât de ascuțită sau turtită este distribuția scorurilor pentru o variabilă,
comparativ cu distribuția normală;
b. simetria sau asimetria unei distribuții de frecvențe față de medie;
c. distribuția scorurilor pentru 2 variabile comparative;
7. Eroarea standard este:
a. diferența numerică între cel mai mare și cel mai mic scor obținut pentru o
variabilă;
b. valoarea medie cu care mediile eșantioanelor extrase dintr-o populație, diferă
față de media populației;
c. diferența scorurilor a 2 variabile.
8. Pentru a calcula boltirea alegem:
a. Range;
b.Variance;
c. Skewness;
d. Kurtoses.
1. c. statistics / Compare Means / Means;
2. c. S.E. mean;
3. c. Skewness;
4. c. media aritmetică a unui set de scoruri, care se obține prin însumarea
valorilor și împărțirea rezultatului la numărul de valori;
5. a. valoarea a măsurii în care scorurile diferă în medie față de media
scorurilor pentru o variabilă particulară;
6. a. cât de ascuțită sau turtită este distribuția scorurilor pentru o variabilă,
comparativ cu distribuția normală;
7. b. valoarea medie cu care mediile eșantioanelor extrase dintr-o
populație, diferă față de media populației;
8. d. Kurtoses .
29 III.5. Răspunsuri corecte
Introducere în SPSS 2011 Mihaela Naidin
30
Introducere în SPSS 2011 Mihaela Naidin
Curs 3
IV.IV.Forme ale distribuției scorurilorForme ale distribuției scorurilor
__________________________________________________ _______________________________________________________________
Este foarte important de studia t forma distribuțiilor scorurilor pentru o
variabilă. Este bine ca o distribuție să fie simetrică și cu o formă normală (formă
de clopot).
Distribuția normală, a fost descrisă prima dată de Ch. Fr. Gauss (1777-
1855) și de aceea distribuția normală se mai numește și distribuție gaussiană .
Deoarece la demonstrarea acestui concept a participat și P.S. Laplace (1749-
1827), în literatura de specialitate se va întâlni și termenul de distribuție Gauss-
Laplace.
Pentru ca o distribuție să fie considerată normală, trebuiesc îndeplinite
simultan următoarele condiții:
•Să fie unimodală – adică să existe un singur modul, o
singură categorie cu frecvență maximă;
•Să fie simetrică față de medie – adică să nu fie deplasată
spre stânga sau spre dreapta;
•Să fie normal boltită – adică să nu fie nici ascuțită și nici
„turtită”;
Toți acești termeni se referă la același lucru, distribuția normală.
De asemenea, limitele din stânga și din dreapta ale unei distribuții
normale tind spre valoarea zero, pe care însă nu o întâlnesc niciodată. O
distribuție perfect normală are aceeași valoare pentru toți cei trei indicatori ai
tendinței centrale (media, mediana și modulul), adică media = mediana =
modulul. În practică, acest lucru se întâlnește extrem de rar și, de aceea, ne
punem problema între ce limite putem considera o distribuție ca fiind normală.
31
Introducere în SPSS 2011 Mihaela Naidin
În exemplul următor este elaborat un tabel de frecvență și o histogramă cu
scorurile obținute la evaluarea coeficientului de inteligență pentru 20 de juriști.
32
Introducere în SPSS 2011 Mihaela Naidin
IV.1. Introducerea datelor.
Pasul 1:
În „Variable View” din
„Data Editor” se denumește
prima coloană „Atenție”.
Se înlătură cele două
zecimale.
*Datele se salvează ca fișier
deoarece vor fi folosite și la
capitolul 9.
Pasul 2:
În „Data View”
din „Data Editor”
se introduc
scorurile obținute
la „Atenție” în
prima coloană.
Pasul 3:
Se selectează
„Analyze”,
„Descriptives
Statistics” și
Frequencies…”
Pasul 4:
Se selectează
„atenție” și apoi
se apasă butonul
►pentru a
introduce în lista de variabile. Se apasă „OK”.
33
Introducere în SPSS 2011 Mihaela Naidin
IV.2. Interpretarea Output-ului
Prima coloană arată
scorurile obținute la
testul de „atenție”.
A doua coloană arată
frecvența acestor
valori.
Exemplu: este 1 caz
în care scorul obținut
are valoarea 55.
A treia coloană
exprimă aceste frecvențe ca
un procent al numărului total A patra coloană A cincea coloană
incluzând și datele care exprimă aceste frecvențe cumulează aceste
lipsesc. ca un procent al numărului procentaje în josul
Exemplu: Din totalul cazurilor, total excluzând datele lipsă. tabelului.
5% au obținut scorul 55 .
IV.3. Histograme.
Histograma este un grafic, folosit în statistica descriptivă și arată o distribuție de
frecvență. Distribuția de frecvență se referă la numărul de evenimente statistice pe clase
(grupe) de evenimente. Pentru o serie de date statistice cu o distribuție de frecvență după o
variabilă numerică continuă (sau continuă pe porțiuni), reprezentările grafice care ne permit să
vizualizăm distribuția de frecvențe sunt histograma și poligonul frecvențelor .
Pasul 1:
Se seletează:
„Graphs”,
„Histogram”
Pasul 2:
Se selectează
„Atenție”și
apoi se apasă
butonul ►
pentru a o
introduce în
34
Introducere în SPSS 2011 Mihaela Naidin
butonul ►butonul ► pentru a o introduce în
caseta de
în caseta de variabile Se
apasă „OK”.
Variabile.
Se apasă „OK”
35
Introducere în SPSS 2011 Mihaela Naidin
IV.4. Interpretarea output-ului
Axa verticală arată
frecvența cazurilor de la 0
la 14 din doi în doi.
Înălțimea barelor arată cât
de frecvent apare fiecare
scor la atenție.
Axa orizontală arată
scorurile diferite ale
„Atenției”.
*Media scorului la atenție este
62,2.
*Abaterea standard este 4,36.
*Numărul cazurilor este 20.
IV.5. Modalitatea.
O distribuție normală (figura 1)
este o distribuție unimodală, adică există
doar o singură categorie cu frecvența
maximă. Prezența a două sau mai multe
valori mod determină distribuții
bimodale, trimodale, în general
polimodale, distribuții ce nu pot fi
considerate ca fiind distribuții normale.
Figura nr. 1.
O
di
stribuție similară distribuției din
figura 1, este o distribuție bimodală
(figura 2), deoarece observăm
existența a două categorii cu frecvența
egală și maximă.
36
Înălțimea subiecților.Frecvența de apariție
Introducere în SPSS 2011 Mihaela Naidin
Figura nr. 2.
Normalitatea distribuției, sub aspectul modalități, se verifică prin
calcularea valorii modul. Dacă există o singură valoare cu frecvența maximă,
atunci distribuția poate fi considerată normală sub acest aspect. În condițiile în
care sunt două sau mai multe valori cu frecvența maximă și, evident, egală,
distribuția este polimodală (multimodală) și nu poate fi considerată ca fiind
normală.
IV.6. Simetria.
O distribuție este
simetrică, dacă valorile sunt
egal (simetric) răspândite în
jurul tendinței centrale. Atunci
când rezultatele tind către valori
mici, sunt aglomerate în partea
stângă a distribuției, avem de a
Figura nr. 3 face cu o distribuție asimetrică
spre dreapta (sau distribuție skewness pozitiv). Când rezultatele tind către valori
mari, se aglomerează în partea dreaptă a distribuției, vorbim despre o distribuție
asimetrică la stânga (skewness negativ). Iată că, asimetria este dată de panta
distribuției și nu de vârful acesteia , așa cum tratează și consideră unii.
În figura nr. 3, distribuția „B” este o distribuție simetrică. Distribuția „A”
este o distribuție asimetrică la dreapta (skewness pozitiv) unde predomină
scorurile scăzute (mici), în timp ce distribuția „C” este o distribuție asimetrică la
stânga (skewness negativ) în care predomină scorurile mari.
37
Introducere în SPSS 2011 Mihaela Naidin
Nu ne putem limita la o apreciere pur vizuală a simetriei; acest lucru necesită
demonstrarea statistică a simetriei sau asimetriei distribuției. În acest scop, există mai mulți
coeficienți care pot fi calculați.
Atunci când discutăm de asimetrie, trebuie să precizăm o serie de relații
care apar între indicatorii tendinței centrale, media, mediana și modul.
Într-o distribuție simetrică , media, mediana și modul au exact aceleași
valori. Caracteristica acestei distribuții o reprezintă coincidența absolută a celor
trei indicatori ai tendinței centrale.
După cum puteți observa în figura
de mai sus, atât media, cât și
mediana și modulul, se află în
același punct, la mijlocul
distribuției. Grupa subiecților cu
scoruri Figura nr. 4
mai mici decât media este perfect simetrică cu grupa subiecților cu scoruri mai
mari decât media. Acest aspect este menționat din rațiuni teoretice. În practică
nu vom întâlni o distribuție perfect normală, ci o distribuție care poate fi
acceptată ca fiind normală.
Într-o distribuție asimetrică la dreapta (distribuție skewness pozitiv,
vezi figura alăturată), predomină
scorurile mici. În acest caz,
modulul este valoarea situată cel
mai la stânga în șirul de date, iar
mediana este mai mică decât
media. Evident, mediana fiind
valoarea care împarte șirul
ordonat de date în două părți egale, Figura nr. 5
iar dacă în distribuție predomină scorurile mici, atunci scorurile mari sunt
considerate ca scoruri extreme. Știm de la analiza preciziei indicatorilor
38
Introducere în SPSS 2011 Mihaela Naidin
tendinței centrale, că într-o serie de date în care întâlnim scoruri extreme mari,
media tinde să le pună în valoare. Iată că acest fapt este ilustrat grafic în figura
de mai sus. Observați relația existentă într-o asemenea distribuție: Mo<Me<m.
Această relație este relația caracteristică a unei distribuții asimetrice pozitiv.
Într-o distribuție asimetrică la stânga (distribuție skewness negativ,
vezi figura alăturată), predomină
scorurile mari. În acest caz,
modulul este valoarea situată cel
mai la dreapta în șirul de date, iar
mediana este mai mare decât
media. Evident, mediana fiind
valoarea care împarte șirul
ordonat de date în două părți egale, Figura nr. 6
iar dacă în distribuție predomină scorurile mari, atunci scorurile mici sunt
considerate ca scoruri extreme. Știm, de la analiza preciziei indicatorilor
tendinței centrale, că într-o serie de date în care întâlnim scoruri extreme mici,
media tinde să le pună în valoare. Iată că acest fapt este ilustrat grafic în figura
de mai sus. Observați relația existentă într-o asemenea distribuție: Mo>Me>m.
Această relație este relația caracteristică a unei distribuții asimetrice negativ.
IV.7. Boltirea (excesul).
Asimetria pe orizontală, presupune, după cum am văzut, o deplasare a
tendinței centrale spre stânga sau spre dreapta, către scoruri mici sau către
scoruri mari. Dar, aceasta nu este singura asimetrie posibilă. Există și un fel de
„asimetrie verticală” sau boltire. Termenul folosit generic pentru acest concept
este termenul de kurtosis (din limba greacă, kurtos = „cocoșat”).
Practic, boltirea se referă la aspectul „cocoașei” distribuției rezultatelor.
Cocoașa poate fi ascuțită și atunci vorbim de o distribuție ascuțită sau
leptocurtică, poate fi turtită, distribuția turtită, plată sau platicurtică sau
39
Introducere în SPSS 2011 Mihaela Naidin
normală, distribuție mezocurtică. O distribuție normală este întotdeauna o
distribuție mezocurtică.
În figura alăturată,
distribuția „C” este o distribuție
leptocurtică, ascuțită. Distribuția
„B” este o distribuție platicurtică,
turtită, iar distribuția „A” este o
distribuție normală sub aspectul
boltirii, sau mezocurtică.
Figura nr. 7
Se observă că boltirea nu este altceva decât simetria pe axa ve rticală (OY),
spre deosebire de simetria propriu zisă, deplasarea valorilor pe axa orizontală
(OX). Dacă la simetrie se vorbește de frecvențe (care sunt cele mai frecvente
scoruri obținute, unde se concentrează acestea? În eșantionul sunt mai degrabă
subiecți scunzi sau subiecți înalți? Ori poate există un echilibru între subiecții
scunzi și cei înalți), la boltire se discută de valori, de modul în care aceste valori
se grupează în jurul tendinței centrale (sunt mai grupate valorile în jurul mediei
sau, din contra, foarte împrăștiate.)
La fel ca și simetria, boltirea nu poate fi apreciată pur „ochiometric” ci
avem nevoie și aici de anumiți coeficienți de boltire. Pearson a discutat despre
boltire în termeni de momente, la fel ca și simetria, rezultând astfel coeficientul
de boltire sau coeficientul kurtosis .
O distribuție leptocurtică, ascuțită, arată că datele sunt foarte grupate și
apropiate de medie, lotul de subiecți având un mare grad de omogenitate a
scorurilor. Această distribuție nu ridică nici un fel de probleme atunci când
trebuie să diferențiem subiecții care obțin scoruri mici sau mari. Avem însă
dificultăți atunci când trebuie să diferențiem subiecții din zona medie a
distribuției.
40
Introducere în SPSS 2011 Mihaela Naidin
De exemplu, dacă într-o clasă de 30 de elevi, 27 obțin medii anuale între
7,9 și 8,1. Iată că, doar două zecimi diferențiază între aproape întreg efectivul de
elevi. Nu avem nici o problemă cu repartizarea celorlalți trei elevi. Pe aceia îi
vom considera ori foarte buni, ori foarte slabi, în funcție de media obținută – sub
7,9 sau peste 8,1. Ce ne facem însă cu cei 27 de subiecți? Suntem, iată, în
imposibilitatea de ai-i ierarhiza în vreun fel. Dacă presupunem că cei trei
subiecți au note mai mici de 7,9, atunci cine va lua, dintre cei 27 de elevi,
premiul I, cine va lua premiul II și cine va lua premiul III. Decizia ar fi, după
cum se poate vedea, extrem de dificilă, dacă nu chiar imposibilă. Singura
variantă în acest caz, ar putea fi creșterea preciziei. Nu calculăm media cu o
singură zecimală, ci cu 2, 3 sau 4 zecimale. Totuși, sunt situații în care un
asemenea nivel de precizie este ridicol. O evaluare în care distribuția rezultatelor
este leptocurtică, este o evaluare ce nu poate diferenția între subiecții de nivel
mediu, iar o curbă leptokurtică nu este o distribuție normală;
O distribuție platicurtică, plată, este o distribuție în care rezultatele sunt
foarte împrăștiate față de medie și indică un grad ridicat de eterogenitate a
scorurilor. Problema generală a acestei distribuții, în opoziție cu distribuția
leptokurtică, este aceea că diferențiază greu la extreme și destul de bine în zona
mediei. Va fi greu, utilizând o asemenea distribuție, să facem diferențieri între
elevii slabi și între elevii buni, deși putem diferenția relativ ușor elevii medii.
Datorită acestui fapt, o distribuție platicurtică nu este nici ea o distribuție
normală.
O distribuție normală este o distribuție mezocurtică.
Analiza unei distribuții sub aspectul normalității este primul pas pe care îl
facem în orice prelucrare de date. Deoarece, în funcție de rezultatul acestei
analize, vom putea alege tehnicile și procedeele statistice pe care le putem
folosi, această etapă o întâlnim, de obicei, la începutul oricărui raport de
cercetare, imediat după descrierea eșantionului.
41
Introducere în SPSS 2011 Mihaela Naidin
1.Histograma:
a.este un grafic folosit în statistica descriptivă;
b.arată o distribuție de frecvență;
c.se folosește pentru date calitative.
2.Valid procent:
a. exprimă aceste frecvențe ca un procent al numărului total excluzând
datele lipsă.
b. frecvențe ca un procent al numărului total lipsesc incluzând și datele care
lipsesc.
c. frecvența valorilor.
3.Pentru a obține un tabel de frecvențe accesăm:
a.analyze/ descriptive statistics/frequences;
b.analyze/ descriptive statistics/descriptives;
c.analyze/ descriptive statistics/frequences/descriptives.
4.Pentru a crea o histogramă accesăm:
a.graphs/histogram;
b.graphs/interactve;
c.graphs/control.
5.O distribuție poate fi:
a.unimodală;
b.bimodală;
c.trimodală.
6.Într-o distribuție simetică:
a.media < mdiana< modul;
b.media = mediana = modul;
c.media >mediana>modul.
7.Într-o distribuție asimetrică la dreapta:
42 IV.8. Alegeți răspunsul corect
Introducere în SPSS 2011 Mihaela Naidin
a.modul <mediana<media;
b.modul>mediana>modul;
c.modul=mediana=mo dul.
8. Într-o distribuție asimetrică la dreapta:
a. modul=mediana=media;
b. modul <mediana>modul;
c. modul>mediana>modul.
9. O distribuție poate fi:
a.leptocurtică;
b.platicurtică;
c.asimetrică pozitiv;
d.asimetrică negativ;
e.mezocurtică.
f.toate variantele de mai sus.
10. O distribuție leptocurtică arată că:
a.datele sunt foarte grupate și apropiate de mediană iar lotul de subiecți are
un grad mare de omogenitate;
b.datele sunt foarte împrăștiate de mediană iar lotul de subiecți are un grad
mare de eterogenitate;
c.distribuția este normală.
11. O distribuție platicurtică arată că:
d.datele sunt foarte grupate și apropiate de mediană iar lotul de subiecți are
un grad mare de omogenitate;
e.datele sunt foarte împrăștiate de mediană iar lotul de subiecți are un grad
mare de eterogenitate;
f.distribuția este normală.
43
Introducere în SPSS 2011 Mihaela Naidin
1. a. este un grafic folosit în statistica descriptivă;
b. arată o distribuție de frecvență;
2. a. analyze/ descriptive statistics/frequences;
3. a. analyze/ descriptive statistics/frequences;
4. a. graphs/histogram;
5. a. unimodală;
b. bimodală;
c. trimodală.
6. b. media = mediana = modul;
7. b. modul <mediana<media;
8. c. modul>mediana>modul.
9. f. toate variantele de mai sus.
10. a. datele sunt foarte grupate și apropiate de mediană iar lotul de subiecți
are un grad mare de omogenitate;
11. b. datele sunt foarte împrăștiate de mediană iar lotul de subiecți are un
grad mare de eterogenitate;
44 IV.9. Răspunsuri corecte
Introducere în SPSS 2011 Mihaela Naidin
Curs 4
VV.. Abaterea standard.Abaterea standard.
_____________________________________________________________________________________________ ___________________
Abaterea standard este un indice care arată cât de mult deviază (diferă)
unele scoruri „în medie” față de media setului de scoruri din care acestea fac
parte.
Abaterea standard poate fi folosită și pentru a transforma scoruri pentru
variabile foarte diferite în scoruri Z (sau standard), care sunt ușor de comparat și
însumat.
Calcularea abaterii standard și a scorurilor Z este prezentată în exemplul
următor:
Vârstă20222526353828242324
V.1. Introducerea datelor.
Pasul 1:
În „Variable View” din
„Data Editor” se
denumește prima coloană
„Vârsta”.
Se înlătură cele două
zecimale.
Pasul 2:
În „Data View” din „Data Editor”
se introduc vârstele în prima
45
Introducere în SPSS 2011 Mihaela Naidin
coloană.
Pasul 3:
Se selectează:
„Analyze”
„Descriptive Statistics”
„Descriptives…”
Pasul 4:
Se selectează „vârsta” și apoi se
apasă butonul ► pentru a o
introduce în lista de variabile.
Se selectează „Options…”
Pasul 5:
Se deselectează „Mean” ,
„Minimum”, „Maximum”.
Se selectează „Continue” .
Se selectează „OK” din
ecranul precedent care
reapare.
V. 2. Interpretarea output-ului.
Numărul 10 reprezintă numărul de
cazuri.
Abaterea standard pentru vârstă este
de 6,115.
V.3. Scorurile Z
Pasul 1:
46
Introducere în SPSS 2011 Mihaela Naidin
La pasul 4 selectați „Save standardized values as variables”.
Se apasă „OK”.
Pasul 2:
Scorurile Z sau standard
sunt în a doua coloană din
„Data View” în „Data Editor”
și sunt numite „ZVârstă”.
V.4. Raportarea output-ului.
Abaterea standard pentru o variabilă este ușor de menționat în textul
raportului: „A fost determinată abaterea standard a vârstei ca fiind 6,11 ani (N=
10)”.
*Este posibil ca abaterea standard să fie înregistrată împreună cu alte statistic i, cum ar
fi media, rangul, etc.
Notele „z” reprezintă diferența dintre scorul observat și medie, în
termeni de abatere standard. Cu alte cuvinte, notele „z” nu sunt altceva decât
distanțele la care se situează scorurile particulare în raport cu media grupului iar
această distanță este exprimată standardizat.
Teoretic, notele „z” sunt note obținute pe o „curbă” cu media 0 și abaterea
standard 1. În acest caz, o distribuție normală are practic notele „z” cuprinse
între -3 și +3, între aceste note regăsindu-se peste 99% din populație, după cum
observați în figura de mai jos.
Notele „z” au și ele o serie de proprietăți cu aplicabilitate practică
deosebită, dintre care menționăm (Popa, 2006):
•Media unei distribuții „z” este egală cu zero, afirmație ce rezultă din
proprietatea acestui indicator de a se diminua atunci când scădem o
47
Introducere în SPSS 2011 Mihaela Naidin
constantă din fiecare scor particular. Deoarece din formulă rezultă această
diferență (se scade fiecare scor particular din medie), în final media va
ajunge la valoarea zero
•Abaterea standard a unei distribuții „z” este întotdeauna 1. Și această
afirmație rezultă din proprietățile abaterii standard. Știm că dacă împărțim
abaterea standard cu o constantă, valoarea acesteia se divide corespunzător.
Din formulă, observăm că acea constantă cu la care împărțim este chiar
abaterea standard iar împărțirea a două numere egale are ca rezultat 1
Notele „z” sunt note direct calculabile, utilizându-se media și abaterea
standard și reprezintă „temelia” oricărui proces de standardizare. Totuși,
principalul dezavantaj al notelor „z” este acela că sunt puțin intuitive. Trebuie să
știm bine ce înseamnă distribuția normală pentru a înțelege corect semnificația
acestor note. În plus, au valori pozitive și negative, ceea ce le face, iarăși, greu
de utilizat.
V.5. Alte caracteristici .
În meniul „Descriptives Statistics sunt conținute mai multe calcule
statistice care pot fi selectate:
Mean (media);
Sum (suma);
Standard deviation (estimate) (abaterea standard);
Range (amplitudinea);
Minimim;
Maximum;
Kurtosis;
Skewness.
* Aceste concepte sunt explicate pe scurt la sfârșitul capitolului 3.
48 V.6. Alegeți răspunsul corect
Introducere în SPSS 2011 Mihaela Naidin
1.Abaterea standard:
a.este un indice care arată cât de mult deviază (diferă) unele scoruri „în
medie” față de media setului de scoruri din care acestea fac parte.
b.este un indice care arată cât de simetrică sau asimetrică este o
distribuție;
c.este un indice care arată cât de turtită sau boltită este o distribuție.
2. Media este o mărime generalizată , adică, înlocuind fiecare nivel
individual al caracteristicii de distribuție cu nivelul mediu:
a) suma seriei rămâne aceeași
b) suma termenilor seriei se modifică
c) suma termenilor seriei este nulă.
3. Media aritmetică reprezintă:
a) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuția ar
fi eterogenă
b) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuția ar
fi omogenă
c) valoarea pe care ar purta-o fiecare variabilă statistică dacă distribuția
ar fi omogenă.
4. Media aritmetică, ca indicator fundamental al tendinței centrale:
a)reprezintă valoarea care modifică nivelul totalizator;
b)se folosește cel mai frecvent și reprezintă suma valorilor raportată
la numărul lor;
c)se calculează adunând valorile existente;
d)nu poate determina numărul de unități din colectivitate.
49
Introducere în SPSS 2011 Mihaela Naidin
1.a. este un indice care arată cât de mult deviază (diferă) unele
scoruri „în medie” față de media setului de scoruri din care acestea fac
parte.
2. a) suma seriei rămâne aceeași
3. b) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuția ar
fi omogenă
4. b. se folosește cel mai frecvent și reprezintă suma valorilor raportată la
numărul lor;
50 V.7. Răspunsuri corecte
Introducere în SPSS 2011 Mihaela Naidin
Curs4
VI.VI. Relațiile dintre două sau mai multe variabile.Relațiile dintre două sau mai multe variabile.
Diagrame și tabele. Diagrame și tabele.
__________________________________________________________________________________________ ______________________
În foarte multe cercetări se studiază relațiile dintre două sau mai multe
variabile. Procedurile statistice univariate (cu o singura variabilă) care au fost
descrise până acum pot fi utilizate pentru analiza oricăror date. Dar, cercetarea
poate necesita ca relațiile și corelațiile dintre diferitele variabile să fie studiate.
La fel ca statistica univariată, statistica bivariată a datelor necesită
studierea tendințelor fundamentale ale datelor utilizând tabele și diagrame.
Modelele de prezentare a relațiilor bivariate includ crearea tabelelor scatter.
O condiție esențială o constituie etichetarea tabelelor și diagramelor și
denumirea acestora.
În continuare se va ilustra elaborarea unui tabel de asociere și a unei
diagrame cu bare .
VI.1. Introducerea datelor.
În studiu sunt introduși 11 copii instituționalizați și 9 copii
neinstituționalizați. Dintre aceștia 9 au fost fete și 11 au fost băieți.
Pasul 1:
În „Variable View” din „Data Editor” se denumește:
-prima coloană „Instituțion alizare”
-a doua coloană „Genul biologic”;
-A treia coloană „ Frecvența”.
Se înlătură cele două zecimale.
51
Introducere în SPSS 2011 Mihaela Naidin
Pasul 2:
Se etichetează cele două valori
ale instituționalizării:
1 – instituționalizat;
2 – neinstituționalizat.
Și genul biologic:
1.Feminin;
2.Masculin
*Pașii acestei proceduri au fost explicați
în capitolul 1.
Pasul 3:
Se introduc aceste numere în „Data
View” din „Data Editor”.
Primul rând se referă la fetele care
au fost instituționalizate: sunt în număr
de 5.
Al doilea rând se referă la băieții
care au fost instituționalizați:
sunt în număr de 6.
Al treilea rând se referă la fetele
neinstituționalizate: sunt în număr de 4.
Al patrulea rând se referă la băieții
neinstituționalizați: sunt în număr de 5.
VI.2. Ponderea datelor
Pasul 4:
Pentru a pondera datele cu scopul
ca cele patru celule să conțină
numărul de cazuri corespunzător,
se selectează:
„Data”
„Weight Cases…”
Pasul 5:
Se selectează „Frecvența”,
„Weight cases by” ș i apoi se
apasă butonul ►pentru
transfer în căsuța
variabilei„Frequency
Variable”.
52
Introducere în SPSS 2011 Mihaela Naidin
Se apasă „OK”
VI.3. Crearea tabelelor de asociere (Crosstabs).
Pasul 6:
Se selectează:
„Analize”
„Descriptivesc statistics”
„Crosstabs…”.
Pasul 7:
Pentru a pune „instituționalizare” pe
rândurile tabelului, se selectează și
apoi se apasă butonul ►de lângă
eticheta „Row(s)”.
Pentru a pune „genul biologic” pe
coloanele tabelului, se selectează și
apoi se apasă butonul ► de lângă
eticheta „Column(s).
Se apasă „OK”.
Pasu l 8:
În tabel sunt
prezentate valorile
celor două variabile.
Se observă că sunt 5
fete și 6 băieți
instituționalizați (în total 11) și 4 fete și 5 băieți neinstituționalizați (în total 9).
(N=20).
Tabelul de asociere este folosit pentru prezentarea relațiilor dintre două variabile categoriale.
În fiecare celulă a tabelului este prezentată frecvența parțială (adică efectivul care poartă
simultan o valoare a fiecărei variabile).
Observație:
1.Dacă într-un crosstabs numărul categoriilor unei variabile este mai mare decât al
alteia, atunci categoriile acelei variabile se plasează pe rânduri.
2.O celulă din crosstabs oferă informația despre intersecția celor două variabile. Pentru
aceasta alegem din fereastra Crosstabs butonul de comandă Cell ce are ca efect
afișarea ferestrei Crosstabs Cell Display.
53
Introducere în SPSS 2011 Mihaela Naidin
Curs 5
VIIVII. Coeficienți de corelație.. Coeficienți de corelație.
Coeficienți de corelație Pearson și Spearman. Coeficienți de corelație Pearson și Spearman.
____________________________________________________________________________________________________ ______________________________________________________________________________________________________________________________
Corelația este o metodă statistică utilizată pentru a determina relațiile
dintre două sau mai multe variabile. Există mai multe tipuri de corelații atât
parametrice cât și neparametrice.
Coeficientul de corelație este o valoare cantitativă ce descrie relația
dintre două sau mai multe variabile. El variază între (-1 si +1), unde valorile
extreme presupun o relație perfectă între variabile în timp ce 0 înseamnă o lipsa
totala de relație liniară. O interpretare mai adecvată a valorilor obținute se face
prin compararea rezultatului obținut cu anumite valori prestabilite în tabele de
corelații în funcție de numărul de subiecți, tipul de legătură și pragul de
semnificație dorit.
Cel mai comun și cel mai folositor este coeficientul de corelație Pearson
și coeficientul de corelație Spearman.
Corela ia Pearson(r) evalueaz gradul de asociere dintre dou variabileț ă ă
m surate pe scal de interval/raport. Aceasta se refer la intensitatea i sensul deă ă ă ș
varia ie concomitent a valorilor unei variabile în raport cu cealalt , dup unț ă ă ă
model de tip liniar. Dac valorile unei variabile urmeaz , în sens direct, ă ă
cresc tor, sau invers, descresc tor, valorile celeilalte variabile, atunci cele două ă ă
variabile coreleaz între ele. Domeniul de varia ie a coeficientului de corela ie ă ț ț
Pearson(r) este între r = -1 (corela ie perfect negativ : ceea ce înseamn c în ț ă ă ă ă
timp ce scorurile unei variabile cresc, scorurile pentru cealalt variabil ă ă
descresc) i r = +1 (corela ie perfect pozitiv : ceea ce înseamn c scorurile ș ț ă ă ă ă
unei variabile se m resc odat cu cre terea scorurilor celeilalte variabile). ă ă ș
Absen a oric rei leg turi (corela ii) dintre variabile se traduce prin r =0.ț ă ă ț
O corela ie de 1,00 indic o asociere perfect între cele dou variabile.ț ă ă ă
Cu alte cuvinte, o diagram scatter a celor dou variabile va ar ta c toate ă ă ă ă
punctele sunt con inute de o singur dreapt . O valoare de 0,00 indic faptul c ț ă ă ă ă
54
Introducere în SPSS 2011 Mihaela Naidin
toate punctele din diagrama scatter sunt dispersate aleatoriu în jurul oric rei ă
drepte desenate pe aceast diagram a datelor sau sunt aranjate într-o manier ă ă ă
curbilinie.
În continuare vom ilustra calculul corela iei Pearson, o diagram scatter ț ă
i coeficientul de corela ie Spearmanș ț , folosind pentru aceasta datele din tabelul
urm tor, care reprezint scoruri ale abilit ilor muzicale i matematice pentru 10ă ă ăț ș
copii.
muzica3789964347
matematic ă7544589976
VII.1. Introducerea datelor.
Pasul 1:
În „Variable „View” din „Data
Editor” se denume te primul ș
rând „muzic ” ă
i al doilea rând „matematic ”.ș ă * Se înl tur cele dou zecimale.ă ă ă
Pasul 2:
În „Data View” din „Data editor” se
introduc datele pentru :
-muzic în prima coloană ă ;
-matematic în a doua coloan . ă ă
VII.2. Corela ia Pearson.ț
Pasul 1:
Se selecteaz : ă
„Analyze”,
„Corelate”,
„Bivariate…”
Pasu l 2:
55
Introducere în SPSS 2011 Mihaela Naidin
Se selecteaz „Muzic ” i „Matematic ” i apoi se apas butonul ă ă ș ă ș ă ►pentru a le
introduce în lista de variabile a a cum este ar tat în figura din dreapta. ș ă
Se apas „OK”.ă
VII.3. Interpretarea
output-ului.
Corela ia dintreț
„matematic ” i „muzic ” ă ș ă
este – 0,845 La un test de
semnifica ie, two-tailed la ț
nivelul de probabilitate 0,01
sau mai mic, corela ia este ț
statistic semnificativ . ă
Num rul cazurilor pe care este bazat corela ia este 10. Informa ia apare i înă ă ț ț ș
aceast celul .ă ă
*One tailed – dac distribu ia este unidirec ional . ă ț ț ă
Two-tailed – dac distribu ia este bidirec ional . ă ț ț ă
VII.4. Raportarea output-ului.
Corela ia dintre abilit ile muzicale i cele matematice este – 0,845.ț ăț ș
* Se obi nuie te s se rotunjeasc corela ia cu dou zecimale, deș ș ă ă ț ă ci aceasta va deveni 0,90,
acesta fiind un rezultat mult mai precis pentru majoritatea m sur torilor psihologice. ă ă
Nivelul de semnifica ie exact, cu trei zecimale, este 0,002. Înseamn c ț ă ă
nivelul de semnifica ie este mai mic decât 0,01. ț
Interpretarea psihologic va fi: „Exist o rela ie negativ semnificativ între ă ă ț ă ă
abilit ile muzicale i cele matematice , ceea ce înseamn c , copii cu nivelăț ș ă ă
ridicat al abilit ilor muzicale au un nivel sc zut al abilit ii matematice”. ăț ă ăț
Un coeficient de corelatie poate fi calculat corect numai când datele ambelor variabile
se refera la esantioane si fiecare este ales independent.
Un coeficient de corelatie poate fi apropiat de ą1, deci ne va indica o corelatie
puternica, dar ea poate fi nesemnificativa din cauza volumului mic a esantionului studiat.
Corelatia nu trebuie identificata cu cauzalitatea, in sensul ca observatiile a 2 variabile se
pot corela foarte bine fara sa avem motive logice si stiintifice ca una dintre variabile poate fi
cauza celeilalte.
VII.5. Coeficientul de corela ie Spearman. ț
56
Introducere în SPSS 2011 Mihaela Naidin
Pasul 1:
Identic corelației Pearson se
selectează „Analyze”, „Correlate”,
„Bivariate” și variabilele care se
doresc pentru corelație.
Se selectează „Spearman” și se
deselectează Pearson (dacă nu se
dorește ca și corelație).
Se apasă „OK”.
VII.6. Interpretarea output-ului.
Coeficientul de corelație Spearman Numărul cazurilor este 10.
între muzică și matematică este – 0,842.
Nivelul de semnificație este 0,001 sau
mai mic, deci corelația este statistic
semnificativă.
VII.7. Raportarea output-ului.
Corelația raportată cu două zecimale este – 0,84.
Interpretarea psihologică va fi: „Există o corelație negativă semnificativă
între abilitățile muzicale și cele matematice, ceea ce semnifică faptul că, cei cu
un nivel ridicat al abilității muzicale au abilități matematice scăzute și
viceversa”.
•Coeficientul de corelatie al rangurilor (Spearman) testeaza gradul de corelare intre 2
variabile calitative; este alternativa neparametrica a “coeficientului de corelatie Pearson”.
•Acest coeficient variaza intre -1 si +1. O valoare apropiata de +1, inseamna ca suma
patratelor diferentelor este aproape nula, deci avem clasamente identice.
•O valoare apropiata de 0, inseamna necorelarea variabilelor, iar valoarea apropiata de -1
pune in evidenta discordanta maxima a variabilelor.
VII.8. Diagrama scatter.
57
Introducere în SPSS 2011 Mihaela Naidin
Pasul 1:
Se selectează:
„Graphs”
„Scatter/Dot”
Pasul 2:
Se selectează „define” din moment ce „simple” este
deja selectat.
Pasul 3:
Pentru a avea variabila
„muzică” ca axă verticală,
se selectează și apoi se
apasă butonul ►de lângă
căsuța „Y Axis”
Pentru a avea variabila
„matematică” ca axă
orizontală, se selectează
apoi se apasă butonul ◄ de
lângă căsuța „X Axis”.
Se apasă „OK”.
VII.9. Interpretarea output-ului.
58
Introducere în SPSS 2011 Mihaela Naidin
În diagrama scatter, răspândirea
punctelor este relativ îngustă,
ceea ce indică o corelație mare.
Forma împrăștierii rezultatelor
este relativ în linie dreaptă,
indicând mai degrabă o relație
în linie dreaptă decât o relație
curbilinie.
Linia este de la colțul stânga sus
până în dreapta jos, ceea ce
indică o corelație negativă.
*Dacă relația este curbilinie atunci
corelațiile Pearson și Spearman pot fi
înșelătoare.
VII.10. Raportarea output-ului.
Despre diagrama scatter s-ar putea scrie următoarele afirmații: „ A fost
examinată o diagramă scatter pentru relația dintre abilitățile muzicale și
matematice. Nu există nicio dovadă privind o relație curbilinie sau asupra
influenței avute de rezultatele atipice”.
59
VII.11. Alegeți răspunsul corect
Introducere în SPSS 2011 Mihaela Naidin
1. Corelația:
a. măsoară variația concomitentă a doi factori
b. măsoară parametria distribuției între două eșantioane
c. măsoară rangul unei distribuții trihotomice
2. Corela ia Pearson(r): ț
a.evalueaz gradul de asociere dintre dou variabile m surate pe scal deă ă ă ă
interval/raport.
b.evalueaz gradul de asociere dintre dou variabile m surate pe scală ă ă ă
nominal ;ă
c.evalueaz gradul de asociere dintre dou variabile m surate pe scală ă ă ă
ordinal .ă
3.O corela ie de 1,00 indic :ț ă
a.o asociere perfect între cele dou variabile; ă ă
b.faptul c toate punctele din diagrama scatter sunt dispersate aleatoriu înă
jurul oric rei drepte desenate pe aceast diagram a datelor;ă ă ă
c.absen a oric rei leg turi (corela ii) dintre variabile.ț ă ă ț
4.Pearson este un indicator de corela ie: ț
a.parametric;
b.neparametric;
c.ambele variante de mai sus.
5.Spearman este un indice de corelație:
a. parametric;
b. neparametric;
c. ambele variante de mai sus.
6.O corela ie negativ semnific faptul c :ț ă ă ă
a.în timp ce scorurile unei variabile cresc, scorurile pentru cealalt variabil ă ă
descresc;
b. c scorurile unei variabile se m resc odat cu cre terea scoruriloră ă ă ș
celeilalte variabile).
c.nu exist nicio leg tur între variabile.ă ă ă
60
Introducere în SPSS 2011 Mihaela Naidin
7. O corela ie pozitiv semnific faptul c :ț ă ă ă
d.în timp ce scorurile unei variabile cresc, scorurile pentru cealalt variabil ă ă
descresc;
e. c scorurile unei variabile se m resc odat cu cre terea scoruriloră ă ă ș
celeilalte variabile).
f.nu exist nicio leg tur între variabile.ă ă ă
8. Norul de puncte este folosit pentru:
a. a reprezenta relația dintre variabile;
b. a arăta frecvența de apariție pentru diferite clase de valori ale variabilei
observate;
c. a arăta intzervalul de încredere de 95% pentru media respectivă.
9. Pentru a realiza un tabel de asociere selectăm:
a. Analyze/Descrisptiv statistics/crosstabs;
b. Analyze/Descrisptiv statistics/Explore;
c. Statistics / Corelate / Crosstabs
d. Statistics / Custom tables / Crosstabs
10. Tabelul de asociere este folosit pentru:
a. selectarea unor subiecți
b. prezentarea relațiilor dintre două variante categoriale
c. recodificarea variabilelor
d. modificarea unui tabel
61
Introducere în SPSS 2011 Mihaela Naidin
1. a. măsoară variația concomitentă a doi factori
2. a. evalueaz gradul de asociere dintre dou variabile m surate pe scal deă ă ă ă
interval/raport.
3. a. o asociere perfect între cele dou variabile; ă ă
4. b. neparametric;
5. b. neparametric;
6. a. în timp ce scorurile unei variabile cresc, scorurile pentru cealalt ă
variabil descresc;ă
7. e. c scorurile unei variabile se m resc odat cu cre terea scoruriloră ă ă ș
celeilalte variabile).
8. a. a reprezenta relația dintre variabile;
9. a. Analyze/Descrisptiv statistics/crosstabs;
10. b. prezentarea relațiilor dintre două variante categoriale
62 VII.12. Răspunsuri corecte
Introducere în SPSS 2011 Mihaela Naidin
VIII.VIII. Regresia. Regresia.
Predicția cu precizie. Predicția cu precizie.
__________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Dacă există o relație între două variabile atunci sunt posibile estimarea
sau predicția scorului unei persoane la o variabilă pornind de la scorul obținut la
cealaltă variabilă. Cu cât este mai puternică corelația cu atât este mai bună
predicția. Variabila independentă este variabila folosită pentru a realiza
predicția, aceasta fiind cunoscută și ca variabilă predictor sau variabila X.
*Este foarte important a nu se confunda variabila independentă cu cea dependentă. Cel
mai bun mod de a evita aceste probleme este de a examina scatterplot-ul sau diagrama scatter
a relației dintre cele două variabile. Axa orizontală X este variabila independentă și axa
verticala Y este variabila dependentă. Se poate investiga și punctul de tăiere, acesta fiind
punctul în care panta se intersectează cu axa verticală.
Regresia devine o tehnică mult mai importantă atunci când sunt folosite
mai multe variabile pentru predicția valorilor unei alte variabile.
În continuare este ilustrată procesarea unei regresii simple și a unei
diagrame de regresie folosind datele din tabelul următor.
Scor muzica3789964347
Scor
matematic ă7544589976
Unul din principalele capitole ale statisticii are în vedere posibilitatea de a face
predictii. Desi nu se gasesc relatii perfecte în lumea reala, prin intermediul regresiei se pot
face predictii ale unei variabile, în functie de valoarea alteia. Predictia este procesul de
estimare a valorii unei variabile cunoscând valoarea unei alte variabile.
Regresia se leaga foarte mult de conceptul de corelatie. O asociere puternica între
doua elemente conduce la cresterea preciziei predictiei unei variabile pe seama alteia. Daca
am avea o corelatie perfecta (+1 sau –1) estimarea ar fi extrem de precisa
VIII.1. Introducerea datelor.
Pasul 1:
În „Variable „View” din „Data
Editor” se denume te primul ș
rând „muzic ” ă
63
Introducere în SPSS 2011 Mihaela Naidin
i al doilea rând „matematic ”. ș ă * Se înl tur cele dou zecimale.ă ă ă
Pasul 2:
În „Data View” din „Data editor” se
introduc datele pentru:
-muzic în prima coloan ;ă ă
-matematic în a doua coloan . ă ă
VIII.2. Regresia simpl . ă
Pasul 1:
Se selectează:
„Analyze”
„Regression”
„Linear…”
Pasul 2:
Se selectează „Muzică” și apoi se
apasă butonul ► de lângă eticheta
„Dependent”, pentru a introduce
această variabilă în căsuța
variabilei dependente.
Se selectează „matematica” și apoi
se apasă butonul ◄ de lângă
eticheta „Independent(s) pentru a
introduce această variabilă în
căsuța variabilei (lor)
independente.
Se selectează „Statistics…”
Pasul 3:
Se selectează „Confidence
Intervals”.
Se selectează „Continue”.
Se apasă „OK” din ecranul
precedent care reapare.
64
Introducere în SPSS 2011 Mihaela Naidin
VIII.3. Interpretarea output-ului.
Acest tabel conține datele esențiale pentru analiza regresiei.
Constanta este 12,716. Acesta este punctul în care linia de regresie
intersectează axa verticală.
Coeficientul nestandardizat Coeficientul standardizat Intervalul de
al regresiei este – 1,049. al regresiei este – 0,845. încredere ia valori
Acesta semnifică faptul că, Acesta este mai mult sau de la -1,591 la -0,507.
pentru fiecare creștere cu 1 mai puțin coeficientul de
a variabilei “matematică” corelație Pearson dintre
valoarea variabilei “muzică” abilitățile muzicale și
descrește cu – 1,049. cele matematice.
În acest tabel, B este panta liniei de regresie (în SPSS fiind denumită
coeficient de regresie nestandardizat).
Intervalul de încredere de 95% pentru acești coeficienți este de la -1,59 la
-0,50. Intervalul de încredere de 95% arată intervalul pantelor de regresie în care
putem fi siguri într-o proporție de 95% că panta pentru populație se va găsi.
Cota denumită „Beta” are valoarea -0,845. Aceasta este de fapt corelația
Pearson între cele două variabile.
Regresia simplă – o variabila dependenta si una independent
VIII.4. Scatterplot-ul de regresie.
Atunci când se realizează o regresie este recomandabilă cercetarea
diagramei scatter pentru cele două variabile.
Pasul 1:
Se selectează:
„Graphs”
„Scatter/Dot”
Pasul 2:
65
Introducere în SPSS 2011 Mihaela Naidin
Se selectează „define”; „simple” este deja selectat.
Pasul 3:
Pentru a avea variabila
„muzică” ca axă verticală, se
selectează și apoi se apasă
butonul ►de lângă căsuța „Y
Axis”
Pentru a avea variabila
„matematică” ca axă
orizontală, se selectează apoi
se apasă butonul ◄ de lângă
căsuța „X Axis”.
Se apasă „OK”
Pasul 4:
Pentru a încadra o linie de
regresie în scatterplot, se dă
dublu clic oriunde în interior și
se va deschide „Chart Editor”.
Se selectează „Elements” și
„Fit Line at Total”.
VIII.5. Interpretarea output-ului.
Punctele de pe scatterpl ot sunt apropiate de linia de regresie. În plus,
punctele par să formeze o linie dreaptă (relația nu este curbilinie).
În regresie, axa verticală este
variabila-criteriu sau
dependentă (în cazul nostru =
muzica).
Linia de regresie are o pantă
negativă în acest caz; de
exemplu: de la stânga sus spre
dreapta jos. În consecință B are
valoare negativă.
66
Introducere în SPSS 2011 Mihaela Naidin
În regresie axa orizontală este variabila predictor sau independentă (în
cazul nostru „matematică”).
67
Introducere în SPSS 2011 Mihaela Naidin
* Linia de regresie oblică, de la stânga sus spre dreapta jos, indică o relație negativă între cele
două variabile.
Punctele par relativ apropiate de line, ceea ce sugerează că beta (corelația)
ar trebui sa fie un număr mare (negativ) și că intervalul de încredere este relativ
mic.
Regresia liniară – relatia dintre cele doua variabile poate fi descrisa printr-o dreapta în cadrul
norului de puncte.
VIIII.6. Raportarea output-ului.
Interpretarea diagramei se poate realiza în felul următor:
„Diagrama scatterplot a relației dintre abilitățile matematice și muzicale
sugerează o relație liniară negativă între cele două variabile. Este posibilă
predicția cu acuratețe a abilității muzicale a unei persoane cunoscând abilitatea
sa matematică.
68
Introducere în SPSS 2011 Mihaela Naidin
IX.IX. Eroarea standard Eroarea standard
__________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Eroarea standard este un indice pentru variabilitatea mediilor mai multor
eșantioane extrase din populație; cu alte cuvinte este media măsurii cu care
media eșantioanelor diferă față de media populației din care au fost extrase.
Eroarea standard poate fi folosită ca un pas intermediar în alte tehnici
statistice, cum ar fi Testul t și este un concept important pentru calculul
intervalelor de încredere.
Calcularea erorii standard estimate pentru medie este ilustrată cu un set
de șase scoruri ale stimei de sine, prezentate în tabelul următor.
IX. 1. Introducerea datelor.
Pasul 1:
Se introduc datele în „Data Editor”.
Se etichetează variabila „Stima”.
IX. 2. Eroarea standard estimată a
mediei.
Pasul 1:
Se selectează:
„Analyze”
„Descriptive Statistics”
„Descriptive…”
Pasul 2:Stima de sine 573645
69
Introducere în SPSS 2011 Mihaela Naidin
Se selectează „stima de sine” și apoi se apasă butonul ◄pentru a introduce
variabila „Stima de sine” în „variable(s)”.
Se selectează „Options…”
Pasul 3:
Se selectează „ S-E mean”.
Se selectează „continue”.
Se apasă „OK” din ecranul anterior care
reapare.
IX. 3. Interpretarea output-ului.
Eroarea standard (estimată) pentru medie a acestui eșantion este 0,577.
este o indicație a mediei cu care mediile eșantioanelor diferă de media populației
din care au fost extrase.
testul oferă valoarea erorii standard a mediilor eșantioanelor ca fiind 0,58
(suma este rotunjită la două zecimale) aceasta fiind valoarea medie cu care
mediile eșantioanelor (N=6) diferă față de media populației.
tabelul include și alte informații cum ar fi media (5,00), abaterea standard
estimată a populației bazată pe acest eșantion, valorile minime și maxime ale
datelor.
ultima coloană oferă abaterea standard (estimată) a celor șase scopuri, care
este 1,41.
X. X. Testul t.Testul t.
Compararea a două eșantioane Compararea a două eșantioane
d de scopuri corelate/relaționate.e scopuri corelate/relaționate.
__________________________________________________________________________________________________________________________________________________________________________________________________________________________________
70
Introducere în SPSS 2011 Mihaela Naidin
Testul t este folosit pentru evaluarea semnificației statistice a diferenței
dintre mediile pentru două seturi de scoruri. Cu ajutorul testului t se pune în
evidență dacă valoarea medie pentru un set de scoruri diferă în medie de
valoarea medie pentru alt set de scoruri.
Testul t are două variante:
1.prima variantă este folosită atunci când cele două seturi de scoruri
ce trebuie comparate provin dintr-un singur eșantion sau când
coeficientul de corelație între cele două seturi este mare – testul t
pentru eșantioane perechi;
2.a doua variantă a testului t este utilizată în momentul în care două
seturi diferite de valori provin din grupe diferite de participanți. –
testul t pentru eșantioane independente.
* Testul t pentru eșantioane perechi este optim dacă distribuția diferențelor dintre
cele două seturi de valori se prezintă (aproximativ) sub formă de clopot (atunci când
distribuția este normală). Dacă distribuția este foarte diferită de forma de clopot ar trebui luată
în considerare utilizarea unei tehnici statistice relaționate nonparametrică pentru eșantioane
perechi, cum ar fi testul de perechi Wilcoxon.
Procesarea unui Test t este ilustrată cu datele din tabelul următor unde
sunt prezentate numărul de cuvinte pe care aceeași copii le-au verbalizat cu
mamele lor la 18 luni și la 24 luni.
Numărul de cuvinte verbalizate într-un minut la vârste diferite.
Alina Cristina Raluca Carmen Simona Radu Cristi Dan
18 luni32452324
24 luni54783446
71
Introducere în SPSS 2011 Mihaela Naidin
X.1. Introducerea datelor.
Pasul 1:
În „Variable View” din „Data
Editor” se etichetează primul rând cu
„optsprezece” și al doilea rând cu
„douăzeci și patru”.
* Se înlătură cele două zecimale.
Pasul 2:
În „Data View” din „Data Editor”
se introduc datele în primele două
coloane.
X.2. Testul t pentru eșantioane perechi
Pasul 1:
Se selectează:
„Analyze”
„Compare Means”
„Paired-Samples T Test…”
Pasul 2:
Se selectează „optsprezece”
și se pune această variabilă
lângă eticheta „Variable1” sub
„Curent Selections”.
Se selectează „douăzeci și
patru” și se pune această
variabilă lângă eticheta
„Variable2” sub „Curent
Selections”.
Se apasă butonul ►pentru a
pune aceste două variabile în
lista variabilelor relaționale.
Se apasă „OK”.
72
Introducere în SPSS 2011 Mihaela Naidin
X.3. Interpretarea output-ului.
Primul tabel arată media, numărul de cazuri și abaterea standard
pentru cele două grupuri. Media pentru „optsprezece” este 3,13 și abaterea
standard este 1,126.
Al doilea tabel arată gradul în care cele două seturi de valori sunt corelate.
Corelația dintre ele 0,94. Aceasta este o corelație mare, nivelul de semnificație
fiind de 0,00.
Primele trei coloane care conțin cifre sunt componentele fundamentale ale
calcului unui Test t relaționat. Media de -2,000 este de fapt diferența dintre
mediile pe 18 și 24 luni, deci în realitate este media diferenței. Valoarea lui t
este bazată pe această medie a diferenței (-2,00), divizată cu eroarea standard a
mediei (0,267). Calculul oferă valoarea lui t (-7,483).
X.4. Raportarea output-ului.
Rezultatele obținute ar putea fi prezentate astfel: „Media numărului de
cuvinte verbalizate la 18 luni diferă semnificativ de media cuvintelor verbalizate
la 24 de luni.
73
Introducere în SPSS 2011 Mihaela Naidin
XI. Testul t.
Compararea a două eșantioane de
scoruri necorelate/nerelaționate.
_________________________________________________________________________________________________________________
Atunci cînd o investigație de tip statistic se efectuează pe un eșantion,
orice rezultat obținut are o valoare relativă, în sensul că datele respective nu
numai că nu coincid cu cele referitoare la populație, dar nici măcar nu se poate
ști cu certitudine care este diferența dintre cele două genuri de date, de vreme ce
starea populației este, de regulă, necunoscută. Teoria matematică a
probabilităților oferă însă proceduri pentru evaluarea rezultatelor studiilor
selective, permițînd o estimare, în termeni de probabilitate, a marjei maxime de
eroare ce se poate comite prin utilizarea mărimilor din eșantion în locul celor
care caracterizează populația.
Testul t este în esen o procedur de testare a semnifica iei diferen eiță ă ț ț
dintre dou medii. ă
Ca urmare, el este potrivit atunci când variabila dependent este ă
m surat pe scal cantitativă ă ă ă (interval-raport). Distribu ia teoretic de referin ț ă ță
(distribu ia de nul) este cea normal , pentru e antioane mai mari de 30 de subiecț ă ș
i, i distribu ia t (Student), pentru e antioane mai mici de 30 de subiec i. Chiarț ș ț ș ț
dac formulele de calcul sunt diferite, forma de prezentare a rezultatelor i raă ș
ionamentul decizional sunt similare pentru ambele situa ii.ț ț
Testul t pentru eșantioane independente este utilizat pentru a calcula
dacă mediile pentru două seturi de variabile sunt diferite semnificativ una față de
cealaltă.
* Testul t pentru eșantioane independente este cel mai des folosit.
Testul t pentru eșantioane independente este utilizat atunci când cele
două seturi de variabile provin din două eșantioane diferite de oameni.
Procesarea unui Test t pentru eșantioane independente este ilustrată cu
datele din tabelul următorcare arată valorile la un test de emotivitate pentru 10
74
Introducere în SPSS 2011 Mihaela Naidin
copii care provin din familii biparentale și 10 copii care provin din familii
monoparentale. Scopul analizei este de a aprecia dacă valorile emotivității sunt
diferite la copii care provin din familii cu doi părinți față de copii care provin
din familii monoparentale.
Familii
biparentale1218141019815111013
monoparentale 69413149812119
XI.1. Introducerea datelor
Pasul 1:
În „Variable View” din „Data Editor”, se etichetează pe rând „Familii”.
Aceasta va defini cele două tipuri de familii.
Se etichetează al doilea rând
„Emotivitate” (aici vor fi introduse
rezultatele la testul de emotivitate).
Se înlătură cele două zecimale.
Pasul 2:
În „Data View” din
„Data Editor” se introduc
valorile pentru cele două
variabile în primele două
coloane.
* Se observă că sunt două colo ane
de date: A doua coloană conține
cele 20 de valori ale testului de
emotivitate de la ambele grupe de
copii. Datele nu sunt păstrate
separat pentru cele două grupe;
valorile 1 din prima coloană indică copii proveniți din familiile biparentale și valorile 2 indică
copii proveniți din familiile monoparentale. Astfel, este utilizată o singura variabilă
dependentă (în cazul nostru „emotivitatea”) și altă coloană pentru variabila independentă
(familia). Cu alte cuvinte, fiecare rând în parte reprezintă un anumit copil și variabilele sale
dependente și independente sunt introduse separat în „Data Editor”.
75
Introducere în SPSS 2011 Mihaela Naidin
XI.2. Efectuarea Testului t pentru eșantioane independente.
Pasul 1:
Se selectează:
„Analyze”
„Compare Means”
„Independent Samples T test…”
Pasul 2:
Se selectează
„Emotivitate” și apoi se
apasă butonul ► pentru
a introduce această
variabilă în lista
variabilelor de test.
Se selectează „Familie”
și apoi se apasă butonul
◄pentru a introduce
această variabilă în
căsuța „Grouping
Variable”.
Se selectează „Define Groups…” pentru a defini cele două grupuri.
Pasul 3:
Se introduce:
-valoarea 1 (codul pentru familiile
biparentale) lături de eticheta „Group 1”
-valoarea 2 (codul pentru familiile
monoparentale) alături de eticheta „Group
2”.
Se selectează „Continue”
Se apasă „OK” din ecranul precedent, care reapare.
XI.3. Interpretarea output-ului.
76
Introducere în SPSS 2011 Mihaela Naidin
Primul tabel arată , pentru fiecare grup în parte, numărul de cazuri, media
și abaterea standard. Media pentru familiile biparentale este 13,00. După cum se
observă există o diferență între cele două tipuri de familii, dar, întrebarea este
dacă mediile diferă semnificativ.
Valoarea lui t este media diferenței (3,500) divizată cu eroarea standard a
diferenței (1,493), diviziune ce produce valoarea 2,345.
Dacă valoarea semnificației pentru Pentru varianțe egale, t este 2,345,
Testul Levene este mai mare de 0,05, care la 18 grade de libertate este
lucru care se întâmplă aici (0,642) semnificativ la 0,031 pentru nivelul
se folosește informația de pe acest two-tailed.
prim rând.
Dacă valoarea semnificației pentru
Testul Levene este mai mică de 0,05,
se folosește informația de pe al doilea
rând (al doilea rând oferă cifrele pentru
cazul în care varianțele sunt diferite
semnificativ).
XI.4. Raportarea output-ului.
Rezultatele obținute se pot raporta astfel: „Media pentru valorile testelor
de emotivitate ale copiilor ce provin din familii cu doi părinți este semnificativ
mai mare decât cea a copiilor proveniți din familiile cu un singur părinte”.
77
Introducere în SPSS 2011 Mihaela Naidin
Dacă se preferă folosirea intervalelor de încredere , se poate scrie:
„Diferența dintre valorile testelor de emotivitate ale copiilor ce provin din
familii cu doi părinți (M=13,00, SD=3,55) și cei proveniți din familii cu un
singur părinte (M=9,50, SD=3,10) este de 3,50. Intervalul de încredere de 95%
pentru această diferență este de la 0,36 la 6,63.Deoarece intervalul nu conține
punctul 0,00 diferența este statistic semnificativă la nivelul de semnificație two-
tailed de 5%.
78
Introducere în SPSS 2011 Mihaela Naidin
1. Independent – Samples T Test se aplică în cazul:
a. aceluiași eșantion
b. eșantioanelor independente
c. eșantioanelor dependente
2. Independent – Samples T Test testează:
a. dacă mediile a două grupe sunt egale;
b. dacă mediile a două grupe diferă;
c. dacă se compară mediile pentru un singur grup observat la momente
diferite;
3. Testul „t” se folosește pentru:
a. compararea a două seturi de date pentru identificarea diferențelor;
b. identificarea predictorilor pentru o variabilă numerică;
c. compararea datelor de frecvență.
4. One sample T Test este un procedeu prin care:
a. se compară mediile pentru un singur grup observat în momente diferite
b. se testează dacă mediile a două grupe sunt egale
c. se testează dacă media unei variabile este egală cu o constantă
specificată
b. se testează dacă mediile a două grupe diferă
5. Paired – Samples T test:
a. testează dacă mediile a două grupe sunt egale
b. testează dacă media unei variabile este egală cu o constantă specificată
c. compară mediile pentru un singur grup observat în momente diferite
d. compară mediile pentru mai multe medii observate în momente diferite
6. Testul t pentru eșantioane independente este utilizat atunci când:
a. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur
eșantion
b. coeficientul de corelație între cele două seturi este mare
c. cele două seturi de variabile provin din două eșantioane diferite de
oameni.
79 XI.5. Alegeți răspunsul corect
Introducere în SPSS 2011 Mihaela Naidin
7. Testul t pentru eșantioane perechi este utilizat atunci când:
a. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur
eșantion
b. coeficientul de corelație între cele două seturi este mare
c. cele două seturi de variabile provin din două eșantioane diferite de
oameni.
8. Testul t:
a. este folosit pentru evaluarea semnificației statistice a diferenței dintre
mediile pentru două seturi de scoruri;
b. este potrivit atunci când variabila dependent este m surat pe scal ă ă ă ă
cantitativ (interval-raport). ă
c. este utilizat pentru a calcula dacă mediile pentru două seturi de variabile
sunt diferite semnificativ una față de cealaltă.
80
Introducere în SPSS 2011 Mihaela Naidin
1.b. eșantioanelor independente;
2. a. dacă mediile a două grupe sunt egale;
3. a. compararea a două seturi de date pentru identificarea diferențelor;
4. c. se testează dacă media unei variabile este egală cu o constantă
specificată;
5. c. compară mediile pentru un singur grup observat în momente
diferite
6. c. cele două seturi de variabile provin din două eșantioane diferite de
oameni.
7. a. cele două seturi de scoruri ce trebuie comparate provin dintr-un
singur eșantion
b. coeficientul de corelație între cele două seturi este mare
8. a. este folosit pentru evaluarea semnificației statistice a diferenței
dintre mediile pentru două seturi de scoruri;
b. este potrivit atunci când variabila dependent este m surat pe ă ă ă
scal cantitativ (interval-raport). ă ă
c. este utilizat pentru a calcula dacă mediile pentru două seturi de
variabile sunt diferite semnificativ una față de cealaltă.
81 XI.6. Răspunsuri corecte
Introducere în SPSS 2011 Mihaela Naidin
XII.XII. Testul Chi-Square. Testul Chi-Square.
Diferențe între frecvențele eșantioanelor. Diferențe între frecvențele eșantioanelor.
__________________________________________________________________________________________________________________________________________________________________________________________________________________________________
În general Testul chi-square este folosit pentru evaluarea existenței unei
diferențe semnificative între două eșantioane formate din date de frecvență (date
nominale). Acesta, analizează tabelele de asociere sau contingență pe baza a
două variabile categoriale nominale.
*Testul chi-square analizează frecvențe. Niciodată acestea nu trebuie să fie
transformate în procente pentru a fi introduse în SPSS, deoarece vor da rezultate eronate
atunci când se vor calcula valoarea și semnificația chi-square.
* O analiză chi-square trebuie să includă datele fiecărui individ o singură dată, astfel
încât frecvențele totale să fie egale cu numărul persoanelor folosite în analiză.
Tabel 1. Relația dintre site-urile accesate și genul biologic.
Respondenți Site-uri
matrimonialeanunțurimuzică
Feminin 27 1419
Masculin 17 339
XII.1. Introducerea datelor din tabelul anterior
folosind procedura „Weighing cases”.
Procesarea Testului chi-square folosind două sau mai multe eșantioane
este exemplificată cu datele din tabelul anterior, care arată care dintre cele trei
tipuri de site-uri este preferat de către un eșantion de 119 adolescenți de ambele
sexe.
Pasul 1:
În meniul „Variable View” Se îndepărtează cele Se etichetează valorile
din „Data Editor” se etichetează două zecimale. „gen” și „program”.
primele trei coloane cu „gen
biologic”, „Site” și „Frecvență”.
82
Introducere în SPSS 2011 Mihaela Naidin
Pasul 2:
Se introduc valorile adecvate în meniul
„Data View” din meniul „Data Editor”.
Fiecare rând reprezintă una dintre cele șase
celule din tabelul prezentat anterior.
Paul 3:
Pentru a pondera aceste celule
se selectează:
„Data”
„Weight Cases…”
Pasul 4:
Se selectează
„Frecvența”, „Weight
cases by” și apoi se
apasă butonul ◄ .
Se apasă „OK”.
XII.2. Introducerea datelor din tabelul 1 caz cu caz.
Se introduc valorile pentru
cele două variabile în fiecare
dintre cele 119 cazuri.
XII.3. Efectuarea Testului chi-square pe baza tabelului 1.
Pasul 1:
Se selectează:
„Analyze”
„descriptives statistics”
„Crosstabs…”(tabele de asociere)
83
Introducere în SPSS 2011 Mihaela Naidin
Pasul 2:
Se selectează „Gen” și se
apasă butonul ► pentru
„Row(s)”: pentru a-l
introduce în caseta
respectivă.
Se selectează „Site” și se
apasă butonul ◄ pentru
„Column(s)”: pentru a-l
introduce în caseta
respectivă.
Ser selectează
„Statistics…”
Pasul 3:
Se selectează „Chi-square”.
Se seletează „Continue”.
Pasul 4:
Se selectează „Cells..”
Pasul 5:
84
Introducere în SPSS 2011 Mihaela Naidin
În secțiunea „Counts” se selectează „Expected” . Se selectează „Unstandardized”
în secțiunea „Residuals”. Se selecteaze „Continue”, apoi se apasă „OK în
ecranul anterior care reapare.
* Termenul „rezidual” se referă la diferențe.
85
Introducere în SPSS 2011 Mihaela Naidin
XII.4. Interpretarea output-ului pentru Testul chi-square.
Acest al doilea tabel din output indică frecvența (Count), frecvența
așteptată (Expected Count” și diferența (Residual) dintre cele două pentru
fiecare dintre cele șase celule ale tabelului.
De exemplu: Frecvența sau numărul de
fete care spun că preferă site-rile de
matrimoniale este de 17, iar numărul
anticipat de probabilitate este 21,8,
diferența dintre cele două valori fiind de
– 4,8.
Al treilea tabel, și ultimul
indică valoarea
coeficientului (Pearson)
chi-square (13,518),
gradele de libertate (2) și
semnificația two-tailed
(0,001). Din moment ce
această valoare este mai
mică de 0,05, coeficientul
chi-square este
semnificativ.
Al doilea tabel indică frecvențele observate și cele așteptate ale cazurilor și
diferența (valoarea reziduală) dintre acestea pentru fiecare celulă. Frecvența
observată (numită „Count”) este prezentată prima, apoi frecvența așteptată
(numită „Expected Count”. Frecvențele observate sunt întotdeauna numere
întregi, astfel încât să fie ușor de localizat.
86
Introducere în SPSS 2011 Mihaela Naidin
Coloana finală din tabel etichetată „Total” conține numărul de cazuri din
respectivul rând, urmat de numărul așteptat de cazuri din tabel.
Astfel primul rând are 60 de cazuri, urmat de numărul așteptat de cazuri
din tabel. Astfel, primul rând are 60 de cazuri, număr care va fi identic
numărului de cazuri așteptate (adică 60).
În mod similar, rândul final din acest tabel (etichetat „Total) prezintă mai
întâi numărul de cazuri din respectiva coloană urmat de numărul așteptat de
cazuri din tabel pentru coloana respectivă. Astfel, prima coloană are 44 de
cazuri, număr care ca fi întotdeauna egal cu numărul așteptat de cazuri (adică
44,0).
Valoarea chi-square, gradul său de liberate și nivelul său de semnificație sunt
afișate în al treilea tabel care începe cu „Pearson” (cel care a elaborat acest test).
Valoarea chi-square este de 13,518, care, rotunjită la un număr cu două
zecimale, devine 13,52. Gradul său de libertate este 2, iar probabilitatea two-
tailed exactă este 0,001.
Sub acest tabel se mai poate vedea și mărimea „minimum expected count” a
oricărei celule din tabel, care este 13,88 pentru ultima celulă (fetele care preferă
site-urile cu muzică). Dacă diferența minimă așteptată este mai mică decât 5.0,
atunci trebuie să se acorde foarte multă atenție Testului chi-square.
* Dacă se folosește un tabel 2×2 de tip chi-square și apar frecvențe anticipate reduse, este
recomandat să se folosească testul Fisher, pe care aplicația SPSS îl include în output în astfel
de situații.
XII.5. Raportarea output-ului pentru Testul chi-square.
Există două modalități de descriere a rezultatelor .
* Pentru o persoană neexperimentată aceste două posibilități de interpretare pot părea
foarte diferite, dar, practic, ele înseamnă același lucru.
87
Introducere în SPSS 2011 Mihaela Naidin
Rezultatele se pot descrie astfel: „A existat o diferență semnificativă
între frecvențele observate și cele așteptate în cazul adolescenților băieți și fete
în ceea ce privește preferința lor pentru cele trei tipuri de site-uri ( χ2 =
13,51. DF = 2, p = 0,001)”.
O altă posibilitate de interpretare a rezultatelor obținute ar putea fi:
„ Există o asociere semnificativă între genul biologic și tipul de site
preferat ( χ2 = 13,51. DF = 2, p = 0,001)”.
Raportarea și direcția rezultatelor se poate face astfel: „ Fetele tind mai
mult decât băieții să prefere site-urile cu anunțuri (de toate genurile) și preferă
mai puțin site-urile despre matrimoniale sau pe cele cu muzică”.
88
Introducere în SPSS 2011 Mihaela Naidin
XIII.XIII. Recodificarea variabilelor. Recodificarea variabilelor.
Aplicația SPSS poate recodifica valori în mod rapid și cu ușurință, ceea ce
îi oferă cercetătorului o mare libertate de recodificare a datelor.
*Nu se modifică variabilele decât în cazul în care este absolut sigur că se dorește
modificarea permanentă a datelor originare.
Scorurile abilităților muzicale și matematice
obținute de către un număr de 10 copii
Scor muzicăScor matematică Gen biologicVârstă
3 7 110
7 5 19
8 4 212
9 4 18
9 5 211
6 8 213
4 9 27
3 9 110
4 7 29
7 6 111
* Scorurile abilităților muzicale și matematice sunt aceleași care au fost prezentate
anterior în capitolul VIII.1.
Dorim să se realizeze corelația dintre valorile abilităților muzicale și a
celor matematice, în cazul copiilor mici și a celor mari. Pentru a realiza această
corelație este important să se stabilească numărul de grupe de vârstă dorite. În
acest caz se vor alege două grupe de vârstă: copii mai mici de 10 ani și copii mai
mari de 10 ani.
XIII.1. Recodificarea rezultatelor.
Pasul 1:
Se introduc datele așa cum este
prezentat în tabelul alăturat.
(Pașii de introducere a datelor
sunt prezentați în capitolele
anterioare).
89
Introducere în SPSS 2011 Mihaela Naidin
Pas ul 2:
Se selectează „Transform”,
„recode”
Și „Into Different Variables”
Pasul 3:
Se selecteaă „Vârstă” și se
apasă butonul ◄ pentru a
introduce „Vârsta” în
caseta „Numeric Variable
– Output variable”.
Se introduce numele noii
variabile.
Se selectează „Change”
pentru a adăuga acest nume Se selectează „Old and New values”.
nou în caseta „Numeric variable
– Output Variable”.
Pasul 4:
Se selectează „Lowest
through” și se scrie 9 în
caseta alăturată.
Se selectează „Value”
din meniul „new value”
și se scrie 1 în căsuța
alăturată.
Se selectează „Add” și
se introduce „lowest
throught 9→1 „ în caseta
„Old→New”.
90
Introducere în SPSS 2011 Mihaela Naidin
Pasul 5:
Se selectează
„Range: through
highest” și se scrie
10 în caseta de
lângă el.
Se selectează
„value” și se scrie
2 în caseta
alăturată.
Se selectează
„Add” și se
introduce „10
through
Highest→2” în
caseta „Old→New”. Se apasă „OK” în ecranul care va reapărea.
Pasul 6:
Noua variabilă și valorile sale sunt
afișate în meniul „Data View”.
•1 semnifică copii cu vârste mai mici de 10
ani
• 2 semnifică copii cu vârste mai mari de
10 ani.
Pentru o astfel de recodificare se
deschide fereastra Recode into Different
Variables (din meniul Transform comanda
Recode) în care:
-se selectează variabila pe care dorim să o recodificăm din lista variabilelor din
partea stângă și se mută în lista variabileor de recodat;
-se scrie numele noii variabile în caseta Name din zona Output Variable;
-se scrie în caseta Label eticheta noii variabile;
-se acționează butonul de comandă Change pentru a se realiza modificarea.
Pentru a defini categoriile variabilei numerice acționăm butonul de comandă Old and
New Values ce are ca efect deschiderea unei ferestre de dialog în care pentru a schimba o
valoare particulară într-o valoare nouă se introduce valoarea veche în caseta Old Value și
valoarea nouă în caseta New Value și se acționează butonul Add.
De regulă se schimbă o valoare reală cu altă valoare reală. În acest scop selectăm
butonul de opțiuni Range. Casetele de editare sunt folosite pentru a stabili limita inferioară și
respectiv limita superioară a intervalului dorit. Apoi se selectează butonul de opțiuni Value
din zona New Value în care se introduce noua valoare și acționăm butonul Add.
91
Introducere în SPSS 2011 Mihaela Naidin
Prin clic pe butonul de comandă Continue se revine în fereastra Record into Different
Variables în care acționăm OK pentru recodificarea variabilei.
1. Comanda RECODE permite:
a. recodificarea într-o variabilă diferită sau în aceeași variabilă ;
b. tranformarea unei variabile prin divizarea valorilor acesteia într-un număr
mai mare de categorii;
c. combinarea valorilor acestei variabile cu scopul creării unei alte serii;
2. Comanda RECODE se găsește în meniul :
a. transform/recode/ into different variables;
b. transform/recode/into same variables;
c. ambele variante de mai sus.
3. Chi – Square
a. testează egalitatea a două sau mai multe proporții
b. testează egalitatea unei proporții cu o valoare specificată
c. testează egalitatea mediilor a două eșantioane independente
d. testează egalitatea mediilor a două eșantioane perechi
4. Pentru recodificarea în aceeași variabilă se selectează:
a. transform/recode/into different variables;
b. transform/recode/into same variables;
c. nicio variantă de mai sus.
5. Pentru recodificarea într-o variabilă diferită se selectează:
92 XIII.2. Alegeți răspunsul corect
Introducere în SPSS 2011 Mihaela Naidin
a. transform/recode/into different variables;
b. transform/recode/into same variables;
c. nicio variantă de mai sus.
1. a. recodificarea într-o variabilă diferită sau în aceeași variabilă;
2. c. ambele variante de mai sus.
3. a. testează egalitatea a două sau mai multe proporții
4. b. transform/recode/into same variables;
5. a. transform/recode/into different variables;
93 XIII.3. Răspunsuri corecte
Introducere în SPSS 2011 Mihaela Naidin
XIV. XIV. Calculul variabilelor noi.Calculul variabilelor noi.
__________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Calculul variabilelor noi permite adunarea, scăderea, etc . a valorilor
câtorva variabile pentru a obține o nouă variabilă.
Exemplu: Se dorește să se adune câteva întrebări dintr-un chestionar, pentru a
obține un indice general al ceea ce măsoară chestionarul.
Atunci când sunt măsurate variabilele psihologice, se folosesc mai multe
întrebări pentru a măsura mai mult sau mai puțin același lucru.
De exemplu, următoarele afirmații pot fi folosite pentru evaluarea satisfacției
profesională:
a.În general mă bucură profesia mea.
b.Uneori stresul de la serviciu devine insuportabil.
c.Unii colegi sunt enervanți câteodată.
d.Viitorul pare promițător la locul de muncă.
Participanților li se cere să afirme în ce măsură sunt de acord cu fiecare
dintre aceste afirmații, pe următoarea scală de la 1 la 4:
1. întru totul de acord; 2. de acord ;
3. dezacord; 4. total dezacord.
94
Introducere în SPSS 2011 Mihaela Naidin
Acești itemi se pot folosi pentru a determina nivelul de satisfacție
profesională a angajaților, prin adunarea răspunsurilor date tuturor celor patru
afirmații.
Întru totul
de acordDe acorddezacordTotal dezacord
Respondent 1
Respondent 2
Respondent 3
Deoarece este nevoie de scoruri mari pentru a indica satisfacția
profesională, se va inversa evaluarea, astfel:
4. total de acord; 3. de acord;
2. dezacord; 1. total dezacord.
XIV.1. Procedura unei variabile noi.
Pasul 1 :
Se scrie un nume
pentru noua
variabilă în caseta
de sub „Target
Variable” (ex. scor
total.
Se scrie sau se
selectează termenii
expresiei și se
introduc în caseta
„Numeric
Expression”.
Se apasă „OK”.
Se selectează
„Paste” pentru a
salva această
procedură sub formă
de sintaxă.
Pasul 4:
Pentru a salva această
procedură sub formă de fișier
de sintaxă, se selectează
„Paste” în caseta principală.
95
Introducere în SPSS 2011 Mihaela Naidin
Această comandă de sintaxă va apărea în fereastra „Syntax”.
XV. XV. Testele rangurilor.Testele rangurilor.
Statistici nonparametrice. Statistici nonparametrice.
__________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Testele nonparametrice sunt folosite atunci când nu este îndeplinită
condiția ca scorurile fiecărei variabile să fie cât de cât normal distribuite (în
formă de clopot). Aceste teste fac mai puține presupuneri referitoare la
caracteristicile populației de la care provin datele, trăsătură care nu este
caracteristică testelor parametrice (cum ar fi Testul t). Metodele statistice
nonparametrice nu testează diferențele dintre medii, deoarece acestea folosesc
scoruri transformate în ranguri. De obicei, prin aceste metode se verifică dacă
rangurile dintr-un grup sunt mai mari sau mai mici decât rangurile din celălalt
grup.
În acest capitol vom vorbi despre Testul semnului și Testul Wilcoxon
pentru date corelate (eșantioane perechi). Cu alte cuvinte, aceste teste sunt
echivalentele nonparametrice ale Testului t pentru eșantioane perechi.
Testul U Mann-Witney se folosește pentru date nerelaționate, acesta
fiind echivalentul nonparametric al Testului pentru eșantioane independente.
Procesarea a două teste nonparametrice pentru scoruri relaționate este
exemplificată folosind datele din tabelul următor , care a fost folosit și în
96
Introducere în SPSS 2011 Mihaela Naidin
capitolul X și care indică numărul de cuvinte pe care aceeași copii le-au
verbalizat cu mamele lor la 18 luni și la 24 luni.
Numărul de cuvinte verbalizate într-un minut la vârste diferite.
Alina Cristina Raluca Carmen Simona Radu Cristi Dan
18 luni32452324
24 luni54783446
XV.1. Scoruri relaționate: testul semnului.
Pasul 1 :
În „Data View” din „Data Editor”
se introduc datele în primele două
coloane.
P asul 2:
Se selectează:
„Analyze”
„Nonparametric Tests”
„2 Related Samples…”
Pasul 3:
Se selectează
„Optsprezece” și
„douăzecisipatru” și se
apasă butonul ◄ pentru
a introduce aceste două
variabile în caseta „Test
Pair(s) List”.
97
Introducere în SPSS 2011 Mihaela Naidin
Se deselectează „Wilcoxon”.
Se selectează „Sign”.
Se apasă „OK”.
XV.2. Interpretarea output-ului pentru testul semnului.
Se poate ignora primul dintre cele
două tabele care indică numărul de
diferențe negative (0), pozitive (8)
și inexistente (0) în ceea ce
privește numărul de cuvinte
verbalizate la cele două vârste.
Al doilea tabel indică nivelul de
semnificație al acestui test. Probabilitatea
two-tailed este de 0,008 ceea ce este
semnificativ la nivelul de 5%.
XV.3. Raportarea output-ului pentru testul semnului.
Rezultatele obținute pot fi raportate astfel: „Există o schimbare
semnificativă la nivelul numărului de cuvinte verbalizate de la 18 luni la 24 de
luni (Testul semnului: N=0,008).
XV.4. Scoruri relaționate: testul Wilcoxon.
Testul Wilcoxon reprezintă opțiunea predefinită în caseta de dialog a
testelor cu două eșantioane perechi. Dacă s-a deselectat anterior, se selectează
din nou. Se apasă „OK” pentru a obține output-ul Testului Wilcoxon.
XV.5. Interpretarea output-ului pentru Testul Wilcoxon.
98
Introducere în SPSS 2011 Mihaela Naidin
Se poate ignora primul dintre cele două tabele de output. Acestea indică
numărul de diferențe negative ( 0), pozitive (8) și inexistente (0) în ceea ce
privește datele ordonate după cele două vârste, și media și suma catalogate
negative și pozitive. Valorile pentru „două zeci și patru „ de luni sunt mai mari
decât cele pentru „optsprezece” luni.
Al doilea tabel indică nivelul de
semnificație al acestui test. În loc să
folosească tabelul valorilor critice,
computerul utilizează o formulă care
stabilește o conexiune cu distribuția Z.
Scorul Z este de – 2,558, care are o
probabilitate two-tailed de 0,011. Aceasta înseamnă că diferențele dintre cele
două variabile sunt semnificative din punct de vedere statistic la un nivel de 5%.
XV.6. Raportarea output-ului pentru Testul Wilcoxon.
Rezultatele obținute pot fi raportate astfel: „Există o diferență
semnificativă între numărul de cuvinte verbalizate de copii între 18 și 24 de luni
(Wilcoxon: N=8, z =2,56, two-tailed p = 0,011)”.
XV.7. Scoruri nerelaționate: Testul U Mann-Whitney.
Pentru procesarea unui test nonparametric p entru scoruri necorelate, vom
folosi datele din tabelul următor, care indică scoruri ale emotivității obținute de
99
Introducere în SPSS 2011 Mihaela Naidin
10 copii care provin din familii biparentale și 10 copii care provin din familii
monoparentale.
Familii
biparentale1218141019815111013
monoparentale 69413149812119
Pasul 1:
– este același ca și cel prezenta la capitolul XI.
Pasul 2:
Se selectează:
„Analyze”
„Nonparametric tests”
„2 Independent Samples…
Pasul 3:
Se selectează
„Emotivitate” și se
apasă butonul
►pentru a introduce
parametrul
„Emotivitate” în
caseta „Test Variable
List”.
Se selectează
„Familie” și se apasă
butonul ◄pentru a
introduce „Familie” în
caseta „Grouping
Variables”.
100
Introducere în SPSS 2011 Mihaela Naidin
Se selectează „Define Groups…”
Pasul 4:
Se scrie 1 (pentru un singur părinte) în c
aseta de lângă „Group 1”.
Se scrie 2 (pentru 2 părinți) în caseta de
lângă „Group 2”.
Se selectează „Continue”.
Se apasă „OK” din ecranul anterior care va
reapărea.
XV.8. Interpretarea output-ului pentru testul U Mann-Whitney.
Se poate ignora primul dintre cele două tabele de output. Acest tabel
indică faptul că rangul mediu dat parametrului „Emotivitate” pent ru primul grup
(adică valoarea 2) este 13,15, iar rangul mediu pentru al doilea grup (adică
valoarea 1) este de 7,85. Aceasta înseamnă că valorile din grupul 2 (biparentale)
au tendința să fie mai mari decât cele din grupul 1 (monoparentale).
Al doilea tabel indică statistica de bază mann-
Whitney, valoarea U fiind de 23,500, ceea ce
este semnificativ din punct de vedere statistic
la un nivel de 0,043.
Computerul a listat și un scor Z de -2,011, care
este semnificativ la nivel de 0,044.
Aceasta este valoarea Testului Mann-Whitney
atunci când se aplică o corecție pentru ranguri înrudite. După cum se poate
101
Introducere în SPSS 2011 Mihaela Naidin
vedea, aceasta a modificat nivelul de semnificație doar marginal, de la 0,44 la
0,44.
XV.9 Raportarea output-ului pentru Testul U Mann-Whitney.
Rezultatele obținute în urma acestei analize se pot raporta astfel: „ Testul
U Mann-Whitney a concluzionat că scorurile emotivității la copii din fa,iliile cu
doi părinți sunt semnificativ mai mari decât la cei din familiile cu un singur
părinte (U=23,5, N 1,2=10, p two-tailed p= 0,044)”.
XVXVI. I. Analiza de varianță (ANOVA).Analiza de varianță (ANOVA).
Introducere în metoda one-way ANOVA Introducere în metoda one-way ANOVA
cu scoruri nerelaționate sau necorelate. cu scoruri nerelaționate sau necorelate.
__________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Analiza de varianță cu scoruri nerelaționate/necorelate indică măsura în
care câteva (două sau mai multe) grupuri au medii foarte diferite.
*Grupurile diferite aparțin variabilei independente iar valorile numerice corespund
variabilei dependente.
Analiza de varianță calculează variația dintre scoruri și pe cea dintre
mediile eșantioanelor.
One – way ANOVA este folosit pentru testare pentru diferențele între
două sau mai multe grupe independente. ANOVA este utilizat pentru a testa
diferențe între cel puțin trei grupuri, deoarece cele două grupuri de caz pot fi
acoperite de u un T-test.
De fapt, testul t independent este un tip special de ANOVA simpla în
care sunt implicate doar doua grupe. ANOVA simpla permite evaluarea ipotezei
nule între mediile a doua sau mai multe serii de date cu restricția ca acestea sa
fie trepte ale aceleiași variabile independente.
102
Introducere în SPSS 2011 Mihaela Naidin
ANOVA simpla permite compararea simultana a trei sau mai multe
grupe menținând nivelul α la valoarea dorita, de maxim 0,05.
Procesarea analizei one-way de varianță cu scoruri nerelaționate este
exemplificată folosind datele din tabelul următor, care indică rezultatele obținute
de către diferiți participanți în condiții diferite. Este vorba despre un studiu
asupra efectului unor tratamente hormonale și placebo asupra depresiei.
Astfel, medicamentul este variabila independentă și depresia este
variabila dependentă.
Date studiu
XVI.1. Metoda one-way ANOVA pentru eșantioane independente.
Pasul 1:
Se introduc datele.
Se codifică cele trei
condiții cu valorile 1, 2, 3.
Se etichetează „Hormon 1”,
„Hormon 2” și „Placebo”.
Pasul 2:
Se selectează:
„Analyze”Grup 1
Tratament hormonalGrup 2
Tratament hormonalGrup 3
Placebo
8 4 4
11 2 6
8 4 4
103
Introducere în SPSS 2011 Mihaela Naidin
„Comparea Means”
„One-Way ANOVA”.
Pasul 3:
Se selectează „depresie” și se
apasă butonul ►de lângă
caseta „Dependent List” –
pentru a introduce
parametrul în casetă.
Se selectează „Condiție” și
se apasă butonul ◄ de lângă
caseta „Factor” – pentru a
introduce parametrul acolo.
Se selectează „Options…
Pasul 4:
Se selectează metodele statistice
„descriptive” și „Momogenity of variance
test”.
Se selectează „Continue…”.
Se apasă „OK” din ecranul anterior, care
va reapărea.
XVI.2. Interpretarea output-ului.
Primul tabel oferă diferite statistici descriptive, cum ar fi numărul de
cazuri, media și abaterea standard în cele trei condiții și pe eșantionul total.
104
Introducere în SPSS 2011 Mihaela Naidin
Al doilea tabel oferă rezultatele
Testului Levene al similarității
varianțelor. Acest test nu este
semnificativ deoarece are o
semnificație de 0,441.
Al treilea tabel indică rezultatele analizei de varianță. Raportul F este
semnificativ la nivel de 0,00, acesta fiind mai mic decât 0,05.
Raportul F se calculează prin împărțirea „sum of square” (suma
pătratelor abaterilor de la medie) dintre grupe, este împărțită suma pătratelor de
la media din interiorul grupelor (sum of squares groups)m ceea ce dă un Raport
F de 13,941 (20,333/0,889 = 13,941).
Aceasta înseamnă că există o diferență semnificativă între cele trei
grupuri.
XVI.3. Raportarea ouput-ului.
Rezultatele obținute pot fi raportate astfel: „Per total, efectul tratamentului
cu medicamente a fost semnificativ (F2,6 = 13,94, p= 0,00). În schimb, nu a
existat nicio diferență semnificativă între media controlului placebo și media
tratamentului hormonal 2.
105
Introducere în SPSS 2011 Mihaela Naidin
XVIXVII. I. Analiza de varianță bifactorială pentru Analiza de varianță bifactorială pentru
scoruri nerelaționate/necorelate. scoruri nerelaționate/necorelate.
__________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Analiza two-way de varianță permite compararea mediilor unei variabile
dependente atunci când există două variabile independente.
Dacă există mai mult de o variabilă dependentă, atunci analiza se
realizează separat pentru fiecare variabilă.
Realizarea unei analize two-way pentru scoruri nerelaționate de varianță
este exemplificată în tabelul următor, care indică scorurile obținute de către
diferiți participanți în șase condiții, reflectând cei doi factori ai privării de somn
și alcool. Scopul acestei analize este acela de a aprecia dacă diferitele combinații
de cafea și deprivare de somn afectează diferențiat numărul mediu de greșeli
făcute.
Datele pentru un experiment referitor la privarea de somn:
Numărul de erori în cazul unui test video.
106
Introducere în SPSS 2011 Mihaela Naidin
XVII.1. Metoda two-way ANOVA pentru scoruri nerelaționate.
Pasul 1:
Se introduc datele. Cele ouă coduri pentru
„Alcool” (1=alcool; 2= fără alcool) – în prima
coloană.
Cele trei coduri pentru „ Privare de somn” se
regăsesc în a doua coloană (1= 3 ore, 2= 6 ore,
3= 9 ore).
Greșelile sunt prezentate în a treia coloană.
Se elimină cele două zecimale din mediul
„Variable View”.
Pasul 2:
Se selectează:
„Analyze”
„General Linear Model”
„Univariate…”privare de somn
3 ore 6 ore 9 ore
Consum alcool 14 16 20
10 14 22
15 23 30
Fără alcool 9 11 10
9 8 14
12 11 12
107
Introducere în SPSS 2011 Mihaela Naidin
Pasul 3:
Se selectează „Erori” și
se apasă butonul ► de
lângă caseta „Dependent
Variable”pentru a
introduce parametrul
acolo.
Se selectează „Alcool”
și „Privare de somn” fie
împreună, fie separat, și
se apasă butonul „Fixed
factor(s)” pentru a le
introduce în casetă.
Se selectează
„Options…”
Pasul 4:
Se selectează
„Descriptives
statistics” și
„Homogeneity test”.
Se selectează
„Continue”.
În ecranul anterior,
care va reapărea, se
selectează „Plots…”.
Pasul 5:
Se selectează „Alcool”
și se apasă butonul ►
de lângă caseta
„Horizontal axis” –
pentru a introduce
parametrul acolo.
Se selectează „Privare
de somn” și se apasă
108
Introducere în SPSS 2011 Mihaela Naidin
butonul ◄ de lângă caseta „Separate Lines” – pentru a introduce opțiunea în
casetă.
Se selectează „Add”
.
Se selectează „Continue”. Se apasă „OK” din ecranul anterior
care va reapărea.
XVII.2. Interpretarea output-ului.
Acest tabel conține
mediile , abaterile
standard și numărul
(N) de cazuri
pentru cele două
variabile „Alcool”
și „Privare de
somn”. Luate
separat sau
împreună.
Media pentru
condiția „Alcool”
este comparată cu
„Totalul” pentru
„Privare de somn”
(adică 18,22). Media pentru privare de 3 ore de somn este comparată cu „Total”
pentru „Alcool” (adică 11,50).
Al treilea tabel de oferă
informații referitoare la Testul
Levene, care verifică
similaritatea varianțelor. Din
moment ce semnificația acestui
test este 0,085 (valoarea care este
mai mare decât 0,05), varianțele
sunt similare
Al patrulea
tabel indică
nivelele de
semnificație
109
Introducere în SPSS 2011 Mihaela Naidin
pentru cele două variabile „Alcool” și „ Privare de somn”, și interacțiunea dintre
acestea.
În tabelul de analiză a varianței, raportul F pentru cele două efecte principale
(Alcool și Privare de somn) este prezentat primul.
Pentru prima variabilă, cea a alcoolului, Raportul F este 22,891, ceea ce este
semnificativ la nivelul 0,000. Deoarece sunt numai două condiții pentru ca acest
efect să se producă, se poate conhide că scorul mediu al uneia dintre condiții
este mult mai mare decât pentru cealaltă.
Pentru a doua variabilă a privării de somn, aceasta este egală cu 5,797,
valoare care are un nivel exact de semnificație de 0,017. Astfel, Raportul f este
semnificativ din punct de vedere statistic la un nivel de 0,05, ceea ce înseamnă
că mediile celor trei condiții legate de somn nu sunt similare.
Mediile care diferă de celelalte pot fi determinate ulterior prin folosirea
testelor de comparații multiple, cum este Testul t pentru eșantioane
independente.
raportul F pentru interacțiunile dintre cele două variabile (Alcool și Privare
de somn) este de 2,708 → nivelul de semnificație al acestui raport este de
0,107→ nu este nicio interacțiune semnificativă.
Acest grafic este realizat pentru mediile celor șase condiții. El a fost editat
cu ajutorul comenzii “Chart Editor”.
110fara alcool alcoolalcool22,50
20,00
17,50
15,00
12,50
10,00Estimated Marginal Means9 ore6 ore3 oreprivare de somnEstimated Marginal Means of erori
Introducere în SPSS 2011 Mihaela Naidin
XVII.3. Raportarea output-ului.
Rezultatele din output se pot raporta astfel: „O analiză de varianță two-way
ANOVA demonstrează obținerea unor efecte semnificative în cazul alcoolului
(F = 22,981, p< 0,001) și al privării de somn (F=5,80, p = 0,017), dar nu și în
cazul interacțiunii celor două variabile (F =2,70, p= 0,107).
111
Introducere în SPSS 2011 Mihaela Naidin
XVIIXVIIII. Comparații multiple cu ANOVA.. Comparații multiple cu ANOVA.
__________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Acest capitol extinde aria de acoperire a Testelor t multiple prezentate în
capitolele anterioare și explică modul în care se decide care perechi de medii
sunt diferite în mod semnificativ între ele, în cazul analizei de varianță.
Această tehnică se folosește atunci când sunt mai mult de două medii .
Pentru a prezenta această procedură vor fi folosite informațiile prezentate
la capitolul XV.
Date studiu
Pasul 1:
Se introduc datele.
Se codifică cele trei
condiții cu valorile 1, 2, 3.
Se etichetează „Hormon 1”,
„Hormon 2” și „Placebo”.
Pasul 2:
Se selectează:
„Analyze”
„Comparea Means”
„One-Way ANOVA”.Grup 1
Tratament hormonalGrup 2
Tratament hormonalGrup 3
Placebo
8 4 4
11 2 6
8 4 4
112
Introducere în SPSS 2011 Mihaela Naidin
Pasul 3:
Se selectează „depresie” și se
apasă butonul ►de lângă
caseta „Dependent List” –
pentru a introduce
parametrul în casetă.
Se selectează „Condiție” și
se apasă butonul ◄ de lângă
caseta „Factor” – pentru a
introduce parametrul acolo.
Se selectează „Post Hoc…”
Pasul 4:
Se selectează:
„Tukey”
„Duncan”
„Scheffe”.
Se apasă
„Continue”.
Se selectează „OK”
în ecranul care va
apărea din nou.
XVIII.1. Interpretarea output-ului.
113
Introducere în SPSS 2011 Mihaela Naidin
Primul tabel reprezintă rezultatele analizei de varianță. Raportul F pentru
efectul dintre grupuri (adică efectul hormonilor) este 13,941, care are un nivel
exact de semnificație de 0,006. Acest lucru înseamnă că efectul dintre grupuri
este semnificativ; per total, mediile pentru cele trei grupuri diferă.
Al doilea tabel și ultimul oferă rezultatele celor trei teste de comparații
multiple.
Dacă se folosește Testul Tukey al diferenței semnificative oneste
(HSD), media de la grupul hormonului 1 este semnificativ diferită de media de
la grupul hormonului 2 (semnificația=0,06) și semnificația de la media grupului
Controlului placebo (semnificația=0,020).
Subgrupele omogene .
Grupul hormonului 2 și al
controlului Placebo
aparțin aceleiași
subgrupe, ceea ce
înseamnă că nu sunt
semnificativ diferite.
Grupul hormonului 1 este
singurul din această a
doua subgrupă, motiv
pentru care aceasta este
semnificativ diferită de
mediile celorlalte două
114
Introducere în SPSS 2011 Mihaela Naidin
grupe.
* Sunt reprezentate mediile grupelor din subgrupele omogene.
a. Folosește Media armonică a dimensiunilor eșantioanelor
=3,000.
Tabelul final, numit „Subgrupele omogene”, enumeră grupurile de medii care
nu sunt semnificativ diferite între ele.
Dacă se ia în calcul aceste două rânduri pentru a se folosi în Testul Tukey HSD,
în acest caz există două subgrupe de medii. Subgrupa 1 indică faptul că mediile
grupelor hormonului 2 și ale controlului placebo cu valorile 3,33 și 4,67 nu
diferă semnificativ. Subgrupa 2 conține doar media grupei hormonului 1, în
valoare de 9,00. Astfel, media grupului hormonului 1 este semnificativ diferită
atât de media grupei hormonului 2, cât și de cea a gupelor de control placebo .
Toate cele trei teste prin comparații multiple sugerează același lucru: faptul
că există diferențe semnificative între grupele hormonului 1 și hormonului 2 și
între grupele hormonului 1 și cele ale controlului placebo. Alte diferențe nu mai
există.
XVIII.2. Raportarea output-ului.
Rezultatele output-ului pot fi raportate astfel: „O analiză de varianță
unifactorială pentru scoruri necorelate a demonstrat producerea unui efect
general semnificativ pe tip de tratament medicamentos ( F=13,94, p= 0,06). Prin
Metoda Scheffe de analiză a intervalului s-a descoperit că grupul hormonului 1
era diferit de grupul hormonului 2 (p= 0,07) și de grupul controlului placebo
(p=0,24), dar nu s-au mai găsit alte diferențe semnificative”.
115
Introducere în SPSS 2011 Mihaela Naidin
1.Calculul variabilelor noi:
a.adunarea și scăderea;
b.înmulțirea și împărțirea;
c.ambele variante de mai sus.
2.Analiza de varianță (ANOVA):
a.indică măsura în care două sau mai multe grupuri au medii foarte
diferite;
b.calculează variația dintre două scoruri;
c.calculează variația dintre mediile eșantionului.
3.ANOVA este utilizată pentru:
a.a testa diferența între cel puțin 2 grupu ri;
b.a testa diferența între cel puțin 3 grupu ri;
c.a testa diferența între cel puțin 4 grupuri;
4.Analiza two-way de varianță per mite:
a.compararea mediilor unor variabile independente;
b.compararea mediilor dintre două grupuri;
c.compararea mediilor unei variabile dependente atunci când există
două variabile independente.
5.Comparațiile multiple cu ANOVA:
a.explică modul în care se decise care perechi de medii sunt diferite
în mod semnificativ între ele;
b.se folosește atunci când sunt mai mult de două medii;
c.indică scorurile obținute de respondenți.
116 XIII.2. Alegeți răspunsul corect
Introducere în SPSS 2011 Mihaela Naidin
1. c. ambele variante de mai sus.
2. a. indică măsura în care două sau mai multe grupuri au medii foarte
diferite;
3. b. testa diferența între cel puțin 3 grupuri;
4. c. compararea mediilor unei variabile dependente atunci când există
două variabile independente.
5. a. explică modul în care se decise care perechi de medii sunt diferite
în mod semnificativ între ele;
b.se folosește atunci când sunt mai mult de două medii;
117 XIII.3. Răspunsuri corecte
Introducere în SPSS 2011 Mihaela Naidin
118
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Introducere în SPSS 2011 Mihaela Naidin [616890] (ID: 616890)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
