Introducere In Spss Versiunea 19

Corelatie l

CUPRINS

INTRODUCERE

I. Noțiuni de bază despre introducerea

și analiza statistică folosind SPSS

I.2. Introducerea datelor.

I.3. Salvarea datelor.

I.4. Folosirea „Variabilei View” pentru crearea și etichetarea variabilelor

I.5. Exemplu de calcul statistic.

I.6. Concepte statistice esențiale în analizele cu ajutorul SPSS-ului.

I.7. Alegeți răspunsul corect

I.8. Răspunsuri corecte

II. Descrierea variabilelor.

Tabele și diagrame.

II.1. Frecvența procentuală.

II.2. Diagrama circulară pentru date categoriale.

II.3. Adăugarea etichetelor unei diagrame circulare

II.4. Diagrama cu bare pentru date categoriale.

II.5. Histograme.

II.6. Exerciții

II.7. Alegeți răspunsul corect

II.8. Răspunsuri corecte

III. Descrierea numerică a variabilelor

– Medie, variație și dispersie –

III.1. Introducerea datelor și efectuarea analizei

III.2. Interpretarea output-ului.

III.3. Alte caracteristici.

III.4. Alegeți răspunsul corect

III.5. Răspunsuri corecte

IV. Forme ale distribuției scorurilor

IV.1. Introducerea datelor.

IV.2. Interpretarea Output-ului

IV.3. Histograme.

IV.4. Interpretarea output-ului

IV.5. Modalitatea.

IV.6. Simetria.

IV.7. Boltirea (excesul).

IV.8. Alegeți răspunsul corect

IV.9. Răspunsuri corecte

V. Abaterea standard.

V.1. Introducerea datelor.

V. 2. Interpretarea output-ului.

V.3. Scorurile Z

V.4. Raportarea output-ului.

V.5. Alte caracteristici.

V.6. Alegeți răspunsul corect

V.7. Răspunsuri corecte

VI. Relațiile dintre două sau mai multe variabile.

Diagrame și tabele.

VI.1. Introducerea datelor.

VI.2. Ponderea datelor

VII. Coeficienți de corelație.

Coeficienți de corelație Pearson și Spearman.

VII.1. Introducerea datelor.

VII.2. Corelația Pearson.

VII.3. Interpretarea output-ului.

VII.4. Raportarea output-ului.

VII.5. Coeficientul de corelație Spearman.

VII.6. Interpretarea output-ului.

VII.7. Raportarea output-ului.

VII.8. Diagrama scatter.

VII.9. Interpretarea output-ului.

VII.10. Raportarea output-ului.

VII.11. Alegeți răspunsul corect

VII.12. Răspunsuri corecte

VIII. Regresia.

Predicția cu precizie.

VIII.1. Introducerea datelor.

VIII.2. Regresia simplă.

VIII.3. Interpretarea output-ului.

VIII.4. Scatterplot-ul de regresie.

VIII.5. Interpretarea output-ului.

VIIII.6. Raportarea output-ului.

IX. Eroarea standard

IX. 1. Introducerea datelor.

IX. 2. Eroarea standard estimată a mediei.

IX. 3. Interpretarea output-ului.

X. Testul t.

Compararea a două eșantioane

de scopuri corelate/relaționate.

X.1. Introducerea datelor.

X.2. Testul t pentru eșantioane perechi

X.3. Interpretarea output-ului.

X.4. Raportarea output-ului.

XI. Testul t.

Compararea a două eșantioane de

scoruri necorelate/nerelaționate.

XI.1. Introducerea datelor

XI.2. Efectuarea Testului t pentru eșantioane independente.

XI.3. Interpretarea output-ului.

XI.4. Raportarea output-ului.

XI.5. Alegeți răspunsul corect

XI.6. Răspunsuri corecte

XII. Testul Chi-Square.

Diferențe între frecvențele eșantioanelor.

XII.1. Introducerea datelor din tabelul anterior

folosind procedura „Weighing cases”.

XII.2. Introducerea datelor din tabelul 1 caz cu caz.

XII.4. Interpretarea output-ului pentru Testul chi-square.

XII.5. Raportarea output-ului pentru Testul chi-square.

XIII. Recodificarea variabilelor.

XIII.1. Recodificarea rezultatelor.

XIII.2. Alegeți răspunsul corect

XIII.3. Răspunsuri corecte

XIV. Calculul variabilelor noi.

XIV.1. Procedura unei variabile noi.

XV. Testele rangurilor.

Statistici nonparametrice.

XV.1. Scoruri relaționate: testul semnului.

XV.2. Interpretarea output-ului pentru testul semnului.

XV.3. Raportarea output-ului pentru testul semnului.

XV.4. Scoruri relaționate: testul Wilcoxon.

XV.6. Raportarea output-ului pentru Testul Wilcoxon.

XV.7. Scoruri nerelaționate: Testul U Mann-Whitney.

XV.8. Interpretarea output-ului pentru testul U Mann-Whitney.

XV.9 Raportarea output-ului pentru Testul U Mann-Whitney.

XVI. Analiza de varianță (ANOVA).

Introducere în metoda one-way ANOVA

cu scoruri nerelaționate sau necorelate.

XVI.1. Metoda one-way ANOVA pentru eșantioane independente.

XVI.2. Interpretarea output-ului.

XVI.3. Raportarea ouput-ului.

XVII. Analiza de varianță bifactorială pentru

scoruri nerelaționate/necorelate.

XVII.1. Metoda two-way ANOVA pentru scoruri nerelaționate.

XVII.2. Interpretarea output-ului.

XVII.3. Raportarea output-ului.

XVIII. Comparații multiple cu ANOVA.

XVIII.1. Interpretarea output-ului.

XVIII.2. Raportarea output-ului.

XIII.2. Alegeți răspunsul corect

XIII.3. Răspunsuri corecte

BIBLIOGRAFIE

INTRODUCERE

_________________________________________________________________________________________________________________

Aplicația SPSS („Statistical Package for the Social Sciences” – „pachet de programe statistice aplicate științelor sociale”) a fost elaborată în anul 1965 de către Universitatea Stanford din California.

 Programul SPSS (Statistical Package for the Social Sciences) este unul dintre cele mai utilizate în analiza statistică a datelor și a evoluat până la versiunea 16, aria de aplicabilitate extinzându-se de la versiune la versiune, odată cu modul de operare și cu facilitățile oferite. Programul este utilizat în foarte multe domenii: în marketing, cercetare experimentală, educație, sănătate etc. În afară de analizele statistice posibile, programul are componente puternice pentru managementul datelor (selectare, reconfigurare, creare de date noi) și pentru documentarea datelor (există un dicționar metadata, care reține caracteristici ale datelor). Se mai poate adăuga flexibilitatea privind tipurile de date acceptate ca și modul de construire a rapoartelor.

Această carte prezintă un mod de abordare a analizei statistice folosind SPSS for Windows și este destinată studenților care doresc să analizeze date din psihologie, sociologie, criminologie, sau date similare. Cartea se dorește a fi un îndrumător pentru analiza datelor, fiind o carte completă, de sine stătătoare care satisface nevoile studenților la toate nivelele.

Manualul este structurat pe XVII capitole, oferind astfel posibilitatea parcurgerii pas cu pas a informațiilor prezentate dar și o privire de ansamblu asupra procedurilor de calcul din SPSS.

I. Noțiuni de bază despre introducerea

și analiza statistică folosind SPSS

_________________________________________________________________________________________________________________

I.1. Accesarea SPSS-ului.

SPSS-ul for Windows este accesat în general prin folosirea butoanelor și

meniurilor folosind pentru aceasta clicuri ale mouse-ului. Astfel, cea mai rapidă

modalitate de învățare este de a urma pașii prezentați și capturile de ecran.

Pasul 1:

Se dă dublu clic pe imagine

dacă imaginea nu apare pe

ecran atunci accesați „Start”

→Programe→IBM SPSS Statistic 19.

Pasul 2:

Această fereastră va apărea

după câteva momente și se

pot alege oricare dintre

opțiunile din fereastră.

(Fereastra se numește „Data Editor”.

Fereastra de editare (Data Editor) se deschide

implicit la lansarea SPSS și este folosită

pentru introducerea, modificarea sau ștergerea

datelor în format spreadsheet. Într-o fereastră

de editare poate fi prezentat conținutul unui

fișier de date care a fost selectat dintr-o

listă de fișiere creat anterior (în SPSS, Excel,

Statistica etc.) sau poate fi creată o nouă foaie

de lucru. Această fereastră recunoaște fișierele de date care au extensia implicită .sav.

În fereastra Data Editor sunt afișate datele de lucru. Acestea sunt aranjate în format tabel (spreadsheet), care conține coloane și linii. La intersecția acestora sunt celulele (casetele, căsuțele) în care se introduc datele. La un moment dat este activă (curentă) o singură celulă, cea în care este plasat cursorul. Celula curentă este scoasă în evidență printr-un chenar îngroșat. Trecerea de la o celulă la alta se realizează prin clic de mouse în noua celulă sau de la tastatură cu ajutorul tastelor de control (taste săgeți, Page Up, Page Down).

I.2. Introducerea datelor.

Pasul 3:

Aceasta este fereastra Data Editor a SPSS-ului și este un spațiu de lucru cu linii și coloane în care pot fi introduse datele.

Coloanele sunt folosite pentru a

desemna diferite variabile.

Liniile sunt cazurile sau indivizii

despre care se dețin date.

Pasul 4:

Pentru a introduce date in SPSS

se selectează una dintre celule și se dă

clic pe celula respectivă.

* În SPSS există întotdeauna o singură celulă

selectată.

Pasul 5:

Se introduce un număr folosind tastatura

calculatorului. La apăsarea tastei „Enter”

sau la selectarea cu mouse-ul a unei alte

celule numărul va fi introdus în foaia de

lucru la fel cum este arătat în figură.

Valoarea 5 este înregistrarea pentru primul

rând (primul caz) al variabilei VAR00001.

Se observă că această variabilă a primit automat un nume standard. Pentru a efectua schimbarea se dă clic pe numele variabilei.

Pasul 6:

Corectarea erorilor se face folosind mouse-ul:

se selectează celula unde este eroarea și se

introduce valoarea corectă.

Atunci când este apăsată tasta „Enter”

sau se deplasează cursorul pe o altă celulă,

valoarea corectată va fi introdusă.

I.3. Salvarea datelor.

Pasul 7:

Selectând „File”→ „Save As” datele se vor

salva sub forma unui fișier. Fișierul salvat

va primi automat de extensia „.sav”.

* Se recomandă folosirea unor nume

de fișiere distincte (ex. date1) pentru

a face conținutul lor cât mai clar. Salvarea

datelor este recomandat să se facă într-un fișier

diferit de cel al SPSS-ului.

Pasul 8:

Pentru a alege locația unde va fi salvat

fișierul de date, se alege calea în mediul

„Save In” (se folosește săgeata pentru a

ajunge la locația dorită).

Salvarea unui fișier se realizează prin pictograma

Save din bara de instrumente Standard sau cu

ajutorul comenzilor Save sau Save As și meniul

File. Aceste comenzi deschid fereastra Save Data

As în care se pot stabili: numele fișierului

(File name); tipul fișierului (Save as type);

locația în care să aibă loc salvarea (Save In).

I.4. Folosirea „Variabilei View” pentru crearea și etichetarea variabilelor

Pasul 9:

Apăsarea meniului „Variable

View”, situat în josul paginii,

schimbă fereastra „Data View”

(spațiul de lucru pentru introducerea

datelor) în altă fereastră în

care pot fi introduse informații

despre variabilele create.

Pasul 10:

Acesta este spațiul de lucru „Variable View”. În acest caz, o variabilă este deja înscrisă fiind introdusă la pasul 8. Variabila poate fi redenumită și pot fi adăugate alte variabile selectând celula corespunzătoare și tastând numele variabilei.

Aici se modifică Aici se modifică

lățimea coloanei. numărul de zecimale.

Pasul 11:

La versiunea SPSS 19 nu există

limită pentru lungimea numărului

unei variabile.

Se selectează o celulă din coloana

„Name” și se scrie un nume diferit

de variabilă. Celelalte variabile vor

primi valori care vor fi implicit

schimbate ulterior.

Acesta este numărul de zecimale care va apărea pe ecran.

*La editarea unei variabile trebuie să se țină cont de următoarele restricții: numele variabilei să fie unic, primul caracter să fie o literă, sa nu conțină simboluri speciale folosite în SPSS sau spații.

Pasul 12:

Apare acest buton:

se dă clic pe el.

Pasul 13:

Va apărea această fereastră. În

continuare se vor urmări pașii

care vor arăta cum genul biologic

„masculin” și „feminin” este introdus

folosind codul „1” (masculin)

respectiv „2” (feminin).

Pasul 14:

Se scrie „1” în dreptul

câmpului „value”

și „masculin” în dreptul

câmpului „value Label”.

Apoi se apasă „Add”.

Pasul 15:

Aceasta operație de adăugare

transferă informația în câmpul

aflat dedesubt.

* La fel se procedează și pentru

introducerea celeilalte variabile

(Ex. 2 – feminin).

* Cele mai frecvent utilizate ferestre in SPSS sunt „data Editor”, „Syntax Editor” și „Output Viewer”, „Pivot Table (Pivot Table Editor)”, “Chart Editor”.

Fereastra de sintaxă (Syntax Editor) este folosită pentru a genera programe de comenzi pe care le vom executa asupra datelor (exemplu: calculul unor noi variabile). Opțiunile selectate în casetele de dialog sunt afișate în fereastra de sintaxă sub formă de comenzi. Aceste ferestre îi sunt specifice fișierele de tip .sps.

Fereastra de rezultate (Output Viewer) devine disponibilă automat după ce a fost efectuată o comandă de analiză a datelor. În această fereastră, sunt afișate rezultatele statistice, tabele și grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor (Text Output Editor) este folosită pentru modificarea textului rezultat, care nu a fost afișat în tabele pivot.

* Fereastra de rezultate (Output Viewer) devine disponibilă automat după ce a fost efectuată o comandă de analiză a datelor. În această fereastră, sunt afișate rezultatele statistice, tabele și grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor (Text Output Editor) este folosită pentru modificarea textului rezultat, care nu a fost afișat în tabele pivot. Toate rezultatele obținute din analizele statistice sunt afișate în fereastra Output Viewer. Această fereastră se aseamănă cu fereastra Windows Explorer și se deschide doar dacă s-au lansat comenzi din meniurile Statistics sau Graphs.

Fereastra Output Wiewer este structurată în două cadre/zone. Cadrul din stânga (cuprinsul/structura) prezintă, sub forma unei schițe, obiectele conținute în fereastră. Elementele din schiță se referă la titlu, note și denumirea rezultatelor statistice propriu-zise.

Fereastra Pivot Table (Pivot Table Editor) oferă multiple posibilități de modificare a tabelelor pivot: editare text, schimbarea datelor din rânduri și coloane, adăugarea de culori, crearea unor tabele multidimensionale, ascunderea sau afișarea selectivă a rezultatelor.

Fereastra de editare a graficelor (Chart Editor) permite modificarea elementelor unui grafic (axe, scale, diagramă, legendă etc.)

I.5. Exemplu de calcul statistic.

Pasul 16:

Pentru a calcula media de

vârstă se urmăresc următoarele

etape:

se dă clic pe „Analyze”;

Se selectează „Descriptive

statistics”;

Se selectează „Descriptive…”

Pasul 17:

Se selectează „atenție”.

Se apasă butonul ► pentru a

muta „atentie” în căsuța

„Variable(s)” cu ajutorul săgeții.

Se dă clic pe „OK”.

Pasul 18:

Fereastra „Data Editor” este înlocuită de output-ul SPSS-ului. Acest tabel apare pentru analiza realizată anterior.

Media scorului pentru atenție este încercuită.

*Ferestrele în SPSS reprezintă zone de pe ecran tratate ca elemente de sine stătătoare, cu caracteristici proprii, care determină acțiunile ce se pot executa în cadrul lor.

I.6. Concepte statistice esențiale în analizele cu ajutorul SPSS-ului.

Elementele de statistică sunt foarte simple dar apar probleme la asamblarea elementelor, abilitățile matematice având un mic rol în analiza statistică a datelor.

Conceptele de bază pe care cercetătorii trebuie să le înțeleagă înainte de a trece la analizele SPSS sunt:

Variabila.

Definiție: O variabilă este orice concept care poate fi măsurat și care variază de la un studiu la altul.

Tipurile de variabile.

Variabilele pot fi clasificate ca fiind de două tipuri:

Scoruri: Vorbim despre scoruri atunci când o valoarea numerică este atribuită unei variabile, pentru fiecare caz în parte din eșantion. Această valoare indică cantitatea sau valoarea caracteristicii (variabilei) în cauză.

Exemplul. Vârsta, înălțimea, greutatea sunt variabile numerice deoarece valoarea – scor indică o cantitate în creștere a variabilei respective.

Variabile nominale sau categoriale: Sunt variabile care se măsoară clasificând cazurile în unul sau mai multe categorii.

Exemplul 1: Genul biologic are două categorii: masculin și feminin

*Este foarte important să se hotărască pentru fiecare variabilă în parte dacă este variabilă nominală (categorială) sau variabilă cantitativă.

Definirea atributelor unei variabile este prima operație din procesul de pregătire a setului de date. Definirea presupune precizarea atributelor unei variabile: numele variabilei, tipul, lungimea (numărul de caractere), numărul de zecimale (pentru cele numerice), eticheta, valorile etichetei, valorile lipsă, alinierea și modalitățile de măsurare a variabilei. Variabilele se definesc în coloanele foii Variabile View din fereastra Data Editor.

Tipul variabilei – variabilele pot fi de mai multe tipuri: numerice (Numeric, Coma, Dot, Scientific notation), alfanumerice (String), date calendaristice, simbol monetar.

I.7. Alegeți răspunsul corect

1. Fereastra de editare (Data Editor):

a. se deschide implicit la lansarea SPSS;

b. este folosită pentru introducerea, modificarea sau ștergerea datelor în format spreadsheet;

c. este folosită pentru a genera programe de comenzi pe care le vom executa asupra datelor;

d. este folosită pentru modificarea textului rezultat, care nu a fost afișat în tabele pivot;

2. Fereastra de rezultate (Output Viewer):

a. afișează rezultatele statistice, tabele și grafice care au asociate ferestre distincte;

b. permite modificarea elementelor unui grafic (axe, scale, diagramă, legendă etc.);

c. este folosită pentru a genera programe de comenzi pe care le vom executa asupra datelor.

3. Ferestrele în SPSS reprezintă:

a. zone de pe ecran tratate ca elemente de sine stătătoare, cu caracteristici proprii, care determină acțiunile ce se pot executa în cadrul lor;

b. elemente constitutive ale programului SPSS;

c. elemente prin care i se conferă utilizatorului posibilitatea selectării unei anumite opțiuni.

4. Care sunt cele mai frecvent utilizate ferestre în SPSS

a. data editor;

b. output editor;

c. syntax editor;

d. syntax viewer;

e. output viewer.

5. În SPSS fereastra SPSS Output Viewer este utilizată pentru:

a. afișarea rezultatelor;

b. editarea de date;

c. editarea de date și tabele;

6. La editarea unei variabile trebuie să se țină cont de următoarele restricții:

a. să conțină spații sau simboluri folosite în SPSS;

b. să conțină numai litere;

c. să aibă cel puțin 8 caractere;

d. primul caracter trebuie să fie o cifră;

e. să fie unic.

7. Numele variabilei trebuie să țină cont de câteva restricții:

a. să aibă cel mult 6 caractere;

b. se poate repeta;

c. primul caracter să fie literă;

d. poate să conțină simboluri speciale folosite în SPSS sau spații.

8. Pentru a introduce date în SPSS se selectează:

a. o celulă dând clic pe celula respectivă;

b. meniul data, split file;

c. meniul transform, compute.

9. Prin apăsarea butonului “Variable View”:

a. se schimbă fereastra “Data View”;

b. apare fereastra output;

c. se poate introduce o variabilă diferită.

10. Care dintre următoarele afirmații este adevărată?

a. indicatorul “medie” reprezintă media aritmetică a unui scor și se obține prin însumarea valorilor și înmulțirea cu numărul de valori;

b. modul este valoarea cu cea mai mare frecvență si este frecvența cu care apare cel mai frecvent scor;

c. mediana este valoarea din centrul distribuției, dacă variabilele numerice sunt ordonate după mărime, de la cea mai mică la cea mai mare.

11. Pentru a calcula media aritmetică alegem

a. SE Mean;

b. Median;

c. Mean;

d. Rouge.

I.8. Răspunsuri corecte

. se deschide implicit la lansarea SPSS;

. afișează rezultatele statistice, tabele și grafice care au asociate ferestre distincte;

. zone de pe ecran tratate ca elemente de sine stătătoare, cu caracteristici proprii, care determină acțiunile ce se pot executa în cadrul lor ;

. data editor;

c. syntax editor;

e. output viewer;

. afișarea rezultatelor;

6. e. să fie unic;

7. c. primul caracter să fie literă;

. o celulă dând clic pe celula respectivă;

. se schimbă fereastra “Data View”;

10. c. mediana este valoarea din centrul distribuției, dacă variabilele numerice sunt ordonate după mărime, de la cea mai mică la cea mai mare;

11. c. mean.

II. Descrierea variabilelor.

Tabele și diagrame.

________________________________________________________

II.1. Frecvența procentuală.

Pentru realizarea unui tabel de frecvență este necesară o coloană căreia i se va da un nume.

Pasul 1:

Se definește variabila.

Se etichetează valorile variabilei.

Valorile pentru specializare se definesc

așa cum este descris în pașii 13-15 din

capitolul I.

Pasul 2:

Se selectează:

„Analize”,

„Descriptive Statistics”

„Frequencies…”

Pasul 3:

Se selectează specializare și se mută

în partea dreaptă a tabelului

(procedeul a fost descris la pasul 17

din capitolul I).

Se apasă „OK”

Pasul 4:

1. Prima coloană a tabelului conține eticheta celor 4 categorii de specializări.

doua și a treia coloană afișează

Frecvența absolută și relativă pentru patra coloană afișează

fiecare categorie. frecvența excluzând valorile lipsă
Exemplu: 3 (jurnalism) reprezintă * Deoarece nu sunt valori lipsă, procentajul 30% din totalul de este același ca în coloana a treia.

10 specializări.

cincea coloană adună procentele în josul tabelului. (reprezintă frecvența relativă cumulată ascendent).

În ceea ce privește raportarea rezultatelor se prezintă numai etichetele categoriale, frecvențele și frecvențele procentuale.

II.2. Diagrama circulară pentru date categoriale.

Pasul 1:

Se selectează:

„Graphs”

„Legacy dialogs”

„Pie”.

Pasul 2:

Se selectează „Define”.

Pasul 3:

Se selectează „specializarea”

și se transferă prin apăsarea

butonului ►(◄) în rubrica

„define slices by”.

Se apasă „OK”.

Diagrama Pie este un cerc divizat

în sectoare. Fiecare sector de cerc

reprezintă o categorie, aria

acestuia fiind proporțională cu

numărul de cazuri din această

categorie a variabilei nominale.

Pasul 4:

Acesta este felul în care apare o diagramă

circulară folosind opțiunile din SPSS.

Sectoarele din cerc sunt codate cu diferite culori.

* Caracteristicile din această diagramă pot fi modificate

cu „Chart Editor”.

II.3. Adăugarea etichetelor unei diagrame circulare

Pasul 1:

Se dă dublu clic oriunde în dreptunghiul

care conține diagrama, pentru a selecta

„Chart Editor”.

Se selectează:

„Elements”

„Show Data Labels”.

* Diagrama de structură „pie” este folosită

pentru reprezentarea frecvențelor absolute

(numere) și/sau relative (procente) pe

categorii/grupe.

Pasul 2:

Se selectează „Count” și

„X”-ul roșu pentru a nu afișa.

Se selectează „specializare” și săgeata

Verde curbată în sus pentru a afișa

denumirile specializărilor.

Se procedează asemănător pentru

„Procent” pentru a afișa procentajul

fiecărei specializări în parte.

Se selectează „Apply” și „Close”.

Pasul 3:

Pentru a înlătura legenda,

se selectează „Options”

și „Hide Legend”.

Diagrama circulară cu sectoarele denumite și frecvență procentuală afișată.

II.4. Diagrama cu bare pentru date categoriale.

Pasul 1:

Se selectează:

„Graphs”

„Legacy dialogs”

„Bar…”.

Pasul 2:

Selectați „Define”.

„Simple” este preselectat.

*Selectare unei alte variante se face prin

clic cu mouse-ul pe varianta respectivă.

Pasul 3:

Se selectează ocupația și se apasă

butonul ► de lângă „Category

Axis” pentru a introduce acolo

specializarea.

Se selectează „% of cases”.

Se apasă „OK”

Diagrama cu bare.

* Diagrama cu bare este folosită pentru a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate (Summaries for groups of cases) sau valorile medii ale diferitelor variabile pentru aceeași colectivitate (Summaries of separate variables).

Diagrama Bar este folosită pentru a ilustra categoriile unei distribuții în formă convenabilă. Diagrama prezintă atâtea bare câte categorii are o variabilă. Barele au aceeași bază, egală cu unitatea, iar înălțimea proporțională cu frecvența categoriei astfel încât aria fiecărei bare reprezintă numărul cazurilor categoriei considerate.

Pentru a fi interpretat un grafic trebuie să conțină următoarele elementele:

titlul graficului – oferă informații asupra fenomenului reprezentat (Titlul graficului coincide cu titlul tabelului de date);

axele de coordonate sunt folosite pentru a reprezenta variabilele. Pe abscisă se înscrie variabila de distribuție, iar pe ordonată frecvența.

legenda – este folosită pentru a explica elementele din diagramă;

sursa – precizează originea datelor reprezentate.

II.5. Histograme.

Pentru a ilustra procesul de realizare a unei histograme vom folosi datele obținute din răspunsurile subiecților la întrebarea „Vă place statistica?”. (răspunsuri: a. foarte mult; b. mult; c. puțin d. foarte puțin; e. deloc).

Pasul 1:

Se introduc datele în „Data Editor”

(așa cum a fost prezentat la

începutul capitolului).

Se selectează:

„Graphs”

„Legacy Dialog”

„Hitogram”

Pasul 2:

Se selectează întrebarea „Vă place statistica?” și se apasă butonul ►de lângă „Variable” pentru a duce întrebarea în căsuța din dreapta.

Se apasă „OK”.

Histograma

* Pentru a schimba denumirile axelor se dă clic pe ele și se editează.

* Histograma este folosită pentru a arăta forma unei distribuții după o variabilă înregistrată asupra unei colectivități (frecvența de apariție pentru diferite clase de valori ale variabilei observate).

Alte tipuri de grafice:

Line – diagrama liniară este folosită pentru a reprezenta de regulă valori medii.

Boxplot – diagrama „cutia cu mustăți” este folosită pentru a prezenta amplitudinea, intervalul intercuartilic și mediana unei distribuții.

Error Bar – diagrama „bara erorilor” este folosită pentru a arăta media și intervalul de variabile.

Scatter – diagrama „norul de puncte” este folosită pentru a reprezenta relațiile dintre încredere de 95% pentru media respectivă.

II.6. Exerciții

La o cercetare „percepția socială asupra consumului de droguri” participă 10 persoane dintre care: 4 studenți, 2 profesori și 4 elevi. Aceștia au vârste cuprinse între 15 și 35 de ani astfel: cei 4 studenți au 21, 22, 25, 26 ani, elevii au 15, 16, 17, 17 ani și profesorii au 34 de ani și 35 de ani. (a se vedea figura 1).

Se cere:

să se realizeze un tabel de frecvențe pentru variabila „subiecți”;

să se realizeze tabel de frecvențe pentru variabila „vârstă”;

să se realizeze diagrama de structură pentru variabila „subiecți”;

să se adauge etichete diagramei;

să se realizeze diagrama de bare și histograma pentru variabila „vârstă”.

să se calculeze media pentru variabila „vârstă și să se interpreteze.

să se salveze fișierul creat pe „Desktop” cu denumirea „cercetare”;

II.7. Alegeți răspunsul corect

1. Care sunt graficele folosite pentru o distribuție după o variabilă calitativă?

a. diagrama Bar si diagrama Pie

b. diagrama Boxplot

c. Scatter sau Line

2. Diagrama de bare este folosită pentru:

a. a reprezenta valori medii;

b. a reprezenta frecvențe absolute (numere) și/sau relative (procente);

c. a reprezenta relațiile dintre variabile;

d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate.

3. Diagrama de structură este folosită pentru:

a. a reprezenta frecvențele absolute (numere) și/sau relative (procente);

b. a arăta forma unei distribuții după variabila înregistrată asupra unei colectivități;

c. a prezenta amplitudinea și mediana unei distribuții;

d. a reprezenta relația dintre variabile.

4. Histograma este folosită pentru:

a. a reprezenta grafic valorile medii ale diferitelor variabile pentru aceeași colectivitate;

b. a arăta forma unei distribuții după o variabilă înregistrată asupra unei colectivități;

c. a reprezenta relația dintre variabile;

d. a reprezenta intervalul intercuartilic.

5. Pentru o distribuție după o variabilă cantitativă se folosesc următoarele grafice:

a. scatter (norul de puncte) și histograma;

b. pie (diagrama de structută) și line (diagrama liniară);

c. histograma și curba frecvențelor;

d. bar (diagrama de bare) și curba frecvențelor.

6. Media aritmetică se calculează pentru:

a. variabile categoriale

b. variabile categoriale și cantitative

c. variabile cantitative.

7. Prima coloană a tabelului de frecvențe conține:

a. etichetele categoriilor introduse;

b. procentul de frecvență pentru fiecare categorie;

c. valorile lipsă.

8. Pentru a realiza o diagramă circulară se selectează:

a. analize/ descriptive statistics/descriptives;

b. graphs/ pie;

c. graphs/ area.

9. Indicatorii tendinței centrale sunt:

a. modul, mediana, abaterea standard

b. medie, mod, mediană

c. dispersie, abaterea standard

10. Care dintre următoarele afirmații este adevărată?

a. indicatorul “medie” reprezintă media aritmetică a unui scor și se obține prin însumarea valorilor și înmulțirea cu numărul de valori;

b. modul este valoarea cu cea mai mare frecvență si este frecvența cu care apare cel mai frecvent scor;

c. mediana este valoarea din centrul distribuției, dacă variabilele numerice sunt ordonate după mărime, de la cea mai mică la cea mai mare.

II.8. Răspunsuri corecte

. diagrama Bar și diagrama Pie

2. d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate.

. a reprezenta frecvențele absolute (numere) și/sau relative (procente);

4. b. a arăta forma unei distribuții după o variabilă înregistrată asupra unei colectivități;

5. c. histograma și curba frecvențelor;

6. c. variabile cantitative.

. etichetele categoriilor introduse;

8. b. graphs/ pie;

9. b. medie, mod, mediană

10. c. mediana este valoarea din centrul distribuției, dacă variabilele numerice sunt ordonate după mărime, de la cea mai mică la cea mai mare.

III. Descrierea numerică a variabilelor

– Medie, variație și dispersie –

_________________________________________________________________________________________________________________

III.1. Introducerea datelor și efectuarea analizei

Pentru realizarea acestui exemplu am selectat un număr de 0 subiecți cu vârste cuprinse între 15-35 ani.

Pasul 1:

În „Variable View” din „Data Editor” se denumește prima coloană „Vârstă”.

* Se îndepărtează cele 2 zecimale și se scrie 0.

Pasul 2: Pasul 3:

În “Data View” Se selectează “Analize” →

din “Data Editor” “Descriptives statistics” și

se introduc vârstele “Frequencies…”

în prima coloană.

Pasul 4:

Se selectează „vârsta”

și butonul ► pentru a

introduce în lista de

variabile.

Se deselectează

butonul „Display frequencys tables”

și se ignoră mesajul de avertizare.

Se dă clic pe „Statistics…”

Pasul 5:

Se selectează

„Mean”;

„Median”;

„Mode”.

Se dă clic pe „Continue”.

Se apasă „OK” din ecranul anterior,

care reapare.

III.2. Interpretarea output-ului.

Există 10 cazuri cu date valide pe care se

bazează analiza.

Nu sunt date lipsă (0).

Media de vârstă, media aritmetică

=26,9 ani.

Mediana de vârstă (vârsta persoanei

aflate la mijlocul liniei de vârste de la cea

mai mică la cea mai mare) este de 28.5 ani.

Valoarea mod de vârstă este 34.

III.3. Alte caracteristici.

În căsuțele de dialog de la pasul 5 se pot observa mai multe valori statistice adiționale care pot fi calculate:

1. centilele – indică punctele de separație pentru procentajele scorurilor.

Exemplu: Al 90-lea centil este valoarea numerică care separă cele 90% de valori de dedesubt, din punct de vedere al mărimii.

2. Cvartilele – sunt valorile distribuției care indică punctele de separare pentru cele ai mici 20%, cele mai mici 50% și cele mai mici 75% dintre scoruri.

3. Suma – indică totalul scorurilor pentru o variabilă.

4. Skewness – Este un indicator de asimetrie sau înclinare a distribuției scorurilor pentru o variabilă. Valoarea este pozitivă dacă valorile sunt asimetrice spre stânga, sau negativă dacă valorile sunt asimetrice spre dreapta.

5. Kurtosis – este un index care arată cât de ascuțită sau turtită este distribuția scorurilor pentru o variabilă, comparativ cu distribuția normală. Va fi cu semnul „+” pentru curbe de frecvențe ascuțite și cu semnul „-” pentru curbe de frecvențe „turtite”.

6. Abaterea standard (estimată) – este o evaluare a măsurii în care scorurile diferă în medie față de media scorurilor pentru o variabilă particulară.

7. Variația (estimată) – este o evaluare a măsurii în care scorurile variază în medie față de media scorurilor pentru variabila respectivă.

8. Rang – diferența dintre cel mai mare și cel mai mic scor obținut pentru o variabilă.

9. Minim (scor) – valoarea celui mai mic scor al datelor pentru o variabilă particulară.

10. Maxim (scor) – valoarea celui mai mare scor al datelor pentru o variabilă particulară.

11. Eroarea standard (ES medie) – valoarea medie cu care mediile eșantioanelor extrase dintr-o populație, diferă față de media populației.

III.4. Alegeți răspunsul corect

1. Cum putem calcula mediana?

a. alegând din meniul Transform / Compute;

b. statistics / summarize / case summaries / statistics;

c. statistics / Compare Means / Means;

2. Pentru a calcula eroarea medie de selecție alegem:

a. Mean;

b. Std Deviation;

c. S.E. mean;

d. Range;

3. Pentru a calcula asimetria alegem una din opțiunile:

a. Range;

b. Std Deviation;

c. Skewness;

d. Kurtosis;

e. Variance;

4. Într-un calcul statistic, media reprezintă:

a. valoarea cu cea mai mare frecvență;

b. valoarea din centrul distribuției;

c. media aritmetică a unui set de scoruri, care se obține prin însumarea valorilor și împărțirea rezultatului la numărul de valori;

d. media aritmetică a unui set de scoruri, care se obține prin diferența valorilor și împărțirea rezultatului la numărul de valori.

5. Într-un calcul statistic, abaterea standard este:

a. valoarea a măsurii în care scorurile diferă în medie față de media scorurilor pentru o variabilă particulară;

b. diferența numerică între cel mai mare și cel mai mic scor obținut pentru o variabilă;

c. valoarea cu frecvența cea mai mare

6. Kurtosis, ca indicator al formei distribuției, indică:

a. cât de ascuțită sau turtită este distribuția scorurilor pentru o variabilă, comparativ cu distribuția normală;

b. simetria sau asimetria unei distribuții de frecvențe față de medie;

c. distribuția scorurilor pentru 2 variabile comparative;

7. Eroarea standard este:

a. diferența numerică între cel mai mare și cel mai mic scor obținut pentru o variabilă;

b. valoarea medie cu care mediile eșantioanelor extrase dintr-o populație, diferă față de media populației;

c. diferența scorurilor a 2 variabile.

8. Pentru a calcula boltirea alegem:

a. Range;

b.Variance;

c. Skewness;

d. Kurtoses.

III.5. Răspunsuri corecte

1. c. statistics / Compare Means / Means;

2. c. S.E. mean;

3. c. Skewness;

4. c. media aritmetică a unui set de scoruri, care se obține prin însumarea valorilor și împărțirea rezultatului la numărul de valori;

. valoarea a măsurii în care scorurile diferă în medie față de media scorurilor pentru o variabilă particulară;

. cât de ascuțită sau turtită este distribuția scorurilor pentru o variabilă, comparativ cu distribuția normală;

7. b. valoarea medie cu care mediile eșantioanelor extrase dintr-o populație, diferă față de media populației;

8. d. Kurtoses.

IV. Forme ale distribuției scorurilor

_________________________________________________________________________________________________________________

Este foarte important de studiat forma distribuțiilor scorurilor pentru o variabilă. Este bine ca o distribuție să fie simetrică și cu o formă normală (formă de clopot).

Distribuția normală, a fost descrisă prima dată de Ch. Fr. Gauss (1777-1855) și de aceea distribuția normală se mai numește și distribuție gaussiană. Deoarece la demonstrarea acestui concept a participat și P.S. Laplace (1749-1827), în literatura de specialitate se va întâlni și termenul de distribuție Gauss-Laplace.

Pentru ca o distribuție să fie considerată normală, trebuiesc îndeplinite simultan următoarele condiții:

Să fie unimodală – adică să existe un singur modul, o singură categorie cu frecvență maximă;

Să fie simetrică față de medie – adică să nu fie deplasată spre stânga sau spre dreapta;

Să fie normal boltită – adică să nu fie nici ascuțită și nici „turtită”;

Toți acești termeni se referă la același lucru, distribuția normală.

De asemenea, limitele din stânga și din dreapta ale unei distribuții normale tind spre valoarea zero, pe care însă nu o întâlnesc niciodată. O distribuție perfect normală are aceeași valoare pentru toți cei trei indicatori ai tendinței centrale (media, mediana și modulul), adică media = mediana = modulul. În practică, acest lucru se întâlnește extrem de rar și, de aceea, ne punem problema între ce limite putem considera o distribuție ca fiind normală.

În exemplul următor este elaborat un tabel de frecvență și o histogramă cu scorurile obținute la evaluarea coeficientului de inteligență pentru 20 de juriști.

IV.1. Introducerea datelor.

Pasul 1:

În „Variable View” din

„Data Editor” se denumește

prima coloană „Atenție”.

Se înlătură cele două zecimale.

*Datele se salvează ca fișier

deoarece vor fi folosite și la

capitolul 9.

Pasul 2:

În „Data View”

din „Data Editor”

se introduc

scorurile obținute

la „Atenție” în

prima coloană.

Pasul 3:

Se selectează

„Analyze”,

„Descriptives

Statistics” și

Frequencies…”

Pasul 4:

Se selectează

„atenție” și apoi

se apasă butonul

►pentru a

introduce în lista

de variabile.

Se apasă „OK”.

IV.2. Interpretarea Output-ului

Prima coloană arată scorurile obținute la testul de „atenție”.

A doua coloană arată frecvența acestor valori.

Exemplu: este 1 caz în care scorul obținut are valoarea 56.

A treia coloană exprimă aceste frecvențe ca

un procent al numărului total A patra coloană A cincea coloană

incluzând și datele care exprimă aceste frecvențe cumulează aceste

lipsesc. ca un procent al numărului procentaje în josul

Exemplu: Din totalul cazurilor, total excluzând datele lipsă. tabelului.

10% au obținut scorul 56.

IV.3. Histograme.

Histograma este un grafic, folosit în statistica descriptivă și arată o distribuție de frecvență. Distribuția de frecvență se referă la numărul de evenimente statistice pe clase (grupe) de evenimente. Pentru o serie de date statistice cu o distribuție de frecvență după o variabilă numerică continuă (sau continuă pe porțiuni), reprezentările grafice care ne permit să vizualizăm distribuția de frecvențe sunt histograma și poligonul frecvențelor.

Se reiau pașii de la capitolul II.5.

IV.4. Interpretarea output-ului

Axa verticală arată frecvența

cazurilor de la 0 la 3.

Înălțimea barelor arată cât de

frecvent apare fiecare scor la atenție.

Axa orizontală arată scorurile

diferite ale „Atenției”.

*Media scorului la atenție este 62,7.

*Abaterea standard este 4,99.

*Numărul cazurilor este 10.

IV.5. Modalitatea.

O distribuție normală (figura 1) este o distribuție unimodală, adică există doar o singură categorie cu frecvența maximă. Prezența a două sau mai multe valori mod determină distribuții bimodale, trimodale, în general polimodale, distribuții ce nu pot fi considerate ca fiind distribuții normale.

Figura nr. 1.

O distribuție similară distribuției din figura 1, este o distribuție bimodală (figura 2), deoarece observăm existența a două categorii cu frecvența egală și maximă.

Figura nr. 2.

Normalitatea distribuției, sub aspectul modalități, se verifică prin calcularea valorii modul. Dacă există o singură valoare cu frecvența maximă, atunci distribuția poate fi considerată normală sub acest aspect. În condițiile în care sunt două sau mai multe valori cu frecvența maximă și, evident, egală, distribuția este polimodală (multimodală) și nu poate fi considerată ca fiind normală.

IV.6. Simetria.

O distribuție este simetrică, dacă valorile sunt egal (simetric) răspândite în jurul tendinței centrale. Atunci când rezultatele tind către valori mici, sunt aglomerate în partea stângă a distribuției, avem de a

Figura nr. 3 face cu o distribuție asimetrică

spre dreapta (sau distribuție skewness pozitiv). Când rezultatele tind către valori mari, se aglomerează în partea dreaptă a distribuției, vorbim despre o distribuție asimetrică la stânga (skewness negativ). Iată că, asimetria este dată de panta distribuției și nu de vârful acesteia, așa cum tratează și consideră unii.

În figura nr. 3, distribuția „B” este o distribuție simetrică. Distribuția „A” este o distribuție asimetrică la dreapta (skewness pozitiv) unde predomină scorurile scăzute (mici), în timp ce distribuția „C” este o distribuție asimetrică la stânga (skewness negativ) în care predomină scorurile mari.

Nu ne putem limita la o apreciere pur vizuală a simetriei; acest lucru necesită demonstrarea statistică a simetriei sau asimetriei distribuției. În acest scop, există mai mulți coeficienți care pot fi calculați.

Atunci când discutăm de asimetrie, trebuie să precizăm o serie de relații care apar între indicatorii tendinței centrale, media, mediana și modul.

Într-o distribuție simetrică, media, mediana și modul au exact aceleași valori. Caracteristica acestei distribuții o reprezintă coincidența absolută a celor trei indicatori ai tendinței centrale. După cum puteți observa în figura de mai sus, atât media, cât și mediana și modulul, se află în același punct, la mijlocul distribuției. Grupa subiecților cu scoruri Figura nr. 4

mai mici decât media este perfect simetrică cu grupa subiecților cu scoruri mai mari decât media. Acest aspect este menționat din rațiuni teoretice. În practică nu vom întâlni o distribuție perfect normală, ci o distribuție care poate fi acceptată ca fiind normală.

Într-o distribuție asimetrică la dreapta (distribuție skewness pozitiv, vezi figura alăturată), predomină scorurile mici. În acest caz, modulul este valoarea situată cel mai la stânga în șirul de date, iar mediana este mai mică decât media. Evident, mediana fiind valoarea care împarte șirul ordonat de date în două părți egale, Figura nr. 5

iar dacă în distribuție predomină scorurile mici, atunci scorurile mari sunt considerate ca scoruri extreme. Știm de la analiza preciziei indicatorilor tendinței centrale, că într-o serie de date în care întâlnim scoruri extreme mari, media tinde să le pună în valoare. Iată că acest fapt este ilustrat grafic în figura de mai sus. Observați relația existentă într-o asemenea distribuție: Mo<Me<m. Această relație este relația caracteristică a unei distribuții asimetrice pozitiv.

Într-o distribuție asimetrică la stânga (distribuție skewness negativ, vezi figura alăturată), predomină scorurile mari. În acest caz, modulul este valoarea situată cel mai la dreapta în șirul de date, iar mediana este mai mare decât media. Evident, mediana fiind valoarea care împarte șirul ordonat de date în două părți egale, Figura nr. 6

iar dacă în distribuție predomină scorurile mari, atunci scorurile mici sunt considerate ca scoruri extreme. Știm, de la analiza preciziei indicatorilor tendinței centrale, că într-o serie de date în care întâlnim scoruri extreme mici, media tinde să le pună în valoare. Iată că acest fapt este ilustrat grafic în figura de mai sus. Observați relația existentă într-o asemenea distribuție: Mo>Me>m. Această relație este relația caracteristică a unei distribuții asimetrice negativ.

IV.7. Boltirea (excesul).

Asimetria pe orizontală, presupune, după cum am văzut, o deplasare a tendinței centrale spre stânga sau spre dreapta, către scoruri mici sau către scoruri mari. Dar, aceasta nu este singura asimetrie posibilă. Există și un fel de „asimetrie verticală” sau boltire. Termenul folosit generic pentru acest concept este termenul de kurtosis (din limba greacă, kurtos = „cocoșat”).

Practic, boltirea se referă la aspectul „cocoașei” distribuției rezultatelor. Cocoașa poate fi ascuțită și atunci vorbim de o distribuție ascuțită sau leptocurtică, poate fi turtită, distribuția turtită, plată sau platicurtică sau normală, distribuție mezocurtică. O distribuție normală este întotdeauna o distribuție mezocurtică.

În figura alăturată, distribuția „C” este o distribuție leptocurtică, ascuțită. Distribuția „B” este o distribuție platicurtică, turtită, iar distribuția „A” este o distribuție normală sub aspectul boltirii, sau mezocurtică.

Figura nr. 7

Se observă că boltirea nu este altceva decât simetria pe axa verticală (OY), spre deosebire de simetria propriu zisă, deplasarea valorilor pe axa orizontală (OX). Dacă la simetrie se vorbește de frecvențe (care sunt cele mai frecvente scoruri obținute, unde se concentrează acestea? În eșantionul sunt mai degrabă subiecți scunzi sau subiecți înalți? Ori poate există un echilibru între subiecții scunzi și cei înalți), la boltire se discută de valori, de modul în care aceste valori se grupează în jurul tendinței centrale (sunt mai grupate valorile în jurul mediei sau, din contra, foarte împrăștiate.)

La fel ca și simetria, boltirea nu poate fi apreciată pur „ochiometric” ci avem nevoie și aici de anumiți coeficienți de boltire. Pearson a discutat despre boltire în termeni de momente, la fel ca și simetria, rezultând astfel coeficientul de boltire sau coeficientul kurtosis.

O distribuție leptocurtică, ascuțită, arată că datele sunt foarte grupate și apropiate de medie, lotul de subiecți având un mare grad de omogenitate a scorurilor. Această distribuție nu ridică nici un fel de probleme atunci când trebuie să diferențiem subiecții care obțin scoruri mici sau mari. Avem însă dificultăți atunci când trebuie să diferențiem subiecții din zona medie a distribuției.

De exemplu, dacă într-o clasă de 30 de elevi, 27 obțin medii anuale între 7,9 și 8,1. Iată că, doar două zecimi diferențiază între aproape întreg efectivul de elevi. Nu avem nici o problemă cu repartizarea celorlalți trei elevi. Pe aceia îi vom considera ori foarte buni, ori foarte slabi, în funcție de media obținută – sub 7,9 sau peste 8,1. Ce putem face însă cu cei 27 de subiecți? Suntem, iată, în imposibilitatea de ai-i ierarhiza în vreun fel. Dacă presupunem că cei trei subiecți au note mai mici de 7,9, atunci cine va lua, dintre cei 27 de elevi, premiul I, cine va lua premiul II și cine va lua premiul III. Decizia ar fi, după cum se poate vedea, extrem de dificilă, dacă nu chiar imposibilă. Singura variantă în acest caz, ar putea fi creșterea preciziei. Nu calculăm media cu o singură zecimală, ci cu 2, 3 sau 4 zecimale. Totuși, sunt situații în care un asemenea nivel de precizie este ridicol. O evaluare în care distribuția rezultatelor este leptocurtică, este o evaluare ce nu poate diferenția între subiecții de nivel mediu, iar o curbă leptokurtică nu este o distribuție normală;

O distribuție platicurtică, plată, este o distribuție în care rezultatele sunt foarte împrăștiate față de medie și indică un grad ridicat de eterogenitate a scorurilor. Problema generală a acestei distribuții, în opoziție cu distribuția leptokurtică, este aceea că diferențiază greu la extreme și destul de bine în zona mediei. Va fi greu, utilizând o asemenea distribuție, să facem diferențieri între elevii slabi și între elevii buni, deși putem diferenția relativ ușor elevii medii. Datorită acestui fapt, o distribuție platicurtică nu este nici ea o distribuție normală.

O distribuție normală este o distribuție mezocurtică.

Analiza unei distribuții sub aspectul normalității este primul pas pe care îl facem în orice prelucrare de date. Deoarece, în funcție de rezultatul acestei analize, vom putea alege tehnicile și procedeele statistice pe care le putem folosi, această etapă o întâlnim, de obicei, la începutul oricărui raport de cercetare, imediat după descrierea eșantionului.

IV.8. Alegeți răspunsul corect

Histograma:

este un grafic folosit în statistica descriptivă;

arată o distribuție de frecvență;

se folosește pentru date calitative.

Valid procent:

a. exprimă aceste frecvențe ca un procent al numărului total excluzând datele lipsă.

b. frecvențe ca un procent al numărului total lipsesc incluzând și datele care

lipsesc.

c. frecvența valorilor.

Pentru a obține un tabel de frecvențe accesăm:

analyze/ descriptive statistics/frequences;

analyze/ descriptive statistics/descriptives;

analyze/ descriptive statistics/frequences/descriptives.

Pentru a crea o histogramă accesăm:

graphs/histogram;

graphs/interactve;

graphs/control.

O distribuție poate fi:

unimodală;

bimodală;

trimodală.

Într-o distribuție simetică:

media < mdiana< modul;

media = mediana = modul;

media >mediana>modul.

Într-o distribuție asimetrică la dreapta:

modul <mediana<media;

modul>mediana>modul;

modul=mediana=modul.

8. Într-o distribuție asimetrică la dreapta:

a. modul=mediana=media;

b. modul <mediana>modul;

c. modul>mediana>modul.

9. O distribuție poate fi:

leptocurtică;

platicurtică;

asimetrică pozitiv;

asimetrică negativ;

mezocurtică.

toate variantele de mai sus.

10. O distribuție leptocurtică arată că:

datele sunt foarte grupate și apropiate de mediană iar lotul de subiecți are un grad mare de omogenitate;

datele sunt foarte împrăștiate de mediană iar lotul de subiecți are un grad mare de eterogenitate;

distribuția este normală.

O distribuție platicurtică arată că:

datele sunt foarte grupate și apropiate de mediană iar lotul de subiecți are un grad mare de omogenitate;

datele sunt foarte împrăștiate de mediană iar lotul de subiecți are un grad mare de eterogenitate;

distribuția este normală.

IV.9. Răspunsuri corecte

1. a. este un grafic folosit în statistica descriptivă;

b. arată o distribuție de frecvență;

. analyze/ descriptive statistics/frequences;

. analyze/ descriptive statistics/frequences;

. graphs/histogram;

5. a. unimodală;

b. bimodală;

c. trimodală.

6. b. media = mediana = modul;

7. b. modul <mediana<media;

8. c. modul>mediana>modul.

. toate variantele de mai sus.

. datele sunt foarte grupate și apropiate de mediană iar lotul de subiecți are un grad mare de omogenitate;

11. b. datele sunt foarte împrăștiate de mediană iar lotul de subiecți are un grad mare de eterogenitate;

V. Abaterea standard.

________________________________________________________________________________________________________________

Abaterea standard este un indice care arată cât de mult deviază (diferă) unele scoruri „în medie” față de media setului de scoruri din care acestea fac parte.

Abaterea standard poate fi folosită și pentru a transforma scoruri pentru variabile foarte diferite în scoruri Z (sau standard), care sunt ușor de comparat și însumat.

Calcularea abaterii standard și a scorurilor Z este prezentată în exemplul următor:

V.1. Introducerea datelor.

Pasul 1:

În „Variable View” din

„Data Editor” se denumește

prima coloană „Vârsta”.

Se înlătură cele două zecimale.

Pasul 2:

În „Data View” din „Data Editor”

se introduc vârstele în prima

coloană.

Pasul 3:

Se selectează:

„Analyze”

„Descriptive Statistics”

„Descriptives…”

Pasul 4:

Se selectează „vârsta” și apoi se

apasănbutonul ► pentru a o i

ntroduce în lista de variabile.

Se selectează „Options…”

Pasul 5:

Se deselectează „Mean”,

„Minimum”, „Maximum”.

Se selectează „Continue”.

Se selectează „OK” din

ecranul precedent care

reapare.

V. 2. Interpretarea output-ului.

Numărul 10 reprezintă numărul de cazuri.

Abaterea standard pentru vârstă este de 5,740.

V.3. Scorurile Z

Pasul 1:

La pasul 4 selectați „Save

standardized values as variables”.

Se apasă „OK”.

Pasul 2:

Scorurile Z sau standard

sunt în a doua coloană din

„Data View” în „Data Editor”

și sunt numite „ZVârstă”.

V.4. Raportarea output-ului.

Abaterea standard pentru o variabilă este ușor de menționat în textul raportului: „A fost determinată abaterea standard a vârstei ca fiind 5,74 ani (N= 10)”.

*Este posibil ca abaterea standard să fie înregistrată împreună cu alte statistici, cum ar fi media, rangul, etc.

Notele „z” reprezintă diferența dintre scorul observat și medie, în termeni de abatere standard. Cu alte cuvinte, notele „z” nu sunt altceva decât distanțele la care se situează scorurile particulare în raport cu media grupului iar această distanță este exprimată standardizat.

Teoretic, notele „z” sunt note obținute pe o „curbă” cu media 0 și abaterea standard 1. În acest caz, o distribuție normală are practic notele „z” cuprinse între -3 și +3, între aceste note regăsindu-se peste 99% din populație, după cum observați în figura de mai jos.

Notele „z” au și ele o serie de proprietăți cu aplicabilitate practică deosebită, dintre care menționăm (Popa, 2006):

Media unei distribuții „z” este egală cu zero, afirmație ce rezultă din proprietatea acestui indicator de a se diminua atunci când scădem o constantă din fiecare scor particular. Deoarece din formulă rezultă această diferență (se scade fiecare scor particular din medie), în final media va ajunge la valoarea zero

Abaterea standard a unei distribuții „z” este întotdeauna 1. Și această afirmație rezultă din proprietățile abaterii standard. Știm că dacă împărțim abaterea standard cu o constantă, valoarea acesteia se divide corespunzător. Din formulă, observăm că acea constantă cu la care împărțim este chiar abaterea standard iar împărțirea a două numere egale are ca rezultat 1

Notele „z” sunt note direct calculabile, utilizându-se media și abaterea standard și reprezintă „temelia” oricărui proces de standardizare. Totuși, principalul dezavantaj al notelor „z” este acela că sunt puțin intuitive. Trebuie să știm bine ce înseamnă distribuția normală pentru a înțelege corect semnificația acestor note. În plus, au valori pozitive și negative, ceea ce le face, iarăși, greu de utilizat.

V.5. Alte caracteristici.

În meniul „Descriptives Statistics sunt conținute mai multe calcule statistice care pot fi selectate:

Mean (media);

Sum (suma);

Standard deviation (estimate) (abaterea standard);

Range (amplitudinea);

Minimim;

Maximum;

Kurtosis;

Skewness.

* Aceste concepte sunt explicate pe scurt la sfârșitul capitolului 3.

V.6. Alegeți răspunsul corect

Abaterea standard:

este un indice care arată cât de mult deviază (diferă) unele scoruri „în medie” față de media setului de scoruri din care acestea fac parte.

este un indice care arată cât de simetrică sau asimetrică este o distribuție;

este un indice care arată cât de turtită sau boltită este o distribuție.

2. Media este o mărime generalizată , adică, înlocuind fiecare nivel individual al caracteristicii de distribuție cu nivelul mediu:

a) suma seriei rămâne aceeași

b) suma termenilor seriei se modifică

c) suma termenilor seriei este nulă.

3. Media aritmetică reprezintă:

a) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuția ar fi eterogenă

b) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuția ar fi omogenă

c) valoarea pe care ar purta-o fiecare variabilă statistică dacă distribuția ar fi omogenă.

4. Media aritmetică, ca indicator fundamental al tendinței centrale:

reprezintă valoarea care modifică nivelul totalizator;

se folosește cel mai frecvent și reprezintă suma valorilor raportată la numărul lor;

se calculează adunând valorile existente;

nu poate determina numărul de unități din colectivitate.

V.7. Răspunsuri corecte

a. este un indice care arată cât de mult deviază (diferă) unele scoruri „în medie” față de media setului de scoruri din care acestea fac parte.

) suma seriei rămâne aceeași

3. b) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuția ar fi omogenă

4. b. se folosește cel mai frecvent și reprezintă suma valorilor raportată la numărul lor;

VI. Relațiile dintre două sau mai multe variabile.

Diagrame și tabele.

________________________________________________________________________________________________________________

În foarte multe cercetări se studiază relațiile dintre două sau mai multe variabile. Procedurile statistice univariate (cu o singura variabilă) care au fost descrise până acum pot fi utilizate pentru analiza oricăror date. Dar, cercetarea poate necesita ca relațiile și corelațiile dintre diferitele variabile să fie studiate.

La fel ca statistica univariată, statistica bivariată a datelor necesită studierea tendințelor fundamentale ale datelor utilizând tabele și diagrame. Modelele de prezentare a relațiilor bivariate includ crearea tabelelor scatter.

O condiție esențială o constituie etichetarea tabelelor și diagramelor și denumirea acestora.

În continuare se va ilustra elaborarea unui tabel de asociere și a unei diagrame cu bare.

VI.1. Introducerea datelor.

În studiu sunt introduși 11 copii instituționalizați și 9 copii neinstituționalizați. Dintre aceștia 9 au fost fete și 11 au fost băieți.

Pasul 1:

În „Variable View” din „Data Editor” se denumește:

prima coloană „Instituționalizare”

a doua coloană „Genul biologic”;

A treia coloană „Frecvența”.

Se înlătură cele două zecimale.

Pasul 2:

Se etichetează cele două valori

ale instituționalizării:

1 – instituționalizat;

2 – neinstituționalizat.

Și genul biologic:

Feminin;

Masculin

*Pașii acestei proceduri au fost explicați în capitolul 1.

Pasul 3:

Se introduc aceste numere în „Data

View” din „Data Editor”.

Primul rând se referă la fetele care

au fost instituționalizate: sunt în număr

de 5.

Al doilea rând se referă la băieții

care au fost instituționalizați:

sunt în număr de 6.

Al treilea rând se referă la fetele neinstituționalizate: sunt în număr de 4.

Al patrulea rând se referă la băieții neinstituționalizați: sunt în număr de 5.

VI.2. Ponderea datelor

Pasul 4:

Pentru a pondera datele cu scopul

ca cele patru celule să conțină

numărul de cazuri corespunzător,

se selectează:

„Data”

„Weight Cases…”

Pasul 5:

Se selectează „Frecvența”, „Weight cases by” și apoi se apasă butonul ►pentru transfer în căsuța variabilei„Frequency Variable”.Se apasă „OK”
VI.3. Crearea tabelelor de asociere (Crosstabs).

Pasul 6:

Se selectează:

„Analize”

„Descriptivesc statistics”

„Crosstabs…”.

Pasul 7:

Pentru a pune „instituționalizare”

pe rândurile tabelului, se selectează

și apoi se apasă butonul ►de lângă

eticheta „Row(s)”.

Pentru a pune „genul biologic” pe

coloanele tabelului, se selectează

și apoi se apasă butonul ► de lângă

eticheta „Column(s).

Se apasă „OK”.

Pasul 8:

În tabel sunt prezentate valorile celor două variabile.

Se observă că sunt 5 fete și 6 băieți

instituționalizați (în total 11) și 4 fete și 5 băieți neinstituționalizați (în total 9). (N=20).

Tabelul de asociere este folosit pentru prezentarea relațiilor dintre două variabile categoriale. În fiecare celulă a tabelului este prezentată frecvența parțială (adică efectivul care poartă simultan o valoare a fiecărei variabile).

Observație:

Dacă într-un crosstabs numărul categoriilor unei variabile este mai mare decât al alteia, atunci categoriile acelei variabile se plasează pe rânduri.

O celulă din crosstabs oferă informația despre intersecția celor două variabile. Pentru aceasta alegem din fereastra Crosstabs butonul de comandă Cell ce are ca efect afișarea ferestrei Crosstabs Cell Display.

VII. Coeficienți de corelație.

Coeficienți de corelație Pearson și Spearman.

_________________________________________________________________________________________________________________

Corelația este o metodă statistică utilizată pentru a determina relațiile dintre două sau mai multe variabile. Există mai multe tipuri de corelații atât parametrice cât și neparametrice.

Coeficientul de corelație este o valoare cantitativă ce descrie relația dintre două sau mai multe variabile. El variază între (-1 si +1), unde valorile extreme presupun o relație perfectă între variabile în timp ce 0 înseamnă o lipsa totala de relație liniară. O interpretare mai adecvată a valorilor obținute se face prin compararea rezultatului obținut cu anumite valori prestabilite în tabele de corelații în funcție de numărul de subiecți, tipul de legătură și pragul de semnificație dorit.

Cel mai comun și cel mai folositor este coeficientul de corelație Pearson și coeficientul de corelație Spearman.

Corelația Pearson(r) evaluează gradul de asociere dintre două variabile măsurate pe scală de interval/raport. Aceasta se referă la intensitatea și sensul de variație concomitentă a valorilor unei variabile în raport cu cealaltă, după un model de tip liniar. Dacă valorile unei variabile urmează, în sens direct, crescător, sau invers, descrescător, valorile celeilalte variabile, atunci cele două variabile corelează între ele. Domeniul de variație a coeficientului de corelație Pearson(r) este între r = -1 (corelație perfectă negativă: ceea ce înseamnă că în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă variabilă descresc) și r = +1 (corelație perfectă pozitivă: ceea ce înseamnă că scorurile unei variabile se măresc odată cu creșterea scorurilor celeilalte variabile). Absența oricărei legături (corelații) dintre variabile se traduce prin r =0.

O corelație de 1,00 indică o asociere perfectă între cele două variabile. Cu alte cuvinte, o diagramă scatter a celor două variabile va arăta că toate punctele sunt conținute de o singură dreaptă. O valoare de 0,00 indică faptul că toate punctele din diagrama scatter sunt dispersate aleatoriu în jurul oricărei drepte desenate pe această diagramă a datelor sau sunt aranjate într-o manieră curbilinie.

În continuare vom ilustra calculul corelației Pearson, o diagramă scatter și coeficientul de corelație Spearman, folosind pentru aceasta datele din tabelul următor, care reprezintă scoruri ale abilităților muzicale și matematice pentru 10 copii.

VII.1. Introducerea datelor.

Pasul 1:

În „Variable „View” din „Data Editor” se denumește primul

rând „muzică”

și al doilea rând „matematică”. * Se înlătură cele două zecimale.

Pasul 2:

În „Data View” din „Data editor”

se introduc datele pentru:

muzică în prima coloană;

matematică în a doua coloană.

VII.2. Corelația Pearson.

Pasul 1:

Se selectează:

„Analyze”,

„Corelate”,

„Bivariate…”

Pasul 2:

Se selectează „Muzică” și

„Matematică” și apoi se apasă

butonul ►pentru a le introduce

în lista de variabile așa cum este

arătat în figura din dreapta.

Se apasă „OK”.

VII.3. Interpretarea output-ului.

Corelația dintre „matematică” și „muzică” este – 0,845 La un test de semnificație, two-tailed la nivelul de probabilitate 0,01 sau mai mic, corelația este statistic semnificativă.

Numărul cazurilor pe care este bazată corelația este 10. Informația apare și în această celulă.

*One tailed – dacă distribuția este unidirecțională.

Two-tailed – dacă distribuția este bidirecțională.

VII.4. Raportarea output-ului.

Corelația dintre abilitățile muzicale și cele matematice este – 0,845.

* Se obișnuiește să se rotunjească corelația cu două zecimale, deci aceasta va deveni 0,90, acesta fiind un rezultat mult mai precis pentru majoritatea măsurătorilor psihologice.

Nivelul de semnificație exact, cu trei zecimale, este 0,002. Înseamnă că nivelul de semnificație este mai mic decât 0,01.

Interpretarea psihologică va fi: „Există o relație negativă semnificativă între abilitățile muzicale și cele matematice , ceea ce înseamnă că, copii cu nivel ridicat al abilităților muzicale au un nivel scăzut al abilității matematice”.

Un coeficient de corelatie poate fi calculat corect numai când datele ambelor variabile se refera la esantioane si fiecare este ales independent.

Un coeficient de corelatie poate fi apropiat de ą1, deci ne va indica o corelatie puternica, dar ea poate fi nesemnificativa din cauza volumului mic a esantionului studiat.

Corelatia nu trebuie identificata cu cauzalitatea, in sensul ca observatiile a 2 variabile se pot corela foarte bine fara sa avem motive logice si stiintifice ca una dintre variabile poate fi cauza celeilalte.

VII.5. Coeficientul de corelație Spearman.

Pasul 1:

Identic corelației Pearson se

selectează „Analyze”, „Correlate”,

„Bivariate” și variabilele care se

doresc pentru corelație.

Se selectează „Spearman” și se

deselectează Pearson (dacă nu se

dorește ca și corelație).

Se apasă „OK”.

VII.6. Interpretarea output-ului.

Coeficientul de corelație Spearman Numărul cazurilor este 10.

între muzică și matematică este – 0,842.

Nivelul de semnificație este 0,001 sau

mai mic, deci corelația este statistic

semnificativă.

VII.7. Raportarea output-ului.

Corelația raportată cu două zecimale este – 0,84.

Interpretarea psihologică va fi: „Există o corelație negativă semnificativă între abilitățile muzicale și cele matematice, ceea ce semnifică faptul că, cei cu un nivel ridicat al abilității muzicale au abilități matematice scăzute și viceversa”.

Coeficientul de corelatie al rangurilor (Spearman) testeaza gradul de corelare intre 2 variabile calitative; este alternativa neparametrica a “coeficientului de corelatie Pearson”.

Acest coeficient variaza intre -1 si +1. O valoare apropiata de +1, inseamna ca suma patratelor diferentelor este aproape nula, deci avem clasamente identice.

O valoare apropiata de 0, inseamna necorelarea variabilelor, iar valoarea apropiata de -1 pune in evidenta discordanta maxima a variabilelor.

VII.8. Diagrama scatter.

Pasul 1:

Se selectează:

„Graphs”

„Legacy Dialogs”

„Scatter Dot”

Pasul 2:

Se selectează „define”

din moment ce „simple”

este deja selectat.

Pasul 3:

Pentru a avea variabila „muzică” ca axă verticală, se selectează și apoi se apasă butonul ►de lângă căsuța „Y Axis”

Pentru a avea variabila „matematică” ca axă orizontală, se selectează apoi se apasă butonul ◄ de lângă căsuța „X Axis”.

Se apasă „OK”.

VII.9. Interpretarea output-ului.

În diagrama scatter, răspândirea punctelor este relativ îngustă, ceea ce indică o corelație mare.

Forma împrăștierii rezultatelor este relativ în linie dreaptă, indicând mai degrabă o relație în linie dreaptă decât o relație curbilinie.

Linia este de la colțul stânga sus până în dreapta jos, ceea ce indică o corelație negativă.

*Dacă relația este curbilinie atunci corelațiile Pearson și Spearman pot fi înșelătoare.

VII.10. Raportarea output-ului.

Despre diagrama scatter s-ar putea scrie următoarele afirmații: „ A fost examinată o diagramă scatter pentru relația dintre abilitățile muzicale și matematice. Nu există nicio dovadă privind o relație curbilinie sau asupra influenței avute de rezultatele atipice”.

VII.11. Alegeți răspunsul corect

1. Corelația:

a. măsoară variația concomitentă a doi factori

b. măsoară parametria distribuției între două eșantioane

c. măsoară rangul unei distribuții trihotomice

2. Corelația Pearson(r):

evaluează gradul de asociere dintre două variabile măsurate pe scală de interval/raport.

evaluează gradul de asociere dintre două variabile măsurate pe scală nominală;

evaluează gradul de asociere dintre două variabile măsurate pe scală ordinală.

O corelație de 1,00 indică:

o asociere perfectă între cele două variabile;

faptul că toate punctele din diagrama scatter sunt dispersate aleatoriu în jurul oricărei drepte desenate pe această diagramă a datelor;

absența oricărei legături (corelații) dintre variabile.

Pearson este un indicator de corelație:

parametric;

neparametric;

ambele variante de mai sus.

Spearman este un indice de corelație:

a. parametric;

b. neparametric;

c. ambele variante de mai sus.

O corelație negativă semnifică faptul că:

în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă variabilă descresc;

că scorurile unei variabile se măresc odată cu creșterea scorurilor celeilalte variabile).

nu există nicio legătură între variabile.

O corelație pozitivă semnifică faptul că:

în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă variabilă descresc;

că scorurile unei variabile se măresc odată cu creșterea scorurilor celeilalte variabile).

nu există nicio legătură între variabile.

8. Norul de puncte este folosit pentru:

a. a reprezenta relația dintre variabile;

b. a arăta frecvența de apariție pentru diferite clase de valori ale variabilei observate;

c. a arăta intzervalul de încredere de 95% pentru media respectivă.

9. Pentru a realiza un tabel de asociere selectăm:

a. Analyze/Descrisptiv statistics/crosstabs;

b. Analyze/Descrisptiv statistics/Explore;

c. Statistics / Corelate / Crosstabs

d. Statistics / Custom tables / Crosstabs

10. Tabelul de asociere este folosit pentru:

a. selectarea unor subiecți

b. prezentarea relațiilor dintre două variante categoriale

c. recodificarea variabilelor

d. modificarea unui tabel

VII.12. Răspunsuri corecte

. măsoară variația concomitentă a doi factori

. evaluează gradul de asociere dintre două variabile măsurate pe scală de interval/raport.

. o asociere perfectă între cele două variabile;

4. b. neparametric;

5. b. neparametric;

. în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă variabilă descresc;

7. e. că scorurile unei variabile se măresc odată cu creșterea scorurilor celeilalte variabile).

. a reprezenta relația dintre variabile;

. Analyze/Descrisptiv statistics/crosstabs;

10. b. prezentarea relațiilor dintre două variante categoriale

VIII. Regresia.

Predicția cu precizie.

_________________________________________________________________________________________________________________

Dacă există o relație între două variabile atunci sunt posibile estimarea sau predicția scorului unei persoane la o variabilă pornind de la scorul obținut la cealaltă variabilă. Cu cât este mai puternică corelația cu atât este mai bună predicția. Variabila independentă este variabila folosită pentru a realiza predicția, aceasta fiind cunoscută și ca variabilă predictor sau variabila X.

*Este foarte important a nu se confunda variabila independentă cu cea dependentă. Cel mai bun mod de a evita aceste probleme este de a examina scatterplot-ul sau diagrama scatter a relației dintre cele două variabile. Axa orizontală X este variabila independentă și axa verticala Y este variabila dependentă. Se poate investiga și punctul de tăiere, acesta fiind punctul în care panta se intersectează cu axa verticală.

Regresia devine o tehnică mult mai importantă atunci când sunt folosite mai multe variabile pentru predicția valorilor unei alte variabile.

În continuare este ilustrată procesarea unei regresii simple și a unei diagrame de regresie folosind datele din tabelul următor.

Unul din principalele capitole ale statisticii are în vedere posibilitatea de a face predictii. Desi nu se gasesc relatii perfecte în lumea reala, prin intermediul regresiei se pot face predictii ale unei variabile, în functie de valoarea alteia. Predictia este procesul de estimare a valorii unei variabile cunoscând valoarea unei alte variabile.

Regresia se leaga foarte mult de conceptul de corelatie. O asociere puternica între doua elemente conduce la cresterea preciziei predictiei unei variabile pe seama alteia. Daca am avea o corelatie perfecta (+1 sau –1) estimarea ar fi extrem de precisa

VIII.1. Introducerea datelor.

Pasul 1:

În „Variable „View” din „Data Editor” se denumește primul

rând „muzică”

și al doilea rând „matematică”. * Se înlătură cele două zecimale.

Pasul 2:

În „Data View” din „Data editor” se

introduc datele pentru:

muzică în prima coloană;

matematică în a doua coloană.

VIII.2. Regresia simplă.

Pasul 1:

Se selectează:

„Analyze”

„Regression”

„Linear…”

Pasul 2:

Se selectează „Muzică” și apoi

se apasă butonul ► de lângă

eticheta „Dependent”, pentru a

introduce această variabilă în

căsuța variabilei dependente.

Se selectează „matematica”

și apoi se apasă butonul ◄ de

lângă eticheta „Independent(s)

pentru a introduce această

variabilă în căsuța variabilei

(lor) independente.

Se selectează „Statistics…”

Pasul 3:

Se selectează „Confidence Intervals”.

Se selectează „Continue”.

Se apasă „OK” din ecranul precedent

care reapare.

VIII.3. Interpretarea output-ului.

Acest tabel conține datele esențiale pentru analiza regresiei.

Constanta este 12,716. Acesta este punctul în care linia de regresie intersectează axa verticală.

Coeficientul nestandardizat Coeficientul standardizat Intervalul de

al regresiei este – 1,049. al regresiei este – 0,845. încredere ia valori

Acesta semnifică faptul că, Acesta este mai mult sau de la -1,591 la -0,507.

pentru fiecare creștere cu 1 mai puțin coeficientul de

a variabilei “matematică” corelație Pearson dintre

valoarea variabilei “muzică” abilitățile muzicale și

descrește cu – 1,049. cele matematice.
În acest tabel, B este panta liniei de regresie (în SPSS fiind denumită coeficient de regresie nestandardizat).

Intervalul de încredere de 95% pentru acești coeficienți este de la -1,59 la -0,50. Intervalul de încredere de 95% arată intervalul pantelor de regresie în care putem fi siguri într-o proporție de 95% că panta pentru populație se va găsi.

Cota denumită „Beta” are valoarea -0,845. Aceasta este de fapt corelația Pearson între cele două variabile.

Regresia simplă – o variabila dependenta si una independent

VIII.4. Scatterplot-ul de regresie.
Atunci când se realizează o regresie este recomandabilă cercetarea diagramei scatter pentru cele două variabile.

Pasul 1:

Se selectează:

„Graphs”

„Legacy Dialog”

„Scatter/Dot”

Pasul 2:

Se selectează „define”; „simple” este deja selectat.

Pasul 3:

Pentru a avea variabila „muzică” ca axă verticală, se selectează și apoi se apasă butonul ►de lângă căsuța „Y Axis”

Pentru a avea variabila „matematică” ca axă orizontală, se selectează apoi se apasă butonul ◄ de lângă căsuța „X Axis”.

Se apasă „OK”

Pasul 4:

Pentru a încadra o linie de regresie în scatterplot, se dă dublu clic oriunde în interior și se va deschide „Chart Editor”.

Se selectează „Elements” și

„Fit Line at Total”.

VIII.5. Interpretarea output-ului.

Punctele de pe scatterplot sunt apropiate de linia de regresie. În plus, punctele par să formeze o linie dreaptă (relația nu este curbilinie).

În regresie, axa verticală este variabila-criteriu sau dependentă (în cazul nostru = muzica).

Linia de regresie are o pantă negativă în acest caz; de exemplu: de la stânga sus spre dreapta jos. În consecință B are valoare negativă.

În regresie axa orizontală este variabila predictor sau independentă (în cazul nostru „matematică”).

* Linia de regresie oblică, de la stânga sus spre dreapta jos, indică o relație negativă între cele două variabile.

Punctele par relativ apropiate de line, ceea ce sugerează că beta (corelația) ar trebui sa fie un număr mare (negativ) și că intervalul de încredere este relativ mic.

Regresia liniară – relatia dintre cele doua variabile poate fi descrisa printr-o dreapta în cadrul norului de puncte.

VIIII.6. Raportarea output-ului.

Interpretarea diagramei se poate realiza în felul următor:

„Diagrama scatterplot a relației dintre abilitățile matematice și muzicale sugerează o relație liniară negativă între cele două variabile. Este posibilă predicția cu acuratețe a abilității muzicale a unei persoane cunoscând abilitatea sa matematică.

IX. Eroarea standard

_________________________________________________________________________________________________________________

Eroarea standard este un indice pentru variabilitatea mediilor mai multor eșantioane extrase din populație; cu alte cuvinte este media măsurii cu care media eșantioanelor diferă față de media populației din care au fost extrase.

Eroarea standard poate fi folosită ca un pas intermediar în alte tehnici statistice, cum ar fi Testul t și este un concept important pentru calculul intervalelor de încredere.

Calcularea erorii standard estimate pentru medie este ilustrată cu un set de șase scoruri ale stimei de sine, prezentate în tabelul următor.

IX. 1. Introducerea datelor.

Pasul 1:

Se introduc datele în „Data Editor”.

Se etichetează variabila „Stima”.

IX. 2. Eroarea standard estimată a mediei.

Pasul 1:

Se selectează:

„Analyze”

„Descriptive Statistics”

„Descriptive…”

Pasul 2:

Se selectează „stima de sine” și apoi

se apasă butonul ◄pentru a

introduce variabila „Stima de sine”

în „variable(s)”.

Se selectează „Options…”

Pasul 3:

Se selectează „ S-E mean”.

Se selectează „continue”.

Se apasă „OK” din ecranul anterior care reapare.

IX. 3. Interpretarea output-ului.

Eroarea standard (estimată) pentru medie a acestui eșantion este 0,577. este o indicație a mediei cu care mediile eșantioanelor diferă de media populației din care au fost extrase.

testul oferă valoarea erorii standard a mediilor eșantioanelor ca fiind 0,58 (suma este rotunjită la două zecimale) aceasta fiind valoarea medie cu care mediile eșantioanelor (N=6) diferă față de media populației.

tabelul include și alte informații cum ar fi media (5,00), abaterea standard estimată a populației bazată pe acest eșantion, valorile minime și maxime ale datelor.

ultima coloană oferă abaterea standard (estimată) a celor șase scopuri, care este 1,41.

X. Testul t.

Compararea a două eșantioane

de scopuri corelate/relaționate.

_________________________________________________________________________________________________________________

Testul t este folosit pentru evaluarea semnificației statistice a diferenței dintre mediile pentru două seturi de scoruri. Cu ajutorul testului t se pune în evidență dacă valoarea medie pentru un set de scoruri diferă în medie de valoarea medie pentru alt set de scoruri.

Testul t are două variante:

prima variantă este folosită atunci când cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eșantion sau când coeficientul de corelație între cele două seturi este mare – testul t pentru eșantioane perechi;

a doua variantă a testului t este utilizată în momentul în care două seturi diferite de valori provin din grupe diferite de participanți. – testul t pentru eșantioane independente.

* Testul t pentru eșantioane perechi este optim dacă distribuția diferențelor dintre cele două seturi de valori se prezintă (aproximativ) sub formă de clopot (atunci când distribuția este normală). Dacă distribuția este foarte diferită de forma de clopot ar trebui luată în considerare utilizarea unei tehnici statistice relaționate nonparametrică pentru eșantioane perechi, cum ar fi testul de perechi Wilcoxon.

Procesarea unui Test t este ilustrată cu datele din tabelul următor unde sunt prezentate numărul de cuvinte pe care aceeași copii le-au verbalizat cu mamele lor la 18 luni și la 24 luni.

Numărul de cuvinte verbalizate într-un minut la vârste diferite.

X.1. Introducerea datelor.

Pasul 1:

În „Variable View” din „Data Editor” se etichetează primul rând cu „optsprezece” și al doilea rând cu „douăzeci și patru”.
* Se înlătură cele două zecimale.

Pasul 2:

În „Data View” din „Data Editor”

se introduc datele în primele două

coloane.

X.2. Testul t pentru eșantioane perechi

Pasul 1:

Se selectează:

„Analyze”

„Compare Means”

„Paired-Samples T Test…”
Pasul 2:

Se selectează „optsprezece”

și se pune această variabilă

lângă eticheta „Variable1”

sub „Curent Selections”.

Se selectează „douăzeci și

patru” și se pune această

variabilă lângă eticheta

„Variable2” sub „Curent

Selections”.

Se apasă butonul ►pentru a

pune aceste două variabile

în lista variabilelor relaționale.

Se apasă „OK”.

X.3. Interpretarea output-ului.

Primul tabel arată media, numărul de cazuri și abaterea standard pentru cele două grupuri. Media pentru „optsprezece” este 3,13 și abaterea standard este 1,126.

Al doilea tabel arată gradul în care cele două seturi de valori sunt corelate. Corelația dintre ele 0,94. Aceasta este o corelație mare, nivelul de semnificație fiind de 0,00.

Primele trei coloane care conțin cifre sunt componentele fundamentale ale calcului unui Test t relaționat. Media de -2,000 este de fapt diferența dintre mediile pe 18 și 24 luni, deci în realitate este media diferenței. Valoarea lui t este bazată pe această medie a diferenței (-2,00), divizată cu eroarea standard a mediei (0,267). Calculul oferă valoarea lui t (-7,483).

X.4. Raportarea output-ului.

Rezultatele obținute ar putea fi prezentate astfel: „Media numărului de cuvinte verbalizate la 18 luni diferă semnificativ de media cuvintelor verbalizate la 24 de luni.

XI. Testul t.

Compararea a două eșantioane de

scoruri necorelate/nerelaționate.

_________________________________________________________________________________________________________________

Atunci cînd o investigație de tip statistic se efectuează pe un eșantion, orice rezultat obținut are o valoare relativă, în sensul că datele respective nu numai că nu coincid cu cele referitoare la populație, dar nici măcar nu se poate ști cu certitudine care este diferența dintre cele două genuri de date, de vreme ce starea populației este, de regulă, necunoscută. Teoria matematică a probabilităților oferă însă proceduri pentru evaluarea rezultatelor studiilor selective, permițînd o estimare, în termeni de probabilitate, a marjei maxime de eroare ce se poate comite prin utilizarea mărimilor din eșantion în locul celor care caracterizează populația.

Testul t este în esență o procedură de testare a semnificației diferenței dintre două medii.

Ca urmare, el este potrivit atunci când variabila dependentă este măsurată pe scală cantitativă (interval-raport). Distribuția teoretică de referință (distribuția de nul) este cea normală, pentru eșantioane mai mari de 30 de subiec ți, și distribuția t (Student), pentru eșantioane mai mici de 30 de subiecți. Chiar dacă formulele de calcul sunt diferite, forma de prezentare a rezultatelor și ra ționamentul decizional sunt similare pentru ambele situații.

Testul t pentru eșantioane independente este utilizat pentru a calcula dacă mediile pentru două seturi de variabile sunt diferite semnificativ una față de cealaltă.

* Testul t pentru eșantioane independente este cel mai des folosit.

Testul t pentru eșantioane independente este utilizat atunci când cele două seturi de variabile provin din două eșantioane diferite de oameni.

Procesarea unui Test t pentru eșantioane independente este ilustrată cu datele din tabelul următorcare arată valorile la un test de emotivitate pentru 10 copii care provin din familii biparentale și 10 copii care provin din familii monoparentale. Scopul analizei este de a aprecia dacă valorile emotivității sunt diferite la copii care provin din familii cu doi părinți față de copii care provin din familii monoparentale.

XI.1. Introducerea datelor

Pasul 1:

În „Variable View” din „Data Editor”, se etichetează pe rând „Familii”. Aceasta va defini cele două tipuri de familii.

Se etichetează al doilea rând

„Emotivitate” (aici vor fi introduse

rezultatele la testul de emotivitate).
Se înlătură cele două zecimale.

Pasul 2:

În „Data View” din „Data Editor” se introduc valorile pentru cele două variabile în primele două coloane.

* Se observă că sunt două coloane de date: A doua coloană conține cele 20 de valori ale testului de emotivitate de la ambele grupe de copii. Datele nu sunt păstrate separat pentru cele două grupe; valorile 1 din prima coloană indică copii proveniți din familiile biparentale și valorile 2 indică copii proveniți din familiile monoparentale. Astfel, este utilizată o singura variabilă dependentă (în cazul nostru „emotivitatea”) și altă coloană pentru variabila independentă (familia). Cu alte cuvinte, fiecare rând în parte reprezintă un anumit copil și variabilele sale dependente și independente sunt introduse separat în „Data Editor”.

XI.2. Efectuarea Testului t pentru eșantioane independente.

Pasul 1:

Se selectează:

„Analyze”

„Compare Means”

„Independent Samples T test…”

Pasul 2:

Se selectează „Emotivitate” și

apoi se apasă butonul ► pentru

a introduce această variabilă în

lista variabilelor de test.

Se selectează „Familie” și apoi

se apasă butonul ◄pentru a

introduce această variabilă în

căsuța „Grouping Variable”.

Se selectează „Define Groups…” pentru a defini cele două grupuri.

Pasul 3:

Se introduce:

valoarea 1 (codul pentru familiile

biparentale) lături de eticheta

„Group

valoarea 2 (codul pentru familiile

monoparentale) alături de eticheta

„Group .

Se selectează „Continue”

Se apasă „OK” din ecranul precedent, care reapare.

XI.3. Interpretarea output-ului.

Primul tabel arată , pentru fiecare grup în parte, numărul de cazuri, media și abaterea standard. Media pentru familiile biparentale este 13,00. După cum se observă există o diferență între cele două tipuri de familii, dar, întrebarea este dacă mediile diferă semnificativ.

Valoarea lui t este media diferenței (3,500) divizată cu eroarea standard a diferenței (1,493), diviziune ce produce valoarea 2,345.

Dacă valoarea semnificației pentru Pentru varianțe egale, t este 2,345,

Testul Levene este mai mare de 0,05, care la 18 grade de libertate este

lucru care se întâmplă aici (0,642) semnificativ la 0,031 pentru nivelul

se folosește informația de pe acest two-tailed.

prim rând.

Dacă valoarea semnificației pentru

Testul Levene este mai mică de 0,05,

se folosește informația de pe al doilea

rând (al doilea rând oferă cifrele pentru

cazul în care varianțele sunt diferite

semnificativ).

XI.4. Raportarea output-ului.

Rezultatele obținute se pot raporta astfel: „Media pentru valorile testelor de emotivitate ale copiilor ce provin din familii cu doi părinți este semnificativ mai mare decât cea a copiilor proveniți din familiile cu un singur părinte”.

Dacă se preferă folosirea intervalelor de încredere , se poate scrie: „Diferența dintre valorile testelor de emotivitate ale copiilor ce provin din familii cu doi părinți (M=13,00, SD=3,55) și cei proveniți din familii cu un singur părinte (M=9,50, SD=3,10) este de 3,50. Intervalul de încredere de 95% pentru această diferență este de la 0,36 la 6,63.Deoarece intervalul nu conține punctul 0,00 diferența este statistic semnificativă la nivelul de semnificație two-tailed de 5%.

XI.5. Alegeți răspunsul corect

1. Independent – Samples T Test se aplică în cazul:

a. aceluiași eșantion

b. eșantioanelor independente

c. eșantioanelor dependente

2. Independent – Samples T Test testează:

a. dacă mediile a două grupe sunt egale;

b. dacă mediile a două grupe diferă;

c. dacă se compară mediile pentru un singur grup observat la momente diferite;

3. Testul „t” se folosește pentru:

a. compararea a două seturi de date pentru identificarea diferențelor;

b. identificarea predictorilor pentru o variabilă numerică;

c. compararea datelor de frecvență.

4. One sample T Test este un procedeu prin care:

a. se compară mediile pentru un singur grup observat în momente diferite

b. se testează dacă mediile a două grupe sunt egale

c. se testează dacă media unei variabile este egală cu o constantă specificată

b. se testează dacă mediile a două grupe diferă

5. Paired – Samples T test:

a. testează dacă mediile a două grupe sunt egale

b. testează dacă media unei variabile este egală cu o constantă specificată

c. compară mediile pentru un singur grup observat în momente diferite

d. compară mediile pentru mai multe medii observate în momente diferite

6. Testul t pentru eșantioane independente este utilizat atunci când:

a. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eșantion

b. coeficientul de corelație între cele două seturi este mare

c. cele două seturi de variabile provin din două eșantioane diferite de oameni.

7. Testul t pentru eșantioane perechi este utilizat atunci când:

a. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eșantion

b. coeficientul de corelație între cele două seturi este mare

c. cele două seturi de variabile provin din două eșantioane diferite de oameni.

8. Testul t:

a. este folosit pentru evaluarea semnificației statistice a diferenței dintre mediile pentru două seturi de scoruri;

b. este potrivit atunci când variabila dependentă este măsurată pe scală cantitativă (interval-raport).

c. este utilizat pentru a calcula dacă mediile pentru două seturi de variabile sunt diferite semnificativ una față de cealaltă.

XI.6. Răspunsuri corecte

b. eșantioanelor independente;

2. a. dacă mediile a două grupe sunt egale;

. compararea a două seturi de date pentru identificarea diferențelor;

4. c. se testează dacă media unei variabile este egală cu o constantă specificată;

5. c. compară mediile pentru un singur grup observat în momente diferite

6. c. cele două seturi de variabile provin din două eșantioane diferite de oameni.

. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eșantion

b. coeficientul de corelație între cele două seturi este mare

. este folosit pentru evaluarea semnificației statistice a diferenței dintre mediile pentru două seturi de scoruri;

b. este potrivit atunci când variabila dependentă este măsurată pe scală cantitativă (interval-raport).

c. este utilizat pentru a calcula dacă mediile pentru două seturi de variabile sunt diferite semnificativ una față de cealaltă.

XII. Testul Chi-Square.

Diferențe între frecvențele eșantioanelor.

_________________________________________________________________________________________________________________

În general Testul chi-square este folosit pentru evaluarea existenței unei diferențe semnificative între două eșantioane formate din date de frecvență (date nominale). Acesta, analizează tabelele de asociere sau contingență pe baza a două variabile categoriale nominale.

*Testul chi-square analizează frecvențe. Niciodată acestea nu trebuie să fie transformate în procente pentru a fi introduse în SPSS, deoarece vor da rezultate eronate atunci când se vor calcula valoarea și semnificația chi-square.

* O analiză chi-square trebuie să includă datele fiecărui individ o singură dată, astfel încât frecvențele totale să fie egale cu numărul persoanelor folosite în analiză.

Tabel 1. Relația dintre site-urile accesate și genul biologic.

XII.1. Introducerea datelor din tabelul anterior

folosind procedura „Weighing cases”.

Procesarea Testului chi-square folosind două sau mai multe eșantioane este exemplificată cu datele din tabelul anterior, care arată care dintre cele trei tipuri de site-uri este preferat de către un eșantion de 119 adolescenți de ambele sexe.

Pasul 1:

În meniul „Variable View” Se îndepărtează cele Se etichetează valorile

din „Data Editor” se etichetează două zecimale. „gen” și „program”.

primele trei coloane cu „gen

biologic”, „Site” și „Frecvență”.

Pasul 2:

Se introduc valorile adecvate în meniul „Data View” din meniul „Data Editor”. Fiecare rând reprezintă una dintre cele șase celule din tabelul prezentat anterior.

Paul 3:

Pentru a pondera aceste celule

se selectează:

„Data”

„Weight Cases…”

Pasul 4:

Se selectează „Frecvența”, „Weight

cases by” și apoi se apasă butonul

◄.

Se apasă „OK”.

XII.2. Introducerea datelor din tabelul 1 caz cu caz.

Se introduc valorile pentru

cele două variabile în fiecare

dintre cele 119 cazuri.

XII.3. Efectuarea Testului chi-square pe baza tabelului 1.

Pasul 1:

Se selectează:

„Analyze”

„descriptives statistics”

„Crosstabs…”(tabele de asociere)

Pasul 2:

Se selectează „Gen” și se

apasă butonul ► pentru

„Row(s)”: pentru a-l

introduce în caseta respectivă.

Se selectează „Site” și se apasă

butonul ◄ pentru „Column(s)”:

pentru a-l introduce în caseta

respectivă.

Se selectează „Statistics…”

Pasul 3:

Se selectează „Chi-square”.

Se selectează „Continue”.

Pasul 4:

Se selectează „Cells..”

Pasul 5:

În secțiunea „Counts” se selectează

„Expected”. Se selectează

„Unstandardized” în secțiunea

„Residuals”. Se selecteaze „Continue”,

apoi se apasă „OK în ecranul anterior

care reapare.

* Termenul „rezidual” se referă la diferențe.

XII.4. Interpretarea output-ului pentru Testul chi-square.

Acest al doilea tabel din output indică frecvența (Count), frecvența așteptată (Expected Count” și diferența (Residual) dintre cele două pentru fiecare dintre cele șase celule ale tabelului.

De exemplu: Frecvența sau numărul de fete care spun că preferă site-rile de matrimoniale este de 17, iar numărul anticipat de probabilitate este 21,8, diferența dintre cele două valori fiind de – 4,8.

Al treilea tabel, și ultimul indică valoarea coeficientului (Pearson) chi-square (13,518), gradele de libertate (2) și semnificația two-tailed (0,001). Din moment ce această valoare este mai mică de 0,05, coeficientul chi-square este semnificativ.

Al doilea tabel indică frecvențele observate și cele așteptate ale cazurilor și diferența (valoarea reziduală) dintre acestea pentru fiecare celulă. Frecvența observată (numită „Count”) este prezentată prima, apoi frecvența așteptată (numită „Expected Count”. Frecvențele observate sunt întotdeauna numere întregi, astfel încât să fie ușor de localizat.

Coloana finală din tabel etichetată „Total” conține numărul de cazuri din respectivul rând, urmat de numărul așteptat de cazuri din tabel.

Astfel primul rând are 60 de cazuri, urmat de numărul așteptat de cazuri din tabel. Astfel, primul rând are 60 de cazuri, număr care va fi identic numărului de cazuri așteptate (adică 60).

În mod similar, rândul final din acest tabel (etichetat „Total) prezintă mai întâi numărul de cazuri din respectiva coloană urmat de numărul așteptat de cazuri din tabel pentru coloana respectivă. Astfel, prima coloană are 44 de cazuri, număr care ca fi întotdeauna egal cu numărul așteptat de cazuri (adică 44,0).

Valoarea chi-square, gradul său de liberate și nivelul său de semnificație sunt afișate în al treilea tabel care începe cu „Pearson” (cel care a elaborat acest test).

Valoarea chi-square este de 13,518, care, rotunjită la un număr cu două zecimale, devine 13,52. Gradul său de libertate este 2, iar probabilitatea two-tailed exactă este 0,001.

Sub acest tabel se mai poate vedea și mărimea „minimum expected count” a oricărei celule din tabel, care este 13,88 pentru ultima celulă (fetele care preferă site-urile cu muzică). Dacă diferența minimă așteptată este mai mică decât 5.0, atunci trebuie să se acorde foarte multă atenție Testului chi-square.

* Dacă se folosește un tabel 2×2 de tip chi-square și apar frecvențe anticipate reduse, este recomandat să se folosească testul Fisher, pe care aplicația SPSS îl include în output în astfel de situații.

XII.5. Raportarea output-ului pentru Testul chi-square.

Există două modalități de descriere a rezultatelor.

* Pentru o persoană neexperimentată aceste două posibilități de interpretare pot părea foarte diferite, dar, practic, ele înseamnă același lucru.

Rezultatele se pot descrie astfel: „A existat o diferență semnificativă între frecvențele observate și cele așteptate în cazul adolescenților băieți și fete

în ceea ce privește preferința lor pentru cele trei tipuri de site-uri ( χ2 = 13,51. DF = 2, p = 0,001)”.

O altă posibilitate de interpretare a rezultatelor obținute ar putea fi:

„ Există o asociere semnificativă între genul biologic și tipul de site preferat ( χ2 = 13,51. DF = 2, p = 0,001)”.

Raportarea și direcția rezultatelor se poate face astfel: „ Fetele tind mai mult decât băieții să prefere site-urile cu anunțuri (de toate genurile) și preferă mai puțin site-urile despre matrimoniale sau pe cele cu muzică”.

XIII. Recodificarea variabilelor.

Aplicația SPSS poate recodifica valori în mod rapid și cu ușurință, ceea ce îi oferă cercetătorului o mare libertate de recodificare a datelor.

*Nu se modifică variabilele decât în cazul în care este absolut sigur că se dorește modificarea permanentă a datelor originare.

Scorurile abilităților muzicale și matematice

obținute de către un număr de 10 copii

* Scorurile abilităților muzicale și matematice sunt aceleași care au fost prezentate anterior în capitolul VIII.1.

Dorim să se realizeze corelația dintre valorile abilităților muzicale și a celor matematice, în cazul copiilor mici și a celor mari. Pentru a realiza această corelație este important să se stabilească numărul de grupe de vârstă dorite. În acest caz se vor alege două grupe de vârstă: copii mai mici de 10 ani și copii mai mari de 10 ani.

XIII.1. Recodificarea rezultatelor.

Pasul 1:

Se introduc datele așa cum este prezentat în tabelul alăturat.

(Pașii de introducere a datelor sunt prezentați în capitolele anterioare).

Pasul 2:

Se selectează „Transform”, „recode”

Și „Into Different Variables”

Pasul 3:

Se selecteaă „Vârstă” și se apasă butonul ◄ pentru a introduce „Vârsta” în caseta „Numeric Variable – Output variable”.

Se introduce numele noii variabile.

Se selectează „Change” pentru a adăuga acest nume Se selectează „Old and New values”.

nou în caseta „Numeric variable

– Output Variable”.

Pasul 4:

Se selectează „Lowest
through” și se scrie 9 în caseta alăturată.

Se selectează „Value” din meniul „new value” și se scrie 1 în căsuța alăturată.

Se selectează „Add” și se introduce „lowest throught 9→1 „ în caseta „Old→New”.

Pasul 5:

Se selectează „Range: through highest” și se scrie 10 în caseta de lângă el.

Se selectează „value” și se scrie 2 în caseta alăturată.

Se selectează „Add” și se introduce „10 through Highest→2” în caseta „Old→New”. Se apasă „OK” în ecranul care va reapărea.

Pasul 6:

Noua variabilă și valorile sale sunt afișate în meniul „Data View”.

1 semnifică copii cu vârste mai mici de 10 ani

2 semnifică copii cu vârste mai mari de 10 ani.

Pentru o astfel de recodificare se deschide fereastra Recode into Different Variables (din meniul Transform comanda Recode) în care:

se selectează variabila pe care dorim să o recodificăm din lista variabilelor din partea stângă și se mută în lista variabileor de recodat;

se scrie numele noii variabile în caseta Name din zona Output Variable;

se scrie în caseta Label eticheta noii variabile;

se acționează butonul de comandă Change pentru a se realiza modificarea.

Pentru a defini categoriile variabilei numerice acționăm butonul de comandă Old and New Values ce are ca efect deschiderea unei ferestre de dialog în care pentru a schimba o valoare particulară într-o valoare nouă se introduce valoarea veche în caseta Old Value și valoarea nouă în caseta New Value și se acționează butonul Add.

De regulă se schimbă o valoare reală cu altă valoare reală. În acest scop selectăm butonul de opțiuni Range. Casetele de editare sunt folosite pentru a stabili limita inferioară și respectiv limita superioară a intervalului dorit. Apoi se selectează butonul de opțiuni Value din zona New Value în care se introduce noua valoare și acționăm butonul Add.

Prin clic pe butonul de comandă Continue se revine în fereastra Record into Different Variables în care acționăm OK pentru recodificarea variabilei.

XIII.2. Alegeți răspunsul corect

1. Comanda RECODE permite:

a. recodificarea într-o variabilă diferită sau în aceeași variabilă;

b. tranformarea unei variabile prin divizarea valorilor acesteia într-un număr mai mare de categorii;

c. combinarea valorilor acestei variabile cu scopul creării unei alte serii;

2. Comanda RECODE se găsește în meniul:

a. transform/recode/into different variables;

b. transform/recode/into same variables;

c. ambele variante de mai sus.

3. Chi – Square

a. testează egalitatea a două sau mai multe proporții

b. testează egalitatea unei proporții cu o valoare specificată

c. testează egalitatea mediilor a două eșantioane independente

d. testează egalitatea mediilor a două eșantioane perechi

4. Pentru recodificarea în aceeași variabilă se selectează:

a. transform/recode/into different variables;

b. transform/recode/into same variables;

c. nicio variantă de mai sus.

5. Pentru recodificarea într-o variabilă diferită se selectează:

a. transform/recode/into different variables;

b. transform/recode/into same variables;

c. nicio variantă de mai sus.

XIII.3. Răspunsuri corecte

. recodificarea într-o variabilă diferită sau în aceeași variabilă;

2. c. ambele variante de mai sus.

. testează egalitatea a două sau mai multe proporții

4. b. transform/recode/into same variables;

. transform/recode/into different variables;

XIV. Calculul variabilelor noi.

_________________________________________________________________________________________________________________

Calculul variabilelor noi permite adunarea, scăderea, etc. a valorilor câtorva variabile pentru a obține o nouă variabilă.

Exemplu: Se dorește să se adune câteva întrebări dintr-un chestionar, pentru a obține un indice general al ceea ce măsoară chestionarul.

Atunci când sunt măsurate variabilele psihologice, se folosesc mai multe întrebări pentru a măsura mai mult sau mai puțin același lucru.

De exemplu, următoarele afirmații pot fi folosite pentru evaluarea satisfacției profesională:

În general mă bucură profesia mea.

Uneori stresul de la serviciu devine insuportabil.

Unii colegi sunt enervanți câteodată.

Viitorul pare promițător la locul de muncă.

Participanților li se cere să afirme în ce măsură sunt de acord cu fiecare dintre aceste afirmații, pe următoarea scală de la 1 la 4:

1. întru totul de acord; 2. de acord;

3. dezacord; 4. total dezacord.

Acești itemi se pot folosi pentru a determina nivelul de satisfacție profesională a angajaților, prin adunarea răspunsurilor date tuturor celor patru afirmații.

Deoarece este nevoie de scoruri mari pentru a indica satisfacția profesională, se va inversa evaluarea, astfel:

4. total de acord; 3. de acord;

2. dezacord; 1. total dezacord.

XIV.1. Procedura unei variabile noi.

Pasul 1:

Se scrie un nume pentru noua variabilă în caseta de sub „Target Variable” (ex. scor total.

Se scrie sau se selectează termenii expresiei și se introduc în caseta „Numeric Expression”.

Se apasă „OK”.

Se selectează „Paste” pentru a salva această procedură sub formă de sintaxă.

Pasul 4:

Pentru a salva această procedură sub formă de fișier de sintaxă, se selectează „Paste” în caseta principală. Această comandă de sintaxă va apărea în fereastra „Syntax”.

XV. Testele rangurilor.

Statistici nonparametrice.

_________________________________________________________________________________________________________________

Testele nonparametrice sunt folosite atunci când nu este îndeplinită condiția ca scorurile fiecărei variabile să fie cât de cât normal distribuite (în formă de clopot). Aceste teste fac mai puține presupuneri referitoare la caracteristicile populației de la care provin datele, trăsătură care nu este caracteristică testelor parametrice (cum ar fi Testul t). Metodele statistice nonparametrice nu testează diferențele dintre medii, deoarece acestea folosesc scoruri transformate în ranguri. De obicei, prin aceste metode se verifică dacă rangurile dintr-un grup sunt mai mari sau mai mici decât rangurile din celălalt grup.

În acest capitol vom vorbi despre Testul semnului și Testul Wilcoxon pentru date corelate (eșantioane perechi). Cu alte cuvinte, aceste teste sunt echivalentele nonparametrice ale Testului t pentru eșantioane perechi.

Testul U Mann-Witney se folosește pentru date nerelaționate, acesta fiind echivalentul nonparametric al Testului pentru eșantioane independente.

Procesarea a două teste nonparametrice pentru scoruri relaționate este exemplificată folosind datele din tabelul următor, care a fost folosit și în capitolul X și care indică numărul de cuvinte pe care aceeași copii le-au verbalizat cu mamele lor la 18 luni și la 24 luni.

Numărul de cuvinte verbalizate într-un minut la vârste diferite.

XV.1. Scoruri relaționate: testul semnului.

Pasul 1:

În „Data View” din „Data Editor”

se introduc datele în primele două

coloane.

Pasul 2:

Se selectează:

„Analyze”

„Nonparametric Tests”

„Legacy dialog”

„2 Related Samples…”

Pasul 3:

Se selectează „Optsprezece”

și „douăzecisipatru” și se

apasă butonul ◄ pentru a

introduce aceste două

variabile în caseta „Test Pair

(s) List”.

Se deselectează „Wilcoxon”.

Se selectează „Sign”.

Se apasă „OK”.

XV.2. Interpretarea output-ului pentru testul semnului.

Se poate ignora primul dintre cele două tabele care indică numărul de diferențe negative (0), pozitive (8) și inexistente (0) în ceea ce privește numărul de cuvinte verbalizate la cele două vârste.

Al doilea tabel indică nivelul de semnificație al acestui test. Probabilitatea two-tailed este de 0,008 ceea ce este semnificativ la nivelul de 5%.

XV.3. Raportarea output-ului pentru testul semnului.

Rezultatele obținute pot fi raportate astfel: „Există o schimbare semnificativă la nivelul numărului de cuvinte verbalizate de la 18 luni la 24 de luni (Testul semnului: N=0,008).

XV.4. Scoruri relaționate: testul Wilcoxon.

Testul Wilcoxon reprezintă opțiunea predefinită în caseta de dialog a testelor cu două eșantioane perechi. Dacă s-a deselectat anterior, se selectează din nou. Se apasă „OK” pentru a obține output-ul Testului Wilcoxon.

XV.5. Interpretarea output-ului pentru Testul Wilcoxon.

Se poate ignora primul dintre cele două tabele de output. Acestea indică numărul de diferențe negative (0), pozitive (8) și inexistente (0) în ceea ce privește datele ordonate după cele două vârste, și media și suma catalogate negative și pozitive. Valorile pentru „două zeci și patru „ de luni sunt mai mari decât cele pentru „optsprezece” luni.

Al doilea tabel indică nivelul de semnificație al acestui test. În loc să folosească tabelul valorilor critice, computerul utilizează o formulă care stabilește o conexiune cu distribuția Z. Scorul Z este de – 2,558, care are o probabilitate two-tailed de 0,011. Aceasta înseamnă că diferențele dintre cele două variabile sunt semnificative din punct de vedere statistic la un nivel de 5%.

XV.6. Raportarea output-ului pentru Testul Wilcoxon.

Rezultatele obținute pot fi raportate astfel: „Există o diferență semnificativă între numărul de cuvinte verbalizate de copii între 18 și 24 de luni (Wilcoxon: N=8, z =2,56, two-tailed p = 0,011)”.

XV.7. Scoruri nerelaționate: Testul U Mann-Whitney.

Pentru procesarea unui test nonparametric pentru scoruri necorelate, vom folosi datele din tabelul următor, care indică scoruri ale emotivității obținute de 10 copii care provin din familii biparentale și 10 copii care provin din familii monoparentale.

Pasul 1:

– este același ca și cel prezenta la capitolul XI.

Pasul 2:

Se selectează:

„Analyze”

„Nonparametric tests”

„Legacy dialog”

„2 Independent Samples…

Pasul 3:

Se selectează „Emotivitate” și

se apasă butonul

►pentru a introduce parametrul

„Emotivitate” în caseta „Test

Variable List”.

Se selectează „Familie” și se

apasă butonul ◄pentru a

introduce „Familie” în caseta

„Grouping Variables”.

Se selectează „Define Groups…”

Pasul 4:

Se scrie 1 (pentru un singur părinte) în c aseta de lângă „Group .

Se scrie 2 (pentru 2 părinți) în caseta de lângă „Group .

Se selectează „Continue”.

Se apasă „OK” din ecranul anterior care va reapărea.

XV.8. Interpretarea output-ului pentru testul U Mann-Whitney.

Se poate ignora primul dintre cele două tabele de output. Acest tabel indică faptul că rangul mediu dat parametrului „Emotivitate” pentru primul grup (adică valoarea 2) este 13,15, iar rangul mediu pentru al doilea grup (adică valoarea 1) este de 7,85. Aceasta înseamnă că valorile din grupul 2 (biparentale) au tendința să fie mai mari decât cele din grupul 1 (monoparentale).

Al doilea tabel indică statistica de bază mann-Whitney, valoarea U fiind de 23,500, ceea ce este semnificativ din punct de vedere statistic la un nivel de 0,043.

Computerul a listat și un scor Z de -2,011, care este semnificativ la nivel de 0,044.

Aceasta este valoarea Testului Mann-Whitney atunci când se aplică o corecție pentru ranguri înrudite. După cum se poate vedea, aceasta a modificat nivelul de semnificație doar marginal, de la 0,44 la 0,44.

XV.9 Raportarea output-ului pentru Testul U Mann-Whitney.

Rezultatele obținute în urma acestei analize se pot raporta astfel: „ Testul U Mann-Whitney a concluzionat că scorurile emotivității la copii din fa,iliile cu doi părinți sunt semnificativ mai mari decât la cei din familiile cu un singur părinte (U=23,5, N1,2=10, p two-tailed p= 0,044)”.

XVI. Analiza de varianță (ANOVA).

Introducere în metoda one-way ANOVA

cu scoruri nerelaționate sau necorelate.

_________________________________________________________________________________________________________________

Analiza de varianță cu scoruri nerelaționate/necorelate indică măsura în care câteva (două sau mai multe) grupuri au medii foarte diferite.

*Grupurile diferite aparțin variabilei independente iar valorile numerice corespund variabilei dependente.

Analiza de varianță calculează variația dintre scoruri și pe cea dintre mediile eșantioanelor.

One – way ANOVA este folosit pentru testare pentru diferențele între două sau mai multe grupe independente. ANOVA este utilizat pentru a testa diferențe între cel puțin trei grupuri, deoarece cele două grupuri de caz pot fi acoperite de u un T-test.

De fapt, testul t independent este un tip special de ANOVA simpla în care sunt implicate doar doua grupe. ANOVA simpla permite evaluarea ipotezei nule între mediile a doua sau mai multe serii de date cu restricția ca acestea sa fie trepte ale aceleiași variabile independente.

ANOVA simpla permite compararea simultana a trei sau mai multe grupe menținând nivelul  la valoarea dorita, de maxim 0,05.

Procesarea analizei one-way de varianță cu scoruri nerelaționate este exemplificată folosind datele din tabelul următor, care indică rezultatele obținute de către diferiți participanți în condiții diferite. Este vorba despre un studiu asupra efectului unor tratamente hormonale și placebo asupra depresiei.

Astfel, medicamentul este variabila independentă și depresia este variabila dependentă.

Date studiu

XVI.1. Metoda one-way ANOVA pentru eșantioane independente.

Pasul 1:

Se introduc datele.

Se codifică cele trei

condiții cu valorile 1, 2, 3.

Se etichetează „Hormon ,

„Hormon și „Placebo”.

Pasul 2:

Se selectează:

„Analyze”

„Comparea Means”

„One-Way ANOVA”.

Pasul 3:

Se selectează „depresie” și se

apasă butonul ►de lângă caseta

„Dependent List” – pentru a

introduce parametrul în casetă.

Se selectează „Condiție” și se

apasă butonul ◄ de lângă caseta

„Factor” – pentru a introduce

parametrul acolo.

Se selectează „Options…

Pasul 4:

Se selectează metodele statistice „descriptive”

și „Homogenity of variance test”.

Se selectează „Continue…”.

Se apasă „OK” din ecranul anterior, care va

reapărea.

XVI.2. Interpretarea output-ului.

Primul tabel oferă diferite statistici descriptive, cum ar fi numărul de cazuri, media și abaterea standard în cele trei condiții și pe eșantionul total.

Al doilea tabel oferă rezultatele Testului Levene al similarității varianțelor. Acest test nu este semnificativ deoarece are o semnificație de 0,441.

Al treilea tabel indică rezultatele analizei de varianță. Raportul F este semnificativ la nivel de 0,00, acesta fiind mai mic decât 0,05.

Raportul F se calculează prin împărțirea „sum of square” (suma pătratelor abaterilor de la medie) dintre grupe, este împărțită suma pătratelor de la media din interiorul grupelor (sum of squares groups)m ceea ce dă un Raport F de 13,941 (20,333/0,889 = 13,941).

Aceasta înseamnă că există o diferență semnificativă între cele trei grupuri.

XVI.3. Raportarea ouput-ului.

Rezultatele obținute pot fi raportate astfel: „Per total, efectul tratamentului cu medicamente a fost semnificativ (F2,6 = 13,94, p= 0,00). În schimb, nu a existat nicio diferență semnificativă între media controlului placebo și media tratamentului hormonal 2.

XVII. Analiza de varianță bifactorială pentru

scoruri nerelaționate/necorelate.

_________________________________________________________________________________________________________________

Analiza two-way de varianță permite compararea mediilor unei variabile dependente atunci când există două variabile independente.

Dacă există mai mult de o variabilă dependentă, atunci analiza se realizează separat pentru fiecare variabilă.

Realizarea unei analize two-way pentru scoruri nerelaționate de varianță este exemplificată în tabelul următor, care indică scorurile obținute de către diferiți participanți în șase condiții, reflectând cei doi factori ai privării de somn și alcool. Scopul acestei analize este acela de a aprecia dacă diferitele combinații de cafea și deprivare de somn afectează diferențiat numărul mediu de greșeli făcute.

Datele pentru un experiment referitor la privarea de somn:

Numărul de erori în cazul unui test video.

XVII.1. Metoda two-way ANOVA pentru scoruri nerelaționate.

Pasul 1:

Se introduc datele. Cele ouă coduri pentru „Alcool” (1=alcool; 2= fără alcool) – în prima coloană.

Cele trei coduri pentru „Privare de somn” se regăsesc în a doua coloană (1= 3 ore, 2= 6 ore, 3= 9 ore).

Greșelile sunt prezentate în a treia coloană.

Se elimină cele două zecimale din mediul „Variable View”.

Pasul 2:

Se selectează:

„Analyze”

„General Linear Model”

„Univariate…”

Pasul 3:

Se selectează „Erori” și se apasă butonul

► de lângă caseta „Dependent Variable

”pentru a introduce parametrul acolo.

Se selectează „Alcool” și „Privare de

somn” fie împreună, fie separat, și se

apasă butonul „Fixed factor(s)” pentru

a le introduce în casetă.

Se selectează „Options…”

Pasul 4:

Se selectează „Descriptives

statistics” și „Homogeneity test”.

Se selectează „Continue”.

În ecranul anterior, care va

reapărea, se selectează „Plots…”.

Pasul 5:

Se selectează „Alcool” și se apasă

butonul ► de lângă caseta

„Horizontal axis” – pentru a

introduce parametrul acolo.

Se selectează „Privare de somn” și

se apasă butonul ◄ de lângă caseta

„Separate Lines” – pentru a

introduce opțiunea în casetă.

Se selectează „Add”

.

Se selectează „Continue”. Se apasă „OK” din ecranul anterior

care va reapărea-

XVII.2. Interpretarea output-ului.

Acest tabel conține mediile , abaterile standard și numărul (N) de cazuri pentru cele două variabile „Alcool” și „Privare de somn”. Luate separat sau împreună.

Media pentru condiția „Alcool” este comparată cu „Totalul” pentru

„Privare de somn” (adică 18,22). Media pentru privare de 3 ore de somn este comparată cu „Total” pentru „Alcool” (adică 11,50).

Al treilea tabel de oferă informații referitoare , care verifică similaritatea varianțelor. Din moment ce semnificația acestui test este 0,085 (valoarea care este mai mare decât 0,05), varianțele sunt similare

Al patrulea tabel indică nivelele de semnificație pentru cele două variabile „Alcool” și „Privare de somn”, și interacțiunea dintre acestea.

În tabelul de analiză a varianței, raportul F pentru cele două efecte principale (Alcool și Privare de somn) este prezentat primul.

Pentru prima variabilă, cea a alcoolului, Raportul F este 22,891, ceea ce este semnificativ la nivelul 0,000. Deoarece sunt numai două condiții pentru ca acest efect să se producă, se poate conhide că scorul mediu al uneia dintre condiții este mult mai mare decât pentru cealaltă.

Pentru a doua variabilă a privării de somn, aceasta este egală cu 5,797, valoare care are un nivel exact de semnificație de 0,017. Astfel, Raportul f este semnificativ din punct de vedere statistic la un nivel de 0,05, ceea ce înseamnă că mediile celor trei condiții legate de somn nu sunt similare.

Mediile care diferă de celelalte pot fi determinate ulterior prin folosirea testelor de comparații multiple, cum este Testul t pentru eșantioane independente.

raportul F pentru interacțiunile dintre cele două variabile (Alcool și Privare de somn) este de 2,708 → nivelul de semnificație al acestui raport este de 0,107→ nu este nicio interacțiune semnificativă.

Acest grafic este realizat pentru mediile celor șase condiții. El a fost editat cu ajutorul comenzii “Chart Editor”.

XVII.3. Raportarea output-ului.

Rezultatele din output se pot raporta astfel: „O analiză de varianță two-way ANOVA demonstrează obținerea unor efecte semnificative în cazul alcoolului (F = 22,981, p< 0,001) și al privării de somn (F=5,80, p = 0,017), dar nu și în cazul interacțiunii celor două variabile (F =2,70, p= 0,107).

XVIII. Comparații multiple cu ANOVA.

_________________________________________________________________________________________________________________

Acest capitol extinde aria de acoperire a Testelor t multiple prezentate în capitolele anterioare și explică modul în care se decide care perechi de medii sunt diferite în mod semnificativ între ele, în cazul analizei de varianță.

Această tehnică se folosește atunci când sunt mai mult de două medii.

Pentru a prezenta această procedură vor fi folosite informațiile prezentate la capitolul XV.

Date studiu

Pasul 1:

Se introduc datele.

Se codifică cele trei

condiții cu valorile 1, 2, 3.

Se etichetează „Hormon ,

„Hormon și „Placebo”.

Pasul 2:

Se selectează:

„Analyze”

„Comparea Means”

„One-Way ANOVA”.

Pasul 3:

Se selectează „depresie” și se

apasă butonul ►de lângă caseta

„Dependent List” – pentru a

introduce parametrul în casetă.

Se selectează „Condiție” și se

apasă butonul ◄ de lângă caseta

„Factor” – pentru a introduce

parametrul acolo.

Se selectează „Post Hoc…”

Pasul 4:

Se selectează:

„Tukey”

„Duncan”

„Scheffe”.

Se apasă

„Continue”.

Se selectează „OK” în

ecranul care va apărea

din nou.

XVIII.1. Interpretarea output-ului.

Primul tabel reprezintă rezultatele analizei de varianță. Raportul F pentru efectul dintre grupuri (adică efectul hormonilor) este 13,941, care are un nivel exact de semnificație de 0,006. Acest lucru înseamnă că efectul dintre grupuri este semnificativ; per total, mediile pentru cele trei grupuri diferă.

Al doilea tabel și ultimul oferă rezultatele celor trei teste de comparații multiple.

Dacă se folosește Testul Tukey al diferenței semnificative oneste (HSD), media de la grupul hormonului 1 este semnificativ diferită de media de la grupul hormonului 2 (semnificația=0,06) și semnificația de la media grupului Controlului placebo (semnificația=0,020).

Subgrupele omogene.

Grupul hormonului 2 și al controlului Placebo aparțin aceleiași subgrupe, ceea ce înseamnă că nu sunt semnificativ diferite.

Grupul hormonului 1 este singurul din această a doua subgrupă, motiv pentru care aceasta este semnificativ diferită de mediile celorlalte două grupe.
* Sunt reprezentate mediile grupelor din subgrupele omogene.

a. Folosește Media armonică a dimensiunilor eșantioanelor

=3,000.

Tabelul final, numit „Subgrupele omogene”, enumeră grupurile de medii care nu sunt semnificativ diferite între ele.

Dacă se ia în calcul aceste două rânduri pentru a se folosi în Testul Tukey HSD, în acest caz există două subgrupe de medii. Subgrupa 1 indică faptul că mediile grupelor hormonului 2 și ale controlului placebo cu valorile 3,33 și 4,67 nu diferă semnificativ. Subgrupa 2 conține doar media grupei hormonului 1, în valoare de 9,00. Astfel, media grupului hormonului 1 este semnificativ diferită atât de media grupei hormonului 2, cât și de cea a gupelor de control placebo .

Toate cele trei teste prin comparații multiple sugerează același lucru: faptul că există diferențe semnificative între grupele hormonului 1 și hormonului 2 și între grupele hormonului 1 și cele ale controlului placebo. Alte diferențe nu mai există.

XVIII.2. Raportarea output-ului.

Rezultatele output-ului pot fi raportate astfel: „O analiză de varianță unifactorială pentru scoruri necorelate a demonstrat producerea unui efect general semnificativ pe tip de tratament medicamentos (F=13,94, p= 0,06). Prin Metoda Scheffe de analiză a intervalului s-a descoperit că grupul hormonului 1 era diferit de grupul hormonului 2 (p= 0,07) și de grupul controlului placebo (p=0,24), dar nu s-au mai găsit alte diferențe semnificative”.

XIII.2. Alegeți răspunsul corect

Calculul variabilelor noi:

adunarea și scăderea;

înmulțirea și împărțirea;

ambele variante de mai sus.

Analiza de varianță (ANOVA):

indică măsura în care două sau mai multe grupuri au medii foarte diferite;

calculează variația dintre două scoruri;

calculează variația dintre mediile eșantionului.

ANOVA este utilizată pentru:

a testa diferența între cel puțin 2 grupuri;

a testa diferența între cel puțin 3 grupuri;

a testa diferența între cel puțin 4 grupuri;

Analiza two-way de varianță permite:

compararea mediilor unor variabile independente;

compararea mediilor dintre două grupuri;

compararea mediilor unei variabile dependente atunci când există două variabile independente.

Comparațiile multiple cu ANOVA:

explică modul în care se decise care perechi de medii sunt diferite în mod semnificativ între ele;

se folosește atunci când sunt mai mult de două medii;

indică scorurile obținute de respondenți.

XIII.3. Răspunsuri corecte

1. c. ambele variante de mai sus.

. indică măsura în care două sau mai multe grupuri au medii foarte diferite;

3. b. testa diferența între cel puțin 3 grupuri;

4. c. compararea mediilor unei variabile dependente atunci când există două variabile independente.

. explică modul în care se decise care perechi de medii sunt diferite în mod semnificativ între ele;

se folosește atunci când sunt mai mult de două medii;

BIBLIOGRAFIE

1. Clocotici Vasile, Stan Aurel, 2000 – Statistica aplicată în psihologie, Ed. Polirom, Iași;

2. Dennis Howitt, Duncan Cramer, 2006 – Introducere în SPSS pentru psihologie, Ed. Polirom, Iași;

2. Howell, D, (2002), Statistical Methods for Psychology, Ediția a v-a, Duxbury Press Boston;

3. Jaba Elisabeta, Gramma Ana, (2004) – Analiza statistică cu SPSS sub Windows, Ed. Polirom, Iași;

4. Radu Ioan și alții, (1993) – Metodologie psihologică și analiza datelor, Ed. Sincrom, Cluj – Napoca;

5. Rotariu T și alții, (2006) – Metode statistice aplicate în științele sociale, Ed. Polirom, Iași;

6. Sava, Florin Alin., (2004) – Analiza datelor în cercetarea psihologică. Metode statistice complementare. Cluj-Napoca : ASCR;

Similar Posts

  • Utilizarea Limbajului Java In Telefonia Mobila

    CUPRINS CAPITOLUL I : LIMBAJUL DE PROGRAMARE JAVA……………………….4 Introducere în lumea Java……………………………………………………..4 Caracteristicile limbajului Java………………………………………………6 CAPITOLUL II : INTRODUCERE ÎN J2ME…………………………………………9 Introducere în java 2 platform……………………………………………….9 Descriere J2ME………………………………………………………………….11 Organizarea J2ME……………………………………………………………..12 Configurații……………………………………………………………….13 Profile……………………………………………………………………….16 Pachete opționale……………………………………………………….18 Aplicații…………………………………………………………………….18 CAPITOLUL III : MIDLET-URI…………………………………………………………19 Suite de midlet-uri……………………………………………………………..19 Modul de lucru…………………………………………………………………..20 Structura unui midlet………………………………………………………….20 Crearea unui midlet simplu (1) ……………………………………………21 OTA…

  • Aplicatiile de Intrare Iesire ale Sistemelor Liniare

    Aplicațiile de intrare-ieșire ale sistemelor liniare Cuprins Capitolul 1. INTRODUCERE Capitolul 2. APLICAȚII DE INTRARE – IEȘIRE PENTRU SISTEME DINAMICE 2.1. Aplicații de intrare-iesire pentru sisteme dinamice liniare continue 2.2. Sisteme izomorfe. 2.3. Sisteme discrete 2.4. Aplicații în Matlab Capitolul 3. SISTEME LINIARE. CALCULUL FUNCȚIILOR DE MATRICE 3.1. Funcții de matrice 3.2. Calculul exponențialei matriceale…

  • Incarcator Wireless

    PROIECT DE DIPLOMĂ Incărcător wireless Cuprins Introducere. Motivarea temei de licență Capitolul 1. Transmisia wireless de energie 1.1Generalități. 1.2-Contribuția lui Tesla in domeniul transmisiei Wireless. 1.3.-Invențiile lui Tesla Capitolul 2 Tehnologii existente 2.1- Sistemul de rezonanță WPT- institutul de tehnologie Massachusetts 2.2- PowerMat-stație de incarcare Wireless portabila 2.3 – Sistemul de transmisie Wireless WiPower Capitolul…

  • Platforme E Learning de Instruire

    CUPRINS 1. INTRODUCERE 1.1. Descrierea temei 1.2. Motivația temei 2. ÎNVĂȚĂMÂNTUL ASISTAT DE CALCULATOR 2.1. Procesul de E-Learning 2.2. Arhitectura unui sistem de E-Learning 2.3. Importanța sistemului de învățare de tip E-Learning 2.4. Tehnologia E-Learning 3. PLATFORME E-LEARNING DE INSTRUIRE 3.1. Definire. Componente principale 3.2. Modalități de concepere a platformelor E-Learning 3.3. Platforme de e-Learning…

  • Aplicatie Software Pentru Evidenta Resurselor Umane Dintr O Firma

    1. INTRODUCERE Managementul competitiv al resurselor umane reprezintă un factor esențial pentru succesul oricărei firme. Datorită importanței factorului uman în asigurarea succesului competițional al fimei, funcția de resurse umane s-a amplificat cu un număr sporit de activități. Pentru un management eficace al resurselor umane este nevoie de informații pertinente și oportune. Rolul asigurării acestor informații…

  • . Proiectarea Unui Dispecerat de Productie Pentru Estimarea Cantitatii de Carbune Excavat

    PREFAȚĂ Intorducere Necesitatea modernizării echipamentelor de automatizare prin folosirea echipamentelor numerice de reglare și control Tema Proiectului Aplicația dezvoltată în cadrul proiectului. 1.Introducere Alegerea temei lucrării a avut drept scop familiarizarea cititorului cu sistemele automate de reglare și control dezvoltate în jurul unui microcontroler. S-a avut în vedere implementarea unui sistem pentru îmbunatațirea performanțelor tehnologice…