Abilități de bază- statistică descriptive [304113]
[anonimizat] – media, mediana, modul, [anonimizat], [anonimizat], boltirea, cuartilele.
Vom calcula acesti indicatori prin intermediul optiunii Frequencies:
Pas1- [anonimizat]: optiunea Analyze din meniul principal; din acest meniu se activeaza optiunea Descriptive Statistics; in final comanda Frequencies
In urma activarii comenzii apare caseta de dialog generala(numita Frequencies) pentru selectarea variabilei satisfactie care va fi repartizata in campul Variable(s) [anonimizat] o noua caseta de dialog numita Frequencies: Statistics, care va permite precizarea acestora.
Pentru a [anonimizat], valoarea mod o [anonimizat].deviation , pentru indicatorii formei distribuției selectam Skewness pentru asimetrie si Kurtosis pentru boltire iar pentru cuartile selectam Quartiles.
[anonimizat]:
Pentru a afla intervalul de încredere al mediei procedam astfel:
Analize→Descriptive statistics→Explore, [anonimizat], selectam Statistics din campul Display. [anonimizat]-o noua fereastra in tabelul numit Descriptives.
Tabelul de frecvență pentru o variabilă demografică cu trei categorii
Tabelul de frecvență pentru o [anonimizat] a genera un tabel de frecventa a variabilei varsta vom apela la comanda Frequencies care se găsește în meniul Analyze
Vom deschide caseta de dialog de mai jos:
În fereastra Variable(s) [anonimizat] . Lasam selectată opțiunea Display frequency tables. Apăsăm butonul OK. Tabelul de frecvențe generat de SPSS arată astfel:
Fig 1. Tabelul de frecvențe al variabilei varsta
Cap 12
În prima coloană a acestui tabel sunt afișate cele trei valori ale variabilei varsta. A doua coloană prezintă frecvențele absolute de apariție a valorilor, iar în următoarea coloană găsim frecvențele relative. Astfel putem constata ca:
-20 din 83 de personanele chestionate au varsta pana in 30 [anonimizat] 24.1% din total
-39 din 83 de personanele chestionate au varsta cuprinsa intre 31-45 [anonimizat] 47% din total
-24 din 83 de personanele chestionate au varsta peste 46 [anonimizat] 28.9% din
total
În coloana a patra se găsesc frecvențele relative recalculate prin excluderea valorilor lipsă. [anonimizat] a treia și a patra. Coloana a cincea afișează frecvențele relative cumulate. Acesta coloana ne ajuta sa observam urmatoarele aspecte:
-cat la suta din totalul persoanelor chestionate au varsta pana in 30 [anonimizat] 24.1%
– cat la suta din totalul persoanelor chestionate au varsta pana in 45 [anonimizat] 71.1%
Întrucât este de o variabil varsta este una continuă, nu ne vom limita la generarea tabelului de frecvențe, ci vom cere programului să calculeze și indicatorii statistici ai acestei variabile.
Vom apela comanda Analyze>Descriptive Statistics>Frequencies. În caseta de dialog Frequencies vom introduce variabila varsta în fereastra Variable(s), iar apoi vom apăsa butonul Statistics. Se deschide o nouă casetă de dialog, Frequencies:Statistics, în care vom selecta opțiunile disponibile exact așa cum este arătat în figura urmatoare:
Prin selectarea acestora, vom calcula media, mediana și modul (dominanta), abaterea standard, dispersia, valoarea minimă și cea maximă, amplitudinea (diferența între acestea din urmă), asimetria (skewness), boltirea (kurtosis), cuartilele distribuției, precum și o percentilă arbitrară (90), aflate în chenarul Percentile Values.
Selectam Continue si Ok pentru a obtine output-ul
In output obtinem atat tabelul cu indicatorii stratistici dat si tabelul de frecvente a variabilei varsta:
Fig Principalii indicatori statistici ai variabilei varsta
In tabelul Statistics observam urmatoarele:
– numărul total de cazuri din baza de date este de 83, iar variabila varsta nu prezintă valori lipsă.
-scorurile asimetriei și boltirii, pentru care SPSS calculează și erorile standard, folosesc la verificarea ipotezei de normalitate a distribuției
– varsta pentru percentile 90 este 3. Aceasta înseamnă că 90% dintre cei chestionati au varsta pana in 45 de ani, iar restul de 10% varsta mai mare de 45 de ani.
Un tabel încrucișat
Un tabel încrucișat utilizând variabila sex și o altă variabilă demografică, la alegere
Dorim să verficăm dacă există o relație între sexul unui angajat și venitul acestuia.
Așadar, vom studia posibila asociere dintre variabilele gen și venit. Întrucât ambele variabile sunt nominale, vom folosi un tabel de contingență pentru a vizualiza această asociere.
Pentru a construi tabelul mergem în meniul Analyze, opțiunea Descriptive Statistics>Crosstabs:
Fig. 1. Apelarea procedurii Crosstabs
În caseta de dialog Crosstabs vom defini mai întâi rândurile și coloanele tabelului. Vom introduce variabila gen în fereastra Row(s), iar variabila venit în fereastra Column(s).
Apoi apăsăm butonul Cells pentru a da programului instrucțiuni cu privire la valorile ce trebuie afișate în căsuțele tabelului. În afară de opțiunea Observed din chenarul Counts, care este deja selectată, vom selecta toate opțiunile din chenarul Percentages: Row, Column și Total, iar la final apăsăm butoanele Continue și OK pentru a genera tabelul incrucisat.
Fiecare din cele două rânduri ale tabelului, masculin și feminin, are trei linii de date: prima prezintă frecvențele absolute (Count), iar următoarele trei procentajele calculate pe rânduri, pe coloane și pe total, după cum am cerut inițial programului.
Putem astfel observa că din totalul de 40 angajați bărbați, 12 au venitul sub 1500 de lei, 10 au venitul intre 1501-2500 de lei, 8 au venitul intre 2501-3500 de lei, iar 10 au venitul peste 3501 lei.
Din totalul de 43 angajați de sex feminin, 12 au venitul sub 1500 de lei, 2 au venitul intre 1501-2500 de lei, 5 au venitul intre 2501-3500 de lei si 4 au venitul peste 3501 lei.
Procentajele de pe rândul % within gen prezintă repartizarea pe venit a angajaților din fiecare sex. Suma acestor procentaje pe linie este de 100%. In cazul nostru, 30% din bărbați au venitul sub 1500 lei(adica 12 din 40) , 25% din bărbați au venitul intre 1501-2500 lei(adica 10 din 40), 20% din bărbați au venitul intre 2501-3500 lei (adica 8 din 40), iar restul de 20% din bărbați au venitul peste 3501 lei(adica 10 din 40).
La fel, din totalul de 43 de femei, 27.9% au venitul sub 1500 lei, 51.2% au venitul intre 1501-2500 lei, 11.6% au venitul intre 2501-3500 lei si 9.3% au venitul peste 3501 lei.
La rândul lor, procentajele de pe coloana % within venit semnifică structura pe sexe a fiecărui nivel de venit. Suma acestor procentaje pe coloană este de 100%. Dacă vom privi, de exemplu, pe coloana sub 1500 lei, vom constata că 50.0% din cei care au venitul sub 1500 de lei sunt barbați, iar restul de 50.0% sunt femei . Pe coloana in care venitul este cuprins intre 1501-2500 lei, 31.2% sunt barbati cu acest venit si 68.8% sunt femei; pe coloana in care venitul este cuprins intre 2501-3500 lei, vom costata ca 61.5% sunt barbati cu acest salariu si restul de 38.5% sunt femei, citind ultima coloana vom observa ca 71.4% din cei care au venitul mai mare de 3501 lei sunt barbati iar restul de 28.6% sunt femei. Ultimul rând din tabel, Total, prezintă structura întregului eșantion atât pe sexe, cât și pe venit.
Abilități de bază- vizualizarea datelor
Grafice de tip coloană
Grafice de tip coloană pentru variabilele satisfacție, loialitate și recomandare
Grafice de tip coloană pentru variabilele satisfacție
Vom crea un grafic de tip coloană pentru a reprezenta nivelul satisfacției in functie de venit.
Pentru a realiza acest lucru, avem nevoie de comanda Graphs>Chart Builder:
În figura următoare puteți observa componentele casetei de dialog Chart Builder:
Vom trage prima icoană de pe rândul de sus în fereastră, cu ajutorul mouse-ului, obtinand urmatoarea imagine in care vom defini axele de coordinate.
In cazul nostru, pe axa X vom reprezenta satisfactia iar pe axa Y vom reprezenta media venitului, dupa ce selectam cele de mai sus dam Ok, iar in output vom obtine ce-a de-a doua imagine de mai jos.
sub 1500 lei
intre 1501-2500 lei
intre 2501-3500 lei
peste 3501 lei
Observăm din diagramă că cei care au salariile medii pana in 2500 de lei sunt cel mai putin satisfacuti de locul de munca. Cei mai satisfacuti sunt cei care au salariile pana in 3500 de lei. Pentru a vedea dacă diferențele observate dintre aceste grupuri sunt și semnificative (adică suficient de mari pentru a nu fi considerate întâmplătoare) trebuie să utilizăm un test statistic.
Grafice de tip coloană pentru variabila loialitate
Vom crea un grafic de tip coloană pentru a reprezenta loialitatea angajatilor in functie de venit, , dar diferențiate pe cele două sexe, bărbați și femei.
Pentru a realiza acest lucru , trebuie să folosim graficul de tip coloane grupate (clustered bar chart). Pentru a realiza acest lucru, avem nevoie de comanda Graphs>Chart Builder:
În figura următoare puteți observa componentele casetei de dialog Chart Builder:
De data aceasta va trebui să tragem în fereastră icoana a doua de pe rândul de sus, în chenarul X-axis? vom introduce variabila loialitate iar în chenarul Y-axis? variabila venit. În plus, în chenarul Cluster on X: set color din colț vom introduce a doua variabilă nominală, gen. La final caseta Chard Builder va arăta astfel:
Apasam Ok, iar in output vom obtine urmatorul grafic:
Cu ajutorul graficului de mai sus putem efectua multiple comparații asupra loialitatii , atât in functie de venit, cât și pe sexe. Din graphic obtinem informatia ca atat femeile cat si barbatii care au veniturile pana in 2500 de lei sunt cam la fel de loiali companiei (pentru dezacord).
Grafice de tip coloană grupat pentru recomandare
Vom crea un grafic pentru a reprezenta legatura dintre venitul angaiatilor si modul in care acestia recomanda compania.
Vom parcurge aceeasi pasi ca si in primul exemplu, numai axa X va fi reprezentat modul in care angajatii recomanda compania iar pe axa y va fi reprezentat venitul acestora.
Daca in output dam dublu click pe grafic, vom obtine prima imagine, apoi mergem in Elements la Show data labels in care vom selecta ca in a doua imagine
Din aceasta imagine tragem concluzia ca 24,12% din cei chestionati care au nivelul salarial pana in 3500 de lei nu recomanda compania in care isi desfasoara activitatea.
Un grafic de tip nor de puncte
Un grafic de tip nor de puncte pentru a ilustra relația dintre satisfacție și loialitate (cu discuție)
Diagramele de tip nor de puncte (sau scatterplot) ne vin în ajutor atunci când dorim să identificăm tipul de relație dintre două variabile continue, in cazul nostru, tipul de relatie dintre satisfactie si loialitate. O condiție principală care trebuie verificată înainte de a rula anumite analize statistice, precum corelația parametrică sau regresia, este existența unei relații liniare între variabilele implicate. Acest lucru poate fi realizat doar vizual, cu ajutorul unui grafic de tip scatterplot.
Mai mult chiar, o diagramă “nor de puncte” ne poate ajuta să identificăm valorile extreme din seria de date, dacă există.
Dorim să stabilim dacă relația dintre satisfactie si loialitate este sau nu liniară.
Pentru a realiza acest lucru, avem nevoie de comanda Graphs>Chart Builder:
În figura următoare puteți observa componentele casetei de dialog Chart Builder:
După activarea modulului de construire a graficelor, se va selecta opțiunea Scatter/Dot din lista tipurilor de diagrame, apoi va fi trasă în fereastra de previzualizare prima icoană de pe rândul de sus. Apoi vor fi definite axele de coordonate, astfel:
pe axa X vom plasa variabila satisfactie
pe axa Y vom plasa variabila loialitate
Amplasarea variabilelor pe cele două axe nu se face tocmai la întâmplare; pe axa categoriilor trebuie să fie reprezentată variabila independentă, iar pe axa valorilor variabila dependentă. În cazul nostru, este logic să considerăm că loialitatea unui angajat va depinde de satisfactie, și nu invers.
Iată cum va arăta caseta Chart Builder după efectuarea acestor operații:
După ce apăsăm butonul OK obținem graficul nor de puncte:
Două grafice de tip boxplot
Două grafice de tip boxplot, pentru doi factori motivatori la alegere (cu discuție)
Modalitatea de construire a unui grafic boxplot nu se deosebește cu nimic, în esență, de cea folosită la crearea altor tipuri de grafice.
Primul grafic de tip boxplot
După ce deschidem modulul Chart, selectăm opțiunea Boxplot din meniul din stânga jos și tragem prima icoană din stânga în fereastra de previzualizare. Apoi introducem în fereastră variabilele din lista din stânga sus: pe axa categoriilor variabila nominală gen, iar pe axa valorilor variabila continua pachet salarial. Înainte de a apăsa OK, caseta Chart Builder trebuie să arate astfel:
Cât despre primul nostru grafic, el se prezintă în felul următor:
Al doilea grafic boxplot
După ce deschidem modulul Chart, selectăm opțiunea Boxplot din meniul din stânga jos și tragem prima icoană din stânga în fereastra de previzualizare. Apoi introducem în fereastră variabilele din lista din stânga sus: pe axa categoriilor variabilă nominală evaluarea corectă și obiectivă iar pe axa valorilor variabila continuă venit. Înainte de a apăsa OK, caseta Chart Builder trebuie să arate astfel:
Al doilea grafic se prezintă în felul următor:
Analize avansate – uni- și bivariate
Corelația dintre variabilele satisfacție globală și recomandare
Corelația dintre variabilele satisfacție globală și recomandare
Corelația Pearson măsoară intensitatea și direcția legăturii dintre două variabile continue. Ea se mai numește și corelație liniară, deoarece una din condițiile esențiale pentru validitatea sa este existența unei relații aproximativ liniare între variabilele implicate.
Interpretarea coeficientului de corelație Pearson (numit astfel în onoarea matematicianului Karl Pearson, creatorul său) este foarte simplă. Coeficientul – notat de regulă cu r – poate lua valori între -1 și 1, valoarea 0 însemnând absența oricărei corelații, iar valorile extreme, -1 și 1, corelație perfectă. Cu cât r este mai apropiat de 1 în valoare absolută, cu atât asocierea dintre respectivele variabile este mai puternică.
Pentru a calcula coeficientul de corelație Pearson trebuie să accesăm comenzile Analyze>Correlate>Bivariate:
Tabelul de output pentru corelația Pearson se prezintă astfel:
Se observă că acest tabel este simetric față de diagonala principală, deoarece corelația dintre două variabile este aceeași, indiferent de ordinea în care considerăm respectivele variabile.
Așadar, pentru a obține informații privind corelația dintre satisfacția în muncă și recomandare este suficient să studiem una dintre căsuțele aflate în afara diagonalei principale.
Valorile care trebuie specificate în raportul de cercetare sunt:
nivelul de semnificație Sig. (în cazul nostru 0.000, adică mai mic decât 0.0005)
valoarea coeficientului de corelație (în cazul nostru, 0.709)
Întrucât Sig.-ul este mai mic decât 0.05, vom deduce că există o corelație semnificativă între satisfacția în muncă și recomandare. Se observă de altfel că programul marchează coeficientul cu două asteriscuri și precizează – în nota de subsol – că este semnificativ statistic.
Cât despre valoarea coeficientului, ea ne arată faptul că există o legătură puternică și directă între cele două variabile. Așadar, angajații care au satisfacție la locul de muncă ar recomanda prietenilor sau cunoștințelor să se angajeze în organizație.
Testul t pe eșantioane independente
Testul t pe eșantioane independente pentru a compara nivelele de loialitate pe cele două sexe
Ipotezele testului t pentru eșantioane independente se scriu în felul următor:
H0: nu există diferențe semnificative între loiaitatea celor două grupuri(femei si barbati) în populația totală
H1: există diferențe semnificative între loiaitatea celor două grupuri(femei si barbati) în populația totală
Ipoteza nulă va fi respinsă dacă nivelul de semnificație calculat al testului t (Sig.) este mai mică decât nivelul de semnificație teoretic (5%).
Putem folosi testul t în analiza datelor noastre dacă sunt îndeplinite următoarele condiții:
Variabila independentă este nominală.
Variabila dependentă este continuă (numerică).
Observațiile sunt independente; cu alte cuvinte, nu există nici o legătură între datele culese din cele două grupuri analizate. Există mai multe modalități de a asigura această independență.
Variabila dependentă este distribuită aproximativ normal pe ambele grupuri.
Nu există valori extreme semnificative ale variabilei dependente, pentru nici unul dintre grupuri.
Varianțele variabilei dependente pe cele două grupuri sunt egale (ipoteza omogenități varianțelor). Din fericire, încălcarea acestei ipoteze nu reprezintă o problemă majoră, deoarece există o variantă “robustă” a testului t, numită corecția Welch, care se folosește în cazul în care varianțele grupurilor sunt diferite și pe care programul SPSS o calculează automat.
Respectarea ipotezelor 1, 2 și 3 trebuie verificată în procesul de concepere a design-ului cercetării. Celelalte trei ipoteze vor fi verificate cu ajutorul programului SPSS.
Cu ajutorul testului t vom stabili dacă mediile variabilei dependente loialitate sunt diferite pe cele două grupuri femei si barbati
Înainte de aceasta însă, trebuie să stabilim dacă sunt sau nu îndeplinite condițiile 4 și 5 de mai sus.
Pentru a verifica conditia 4, adica ipoteza de normalitate a variabilei loialitate pe cele două grupuri, vom utiliza procedura Explore, utilizând ca factor variabila gen.
Cele mai uzuale metode numerice folosite pentru verificarea ipotezei de normalitate a variabilelor sunt:
indicatorii asimetriei și boltirii
testul de normalitate Shapiro-Wilk.
Metodele grafice folosite cel mai frecvent sunt:
histograma
diagrama Q-Q.
In continuare, vom folosi cele doua metode numerice dar si o metoda grafica(histograma), iar de interpretat vom interpreta doar testul de normalitate Shapiro-Wilk, rezultatele pentru normalitate fiind identice indifferent de metoda folosita.
Să apăsăm acum butonul Statistics pentru a deschide următoarea casetă:
:
Apăsăm așadar butonul Continue pentru a merge mai departe.
În cele ce urmează vom apăsa butonul Plots din caseta de dialog inițială. În noua casetă de dialog, în chenarul Descriptives, vom deselecta opțiunea Steam and leaf și vom selecta opțiunea Histogram. De asemenea, în chenarul Boxplots vom selecta ultima opțiune, None, deoarece nu ne interesează acum să generăm o diagramă de tip boxplot. La final, caseta de dialog Explore:Plots va arăta după cum urmează:
Fig. 14.4. Caseta Plots a procedurii Explore
Apăsăm din nou butonul Continue pentru a reveni la caseta de dialog Explore. Observăm că în chenarul Display programul ne dă posibilitatea de a alege tipul de informație pe care îl dorim afișat în raport: datele statistice, graficele, sau amândouă. Prima opțiune (Both) este cea selectată implicit, și o vom păstra selectată. Dacă nu avem nevoie de grafice putem selecta opțiunea Statistics. Odată ce am terminat, apăsăm butonul OK.
Tabelele generate de procedura Explore este prezentat în figurile următoare:
Gragicul de mai jos este cel obtinut in output. In acest grafic se observa ca nu exista nici un outlier, prin urmare conditia 5 este indeplinita.
Fig. . Diagramele boxplot ale variabilei loialitate
Putem rula acum testul t pentru eșantioane independente, care se apelează cu comenzile Analyze>Compare Means>Independent-Samples T Test:
Fig. 28.6. Apelarea testului t pentru eșantioane independente
În caseta de dialog vom introduce variabila loialitate în fereastra Test Variable(s), iar variabila independentă gen în câmpul Grouping Variable:
Fig. 28.7. Caseta de dialog a testului t pentru eșantioane independente
Prezența celor două semne de întrebare în paranteză, după variabila gen , înseamnă că programul ne cere definirea celor două grupuri care urmează a fi analizate. Vom apăsa în acest scop butonul Define Groups.
În noua casetă de dialog, vom introduce codurile celor două grupuri, 1 și 2, în câmpurile corespunzătoare, după cum se arată în figura urmatoare:
F28.8. Definirea celor două grupuri
După ce apăsăm butonul Continue și revenim la caseta inițială, vom observa că aceste două coduri se găsesc acum în paranteză în locul semnelor de întrebare.
Fig. Caseta de dialog a testului după definirea grupurilor
Să apăsăm acum butonul OK din caseta principală pentru a produce rezultatele testului. Aceste rezultate se găsesc în figura de mai jos:
.Rezultatele testului t pe eșantioane independente
Să verificăm acum ultima condiție a testului t pe eșantioane independente, cea de egalitate a varianțelor grupurilor. Pentru aceasta vom inspecta rezultatul testului F al lui Levene pentru egalitatea varianțelor, afișate în primele coloane ale tabelului din figura de mai sus.
Valoarea testului F este de 0.460, iar Sig.-ul de 0.5. Întrucât avem Sig.>0.05, vom trage concluzia că nu există diferențe semnificative între dispersiile celor două grupuri. Așadar, condiția 6 de mai sus este satisfăcută.
În cele ce urmează, vom observa că tabelul din figura de mai sus, prezintă două secțiuni:
secțiunea Equal variances assumed, care prezintă rezultatul testului t în condițiile în care ipoteza de egalitate a varianțelor este confirmată
secțiunea Equal variances not assumed, unde este prezentat rezultatul versiunii “robuste” a testului t pe eșantioane independente (corecția Welch), care trebuie luat în considerare atunci când ipoteza omogenității varianțelor este încălcată.
Vom include informațiile dintr-una din aceste secțiuni, în funcție de rezultatul testului Levene (semnificativ sau nesemnificativ). În exemplul nostru testul lui Levene este nesemnificativ; așadar, vom raporta și interpreta cifrele din secțiunea Equal Variances Assumed(adica prima linie).
Valoarea testului t pentru cazul omogenității varianțelor este de -0,801, cu 81 grade de libertate. Inspectând coloana Sig. (2-tailed) observăm că avem Sig.>0.0005 deoarece are valoarea 0.425 – așadar testul t este nu semnificativ statistic. Cu alte cuvinte, nu există o diferență semnificativă între loialitatea celor două grupuri(femei si barbati) în populația totală.
Pentru a obține informații suplimentare vom studia și cel de-al doilea tabel al outputului pentru această procedură:
Fig. Tabelul Group Statistics
Din acest tabel obtinem urmatoarele informatii:
Persoanele de sex masculine au loialitatea medie de 3.55
Persoanele de sex feminine au loialitatea medie de 3.77
Diferența dintre acestea este de 0,22 în favoarea persoanelor de sex feminin (coloana Mean Difference din tabelul de la figura de mai sus).
Această diferență nu este semnificativă, după cum arată testul t; așadar, putem extinde concluziile la nivelul populației totale, afirmând că angajații de sex feminine sunt mai loiale decat persoanele de sex masculin, dar nu este semnificativa?.
Mai mult decât atât, putem spune în ce interval se situează diferența dintre aceste grupuri, pe populația totală. Dacă vom examina ultimele coloane ale tabelului cu rezultatele testului t pe eșantioane independente (prima linie), vom constata că această diferență este cuprinsă între -0.757 și 0.322 , cu un nivel de încredere de 95%.
Marimea efectului
În afară de rezultatele testului t, se raportează de obicei și mărimea efectului pentru acest test.
Diferența de 0.22 puncte calculate mai sus, deși nu este semnificativă statistic, aceasta nu prezintă semnificație practică (sau importanță practică, cum i se mai spune) pentru persoana de decizie.
Din aceasta cauza, vom calcula indicatorul “mărimea efectului” a fost definit tocmai cu scopul de a estima semnificația practică. Pentru testul t pe eșantioane independente, mărimea efectului se măsoară cu ajutorul coeficientului d al lui Cohen. Acest coeficient poate fi calculat deoarece îndeplinită condiția omogenității varianțelor. Formula sa este următoarea:
unde m1 și m2 sunt mediile celor două grupuri, iar sc este abaterea standard comună a grupurilor, calculată la rândul său cu formula:
unde s1 și s2 sunt abaterile standard ale grupurilor, iar n1 și n2 numărul de subiecți din fiecare grup.
În cazul nostru, abaterea standard comună a grupurilor este:
iar mărimea efectului este:
Vom folosi valorile critice sugerate de Cohen însuși pentru a exprima importanța practică:
Tab. 28.1. Valorile critice orientative ale coeficientului d al lui Cohen
În cazul nostru avem de-a face cu un efect foarte mic, întrucât valoarea lui d este mai mic de 0.2. Putem afirma o dată în plus că diferența de loialitate dintre cele două grupuri, , nu este considerabilă.
Analize avansate – uni- și bivariate
O analiză de varianță bifactorială
O analiză de varianță bifactorială, utilizând ca factori sexul și o altă variabilă demografică, la alegere, iar ca variabilă dependentă, satisfacția globală
Analiza de varianță bifactorială este folosită pentru a studia acțiunea combinată a doi factori asupra variabilei dependente.
Să apelăm acum comanda pentru analiza de varianță bifactorială: Analyze>General Linear Model>Univariate:
În câmpul Dependent Variable introducem variabila satisfacția globală, iar în fereastra Fixed Factor(s) variabilele venit și gen, ca în figura de mai jos:
Apăsăm acum butonul Model pentru a deschide următoarea casetă de dialog:
Atunci când efectuăm o analiză de varianță cu doi sau mai mulți factori putem specifica două tipuri de model: factorial complet sau factorial incomplet. Modelul factorial complet include efectele tuturor factorilor și a tuturor interacțiunilor posibile dintre ei.
În cazul de față, întrucât avem de studiat doar trei efecte (două principale și o interacțiune), vom alege modelul factorial complet. Drept urmare, vom păstra opțiunea Full factorial și vom apăsa butonul Continue pentru a reveni la caseta inițială.
În continuare vom cere programului să reprezinte grafic gradul de mulțumirea a fiecărui angajaz privind salariului pentru fiecare categorie de sex în parte, pentru a avea și o imagine vizuală a rezultatului analizei, respectiv a interacțiunii dintre factori. Pentru aceasta vom apăsa butonul Plots, iar în noua casetă de dialog vom introduce factorul venit în câmpul Horizontal Axis, iar factorul gen în câmpul Separate Lines. Apoi vom apăsa butonul Add pentru a introduce această combinatie în fereastra Plots. La final, caseta de dialog va arăta astfel:
Fig.Caseta de dialog Profile Plots
Apăsăm apoi butonul Continue pentru a închide caseta de mai sus.
În continuare vom cere programului să efectueze comparațiile perechi pentru categoriile variabilei venit (pentru variabila gen aceste comparații nu pot fi realizate, întrucât are doar două categorii). Pentru aceasta vom apăsa butonul Post-Hoc.
În noua casetă de dialog vom introduce variabila venit în fereastra Post Hoc Tests for, iar apoi vom selecta testul Bonferroni pentru comparațiile perechi, după care vom închide caseta apăsând butonul Continue. Iată cum va arăta caseta la final:
Fig. Caseta de dialog Post Hoc
Ne-au mai rămas opțiunile privind calcularea unor indicatori statistici, pe care le vom accesa apăsând butonul Options. În caseta de dialog respectivă vom selecta mai întâi opțiunile Descriptive Statistics, Estimates of effect size și Homogeneity Tests. Apoi vom selecta elementele venit și venit*gen din fereastra Factor(s) and Factor Interaction și le vom transfera în fereastra alăturată, Display Means for. După aceea facem clic pe elementul venit*gen și selectăm opțiunea Compare main effects, precum și opțiunea Bonferroni din meniul Confidence interval adjustement. Caseta de dialog va arăta în final după cum urmează:
Fig. Caseta de dialog Options
Apăsăm acum Continue pentru a închide caseta și, în sfârșit, apăsăm OK pentru a rula analizele.
Prima sarcină a analistului la acest punct este verificarea ipotezei de omogenitate a varianțelor. Tabelul cu rezultatele testului F al lui Levene este prezentat în figura de mai jos:
Fig.Testul lui Levene pentru egalitatea varianțelor
Întrucât avem Sig.>0.05, vom afirma că varianțele celor șase grupuri sunt egale. Așadar ultima conditie pentru derularea ANOVA, cea de omogenitate a varianțelor, este respectată în cazul nostru.
Următorul pas constă în examinarea efectului de interacțiune a factorilor, pentru a stabili dacă este sau nu semnificativ. Acest efect îl găsim în tabelul din figura următoare:
Fig.Efectele factorilor
Ne vom concentra atenția asupra liniei venit*gen din tabelul de mai sus. Valoarea testului F cu două grade de libertate (coloana df) este de 1,537, iar Sig.-ul este mai mare de 0.0005. Mărimea efectului pentru această influență este de 0.058 (coloana Partial Eta Squared).
Programul a calculat, la cerea noastră, și așa-numitele “medii marginale”, adică mediile variabilei efort pentru fiecare grup în parte. Aceste medii se regăsesc în figura de mai jos:
Fig. Tabelul mediilor marginale
Mediile marginale din sunt reprezentate grafic în figura de mai jos:
Fig.Reprezentarea grafică a mediilor marginale
Pe axa orizontală se găsesc categoriile variabilei venit, iar pe axa valorilor mediile variabilei dependente satisfacție în muncă.
Linia superioară prezintă efectul celor trei nivele ale factorului venit asupra bărbaților, iar linia inferioară prezintă același efect, dar asupra femeilor. Faptul că cele două linii au pante diferite (și, în plus, se intersectează) confirmă existența efectului de interacțiune dintre cei doi factori.
Pentru a calcula efectele principale simple vom deschide din nou caseta de dialog Univariate și în această casetă de dialog vom apasa butonul Paste. Această comandă ne deschide editorul de sintaxă al programului SPSS:
Pentru a obține efectele principale trebuie să modificăm prima linie /EMMEANS din codul de mai sus.
La finalul ei va trebui să adăugăm următoarea instrucțiune:
COMPARE(doza) ADJ(BONFERRONI)
Această instrucțiune va genera efectele principale pentru variabila doza: diferențele dintre diverse nivele ale dozei pentru bărbați, respectiv femei.
Linia /EMMEANS va arăta astfel:
/EMMEANS=TABLES(venit*gen) COMPARE(venit) ADJ(BONFERRONI)
Pentru a obține și efectele principale simple pentru variabila sex, vom adăuga o nouă line /EMMEANS sub cea existentă, care va arăta astfel:
/EMMEANS=TABLES(venit*gen) COMPARE(gen) ADJ(BONFERRONI)
După toate aceste modificări, codul nostru se prezintă astfel:
Fig. Sintaxa procedurii Univariate pentru calcularea efectelor principale simple
Pentru a executa acest cod vom selecta opțiunea Run>All:
Pentru variabila venit, efectele principale simple se găsesc un tabelul următor:
Fig. Efectele principale simple ale variabilei venit
Pentru fiecare categorie de sex va trebui să examinăm linia Contrasts, unde găsim informații cu privire la semnificația diferențelor dintre mediile variabilei efort pentru cele trei nivele ale dozei. Astfel:
pentru grupul bărbaților există diferențe semnificative, per ansamblu (F=2,628 Sig>0.0005, η2 parțial = 0.095)
pentru grupul femeilor există de asemenea diferențe semnificative, per ansamblu, (F=1,455, Sig>0.0005, η2 parțial = 0.055)
Fig. Tabelul comparațiilor perechi a venitului, pe fiecare sex
Acesta este de fapt un tabel de comparații perechi, care prezintă diferențele dintre toate nivelele dozei de vitamină, separat pe fiecare categorie de sex. Deși toate diferențele sunt semnificative statistic (a se observa coloana Sig.).
Să analizăm în continuare efectele principale simple ale variabilei sex, care se găsesc în următorul tabel:
Fig. Efectele principale simple ale variabilei gen
Cele trei linii Contrasts din tabel prezintă diferențele dintre satisfacția în muncă a bărbaților și femeilor pe fiecare din cele patru categorii de venit. Astfel:
pentru grupul de venit “sub 1500 lei” nu există diferențe semnificative, per ansamblu, între bărbați și femei în ceea ce privește satisfacția în muncă (F=0.383, Sig=0.538, η2 parțial = 0.005)
pentru grupul de venit “între 1501-2500 lei” nu există diferențe semnificative, per ansamblu, între bărbați și femei în ceea ce privește satisfacția în muncă (F=0, 710, Sig=0.402, η2 parțial = 0.009)
pentru grupul de venit “între 2501-3500 lei” nu există de asemenea diferențe semnificative, per ansamblu, între bărbați și femei în ceea ce privește satisfacția în muncă (F=0,159, Sig=0,691, η2 parțial = 0.02)
pentru grupul de venit “peste 350lei” există diferențe semnificative, per ansamblu, între bărbați și femei în ceea ce privește satisfacția în muncă (F=3,528 Sig=0,064, η2 parțial = 0.045)
Pentru a vedea unde se află diferențele semnificative, vom inspecta tabelul comparațiilor perechi de mai jos:
O analiză de regresie multiplă
O analiză de regresie multiplă, utilizând ca variabilă dependentă satisfacția globală iar ca variabile independente factorii motivatori
Regresia multiplă se folosește: fie pentru prognozarea valorilor variabilei dependente satisfactia pornind de la valori date ale variabilelor dependente, fie pentru determinarea proporției în care modificările variabilelor independente adica munca_in_echipa, pachet_salarial, oportunitati_avansare_dezvoltare, stress, corectitudine influențează variația variabilei dependente. Condițiile pe care trebuie să le verificăm înainte de a rula această analiză sunt următoarele:
Toate variabilele studiate sunt continue (numerice).
Relația dintre variabila dependentă și cele independente este aproximativ liniară, atât pentru fiecare variabilă independentă în parte, cât și global.
Nu există valori extreme semnificative în seria de date.
Erorile sunt independente – nu există corelație între variabila de eroare și variabilele independente.
Variabila dependentă are aceeași varianță pentru toate valorile variabilelor independente (condiția de homoscedasticitate).
Variabila reziduală este distribuită aproximativ normal.
Variabilele independente nu sunt corelate între ele – cu alte cuvinte, nu apare fenomenul de multicoliniaritate.
Așadar, la lista de condiții din capitolul precedent se adaugă încă una – nu trebuie să existe o corelație puternică între variabilele independente. Va fi necesar prin urmare să rulăm un test de coliniaritate înainte de a interpreta rezultatele analizei de regresie multiplă.
De fapt, cea mai mare parte a acestui capitol va fi dedicată verificării condițiilor de mai sus. Vom începe prin a arăta modul de setare a opțiunilor pentru regresia multiplă, vom continua cu verificarea condițiilor iar la final vom interpreta rezultatele analizei.
Dorim sa facem un studiu prin care să măsurăm influența a cinci variabile munca in echipa, pachetul salarial, oportunitatile de avansare si dezvoltare, stresul si corectitudinea asupra satisfactiei.
Vom apela procedura de analiză, prin comanda Analyze>Regression>Linear:
Fig. 43.3. Apelarea procedurii de regresie liniară
iar apoi introducem variabilele la locul lor, după cum se observă în figura urmatoare
Fig. 44.2. Definirea variabilelor pentru regresia multiplă
În caseta de dialog Linear Regression:Statistics (activată prin apăsarea butonului Statistics), vom selecta următoarele opțiuni:
Fig. 44.3. Caseta de dialog Statistics
În caseta de dialog Linear Regression:Plots (activată prin apăsarea butonului Plots), vom face selecțiile după cum urmează:
Fig. 44.4. Caseta de dialog Plots
În sfârșit, în caseta Linear Regression:Save (activată prin apăsarea butonului Save), vom selecta opțiunile următoare:
Fig. 44.5. Caseta de dialog Save (fragment)
Putem apăsa acum butonul OK pentru a genera tabelele de output.
Vom observa mai întâi că programul SPSS a creat patru noi variabile, după cum i-am cerut în caseta Linear Regression:Save:
Fig. 44.6. Noile variabile create prin procedura de regresie
Aceste variabile conțin: valorile estimate ale variabilei dependente (PRE_1), valorile reziduale standardizate (ZRE_1), valorile reziduale studentizate (SRE_1) și valorile reziduale studentizate șterse (SDR_1). Valorile reziduale studentizate se calculează prin împarțirea valorilor inițiale la o estimare a varianței fiecăreia. În ceea ce privește valorile reziduale studentizate șterse, ele sunt acele valori reziduale studentizate care ar fi fost obținute dacă respectivul caz ar fi fost exclus din analiză. Aceste valori sunt utile pentru identificarea valorilor extreme ale seriei de date.
Prima condiție pe care o vom verifica este cea privind relațiile liniare dintre variabile. Programul a produs automat, la cererea noastră, diagramele parțiale ale relațiilor dintre variabila dependent, in cazul nostru satisfactia, și fiecare variabilă independent, in cazul nostru munca_in_echipa, pachet_salarial, oportunitati_avansare_dezvoltare, stress, corectitudine.
Pentru a verifica dacă există o relație liniară între variabile per ansamblu, trebuie să construim o diagramă de de tip nor de puncte având pe abscisă valorile estimate ale variabilei dependente satisfactia (PRE_1), iar pe ordonată valorile reziduale studentizate (SRE_1). Iată cum arată această diagramă în cazul nostru:
Fig. Distribuția valorilor reziduale studentizate
Pentru a putea afirma că avem o relație liniară per ansamblu, punctele de pe grafic ar trebui să se situeze cu aproximatie de-a lungul unei benzi orizontale, paralelă cu abscisa. Graficul din figura anterioara ne conduce la concluzia că relația dintre variabilele noastre este suficient de apropiată de cea liniară deoarece conformația norului de puncte seamănă cu o bandă orizontală.
Dacă relația dintre variabile este neliniară putem fie transforma unele dintre ele cu scopul de a ajunge la o relație liniară, fie apela la un model de regresie neliniară.
Să verificăm acum condiția de independență a erorilor, cu ajutorul testului Durbin-Watson. Prezentăm mai jos tabelul Model Summary din fișierul de output:
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Abilități de bază- statistică descriptive [304113] (ID: 304113)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
