Traian Rotariu, Gabriel Bădescu, Irina Culic, Elemer Mezei, Cornelia Mureșan, Metode Statistice [611610]

Traian Rotariu, Gabriel Bădescu, Irina Culic, Elemer Mezei, Cornelia Mureșan, Metode Statistice
aplicate în științele sociale, Editura Polirom 2000
Frecvențe: dacă tre să determinăm numărul de țări dintre toate statele lumii care sunt: dezvoltate,
mediu dezvoltate și slab dezvoltate, înseamnă că trebuie să găsim câte țări sunt din prima categorie,
câte din a adoua și câte din a treia (căutarea frecvențelor caracteristicii respective pentru populația
luată în obiectivul cercetării, sau a numărului de indivizi statistici care populează fiecare clasă a
caracteristicii)
Cap. 3 Indicatori ai caracteristicilor cantitative
Indicatori= valori atașate variabilelor statistice cantitative, prin intermediul cărora se încearcă
exprimarea, de o manieră sintetică, a informațiilor conținute în distribuția de frecvențe respectivă.
1. Indicatori de poziție (de nivel, ai tendinței centrale) redă într-o singură valoare
numerică, nivelul general al valorilor seriei sau ordinul de mărime al acestor valori. Spre exemplu
media: valoare care se obține împărțind suma valorilor tuturor indicatorilor din populație la numărul
acestora, valoare comună pe care ar trebui să o ia fiecare individ din populație, astfel încât să păstreze
neschimbată suma valorilor. Proprietăți: 1. media este o valoare cuprinsă în intervalul ale cărui capete
le constituie valoarea minimă și maximă ale seriei de valori, 2. val medie a unei populații descompuse
în s subpopulții este media mediilor din subpopulații, ponderate cu mărimea fiecărei subpopulații, 3.
media e o unitate de măsură exprimată în aceeași unitate de măsură în care sunt exprimate și valorile
variabilei respective, 4. suma abaterilor valorilor de la medie este nulă, 5. media aritmetică rămâne
neschimbată dacă frecvențele se * sau se / cu același număr, 6. valoarea medie poate fi calculată chiar
dacă nu cunoaștem distribuția caracteristicilor, ci numai suma valorilor. Media este relevantă dacă
populația este omogenă.
Mediana: valoarea mediană este cea care are în stânga sa tot atâtea valori cât și în dreapta sa.
Se poate determina numai când șirul de valori e fără soț, altfel considerăm cele două valori mediane,
din care facem media aritmetică
Modul este valoarea luată cu cea mai mare frecvență, valoarea ce caracterizează individul
tipic al populației. Pt variabilele continue, tre să se construiască intervale de valori, apoi să se
găsească intervalul modal, adică a intervalului cu cea mai ridicată frevență. Există distribuții
plurimodale (graficele au mai multe cocoașe) și unimodale.
Ordinea acestora este cea din dicționar: MEDIA (1/3) < MEDIANA< (2/3)MODUL

2. Indicatori de dispersie (împrăștiere, variație)
Urmăresc să măsoare gradul de împrăștiere a indivizilor în cadrul seriei de valori pe care
aceștia le iau. Ei caracterizează o populație statistică din punctul de vedere al
omogenității/eterogenității în raport cu o variabilă dată.
Amplitudinea se calculează ca diferență dintre cea mai mare și cea mai mică valoare.
Această valoare nu are o acuratețe prea mare pt că se iau în calcul douar două valori, care pot fi mult
diferite de seria celorlalte valori, deci care nu reflectă în mod real situația din populație.
Abaterea intercuartilă Cuartilele sunt valorile care corespund indivizilor statistici aflați pe
acele poziții –în ierarhia formată pornind de la cel cu valoarea cea mai mică la cel cu valoarea cea mai
mare, care împart mulțimea indivizilor în patrru părți egale- (Xmin, Q1), (Q1, Q2), (Q2, Q3), (Q3,
Xmax. A doua cuartilă, Q2 este chiar mediana)
Abaterea intercuartilă este I=Q3-Q1
Indicele de împrăștiere al lui Gini este media aritmetică a diferențelor dintre toate perechile
de valori, diferențe luate în valoare absolută
Abaterea medie
Ex: avem 5 note: 5,6,7,9,10.
1

Mediana este 7, abaterile de la ea vor fi 5-7=2, 6-7=1, 7-7=0, 7-9=2, 7-10=3, deci Am(Me)=
(2+1+0+2+3):5=8:5= 1,6
Media este 7,4 abnaterea medie este (2.4+1.4+0.4+1.6+2.6):5=8.4:5= 1,68 note, valoare mai
mare decât cea a abaterii de la mediană
Abaterea standard (deviație standard, dispersie) (este o măsură a gradului de
eterogenitate, diversitate, inegalitate, pentru indivizii ce formează populația respectivă) sau abaterea
medie pătratică se calculează prin ridicarea la pătrat a diferențelor dintre valorile individuale și o
mărime constantă, arbitrar aleasă, a, urmată de însumarea pătratelor respective și de raportarea la
numărul cazurilor observate, adică n. Cea mai mică abatere standard este cea față de medie. Pătratul
indicatorului poartă denumirea de varianță.
Proprietăți:
-dacă valorile variabilei se înmulțesc cu o constantă, a, atunci și abaterea standard se
multiplică cu aceeași valoare
-dacă la valorile variabilei se adună sau se scad o aceeași valoare, abaterea standard rămâne
nemodificată
Teorema de descompunere a varianței S-a constatat că dacă populația statistică este
concepută ca fiind formată dintr-o mulțime de grupuri, atunci media generală a caracteristicii este
egală cu media mediilor la nivelul fiecărui grup. Astfel, varianța totală se descompune în suma
varianței intragrupale și a celei intergrupale
Coeficientul de variație arată ce fracțiune din medie corespunde unei abateri standard. Cu
cât coef e mai aproape de 0, cu atât grupurile sunt mai omogene
3. Indicatori ai formei distribuției
Forma distribuției:
-în ce măsură distribuția se abate de la cazul-limită al simetriei în jurul valorilor centrale
(distribuția normală ideală). Pentru aceată problemă se introduc indicatori ai oblicitățiii
-În ce măsură distribuția este mai plată sau mai boltită, se exprimă prin indicatori ai boltirii,
sau de exces
Indicatorii de oblicitate (skewness) oblicitatea distribuției, în sensul de deplasare spre
stânga sau spre dreapta a valorii modale, generează poziții și distanțe diferite între indicatorii tendinței
centrale, adică între medie șimod. Indicatorul propus de Pearson. Valoarea este nulă pt distribuții
simetrice, pozitivă pt curbe înspre dreapta, negativă pt curbe spre stânga
Indicatori ai boltirii (kurtosis) exprimă înălțimea cocoașei curbei, comparativ cu cea
normală. Valorile pozitive indică distribuții leptocurtice (cu cocoașa înaltă) și valorile negative, cele
platicurtice (cu cocoașa aplatizată).
Cap. 4 Elemente de teoria probabilităților
Noțiuni elementare:
-experiență (acțiune ce se poate repeta de multe ori, în condiții identice: datul cu zarul)
-proba (fiecare dat cu zarul)
-cazul (rezultatul: ce cifre ies), mulțimea tuturor rezultatelor posibile e E
-evenimentele sunt afirmații legate de rezultatul unei probe a unui experiment
-ev imposibil e ev caracterizat de mulțimea vidă, ev sigur e notat cu E și se prod pt toate
probele experienței. A și B sunt incompatibile dacă A intersectat cu B e mulțimea vidă. Ev
care apare când apare A și nu apare B este A\B. A include B înseamnă că producerea lui A
atrage după sine producerea lui B.
-Frecvențele relative se obțin prin împărțirea frecvențelor de apariție la numărul de probe
efectuate
2

Teoria probabilității pleacă de la convingerea că există o valoare-limită a frecvenței
relative de apariție a unui eveniment, pentru un număr mare de probe. Deci, pt fiecare
experiență există o funcție, numită probabilitate, definită de mulțimea tuturor evenimentelor cu
valori (0,1), interval dat de frecvența relativă de apariție a evenimentului respectiv .
Distribuția de probabilitate a unei variabile se referă la probabilitățile de apariție a diferitelor
valori posibile ale apariției.
Schema hipergeometrică ? p. 69
Schema binominală? P.70
Distribuția normală : reprezentarea grafică a cărei distribuții este o curbă de forma unui
clopot , simetrică față de centrul dat de valoarea lui m (media distribuției) și a cărei formă este
determinată de valoarea abaterii standard a distribuției. Importanța acestei curbe este accea că
aproximează distribuțiile multor variabile întâlnite în aplicațiile din științele sociale. Se mai utilizează
în multe metode de inferență statistică, premițându-ne să estimăm valorile anumitor indicatori pentru
variabile, cu o eroare stabilită și un risc de a greși mic. Distribuția normală de parametrii a cărei medie
este 0 și a cărei abatere standard este 1, se numește distribuție normală standard.
Probabilități condiționate
Definim evenimentele A și B ca fiind independente dacă P(Aintersectat cu B)=P(A)xP(B)
(realiy ev A nu infl ev B)
Dacă unul din ev ar infl celălalt ev, atunci acest ev ar tre să se realiz, ca secvență de timp,
înaintea celuilalt ev. … Probabilitatea evenimentului B, în ipoteza realizării lui A
Teorema lui Bayes
Având un câmp de probabilitate (E, P(E), P), finit sau infinit, discret sau continuu, un
eveniment oarecare posibil, A (P(A)>0), și un ev oarecare B, numim probabilitatea lui B condiționată
de A, valoarea notată cu P(B/A)=P(Aintersectat cu B)/P(A). Se observă că dacă evenimentele sunt
independente, atunci P(B)=P(B/A)
Teorema probabilității condiționate Având (E, P(E), P) un câmp de probabilitate, Ai
(i=1,2,…n) uun sistem complet de evenimente (două câte două se exclud și reuniunea cu Ai egal E) și
B un ev oarecare, atunci:
P(B)= P(A1)xP(B/A1)+ P(A2)xP(B/A2)+ …………….P(An)xP(B/An)
Cap. 5 Eșantioanarea
Eșantionarea sau selecția reprezintă setul de operații cu ajutorul cărora, din ansamblul
populației vizate de cercetare, se alege o parte, numită eșantion, parte ce va fi supusă în mod
nemijlocit investigației. Alegerea tre făcută aî, prin intermediul acestui studiu redus, să se obțină
concluzii cu valabilitate generală, adică dând seama de întreaga populație. Eșantionarea este o
realitate impusă, nu numia datorită costurilor mai mici, dar și pt că investigarea întregii populații este
absurdă.
Eșantionul tre să fie reprezentativ, capacitatea lui de a reproduce cât mai fidel structurile și
caracteristicile populației din care este extras.
Erori de eșantionare:
-în loc să culegem date de la toți indivizii, le culegem numai de la o parte a acestora.
-Erori datorate persoanelor care culeg informația
d, eroarea maximă, ce exprimă diferența cea mai mare acceptată dintre o valoare v* găsită în
eșantion și valoarea v găsită în populație (de exemplu ne spune cu cât se poate abate media de vârstă a
indivizilor din eșantion de media de vârstă a indivizilor din populație). Se mai poate calcula în funcție
de abaterea standard, indicator de dispersie… Nu se poate vorbi de reprezentativitate în general, ci
numai în raport cu o caracteristică dată
3

P, nivel de probabilitate sau de încredere, care arată ce șanse sunt ca eroarea reală comisă, atunci
când valoarea v (firește, necunoscută) este aproximată prin v*, să nu depășească limita d. Pentru
nivelul de probabilitate, nivelul minim acceptat este de 0,95, ceea ce înseamnă că șansele de a greși
estimarea nu trebuie să fie mai mari de 5%.
Reprezentativitate unui eșantion este cuplul d, P. Cele două mărimi, d și P nu sunt independente.
Cu toate acestea, în condiții egale, scăderea erorii antrenează scăderea probabilității. Nu putem
ameliora simultan și precizia estimării, și siguranța acesteia, restul condițiilor fiind identice.
Reprezentativitatea este o noțiune relativă. Gradul de reprezentativitate al unui eșantion dep de :
-caracteristicile populației (pt estimarea unor caracteristici ale unei pop omogene va fi nevoie
de un nr mai mic de indivizi. Pt a caracteriza niv de omogenitate al unei pop se fol indicatorul
de dispersie: abaterea standard) Eroarea de eșantionare e dp cu abaterea standard.
-mărimea eșantionului: cu cât mărimea e mai mare, cu atât reprezentativitatea e mai mare, dar
nu într-o rel dp. Reprezentativitatea atinge repede un niv ridicat, aî nu e necesară o creștere f
mare a eșantionului. Mărirea eșantionului se face de obicei pt a crește reprezentativitatea în
cadrul subpopulațiilor.
-tehnicile de eșantionare
eșantioane aleatoare, probabilistice: alegerea se face într-o manieră pur
întâmplătoare, se elimină intervenția subiectivă. Fiecare individ are om șansă
calculabilă și nenulă de a fi inclus în eșantion. Reprezentativitatea
eșantionului se poate calcula numai pt eșantioanele strict probabilistice.
Fiecare tehnică de eșantionare aleatoare pp formul specifice de estimare a
erorii.
eșantioane nealeatoare
1.eșantioanarea simplă aleatoare se procedează prin tragere la sorți: tabele cu numere
întâmplătoare: se generează serii lungi de numere de 4,5,6, sau maimulte cifre, numerele sunt
dispuse întâmplător. Cercetătorul are o listă cu indivizii din populație, fiecare ind primește un
nr de la 1 la N
2.eșantionarea prin stratificare Se pornește de la o divizare a populației după un criteriu, o
caracteristică A, în s clase de efective: N1, N2, ….. Ns, cifre care prin însumare dau efectivul
total al populației. Întrucât este greu să se stab un singur crit după care să se facă eșantionarea,
aceasta ia în calcul împărțirea pop după mai multe crit, cum ar fi cel de vârstă, sex, ocupație,
niv de școlarizare. Acest tip de eșantion e mai reprezentativ decât cel aleator, pt că e ales pe
anumite criterii căutate
3.eșantionarea multistadială: într-un prim stadiu se alege un eșantion de grupuri de cel mai înalt
rang, apoi, din fiecare dintre acestea, un eșantion de rang 2, etc.În final se va alege un
eșantion de indivizi, care, de cele mai multe ori, cuprinde întreg efectivul ultimului eșantion
de grupuri. Scopul principal este reducerea costurilor și timpului de cercetare. Este însă mai
puțin reprezentativ decât unul simplu aleator
Estimarea valorilor medii se face prin
-extragerea a mai multor subeșantioane și calcularea mediilor acestora. Dacă media lor este
aceeași cu cea din populație, atunci eșantionul este corect alcătuit.
-Dacă eșantionarea e simplă aleatoare, abaterea standard a variabilei este de radical din n ori
mai mică decât abaterea standard a variabilei x. (mărind eșantionul se mărește concentrarea
valorilor mediei din eșantioane de cea din populație)
-Distribuția valorilor variabilei mediei din eșantion urmează o curbă normală (Gauss)
-Abaterea standard a variabilei x în populație este suficient de bine aproximată de abaterea
standard a aceleiași variabile într-un eșantion oarecare.
Ex: PP că avem un eșantion de 1600 de persoane, frecvența cu care se declară votul pt un p este
de 20%. Pt a calcula reprezentativitatea , mai întâi se estimează eroarea standard ( e 1%, după o
formulă?), apoi se alege un nivc de probabilitate P e 95%, căruia îi coresp o eroare max de 2e. Se
trage concluzia că există 95% șanse ca p respectiv să aibă, în întreaga populație, un procent de
susținători cuprins între 18% și 22%
-pt eșantionarea simplă aleatoare nerepetate (fără reintroducerea în urnă a individului extras)
p.100
-pt eșantionarea prin stratificare p.101
4

Teste de semnificație
Probl semnif diferenței dintre 2 mărimi se pune atunci când se compară 2 valori, dintre care
cel puțin 1 este obținută printr-o procedură de cercetare selectivă.
Teste de semnificație pentru eșantioane mari:
-Testul Z sau T se aplică în cazul eșantioanelor mari și servește la testarea semnificației
diferenței dintre 2 mărimi sau la testarea unei mărimi (dacă ea este sau nu semnificativ
diferită de 0)
-Testarea semnificației diferenței dintre 2 medii sau proporții
1. când 1 dintre mărimi este calculată la nivel de populație și cealaltă la nivel de eșantion. Z nu este
altceva decât nr de erori standard. Dacă Z e mai mare de 2, mai exact de 1,96, atunci diferența este
semnificativă la nivelul de probabilitate de 0,95, adică 95%. Dacă Z depășește valoarea de 2,6, atunci
diferența este semnificativă la nivelul de 0,99, iar când Z trece de 3,3 diferența este semnificativă la
nivelul de 0,999. Acestea sunt cele 3 praguri de probabilitate cel mai des utilizate
One sample statistics
N (nr de oam in
esantion)Mean
(media)St. Deviation
(abaterea
standard)Std. Error Mean
(eroarea standard
a var rezident)
REZIDENT 1298 .5470 .4980 1.4E-2
One –Sample test
Gradele de liberatate ale
eșantionului Test Value =0.543
T (Z)Df
(N-1)Sig(2-
tailed)Mean
difference95% Confidence Interval
of the Difference
(intervalul de confidență
pentru niv de încredere de
95%)
LowerUpper
REZIDENT.289 1297.773
(77.3%)3.995E-03-2.E-023.1E-02
Sunt 77.3% șanse pentru a obține valoarea 0,289pentru T, în ipoteza că cekle două valori sunt egale
Pentru intervalul de confidență: acesta se înmulțește cu 100 și rezultă că este situat în intervalul –0,02
și 0,31. Întrucât conține valoarea 0, deci e posibil ca diferența dintre cele 2 medii să fie 0, deci nu
putem respinge ip ca cele 2 valori să fie egale
(simbolul E-02 înseamnă înmulțit cu 10 la –2. Ex: 4,1 E2 înseamnă 410)
2. Pentru compararea a două mărimi medii, respectiv proporții. Dacă nivelul de probabilitate
depășește valoarea de 0,95 se respinge ipoteza nulă, ipoteză care , în cazul de față, înseamnă că
mediile sau proporțiile celor 2 populații (din care s-au extras eșantioanele ale căror valori se compară)
sunt identice sau, altfel spus, că cele 2 eșantioane provin din aceeași populație.
Ex: pp că într-o anchetă s-a studiat câte un eșantion din 2 județe și s-a stab că în cazul primului , pe
un eș de 700 de oam 25,8% votau cu X, iar pe al doilea, pe un eș de 1300 pt X votau 21,3%. Există o
diferență de atitudine? Ipoteza nulă este pp că populațiile celor 2 județe sunt identice, din punctul de
vedere analizat, și că diferența dintre procentele 25,8 și 21,3 se datorează fluctuațiilor normale de
eșantionare. După calcule ajungem la T=2,25, deci se depaseste val critică de 1,96%, pt pragul de
probabilitate de 0,95. P este 0.9756, deci vom respinge ipoteza nulă pt că există 97,56% șanse ca
realmente în prima populație partidul nostru să aibă mai mulți aderenți decât în a doua.
Testarea semnificației coeficientului de corelație
Trebuie să se testeze valorile mici ale coeficientului de corelație, adică dacă se obține pe
eșantion o anumită corelație, ea se regăsește (cu același semn) la nivelul populației.
5

Testul hi pătrat p.108
Teste de semnificație pentru eșantioane mici:
Testul t Este corespondentul testului Z, utilizabil în judecarea diferențelor dintre 2 valori medii sau
proporții, pt cazul când numărul indivizilor din eșantion este mic (nu mai mare de 60), t= (a-b)/e
A și b sunt cele 2 valori care se compară, dintre care cel puțin una e obținută pe eșantion, iar e este
eroarea standard, calculată la fel ca mai înainte, numai că la numitor se pune n-1 în loc de n
Semnificația coeficienților de corelație se pune cu mult mai multă acuitate în cazul eșantioanelor
mici…?
Testul Fisher
Procedură prin care se decide dacă dispersia unei caracteristici este diferită în 2 populații
reprezentate prin 2 eșantioane mici.
Cap. 6 Asocierea caracteristicilor calitative
Metodele statistice se împart în nonparamertice ( calitative, având la baza caracteristici
construite pe scala nominală sau ordinală) și cele parametrice, ( cantitative, când se lucrează cu
caracteristici construite pe scale de intervale sau de rapoarte).
Asocierea este realizată atunci când distribuția simultană a indivizilor statistici după 2 sau mai
multe caracteristici calitative, adică variabile nominale sau ordinale. (asocierea este sinonimă cu
contingența –grup de oameni având o compoziție omogenă-). Asocierea evidențiază comportamentul
simultan al indivizilor față de cele 2 variabile, induce oarecum ideea de abordare simetrică a factorilor
studiați.
Un tabel de contingență este cel în care ne permite analiza comportamentului indivizilor în
funcție de o variabilă, în măs în care, după cealaltă var, sunt identici.
Etapele asocierii:
-analiza bivariată (asocierea a 2 caracteristici)
o2 caracteristici (dihotomice)
O caracteristică dih e una care decupează din mulțimea indivizilor pe aceia care posedă o anumită
proprietate, distingându-i de cei care nu o posedă.
De ex. sexul, și orice var calitativă. Având 2 var dih, indivizii ce formează populația statistică se
repartizează în 4 categorii. Pe prima diagonală asocierea este pozitivă, în timp ce pe a doua diagonală,
asocierea este negativă. Astfel, legătura dintre variabile poate avea intensități diferite. De aceea, după
descoperirea existenței sau nu a unei asocieri , este calcularea unui coeficient care să măsoare această
intensitate.
Coeficienții de asociere: (0-lipsa asocierii,1-asociere maximă), (+1 e pt asoc poz,-1 e pt asoc neg)
Asocierea perfectă nu se poate realiza decât în cazul în care distribuțiile de frecvențe ale celor 2 var
luate separat coincid. În principiu, coeficienții propuși pt măsurarea asocierii pot fi simetrici (se
încearcă o măsurare globală a relației statistice între cele 2 var) și asimetrici (pozițiile variabilelor nu
sunt identice, una fiind considerată anterioară, independentă sau predictivă în raport cu cealaltă). Nici
o rel statistică ne este o garanție pt existența unei relații reale de determinare sau de cauzalitate între
fenomenele sociale transpuse în formă statistică. Coeficienți de asociere pentru caracteristicile
dihotomice:
– coeficientul fi concentrarea valorilor pe prima diagonală, înseamnă că coef vor
primi val pozitivă
– coeficientul Yule (ia val între –1 și +1), se anulează în cazul în care variabilele sunt statistic
independente
– coeficientul Y
(Putem vorbi de un sens al asocierii numai pt că am presupus că o clasă desemnează prezența unui
atribut , iar cealaltă absența acestuia, semnul + se atribuie în caz de concordanță , adică prezență sau
absență simultană a atributelor. Astfel am interpretat practic caracteristica dihotomică drept o
variabilă ordinală)
6

ovariabile categoriale (religie, naționalitate)
Două caracteristici a căror structură o constituie un sistem de clase, în număr superior lui 2, clase care
pot fi stări calitative propriu-zise (deci trepte ale unei scale nominale) sau stări calitative rezultate
dintr-o reducție de scală, în sensul că se renunță la ordonarea claselor sau a intervalelor de valori. Deci
nu introducem nici o ipoteză asupra sistemului de categorii, situându-ne în situația variabilelor
nominale. Nu mai putem vorbi de un sens al asocierii, toți coeficiențiivor fi pozitivi, mișcându-se pe
intervalul (0,1). Existența asocierii se stabilește, ca și mai înainte prin apelul la situația de
independență.
Măsurarea asocierii se realizează prin mai mulți indici:
-Coeficientul de contingență C (al lui Pearson). Acesta nu se poate apropia de valoarea 1 decât
dacă tabelul este din ce în ce mai mare
-Coeficientul V al lui Cramer
-Coeficientul Lambda: se definește ca proporția cu care se reduc erorile , prin introducerea var
independente. Neajunsul acestui copeficient este că el se poate anula și în cazul existenței
unei asocieri.
-Coeficientul Tau
-Coeficientul de incertitudine U. Acest coef uzează de noț de entropie: gradul de
nedeterminare sau de incertitudine față de plasarea indivizilor în categoriile respectivei
caracteristici
ovariabile ordinale
Există o ordine a claselor caracteristicii, ceea ce implică, pe de o parte, necesitatea de a vorbi de un
sens al asocierii, observând dacă există o concordanță sau discordanță legată de ordonările respective.
Indicatori:
-coeficienții lui Kendall
-Coeficientul gama (+1 dacă nu e nici o discordanță, -1 dacă nr concordanțelor e nul și 0 dacă
nr concordanțelor egal nr discordanțelor)
-analiza multivariată (asocierea simultană a mai multor caracteristici)
Este orice procedură statistică de evidențiere și evaluare a rel dintre 3 sau mai multe caracteristici,
indiferent de tipul scalei pe care s-au construit. Este vorba de caracteristici de tip calitativ,
variabile categoriale. Ideea analizei multivariate este că prin modele statistice adecvate se pot
reproduce condițiile experimentului, adică o relație dintre 2 var (cauză-efect) se validează dacă se
regăsește în situația când sunt controlate (menținute constante) alte variabile.
Putem întâlni o situație în care de ex. factorul „pagubele produse de un incendiu” B este
corelat cu „amploarea mijloacelor materiale și umane folosite de pompieri pt stingerea focului”, A. Cu
toate acestea, A și B derivă din C „gravitatea incendiului”. Utilitatea descoperirii faptului că A și B
sunt consecințe ale lui C este că se va respinge ipoteza unei relații de determinare între A și B.
Un alt subtip este cel în care variabila C este intermediară, el mijlocind influența lui A asupra
lui B. Caracterul ideal al acestui subtip este atunci când toată influența lui A asupra lui B se transmite
prin C.
A C B
Ex: mobilitatea socială: A este originea soc, C niv școlar al indivizilor, iar B este statusul indivizilor
Un alt subtip: var cauzală A și cea test C sunt independente statistic. Lipsa de asociere între A
și C poate fi naturală sau artificială. De ex dacă ne interesează inf vârstei tineri-vârstnici (A) asupra
asupra atitudinii politice B: (st-dr), luând ca variabilă test mediul urban sau rural, și știind că mediul
rural diferă mult de cel urban în privința reprezentării pe vârste. Cerința este ca lotul experimental să
coincidă cu cel de control, din pdv al caract C: „elaborare de relații parțiale”. Sunt evidențiate 2
subtipuri:
-C anterior lui A
-C intermediar: A stimul, B răspuns, C condiție
7

Similar Posts