Analiza Statistica Metoda de Cunoastere a Fenomenelor

Cuprins

Introducere

Analiza statistică – metodă de cunoaștere a fenomenelor

Obiectul statisticii este reprezentat de fenomenele din natură și societate. Cercetarea acestora permite determinarea unor caracteristici definitorii prin intermediul statisticii descriptive sau a unor legități care dirijează modul de manifestare a proceselor studiate cu ajutorul statisticii inferențiale.

Legături între fenomene

Conform Dicționarului explicativ al limbii române noțiunea de legătură reprezintă „un mod de reunire, de asamblare a două corpuri prin care se limitează mobilitatea lor relativă și carepermite, de obicei, transmiterea unor mișcări de la unul la celălalt”. În ceea ce privește legătura statistică, aceasta reflectă dependența unui fenomen de altul, evoluțiile cărora nu pot fi desprinse una de cealaltă.

Așadar, o posibilitate de clasificare a legăturilor este dupa forma de manifestare a relațiilor existența între fenomene:

Legături funcționale – caracterizate de univocitate, fiind prezente între un fenomen-cauză și un fenomen-efect, deterministe. Reprezentarea matematică:

Legături statistice – care mai poartă și denumirea de legături stochastice, nedeterministe. Ele reflectă existența mai multor cauze în situații și condiții variate. Reprezentarea matematică:

Altă criteriu de clasificare este numărul variabilelor înregistrate:

Legături unifactoriale – care au doar un singur fenomen drept cauză (factor)

Legături multifactoriale – determinate de mai mulți factori

Al treilea criteriu este direcția legăturii, legăturile fiind de două tipuri:

Legături directe – evoluția fenomenelor are loc în aceeași direcție (creșterea unui proces determină creșterea celuilalt proces)

Legături inverse – evoluția fenomenelor este direcționată în sens opus (creșterea fenomenului-cauză determină descreșterea fenomenului-efect)

După funcția analitică prin intermediul căreia pot fi reprezentate avem:

Legături liniare – pot fi caracterizate de o funcție liniară

Legături neliniare – caracterizate de o funcție parabolică, exponențială sau hiperbolică

După timpul de producere pot fi determinate alte două tipuri de legături:

Sincrone – care se produc în același interval de timp

Asincrone – se referă la exitența decalajului dintre fenomenul-cauză și fenomenul-efect

I.2. Corelația

Corelația, în conformitate cu definiția dată de dicționar, reprezintă o „ relație, legătură reciprocă între două sau mai multe lucruri sau fenomene; relație în care unul dintre termeni nu poate exista fără celălalt”.

Din punct de vedere statistic, corelația este folosită pentru cercetarea și demonstrarea legăturilor dintre fenomene, variabile, procese. De asemenea, aceasta prevede descrierea legăturii identificate prin intermediul unei funcții analitice.

I.3. Caracteristicile corelației

Corelația poate fi caracterizată de câteva trăsături definitorii: direcția, forma și gradul de asociere. Ca și în cazul legăturilor, direcția determină două tipuri de corelații, pozitivă sau negativă, ceea ce presupune evoluția fenomenelor studiate în aceeași direcție sau diametral opusă.

Forma corelației se referă la tipul funcției ce o poate descrie, adică liniară sau neliniară.

Gradul de asociere reprezintă o mărime ce poate lua valori din intervalul închis [-1;1], modulul acestuia sau valoarea absolută reflectă puterea de asociere a fenomenelor.

-1……………………………………………………..0………………………………………………………1

Asociere negativă

Asociere zero(lipsă)

Asociere pozitivă

I.4. Coeficienți de corelație

O posibilă sursă de confuzie este procesul de determinare a procedurilor statistice necesare de utilizat în analiza datelor – parametrice sau neparametrice. Importanța acestei etape nu poate fi subestimată, deoarece studiul efectuat se va baza pe proceduri incorecte sau puțin reprezentative.

Distincția de bază dintre parametric și neparametric:

a) Dacă scara de măsurare este de tip nominal sau ordinal, atunci utilizați statistici non-parametrice

b) Dacă utilizați scară de tip interval sau raport, atunci utilizați statisticile parametrice

Este recomandat, de asemenea, de verificat normalitatea distribuției și omogenitatea dispersiei pentru cazul în care datele sugerează utilizarea statisticilor parametrice.

Corelații parametrice:

coeficientul de corelație simplă – numit și Bravais-Pearson sau coeficientul r de ordinul zero, are intervalul de valori cuprins între [-1;1], unde valoarea zero atestă lipsa legăturii. Condiții de indeplinit: datele să fie numerice care definesc o relație liniară, indicând o situașie de homoscedasticitate.

Unde și sunt mediile eșantioanelor X și Y, iar Sx și Sy sunt abaterea standard ale eșantioanelor X și Y.

coeficientul de corelație parțială – presupune existența unei influențe externe, pe care o considerăm constantă, asupra relației dintre cele două fenomene. De obicei, acesta nu este încadrat în statisticile multivariate.

Unde variabilele sunt notate cu 1, 2 și 3, cercetând corelația dintre 1 și 2 când este eliminat 3; iar r12, r23, r13 indică doar corelațiile între perechile respective.

coeficientul de corelație biserial și triserial – este folosit în cazul unei corelații dintre o variabilă scalară cu o variabilă nominală (dihotomială).

Unde M1 este valoarea medie a variabilei continue X pentru toate datele din grupul 1(în număr de n1), M0 – valoarea medie a variabilei X pentru toate datele din grupul 2(în număr de n0), iar Sn – abaterea standard.

coeficientul de corelație eneahoric – utilizat în cazul grupării datelor continue în trei clase (inferior-mediu-superior, sub medie-medie-peste medie, dezacord-neutru-acord,etc.), situație în care zona de interes sunt doar extremele extrase în tabele diferite.

Corelații neparametrice:

coeficientul de contingență C a lui Pearson pentru date categoriale nominale – este interpretat ca o măsură simetrică a unei asocieri relative ca putere dintre două variabile. În general, poate fi utilizat pentru tabele n*m, neținându-se cont de tipul datelor.

Unde n este numărul înregistrărilor variabilei X.

coeficientul de corelație φ – pentru variabile dihotomice de tip 2*2

Unde n este numărul înregistrărilor variabilei X.

coeficientul V a lui Cramer pentru date categoriale nominale – util pentru compararea testului χ2 multiplu și poate fi generalizat pentru tabele de diferite dimensiuni. Se folosește în cazul în care se bănuiește că χ2 este semnificativ statistic datorită dimensiunilor mari ale eșantionului în loc de de orice relație substanțială între variabile.

Unde q este cel mai mic număr de rânduri sau coloane necesare calculului, iar n este numărul înregistrărilor variabilei X.

coeficientul τ a lui Kendall – folosit pentru date ordinale

Unde ;

;

2;

numărul de perechi concordante

numărul de perechi discordante

numărul de valori legate în grupul i pentru prima cantitate

numărul de valori legate în grupul j pentru a doua cantitate

testul Spearman al corelației diferenței rangurilor – utilizat pentru date ordinale

Unde și reprezintă convertirea variabilelor Xi și Yi în ranguri.

I.5. Regresia liniară

Analiza statistică bazată pe regresia liniară este cea mai utilizată metodă dintre toate tehnicile statistice: aceasta reflectă studiul relațiilor liniare, aditive dintre variabile.

Fie Y notată variabila dependentă ale cărei valori necesită a fi studiate, prezise, determinate, etc., iar X – notată variabila independentă de la care derivă Y.

Expresia matematică care descrie acest fenomen este:

Unde , – sunt parametrii funcției liniare (panta liniei fiind b și interceptul fiind a)

– variabila reziduală, referindu-se la ceilalți factori/variabile de influență minoră.

Înainte de a încerca utilizarea unui model liniar de regresie pentru datele observate, trebuie să se stabilească mai întâi dacă există sau nu o relație între variabilele de interes. Acest lucru nu înseamnă neapărat că o variabilă determină altă variabilă, dar poate există o anumită asociere semnificativă între cele două variabile.

Considerente privind calculul mărimilor relative

Mărimile relative reprezintă un mijloc de a exprima o valoare absolută a unui element, atunci când valoarea lui reală nu este considerată relevantă pentru comparare, studiu, determinarea unei evoluții, etc. Cu alte cuvinte mărimile relative semnifică prezentarea unui indicator față de altul, luat drept bază de raportare, obținând proporția primului vis-a-vis de al doilea.

Formula matematică care definește mărimile relative generale:

Unde z este mărimea relativă, x este indicatorul raportat, y – indicatorul bază de raportare, iar k de tip întreg, determină forma de exprimare (dacă k=0‚ se exprimă în coeficienți; k=2, se exprimă în procente; etc.)

Alegerea bazei de raportare

În conformitate cu nivelul de dependență dintre variabilele/fenomenele propuse spre cercetare se identifică baza de raportare potrivită.

II.2. Asigurarea compatibilității datelor

Comparabilitatea datelor se referă la perioada sau intervalul de timp studiat, modalitățile de calcul ale indicatorilor derivați din datele inițiale, precum și respectarea regulilor și legităților statistice corespunzătoare.

II.3. Alegerea formei de exprimare

Relevanța și sugestivitatea mărimilor relative trebuie asigurate prin forma de exprimare a acestora, posibilitățile fiind:

Fracțiile zecimale și/sau ordinare

Procente, prodecimile, promile și alte variațiuni ale acestora

Numere întregi

II.4. Tipuri de mărimi relative

Există cinci tipuri principale de mărimi relative care pot fi utilizate în analiza datelor, acestea fiind:

De dinamică – indică evoluția unui fenomen/indicator pe parcursul unei anumite perioade de timp de interes.

Cu bază fixă – situația în care perioada la care se face referință este aceeași pentru toate etapele calcului marimilor relative și este notată cu .

Cu bază mobilă – situația în care perioada la care se face referință este precedenta pentru toate etapele calcului marimilor relative și este notată cu .

De structură – se referă la ponderea unui indicator/fenomen ca parte din întreg, cu condiția că anterior întregul a fost clasificat, grupat, sistematizat pe părți.

De intensitate – se determină în cazul unor relații sau asocieri logice dintre indicatorii propuși spre calcul

De comparare, numite și de coordonare – se propune în cazul apariției necesității de a evidenția corespondența dintre două grupe ale aceluiași indicator

Ale planului, cunoscute ca și ale prevederilor – oferă o imagine reprezentativă asupra nivelului de activitate, reflectând procentajul de realizare a planului sau procentajul prognozat pentru a fi realizat.

Pentru sarcina programată:

Pentru realizarea programului:

Pachetul SPSS

Ferestre

III.2. Meniu

III.3. Concepte statistice în analiza datelor

Aplicație practică

Extragerea datelor

IV.2. Prelucrarea datelor

IV.3. Transferul datelor

IV.4. Definirea variabilelor

IV.5. Analiza datelor

IV.5.1. Analiza descriptivă a productivității

IV.5.2. Analiza descriptivă a câștigului salarial

IV.5.3. Calculul indicilor de dinamică

IV.5.4. Determinarea corelației dintre productivitate și câștigul salarial

IV.5.5. Determinarea legăturii dintre productivitate și câștigul salarial

Concluzii

Bibliografie

Similar Posts