Analiza Statistica Metoda de Cunoastere a Fenomenelor
Cuprins
Introducere
Analiza statistică – metodă de cunoaștere a fenomenelor
Obiectul statisticii este reprezentat de fenomenele din natură și societate. Cercetarea acestora permite determinarea unor caracteristici definitorii prin intermediul statisticii descriptive sau a unor legități care dirijează modul de manifestare a proceselor studiate cu ajutorul statisticii inferențiale.
Legături între fenomene
Conform Dicționarului explicativ al limbii române noțiunea de legătură reprezintă „un mod de reunire, de asamblare a două corpuri prin care se limitează mobilitatea lor relativă și carepermite, de obicei, transmiterea unor mișcări de la unul la celălalt”. În ceea ce privește legătura statistică, aceasta reflectă dependența unui fenomen de altul, evoluțiile cărora nu pot fi desprinse una de cealaltă.
Așadar, o posibilitate de clasificare a legăturilor este dupa forma de manifestare a relațiilor existența între fenomene:
Legături funcționale – caracterizate de univocitate, fiind prezente între un fenomen-cauză și un fenomen-efect, deterministe. Reprezentarea matematică:
Legături statistice – care mai poartă și denumirea de legături stochastice, nedeterministe. Ele reflectă existența mai multor cauze în situații și condiții variate. Reprezentarea matematică:
Altă criteriu de clasificare este numărul variabilelor înregistrate:
Legături unifactoriale – care au doar un singur fenomen drept cauză (factor)
Legături multifactoriale – determinate de mai mulți factori
Al treilea criteriu este direcția legăturii, legăturile fiind de două tipuri:
Legături directe – evoluția fenomenelor are loc în aceeași direcție (creșterea unui proces determină creșterea celuilalt proces)
Legături inverse – evoluția fenomenelor este direcționată în sens opus (creșterea fenomenului-cauză determină descreșterea fenomenului-efect)
După funcția analitică prin intermediul căreia pot fi reprezentate avem:
Legături liniare – pot fi caracterizate de o funcție liniară
Legături neliniare – caracterizate de o funcție parabolică, exponențială sau hiperbolică
După timpul de producere pot fi determinate alte două tipuri de legături:
Sincrone – care se produc în același interval de timp
Asincrone – se referă la exitența decalajului dintre fenomenul-cauză și fenomenul-efect
I.2. Corelația
Corelația, în conformitate cu definiția dată de dicționar, reprezintă o „ relație, legătură reciprocă între două sau mai multe lucruri sau fenomene; relație în care unul dintre termeni nu poate exista fără celălalt”.
Din punct de vedere statistic, corelația este folosită pentru cercetarea și demonstrarea legăturilor dintre fenomene, variabile, procese. De asemenea, aceasta prevede descrierea legăturii identificate prin intermediul unei funcții analitice.
I.3. Caracteristicile corelației
Corelația poate fi caracterizată de câteva trăsături definitorii: direcția, forma și gradul de asociere. Ca și în cazul legăturilor, direcția determină două tipuri de corelații, pozitivă sau negativă, ceea ce presupune evoluția fenomenelor studiate în aceeași direcție sau diametral opusă.
Forma corelației se referă la tipul funcției ce o poate descrie, adică liniară sau neliniară.
Gradul de asociere reprezintă o mărime ce poate lua valori din intervalul închis [-1;1], modulul acestuia sau valoarea absolută reflectă puterea de asociere a fenomenelor.
-1……………………………………………………..0………………………………………………………1
Asociere negativă
Asociere zero(lipsă)
Asociere pozitivă
I.4. Coeficienți de corelație
O posibilă sursă de confuzie este procesul de determinare a procedurilor statistice necesare de utilizat în analiza datelor – parametrice sau neparametrice. Importanța acestei etape nu poate fi subestimată, deoarece studiul efectuat se va baza pe proceduri incorecte sau puțin reprezentative.
Distincția de bază dintre parametric și neparametric:
a) Dacă scara de măsurare este de tip nominal sau ordinal, atunci utilizați statistici non-parametrice
b) Dacă utilizați scară de tip interval sau raport, atunci utilizați statisticile parametrice
Este recomandat, de asemenea, de verificat normalitatea distribuției și omogenitatea dispersiei pentru cazul în care datele sugerează utilizarea statisticilor parametrice.
Corelații parametrice:
coeficientul de corelație simplă – numit și Bravais-Pearson sau coeficientul r de ordinul zero, are intervalul de valori cuprins între [-1;1], unde valoarea zero atestă lipsa legăturii. Condiții de indeplinit: datele să fie numerice care definesc o relație liniară, indicând o situașie de homoscedasticitate.
Unde și sunt mediile eșantioanelor X și Y, iar Sx și Sy sunt abaterea standard ale eșantioanelor X și Y.
coeficientul de corelație parțială – presupune existența unei influențe externe, pe care o considerăm constantă, asupra relației dintre cele două fenomene. De obicei, acesta nu este încadrat în statisticile multivariate.
Unde variabilele sunt notate cu 1, 2 și 3, cercetând corelația dintre 1 și 2 când este eliminat 3; iar r12, r23, r13 indică doar corelațiile între perechile respective.
coeficientul de corelație biserial și triserial – este folosit în cazul unei corelații dintre o variabilă scalară cu o variabilă nominală (dihotomială).
Unde M1 este valoarea medie a variabilei continue X pentru toate datele din grupul 1(în număr de n1), M0 – valoarea medie a variabilei X pentru toate datele din grupul 2(în număr de n0), iar Sn – abaterea standard.
coeficientul de corelație eneahoric – utilizat în cazul grupării datelor continue în trei clase (inferior-mediu-superior, sub medie-medie-peste medie, dezacord-neutru-acord,etc.), situație în care zona de interes sunt doar extremele extrase în tabele diferite.
Corelații neparametrice:
coeficientul de contingență C a lui Pearson pentru date categoriale nominale – este interpretat ca o măsură simetrică a unei asocieri relative ca putere dintre două variabile. În general, poate fi utilizat pentru tabele n*m, neținându-se cont de tipul datelor.
Unde n este numărul înregistrărilor variabilei X.
coeficientul de corelație φ – pentru variabile dihotomice de tip 2*2
Unde n este numărul înregistrărilor variabilei X.
coeficientul V a lui Cramer pentru date categoriale nominale – util pentru compararea testului χ2 multiplu și poate fi generalizat pentru tabele de diferite dimensiuni. Se folosește în cazul în care se bănuiește că χ2 este semnificativ statistic datorită dimensiunilor mari ale eșantionului în loc de de orice relație substanțială între variabile.
Unde q este cel mai mic număr de rânduri sau coloane necesare calculului, iar n este numărul înregistrărilor variabilei X.
coeficientul τ a lui Kendall – folosit pentru date ordinale
Unde ;
;
2;
numărul de perechi concordante
numărul de perechi discordante
numărul de valori legate în grupul i pentru prima cantitate
numărul de valori legate în grupul j pentru a doua cantitate
testul Spearman al corelației diferenței rangurilor – utilizat pentru date ordinale
Unde și reprezintă convertirea variabilelor Xi și Yi în ranguri.
I.5. Regresia liniară
Analiza statistică bazată pe regresia liniară este cea mai utilizată metodă dintre toate tehnicile statistice: aceasta reflectă studiul relațiilor liniare, aditive dintre variabile.
Fie Y notată variabila dependentă ale cărei valori necesită a fi studiate, prezise, determinate, etc., iar X – notată variabila independentă de la care derivă Y.
Expresia matematică care descrie acest fenomen este:
Unde , – sunt parametrii funcției liniare (panta liniei fiind b și interceptul fiind a)
– variabila reziduală, referindu-se la ceilalți factori/variabile de influență minoră.
Înainte de a încerca utilizarea unui model liniar de regresie pentru datele observate, trebuie să se stabilească mai întâi dacă există sau nu o relație între variabilele de interes. Acest lucru nu înseamnă neapărat că o variabilă determină altă variabilă, dar poate există o anumită asociere semnificativă între cele două variabile.
Considerente privind calculul mărimilor relative
Mărimile relative reprezintă un mijloc de a exprima o valoare absolută a unui element, atunci când valoarea lui reală nu este considerată relevantă pentru comparare, studiu, determinarea unei evoluții, etc. Cu alte cuvinte mărimile relative semnifică prezentarea unui indicator față de altul, luat drept bază de raportare, obținând proporția primului vis-a-vis de al doilea.
Formula matematică care definește mărimile relative generale:
Unde z este mărimea relativă, x este indicatorul raportat, y – indicatorul bază de raportare, iar k de tip întreg, determină forma de exprimare (dacă k=0‚ se exprimă în coeficienți; k=2, se exprimă în procente; etc.)
Alegerea bazei de raportare
În conformitate cu nivelul de dependență dintre variabilele/fenomenele propuse spre cercetare se identifică baza de raportare potrivită.
II.2. Asigurarea compatibilității datelor
Comparabilitatea datelor se referă la perioada sau intervalul de timp studiat, modalitățile de calcul ale indicatorilor derivați din datele inițiale, precum și respectarea regulilor și legităților statistice corespunzătoare.
II.3. Alegerea formei de exprimare
Relevanța și sugestivitatea mărimilor relative trebuie asigurate prin forma de exprimare a acestora, posibilitățile fiind:
Fracțiile zecimale și/sau ordinare
Procente, prodecimile, promile și alte variațiuni ale acestora
Numere întregi
II.4. Tipuri de mărimi relative
Există cinci tipuri principale de mărimi relative care pot fi utilizate în analiza datelor, acestea fiind:
De dinamică – indică evoluția unui fenomen/indicator pe parcursul unei anumite perioade de timp de interes.
Cu bază fixă – situația în care perioada la care se face referință este aceeași pentru toate etapele calcului marimilor relative și este notată cu .
Cu bază mobilă – situația în care perioada la care se face referință este precedenta pentru toate etapele calcului marimilor relative și este notată cu .
De structură – se referă la ponderea unui indicator/fenomen ca parte din întreg, cu condiția că anterior întregul a fost clasificat, grupat, sistematizat pe părți.
De intensitate – se determină în cazul unor relații sau asocieri logice dintre indicatorii propuși spre calcul
De comparare, numite și de coordonare – se propune în cazul apariției necesității de a evidenția corespondența dintre două grupe ale aceluiași indicator
Ale planului, cunoscute ca și ale prevederilor – oferă o imagine reprezentativă asupra nivelului de activitate, reflectând procentajul de realizare a planului sau procentajul prognozat pentru a fi realizat.
Pentru sarcina programată:
Pentru realizarea programului:
Pachetul SPSS
Ferestre
III.2. Meniu
III.3. Concepte statistice în analiza datelor
Aplicație practică
Extragerea datelor
IV.2. Prelucrarea datelor
IV.3. Transferul datelor
IV.4. Definirea variabilelor
IV.5. Analiza datelor
IV.5.1. Analiza descriptivă a productivității
IV.5.2. Analiza descriptivă a câștigului salarial
IV.5.3. Calculul indicilor de dinamică
IV.5.4. Determinarea corelației dintre productivitate și câștigul salarial
IV.5.5. Determinarea legăturii dintre productivitate și câștigul salarial
Concluzii
Bibliografie
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Analiza Statistica Metoda de Cunoastere a Fenomenelor (ID: 136286)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
