Utilizarea Sondajului In Caracterizarea Fenomenelor Economico Sociale

=== l ===

Cuprins

TEMA PROIECTULUI

Un agent economic dispune de o rețea de unități economice cu profilul alimentație publică în care sunt angajați 500 de vânzători.

Pentru cei 500 de vânzători, considerați ca o colectivitate generală, s-a întocmit o bază de sondaj. Înscrierea în baza de sondaj a vânzătorilor s-a făcut în ordine alfabetică, ceea ce constituie un criteriu aleator și li s-a dat un cod (nr. crt.).

Considerând cei 500 de vânzători ca formând o colectivitate statistică se cere:

să se extragă printr-un procedeu de sondaj un eșantion de 60 de unități și să se centralizeze nivelurile individuale ale fiecăruia din variabilele prezentate potrivit conținutului lor;

să se grupeze datele înregistrate la punctul precedent folosind grupările simple pentru toate caracteristicile înregistrate pe intervale egale și neegale (se vor folosi minim 8 grupe pentru intervale egale și minim 3 grupe pentru intervale neegale) și să se centralizeze datele condiționate de grupările folosite. Să se reprezinte grafic seriile obținute,

să se calculeze toate mărimile relative posibile și să se reprezinte grafic mărimile obținute folosind diagramele adecvate;

să se calculeze indicatorii tendinței centrale, indicatorii variației și ai asimetriei pentru variabilele înregistrate;

să se aplice regula adunării dispersiilor pentru tabelul cu dublă intrare obținut prin gruparea combinată;

să se extindă rezultatele obținute asupra întregii colectivități pentru două variabile dacă P = 0,9973 (z = 3);

să se aplice metoda corelației și regresiei pentru datele din eșantion. Să se măsoare gradul de intensitate al corelației. Pentru date grupate se vor lua în calcul primele 10 unități din eșantion, la care se vor calcula și coeficienții de corelație a rangurilor.

Extragerea eșantionului

1. Din baza de sondaj se extrage un eșantion format din 60 de vânzători. La extragere s-a folosit procedeul selecției mecanice cu pas de numărare egal cu 8 și prima unitate extrasă … .

S-au înregistrat datele privind sexul, vârsta (ani), zile lucrate, ore lucrate, valoarea desfacerilor lunare (lei) și salariul net lunar (lei) din luna februarie 2009.

Interpretare…..

Gruparea datelor înregistrate

Gruparea pe intervale de variație egale

Gruparea datelor înregistrate

Gruparea pe intervale de variație egale

Gruparea pe intervale egale implică următoarele etape:

calculul amplitudinii absolute de variației (A) care exprimă împrăștierea maximă a valorilor serei.

Axa = Xmax – Xmin;

Dacă variația este foarte mică (în cazul nostru Axa 10) se va forma o distribuție pe variante (valabil în cazul caracteristicilor: vârsta; zile lucrate).

b) stabilirea în parametrii într-un anumit număr de grupe (r) se poate stabili astfel:

dacă variația caracteristicii este relativ uniformă și volumul de unități nu este suficient de mare numărul de grupe se poate fixa anterior (din cerințele proiectului se vor folosi minimul 8 grupe pentru intervale egale);

iar dacă numărul grupelor nu este anterior cunoscut și volumul unităților este suficient de mare se recomandă stabilirea grupelor conform relației lui Sturgers,

r = 1+3,322log n

unde: n – nr. caracteristicilor.

c)determinarea mărimii intervalului de grupare (h), se calculează ca raport între amplitudinea absolută a variației și numărul de grupe:

sau

Notă: Mărimea intervalului (h) se rotunjește la întreg în plus (ex.3,254)

Prima grupă se pornește de la xmin adăugându-se succesiv mărimea intervalului de grupare (h) rezultat din calculul anterior. Valoarea din stânga intervalului va fi considerată ca limită inferioară, iar valoarea din dreapta ca limită superioară. Valorile care formează limitele intervalelor se înregistrează fie numai ca limită superioară fie ca limită inferioară pentru a evita înregistrări duble a caracteristicilor.

Analog se rezolvă pentru orice variabilă.

2A. Gruparea pe intervale egale a vânzătorilor după vârstă

a) Amplitudinea variației Axa = Xmax – Xmin =

Repartiția vânzătorilor după vârstă

Reprezentarea grafică a repartiției vânzătorilor după vârstă se ilustrează prin poligonul frecvențelor și prin curba cumulativă a frecvențelor.

2B. Gruparea pe intervale egale a vânzătorilor după zile lucrate

a) Amplitudinea variației Axa = Xmax – Xmin =

Se obține o distribuție formată din variante.

Repartiția vânzătorilor după numărul zilelor lucrate

Repartizarea grafică a repartiției vânzătorilor după zilele lucrate se ilustrează prin poligonul frecvențelor și prin curba cumulativă a frecvențelor

2C. Gruparea pe intervale egale a vânzătorilor după ore lucrate

a) Amplitudinea variației Axa = Xmax -Xmin =

b) Nr. de grupe r = 8

c) Mărimea intervalului h =

Repartiția vânzătorilor după numărul de ore lucrate

Nota: Limita superioară este inclusă în interval.

Repartizarea grafică a repartiției vânzătorilor după numărul de ore lucrate se ilustrează prin poligonl frecvențelor și prin curba cumulativă a frecvențelor.

2D. Gruparea pe intervale egale a vânzătorilor după valoarea desfacerilor lunare

a) Amplitudinea variației Axa = Xmax -Xmin

b) Nr. de grupe r = 8

c) mărimea intervalului h

Repartiția vânzătorilor după valoarea desfacerii lunare (lei)

Notă: Limita superioră inclusă în interval

Repartizarea grafică a repartiției vânzătorilor după valoarea desfaceri lunare se ilustrează prin poligunul frecvențelor și curba cumulativă a frecvențelor.

2E. Gruparea pe intervale egale a vânzătorilor după salariul net lunar

a) Amplitudinea variației Axa = Xmax -Xmin =

b) Nr. de grupe r = 8

c) mărimea intervalului h

Repartiția vânzătorilor în funcție de salariul net lunar (lei)

Notă: Limita superioară inclusă în interval

Centralizarea valorilor după salariul net lunar s-a obținut la fel ca și la orele lucrate.

Repartizarea grafică a repartiției vânzătorilor după salariul net lunar, se ilustreză prin poligonul frecvențelor și curba cumulativă a frecvențelor.

Gruparea pe intervale egale permite structurarea colectivității pe grupe cât mai omogene, iar gruparea statistică este cea mai semnificativă modalitate a sistemetizării datelor după o caracteristică numerică sau nominativă.

Sistematizarea datelor printr-o grupare pe intervale egale răspunde necesității de sistematizare și omogenizare a datelor unei observații statistice de masă și a caracterizării independente a fiecărei variabile din propria observare.

Gruparea pe intervale de variație neegale

Pentru analiza structurii colectivității pe grupe tipice se folosește gruparea pe intervale neegale.

Gruparea pe intervale neegale presupune regruparea intervalelor egale.

Un prim principiu al grupării pe intervale neegale este trecerea de la variația lineară (interval de mărime constantă) la variația neuniformă a unor intervale de grupare din ce în ce mai mari.

Un alt principiu de grupare are în vedere separarea unităților pe trei grupe: mici, mijlocii și mari.

2.2.A Gruparea pe intervale neegale a vânzătorilor după vârstă

Nivelul mediu

2.2.B. Gruparea pe intervale neegale a vânzătorilor după zilele lucrate

Nivelul mediu

2.2.C. Gruparea pe intervale neegale a vânzătorilor după orele lucrate

Nivelul mediu

Notă: Limita superioară inclusă în interval

2.2.D. Gruparea pe intervale neegale a vânzătorilor după valoarea desfacerii

Nivelul mediu

Notă: Limita superioară inclusă în interval

2.2.E. Gruparea pe intervale neegale a vânzătorilor după salariu net

Nivelul mediu

Notă: Limita superioară inclusă în interval

2.2.F. Gruparea vânzătorilor după sex (gruparea după o variabilă calitativă)

Pentru reprezentarea grafică s-a folosit diagrama de structură

Structura pe sexe se determină conform relației:

2.2.G. Gruparea combinată a vânzătorilor după ore lucrate și salarii

Distribuțiile bidimensionale cu frecvențe se reprezintă grafic prin diagrama norului de puncte (corelogramă)

CALCULUL MĂRIMILOR RELATIVE DE STRUCTURĂ

Din cele 5 mărimi relative întâlnite în statistică, în proiectul de față se pot determina trei:

3.1. Mărimile relative de structură se obțin ca raport între parte și întreg. Forma cea mai obișnuita de exprimare a mărimilor relative de structură este cea a procentelor care arată câte unității din indicatorul raportat revin la 100 unități ale indicatorului bază de raportare. Se pot calcula atât pe baza frecvențelor absolute și în acest caz au sens de frecvențe relative ()

cât și pe baza valorilor centralizate privind : vârsta, zilele lucrate, orele lucrate, volumul desfacerilor și salariul net, obținându-se în acest caz ponderea sau greutatea specifică () a unei valori () în totalul valorilor colectivității ():

3.2. Mărimile relative de coordonare se obțin ca raport între două grupe sau între două colectivități ce coexistă în spațiu.

Pentru o colectivitate împărțită în două grupe pentru care nivelul pe grupe al variabilei studiate este xA și xB :

sau

Dacă sunt mai multe grupe, se alege una ca bază de comparație și se raportează, pe rând, fiecare grupă la baza aleasă.

3.3. Mărimile relative de intensitate se obțin prin raportarea a doi indicatori cu conținut diferit dar între care există o relație de interdependență.

la nivel parțial: ; la nivelul ansamblului:

3.A Calculul mărimilor relative pe baza repartiției vânzătorilor după vârstă

Repartiția timpului lucrat (în zile și ore), a valorii desfacerii și a fondului de salarii și a

structurii acestora în funcție de vârstă

Interpretare:

Repartiția timpului lucrat (în zile și ore), a valorii desfacerii și a fondului de salarii și a raportului acestora față de grupa celor mai tineri, în funcție de vârstă

Repartiția timpului lucrat (în zile și ore), a valorii desfacerii și a fondului de salarii pe total și în medie pe un vânzător în funcție de vârstă salariatului

Notă: În cazul dat mărimile relative de intensitate au caracter de medie, prin urmare toate valorile obținute sunt valori medii atât la nivel de grupă cât și pe total.

3.D Calculul mărimilor relative pe baza repartiției vânzătorilor după valoarea desfacerii

Repartiția timpului lucrat (în zile și ore) a fondului de salarii și a structurii acestora în funcție de valoarea desfacerii

Repartiția timpului lucrat (în zile și ore), a fondului de salarii și a raportului acestora față de prima grupa, în funcție de valoarea desfacerii

Repartiția timpului lucrat (în zile și ore), a fondului de salarii pe total și în medie pe un vânzător în funcție de valoarea desfacerii

Se va proceda la fel și la repartiția vânzătorilor după: numărul de zile; numărul de ore și salariul net lunar

CARACTERIZAREA STATISTICĂ A REPARTIȚIILOR OBȚINUTE

Caracterizarea statistică în cazul dat se referă la determinarea:

Indicatorilor tendinței centrale:

Media aritmetică

Modul (modulul, dominanta)

Mediana (Me)

Indicatorii sintetici ai variației și ai asimetriei:

Abaterea medie liniară :

Dispersia

Abaterea medie pătratică

Coeficientul de variație (v):

respectiv

Coeficientul de asimetrie

sau

Repartiția vânzătorilor după vârstă

Calculul indicatorilor tendinței centrale:

Media aritmetică

Modul (modulul, dominanta)

Fiind o serie pe variante Mo este valoarea cu frecvența maximă

Mediana (Me)

locul medianei:

Calculul indicatorii sintetici ai variației și ai asimetriei

Dispersia

Abaterea medie pătratică

Coeficientul de variație (v):

v` și v < 35% – seria este omogenă și media este reprezentativă pentru serie

Coeficientul de asimetrie

Rezultă asimetrie

Repartiția vânzătorilor după zilele lucrate

Calculul indicatorilor tendinței centrale:

Media aritmetică

Modul (modulul, dominanta)

Fiind o serie pe variante Mo este valoarea cu frecvența maximă

Mediana (Me)

locul medianei:

Calculul indicatorii sintetici ai variației și ai asimetriei

Dispersia

Abaterea medie pătratică

Coeficientul de variație (v):

v` și v < 35% – seria este omogenă și media este reprezentativă pentru serie

Coeficientul de asimetrie

Rezultă asimetrie moderată

Repartiția vânzătorilor după orele lucrate

Calculul indicatorilor tendinței centrale:

Media aritmetică

Modul (modulul, dominanta)

Fiind o serie pe variante Mo este valoarea cu frecvența maximă

Mediana (Me)

locul medianei:

Variabila 23 ani este prima a cărei frecvență cumulată crescător este mai mare de 30,5

Calculul indicatorii sintetici ai variației și ai asimetriei

Dispersia

Abaterea medie pătratică

Coeficientul de variație (v):

v` și v < 35% – seria este omogenă și media este reprezentativă pentru serie

Coeficientul de asimetrie

Rezultă asimetrie …..

Repartiția vânzătorilor după valoarea desfacerii (lei)

Calculul indicatorilor tendinței centrale:

Media aritmetică

Modul (modulul, dominanta)

Fiind o serie pe variante Mo este valoarea cu frecvența maximă

Mediana (Me)

locul medianei:

Calculul indicatorii sintetici ai variației și ai asimetriei

Dispersia

Abaterea medie pătratică

Coeficientul de variație (v):

v` și v < 35% – seria este omogenă și media este reprezentativă pentru serie

Coeficientul de asimetrie

Rezultă asimetrie …

Repartiția vânzătorilor după salariu net (lei)

Calculul indicatorilor tendinței centrale:

Media aritmetică

Modul

Locul Mo – intervalul cu frecvența maximă

Mediana (Me)

locul medianei:

prin urmare intervalul ) este primul interval a cărei frecvență cumulată crescător este mai mare de 30,5

b) Calculul indicatorii sintetici ai variației și ai asimetriei

Abaterea medie liniară :

Dispersia

Abaterea medie pătratică

Coeficientul de variație (v):

v` și v < 35% – seria este omogenă și media este reprezentativă pentru serie

Coeficientul de asimetrie

Rezultă asimetrie negativă moderată

Pentru interpretarea rezultatelor se vor trece indicatorii obținuți într-un tabel sintetic.

Indicatorii tendinței centrale, de variație totală și de asimetrie pentru variabilele înregistrate în eșantion

APLICAREA REGULII DE ADUNARE A DISPERSIILOR ȘI VERIFICAREA GRADULUI DE SEMNIFICAȚIE A FACTORULUI DE GRUPARE

Mediile de grupă

Media pe total (generală)

– pe baza mediilor de grupă

c. Dispersia de grupă sau dispersia parțială

d. Media dispersiilor de grupă

e. Dispersia dintre grupe

f. Dispersia totală

sau regula de adunare a dispersiilor:

Pe baza regulii de adunare a dispersiilor se pot calcula alți doi indicatori statistici cu caracter de mărimi relative de structură, care exprimă ponderea celor două categorii de factori.

Coeficientul de determinație

Coeficientul de nedeterminație după relația:

Pe baza mediilor și a abaterilor medii pătratice, determinate pe grupe și pe total, se pot obține informații referitoare la gradul de omogenitate al acestora cu ajutorul coeficienților de variație corespunzători, calculați după relațiile:

Coeficientul de variație se calculează ca raport între abaterea medie pătratică și media variabilei respective și se exprimă în procente:

unde

Coeficientul de variație pe total

unde

Pentru interpretarea rezultatelor se vor trece indicatorii obținuți într-un tabel sintetic

Indicatorii tendinței centrale și de variație

Întrucât valoarea coeficientului de variație este mai mică de 35%, putem aprecia că toate cele 8 grupe de salarii nete atribuite după valoarea desfacerii sunt omogen. Dacă ierarhizăm grupele din punct de vedere a omogenității dintre cele mai omogene grupe sunt grupele VI și VII, iar cea mai puțin omogenă este III deoarece aici coeficientul de variație este cel mai mare. Paralel cu aceasta rezultă că media, ca indicator al tendinței centrale, este semnificativă, valorile seriei gravitând în jurul mediei grupei.

ESTIMAREA LIMITELOR PENTRU MEDIA COLECTIVITĂȚII TOTALE ȘI PENTRU NIVELUL TOTALIZAT AL CARACTERISTICII

Eroarea medie de reprezentativitate:

pentru selecție repetată:

pentru selecție nerepetată:

Eroarea limită maximă admisă:

pentru selecție repetată

pentru selecție repetată

Intervalul de încredere al mediei colectivității generale:

Intervalul de încredere al nivelului totalizat al caracteristicii:

Estimări pentru repartiția vânzătorilor după valoarea desfacerilor

Notă: Valorile necesare (media () și dispersia ()) sunt la punctul 4.D

Estimări pentru repartiția vânzătorilor după salariul net lunar

Notă: Valorile necesare (media () și dispersia ()) sunt la punctul 4.E

ANALIZA CORELAȚIEI DINTRE VALOAREA DESFACERII ȘI SALARIU

Corelația liniară simplă (date negrupate)

Se aplică pentru primele 10 unități din eșantion, privind numărul de ore lucrate (xi) și salariul net lunar (yi ) – mii lei. Seria se va ordona crescător după numărul de ore lucrate (xi) menținându-se salariul net lunar (yi ) corespunzător.

Dintre metodele simple de cercetare a legaturilor statistice recurgem la :

Metoda seriilor paralele interdependente

Concluzie: Valorile xi fiind ordonate crescător se poate observa că și valorile yi cresc în cea mai mare parte, ceea ce sugerează o legătură directă.

Metoda grafică este o altă cale de a stabili legătura dintre fenomene.

Pentru a obține graficul de corelație, denumit și corelograma, valorile caracteristicii factoriale (xi) sau intervalele acesteia se trec pe abscisa, iar pe ordonate valorile caracteristicii rezultative (yi) sau intervalele respective. Fiecare unitate observată a celor două caracteristici se reprezintă grafic printr-un punct.

Graficul de asemenea confirmă o legătură directă de formă liniară.

Metoda grafica este utilizată cu bune rezultate pentru alegerea funcției analitice care se studiază (în cazul regresiei și corelației)

Metodele de studiere a legaturilor prezentate anterior au ca deficiență principală faptul că deși permit constatarea legăturii și caracterulul ei, nu o pot măsura printr-un indicator sintetic. Acest inconvenient este înlăturat prin utilizarea metodei regresie.

Metoda regresiei constituie o metoda statistică analitică de cercetare a legăturii dintre variabile cu ajutorul unor funcții denumite funcții de regresie.

Notând cu Y variabile dependenta și cu x1 , x2 … xn variabilele independente obținem ecuația de regresie y = f (x1 , x2 … xn).

În cazul de fata am apelat la modelul de regresie unifactorială liniar considerând legătura dintre y și x de tipul yxi = a +bxi. Parametri ecuației în acest caz se determină prin rezolvarea următorului sistem de ecuații:

Dacă se folosește metoda determinanților se obține:

Datele necesare calculării celor doi parametri sunt prezentate în tabelul de mai jos.

Funcția de regresie este:

Raportul de corelație liniară simplă se calculează cu formula:

Unde:

Metoda coeficientului de corelație

Intensitatea legăturii se măsoară prin coeficientul de corelație (ry/x).

Rezultă că legătura dintre aceste două variabile este directă (rz/x>0) și puternică. Există legătură liniară intensă deoarece ry/x=Ry/x.

Calculul coeficientului de corelație a rangurilor

Coeficienul de corelație a rangurilor propus de Spearman:

în care: di – reprezintă diferența între rangurile perechii de valori (xi,yi);

n – numărul de perechi de valori.

Coeficientul de corelație a rangurilor propus de Kendall :

în care

în care: Pi – numărul rangurilor mai mari care urmează rangului curent pentru variabila dependentă;

Qi – numărul rangurilor mai mici care urmează rangului curent pentru variabila dependentă.

Calculul coeficienților de corelație a rangurilor

Interpretare ….

BIBLIOGRAFIE

1. Elena-Maria Biji, Eugenia Lilea, Mihaela Vătui, Emilia Gogu, STATISTICĂ APLICATĂ ÎN ECONOMIE, Editura Oscar Print, 2007

2. . Elena-Maria Biji, Eugenia Lilea, Mihaela Vătui, Emilia Gogu, APLICAȚII STATISTICE ÎN STUDIUL FENOMENELOR ECONOMICE, Editura Oscar Print, București 2007

Similar Posts