Specializarea: STATISTICĂ ȘI PREVIZIUNE ECONOMICĂ [302963]
UNIVERSITATEA „ALEXANDRU IOAN CUZA“ DIN IAȘI
FACULTATEA DE ECONOMIE ȘI ADMINISTRAREA AFACERILOR
Specializarea: STATISTICĂ ȘI PREVIZIUNE ECONOMICĂ
Analiza datelor privind
Mortalitatea infantilă
Student: [anonimizat] 2
IAȘI, 2019/2020
[anonimizat] 0-1 an. România are una dintre cele mai mari rate ale mortalității infantile din U.E. atingând o cifră de 6.8 (raport la 1000 de născuți) în 2018. Acest studiu ar putea ajuta România să descopere care sunt factorii care influențează mortalitatea infatilă și eventual să se efectueze o remediere a acesteia. [anonimizat].
Variabilele cantitative din baza „un98.sav” sunt:
„infantmortality” (Mortalitatea infatilă);
„gdppercapita” (PIB în dolari americani);
P.I.B.-ul este un indicator macroeconomic care reflectă suma valorii de piață a [anonimizat].
„illiteracyfemale” (Rata de analfabetism pentru femei);
Analfabetismul reprezintă situația aceluia sau a acelora care nu știu să scrie și să citească. Aacest indicator are un efect pozitiv asupra mortalității infantile.
Variabilele calitative sunt:
„country” (Țara);
„region” (Regiunea)
[anonimizat], dar și pentru modele neliniare. In final am estimat și testat unele medii și proporții precum și diferențele dintre acestea împreună cu testarea erorilor și remodelarea datelor.
Descrierea bazei de date și a variabilelor analizate
Pentru realizarea acestui proiect am ales baza de date “un98.sav”
Imaginea 2.1. Datele din baza “un98.sav”
Imaginea 2.2. Variabilele din baza “un98.sav”
Variabilele cantitative din baza „un98.sav” sunt: „infantmortality” (Mortalitatea infatilă),„gdppercapita” (PIB în dolari americani) și „illiteracyfemale” (Rata de analfabetism pentru femei).
Variabilele calitative sunt: „country” (Țara) și „region” (Regiunea).
Transformarea unei variabile calitative intr-o variabilă calitativă:
Variabila supusă transformării este variabila „educationfemale” (Numărul mediu de ani de educatie al femeilor). Am ales să creez o variabilă categorială cu 2 [anonimizat] „educationfemale”- Nivelul de educație al femeilor pe categorii “educfemcat”.
Prima categorie o au femeiile cu un nivel de studii de sup 11 ani, iar a doua categorie este constituită din femeiile cu un nivel de studii de peste 11.
Analiza statistică univariată a datelor:
Descrierea statistică a variabilelor calitative
„country” (Țara):
Variabila„country” –Reprezintă țările bazei noastrea de date.
“educfemcat”(Numărul mediu de ani de educatie al femeilor):
Observăm faptul că nivelul femeilor cu studii de peste 11 clase este egal cu cel al femeilor cu un nivel de studii de sub 11 clase, acest lucru poate fi datorat atât unor factori culturali și demografici cât și unor factori sociali.
„region” (Regiunea).
„Region” reprezintă regiunile din baza noastră de date.
3.2. Descrierea statistică a variabilelor cantitative
„infantmortality” (Mortalitatea infatilă)
Observăm faptul că variabila „infantmortality” este asimetrică la dreapta, acest lucru poate fi dat de un P.I.B. destul de mare pentru majoritatea țărilor, o rată de analfabetizare redusă și un nivel al educației destul de mare. Media nu este semnificativă statistic.
„gdppercapita” (PIB în dolari americani)
Pentru P.I.B. avem o asimetrie la dreapta, o parte din țări nu au înregistrat indicatorul P.I.B. .Media nu este semnificativă statistic.
„illiteracyfemale” (Rata de analfabetism pentru femei)
Rata de analfabetism pentru femei este asimetrică la dreapta, acest lucru poate fi datorat anumitor factori sociali si geografici ori culturali. Media nu este semnificativă statistic.
4. Estimarea și testarea statistică
4.1. Estimarea unei medii prin interval de încredere
4.1.1. Estimarea prin interval de încredere a unei medii
Media nu este semnificativă.
4.1.2. Estimarea prin interval de încredere a diferenței dintre două medii
Cu o probabilitate de 95% asumăm faptul că mediile nu sunt egale.
4.2. Testarea statistică
4.2.1. Testarea unei medii
4.2.1.1Testarea Mediei erorilor
Ipoteze:
H0:M(ε)=0
H1:M(ε)#0
Aceptăm H0: M(ε)=0
Sig.>0,05
Testarea unei medii
Ipoteze:
H0:M=0
H1:M#0
Aceptăm H1:M#0
Sig.<0,05
4.2.2. Testarea unei proporții
Ipoteze:
H0:M1=M2
H1:M1#M2
Aceptăm H0:M1=M2 sig.>0,05 ,Cu o probabilitate de 95% putem spune că numărul de variabile din grupul 1 este egal cu cel din grupul 2.
4.2.3. Testarea diferenței dintre două medii și două (sau mai multe) proporții
Cu o probabilitate de 95% asumăm faptul că mediile nu sunt egale.
Ipoteze:
H0:M1=M2
H1:M1#M2
Aceptăm H0:M1=M2 sig.>0,05 ,Cu o probabilitate de 95% putem spune că numărul de variabile din grupul 1 este egal cu cel din grupul 2.
4.2.4. Testarea asocierii dintre două variabile
Constatăm faptul că variabila noastră include doar 36,7% din totalul variabilelor din baza de date, de asemeni observăm și faptul că pentru țările în care femeile au sub 11 ani de școală rata mortalității infantile este cu mult mai mare față de țările în care femeile au peste 11 ani de școală.
4.2.5. ANOVA
Ipoteze:
H0: Nu există diferențe în rata mortalității infantile între țările în care nivelul de educație al femeilor este sub 11 ani de școală și cele în care femeile au peste 11 ani de școală.
H1: există diferențe în rata mortalității infantile între țările în care nivelul de educație al femeilor este sub 11 ani de școală și cele în care femeile au peste 11 ani de școală.
Respingem H0:sig.<0,05 Cu o probabilitate de 95% există diferențe în rata mortalității infantile între țările unde nivelul de educație al femeilor este sub 11 ani de școală și cele în care femeile au peste 11 ani de școală.
4.2.5.1.Ipoteza de normalitate a erorilor
Pentru verificarea acestei ipoteze am folosit testul Kolmogorov-Smirnov.
Ipoteze:
H0: ipoteza de normalitate
H1: distribuția erorilor nu urmează o lege normală
Aceptăm H0: ipoteza de normalitate,cu o probabilitate de 95% putem spune că erorile sunt distribuite normal .
4.2.5.2 Ipoteza de necorelare a erorilor
Pentru verificarea acestei ipoteze am ales testul Runs.
Ipoteze:
H0: k este distribuit normal (nu există autocorelare a erorilor)
H1: k nu este distribuit normal (ipoteza este încălcată)
Aceptăm H0: k este distribuit normal (nu există autocorelare a erorilor),cu o probabilitate de 95% erorile nu sunt autocorelate.
5.Analiza de regresie si corelație
5.1. Analiza de corelație
Analiza de corelație bivariată
Obsevăm faptul că toate variabilele noastre sunt semnificative statistic pentru un risc de 5%.
Pentru “rata de analfabetism pentru femei” avem o legătură directă și medie cu “rata mortalității infantile”. Putea spune faptul că la o creștere a “ratei de analfabetismului pentru femei ”rata mortalității infantile” va crește.
„P.I.B.” are o legătură inversă și puternică cu “rata mortalității infantile”.Deoarece „P.I.B.”explică 81% din “rata mortalității infantile”, putem spune faptul că 81% dintre țările din baza noastră de date vor avea o scădere în “rata mortalității infantile” la o creștere a „P.I.B.” .
„P.I.B.” are o legătură slabă și inversă cu “rata de analfabetism pentru femei”.
Analiza de corelație partială:
Cu un risc de 5% variabilele noaste explică parțial “rata mortalității infantile”.
Variabilele noastre explică doar 28,6% din “rata mortalității infantile”, acest lucru poate fi cauzat de numărul de țări analizate.Avem o legătură slabă între variabile, dar sunt semnificative statistic.
5.2. Analiza de regresie
Regresie liniară simplă
Pentru realizarea legăturii de regresie liniară simplă am ales să analizez legătura dintre „P.I.B.” și “rata de analfabetism pentru femei” față de “rata mortalității infantile”.
5.2.1.Testarea homoscedasticității
Pentru testarea homoscedasticității am folosit testele Glejser, Spearman și Goldfeld-Quandt. Pentru a obține homoscedasticitate am logaritmat toate variabilele.
Glejser
Ipoteze:
H0:Erorile sunt homoscedasticitate.
H1:Erorile sunt heteroscedasticitate.
Pentru “rata de analfabetism pentru femei” și “rata mortalității infantile”.
Respingem H0:Erorile sunt heteroscedasticitate.
SIG<0,05
Pentru “P.I.B.” și “rata mortalității infantile”.
Aceptăm H0:Erorile sunt homoscedasticitate.SIG>0,05
Spearman
Ipoteze:
H0:Erorile sunt homoscedasticitate.
H1:Erorile sunt heteroscedasticitate.
Pentru “rata de analfabetism pentru femei” și “rata mortalității infantile”.
Aceptăm H0:Erorile sunt homoscedasticitate.
SIG>0,05
Pentru “P.I.B.” și “rata mortalității infantile”.
Aceptăm H0:Erorile sunt homoscedasticitate.
SIG>0,05
Goldfeld-Quandt
Ipoteze:
H0:Erorile sunt homoscedasticitate.
H1:Erorile sunt heteroscedasticitate.
Pentru “rata de analfabetism pentru femei” și “rata mortalității infantile”.
Aceptăm H0:Erorile sunt homoscedasticitate.
Fteo>Fcalc
Pentru “P.I.B.” și “rata mortalității infantile”.
Aceptăm H0:Erorile sunt homoscedasticitate.
Fteo>Fcalc
Regresia liniară simplă pentru “P.I.B.” și “rata mortalității infantile”
Putem explica 65,6% din “rata mortalității infantile”,cu o probabilitate de 95% la o creșterea cu o unitate a P.I.B. mortalitatea infantilă scade cu 0,493 unități.
Regresia liniară simplă pentru “rata de analfabetism pentru femei” și “rata mortalității infantile”
Putem explica 55,7% din “rata mortalității infantile”,cu o probabilitate de 95% la o creșterea cu o unitate a ratei de analfabetism pentru femei mortalitatea infantilă crește cu 0,027 unități.
Regresie liniară multiplă
Pentru realizarea legăturii de regresie liniară multiplă am analizat legătura dintre „P.I.B.” , “rata de analfabetism pentru femei” și “rata mortalității infantile”..
5.2.2.Testarea homoscedasticității multiple
Pentru testarea homoscedasticității am folosit testul Breusch-Pagan-Godfrey.
Breusch-Pagan-Godfrey
Ipoteze:
H0:Erorile sunt homoscedasticitate.
H1:Erorile sunt heteroscedasticitate.
Aceptăm H0:Erorile sunt homoscedasticitate.
Sig.>0,05
Modelul de regresie multiplă
Putem explica 72.1% din “rata mortalității infantile” cu ajutorul acestui model multiplu,toate variabilele sunt semnificative statistic.
Regresie simplăneliniară
Folosind un model power valoarea P.I.B. este semnificativă statistic.
Putem explica 86,3% din “rata mortalitații infantile” folosind un model power.
Concluzii
În lucrarea de fată am realizat o analiză a bazei „un98.sav”, în care am avut ca și indicatori:
-variabilele cantitative: „infantmortality” (mortalitatea infatilă), „gdppercapita” (PIB în dolari americani), „illiteracyfemale” (rata de analfabetism pentru femei);
-variabilele calitative: „country” (țara), „region” (regiunea).
După realizarea acestui studiu am constatat faptul că mortalitatea infantilă este influențată, în mare măsură, de PIB în dolari americani și de rata de analfabetism pentru femei. Am ajuns la concluzia că, cu o probabilitate de 95%, la o creșterea cu o unitate a P.I.B., mortalitatea infantilă scade cu 0,493 unități.
De asemenea, există diferențe în rata mortalității infantile între țările unde nivelul de educație al femeilor este sub 11 ani de școală și cele în care femeile au peste 11 ani de școală. Pentru un procent de 55,7% din “rata mortalității infantile”,cu o probabilitate de 95%, la o creșterea cu o unitate a ratei de analfabetism pentru femei, mortalitatea infantilă crește cu 0,027 unități.
Concluzionând, putem spune faptul că la o creștere a ratei analfabetismului pentru femei, rata mortalității infantile va crește. P.I.B.-ul are o legătură inversă și puternică cu rata mortalității infantile. Deoarece P.I.B. explică 81% din rata mortalității infantile, putem spune faptul că 81% dintre țările din baza noastră de date vor avea o scădere în rata mortalității infantile la o creștere a P.I.B. De asemenea, am constatat că P.I.B. are o legătură slabă și inversă cu rata de analfabetism pentru femei.
Bibliografie
Baza de date “un98.sav"
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Specializarea: STATISTICĂ ȘI PREVIZIUNE ECONOMICĂ [302963] (ID: 302963)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
