AudefVescovo,fIRDjAFRISTATf f f f f ffffffffffCoursfI.fP risefenfmainfduflogicielf [615624]

AudefVescovo,fIRDjAFRISTATf f f f f ffffffffffCoursfI.fP risefenfmainfduflogicielf
1fCours I. Prise en main du logiciel
1. Le logiciel Stata
Traditionnellement,f Stataf estf unf logicielf quif fonct ionnef avecf desf lignesf def commandef tapéesf parf
l'utilisateurf(différentfdefSPSS,fpareilfquefSAS).f Quelquesfmenusfontfétéfcréésfdansflesfdernièresfver sions,f
notammentfpourflesfgraphiques.fLeffaitfdefdevoirfta perfdesflignesfdefcodefplutôtfquefdefcliquerfdansfd esf
menusfestfsouventfrédibitoire,fpourtantfcelafafdesf avantagesf:ff
jf laf reproductibilité.f Ilf estf souventf nécessairef de f pouvoirf justifierf def laf façonf dontf af étéf calculéf u nf
indicateur.fAflaflecturefd'unfarticlefoufd'unfrappo rt,fleflecteurfdoitfpouvoir,fàfpartirfdesfmêmesfdon nées,f
obtenirflesfmêmesfrésultats.fOrfavecfunflogicielfàf interface,filfn'yfafpasfdeftracefdefquelsfclicsfont fétéffaits.f
jfl'extensibilitéf:fleflogicielfs'enrichitfenfperma nence.fIlfestfpossiblefdefcréerfunefcommandefenfuti lisantf
plusieursfautres.fOrflesfinterfacesfsontffigéesfetf nefchangentfqu'àflafparutionfdefnouvellesfversions. f
UnfdesfpremiersfavantagesfdefStatafestfsonfprix.fDe fplus,filfestftrèsfpratiquefpourflafmanipulationfde f
données,f notammentf def donnéesf longitudinales.f Enfin f ilf couvref laf quasijtotalitéf desf domainesf desf
statistiquesf etf def l'économétrief abordésf dansf diffé rentesf sciencesf commef l'économie,f laf santé,f
l'épidémiologief:ff
jftechniquesfd'évaluationfd'impactf(régressionsflin éaires,fmodèlesfdefsélection,fvariablesfinstrumenta les)f
jfmodèlesfdichotomiquesf(modélisationfdesfdétermina ntsfdufchômage,fdeflafmortalité)f
jfdonnéesfdefpanelf(suivifdefgensfdansfleftemps,fpe rmetfdefdifférencierfl'effetfindividuelfdefl'effetf temps)f
jfmodèlesfdefduréef(démographie,fduréefdefchômage)f
jfsériesftemporellesf(macrojéconomie,fprévisions)f
jfdonnéesfd'enquêtesf(estimateursfsansfbiais,fpréci sionfdesfindicateurs)f
2. Installation de Stata
StatafestfinstalléfdansfC:\ProgramfFiles.fDansflefd ossierfStataf9fseftrouvefunfdossierfadofàfl'intérie urf
duquelfseftrouventflesfrépertoiresfbasefetfupdatef( misefàfjour).fDansfleffichierfbasefsontfrangésfdesf fichiersf
.ado.f Chacunf def cesf fichiersf (pouvantf s'ouvrirf dans f l'éditeurf def texte,f maisf àf nef pasf modifierf sansf
précaution)fdéfinitfunefcommande.fIlsfsontfrangésfs elonflafpremièreflettrefdeflafcommande.fParfexemple ,f
laf commandef meanf estf définief dansf lef fichierf mean.a dof situéf dansf C:\Programf Files\Stataf
9\Stata9\ado\base\m.f
Lorsqu'onfvoudrafcalculéfl'âgefmoyenfdesfBamakois,f onftaperaflafcommandef
mean age
quifutiliserafleffichierfmean.adofpourfretournerfle frésultatfattendu.fDansflefdossierfC:\ProgramfFiles \Stataf
9\Stata9\ado\update\mfseftrouveflesfcommandesfmises fàfjour.fSifvousfachetezfleflogicielfStataf10fenf
2008,f etf qu'avantf laf sortief def laf versionf 11f def nou vellesf commandesf sontf créées,f vousf pouvezf lesf
téléchargezfviaflefsitefinternetfdefStata,fgratuite ment.ff

AudefVescovo,fIRDjAFRISTATf f f f f ffffffffffCoursfI.fP risefenfmainfduflogicielf
2f3. Les fenêtres
f
Lesf4ffenêtresfdefbasefsontflesffenêtresfCommand,fR eview,fVariablesfetfResults.fLesfcommandesfsontf
saisiesfdansflaffenêtrefCommandfpuisfexécutéesfenft apantfEntrée.fEllefsertfàftesterfdesfcommandesfmais f
nonfàfrédigerfunfprogrammefcomplet.fLaffenêtrefRevi ewflisteflesfdernièresfcommandesfeffectuées.fIlfsuf fitf
defcliquerfsurfl'unefd'ellefpourflafrappelerfdansfl affenêtrefCommand.fLaffenêtrefVariablesflisteflesfv ariablesf
figurantfdansflefbasefdefdonnées.fIlfsuffitfdefcliq uerfsurfl'unefd'ellesfpourfqu'ellefsoitfsaisiefdans flaffenêtref
Command.fLaffenêtrefResults,fsurffondfnoir,fdécritf lesfrésultatsfdeftoutesflesfcommandes.fLesfcommande sf
effectuéesfyffigurentfenfblanc,flesfrésultatsfenfja une,fvertfetfblanc,flesfmessagesfdefmisefenfgardefe nfvert,fetf
lesferreurs,fstoppantfl'exécution,fenfrouge.fLesfer reursfsontfréférencées.fEnfcliquantfsurflefcodefdef l'erreur,f
icifr(101),fonfaccèdefàfunefdescriptionfdefl'erreur .fOnfpeutfcopierflesfrésultatsfdefResultsfpourflesf collerf
dansfWord.fSelonfqu'onfveuillefcopierfduftextefoufu nftableauf(sélectionnerfuniquementfleftableaufavecf desf
lignesfentières),fonfutiliserafCopyftextfoufCopyfta blefdansflefmenufEdition.f
f
Defgauchefàfdroitef:f
jfOuvrirfunffichierfdefdonnéesfStataf
jfSauvegarderfunffichierfdefdonnéesf(équivalentfàfl afcommandefsave)ff
jfImprimerflesfrésultatsftelsfqu'ilsfapparaissentfd ansflaffenêtrefResultsf
jfCommencerfunffichierflog,funfjournalfquifconserve raftoutfcefquifafétéffaitf
jfFairefapparaîtreflaffenêtrefResultsflorsqu'ellefn 'estfpasfprésentef
jfOuvrirfunfdo.filef
jfAfficherflafbasefdefdonnéesf(enfpouvantfoufpasfle fmodifierfmanuellement)ff
jfStopperflafcommandefenfcoursf(sifc'estftropflongf oufqu'onfs'estfrendufcomptefd'uneferreur)f

AudefVescovo,fIRDjAFRISTATf f f f f ffffffffffCoursfI.fP risefenfmainfduflogicielf
3f4. Types de fichiers
dtaf:fBasefdefdonnées ff
Lesfvariablesfsontfenfcolonne,flesfobservationsf(in dividus,fménages,…)fenfligne.fLesfquatrefpremièresf
variablesfsontfdesfcaractères,fcefpourquoifellesfso ntfécritesfenfrouge.fLafvariablefpoids,fidenq,fidsu pfetfm2f
sontfnumériquesfdoncfécritesfenfnoir.fLafvariablefm 3festfnumériquefégalement,fmaisfellefestf"labellisé e".f
C'estjàjdirefqu'onfafaffectéfunflabelfquiffaitfcorr espondref"homme"fàflafvaleurf1fetf"femme"fàflafvale urf2.f
f
Pourfaffecterfunflabelfàfunefvariable,fonfutilisefl afcommandef:ff
. label variable m3 genre
Ainsi,fonfsaurafquefm3fcontientflefgenrefdefl'indiv idu.f
Onfpeutfégalementfaffecterfunflabelfàfchacunefdesfm odalitéfd'unefvariable,ftoujoursfafinfdefrendrefplu sf
compréhensibleflaflecturefdeflafbasefdefdonnéesfouf lesfrésultats.f
. label define labgenre 1 "homme" 2 "femme"
. label values m3 labgenre
f
adof(déjàfvu) f
f
hlpf:fFichierfd'aidef(avecflesffichiersfado). ff
Ilsfsontfappelésfenftapantflafcommandefhelpf:ff
help mean
quiffaitfouvrirfunffichierfexpliquantfcommentfcalcu lerflafmoyennefd'unefvariable.ff
f
dof:fprogrammefcrééfparfl'utilisateur.f f
Ilfpermetfdefsauverflesfcommandesfeffectuéesfetfdef relancerfsonfprogrammefplusftardfoufsurfunfautref
ordinateur.fSifjefveuxfcalculerfleftauxfdefpauvreté fdufMali,fcelafnécessitefbeaucoupfdefcommandes.fCef
n'estfpasfpratiquefdeflesftaperfunefparfunefdansfla ffenêtrefCommand.fDoncfonflesfécritfdansfunffichier fdo.f
Enfsauvegardantfceffichierfdo,filfserafpossiblefdef lefrelancerfetfd'obtenirfdefnouveauflesfmêmesfrésul tats.f
f
.logf:fJournal f
Fichierfpouvantfs'ouvrirfenfdehorsfdefStatafavecfle fblocfnote,filfpermetfdefsauvegarderftoutfcefquifaf étéf
fait,flesfcommandesfetflesfrésultats.f

AudefVescovo,fIRDjAFRISTATf f f f f ffffffffffCoursfI.fP risefenfmainfduflogicielf
4f5. Commencer à travailler f
Lafmémoiref:f f
Lafmémoirefallouéefparfdéfautfàflafbasefdefdonnéesf peutfparfoisfêtrefinsuffisanteflorsqueflafbasefcont ientf
beaucoupfd'observations.fSupposonsfquefl'utilisateu rfveuillefdupliquerftoutesflesfobservationsfdeflafb asef
defdonnéesfqu'ilfutilisef(commandfexpand),fmaisfque flafbasefdeviennefalorsftropfvolumineuse.fUnfmessag ef
d'erreurfapparaîtfalors.fParfexemple,fdansfl'exempl efcijdessous,flafpremièreflignefdemandeàfStatafd'ou vrirf
lafbasefdefdonnéeftable.dta.fPuisflafdeuxièmefligne f(expandf2)fdemandefàfStatafdefdupliquerftoutesfles f
observations.fSiflafmémoirefallouéefestfinsuffisant e,funfmessagefd'erreurfd'affiche,fenfrougef:ff
. use table.dta
. expand 2
no room to add more observations
Ilfestfalorsfnécessairefd'augmenterflafmémoirefdisp oniblefparflafcommandefsetfmemoryf:ff
set memory 100m
Ici,funefmémoirefdef100fMofestfallouée.ff
f
Créationfd'unfrépertoirefdeftravail f
L'utilisationfdefStatafnécessitefunefbasefdefdonnée sfetfunffichierfdo.fNousfverronsfparflafsuitefqu'il festf
possiblef def créerf desf fichiersf def résultatsf (log,f r ésultatsf def régressions,f graphiques).f Afinf def nef pa sf
disperserfsesffichiersfetfdefnefpasfdevoirfindiquer flefcheminfdesffichiersfàfchaqueffois,filfestfutile fdefcréerf
unfrépertoirefdeftravailfenfdébutfdefsonffichierfdo .f
cd "C:\Formation Stata\Espace de travail"
Ainsi,fparflafsuite,fsifl'onfsouhaitefsauvegarderfs afbasefdefdonnées,fonftaperafseulementf
save table.dta
auflieufdeff
save "C:\Formation Stata\Espace de travail\table.dt a"
f
Créationfd'unffichierflog,fjournalfdesfcommandesfef fectuéesfetfdesfrésultats f
Afinfdefgarderfuneftracefdeftoutesflesfcommandesfef fectuéesfetfdesfrésultatsfilfestfconseilléfd'ouvrir funf
fichierflogfenfdébutfdeftravailf
log using trace.log
ou,fsifonfn'afpasfcrééfdefrépertoirefdeftravailf:ff
log using "C:\Formation Stata\Espace de travail\tra ce.log"
Ilfseffermefenftapantflafcommandef
log close
f
Ouvrirfunefbasefdefdonnées f
use table.dta [, clear]
Ilffautfparfoisfrajouterfl'optionfclearfafinfd'effa cerfleffichierfdefdonnéesfdéjàfutiliséfparfleflogic iel.fParf
précaution,fonfpeutfl'écrireftoutfleftemps.ff
Sauvegarderfsafbasefdefdonnéesf:f f
save table.dta [,replace]

AudefVescovo,fIRDjAFRISTATf f f f f ffffffffffCoursfI.fP risefenfmainfduflogicielf
5fIlfestfégalementfpossiblefdefcréerf"manuellement"fu nefbasefdefdonnéesfàfl'aidefdeflafcommandefeditfqui f
ouvrefunefbasefdefdonnéesfvidefdeflaquellefonfrempl itflesfcases.fC'estfrarefd'avoirfàfleffaire.fPourfo bserverf
lafbasefdefdonnées,filfsuffitfdeftaperflafcommandef browsefoufdefcliquerfsurfl'ongletfcorrespondantfdan sflaf
barrefdesftâchesfduflogiciel.f
f
Inscrirefdesfcommentairesfdansfsonffichierfdo f
Ilfestftrèsfutilefdefcommenterfsonfprogramme,fafinf qu'ilfsoitfcompréhensiblefàfunfautrefutilisateurfet fàfsoij
mêmefsifonfs'enfsertfquelquesftempsfaprès.fPourfécr irefunfcommentairefsansfquefStatafpensefqu'ilfs'agi tf
d'unefcommande,fonfutilisefl'astérisquefouf/*commen taire*/f
*j'ouvre la base de données
use table.dta
ouff
/*j'ouvre la base de données*/
use table.dta
oufencoref
use table.dta /*j'ouvre la base de données*/
/*commentaire*/fpeutfégalementfaiderfàfrendrefsonfp rogrammefplusflisible.fEnfeffet,fdansflesffichiersf do,f
onfpeutfécriref"sansffin"fsurfunefligne,fpasfcommef dansfWord.fAlors,fàfl'écranfonfnefvoitfpasfl'ensemb lef
def saf commande.f Sif onf vaf àf laf lignef sansf précaution ,f Stataf interprèteraf lesf deuxf lignesf commef deuxf
commandesfdistinctesf:ff
use "C:\Formation Stata\Documents de travail\base d e donnees de la formation\bases
individuelles\donnees sociodemo\base1.dta"
Statafvafessayerfdeflireflaflignef
individuelles\donnees sociodemo\base1.dta"
commefunefcommande,falorsfqu'ellefn'estfqueflafsuit efdeflafcommandefuse.fPourféviterfcela,fonfécritf:f f
use "C:\Formation Stata\Documents de travail\base d e donnees /*
*/de la formation\bases individuelles\donnees socio demo\base1.dta"
f
Exécuterfleffichierfdof:ff f

Pourfexécuterfseulementflafsélection,fonfcliquefsur fdo.fPourftoutfexécuter,fonfnefsélectionnefaucunefl ignef
enfparticulierfetfonfcliquefsurfdo.fCliquerfsurfrun fexécutefégalementfleffichier,fmaisf"silencieusemen t".f
C'estjàjdirefqu'ilfn'affichefrienfdansflaffenêtrefR esults,fetfdefceffaitfrienfdansfleffichierflog.fPou rtantfilf
exécuteflesfcommandes.fDefmêmefquefpourfdo,fonfpeut fnefsélectionnerfquefcertainesflignes.ff
do run

AudefVescovo,fIRDjAFRISTATf f CoursfII.fPricipesfdefs yntaxefdansfStata
6fCours II. Principes de syntaxe dans Stata
1. Trouver une commande et de l'aide
Pourftrouverfunefcommandeflorsqu'onfnefconnaîtfpasf sonfnom,filfsuffitfdeftaperflafcommandefsearchf
suiviefd'unfoufplusieursfmotsfclés.fSupposonsfquefl 'onfsouhaiteftrouverfunefcommandefpermettantfdef
calculerfdesfstatistiquesfdescriptivesfdefbasefd'un efvariablef:ff
search univariate summary statistics
Statafretourneflaflistefdeffichiersfd'aidefdesfcomm andesfcorrespondantesfainsifquefdesfliensfhypertext esf
pointantfsurflefsitefwebfdefStata.fDansfl'exemplefc ijdessusfilfretournefdeuxfcommandesfdontf summarize f
quifcorrespondfàfcefqu'onfsouhaite.f
Pourftrouverfensuitefdesfdétailsfsurflaffaçonfd'uti liserflafcommandefsummarize,fonftapef
help summarize
Chaquefcommandefpossèdefunffichierfhelp,fenfanglais ,fassezfdétaillé.fLesfcommandesfsearchfetfhelpfsont f
trèsfutiliséesfcarfilfestfimpossiblefdefconnaîtreft outesflesfcommandesfdefStata.ff

N'hésitez pas à utiliser la commande help
2. La syntaxe type des commandes dans Stata
Lafsyntaxefestfcommunefàftoutesflesfcommandes.fLafm ajoritéfdesfcommandesfs'écrivefenfrespectantflaf
syntaxefdefbasefsuivantef:ff
command [ varlist ] [if exp ] [, options]
f
[varlist ]f:ff
Ilfs'agitfdeflaflistefdefvariablesfàfutiliser.fParf exemple,fsifonfveutfcalculerfl'agefmoyen,fpuisfl'âg efmoyenfetflef
nombrefmoyenfd'annéesfd'étudesfdesfindividusfdefnot refbasefdefdonnéesf(commandefsummarize)f:ff
. summarize age

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
age | 12749 21.69896 17.27642 0 98

. summarize age etudes

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
age | 12749 21.69896 17.27642 0 98
etudes | 12749 3.350145 4.450341 0 22
f
Pourfcertainesfcommandes,fsifonfnefspécifiefpasfvar list,fparfdéfautfStatafappliqueflafcommandefàftoute sflesf
variablesf_all.fC'estflefcasfentrefautresfpourfsumm arize.

AudefVescovo,fIRDjAFRISTATf f CoursfII.fPricipesfdefs yntaxefdansfStata
7f[if exp ] :
Supposonsf qu'onfsouhaitefcalculerf cesf mêmesf statist iquesf descriptivesf surf lesf individusf vivantf dansf la f
communefIIIfdefBamako.fOnfutilisefalorsfiffpourfind iquerfàfStatafqueflafcommandefnefdoitfêtrefeffectué ef
quefsurflesfobservationsfvérifiantfcettefconditionf d'appartenancefàflafcommunefIIIf:ff
. summarize age etudes if commune==3

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
age | 1924 24.12058 17.8297 0 95
etudes | 1924 4.954782 4.798545 0 20

Sifonfveutfexécuterflafcommandefseulementfsurflesff emmesfdeflafcommunefIIIf:ff
. summarize age etudes if commune==3 & femme==1

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
age | 923 23.66197 17.39158 0 94
etudes | 923 4.211268 4.353397 0 20
f
Certainsfopérateursfsontfutilsefpourfécrireflesfcon ditionsf:ff
TableaufrécapitulatiffdesfopérateursfdansfStataf:f
Op.farithmétiquesf Op.flogiquef Op.fdefconditionf
+fffadditionf
jfffsoustractionf
*fffmultiplicationf
/fffdivisionf
^fffpuissancef
f
+ffconcaténationf~fffnotf
!fffnotf
|ffforf
&fffandf>fffsupérieurfàff
<fffinférieurfàf
>=ffsupérieurfàf
<=ffinférieurfàf
==ffégalfàf
~=ffdifférentfdef
!=ffdifférentfdef

Attention : Pour une condition, l'égalité s'écrit = = et non =
[,options ] :
Quasimentftoutesflesfcommandesfproposentfdesfoption s.fCellesjcifsontfindiquéesfaprèsfunefvirgule.fParf
exemple,f laf commandef summarizef possèdef l'optionf det ailf quif permetf d'obtenirf plusf def statistiquesf
descriptivesf(parfexemplefcertainsfquantiles).fPour fconnaîtreftoutesflesfoptionsfpossiblesfd'unefcomma nde,f
ilffautfregarderfleffichierfd'aidef(commandefhelp)f
. summarize age, detail

age
––––––––––––––––– –––-
Percentiles Smallest
1% 0 0
5% 1 0
10% 3 0 Obs 12749
25% 8 0 Sum of Wgt. 12749

50% 17 Mean 21.69896
Largest Std. Dev. 17.27642
75% 32 96
90% 46 97 Variance 298.4748
95% 55 97 Skewness .9544977
99% 71 98 Kurtosis 3.52789

AudefVescovo,fIRDjAFRISTATf f CoursfII.fPricipesfdefs yntaxefdansfStata
8f3. Autres éléments de syntaxe : type de variables e t abréviations
Nousfavonsfvufplusfhautfqu'ilfexistefdesfvariablesf numériques,fcontenantfdesfentiersfoufdesfréels,fetf desf
variablesf alphanumériquesf (string)f contenantf desf ch aînesf def caractères.f Sif onf manipulef unef variablef
alphanumérique,fonfutilisefdesfguillemetsf:ff
. generate varnum=10
. generate varalpha="dix"
. generate varalpha2="10"

Il est préférable de créer des variables numériques car certaines commandes n'arrivent pas à
traiter des variables alphanumériques.
f
Ilf n'estf pasf nécessairef def taperf lef nomf d'unef comma ndef enf entierf pourf quef Stataf laf reconnaisse.f Parf
exemple,fsifj'utiliseflafcommandefgenerate,fjefpeux fécrireff
f
. generate CDM=1 if m5==1 ouf f . gener CDM=1 if m5==1 ouf
. gen CDM=1 if m5==1 oufmêmeff . g CDM=1 if m5==1
f
Onfnefpeutfpasfréduireftoutesflesfcommandesfàfunefl ettrefnifmêmefàfdeux.fEnfeffetfcertainesfabréviatio nsf
peuventfprêterfàfconfusion.fParfexemple,fjefpeuxfab régerf:ff
f
. summarize age en . su age maisfpas . s age
CarfStatafnefpeutfpasfs'avoirfs'ilfs'agitfdefsummar izefoufdefsortfagefparfexemple.fDansflefrestefdufco urs,f
nousfécrivonsflesfcommandesfenfentier,fmaisfenfTD,f vousfpouvezflesfabréger.f
f
Ilfenfestfdefmêmefpourflesfnomsfdesfvariablesf
. summarize etudes en . su etud maisfpas . su e
carfilfyfafunefconfusionfpossiblefentrefetudesfetfu nefvariablefnomméefe1fparfexemple.f
Supposonsf qu'onf veuillef lancerf unef commandef surf les f variablesf revenu_travail1f revenu_travail2f etf
revenu_hors_travail.ff
. summarize revenu_travail1 revenu_travail2 revenu_ hors_travail
Onfpeutftaperfdeffaçonfplusfconcisef:ff
. summarize revenu*
Stataf exécuteraf laf commandef surf toutesf lesf variable sf dontf lef nomf commencef parf revenu.f

AudefVescovo,fIRDjAFRISTATf f CoursfIII.fDécrireflesf données
9fCours III. Décrire les données
browse :
Lafcommandefbrowsefouvreflafbasefdefdonnées,fmaisfn efpermetfpasfdeflafmodifierf"àflafmain"f
describe :
Lafcommandefdescribefpermetfdefdécrireflesfdonnéesf deffaçonftrèsfgénéralef:fpourfchaquefvariable,felle f
retourneflefformatfdansflequelflafvariablefestfstoc kéef(double,ffloat,fint)flefformatfdansflequelflafv ariablef
s'affichef(%9.0g,f%9s,f…)flefnomfduflabelfdesfmodal itésfdeflafvariablefetfleflabelfdeflafvariable.fSif onf
n'indiquefpasflesfvariablesfàfdécrire,fStatafdécrit ftouteflafbasefdefdonnées,fenffournissantfégalement flef
nombrefd'observations,fdefvariables,flaftaillefdefl afbasefdefdonnéesfetflafdate.fL'optionfshortfpermet fdef
n'obtenirfqueflafdescriptionfdeflafbase.f
. describe age m3
storage display value
variable name type format label varia ble label
––––––––––––––––– –––––––––-
age float %9.0g age
m3 float %9.0g labgenre genre

. describe
Contains data from table.dta
obs: 12,749
vars: 189 3 Apr 2008 13:42
size: 9,523,503 (90.9% of memory free)
––––––––––––––––– –––––––––-
storage display value
variable name type format label varia ble label
––––––––––––––––– –––––––––-
strate str2 %9s
ZD str3 %9s
menage str3 %3s ménag e

list :
Lafcommandeflistfpermetfd'afficherflafbasefdefdonné esfoufunfextraitfdefcettefbasefdansflaffenêtrefdef
résultats.fAttention,fsifonfoubliefdefpréciserfquel lesfvariablesf(enftapantfseulementflist)fonfveutfvo irfetf
quellesfobservations,ftoutesflafbasefdefdonnéesfs'a ffichefdansflaffenêtrefResultsf!f
. list age etudes m3 in 1/5
+–––––––-+
| age etudes m3 |
|–––––––-|
1. | 39 16 homme |
2. | 4 0 homme |
3. | 11 3 homme |
4. | 6 0 femme |
5. | 25 10 femme |
+–––––––-+

N'oubliez pas de préciser les variables et les lign es que vous voulez voir apparaître !

AudefVescovo,fIRDjAFRISTATf f CoursfIII.fDécrireflesf données
10 fcodebook :
Lafcommandefcodebookfpermetfdefcréerfunfdictionnair efdesfvariablesfindiquantflefnomfdeflafvariable,fso nf
label,fsonfformatfdefstockage,fl'intervallefdefsesf valeurs,fsesfvaleursfuniques,fsafmoyennefetfsonféca rtjtypef
(variablefcontinue),flaffréquencefdesfmodalitésf(va riablefdiscrète),flefnombrefdefvaleursfmanquantes,f desf
quantiles,fleflabelfdefsesfmodalités.fL'optionfmvff ournitfdesfinformationsfsurflesfvaleursfmanquantes. ff
. codebook strate age sitac
––––––––––––––––– –––––––––––
strate strate
––––––––––––––––– –––––––––––
type: string (str2)

unique values: 6 m issing "": 0/12749

tabulation: Freq. Value
2271 "01"
2115 "02"
1924 "03"
2291 "04"
1992 "05"
2156 "06"
––––––––––––––––– –––––––––––
age age
––––––––––––––––– –––––––––––
type: numeric (float)

range: [0,98] units: 1
unique values: 95 m issing .: 0/12749

mean: 21.699
std. dev: 17.2764

percentiles: 10% 25% 50% 75% 90%
3 8 17 32 46
––––––––––––––––– –––––––––––
sitac situation dans activité
––––––––––––––––– –––––––––––
type: numeric (float)
label: lsitac

range: [1,5] units: 1
unique values: 5 m issing .: 0/12749

tabulation: Freq. Numeric Label
4354 1 actif occ upe
304 2 chomeur B IT
277 3 chomeur d ecourage
3937 4 inactif
3877 5 moins de 10 ans
. codebook ap13a1 if sitac==1,mv
––––––––––––––––– –––––––––––
ap13a1 salaire mensuel
––––––––––––––––– –––––––––––
type: numeric (float)

range: [0,5000] units: 1
unique values: 155 m issing .: 1774/4354

mean: 49.2143
std. dev: 191.828

percentiles: 10% 25% 50% 75% 90%
2 7 20 50 90

missing values: h3==mv –> ap13a 1==mv
ap2==mv –> ap13a 1==mv

AudefVescovo,fIRDjAFRISTATf f CoursfIII.fDécrireflesf données
11 fmore :
Siflefrésultatfd'unefcommandefestftropflong,fparfex emplefdescribefsansfpréciserflesfvariablesfàfdécrir e,f
l'éditionfdesfrésultatsfsefbloque.fIlffautfalorsfcl iquerfsurfmoref(ouftaperfEntrée)fpourfrelancerfl'éd itionfdesf
résultats.f Pourf quef Stataf nef bloquef pasf l'éditionf d esf résultats,f onf peutf désactiverf cettef optionf avecf laf
commandef:ff
set more off
Pourfréactiverfcettefoptionf:ff
set more on

N'oubliez pas set more off si vous lancez un long p rogramme et vous absentez

AudefVescovo,fIRDjAFRISTATf f f f ffffffffffff f fffCours fIV.fCréerfdesfvariablesf

12 fCours IV. Créer des variables
generate :
Lafcommandefprincipalefpourfcréerfunefvariablefestf lafcommandefgenerate.fSafsyntaxefpossèdefunefpartie f
supplémentairef:ff
command [ varlist ] [= exp ] [if exp ] [,options]
C'estfdans [= exp ] qu'onfindiquefcommentfconstruireflafvariable,fparfe xemplef:ff
. generate var3=var1+var2 /*addition*/
. generate var4=5*var1 /*multiplication*/
. generate logvar=log(var) /*logarithme*/

. generate CDM=1 if m5==1 /*== : test d'égalité */
. generate nonCDM=0 if CDM~=1 /*~= : test de dif férence*/

. generate CDMfemme=1 if femme==1 & CDM==1 /* & : et*/
. generate CDM_conjoint=1 if CDM==1 | m5==2 /* | : ou*/
f
replace :
Lafcommandefreplacefsertfàfremplacerflafvaleurfd'un efvariablefdéjàfexistantef
generate moins10ans=1 if age<10
replace moins10ans=0 if age>=10
f
La fonction cond(x,a,b)
Uneffonctionfestftrèsfutilefpourfcréerfdesfvariable sfenftapantfmoinsfdeflignefdefcommande,flaffonction f
cond.fLafcréationfdeflafvariablefmoins10ansfcijdess usfs'écritfenfuneflignef:ff
generate moins10ans=1 if age<10
replace moins10ans=0 if age>=10
équivautfàff
generate moins10ans=cond(age<10,1,0)
cond(x,a,b) fretournefafsiflafconditionfxfestfvérifier,fbfsifel lefnefl'estfpas.fIci,fellefretournef1fsifl'agefdef
l'individufestfstrictementfinférieurfàf10,fetf0fsif cettefconditionfd'agefn'estfpasfvérifiée.fff
f
Beaucoupfd'autresffonctionsfexistentfdansfStataf(ex ponentielle,ftiragefdefnombresfaléatoire,fextractio nfdef
caractères,…).fPourfenfavoirflaflistefexhaustive,ft apezfhelpffunctions.fPourfavoirflaflistefdesfplusfu tilisées,f
voirfenfannexe.ff
f
rename :
Lafcommandefrenamefsertfàfrenommerfunefvariable.f
rename m3 genre

AudefVescovo,fIRDjAFRISTATf f f f ffffffffffff f fffCours fIV.fCréerfdesfvariablesf

13 frecode :
Lafcommandefrecodefsertfàfrecodeflesfmodalitésfd'un efvariablef:ff
recode var1 (règle1) (règle2) …, gen ( )
Cesfrèglesfpeuventfprendrefplusieursfformesf:ff
règlef actionf
3f=f1f 3frecodéfenf1f
2f.f=f9f 2fetf.frecodéfenf9f
1/5f=f4f toutefvaleurfdef1fàf5frecodéefenf4f
nonmissf=f8f toutefvaleurfnonfmanquantefrecodéefenf8 f
missf=f9f toutefvaleurfmanquantefrecodéefenf9f
f
L'optionfgenfpermetfdefcréerfunefnouvellefvariablef contenantflefnouveaufdécoupagefdesfmodalités.fSansf
spécifierfcettefoption,fvar1festfremplacéefparflafv ariablefnouvellementfcodée.ff
. list
+––+
| var1 |
|––|
1. | 1 |
2. | 2 |
3. | 3 |
4. | 4 |
5. | 5 |
|––|
6. | 6 |
7. | 7 |
8. | . |
+––+

. recode var1 (1 2 = 1) (3/7 = 2) (miss = 9), gen ( newvar1)
(7 differences between var1 and newvar1)

. list
+–––––-+
| var1 newvar1 |
|–––––-|
1. | 1 1 |
2. | 2 1 |
3. | 3 2 |
4. | 4 2 |
5. | 5 2 |
|–––––-|
6. | 6 2 |
7. | 7 2 |
8. | . 9 |
+–––––-+

encode
Laf commandef encodef permetf def convertirf unef variable f alphanumériquef enf unef variablef numériquef
discrète,fdontflesfmodalitésfsontf"labellisées"fave cflesfchaînesfdefcaractèresfdeflafvariablefinitiale .fIci,fvar1f
estfinitialementfunefvariablefalphanumériquefprenan tflesfvaleursf"absent",f"présent"fetf"visiteur"f:ff f
f

AudefVescovo,fIRDjAFRISTATf f f f ffffffffffff f fffCours fIV.fCréerfdesfvariablesf

14 f. list
+–––-+
| var1 |
|–––-|
1. | absent |
2. | present |
3. | visiteur |
+–––-+
. encode var1, gen(newvar1)
. list
+–––––––+
| var1 newvar1 |
|–––––––|
1. | absent absent |
2. | present present |
3. | visiteur visiteur |
+–––––––+

. describe var1 newvar1
storage display value
variable name type format label varia ble label
––––––––––––––––– –––––––––-
var1 str8 %9s
newvar1 long %8.0g newvar1
Lafcommandefdecodeffaitfl'opérationfinverse.f
f
drop :
Lafcommandefdropfsertfàfsupprimerf:ff
jfdesfvariablesf:f
drop age
jfdesfobservationsf:f
drop if age<10
f
keep :
Lafcommandefkeepfpermetfdefpréciserflesfvariablesfo ufobservationsfquefl'onfveutfconserver,fauflieufdef
cellesfquefl'onfveutfsupprimerf:ff
keep etudes genre age
keep if age>=10
f
order :
Lafcommandeforderfsertfàfordonnerflesfvariablesfdef lafbasef:ff
order strate ZD menage age genre etudes revenu
f
destring :
Lafcommandefdestringftransformefunefvariablefalphan umériquefenfvariablefnumériquef
destring strate, gen (str)
tostringf:fTransformefunefvariablefnumériquefenfvar iablefalphanumériqueff
tostring str, gen (strate)
f

AudefVescovo,fIRDjAFRISTATf f f f ffffffffffff f fffCours fIV.fCréerfdesfvariablesf

15 fLes valeurs manquantes dans Stata :
LaffaçonfdefStatafdeftraiterflesfvaleursfmanquantes f(missingfvalues)fpeutfêtrefdifférentefdefcellefdes fautresf
logicielsfdefstatistique.fIlffautfyfprêterfattentio nflorsqu'onfécritfdesfconditionsfetflorsqu'onfcalcu lefdesf
statistiques.ff
Parfdéfaut,flesfvaleursfmanquantesfs'écriventfàfl'a idefd'unfpointfpourflesfvariablesfnumériquesf(sysmi ssf
pourfsystemfmossingfvalue).fPourflesfvariablesfalph abétiques,flesfvaleursfmanquantesfs'écriventf"".ff
Pourflesfvariablesfnumériquesftoutefvaleurfnonfmanq uantef(nmvfpourfnonfmissingfvalue)festfconsidéréef
inférieurefàf.f
f
Vérificationfd'unefconditionf f
Parfexemple,fsifjefconstruisflafvariableff
generate moins10ans=1 if age<10
replace moins10ans=0 if age>=10
Sifl'agefd'unfindividufn'estfpasfrenseignéf(age=.), fsonfâgefserafconsidéréfcommefsupérieurfàf10fetflaf
variablefmoins10ansfprendraflafvaleur0,fbienfqu'onf ignorefcomplètementfsonfâge.f
Pourféviterfcelaf:ff
generate moins10ans=1 if age<10 & age~=.
replace moins10ans=0 if age>=10 & age~=.
ouf
generate moins10ans=1 if age<10 & age< .
replace moins10ans=0 if age>=10 & age< .
oufencoref
generate moins10ans=1 if age<10
replace moins10ans=0 if age>=10
replace moins10ans=. if age==.

Valeursfmanquantesfenfargumentfdeffonctionf:f f
. + nmv = .
. – nmv = .
. * nmv = .
max(1,5,.)=5
max(.,.,.)=.

CertainesffonctionsfdefStatafinterprètentf.fd'unefm anièrefspécifique.fParfexemple,flaffonctionfinrange .f
inrange(x,a,b)fretourneflafvaleurf1fsifxfappartient fàfl'intervallef[a,b].f
Sifafestfmanquante,felleftestefl'appartenancefdefxf àfl'intervallef[j∞,b]f
Sifbfestfmanquante,felleftestefl'appartenancefdefxf àfl'intervallef[a,+∞]f
LesfautresffonctionsfdefStatafretourneflafvaleurf.f sifunfoufplusieursfdefleursfargumentsfsontfmanquant sfouf
invalide.ff
Regardez toujours si la variable que vous étudiez a des non-réponses.

AudefVescovo,fIRDjAFRISTATf f f f ffffffffffff f fffCours fIV.fCréerfdesfvariablesf

16 fLes boucles
Supposonsf qu'onf veuillef effectuerf laf mêmef manipulat ionf desf variablesf v1,f v2,f … ,f v10,f parf exemplef
remplacerflafvaleurf9fparfunefvaleurfmanquantef
replace v1=. if v1==9
replace v2=. if v2==9

replace v10=. if v10==9
Celafpeutfallongerflefprogrammefetfêtrefsourcefd'er reurs.fOnfpeutfalorsfcréerfunefbouclef:ff
forvalues num=1/10 {
replace v`num'=. if v`num'==9
}
Siflesfvariablesfqu'onfveutfmodifierfsontfv5fv10fv1 5fv20,f…,fv100.f
forvalues num=5 10 to 100 {
replace v`num'=. if v`num'==9
}
Siflesfvariablesfn'ontfpasfunfnomfcontenantfunfchif frefsurflequelfeffectuerflafbouclef:ff
foreach statut in actifocc chomeur inactif moins10a ns {
summarize `statut'
}

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
actifocc | 12749 .341517 .474237 0 1

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
chomeur | 12749 .0455722 .2085636 0 1

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
inactif | 12749 .3088085 .4620201 0 1

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
moins10ans | 12749 .3041023 .4600442 0 1

N'oubliez pas de fermer les accolades. Attention au x quotes (touche 7 puis touche 4)

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

17 fCours V. Structure des bases de données
Nousfavonsfvufprécédemmentfqueflesfvariablesfsontfe nfcolonnefetflesfobservationsfenfligne.fSupposonsf
quef nosf observationsf correspondentf auxf individusf de sf ménagesf échantillonnés.f C'estf lef casf dansf nosf
exercicesfetfc'estflefcasfdansflafplupartfdesfenquê tes,fpourflesquellesfonftirefunféchantillonfdefména gesfpuisf
onfinterrogefchaquefmembrefdesfménagesftirés.ff
Créer des identifiants uniques et ayant un sens.
Ilffautftoujours,favantfdeftravaillerfsurfunefbasef defdonnées,fidentifierflesfobservations,ficiflesfin dividus,f
parfunfidentifiantfunique.ff
Méthodefnaïvef:fonfcréefunfidentifiantf(ident1)fdon tflafvaleurfestfégalefaufnumérofdeflafligne.ff
strate ZD menage individu age ident1
05 007 146 05 9 1
02 039 204 05 5 2
02 045 214 01 32 3
02 070 094 04 0 4
02 077 138 01 38 5
02 051 039 08 6 6
06 003 058 01 26 7
01 106 057 03 2 8
01 209 012 01 50 9
04 007 162 02 22 10
Cetf identifiantf estf bienf uniquef pourf chaquef individ uf(onf af pasf deuxf individusftelsf quef ident1=3).f Enf
revanchefilfn'afaucunfsens.ff
Supposonsfquefjefdisposefd'unefautrefbasefdefdonnée sfavecflesfmêmesfindividusfetfd'autresfvariables.fJ ef
construisfunfidentifiantfselonflafmêmefméthodefnaïv e.ff
strate ZD menage individu etudes ident2
02 039 204 05 0 1
06 003 058 01 15 2
05 007 146 05 2 3
02 077 138 01 5 4
02 070 094 04 0 5
04 007 162 02 0 6
02 045 214 01 0 7
02 051 039 08 2 8
01 209 012 01 0 9
01 106 057 03 0 10
Alorsfilfm'estfimpossible,fàfl'aidefdefcesfidentifi antfseulement,fdefdirefquelfâgefcorrespondfàfquelfn iveauf
d'études,fpuisquefl'individuf1fdeflaf1 ère fbasefdefdonnéefn'estfpasflefmêmefquefl'indivduf1fd eflaf2 ème fbasefdef
donnée.ff

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

18 fEnf revanche,f onf remarquef toutf def suite,f qu'ilf estf p ossiblef def diref quelf âgef correspondf àf quelf niveauf
d'étudesfenfregardantflesfvariablesfstratefZDfmenag efetfindividu.fC'estfdoncfàfpartirfdefcesfvariables fqu'onf
vafconstruirefunfidentifiantfefficace.fD'unefpartfi lfafunfsens,fd'autrefpart,filfestfunique,fenfinfces fvariablesf
seftrouventfdansftoutesflesfenquêtesfauprèsfdesfmén ages.fstratefestflefnumérofdeflafstratef(dansfnotre fbasef
defdonnées,flaffcommunefdefBamako).fZDfestflafzonef defdénombrementfdufrecensement.fmenagefestflef
numérofdufménageféchantillonnéfaufseinfdeflafZD,fet findividuflefnumérofdefl'individufaufseinfdufménage .ff
Ilfestfpossiblefqu'onfaitféchantillonnéflefménagef0 58fdeflafZDf003fetflefménagef058fdeflafZDf023.fAuss i,f
lef numérof duf ménagef nef suffitf pasf àf identifierf def f açonf uniquef unf ménage,f doncf encoref moinsf unf
individu.fLafseuleffaçonfd'êtrefsûrfdefl'unicitéfde fl'identifiantfestfdoncfd'utiliserfcesf4fvariables. fIci,fonfaf
concaténéflesfvariablesfstrate,fZD,fmenagefetfindiv idufenftapantflafcommandef:ff
generate ident3=strate+ZD+menage+individu

fstrate ZD menage individu etudes ident3
02 039 204 05 0 0203920405
06 003 058 01 15 0600305801
05 007 146 05 2 0500714605
02 077 138 01 5 0207713801
02 070 094 04 0 0207009404
04 007 162 02 0 0400716202
02 045 214 01 0 0204521401
02 051 039 08 2 0205103908
01 209 012 01 0 0120901201
01 106 057 03 0 0110605703
f
strate ZD menage individu age ident3
05 007 146 05 9 0500714605
02 039 204 05 5 0203920405
02 045 214 01 32 0204521401
02 070 094 04 0 0207009404
02 077 138 01 38 0207713801
02 051 039 08 6 0205103908
06 003 058 01 26 0600305801
01 106 057 03 2 0110605703
01 209 012 01 50 0120901201
04 007 162 02 22 0400716202
Ilfestfalorsfpossible,fàfl'aidefdefcetfidentifiantf ident3funiquement,fdefdirefquelfâgefcorrespondfàfqu elfniveauf
d'études.fEnfeffetfl'individuf0500714605faf9fansf.f Cefmêmefindividufafdéjàffaitf2fansfd'annéesfd'étude sf
avecfsuccès.f
Créez toujours un identifiant des observations, uni que et qui ait un sens réel.

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

19 fTrierflafbasefdefdonnées f
Supposonsfqu'onfaitfconstruitfnotrefidentifiantfdef l'individuf
strate ZD menage individu idind genre age statut
03 037 097 04 0303709704 femme 24 Autres parents
03 005 070 03 0300507003 homme 26 enfant du CDM
03 073 256 04 0307325604 femme 10 enfant du CDM
03 039 105 09 0303910509 femme 12 enfant du CDM
05 007 118 02 0500711802 femme 18 Conjoint CDM
02 074 009 01 0207400901 homme 65 CDM
05 157 238 03 0515723803 homme 4 enfant du CDM
03 062 151 01 0306215101 homme 33 CDM
06 080 495 09 0608049509 femme 0 enfant du CDM
01 039 033 01 0103903301 homme 35 CDM
Dansflafbase,fonfafplusieursfindividusfpourfchaquef ménage.fMaisfsiflafbasefn'estfpasftriée,flesfindivi dusf
d'unfmêmefménagefnefsontfpasfàflafsuiteflesfunsfdes fautres.fIlfestfdoncfutilefdeflaftrierfparfménage.f f
sort :
Lafcommandefsortfsertfàftrierflafbasefdefdonnées.ff
sort idind
Alorsflesfindividusfd'unfmêmefménagefseftrouveflesf unsfàflafsuitefdesfautresf:ff
strate ZD menage individu segment idmen idind m3 m4 m5
01 009 007 01 01009 01009007 0100900701 homme 39 CDM
01 009 016 01 01009 01009016 0100901601 homme 49 CDM
01 009 016 02 01009 01009016 0100901602 femme 45 Conjoint CDM
01 009 016 03 01009 01009016 0100901603 homme 20 enfant du CDM
01 009 016 04 01009 01009016 0100901604 femme 30 Conjoint CDM
01 009 016 05 01009 01009016 0100901605 femme 14 enfant du CDM
01 009 016 06 01009 01009016 0100901606 femme 6 enfant du CDM
01 009 016 07 01009 01009016 0100901607 homme 11 enfant du CDM
01 009 016 08 01009 01009016 0100901608 femme 25 Conjoint CDM
01 009 016 09 01009 01009016 0100901609 femme 5 enfant du CDM
01 009 016 10 01009 01009016 0100901610 homme 4 enfant du CDM
01 009 025 01 01009 01009025 0100902501 homme 28 CDM
01 009 025 02 01009 01009025 0100902502 femme 23 Conjoint CDM
01 009 025 03 01009 01009025 0100902503 homme 2 enfant du CDM

Defplus,fcommefonfaftriéfparfl'identifiantfdefl'ind ividufetfnonfceluifdufménage,flesfmembresfd'unfmême f
ménagefsontfrangésfparfordre.fSouvent,flefnumérof1f aufcheffdefménage,fpuisflesfnumérofsuivantsfàfsonf
(safoufses)fconjoint(e)(s).fC'estflefcasfici.ff
Compteftenufdeflaffaçonfdontfnousfavonsfconstruitfn otrefidentifiant,ff
sortfsegmentf /bleftrightfsortfstratefZDf
sortfidmenf /bleftrightsortfstratefZDfmenage /bleftrightsortfsegmentfmenagef
sortfidindf /bleftrightsortfstratefZDfmenagefindividuf /bleftrightsortfsegmentfmenagefindividuf /bleftrightsortfidmenfindividuf
f
f

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

20 fTrierf safbasef defdonnéesf n'af pasf seulementf unef util itéf visuelle.f Unefdef sesf premièresf fonctionf estf def
permettrefdefcalculerfdesfstatistiquesfsurfdesfsous jéchantillonsfdéfinisfparflesfmodalitésfd'unefvaria ble.fParf
exemple,fsupposonsfqu'onfsouhaitefcalculerfcesfstat istiquesfdescriptivesfselonflefgenre.fOnfutilisefal orsflef
préfixefby,fquifpeutfs'appliquerfàflafgrandefmajori téfdesfcommandesfdefstatistiquesf:ff
[by varlist ]f:f command [ varlist ] [=exp] [if exp] [,options]
Pourfpouvoirfutiliserfby,filffautfaufpréalableftrie rflafbasefdefdonnéesfselonflafvariablefdefgenre.ff
. sort femme
. by femme : summarize age etudes
––––––––––––––––– ––––––––––
-> femme = 0

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
age | 6380 22.48652 18.11568 0 97
etudes | 6380 3.966458 4.855989 0 22
––––––––––––––––– ––––––––––
-> femme = 1

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
age | 6369 20.91003 16.35614 0 98
etudes | 6369 2.732768 3.907078 0 20

f
Lef trif permetf égalementf def créerf desf variablesf cons tantesf pourf certainsf groupesfd'observations.fSif onf
disposefdufrevenufindividuelfdefchaquefindividufetf qu'onfsouhaitefcalculerflefrevenuftotalfdufménage.f
Cettefnouvellefvariablefdoitfavoirflafmêmefvaleurfp ourftousflesfmembresfd'unfmêmefménage.ff
egen :
Lafcommandefegen,fextensionfdefgenerate,fpermetfdef créerfcesfvariablesf:f
. sort idmen
. egen revmen=total(revind), by(idmen)
. list idmen idind revind revmen in 1/18
+––––––––––––––+
| idmen idind revind revmen |
|––––––––––––––|
1. | 01009025 0100902501 120 252 |
2. | 01009025 0100902502 132 252 |
3. | 01009025 0100902503 0 252 |
4. | 01009034 0100903401 1584 2844 |
5. | 01009034 0100903402 1200 2844 |
|––––––––––––––|
6. | 01009034 0100903403 0 2844 |
7. | 01009034 0100903404 0 2844 |
8. | 01009034 0100903405 60 2844 |
9. | 01009052 0100905201 132 132 |
10. | 01009052 0100905202 0 132 |
|––––––––––––––|
11. | 01009061 0100906101 528 660 |
12. | 01009061 0100906102 132 660 |
13. | 01009061 0100906103 0 660 |
14. | 01009061 0100906104 0 660 |
15. | 01009061 0100906105 0 660 |
Ilfexistefbeaucoupfd'autresffonctionsfqueftotal(f), fparfexemplefmean(f),fmax(f),fmin(f).fPourfenfavoir flaflistef
complète,fconsultezfleffichierfd'aidefdeflafcommand efegenf(helpfegen).f

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

21 fFusionner des bases de données.
append :
Laf commandef appendf permetf def fusionnerf "horizontale ment"f deuxf basesf def donnéesf enf ajoutantf lesf
observationsfdefl'unefàfl'autre.fSupposonsfquefj'ai funefbasefdefdonnéesfavecflesfménagesfdeflafcommune fIf
defBamakofetfunefautrefbasefdefdonnéesfcontenantfle sfménagesfdeflafcommunefII.fJefveuxflesfassemblerf
pourfneftravaillerfquefsurfunefbasefdefdonnées.fAlo rsfj'utiliseflafcommandefappendf:ff
use table_CommI.dta
append using table_CommII.dta
f
table_CommI.dtaf:ff
commune strate ZD idmen idind m3
1 01 009 01009025 0100902501 homme
1 01 009 01009025 0100902502 femme
1 01 009 01009025 0100902503 homme
1 01 009 01009034 0100903401 homme
1 01 009 01009034 0100903402 femme
f
table_CommII.dtaf:ff
commune strate ZD idmen idind m3
2 02 003 02003011 0200301101 homme
2 02 003 02003011 0200301102 femme
2 02 003 02003011 0200301103 homme
2 02 003 02003020 0200302001 homme
2 02 003 02003020 0200302002 femme
f
Résultatfdeflafcommandefappendf:ff

f
fff
ffftable_CommIf

f
f
f
ffftable_CommII

f
f
Lafcommandfappendfnefnécessitefpasfdeftrierflesfobs ervations.fSifunefvariablefn'existefquefdansfunefde sf
deuxftables,fparfexemplefdansflafbaseftable_CommI,f elleffigurerafdansflafbaseffinale,favecfdesfvaleurs f
manquantesfpourflesfobservationsfdeflafcommunefII.f fcommune strate ZD idmen idind m3
1 01 009 01009025 0100902501 homme
1 01 009 01009025 0100902502 femme
1 01 009 01009025 0100902503 homme
1 01 009 01009034 0100903401 homme
1 01 009 01009034 0100903402 femme
2 02 003 02003011 0200301101 homme
2 02 003 02003011 0200301102 femme
2 02 003 02003011 0200301103 homme
2 02 003 02003020 0200302001 homme
2 02 003 02003020 0200302002 femme

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

22 fmerge :
Lafcommandefmergefpermetfdeffusionnerf"verticalemen t"fdeuxfbasesfdefdonnéesfcontenantfdesfindividusf
enfcommunfetfdesfvariablesfdifférentes.fSupposonsfq uefjefdisposefdesfdonnéesfsociojdémographiquesfdesf
individusfdansfunefbasefdefdonnées,fetfdesfvariable sfrelativesfàfl'emploifdansfunefautrefbasefdefdonné es.fJef
veuxflesfassemblerfenfétantfsurefd'affecterflesfbon nesfvaleursfdesfvariablesfd'emploifauxfbonsfindivid us.f
Alorsfj'utiliseflafcommandefmergef:ff
use sociodemo.dta, clear
sort idind
save sociodemo.dta, replace
use emploi.dta, clear
sort idind
merge idind using sociodemo.dta
f
Ilfestfnécessairefdefcréerflefmêmefidentifiantfdans flesfdeuxfbasesfetfdeftrierflesfbasesfselonfcetfide ntifiant.ff
sociodemo.dtaf:ff
idmen idind m3
01009025 0100902501 homme
01009025 0100902502 femme
01009025 0100902503 homme
01009034 0100903401 homme
01009034 0100903402 femme
emploi.dtaf:ff
idmen idind sitac
01009025 0100902501 actif occupé
01009025 0100902502 actif occupé
01009025 0100902503 moins de 10 ans
01009034 0100903401 actif occupé
01009034 0100903402 actif occupé
Résultatfdeflafcommandefmergef:ff
idmen idind m3 sitac _merge
01009025 0100902501 homme actif occupé 3
01009025 0100902502 femme actif occupé 3
01009025 0100902503 homme moins de 10 ans 3
01009034 0100903401 homme actif occupé 3
01009034 0100903402 femme actif occupé 3
f
Lafcommandefmergefcréefautomatiquementfunefvariable fnomméef_mergefquifvautf:fff
jf1fsifl'observationfnefseftrouvaitfquefdansflafbas efdefdonnéesf"maître"f(masterfdata),ficifemploi.dta f
jf2fsifl'observationfnefseftrouvaitfquefdansflafbas efdefdonnéesf"àfutiliser"f(usingfdata)f
jf3fsifl'observationfseftrouvaitfdansflesfdeuxfbase sfdefdonnéesf
Aussi,fpourfs'assurerfdeflafqualitéfdeflaffusion,fi lfestfnécessairefdefregarderflafdistributionfdeflaf variablef_m.f
Icif:ff
tabulate _merge
_merge | Freq. Percent Cum.
––––+––––––––––––
3 | 5 100.00 100.00
––––+––––––––––––
Total | 5 100.00
Iciflesf5fobservationsfseftrouvaientfdansflesfdeuxf basesfdefdonnées.f
Uneffoisflafqualitéfdeflaffusionfvérifier,fonfpeutf supprimerflafvariablef_mergef:ff
drop _merge

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

23 fAutrefexemplef:ff
sociodemo.dtaf:ff
idmen idind m3
01009025 0100902502 femme
01009025 0100902503 homme
01009034 0100903401 homme
01009034 0100903402 femme
f
emploi.dtaf:ff
idmen idind sitac
01009025 0100902501 actif occupé
01009025 0100902502 actif occupé
01009034 0100903401 actif occupé
01009034 0100903402 actif occupé
f
Résultatfdeflafcommandefmergef:ff
idmen idind m3 sitac _merge
01009025 0100902501 . actif occupé 2
01009025 0100902502 femme actif occupé 3
01009025 0100902503 homme . 1
01009034 0100903401 homme actif occupé 3
01009034 0100903402 femme actif occupé 3
f
Onfvérifieflafqualitéfdeflaffusionf:ff
tabulate _merge
_merge | Freq. Percent Cum.
––––+––––––––––––
1 | 1 20.00 100.00
2 | 1 20.00 100.00
3 | 3 60.00 100.00
––––+––––––––––––
Total | 5 100.00
f
_mergefprendflafvaleurf1fpourfl'individuf"010090250 3".fEnfeffet,filfestfbienfdansflafbasef"maîtresse", f
sociodemo.dta,fmaisfpasfdansflafbasefutilisée,fempl oi.dta.fOnfignorefdoncfsafvariablefdefstatutfvisjàj visfdef
l'activitéfdontflafvaleurfestfmanquantefdanslafbase ffinale.fDeflafmêmeffaçon,f_mergefprendflafvaleurf2 f
pourfl'individuf"0100902501".fEnfeffet,filfestfbien fdansflafbasefutilisée,femploi.dta,fmaisfpasfdansfl afbasef
"maîtresse",fsociodemo.dta.fOnfignorefdoncfsafvaria blefdefgenre,fdontflafvaleurfestfmanquantefdanslafb asef
finale.ff
Vérifier la qualité du merge. Pensez à supprimer en suite la variable _merge

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

24 fcollapse : A UTILISER AVEC PRECAUTION
Laf commandef collapsefremplacef laf basef def donnéesf ut iliséef parf unef tablef defstatistiquesfdescriptives.f
Supposonsfqueflafbasefdefdonnéesfcontienneflefreven ufdefchaquefmembrefdesfménages.fSifjefveuxfcréerf
unefbasefnefcontenantfqu'unefseuleflignefparfménage favecfcommefvariableflefrevenuftotalfdufménagef:f
. list idmen idind revind
+–––––––––––+
| idmen idind revind |
|–––––––––––|
1. | 01009025 0100902502 132 |
2. | 01009025 0100902503 0 |
3. | 01009025 0100902501 120 |
4. | 01009034 0100903401 1584 |
5. | 01009034 0100903402 1200 |
|–––––––––––|
6. | 01009034 0100903403 60 |
7. | 01009034 0100903404 0 |
8. | 01009043 0100904302 132 |
9. | 01009043 0100904301 0 |
10. | 01009043 0100904304 0 |
|–––––––––––|
11. | 01009043 0100904303 396 |
+–––––––––––+
. sort idmen
. collapse (sum) revind, by(idmen)
. list
+––––––-+
| idmen revind |
|––––––-|
1. | 01009025 252 |
2. | 01009034 2844 |
3. | 01009043 528 |
+––––––-+
Cettefcommandefremplaçeflafbasefdefdonnéesfinitiale fparfunefbasefdefdonnéesfcontenantfdesfstatistiques f
descriptivesf(icifleftotalfdufrevenu).fIlfconvientf doncfdefvérifierfqu'onfafbienfenregistréfsafbasefde fdonnéesf
avantfd'utiliserfcollapse.fParfprudence,fonfluifpré fèrefegen,fquifcalculerafaussiflefrevenuftotalfdufm énage,f
maisfenfconservantftoutesflesfobservationsfindividu ellesf(voirfegen,fdansflefmêmefchapitre)f:ff

Attention : lorsqu'on débute, egen est préférable à collapse

expand
Lafcommandefexpandfpermetfdefdupliquerflesfobservat ionsf:ff
. list
+––––––+
| idind age |
|––––––|
1. | 0100900701 39 |
2. | 0100901603 20 |
+––––––+
. expand 3
(4 observations created)
. list
+––––––+
| idind age |
|––––––|
1. | 0100900701 39 |
2. | 0100901603 20 |
3. | 0100900701 39 |
4. | 0100900701 39 |
5. | 0100901603 20 |
|––––––|
6. | 0100901603 20 |
+––––––+

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

25 fLes variables systèmes _n et _N
f
UnefvariablefsystèmefestfunefvariablefcréefparfStat afmaisfquifn'estfpasfprésentefdansflafbasefdefdonné e.f
Ellesfexistentfdèsflorsfqu'unefbasefdefdonnéesfestf chargéefdansfStata.fLesfdeuxfvariablesfsystèmeflesf plusf
utiliséesfsontf_nfetf_N.ff
_nf contientf lef numérof def l'observationf courante.f Pa rfexemple,f lorsqu'onf utilisef laf commandef list,f desf
numérosffigurentfàfgauchefdeflafpremièrefvariablef( enfrougefici,fmaisfenfvertfdansflaffenêtrefResults) f:fff
f
. list idmen idind m3

+––––––––––-+
| idmen idind m3 |
|––––––––––-|
1. | 01009025 0100902501 homme |
2. | 01009025 0100902502 femme |
3. | 01009025 0100902503 homme |
4. | 01009034 0100903401 homme |
5. | 01009034 0100903402 femme |
|––––––––––-|
6. | 01009034 0100903403 femme |
7. | 01009034 0100903404 homme |
8. | 01009034 0100903405 femme |
9 . | 01009052 0100905201 homme |
10 . | 01009052 0100905202 femme |
+––––––––––-+
f
Cesf numérosf sontf laf valeurf def laf variablef _nf pourf c haquef observation.f _nf estf doncf laf positionf def
l'observationf dansf laf basef def données.f Sif jef trief l af basef def donnéesf dansf unf autref ordre,f l'individuf
"0100902501"fn'aurafplusflafmêmefvaleurfdef_nf:ff
f
. list idmen idind m3

+––––––––––-+
| idmen idind m3 |
|––––––––––-|
1. | 01009034 0100903403 femme |
2. | 01009052 0100905201 homme |
3. | 01009025 0100902503 homme |
4. | 01009034 0100903405 femme |
5. | 01009052 0100905202 femme |
|––––––––––-|
6. | 01009025 0100902502 femme |
7. | 01009034 0100903401 homme |
8. | 01009034 0100903402 femme |
9. | 01009034 0100903404 homme |
10 . | 01009025 0100902501 homme |
+––––––––––-+
f
L'individuf"0100902501"fafdésormaisfcommefvaleurfde f_nflefnombref10fcarfilfestfsurflaf10 ème flignefdeflaf
basefdefdonnées,falorsfqu'avant,filfavaitfcommefval eurfdef_nflefnombref1fcarfilfétaitfsurflaf1 ère flignefdeflaf
basefdefdonnées.f_nfestfdoncflefnumérofdeflaflignef defl'individufdansflafbase.ff
f
f

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

26 fLafvariablef_nfpeutfégalementfcompterflesfobservati onsfaufseinfd'unfgroupe,fparfexemplefdufménage.ff
. sort idmen

. by idmen : list idmen idind m3

––––––––––––––––– –––––––––––
-> idmen = 01009025
+––––––––––-+
| idmen idind m3 |
|––––––––––-|
1. | 01009025 0100902501 homme |
2. | 01009025 0100902502 femme |
3. | 01009025 0100902503 homme |
+––––––––––-+

––––––––––––––––– –––––––––––
-> idmen = 01009034
+––––––––––-+
| idmen idind m3 |
|––––––––––-|
1. | 01009034 0100903401 homme |
2. | 01009034 0100903402 femme |
3. | 01009034 0100903404 homme |
4. | 01009034 0100903405 femme |
5. | 01009034 0100903403 femme |
+––––––––––-+

––––––––––––––––– –––––––––––
-> idmen = 01009052

+––––––––––-+
| idmen idind m3 |
|––––––––––-|
1. | 01009052 0100905202 femme |
2. | 01009052 0100905201 homme |
+––––––––––-+
f
Supposonsfquefjefnefdisposefquefdefl'identifiantfdu fménage.fJefveuxfnuméroterflesfindividusfaufseinfde sf
ménagesfsansfrèglefparticulièref(unefrègleffréquemm entfutiliserfestfd'attribuerflefnumérof1faufcheffdu f
ménage,fmaisfpourfl'exemple,fonfsupposefquefcelafno usfestfégal).fff
. sort idmen

. by idmen : gen num_individu=_n

. list idmen num_individu m3
+––––––––––+
| idmen num_in~u m3 |
|––––––––––|
1. | 01009025 1 homme |
2. | 01009025 2 femme |
3. | 01009025 3 homme |
4. | 01009034 1 homme |
5. | 01009034 2 femme |
|––––––––––|
6. | 01009034 3 homme |
7. | 01009034 4 femme |
8. | 01009034 5 femme |
9. | 01009052 1 femme |
10. | 01009052 2 homme |
+––––––––––+
f
f

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

27 f_Nfcontientflefnombreftotalfd'observationsfdansflaf basefdefdonnées,fc'estjàjdireflefmaximumfdef_n.fPar f
exemple,fdansflafbasefdefdonnéesfcijdessus,f_N=10.f
Deflafmêmeffaçonfquefpourf_n,f_Nfpeutfêtrefcalculéf parfsousjgroupe,fparfexemplefparfménage.f
. sort idmen

. by idmen : generate taille=_N

. list idmen idind taille
+–––––––––––+
| idmen idind taille |
|–––––––––––|
1. | 01009025 01009025 01 3 |
2. | 01009025 01009025 02 3 |
3. | 01009025 01009025 03 3 |
4. | 01009034 01009034 01 5 |
5. | 01009034 01009034 02 5 |
|–––––––––––|
6. | 01009034 01009034 03 5 |
7. | 01009034 01009034 04 5 |
8. | 01009034 01009034 05 5 |
9. | 01009052 01009052 01 2 |
10. | 01009052 01009052 02 2 |
+–––––––––––+
f
Unfexemplefcourantfd'utilisationfdefcesfdeuxfvariab lesf(_nfetf_N)festflafrecherchefetflafsuppressionfd ef
duplicationsf dansf unef basef def données.f Ilf arrivef so uventf quef desf erreursf dansf laf saisief desf donnéesf
conduisentfàfdesfduplicationsfd'observation.fC'estj àjdirefqu'unfmêmefindividuffigurerafdeuxffoisfdansf laf
basefdefdonnées.fDansfcertainsfcas,fcesfduplication sfsontfnombreuses.fAussi,florsqu'onfrécupèrefunefba sef
defdonnées,filfconvientfdefvérifierfl'existencefdef duplicationsfetflefcasféchéant,fdeflesfsupprimer.ff
Sifdeuxflignesfsontfstrictementfidentiques,fellesfa urontflefmêmefidentifiantfdefl'individuf
. sort idind
. by idind : generate dupli = cond(_N==1,0,_n)

duplifvautf0fsifsif_N==1,fc'estjàjdirefsiflefnombre fd'observationsfparfvaleurfd'identifiantfestfégalfà f1,fc'estj
àjdiref sif unf seulf individuf correspondf àf unf seulf ide ntifiant.f Donc,f duplif vautf 1f sif l'individuf n'estf pa sf
dupliqué.ff
Sif_Nfn'estfpasfégalfàf1,fc'estjàjdirefs'ilfestfsup érieurfàf1,fcelafveutfdirefquefplusieursfobservatio nsfontflef
mêmefidentifiant,fparfexemplef_N=2fobservationsfont flefmêmefidentifiant.fC'estjàjdirefqu'unfindividuf
figurefdeuxffoisfdansflafbasefdefdonnées.fSifplusie ursfobservationsfontflefmêmefidentifiant,fduplifvau tf_n.ff
f
Exemplef:ff
. list
+–––––––––+
| idind m3 age |
|–––––––––|
1. | 0303512904 homme 6 |
2. | 0201501802 femme 35 |
3. | 0301709104 homme 25 |
4. | 0511720405 homme 1 |
5. | 0112302203 femme 13 |
|–––––––––|
6. | 0201501802 femme 35 |
7. | 0201501802 femme 35 |
8. | 0511720405 homme 1 |
+–––––––––+
f

AudefVescovo,fIRDjAFRISTATf f f f fffffffffffCoursfV.fS tructurefdesfbasesfdefdonnéesf

28 fSifonfsefpenchefsurflafbasefdefdonnées,fonfs'aperço itfqueflesflignesf2,f6fetf7fsontflesfmêmesfetfquefl esf
lignesf4fetf8fsontfidentiquesfégalement.fC'estfenco refplusfvisibleflorsqu'onftrieflafbasefselonfidindf :ff

. sort idind
. list
+–––––––––+
| idind m3 age |
|–––––––––|
1. | 0112302203 femme 13 |
2. | 0201501802 femme 35 |
3. | 0201501802 femme 35 |
4. | 0201501802 femme 35 |
5. | 0301709104 homme 25 |
|–––––––––|
6. | 0303512904 homme 6 |
7. | 0511720405 homme 1 |
8. | 0511720405 homme 1 |
+–––––––––+

Onfcréefalorsflafvariablefduplif:ff
f
. by idind : generate dupli = cond(_N==1,0,_n)
. list
+–––––––––––-+
| idind m3 age dupli |
|–––––––––––-|
1. | 0112302203 femme 13 0 |
2. | 0201501802 femme 35 1 |
3. | 0201501802 femme 35 2 |
4. | 0201501802 femme 35 3 |
5. | 0301709104 homme 25 0 |
|–––––––––––-|
6. | 0303512904 homme 6 0 |
7. | 0511720405 homme 1 1 |
8. | 0511720405 homme 1 2 |
+–––––––––––-+
f
duplifvautf0florsquefl'observationfestfunique.fdupl ifvautf1fpourflafpremièrefoccurrencefdefl'identifia ntf
"0201501802",f2fpourflafdeuxièmefoccurrencefetf3fpo urflaftroisième.fDefmême,fduplifvautf1fpourflaf
premièrefoccurrencefdefl'identifiantf"0511720405"fe tf2fpourflafdeuxièmefoccurrence.fPourfsupprimerfles f
duplications,filfsuffitfalorsfdeftaperf:ff
f
. drop if dupli>1
(5 observations deleted)
. list
+–––––––––––-+
| idind m3 age dupli |
|–––––––––––-|
1. | 0201501802 femme 35 2 |
2. | 0201501802 femme 35 3 |
3. | 0511720405 homme 1 2 |
+–––––––––––-+
f
Attention,filfneffautfpasfgarderfuniquementflesfobs ervationsfpourflesquelsfdupli=0,fmaisfbienfcellesfp ourf
quifdupli=0foufdupli=1.fSinonfvousfsupprimeriezftou tesflesfréplicationsfd'unfindividufetfilfdisparaîtr aitfdef
lafbase.ff

AudefVescovo,fIRDjAFRISTATf ffffffffffffCoursfVI.fCo mmandesfdefbasesfpourfdesfstatistiquesfdescriptives f

29 fCours VI. Commandes de bases pour obtenir des stati stiques descriptives
tabulate :
Lafcommandeftabulatefsertfàfcalculerflesffréquences fd'apparitionfdesfmodalitésfd'unefvariablefdiscrète f:ff
. tabulate m14b

type |
enseignement | Freq. Percent Cum.
––––+––––––––––––
sans educ | 6,492 50.92 50.92
fonda 1 | 3,077 24.14 75.06
fonda 2 | 1,604 12.58 87.64
Lycée Gal | 447 3.51 91.14
Lycée TP | 660 5.18 96.32
Sup | 469 3.68 100.00
––––+––––––––––––
Total | 12,749 100.00

L'optionfnolabelfpermetfd'affichierflafvaleurfdesfm odalitésfplutôtfquefleurflabel.fL'optionfplotfrepré senteflaf
répartitionfdesfmodalitésfavecfdesflignesfd'étoiles f:fff
. tabulate m14b, plot nolabel

type |
enseignement | Freq.
––––-+––––+–––––––– ––––––––––
0 | 6,492 |************************ *****************************
1 | 3,077 |************************ *
2 | 1,604 |*************
3 | 447 |****
4 | 660 |*****
5 | 469 |****
––––+––––+–––––––– ––––––––––
Total | 12,749

L'optionfgenfestftrèsfutilefcarfellefpermetfdefcrée rfunefvariablefindicatricefcorrespondantfàfchacunef desf
modalités.fIci,fonfcrééf6fvariablesfnomméesfniveau1 ,fniveau2,… niveau6f:f
. tabulate m14b, gen (niveau)
f
f
f
f
f
f
f
f
f

AudefVescovo,fIRDjAFRISTATf ffffffffffffCoursfVI.fCo mmandesfdefbasesfpourfdesfstatistiquesfdescriptives f

30 fLaf commandef tabulatef permetf égalementf def créerf desf tableauxf croisésf def variables.f Ici,f onf croisef laf
situationfdansfl'activitéfdufcheffdefménagefavecfle fquintilefdefrevenufdufménage.f
. tabulate sitac quintiles if CDM==1, row col nofre q

+––––––-+
| Key |
|––––––-|
| row percentage |
| column percentage |
+––––––-+

situation | 5 quantiles of revcap
activité | 1 2 3 4 5 | Total
––––+––––––––––––– –––––-+–––-
actif | 10.17 17.36 18.90 2 4.44 29.13 | 100.00
occupe | 38.98 78.55 87.65 9 0.53 92.40 | 77.96
––––+––––––––––––– –––––-+–––-
chomeur | 76.81 8.70 5.80 5.80 2.90 | 100.00
BIT | 10.82 1.45 0.99 0.79 0.34 | 2.86
––––+––––––––––––– –––––-+–––-
chomeur | 50.00 23.33 3.33 1 0.00 13.33 | 100.00
decourage | 3.06 1.69 0.25 0.59 0.68 | 1.25
––––+––––––––––––– –––––-+–––-
inactif | 53.47 17.59 10.42 9.49 9.03 | 100.00
| 47.14 18.31 11.11 8.09 6.59 | 17.93
––––+––––––––––––– –––––-+–––-
Total | 20.34 17.23 16.81 2 1.05 24.57 | 100.00
| 100.00 100.00 100.00 10 0.00 100.00 | 100.00
Lesfoptionsfrowfetfcolfindiquentfqu'onfsouhaitefvoi rflesfpourcentagesfenflignefetfenfcolonne.fL'option f
nofreqfprécisefqu'onfnefsouhaitefpasfvoirflesfeffec tifs.ff
Lafcommandeftabulatefpermetfégalementfd'effectuerfu nftestfdufχ2. L'optionfexpectedfpermetfdefvoirflesf
effectifsfattendus,fsiflesfvariablesfétaientfindépe ndantes.f f

. tabulate sitac quintiles if CDM==1, chi2 expected
+–––––––+
| Key |
|–––––––|
| frequency |
| expected frequency |
+–––––––+

situation | 5 quantiles of revcap
activité | 1 2 3 4 5 | Total
––––+––––––––––––– –––––-+–––-
actif | 191 326 355 459 547 | 1,878
occupe | 382.0 323.5 315.7 3 95.2 461.5 | 1,878.0
––––+––––––––––––– –––––-+–––-
chomeur | 53 6 4 4 2 | 69
BIT | 14.0 11.9 11.6 14.5 17.0 | 69.0
––––+––––––––––––– –––––-+–––-
chomeur | 15 7 1 3 4 | 30
decourage | 6.1 5.2 5.0 6.3 7.4 | 30.0
––––+––––––––––––– –––––-+–––-
inactif | 231 76 45 41 39 | 432
| 87.9 74.4 72.6 90.9 106.2 | 432.0
––––+––––––––––––– –––––-+–––-
Total | 490 415 405 507 592 | 2,409
| 490.0 415.0 405.0 5 07.0 592.0 | 2,409.0

Pearson chi2(12) = 597.1354 Pr = 0.000
L'hypothèsefnullefduftestfduf χ2 estfl'indépendancefdesfdeuxfvariables.fIcifonfafmoi nsfdef1fchancefsurf1000f
defseftromperfenfrejetantfH 0.fDoncfonflafrejette.fLesfvariablesfsontfsignificat ivementfdépendantes.f

AudefVescovo,fIRDjAFRISTATf ffffffffffffCoursfVI.fCo mmandesfdefbasesfpourfdesfstatistiquesfdescriptives f

31 ftable
Lafcommandeftablefsertfàfcréerfdesftableauxfdefstat istiquesfdescriptives.fIci,fonfcréefuneftablefconte nant,f
pourfchaquefcroisementfdeflafsituationfdansfl'activ itéfetfdufgenre,flafmoyennefdufrevenufindividuel.ff
. table m3 sitac, contents (mean revind)
––––––––––––––––– –––
| situation dans activité
genre | 1 2 3 4 5
–––-+–––––––––––––- –––
homme | 362.5652 150.6192 253.1582 229.9465 191.8583
femme | 295.5595 177.4115 157.0455 240.8907 208.6397
––––––––––––––––– –––
f
summarize
Laf commandef summarizef sertf àf calculerf desf statistiq uesf descriptivesf d'unef variablef continuef (vuef
précédemment).ff

mean
Laf commandef meanf calculef laf moyennef d'unef variable, f l'erreurf typef etf l'intervallef def confiancef def
l'estimationfdeflafmoyenne.fL'optionfoverfpermetfde ffaireflesfcalculsfséparémentfsurfdesfgroupesf:ff
. mean revind, over(m3)
Mean estimation Number of obs = 12748

homme: m3 = homme
femme: m3 = femme

––––––––––––––––– ––––
Over | Mean Std. Err. [95% Conf . Interval]
––––-+––––––––––––- ––––
revind |
homme | 389.0121 21.99022 345.9079 432.1162
femme | 121.5222 8.247381 105.3561 137.6883
––––––––––––––––– ––––
total
Lafcommandeftotalfcalculefleftotalfd'unefvariablef
. total unite poids

Total estimation Number of obs = 12749

––––––––––––––––– ––––
| Total Std. Err. [95% Conf . Interval]
––––-+––––––––––––- ––––
unite | 12749 0 . .
poids | 1142483 5766.12 1131181 1153786
––––––––––––––––– ––––

. total unite [pw=poids]

Total estimation Number of obs = 12749
––––––––––––––––– ––––
| Total Std. Err. [95% Conf . Interval]
––––-+––––––––––––- ––––
unite | 1142483 0 . .
––––––––––––––––– ––––

AudefVescovo,fIRDjAFRISTATf ffffffffffffCoursfVI.fCo mmandesfdefbasesfpourfdesfstatistiquesfdescriptives f

32 fratio
Lafcommandefratiofcalculeflefratiofentrefdeuxfvaria blef
. ratio actif/PAT
Ratio estimation Number of obs = 12749
_ratio_1: actif/PAT
––––––––––––––––– ––––
| Linearized
| Ratio Std. Err. [95% Conf . Interval]
––––-+––––––––––––- ––––
_ratio_1 | .5562444 .0052749 .5459048 .5665839
––––––––––––––––– ––––

Cettefcommandefdonneflefmêmefrésultatfqueff
. mean actif if PAT==1

Les graphiques dans Stata
Onfprésenteficifquelquesfcommandesfpermettantfdefde ssinerfdesfgraphiques.fStatafdisposefd'unfmenuf
graphiquefquifévitefdefprogrammerflesfcommandesfgra phiquesfetfleursfoptions.fCefmenufestftrèsfpratique f
carf lesf optionsf "esthétiques"f sontf trèsf nombreusesf (couleurs,f police,…).f Parf exemple,f laf commandef
histogramfreprésentefl'histogrammefd'unefvariablef( catégoriellefoufcontinue).f
. histogram m14b if m17==2 & age>=7, discrete
Aufprixfdeflafcommandefcijdessous,ftrèsflonguefetfi ncompréhensible,fonfpeutfdessinerfdesfgraphiquesftr èsf
travaillés.fPourfdeftelsfgraphiques,filfestfdoncfpr éférablesfd'utiliserflefmenu.f
histogram m14b if age>=7 & m17==2, discrete fcolor( eltgreen) lcolor(dkgreen)/*
*/ ytitle(Fréquence, size(small) color(dkgreen)) yl abel(, tlcolor(dkgreen) /*
*/ labcolor(dkgreen) labsize(medsmall)) xtitle(Nive aux d'éducation, size(small) /*
*/ color(dkgreen)) xlabel( 0 "Non scolarisés" 1 "Fo ndamental 1" 2 "Fondamental 2"/*
*/ 3 "Lycée général" 4 "Lycée tech. et prof" 5 "Sup érieur" , noticks labels /*
*/ valuelabel tlcolor(dkgreen) labcolor(dkgreen) an gle(forty_five) /*
*/ labsize(medsmall)) title(, size(medium) color(dk green)) /*
*/ subtitle(,color(dkgreen)) by(femme, title(Educat ion à Bamako en 2001, /*
*/ size(medium) color(dkgreen)) subtitle(, size(sma ll) color(dkgreen)) /*
*/ note(Individus de 7 ans et plus ayant fini leur scolarité, /*
*/ size(vsmall)color(dkgreen)) legend(off))
0 .2 .4 .6 Density
0 2 4 6
type enseignement

AudefVescovo,fIRDjAFRISTATf ffffffffffffCoursfVI.fCo mmandesfdefbasesfpourfdesfstatistiquesfdescriptives f

33 f0 .2 .4 .6
Non scolarisés Fondamental 1
Fondamental 2
Lycée général
Lycée tech. et prof
Supérieur
Non scolarisés Fondamental 1
Fondamental 2
Lycée général
Lycée tech. et prof Supérieur Hommes Femmes Fréquence
Niveaux d'éducation
Individus de 7 ans et plus ayant fini leur scolarit é Education à Bamako en 2001
f
f
Lafcommandefquantilefreprésenteflesfquantilesfdefla fdistributionfd'unefvariablefcontinuefetfceuxfdefla f
distributionfuniforme.f
Lafcommandefqnormfreprésenteflesfquantilesfdeflafdi stributionfetflesfcomparefàfceuxfdeflafloifnormale. f
Lafcommandefgraphfboxfreprésentefunfboxjplotf
Lafcommandefscatterplotfreprésentefunfnuagefdefpoin tsf
LafcommandefkdensityfreprésenteflafdensitéfdefKerne lfdeflafdistributionfd'unefvariablef
Lafcommandeflowessflissefunefdistributionf
Lafcommandefgraphftwowayfreprésentefuneffonctionfqu elconquefdéfiniefparf(x,y)f
f
Sauverfunfgraphiquef:f
graph save "Distribution des revenus.gph", replace
ff

AudefVescovo,fIRDjAFRISTATffffffffffffffffffffCours fVII.fLafprécision:fpoids,fplanfdefsondagefetfboots trap
34 fCours VII. La précision dans Stata : poids, plan de sondage et bootstrap
Ilfexistef4ftypesfdefpoidsfdansfStataf:ff
j fweights ,f pourf frequencyf weights.f Ilsf indiquentf lef nombref d 'individusf représentésf parf unef
observation.fIlsfdoiventfêtrefentiers.f
j pweights ,flesfpoidsfd'échantillonnage,foufcoefficientsfd'ex trapolation,finversesfdesfprobabilitésf
d'inclusion.f
j aweights ,fpourfanalyticfweights.fIlsfs'utilisentfquandflesf observationsfreprésententfdesfmoyennesf
etflefpoidsfreprésenteflefnombrefd'élémentsfayantfs ervifàfcalculerfcesfmoyennes.fIlsfnefchangentf
pasflafvaleurfdeflafmoyennefcalculée,fmaisfl'erreur jtype,flafprécision,fcarfilftientfcomptefduffaitfqu ef
chaquefobservationfestfdéjàfissufd'unefestimation.f
j iweights ,fpourfimportancefweights.fIlsfindiquentfunefimport ancefrelativefdesfobservations.fIlsf
n'ontf pasf def définitionf statistique.f Lesf commandesf quif supportentf lesf iweightsf définissentf
précisémentfleftraitementffait.fEnffaitfilsfsontfut ilisésfparflesfprogrammeursfdefcommandes.f
Onfprécisefleftypefdefpoidsfdansflafcommandef:ff

[by varlist ]f:f command [ varlist ] [=exp] [if exp] [weights ] [,options]
f
. summarize age [aw=poids]

Variable | Obs Weight Mean St d. Dev. Min Max
––––-+––––––––––––- –––––––––-
age | 12749 1142483.45 21.07993 16 .97981 0 98

. mean age [pw=poids]

Mean estimation Number of obs = 12749

––––––––––––––––– ––––
| Mean Std. Err. [95% Conf . Interval]
––––-+––––––––––––- ––––
age | 21.07993 .1703419 20.74604 21.41383
––––––––––––––––– ––––

. summarize age [iw=poids]

Variable | Obs Weight Mean St d. Dev. Min Max
––––-+––––––––––––- –––––––––-
age | 12749 1142483.45 21.07993 16 .97915 0 98

. summarize revcap [fw=taille1] if CDM==1

Variable | Obs Mean Std. Dev. Min Max
––––-+––––––––––––- ––––––-
revcap | 12749 255.352 819.6166 0 60000
f
f
Tousflesftypesfdefpoidsfnefsontfpasfdisponiblesfave cftoutesflesfcommandes.fPourfconnaîtrefleftypefdef
poidsfsupportéfparflafcommande,filffautfregarderfda nsfleffichierfd'aide.f
f

AudefVescovo,fIRDjAFRISTATffffffffffffffffffffCours fVII.fLafprécision:fpoids,fplanfdefsondagefetfboots trap
35 fL'utilisationfdesfpoidsfd'échantillonnagefseffaitfà fl'aidefdefpweight.fCependantfunfcalculfsansfbiaisf deflaf
précisionfdesfindicateursfcalculésfnécessitefd'util iserfd'autresfinformationsfdufplanfd'échantillonnag ef:flesf
strates,flesfunitésfprimairesfdefsondagefdansfunfso ndagefàfdeuxfdegrés,….fIlffautfdoncfdonnerftoutesfc esf
informationsfàfStata.fLefplanfd'échantillonnagefsef définitfparflafcommandefsvysetf:ff
svyset ZD [pw=poids], strata(strate)

Unef foisf lef planf def sondagef défini,f lef préfixef svyf permetf d'effectuerf desf estimationsf enf estimantf
correctementflafprécisionf: svy : mean, svy : total, svy : ratio, svy : regress

Lafvariancefdesftotaux,fmoyennefetfautresfstatistiq uesfpeutfêtrefestiméefàfl'aidefdefplusieursmféthode sf:flaf
linéarisationf def laf variance,f lef bootstrap,f lef jack knife,f laf méthodef desf BRRf (Balancedf Repeatedf
Replications).fIlfestfpossiblefdefdécrirefdesfplans fdefsondageftrèsfcomplexes,fcommefàf5fdegrés,fstrat ifiésfàf
tousflesfdegrés…Plusieursfexemplesfsontfprésentésfd ansfleffichierfd'aidefdefsvyset.ff
f
Pourfeffacerflefplanfdefsondagef:f
svyset, clear
f
f
Lorsqu'onf disposef def peuf d'informationf surf lef planf def sondagef (ouf dansf lef casf def modèlesf
économétriques,fqu'onfdoutefdefl'homoscédasticitéfd ufmodèlefoufqu'onfsupposefunfmauvaisfcalculfdesf
erreursjtype)flafméthodefdefbootstrapfpeutfêtrefuti le.fLargementfrépanduefaujourd'hui,fellefafl'avanta gefdef
suivrefunfprincipef"universel".fLefbootstrapfconsis tefàftirerfavecfremisef Rféchantillonsfdefmêmeftaillefquef
l’échantillonfinitial.fL'estimateur,fquelfqu'ilfsoi t,festfcalculéfàfchaquefitération.fLafprécisionfdef l'estimateurf
bootstrapéfestfestiméefparflafvariancefdesfRfestima teurs.ff
Lefpréfixefbootstrapfpermetfdeffairefdesfréplicatio nsfbootstrapfd'unefestimation.fParfdéfaut,fStatafef fectuef
50fréplications.fIci,fonfluifdemandefd'enffairef100 .f
f
. bootstrap, reps(100) : mean age
(running mean on estimation sample)

Bootstrap replications (100)
–-+– 1 –+– 2 –+– 3 –+– 4 –+– 5
………………………………………….. 50
………………………………………….. 100

Mean estimation Number of obs = 12749
Replications = 100

––––––––––––––––– ––––
| Observed Bootstrap Norma l-based
| Mean Std. Err. [95% Conf . Interval]
––––-+––––––––––––- ––––
age | 21.69896 .1716595 21.36251 22.0354
––––––––––––––––– ––––

AudefVescovo,fIRDjAFRISTATf f f f ffffffffffCoursfVIII. fLefmodèleflinéairefdansfStataf

36 fCours VIII. Le modèle linéaire dans Stata
Supposonsf qu'onf étudief lesf déterminantsf duf revenu.f Onf commencef parf étudierf desf corrélations.f Laf
commandefcorrelatefcalculeflefcoefficientfdefcorrél ationfentrefdeuxfvariablesf
f
. correlate age revind etudes
(obs=12748)

| age revind etudes
––––-+–––––––––
age | 1.0000
revind | 0.2109 1.0000
etudes | 0.2544 0.1598 1.0000
f
Ilf apparaîtf quef lef revenuf individuelf (activitésf pri ncipalef etf secondairef etf autresf revenus)f estf corrél éf
positivementf àf l'âgef etf auf nombref d'annéesf d'études f réussies.f Pourf savoirf sif cettef corrélationf estf
significative,fonfpeutfprocéderfàfunftestfdefnullit éfdufcoefficientfdeflafcorrélation,fàfl'aidefdeflaf commandef
pwcorrfetfdefsonfoptionfsigf:ff
f
. pwcorr age revind etudes, sig

| age revind etudes
––––-+–––––––––
age | 1.0000
|
revind | 0.2109 1.0000
| 0.0000
|
etudes | 0.2541 0.1598 1.0000
| 0.0000 0.0000
f
Lesfcorrélationsf(revenu,fâge)fetf(revenu,fétudes)f sontftoutesflesfdeuxfsignificatives.f(Lafcorrélatio nfentref
l'âgefetflesfétudesfaussi).fOnfàfmoinsfdef1fchancef surf1000fdefseftromperfenfaffirmantfqueflefcoeffici entfdef
corrélationfestfdifférentfdef0.fOnfditfqueflefcoeff icientfdefcorrélationfentreflefrevenufetflefnombref d'annéesf
d'étudesfestfdef25,4%fetfqu'ilfestfsignificatiffauf seuilfdef1‰.ff
significativitéf=f0.000f f significatiffaufseuilfdef1 ‰f
significativitéf<f0.010f f significatiffaufseuilfdef1 %f
significativitéf<f0.050f f significatiffaufseuilfdef5 %f
significativitéf<f0.100f f significatiffaufseuilfdef1 0%f
f
Lef revenuf dépendf def plusieursf variablesf enf mêmef tem ps.f Laf corrélationf nousf permetf def testerf lesf
varaiblesfexplicativesfunefparfune,fmaisfpasfensemb le.fLefmodèleflinéaire,foufmodèlefdesfmoindresfcarr ésf
ordinairesfpermetfd'estimerfl'effetfd'unffacteurfsu rflafvariablefd'intérêt,f"toutefchosefégalefparfail leurs",f
c'estjàjdirefenfmaintenantflesfautresfvariablesfcon stantes,fàfleurfmoyennefpourflesfvaraiblesfcontinue s,fàf

AudefVescovo,fIRDjAFRISTATf f f f ffffffffffCoursfVIII. fLefmodèleflinéairefdansfStataf

37 fleurfvaleurfditefdefréférencefpourflesfvariablesfca tégorielles.fIlfestfpréférablefdefchoisirflafcarégo rieflafplusf
représentéefcomefcatégoriefdefréférence.f
PourfpouvoirfassumerfqueflesfcoefficientsfdeflafMCO fsontfnonjbiaisés,fc’estjàjdirefqueflafvaleurfprédi tef
parfl’estimateurfconvergefversflafvaleurfdansflafpo pulation,fonfdoitffairefl’hypothèsefqueflesf4fcondi tionsf
suivantesfsontfrespectéesfdansfnotreféchantillonf:f f
1.fLesfparamètresfsuiventfuneffonctionflinéairesf:f yf=fβ0f+fβ1xf+fuf
2.fL’échantillonfestfidentiquementfetfindépendammen tfdistribuéf(iid).f
3.fL’espérancefduftermefd’erreurfsachantfxfestfégal efàfzéro.fEf(u/x)f=f0f
4.fPasfdefmulticolinéaritéfexactefentreflesfvaraibl esfexplicativesfx.f
Lafcommandefregressfpermetfd'estimerfunfmodçlefparf lesfmoindresfcarrésfordinaires.fIcifonfcherchefàf
expliquerflefrevenufdefl'activitéfprincipalefparfle fgenre,fl'âgefetfsonfcarré,fetflefniveaufd'études.f ONfafchoisif
lefniveauf"sansféducation"fcommefmodalitéfdefréfére nce.f
. regress lrevAPh femme age age2 nived2 nived3 nive d4 nived5 nived6

Source | SS df MS Number of obs = 3876
––––-+–––––––––– F( 8, 3867) = 219.16
Model | 1616.0648 8 202.0081 Prob > F = 0.0000
Residual | 3564.32398 3867 .921728466 R-squared = 0.3120
––––-+–––––––––– Adj R-squared = 0.3105
Total | 5180.38877 3875 1.33687452 Root MSE = .96007

––––––––––––––––– –––––––––
lrevAPh | Coef. Std. Err. t P>|t| [95% Conf. Interval]
––––-+––––––––––––- –––––––––
femme | -.3826071 .0321178 -11.91 0.000 -.4455765 -.3196378
age | .0958512 .0053997 17.75 0.000 .0852647 .1064378
age2 | -.0009373 .0000689 -13.59 0.000 -.0010724 -.0008021
nived2 | .0557579 .0427996 1.30 0.193 -.0281541 .1396699
nived3 | .2882051 .0465887 6.19 0.000 .1968644 .3795458
nived4 | .525106 .0889622 5.90 0.000 .3506888 .6995233
nived5 | .837949 .0573946 14.60 0.000 .7254225 .9504756
nived6 | 1.203702 .0653987 18.41 0.000 1.075483 1.331921
_cons | -3.905688 .1016011 -38.44 0.000 -4.104885 -3.706491
––––––––––––––––– –––––––––

Stataf retournef lesf coefficientsf estimés,f leurf erreu rf standardf etf l'intervallef def confiancef (enf bleu).f Lesf
colonnesftfetfP>|t|,fenfvert,freprésententflesfrésu ltatsfdesftestsfdefnullitéfdesfcoefficientsf(testfd efStudent).ff
H0f:flefcoefficientfestfnul.f
Pourflafvariablefnived2f(niveauffondamentalf1),fP>| t|=0.193,filfyfaf19%fdefchancefdefseftromperfenf
rejetantfH0.fDoncfonfneflafrejettefpas.fOnfditfalor sfqueflefcoefficientfdefnived2fn'estfpasfsignificat ivementf
différentfdef0,foufencorefplusfsimplementfqu'ilfn'e stfpasfsignificatif.ff
Généralement,fonfétablitf3fseuilsfenfdessousfdesque lsfonfconsidèrefqu'unfcoefficientfestfsignificatiff :f1%f
d'erreur,f5%fd'erreurfetf10%fd'erreur.fTousflesfaut resfcoefficientsfsontfsignificatifsfaufseuilfdef1%f
P>|t|=0.000f f f significatiffaufseuilfdef1‰ f
P>|t|<0.010f f f significatiffaufseuilfdef1%f
P>|t|<0.050f f f significatiffaufseuilfdef5%f
P>|t|<0.100f f f significatiffaufseuilfdef10%f
LefR 2f(enfrouge)freprésenteflafpartfdeflafvariabilitéfdu frevenufespliquéefparflefmodèle.fIci,f31,2%fdeflaf
varaibilitéf duf revenuf estf expliquéef parf lef genre,f l 'âgef etf lesf études.f Cettef mesuref peutf augmenterf

AudefVescovo,fIRDjAFRISTATf f f f ffffffffffCoursfVIII. fLefmodèleflinéairefdansfStataf

38 fartificiellementf lorsqu'onf ajoutef desf varaiblesf exp licatives,f maisf sif cellejcif n'expliquef pasf laf varia blef
dépendante.fAussi,filfestfd'usagefdefluifpréférerfl efR 2fajusté.fIcifilsfsontfprochesfcarfilfyfafpeufdefvar iablesf
explicativesfdansfnotrefmodèle.ff
Lafcommandefoutreg2fpermetfdefcréerfunffichierfdefr ésultatfqu'onfpourrafouvrirfdansfWord.ff
outreg2 using "MCO.doc", bdec(3,3,3) adec(3) nor2 a ddstat(R2a,e(r2_a))
L'optionfbdecfpermetfdefpréciserflefnombrefdefdécim alesfdefcoeffiients,fl'optionfnor2fprécisefqu'onfne f
veutfpasfqueflefR2fapparaisse,fl'optionfaddstatfper metfdefdemanderfquefd'autresfstatistiquesfapparaiss ent,f
iciflefR 2fajusté.fL'optionfadecfpréciseflefnombrefdefdécimal esfdesfstatistiquesfsupplémentaires,fdoncficifduf
R2fajusté.fOnfobtientfalorsfaisémentfunftableaufdefla fformef(enfutilisantflaffonctionfconvertirfunftexte fenf
tableaufdansfWord)f:ff
f
f lrevAPhf
femmef j0.383***f
f (0.032)f
agef 0.096***f
f (0.005)f
age2f j0.001***f
f (0.000)f
nived2f 0.056f
f (0.043)f
nived3f 0.288***f
f (0.047)f
nived4f 0.525***f
f (0.089)f
nived5f 0.838***f
f (0.057)f
nived6f 1.204***f
f (0.065)f
Constantf j3.906***f
f (0.102)f
Observationsf 3876f
R2af 0.311f
Standardferrorsfinfparenthesesf f
***fp<0.01,f**fp<0.05,f*fp<0.1f f
f

AudefVescovo,fIRDjAFRISTATf f Annexef1.fQuelquesffonc tionsfutilesfdefStata
39 fAnnexe 1. Quelques fonctions utiles de Stata
Quelques fonctions
Fonctions mathématiques
abs(x) ff f f retourneflafvaleurfabsoluefdefx.f
exp(x) ff f f retournefl'exponentiellefdefx.f
log(x) ff f f retournefleflogarithmefdefxfsifx>0.ff
max(x1,x2,…,xn) f retourneflefmaximumfdefx1,fx2,f…,fxn.fff
min(x1,x2,…,xn) ff retourneflefminimumfdefx1,fx2,f…,fxn.ff
round(x,y) ff f retournefxfarrondifàfl'unitéfdefy.fff
sqrt(x) ff f retourneflafracinefcarréefdefxfsifxf>f0.f
sum(x) ff f f retourneflafsommefcumuléefdefx,ftraitantflesfva leursfmanquantesfcommefdesf0.f
Distributions et densités
binomial(n,k,p) ff retourneflafprobabilitéfd'aufmoinsfkfsuccèsfenfnf tiragesfavecfunefprobabilitéfdef
succèsfàfchaqueftiragefdefp.ff
normal(z) ff f retourneflaffonctionfdefrépartitionfdeflafloifno rmalefstandard.f
normalden(z) fff retourneflaffonctionfdefdensitéfdeflafloifnormal efstandard.f
Générations de nombres aléatoires
uniform( ) ff f retournefdesfnombresfuniformémentfdistribuéfsurf l'intervallef[0,1].ff
invnormal(uniform( )) retournefdesfnombresfnormalementfdistribué,fdefmoye nnef0fetfd'écartjtypef1.f
Cesffonctionsfn'ontfpasfd'argumentsfmaisfilfestfnéc essairefdefmettreflesfparenthèses.f
Chaîne de caractères
length(s) ff f retourneflaflongueurfdeflafchainefdefcaratèrefs. f
string(n) ff f convertirfnfenfunefchaînefdefcaractèref
substr(s,n1,n2) ff retournefunefpartiefd'unefchaînefdefcaractèrefs.f Ellefextraitflafpartiefallantfduf
n1 ème fcaractèrefauf(n1+n2)èmefcaractèrefinclus.fSifn2fn' estfpasfrenseigné,fellefretourneftousflesfcaractère sf
seftrouvantfàfdroitefdefn1,fn1fcompris.ff
generate s2=substr("CSPouvrier", 4, 7)
generate s3=substr("CSPouvrier", 4)
Alorsfs2=s3="ouvrier"ff

AudefVescovo,fIRDjAFRISTATf f Annexef1.fQuelquesffonc tionsfutilesfdefStata
40 fFonctions utiles en programmation
cond(x,a,b) fretournefafsiflafconditionfxfestfvérifier,fbfsifel lefnefl'estfpasf
generate femme=1 if m3==2
replace femme=0 if m3==1
peutfs'écrirefenfuneflignef
generate femme=cond(m3==2,1,0)
inlist(z,a,b,…) fretourneflafvaleurf1f(lafvaleurfvraie)fsifzfappart ientfàflalfistefdesfautresfargumentsfdef
laffonctionf(a,fb,f…).fSinonfellefretournef0.fLefno mbrefd'argumentsfpeutfêtrefcomprisfentref2fetf255fp ourf
desfréelsfetfentref2fetf10fpourfdesfchaînesfdefcara ctères.ff
inrange(z,a,b) fretourneflafvaleurf1f(vraie)fsifaf<fzf<fb,f0fsinon .fEllefretournef0fsifzfestfmanquantf
r(name) fcontientflafvaleurfd'unfrésultatfsauvéf
. summarize revcap, detail
revcap
––––––––––––––––– –––-
Percentiles Smallest
1% 0 0
5% 0 0
10% 17.45455 0 Obs 12749
25% 56.57143 0 Sum of Wgt. 12749

50% 132 Mean 255.352
Largest Std. Dev. 819.6166
75% 250.6 18484
90% 477.72 18484 Variance 671771.4
95% 741 27864 Skewness 38.65029
99% 2160 60000 Kurtosis 2411.216

. gen ligne2=0.5*r(p50)
Pourfconnaîtreflaflistefdesfrésultatsfdeflfcommande s,fonftapef:ff
return list
e(sample) f retournef laf valeurf 1f sif l'observationf af étéf utilis éef dansf l'échantillonf d'estimationf def laf
commandefprécédente.f
. regress lrevAPh femme age age2

Source | SS df MS Number of obs = 3876
––––-+–––––––––– F( 3, 3872) = 366.78
Model | 1146.38086 3 382.126953 Prob > F = 0.0000
Residual | 4034.00791 3872 1.04184089 R-squared = 0.2213
––––-+–––––––––– Adj R-squared = 0.2207
Total | 5180.38877 3875 1.33687452 Root MSE = 1.0207

––––––––––––––––– –––––––––
lrevAPh | Coef. Std. Err. t P>| t| [95% Conf. Interval]
––––-+––––––––––––- –––––––––
femme | -.4861283 .0336211 -14.46 0.0 00 -.5520451 -.4202116
age | .1177752 .0056444 20.87 0.0 00 .1067089 .1288415
age2 | -.0011868 .0000722 -16.43 0.0 00 -.0013284 -.0010452
_cons | -4.055482 .1065508 -38.06 0.0 00 -4.264383 -3.846582
––––––––––––––––– –––––––––

. gen R2=e(r2)
. display R2
.22129244
Pourfconnaîtreflaflistefdesfrésultatsfd'estimation, fonftapef:ff
ereturn list

Similar Posts