INTRODUCERE ………………………….. ………………………….. ………………………….. ………………………. 3… [604009]
Universitatea din Craiova
Facultatea de Știin țe
Departamentul de Informaticã
LUCRARE DE LICEN ȚĂ
COORDONATOR: Conf . Dr. BOLDEA Costin -Radu
STUDENT: [anonimizat] 2019
1 Universitatea din Craiova
Facultatea de Știin țe
Departamentul de Informaticã
Modele de simulare Monte Carlo
Coordonator: Conf . Dr. BOLDEA Costin -Radu
Student: [anonimizat] 2019
2
CUPRINS
INTRODUCERE ………………………….. ………………………….. ………………………….. ………………………. 3
CAPITOLUL I. ELEMENT E DE STATISTICĂ DESC RIPTIVĂ ȘI PREDICTIV Ă …… 4
1.1 NOȚIUNI DE BAZĂ ALE S TATISTICII ………………………….. ………………………….. ……………………….. 4
1.2 GRAFICE ………………………….. ………………………….. ………………………….. ………………………….. … 6
1.3 MODELE DE REGRESIE GENERAL LINIARE ȘI N ELINIARE ………………………….. …………………………. 9
1.4 LEGILE NUMERELOR MARI ………………………….. ………………………….. ………………………….. ……. 14
1.5 SIMULAREA MONTE CARLO ………………………….. ………………………….. ………………………….. …. 14
CAPITOLUL II. PROGRA MAREA ÎN R CODE ………………………….. ………………………….. . 17
2.1 GENERALITĂȚI ………………………….. ………………………….. ………………………….. ………………….. 17
2.2 OPERAREA ÎN R ………………………….. ………………………….. ………………………….. …………………. 18
2.4 FUNCȚII ÎN R ………………………….. ………………………….. ………………………….. …………………….. 25
2.5 REPREZENTĂRI GRAFICE ÎN R ………………………….. ………………………….. ………………………….. .. 31
2.6 TESTE STATISTICE ÎN R ………………………….. ………………………….. ………………………….. ……….. 36
CAPITOLUL III. MODE LAREA ȘI SIMULAREA M ONTE CARLO A EVOLUȚI EI
POLUĂRII CU BERILIU 7 FOLOSIND LIMBAJUL R ………………………….. ……………….. 39
3.1 INTRODUCERE . POLUAREA CU BERILIU 7 ………………………….. ………………………….. …………….. 39
3.2. UN MODEL CVASI -PERIODIC AL POLUĂRII CU BE7 ÎN ARIZONA ………………………….. ……………… 41
3.3. SIMULAREA MONTE CARLO A EFECTULUI VAR IAȚIILOR FACTORILOR ATMOSFERICI ALEATORI
ASUPRA CONCENTRAȚIEI DE BE7 ÎN PRECIPITAȚII ………………………….. ………………………….. ………… 49
3.1 Etapa 1. Generarea unui sir de valori aleatoare distribuite normal care respectă
media și dispersia datelor inițiale ………………………….. ………………………….. …………….. 49
3.2 Etapa a 2 -a. Construcția funcției de simulare și generarea predictiei Monte Carlo .. 50
3.3 Etapa a 3 -a. Analiza rezultatelor și determinarea intervalelor de încredere pentru
valorile prezise prim metoda Monta Carlo ………………………….. ………………………….. … 52
4. ANALIZA STATISTICĂ A MODELULUI OBȚINUT ………………………….. ………………………….. …………. 54
BIBLIOGRAFIE ………………………….. ………………………….. ………………………….. …………………….. 55
ANEXA. ………………………….. ………………………….. ………………………….. ………………………….. …….. 56
3
INTRODUCERE
Statistica și statistica matematică , în special , se ocupă cu descrierea și analiza
numerică a fenomenelor de masă conducâ nd la formularea legilor ce le guvernează.
Demersul gneoseologic a l statis ticii parcurge fazele cunoscute , iar metodele
sale au o mare putere de cunoaș tere verificate în cele mai variat e domenii. Acest
demers prezintă două aspecte importante: descriere statistică și inferenț ă statistică.
Primul aspect constituie în gen eral partea clasică și este, în general, cunoscut sub
numele de statistică descriptivă și pune accentul pe fix area informației asa cum
rezultă din prelucrarea datelor empirice. Al doilea aspect, care t rebuie privit ca o a
doua etapă a aceluiași proces de c unoaș tere, este obiectul statisticii descriptive. Rolul
statis ticii matematice în analiza și i nterpretarea unor cl ase largi de fenomene și
prezenț a unor investigații și concluzii statistice în viața de zi cu zi cond uc la
necesitarea pătrunderii gâ ndirii și culturii statistice în fondul de bază al culturii
generale, ale tuturor oamenilor.
….
Identificarea și testarea unei metode de simulare a fenomenului poluare cu
Beriliu radioactiv studiat. .
4
CAPITOLUL I . Elemente de statistică
descriptivă și predictivă
1.1 Noțiuni de bază ale statisticii
Statistica este ș tiinta carea studi ază aspectele cantitative ale feno menelor
social economice de masă , fenomene ce sunt variabile în timp și spațiu, pornind de la
conținutul calitativ al a cestora. Statistica este o disciplină de graniță, un fel de ș tiintă
metodologică , în gen de omnibus al cun oașterii empirice
Populația sau colectivi tatea statistică este orice mulțime de elemente care au
ceva comun, care o definește ca obiect al investigației statistice și care se diferențiază
prin diferite atribute sau caracteristici.
In general este necesară o precizare riguroasă a obiectelor supuse investigației
statisti ce pentru a nu înregistra comportări din afara populației statistice .
Colectivitatea statistică definită are un caracter obiectiv și finit și este
necesară definirea sa din punctul de vedere al conținutului, spațiului , timpului și
formei de organizare .
Colectivitațile pot fi: statistice și dinamice. În cazul colectivitaților statistice
timpul este constant, iar în cazul celor dinamice, spațiul și forma organizată sunt
constante.
Variabila se reprezintă printr -un simbol precum X,H,Y,x care poate lua orice
valoare din domeniul de definiț ie al variabilei. Dacă variabila poate lua o singură
valoare se numește constantă .Variabila care poate lua orice valoare intre două
numere se numește valoare continuă.Variabila discretă este acea variabila care ia
numai anumite valori.
Noțiune: Variabila de grupare este acea caracteristică după care se distribuie, în clase
omogene, unitățile statistice dintr -o colectivitate dată sau după care se urmărește
modificarea – fie în timp, fie în spațiu – a unei alte variabile.
Este cunoscută și sub numele de caracteristică de grupare.
Tipuri: Se deosebesc:
5 a) După conținut:
a1) Variabile atributive. Sunt însușiri, atribute ale unităților statistice dintr -o
colectivitate dată, în funcție de care se face gruparea acestora în clase omogene. Ex.:
sexul, vârsta, profesia, productivitatea muncii, etc.
a2) Variabile de timp. Oferă posibilitatea cunoașterii tendințelor evolutive
ale unui fenomen oarecare. Ex.: ziua, luna, trimestrul, anul.
a3) Variabile de spațiu. Oferă posibilita tea cunoașterii variabilității unui
fenomen în profil teritorial, în spațiu. Ex.: întreprinderea, localitatea, județul, țara,
etc.
Revenind la noțiunea de variabilă de grupare, se poate observa :
• cu variabila atributivă se realizează gruparea propriu -zisă a unităților dintr -o
colectivitate dată în clase omogene ;
• cu celelalte două variabile se urmărește variația – în timp sau în spațiu – a
unei caracteristici oarecare .
Rezultă că : Tipul variabilei de grupare determină tipul seriei statistice .
b) După forma de exprimare:
b1) Variabile cantitative. Au variantele exprimate numai prin cifre ; sunt
variabile numerice. Ex.: productivitatea muncii, salariul, costurile de producție, etc.
La rândul lor, aceste variabile se împart în:
b1.1) Variabile discrete. Iau numai valori întregi. Ex.: populația, numărul
de muncitori, producția exprimată în bucăți, etc.
b1.2) Variabile continui e. Iau orice valoare. Ex.: productivitatea exprimată în
lei, salariul, procentul realizării normelor, etc.
b2) Variabile calitative. Au variantele exprimate numai prin cuvinte ; sunt
variabile alfabetice. Ex.: sexul, profesia, culoarea ochilor, etc.
O variabilă calitativă poate fi transpusă în limbajul cifric prin codificarea
variantelor sale.
Această clasificare oferă posibilitatea identificării precise a tipului
caracteristicii de grupare pentru datele de care dispunem, facilitând într-o măsură
considerabilă stabilirea tipului de serie statistică ce se poate construi; se va observa
că tipul seriei va determina la rândul său tipul graficului adecvat, apoi tipul mediei și
al altor indicatori sintetici folosiți în analiza statistică.
6 1.2 Grafice
Graficul este reprezenta rea relațiilor dintre variabile sau, altfel spus , graficul
este reprezen tarea prin figuri geometrice, natural sau simbolice a datelor cuprinse
într-un tabel statistic.Transpunerea în grafice a datelor statistice constituie un mijloc
de studiu avantajos deoarece ofera o vedere sintetică a fenomenelor studiate,
înlesneste compar ații între fenomene, pune în evidență caracteristicile lor și eventual
conduce la descoperirea de anomali, erori sau omisiuni în datele originale. Unele
grafice îndeplinesc și funcția de calcul, cu ajutorul lor definindu -se mai simplu mai
multe valori stat istice pentru care nu se cere o precizie prea mare. Reprezentare
grafică se poate face în coordonate rectangulare sau coordonat e polare.
În practică, în orice domeniu, sunt folosite pe scară largă reprezen tările
grafice. Cu ajutorul lor pot fi evidențiat e, într-o formă deosebit de sugestivă,
proporțiile și variațiile diferitelor fenomene.
Pentru a reda cu fidelitate realitatea pe care o reprezintă, graficul
trebuie să îndeplinească cu rigurozitate condițiile constructive impuse de principiile
metodologi ce, care vizează, în principal, următoarele elemente:
a) Titlul graficului. Se trece, de regulă, deasupra graficului, atunci
când acesta este prezentat independent, în scopul evidențierii unor aspecte de interes
general, mai ales în activitatea publicit ară. De pildă, prezentarea evoluției producției,
a volumului desfacerilor de mărfuri pe diverse piețe, etc.; dacă graficul este integrat
într-un text, într -o lucrare științifică, titlul se trece, de regulă, sub grafic.
Titlul graficului trebuie să sinteti zeze foarte clar și exact conținutul
informațiilor oferite.
b) Scara de reprezentare. Este unul dintre elementele esențiale,
întrucât cu ajutorul său se asigură proporționalitatea indicatorilor reprezentați
grafic. Se deosebesc următoarele tipuri de scări de reprezentare:
După forma pe care o au :
•scară lineară – are diviziunile însc rise pe o linie dreaptă ; ex.: rigla pentru
desen, metrul;
•scară nelineară – diviziunile sunt înscrise pe o linie curbă (un arc de cerc)
sau pe un cerc; ex.: scalele ap aratelor de măsură (voltmetre, manometre, etc.).
În practică, scările lineare sunt folosite mai mult în sistemul axelor
rectangulare iar cele nelineare – în sistemul axelor polare.
7 După mărimea intervalelor dintre diviziuni:
•scară uniformă – are int ervalele egale;
•scară logaritmică – dimensiunea intervalelor este proporțională cu logaritmii
zecimali ai indicatorilor reprezentați grafic.
c) Rețeaua graficului. Este dată de fluxul segmentelor de dreaptă duse
din dreptul diviziunilor scării. Se deose besc mai multe tipuri de rețele, determinate în
special de tipul scărilor de reprezentare. Astfel, în sistemul axelor rectangulare, se
întâlnesc: rețea simplă uniformă, rețea dublă uniformă, rețea simplă logaritmică,
rețea dublă logaritmică, rețea semiloga ritmică – aceasta fiind o combinație între o
rețea simplă uniformă și o rețea simplă logaritmică.
d) Figura propriu -zisă. Este elementul substanțial, de conținut, al
graficului. Dimensiunile și forma acesteia sunt strict legate de nivelurile și
tendințele variaționale ale indicatorilor reprezentați grafic, legătură realizată prin
scara de reprezentare. Figurile geometrice folosite frecvent în cadrul graficii
profesionale su nt: dreptunghiul, cercul, pătratul, paralelipipedul, cilindrul, etc.
Alegerea uneia sau alteia dintre aceste figuri, se face în funcție de tipul seriilor
statistice, de aspectele reliefate prin diversele comparații, de legăturile funcționale
dintre indicatorii reprezentați grafic, de scopul urmărit precum și de alte
considerente, fi e de ordin metodologic, fie de ordin practic.
e) Legenda și nota explicativă. Însoțesc graficul atunci când, în același
sistem de axe sau în cadrul aceleeași figuri geometrice sunt reprezentați mai mulți
indicatori. Prin legendă sunt identificate și expli cate curbele de tendință sau
sectoarele hașurate corespunzatoare fiecărui indicator; prin nota explicativă, se fac
referiri la unele particularități ale indicatorilor reprezentați grafic (lipsa de date,
schimbarea perioadei de referință, etc.).
Graficele utilizate pentru re prezentarea seriilor de repartiț ie sunt numeroase și
depind de natura fenom enului studiat și de scopul urmărit.Î n practică se utilizează, de
obicei, urmatoarele:
Diagrama în batoane (bare) . Fiecarei valori a variabilei înscrisă pe abscisă i se
asociază o ordonată de lungime proporțională cu frecvenț a valorii. Lungimea
ordonatelor (barelor) fac f i ,1 dacă se consideră frecvenț ele absolute, respectiv 100,
dacă se consideră frecvenț ele relative. Acest tip de diagrame este propriu variabilelor
discrete (întregi).
8
Diagrama cumulațiva -este diagrama construită în scară, se trasează seg mente
de dreapta de l ungimi proportionale cu frecvenț ele, dar decalî ndu-se progresiv în sus
astfel încât originea fiecarui segment să se afle nivelul extremității segmentului
precedent. Segmentele verificate se unesc prin segmente orizontale.
Diagrama prin coloane (tuburi de orga) -este reprezentarea unei serii sau
reparații simp le prin dreptunghiuri avâ nd bazele egale și înalți mile proporționale cu
fercvenț a.
Diagrama circulară (în sectoare) în care reparația se reprezintă sub forma u nui
cerc divizat în sectoare avâ nd unghiurile la centru proporționale cu frecvenț ele.
Diagrama pri n suparafeț e. Diagrama este formată de obicei d in pătarate sau
cercuri avînd suparafețe proporț ionale cu valorile respective. Pentru construirea unei
astfel de diagra me trebuie extrase radacinile pătrate ale valorilor seriei și laturile
pătratelor sau razele cercurilor se iau proporțional cu aceste răd ăcini.
Histograma (cronodiagrama) este prezentarea grafică a unei serii cronologice
bazate pe sistemul coordonatelor rectangulare. Pe axa absciselor se reprezintă anii (t)
iar pe Oy valorile.
Diagarama semilogaritmică necesită o scară lo garitmică și o sc ară
aritmeteică.Î n general se utilizează pentru reprezentarea seriilor cronologice cu
variații mari ale caracteristicii și se constru iește cu scară logaritmică pe axa Oy.
Diagarama logaritmică se realizează folosin d două serii logaritmice. Se aplică
frecv ent la studiul elasticităților. Diagrama logaritmică este indicată atunci când X și
Y prezintă amplitudini mari de variație cu câ t se îndepartează de origine.
9 Histograma este un grfic al repartiț iei pe clase de valori, format dintr -o
succesiune de dreptu nghiuri alternat ive, avînd suparafețele proporționale cu
frecvenț ele în clase. Histograma se constru iește în coordonate rectangulare, unde pe
axa absciselor se trec valorile variabile care delimitează clasele, iar pe ordonat ă
valorile frecvențelor de clasă .
Poligonul frecvenț elor este graficul repartiț iei pe clase d e valori, definit de o
linie frânta care unește perpendicularele proporționale cu frecvenț ele, ridicate din
centrele claselor înscrise pe axa absciselor.
Diagrama integrală (cumulat iva) este li nia poligonală obț inută prin unirea
punctelor (x,f(x)) corespunză toare extremităților claselor succesive. Se numeste și
poligonul frecvenț elor cumulate.
Curba frecvenț elor (curba de reparație) este o curbă continuă că tre care tinde
histograma (sau poligo nul frecventelor) când intervalul de clasă este suficient de mi c
și numarul de observații relat iv mare.
Diagrama polară (radiala) este diagrama construită î n coordonate polare și
utilizată pentru reprezentarea variațiilor unui fenomen.
Diagrama triunghiu lară este diagrama alcatuită cu ajuto rul unui triunghi
echilateral, reprezentând un ansamblu de trei variabile a căror sumă este constantă .
1.3 Modele de regresie general liniare și neliniare
În modelarea statistică, analiza de regresie este un proces statistic pentru
estimarea rela țiilor dintre o variabilă dependentă y și mai multe variabile presupuse
independente x i . Analiza de regresie include mai multe tehnici pentru modelarea și
analiza acestor relații, tehnici care pleacă de la propunerea unui mo del matematic al
10 acestei relații, estimarea parametrilor acestuia, a relevanței modelului propus, a
relevanței fiecărei componente a modelului și analiza calitativă a erorilor modelului .
Cele mai utilizate modele de regresie sunt modelele generale liniare Un model
general liniar este utilizat pentru a prezice valoarea unei variabile continue (cunoscută
ca variabilă răspuns) la una sau mai multe variabile explicative. Un model general
liniar ia forma:
y = a1x1+a2x2+…+ apxp+ε
unde
• y=(y j)j=1..n este variabila dependentă (explicată, endogenă sau rezultativă),
• x =( x1,…,x p) este vectorul variabilelor explicative , exogene, nu neaparat
independente , fiecare dintre acestea având n valori ,
• a =( a1,a2,…, ap )este vectorul coeficienților modelului,
• ε este o variab ilă, interpretată ca eroare (perturbare, eroare de măsurare
etc.).
Dacă variabilele explicative sunt independente toate, modelul de regresie este
considerat multi -liniar. Variabilele explicative pot fi însă funcții neliniare ale unui set
mai restrâns de v ariabile independente, cum ar fi produse scalare, monoame și
transformări elementare ale altor variabile independente (exponențieri, puteri
fracționare, logaritmi ) .
Erori le aleatoare sunt presupuse independente, urmând o distribu ție normală
(clopotul lui Gauss), cu o medie zero și aceeași dispersie (varianță) pentru toate
valorile variabilelor explicative.
Numim estimație (ajustare) a modelului orice soluție { a, e} a sistemului y =
y= x·a + ε.
Este de remarcat că sistemul conține n ecuații și p + n necuno scute, deci admite o
infinitate de soluții. Numim estimație prin metoda celor mai mici pătrate acea soluție a
care minimizează suma pătratelor erorilor ε= ei, adică
11
și se demonstrează că este îndeplinit criteriul de minim și că solu ția este unică.
Ecuația
yf = a 1×1 + a2x2 + … + a pxp
se numește ecuația de regresie multiplă a modelului . Înlocuind în această relație valori
pentru variabilele independente xi se obține o valoare prognozată pentru variabila
dependentă y.
Analiza modelului de regresie se poate face pentru modelele general liniare
prin studiul valorilor coeficientului de determinație R2, mai precis a coeficientului
ajustat R*2), prin verificarea semnificației acestuia folosint un F -test, prin verificarea
semnificației fiecărui coeficient (a i) folosind testul Student, respectiv prin analiza
dispersiei rezidualilor r j=yj-yfj(x1j,…,x pj). Mai jos sunt explicate pe scurt fiecare dintre
aceste evaluări.
a. Coeficientul de determinare este definit de
R2= 1- j(rj)2/j (yj-y*)2
unde y* este media variabilei statistice y. Coeficientul de determinare ajustat R* se
definește asemănător
R*2= 1- [ j(rj)2 /(n-p-1)]/[j (yj-y*)2 /(n-1)]
12 și a fost introdus de Theil în 1961 pentru a contrabalansa efectul creșterii valorii
coeficientului classic de determ inare odată cu cresterea numărului p de variabile
explanatorii. Coeficientul ajustat de determinare exprimă pentru modelele generale
liniare cât de bine funcția de regressie aproximează valoruile reale (y j) și are
semnificația statistică de coeficient de c orelație între valorile prezise de către model și
cele reale. O valoare suficient de mare (intre 0.8 și 1) a acestui coeficient indică ăn
general un model care poate fi utilizat în predicții, pe când o valoare mică a acestui
coeficient ( <0.5) sugerează ine ficacitatea modelului propus.
b. Testul F de semnificație globală
Primul test utilizat în analiza regresiei este un test global de semnificație a
ansamblului coeficienților (exceptând termenul liber, dacă acesta apare).
Ipotezele testului sunt
Ipoteza nul ă H0: a 1 a2 … ap 0
Ipoteză nenulă H 1: (∃)i, astfel încât a i ≠ 0.
În condițiile ipotezei nul e, se demonstrează că indicatorul F, dat de
F=[ j (yfj-y*)2 /(n-1)] /[ j(rj)2 /(n-p-1)]
(unde (yf j) sunt cele n valorile prezise de model, iar p este n umărul de variabile
expalnatorii) este repartizat Fisher -Snedecor , iar dacă F < Fp-1;n-p, se verifică ipoteza
nulă și modelul de regresie este în consecință ne-semnificativ .
Nerespingerea ipotezei nule duce la concluzia că datele observate nu permit
ident ificarea unui model liniar valid, deci regresia nu este adecvată în scopul de
prognoză, propus inițial. În caz contrar (F > Fp-1;n-p,) avem un model care poate fi
folosit pentru preziceri statistic semnificative.
Pentru analiza semnificației statistice a f iecărui coeficient a i în parte se
folosește un test Student.
c. Teste le t
13 În situația când este respinsă ipoteza nulă, se acceptă că ecuația de regresie este
semnificativă la nivel global, cu mențiunea că s -ar putea ca anumiți coeficienț i să nu
fie semn ificativi. Pentru testarea fiecărui coeficient se utilizează un test t cu ipotezele:
H0: ai = 0 H1: a i ≠ 0.
În condițiile ipotez ei H0 se arată că indicatorul statistic ti=ai/s(a i) este repartizată
Student cu n – p grade de libertate, ceea ce permite ut ilizarea testului t . În expresia
care dă statistica testului, s(ai) este abaterea standard estimată a coeficientului .
Nerespingerea ipotezei nule arată că datele experimentale nu permit stabilirea
necesității prezenței variabilei x i în model, variabila fiind nesemnificativă în model.
d. Analiza reziduurilor
Analiza statistică a ecuației de regresie este bazată pe ipotezele Gauss -Markov
asupra erorilor ε ~ N(0, ζ2In ). Valabilitatea acestor ipoteze, în special cea a
normalității erorilor, poate fi testată pr in analiza reziduurilor. Ca și în cazul testelor
statistice, concluziile analizei sunt de genul: ipoteza normalității se respinge sau
ipoteza normalității nu se respinge. Analiza reziduurilor este, în esență, de natură
grafică.
Regresii neliniare.
De m ulte ori un model general liniar nu satisface exigențele cerute pentru un
bun model de predicție. De aceea se pot folosi și modele ne -liniare de regresie.
Având în v edere valorile observate a variabile lor aleatoare independente x i (i=1..p) ș i
a variabile i dependente y , prin funcție de regresie neliniară trebuie să se înțeleagă o
funcție f stfel încât j(y- f (x i) )2 să fie minimă . Însă coeficienții unui astfel de model
neliniar nu pot fi unic determinați. De asemenea, analiza modelului de regresie astfel
obținut nu mai poate fi efectuată pe baza acelorași criterii ca în cazul general liniar,
întrucât coeficientul de determinare R nu mai are semnificație, iar testele de tip t
trebuie adaptate modelului.
14 1.4 Legile numerelor mari
1.5 Simularea Monte C arlo
Simularea este o metodă prin care un sistem fizic este modelat matematic iar
procesele sistemului sau comportmentul sunt imitate numeric, rulând un program pe
baza unor date generate de utilizator. Pentru sistemele ce conțin componente
semnificati v aleatorii sau incerte, teoria probabilitățilpr poate ajuta la modelarea
incertritudinii. Variabilele de intrare ce au valori incerte pot fi înlociuite cu variabile
aleatoare cu caracteristici date (medie, dispersie, aplatizare s.a.). În cursul simulării,
aceste variabile aleatoare sunt generate numeric cu ajutorul unor algoritmi numiți
generatori de numere pseudo -aleatoare. Simularea sistemelor cu comportament haotic
folosind variabile aleatoare ale caror valori respectă o anumita distribuție a
evenimente lor întâmplătoare se numește simulare Monte Carlo.
Simularea Monte Carlo este numită după orașul Monte Carlo din Monaco,
renumit pentru jocuri de noroc (ruleta, zaruri, și mașini de slot). Deoarece procesul de
simulare presupune generarea de variabile cu v alori întâmplătoare și descrierea de
comportamente aleatoare, a fost numit simulare Monte Carlo.
Simularea Monte Carlo este un instrument puternic de analiză statistică,
utilizat pe scară largă atât în domeniile științificd căt și în inginerie. Acesta a fost
inițial folosită pentru a rezolva problem de difuzie neutronice în SMURD la Los
Alamos Scientific Laboratory în 1944. Simularea Monte Carlo a fost aplicată în trecut
la diverse problem e: de la simularea fenomenelor fizice complexe, cum ar fi coliziuni
de atomi, până la simularea fluxului de trafic si prognoza varia ției indicelui bursier
Dow Jones. Monte Carlo este, de asemenea, potrivită pentru rezolvarea problemelor
complexe de inginerie, pentru că se pot genera astfel un număr mare de var iabilele
aleatoare, distribuite ]n diverse moduri și se pot simula mode le depinz \nd de valori de
intrare haotice
15 Diferit ă de un experiment fizic, simularea Monte Carlo imită prelevarea de
probe statistic afectate de fenomene aleatorii și efectuează un număr mare de
experimente pe calculator. Apo i caracteristicile statistice ale modelului experimental
(ieșiri le model ului) sunt observate și pe baza lor sunt trase concluzii.
În fiecare exper iment, valorile posibile ale variabilelor de aleatorii intrare X
( X1 , X2 …, Xn ) sunt generate pseudo -aleator pe calculator, respectând caracteristicile
distribuției lor statistice (medie, dispersie) . Apoi valorile variabile i de ieșire Y se
calcule ază prin funcția de descriere a modelului Y = g (X) plecănd de la valorile
variab ilelor aleatorii. . Folosind mai multe experimente numerice de acest tip se obține
un set de valori posibile ale variabilei Y care sunt disponibile pentru analiză statistică,
pentru a estima caract eristicile acesteia .
Schița simulării Monte Carlo este repr ezentată în F ig.1.1 . Trei pași sunt
necesari în procesul de simulare:
Pasul 1 – generarea de eșantioane ale unor variabile aleatoare Xj pe
post de intrări ale modelului Y <- M(X j)j,
Pasul 2 – evaluarea ieșirii model ului Y, și
Pasul 3 – analiza statistică pe modelul de ieșire , în urma mai multor
experimente numerice (determinarea valorilor medii ale variabilei de
iesire, dispersia ei, intervalele de incredere, s.a.)
16
Fig 1 .1 Schema generală a unei simulări Monte Carlo
. Cei trei pasi ai simulării Monte Carlo pentru analiza poluării precipitațiilor cu Be7
sunt discutați în secțiunile următoare.
17
CAPITOLUL II . PROGRAMAREA ÎN R
CODE
2.1 Generalități
Părintele limbajului , Ross Ihaka scria în 1998:
„În august 1993 Rob ert Gentleman și cu mine am plasa t copii ale R -ului la
Statlib și am făcut un mic grup pe s -news. Unii ne -au descărcat copiile și s -au oferit
să colaboreze. Cel mai de nădejde a fost Martin Maehler de la ETH Zurich care ne -a
convins să lansăm codul sursă ca un software gratuit. La început am avut ezitări, dar
în iunie 1995 am convenit să punem la dispoziția tuturor codul sursă în condițiile
fundației FRF . ”
S-a creat astfel o impresionantă comunitate a utilizatorilor și dezvoltatorilor
limbajului.
Decizia de a face R un software gratuit , continuă Ihaka „ ne-a făcut să ne
propunem țeluri mai mari decît un simplu soft statistic cu care să ne putem preda
cursurile mai bine. Ne -a dat acces la o masă de indivizi foarte talentați doritori s ă
se implice în proiect. Poate unul din cele mai bune lucruri care ni s -a întîmplat a fost
șansa de lucra cu asemenea oameni strălucitori ”. Și își exprima optimismul : „ Se
pare că R a ajuns la punctul în care este destul de stabil pentru a fi folosit de
utilizatori – cel puțin sub Unix. Sperăm ca în 1999 să putem lansa varianta completă
R.1.0 în cadrul fundației Free Software ”
R este un mediu integrat de facilități software destinat în special analizei
statistice și reprezentării grafice a datelor. Acesta include un limbaj simplu de
programare, limbajul S, care permite utilizarea pachetelor existente și construirea de
pachete noi de programe destinate analizei statistice și reprezentării grafice a datelor.
R este un mediu de dezvolare gratuit distribuit sub licență publică generală
GNU. A fost inițial scris de Ross Ihaka și Robert Gentleman de la departmentul de
18 statistică de la Universittea din Auckland, New Zealand. Din 1997 s -a format un grup
principal (“R Core Team”) care poate modifica variante ale R -ului. R -ul s-a dezvoltat
rapid și s -a extins la o mar e colecție de pachete de programe.
Site-ul oficial de unde se pot obține gratuit versiuni compilate de R pentru OS
X, Linux și Windows este http://www.r -project.org . Tot aici se pot găsi și resurse
pentru instalarea și utilizarea R -ului. Cea mai recentă versiune este 2.13.2 disponibilă
din 30.09.2011. Odată cu R se descarc ă și o serie de pachete de programe (numite și
pachete standard), dar sunt disponibile și alte pachete de programe R prin intermediul
CRAN (Comprehensive R Archive Network – http://CRAN .R-project.org ) care
conține diferite variante ale sistemului R și ale pachetelor de programe R.
2.2 Operarea în R
Kitul de instalare R vine cu manuale în care este descris în detaliu modul de
funcționare al programului. De asemenea se găsesc cărți spec ializate pe diverse
domenii unde se utilizează statistica și unde se arată cum se poate utiliza R pentru
calculele necesare.
La lansarea în execuție a R -ului apare o fereastră ca cea alăturată și se poate
lucra direct cu R în fereastra consolă interioară .
19 În meniul „Packages” se găsesc opțiuni de instalare separată a unor pachete
suplimentare de programe specializate pe diverse domenii prin care posibilitățile lui
R se pot extinde foarte mult.
Lucrul cu R se poate face fie în regim interactiv: în fereastr a Rconsole, după
prompter -ul ‚>‟, se scrie o comandă acceptată de R, apoi se apasă tasta Enter și
rezultatul apare imediat mai jos în aceeași ferestră, fie prin script -uri, în regim de
programare: comenzile de calcul sunt grupate într -un fișier cu extensia .r care poate fi
apelat în mai multe moduri. Un fișier script poate fi scris în orice editor de text, dar R
are un editor ce se apelează din meniul „File” prin „Open script…” sau „New
script” . Fișierul script poate fi executat după ce se încarcă în medi ul R prin File →
Open script… sau se poate folosi direct funcția source() , de exemplu,
presupunând că fișierul script se numește test.r și se află în directorul de lucru curent,
comanda scrisă la prompt: >source("test.r") va avea ca efect încărcarea în
spațiul de lucru a fișierului și executarea comenzilor conținute în fișierul „test.r”.
R dispune de un mecanism de rechemare a comenzilor executate în linia de
comandă în fereastra RConsole. Prin apăsarea tastei de deplasare pe verticală în sus
(↑ ), se pot obține comenzile scrise anterior. Acestea pot fi reexecutate sau modificate
și apoi executate.
Toate datele citite sau salvate prin comenzi R sunt asociate cu directorul
curent care poate fi schimbat prin File → Change dir… la calea dorită de utilizator .
Directorul curent (de lucru) poate fi aflat prin comanda getwd() și poate fi
fixat și prin comanda setwd("directorul de lucru dorit") .
R dispune de funcții care permit obținerea rapidă de informații referitoare la
funcțiile ș i facilitățile sistemului R instalat pe calculatorul propriu. Pentru a obține
informații despre facilitățile oferite de functia help() , din R se execută comanda
> help.start()
Se va lansa o pagină web cu o serie link -uri care permit accesarea
informațiilor legate de sistemul R.
Pentru a obține informații despre o anumită funcție R, de exemplu plot , se
execută comanda
> help(plot)
20 sau comanda alternativă
> ?plot
Aceasta va deschide un Web browser cu o pagină în care se afișează
informații referitoare la funcția plot .
Pentru funcții le specificate prin cuvinte cheie, ca de exemplu, if, while ,
function , argumentele trebuie incluse între ghilimele:
> help("while")
Pentru a afișa fișiere, titluri, obiecte, etc. ce conțin un anumit șir de caractere,
se folosește comanda
> help.search (șir de caractere, ….)
De exemplu:
> help.search("poisson")
sau echivalent
> ??poisson
conduce la afișarea următoarelor rezultate
Help files with alias or concept or title matching
‘poisson’ using fuzzy matching:
boot::poisons Animal Survival Times
stats::fam ily Family Objects for Models
stats::Poisson The Poisson Distribution
stats::poisson.test Exact Poisson tests
Dacă dorim să încărcăm un anumit pachet de programe R, mai întâi trebuie
descărcat în subdirectorul library al directorului R (de exemplu în: C:\Program
Files \R\R-2.13.0 \library ). Pentru încărcarea de exemplu a pachetului graphics (the R
graphics package), putem folosi funcția
> library(graphics)
21 Dacă dorim să aflăm informații despre un anumit pachet de programe, de
exemplu utils (the R Utils package)
> library(help="utils").
Pentru vedea ce pachete de programe R sunt disponibile în versiunea curentă R, se
poate folosi funcția
> library()
De exemplu, pahetele disponibile în versiunea RR -2.13.0 sunt:
base The R Base Package
boot Bootstrap R (S -Plus) Functions (Canty)
class Functions for Classification
cluster Cluster Analysis Extended Rousseeuw et
al.
codetool
s Code Analysis Tools for R
compiler The R Compiler Package
datasets The R Datasets Package
foreign Read Data Stored by Minitab, S, SAS,
SPSS,
graphics Stata, Systat, dBase, …
The R Graphics Package
grDevice
s The R Graphics Devices and Support for
Colours
grid and Fonts
The Grid Graphics Package
KernSmooth Functions for kernel smoothing for
Wand &
lattice Jones (1995)
Lattice Graphics
MASS Support Functions and Datasets for
Venables
Matrix and Ripley's MASS
Sparse and Dense Matrix Classes and
Methods
22 methods Formal Methods and Classes
mgcv GAMs with GCV/AIC/REML smoothness
estimation
nlme and GAMMs by PQL
Linear and Nonlinear Mixed Effects
Models
nnet Feed-forward Neural Networks and
Multinomial
rpart Log-Linear Models
Recursive Partitioning
spatial Functions for Kriging and Point Pattern
splines Analysis
Regression Spline Functions and Classe s
stats The R Stats Package
stats4 Statistical Functions using S4 Classes
survival Survival analysis, including penalised
Tcltk likelihood.
Tcl/Tk Interface
tools Tools for Package Development
utils The R Utils Package
Pentru a vizualiza example referito are la anumite funcții R, de exemplu pentru
funcția mean , se poate proceda astfel:
> example(mean)
iar răspunsul sistemului este următorul:
mean
> x <- c(0:10, 50)
mean
> xm <- mean(x)
mean
> c(xm, mean(x, trim
= 0.10))
23 [1]
8.75 5.50
mean
> mean(USA rrests,
trim = 0.2)
Murder Assault
UrbanPop Rape
7.42 167.60 66.20 20.16
Odată cu lansarea R-ul se deschide o nouă sesiune R. Ieșirea din sesiunea R se
poate face utilizând comanda:
> q()
sau echivalent
> quit()
Pe ecran vă apare o întrebare referitoar e la memorarea sesiunii de lucru
(instrucțiuni lansate la linia de comandă, obiecte cu care s -a operat, etc.) care se poate
salva într -un fișier și redeschide mai târziu sau se poate renunța definitiv la aceasta.
Dacă se dorește salvarea spațiului de lucru (ce cuprinde toate variabilele create
în R), într -un fișier anume se poate folosi comanda save . Să presupunem de exemplu
că într -o nouă sesiune R, în spațiul de lucru, printre altele, avem și variabila x:
> x=2 #se creeaza si initializeaza varibila x
> save(x,file="C:/Lucru/date.RData")
> # se salveaza variabila x in fisierul
date.Rdata
> q() #părăsirea sesiunii R
Funcția save este echivalentă cu saveimage . R este case sensitive și deci x și X
sunt interpretate ca simboluri diferite și se vor referi la vari abile diferite.
De asemenea orice șir de caractere precedat de simbolul „#‟ este interpretat ca
fiind un comentariu .
La redeschiderea unei noi sesiuni R se poate proceda în modul următor:
> load("c:/lucru/date.RData")
> #se incarca obiectele din fisierul d ate
24 > x #se afiseaza valoarea variabilei x [1] 2
#raspunsul sistemului
În mod similar, exectând dublu click pe fișierul „date.Rdate”, se realizează
deschiderea unei noi sesiuni R și apoi încărcarea fișierului „date.Rdate”. De
asemenea, salvarea spațiului de lucru curent se poate realiza prin meniul File → Save
Workspace …, respectiv încărcarea unui fișier Rdate se poate realiza prin meniul File
→ Load Workspace …
Comenzile se pot separa în R fie prin simbolul punct și virgulă fie se pot scrie
pe linii d iferite. De exemplu:
> x1=1; x2=3.7;
> x3=5.1;
> x1+x2
[1] 4.7 > x1 -x3 [1] -4.1
Dacă o comandă nu este completă la sfârșitul unei linii de la prompt -ul >, R va
lansa un nou prompt, de obicei simbolul „+‟ în linia sau liniile următoare. Acest
simbol dispare cân d comanda este completă. De exemplu:
> x=4
> y=6
> z=x* + y
> z
2.3 Tablouri numerice
Tablourile de numere ( arays ) sunt generalizări ale matricelor la dimensiuni
mai mari sau egale cu doi. O matrice este un array de dimensiune doi.
Crearea unui tablou de nu mere se poate face utilizând funcția
array(elemente,dimensiuni) . De exemplu:
> m5=array(1:12, dim=c(2,3,2))
> m5
O altă modalitate de a crea tablouri multidimensionale, este de a utiliza funcția
dim ca în exemplul de mai jos:
25 > x=1:8
> dim(x)=c(2,2,2)
Astfel, v ectorul x a fost transformat în tablou de dimensiuni 2×2×2.
Tablourile pot fi utilizate în diferite operații aritmetice, multe dintre acestea fiind
similare celor descrise pentru matrice. Se pot efectua de asemenea operații între
tablouri numerice și alte obiecte R precum ar fi vectorii și matricele. De exemplu:
> x=1:4
> y=5:8
> t1=array(x,c(2,2,2))
> t2=array(y,c(2,2,2))
Dacă A și B sunt două tablouri numerice atunci produsul lor exterior (engl.,
outer product ) va fi un tablou numeric ale cărui elemente se obțin prin formarea
tuturor combinațiilor posibile ale elementelor lui A și B. Simbolul pentru acest tip de
produs este ‟%0%‟:
> AB = A %o%B
sau echivalent
> AB = outer(A,B,”*”)
De remarcat este că produsul definit de simbolul ‟%*%‟ (înmulțirea clasică dintre
matrice) este diferit de produsul reprezentat prin simbolul ‟%o%‟.
Funcția aperm() poate fi utilizată pentru a permuta dimensiunile unui tablou
numeric. Al doilea argument este o permutare de numere întregi {1, 2,…, k}, unde k
este numărul de indici al tab loului numeric. Rezultatul acestei funcții este un tablou
numeric de aceeași dimensiuni cu dimensiunile, respectiv datele permutate conform
celui de -al doilea argument.
2.4 Funcții în R
R vine cu un mare număr de funcții predefinite pentru prelucrarea d atelor, iar
diversele pachete adi ționale vin cu funcții suplimentare. În cele ce urmează descriem
un număr de funcții curent utilizate. În manualele ce însoțesc distribuțiile de R, în
carțile din bibliografie sau în diverse locații de pe internet (de exemp lu la adresa
26 http://www.statmethods.net/ sau pur și simplu căutând cu Google documentație pentru
R) se pot găsi informații pentru multe alte funcții disponibile. Pe lângă funcțiile
predefinite putem defini funcții noi care se pot utiliza exact ca cele pred efinite.
Un lucru este important de menționat. Argumentele funcțiilor au în general
nume și dacă se specifică numele lor atunci nu este importantă ordinea în care se pun,
ca în exemplul următor în care se crează un șir de numere cu funcția seq.
> seq(from= 1, by=2, to=5)
[1] 1 3 5
> seq(by=2, to=5, from=1)
[1] 1 3 5
De asemenea, unele funcții admit un număr mai mare de argumente care nu
sunt compatibile decât în anumite combinații, ca în exemplul de mai jos :
> seq(by=2, to=5, from=1)
[1] 1 3 5
> seq(from=1, by= 2,
length=3) [1] 1 3 5
> seq(from=1, by=2, to=5, length=3)
Error in seq.default(from = 1, by = 2, to = 5,
length = 3): too many arguments
Numele argumentelor formale este ales intuitiv (în engleză) și după un pic de
practică nu este dificil a le ține minte. De la o funcție la alta unele argumente formale
au valori predefinite și funcțiile pot fi apelate fără aceste argumente (se utilizează
valorile implicite în calcul). Apar astfel situații când aceeași funcție este apelată cu un
număr diferit de argumente. O astfel de situație este curentă pentru funcțiile grafice de
exemplu. Dacă funcțiile sunt apelate fără menționarea numelui argumentelor atunci
ordinea și semnificația argumentelor este strictă, ca în programul de definiție a
funcției. De exemplu
> seq(1,5, 2)
[1] 1 3 5
pune în evidență că în funcția seq primul argument este from , al doilea este to și
al treilea este by. Pentru foarte multe funcții din R apelul se face cu primele 1, 2, 3
argumente nedenumite, dar în ordinea și cu semnificația specificată în d ocumentație,
27 pe când restul argumentelor sunt parametri opționali din care unii se introduc prin
numele lor iar ceilalți se utilizează prin valorile lor implicite.
Funcțiile aplicate unui număr care dau ca rezultat un alt număr, iar aplicate
unui vector sau unei matrice se aplică fiecărui element al vectorului sau matricei
respective (sunt vectorizate), sunt considerate funcții numerice. Câteva exemple sunt
date mai jos
Funcția Explicații
abs(x) | x |
sqrt(x) x
ceiling(x) Dacă x (n-1,n] valoarea retu rnată este n
floor(x), trunc(x) Partea întreagă a lui x
round(x, digits=n) Rotunjire la n zecimale
signif(x, digits=n) Rotunjire la cele mai semnificative n cifre
cos(x), sin(x), tan(x), Funcții trigonometrice directe și inverse
acos(x), asin(x), tan( x), precum și funcții hiperbolice directe și inverse
cosh(x), acosh( x), etc.
log(x) Logaritmul natural, ln x
log10(x) Logaritmul în baza 10, lg x
exp(x) e x
besselI(x, nu) Funcții Bessel. Parametru nu este ordinul
besselK(x, nu) funcției. Parametru x este un vector numeric
besselJ(x, nu) cu valori pozitive.
besselY(x, nu)
gamma(x), lgamma(x) Funcția gamma și logaritm natural din gamma
beta(a,b), lbeta(a,b) Funcția beta și logaritm natural din beta
digamma(x) Calculează derivata lui log(gamma(x) )
psigamma(x, deriv) Calculează derivata de ordin deriv a lui
digamma(x)
28 choose(n,k), lchoose(n,k) Combinări de n câte k (n poate fi real);
lchoose calculează logaritm natural din
choose.
factorial(x) Calculează gamma(x+1)
Matricele reprezintă u n obiect matematic important în statistică și de aceea R
are implementate multe funcții referitoare la ele. Mai jos indicăm unele din ele.
Operatorul sau funcția Explicații
A * B Înmulțirea element cu element
A %*% B Înmulțirea matriceală
outer(a,b,f) Dacă a și b sunt vectori generează o matrice x cu
a %o% b xi,j = f(ai, bj). Dacă a și b sunt matrice generează un array
x cu xi,j,k,l = f(ai,j, bk,l) .
Forma a %o% b este asemănătoare față de funcția produs.
crossprod(A,B) AtB, respectiv AtA
crossprod(A)
cbind(A,B,…) Combină orizontal (rezultatul va avea liniile din A, B,…)
rbind(A,B,…) Combină vertical (rezultatul este o matrice cu coloanele din
A, B,…)
rowMeans(A) Se obține un vector cu mediile liniilor
rowSums(A) Se obține un vector cu sumele elementelor liniilor
colMeans(A) Se obține un vector cu mediile coloanelor
colSums(A) Se obține un vector cu sumele elementelor coloanelor
min(A), max(A), Minimul, maximu, respectiv un vector cu minimul si
range(A) maximul
solve(A) Inversa matricei A
ginv(A) Inversa generalizată Moore -Penrouse (se găsește în pachetul
MASS)
29 x<-eigen(A) x$values conține valorile proprii ale lui A
Funcții statistice elementare
Funcția Explicații
mean(x, trim=0, Media obiectului x. trim indică ce fracți e din valorile
na.rm=FALSE) dinspre capete se neglijează. Parametrul na.rm indică
dacă se elimină NA și NaN din calcul.
sd(x,na.rm=FALSE) Deviația standard
var(x, y = NULL, Varianța (dispersia) vectorului, matricei sau
na.rm = FALSE, use) data.frame x. Parametrul use este unul din șirurile:
"everything", "all.obs", "complete.obs",
"na.or.complete" sau "pairwise.complete.obs" și
specifică felul în care se tratează valorile lipsă.
Vectorul y trebuie să aibă aceeași dimensiune ca x.
Implicit y= NULL înseamnă y=x.
median(x,na.rm=FALSE) Valoarea
mediană
cov(x, y = NULL, Covarianța vectorilor x și y sau a matricei ori
use = "everything", data.frame x (în acest caz se face covarianță între
method = "kendall") coloane). Parametrul method poate f i "pearson" ,
"kendall" , "spearman" .
cor(x, y = NULL, use Coeficientul de corelație al vectorilor x și y sau a
= "everything",method matricei ori data.frame x (în acest caz se face
= "kendall") corelația între coloane). Parametrul method poate fi
"pearson", "kendall", "spearman" .
quantile(x ,prob, Se determină cuantilele din vectorul de probabilitați
na.rm=FALSE,type=7) prob pentru datele numerice din x. Parametrul na.rm
30 controlează dacă se exclud valorile NA și NaN.
Parametrul type ia valori întregi între 1 și 9 în funcție
de metoda dorită de calcul a cuantilelor.
range(x) Intervalul [minim, maxim]
sum(x,y) , Suma elementelor vectorilor x, y,.. respectiv produsul.
prod(x,y,…)
diff(x, lag=1) Diferențe finite xi+lag – x, cu pasul lag. Implicit este
lag=1, iar rezultatul are lungimea cu 1 mai mică. Dacă
x este matrice se fac diferențele pe componente.
min(x) Minimul
max(x) Maximul
summary(obiect,…) Este o funcție generică al cărei rezultat depinde de
obiectu l căreia i se aplică. Pentru un vector numeric se
dau minimul, maximul, media, mediana, prima și a
treia cvartilă. Pentru o matrice sau data frame se face
același lucru pentru coloane.
scale(x, center=TRUE , Se înlocuiește xi
cu xi center . Dacă center=TRUE
scale=TRUE) scale
atunci se ia center egal cu mean(x) , iar dacă
scale=TRUE se ia scale=sd(x) . Dacă x este o
matrice se aplică procedura pentru fiecare coloană.
Center și scale trebuie să fie în acest caz un vector
31 de centre, respectiv un vector de parametri de scalare.
Exemplul . Se dă un vector numeric x și se cere un sumar al caracteristicilor
statistice elementare.
> x<-c(1,2,-1,3,4,10,6,4, -2,6,8,3,5)
> summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-2.000 2.000 4.000 3.769 6.000 10.000
2.5 Reprezentări grafice în R
În R se pot executa grafice de calitate pentru datele admise. Aceste grafice
sunt trimise pe ecran sau în fișiere de diverse tipuri. Pentru a realiza acest lucru
trebuie deshis un “devi ce”. Comanda windows() deschide ecranul ca dispozitiv
grafic, comanda jpeg() deschide ca dispozitiv grafic un fișier în care se va scrie
informația grafică în format jpeg, postscript() deschide un fișier de tip postscript,
pdf(), png(), tiff(), bitmap(), w in.metafile(), etc. Aceste comenzi au ca parametru file
numele fișierului unde se salvează graficul, width= lățimea în pixeli,
height= înălțimea în pixeli. Numai un dispozitiv este activ la un moment, trecerea
de la unul la altul se face dev.next(), dev.prev (), dev.set(which=k) . Listarea
dispozitivelor grafice se face cu comanda dev.list() , închiderea unui dispozitiv cu
dev.off(k) , iar închiderea tuturor cu graphics.off() . Când s -a închis un dispozitiv
diferit de ecran, imaginea din el este salvată în fișieru l specificat în parametrul file.
După comanda graphics.off() trebuie deschis un nou dispozitiv pentru a putea tipări
grafic, de regulă windows() pentru ecran. Un clic dreapta pe fereastra cu
reprezentarea grafică de pe ecran deschide un meniu cu opțiuni de salvare sau
copiere a conținutului în clipboard.
Rutinele grafice sunt cuprinse în modulul de bază: “base” precum și în două
pachete suplimentare “grid” și “lattice”. Rutinele de bază se împart în trei categorii:
rutine de nivel înalt “high level” în urm a cărora se crează o fereastră grafic ă nouă
în care se pun graficele specificate prin argumentele rutinelor; rutine de nivel jos
32 “low level” prin care la graficul existent se adaugă informații suplimentare ca text,
puncte, linii; grafice interactive prin care utilizatorul poate interacționa cu graficul
prin intermediul mausului pentru a obține informații despre valorile din diverse
poziții de pe grafic sau pentru a adăuga informații în diverse poziții de pe grafic.
Rutinele de nivel înalt din modulul de b ază sunt:
Instrucțiunea Explicații
plot plot(x,y,…), plot(xy,…), tipărește punctele de coordonate ( x[i],y[i])
utlizând opțiunile grafice … (vezi mai jos). plot(f,x) unde f este un
factor pentru x tipărește un boxplot pentru x grupat după fact orul f.
plot(x~y) face graficele coloanelor y i în funcție de x. plot(x)
pentru o variabilă care are metoda plot produce un grafic specific
acelui tip de variabilă.
pairs pairs (x) unde x este o matrice face toate graficele x i , x j
unde x i și x j sunt coloane ale lui x
coplot coplot(x~y,f) execută graficele lui y depinzând de x, pentru fiecare
nivel al factorului f
hist hist(x,…) tipărește histograma frecvențelor valorilor din vectorul x.
Opțiunea frecvent utilizată este nclass=n pentru a specifica în câte
clase se împart datele din x. Cu opțiunea probability=TRUE
histograma va reprezenta probabilitățile nu frecvențele.
boxplot boxplot(x,…) sau boxplot(x~y,data=z,…). În primul caz se execută
un boxplot pentru valorile din vectorul sau lista de vectori x, iar în
al doilea caz se execută un box plot pentru valorile din coloana x
grupate după factorul y, date ce se află în variabila z ce trebuie să
aibă date numite x și y (de exemplu z este data.frame iar x, y sunt
două coloane în z).
qqnorm, qqplot, qqnorm(x) reprezintă grafic cuantilele lui x față de cele ale
33 qqline distribuției normale standard, qqplot(x,y) reprezintă grafic
cuantilele lui x față de cele ale lui y, qqline(x) reprezintă pe lângă
grafi cul ca în qqnorm(x) și linia ce aproximează graficul.
barplot barplot(x,…), unde … sunt opțiuni, tipărește sub formă de bare
verticale valorile lui x
dotchart dotchart(x,…) la fel ca barplot(x,…) face graficul valorilor lui x
sub formă de pun cte
image image(x,y,z,…), image(z,…) reprezintă matricea z prin culori; x[i]
și
y[j] reprezintă coordonatele centrului dreptunghiului unde se
reprezintă prin culoare valoarea z[i,j]
contour, contour(x,y,z, nlevels=n,…) reprezintă grafic l iniile de contur ale
filled.contour valorilor z[i,j] din matricea z, având pe axe gradațiile date de
vectorii x, respectiv y. Opțiuni suplimentare se pot afla cu
help(contour). Analog pentru filled.contour, unde spațiul între
două linii de contur e colorat.
persp persp(z), persp(x,y,z), persp(x,y,z,theta=a,phi=b,…) desenează o
suprafață pe care sunt punctele de coordonate ( x[i], y[j], z[i,j]).
Direcția de vedere a suprafeței se ajustează prin parametrii theta și
phi (in grade), iar ltheta și lphi dau direcția de unde vine lumina
pe suprafață, r dă distanța de la care se vede ( r mare e ca vederea
de la infinit). Culoarea este controlată prin parametrul opțional
col. Pentru o variație continuă a culorii col trebuie să fie un vec tor
de culori de dimensiune egală cu numărul de fațete (vezi exemplul
de mai jos). Pentru a obține o senzație de relief mai puternică se
utilizează opțiunea shade=număr de obicei între 0 și 1, thicktype
poate fi “simple” sau “detailed”, axes este T RUE sau FALSE
după
cum se pun sau nu marcajele pe axe, xlim, ylim, zlim dau valorile
34 limită pe axe, valori care sunt cuprinse în grafic, main și sub sunt
titlul și subtitlul, xlab,ylab, zlab sunt titlurile axelor. Dacă scale =
TRUE atunci nu se păs trează proporția pe cele trei axe.
Prin tipărirea cu rutine de nivel jos se adaugă elemente noi la graficul existent.
Mai jos sunt descrise unele rutine grafice și unii parametri ai acestora. Restul se pot
afla prin comanda help .
Rutina grafică Explicaț ii
points points(x,y,…) tipărește puncte în coordonatele specificate de x și y
lines lines(x,y) adaugă linii între punctele de coordonate specificate în
vectorii x, y.
text text(x,y,text,…) determină scrierea începând din poziția ( x[i],y[i]) a
caracterelor din text[i]. Un parametru auxilar numit pos ce poate avea
valorile 1, 2, 3, 4 controlează dacă textul este sub, la stânga, deasupra sau
la dreapta punctului ( x, y).
mtext mtext(text,…) scrie un text pe o margine a graficului. Printre
parametrii opționali : side pentru a controla marginea (1=jos,
2=stânga, 3=sus, 4=dreapta), col este culoarea pentru text,
line=întreg controlează depărtarea față de marginea corespunzătoare
a graficului (în linii).
abline abline(a=valoare1, b=valoar e2) trasează graficul lui y=a+bx,
abline(h=valoare) trasează linia orizontală prin y=h,
abline(v=valoare) trasează linia verticală prin x=v.,
abline(coef=vector) trasează linia care are în coef ordonata la
origine și panta, abline(obiect) trasează o linie de parametrii coef
din obiectul obiect (dacă există).
axis axis(side,…) trasează o axă în funcție de parametrul side (1=jos,
2=stânga, 3=sus și 4=dreapta). Există mai mulț i parametri opționali.
segments segments(xo,yo,xd,yd,…) trasează s egmente de la (xo,yo) la (xd,yd).
35 Dacă xo, yo, xd, yd sunt vectori atunci se trasează mai multe
segmente. Printre parametrii opționali amintim col care este egal cu
indicele culorii segmetului (col poate fi un nume de culoare).
arrows arrows(xo,yo,x d,yd,…) este ca și rutina segments de mai sus doar că
trasează s ăgeți de la (xo,yo) la (xd,yd)
rect rect(xleft, ybottom, xright, ytop,…) traează o mulțime de
dreptunghiuri în care xleft reprezintă coordonatele lor x stânga,
ybottom repre zintă coordonatele lor y jos, etc. Printre parametrii
opționali menționăm col un vector cu indicii de culoare din paleta
curentă, density un vector cu numărul de linii de hașurare, lty un
vector cu tipurile de linie de hașură, angle un vector cu ungh iurile
față de Ox aleliniilor de hșurare.
polygon polygon(x,y,…) trasează un poligon cu vârfurile consecutive date de
vectorii x și y. Printre opțiuni sunt importante col=culoarea cu care
se umple interiorul poligonului, density=numărul de linii c u care se
hașurează poligonul, angle=unghiul cu axa Ox al liniilor de
hașurare (în grade)
box box(lty=tip, col=culoare) determină trasarea unui dreptunghi în
jurul graficului cu tipul de linie tip și culoarea culoare.
grid grid(nx,ny, col=culoare, lty=tiplinie) datermină trasarea unui
caroiaj cu culoarea culoare și tipul de linie tiplinie. Se mai poate
introduce parametrul lwd care dă grosimea liniilor de caroiaj. Pe axa
Ox sunt nx diviziuni, iar pe axa Oy sunt ny diviziuni.
legend legend(x,y , legenda, col=vector, text.col=vector, lty=vector,
pch=vector, bg=,…) unde (x,y) este poziția pe grafic al colțului
stânga sus al legendei (se poate indica poziția prin cuvinte "topleft"
sau "bottomright" sau prin instrucțiunea locator() caz în ca re este
aleasă cu mausul), legenda este un vector cu elemente text (se poate
da textul din legendă prin legend=textul , col este un vector cu
36 indicii culorilor din paleta curentă de culoare pentru culorile
marcajelor din legendă, text.col este un v ector cu indicii de culoare
pentru textele din legendă, lty este un vector de întregi cu indicii
tipurilor de linie din grafice, pch este un vector cu indicii tipurilor
de linie din legendă, bg este indicele culorii de fundal din legendă.
Culorile, tipurile de linie sau tipurile de puncte pot fi specificate și
prin cuvinte)
title title(main=text1,sub=text2,xlab=text3,ylab=text4,…) determină
scrierea unui titlu(main), subtitlu(sub), etichete pentru axe(xlab,
ylab) care sunt luate din text1, text2, etc.
2.6 Teste statistice în R
Reamintim că orice presupunere privind repartiția necunoscută a unei variabile
aleatoare poartă numele de ipoteză statistică , iar metodele de verificare a ipotezelor
statistice poartă numele de teste statistice .
Ipoteza care se verifică se numește ipoteza nulă (notată de obicei cu H0) și
orice altă ipoteză admisibilă se numește ipoteză alternativă (notată de obicei cu Ha).
Verificarea ipotezei nule se face pe baza unei selecții (eșantion) de volum n,
x1,…, xn, dintr-o populație statistică.
Testele statistice, după scopul lor, se pot clasifica în:
– teste de comparare a unor parametri ai populației, ce verifică ipoteze precum
compararea mediilor a două populații, compararea mediilor mai multor populații,
compararea d ispersiilor, etc;
– teste de omogenitate sau de independență care verifică ipoteze de tipul
dependenței sau independenței unor factori de clasificare;
– testele de concordanță , care verifică dacă distribuția selecției este conforma cu o
anumită distribuție teo retică așa cum ar fi distribuția normală.
Testele de comparare se împart la rândul lor în două categorii fundamentale:
– teste parametrice , pentru care se presupune că populațiile din care provin
eșantioanele au distribuții cunoscute cu cel puțin un parametr u necunoscut;
37 – teste neparametrice , pentru care nu se face nicio presupunere despre distribuțiile
populațiilor din care provin eșantioanele.
Testele parametrice (fie δ un parametru al dis tribuției populației) pot fi :
– teste unilaterale (direcționale) în care H0: θ = θ 0 și H1: θ < θ 0 sau θ > θ 0.
– teste bilaterale (nedirecționale) în care H0: θ = θ 0 și H1: δ ≠ θ 0;
La testele parametrice, dacă valoarea parametrului care apare în ipoteza
alternativă este unică, atunci ea se numește ipoteză simplă, altfel se n umește ipoteză
compusă.
Zona de acceptare a unei ipoteze, numită și interval de încredere , este un
interval în care se acceptă, printr -un test statistic, ipoteza nulă, căreia i se asociază
probabilitatea 1 -α. Zona de respingere este intervalul dintr -o dist ribuție de selecție a
unei statistici considerate, în care se respinge ipoteza nulă, căreia i se asociază o
probabilitate α. Probabilitatea α este numită prag de semnificație a testului .
Se pot produce erori de acceptare sau de respingere pe nedrept a unei ipoteze,
numite erori de primă spetă sau erori de tipul I și de -a doua speță sau erori de tipul II.
Eroarea de tipul I este eroarea în care se respinge pe ipoteza nulă când în realitate ea
este adevărată, probabilitatea asociată fiind α. Valoarea α se ale ge de obicei ca având
valoarea 0,05. Eroarea de tipul II este cea în care se acceptă ipoteza nul atunci când
ea este de fapt falsă, probabilitatea asociată fiind β. Regiunea critică (de respingere) a
testului reprezintă valorile numerice ale testului stati stic pentru care ipoteza nulă va fi
respinsă. Nivelul de încredere al unui test este 1 –α, iar puterea testului este 1 –β.
Un test statistic, în gene ral, parcurge următorii pași :
1. Se formulază ipotezele statistice: o ipoteză nulă H0 și o ipoteză alternativă H1.
2. Pe baza selecției se calculează o statistică numită statistica testului.
3. Se alege un prag de semnificație pentru testul statistic.
4. Se compară valoarea actuală a statisticii testului cu valoarea teoretică.
5. Se stabilesc regulile de decizie de acceptare s au respingere a ipotezei nule.
Exist ă funcții R predefinite, precum z.test care se găsește în pachetul de
programe R TechingDemos . Acest pachet de funcții R se poate găsi ca arhivă zip la
adresa web
http://cran.r -project.org/web/packages/TeachingDemos/inde x.html
38 După descărcarea pe calculatorul personal a pachetului, pentru instalare se poate
folosi opț iunea „ Install package(s) from local zip files … ” din meniul Packages .
După instalarea cu succes, se poate alege opțiunea „Load package…”, din același
meniu pentru încarcarea pachetului TechingDemos.
Există funcții R predefinite, precum sign.test care se găsește în pachetul de
programe BSDA (Basic Statistics and Data Analysis). Acest pachet de funcții R se
poate găsi ca arhivă zip la adresa web
http:// cran.r -project.org/web/packages/BSDA/index.html
Se descarcă, se instalează și se încarcă pachetul BSDA ca în cazul pachetului
TechingDemos.
Alte funcții referitoare la teste statistice se mai găsesc în pachetul standard „stats”
care se instalează automat l a instalarea software -ului R.
39 CAPITOLUL III . MODELAREA ȘI
SIMULAREA MONTE CARLO A EVOLUȚIEI
POLUĂRII CU BERILIU 7 FOLOSIND
LIMBAJUL R
3.1 Introducere . Poluarea cu Beriliu 7
Poluarea reprezinta contaminarea mediului înconjurător cu materiale care
interferează cu sanatatea umană, calitatea vie ții sau func ția naturală a ecosistemelor
(organismele vii si mediul în care trăiesc). Chiar daca uneori poluarea mediului
inconjurator este un rezultat al cauzelor naturale cum ar fi eruptiile vulcanice, cea mai
mare parte a substantelor poluante provine din activitatile umane. Un caz special îl
reprezintă poluarea indirectă cu substan țe radioactive sau care care pot deveni
radioactive în condi ții de expunere naturală la suprafa ța Pamîntului.
Radioactivitatea natu rala, ca parte a mediului înconjurator, este determinată
de prezen ța în sol, aer, apa și organisme vii a substan țelor radioactive de origine
terestră , existente in mod evident în natură în anumite concentrații .
Radioactivi tatea naturală a cunoscut, î n ul timele 4 -5 decenii, variații
semnificative datorate activitatilor umane : aducerea la suprafata a minereurilor
radioactive, extractia si utilizarea uraniului si a altor metale necesare în industria
nucleară, utilizarea unor îngrășă minte minerale extrase din roci fosfatice , explozii
atomice și accidente nucleare.
Beriliul , element cu numărul atomic 4, este un metal de culoare gri -oțel în
stare pură , care nu are miros. Este unul dintre cele mai u șoare dintre toate metalele și
are unul dintre cele mai înalte p uncte de topire. Beriliul t ransmite c aldura bine și nu
este magnetic.
Beriliul metalic este utilizat pentru fabricarea pieselor de aeronavă, a
componentelor de răcire pentru reactoarele nucleare, a propulsoarelor pentru rachete
și a oglinzilor . Oxidul de beriliu este de asemenea utilizat pentru o varietate de
aplica ții, inclusiv produc ția de ceramică specializată și izolatoare electrice. Beriliul
este, de as emenea, amestecat cu cuprul pentru a face aliaje. Aliajele de beriliu -cupru
sunt folosite pentru a f ace instrumente de precizie, componente de aeronave și
conectori electrici.
40
Fig. 3.1. Beriliu în stare pură
Cea mai importantă sursă directă de eliberare a beriliului în mediul
înconjurător provine din arderea cărbunelui care îl con ține în mod natural. D e
asemenea, poate fi eliberat din industrie prin utilizarea acestuia și eliberarea ca deșeu .
Cantită ți mici de beriliu pot fi eliberate în mod natural din minerale, roci, soluri și
prafuri vulcanice. Cantită țile de urme se găsesc în fumul de țigară.
Berili ul este considerat extrem de periculos pentru sănătate, inclusiv în
cantită ți sufficient de mici (de obicei m ai puțin de 10 μg) în praf, cea ță sau fum care
poate conține fragmente suficient de mici pentru a fi inhalate .
Beriliu are 12 izotopi naturali , dintre care Be9 este singurul stabil. În natură se
mai întâlnesc izotopii radioactivi Be7 , foarte instabil, cu perioada de înjumătățire de
53.22 de zile, și Be10, mai puțin radioactiv, cu periada de înjum ătățire de 1.39
milioane de ani , aceștia fiind s ingurii izotopi cu stabilitate mai mare de câteva
secunde. Fluxul atmosferic de Be9 provine în principal din emisii industriale, din
arderea cărbunilor cu conținut ridicat de beriliu (~ 2000 mg / kg în zona bazinului
Moraviei de exemplu ), din prelucrarea mi nerului brut pentru obținerea de beriliu
metalic și din deversarea deșeurilor ce conțin beriliu (cu precădere provenind din
industria spațială armament și industria nucleară).
Be7 este produs în mod natural în atmosferă din Be9, în urma impactului cu
radia țiile cosmice. Timpul de rezidență în atmosferă a Be9 e aproximat la o medie de
nouă zile, la fel ca apa atmosferică. Beriliul 7 se formează în primul rând în
stratosfera și are un timp de reziden ță estimat în troposferă inferioară de 10,3 până la
48 de zi le.
Radiatiile de origine cosmică, provenite din galaxia noastră ( și de la Soare,
mai ales în timpul erupțiilor solare) sau din radiația cosmică de fond (remanență a Big
Bang) , sunt relativ constante can titativ. Numă rul particulelor cosmice care intra in
41 atmosfera Pamantului este puțin afectat de ca mpul magnetic al acestuia, dar ș i de
atmo sfera terestră. Radiația cosmică, în interacț iune cu atmosfera, are ca efect
secundar și un numă r mare de radionuclizi – numiti si cosmogeni, dintre care cu
importanta mare pentr u expunerea populatiei la radiaț ii, sunt: carbon -14, hidrogen -3
(tritiu) , beriliu -7 si sodiu -22.
Dacă concentrația de C14 din atmosferă si cea de Tritiu (H3 ) din apă sunt
relativ constante de mii de ani, concentrația de Be7 a cunoscut creșteri s emnificative
de până al 14 ori în ultimile decenii de când Ber iliul este exploatat industrial .
Producția de Be7 în atmosferă depinde de altitudine, de intensitatea activității solare
(radiațiile cosmice extrasolare având în general un flux aproape constan t) și mai ales,
de cantitatea de Be9 deversată în atmosferă de activitățile umane.
Estimările anuale ale emisiilor în Europa par să fie de 30 de tone/an . Emisiile
de beriliu în Statele Unite ar fi fo st de aproximativ 250 de tone/ an, dar cu o diferență
foarte mare în distribuția geografică locală. J. Vesely a constatat că depunerea
atmosferică de Be în anul 199 0 a fost de trei ori mai mare pe unitate de suprafa ță în
fosta Cehoslovacie decât media din Statele Unite.
O sursă directă de Be7 apare din reacțiil e nucleare produse artificial, sporadic
(explozii sau deversări de materiale radioactive) sau pemanent, prin faptul că Beriliul
este utilizat în anumite reactoare (pe neutroni rapizi) ca agent de răcire si
moderator/absorbant al radiațiilor.
Prezența Be7 în precipitații a fost monitorizată de multe decenii, constatându –
se variații semnificative ale acestuia, datorate industriei respectiv factorilor
atmosferici aleatori sau sezonieri. Fluxul de depunere al lui Be7 este legat de
asemenea de distan ța pe care a fost purtat și puterea surselor de emisie.
3.2. Un model cvasi -periodic al poluării cu Be7 în Arizona
Punctul de plecare al acestei lucrări îl constituie datele obținute de pe sit -ul
Agenției US de Protecție a Mediului USEPA (a se vedea Anexa), culese într-o
perioadă de 1329 de săptămâni începând cu 15 iulie 1991. Datele sunt reprezentate
grafic in Fig. 2.
42
Fig. 3.2 Variația concentrației de Be7 în precipitații în Arizona între iulie 1991 și
august 2017 (în albastru, măsurată în Bq/litru). În roșu es te reprezentată incertitudinea
standard a măsurătorii.
Se observă direct existența unor vârfuri ale concentrației cu o periodicitate de
aproximativ 4 ani, precum și variații aleatorii destul de mari ale măsurătorilor în
intervalul 1 -3 Bq/l, datorate facto rilor atmosferici aleatori. Fenomene de periodicitate
ale concentrație de Beriliu 7 în atmosferă au mai fost constatate în trecut, fiind
asociate cu ciclul activității solre de 11 ani [4-5]. Perioada de aproximativ 4 ani pentru
apari ția maximelor în datel e din Arizona poste fi asociat ă cu variația multi -anuală a
curenților de înaltă altitudine, determinată de ciclurile instabile ale ciclonilor care
afectează sudul Statelor Unite.
Sumarizat, indicatorii statistici descriptivi de bază ai seriei temporale
reprezentată de aceste măsurători sunt:
Media 1.577137405
Varian ța 0.644251905
Devia ția standard (abaterea medie pătratică) 0.802653041
Trendul principal al seriei se obține folosind o regresie liniară. Toate
determinările numerice au fost e fectuate in R Code, un limbaj de programare orientat
spre prelucrări statistice.
Modelul de regresie liniară poate fi descries simplu prin
Concentration~ a+b* Week
unde coeficien ții a și b determină trendul principal. Codul R pentru determinarea
acest ora este dat mai jos:
43 setwd("C:/Rdata/regresii/");#citirea datelor
test<- read.delim("C:/Rdata/regresii/Beryl.txt");
View(test);
detach(test);
attach(test);#conversia din coloane in variabile aleatoare
W <- Week;
#Regresia liniara
model <- lm(Concentrati on~Week);
summary(model);
plot(Week,Concentration,main="Main Trend of Beryllium 7
concetration in Arizona",
xlab="Weeks from 15/07.1991 ", ylab=" concentration
(Bq)", pch=20,col="blue");
Rezultatul execu ției este dat mai jos:
Call:
lm(formula = Conc entration ~ Week)
Residuals:
Min 1Q Median 3Q Max
-1.3330 -0.5268 -0.2094 0.3557 4.2208
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.9989973 0.1332382 15.003 < 2e -16 ***
Week -0.0006188 0.0001687 -3.668 0.000357 ***
–
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7797 on 129 degrees of freedom
(1 observation deleted due to missingness)
Multiple R -squared: 0.09443, Adjusted R -squared: 0.08741
F-statistic: 13.45 on 1 and 129 DF, p -value: 0.0003566
Se ob ține a=1.9989973±0.1332382, b= -0.0006188±0.0001687 , iar cei doi coeficien ți
sunt semnificativi cu probabilitate mai mare de 99% (ultima coloan ă a tabelului
Coefficients determină o pr obabilitate de ne -semnifica ță inferioară lui 0.0357%).
Modelul linear însă nu poate fi folosit în predic ții din cauza coeficientului R2=0.09443
extrem de mic.
Dreapta de regresie este reprezentată în figura urm ătoare.
44
Fig. 3 Tendința centrală (Trend -ul) prezenței Beriliului în atmosferă
În urma observației fenomenului de repetitive aproape ciclică a vărfurilor de
poluare cu Be7 odata la cățiva ani, precum și a concentrării valorilor măsurate în afara
acestor vărfuri în zon valorica [1 Bq/l , 2 Bq/l], am testat mai multe modele de
regresii neliniare cvasi -periodice, folosind ca și criteriu de departajare analiza
reziduurilor fiecarui model și testul Fisher (F -test) al semnificației modelului.
Modelul final ales a fost descris de ecua ția:
Concent ration ~ C0 + c 1*Week+c 2*log(c 3+sin((Week+c 4)*/c5) )
obținănd dupa căteva teste privind distributia maximelor c3~1.2, c 4~110, și c5~112 .
45
Codul R pentru determinarea coeficienților necunoscuți:
#Regresie ciclica
W <- Week;
W1 <- log(1.2+sin( (Week+110)*3. 1415/112))
model2 = lm(Concentration~ W+W1)
model2
summary(model2)
# afisare grafica
news=seq(0,1400,10)
news
fitv5=2-0.0006271*news –
0.4863*log(1.2+sin((news+110)*3.1415/112));
fitv5
plot(Week,Concentration,main="Regresion lines of Beryllium 7
concetra tion in Arizona",
xlab="Weeks from 15/07.1991 ", ylab=" concentration
(Bq)", pch=20,col="blue");
abline(lm(Concentration~Week), col="red") # regression line
(y~x)
lines(news,fitv5,lty=1,col="green")
Results:
Call:
lm(formula = Concentration ~ W + W1)
Residuals:
Min 1Q Median 3Q Max
-1.2675 -0.4836 -0.1278 0.3902 3.7819
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.9988082 0.1284439 15.562 < 2e -16 ***
W -0.0006271 0.0001627 -3.855 0.000182 ***
W1 -0.2863982 0.0871086 -3.288 0.001304 **
–
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.742 on 128 degrees of freedom
(1 observation deleted due to missingness)
Multiple R-squared: 0.165, Adjusted R -squared: 0.1519
F-statistic: 12.64 on 2 and 128 DF, p -value: 9.762e -06
Atunci C0 =1.998, C 1= – 0,0006271 și C 2=-0.2863982 , cu erorile standard afi șate în
coloana a doua a tabelei Coefficients de mai sus. Cei trei trec testul t de
semnifica ție cu pragul =0.01 (probabilitatea ca sa fie semnificativi peste 99% ).
46
Modelul trece de asemenea testul F cu (2 , 131) grade de libertate F(alfa=0.5;
2,131)=2.9957 din tabela, iar Fcalc=12.640> F (alfa=0.5; 2,131) pentru un prag de semnificatie
alfa=0.05 (95% prag de încredere). Curba de regresie este reprezentată în figura de
mai jos în verde.
Fig.4 În verde este reprezentată curba de regresie, iar în roșu trendul principal
Fig.5 În albastru sunt reprezentate predic țiile model ului regresiv
> print(predictie);
47 1 2 3 4 5 6 7
8
1.9334921 2.0208665 2.1372270 2.1825635 2.2304328 2.4198893 2.3980555
2.3120625
9 10 11 12 13 14 15
16
2.2588891 2.2043528 2.1001704 2.0523601 1.8944873 1.8339555 1.8077240
1.7840704
17 18 19 20 21 22 23
24
1.7627603 1.7437847 1.7122872 1.6996285 1.6889666 1.6734850 1.6655944
1.6652413
În Figura 5 am reprezentat predic țiile modelului de regresie folosit. Modelul
are principalul defect că nu tine cont de varia țiile induse de fenomenele atmosferice
normale (precipita ții, acalmie, furtune reduse ca intensitate), întrucât frecven ța
acestora este neregulată, având un caracter aleator.
Analiza rezidualilor regresiei a fost efectuată folosind facilită țile limbajului R Code:
#model de regresie final salvare si analiza
predictie< – predict(model2);
print(predictie);
View(pred)
write.tab le(predictie, file = "predictieB.csv",
row.names=TRUE, na="",col.names=TRUE, sep=",") ;
#analiza rezidualilor
opar <- par(mfrow = c(1,1), oma = c(0, 0, 1.1, 0));
plot(model2,col="green", pch=20,las = 1);
Fig. 6 Analiza rezidualilor modelul ui. Valorile mari ale Concentra ției sunt pu țin sub –
evaluate, iar cele mici pu țin supra -evaluate
48
Fig.7 Graficul rezidualilor standardizați. Se observa o împrăștiere a rezidualilor destul
de uniformă, cu ușoară tendință de crestere a abaterilor standardi zate pentru valori
mari ale concentrației
Fig.8 Rezidualii în funție de leverage (măsură a variației valorilor prezise de model de
variația uneia dintre valorile de intrare w i ale modelului). În afară de trei date de
intrare toate celelalte prezintă un leverage inferior valorii de 5%, cea mai mare parte
fiind cuprinse între 1% și 2%, adică modelul este stabil.
În concluzie , modelul de regresie ob ținut este sufficient de semnificativ
pentru a fi luat în considerare. În continuare îl vom folosi pentru a p roduce un model
predictiv al fenomenului studiat, bazat pe o simulare Monte Carlo.
49
3.3. Simularea Monte Carlo a efectului varia țiilor factorilor
atmosferici aleatori asupra concentra ției de Be7 în precipita ții
3.1 Etapa 1. Generarea unui sir de valori a leatoare distribuite normal
care respectă media și dispersia datelor ini țiale
Generarea de numere aleatoare în R code
În această etapă se genereză unui șir de valori aleatoare distribuite normal in
jurul mediei Concentratiilor, avand dispersia nesemnifica tiv diferita de cea a sirului
initial (simularea Monte Carlo ține cont de existen ța factorilor perturbativi
atmosferici, unde perturba țiile sunt distribuite normal).
Fig. 10 Serie normală generată aleator în jurul mediei Concentrațiilor, cu Deviația
Standard impusă
Cod R:
mediaC=mean(Concentration[1:n]); mediaC;
standardDevC=sd(Concentration[1:n]);standardDevC;
#rnorm() generatorul de numere al eatoare normal distribuite din R
code
50
x=mediaC+rnorm( n, mean=0,sd=standardDevC);
x;sd(x);
t.test(x);
plot(Week[1:131],x,main="Monte Carlo random generator ",
xlab="Weeks from 15/07.1991 ", ylab=" concentration (Bq)",
pch=20,col="red");
––––––––
Rezultat:
> t.test(x); # verificare
One Sample t -test
data: x
t = 24.667, df = 130, p -value < 2.2e -16
alternative hypothesis: true mean is not equal to mediaC
95 percent confidence interval:
1.436536 1.687064
sample estimates:
mean of x
1.5618
3.2 Etapa a 2-a. Construc ția func ției de simulare și generarea predictiei
Monte Carlo
În et apa a doua se determină valorile variabilei de ie șire ca medie valorilor
eșantioanelor simulate la acela și moment de timp, folosind ca func ție a modelului
funcția de regresie de la Secțiunea 2, ceea ce permite recuperarea trendului principal
al seriei de v alori inițiale ale Concentrației.
Folosind generatorul de numere aleatoare se ”produc” mai întâi un număr de
Simulations =100 de serii aleatoare care respectă distribu ția ini țiala a concentra țiilor
inițiale mă surate de -a lungul timpului.
#Simulare MONTE CA RLO
#definirea parametrilor de simulare Monte Carlo
simulations < – 100 # numarul de simulari MonteCarlo
n <- 131 # numarul de saptamani de referinta
#
mc<-matrix(,nrow=simulations,ncol=n);
standD<-c();
for (i in seq(simulations)){
x=standardDevC*rnorm( n, mean=0,sd=standardDevC);
mc[i,]=x;
for (j in seq(n)){
mc[i,j]< -mc[i,j]+f[j];
};
standD[i]< -sd(mc[i,]);
}
standD;
51 write.table(mc, file = "Monte Carlo Generated.csv",
row.names=TRUE, na="",col.names=TRUE, sep=",") ;
Cu titlu de exemplu, câteva eșantioane astfel obținutesunt prezentate în
Figura 11.
12.747737 2.045988 1.83189 2.970476 3.014575 2.246346 1.781037 3.313658 2.153155 3.586984 1.688412 2.401292 1.816198
21.510298 1.472143 2.028477 1.543548 2.452019 2.815541 2.578689 2.063141 3.433989 0.995618 2.540617 1.897854 1.772191
30.548606 2.182668 2.041125 3.13992 1.215091 2.284364 2.567171 2.827376 3.013909 1.678537 2.12008 2.025396 1.429092
42.303525 1.745801 2.243382 3.544494 2.459986 2.996142 3.644851 2.559181 1.534721 1.748364 1.507386 2.865371 1.655976
50.780362 0.753946 1.913965 2.562977 1.384136 2.464128 1.865423 1.344763 2.091421 0.873105 0.213575 2.648915 2.021645
62.562866 0.469844 2.309321 2.359661 2.333536 2.496282 2.461718 2.886136 1.341905 1.459162 2.787945 1.597222 1.562652
71.987082 1.494251 1.686117 1.807155 3.139863 1.78981 1.123952 3.38778 2.943254 1.775857 2.249904 1.041295 2.484764
82.46188 1.817509 3.015648 2.754425 2.470713 2.754181 1.78948 2.45607 2.520215 1.996641 2.235386 2.066082 2.644135
91.852297 2.875274 1.9312 1.378895 1.806106 2.351279 3.386934 3.227387 2.682248 1.933686 0.260959 2.968768 0.807759
102.743697 2.522496 1.50219 2.337111 1.911258 2.506022 2.3362 3.490324 3.672476 1.522611 1.367207 1.035485 2.450932
112.087745 1.906866 2.143335 2.465461 2.700788 1.673641 2.475455 2.381088 2.803478 2.272851 2.261501 1.599456 3.15081
122.037976 2.764876 1.670018 2.528094 1.719794 1.476704 2.622182 2.398969 2.626573 1.722661 3.334034 2.629437 2.683013
132.271016 1.060351 2.413233 2.507039 2.917902 2.562225 2.873798 1.523076 2.341877 2.90261 1.974482 2.069697 2.160676
141.309746 2.466774 2.082085 2.26665 2.04523 2.724691 2.816003 2.278812 1.174054 1.413297 2.233395 1.960511 2.411791
151.596609 1.599584 0.715095 2.39603 2.17026 1.651059 2.423103 2.938118 2.269207 2.321675 1.087826 1.876236 1.420945
161.908605 1.768258 1.488939 3.323605 1.782559 2.679501 3.067864 2.702728 2.53731 2.348558 2.553403 1.949714 1.939403
172.214902 1.546282 1.942891 2.657417 1.890965 2.038042 3.308871 2.40754 2.023216 2.8588 2.505895 2.839549 1.804887
181.295701 2.252682 3.015875 1.819924 2.315329 1.474322 1.737227 2.060464 2.316009 2.72614 2.305453 1.959105 1.503317
190.876759 2.16226 2.142384 2.665819 2.378531 2.177629 2.386318 1.494456 2.311736 2.507932 1.405119 1.98213 1.127568
201.751553 1.474117 2.531624 2.608654 2.226024 2.73136 3.635837 1.826204 1.697633 2.46098 1.645694 2.79882 1.658812
211.537772 1.505331 1.393852 2.643701 2.623418 3.54429 0.958726 2.005025 2.708951 1.717761 2.880349 2.280156 1.780344
222.733356 2.027443 1.936056 3.352417 1.928141 2.153749 2.847452 1.949821 1.937358 1.565358 2.165852 2.722204 2.137924
23 1.25006 2.520546 2.253905 1.934967 2.506348 2.627761 2.933096 2.570287 2.580494 1.190013 2.423155 1.624101 1.890668
Fig. 11 Exemplu de valori generate. Pe verticală sunt valorile eșantionului „ j”, iar pe
orizontală sunt eșantioanele successive.
#functia de simulare Monte Carlo
sMC<-c(); #initializare vector
for (j in seq(n)){sMC[j]< -mean(mc[,j])
};
sMC;#afisare
plot(wk,sMC,main="Monte carlo prediction of Beryllium 7
concetration",
xlab="Weeks from 15/07.1991 ", ylab=" concentration
(Bq)", pch=17,col="blue");
lines(wk,sMC,lty=1,col="red ");
Un exemplu de rezultat al simulării este prezentat în Figura următoare. Prin
comparare cu Figura 4 se poate observa că valorile determinate de simulare au
tendin ța să respecte fenomenul de grupare în jurul unor minime locale.
52
Fig.12 Rezultatele si mulării Monte Carlo cu 100 de e șantioane.
3.3 Etapa a 3 -a. Analiza rezultatelor și determinarea intervalelor de
încredere pentru valorile prezise prim metoda Monta Carlo
Intervalele de încredere pentru predic ții se determină prin metode statistice,
folosind cele 100 de e șantioane generate la etapa 1. În final putem determina
valabilitatea modelului de simulare Monte Carlo prin determinarea numărului de
valori ini țiale aflate în aceste interval de încredere.
#definirea intervalelor de incredere pentru valorile propuse de
simularea MCarlo
norm.interval = function(data, variance = var(data), conf.level =
0.95) {
z = qnorm((1 – conf.level)/2, lower.tail = FALSE)
xbar = mean(data)
sdx = sqrt(variance/length(data))
c(xbar – z * sdx, xbar + z * sdx)
}
get.conf.int = function(x) t.test(x)$conf.in;
conf.int = apply(mc, 2, get.conf.int);
#sum(conf.int[1, ] <= 1.7 & conf.int[2, ] >= 1,7);
conf.int;
write.table(conf.int, file = "Monte Carlo confidence intervals.csv",
row.names=TRUE, na="",col.names=TRUE, sep=",") ;
plot(range(conf.int), c(0, 1 + n), type = "n", xlab = "mean values
concentration",
ylab = "week");
for (i in 1:n) lines(conf.int[, i], rep(i, 2), lwd = 2);
53
Fig. 13 Distribu ția intervalelor de increder e pentru valorile prezise de simularea MC
În Figura 13 este reprezentată schematic distribu ția acestor intervale de încredere (pe
orizontală este reprezentată valoarea concentra ției, iar pe vertical factorul timp). Mai
jos am prezentat o secvență din predi cția modelului.
week 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
lowCI 1.707121 1.820311 1.942802 2.257149 2.017534 2.290224 2.299276 2.173753 2.181187 2.065821 1.908927 1.894649 1.795396 1.762377 1.744826 1.621663
HigtCI 1.97044 2.059803 2.16743 2.520099 2.259333 2.529605 2.556229 2.434442 2.408472 2.335645 2.202356 2.171985 2.052147 2.011983 2.006896 1.873017
MC pred 1.83878 1.940057 2.055116 2.388624 2.138433 2.409914 2.427752 2.304098 2.29483 2.200733 2.055642 2.033317 1.923772 1.88718 1.875861 1.74734
err 0.13166 0.119746 0.112314 0.131475 0.1209 0.11969 0.128476 0.130344 0.113642 0.134912 0.146715 0.138668 0.128376 0.124803 0.131035 0.125677
Predictie=Mcpred Inrtervalul de incredere=[lowCI,hughtCI] eroarea predictiei~ err
erorea medie= 0.129756
Fig. 14 Exemplu de interval de incredere și calculul erorii modelului
În final, curba de predic ție Monte Carlo încadrată între limita superioara (în
roșu) respective cea inferioară (în albastru) a valorilor prezise este reprezentată mai
jos. Varia ția lă țimii intervalului de încredere apare în violet (err). Dintre datele
inițiale, din 131 de valori, 89 au fost cuprinse în interiorul acestor intervale.
54
Fig. 15 Graficul modelului simulat Monte Carlo (în verde) și intervalele de încredere
(albastru/ro șu). În violet este reprezentată abaterea maximă admisibilă a valorilor
reale fa ță de predic ție (cu probabilitate 95%)
4. Analiza statistică a modelului ob ținut
Pentru a determina în ce măsură simularea Monte Carlo poate fi folosită în
generarea de intervale de predic ție am utilizat testul -t (Student) pentru a verifica
probabilitatea ca media și varianța seriei temporale inițiale a valorilor concentrației și
seria de valori prezise de simularea Monte Carlo să fie ”semnificativ” identice.
Pentru analiza mediei celor două serii, probabilitatea ca cele două medii să nu
difere semnificativ a fost de p med=0.97544, iar pentru studiul varianței, probabilitatea
ca varianțele să nu difere semnificativ a fost p var=0.97926 ambele valori depășind
pragu l de încredere de 95% luat în considerare în modelul de simulare Monte Carlo.
În concluzie, modelul de simulare obținut poate fi folosit în predicții ale
evoluției poluării atmosferice vu Be7, cel puțin în zona de unde provin datele statistice
inițiale.
55
Bibliografie
[1] Scottish Environment Protection Agency, Scottish polluant release inventory:
Beryllium , 2013,
http://apps.sepa.org.uk/spripa/Pages/SubstanceInform ation.aspx?pid=100 .
[2] Ray Batich, James M. Marder , Beryllium Industry (Ed. 9), Metals Handbook:
Metallography and Microstructures. Metals Park, Ohio: American Society for Metals.
1985 , p. 389 -391.
[3] J. Vesely, J et all, Environmental Chemistry of Ber yllium. Reviews in Mineralogy
& Geochemistry – Rev Mineral Geochem. 50. p. 291 -317, 2002.
[4] Alex andra Ioannidou, & C. Papastefanou, Atmospheric beryllium -7
concentrations and sun spots. Nuclear Geophysics . 8(6), 1994, DOI: 10.1016/0969 –
8086(94)00034 -B.
[5] Alexandra Ioannidou &, J. Paatero, Activity size distribution and residence time of
7Be aerosols in the Arctic atmosphere , Atmospheric Environment 88, p. 99 -106, 2014
[6] Emilia Petrisor, Simulare Monte Carlo , Ed. Politehnica, Timisoara, 2006
[7] Julian J. Faraway, “Practical Regression and Anova using R”, 2002, https://cran.r –
project.org/doc/contrib/Faraway -PRA.pdf
56
Anexa.
Datele brute din ale prezen ței Be7 în precipita țiile d in Arizona (sursa: U.S.
Environmental Protection Agency
https://iaspub.epa.gov/enviro/erams_query_v2.simple_query )
Masurători: Concetra ția în Precipita ții
Procedura de detec ție: Spectroscopie Gamma
Concentratia minima detectabila medie (MDC) a fost de 0.45 Bq// L.
Conversii : 1 Bq=27 pCi
Tabel A1. Datele brute ale prezen ței Berylium -7 în precipita ții în Arizona
Week (nr. of days
from first
measurement/7) Date of prelevation Conc entration Combined
Standard
Uncertainty CSU Min Detect
Concentr. Unit
0.00 15/07/1991 0.666 0.363 0 Bq/L
12.86 15/10/1991 1.07 0.518 – Bq/L
25.71 15/01/1992 1.48 0.555 – Bq/L
30.00 15/02/1992 2.96 0.629 – Bq/L
34.29 15/03/1992 1.81 0.518 – Bq/L
60.00 15/09/1992 2.26 0.74 – Bq/L
64.29 15/10/1992 6.18 0.814 – Bq/L
72.86 15/12/1992 1.44 0.555 – Bq/L
77.14 15/01/1993 1.52 0.518 – Bq/L
81.43 15/02/1993 1.22 0.37 – Bq/L
90.00 15/04/1993 2.96 0.925 – Bq/L
94.29 15/05/1993 1.96 0.851 – Bq/L
111.43 15/09/1993 1.07 0.481 – Bq/L
120.00 15/11/1993 1.3 0.444 – Bq/L
124.29 15/12/1993 1.44 0.666 – Bq/L
128.57 15/01/1994 2.96 0.666 – Bq/L
132.86 15/02/1994 1.37 0.629 – Bq/L
137.14 15/03/1994 1.92 0.592 – Bq/L
145.71 15/05/1994 2.29 0.629 – Bq/L
150.00 15/06/1994 1.18 0.518 – Bq/L
154.29 15/07/1994 1.41 0.444 – Bq/L
162.86 15/09/1994 1.33 0.629 – Bq/L
171.43 15/11/1994 2.44 0.703 – Bq/L
180.00 15-Jan-95 0.999 0.555 – Bq/L
184.29 15-Feb-95 2.7 0.518 – Bq/L
210.00 15-Aug-95 1.37 0.592 – Bq/L
231.43 15-Jan-96 1.81 0.925 – Bq/L
57 244.29 15-Apr-96 2.55 0.592 – Bq/L
252.86 15-Jun-96 2.78 0.555 – Bq/L
304.29 15-Jun-97 1.41 0.74 – Bq/L
308.57 15-Jul-97 3.92 0.518 – Bq/L
312.86 15-Aug-97 2.74 0.481 – Bq/L
334.29 15-Jan-98 2.04 0.666 – Bq/L
338.57 15-Feb-98 0.999 0.518 – Bq/L
360.00 15-Jul-98 1.37 0.74 – Bq/L
364.29 15-Aug-98 1.59 0.666 – Bq/L
372.86 15-Oct-98 1.96 0.518 – Bq/L
377.14 15-Nov-98 2.26 0.518 – Bq/L
390.00 15-Feb-99 2.66 0.555 – Bq/L
394.29 15-Mar-99 1.92 0.592 – Bq/L
407.14 15-Jun-99 1.11 0.518 – Bq/L
420.00 15-Sep-99 1.37 0.74 – Bq/L
428.57 15-Nov-99 1.15 0.592 – Bq/L
475.71 15-Oct-00 2.18 0.814 – Bq/L
492.86 15-Feb-01 1.63 0.444 – Bq/L
514.2 9 15-Jul-01 3.37 0.74 – Bq/L
540.00 15-Jan-02 2.52 0.592 – Bq/L
544.29 15-Feb-02 1.33 0.407 – Bq/L
548.57 15-Mar-02 1.89 0.629 – Bq/L
557.14 15-May -02 1.3 0.407 – Bq/L
561.43 15-Jun-02 1.85 0.407 – Bq/L
570.00 15-Aug-02 1.2 0.359 – Bq/L
587.14 15-Dec-02 0.537 0.222 – Bq/L
595.71 15-Feb-03 1.3 0.444 – Bq/L
600.00 15-Mar-03 1.31 0.326 – Bq/L
604.29 15-Apr-03 0.881 0.155 – Bq/L
612.86 15-Jun-03 1.88 0.311 – Bq/L
621.57 16-Aug-03 1.77 0.211 – Bq/L
625.71 15-Sep-03 0.688 0.178 – Bq/L
638.57 15-Dec-03 1.08 0.292 – Bq/L
647.14 15-Feb-04 1.37 0.296 – Bq/L
651.43 15-Mar-04 1.68 0.326 – Bq/L
655.71 15-Apr-04 1.07 0.352 – Bq/L
660.00 15-May -04 0.551 0.211 – Bq/L
664.29 15-Jun-04 1.55 0.363 – Bq/L
668.57 15-Jul-04 1.32 0.315 – Bq/L
694.29 15-Jan-05 1.78 0.359 – Bq/L
698.57 15-Feb-05 3.18 0.777 – Bq/L
702.86 15-Mar-05 2.81 0.777 – Bq/L
720.00 15-Jul-05 0.777 0.407 – Bq/L
724.29 15-Aug-05 1.81 0.518 – Bq/L
750.00 15-Feb-06 2.48 0.518 – Bq/L
58 758.57 15-Apr-06 1.18 0.518 – Bq/L
844.29 15-Dec-07 1.26 0.285 – Bq/L
852.86 15-Feb-08 1.92 0.555 – Bq/L
857.14 15-Mar-08 0.766 0.263 – Bq/L
861.43 15-Apr-08 0.881 0.337 – Bq/L
865.71 15-May -08 1.15 0.181 – Bq/L
878.57 15-Aug-08 0.825 0.292 – Bq/L
891.43 15-Nov-08 1.33 0.407 – Bq/L
895.71 15-Dec-08 0.666 0.315 – Bq/L
904.29 15-Feb-09 1.23 0.355 – Bq/L
908.57 15-Mar-09 0.851 0.481 – Bq/L
912.86 15-Apr-09 0.596 0.226 – Bq/L
917.14 15-May -09 0.662 0.344 – Bq/L
921.43 15-Jun-09 1.63 0.592 – Bq/L
930.00 15-Aug-09 0.814 0.296 – Bq/L
938.57 15-Oct-09 1 0.311 – Bq/L
942.86 15-Nov-09 0.814 0.407 – Bq/L
951.43 15-Jan-10 1.87 0.337 – Bq/L
960.00 15-Mar-10 1.59 0.629 – Bq/L
977.14 15-Jul-10 2.15 0.444 – Bq/L
990. 00 15-Oct-10 2.33 1.22 – Bq/L
1013.29 28-Mar-11 1.55 0.141 – Bq/L
1014.29 5-Apr-11 0.925 0.359 – Bq/L
1015.14 11-Apr-11 1.15 0.204 – Bq/L
1016.14 18-Apr-11 0.692 0.17 – Bq/L
1016.57 21-Apr-11 1.11 0.215 – Bq/L
1017.14 25-Apr-11 1.17 0.207 – Bq/L
1017.57 28-Apr-11 1 0.167 – Bq/L
1067.14 15-Apr-12 2.18 0.518 1.22 Bq/L
1075.71 15-Jun-12 1.31 0.185 0.518 Bq/L
1084.29 15-Aug-12 3.48 0.481 0.999 Bq/L
1088.57 15-Sep-12 0.707 0.315 0.999 Bq/L
1097.14 15-Nov-12 0.359 0.2 0.666 Bq/L
1105. 71 15-Jan-13 0.411 0.222 0.703 Bq/L
1110.00 15-Feb-13 1.81 0.37 0.851 Bq/L
1118.57 15-Apr-13 0.777 0.252 0.814 Bq/L
1122.86 15-May -13 0.762 0.281 0.888 Bq/L
1127.14 15-Jun-13 0.921 0.27 0.851 Bq/L
1152.86 15-Dec-13 0.881 0.329 1.04 Bq/L
1157.14 15-Jan-14 1.85 0.37 0.925 Bq/L
1165.71 15-Mar-14 1.66 0.363 0.888 Bq/L
1170.00 15-Apr-14 1.02 0.303 0.777 Bq/L
1182.86 15-Jul-14 1.92 0.37 0.814 Bq/L
1191.43 15-Sep-14 1.52 0.481 1.18 Bq/L
1200.00 15-Nov-14 1.02 0.322 0.999 Bq/L
59 1204.29 15-Dec-14 2.7 0.48 1 0.999 Bq/L
1208.57 15-Jan-15 1.01 0.329 1.04 Bq/L
1212.86 15-Feb-15 0.688 0.333 1.07 Bq/L
1221.43 15-Apr-15 1.59 0.444 1.15 Bq/L
1225.71 15-May -15 1.55 0.407 1.04 Bq/L
1230.00 15-Jun-15 1.27 0.252 0.592 Bq/L
1234.29 15-Jul-15 0.999 0.481 1.52 Bq/L
1238.57 15-Aug-15 1.11 0.359 1.15 Bq/L
1255.71 15-Dec-15 1.14 0.278 0.703 Bq/L
1260.00 15-Jan-16 1.48 0.481 1.15 Bq/L
1268.57 15-Mar-16 2.18 0.481 0.999 Bq/L
1298.57 15-Oct-16 1.56 0.366 0.962 Bq/L
1307.14 15-Dec-16 1.52 0.481 1.26 Bq/L
1328.57 15-May-17 2.07 0.592 1.48 Bq/L
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: INTRODUCERE ………………………….. ………………………….. ………………………….. ………………………. 3… [604009] (ID: 604009)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
