Modelarea Ecosistemelor2017 [605242]
1/124
MODELAREA PROCESELOR ECOLOGICE
CUPRINS
Introducere ………………………………… …………………………………………… …………. 3
Strategie de modelare a ecosistemelor …………. ……………………………………. 4
Etapele metodologiei de modelare ……………… ……………………………………… 5
1. Modele calitative ………………………… …………………………………………… ……… 8
1.1. Principii pentru elaborarea modelelor calitati ve ………………………………. 8
1.2. Metodologia de elaborare a modelelor calitativ e …………………………….. 9
1.3. Simboluri standard pentru modele calitative .. ……………………………….. 11
1.3.1. Surs ă ………………………………………….. …………………………………… 11
1.3.2. Depozit ……………………………… …………………………………………… … 11
1.3.3. Interac țiune ………………………………………. ………………………………. 12
1.3.4. Consumator …………………………… …………………………………………. 1 3
1.3.5. Produc ător ……………………………………….. ………………………………. 14
1.3.6. Amplificator …………………………. …………………………………………… . 15
1.3.7. Consum energie ……………………….. ………………………………………. 15
1.3.8. Tranzac ție ………………………………………… ………………………………. 16
1.3.9. Simbol “cutie neagr ă” …………………………………………. ………………. 17
1.3.10. Conexiuni, for țe, fluxuri …………………………………. ………………….. 18
1.3.11. Ciclu condi țional ……………………………………… ……………………….. 18
2. Modele cantitative dinamice ……………….. …………………………………………… 20
2.1. Modelul dinamic NETPROD …………………. …………………………………… 23
2.1.1. Exemple ……………………………… …………………………………………… . 23
2.1.2. Ecua țiile modelului ……………………………… ……………………………… 24
2.1.3. Aplica ție ………………………………………… …………………………………. 24
2.2. Modelul dinamic RENEW …………………… …………………………………….. 26
2.2.1. Exemple ……………………………… …………………………………………… . 26
2.2.2. Ecua țiile modelului ……………………………… ……………………………… 27
2.2.3 Aplica ție ………………………………………… ………………………………….. 27
2.3. Modelul dinamic SLOWRENEW ……………….. ……………………………….. 28
2.3.1. Exemple ……………………………… …………………………………………… . 28
2.3.2. Ecua țiile modelului ……………………………… ……………………………… 29
2.3.3. Aplica ție ………………………………………… …………………………………. 29
2.4. Modelul dinamic EXCLUS ………………….. …………………………………….. 31
2.4.1. Exemple ……………………………… …………………………………………… . 31
2.4.2. Ecua țiilemodelului ………………………………. ……………………………… 32
2.4.3. Aplica ție numeric ă…………………………………………… …………………. 32
2.5. Modelul dinamic INTERACT ………………… ……………………………………. 33
2.5.1. Exemple ……………………………… …………………………………………… . 33
2.5.2. Ecua țiile modelului ……………………………… ……………………………… 33
2.5.3. Aplica ție ………………………………………… …………………………………. 33
2.6. Modelul dinamic COOP …………………… ………………………………………. 35
2.6.1. Exemple ……………………………… …………………………………………… . 35
2.6.2. Ecua țiile modelului ……………………………… ……………………………… 35
2.6.3. Aplica ție ………………………………………… …………………………………. 35
2/124
2.7. Modelul dinamic DESTRUCT ………………… ………………………………….. 37
2.7.1. Exemple ……………………………… …………………………………………… . 37
2.7.2. Ecua țiile modelului ……………………………… ……………………………… 37
2.7.3. Aplica ție ………………………………………… …………………………………. 38
3. Modele cantitative statistice ……………… …………………………………………… .. 39
3.1. Cuantificarea intensit ății corela țiilor ……………………………………… …….. 39
3.1.1.Coeficien ții de corela ție ………………………………………… ……………… 41
a) Raportul de corela ție ………………………………………… ……………….. 41
b) Coeficientul corela ției lineare ………………………………… ………………. 45
c) Coeficientul cosinus θ ………………………………………….. ……………… 46
d) Coeficientul distantei taxonomice ………….. ……………………………….. 47
e) Coeficientul corela ției binare …………………………………. ………………. 49
3.1.2. Coeficien ții de corela ție a rangurilor …………………………….. ……….. 51
a) Coeficientul lui Spearman …………………. ………………………………….. 51
b) Coeficientul lui Kendall ………………….. ……………………………………… 53
c) Coeficientul OMEGA-Kendall ………………… ………………………………. 55
3.1.3.Coeficien ți de asociere ………………………………. ………………………… 57
a) Coeficientul de asociere Yule și Kendall ………………………………….. 60
b) Coeficientul de interdependen țã …………………………………………. …. 60
c) Coeficientul de corela ție asociativã ………………………………. ………… 60
3.1.4.Coeficien ți de corela ție temporal ă ………………………………………….. 62
a)Formalizarea stocasticã a seriilor de timp …… ……………………………. 64
b)Coeficientul de autocorela ție ………………………………………… ………… 68
c)Coeficientul de intercorela ție ………………………………………… ………… 71
3.2. Factorizarea corela țiilor ……………………………………… …………………….. 74
3.2.1. Valori proprii și vectori proprii …………………………… ………………….. 75
3.2.2.Standardizarea ………………………… ………………………………………… 78
3.2.3.Analiza în componen ți principali ……………………………….. ………….. 80
a)Metodologia de lucru ………………………. …………………………………….. 80
b)Influenta covariantei asupra A.C.P. …………. ………………………………. 83
c)Aplicatie ………………………………… …………………………………………… .. 84
3.2.4. Analiza factorialã R-MOD ………………. …………………………………… 87
a)Diferenta operationalã dintre A.C.P. și A.F.R.-MOD …………………… 88
b)Câti factori trebuie ale și? ………………………………………… ……………… 90
c)Aplicatii ………………………………… …………………………………………… … 90
3.2.5.Rotatia factorilor …………………….. …………………………………………… 93
3.2.6. Analiza factorialã Q-MOD ………………. …………………………………… 96
3.3. Modelarea matematic ă a corela țiilor substan țiale ………………………… 100
3.3.1. Model liniar de o singurã variabilã independ entã …………………… 100
3.3.1.1. Analiza graficã a corela ției ……………………………………….. …. 101
3.3.1.2. Evaluarea intensitã ții corela ției liniare ……………………………. 106
3.3.1.3.Testarea adecvãrii modelului liniar ……. …………………………… 109
3.3.1.4. Parametrii modelului ………………… …………………………………. 110
3.3.1.5.Aplica ție ………………………………………… …………………………… 113
3.3.2.Model liniar multiplu ………………….. ………………………………………. 115
3.3.2.1.Analiza graficã a corela ției multiple ……………………………….. . 116
3.3.2.2.Evaluarea intensitã ții corela ției ………………………………………. 117
3.3.2.3.Testarea adecvãrii modelului liniar multipl u ……………………… 119
3.3.2.4.Parametrii modelului …………………. …………………………………. 121
3.3.2.5.Aplicatie …………………………… ………………………………………… 12 3
3/124
MODELAREA ECOSISTEMELOR
Introducere
Ecologia (din cuvintele grece ști: ecos – cas ă și logos – știin ță , adic ă
"știin ța studierii habitatului" ) este o știin ță biologic ă de sintez ă ce studiaz ă
conexiunile ce apar între organisme și mediul lor de via ță (abiotici și biotici),
precum și structura, func ția și productivitatea sistemelor biologice
supraindividuale ( popula ții , biocenoze ) și a sistemelor mixte ( ecosisteme ), mai
pe scurt, reprezint ă studiul interac țiunii dintre organisme și mediul
înconjur ător .
Un ecosistem este o unitate de func ționare și organizare a ecosferei
alc ătuit ă din biotop și biocenoz ă și capabil ă de productivitate biologic ă.
Ecosistemul cuprinde și rela țiile dintre biotop și biocenoz ă
Popula ția reprezint ă un grup de organisme ce apar țin aceleia și specii
și care ocup ă un anumit teritoriu ( areal ). Privit din punctul de vedere al
geneticii poula țiilor aceast ă no țiune reprezint ă o asocia ție de indivizi care au
împreun ă anumite caracteristici: ocup ă un anumit areal, poed ă acela ș mod de
reproducere, au variabilitate ereditar ă asem ăntoare și sunt rezultatul aceleia și
selec ții naturale.
Biotopul reprezint ă totalitatea factorilor abiotici ( apa , vântul , energia
solar ă, clima , umiditatea ) și rela țiile dintre ei.
Biocenoza reprezint ă un nivel supraindividual de organizare a materiei
și descrie totalitatea organismelor vii, vegetale ( fitocenoz ă) și animale
(zoocenoz ă) care interac ționeaz ă între ele și care convie țuiesc într-un anumit
mediu sau sector din biosfer ă (biotop ).
Un ecosistem nu are grani țe definite, astfel el poate avea dimensiuni
foarte mari ( de șertul Sahara ), sau dimensiuni foarte mici (un iaz).
4/124
Modelarea și simularea ecosistemelor este un process complex de
reprezentare a organiz ării și func țion ării a ecosistemelor în scopul în țelegerii
cre șterii și evolu ției acestora.
Modelarea și simularea sunt instrumentele de conectare a ideilor , ce
constituie formularea abstract ă a interac țiunii factorilor biotici și abiotici în
procesele specifice ecosistemelor cu realitatea reprezentat ă de ecosisteme.
Obiectivele modelarii si simularii ecosistemelor su nt:
o în țelegerea complet ă și a func țion ării ecosistemelor
o controlul riguros cantitativ al cre șterii și evolu ției spa țio-
temporale a ecosistemelor.
MODELAREA are ca obiectiv specific reprezentarea sintetic ă a organiz ării și
func țion ării ecosistemelor (sub forma grafic ă și
cantitativ ă).
SIMULAREA dă “via ță ” modelelor în scopul controlului cantitativ al cre șterii și
evolu ției ecosistemelor (prin intermediul ecua țiilor și
sistemelor de ecua ții asociate proceselor cercetate).
Strategie de modelare a ecosistemelor
Modelarea ecosistemelor se bazeaz ă pe o analiz ă detaliat ă a
acestora cu dou ă obiective principale:
• stabilirea factorilor biotici și abiotici ai ecosistemului cercetat;
• identificarea interac țiunilor dintre factorii biotici și abiotici în
ambian ța proceselor ecosistemului.
Rezultatele analizei ecosistemului sunt sintetizate în dou ă modele
realizate succesiv:
5/124
• Modelul calitativ (conceptual) al ecosistemului, realizat de
regul ă sub forma unor diagrame în care sunt figurate prin
simboluri componentele ecosistemului și prin linii leg ăturile
dintre ele.
• Modelul cantitativ realizat prin completarea diagramelor cu
numere ,de acela și tip sau de tipuri diferite.
În etap ă final ă este utilizat modelul cantitativ calibrat pe datele
experimentale ob ținute în programul de monitorizare al ecosistemului , pentru
simularea evolu ției spa țio-temporale a ecosistemului în dou ă situa ții
distincte:
• evolu ția ecosistemului în condi țiile naturale, în lipsa unui
stress extern care s ă modifice condi țiile în care s-a elaborat și
calibrat modelul cantitativ;
• evolu ția spa țio-temporal ă a ecosistemului în condi ții de
stress natural sau antropic, stress care modific ă parametrii
energetici și materiali ai acestuia.
Etapele metodologiei de modelare
Metodologia de realizare a celor dou ă tipuri de modele, calitativ și
cantitativ, poate fi separat ă în patru etape:
• definirea frontierelor modelului calitativ , pin simbolizarea
suprafe ței în care vor fi reprezentate toate componentele și
interconexiunile sistemului ( Fig.1 ):
• plasarea componetelor ecosistemului ( Fig.2 ):
o sursele de energie și de materie
o componetele de stocare
o produc ători și consumatori
6/124
• trasarea interconexiunilor dintre componentele modelului
calitativ al ecosistemului ( Fig.3 .)
• ini țializarea numeric ă a modelului cantitativ prin plasarea
numerelor în diagrama modelului calitativ (particularizare
pentru ciclul fosforului: valorile sunt exprimate î n [grame/m 2.an],
Fig.4 )
Fig.1 . Frontierele ecosistemului
7/124
Sursa
de
energie Sursa
de
materie
Stocare
materie
organic ă Stocare
materie
anorganic ă
Produc ător Consumator
Fig.3 . Trasarea interconexiunilor dintre componentelor e cosistemului . Sursa
de
energie Sursa
de
materie
Stocare
materie
organic ă Stocare
materie
anorganic ă
Produc ător Consumator Ie șire
materie din
ecosistem
Energie
neutilizat ă Energie
consumat ă Reciclare
8/124
1. Modele calitative
1.1. Principii pentru elaborarea modelelor calitati ve
Fig.4 . Ob ținerea modelului cantitativ prin plasarea numerelor în diagrama
modelului calitativ (exemplificare pentru ciclul fosforului într-un ec osistem; valorile
sunt exprimate în [ grame/metru p ătrat și an ]) Sursa
de
energie Sursa
de
fosfor
Stocare
fosfor in
organisme Fosfor în
ap ă
Produc ător Consumator Ie șire fosfor
din
ecosistem
Energie
neutilizat ă Energie
consumat ă Reciclare
0,5 0,5
40,0
40,0
40,0 40,0
100,0 1,0
9/124
Elaborarea modelelor calitative, în variant ă grafic ă, are avantajul c ă
vizualizeaz ă într-un mod intuitiv componentele și rela țiile dintre acestea, f ără a
inlocui realitatea palpabil ă cu simboluri abstracte specializate, de tipul
ecua țiilor matematice, care presupun o anumit ă specializare pentru o
manipulare eficient ă.
Realizarea diagramelor grafice pentru modelele cal itative respect ă
câteva principii generale:
• sursele principale de energie se amplaseaz ă în afara sistemului
modelat șî liniile de leg ătura traverseaz ă frontierele acestuia;
• consumul de energie se face în general de la stâng a la dreapta șî de
sus în jos;
• fiecare sistem are o piedere de enegie pe frontier a inferioar ă, pierdere
inevitabil ăconform cu principiul al doilea al termodinamicii.;
1.2. Metodologia de elaborare a modelelor calitativ e
Elaborarea modelelor calitative este prima etap ă obligatorie în
analiza numeric ă și simularea oric ăror procese.
Rezultatul acestei prime etape este modelul conceptual pe care se
fundamenteaz ă toate evalu ările cantitative. CORECTITUDINEA MODELULUI
CONCEPTUAL ESTE CHEIA EVALUARII CORECTE A PROCESELO R
ECOLOGICE.
Etapele realizarii modelului calitativ sunt :
1. Trasarea limitelor sistemului
2. Consemnarea tuturor traseelor care traverseaza l imitele
sistemelor ( intrari si iesiri )
• Plasarea fiecarui inceput intr-o sursa plasata in
afara sistemului studiat
• Marcarea simbolurilor de sursa cu Cuvinte
suggestive
3. Consemnarea componentelor sistemului:
• Lista completa a componentelor cercetate
10/124
• Plasarea lor in interiorul sistemului de la stanga la
dreapta in ordinea intrarii in actiune;
4. Consemnarea proceselor din system
• O lista cu procesele importante
• Conexiunile intre componentele implicate de
fiecare process
5. Marcarea conservarii masei prin evidentierea clara de-a
lungul proceselor pentru:
• Intrari;
• Stocari
• Iesiri
6. Verificarea circuitului banilor in system
7. Marcarea circuitului energiei prin:
• Intrari
• Consum
• Iesiri
8. Utilizarea culorilor standardizate pentru intocmirea
diagramelor:
• ro șu pentru circuitul energiei
• albastru pentru circuitul materiei din biosfera :
aer, apa, nutrien ți
• maron pentru componentele geologice ,
combustibil, minereu
• verde pentru zona ambiental ă, producatori,
productie
• portocaliu pentru consumatori : animale, oameni,
industrie etc.
• purpuriu pentru bani
9. Definitivarea modelului pentru obiectivul studi ului
• detaliere pentru studiul știintific detaliat
• sinteza pentru discutii cu beneficiari ai rezultatelor
(public, politicieni)
11/124
1.3. Simboluri standard pentru modele calitative
1.3.1. Surs ă
Simbolul utilizat în mod curent pentru surs ă este circular, se plaseaz ă
în exteriorul frontierelor ecosistemului și simbolizeaz ă aportul de informa ție,
materie sau energie în ecosistem ( Fig.5. ).În interiorul cercului este precizat
prin text tipul de aport (surs ă de materie anorganica/organic ă, energie solar ă
etc.).
Plasamentul surselor este de regul ă în partea stâng ă a frontierelor
ecosistemului, consumul de energie, materie sau inf orma ție realizându-se de
la stânga spre dreapta ( Fig.4 ).
1.3.2. Depozit
Stocarea, sub diferite forme (energiei, materiei, informa ție, structur ă) se
reprezint ă cu un simbol de baz ă (Fig.6a ).
Stocarea într-un depozit fiind nelimitat ă trebuie s ă existe nu numai c ăi
de intrare dar și c ăi de ie șire (difuzie, dispersie sau depreciere), ambele fiind
de acela și tip.
Stoc ările specializate sunt reprezentate prin diferite conexiuni asociate
simbolului de baz ă:
• stocarea energiei cu indicarea deprecierii acestei ( Fig.6b );
• stocarea energiei și materiei cu
consumul energiei și deprecierea
materiei ( Fig.6c ).
Fig.5 . Simbol utilizat pentru
surse de informa ție, materie
sau energie.
12/124
1.3.3. Interac țiune
Simbolul pentru interac țiune reprezint ă o transformare și con ține
(Fig.7 ):
• căi prin care sunt
simbolizate
afluxurile de
materie sau
energie;
• caset ă în care se
produce
transformarea;
• una sau mai
multe ie șiri
pentru produsul rezultat, energia consumat ă etc.
Exist ă diferite tipuri de interac țiuni pentru care se ata șeaz ă diferite
atribute suplimentare simbolului elementar de inter ac țiune: Fig.6. Simboluri pentru stocare elementar ă(a), stocare de energie cu
deprecierea acestei ( b) și stocare de energie și materie cu depreciere
energiei și materiei ( c). Energie
uzat ă Energie
uzat ă Materie
depreciat ă a) c) b)
Aflux
component
A Aflux
component
B
Energie
utilizata Produs
rezultat
Fi g.7. Simbolul utilizat pentru interac țiunea din care
rezult ă diverse produse.
13/124
• interac țiune cu niveluri de intensitate variabil ă a transform ărilor,
pozi ționate în ordinea cresc ătoare de la st ănga la dreapta în
diagrama modelului calitativ ( Fig.8a ).
• interac țiune cu dilu ție (Fig.8b,c ), în care produsul rezultat este
propor țional cu afluxul de materie și energie, divizat sau redus
propor țional cu ponderea foctorilor care sunt plasa ți în dreapta
simbolului de interac țiune (exemplu: cantitatea de plancton dintr-un
lac este redus ă prin dilu ția apei rezultat ă din alimentarea lacului);
1.3.4. Consumator
Simbolul pentru consumator
se refer ă la un grup de ac țiuni, în mod
uzual reprezentate prin cuplul
transformare-stocare, încadrate într-un
hexagon ( Fig.9a ). Nivel
transformare
redus Control
transformare
intens ÷
–
Fig.8 . Interac țiuni cu niveluri de transformare diferen țiate ( a), cu dilu ție
divizat ă ( b) sau redus ă(c) a) b)
c)
Fig.9 .Utilizarea simbolului de grup
consummator. a) b)
c) d)
14/124
Procesul de transformare din simbolul de interac țiune ( Fig.8a ) este un
proces de transformare primar și devine secundar când este plasat într-un
simbol grup de consumator.
Diversele variante de proces consumator se diferen țiaz ă prin
simbolurile plasate în interiorul hexagonului de ba z ă:
• flux de consum propor țional cu factorii determinan ți (ex.: consumul
microbilor propor țional cu zah ărul disponibil) ( Fig.9b );
• fluxul de consum propor țional cu fluxul productiv determinat de doi factor i
(ex.: descompunerea substan țelor organice propor țional cu concentra ția
materiei organice și concentrarea oxigenului) ( Fig.9c );
• fluxul de consum este propor țional cu sursele de materie și energie
precum și semnalul de feedback dat de stocarea proprie (ex. : cre șterea
zooplanctonului propor țional cu cantitatea de hran ă și concentra ția de
oxigen ( Fig. 9d ).
1.3.5. Produc ător
Simbolul pentru produc ător implic ă o unitate de producere și de cele
mai multe ori una de stocare a
produsului creat. Pentru
simbolizarea unui produc ător se
utilizeaz ă, în cel mai general caz, un
cadru care mascheaz ă o structur ă
intern ă detaliat ă ( Fig.10a ) iar pentru
precizarea unor caracteristici ale
structurii interne se adaug ă
atributele necesare:
• produc ător influen țat
propor țional cu concentra ția
aportului de energie (ex.:
producere de materie
organic ă prin procesul de fotosintez ă, propor țional cu concentra ția
luminii) ( Fig.10b ); Fig.10 .Utilizarea simbolului de grup
produc ător. a) b)
c)
d)
15/124
• produc ător “stimulat” simultan de dou ă aporturi (ex.: stimularea
fotosintezei de concentra ția luminii și a nutrien ților) ( Fig.10c );
• produc ător stimulat propor țional cu aportul de energie/materie și
controlat prin feedback-ul rezultat de stocarea pro dusului (ex.:
produc ția de fitoplancton stimulat ă de concentra ția de lumin ă și
nutrien ți, și inhibat ă de cantitatea de produs stocat ă ( Fig.10d ).
1.3.6. Amplificator
Acest operator simbolizat printr-un triunghi (Fig. 11a ) controleaz ă
aportul de materie/energie din diferite surse, apor t care aplific ă intensitatea
unui proces de consum/produc ție (ex.: reproducerea organismelor care poate
fi stimulat ă de o cantitate suplimentar ă de hran ă) ( Fig.11b ).
1.3.7. Consum energie
Sursa de
materie/
energie
Controlul
afluxului Produsul
propor țional cu
afluxul
Energia
uzat ă Iepuri
Reproducere Hran ă Mor ți Născu ți
Fig.11. Amplificator cu rat ă constant ă ( a) cu un exemplu de reproducere
cu amplifictor stimulat de aport de hran ă nelimitat ( b). a) b)
16/124
Fiecare ecosistem trebuie s ă aib ă, pentru ca
modelul s ă respecte legea a doua a termodinamicii,
pozi ționat pe frontiera de la baz ă, un simbol care s ă
figureze pierderea/consumul/dispersia de energie în afara
sistemului, nerecuperabil ă și neregenerabil ă ( Fig.12 ).
Simbolul nu trebuie confundat cu cel de legare la pământ al unei surse
electrice.
1.3.8. Tranzac ție
Circula ția banilor în cadrul tranzac țiilor asociate diferitelor procese de
produc ție și consum este în general în sens contrar sensului de consum al
energiei și materiei și se reprezint ă prin linie întrerupt ă ( Fig.13 ). Fig.12 . Consum
ireversibil de
energie
Sursa de
energie
Produc ător Consu-
mator $ $ Servicii
Fig.13. Circula ția banilor într-un ciclu de producere și consum
17/124
Pentru situa ții particulare se completeaz ă circuit banilor, a c ăror
valoare se conserv ă în circuitul proceselor asociate, cu simboluri sup limentare
(Fig.14 ).
1.3.9. Simbol “cutie neagr ă”
Simbolul de cutie neagr ă este utilizat pentru a reprezenta componente
cu structur ă intern ă necunoscut ă ( Fig.15a ), sau simboluri pariculare ale unor
ecosisteme (cu apari ție extrem de rar ă; Fig.b,c ).
Plat ă în bani Produc ție Produc ție $ $
$ $ Pre țul de
piat ă Pre ț a) b)
c) d)
Fig.14 . Circula ția banilor în diferite tipuri de tranzac ții: a) cump ărare; b)
tranzac ție cu pierdere de energie; c) tranzac țier cu pre ț dictat de un
system mai mare; d) flux dintr-un sistem mai mare care stabile ște pre țul
de pia ță .
c) a) b)
Fig.15 . Simbolul cutie neagr ă utilizat pentru: a) componente cu
structur ă intern ă necunoscut ă; b) for țe rezultate dintr-un flux principal;
c) senzori pentru identificarea unor componente secu ndare rezultate
dintr-un anumit process.
18/124
1.3.10. Conexiuni, for țe, fluxuri
Structura ecosistemelor este constituit ă din simbolurile componentelor
legate prin linii de diferite tipuri: conexiuni, fo r țe, fluxuri.
O linie de leg ătur ă poate fi utilizat ă pentru: material, informa ție,
organisme, popula ție, energie etc.
Fluxurile sunt activate de for țe, for țe reprezentate prin: for țe fizice,
concedntra ție chimic ă, sau oirice alte propriet ăți ce au energia necesar ă
intre ținerii unui flux. For țele provin dintr-o surs ă exterioar ă sau dintr-un stocaj
intern.
Fluxurile sunt diferen țiate grafic în func ție de particularit ățile de
circula ție și de num ărul for țelor active:
• fluxul propor țional cu o singur ă for ță , de tip linear, este reprezentat
printr-o linie cu o singur ă s ăgeat ă, indiferent de prezen ța sau absen ța
unei pierderi sau transform ări de energie ( Fig. 16a,b,c );
• flux divizat sau combinat din dou ă fluxuri de acela și tip ( Fig.16d,e );
• flux dependent de diferen ța de for țe de la cele dou ă capete ale
circuitului ( Fig.16f ).
1.3.11. Ciclu condi țional
a) b) c) e) d) f)
Fig.16 . Diferite tipuri de fluxuri din structura ecosiste melor: a)flux linear cu o
for ță ; b) flux linear cu pierdere de energie; c) flux linear cu transformare de
energie; d) combinarea a dou ă fluxuri de acela și tip; e) divizarea în dou ă
fluxuri de acela și tip; f) flux dependent de diferen ța dintre for țele de la
capetele circuitului.
19/124
Ciclul condi țional limitativ/de maxim ( Fig.17a ) este un simbol de grup
care limiteaz ă ie șirea dintr-un sistem la cre șterea energiei provenite dintr-o
surs ă intern ă.
Ciclul condi țional limitativ este utilizat pentru un flux energe tic al unei
unit ăți cu un ciclu intern propriu. Este cazul procesului de producere de oxigen
și substan ța organic ă prin fotosintez ă ( Fig.17b ):
• in primul pas clorofila prime ște energie (lumina de la soare) și produce
sarcina pozitiv ă sau negativ ă;
• al doilea pas se produce oxigen și substan ță organic ă și se “reseteaz ă”
clorofila ca s ă poat ă primi din nou energie pentru un nou ciclu de
producere, declan șat numai dac ă mai exist ă materie prim ă disponibil ă.
Fig.17 .Ciclu limitativ: a) far ă structur ă intern ă cunoscut ă (“black box”) sau
cunoscut ă, dar nereprezentat ă, din ra țiuni de simplificare a diagramei (“white
box”); b) cu structura intern ă cunoscut ă si reprezentat ă . Sursa
de
energie Produs
intermediar Material
limitat
Produc ător
Iesire
limitat ă a) b)
20/124
2. Modele cantitative dinamice
Modelele cantitative dinamice se construiesc pe structura modelului
conceptual reprezentat de modelul calitativ al ecos istemului prin:
• introducerea numerelor în diagrama modelului calitativ;
• ata șarea ecua țiilor modelului calitativ.
Introducerea numerelor în diagrama modelului calitativ îl transform ă în
mondel cantitativ. Cu ajutorul numerelor introduse în diagramele modelelor
calitative se poate sesiza unde stocarea sau fluxul sunt mai mari sau mai mici.
Diagramele cu numere au calitatea de a reprezenta s intetic și sugestiv
carateristicile cantitative generale ale ecosistemu lui.
Ecua țiile asociate modelului calitativ permit construirea un ui model
cantitativ care permite:
• analiza detaliat ă a evolu ției componentelor ecosistemului;
• prognoza evolu ției ecosistemului în etapa de simulare , pentru diverse
condi ții (cele monitorizate sau generate de situa ții excep ționale: catastrofe
naturale, polu ări accidentale).
Ini țializarea numeric ă a modelelor calitative se bazeaz ă pe date
ob ținute prin monitorizarea componentelor ecosistemului cercetat, pe o
perioad ă îndelungat ă de timp în care pot fi sesizate tendin țele de varia ție
temporal ă și spa țial ă.
Introducerea numerelor în diagramele modelelor se face, în func ție de
coplexitatea ecosistemului studiat, în dou ă variante:
• cu numere de acela și tip;
• cu numere de tipuri diferite.
Diagramele care urm ăresc fluxul unui singur component sunt
completate cu numere exprimate în aceea și unitate de m ăsur ă.
Stdiile biochimice, de cele mai multe ori, urm ăresc fluxul unui singur
component chimic și în aceast ă situa țiile pe toate liniile de conexiune ale
componentelor sunt plasate valorile componentului r espectiv în aceea și
unitate de m ăsur ă.
21/124
Reprezentarea cantitativ ă prin numere a ciclului pentru fosfor într-un
ecosistem ( Fig.18 ), poate fi exprimat ă numere care iarat ă cantitatea de fosfor
în [grame/metru p ătrat și an ] și trebuie completat ă pe toate conexiunile cu
excep ția conexiunii cu sursa de energie primar ă și conexiunea care indic ă
pierderea de energie din baza diagramei ecosistemul ui (energia pierdut ă)
O diagram ă similar ă poate fi completat ă cu energia consumat ă pe
fiecare tronson și exprimat ă în [ 10 6 Joule/metru p ătrat și an ] ( Fig.19 ).
Fig. 18 . Ob ținerea modelului cantitativ prin plasarea numerelor în diagrama
modelului calitativ (exemplificare pentru ciclul fosforului într-un ec osistem;
valorile sunt exprimate în [ grame/metru p ătrat și an ]) Sursa
de
energie Sursa
de
fosfor
Stocare
fosfor in
organisme Fosfor în
ap ă
Produc ător Consumator Ie șire fosfor
din
ecosistem
Energie
neutilizat ă Energie
pierdut ă Reciclare
0,5 0,5
40,0
40,0
40,0 40,0
100,0 1,0
22/124
Cele dou ă diagrame cu numere, materie (Fig.18 ) și energie (Fig.19 ),
pot fi combinate și rezult ă o diagram ă cu tipuri deferite de numere, unele
exprimate în [grame/metru p ătrat și an ] și altele exprimate în [10 6
Joule/metru p ătrat și an ]. Pentru a elimina confuziile Intr-o astfel de
diagram ă este util s ă se noteze unitatea de m ăsur ă lâng ă fiecare num ăr.
a) b)
c) d)
Fig.19 . Ob ținerea modelului cantitativ prin plasarea numerelor în diagrama
modelului calitativ (exemplificare pentru ciclul fosforului într-un ec osistem;
valorile sunt exprimate în [ 10 6 Joule/metru p ătrat și an ]) Sursa
de
energie Sursa
de
fosfor
Energie în
material
organic ă Energie în
fosfor
Produc ător Consumator Ie șire fosfor
din
ecosistem
Energie
neutilizat ă
600 Energie
pierdut ă
5400 Reciclare
0,1 0,01
0,01
54,0
54,0 0,01
200,0 0,2
54,0 6000
23/124
2.1. Modelul dinamic NETPROD
Modelul NETPROD ilustreaz ă conceptul de produc ție net ă, ca
diferen ță dintre produc ția total ă și consum .
2.1.1. Exemple
Ilustrarea conceptului de produc ție net ă poate fi realizat ă într-un sistem
cu o surs ă permanent ă de energie ( S), o unitate de produc ție ( P), una de
stocare a produsului creat ( Q) și una de consum ( C) ( Fig.20 ).
În procesul de fotosintez ă plantele produc materie organic ă (P) care
se acumuleaz ă într-un deposit (Q). Din materia organic ă produs ă (P) o parte
este consumat ă (C) de plante și animale. Diferen ța dintre produc ția total ă (P)
și consum (C) constituie produc ția net ă (P-C).
Produc ția P este propor țional ă cu energia solar ă care este variabil ă în
func ție de sezon, iar consumul este propor țional cu cantitatea de materie
organic ă produs ă și stocat ă (Q). Fig.20 . Modelul NETPROD. Sursa
S Stocare
Q
P C Consum
Produc ți
e
SKP *1=
Q KC *2=
24/124
Procese similare de produc ție se desf ăș oar ă în
orice ecosisteme: lacuri , exploat ări forestiere , bazine
hidrografice etc. Pentru fiecare din aceste ecosisteme pot
fi trasate cu claritate diagramele care reprezint ă produc ția
și consumul din a c ăror diferen ța rezult ă produc ția net ă.
2.1.2. Ecua țiile modelului
Ecua țiile modelului sunt de tip linear și sunt construite pe principiul
propor ționalit ății dintre surs ă, stocare și consum. Coeficien ții de
propor ționalitate se ob țin pe baza m ăsur ătorilor șî prin calarea unor modele
analitice simple, în caul acesta fiind ales modelul linear.
• Produc ția: SKP *1=
• Consumul: Q KC *2=
• Productia net ă pe un interval de timp: CP DQ −=
• Cantitatea stocat ă la un moment dat: DQ QQ +=
2.1.3. Aplica ție
Aplica ția numeric ă este construit ă pe un proces de produc ție sezonier
care ține seama de varia ția ciclic ă a energiei solare, energie care este sursa
continu ă pentru procesul de produc ție al materiei organice stocate în interiorul
sistemului.
Modelul de calcul se poate realiza într-un spreeds heet de tip excel și
poate fi ilustrat cu varia ția parametrilor de intrare și ie șire în func ție de tip:
• S=f(T)
• P=f(T)
• C=f(T)
• P-C=f(T)
K_unu K_doi
25/124
2000 3500 4500 3500 0.0225 0.09 200
T[an]
(N) S1 S2 S3 S4 (S) (P) ( C ) (DQ) Q P-C
0,00 0 200.00
0.25 1 2000 0 0 0 2000 45.00 18.00 27.00 227.00 27.00
0.5 2 0 3500 0 0 3500 78.75 20.43 58.32 285.32 58.32
0.75 3 0 0 4500 0 4500 101.25 25.68 75.57 360.89 75.57
1 4 0 0 0 3500 3500 78.75 32.48 46.27 407.16 46.27
1.25 1 2000 0 0 0 2000 45.00 36.64 8.36 415.52 8.36
1.5 2 0 3500 0 0 3500 78.75 37.40 41.35 456.87 41.35
1.75 3 0 0 4500 0 4500 101.25 41.12 60.13 517.00 60.13
Model NETPROD
-100.00 0.00 100.00 200.00 300.00 400.00 500.00 600.00 700.00 800.00 900.00
0 2 4 6 8 10
T [an] Q/P/C P(productia primara)
Q(biomasa)
P-C (productia neta) M o d el N ET PR O D
1500 2000 2500 3000 3500 4000 4500 5000
0 1 2 3 4 5 6 7 8 9 10 T i m p [ a n ]
26/124
2.2. Modelul dinamic RENEW
Modelul RENEW are o unitate autocatalitic ă bazat ă pe un flux de
energie limitat ă, din afar ă, care limiteaz ă cre șterea cantit ății de materie
organic ă stocat ă, la un regim sta ționar.
2.2.1. Exemple
Modelul poate fi realizat într-un sistem cu o unit ate de produc ție și una
de stocare, sistem în care avem o surs ă exterioar ă de energie și pierdere de
energie pe dou ă c ăi ( Fig.21 ).
Un astfel de sistem este o p ădure în cre ștere, care creeaz ă biomas ă
(frunze, trunchiuri, r ădăcini, animale, bacterii) pe baza energiei solare
regenerabil ă dar limitat ă.
În acest proces de cre ștere, la un moment dat, atunci c ănd cantitatea
de biomas ă creat ă este în echilibru cu cea descompus ă, se intr ă într-o stare
de echilibru.
Fig.21 . Modelul RENEW. Sursa
limitat ă
de
energie Stocare
Q
*
Produc ție QR K **3
QRK **1QRK **0QR K **4
QRK **2
27/124
2.2.2. Ecua țiile modelului
Nota țiile utilzate pentru scrierea ecua țiilor sunt:
Q: biomasa
J: afluxul de energie în siti ție de echilibru (stare sta ționar ă)
Ko*R*Q: energia utilizat ă pentru producerea de biomas ă ;
R: energia r ămas ă disponobil ă pentru utilizare în contunuare
• QR KJR ∗∗ −=0 din care rezult ă QKJR∗ +=
0 1
DQ: schimbarea de biomas ă din p ădure la fiecare itera ție
• Q K Q R K DQ *4 3 − ∗ ∗ =
cu care se poate estima cantitatea de biomas ă dup ă fiecare itera ție:
• DT DQ Q Q * + =
DT-modificarea de timp de la o itera ție la alta.
2.2.3 Aplica ție
Valorile utilizate pentru
aplica ție sunt sintetizate în tabel, iar
pentru reprezentarea grafic ă a
varia ției biomasei stocate (Q) sunt
calculate valorile acesteia pentru o
perioad ă de 200 unit ăți de timp.
J 45 K_3 0.008 T_0 1
Q 0.1 K_4 0.03 Q_0 1
Ko 0.1 DT 1
T R DQ Q
0 "-" "-" 0.1
1 44.55446 0.032644 0.132644
2 44.41092 0.043147 0.175791
Model RENEW
020 40 60 80 100 120
0 100 200
T ( t i m p u l )
28/124
2.3. Modelul dinamic SLOWRENEW
Modelul SLOWRENEW are ca obiectiv evaluarea cantita ții ded
biomas ă creat ă în condi țiile existen ței unei surse de energie limitat ă si dou ă
depozite de stocare interne.
2.3.1. Exemple
Multe procese biologice, geologice și economice au incluse un stocaj
intermediar pentru energia provenit ă dintr-o surs ă limitat ă (Fig.22).
Modelul SLOWRENEW este o bun ă reprezentare și pentru pentru
modul în care se procedeaz ă cu resursele energetice în economia mondial ă,
mare consumatoare de energie. În lume exist ă depozte mari de carbine,
petrol, minereuri, ap ă, utilizate pentru realizarea diverselor produse, R eglarea
consumului este legat ă de ncesitatea produselor și de resursele disponibile,
resurse energetice și materiale.
Fig.22 . Modelul SLOWRENEW. Sursa
limitat ă
de
energie Stocare
Q
*
Produc ție QE K **0QE K **1
E K*4 Q K*3 E
Stocare
intermediar ă
J
29/124
2.3.2. Ecua țiile modelului
Afluxul J de energie din exteriorul sistemului este într-o p rim ă etap ă
stocat într-un rezervor ( E) de unde este folosit pentru dezvoltarea unui proc es
autocatalitic care acumuleaz ă produsul într-un al doilea deposit ( Q).
Ecua țiile modelului :
• QE KE KJ DE ** *0 4 − −=
• QKQEK DQ * **3 1 − =
J : afluxul din exterior
E: primul depozit de energie din sistem
DE: modificarea de energie din depozitul intern:
Q: stocarea de biomas ă creat ă, al doilea depozit din interiorul ecosistemului
2.3.3. Aplica ție
J 2 K1 0.001 DT 4
E 159 K3 0.03 Q 3
KO 0.001 K4 0.01
T DE DQ E Q
159 3
1 -0.067 0.387 158.732 4.548
5 –
0.30923 0.585473 157.4951 6.889893
Model SLOWRENEW
020 40 60 80 100 120 140 160 180
0 100 200 300 400
T (tim pul) E(Energia), Q(biomasa) Rezerva de
energie
Biomasa
stocata
30/124
31/124
2.4. Modelul dinamic EXCLUS
Model EXCLUS con ține dou ă cicluri concurente alimentate de aceea și
surs ă de energie.
2.4.1. Exemple
Modelul poate fi aplicat în orice ecosistem unde e xist ă dou ă sau mai
multe specii care se hr ănesc dintr-o surs ă limitat ă de hran ă. Dac ă una dintre
specii este mai puternic ă și mananc ă mai mult decât cealalt ă, atunci cea
slab ă moare din lips ăde hran ă.
Sursa de
energie
limitata
* Q2 * Q1 2
1K
6K 2K 3K
5K 4K
R
Fig.23. Modelul EXCLUS
32/124
2.4.2. Ecua țiilemodelului
Ecua țiile modelului descriu cele trei componente princip ale:
• Energia disponibil ă: 2 2 1 1 ** ** QR K QR KIR − −=
I- energia disponibil ă ini țial;
• Cre șterea popula ției Q1 într-un interval de timp DT:
1 3 1 5 1 * ** Q K QR K DQ − =
• Cre șterea popula ției Q2 într-un interval de timp DT:
2 4 2 6 2 * ** Q K QR K DQ − =
2.4.3. Aplica ție numeric ă
I 5 Q1 20
DT 0.3 Q2 20
K1 0.08 K2 0.01
K3 0.05 K4 0.05
K5 9.000001E- 02 K6 0.05
T R DQ1 DQ2 Q1 Q2
0.00 20.00 20.00
0.30 1.79 2.21 0.79 20.66 20.24
0.60 1.75 2.22 0.76 21.33 20.46
0.90 1.72 2.23 0.73 22.00 20.68
Dependenta Q1-Q2
0.00 5.00 10.00 15.00 20.00 25.00 30.00
0.00 20.00 40.00 60.00 80.00 100.00 120.00
Q1 Q2 Mode EXCLUS
0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00 90.00 100.00
0.00 50.00 100.00 150.00
Timp Q1, Q2 Q1
Q2
33/124
2.5. Modelul dinamic INTERACT
Modelul INTERACT este reprezentat ă competi ția dintre dou ă popula ții Q1 și
Q2. Fiecare popula ție are propriul ciclu autocatalitic, și au la dispozi ție o surs ă
nelimitat ă de hran ă E, constant ă. Sunt posibile dou ă variante:
• lipsa interac țiunii care determin ă o cre șterea a ambelor popula țiil
pân ă la o valoarea maxim ă la care se stabilizeaz ă.
• interac țiunea negativ ă (concuren ța) una din popula ții se dezvolta și
ajunge în regim stabilizat în timp ce cealalt ă popula ție dispare la un
moment dat din lipsa de resurse, consumate de popul a ția concurent ă.
2.5.1. Exemple
2.5.2. Ecua țiile modelului
Ecua țiile modelului INTERACT exprim ă a doua variant ă, a interac țiunii
concuren țiale:
• Energia disponibil ă: E-constant ă;
• Cre șterea popula ției 1 într-un interval de timp DT:
2 1 5 1 3 1 1 1 ** 1** ** QQ K QQ K QE K DQ − − =
• Cre șterea popula ției 2 într-un interval de timp DT:
2 1 6 2 2 4 2 2 2 ** * * ** QQ K Q Q K QE K DQ − − =
2.5.3. Aplica ție
E 1K1 0.07 K4 0.001
Q1 3K2 0.08 K5 0.002
Q2 3K3 0.002 K6 0.001
DT 1
T DQ1 DQ2 Q1 Q2
0.000 3.000 3.000
1.000 0.174 0.222 3.174 3.222
2.000 0.182 0.237 3.356 3.459
3.000 0.189 0.253 3.545 3.712 M od el IN TER AC T
010 20 30 40 50 60 70 80 90
0 50 100 150 200 250 300 350 400 450
TQ1
Q2
34/124
35/124
2.6. Modelul dinamic COOP
Cooperare mutual ă între cele dou ă popula ții care se dezvolt ăpe
aceea și surs ă limitat ă de hran ă.
2.6.1. Exemple
2.6.2. Ecua țiile modelului
Ecua țiile modelului sunt:
• Sursa in țial ă de energie: I
• Energia disponibil ă dup ă un pas DT:
2 1 2 2 1 1 ** * * 1 QQ K Q QKIR
+ +=
• Cre șterea popula ție 1: 2 1 7 1 3 2 1 5 1 *** * *** QQR K Q K QQR K DQ − − =
• Cre șterea popula ție 2: 2 1 8 2 4 2 1 6 2 *** * *** QQR K Q K QQR K DQ − − =
2.6.3. Aplica ție
I 10 K1 0.08 K5 0.09
Q1 8 K2 0.04 K6 0.05
Q2 8 K3 0.05 K7 0.002
DT 1 K4 0.05 K8 0.002
T R_1 R2 DQ1 DQ2 Q1 Q2
1 8 8
2 1.79 1.79 9.77 5.19 17.77 13.19
3 0.54 0.54 10.11 5.24 27.88 18.44
4 0.25 0.25 9.23 4.52 37.11 22.96
Model COOP
0.00 20.00 40.00 60.00 80.00 100.00 120.00 140.00
0 100 200 300 400
TQ1, Q2 Q1
Q2
36/124
37/124
2.7. Modelul dinamic DESTRUCT
Modelul DESTRUCT ilustreaz ă o proprietate important ă a unui
ecosistem care se manifest ă atunci c ănd un produs (A) este în exces.
Este vorba de utilizarea unei cantit ăti de energie care conduce la
distrugerea produsului A și în felul acesta este pus din nou la dispozi ția
sistemului materialul M utilizat la crearea produsu lui A.
Acest proces de dispersie și deterioare reduce cantitatea de
produs (ordinea), recicleaz ă materia (dezordine).
Cantitatea de energie necesar ă deprecierii produsului A, utilizat ă în
sensul cre șterii dezordinii în sistem, este mult mai mic ă decât cea necesar ă
creerii produsului A, adic ă cre șterea ordinii din sistem.
2.7.1. Exemple
Uraganele și incendiile care distrug copacii din p ădure și recicleaz ă
materia pentru alt ciclu de cre ștere.
În ecosisteme, bolile distrug popula țiile care sunt ptost adaptate
condi țiilor noi create.
2.7.2. Ecua țiile modelului
Ecua țiile modelului exprim ă cantitativ energia valabil ă, materia
disponibil ă și cantitatea de produs creat ă:
• Energia valabil ă: M KIR* 10+=
• Materialul disponibil: AF M Mt *− = ;
F-frac ția din materialul total disponibil utilizat pentru crearea produsului A
• Cantitatea de produs A creat ă:
DA KXA KAMR K DA ** * * ***3 2 1 − − =
X-energie utilizat ă pentru distrugerea produsului A și eliberarea materialului
M.
D- energia disponibil ă pentru distrugerea produsului A
38/124
2.7.3. Aplica ție
I 4 A 1 AO 3
F 0.2 DT 0.5 K1 0.001
D 1 TO 1 K2 0.01
MT 100 MO 3 K3 0.02
KO 0.0009
T X R DA A M
1 3 3
1.5 0 3.96786 0.035711 3.017855 99.4
2 0 3.149662 0.944819 3.490265 99.39643
Model DESTRUCT
0100 200 300 400 500
0 50 100 150 200 250
TM, A A
MPuls
39/124
3. Modele cantitative statistice
Modelele cantitative statistice exprim ă interdepende țele dintre
componentele ecosistemelor și sunt construite pe baza prelucr ării unui mare
num ăr de m ăsur ători experimentale realizate pe parcursul unui prog ram
complex de monitorizare.
Elaborarea modelelor statistice se realizeaz ă în trei etape principale:
/square4 Cuantificarea intensit ății corela țiilor de diferite tipuri
prin intermediul coeficien ților de corela ție, coeficien ți
diferen ția ți în func ție de tipul variabilelor factoriale și al
variabilelor independente (x,y, t);
/square4 Factorizarea corela țiilor care are ca scop ierarhizarea și
selectarea corela țiilor reprezentative din punct de vedere
statistic.
/square4 Modelarea matematic ă a corela țiilor de diferite tipuri.
Modelele statistice au un domeniu de aplicare restrans la spa țiul și
intervalul de timp în care s-a realizat programul de monitorizare pe baza
căruia s-au ob ținut datele necesare elabor ării acestora.
3.1. Cuantificarea intensit ății corela țiilor
Utilizarea termenului corela ție în ecologie are o semnificatie mult mai
largã decât cea matematicã. În sens statistic, core la ția reprezintã un anumit
grad de legãturã evaluat prin diferite tehnici mat ematice, fiecare caracter fiind
tratat ca o variabilã aleatoare. Ansamblul caracter elor studiate formeazã o
variabilã aleatoare cu mai multe componente iar ipo teza normalitãtii acestei
variabile în spatiul multidimensional este la baza tehnicilor de evaluare a
intensitãtii corela ției. In ecologie o mare parte a cercetãrii este con sacratã
identificãrii relatiilor dintre caracteristicile m ãsurabile.
40/124
Natura corela țiilor în ecologie este determinatã de structura fiz ico-
chimicã și bilogic ă a “obiectelor” de studiu care este constituitã din tr-un
ansamblu de variabile care formeaz ă biotopul și biocenoza. De aici rezultã
natura substantialã a corela țiilor care se realizeazã pe baza compozitiei
fizice, chimice, pe baza speciilor sau a calitãtii fizico-chimice a câmpurilor
terestre (magnetic, gravimetric etc).
Ecologia se ocupã, de asemenea, cu analiza procesel or ce se
desfãsoarã în timp și spa țiu ; în acest fel se completeazã spectrul naturii
corela țiilor ecologice cu trei componente principale:
• corela ții substantiale;
• corela ții temporale.
• corela ții spa țio-temporale sau topo-probabiliste;
Cercetarea corela țiilor poate fi realizatã cu instrumente diferite în
functie de dimensiunea și natura fenomenelor studiate. În literatura existã încã
o mare confuzie în terminologia utilizatã pentru in strumentele cu ajutorul
cărora evalu ăm intensitatea legãturilor/corela țiilor dintre caracteristicile
ecologice.
Vom adopta în continuare pentru instrumentele de cu antificare a
intensitãtii corela țiilor substan țiale dintre douã variabile urm ătoarele
categorii:
• coeficient de corela ție utilizat pentru variabile cantitative
(numerice) și adaptabil, în anumite circumstan țe, pentru
variabile calitative (alfanumerice);
• coeficient de corela ție a rangurilor utiliza ți pentru
variabile ordonabile (numerice/alfanumerice);
• coeficie de asociere utiliza ți pentru variabile calitative
(alfanumerice)
Cuantificarea corela țiilor temporale se bazeaz ă pe o formalizare
particular ă a serilor de timp șî se exprim ă prin:
• coeficien ți de autocorela ție
• coeficien ți de intercorela ție
Cuantificarea corela țiilor spa țio-temporale presupune o prelucrare
complex ă și un volum mare de date cu o structur ă spa țial ă și temporal ă
41/124
complex ă. Metodologia de evaluare a acestor corela ții este de o deosebit ă
complexitate constituind o direc ție special ă ( Scr ădeanu, D., 2003,
Geostatistic ă aplicat ă).
3.1.1.Coeficien ții de corela ție
Aceastã categorie de coeficien ți este definitã pentru cuantificarea
intensitãtii legãturii dintre caracteristicile ecol ogice cantitative dar pot fi
adaptati și pentru studiul caracteristicilor calitative.
Caracteristica lor comunã este adimensionalitatea și domeniul valoric
restrâns ( []1 ; 1− sau []1 ; 0). Valorile extreme indicã o intensitate maximã sau
minimã a intensitãtii corela ției.
a) Raportul de corela ție
Raportul de corela ție permite evaluarea intensitãtii și sensului corela ției
dintre douã variabile geologice ()xy, independent de modelul de corela ție.
Raportul de corela ție realizeazã aceastã evaluare prin intermediul gra dului de
împrã știere al valorilor iy mãsurate în jurul mediilor condi ționate xi y.
Analizând intensitatea dependen ței variabilei y (rezultative) în raport
de variabila x (factorialã), dispersia acesteia poate fi exprimat ã sub forma:
( )2
02 2
y xy y s s s + =
(III.169)
în care
2
ys – dispersia totalã a variabilei y în raport cu toti factorii cunoscuti sau
necunoscuti;
( )2
xys – dispersia condi ționatã a variabilei y în raport cu variabila x;
42/124
2
0ys – dispersia rezidualã a variabilei y în raport cu celelalte variabile care-i
condi ționeazã variabilitatea și care nu sunt specificate în model.
Separarea dispersiei totale în cele douã component e necesitã
gruparea datelor
într-un tabel de corela ție a cãrui configuratie este condi ționatã de sensul
corela ției. Pentru evaluarea gradului de dependentã al var iabilei y în raport
cu variabila x, tabelul de corela ție (Tabelul III.19) contine:
yxi m – mediile variabilei y pentru fiecare interval ix;
xi n – frecventele marginale ale valorilor iy pentru fiecare interval ix;
în timp ce tabelul de corela ție al variabilei x în raport cu y ( ()yfx= ) (Tabelul
III.20):
xyi m – mediile variabilei x pentru fiecare interval iy;
yi n – frecventele marginale ale variabilei ix pentru fiecare interval iy.
Tabelul III.19 Corela ție ()xfy= Tabelul III.20 Corela ție ()yfx=
x y- var.
dependentã xi n yxi m y x- var.
dependentã yi n xyi m
1x
2x
.
.
.
kx 11 12 11 ,…, ,ny yy
22 22 21 ,…, ,ny yy
.
.
.
knk k k y yy ,…, ,2 1 1xn
2xn
.
.
.
xk n 1yx m
2yx m
.
.
.
yxk m 1y
2y
.
.
.
ky 11 12 11 ,…, ,nx xx
22 22 21 ,…, ,nx xx
.
.
.
knk k k x xx ,…, ,2 1 1yn
2yn
.
.
.
yk n 1xy m
2xy m
.
.
.
xyk m
Dispersiile 2
ys și ( )2
xys se evalueazã cu rela țiile:
( )
112
2
−−
=∑=
kmy
sk
i y i
y
(III.170)
43/124
( )( )
112
2
−−
=∑=
km mn
sk
i y yxi xi
xy
(III.171)
pentru analiza intensitã ții corela ției ()xfy= , iar dispersiile 2
xs și ( )2
yxs cu
rela țiile:
( )
112
2
−−
=∑=
kmx
sk
i x i
x
(III.172)
( )( )
112
2
−−
=∑=
km mn
sk
i x xyi yi
yx
(III.173)
pentru analiza intensitã ții corela ției ()yfx= .
Intensitatea corela ției dintre cele douã variabile se mãsoarã cu ajutor ul
raportului dintre dispersia ( ( )xys sau ( )yxs) și dispersia totalã ( ys2 sau xs2).
Pentru exprimarea cantitativã a acestei corela ții se defineste raportul de
corela ție cu:
( )( )
22
yxy
xyss= η
(III.174)
( )( )
22
xyx
yxss= η
(III.175)
Valoarea maximã a raportului de corela ție este 1 și exprimã o corela ție
maximã între cele douã variabile, iar lipsa de core la ție dintre cele douã
variabile corespondente valorii zero, valoarea mini mã a raportului de corela ție.
44/124
În analiza corela ției dintre douã variabile geologice, nu întotdeauna
este evident care din variabile este rezultativã și care este factorialã, motiv
pentru care este necesar sã se determine valoarea r aportului de corela ție în
ambele variante (III.174) și (III.175). Analiza ambelor valori poate conduce l a
urmãtoarele variante extreme de interpretare:
a) variabila y este dependentã de x iar x este independentã;
( )1=xyη și ( )0=yxη
(III.176)
b) variabila x este dependentã de y iar y este independentã;
( )0=xyη și ( )1=yxη
(III.177)
c) variabilele x și y sunt independente;
( )0=xyη și ( )0=yxη
(III.178)
d) variabilele x și y se intercondi ționeazã sau ambele sunt
condi ționate de o a treia variabilã neidentificatã:
( )1=xyη și ( )1=yxη
(III.179)
În practica analizei corela țiilor dintre variabilele geologice, raportul de
corela ție ia valori cuprinse între 0 și 1 iar semnificatia lor statisticã se poate
testa cu ajutorul factorului F pe baza inegalitãtii:
( )2 1 22
exp ;,1 1νναηηFkknF >−−×−=
(III.180)
în care 11 −=k ν , kn−=2ν (n= perechi de valori, k= numãr de intervale de
grupare, α= nivelul de semnifica ție al testului).
Verificarea inegalitãtii (III.180) indicã o valoar e semnificativã statistic a
raportului de corela ție, deci existenta unei corela ții între variabilele analizate.
45/124
b) Coeficientul corela ției lineare
Coeficientul corela ției lineare este cel mai des întâlnit în cercetarea
geologicã a corela țiilor și din nefericire este utilizat în general fãrã abso lut nici
o precautie legatã de caracteristicile statistice a le variabilelor implicate.
Definit pentru douã variabile cu reparti ție normalã ( yx,), coeficientul
corela ției lineare (= coef. lui PEARSON = coeficientul cor ela ției totale) este
definit cu rela ția:
( )( )
( ) ( )∑∑∑
− −− −
=
==
n
i y in
i x in
i y i x i
xy
my mxmymx
r
2
121
(III.181)
Valorile coeficientului de corela ție linearã sunt cuprinse între 1− și 1 iar
dacã x și y sunt independente, 0=xy r .
Abaterea de la repartitia normalã a variabilelor x și y antreneazã
modificãri ale interpretãrii valorilor coeficientul ui de corela ție linearã. Valoarea
minimã a coeficientului Pearson ( 0=xy r ) nu este un indicator al independentei
celor douã caracteristici, ci numai de necorelare l iniarã a lor. Acestea pot fi
corelate printr-o relatie functionalã de tip parabo lic, logaritmic etc.
Pentru interpretarea valorilor nenule ale coeficie n ților de corela ție, o
explicare graficã este mult mai sugestivã pentru ce i neacomodati cu statistica
matematicã. Valoarea coeficientului de corela ție linearã este în dependen țã
directã cu distribu ția perechilor de valori ( i iyx,) într-un sistem rectangular de
referintã XOY . Corespunzãtor configuratiei geometrice a distribu tiei
punctelor, se disting urmãtoarele cazuri:
a) alinierea perfectã a punctelor de-a lungul unei drepte – fie
ascendentã ( 1=xy r ; Fig. 58a), fie descendentã ( 1−=xy r ; Fig. 58b) – care
indicã o dependen țã linearã perfectã între cele douã variabile. O ast fel de
situa ție este foarte rar întâlnitã în studiul unor relati i functionale între douã
caracteristici geologice;
46/124
b) punctele sunt dispersate aleator, norul de punc te neavând nici o
orientare preferentialã (Fig. 58c). În circumstan țele amintite anterior, cele
douã variabile sunt independente sau necorelate ( 0=xy r );
c) configura ția tranzitorie între cele douã extreme, în care nor ul de
puncte are o orientare preferen țialã corespunzãtoare valorilor lui xy r
apar ținând intervalului []1 , 1− (Fig. 58d).
O analizã mai detaliatã a coeficientului de corela ție linearã este reluatã
la analiza modelului liniar de o singurã variabilã independentã .
Valorile coeficientului de corela ție linearã, în cazul în care repartitia
celor douã variabile se abate de la cea normalã, nu mai exprimã în mod
obligatoriu intensitatea corela ției lineare între cele douã variabile x și y. În
cazul frecvent al repartitiilor
lognormale, pentru calculul
coeficientului de corela ție linearã se
opereazã cu valorile logaritmate ale
caracteristicilor analizate.
c) Coeficientul cosinus θ
Coeficientul cosinus θ este o 1F
1x
2x 1A
2A
1y 2y 1θ
2θ θ
2F
Fig. 59 Coeficientul cosinus θ
pentru un spa țiu bidimensional x y
1≈r y
x
1−≈r x y
0=r 1 0 <<r x y a b c d
Fig. 58 Semnifica ția geometricã a coeficientului Pearson
47/124
mãsurã a distantei unghiulare, utilizat pentru esti marea similaritãtii între
obiecte geologice de studiu (ex.: aflorimente, zãcã minte, bazine de
sedimentare, acvifere etc), reprezentate în spatiul variabilelor mãsurabile (ex.:
compozitie chimicã, compozitie granulometricã, para metri hidrogeologici etc).
Estimarea lui implicã ortogonalitatea axelor sistem ului de referintã, motiv
pentru care este preferat în analiza factorialã Q – MOD.
Într-un spatiu bidimensional definirea coeficientu lui cosinus θ se
bazeazã pe relatiile trigonometrice elementare ale cosinusului unghiului unei
diferente de unghiuri (Fig.59):
( )( )( )2
22
22
12
12 2 1 1
2 1 cos cos
21y xy xyxyx
AA+ +×+×= − = θθ θ (III.183)
Generalizând pentru n dimensiuni ( n factori independenti nF FF ,…, ,2 1 ,
spre exemplu n aflorimente probate în cazul analizei Q-MOD) se ob ține
formula:
∑∑∑
= ===
k
i ik
i ik
i ii
AA
y xyx
12
121
21cos θ
(III.183)
Acest coeficient de corela ție indicã o similaritate completã între douã
obiecte geologice 1A și 2A pentru 1 cos =θ și o disimilaritate totalã pentru
0 cos =θ (corespunzãtor unui unghi o90 =θ echivalent cu ortogonalitatea
vectorilor de pozi ție).
d) Coeficientul distantei taxonomice
Ca mãsurã a similaritãtii între douã obiecte geolo gice, coeficientul
distantei taxonomice î și are originea în modelul geometric al distantei
euclidiene între douã puncte A și B într-un spatiu n-dimensional. Distanta
taxonomicã între cele douã obiecte geologice este i nvers proportionalã cu
48/124
similaritatea, n fiind numãrul de caracteristici proprii celor douã obiecte
geologice studiate.
În cazul distan ței taxonomice dintre douã e șantioane A și B
reprezentate prin douã caracteristici 1x și 2x (Fig.60) formula de calcul este:
( ) ( )2
2 22
1 1 B A B A AB x x x x D − + − = (III.184)
în care:
Ax1 – caracteristica 1x determinatã în e șantionul A (ex.: con ținutul în
zinc);
Bx1 – caracteristica 1x determinatã în e șantionul B;
Ax2 – caracteristica 2x
determinatã în e șantionul A
(exemplu: con ținutul în plumb);
Bx2 – caracteristica 2x
determinatã în e șantionul B.
Dacã pentru cele douã
obiecte geologice (A și B) se
determinã mai multe caracteristici
(nx xx ,…, ,2 1 ) se utilizeazã o
generalizare a distan ței
taxonomice:
( )∑=− =n
i iB iA AB X X D12 (III.185)
Cre șterea numãrului de caracteristici utilizate reduce posibilitatea
interpretãrii valorii distantei taxometrice în comp aratie cu a altor coeficien ți de
corela ție datoritã diversitãtii unitãtilor de mãsurã și a amplitudinilor de selectie.
Eliminarea acestor inconveniente se realizeazã prin standardizarea valorilor 1x
Ax1
Bx1 A
B
Ax2 2x Bx2
Fig. 60 Distan ța taxonomicã în spa țiu
bidimensional
49/124
caracteristicilor mãsurate, normarea lor pe interva lul []1 , 0 și definirea
coeficientului distan ței taxonomice:
( )∑
=− −=n
iiB iA AB XS XS nd
12 11 (III.186)
în care:
iA XS – valoarea standardizatã și normatã a caracteristicii "i" din e șantionul A;
iB XS – valoarea standardizatã și normatã a caracteristicii "i" din e șantionul B.
În aceste condi ții, valorile extreme ale coeficientului de distan țã sunt:
zero, când cele douã esantioane sunt identice, deci similaritatea este maximã
și unu, când cele douã e șantioane A și B sunt total diferite.
e) Coeficientul corela ției binare
Coeficientul corela ției binare ( Dr) a fost propus de Derec, Sarcia și
Troly (1964) pentru cercetãri metalogenetice și este definit prin rela ția:
( )( ) bnanab ab ne rab
D− −−=
(III.188)
în care:
n – numãrul total de cazuri
analizate (Fig. 61);
a – numãrul de cazuri analizate
care prezintã caracteristica A;
b – numãrul de cazuri analizate care prezintã caract eristica B;
ab e – numãrul de cazuri analizate care prezintã ambele caracteristici A
și B, a cãror corela ție se analizeazã. ab e b a n
Fig. 61 Rela ția dintre elementele
coeficientului de corela ție binarã
50/124
Coeficientul de corela ție binarã este o mãsurã a intensitatii legãturii
între caracteristicile A și B. Cu cât coeficientul Dr este mai mare (valori
pozitive) legãtura este mai puternicã. Valorile neg ative indicã o "respingere" a
caracteristicilor, iar valoarea nulã o independen țã totalã.
Interpretarea naturalistã a valorilor lui Dr permite ierarhizarea
corela țiilor într-un sistem multivariat pe baza coeficien ților corela ției binare
calculati pentru toate perechile de caracteristici mãsurabile. Asamblate într-o
matrice de similaritate, toate valorile coeficientu lui de corela ție pot forma o
imagine sinteticã a ierarhiilor corela ționale din sistemul studiat. În tabelul III.21
este prezentatã configuratia unei astfel de matrici ce va constitui obiectul unor
prelucrãri ulterioare în scopul factorizãrii corela ționale.
Tabelul III.21 Matricea coeficien ților Dr pentru mineralele caracteristice ale
pegmatitelor cu beril din Madagascar și Mozambic (dupã P. Lafitte, 1972)
1 2 3 4 5 6 7 8 9 10 11
1 1 0.31 0.34 -0.16 0.18 0.31 0.17 0.18 -0.06 -0.57 0.26
2 0.31 1 -0.17 -0.46 0.13 0.1 0.05 0.13 0.13 -0.55 -0.19
3 0.34 -0.17 1 -0.16 0.18 -0.28 -0.31 -0.06 0.18 0.01 0.26
4 -0.16 -0.46 -0.16 1 0 0.14 -0.11 0.29 0 0.14 0.15
5 0.18 0.13 0.18 0 1 -0.14 -0.13 -0.07 -0.33 0.08 0.24
6 0.31 0.1 -0.28 0.14 -0.24 1 0.55 0.08 0.08 -0.18 0.06
7 0.17 0.05 -0.31 -0.11 -0.13 0.55 1 -0.13 -0.13 -0.1 -0.29
8 0.18 0.13 -0.06 0.29 -0.07 0.08 -0.13 1 0.73 -0.24 0
9 -0.06 0.13 0.18 0 -0.33 0.08 -0.13 0.73 1 -0.24 0
10 -0.57 -0.55 0.01 0.14 0.08 -0.18 -0.1 -0.24 -0.24 1 -0.23
11 0.26 -0.19 0.26 0.15 0.24 0.06 -0.28 0 0 -0.23 1
1 – minereuri de Nb și Ta; 2 – micã litinifierã; 3 – amfibolit și spodumen; 4 – fosfati de Mn
și Fe; 5 – minerale de Bi; 6 – casiterit și wolframit; 7 – molibdenit; 8 – minerale de U; 9 –
pãmânturi rare; 10 – minerale de Cs; 11 – granat.
51/124
3.1.2. Coeficien ții de corela ție a rangurilor
Ordonarea valorilor unei caracteristici geologice într-o succesiune
ascendentã sau descendentã este realizabilã atât pe ntru caracteristicile
cantitative cât și pentru cele calitative. Operatiune extrem de ieft inã din punct
de vedere al prelucrãrii, ordonarea asociazã fiecãr ei valori a caracteristicii
studiate un numãr natural, cunoscut sub denumirea d e rang.
Analiza corela ției rangurilor este o tehnicã neparametricã pentru studiul
legãturilor dintre variabilele geologice care nu ti ne seama de diferenta dintre
valorile numerice ale proprietãtilor, ci numai de o rdinea lor.
Coeficien ții definiti pentru cuantificarea intensitãtii corel a ției rangurilor
au valori cuprinse în intervalul []1 , 1− și permit analiza corela țiilor pentru douã
sau mai multe variabile. Ei pot fi utilizati cu deo sebit succes pentru corelarea
secventelor sedimentare investigate prin carotaj ge ologic complex în structuri
sedimentare cu numeroase alternan țe litologice pe unitatea de adâncime.
a) Coeficientul lui Spearman
Coeficientul lui Spearman ( SP ρ) este definit pe baza coeficientului
corela ției lineare al lui Pearson între douã variabile 2 1,vv și are formula:
( ) 16
1212
−−=∑=
nndn
i i
SP ρ (III.189)
în care:
n – numãrul de perechi de valori ordonate crescãtor;
id – diferenta rangurilor celor douã variabile :
=idrang −ixrang iy
rang ix – rangul valorii ix în sistemul ordonat crescãtor;
rang iy – rangul valorii iy în sistemul ordonat crescãtor.
52/124
Aplicatie. Analiza corela ției între valoarea economicã a unei roci și indicele ei
de duritate pe baza valorilor din tabelul III.22 co nduce la o valoare a
coeficientului lui Spearman:
( )9 , 01 100 10 150 61 =− ⋅⋅−=SP ρ
Valorile SP ρ sunr cuprinse în intervalul []1 , 1− iar interpretarea este
similarã cu a coeficientului lui Pearson din care e ste dedus. Pentru aplica ția
precedentã se poate concluziona pe baza valorii 9 , 0=SP ρ cã existã o bunã
concordan țã între valoarea economicã a rocii și tãria ei rezultatã dintr-un
ansamblu de proprietã ți elementare (compozi ție mineralogicã, structurã,
texturã etc.).
Tabelul III.22 Calculul coeficientului lui Spearma n
Nr.
crt. Proba Rangul id 2
id
Valoare
economicã Tãrie
1 P1 10 5 5 25
2 P2 2 3 -1 1
3 P3 3 1 2 4
4 P4 1 10 -9 81
5 P5 5 8 -3 9
6 P6 4 2 2 4
7 P7 6 9 -3 9
8 P8 7 4 3 9
9 P9 8 6 2 4
10 P10 9 7 2 4
53/124
b) Coeficientul lui Kendall
Coeficientul lui Kendall ( kτ) are acelea și proprietã ți cu coeficientul
Spearman, fiind egal cu zero când cele douã variabi le analizate sunt
independente și cu +1 și -1 când dependen ța dintre cele douã variabile este
maximã, pozitivã sau negativã.
Rela ția de definitie este:
( )12
−=nnS
kτ
(III.190)
în care:
n – numãrul de perechi de valori ordonate;
S – suma concordantelor posibile, calculate prin con semnarea cu +1 a
"consensului" și cu -1 a varia ției inverse.
Aplicatie. Pentru o serie de 5=n perechi de valori [densitate ( ρ), coeziune
(c)] (Tabelul III.23a), succesiunea opera țiunilor necesare calculului
coeficientului kτ este:
Tabelul III.23 Elementele de calcul pentru coeficie ntul Kendall
a) b)
Proba Rangul
Proba Rangul
ρ c ρ c
1 5 4 3 1 3
2 2 1 2 2 1
3 1 3 4 3 2
4 3 2 5 4 5
5 4 5 1 5 4
1. Ordonarea probelor dupã rangul unei caracteristi ci, de exemplu ρ
(Tabelul III.23b).
2. Realizarea perechilor de ranguri prin combinare a probelor
disponibile (Tabelul III.24).
54/124
3. Calculul lui S prin însumarea algebricã a varia țiilor relative.
4. Calculul lui kτ cu formula (III.190):
( )4 , 015542=−⋅=kτ
Tabelul III.24 Calculul parametrului S
pentru coeficientul Kendall
Nr. crt. ρ c Consens +1
Contrasens -1
1 1⇒2 3 ⇐1 -1
2 1⇒3 3 ⇐2 -1
3 1⇒4 3⇒5 +1
4 1⇒5 3⇒4 +1
5 2⇒3 1⇒2 +1
6 2⇒4 1⇒5 +1
7 2⇒5 1⇒4 +1
8 3⇒4 2⇒5 +1
9 3⇒5 2⇒4 +1
10 4⇒5 5 ⇐4 -1
=S 4
În practicã, frecvent, selec țiile de date con țin grupuri de k valori cu
acela și rang. Pentru astfel de situa ții se calculeazã un rang mediu prin media
aritmeticã a rangurilor celor k valori. Vor apare astfel în seria ordonatã a
selectiei k valori cu acela și rang. Tranzitiile între valori cu acela și rang sunt
consemnate cu valoarea zero în calculul parametrulu i S.
Aplicatie. Dacã ordonarea a 5=n probe dupã gradul de alterare este realizatã
de doi specialisti (A, B) obtinându-se situatia din tabelul III.25, rangul mediu al
probelor P3 și P4 dupã clasificarea obtinutã de specialistul A este:
5 , 2232
4 3 =+= =P PrangA rangA
55/124
Conform tabelelor de calcul (tabelul III.26 și tabelul III.27):
( )1 , 015512=−⋅=kτ
Tabelul III.25 Coef. Kendall
Proba RANG
A B Tabelul III.27 Coef. Kendall
P1 1 3 Nr. crt. A B +1/-1
P2 4 1 1 1→2,5 3 ←2 -1
P3 2-3 2 2 1→2,5 3 →4 1
P4 2-3 4 3 1→4 3 ←1 -1
P5 5 5 4 1→5 3 →5 1
Tabelul III.26 Coef.Kendall 5 2,5 →2,5 2→4 0
Proba RANG 6 2,5 →4 2 ←1 -1
A B 7 2,5 →5 2 →5 1
1 1 3 8 2,5 →4 4 ←1 -1
2 2,5 2 9 2,5 →5 4 →5 1
3 2,5 4 10 4→5 1 →5 1
4 4 1 1=S
5 5 5
c) Coeficientul OMEGA-Kendall
Corelarea simultanã a rangului mai multor variabil e poate fi cuantificatã
prin coeficientul definit cu rela ția:
( ) nnmS
K−=Ω3 212 (III.191)
56/124
în care:
S – suma concordan țelor multiple:
( )∑=− =m
i iSS S12
(III.192)
iS – suma concordan țelor binare;
S – media concordan țelor binare;
m – numãrul variabilelor comparate;
n – numãrul cuplurilor de valori ale selectiei.
Aplicatie. Analiza corela ției rangurilor a trei variabile V1, V2 și V3, a cãror
clasificare este consemnatã în tabelul III.28a, con duce la urmãtoarele etape
de calcul (Tabelul III.28b):
1 – media concordan țelor binare
23204=++=S
2 – suma concordan țelor multiple
( )( )( )8 22 20 242 2 2= −+ −+ −=S
3 – coeficientul KΩ
( )1 , 0553812
3 2=−⋅=ΩK
Valoarea 0,1 indicã o corela ție nesemnificativã între cele trei variabile
(V1, V2 și V3).
Tabelul III.28 Elementele de calcul pentru coeficie ntul OMEGA-Kendall
b)
Nr.
crt. Tranzi ții +1/-1
a) V1 V2 V3 V1:V2 V1:V3 V2:V3
Nr.
probã Rang 1 1⇒2 2⇐1 3⇐2 -1 -1 +1
V1 V2 V3 2 1⇒3 2⇒4 3⇒5 +1 +1 +1
P1 1 2 3 3 1⇒4 2⇒5 3⇐1 +1 -1 -1
57/124
P2 2 1 2 4 1⇒5 2⇒3 3⇒4 +1 +1 +1
P3 3 4 5 5 2⇒3 1⇒4 2⇒5 +1 +1 +1
P4 4 5 1 6 2⇒4 1⇒5 2⇐1 +1 -1 -1
P5 5 3 4 7 2⇒5 1⇒3 2⇒4 +1 +1 +1
8 3⇒4 1⇒5 5⇐1 +1 -1 -1
9 3⇒5 4⇒5 5⇐4 +1 -1 +1
10 4⇒5 5⇐3 1⇒4 -1 +1 -1
Dacã în selec țiile analizate existã și valori identice, deci cu acela și
rang, formula (III.191) se modificã sub forma:
( ) ( )∑=− −−=Ωn
i i iKtt mnnmS
13 3 212
(III.193)
semnificatiilor notatiilor fiind acelea și cu cele mentionate anterior:
3.1.3.Coeficien ți de asociere
Asocierea caracteristicilor calitative este o prob lemã de importan țã
deosebitã în cercetarea geologicã fundamentalã. Com pararea rocilor pe baza
asociatiilor mineralogice, a nivelurilor stratigraf ice pe baza speciilor fosile
determinate, a zãcãmintelor pe baza caracteristicil or petrografice, toate
solicitã existenta unui instrument pentru ierarhiza rea asocierii caracteristicilor
calitative functie de intensitatea ei. Aproape jumã tate din datele obtinute prin
prospectiune și explorare geologicã sunt de naturã calitativã și ignorarea
acestora în etapa de analizã corela ționalã echivaleazã cu pierderea
contactului cu ambianta geologicã a fenomenului stu diat.
Coeficien ții de asociere permit descrierea cantitativã a celo r douã tipuri
de relatii fundamentale ce se stabilesc între douã caracteristici calitative A și B
58/124
(ex.: A=tipul petrografic: granit, dacit, bazalt et c.; B=caracterul mineralogic:
ortozã, albit, olivinã etc.): independenta și asocierea .
Independenta a douã caracteristici calitative A și B este exprimatã
cantitativ prin identificarea aceleia și proportii de elemente A, atât printre
elementele B cât și nonB. Exprimat prin intermediul frecventelor de g rupã,
forma clasicã a criteriului de independentã pentru cele douã caracteristici A și
B este:
()
( )()
ββA
BAB =
(III.194)
Pentru identificarea comodã a independentei, indif erent de forma în
care au fost sistematizate datele din cele N puncte de probare, criteriul
exprimat prin rela ția (III.194) poate fi formulat în diferite variante echivalente :
()
( )()
NA
BAB =
(III.195)
()
( )()
NB
AAB =
(III.196)
( )()()
NBAAB =
(III.197)
()()()
NB
NA
NAB =
(III.198)
Ecua ția (III.198) exprimã simbolic regula fundamentalã a
independentei:
"Dacã caracteristicile calitative A și B sunt independente, proportia
elementelor ()AB este egalã cu proportia elementelor A înmultitã cu proportia
elementelor B."
59/124
Asocierea exprimã existenta unei legãturi între ca racteristicile calitative,
iar functie de sensul, intensitatea și numãrul de variabile implicate poate fi:
pozitivã sau negativã, completã sau incompletã, tot alã sau partialã.
Asocierea pozitivã a douã caracteristici A și B atrage cresterea
numãrului de elemente B o datã cu cresterea numãrul ui de elemente A și este
exprimatã de inegalitatea:
( )()()
NBAAB >
(III.199)
Asocierea negativã, opusã celei pozitive, exprimã dezasocierea
caracteristicilor comparate, adicã reducerea numãru lui de elemente B
proportional cu cresterea numãrului de elemente A, și este exprimatã de
inegalitatea:
( )()()
NBAAB <
(III.200)
Propor țional cu cre șterea intensitã ții legãturii între cele douã
caracteristici calitative implicate, asocierea pozi tivã și negativã tind sã devinã
complete ((A)=(B) – asociere completã; (AB)=0 – dez asociere = asociere
negativã completã).
Analiza corela ționalã a unui sistem geologic, fie el bazin de
sedimentare, zãcãmânt polimetalic sau de petrol, im plicã în mod obligatoriu
studiul simultan al mai multor variabile calitative . Numai din considerente
operationale, în anumite etape ale prelucrãrii date lor se ignorã ansamblul de
corela ții, lunându-se în considerare numai informatiile re feritoare la douã
caracteristici calitative A și B, definindu-se asocierea totalã între acestea.
Definirea asocierii totale, presupune ipoteza cã în sistemul studiat nu existã o
altã variabilã care sã condi ționeze variabilele luate în studiu.
Pentru cuantificarea intensitãtii asocierii, presu puse totale, se utilizeazã
în mod uzual coeficientul de asociere ( Q), coeficientul de interdependentã
(Y) și coeficientul de corela ție calitativã ( AB r).
60/124
a) Coeficientul de asociere Yule și Kendall
Coeficientul Yule și Kendal, ( Q),are rela ția de definitie:
()()()()
( )( ) ( )( ) β α αβ β α αβ
AB AB AB AB Q+−=
(III.201)
Coeficientul de asociere Q este zero când cele douã caracteristici A și
B sunt independente, +1 când existã asociere poziti vã completã și -1 când
cele douã caracteristici sunt dezasociate (= asocie re completã negativã).
Coeficientul de asociere Q este independent de proportiile relative ale
elementelor A și α în selectia de date, proprietate ce-l face adecvat cazurilor
în care proportiile sunt arbitrare.
b) Coeficientul de interdependen țã
Coeficientul de interdependen țã ,( Y), cu proprietã ți similare coeficientului de
asociere Q este definit cu rela ția:
()()
( )( )
( )( )
( )( ) αβ αβαβ αβ
AB B AAB B A
Y
+−
=
11
(III.202)
c) Coeficientul de corela ție asociativã
Coeficientul de corela ție asociativã ( AB r) este definit (Sarapov, 1968)
pe structura coeficientului corela ției lineare, având acelea și proprietãti cu
acesta :
61/124
()()()()
( )( )( )( ) β ααβ αβ
B AB A AB rAB −=
(III.203)
Testarea caracterului total al asocierii caracteri sticilor A și B necesitã
verificarea influentei unei alte caracteristici C a supra asocierii acestora.
Pentru aceasta se defineste asocierea partialã a ca racteristicilor A și B în
raport cu C.
Asocierea partialã ca și cea totalã poate fi pozitivã dacã se verificã
inegalitatea:
( )()()
CBC AC ABC >
(III.204)
sau negativã dacã:
( )()()
CBC AC ABC <
(III.205)
Prin adaptarea formulelor (III.201), (III.202) și (III.203) se definesc
coeficien ții de asociere partialã corespunzãtori:
( )( )( )( )
( )( ) ( )( ) CA BC C ABC CA BC C ABC QCAB β α αβ β α αβ
+−=.
(III.206)
( )( )
( )( )
( )( )
( )( ) C ABC BC CAC ABC BC CA
YCAB
αβ αβαβ αβ
+−
=
11
.
(III.207)
62/124
( )( )( )( )
( )( )( )( ) C BC C AC CA BC C ABC rCAB β αβ α αβ −=.
(III.208)
Testarea influentei caracteristicii C asupra asoci erii caracteristicilor A și
B se bazeazã pe compararea coeficien ților calculati pentru asociere în raport
atât cu caracteristica C cât și cu caracteristica nonC (= γ). Egalitatea
γAB CAB Q Q =. indicã independenta asocierii caracteristicilor A și B în raport cu
caracteristica C, altfel spus, între caracteristici le A și B este o asociere totalã.
Proportional cu cresterea numãrului de caracterist ici luate în studiu
creste numãrul asociatiilor partiale care se pot an aliza pentru precizarea
ansamblului de corela ții din sistemul studiat.
3.1.4.Coeficien ți de corela ție temporal ă
În cercetarea ecologicã se opereazã frecvent cu se rii de valori ale unor
variabile ij v ( nv i ,…, 3 , 2 , 1 = ; ni j ,…, 3 , 2 , 1 = ; nv – numãrul de variabile; ni –
numãrul de valori pentru fiecare variabilã) obtinut e prin determinari realizate la
intervale mai mult sau mai putin egale.
Astfel de serii de valori cunoscute sub denumirea genericã de serii de
timp pot fi constituite din:
cote ale nivelului
piezometric ale unui
acvifer mãsurate la
intervale de timp egale
(Fig.62), succesiunea
litologicã a unei secvente
sedimentare separatã în
intervale egale ca
grosime (Fig.63), numãr
de microfosile identificate pe o directie oarecare de probare (Fig.64).
H(1)
H(2) H(4) H(3)
H(4) H(2)
t
t1 t2 t4 t3
Fig. 62 Serie de timp a nivelurilor piezometrice
mãsurate într-un acvifer freatic
63/124
Timpul, într-o astfel de serie de valori sau stãri ale procesului studiat
este echivalent fie cu grosimea stratigraficã, fie cu adâncimea mãsuratã într-
un foraj, fie cu distanta de-a lungul unei directii oarecare din spatiu.
Studiul seriilor de timp beneficiazã de o amplã și sofisticatã
metodologie (Tertisco M.et.al.,1985) care nu poate fi utilizatã cu eficientã
maximã în geologie din douã motive principale: t1
t2
t3
.
.
.
tn-1
tn a) v 1 v 2 v 3 b)
Fig. 63 Serii de timp rezultate din cercetarea unei succes iuni sedimentare
a) serie de timp litologicã univariatã;
b) serie de timp multivariatã ( γγ ρ = = =3 2 1 ; , vPS v v ) ob ținutã din diagrafia geofizicã
complexã Fig. 64 Numãr de microfosile identificate în puncte de
probare plasate pe o direc ție oarecare de probare Z
Y X
NF(1) NF(2) NF(3)…
e e e t
64/124
a)volumul mare de date necesar calculului parametri lor caracteristici analizei
seriilor de timp univariate, cu semnificatie relati v redusã în studiul proceselor
geologice complexe, multivariate;
b)complexitatea metodologiei care introduce dificul tãti de interpretare în
analiza seriilor de timp multivariate, adecvate stu diului proceselor geologice
complexe.
a)Formalizarea stocasticã a seriilor de timp
Existenta unui volum minim de date pentru studiul unei serii de timp în
scopul estimãrii stocastice a corealtiilor presupun e o formalizare care
asociazã caracteristicii studiate (ex.: litologia, nivelul piezometric, numãrul de
fosile identificate etc.) o variabilã aleatoare de obicei discretã (caracterul
discret fiind determinat de modul de colectare a da telor și nu de natura
variabilei studiate), iar continutului variabilei, un ansamblu de stãri (ex.: variate
tipuri litologice: calcar, argilã, gresie; sensul e volutiei: ascendent, descendent,
constant).
O serie de timp este din punct de vedere formal o succesiune se stãri
exclusive, iar instrumentul operational care permit e identificarea probabilistã a
ponderii componentei deterministe (=corela ționale) a procesului este matricea
de tranzitie.
Matricea de tranzitie sacrificã toate informatiile referitoare la pozitia
stãrilor în secventa de date, în favoarea identific ãrii tendintei unei stãri de a fi
urmatã sau precedatã de alta.
Existã douã tipuri principale de matrici de tranzi tie: matrici de tranzitie
unitarã (de un pas) și matrici de tranzitie multiplã, fiecare dintre ele putând fi
exprimate numeric în trei forme diferite: 1) matric ea frecventelor de tranzitie,
2) matricea proportiei perechilor de tranzitii, 3) matricea proportiilor de
tranzitie.
1) Matricea frecventelor de tranzitie este formatã din numãrul tranzitiilor de la
o stare la alta determinatã pe baza seriei de obser vatii disponibile.
65/124
Pentru seria de 31 =n stãri:
ABACDCDABCBADCDCBACABDABCDBACDA
matricea frecventelor celor 30 1=−n tranzitii ( MFT ) este:
A B C D
Total
7878
0313502112041340
=
DCBA
MFT
(III.209)
30
Total 8 7 8 7
2) Matricea propor ției perechilor de tranzi ții ( MPPT ) se ob ține din MFT prin
divizarea fiecãrei valori cu numãrul total de tranz itii și exprimã ponderea unei
tranzitii în totalul acestora:
A; B; C; D;
Total
23 , 027 , 023 , 026 , 0
00 , 0 10 , 0 03 , 0 10 , 017 , 0 00 , 0 07 , 0 03 , 003 , 0 07 , 0 00 , 0 13 , 003 , 0 10 , 0 13 , 0 00 , 0
=
DCBA
MPPT
(III.210)
1,00
Total 0,26 0,23 0,27 0,23
3) Matricea propor țiilor de tranzi ție ( MPT ) exprimã propor ția în care o stare
poate fi urmatã de alta fãrã a ține seama de ponderea stãrii ini țiale în totalul
acestor tranzitii. Ea se calculeazã prin divizarea fiecãrui element dintr-un rând
al MFT prin suma frecventelor din rândul respectiv.
66/124
A B C D
Total
000 , 1000 , 1000 , 1000 , 1
000 , 0 428 , 0 143 , 0 428 , 0625 , 0 000 , 0 250 , 0 125 , 0143 , 0 286 , 0 000 , 0 571 , 0125 , 0 375 , 0 500 , 0 000 , 0
=
DCBA
MPT
(III.211)
Cele trei forme de exprimare ale matricii de tranz itie pot fi construite
pentru o tranzitie unitarã cãnd procesul studiat op ereazã la momente
consecutive, exprimate formal de indicele superscri s al probabilitãtii de
tranzitie de la starea "j" la starea "k".
(){ }j Vk VP pm m jk = = =+11
(III.212)
Pentru o tranzitie multiplã ( n pa și), probabilitatea de tranzitie de la
starea "j" la starea "k" se scrie:
(){ }j Vk VP pm nmn
jk = = =+
(III.213)
În cazul în care probabilitãtile jk p depind numai de pasul n și sunt
independente de pozitia initialã "m" (situatie vala bilã pentru un lan ț Markov
omogen) matricea de tranzitie multiplã se calculeaz ã pe baza matricilor de
tranzi ție unitarã.
Rela ția de recurentã a prognozei stãrii sistemului pent ru orice
"moment" este:
() () ()m mP p p × =0
(III.214)
67/124
în care ()mP este matricea constituitã din probabilitãtile de t ranzitie multiplã
()m
jk p.
Aplicatie.Pentru matricea proportiei de tranzitie u nitarã:
=
25 , 0 25 , 0 50 , 034 , 0 50 , 0 16 , 010 , 0 20 , 0 70 , 0
1
CALCAR ARGILA GRESIE
MPT
se ob ține prin calcule succesive:
( )
=
11 , 0 29 , 0 52 , 027 , 0 37 , 0 36 , 016 , 0 27 , 0 57 , 0
12MPT ( )
=
20 , 0 30 , 0 50 , 021 , 0 31 , 0 48 , 020 , 0 30 , 0 50 , 0
14MPT
( )
=
20 , 0 30 , 0 50 , 020 , 0 30 , 0 50 , 020 , 0 30 , 0 50 , 0
16MPT ( )
=
20 , 0 30 , 0 50 , 020 , 0 30 , 0 50 , 020 , 0 30 , 0 50 , 0
18MPT
o matrice de echilibru, care nu se modificã peste o anumitã valoare a
exponentului și care prin structura numericã exprimã intensitatea corela țiilor
care existã în seria de timp analizatã.
Pentru exemplificarea modului în care se reflectã gradul de
determinare în structura unei matrici de tranzitie prezentãm în continuare:
a) matricea unui proces determinist de tipul MPTD:
…ABCDABCDAABCDABCD…
A B C D
=
0001100001000010
DCBA
MPTD
cu exprimarea graficã a tranzitiilor în fig. 65. A B
C D
Fig. 65 Tranzi țiile într-un proces determinist
68/124
b) matricea unui proces aleator de tip MPDA:
…DBABCDCABCABDCDCBCDBAD…
=
000 , 0 390 , 0 460 , 0 150 , 0530 , 0 000 , 0 100 , 0 370 , 0320 , 0 320 , 0 000 , 0 360 , 0160 , 0 450 , 0 390 , 0 000 , 0
DCBA
MPDA
cu exprimarea graficã a tranzitiilor în fig. 66.
La un numãr mare de valori ale unei serii de timp aleatoare,
probabilitãtile devin egale (ex.: ()()() 3 / 1= = = DAP CAP BAP ) în cazul unui
sistem cu patru stãri distincte A,B,C,D). Între cel e douã extreme (model
determinist și aleator) existã o infinitate de variante diferent iate prin
intensitatea corela țiilor.
Descrierea statisticã a seriilor de timp este real izatã prin patru functii
elementare: dispersia, densitatea de probabilitate, coeficientul de
autocorela ție sau intercorela ție și densitatea spectralã. Dacã primele douã
sunt utilizate pentru orice variabilã cu comportame nt aleator, ultimele douã
sunt specifice seriilor de timp.
b)Coeficientul de autocorela ție
Autocovarianta este covarianta a douã realizãri al e aceleia și variabile
(V) care este determinatã în douã puncte separate pri n intervalul h.
Covarianta, ca o functie de h poate fi scrisã sub forma:
()( )∑ +→∞ + × = =N
hn nNhn n V VV VVE hC1lim ,
(III.215) A
B
C D
Fig. 66 Tranzi țiile în MPDA
69/124
în care
h – "distanta" dintre cele douã valori ( 1 ,…, 2 , 1 , 0 − = N h );
N – numãrul de valori ale seriei de timp.
Functia de covariantã este simetricã în jurul valor ii zero:
() ()hCh CV V =−
(III.216)
iar dacã 0=h covarianta se reduce la dispersie (=variantã) și se poate scrie :
( ) ( ) ∑
== =N
nn V VNV C
12 1var 0
(III.217)
Coeficientul de autocorela ție se ob ține prin divizarea covariantei la
variantã și poate fi scris sub forma:
( )()
( )0VV
VChChR =
(III.218)
Estimatorul coeficientului de corela ție se calculeazã cu rela ția:
( )( )
( ) ( ) ( ) ( )∑ ∑ ∑ ∑∑ ∑∑
+ +−
=−
= +−
= +
− − − −− −=
22221 1 1
hi hi i ihN
ihN
i hihN
i i hii
V
v v hN v v hNv v vv hNhr
(III.219)
Valorile coeficientului de autocorela ție sunt cuprinse în intervalul []1 , 1−
și evident ()10=vR este valoarea care indicã o corela ție maximã. Valoarea
()1 0−=vR indicã o corela ție maximã inversã. Valorile estimate ale
70/124
coeficientului de autocorela ție permit identificarea ciclicitã ților dintr-o serie de
timp.
Reprezentarea
graficã a variatiei
coeficientului de
autocorela ție în functie de
h poartã denumirea de
corelogramã (Fig. 67) și
ilustreazã într-o formã
sinteticã semnificatia
statisticã a componentelor
ciclice ale seriei studiate.
Selectarea
componentelor cu semnificatie statisticã se face pr in alegerea unui nivel de
semnificatie minimã care filtreazã valorile coefici entului de autocorela ție. Intr-
un model pentru reproducerea și prognoza seriei de timp sunt reprezentate
numai componentele al cãror coeficient de autocorel a ție depãseste nivelul de
semnificatie minim.
Aplicatie. Ca un exemplu simplu se poate calcula co relograma unui proces
geologic de tip markovian descris printr-o matrice de tranzitie. Acest lucru se
poate realiza prin asocierea unei valori numerice f iecãrei stãri a sistemului .
Pentru un proces cu douã stãri distincte, asociind unei stãri valoarea
unu și celei de-a doua valoarea zero matricea de tranzit ie va fi notatã:
=
11 10 01 00
p pp pMPT
în care 10 01 01 ,, ppp și 11 p sunt probabilitãtile de tranzitie din sistemul stu diat.
Conform rela ției (III.215):
()( )( )( )1 1 1 1 = = ×= == = =+ + n hn n hn n V V VP VP V VE hC +1
-1 0
1 2 3
4 5
6 7 8 Nivel semnifica ție
minimã
h()hRv
Nivel semnifica ție
minimã
Fig. 67 Corelograma unei serii de timp
71/124
și deoarece
( )()1 1 p VE VPn n = ==
în care 1 0,pp sunt probabilitãtile stabile ale matricii MPT:
()h
V pp hC11 1×=
și
()h
V p hR11 =
Corelograma unui astfel de proces markovian coresp unde puterilor
probabilitãtilor de tranzitie 11 p și în general, pentru orice lan ț markov va fi o
functie simplã de ()hMPT .
Dacã se calculeazã corelograma uni proces aleator "pur" în care
()0=nVE , atunci ()0=hRV pentru ,… 3 , 2 , 1 =h având un singur maxim de
()1=hRV pentru 0=h . Acest lucru este în acord cu definitia unui proce s
aleator în care se presupune cã nu existã corela ții între nV și hnV+ pentru orice
n și orice h diferit de zero.
c)Coeficientul de intercorela ție
Coeficie
ntul de
intercorela ție
este utilizat
pentru
evaluarea
intensitãtii
corela ției dintre
douã serii de
t U, V
0 U
V
Fig. 68 Varia ția în “timp” a douã caracteristici
geologice cu comportament aleator
72/124
timp ce mãsoarã variatia a douã variabile disticte VU, (ex.: U=precipitatiile,
V=cota nivelului piezometric al unui acviferului fre atic); U=porozitatea,
V=valoarea PS-ului corespunzãtor înregistrat într-un carotaj etc.) (Fig. 68).
Rela ția de calcul pentru coeficientul de intercorela ție este:
( )( )
( ) ( ) ( ) ( )∑ ∑ ∑ ∑∑∑∑
+ +−
=−
=−
= + +
− − − −− −
=
2 2 2 21 1 1
hi hi i ihN
ihN
ihN
i hi i hii
UV
U U hN v v hNU V UV hN
hr
(III.220)
Domeniul de variatie și semnificatia coeficientului de intercorela ție sunt
analoage cu cele ale coeficientului de autocorela ție. Referindu-se la douã
variabile ()0UV R este identic cu coeficientul lui Pearson și numai în cazul unei
corela ții liniare perfecte între U și V va avea valoarea unitarã, pozitivã sau
negativã dupã cum corela ția este directã respectiv inversã.
Corelograma coeficientului de intercorela ție este utilizatã în scopul
identificãrii periodicitãtii seriilor de timp multi variate, a decalajelor cu
semnificatie statisticã pentru cupluri de douã vari abile.
Prin analiza corela ției dintre variatia precipitatiilor și a nivelului
piezometric din acviferele freatice se poate evalua , spre exemplu, cu ajutorul
coeficientului de intercorela ție, durata de tranzit a apei prin zona de aerare și
implicit vulnerabilitatea la poluare a acviferelor.
***
Atât pentru coeficientul de autocorela ție cât și pentru cel de
intercorela ție seriile de timp sunt presupuse lineare și stationare. Dacã aceste
condi ții nu sunt îndeplinite, evaluarea corela țiilor temporare presupune o
preprocesare care sã realizeze:
73/124
a ) linearizarea datelor (prin logaritmare, ridicar e la putere, extragerea
rãdacinii de un ordin oarecare) sau separarea datel or într-un numãr oarecare
de subdomenii pe care sã se comporte linear;
b) eliminarea tendintelor neperiodice care mascheaz ã componentele ciclice
ale seriilor de timp. Aceastã operatiune se realize azã prin identificarea
modelului analitic al tendintei și eliminarea ei din datele brute. Evaluarea
coeficien ților se opereazã asupra valorilor "reziduale" (M.Te rtisco et.al., 1985).
74/124
3.2. Factorizarea corela țiilor
Rezultatã din complexitatea proceselor ecologice, necesitatea
identificãrii factorilor principali care determinã evolutia fenomenelor este
obiectivul final al descrierii multivariate a proce selor ecologice. Unul din cele
mai adaptate instrumente pentru solu ționarea acestei probleme este analiza
factorialã.
Analiza factorialã a fost privitã în general ca o metodã misterioasã de o
mare complexitate. O parte din misterul care o înco njoarã provine din bogata
terminologie utilizatã. Analiza factorialã a fost d ezvoltatã de psihologii
experimentalisti în anii 1930-1940 și mare parte din terminologie are
semnificatie numai în contextul acestui domeniu.
Obiectivul original al analizei factoriale a fost sã dea un sistem corect
de evaluare a inteligentei prin corelarea punctajel or obtinute din diferite teste
relative la abilitatea mentalã. Este în general acc eptat faptul cã punctajul dintr-
un singur test nu poate da o mãsurã realã a intelig entei unei persoane. O
persoanã bine înzestratã intelectual va ob ține rezultate mai bune la
majoritatea testelor de inteligentã decât o persoan ã consideratã inferioarã
mental. Diferentele la testele specifice nu reflect ã diferentele mentale ci de
educatie, culturã generalã și circumstantiale, legate de condi țiile în care se
desfãsoarã testele. Psihologii au considerat analiz a factorialã capabilã sã
extragã coeficientul corect de evaluare a inteligen tei din rezultatele tuturor
testelor chiar dacã nici unul dintre aceste teste, individual, nu este capabil sã
o facã corect.
Aplicatã în cercetãri biologice și geologice analiza factorialã studiazã
relatiile dintre un numãr mare de variabile mãsurab ile, cu scopul evidentierii
unor noi variabile, teoretice, numite factori.
Aceste noi variabile (=teoretice =factori) sunt în tr-un numãr mai mic
decât variabilele mãsurabile și sunt în acela și timp functii lineare de variabilele
mãsurabile.
Noile variabile sunt astfel stabilite încât sã exp lice într-un procent cât
mai mare varianta variabilelor originale. Se cautã prin analiza factorialã
gãsirea unui numãr cât mai mic de factori (=variabi le teoretice) care sã
exprime variabilitatea observatã pin intermediul va lorilor mãsurate.
Variabilitatea rezidualã, rãmasã neexprimatã este o pierdere de
informatie compensatã prin numãrul redus de variabi le teoretice cu care se
opereazã în continuare pentru modelarea procesului studiat.
Variabilele teoretice (=factorii) vor putea reflec ta fenomene naturale
care sunt la originea variabilitãtii observate și astfel se vor putea interpreta
într-o opticã naturalistã rezultatele calculelor ca ntitative.
Fundamentate pe acelea și principii, factorizarea corela țiilor sistemelor
multivariate poate fi abordatã prin trei variante a le analizei factoriale: analiza
în componen ți principali, analiza factorialã R-MOD și analiza factorialã Q-
MOD.
Separarea tipurilor de sedimente pe baza variabili tãtii compozitiei
granulometrice și identificarea fractiunilor caracteristice diferit elor tipuri de
75/124
sedimente pot fi realizate prin aplicarea analizei componentilor principali.
Dacã se studiazã un corp plutonic, pentru stabilire a numãrului factorilor care
condi ționeazã distributia elementelor chimice și mineralelor se utilizeazã
analiza factorialã R-MOD. Gruparea taxonomicã a unu i lot de esantioane
prelevate din diferite tipuri de roci (ex.: sienit, monzonit, diorit, quartit, gabrou,
norit, diabaz) pe baza oxizilor continuti (ex.: SiO 2, Al 2O3, Fe 2O3, FeO, MgO,
CaO, Na 2O, K 2O) se poate realiza printr-o analizã factorialã Q- MOD.
Toate variantele analizei factoriale vor fi luate în studiu în acest capitol,
punctul de plecare fiind obligatoriu analiza în com ponenti principali.
Obiectivul operational al analizei factoriale este interpretarea structurii
matricilor de varian țã-covarian țã pentru un ansamblu multivariat de date.
Tehnica utilizatã este extragerea valorilor proprii și a vectorilor proprii din
aceste matrici care exprimã sintetic ansamblul de r elatii dintre variabilele
mãsurate.
3.2.1. Valori proprii și vectori proprii
Determinarea valorilor proprii și vectorilor proprii este privitã ca fiind
cea mai dificilã operatie în algebra matricialã. Di ficultatea nu constã în metoda
de calcul, care nu este mai dificilã decât alte pro cedee matematice, ci în
perceperea semnificatiei acestor instrumente în mod intuitiv.
Pentru o clarã percepere a acestor semnificatii vo m utiliza o
interpretare geometricã deosebit de clarã aplicabil ã matricei coordonatelor a
douã puncte plasate într-un spatiu bidimensional și vom interpreta valorile
propprii, vectorii proprii și functiile asociate ca proprietãti geometrice ale
aranjamentului acestor puncte.
Aceastã abordare ne limiteazã la matrici mici (2X2 ) dar rezultatele
obtinute pot fi extrapolate la sisteme mai mari chi ar dacã calculul manual
devine impracticabil. Trebuie notat cu acest prilej cã suntem într-un domeniu
în care puterea de calcul chiar a celor mai moderne calculatoare deseori este
inadecvatã pentru solu ționarea problemelor reale.
a) Valori proprii
Considerãm sistemul matricial ipotetic:
[][][]X XA λ=
(III.258)
care formal este similar cu
[][][]B XA = în care [][]X Bλ=
(III.259)
Ecua ția poate fi rescrisã sub forma:
76/124
[][] ( )[][]O XI A = −λ
(III.260)
în care I este matricea identitate.
Pentru matrici [2X2], ecua ția matricialã (III.260) poate fi scrisã sub
forma sistemului:
( )
( )
= − += + −
00
2 22 1 21 2 12 1 11
X A XAXA X A
λλ
(III.261)
Presupunând cã sistemul are și alte solu ții decât cea banalã
02 1 = =X X atunci trebuie ca:
0 det =∗− I Aλ
(III.262)
care prin dezvoltare devine ecua ția:
( ) 012 21 22 11 22 11 2
2 = − + + − AA AA A A λ λ
(III.263)
cu douã solu ții reale în cazul unei matrici A simetrice.
Aplicatie. Pentru douã puncte ()8 , 41P și ()4 , 82P matricea coordonatelor este:
=4884A
iar matricea pentru calculul valorilor proprii
−−=λλ
4 88 4A
Solu țiile ecua ției de gradul doi care rezultã prin dezvoltarea
determinantului sunt:
41−=λ și 12 2=λ
Punctele 1P și 2P pot fi imaginate ca fiind plasate pe conturul unei
elipse al cãrei centru este plasat în centrul siste mului de referintã. Elipsa este
ca o anvelopã care cuprinde ambele puncte iar valor ile proprii pot fi
interpretate ca semiaxele elipsei. Raportul axelor poate fi o expresie numericã
a gradului de împrãstiere a punctelor. Cu cât punct ele sunt mai apropiate,
lungimea axelor diferã mai mult și elipsa tinde spre o dreaptã. Dacã cele douã
puncte se aflã pe doi vectori perpendiculari elipsa devine cerc.
Ca exemplificare se calculeazã valorile proprii pe ntru matricile
coordonatelor a douã puncte situate pe douã axe car e fac un unghi de: a)
90 o; b) 45 o; c) 30 o; d) 0 o (Fig. 69).
77/124
;
21
PP a)
−
4884 b)
4884 c)
6886 d)
8484
a) b) c) d)
95 , 81=λ 12 1=λ 14 1=λ
12 1=λ
95 , 82−=λ 42=λ 22−=λ 02=λ
Ca regulã de verificare a corectitudinii calcululu i valorilor proprii se
retine cã suma valorilor proprii este egalã cu urma matricii initiale (suma
valorilor de pe diagonala principalã).
Valorile proprii reprezintã lungimile celor douã s emiaxe ale elipsei pe
care sunt plasate cele douã puncte sau, generalizân d, la "n" dimensiuni, "n"
semiaxe ale elipsoidului care înglobeazã toate punc tele într-un spatiu cu "n"
dimensiuni.
b) Vectori proprii
Revenind la ecua ția [][] ( )[][]O XI A = −λ , dacã dupã calculul valorilor
proprii acestea sunt utilizate pentru calculul solu ției nebanale, se ob țin vectorii
proprii ai matricii ini țiale.
Pentru matricea [2X2] dezvoltând ecua ția (III.260) se ob ține:
=
×
−−
00
21
22 21 12 11
XX
A AA A
λλ
(III.264)
Vectorul [ ]2 1,XX se numeste vector propriu (=caracteristicã proprie
=caracteristicã latentã =vector principal) asociat valorii proprii.
Pentru a concluziona relativ la partea operational ã, trebuie mentionat
cã pentru a afla vectorii proprii și valorile proprii ale unei matrici []nn× trebuie
sã-i gãsim determinantul, rãdãcinile ecua ției polinomiale caracteristice și sã
solu ționãm un set de n ecua ții cu n necunoscute.
Aplicatie. Revenind pentru interpretare la matricea
Fig. 69 Semnifica ția geometricã a valorilor proprii și vectorilor proprii O O’’ y
O’
x P1(8;4) P2(-4;8) y
x O’
O’’ P2(4;8)
P1(8;4) y
x O O’’ O’
P2(8;6) P1(6;8)
x O;O’’ O’
P(4;8) y
78/124
=4884A
ecua ția de calcul pentru vectorul propriu al valorii pro prii 12 1=λ este:
=
×
−−
00
12 4 88 12 4
21
XX
cu solu ția
=
11
21
XX
Pentru ecua ție existã o infinitate de vectori proprii pentru cã sistemul
este satisfãcut de
×=
11
21βXX
unde β este o constantã oarecare. Practic este insuficien t sã ne limitãm la
1=β deoarece, a șa cum se va vedea, suntem interesa ți de valorile
rapoartelor dintre elementele vectorului care nu se schimbã prin multiplicare
cu o constantã.
Pentru cea de-a doua valoare proprie 42−=λ , solu ția pentru al doilea
vector propriu este:
−×=
11
21βXX
Revenind la figura 69, vectorii proprii pot fi int erpretati ca pantele celor
douã axe ale elipsei. Primul vector propriu defines te bisectoarea unghiului
determinat de cele douã puncte și centrul elipsei și a cãrei lungime este egalã
cu prima valoare proprie ( 12 1=λ ), iar ce-l de-al doilea vector propriu define ște
axa ortogonalã cu prima .
De retinut cã matricile simetrice au toate valori proprii reale iar vectorii
proprii corespondenti sunt ortogonali.
3.2.2.Standardizarea
Analiza factorialã este deseori confruntatã cu interpretarea unei matrici
de varian țã-covarian țã obtinutã dintr-o colectie de caracteristici geolo gice
exprimate în unitãti de mãsurã diferite.
Valorile exprimate în unitãti de mãsurã diferite n u pot fi comparate
direct necesitând o transformare a datelor original e prin standardizare.
Standardizarea se realizeazã prin extragerea din f iecare valoare
originalã a valorii medii a variabilei și divizarea diferentei prin abaterea
79/124
standard. Se ob ține astfel un nou set de valori cu media zero și dispersia unu
.
Standardizarea permite compararea variabilelor exp rimate în unitãti de
mãsurã diferite, altfel spus permite compararea "me relor" cu "perele".
Dacã se opereazã cu matricea de corela ție a variabilelor studiate, cum
este cazul în analiza factorialã Q-MOD sau R-MOD, n u este necesar sã se
standardizeze valorile pentru cã de fapt matricea d e corela ție este matricea
de varian țã-covarian țã a datelor standardizate.
Standardizarea poate avea o influentã determinantã asupra structurii
matricii de variantã-covariantã și în consecintã asupra rezultatelor analizei
factoriale dacã amplitudinile de selectie ale varia bilelor diferã semnificativ și
distributiile sunt puternic asimetrice. Când unitãtile de mãsurã nu diferã se
recomandã din acest evitarea standardizãrii.
Pentru ilustrarea efectului standardizãrii sã cons iderãm reprezentãrile
grafice ale datelor brute (Fig. 70) și ale celor standardizate (Fig. 71) pentru
care au fost calculate separat matricile de covaria ntã, valorile proprii și vectorii
proprii.
Efectul standardizãrii este extinderea ambelor var iabile pe acela și
interval valoric cu modificarea raportului de împrã stiere a valorilor pe cele
douã axe și rotirea axelor principale cu 45 o (cu 45 o pentru toate matricile
binare și cu valori diferite în cazul matricilor mai mari).
De asemenea, se remarcã o reducere slabã a varian tei de-a
lungul primului vector propriu (de la 96% la 93%), reducere care se
accentueazã proportional cu diferenta dintre domeni ile de variatie ale
variabilelor originale.
Tabelul III. 32 Elementele de standardizare
Valori nestandardizate Valori standardizate
MEDIA
()51=Xm ()01= XS m
()10 2=Xm ()02= XS m
VARIAN ȚA
() 08 , 612=Xs
() 54 ,27 22=Xs ()112= XS s
()122= XS s
MATRICE DE COVARIAN ȚÃ MATRICE DE CORELA ȚIE
=54 ,27 08 ,11 08 ,11 08 , 6cov
=00 , 1 86 , 086 , 0 00 , 1R
VALORI PROPRII
23 ,32 1=λ ( )%96 86 , 11=λ ( )%93
39 , 12=λ ()%4 14 , 02=λ ()%7
VECTORI PROPRII
[ ]92 , 0 ; 39 , 01V [ ]707 , 0 ; 707 , 01V
[ ]39 , 0;92 , 02 − V [ ]707 , 0 ; 707 , 02−V
80/124
3.2.3.Analiza în componen ți principali
Analiza în componenti principali constã în transfo rmarea liniarã a m
variabile mãsurabile corelate, în n variabile teoretice care sunt combinatii
linerare ale celor vechi. Fiecare nouã variabilã es te astfel creatã încât sã
înglobeze cât mai mult din varianta totalã a datelo r originale.
Componentii principali nu sunt altceva decât vecto rii proprii ai matricii
de varian țã-covarian țã. În calcule nu este implicatã nici o ipotezã prob abilistã
sau testare astfel încât A.C.P., strict vorbind, es te doar o prelucrare
matematicã și nu o procedurã statisticã. Utilitatea A.C.P. este apreciatã dupã
performante și nu dupã consideratii teoretice.
a)Metodologia de lucru
Presupunând cã dispunem de o colectie de 25 de exe mplare de
brahiopode și mãsurãm pentru fiecare exemplar lungimea 1X și lãtimea 2X
(tabelul III.32) matricea de varian țã-covarian țã ob ținutã prin calcul este
=10 ,24 60 ,15 60 ,15 3 ,20 cov
Reprezentând grafic aceastã matrice, considerând-o ca fiind alcãtuitã
din coordonatele a douã puncte cu abscisele pe prim a linie și cu ordonatele
pe a doua, se ob ține o reprezentare vectorialã care exprimã grafic c orela ția
dintre cele douã variabile 1X și 2X (Fig. 72 și 73).
Calculul vectorilor proprii și al valorilor proprii conduc la ob ținerea
elementelor elipsei ce înglobeazã toate cele 20 de puncte din tabelul III.32:
[ ]75 , 0 ; 66 , 0= VectorI , [ ]66 , 0;75 , 0− = VectorII cu 9 ,37 =Iλși 5 , 6=II λ (Fig. 74). 0 5 10 15 20 0510 15 20
Fig. 70 Reprezentarea graficã
a datelor nestandardizate 1 2
-1
-2 -1 -2 1 2
Fig. 71 Reprezentarea graficã a
datelor standardizate
81/124
Tabelul III. 32 Elemente ale analizei în
componenti principali
VALORILE
SELECTIEI VALORILE
FACTORIZATE DATELE
ORDONATE
Nr. 1X 2X 1Y 2Y 1X 2X
1 3 2 3.49 0.92 3 2
2 4 10 10.14 -3.64 4 2
3 6 5 7.72 1.18 6 5
4 6 8 9.97 -0.81 6 5
5 6 10 11.46 -2.14 6 6
6 7 2 6.14 3.91 7 7
7 7 13 14.37 -3.38 7 7
8 8 9 12.04 3.32 8 8
9 9 5 9.71 3.42 9 8
10 9 8 11.96 1.43 9 9
11 9 14 16.45 -2.45 9 10
12 10 7 11.87 2.84 10 10
13 11 12 16.28 0.28 11 10
14 12 10 15.44 2.35 12 11
15 12 11 16.19 1.69 12 12
16 13 16 13.11 5.75 13 13
17 13 14 19.1 0.45 13 13
18 13 15 19.85 -0.22 13 13
19 13 17 21.35 -1.54 13 14
20 14 7 14.52 5.84 14 14
21 15 13 19.68 2.6 15 15
22 17 13 21 4.1 17 17
23 17 17 24 1.45 17 17
24 18 19 26.16 0.87 18 19
25 20 20 28.23 1.7 20 20
Se poate defini varian ța totalã a setului de date ca sumã a varian țelor
individuale și deoarece valorile acestor varian țe se aflã pe diagonala
principalã a matricii de varian țã-covarian țã ea va fi numeric egalã cu urma
acestei matrici și implicit cu suma valorilor proprii ale matricii:
Varian ța totalã = 20,3 + 24,1 = 44,4
82/124
La aceastã varian țã totalã variabila 1X contribuie cu 20,3/44,4 = 46%
iar 1X cu 24,1/44,4 = 54%.
Varian ța totalã fiind egalã cu suma valorilor proprii ale matricii de
varian țã-covarian țã rezultã cã axele elipsei ce înglobeazã toate pere chile
(iiYX,) reprezintã varian ța totalã, iar fiecare axã exprimã o anumitã parte d in
ea. Pentru matricea utilizatã, axa principalã repre zintã 37,9/44,4 = 86% din
varian ța totalã în timp ce a doua axã, corespunzãtoare cel ei de-a doua valori
proprii ( 5 , 62=λ ) 6,5/44,4 = 14%.
Astfel spus, dacã mãsurãm varian ța setului de date de-a lungul primei
axe principale putem reprezenta 86% din totalul var ian ței totale. Este evident
cã cel putin una din axele principale va fi mai efi cientã în exprimarea varian ței
decât oricare din axele originale și implicit, printre celelalte axe principale se
va gãsi una mai pu țin eficientã decât oricare din axele originale.
Dacã se realizeazã transformãrile liniare de form a:
20 30
10 10 20
Var X 1 Cov X 1
Cov X 2 Var X 2
30 0
Fig. 72 & 73 Reprezentarea graficã a matricii de varian țã-covarian țã
Fig. 74 Elipsa definitã de varian ța și covarian ța datelor din tabelul III.32
83/124
() () ()() () ()iXViXViYiXViXViY2 22 1 21 2 2 12 1 11 1 + = + =
în care 22 21 12 11 ,,, VVVV sunt elementele celor doi vectori proprii, se crea zã douã
noi variabile factorizate: 1Y care reprezintã 37,9/44,4 = 86% și 2Y numai
6,5/44,4 = 14% din varian ța totalã (Tabelul III.32)
Deoarece noile variabile proprii 1Y și 2Y sunt mãsurate de-a lungul
celor doi vectori, ortogonali, corela ția dintre ele va fi zero.
Componentele vectorilor proprii ( 22 21 12 11 ,,, VVVV ), coeficien ții numerici ai
ecua țiilor liniare de generare a noilor variabile sunt ponderile fiecãrei variabile
pe un anumit factor (ex.: 11 V este ponderea variabilei 1X pe "factorul" 1Y).
Dacã este obligatoriu din considerente de eficient ã a prelucrãrii datelor
sã reducem sistemul nostru la numai o variabilã: da cã renuntãm la una din
variabilele originale 1X sau 2X pierdem 46% sau 56% din varian ța totalã.
Dacã convertim variabilele originale prin proiectar ea pe axele componentilor
principali, operând cu 1Y pãstrãm 86% din varian ța totalã pierzând doar 14%.
b)Influenta covariantei asupra A.C.P.
Eficien ța repartizãrii varian ței totale pe un numãr de factori mai mic
decât cel al variabilelor originale este determinat ã de intensitatea corela ției
dintre ele.
Pentru exemplificare, în setul de date brute se re alizeazã o ordonare și
o randomizare a valorilor (Tabelul III.32). Se ob țin douã noi serii de 20 de
perechi de valori fiecare cu aceea și varian țã dar cu covarian țe diferite.
Reprezentãrile grafice ale celor douã serii de val ori ilustreazã în raport
cu seria ini țialã a valorilor cresterea corela ției în cazul ordonãrii și reducerea
ei în cazul randomizãrii (Fig. 75 și 76).
R
ez
ult
ate
le
cal
cul
ulu
i
pe
ntr
u
cel
e douã noi seturi de date conduc la urmãtoarele rez ultate:
VALORI ORDONATE VALORI RANDOMIZATE X1 X2
X1 X2
Fig. 75 Datele ordonate Fig. 76 Datele randomizate
84/124
=1 ,24 9 ,21 9 ,21 3 ,20 cov
−−=1 ,24 05 , 005 , 0 3 ,20 cov
VALORI PROPRII
( )%99 2 ,44 1=λ ( )%7 ,54 3 ,24 1=λ
()%12 , 02=λ ( )%3 ,45 1 ,20 2=λ
VECTORI PROPRII
[ ]74 , 0 ; 68 , 01=V [ ]98 , 0 ; 22 , 01−=V
[ ]68 , 0;74 , 02 − =V [ ]22 , 0 ; 98 , 02=V
Reprezentãrile grafice sunt sugestive pentru ilustr area eficientei cu
care componentii principali pot exprima varian ța în cele douã cazuri (fig. 77 și
78).
În cazul valorilor ordonate (Fig. 77), axa principa lã poate exprima 99%
din varian ța totalã, cea de-a doua fiind asa de scurtã încât p ractic este
imposibil de reprezentat grafic. Dacã renuntãm la c eastã a doua componentã
pierderea de varian țã a datelor originale este foarte micã.
Se poate reduce deci dimensionalitatea setului de date originale de la
doi la unu prin proiectarea pe prima axã principalã cu o pierdere de varian țã
totalã de 1%, utilizând rela ția: () () ()iXViXViY2 12 1 11 1 + = .
In cazul valorilor randomizate (Fig. 78), cele dou ã valori proprii sunt
practic identice, elipsa devenind cerc. Nici una di n axele principale, în aceste
condi ții, nu va capta mai bine varian ța totalã în comparatie cu variabilele
originale. În aceastã situatie A.C.P. nu î și gãseste utilitatea și factorizarea
corela ției nu î și are obiect, corela ția lipsind între variabile.
c)Aplicatie
20 30
10 10 20
30 0 X1 X2
I 30
30 I
II
Vector 2 Vector 1
Fig. 77 “Elipsa” valorilor ordonate Fig. 78 “Cercul” valorilor randomizate
85/124
Aplicarea analizei în componenti principali este ex emplificatã prin
separarea tipurilor de sedimente pe baza analizelor granulometrice realizate
pe 50 de probe recoltate din cinci domenii distinct e (I, II, II, IV, V) pentru care
s-au determinat șapte fractiuni granulometrice ( 7 6 5 4 3 2 1 ,,,,,, xxxxxxx ).
Calculul matricii de varian țã-covariant țã se face pe date originale,
nestandardizate deoarece toate sunt mãsurate în ace lea și unitãti de mãsurã.
Deoarece matricea de covariantã este supradetermin atã (suma tuturor
fractiunilor granulometrice este 100), una din valo rile proprii teoretic trebuie sã
fie nulã. Practic ea va fi foarte micã și nu nulã deoarece nu în toate probele
suma fractiunilor componente dau 100 din cauza eror ilor de determinare.
Tabelul III.33 Matricea de varian țã-covarian țã a celor 7 frac țiuni
1x 2x 3x 4x 5x 6x 7x
1x 4,8443
2x -2,6234 468,848
3x -0,0011 81,3941 353,1255
4x -1,5449 -200,2109 -84,6165 130,2741
5x -0,5972 -84,2597 -73,0435 44,7616 30,4350
6x -0,3805 -71,2097 -65,5433 34,9927 23,7565 22,4189
7x -0,0222 -57,8578 -56,1533 23,9136 19,3907 17,967
Tabelul III.34 Valorile proprii ale matricii de var ian țã-
covarian țã
Vector Valoare proprie Varian țã totalã Varian țã totalã
cumulatã %
I 659,7759 64,18 64,19
II 318,4384 30,98 95,17
III 35,1959 3,42 98,59
IV 6,7528 0,66 99,25
V 3,8193 0,37 99,62
VI 2,3763 0,23 99,85
VII 1,5540 0,15 100,00
Tabelul III.35 Vectori proprii
Var I II III IV V VI VII
1x -0,0019 0,0039 -0,0689 -0,5829 0,7554 0,2793 0,0818
2x 0,7710 -0,4777 0,3194 0,1885 0,1169 0,1581 0,0326
3x 0,4167 0,8647 0,0531 0,2119 0,1123 0,1294 0,0421
4x -0,3907 0,0761 0,8844 0,0704 0,0490 0,2280 0,0028
5x -0,1895 -0,0794 -0,0775 0,6308 0,6255 -0,3240 -0,24 01
6x -0,1618 -0,0813 -0,1629 0,3330 0,0526 0,2510 0,8723
7x -0,1308 -0,0735 -0,2750 0,2570 -0,0815 0,8107 -0,41 46
Pe baza elementelor calculate în tabelele III.33, I II.34, III.35 se deduc
elemetele necesare interpretãrii.
86/124
Primii doi componen ți principali acumuleazã 95,17% din varian ța totalã,
încãrcarea principalã apar ținând frac țiunii fine și foarte fine (factorul I: ( 2x),
(3x) și ( 4x); factorul II: ( 2x) și ( 3x)).
Diferen ța dintre cele cinci medii de sedimentare poate fi c omplet
descrisã prin numai doi factori principali. Prin re prezentarea variabilelor
transformate în sistemul de referin țã al factorilor I și II separarea lor este
evidentã (Fig. 79).
Rela țiile de transformare sunt:
1)pentru factorul I:
() () () () () () () ()iX iX iX iX iX iX iX iYI 7 6 5 4 3 2 1 1308 , 0 1618 , 0 1895 , 0 3907 , 0 4167 , 0 7710 , 0 0019 , 0 − − − − + + −=
2)pentru factorul II:
() () () () () () () ()iX iX iX iX iX iX iX iYII 7 6 5 4 3 2 1 0735 , 0 0813 , 0 0794 , 0 0761 , 0 8647 , 0 4777 , 0 0039 , 0 − − − + + − −=
Eficien ța celor doi
factori poate fi comparatã
cu puterea de separare a
tipurilor de sedimente pe
baza medianei și gradului
de sortare (Fig. 80) sau a
procentajului de nisip și
raportului dintre nisip fin și
nisip foarte fin (Fig. 81).
Fiecare din aceste
diagrame sunt aproximativ
la fel de eficiente în
separarea tipurilor de
sedimente.
-70 -60 -50 -40 -30 -20 -10 010 20
-70 -50 -30 -10 10 30 I II
Fig. 79 Reprezentarea valorilor func ție de factorii I, II
3 4 5 6 7 0,25 0,5 0,75 1,0 1,25 1,50 1,75 2,0 2,25
Fig. 80 Separarea func ție de medianã
(OX) și gradul de sortare (OY)
87/124
Avantajul A.C.P este implicatã de faptul cã din analiza încãrcãrilor
factorilor pentru fiecare variabilã se poate conclu ziona cã sedimentele
analizate pot fi considerate o mixturã de material nisipos și silt argilos.
Aceastã observatie sugereazã nu numai un alt mod de a privi sedimentele dar
indicã și o posibilitate de reducere a fractiunilor granulo metrice la trei,
suficiente pentru a permite separarea clarã a celor cinci tipuri de sedimente.
Analiza în
componen ți principali
poate fi utilizatã în acest
mod pentru testarea
eficientei relative în
separarea tipurilor de
sedimente și a altor
coeficien ți sau parametri
statistici (ex.: media,
mediana, coeficientul de
sortare).
3.2.4. Analiza factorialã R-MOD
În analiza factorialã R-MOD (R este simbolul mate matic al matricii de
corela ție) relatiile dintre m variabile mãsurabile sunt privite ca o reflectare a
corela ției acestora cu p factori necorela ți. Presupunerea uzualã este cã
mp<.
Rezultã cã varian ța totalã are douã componente: una determinatã de
p factori comuni și alta individualã/specificã fiecãrei variabile.
Modelul matematic poate fi exprimat sub forma: Fig. 81 Separarea tipurilor de sedimente func ție
de con ținutul în nisip (OX) și raportul nisip
fin/nisip foarte fin (OY) 20 40 60 80 3,5
100 3,0
2,5
2,0
1,5
1,0
0,5
0
88/124
j rp
rjr j fl X ε+ =∑
=1
(III.264)
în care:
rf – factorul comun;
p – numãrul de factori;
jr l – încãrcarea factorului r pe variabila j;
jε – varia ția aleatoare specificã variabilei jX;
Presupunând o distributie normalã multivariatã a va riabilelor jX, varian ța și
covarian ța formeazã o matrice [ ]mm× ale cãrei elemente diagonale sunt de
forma:
jp
rjr jr l s εvar
12 2+ =∑
=
(III.265)
iar restul elementelor de forma:
∑
==p
rkr jr jk ll
1cov
(III.266)
Dacã notãm matricea varian țã-covarian țã cu 2s, cu L matricea [ ]pm×
a încãrcãrilor factoriale și cu () [ ]jεvar matricea diagonalã [ ]mm× cu variantele
aleatoare specifice fiecãrei variabile, avem rela ția:
[][][] () [ ]jTLL s εvar 2+ ∗ =
(III.267)
Produsul [][]TLL∗ conduce la o matrice [ ]mm× cu p valori proprii
pozitive și cu vectorii proprii asocia ți. Dacã mp=, matricea () [ ]0 var =jε și
problema este echivalentã cu Analiza în Componen ți Principali.
Analiza Factorialã cere ca numãrul de factori sã f ie mai mic decât
numãrul de variabile și sã fie cunoscut înainte de începerea analizei. Ac est
lucru presupune de ținerea unor informa ții suplimentare fa țã de datele
numerice ce vor fi prelucrate și din care sã rezulte numãrul de factori ce
trebuie extra și. Dacã p nu este cunoscut, împãrtirea variantei între facto rii
comuni și factorii specifici poate fi rezolvatã într-un num ãr practic nelimitat de
variante.
a)Diferenta operationalã dintre A.C.P. și A.F.R.-MOD
Calculul valorilor proprii și vectorilor proprii în analiza factorialã R-MOD
se face plecând de la matricea de corela ție. Acest lucru implicã transformarea
componentelor principale ale vectorilor în factori.
Vectorii proprii obtinuti din matricea de corela ție sunt normalizati (adicã
suma ponderilor este unitarã) și pentru a putea realiza analiza factorialã
89/124
trebuie convertitã valorea unitarã a vectorului înt r-o valoare a cãrei lungime sã
reprezinte valoarea proprie corespunzãtoare. Acest lucru se face prin
multiplicarea fiecãrei componente a vectorului prop riu normalizat cu rãdãcina
pãtratã a valorii proprii corespunzãtoare. Rezultat ul este un factor, adicã un
vector care este ponderat proportional cu mãrimea v arian ței totale pe care o
reprezintã.
Pentru matricea de corela ție:
=00 , 1 86 , 086 , 0 00 , 1COV
cu valorile și vectorii proprii:
86 , 11=λ și [ ]707 , 0 707 , 01=V
14 , 02=λ și [ ]707 , 0 707 , 01−=V
factorii ce înglobeazã varian ța ansamblului sunt:
=
××=964 , 0964 , 0
86 , 1 707 , 086 , 1 707 , 01 FACTOR
−=
∗∗ −=264 , 0264 , 0
14 , 0 707 , 014 , 0 707 , 02 FACTOR
Verificarea corectitudinii convertirii vectorilor proprii standardizati în
factori se face prin însumarea pãtratelor ponderilo r factoriale care trebuie sã
fie egale cu valorile proprii:
0,964 2 + 0,964 2 = 1,86 și (-0,264) 2 + 0,264 2 = 0,14
Primul factor reprezintã 1,86/2,00=93% din varia n ța totalã a
variabilelor originale. Din aceastã varian țã 0,964 2/1,86=50% este ponderea
variabilei 1 și 0,964 2/1,86=50% este ponderea variabilei 2.
Al doilea factor reprezintã 0,14/2,0=7% din varian ța totalã a datelor cu
(-0,264) 2/0,14=50% pondere pentru prima variabilã și 0,264 2/0,14=50%
pentru a doua.
Cei doi factori redau 100% din varian ța totalã iar scrierea matricialã
utilizatã pentru exprimarea ponderilor factoriale e ste:
FACTORI
I II
VARIABILE:
264 , 0 964 , 0264 , 0 964 , 0
21
Prin însumarea pãtratelor ponderilor factoriale pe ntru fiecare variabilã
se ob ține mãrimea totalã a varian ței retinutã de factori care poartã numele de
comunalitate. Pentru matricea []22× luatã ca exemplu, comunalitãtile pentru
ambele variabile sunt unitare:
Variabila 1: ( )( )1 264 , 0 964 , 02 2
12= −+ =h
Variabila 2: ( )( )1 264 , 0 964 , 02 2
22= + =h
90/124
Dacã numãrul factorilor extra și coincide cu numãrul variabilelor,
comunalitãtile sunt egale cu varian ța originalã și pentru cã se lucreazã cu
variabile standardizate ea va fi egalã cu unitatea.
Dacã se extrag mai putin de m factori ( m = nr. variabile) comunalitãtile
vor fi subunitare și vor fi un coeficient al eficientei setului de fac tori relativ la
exprimarea varian ței setului original de date. Spre exemplu, dacã se retine
numai primul factor comunalitãtile matricii factori lor sunt:
93 , 0 964 , 02
12= =h pentru variabila 1;
93 , 0 964 , 02
22= =h pentru variabila 2.
Mãrimea comunalitãtii este dependentã de numãrul d e factori ale și și
aceasta ridicã marile probleme ale analizei factori ale.
b)Câti factori trebuie ale și?
Problema alegerii factorilor nu are solu ție unicã fiind o problemã de
optiune:
a) psihologii experimentalisti extrag atâtia factor i cât cere teoria accceptatã
pentru studiul esantonului de date;
b) se extrag atâtia factori cât pot fi reprezentati grafic (2 sau 3);
c) se extrag toti factorii proprii care au valori p roprii mai mari ca 1, adicã
factorii care contin varian țe mai mari decât cele ale variabilelor standardizat e.
Dacã pentru retinerea unei mari pãrti din varian ța totalã a sistemului
este nevoie de multi factori, modelul analizei fact oriale se considerã
neadecvat analizei esantionului de date disponibil.
c)Aplicatii
Un exemplu clasic pentru aplicarea analizei factor iale R-MOD este
separarea a 25 prisme rectangulare (Tabelul III.35 ) dupã formã și mãrime
(cei doi factori) pe baza unui numãr de 7 variabile :
X1 = axa lungã;
X2 = axa intermediarã;
X3 = axa scurtã;
X4 = cea mai lungã diagonalã;
X5 = (raza sferei circumscrise)/(raza sferei înscr ise)
X6 = (axa lungã +axa intermediarã)/(axa scurtã)
X7 = (aria totalã/volumul)
În tabelele III.35b și III.36 sunt prezentate matricea de corela ție, valorile
proprii și matricea vectorilor proprii, pentru prelucrare și interpretare fiind
retinuti doar primii doi factori (corespunzãtori fo rmei și mãrimii) pentru care
valorile proprii corespunzãtoare sunt supraunitare.
Etapele de prelucrare ale cãror rezultate intermed iare sunt sintetizate
în tabelele III.35, 36 și 37 sunt:
91/124
Tabelul III.35 Dimensiunile a 25 de prisme generate aleator
Nr.crt. X1 X2 X3 X4 X5 X6 X7
1 3,760 3,660 0,540 5,275 9,768 13,741 4,782
2 9,840 9,270 1,510 13,604 9,017 12,668 1,745
3 8,390 4,920 2,540 10,053 3,956 5,237 1,432
4 4,940 4,380 1,030 6,678 6,494 9,059 2,807
5 7,230 2,300 1,770 7,790 4,393 5,374 2,274
6 9,460 7,310 1,040 11,999 11,579 16,182 2,415
7 9,550 5,350 4,250 11,742 2,766 3,509 1,054
8 4,940 4,520 4,500 8,067 1,793 2,103 1,292
9 8,210 3,080 2,420 9,097 3,753 4,657 1,719
10 9,410 6,440 5,110 12,495 2,446 3,103 0,914
11 5,900 5,760 1,550 8,388 5,395 7,497 1,973
12 1,660 1,610 1,570 2,799 1,783 2,087 3,716
13 5,510 1,340 1,270 5,808 4,566 5,382 3,427
14 4,690 3,010 2,170 5,983 2,760 3,554 2,013
15 7,120 5,490 3,680 9,716 2,642 3,430 1,189
16 8,590 2,980 1,170 9,170 7,851 9,909 2,616
17 9,730 1,330 1,000 9,871 9,871 11,064 3,704
18 9,640 9,490 1,030 13,567 13,133 18,519 2,354
19 8,740 7,000 3,310 11,675 3,529 4,757 1,119
20 3,270 0,620 0,440 3,357 7,629 8,838 8,389
21 5,510 3,980 1,300 6,924 5,326 7,304 2,403
22 9,030 7,080 2,590 11,762 4,539 6,217 1,276
23 7,570 7,280 7,070 12,662 1,791 2,101 0,822
24 6,220 6,140 4,520 9,842 2,175 2,732 1,089
25 8,590 4,990 1,340 10,022 7,500 10,162 2,130
Tabelul III.35b Matricea de corela ție
Variabilele X1 X2 X3 X4 X5 X6 X7
X1 1,000
X2 0,580 1,000
X3 0,201 0,364 1,000
X4 0,911 0,834 0,439 1,000
X5 0,283 0,166 -0,704 0,163 1,000
X6 0,287 0,261 -0,681 0,202 0,990 1,000
X7 -0,533 -0,609 -0,649 -0,676 0,427 0,357 1,000
Tabelul III.36 Valorile proprii
Vector Valoare proprie Varian țã totalã Var.cumulatã [%]
I 3,3946 48,4949 48,4949
II 2,805 40,0783 88,5731
III 0,4373 6,2473 94,8204
IV 0,2779 3,9707 98,7911
V 0,0810 1,1565 99,9476
VI 0,0034 0,0487 99,9963
VII 0,0003 0,0037 100,0000
92/124
Tabelul III.37 Vectorii proprii
Variabile I II III IV V VI VII
X1 0,4053 -0,2929 -0,6674 0,0888 -0,2267 0,4098 -0,2782
X2 0,4316 -0,2224 0,6980 -0,0338 -0,4366 0,1443 -0,2540
X3 0,3854 0,3559 0,1477 0,6276 0,5121 0,1875 -0,108 1
X4 0,4939 -0,2323 -0,1186 0,2103 -0,1054 -0,5878 0,5359
X5 -0,1277 -0,5751 0,0294 0,1108 0,3890 -0,4232 -0,5562
X6 -0,0968 -0,5800 0,1743 -0,0061 0,3549 0,5003 0,4975
X7 -0,4809 -0,1303 0,0176 0,7353 -0,4553 0,0332 0,0489
1. Calculul ponderilor factorilor comuni prin multi plicarea ponderilor
normalizate cu radicalul valorilor proprii:
X1 X2 X3 X4 X5 X6 X7
[ ]
−− − −
=218 , 0 971 , 0 963 , 0 389 , 0 596 , 0 373 , 0 491 , 0886 , 0 178 , 0 235 , 0 910 , 0 710 , 0 795 , 0 747 , 0
FactII FactI LT
2. Calculul comunalitã ților prin însumarea pãtratelor ponderilor factorial e
pentru fiecare variabilã prin luarea în considerare a primilor doi factori
conduce la:
( )
( )
( )
( )
=
+ −+ −+ −+−+++
=
7654321
833 , 0976 , 0983 , 0979 , 0860 , 0771 , 0798 , 0
218 , 0 886 , 0971 , 0 178 , 0963 , 0 235 , 0389 , 0 910 , 0596 , 0 710 , 0373 , 0 795 , 0491 , 0 747 , 0
2 22 22 22 22 22 22 2
2
XXXXXXX
pentru H
3. Calculul varian ței reziduale care exprimã ponderea componentei spec ifice
(jε):
=
−−−−−−−
=
7654321
167 , 0024 , 0017 , 0021 , 0140 , 0229 , 0202 , 0
Re
2
72
62
52
42
32
22
1
XXXXXXX
pentru
HlHlHlHlHlHlHl
z
Dacã sunt retinuti m factori dintr-un set de m variabile matricea de
covarian țã originalã []2s poate fi generatã prin multiplicarea tuturor perec hilor
de ponderi factoriale și însumarea acestora pentru toti factorii.
Când mp< matricea originalã nu poate fi reprodusã exact. Pe ntru
variabilele j și k covarian ța reproductibilã este datã de rela ția:
93/124
kp jp k j k j jk ll llll s ×++×+×= … 2 2 1 12
(III.268)
în care 1jl este încãrcarea variabilei j pe factorul 1. Notând cu L matricea
încãrcãrilor factoriale rezultã cã matricea reprodu ctibilã pe baza celor p
factori se poate calcula prin:
[][][]TL L s × =2 '
Reziduul matricii varian țã-covarian țã poate fi calculat prin diferenta:
[][][][ ] rezidual Ts L L s2 2= × −
(III.269)
Analiza factorialã este aplicatã cu eficientã în s epararea faciesurilor
calcaroase. Toomey (1966) a determinat pentru calca rele de Leavenworth
(Pensilvanian superior =Carbonifer superior) din no rdul regiunii Midcontinet 19
tipuri de constituenti petrografici: calcit spatic, micrit, pellete, trilobiti,
ostracode, moluste, brachiopode, spiculi de spongie ri, echinoderme,
fusulinide, foraminifere mobile, foraminifere încru state, Tubiphytes,
Epimastopore, alge cu structurã laminarã, granule c u învelis algal și particule
de schelete necunoscute. Datele au fost determinate în 33 de probe și pe
baza lor au fost delimitate cinci grupuri bine indi vidualizate: grupul fusulinide
calcit, grupul micrit, grupul foraminifere mici, gr upul cochilii-briozoare și grupul
granulelor cu învelis algal, din care primele patru formeazã un cluster cu
coeziunea internã mai mare.
Analiza factorialã R-MOD poate fi utilizatã pentru separarea cu
eficientã maximã și totalã obiectivitate a tipurilor de cãrbune pe ba za
parametrilor fizico-chimici care se determinã în mo d clasic: grosime, greutate
specificã, cenusã, umiditate, substante volatile, s ulf, continut în carbon, putere
calorificã etc.
3.2.5.Rotatia factorilor
De și analiza factorialã poate reduce dimensionalitatea unei probleme
pentru a o face mai usor de studiat, semnificatia f actorilor poate fi dificil de
dedus. Aceastã dificultate poate fi determinatã de faptul cã pozitia a p axe
factoriale ortogonale într-un spatiu m dimensional ( mp<) sunt fortate de
pm− axe inutile care de asemenea trebuie plasate ortog onal în spatiul de
probare.
Deoarece avem nevoie numai de p axe factoriale, dupã eliminarea
axelor inutile pare posibil și avantajos sã rotim axele factoriale pentru a gãsi o
pozitie care sã maximizeze varian ța încãrcãrilor factoriale.
Metoda KAISER-VARIMAX are ca obiectiv rotirea fiec ãrei axe în pozitia
în care proiectia fiecãrei variabile sã se plaseze în vecinãtatea extremitãtii sau
94/124
originii sistemului de axe factoriale. Metoda opere azã prin ajustarea
încãrcãrilor factoriale astfel încât ele sã fie ori aproape de 1±, ori aproape de
zero. În acest mod pentru fiecare factor vor fi cât eva ponderi semnificative iar
restul aproximativ nule.
Totu și, în unele cazuri, rotirea rigidã a axelor prin pã strarea
ortogonalitãtii nu va îmbunãtãti sau chiar poate co nduce la rezultate confuze.
Aceste situatii pot indica o corelare a factorilor (factori oblici) sau neadecvarea
modelului factorial pentru analiza sistemului.
Criteriul VARIMAX implicã maximizarea varian ței încãrcãrilor factoriale.
Se poate defini varian ța încãrcãrilor pe factorul k sub forma:
212
1222
22
2
phl
hlp
sm
jm
j
jjp
jjp
k∑ ∑= =
−
=
(III.270)
Cantitatea care trebuie minimizatã este:
∑
==p
kks V
12
(III.271)
Varian ța este calculatã din încãrcãrile factoriale jp l care sunt corectate
prin divizarea lor cu comunalitatile 2
jh, astfel încât numai partea comunã a
varian ței fiecãrei variabile este luatã în considerare înd epãrtând
constrângerile impuse de cele pm− componente (necesare pentru luarea în
considerare a întregii varian țe a sistemului).
Maximizarea varian ței implicã mãrirea domeniului încãrcãrilor care
conduce la "extremizarea" ponderilor.
Rotatia factorilor se face iterativ. Douã axe sunt ajustate simultan
considerând restul axelor stationare. Dupã ce toate axele au fost ajustate
procesul este reiterat pânã când cresterea varian ței încãrcãrilor la fiecare
iteratie rãmâne sub o anumita valoare.
Aplicatie. Rotatia axelor cu metoda Varimax. Consid erãm cazul ponderilor
factoriale pentru cei doi factori utilizati în sepa rarea prismelor (notate cu
1,2,…) pe baza formei și mãrimii.
Dupã rotatie, pozitia relativã a variabilelor nu s e schimbã ci numai
1,0 0,5 0,5 1,0
1
I II
-0,5 -1,0
-1,0 -0,5 2 4
3 5 6
7
1,0 0,5 0,5 1,0
1
I II
-0,5 -1,0
-1,0 -0,5 2 4
3 5 6
7
Fig. 82 Încãrcãrile factoriale înainte de
rotirea axelor Fig. 83 Încãrcãrile factoriale dupã
rotirea axelor
95/124
raportul fa țã de axele factoriale. Lungimea vectorilor este fun ctie de proportia
și varian ța originalã a fiecarei variabile preluatã de axele factoriale. În
exemplul prezentat, cei doi factori preluând 88,59% din varian ța sistemului,
lungimea vectorilor de pozitie este aproape unitarã .
Reprezentarea graficã a proiec țiilor factoriale (rotite sau nerotite) este
mult mai complicatã decât proiectarea pe axele comp onen ților principali.
Componen ții principali sunt transformãri liniare și deci putem proiecta datele
originale pe axele principale.
În analiza factorialã proiectiile datelor original e (=variabile mãsurabile)
pe axele factoriale reprezintã estimãrile contribut iilor diferitilor factori asupra
fiecãrei observatie (=proba în care se executã dete rminarea celor m
variabile). Deoarece factorii în șiși sunt estima ți din acelea și date, calculul
proiectiilor factoriale este un proces circular, ia r rezultatele nu sunt unice.
Calculul proiec țiilor factoriale este esen țial pentru studiile geologice.
Pentru explicitarea modului de calcul ne vom referi la setul ini țial de date []X
care este o matrice [ ]nm× (m – numãr variabile; n – numãr de probe).
În cazul ACP se poate calcula o matrice a proiec țiilor factoriale []F prin
multiplicarea matricii de date []X cu matricea încãrcãrilor factoriale []L:
[][][]F L X = ×
(III.272)
Dacã re ținem p factori, matricea încãrcãrilor []L va fi [ ]pm×, iar
matricea proiectiilor va fi [ ]pn×.
Se știe cã variabilele originale nu reprezintã numai ef ectul factorilor
comuni dar au și o componentã specificã ( )jε. Matricea proiec țiilor calculatã în
acest mod va reflecta par țial structura covarian ței datelor originale, în mãsura
în care factorii preiau aceastã covarian țã.
Influenta variatiei specifice ( )jε trebuie eliminatã pentru realizarea
proiec țiilor factoriale. Acest lucru se realizeazã prin mu ltiplicarea ecua ției
(III.273) cu inversul matricii de covarian țã:
[][][][]'12F L s X = × ×−
(III.273)
Deoarece inversarea matricii de covarian țã este laborioasã calculul nu
se realizeazã direct din aceastã ecua ție. Se calculeazã în primul rând
matricea []s prin înmultirea matricii încãrcãrilor factoriale cu transpusa ei:
[][][]S L LT= ×
(III.274)
Matricea obtinutã se inverseazã și se multiplicã cu []L obtinându-se
matricea coeficien ților proiectiilor factoriale []B:
[][][]B SL = ×−1
(III.275)
Matricea proiectiilor factoriale se ob ține din produsul cu matricea
datelor originale:
96/124
[][][]'F B X = ×
(III.276)
Sintetizând în termenii matricilor încarcãrilor fa ctoriale, opera ția se
poate scrie:
[][][]'F B X = ×
(III.277)
[][][][]'1F SL X = ××−
(III.278)
[][][][] ( )[]'1F L L L XT= × ××−
(III.279)
Aceea și procedurã este utilizatã pentru a ob ține proiec țiile factoriale în
cazul axelor rotite sau nerotite. De retinut cã mat ricea []X contine variabilele
standardizate și nu pe cele initiale din selectia de valori ca în A.C.P.,
deoarece A.C.P. calculeazã încãrcãrile componentilo r principali plecând de la
matricea de varian țã-covarian țã în timp ce încãrcãrile factoriale se calculeazã
plecând de la matricea de corela ție.
Problema specificãrii numãrului de factori p care trebuie retinuti este
criticã. Numãrul lor afecteazã mãrimea matricii rep roduse și reziduale,
comunalitãtile și încãrcãrile factoriale specifice ( jε). Încãrcãrile factoriale
comune nu sunt afectate.
Astfel, dacã 2=p și factorii sunt extra și din datele originale, încãrcãrile
pe factorii I și II nu sunt modificate dacã se extrage și un al treilea factor.
Totu și, dacã extragem și rotim doi factori, ponderile factoriale pot fi ra dical
diferite de cele obtinute dacã extragem și rotim trei factori din setul de date.
Când sunt extra și doi factori ei nu introduc constrângeri la rotati e ca atunci
când sunt extra și trei. Metoda Varimax pãstreazã orogonalitatea fac torilor.
Existã metode de rotatie a axelor factoriale care nu pãstrezã
ortogonalitatea, conducând la rezultate mai u șor de prelucrat deoarece se pot
ob ține mai multe ponderi factoriale extreme. Din punct de vedere interpretativ
apar contradic ții cu principiile metodei care presupune cã factori i comuni sunt
necorela ți, adicã ortogonali. Renun țând la restric ția ortogonalitã ții se admite
intercorela ția dintre factori.
Dacã factorii sunt corela ți între ei, relatiile între variabilele originale și
factorii identificati sunt mult mai complexe decât în modelul adoptat deoarece
interactiunile sunt atât între perechile de variabi le cât și între perechile de
factori. Prezenta corela țiilor între factori conduce la ideea cã existã alti
SUPERFACTORI independenti care actioneazã asupra va riabilelor mãsurate
și factorilor comuni separa ți la primul nivel. Solu țiile de rotatie oblicã introduc
mai multã subiectivitate în interpretare și trebuie abordate cu multã aten ție.
3.2.6. Analiza factorialã Q-MOD
Analiza factorialã Q-MOD, introdusã în geologie de Imbrie și Purdy
(1962), este o a doua formã de analizã factorialã î n care rolul valorilor (sau
probelor) și al variabilelor se schimbã. Prin aceastã analizã se urmare ște
97/124
eviden țierea corela țiilor dintre probe, având ca obiectiv gruparea lor într-o
structurã dendriticã din care sã poatã fi deduse re la țiile dintre ele.
În 1962, când au introdus analiza Q-MOD în cercetar ea geologicã,
Imbrie și Purdy au utilizat-o pentru realizarea unui sistem obiectiv de
clasificare a sedimentelor carbonatice actuale din Great Bahama Bank.
Metoda a mai fost utilizatã de Harbaugh și Demirmen (1964) pentru a
discerne limitele de facies din calcarele de Americ us.
Primul pas în analiza factorialã Q-MOD este crearea unei matrici de
similaritate []nn× în care n este numãrul de probe în care se face
determinarea diferitelor “m” caracteristici geologi ce, calitative sau cantitative.
Mãsura similaritã ții poate fi oricare dintre coeficien ții de similaritate defini ți in
capitolul III.2. cu valori cuprinse în intervalul [ ]1, 1+− . Cel mai utilizat coeficient
de similaritate în analiza Q-MOD este coeficientul cosinus θ.
Analiza factorialã Q-MOD are ca obiectiv identifica rea unui
hiperelipsoid
n-dimensional care este definit prin corela țiile dintre cei n vectori care
reprezintã cele n probe. Fiecare vector este determinat prin cele m variabile
care au fost mãsurate în fiecare probã și din acest motiv dimensionalitatea
problemei nu depã șeste numãrul variabilelor ( m).
Al doilea pas este identificarea principalelor axe ale hiperelipsoidului
prin extragerea valorilor și vectorilor proprii. Deoarece vor fi re ținute, de
fiecare datã, mai pu țini factori decât numãrul probelor, nu este necesar ã
extragerea tuturor valorilor și vectorilor proprii, acest lucru reducând mult din
timpul de calcul.
În al treilea pas se realizeazã maximizarea încãrcã rilor factoriale prin
rota ția axelor factoriale. Rota ția axelor se poate face pânã ce fiecare factor
coincide cu una din probele ce alcãtuiesc selec ția de date. Pe lângã tehnicile
ce pãstreazã ortogonalitatea axelor factoriale dupã rota ție, analiza factorialã
Q-MOD apeleazã și la rota ția ce conduce la oblicitatea axelor factoriale cu
implica țiile semnalate în paragraful anterior.
Aplica ție. Ca un exemplu al aplicãrii analizei Q-MOD, prezen tãm în
continuare o analizã petrograficã. Tabelul II.37 co n ține componen ții chimici
majori a 20 de e șantioane (1-Sienit, 2-Sienit, 3-Sienit, 4-Monzonit, 5-Diorit, 6-
Diorit, 7-Diorit, 8-Diorit cuar țitic, 9-Gabrou, 10-Gabrou, 11-Norit, 12-Norit, 13-
Gabrou cu hipersten, 14-Gabrou cu hipersten, 15-Sie nit, 16-Sienit cuar țitic,
17-Sienit alterat, 18-Monzonit, 19-Monzonit, 20-Dia baz). Prin analiza Q-MOD
se urmãre ște plasarea ficãrei probe în pozi ția proprie a seriei diferen țiate de
roci magmatice.
Plasarea probelor în succesiunea fireascã, determin atã de compozi ția
chimicã, se realizeazã prin utilizarea încãrcãrilor factoriale ce exprimã varian ța
ansamblului petrografic probat. Deoarece valorile v or fi standardizate, vectorii
defini ți vor avea lungimi unitare și probele vor fi plasate pe circumferin ța unui
cerc cu razã unitarã. Unghiurile dintre ace ști vectori sunt o mãsurã a
similaritã ții dintre probe. Pentru evaluarea matricii de simil aritate, ca rezultat al
primei etape de prelucrare se utilizeazã coeficient ul de cos θ, rezultatul fiind
consemnat în tabelul III.38 ( ANEXA 1).
98/124
Identificarea axelor este limitatã la primii doi fa ctori care asigurã în
etapa finalã o reprezentare graficã simplã. Încãrcã rile factoriale pentru fiecare
probã sunt sintetizate în tabelul III.39.
Tabelul III.39 Încãrcãrile factoriale pentru primii doi factori (I și II)
Proba I II Proba I II
1 0,9948 -0,0910 11 0,9833 0,1202
2 0,9918 -0,1223 12 0,9890 0,1259
3 0,9958 -0,0587 13 0,9721 0,1719
4 0,9989 -0,0126 14 0,9561 0,02323
5 0,9963 -0,0191 15 0,9918 -0,1257
6 0,9904 0,1188 16 0,9844 -0,1665
7 0,9959 -0,0838 17 0,9866 0,0783
8 0,9996 0,0010 18 0,9950 -0,0870
9 0,9983 0,0204 19 0,9945 -0,0946
10 0,9978 0,0223 20 0,9981 -0,0161
Rotirea axelor prin metoda Varimax maximizeazã vari an ța încãrcãrilor
factoriale (Tabel III.40) care permit reprezentarea graficã cea mai sugestivã a
grupãrii celor 20 de probe func ție de afinitãțile lor chimice (Fig. 84).
Tabelul III.40 Încãrcãrile factoriale dupã rota ție (pentru factorii I și II)
Proba I II 2h Proba I II 2h
1 0,7851 0,6177 0,9980 11 0,6316 0,7632 0,9814
2 0,8044 0,5959 0,9986 12 0,6319 0,7712 0,9940
3 0,7636 0,6418 0,9950 13 0,5879 0,7930 0,9745
4 0,7342 0,6774 0,9980 14 0,5348 0,8259 0,9681
5 0,7368 0,6709 0,9929 15 0,8068 0,5904 0,9995
6 0,6377 0,7671 0,9950 16 0,8295 0,5556 0,9968
7 0,7809 0,6236 0,9988 17 0,6628 0,7350 0,9796
8 0,7254 0,6878 0,9993 18 0,7825 0,6207 0,9976
9 0,7111 0,7009 0,9970 19 0,7873 0,6148 0,9979
10 0,7094 0,7020 0,9960 20 0,7360 0,6744 0,9965
În final trebuie remarcat cã analiza factorialã Q-M OD are acela și
obiectiv ca orice analizã a grupãrilor însã cu o ef icien țã mai mare datoratã
reducerii timpului de calcul, în condi țiile în care se apeleazã la mijloacele
automate.
Eficien ța metodei este sporitã și de faptul cã ea este aplicabilã și în condi țiile
în care matricea de similaritate con ține și coeficien ți negativi, caz în care
analiza factorialã R-MOD nu este utilizabilã.
Tabel III.37 Principalii oxizi din 20 de e șantioane recoltate dintr-o serie magmaticã
99/124
Nr.
probã X1=SiO 2 X2=Al 2O3 X3=Fe 2O3 X4=FeO X5=MgO X6=CaO X7=Na 2O X8=K 2O
1 61,7 15,1 2,0 2,3 3,7 4,6 4,4 4,5
2 58,3 17,9 3,2 1,7 1,5 3,7 5,9 5,3
3 51,2 17,6 3,5 4,3 3,2 4,5 5,7 4,4
4 54,4 14,3 3,3 4,1 6,1 7,7 3,4 4,2
5 58,0 15,7 0,7 2,8 5,0 10,9 3,0 3,2
6 46,6 15,9 2,9 10,0 7,0 9,6 2,7 0,7
7 58,0 17,3 2,2 3,8 2,2 4,3 4,3 4,1
8 55,5 16,5 1,7 4,6 6,7 6,7 3,2 2,5
9 55,4 15,3 2,7 5,5 5,8 9,9 2,9 1,5
10 55,9 13,5 2,7 5,9 6,5 8,9 2,4 1,7
11 47,2 14,5 1,6 13,8 5,2 8,1 3,1 1,2
12 48,2 18,3 1,3 6,1 10,8 9,4 1,3 0,7
13 44,8 18,8 2,2 4,7 11,3 14,6 0,9 0,1
14 47,0 14,1 0,8 15,0 16,0 2,3 0,4 1,7
15 59,8 17,3 3,6 1,6 1,2 3,8 5,0 5,1
16 66,2 16,2 2,0 0,2 0,8 1,3 6,5 5,8
17 50,0 9,9 3,5 5,0 11,9 8,3 2,4 5,0
18 57,4 18,5 3,7 2,1 1,7 6,8 4,5 3,7
19 59,8 15,3 3,8 3,3 2,2 3,9 3,0 4,4
20 52,2 18,2 3,3 4,4 4,7 6,5 4,6 1,9
100/124
3.3. Modelarea matematic ă a corela țiilor substan țiale
Exprimarea într-o formã sinteticã a sistemului de corela ții între
caracteristicile unui proces este obiectivul final al oricãrei cercetãri
sistematice. Modelul operational rezultat din forma lizarea matematicã a
sistemului de corela ții este o constructie intelectualã care înlocuieste "vizibilul
complicat" (procesele fizico-chimice studiate) cu " invizibilul" (ecua ții, sisteme
etc.) u șor de manevrat.
În func ție de calitatea descrierii (completã sau de tendint ã), scara
modelului (atomicã, macroscopicã), caracterul intri nsec (determinist,
probabilist, linear, nelinear), structura matematic ã (algebric, în diferen țe finite
sau element finit, diferen țial) existã o diversitate de modele aplicabile stud ierii
proceselor geolgice. În continuitate imediatã cu de mersul statistic de
prelucrare a informatiilor geologice prezentãm cea mai simplã modalitate de
formalizare empiricã a rela țiilor dintre variabilele unui proces geologic
complex: modelarea linearã a corela țiilor substan țiale.
3.3.1. Model liniar de o singurã variabilã independ entã
Cel mai simplu model pentru corela ția între douã variabile geologice
este cel liniar, în care se presupune cã dependen ța poate fi descrisã prin
ecua ția unei drepte:
ex y + + =1 0α α
(III.277)
în care
y – variabila dependentã (= rezultativã);
x – variabila independentã (= factorialã);
1 0,αα – parametrii modelului;
101/124
e – eroarea de estimare a modelului.
Existã douã modele liniare limitã pentru dependen ța dintre douã
variabile geologice x și y:
a) ambele variabile ( x și y) sunt afectate de erori întâmplãtoare ( Fig. 85 );
b) variabila independentã ( x) este cunoscutã riguros, iar variabila dependentã
(y) este afectatã de erori distribuite normal ( Fig. 86 ).
Modelul a) este adecvat studierii corela ției con ținuturilor de Au și Ag
dintr-un zãcãmânt sau dintre granulozitate și porozitate într-un acvifer nisipos,
iar modelul b) se recomandã pentru studiul corela ției între adâncime ( x) și
con ținutul în Au ( y) sau între adâncimea ( x) și gradul de saturare ( y) din
zona de aerare a unui acvifer freatic.
Pentru studiul complet al corela ției liniare între douã variabile este
necesarã parcurgerea unui numar de patru etape de p relucrare.
3.3.1.1. Analiza graficã a corela ției
Reprezentarea
graficã a reparti ției
bidimensionale a variabilelor
analizate este cea mai
rapidã formã de identificare
calitativã a existen ței
corela ției. Ea se poate
analiza în trei variante:
diagrama de împrã știere,
stereograma și dreapta de
corela ție.
Fig. 86 Model liniar cu o singurã variabilã (y)
afectatã de erori x
yin
102/124
a)Diagrama de împrã știere
Diagrama de împrã știere este cea mai simplã formã de reprezentare
graficã în care utilizând un sistem de referin țã rectangular, fiecare pereche de
valori mãsuratã ( i iyx,) se materializeazã printr-un punct. Se ob ține în acest
mod o mul țime de puncte a cãrei configura ție geometricã sugereazã prezen ța 2y1y1x2xx
yxy n
Fig. 85 Model liniar cu ambele variabile (x,y) afectate de erori aleatoare
Fig. 87 Diagrame de împrã știere 0 2 4 6 8 10 12 14 16 18 20 1 2 3 4 5 6 7 8 9
0
ZINC PLUMB
103/124
sau absen ța corela ției între cele douã variabile ( Fig. 87 ).
Punctele pot avea o distribu ție: haoticã – corela ția între cele douã
variabile fiind nulã, concentratã pe o zonã alungit ã rectilinie – corela ția fiind de
tip liniar sau concentratã pe o zonã alungitã curbi linie, situa ție în care se
presupune existen ța unei corela ții neliniare între cele douã variabile.
Diagrama de corela ție poate fi realizatã și cu valori standardizate,
variantã recomandatã atunci când valorile sunt expr imate în unitã ți de mãsurã
diferite și au amplitudini de selec ție dispropor ționate.
b)Stereograma
Stereograma este o reprezentare tridimensionalã ca re se bazeazã pe
gruparea bidimensionalã a valorilor celor douã vari abile dupã aranjarea în
ordine crescãtoare a variabilei independente. Inter valele de grupare care
formeazã compartimentele tabelului de corela ție (Tabel III.41), pentru ambele
variabile se stabilesc dupã acelea și criterii ca cele stabilite pentru descrierea
univariatã.
Tabelul III.41 Tabel de corela ție pentru douã variabile ( yx,)
y
x 1y 2y … ky … ny
1x
11yxn
21yxn …
kyxn
1 …
1xn
2x
12yxn
22yxn …
kyxn
2 …
2xn
… … … … … … …
lx
1yxln
2yxln …
klyxn …
lxn
xy
1yn
2yn …
kyn … n
În tabelul de corela ție apar trei tipuri de frecven țe:
1) frecven ța valorilor perechi (
iiyxn) reprezintã numãrul de perechi pentru
fiecare interval de grupare.
104/124
2) frecven țe par țiale dupã variabila X (
ixn) care reprezintã numãrul de valori
ale variabilei Y corespunzãtoare unei valori ix sau valorii centrale a
intervalului i,
icx, care se calculeazã însumând frecventele perechilo r de valori
de pe un rând al tabelului III.41.
∑
==k
jyx xji in n
1 ( )l i ,…, 2 , 1=
(III.278)
3) frecven țele par țiale dupã variabila Y (
iyn) se evalueazã în mod analog pe
coloanele tabelului III.41.
∑
==l
jyx yij in n
1 ( )k i ,…, 2 , 1=
(III.279)
Stereograma se ob ține prin construirea pentru fiecare compartiment al
tabelului de corela ție a unui paralelipiped având înãl țimea propor ționalã cu
frecven țele perechilor de valori. Suprafa ța care îmbracã stereograma poartã
denumirea de suprafa țã de frecven țã și oferã o imagine globalã a corela ției
între cele douã variabile într-un spatiu tridimensi onal.
c)Dreapta de corela ție
Dreapta de corela ție reprezintã grafic tendin ța pe care o urmeazã
media unei variabile în compara ție cu valorile celeilalte variabile. Se
construiesc douã drepte de corela ție pentru fiecare cuplu de douã variabile
(yx,):
a) dreapta de corela ție corespunzãtoare modelului ()xfy= în care
pentru fiecare ix se determinã și se reprezintã valoarea medie ( Fig. 89 ).
b) dreapta de corela ție corespunzãtoare modelului ()yfx= în care
pentru fiecare valoare iy se calculeazã și se reprezintã grafic ( Fig. 90 ).
105/124
Linia în jurul cãreia se grupeazã punctele se nume ște linie de regresie
și pentru foarte multe caracteristici geologice este rectilinie. Raporturile
spa țiale dintre cele douã drepte de regresie ( ()yfx= și ()xfy= ) exprimã
intensitatea corela ției dintre variabilele analizate:
1) independen ța, dacã cele douã linii de regresie sunt ortogonale (Fig. 91a);
2) dependen ța totalã, dacã cele douã linii de regresie coincid (Fig. 91b);
3) dependen ța intermediarã, dacã cele douã linii de regresie fo rmeazã un
anumit unghi, unghi a cãrui mãrime este invers prop or ționalã cu intensitatea
corela ției (nulã când unghiul este de 90 o).
Cele trei modele de reprezentare graficã a distrib u ției bidimensionale a
unui cuplu de variabile geologice exprimã doar cali tativ intensitatea corela ției,
care poate fi cuantificatã prin intermediul unor pa rametri. 1x
106/124
3.3.1.2. Evaluarea intensitã ții corela ției liniare
Din reprezentãrile grafice se pot deduce la nivel calitativ inexisten ța
corela ției sau existenta unei corela ții directe sau inverse. Cele douã variabile
sunt corelate direct dacã valorile mari ale uneia t ind sã se asocieze cu cele
mari ale celeilalte. In rocile poroase, porozitatea și permeabilitatea sunt un
exemplu tipic de variabile pozitiv corelate. Douã v ariabile geologice sunt
corelate negativ dacã valorile mari ale uneia tind sã se asocieze cu valorile
mici ale celeilalte. Corela ții negative se stabilesc de obicei între concentrat iile
a douã elemente majore, de exemplu în rocile dolomi tice continutul în calciu
este în mod normal corelat negativ cu continutul de magneziu.
Sub aspect cantitativ, intensitatea corela ției lineare se poate cuantifica
prin intermediul coeficientului de corela ție Pearson și a coeficentului de
corela ție a rangurilor.
a)Coeficientul de corela ție Pearson
Coeficientul de corela ție este cel mai utilizat parametru pentru
cuantificarea intensitãtii corela ției liniare a douã variabile și se calculeazã cu
rela ția:
( )( )
( ) ( )r
my mxmymx
yn
in
i y i x in
i y i x i
xxy =
− −− −≈ =
∑ ∑∑
= ==
1 12 21
σσσρ
(III.280)
Coeficientul de corela ție ()ρ are valori cuprinse între -1 și +1, indiferent
de amplitudinea selec ției de date. Valorile extreme ale coeficientului de
corela ție liniarã indicã o aliniere perfectã a punctelor î ntr-o diagramã de
împrãstiere de-a lungul unei drepte fie cu panta po zitivã ( 1=ρ ; corela ție
pozitivã), fie cu panta negativã ( 1−=ρ ; corela ție negativã.
107/124
Pentru valori 1<r (r fiind estimatorul lui ρ), distribu ția punctelor se abate de
la linia dreptei devenind din ce în ce mai difuzã c u cât r descre ște de la 1
spre 0.
Valoarea coeficientului de corela ție este puternic influentatã de
existenta perechilor aberante de puncte. O bunã ali niere a câtorva valori
extreme poate creste foarte mult valoarea coeficien tului de corela ție pentru
douã variabile slab corelate și invers, o bunã corela ție poate fi "distrusã" de
slaba aliniere a câtorva valori extreme.
Aplicatie . Pentru analiza
corela ției între continuturile în
Au și Ag din zãcãmântul Cavnic
filonul 80 s-a evaluat un
coeficient de corela ție 64 , 01=r
cu luarea în cosiderare a tuturor
valorilor selectiei în care era
inclusã și o pereche de valori
afectatã de erori de mãsurare
(Fig. 92). Prin eliminarea acestei singure perechi de valori și recalcularea
coeficientului de corela ție s-a ob ținut 84 , 02=r .
Dacã rela ția dintre douã variabile nu este linearã, coeficien tul de
corela ție ( r) poate avea o valoare foarte micã. Din acest motiv este deseori
util sã se suplimenteze utilizarea lui cu cea a coe ficientului de corela ție a
rangurilor.
b)Coeficientul de corela ție a rangurilor
Coeficientul de corela ție a rangurilor ()rρ se calculeazã aplicând
formula de calcul a coeficien ților de corela ție Pearson rangurilor valorilor
variabilelor.
108/124
( )( )
( ) ( )in
in
i yR y R xn
i R y R x
RxRxy R
r r
m R m Rm R m R
i x iy i x i
y=
− −− −
≈ =
∑ ∑∑
= ==
1 12 21
σσσρ
(III.281)
în care:
i i y xRR, – rangul valorii ix respectiv iy;
y x R Rσσ, – abaterea standard a rangurilor valorilor variabi lelor x, respectiv y;
y x R Rmm, – media rangurilor valorilor
nx x R R,…,
1, respectiv
ny y R R,…,
1.
O mare diferentã între rρ și ρ poate fi deseori determinatã de
prezen ța unei perechi de valori extreme. Spre deosebire de coeficientul de
corela ție ( r), coeficientul de corela ție a rangurilor ( rr) nu este atât de sensibil
la perechi extreme de valori. O valoare mare a coef icientului de corela ție a
rangurilor și una micã a coeficientului de corela ție Pearson poate fi datoratã
faptului cã un numãr redus de perechi aberante afec teazã buna corela ție a
variabilelor studiate. Dacã coeficientul de corela ție a rangurilor este mare și
coeficientul de corela ție Pearson mic este posibilã o "îmbunãtã țire" falsã a
corela ției prin prezenta câtorva valori extreme bine "alin iate".
Pentru situatia prezentatã anterior valorile cores punzãtoare ale
coeficientului de corela ție a rangurilor sunt: 80 , 0
1=rr înainte de eliminarea
valorii extreme și 79 , 0
2=rr , eliminarea valorii aberante avand o influenta mul t
mai micã asupra coeficientului de corela ție a rangurilor decât asupra
coeficientului de corela ție r.
Diferenta dintre r și rr poate fi revelatoare și asupra altui aspect al
corela ției între cele douã variabile: cel al liniaritãtii. Dacã 1+=rr , adicã
rangurile celor douã variabile sunt identice, valor ilor mari ale variabilei x le
corespund valori mari ale variabilei y, corela ția are intensitate maximã dar ea
nu este obligatoriu de tip linear. Neliniaritatea c orela ției este evidentiatã de
valorile mici ale ale coeficientului de corela ție ( r).
109/124
3.3.1.3.Testarea adecvãrii modelului liniar
Adecvarea unui model liniar este sintetizatã în ev aluarea semnificatiei
statistice a coeficientului de corela ție care se poate realiza în douã etape
succesive: cea a acceptãrii (functie de valoarea ca lculatã) existentei unei
corela ții liniare și cea de evaluare a incertitudinii asupra intensitã tii acesteia.
Testarea statisticã a existentei corela ției liniare se poate realiza cu
ajutorul testului STUDENT aplicat ipotezelor statis tice:
( )
( )
≠=
liniare corelatiei prezenta Hliniare corelatiei absenta H
0 :0 :
10
ρρ
Pentru testarea inexistentei corela ției ( )0=ρ se calculeazã valoarea:
2exp 12
rrn t
−− =
(III.282)
care se comparã cu valorile reparti ției STUDENT ()να,t cu 2−=nν .
În alternativã ()να,exp t t< se acceptã ipoteza absen ței corela ției liniare
între cele douã variabile. Dacã ()να,exp t t> , din punct de vedere statistic se
admite existen ța unei corela ții liniare între cele douã variabile și se trece la
etapa de evaluare a incertitudinii asupra valorii r calculate.
Calculul intervalului de încredere pentru valoarea coeficientului de
corela ție ρ se poate realiza utilizând variabila cu reparti ție normalã propusã
de Fisher:
rrz−+=11ln 21
(III.283)
Pentru calculul intervalului de încredere al coefic ientului de corela ție
(ρ) se utilizeazã rela țiile:
11
11
21
21
22
sup 22
inf +−= <<+−=zz
zz
eereer ρ
(III.284)
în care:
znps zz −=1 (III.285)
110/124
znps z z +=2
(III.286)
np – argumentul func ției inverse Laplace ( 1−Φ) pentru o anume probabilitate
(p) de verificare a ipotezei testate.
31
−=
nsz – abaterea standard a variabilei z.
Pe baza abaterii standard a coeficientului de core la ție
nrsr21−=
(III.287)
intervalul de încredere al coeficientului de corela ție pentru o probabilitate p
se calculeazã cu rela ția:
nrnp r
nrnp r2 21 1 −+<<−− ρ
(III.288)
3.3.1.4. Parametrii modelului
Evaluarea parametrilor modelului statistic liniar parcurge cele douã
etape clasice de calcul al parametrilor pe baza e șantionului de date
disponibile și de evaluare a incertitudinii acestor parametri.
a) Calculul parametrilor
Calculul parametrilor 0a și 1a ca estima ții de selec ție ale parametrilor
(0α și 1α) se realizeazã prin metoda celor mai mici pãtrate care constã în
minimizarea sumei pãtratelor abaterii valorilor sel ec ției de la ecua ția generalã.
Notând suma pãtratelor abaterilor de la modelul li niar:
( )[ ]∑
=− − =n
ii i xaa y SPA
12
1 0
(III.289)
prin derivare în raport cu 0a și 1a se ob ține sistemul de ecua ții normale
111/124
= += +
∑ ∑∑∑ ∑
= = == =
n
in
iii in
iin
in
ii i
yx x ax ay x ara
1 12
1
101 11 0
(III.290)
Prin rezolvarea sistemului (III.290 ) se ob țin solu țiile:
=− =
xx xy x
xx xy
y
ssamssm a
10
(III.291)
în care:
xm – media valorilor variabilei x: ∑
=n
ii x nx m
1/
ym – media valorilor variabilei y: ∑
=n
ii x nx m
1/ ??
∑ ∑∑
= = =− =n
in
iin
ii i xy y xnx s
1 1 121
(III.292)
∑ ∑
= =
− =n
in
ii i xx xnx s
12
121
(III.293)
b) Evaluarea incertitudinii
Evaluarea intervalului de încredere pentru paramet rii modelului ( 1,αα )
se bazeazã pe amploarea fluctua țiilor variabilei y în jurul modelului
determinatã de parametrii calcula ți 0a și 1a:
( )∑
=−−= ≈n
iy i y y myns
12 2 2
11σ
(III.294)
Parametrul 0a, ce estimeazã parametrul necunoscut 0α, are o
distribuție ( )0 0,σαN în care:
112/124
( )∑ ∑
= =
− =n
in
ix i i y mx nx
1 12 2 2 2/
0σ σα
(III.295)
Variabila:
( )
0/0 0 exp α α sa t − =
(III.296)
are o distributie t cu 2−=nν grade de libertate în care
( )∑ ∑
= =
− =n
in
ix i i y mx nx s s
1 12 2 2 2/
0α (III.297)
Pentru un nivel de semnifica ție α, intervalul de incredere pentru
parametrul 0α se scrie:
0 0;210 0 0 ;21ανα αα ναs ta s ta
−+< <− −
(III.298)
În condi țiile acelora și ipoteze, valoarea 0α nu se acceptã ca o
estima ție a valorii 0α dacã
− > να;21exp t t
(III.299)
Parametrul 1a ce estimeazã parametrul necunoscut 1α are o distribu ție
( )
1,1 ασαN în care:
( )
− =∑
=n
ix imx y
12 2/
1σ σα
(III.300)
Variabila
( )
1/1 1 exp α α s a t − =
(III.301)
are deci o distribu ție t cu 2−=nν grade de libertate, abaterea standard de
estima ție calculându-se cu rela ția:
( )
− =∑
=n
ix i y mx s s
12 2 2/
1α
(III.302)
113/124
Intervalul de încredere pentru parametrul 1a corespunzãtor unui nivel
de semnifica ție α este deci:
1 1;21 ;211 1 1 α α ναα ναs ta s ta
− +< <
− −
(III.303)
În mod analog, valoarea 1a este acceptatã ca estima ție a parametrului
1α numai în cazul în care:
− < να;21exp t t
(III.304)
3.3.1.5.Aplica ție
Diagrama de împrã știere pentru masa în stare umedã ( wM) și masa în
stare uscatã ( dM) a depozitelor recoltate din iazul de decantare Ba ia Sprie
sugereazã o corela ție linearã între ace ști doi parametri ( Fig. 93 ).
245 250 255 260 265 270 275 280 285 290 295 300 305 270
265 275 280 285 290 295 300 305 310 315 320 325 330 335 340
Fig. 93 Diagrama de împrã știere pentru wM și dM
114/124
Pe baza celor 49 de valori prelucrate se vor parcur ge în continuare
principalele etape ale ob ținerii modelului:
d w M M ×+= βα
Realizarea stereogramei eviden țiazã într-un mod sugestiv douã
aspecte determinante pentru strategia aplicãrii met odologiei clasice:
– existen ța unui numãr de valori extreme aberante ce trebuie eliminate
înaintea evaluãrilor numerice;
– caracterul normal al reparti ției bidimensionale a variabilelor wM și dM care
asigurã interpretarea corectã atât a valorilor coef icientului de corela ție cât și a
parametrilor modelului.
Intensitatea corela ției între cele douã variabile este evaluatã prin
intermediul coeficientului de corela ție:
1) înaintea eliminãrii valorilor extreme: 32 , 01=r , valoare care contrazice
flagrant aspectul diagramei de împrã știere și al stereogramei;
2) dupã eliminarea a opt valori extreme: 889 , 02=r .
Testarea adecvãrii modelului devine formalã la o v aloare a
coeficientului de corela ție 889 , 02=r și într-adevãr prin calcul se ob ține:
( ) 12 ,12 021 , 0 39 ;05 , 0exp = < = = = t t ν α
criteriu care confirmã din punct de vedere statisti c adecvarea modelului linear.
Intervalul de încredere al coeficientului corela ției lineare este:
93 , 0 81 , 0 <<ρ
Parametrii modelului estima ți în condi țiile aceleia și precizii sunt:
68 ,40 36 ,20 <<α cu estimatorul 17 ,18 =a
217 , 1 812 , 0 << − β cu estimatorul 781 , 0=b
Modelul estimat al corela ției lineare este deci:
d w M M × + = 781 , 0 17 ,18
Acest model poate fi utilizat cu o bunã aproximare pentru deducerea
unuia dintre parametrii pe baza celuilalt reducând la jumãtate efortul de
determinare realizat în laborator pentru depozitele iazului Baia Sprie. Desigur
115/124
cã pentru alte amplasamente coeficien ții și poate chiar structura modelului vor
fi al ții deoarece acest model este un model empiric valab il doar pentru
domeniul valor (valoric??) al selec ției pe baza cãreia a fost construit.
3.3.2.Model liniar multiplu
Complexitatea proceselor geologice implicã frecven t analiza influen ței
simultane a mai multor variabile, aparent independe nte, asupra unei variabile
consideratã dependentã (rezultativã) de ac țiunea acestora.
Modelarea linearã a cestei corela ții multiple este cea mai simplã solu ție
adoptatã într-o etapã preliminarã de studiu. Formal ea se exprimã prin
ecua ția:
i nn ex x x y + ++ + + = α α α α … 22 11 0
(III.304)
în care:
y – variabila rezultativã (independentã);
nx xx ,…, ,2 1 – variabilele factoriale;
nα αα ,…, ,2 1 – parametrii modelului;
ie – eroarea de estimare.
Din punct de vedere metodologic, utilizarea acestu i model pune douã
probleme specifice aplicãrii ei în studiul variabil elor geologice:
1) alegerea variabilei rezultative;
2) stabilirea numãrului de variabile factoriale.
Caracterul rezultativ sau factorial al unei variab ile poate fi bine precizat
în contextul geologic în care se realizeazã studiul sau rezultã dupã rularea
tuturor variabilelor sistemului pe pozi ția variabilei rezultative.
Dacã spre exemplu, caracterul rezultativ al cotei nivelului piezometric
într-un acvifer freatic, în raport cu variabilele f actoriale: precipita ții, grad de
acoperire cu vegeta ție, modul de infiltrare și porozitate, pare evident, nu
acela și lucru se poate spune despre analiza corela ției dintre con ținuturile de
Au, Ag, Pb, Zn, Cu dintr-un zãcãmânt polimetalic. Î n acest al doilea caz
116/124
stabilirea variabilei rezultative poate fi aleasã d upã criterii statistice pe baza
valorii maxime a coeficientului corela ției multiple sau pragmatice, de exemplu,
necesitatea prognozãrii con ținutului unui anumit metal (Au) func ție de
con ținutul celorlalte.
Numãrul variabilelor factoriale ale modelului este controlat de criterii
opera ționale (capacitatea de prelucrare a instrumentului de calcul) precum și
de necesitã țile interpretãrii rezultatelor. De cele mai multe o ri în modelarea
statisticã se preferã un numãr minim de variabile p entru ca efectele numerice
sã nu estompeze caracteristicile intrinseci ale pro cesului modelat.
Precizarea configura ției modelului liniar multiplu este obligatoriu sã f ie
precedatã de o analizã factorialã care sã simplific e și sã ierarhizeze la nivel
statistic importan ța variabilelor în reflectarea ansamblului de corela ții propriu
sistemului studiat.
3.3.2.1.Analiza graficã a corela ției multiple
Diagrama de împrã știere este singura dintre reprezentãrile grafice
utilizate în cazul modelului liniar de o singurã va riabilã independentã care
poate fi generalizat pentru cazul a trei dimensiuni , corespunzãtor unei corela ții
multiple cu douã caracteristici independente și una factorialã.
În cazul a trei variabile 2, 1XX și 3X, tripletele ( 3, 2, 1xxx ) pot fi
considerate ca determinând un punct ale cãrei coord onate sunt valorile 2, 1xx
și 3x. Reprezentate într-un sistem de referin țã ortogonal, toate punctele vor
forma o mul țime cu o anumitã dispozi ție geometricã în raport cu diferite
"suprafe țe de corela ție". Gruparea punctelor în vecinãtatea unei astfel de
suprafe țe poate fi o mãsurã calitativã a intensitã ții corela ției între cele trei
variabile.
Pentru mai mult de trei variabile, reprezentãri gr afice care sã rezume în
mod sugestiv corela ția între variabile nu se poate realiza decât dupã p relucrãri
speciale de tipul celor prezentate în cadrul analiz ei factoriale.
Datele brute nu mai pot fi examinate prin acelea și procedee prezentate
la modelul liniar de o singurã variabilã independen tã (stereograma, dreapta de
117/124
regresie) decât formând perechi din variabila rezul tativã și fiecare variabilã
factorialã, metodã care ignorã însã tocmai efectul ansamblului de intercorela ții
pe care tinde sã-l exprime modelul corela ției multiple.
3.3.2.2.Evaluarea intensitã ții corela ției
Calitatea modelului liniar multiplu se evalueazã su b douã aspecte:
a) intensitatea corela ției între variabila rezultativã și toate variabilele factoriale,
cuantificatã cu ajutorul raportului corela ției multiple și coeficientului corela ției
multiple;
b) intensitatea corela ției între variabila rezultativã și fiecare variabilã factorialã,
exprimatã prin coeficientul de corela ție par țialã.
a) Raportul corela ției multiple
Raportul corela ției multiple se calculeazã cu formula:
( )( )
( )∑∑
==
−−
− =k
iik
ixn x
xn xy
yyyy
R
1212*
… 1
… 1 1
(III.305)
în care
iy – valoarea mãsuratã a variabilei rezultative;
*
… 21 xn xxy – valoarea estimatã a variabilei rezultative;
y – media valorilor mãsurate ale variabilei rezultat ive;
k – numãrul de probe în care se mãsoarã cele n variabile.
Valoarea ( ) xn xyR,…, 2 depinde deci de raportul dintre dispersia valorilo r
determinate pe baza ecua ției de regresie linearã și dispersia valorilor
mãsurate ale variabilei rezultative. Cu cât valoril e mãsurate se abat mai pu țin
de la valorile calculate, cu atât coeficientul de c orela ție are o valoare mai
mare și ca atare corela ția este mai intensã.
118/124
b) Coeficientul corela ției multiple
Coeficientul corela ției multiple între variabilele xn xxy ,…, 2, 1, mãsoarã
gradul de precizie cu care y poate fi reprezentatã prin modelul liniar multiplu .
Rela ția de calcul a coeficientului corela ției multiple este:
( )
∑ ∑∑ ∑∑ ∑
= == = = =
−
− ++ +
=
k
ik
ii ik
ik
iik
ik
iii ii i
xn xxy
ynyynyxn an yx ay a
R
12
1212
1 1 11
… 2111… 1 0
(III.306)
utilizabilã dupã evaluarea parametrilor modelului p rin intermediul coeficien ților
an aaa ,…, 2, 1, 0 .
Coeficientul corela ției multiple se poate calcula și cu formula:
( ) ( )( )( ) ( )2
1 … 12 .2
1 . 22
1 … 21 1… 1 11− − − −− =n yn y y xn xxy r r r R
(III.307)
în care ( )2
1 … 12 .2
1 . 22
1 ,…, ,−n yn y y r rr sunt coeficien ții de corela ție par țialã.
Dacã ( ) 1… 21 =xn xxyR , variabila rezultativã y poate fi perfect reprezentatã
prin modelul liniar multiplu. Se poate demonstra cã ( ) xn xxyR… 21 este mai mare
decât coeficientul de corela ție între y și orice func ție liniarã de xn xx ,…, 2, 1
diferitã de cea din expresia (III.304).
Coeficientul corela ției multiple este mai mare sau egal cu zero și deci
în mod evident este mai mare (sau egal) decât orica re din coeficien ții de
corela ție par țialã care apar țin modelului. Ca o consecin țã a acestui fapt, dacã
( ) 0… 21 =xn xxyR to ți coeficien ții de corela ție referitori la y sunt zero și deci y
este independentã fa țã de toate variabilele factoriale ale modelului.
c) Coeficien ții de corela ție partialã
Coeficien ții de corela ție par țialã exprimã intensitatea corela ției între
variabila rezultativã ( y) și o variabilã factorialã oarecare ( xn xx ,…, 2, 1 ) când
restul variabilelor modelului rãmân constante.
119/124
Pentru un model liniar multiplu cu n variabile calculul coeficien ților de
corela ție par țialã se face func ție de coeficien ții de ordin inferior cu rela ția de
recuren țã:
( ) ( ) ( )
( ) ( )( ) ( )2
1 … 23 .12
1 … 23 .1 … 23 .1 1 … 23 . 1 … 23 . 1
… 23 . 11 1− −− − −
− −× −=
n n n yn n n n yn n y
n yr rr r rr
(III.308)
Pentru un model liniar cu douã variabile independe nte:
22110 xaxa ay + + =
(III.309)
aplicând formula (III.308) se ob ține rela ția de calcul a coeficientului corela ției
par țiale între y și 1x:
( )( )2
12 2
212 2 1
1 12 . 1r rr r rr
yy y
y− −× −=
(III.310)
în care 2 1,y yrr și 12 r sunt coeficien ții de corela ție binarã calcula ți cu formula
(III.280) utilizatã pentru evaluarea intensitã ții modelului liniar cu o singurã
variabilã independentã.
Coeficien ții corela ției par țiale au valori cuprinse între -1 și +1
semnifica ția fiind cea a coeficientului de corela ție Pearson analizatã în detaliu
la paragraful IV.2.1.
3.3.2.3.Testarea adecvãrii modelului liniar multipl u
Adecvarea modelului liniar multiplu este condi ționatã de semnifica ția
statisticã a coeficientului corela ției multiple.
Pentru modelul liniar multiplu, suma pãtratelor ab aterilor valorilor
observate ale lui y fa țã de media lor este egalã prin defini ție cu
2
ysk×
(III.311)
având 1−=kν grade de libertate și douã componente:
120/124
a) suma pãtratelor abaterilor valorilor mãsurate fa țã de cele date de ecua ția
modelului și care este egalã cu:
( ) ( )2
… 2121xn xxy y R sk −××
(III.312)
cu nk− grade de libertate;
b) suma pãtratelor abaterilor valorilor calculate p rin ecua ția modelului fa țã de
media valorilor mãsurate:
( )2
… 212
xn xxy yRsk ××
(III.313)
cu 1−n grade de libertate.
Dacã y (valoarea mãsuratã) și *y (valoarea estimatã prin model) sunt
complet necorelate, abaterile lui y fa țã de valorile modelului ( *y), vor fi
independente de abaterile valorilor calculate fa țã de media valorilor mãsurate
și deci dispersiile celor douã componente vor fi pra ctic identice ( 0=R ).
Testarea semnifica ției statistice a diferen ței celor douã componente
poate fi realizatatã cu ajutorul reparti ției Z calculând factorul experimental:
( )
( ) 1 1ln 1
2
… 212
… 21
exp −−×−=nnk
RR
zZ
xn xxyxn xxy
(III.314)
cu 1−=nν și nk==2ν grade de libertate.
Dacã
( )2 1 exp ,,νναZ Z<
(III.315)
valoarea coeficientului de corela ție ( ) xn xxyR,…, 21 este nesemnificativã și modelul
liniar multiplu nu este adecvat modelãrii corela ției între 1+n variabile.
În caz contrar, din punct de vedere statistic, cor espunzãtor nivelului de
semnifica ție ales, modelul liniar multiplu este adecvat model ãrii rela ției între
variabila rezultativã ( y) și variabilele factoriale: xn xx ,…, 2, 1 .
Semnifica ția coeficientului corela ției multiple este puternic afectatã de
numãrul de valori disponibile ( k) și numãrul de variabile ale modelului ( n). În
cazul limitã în care numãrul de variabile este egal cu numãrul de observa ții
121/124
disponibile, toate corela țiile par țiale de cel mai ridicat grad posibil vor fi egale
cu valoarea unitarã și în consecin țã R va indica o corela ție totalã indiferent de
ansamblul real de corela ții din sistemul studiat.
3.3.2.4.Parametrii modelului
Evaluarea parametrilor modelului corela ției multiple parcurge acelea și
douã etape cu cele prezentate în paragraful precede nt pentru modelul liniar
cu o singurã variabilã independentã.
a) Calculul parametrilor
Evaluarea parametrilor an aa ,…, 1, 0 se face prin aplicarea modelului
anxn xaxa ay ++ + + = … 21110
(III.316)
În mod analog cu procedeul aplicat modelului linia r de o singurã
variabilã independentã se minimizeazã suma abaterii pãtratelor:
( )[ ]∑
=++ + + − =k
ii i i i anxn xa xa a y SPA
12… 22 110
(III.317)
prin derivare în raport cu an aa ,…, 1, 0 ob ținându-se sistemele :
( )[ ]
( )[ ]
( )[ ]
= ++ + − −=∂∂= ++ + − −=∂∂= ++ + − −=∂∂
∑∑∑
===
0 … 110 20 … 110 1 210 … 110 20
121212
k
ii i i ik
ii i i ik
ii i i
anxn xa a yxn an SPA anxn xa a yxaSPA anxn xa a yaSPA
(III.318)
122/124
= ++ += ++ += ++ +
∑ ∑ ∑ ∑∑ ∑ ∑ ∑∑∑∑
= = = == = = == = =
k
ik
ik
iik
ii ik
ik
ik
iik
ii ik
iik
iik
ii
xny xn an xn x axn ayx xxn an x ax ay xn an x aka
1 1 1 121 1 1 121 1 1
… 1 1 01 1 … 1 11 0… 1 1 0
(III.319)
prin a cãror rezolvare se ob țin valorile parametrilor.
Fiecare dintre parametrii modelului ( an aa ,…, 2, 1 ) reprezintã varia ția
medie a variabilei rezultative ( y) corespunzãtoare unei varia ții unitare a
variabilei factoriale, considerându-le pe celelalte constante.
Termenul liber ( 0a) reprezintã nivelul de referin țã al variabilei
rezultative fãrã a avea o semnifica ție geologicã precizatã.
b) Evaluarea incertitudinii
Pentru parametrii modelului corela ției multiple intervalul de încredere
se evalueazã pe baza inegalitã ții:
( ) ( )
nsta
nstai i yy
j jyy
j × + < < × − να α να , ,
(III.320)
pentru coeficien ții variabilelor factoriale ( n j ,…, 2 , 1= ) iar pentru termenul liber
pe baza inegalitã ții:
( ) ( )
nsta
nstai i yy yy × +< < × − να α να , ,0 0 0
(III.321)
în care
iyy s – abaterea medie pãtraticã a valorilor observate f a țã de valorile calculate
prin model:
( )
112*
−−−
=∑
=
nkyy
sk
ii i
yy i
(III.321)
jas – abaterea standard introdusã de fiecare variabilã factorialã:
123/124
( )∑
=−=
k
ixj ij yy
a
mxssi
j
1
(III.322)
3.3.2.5.Aplicatie
Dintr-un acvifer freatic s-a exploatat pe o perioa dã de 10 ani un debit
ce variazã de la 1000 la 6000 m 3/zi. Acviferul este alimentat prin infiltra ții
rezultate din precipita ții care în zonã au valoarea medie de 350 mm/an.
Pentru optimizarea regimului de func ționare a forajelor de drenaj s-a
elaborat un model statistic de tip linear pe baza v alorilor medii lunare ale
debitelor exploatate și precipita țiilor pe perioada 1970 – 1980.
Elaborarea modelului a cuprins trei etape: identif icarea variabilelor
modelului, evaluarea parametrilor și evaluarea performan țelor.
a) Identificarea variabilelor modelului s-a realiza t pe baza corelogramelor
calculate pentru cele douã variabile principale (Q- debit și P-precipita ții). Din
corelogramele calculate se remarcã o autocorelare i mportantã a debitului de
exploatare pentru un decalaj de 1 lunã și 4 luni ( Fig. 96 ) și o corelare
importantã între precipita ții și debitul de exploatare cu un decalaj de o lunã
(Fig. 97 ).
În aceste condi ții modelul identificat optim este de forma: +1
-1 0 1 2 3 4 5 6 … t∆QQ R
Fig. 96 Autocorelograma Q-Q +1
-1 0 1 2 3
4 5
6 7 t∆QP R
Fig. 97 Autocorelograma Q-P
124/124
() () () ()1 3 4 2 1 10 − +− +− + = tPa tQa tQa atQ
b) Evaluarea parametrilor modelului prin minimizare a abaterilor a condus la
coeficien ții: 9648 , 0 3; 2128 , 0 2; 3299 , 0 1; 5 , 2077 0 = = = = a a a a .
c) Performan țele
modelului exprimate prin
coeficientul corela ției
multiple și a coeficien ților
de corela ție par țialã sunt:
corela ția totalã între
()()():1 4 1 − − − tP tQtQQ
65 , 0=R
corela ția par țialã între Q
și ():1−tQ
( ) 16 , 01=−tQQ r ;
corela ția par țialã între Q
și ():4−tQ
( ) 14 , 04=−tQQ r ;
corela ția par țialã între Q și ():1−tP ( ) 63 , 01=−tQP r .
Grafic rela ția dintre valorile observate și cele calculate prin model (Fig.
98) exprimã o bunã adecvare a modelului pentru core la țiile între debitul de
exploatare și precipita ții.
1975 1980 1000 3000 5000 7000
0
zi mQ3
t
Fig. 98 Rela ția dintre debitul calculat (modelat)
și cel mãsurat
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Modelarea Ecosistemelor2017 [605242] (ID: 605242)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
