ADE – ajutor dispecer energetic AA – alarmă de avarie AMDE – metodă de analiză a modurilor de defectare ANB – Algoritmul Augmented Naive Bayes AMP –… [615200]
LISTĂ ABREVIERI
A
ADE – ajutor dispecer energetic
AA – alarmă de avarie
AMDE – metodă de analiză a modurilor de
defectare
ANB – Algoritmul Augmented Naive Bayes
AMP – atribuirea maximă a posteriori
B
BS – Algoritmul Bayesian Search
BD – Bayesian Dirichlet
BDe – Bayesian Dirichlet echivalent
Bar – presiunea barometrică
C
CMI – cutremur de mică intensitate
CPE – cea mai probabilă explicație
CRE – cea mai relevantă explicație
CIB – Criteriul informațional Bayesian
CIA – Criteriul informațional Akaike
CFR – caracteristica de funcționare a
receptorului
E
EGS – Algoritmul Essential Graph Search
ET – evapotranspirație
F
FMECA – Moduri de defectare, efecte și
analiza criticității (failure mode s, effects, and
criticality analysis )
G
GAD – graf aciclic direcționat
GTT – Algoritmul Greedy Thick Thinning
GADP – graf aciclic direcționat parțial
H
HAZOP – exploatarea periculoasă (hazard
operability )
HI – Indicele de încălzire
I
IA – inteligență artificială
ISD – inginer de serviciu la domiciliu
IN – intervenții neautorizate
L
LOLP – indicator al probabilității de
întrerupere în alimentarea cu energie ( Loss of
Load Probability )
LDM – lungimea descrierii minime
LACARP – Laborator de cercetare aplicată și
realizare de prototipuri
M
MTTF – timpul de defectare
MSEF – modelul structural echivalent de
fiabilitate
MT – medie tensiune
MTBF – timpul mediu de bună funcționare
N
NPC – Algoritmul Necessary Path Condition
NB – Algoritmul Naive Bayes
O
OU – umiditatea exterioară
P
PRA – evaluarea probabilistică a riscului
(probability risk assessment )
PW – Puterea provenită din sursa eoliană
PS – Puterea provenită din sursa solară
PR – Puterea generată de sursele regenerabile
PL – Puterea cerută de consumatori
PL – pro babilitatea logaritmică
PMN – probabilitatea minimă normalizată
PAM – probabilitatea a posteriori maximă
R
RB – rețele Bayesiene
RBD – rețele Bayesiene dinamice
RTS – sistemul test de fiabilitate ( Reliability
Test System )
S
SE – sistemul electroenergetic
SF – semnal fals
S – sursa solară, 34
SR – Iradiația solară
T
THW – Indice temperatură, umiditate, vânt
THSW – Indice temperatură, umiditate,
radiație, vânt
TO – Temperatura exterioară
TANB – Algoritmul Tree Augmented Naive
Bayes
TPC – tabel de probabilități condiționate
TIM – teste de informație mutuală
U
UV – ultraviolete
W
W – sursa eoliană, 34
WS – Viteza vântului
Z
ZSC – zona aflată sub CFR
LISTĂ FIGURI
Capitolul 2
Fig. 2.1 Distribuția publicațiilor pe domenii de analiză……………………………………………
Fig. 2 .2 Evoluția în timp a numărului de publicațiiprivind RB în analizafiabilității………………
Fig. 2 .3 Evoluția în timp a numărului de publicații privind RB în analize de risc………………..
Fig. 2.4 Evoluția în timp a numărului de publicații privind utilizarea RB pentru mentenanța
sistemelor
Capitolul 3
Fig. 3.1 Universul elementelor U=X X………………………………………………………………………….
Fig. 3.2 Probabilitatea ca un element oarecare din U să aparțină fie domeniului X sau Y se
definește cu relația ) ( )( )( ) ( YXP YP XP YXP −+=……………………………………………………………
Fig. 3.3 Probabilitatea condiționată ca un element oarecare din U să aparțină fie domeniului X
dat fiind că se cunoaște că aparține domeniului Y este suma dintre ) ( YXP și P(Y)………………
Fig. 3. 4 Reprezentarea grafică a P( X|Y 1 ,….., Y n)……………………………………… ………………………..
Fig. 3. 5 Marginalizarea (sau proiecția) lui ΦX (zi, x’) pe dom(X’) pentru toate valorile
zi∈dom(X \X’): ΦX’(z1 , x’)+……+ΦX(zn ,x’) …………………………………………………………………..
Fig. 3. 6 Douămodeleechivalente ce se pot obține, unuldincelălalt, prininversareaconexiunii..
Fig. 3. 7 Graf aciclic direcționat GAD (a). Graf „moral” (b)……………………… …………………………
Fig. 3. 8 Rețea cauzală, pentru un transformator de putere, ce permite nu numai concluzii
cauzale (deductive) ci și de tip diagnostic (abductive) …………………………
Fig. 3. 9 Diagramă de influență reprezentând o problemă de decizie secvențială privind
diagnosticarea stării unui transformator de putere: inițial, decidentul trebuie să decidă dacă să
măsoare sau nu temperatura și apoi, pe baza rezultatului, s ă decidă soluția de reparare.
Diagrama este derivată din rețeaua cauzală din figura 3.8 care a fost perfecționată cu variabile
decizionale și mărimi de ieșire ……………………………………………………………………………………….
Fig. 3. 10 Rețea cauzală în cazul exemplului „semnal fals sau intervenție neautorizată (SF+IN)
sau cutremur de mică intensitate (CMI)?”………………………………………………………………………….
Fig. 3. 11 Conexiunea serială (lanț cauzal) fără evidență clară relativ la AA. Evidența relativ la
SF+IN va influența încrederea asupra stării Telefon și reciproc……………….. …………………………
Fig. 3. 12 Conexiunea serială (lanț cauzal) cu evidența clară a variabilei AA. Evidența relativ
la SF+IN nu va avea nici un efect asupra încrederii stării variabilei Telefon ISD și reciproc.
Fig. 3. 13 Conexiune divergentă fără evidență asupra variabilei CMI. Evidența legată de AA va
afecta probabilit atea (încrederea) variabilei SR și reciproc…………………………………………………..
Fig. 3. 14 Conexiunea divergentă cu evidența clară asupra variabilei CMI. Evidența legată de
AA nu va afecta probabilitatea variabilei SR și reciproc……………………………………………………..
Fig. 3. 15 Conexiune convergentă f ără nici o evidență asupra variabil ei AA sau a
descendenților săi. Informația legată de SF+IN nu va afecta probabilitatea variabilei CMI și
reciproc
Fig. 3.16 Conexiune convergentă cu (posibil ușoară) evidență asupra AA sau a oricărui dintre
descendenții săi. Informațiadespre SF+IN vaafectaprobabilitateastăriivariabilei CMI
șireciproc……………………………………………………………………………………
Fig. 3. 17 Supratemperatura determină funcți onarea protecției termice a unui transformator de
putere nu invers……………………………………………………………………………………………………………..
Fig. 3. 18 Modelul eronat din exemplul SF+IN sau CMI în care l egăturile sunt direcționate de
la efect la cauză ceea ce determină afirmații greșite relativ la dependența (condiționată) și la
independența variabilelor………………………………………………………………………………………………..
Fig. 3. 19 Graful din stânga este o RB iar cel din dreapta nu este pentru că are o buclă orientată
închisă (CABE)………………………………………………………………………………………………………………
Fig. 3.20 Ilustrativă pentru tipurile de inferență în RB….. …………………………. ………………………..
Fig. 3. 21 Separația de tip d: nodurile E sunt evidențe din mulțimea S a nodurilor RB; a, b și c
ilustrează situațiile din text……………………………………………………………………..
Fig. 3. 22 Reprezentarea RBD: în momente de timp date ale evoluției în timp a procesului
(stânga); model temporal cu multiplicarea momentelor de timp (dreapta)….. …………………………
Capitolul 4
Fig. 4. 1 RB și modelul noisy -or…………………………………………………………………………………………
Fig. 4. 2 RB pentru alarmare în caz de CMI sau SF+IN …………………………………………………………
Fig. 4. 3 Subsistemul de alimentare cu energie electrică luat în considerare ……………………………..
Fig. 4. 4 Modelul structural echivalent de fiabilitate a subsistemului analizat …………………………..
Fig. 4. 5 Rețeaua Bayesiană echivalentă pentru subsistemul analizat…………………………….
Fig. 4. 6 Probabilitatea de funcționare a sistemului condiționat de evidențe………………………
Fig. 4. 7 Arhitectură nodală de tip punte…………………………………………………………..
Fig. 4. 8 Diagrama bloc echivalentă de fiabilitate pentru sistemul de tip punte prin metoda
legăturilor minimale………………………………………………………………………………………………………….
Fig. 4. 9 Rețea Bayesiană pentru evaluarea fiabilității sistemului de tip pun te………………………….
Fig. 4. 10 Probabilitatea de funcționare a sistemului……………………………………………………………..
Fig. 4. 11 Probabilitatea de alimentare a sarcinii ca funcție a probabilității elementelor……….. .
Fig. 4. 12 Arhitectura cu dublu sistem de bare…………………………………………………….
Fig. 4. 13 Legăturile minimale pentru partea stângă a arhitecturii cu dublu sistem de bare…………
Fig. 4. 14 Rețeaua Bayesiană pentru partea stângă a arhitecturii nodale cu dublu sistem de bare…
Fig. 4. 15 Fluxul probabilităților în RB………………………………………………………………………………..
Fig. 4. 16 Analiză de senzitivitate pentru evaluarea fiabilității arhitecturii cu dublu sistem de
bare…………………………………………………………………………………………………………. …………………….
Fig. 4. 17Arhitectura cu dublu sistem de bare cu bară de transfer………………………………..
Fig. 4. 18 Legături minimale pentru arhitectura cu dublu sistem de bare cu bară de ocolire………..
Fig. 4. 19 RB corespunzătoare arhitecturii prezentate în figura 4.17……………………………………….
Fig. 4. 20 Grupuri de defectare pentru arhitectura de tip punte……………………………………
Fig. 4. 21 RB construită în baza grupurilor de defectare…………………………………………………………
Fig. 4. 22 Porți logice utilizate în construcția unui arbore de defectare……………………………
Fig. 4. 23 Subsistemul generator…………………………………………………………………..
Fig. 4. 24 Arborele de defectare a subsistemului din figura 4.23……………………………………………..
Fig. 4. 25 RB a subsistemului din figura 4.23……………………………………………………………………….
Fig. 4. 26 Sistem de alimentare cu energie electrică………………………………………………………………
Fig. 4. 27 Rețea Bayesiană pentru analiza riscului de întrerupere în alimentarea cu energie
electrică a consumatorilor………………………………………………………………………………………………….
Fig. 4. 28 RB finală cu afișarea probabilităților condiționate………………………………………………….
Fig. 4. 29 Rețeaua Bayesiană pentru studiul disponibilității întreruptoarelor…………………………….
Fig. 4.30 Diagrama de influență pentru studiul disponibilității întrerupătoarelor ……….. …………….
Fig. 4. 31Diagramade influențăcurezultateînurmaaplicăriiment enanței………………………
Fig. 4. 32 Rețea pentru studiul disponibilității întrerupătoarelor în cazul funcționării ideale a
Întrerupătorului_1……………………………………………………………………………………………………………
Capitolul 5
Fig. 5. 1 Stațiameteorologică Vintage Pro 2 Plus utilizatăpentruachiziția de date
Fig. 5. 2Vitezavântului [m/s] înregistratăpeparcursulanului 2014
Fig. 5. 3Evoluțiavariabilei M[Tf] înregistratăînintervalul de timpconsiderat
Fig. 5. 4 M[T f], intervalul 0 – 3 min
Fig. 5. 5 M[T f], intervalul 3 – 5 min
Fig. 5. 6 M[T f], intervalul 5 -7 min
Fig. 5. 7 M[T f], intervalul 7 -10 min
Fig. 5. 8 Cazul 1 – Spațiul stărilor pentru viteza vântului considerând toate perturbațiile de
scurtă durată
Fig. 5. 9 Cazul 2 – Spațiul stărilor pentru viteza vântului considerând constanta mecanică de
timp C timp> 3 min
Fig. 5. 10 Cazul 3 – Spațiul stărilor pentru viteza vântului considerând constanta mecanică de
timpC timp> 5 min
Fig. 5. 11 Cazul 4 – Spațiul stărilor pentru viteza vântului considerând constanta mecanică de
timp C timp> 7 min
Fig. 5. 12 Cazul 5 – Spațiul stărilo r pentru viteza vântului considerând constanta mecanică de
timpC timp> 10 min
Fig. 5. 13 Probabilitatea de succes a turbine eoliene
Fig. 5. 14 Discretizarea parametrului radiația solară pe 5 intervale de variație după metoda
ierarhică
Fig. 5. 15 Evoluția în timp a radiației solare
Fig. 5. 16Analiză comparative între distribuția empirică a datelor privind radiația solară și
funcția normală de distribuție
Fig. 5. 17 Variația vitezei vântului și a radiației solare în unități relative, pe parcursul anului
2016
Fig. 5. 18 Analiză statistică a corelației între radiația solară și viteza vântului
Fig. 5. 19 Producția lunară de energie a panoului fotovoltaic
Fig. 5. 20 Structura modelului Naive Bayes (NB)
Fig. 5. 21 Structura modelului naiv Bayesian de tip evolutiv
Fig. 5. 22 Structura unei rețeleBayesiene, notată cu BS1
Fig. 5. 23 Structură de tip V (a); Structură nedirecționată (b)
Fig. 5. 24 Algoritmul EGS simplificat
Fig. 5. 25 Pagina de start a modelului Bayesian pentru analiza disponibilității surselor
regenerabile de pe site- ul companiei Hugin
Fig. 5. 26 Rețeaua electrică de referință considerată pentru analiza riscului de întrerupere în
alimentare:S – sursa solară, W – sursa eoliană, R – întrerupător, G – rețeaua electrică locală
Fig. 5. 27 Structura inițială a RB
Fig. 5. 28 Inserarea bazei de date în Hugin Expert
Fig. 5. 29 Inserarea fișierului cu baza de date pe 5 luni
Fig. 5. 30 Stabilirea constrângerilor în RB
Fig. 5. 31 Algoritmul NPC în Hugin Expert
Fig. 5. 32 Structura învățată a RB generată de software -ul Hugin Expert
Fig. 5. 33 RBD pentru modelarea evoluției unui process în pași de timp
Fig. 5. 34 RB multiplicată temporal
Fig. 5. 35 Variabilele meteorologice înregistrate în baza de date în formă continuă (a) și în
formă discretizată (b)
Fig. 5. 36 Structura RB generată de algoritmul
Fig. 5. 37 Probabilitățile condiționate pentru clasele de variabile meteorologice pentru primul
pas de timp
Fig. 5. 38 Setarea aleatorie a evidențelor pentru n-1 variabile și verificarea valorii variabilei n
(THSW)
Fig. 5. 39 CFR pentru clasa 3 [10 -12 m/s] a vitezei vântului și ZSC=0.7298
Fig. 5. 40 CFR pentru clasa 4 [ ≥684 W/m2] a radiației solare și ZSC=0.6974
Fig. 5. 41 RB nerulată pentru primul pas de timp
Fig. 5. 42 Probabilitățile condiționate dinamice pentru iradiația solară și viteza vântului generate
de RBD
Fig. 5. 43 Probabilitățile condiționate pentru clasele vitezei vântului pentru primele 5 luni din
2016
Fig. 5. 44 Probabilitățile condiționate pentru clasele iradiației solare pentru primele 5 luni din
2016
Fig. 5. 45 Coeficienții de corelație între iradiația solară și viteza vântului pe durata celor patru
ani de înregistrări
Fig. 5. 46 RB generată de algoritmul EGS pe baza datelor pe o perioadă de 4 ani și distribuțiile
discrete ale variabilelor meteorologice
Fig. 5.47 Probabilitățile condiționate ale claselor de variație a vitezei vântului
Fig. 5. 48 Probabilitățile condiționate ale claselor de variație a iradiației solare
Fig. 5. 49 Distribuția comună de probabilitate a puterii totale disponibile generate de sursele
regenerabile
LISTĂ TABELE
Capitolul 3
Tabelul 3.1 Modul de reprezentare grafică a diverselor tipuri de noduri ale RB……………….
Tabelul 3.2 15 din totalul de 35 de afirmații de dependență și inde pendență incluse în GAD din figura
3.10. Fiecare din afirmațiile listate este minimală în sensul că înlăturarea oricărui element din setul C
anulează afirmația că A și B sunt in(dependente) dat fiind C………………
Tabelul 3.3 Transmiterea informației, în cazul conexiunilor serie, divergente și convergente,
în funcție de evidența supra variabilei intermediare……………………………………………..
Capitolul 4
Tabelul 4.1 TPC pentru RB din figura 4.2………………………………………………………
Tabelul 4.2 Logica binară pentru legătura minimală T1 (TPC – T1)……………………………
Tabelul 4.3 Logica binară pentru grupul de defectare C1 (CPT – C1)…………………………
Tabelul 4.4 Datele de intrare pentru subsistemul generator din figura 4.23…………………….
Tabelul 4.5 Datele de intrare pentru variabilele marginale………………………………………………….
Tabelul 4.6 TPC pentru nodul Întrerupere_alimentare……………………………………………………….
Tabelul 4.7 Probabilitatea de funcționare a întrerupătorului după un timp în care se manifestă
uzură……………………………………………………………………………………………………………………………..
Tabelul 4.8 TPC pentru variabila Mecanism_de_acționare………………………………………………….
Tabelul 4.9 Probabilitățile inițiale ale variabilei nodului Mentenanță……………………………………
Tabelul 4.10 Costul mentenanței ………………………………………………………………..
Tabelul 4.11 TPC pentru variabila Întreruepere_alimentare_1…………………………………
Tabelul 4.12 Valorile aferente nodului Încasări_energie_vândută………………………………
Capitolul 5
Tabelul 5.1 M[T f] și M[T r] pentru perturbații de scurtă durată a vitezei vântului ……………..
Tabelul 5.2 Verificarea normalității funcțiilor de repartiție pentru variabila M[T f]……………
Tabelul 5.3 Valorile finale pentru indicatorii de fiabilitate [][][][]d f TM TMt Mt M , ,)( ,)(βα…
Tabelul 5.4 Principalii parametri statistici ai bazei de date analizate …………………………..
Tabelul 5.5 Valorile globale lunare ale radiației solare ………………………………………..
Tabelul 5.6 Valorile lunare ale coeficientului de corelație ………………………………………………….
Tabelul 5.7 Valorile anuale ale coeficientului de corelație …………………………………….
Tabel ul 5.8 Exemplu de bază de date ……………………………………………………………
Tabelul 5.9 Indicatori înregistrați pentru prognoza me teorologică ……………………………..
Tabelul 5.10 Discretizarea valorilor ce caracterizează resurselor regenerabile ………………..
Tabelul 5.11 Stările posibile, clasele de putere totală și probabilitățile associate………………
1
INTRODUCERE
Conceptul de sistem a apărut ca efect al dezvoltării structurilor fizice, iar prin
evidențierea proprietăților și comportamentelor s -a permis tratarea acestora într -un mod unitar,
sistemic.
Modelarea este una din etapele de analiză a sistemelor, pentru a putea descrie
caracteristicile și comportamentul dinamic, de cele mai multe ori sub forma unui model
matematic.
Modelele matematice pot fi clasificate astfel:
• modele liniare și neliniare – diferența între acestea constând în principiul
suprapunerii efectelor (pentru modelele liniare), identificându- se relațiile dintre
variabilele dependente de timp;
• modele parametrice sau neparametrice – presupun descrierea matematică a
procesului din punctul de veder e al parametrilor sau identificarea căii de trecere de la
spațiul funcțiilor de intrare la cel al funcțiilor de ieșire;
• modele intrare -ieșire și modele de stare;
• modele continue și discrete în timp;
• modele deterministe și modele probabilistice
• modele cu pa rametri concentrați și cu parametri distribuiți.
Modelele probabilistice s -au dezvoltat, cu precădere în ultimele decade pornind de la
fenomenele și procesele reale. Toate mărimile din natură au un caracter aleatoriu.
Procesul gândirii umane, pe baza et apelor de învățare, experiență, acumulare și
dezvoltare cantitativă și, mai ales calitativă evoluează de la afirmații deterministe, categorice,
ultimative la unele dintre cele mai fine și nuanțate care au atașate marje de „îndoială”.
Afirmația cunoscută a filosofului și matematicianului francez Ren é Descartes (n. 1596 –
m. 1650) „dubito, ergo cogito, ergo sum” – „mă îndoiesc, deci gândesc, deci exist” susține aceste
afirmații.
Inteligența artificială, încercând să ajute, să completeze, uneori să copie gân direa umană,
ajunge la modele și tehnici care să considere variabile evenimente, procese cu caracter aleatoriu,
probabilistic. Rețelele Bayesiene, o tehnică ce aparține domeniului inteligenței artificiale, s -au
dezvoltat puternic în diverse domenii științ ifice și tehnice tocmai pentru faptul că permit studiul
și analiza proceselor probabilistice și, suplimentar față de statistica frecvențială, înglobează și experiența sub forma informației „a priori”.
2
Procesul aleatoriu în teoria probabilităților este con siderat a fi contrar procesului
determinist, datorită existenței incertitudinii în ceea ce privește evoluția în timp descrisă în
distribuțiile de probabilitate .
O variabilă aleatorie este o funcție numerică definită pe mulțimea rezultatelor unui
experim ent. Deoarece orice proces de măsurare este afectat de erori aleatorii, atunci chiar
rezultatele măsurătorilor sunt aleatorii. Repetând de un număr mare de ori, în condiții identice, măsurarea unei mărimi, se constată că rezultatele aleatorii ale măsurării sunt caracterizate de o
lege de repartiție bine determinată. Calculele de incertitudine utilizate în rețelele probabilistice au la bază teoria probabilităților.
Rețelele Bayesiene (RB)folosesc teorema lui Bayes oferind mai multe avantaje
comparativ cu metodele ce folosesc statistica frecvențială.
Obiectivitatea mai redusă a statisticii frecvențiale se datorează faptului că neglijează
cunoștințele anterioare despre un proces analizat iar acest lucru înseamnă, uneori pierderi
informaționale și chiar materiale. Statistica Bayesiană folosește atât ambele surse de informații:
informația a priori despre procesul analizat și informația conținută în datele disponibile despre
acesta. Ambele surse sunt combinate în ceea ce se numește teorema lui Bayes.
Metoda Baye siană permite alocarea directă a valorilor parametrilor probabilistici. Acest
lucru este mai folositor în cercetare comparativ cu stabilirea intervalelor de încredere în cazul
tehnicilor bazate pe statistica frecvențială. Utilizatorii rezultatelor interpre tează intervalele de
încredere ca intervale de probabilitate. Statisticienii știu că acest lucru nu este corect. Dar știu că, de asemenea, o legătură între interpretarea a ceea ce înseamnă intervalele de încredere relativ la
probabilitatea seturilor de date.
Statistica Bayesiană folosește, în orice situație, un singur instrument: teorema lui Bayes
în timp ce statistica frecvențială utilizează diferite instrumente. Totodată permite eliminarea, prin
procedeul de marginalizare, eliminarea influenței oricărei variabile asupra rezultatelor.
Un alt avantaj al utilizării tehnicilor Bayesiene este că permite estimarea distribuției
observațiilor viitoare, lucru dificil în modul frecvențial.
Avantajele de principiu al statisticii Bayesiene,menționate mai sus, sunt contracarate
oarecum de dificultatea majoră a utilizării acesteia în practică. Este relativ ușor să se determine
distribuția a posteriori (θ) cunoscând setul de date (D) conform relației
∫= =
θθθθθ θθθ
)()|()()|(
)()()|()|(
p Dpp Dp
Dpp DpD p
3
O formă simplă a relației de mai sus se poate scrie în puține cazuri, cum este cel al
distribuției normale a datelor eșantionului de selecție cu o distribuție tot normală a datelor a
priori. În alte cazuri integrarea trebuie făcută numeric. În cazul existenței mai multor parametri,
integrarea devine extrem de dificilă. Există metode utilizate în programe de calcul specializate
având la bază eșantionarea Gibbs sau algoritmul Metropolis -Hasting ce permit eșantionarea
aproximativă, aleatorie, a distribuției a posteriori, fără a o determina complet. Distribuția a
posteriori poate fi aproximată cu orice precizie dacă se selectează suficiente eșantioane. Acest
procedeu înlătură dezavantajul statisticii Bayesiene și poate fi utilizat în practică în cazul
existenței multor parametri sau în cazul distribuțiilor deduse din eșantioane de date cunoscând
distribuțiile a priori.
Sintetic, o RB constă în următoarele:
– un set de variabile și un set de legături orientate între aceste variabile;
– fiecare variabilă are un set f init de stări mutual exclusive;
– variabilele, împreună cu legăturile directe orientate, formează un graf aciclic direct (GAD); un graf direcționat este aciclic dacă nu există o cale directă A
1 → A 2, ……, →
An astfel încât A1 = A n;
– fiecărei variabile A cu leg ături orientate directe dinspre variabilele (părinți) B 1, B 2, ….,
Bn i se atașează un tabel de probabilități condiționate P(A|B 1, B2, …, B n)
GAD- ul configurează partea calitativă a unei RB iar prob abilitățile asociate reprezintă
partea cantitativă a acesteia.
Utilizarea rețelelor Bayesiene (RB), în diverse domenii ale științei și ingineriei, a
cunoscut o dezvoltare spectaculoasă mai ales în ultimele decenii.
Ca o tehnică a inteligenței artificiale (IA), rețelele Bayesiene au fost introduse prima dată
de către Judea Pearl1. În general, reprezentările grafice ale informației probabilistice sunt folosite
de multă vreme, din anii 1900, cu aplicații în fizica statistică sau genetică Mai recent au fost
dezvoltate metode de tip lanț Markov pentru studii de disponibilitate a sistemelor din domenii
diverse.
Cunoscute și sub numele de rețele de încredere sau rețele Bayesiene de încredere,
specialiștii în AI au identificat repede utilitatea și potențialul lor dar conceptele matematice și
1 Judea Pearl (n. septemb rie 4, 1936) este specialist în calculatoare și filosof, cunoscut pentru realizările sale privind abordarea
probabilistică a inteligenței artificiale și dezvoltarea rețelelor Bayesiene. Are contribuții remarcabile în dezvoltarea teoriei
inferenței cauzale bazată pe mo dele structurale.
4
limitările structurale ale a lgoritmilor inițiali ai lui J. Pearl au redus mult domeniile de aplicare. În
perioada anilor 90’, RB au cunoscut o largă răspândire din următoarele motive:
– tehnicile de învățare automată s -au dezvoltat semnificativ permițând construcția
automată a structu rii și calculul parametrilor RB direct din bazele de date;
– au fost propuse pentru recunoașterea formelor sau clasificare oferind rezultate bune
comparativ cu alte tehnici de clasificare;
– au fost potrivite și utilizate pentru gestionarea atât a variabilelor discrete cât și a celor
continue chiar în același model de RB.
Principalele domenii de cercetare în care au fost publicate lucrări ce utilizează RB sunt
arătate în figura I, începând din anii 1990 și până la redactarea tezei, rezultat al unei cercetări
bibliografice în baza de date Clarivate Analytics și IEEE Xplore.
Fig. I Domeniile în care au fost publicate lucrări ce prezintă rezultate ale cercetării folosind RB
Utilizarea RB în domeniul disponibilității în energetică este confirmată de rezultate
privind fiabilitatea, mentenanța și riscul componentelor, subsistemelor și sistemelor electroenergetice.
Tehnicile Bayesiene de analiză a fiabilității s -au extins odată cu renunțarea la abordarea
analizei exclusiv a părții tehnice a sistemelor electroenergetice și considerarea, dată fiind
importanța lor crescândă, a factorilor uman și organizațional. Până în anii ’70, studiile de
fiabilitate se concentrau aproape în exclu sivitate pe partea tehnică dar, evenimente majore cum
au fost cele nucleare de la Three Miles Island, Cernobâl sau catastrofa de la Bhopal din India, au scos în evidență rolul operatorilor umani și al structurilor organizaționale improprii. 0 1000 2000 3000 4000 5000 6000 7000 Număr lucrări publicate
5
Fiabilitatea a intrat într -o nouă eră, cea în care complexitatea sistemelor analizate a
crescut mult datorită interacțiunii factorilor tehnici, umani, organizaționali, toți contribuind la
cuantificarea unor scenarii de nefuncționare și/sau de risc. Modelarea tuturor factorilor amintiți
trebuie să integreze și cunoștințele specifice diverse, cu diferite nivele de abstractizare.
Factorii organizaționali și umani sunt, în mod natural, modelați folosind informații
calitative cum sunt cele bazate pe efectele defectărilor și analiza criticității lor (failure mode,
effects, and criticality analysis – FMECA), exploatarea periculoasă (hazard operability –
HAZOP), evaluarea probabilistică a riscului (probability risk assessment – PRA) ș.a.
Componenta tehnică este modelată, în fia bilitate, cu ajutorul unor informații cantitative:
intensitatea de defectare, indisponibilitatea, durata medie de funcționare neîntreruptă, etc.
Suplimentar, modelarea fiabilității sistemelor poate lua în considerare și factorul timp
(sisteme dinamice) an alizându -se diverse scenarii și evoluția lor, fenomenele de uzură și
degradare, impactul mentenanței preventive, condițiile de exploatare și de mediu. Modelarea fiabilității sistemelor are la bază tehnici cunoscute: lanțuri Markov, arbori de defectare dina mici,
rețele Petri și rețele Bayesiene.
Mentenanța , alături de fiabilitate formează noțiunea mai generală a disponibilității.
Conceptul de mentenanță trebuie abordat holistic pentru succesul practic și este fundamentat pe analize de funcționalitate și dis funcționalitate, relații cauzale între mecanismele de degradare și
uzură, relațiile dintre componente și subsisteme. Mentenanța include aspecte critice cum sunt costurile, sănătatea și securitatea muncii, protecția mediului.
RB sunt utilizate în decizii p rivind mentenanța și evaluarea performanței sistemelor
electroenergetice în urma aplicării mentenanței. Relația cauzală între degradare/cauze/consecințe
incluzând și aspecte privind mărimile de ieșire (puteri, debite, energii) poate fi determinată
folosind rețelele Bayesiene. Foarte potrivită este aici și folosirea metodei judecatei experților
pornind de la stabilirea unii set de reguli pentru colectarea informațiilor în scopul stabilirii structurii rețelelor. Valoarea parametrilor se determină prin asigura rea feedback -ului necesar și a
unei expertize secundare.
Analiza riscului este strâns corelată cu fiabilitatea și consecințele non -fiabilității asociind
efectele negative cu probabilitatea lor de apariție pe baza analizei fiabilității componentelor
sistemului analizat, interacțiunea acestora având în vedere ansamblul om -sistem. Evaluarea
riscului are drept scop stabilirea elementelor ce permit elaborarea deciziilor privind proiectarea, funcționarea, exploatarea și managementul riscului la nivel de sistem electroenergetic.
6
Rețelele Bayesiene reprezintă instrumentul util pentru analiza situațiilor de risc
considerând capacitatea acestora de a modela datele probabilistice și dependențele dintre
evenimente.
Un aspect extrem de important și relativ nou în utilizarea statisticii Bayesiene se referă la
integrarea surselor regenerabile în rețelele electroenergetice. Modelarea resurselor
regenerabile, eoliene și fotovoltaice, tehnicile de prognoză ale vitezei vânt ului și iradiației solare
(mărimi naturale pur aleatorii), ale puterii generate și energiei electrice produse reprezintă puncte forte ale utilizării rețelelor Bayesiene așa cum este demonstrat inclusiv în teza de doctorat.
Algoritmi specifici pentru întoc mirea structurii RB și calculul parametrilor, însoțite de
calculul și analiza erorilor au fost dezvoltați în literatura de specialitate și folosiți inclusiv pentru
dezvoltarea rețelelor Bayesiene dinamice
Interesul crescut pentru utilizarea RB, care nu reprezintă soluția tuturor problemelor, se
datorează relevanței folosirii lor în cazul sistemelor complexe.
Sintetizând, avantajele utilizării RB constau în capacitatea lor de a:
– modela rețele complexe;
– realiza predicții și de a furniza diagnostice;
– repre zenta variabile cu stări multiple;
– a ajuta utilizatorul să modeleze sisteme printr -o abordare grafică compactă.
1
CAPITOLUL 1
PRIVIRE GENERALĂ ASUPRA TEZEI
Prezenta lucrare cuprinde, în mare parte, rezultatele cercetărilor dintre care cele publicate
pe parcursul stagiului de doctorat sunt următoarele:
A. Lucrări publicate în reviste indexate BDI
1. Alexandra Ciobanu , F. Munteanu, C. Nemeș, Mihaela Adochiței “ Dynamic Bayesian
Network for weather forecast and evaluation of renewablere sources availability”. Journal
of Sustainable Energy, vol. 9, no. 2, 2018.
2. Alexandra Ciobanu , F. Munteanu, C. Nemes and D. Astanei, "Availability evaluation of
nodal architectures using Bayesian networks", 2016, Buletinul Institutului Politehnic din
Iași, Vol. 62 (66), numărul 3, Secția Electrotehnică, Energetică, Electronică.
B. Lucrări publicate în volumele conferințelor indexate Web of
Science/ClarivateAnalytics
3. Alexandra Ciobanu , F. Munteanu, C. Nemes and D. Astanei, "Availability model of
windandsolutiontoimmunizethegeneratorsagainstshorttimeperturbations," 2016
International Symposium on Fundamentals of Electrical Engineering (ISFEE) , Bucharest,
2016, pp. 1- 6; doi: 10.1109/ISFEE.2016.7803166; WOS:000392434400018
4. Alexandra Ciobanu , F. Munteanu and C. Nemes, "Bayesiannetworksutilization for
reliabilityevaluation of powersystems," 2016 International ConferenceandExposition on
Electricaland Power Engineering (EPE) , Iasi, 2016, pp. 837- 841. doi:
10.1109/ICEPE.2016.7781454; WOS:000390706300164.
5. F. Munteanu, Alexandra Ciobanu and C. Nemes, "Fromtechnical design
structurestoBayesiannetworks in power engineering," 2016 International Conference on AppliedandTheoreticalElectricity (ICATE) , Craiova, 2016, pp. 1- 6. doi:
10.1109/ICATE.2016.7754625; WOS:000390767500025
6. D. Astanei, C. Nemes, F. Munteanu and Alexandra Ciobanu ,
"Annualenergyproductionestimationbased on windspeeddistribution," 2016 Interna tional
ConferenceandExposition on Electricaland Power Engineering (EPE) , Iasi, 2016, pp.
862-867. doi: 10.1109/ICEPE.2016.7781459; WOS:000390706300169.
7. C. Nemeș, F. Munteanu, D. Astanei, Alexandra Ciobanu , M. Adochițeiand M. Larion,
"A correlationbetweenph otovoltaicsystemproductionand local solar resources," 2017 14th
2
International Conference on Engineering of Modern Electric Systems (ICEMES) , Oradea,
2017, pp. 47- 50; doi: 10.1109/EMES.2017. 7980378. WOS:000427085200011.
8. Alexandra Ciobanu , F. Munteanu, C. N emes and D. Astanei, "Data –
drivenBayesiannetworks for reliability of supplyfromrenewablesources," 2017
International Conference on Optimization of Electricaland Electronic Equipment
(OPTIM) & 2017 IntlAegeanConference on ElectricalMachinesand Power Elect ronics
(ACEMP) , Brasov, 2017, pp. 84- 89; doi: 10.1109/OPTIM.2017.7974952.
WOS:000426909600012
9. F. Munteanu, Alexandra Ciobanu and C. Nemes, "A BayesianApproach of
theAvailabilityComplementarity of RenewableResources," 2018 International
ConferenceandExpositi on on ElectricalAnd Power Engineering (EPE) , Iasi, 2018, pp.
0731- 0736. doi: 10.1109/ICEPE.2018.8559738.
C. Lucrări publicate în volumele conferințelor indexate în IEEE Xplore Digital Library
10. C. Nemes, M. Adochitei, F. Munteanu, Alexandra Ciobanu and O. Neagu, "Self –
consumptionenhancement on a low -voltagegrid -connectedphotovoltaicsystem," 2018
IEEE International Energy Conference (ENERGYCON) , Limassol, 2018, pp. 1- 6. doi:
10.1109/ENERGYCON.2018.8398839.
D. Lucrări publicate în volumele conferințelor internaționale
11. Florin Munteanu, Ciprian Nemes, Dragoș Astanei, Alexandra Ciobanu , ” Data Mining
for WindAvailability Modeling ”, 2015, International Conference on Energy
andEnvironment (CIEM), Iași 2015.
Considerarea tematicii privind utilizarea tehnicilor reprezentate de rețelele Bayesiene în
studii de disponibilitate în electroenergetică a implicat, în același timp, unele dificultăți dar și o
provocare. Dificultățile s -au datorat faptului că problematica este relativ modest prezentă în
literatura românească de specialitate, puținele lucrări accesibile sunt din domeniul medicinii, al recunoașterii limbajului și științei calculatoarelor și, ca urmare, unii termeni foarte specifici nu
sunt asimilați încă în limba română iar unii nici nu au corespondent. Acolo unde terminologia în
limba română nu există sau provoacă încă importante controverse, s -au folosit termenii în limba
engleză cum ar fi: modelul de tip noisy -or, algoritmul TANB – TreeAugmented Naive Bayes sau
GTT – GreedyThickThinning.
Provocarea s -a datorat oportunităților oferite de o tehnică a inteligenței artificiale care
3
permite studiul și analiza proceselor și sistemelor caracterizate de variabile cu caracter
probabilistic, specifice domeniului dis ponibilității și fiabilității în ingineria energetică.
Literatura internațională în domeniul tezei este bogată iar bazele de date științifice
recunoscute și apreciate unanim, printre care IEEE Xplore, ClarivateAnalytics/Web of Science,
Scopus, includ sute de publicații apărute după 1995- 2000: articole, cărți, teze de doctorat,
pachete software. Sinteza numai a celor din ingineria electrică și energetică a însemnat atenție și timp care, însă, a permis evidențierea utilității acestui instrument extrem de util în acest domeniu.
Stagiul efectuat la Departamentul Computer Science al Universității din Aalborg,
Danemarca sub coordonarea a doi specialiști foarte cunoscuți în teoria RB, Thomas D. Nielsen și
în aplicarea acestora în inginerie, Anders L. Madsen, a permis aprofundarea modului în care se
pot modela procese aleatoare, dezvolta raționamente, aplica și utiliza rezultate fundamentate pe
teorema lui Bayes.
Teza este structurată astfel:
Cuprins
Listă abrevieri
Listă figuri
Listă tabele
Introducere
Capitolul I: Privire generală asupra tezei
Capitolul II: Stadiul actual privind utilizarea rețelelor Bayesiene în analiza
disponibilității în electroenergetică
Capitolul III: Rețele Bayesiene și diagrame de influență
Capitolul IV: Metode de construcție a r ețelelor Bayesiene
Capitolul V: Tehnici de construcție automată a structurii și de calcul a parametrilor rețelelor Bayesiene
Contribuții personale și direcții de cercetare
Bibliografie generală
Anexe
În capitolul 2 este inclus rezultatul unei cercetării b ibliografice minuțioase și selective
privind utilizarea RB în analizele de fiabilitate, mentenanță și analiză a riscului din domeniul
ingineriei energetice. Sunt prezentate rezultate statistice privind numărul lucrărilor publicate ca
și informații despre lucrări de referință în subdomeniile amintite. Dinamica evoluției crescătoare
4
a numărului de publicații indică interesul cercetătorilor și al utilizatorilor pentru RB.
Capitolul 3 prezintă în detaliu noțiunile referitoare la RB și diagramele de influență.
Începând cu definiția clasică a unei RB stabilită de Judea Pearl în 1985, sunt enumerate și alte
definiții care nuanțează conceptul general.
Bazele calculului probabilistic aplicat în RB este dezvoltat cu accent asupra definirii
probabilității condițion ate, axiomelor fundamentale și distribuțiilor de probabilitate ale
variabilelor. După enunțarea legii probabilității totale sunt definite potențialele de probabilitate inclusiv tehnica normalizării, apoi potențialele de evidență.
Teorema lui Bayes este p rezentată din punct de vedere cantitativ și calitativ. În acest scop
baza o reprezintă regula fundamentală a calculului probabilităților și regula probabilității totale.
O atenț ie specială a fost acordată definirii termenilor probability și likelyhood pentru care nu
există termeni diferiți în limba română. De asemenea, teorema lui Bayes este descrisă din punct
de vedere calitativ printr -o abordare logico -temporală, relativ la prelucrarea informației.
În continuare, este dezvoltată noțiunea de RB asoc iată cu teoria grafurilor. Este făcută
asocierea între RB și rețelele probabilistice, exemplificându -s e ș i d e o s e b i r e a d i n t r e o R B ș i o
diagramă de influență. Cea de- a doua categorie este ilustrată folosind exemplul de diagnosticare
a stării unui transforma tor de putere.
Circulația informației în rețelele cauzale pornind de la structurile elementare (conexiuni
seriale, divergente și convergente) este ilustrată printr -un exemplu din electroenergetică:
procesul de detectare a unei situații de alarmare într -un dispecerat energetic și diagnosticarea
diferențială a naturii perturbației.
Teoria grafurilor este particularizată prin definirea unui graf aciclic direcționat, care
constituie baza reprezentării unei RB și permite determinarea distribuției comune de
probabilitate.
Bazele raționamentelor în RB sunt dezvoltate pe baza tipurilor de inferență: cauzală, de
tip diagnostic și de tip continuarea explicației.
Avantajul utilizării RB se referă la independenț ele condiționate prezentate pe baza
criteriului de s eparație de tip d.
O categorie aparte de rețele este reprezentată de rețelele Bayesiene dinamice (RBD).
Acestea se constituie într -o modalitate specifică pentru modelarea evenimentelor care includ
variabila timp și influența altor factori.
Sunt detaliate aspecte privind funcția de distribuție de probabilitate a unei secvențe de
5
variabile pe durata unui interval de timp de studiu.
Capitolul 4 este, de asemenea, rezultatul unei documentării și, mai ales, al unei sinteze
privind metodele de construcție a R B. Metoda modelului structural de fiabilitate (MSEF),
metodele bazate pe legături minimale, întreruperi minimale, cea a arborelui de defectare sau pe
structura tehnică a sistemului analizat sunt dezvoltate pe baza unor exemple din domeniul
ingineriei energ etice.
Este detaliat algoritmul care trebuie parcurs pentru realizarea unei RB, se fac precizări la
posibilele dificultăți de calcul în utilizarea tabelelor de probabilități condiționate în cazul unui
mare de virabile părinți, prezentându- se și soluția de surmontare a acestor dificultăți pe baza
modelului de tip noisy -or.
Metodele amintite mai sus au fost aplicate pentru întocmirea unor structuri de RB ce
permit modelarea arhitecturilor nodale tipice pentru un sistem electroenergetic. Sunt determinate probabilitățile de alimentare cu energie electrică a nodurilor sarcină. Un nod de rețea specific,
alimentat din trei surse, două regenerabile și una reprezentată de racordul la rețeaua publică, a fost modelat printr -o RB dezvoltată către o diagramă de influență, ce permite analiza riscului de
întrerupere în alimentarea cu energie electrică datorat defectelor în amonte față de nodul sarcină, erorilor umane și nonfiabilității echipamentelor ce compun cupla longitudinală.
O diagramă de influență a fost întocmită pentru studiul disponibilității întrerupătoarelor
considerând sintetic întrerupătorul propriu -zis, mecanismul său de acționare, uzura în timp a
acestuia ca și costurile pentru mentenanță. Datele primare au fost selectate din practica de exploatare.
Unul dintre cele mai importante capitole ale tezei este destinat prezentării tehnicilor de
construcție automată a RB. Bazele de date se constituie în principalul factor de care depinde
întocmirea corectă a structurii RB precum și calculul parametrilor asociați.
Prima parte a capitolului 5 se referă la metodele de prelucrare a șirurilor de date cu
exemplificări privind resursele regenerabile. Prin natura lor pur aleatorie, datele privind viteza
vântului și iradiația solară, devenite importante pentru dimensiona rea surselor corespunzătoare
de energie, sunt adecvate pentru prelucrare ca bază a întocmirii structurii RB.
Modelarea sursei eoliene ca un sistem autoreparabil este dezvoltată în detaliu,
analizându -se distribuțiile de probabilitate și indicatorii de fiabilitate corespunzători. Sunt
efectuate calcule amănunțite, prelucrându -se un volum important de date primare având drept
rezultat întocmirea funcției de probabilitate a sursei eoliene.
6
În mod similar, au fost înregistrate, filtrate și prelucrate datele privind resursa solară. În
final a fost posibilă determinarea corelației dintre cele două variabile, producția de energie și
iradiația solară.
Anexa 5.2 include o trecere în revistă a tipurilor de erori ce afectează șirurile de date și a
testelor pen tru eliminarea acestora.
O parte din lucrările publicate au drept subiect colectarea, selectarea, eliminarea erorilor
și discretizarea datelor pe clase de variație pentru asigurarea unei precizii crescute relativ la
structura și parametrii RB generate.
Sunt prezentați algoritmii de învățare automată a structurii unei RB, algoritmi folosiți în
pachetele software specifice: Hugin, Genie, BayesiaLab sau AgenaRisk.
Unii dintre cei mai utilizați algoritmi: Naive Bayes, Augmented Naive Bayes,
TreeAugmented Naive Bayes, BayesianSearch, PC, EssentialGraphSearch și
GreedyThickThinning sunt detaliați din punct de vedere al datelor de intrare necesare, volumului și duratei de calcul precum și al preciziei rezultatelor.
Unii dintre acești algoritmi pot folosi baze de d ate în format continuu, alții doar date
discretizate.
Un rezultat al cercetării bibliografice, constă în sinteza criteriilor de ierarhizare pentru
alegerea structurii optime a unei RB, corelat cu baza de date. Dintre acestea, cele mai cunoscute
sunt:
– Criteriul Bayesian: pur Bayesian (B), Bayesian Dirichlet (BD), tipul K2, Bayesian
Dirichlet luând în considerare probabilitatea echivalentă și structura posibilă (BDe),
criteriul de selecție BDeu (o formă a criteriului BDe);
– Criterii de selecție ce au la baz ă informația teoretică: probabilitatea logaritmică (PL),
lungimea descrierii minime/ criteriul informațional Bayesian (LDM/CIB), criteriul
informațional Akaike (CIA), probabilitatea minimă normalizată (PMN), teste de
informație mutuală (TIM), etc.
Rezultate ale unor cercetări proprii sunt ilustrate de RB destinate calculării indicatorului
de fiabilitate LOLP, rețea inclusă în baza de modele a companiei software Hugin. Este detaliat
suportul teoretic și aplicativ pentru calculul acestui indicator folosind tehnici Bayesiene asociate
algoritmului NPC.
Un domeniu extrem de important și actual, în care RB își găsesc utilitatea este cel al
analizei disponibilității sistemelor cu un grad înalt de integrare a resurselor regenerabile.
RB pilotate de baze de date permit prognoze meteorologice și estimarea parametrilor
resurselor regenerabile și, ca urmare, a puterii disponibile.
7
RBD permit extrapolarea puterii disponibile către energia produsă în intervale de timp
selectate. Au fost întocmite RB folosind algoritmii BS și EGS, ce au permis pentru situații
concrete relativ la puterea surselor regenerabile, eoliană și solară, estimarea funcției de
probabilitate a puterilor respective și a celei corelate rezultante.
Opinia experților și verificările relativ la capacitatea RB pentru prognoze meteorologice
au confirmat cu erori acceptabile o portunitatea folosirii RB pe baza algoritmului EGS în acest
scop.
Partea finală a tezei prezintă rezultatele cercetărilor în domeniul tezei de doctorat,
concretizate în arti cole publicate în reviste de specialitate și volume ale conferințelor.
Principalele contribuții pot fi sintetizate astfel:
– Stabilirea unui model logic, cu exemplificare din domeniul electroenergetic, pentru ilustrarea principiului de transfer al informației în structuri elementare ale RB: conexiune
serială, convergentă și divergentă;
– Întocmirea unui set de RB asociate principalel or tipuri de arhitecturi nodale ce permit în
mod flexibil determinarea in dicatorilor de fiabilitate;
– Monitorizarea (î nregistrare a, selectarea și prelucrarea) unui volum important de
informații, privind parametrii meteorologici inclusiv cei ai resurselor regenerabile care au
stat la baza întocmirii structurii unor RB pentru studii de disponibilitate în
electroenergetică; în acest scop a fost utilizată stația meteorologică profesională Vintage Pro2Plus din cadrul Laboratorului de Cercetare Aplicată și Realizare de Prototipuri –
LACARP din cadrul departamentului de energetică;
– Modelarea probabilistică a resurselor de energie regenerab ilă (solară și eoliană) cu
evidențierea coeficienților Pearson de corelare dinamică;
– Întocmirea unei RB pentru calculul indicatorului de fiabilitate LOLP generalizat, inclus
în baza de date a companiei Hugin ;
– Întocmirea unei RBD folosind algoritmul BS pent ru evaluarea probabilistică a
disponibi lității resurselor regenerabile ;
– Întocmirea structurii, calculul parametrilor și analiza erorilor pentru o RB capabilă de prognoze meteorologice, estimări ale parametrilor resurselor regenerabile precum și a
celor cor espunzători surselor regenerabile (puteri/ energie) folosind algoritmul EGS;
– Întocmirea unei diagrame de influență ce are la bază modelarea unui întrerupător, a mecanismului său de acționare, considerând și decizii de corelare ale costurilor de
mentenanță în funcție de uzură.
8
Literatura studiată, cercetările efectuate, modelarea unor subsisteme din
electroenergetică, inclusiv a situațiilor integrării pe scară largă a surselor regenerabile, a permis
stabilirea unor noi direcții de extindere a utilizării tehnicilor Bayesiene cum ar fi:
– Dezvoltarea RB pilotate de date, cu generarea automată a structurii și optimizarea parametrilor în scopul modelării subsistemelor autonome de alimentare cu energie
electrică din surse regenerabile; Generarea și consumul local alături de minimizarea
interacțiunii cu rețeaua constituie ținte de optimizare;
– Consolidarea bazei de date existente în scopul creșterii preciziei calculelor probabilistice
privind echilibrul între energia electrică produsă și consumată;
– Testarea de noi al goritmi pentru optimizarea timpului și resurselor de calcul concomitent
cu creșterea preciziei rezultatelor;
– Extinderea utilizării RB și a diagramelor de influență pentru mdelarea subsistemelor de generare, transport și distribuție a sistemelor electroener getice;
– Folosirea tehnicilor Bayesiene pentru modelarea resurselor și surselor multiple regenerabile în scopul creșterii autonomiei în alimentarea sustenabilă cu energie electrică
și termică din hub- uri specializate.
1
Capitol ul 2
STADIUL ACTUAL PRIVIND UTILIZAREA REȚELOR BAYESIENE ÎN
ANALIZA DISPONIBILITĂȚII ÎN ELECTROENERGETICĂ
2.1 Stadiul actual privind utilizarea RB
Domeniul științific abordat în teza de doctorat este cel al rețelelor Bayesiene și a utilizării
lor în analiza disponibilității în domeniul electroenergetic. Utilizarea RB, cunoscute și ca rețele
de încredere sau rețele cauzale, a luat amploare în ultimele decenii deoarece reprezintă o metodă
adecvată de analiză pentru diferite domenii precum: diagnoza medicală, studii de disponibilitate
și fiabilitate, analiza riscului, proceduri de decizie, clasificare, extragere de date, etc.
Încă de la începuturi – anii 1980 și până în prezent, s -a înregistrat o dezvoltare rapidă a
algoritmilor de construcție, inferență, învățare și analiză a rețelelor probabilistice și de asemenea,
o creștere a numărului de aplicații a acestora.
Limbajul grafic reprezintă o unealtă importantă pentru rețelele probabilistice deoarece se
pot exprima simultan atât legăturile cauzale cât și relațiile de dependență și independență dintre variabile aparținând domeniului problemei analizate.
Tema de doctorat are strânsă legătură cu realizarea de modele de analiză pentru sistemele
electroenergetice. Teza își propune să contribuie la modelarea Bayesiană a disponibilității
componentelor și subsistemelor electroenergetice inclusiv a modelării detaliate a resurselor și
surselor regenerabile din ce în ce mai prezente în structura producției de energie.
Avantajele utilizării RB sunt cunoscute cercetătorilor. Există însă și dificultății ale
utilizării statisticii Bayesiene în practică .
Integrarea este uneori dificilă, în special dacă există mai mulți parametri.
Utilizarea metodelor de eșantionare permit determina rea un eșantion aleatoriu din
distribuția a posteriori fără a o cunoaște complet. Poate fi aproximată cu precizia dorită
extrăgând un eșantion suficient de mare. Astfel de proceduri, înlătură dezavantajul statisticii
Bayesiene.
Interesul comunității științif ice în publicarea de lucrări în domeniul RB a crescut
semnificativ datorită beneficiilor pe care le prezentă aceste a comparativ cu metodele clasice de
modelare precum: lanțul Markov, arbori de defectare sau rețele Petri. Lucrarea [ 2.1] prezintă o
analiză succintă asupra acestor aspecte.
2
În literatura de specialitate din domeniul RB, majoritatea referințelor se referă la
algoritmii de învățare și inferență [2.2], [2.3], [2.4] . Numeroasele articole despre aplicații ale RB
sunt realizate în direcții precum: analiza fiabilității [2.5], [2.6], [2.7], [2.8], [2.9] , analize de risc
și mentenanță.
Fig. 2. 1 Distribuția publicațiilor pe domenii de analiză [2.1]
2.1.1 Aplicații privind analiza fiabilității
Scopul analizei fiabilității este de a previziona starea unor parametri (timpul de defectare,
MTTF, fiabilitatea, etc.) care sunt introduși ca date de intrare pentru etapa decizională.
Prin urmare, este necesar să luăm în considerare unele aspecte precum analiza
elementelor cu stări multiple [2.10 ], dependențel e defectelor [2.11], redundanța sistemelor
[2.12], evoluția dinamică (ex. procesele de degradare) [2.11] și să analizăm factorii de influență
în fiabilitatea sistemelor [2.13].
Modelele de RB sunt din ce în ce mai utilizate în analiza fiabilității pentru a susține studii
despre disponibilitatea, fiabilitatea și mentenabilitatea sistemelor.
Figura 2.2 arată evoluția în timp a numărului de aplicații privi nd RB în analiza fiabilității.
Fig. 2. 2 Evoluția în timp a numărului de publicații privind RB în analiza fiabilității
Mentenanță – 13%
Analize de risc – 26%
Analiza fiabilității – 61%
0 5 10 15 20 25 30 35 Număr de contribuții
Anul
3
Este de observat că, începând cu anul 2000 se înregistrează o creștere de aproximativ
800% a numărului de aplicații, datorită avantajelor pe care acest tip de rețele le prezintă în
modelarea sistemelor.
Primele contribuții majore sun t prezentate în lucrările [2.14], [2.15 ], [2.16 ], lucrări ce își
arată originalitatea în două direcții: (a) estimarea fiabilității unui sistem prin includerea
posibilităților de dependențe ale defectelor; (b) modelarea sistemelor complexe.
2.1.2 Aplicații privi nd analizel e de risc
Analizele de risc reprezintă o tehnică de identificare, caracterizare, cuantificare și
evaluare a gradului critic de producere a unui eveniment. Cuantificarea unui risc include estimarea probabilității și a consecințelor producerii unui eveniment, estimări care depind în mod
direct de gradul de fiabilitate a componentelor sistemului și interacțiunea dintre acestea.
Fig. 2. 3 Evoluția în timp a numărului de publicații privind RB în analize de risc [2. 1]
Începând cu anul 2001, RB au fost utilizate și în analize privind situații de risc, datorită
avantajelor pe care le prezintă în modelarea unor date probabilistice ce conțin dependențe între
evenimente. Figura 2.3 arată dezvoltarea literaturii științifice în ceea ce privește utilizare a RB în
analize de risc.
2.1.3 Aplicații referitoare la mentenanț ă
Pentru dezvoltarea unui concept de mentenență corect, operațiunile de întreținere trebuie
considerate în mod holistic . Astfel trebuie luați în considerare factorii care descriu tehnic un
sistem ca fiind mentenabil (analize de funcționalitate sau disfuncționalitate, relațiile inter -cauzale
între etapele de degradare), precum și factorii care descriu relațiile între sistem e diferite.
În lucrarea [2.17] este propus un model de diagramă de influență pentru a estima starea
unui sistem supus unor activități particulare, model bazat pe probabilități condiționate și funcții
de utilitate.
0 2 4 6 8 10 12 14 16 18 20 Număr de contribuții
Anul
4
În fig ura 2 .4 este prezentată evoluția pu blicațiilor în ceea ce privește aplicarea metodelor
bazate pe RB în domeniul mentenanței sistemelor și se poate observa că începând cu anul 2000
numărul de aplicații ale RB în acest domeniu a crescut considerabil.
Fig. 2. 4 Evoluția în timp a numărului de publicații privind utilizarea RB pentru mentenanța sistemelor
2.1.4 Aplicații în domeniul electroenergetic
Pe lângă cele prezentate , în literatura de specialitat e se regăsesc și aplicații ale RB în
domeniul electroenergetic.
RB furnizează un cadru flexibil pentru reprezentarea probabilistică a informației și
realizarea unor deducții pe baza acesteia.
Disponibilitatea și fiabilitatea sistemelor electroenergetice reprezintă un domeniu
important în care aceste rețele ș i-au dovedit eficiența.
Începând cu lucrăr ile [2.18] și [2.19 ], care au stabilit modelarea seriilor temporale pentru
rețele Bayesiene dinamice ( RBD ), și finalizând cu lucrarea [2.20], care prezintă modelarea
arborilor de defectare dinamici pentru sisteme tolerante la defect și modele Markov pentru
analiza fiabilității sistemelor digitale tolerante la defect, literatura de specialitate prezintă o
multitudine de lucrări în domeniul fiabilității sistemelor electroenergetice, subsisteme și
componente.
Una din primele lucrări referitoare la analiza fia bilității subsistemului mixt, generator +
evacuare energie [2.21], al unui sistem electroenergetic, detaliază modul în care metoda clasică
din fiabilitate, cea a modelului cu bară unică, poate fi reluată în contextul utilizării rețelelor
Bayesiene (RB).
Pornind de la expresia distribuției comune de probabilitate dată de relația autorii au
calculat probabilitatea de funcționare a sistemului cu o putere dis ponibilă mai mare decât 375
MW.
Lucrarea [2.21] prezintă, de asemenea, modul în care se poate întocm i o RB pentru o
centrală electrică având asociată o schemă primară cu 1.5 întrerupătoare pe circuit folosind
tehnica tie -set-urilor sau a legăturilor minimale.
0 1 2 3 4 5 6 7 Număr de contribuții
Anul
5
În lucrarea [2.22] , se prezintă modelarea unei RB pentru calcularea indicelui
probabilitatea de întrerupere a alimentarii cu energie (LOLP – Loss of Load Probability) prin
conectarea subrețelelor reprezentând componente cheie a unui sistem bazat pe topologia unei
rețele electrice reale.
De asemenea și un studiu de caz pentru o rețea electrică comp usă din trei zone de
alimentare, ce au capacitatea de a asista în alimentare zonele vecine.
O altă lucrare în care este utilizată o metodă bazată pe RB, este lucrarea [2.23] , în care
acest tip de rețele este folosit pentru analiza fiabilității sistemelor de distribuție cu generare
distribuită. Metoda permite nu numai calcularea indicilor de fiabilitate ci și prezentarea efectelor uneia sau a mai multor componente asupra fiabilității sistemelor.
În lucrarea [2.24], e ste prezentată o metodologie minimalistă de construcție și analiză a
RB aferente sistemului test de fiabilitate (IEEE – RTS – Reliability Test System) încărcat la
vârful de sarcină de 200 MW.
RB a Sistemului Test de Fiabilitate este prezentată în această lucrare a permis calcularea
indicatorilor de severitate cu ajutorul algoritmul ui de eliminare a variabilelor.
Lucrarea [2.25] propune o metodă de abordare a probabilităților condiționate pentru
analiza disponibilității energiei în rețelele electrice de distribuție, utilizând RB.
În lucrare se prezintă o metodă de modelare a RB pentru a arăta influența
comportamentului întrerupătoarelor în ceea ce privește disponibilitatea energiei și un studiu de caz bazat pe o rețea electrică de 30 KV , pentru a demonstra importanța modelării Bayesiene în
domeniul cercetat.
Autorii utilizează rețelele Bayesiene dinamice (RBD), pentru a determina importanța
fiabilității întrerupătoarelor și de asemenea pentru a arăta diferite situații de alimentare cu
energie.
Pentru a putea controla o rețea electrică de distribuție, este luată în vedere monitorizarea
evoluției în timp a variabilelor din secțiunea controlată, obiectiv realizat în lucrarea [2.25] .
În [2.26] este prezentată o aplicație a RB pentru analiza fiabilității arhitecturilor nodale.
Pe lângă modalitatea de construcție și metodologia de calcul specific RB, autorii
realizează și un model de reprezentare a dependențelor întreruperilor pentru diferite configurații de rețea, model utilizat în studiul de caz pentru anali za defectelor întrerupătoarelor.
Configurațiile avute în vedere în aceasta lucrare sunt:
• Sistemul cu bară unică
• Sistemul cu bară secționată
• Sistemul de tip inel
• Sistemul cu 1,5 întrerupătoare pe circuit
6
• Sistem cu două întrerupătoare pe circuit
Pentru cele cinci tipuri de configurații, autorii au calculat indicii de fiabilitate :
intensitatea de defectare, media duratei de defectare și probabilitatea de defectare.
Pentru compararea și verificarea rezultatelor, autorii utilizează pentru calculul
probabi lităților de defectare metoda grupurilor de defectare minime și un program specializat
WinAREP, atât pentru întregul subsistem cât și pentru întrerupător ca echipament individual .
Diferențele dintre rezultatele obținute utilizând metoda RB și cele obținu te utilizând
software -ul WinAREP sunt datorită faptului că, programul sumează toate probabilitățile chiar
dacă unele sunt dependente de celelalte. Utilizând metoda RB pot fi analizate mai multe stări de
defect ținând cont și de dependențele dintre compone nte.
Complexitatea crescătoare a dependențelor între componente și a comportamentului
defectuos (ex. defecțiuni dependente de secvență, dependențe funcționale, etc) a sistemelor din
prezent, subiect mult dezbătut în lucrarea [2.27] , au dus la creșterea int eresului în modelarea
unor cadre flexibile pentru analiza fiabilității.
Abordări precum cea a arborilor de defect are cu structură dinamică (Dynamic fault trees –
DFTs) [2.28] , [2.29] , au dovedit creșterea puterii de modelare a modelelor tradiționale
combinatorii, cum ar fi arbori de defect statici (Static fault trees – FTS), luând în considerare nu
numai combinațiile ci, de asemenea, ordonarea secvențială a apariției unor defecțiuni ale
componentelor, care au dus la defectarea sistemului.
Cu toate acestea, în practică, arborii de defectare cu evoluție dinamică în timp prezintă
limitări severe, cum ar fi problema creșterii explozive a numărului stărilor și incapacitatea de a
gestiona d istribuții de defect non- exponențiale.
O serie de studii au încercat să utilizeze RB, precum și extinderea lor în modelarea
seriilor temporale, cunoscute și sub numele de Rețele Bayesiene Dinamice (DRB) [2.30], [2.31 ],
[2.32], pentru a oferi un cadru unif icat pentru modelarea fiabilității și analiza sistemelor
complexe.
Un alt beneficiu important al RB este că acestea ne permit să integrăm informații din
diferite surse, inclusiv date experimentale, date statistice, precum și opinia anterioară a experților . Acest lucru este deosebit de util pentru evaluarea fiabilității sistemelor tolerante la
defect, în cazul în care apar erori la testare și la operațiunile de pe teren, utilizate în mod tradițional ca o sursă de informare pentru evaluarea sistemului.
7
2.2 Motivarea alegerii temei tezei de doctorat
Prin prezentarea stadiului actual al domeniului cercetat, această teză dorește să
evidențieze faptul că utilizarea RB poate aduce îmbunătățiri în ceea ce privește calitatea
componentelor și rețelelor de distribuție din sistemul electroenergetic (SE) prin realizarea unor
diagnoze bazate pe cunoștințele experților și baze de date reale.
Literatura de specialitate abundă de lucrări și modele realizate de experți în domeniu din
diferite țări occidentale, însă în România, acest domeniu este slab cercetat și dezvoltat.
Cunoscând studiile realizate pe plan mondial în domeniul utilizării rețelelor Bayesiene,
pot spune că perspectiva este una promițătoare în ceea ce privește obținerea unor rezultate
concrete.
8
Referințe bibliografice
[2.1] G. Medina -Oliva, C.Simon, B.Lung P. Weber, "Overview on Bayesian networks applications for
dependability, risk analysis and maintenance areas," in Engineering Applications of Artificial Intelligence, 2012,
pp. 671- 682.
[2.2] Yu Wang, Weikang Qian, Shuchang Zhang, Xiaoyao Liang, Bo Yuan, "A Learning Algorithm for Bayesian
Networks and Its Efficient Implementation on GPUs", IEEE Transactions on Parallel & Distributed Systems,
vol.27, no. 1, pp. 17- 30, Jan. 2016, doi:10.1109/TPDS.2014.2387285
[2.3] Xue-Wen Chen, Gopalakrishna Anantha, Xiaotong Lin, "Improving Bayesian Network Structure Learning
with Mutual Information -Based Node Ordering in the K2 Algorithm", IEEE Transactions on Knowledge & Data
Engineering, vol.20, no. 5, pp. 628- 640, May 2008, doi:10.1109/TKDE.2007.190732
[2.4] Nayot Poolsappasit, Rinku Dewri, Indrajit Ray, "Dynamic Security Risk Management Using Bayesian
Attack Graphs", IEEE Transactions on Dependable and Secure Computing, vol.9, no. 1, pp. 61 -74,
January/February 2012, doi:10.1109/TDSC.2011.34
[2.5] S. Montani, L. Portinale, A. Bobbio, D. Codetta -Raiteri, A tool for reliability analysis of ynamic fault trees
through conversion into dynamic Bayesian networks. Reliability Engineering and System Safety, 93 (2008), pp.
922– 932
[2.6] M. Neil, D. Marquez, Availability modelling of repairable systems using Bayesian networks. Engineering
Applications of Artificial Intelligence, 25 (2012), pp. 698– 704
[2.7] O. Doguc, J.E. Ramirez -Marquez, A generic method for estimating system reliability using Bayesian
netwo rks. Reliability Engineering and System Safety, 94 (2009), pp. 542 –550
[2.8] A.G. Wilson, A.V. Huzurbazar, Bayesian networks for multilevel system reliability Reliability Engineering
and System Safety, 92 (2007), pp. 1413 –1420
[2.9] B. Langseth, L. Portinale. Bayesian networks in reliability. Reliability Engineering and System Safety, 92
(2007), pp. 92– 108
[2.10] Griffith W.S., "Multistate reliability models," Journal of Applied Probability 17, pp. 735 -744, 1980.
[2.11] Xie M. Lai C. -D., "Stochastic Ageing and Dependence for Reliability," Springer, New York, 2006.
[2.12] R., Safari, J., Sassani, F. Tavakkoli -Moghaddam, "Reliability optimization of series -parallel system with a
choice of redundancy strategies using genetic algorithm," in Reliability Engineering and System Safety 93, 2008.
[2.13] Bazovsky I., "Reliability Theory and Practice," in Prentice Hall, 1961.
[2.14] E., Solares, C., Gomez, P., Castillo, "Tail uncertainty analysis in complex systems," in Artificial
Intelligence 96, 1997, pp. 395 -419.
[2.15] Sucar L.E. Torres -Toledano J.G., "Bayesian Networks for Reliability Analysis of Complex Systems," in
Proceedings of the 6th Ibero -American Conference on AI: Progress in Artificial Intelligence, 1998, pp. 195 –206,
Vol. 1484.
[2.16] G., Sucar, L., Villavicencio, A. Arroyo, "Probabilistic temporal reasoning and its application to fossil
power plant operation," in Expert Systems with Applications 15, 1998, pp. 317 –324.
[2.17] C.W.,Golay,M.W. Kang, "A Bayesian belief network -based advisory system for operational availability
focused diagnosis of complex nuc lear power system," in Expert Systems and Applications 17, 1999, pp. 21- 32.
[2.18] J. Pearl, “Graphical models, causality, and intervention”, in Statistical Science, v ol. 8, no. 3, pp. 266 – 273.
[2.19] Jensen F., Bayesian Networks and Decision Graph.: Springer, 2001.
[2.20] Bavuso S. J. and Boyd M.A. Dugan J.B., "Dynamic Fault Tree models for Fault Tolerant Computer
Systems," IEEE Trans.Reliability, vol. 41, pp. 363 -377, 1992.
[2.21] Zhu Yongli, Fan Gaofeng, Huo Limin, "Reliability Assessment of Power Systems by Bayesian Networks,"
in IEEE, 2002, pp. 876- 879
[2.22] David C. Yu Thanh C. Nguyen Peter Haddawy, "Bayesian Network Model for Reliability Assessment of
Power Systems," in IEEE Transactions on Power Systems, Department of Electrical Engineering and Computer
Science, University of Wisco nsin-Milwaukee, Milwaukee, WI 53201, 1999, pp. 426- 432.
[2.23] L. Gao – Y. Zhou – C. Li – L. Huo, " Reliability assessment of distribution systems with d istributed
generation based on B ayesian networks ," Engineering Review, vol. 34, no. Issue 1, pp. 55- 62, 2014.
[2.24] S Patra S Deb, "A new methodology for severity analysis of power system network by using Bayesian
network," MAYFEB Journal of Electrical and Electronic Engineering, vol. 1, pp. 1 -6, 2016.
[2.25] Zine Ghemari Abdelaziz Lakehal, "Availability Assessment of Electric Power based on Switch Reliability
9
Modelling with Dynamic Bayesian Networks: Case Study of Electrical Distribution Networks," Journal of
Mathematics and System Science 5, pp. 289 -295, 2015.
[2.26] M.Sc. Łukasz Wojdowski, "Substation Reliability Evaluation with Dep endent Outages and Switching
Failures Using Bayesian Networks," Int. Journal of Precious Engineering Research and Applications, vol. ISSN :
2456- 2734, vol. 1, no. Issue 4, pp. 01 -11, November 2016.
[2.27] Martin Neil, Norman Fenton David Marquez, "A new Bayesian Network app roach to Reliability
modeling", Dep. of Computer Science Queen Mary; University of London.
[2.28] A., Portinale, L., Minichino, M., Ciancamerla, E. Bobbio, "Improving the analysis of dependable systems
by mapping fault trees into Bayesian networks," in Reliability Engineering and System Safety 71, 2001, pp. 249–
260.
[2.29] Andrea Bobbio Luigi Portinale, "Bayesian Networks for Dependability Analysis: an Application to Digital
Control Reliability," , Dipartimento di Scienze e Tecnologie A vanzate Universita del Piemonte Orientale "A.
Avogadro" – Alessandria (ITALY).
[2.30] P., Jouffe, L. Weber, "Reliability modeling with dynamic Bayesian networks," in Reliability Engineering
and System Safety. 91, 2003, pp. 149– 162.
[2.31] P., Jouffe, L. Weber, "Complex system reliability modeling with dynamic object oriented Bayesian
networks (DOOBN)," in Reliability Engineering and System Safety 91, 2006, pp. 149– 162.
[2.32] Muller A., Weber P. Ben Salem A., "Dynamic Bayesian Networks in system reliability analysis. ," in
Proceedings of the Sixt h IFAC Symposium on Fault Detection, Supervision and Safety of technical processes.,
2006, pp. 481- 486.
1
Capitol ul 3
REȚELE BAYESIENE ȘI DIAGRAME DE INFLUENȚĂ
3.1 Introducere
Denumirea de rețea Bayesiană este legată de numele lui Thomas Bayes1 și de formula sa
a probabilității condiționate dar termenul propriu- zis de „rețea Bayesiană” a fost introdus de
Judea Pearl în 1985 pentru a sublinia următoarele aspecte:
– natura subiectivă a informației utilizate;
– robustețea relației probabilității condiționate a lui Bayes în actualizarea informației;
– distincția între gândirea cauzală și cea probatorie (bazată pe evidențe) care subliniază
importanța lucrării lui Bayes, publicată postum în 1763 [3.1].
Thomas Bayes (1702 – 1761)
Autoportret
Literatura de s pecialitate oferă multe definiții generale ale RB, redate în forme destul de
diferite:
– RB reprezintă o modalitate de vizualizare grafică și de analiză a modelelor care
implică incertitudinea, incertitudine gestionată într -un mod matematic riguros,
eficient și simplu.
– O RB este o reprezentare a unei distribuții comune de probabilitate a unui set de variabile cu posibile legături mutuale cauzale între ele.
– O RB este o reprezentare grafică a unor mărimi (și decizii) incerte care, în mod explicit, relevă depend ența cauzală între variabile ca și circulația informației în
modelul procesului analizat.
– O RB se referă la o metodă sistematică și concretă pentru structurarea informației cu caracter probabilistic într -un mod coerent și cu ajutorul unor algoritmi de inf erență
2.
Thomas Bayes , născut în Hertfordshire, fiul preotului prezbiterian Joshua Bayes. A studiat logica și teologia la
Universitatea din Edinburg. A scris două cărți, una de matematică ( An Introduction to the Doctrine of Fluxions, and a Defence of
the Mathematicians Against the Objections of the Author of the Analyst ) și una de teologie ( Divine Benevolence, or an Attempt
to Prove That the Principal End of the D ivine Providence and Government is the Happiness of His Creatures).
2 Inferența statistică este o ramură a matematicii care oferă metodele de a trece de la rezultatele experimentale, bazate
pe eșantioane de selecție, la cele care caracterizează întreaga p opulație (de evenimente) analizată. În sens particular și local, în
analiza RB, termenul de inferență poate avea și înțelesul de calcul probabilistic.
2
– RB, cunoscute și sub numele de rețele probabilistice, rețele de încredere sau rețele
cauzale, sunt modalități de reprezentare a unor procese din domenii ce includ relații
incerte între grupuri de variabile aleatorii.
– RB sunt structuri grafice pentru reprezentarea dependențelor probabilistice între numeroase variabile și pentru efectuarea calculelor probabilistice cu aceste variabile.
Există și alte definiții care pot genera semne de întrebare privind înțelegerea exactă a
răspunsului la chestiunea titlului acestui paragraf. Răspunsul este realmente dificil, lucru demonstrat și prin faptul că, în literatură, abordarea subiectului legat de RB este, întotdeauna, însoțită de exemple. Generalizarea este, ca urmare, aproape imposibilă iar autorii simt nevoia de
a defini, explica, detalia, convinge și prin exemple.
3.2 Calculul probabilistic în rețelele Bayesiene
3.2.1 Aspecte fundamentale
Calculele de incertitudine utilizate în rețelele probabilistice au la bază teoria
probabilităților. Astfel, noțiunile de probabilitate și, în particular, probabilitatea condiționată,
joacă un rol cheie. Vor fi prezentate, în cele ce urmează, noțiunile de probabilitate, evenimente și trei teoreme de bază.
3.2.1.1 Definiția probabilității
Fie universul, discret, U , de elemente și fie X
⊆ U. Se notează X=U\X complementul lui
X. Figura 3. 1 arată U și ne putem imagina aria care acoperă X este proporțională cu numărul
elementelor pe care le conține.
Probabilitatea ca un element, ales aleatoriu din universul U să aparțină mulțimii X se
notează P(X) . P(X) poate fi văzut drept suprafața ocupată de X în U. Aceasta înseamnă că P(X)
este un număr între 0 și 1.
X
X
Fig. 3 .1 Universul e lementelor U=X X
Se presupune că YXYX U = , conform fig ura 3 .2. Probabilitatea ca un element
oarecare din U să aparțină și mulțimii YXse definește astfel:
Din nou, se poate interpreta ) ( YXP ca suprafața relativă definită, în comun, de X și Y.
Astfel, dacă X și Y sunt disjuncte ( ∅=YX ), atunci )( )( ) ( YP XP YXP += . Forma
conjunctivă ) ( YXP (sau P(XΛY) se scrie, deseori, P (X,Y).
Se consideră fig ura 3.3 și se presupune cunoscut faptul că un element oarecare din U
aparține și lui Y. Probabilitatea ca acest element să aparțină și lui X se determină ca raportul
3
)(/) ( YPYXP . Din nou, este util să se considere ) ( YXP și )(YP ca suprafețe relative din
U.
YX Y X
Fig. 3.2 Probabilitatea ca un element oarecare din U să aparțină fie domeniului X sau Y se definește cu relația
) ( )( )( ) ( YXP YP XP YXP −+=
Se va utiliza notația P(X|Y) , în care „|” se citește „cunoscând” sau, mai simplu „dat fiind”.
Rezultă:
Fig. 3.3 Probabilitatea condiționată ca un element oarecare din U să aparțină fie domeniului X dat fiind că se
cunoaște că aparține domeniului Y este suma dintre ) ( YXP și P(Y)
)(),(
)() ()|(YPYXP
YPYXPYXP = =
în care P(X|Y) se citește „ probabilitatea condiționată a lui X dat fiind Y ”.
3.2.1.2 Evenimente
Limbajul probabilistic constă în enunțarea unor afirmații (propoziții) dspre probabilități
sau evenimente. Ca un exemplu, se consideră că evenimen tul α, ca un eșantion din universul
XX U= , se întâmplă că aparține lui X. Probabilitatea unui eveniment α se notează cu P(α). În
general, un eveniment poate fi considerat ca un rezultat (mărime de ieșire) al unui experiment
(de exemplu aru ncarea unei monede), o observație (măsurare) particulară a valorii unei variabile
sau a unui set de variabile. Deoarece o rețea probabilistică definește o distribuiție de probabilitate
relativ la o mulțime de variabile, V, în acest context un eveniment rep rezintă configurația x ∈
dom( X) (un vector de valori) a unei submulțimi de variabile x ⊆V.
3.2.1.3 Probabilitatea condiționată
Conceptul de bază în analiza incertitudinii pe baza teoremei lui Bayes este probabilitatea
condiționată. Dat fiind evenimentul b, probabilitatea condiționată (de evenimentul b) a
evenimentului a este x și se notează cu
P(a|b) = x
Aceasta înseamnă că, dacă evenimentul b este adevărat și orice altceva este irelevant
pentru evenimentul a, atunci probabilitatea evenimentului a este x .
4
3.2.1.4 Axiome
Următoarele trei axiome formează fundamentul calculelor de probabilitate Bayesiene și
sintetizează considerațiile din §3.2.1.1.
Axioma 1 Pentru orice eveniment, a, 1≤≤0 )(aP cu P(a)=1 dacă, și numai dacă, a se
produce cu certitudine.
Axioma 2 Pentru orice două evenimente a și b, mutual exclusive, probabilitatea apariției
fie a evenimentului a fie a evenimentului b este
)( )( ) ( ) ( bPaP baP bsauaP +=∨≡
În general, dacă evenimentele a 1, a2, …., a n sunt exclusive două câte două, atunci
∑=++=
1n
ii nn
ii aP aP aP a P )( )( ……..)(
Axioma 3 Pentru orice două evenimente a și b, probabilitatea ca să se producă ambele
este
)()|( )()|( ),( ) ( ) ( bPbaP aPabP baP baP bsiaP ⋅=⋅=≡∧≡
P(a,b) se numește probabilitatea comună a evenimentelor a și b.
Axioma 1 stabilește, simplu, că o probabilitate este un număr real pozitiv, mai mic sau
egal cu 1, iar atunci când este egal cu 1 evenimentul asociat este sigur.
Axioma 2 indică faptul că, dacă două evenimente nu pot să se producă simultan, atunci
probabil itatea ca oricare dintre ele să se producă este egală cu suma probabilităților lor,
individuale.
Axioma 3 este denumită și regula fundamentală a calculului probabilităților. Aceasta
stabilește că probabilitatea de apariție simultană a două evenimente, a și b, poate fi determinată
ca produs între probabilitatea evenimentului a (b) condiționată de faptul că evenimentul b (a) s-a
produs deja și probabilitatea apariției evenimentului b ( a).
3.2.2 Distribuții de probabilitate ale variabilelor
Rețelele probabilistice sunt definite pe mulțimea finită a variabilelor, fiecare dintre
acestea reprezentând o mulțime finită de stări (evenimente) mutual exclusive, conform §3.1.2.
Astfel, distribuțiile de probabilitate (condiționată) ale variabilelor joacă un rol important în
rețelele probabilistice.
Dacă X este o variabilă aleatorie definită pe domeniul dom ) ,…,()(xx x X1= , atunci P( X)
semnifică o distribuție de probabilitate în care
( )) ( ),……, ( )(xxXP xXP XP = ==1
Dacă nu este posibilă nici o confuzie, se va utiliza P( x) drept exprimare concisă pentru
P(X=x), etc.
5
Dacă distribuția de probabilitate a variabilei Y este condiționată de variabila (sau setul de
variabile) X, atunci se va utiliza notația P( Y|X). Aceasta înseamnă că, pentru orice valoare (stare)
posibilă, x∈dom( X), avem o distribuție de probabilitate P( Y|X=x ); din nou, dacă nici o confuzie
nu este posibilă, se va scrie P( Y|x).
3.2.2.1 Legea probabilității totale
Fie P( X,Y) distribuția de probabilitate comună a variabilelor X și Y definite pe domeniile
dom( X) = { x1, ….., x m} și respectiv dom( Y) = { y1, ….., y m}. Pe baza faptului că dom( X) și
dom( Y) sunt mulțimi exhaustive ale stărilor X și Y, mutual eclusive, axioma 2 permite formularea
legii probabilității totale:
∑
1=1 11 = ++ =∀n
ii n i i yxP yxP yxP xPi ),( ),( …..),( )(: ( 3.1)
Folosind ( 3.4), se poate calcula P( X) pornind de la P( X,Y):
=∑ ∑
1= 1=1n
jn
jj m j yxP yxP XP ),( ),….,,( )(
Într-o exprimare mai compactă, se poate scrie:
∑
1==n
jjyXP XP ),( )(
sau, și mai concis:
∑=
yYXP XP ),( )( ( 3.2)
ceea ce denotă suma pentru toate valorile lui y. De acum încolo, referirea la ( 3.2) se va face prin
noțiunea de marginalizare sau proiecție . Operația descrisă de (3.2) se mai numește și
margi nalizarea în afara lui Y a P(X,Y) sau eliminarea lui Y din P(X,Y) .
3.2.2.2 Reprezentarea grafică
Distribuțiile de probabilitate ale rețelelor probabilistice sunt exprimate sub forma P(X|Y),
în care X este o singură variabilă iar Y reprezintă (posibil) un set de v ariabile. X și Y sunt, uneori,
denumite și „cap” și respectiv „coadă” pentru P( X|Y). Dacă Y=Ø (set nul de valori), P( X|Y) se
numește distribuția marginală de probabilitate și se scrie P( X). Relația dintre X și Y={Y1, …, Y n}
poate fi reprezentată grafic printr -un GAD (grafic direct, aciclic) ca în fig ura 3 .4, în care nodul
„copil” (descendent) este notat cu X iar „părinții” (ascendenții) cu Y 1, Y 2 , etc.
Fig. 3.4 Reprezentarea grafică a P( X|Y1 ,….., Y n)
6
3.2.3 Potențiale de probabilitate
În utilizarea rețelelor de probabilitate noțiunea de „potențiale” apare, deseori, ca fiind
convenabilă. În mod formal, un potențial de probabilitate este o funcție non- negativă definită pe
spațiul domeniilor unui set de variabile. Se vor folosi litere grecești ( Φ, Ψ ) pentru a nota
potențialele și, uneori, indici inferiori pentru specificarea domeniilor lor (de exemplu, ΦX,
exprimă un potențial definit pe dom( X)) sau pentru a indica faptul că un potențial ΦX este unul
marginal al lui Φ .
3.2.3.1 Normalizarea
Un potențial (de probabilitate) ΦX, definit pe dom( X) este tranformat într -o distribuție de
probabilitate P( X) prin operațiunea cunoscută sub numele de normalizare . Se va utiliza notația
η(Φ X) pentru a exprima normal izarea lui Φ X, unde η( ΦX) se definește astfel:
∑=
X XX
XΦΦΦη )( (3. 3)
Ca urmare, P( X) = η(Φ X). Distribuția probabilității condiționate P( X|Y) se poate obține
din distribuția comună P( X,Y) prin normalizarea condiționată în raport cu X :
)|()(),(
),(),()),(( XYPXPYXP
YXPYXPYXPη
YX = = =∑
În general,
)'|'\()'()(
)(),())((
'\' XXXPXPXP
XPYXPXPη
XXX == =∑ (3. 4)
în care X’ este o submulțime a mulțimii X. În particular,
)( ))(( ))(( XP XPη XPη = =∅
dacă P( X) este o distribuție de probabilitate definită pe X. Acest lucru este valabil și pentru
distribuțiile condiționate:
)|( ))|(( YXP YXPηY =
deoarece
∑ 1=
XY YXP )|( (3. 5)
în care 1 Y semnifică un vector unitar definit pe dom( Y). Un potențial uniform, de exemplu 1 Y, se
numește potențial vid . În mod intuitiv, un potențial vid poate fi văzut ca un potențial non –
informativ (superfluu).
3.2.3.2 Potențiale de evidență
Pentru a calcula distribuția comună posteriori, rezultând din încorporarea unei mulțimi de
observații sub forma funcțiilor de evidență, se va extinde, simplu, setul de constituenți ai
funcțiilor de probabilitate (posibil sub forma potențialelor) cu potențialele de evidență
corespondent e, se vor multiplica și se va normaliza produsul.
7
Înaintea considerării oricărei evidențe, distribuția de probabilitate P( X’) pentru o
submulțime X’⊆X de variabile, se numește distribuție de probabilitate apriori a lui X’. Dat fiind
un potențial de evidență ε E pe o submulțime E ⊆X, distribuția comună posteriori se obține ca
E
XXε XP εXP ∗ =∑
'\)( ),'(
și distribuția condiționată posteriori se obține prin normalizarea
)),'()|'( ε PXηεXP=
3.2.3.3 Calculul potențialelor
Pentru efectuarea inferenței în rețelele probabilistice sunt necesare unele operații relativ
simple cum sunt multiplicarea (combinarea), împărțirea, adunarea și marginalizarea (proiecția).
Toate sunt definite în continuare.
Fie Φ și Ψ potențiale definite pe dom( X) și respectiv dom( Y) și fie ) ( YX domz ∈ un
element (configurație) arbitrar.
Se definește ΨΦ∗ astfel:
)()( ))( (Y X zΨzΦzΨΦ =∗ (3. 6)
în care z X și zY sunt proiecțiile lui z pe dom( X) și respectiv pe dom( Y). Adunarea se definește
analog. O atenție specială trebuie acordată pentru evitarea împărțirii la zero care este definită într-un mod evident:
0≠0= 0
=
restin nedefinitazΨ daca zΨ zΦzΦ daca
zΨΦY Y XX
)( )(/)()(
))(/( (3. 7)
Se va vedea ulterior, pentru toate operațiile relevante implicate în inferența din cadrul
rețelelor probabilistice că 0=)(XzΦ implică 0=)(YzΨ în împărțirea lui Φ la Ψ și astfel,
definind 0/0=0, operatorul de divizare este totdeauna definit.
Fie X’⊆X și fie ΦX un potențial definit pe dom( X). ∑='\'XXX X Φ Φ reprezintă
marginalizarea (proiecția) lui ΦX pe dom( X’) definită astfel:
∑
∈=
)',(' )',( )'(
xz domzX X xzΦ x Φ (3. 8)
în care z, x’ este elementul din dom( X) pentru care ( z, x’)X\X’ = z ș i ( z,x’)X’ = x’. Figura 3.5
ilustrează procesul în care toate valorile lui ΦX corespunzătoare configurațiilor cu X’=x’ sunt
adăugate împreună determinând valoarea lui Φ X’(x’).
8
Fig. 3.5 Marginalizarea (sau proiecția) lui ΦX (zi, x’) pe dom(X’) pentru toate valorile
zi∈dom(X \X’): ΦX’(z1 , x’)+……+ΦX(zn ,x’)
3.2.3.4 Legea distributivității
Fie Φ și Ψ potențiale definite pe dom( X) = { x1,…..x m} și respectiv dom( Y) = { y1,….y n}, în
care X∩Y =Ø. Folosind legea distributivității, se obține:
∑∑∑∑∑ ∑∑ ∑
==++ ++++++ ++ = =∗
∈ ∈1 1 11 11
∈ ∈
'\ '\ )'\( )'\('\ )'\( )'\( '\
)( )()]( ……)()[( ….)]( ……)()[(….)()( …….)()( )()( ) (
YY XX YY domy XX domxn m nn
XX XX domx YY domy YY
Ψ Φ yΨ xΦyΨ yΨxΦ yΨ yΨxΦyΨxΦ yΨxΦyΨxΦ ΨΦ
(3.9)
în care X X⊆' , Y Y⊆' și ∑∑Y XΨ Φ este reducerea pentru ∑∑∗X YΨ Φ )) (( . Astfel, dacă se
dorește calcularea distribuției marginale '') (YXΨΦ∗ și ∅=YX , utilizarea legii
distributivității permite redu cerea termenilor și, ca urmare, a complexității calculelor.
3.2.3.5 Variabile neproductive
Variabilele unui model grafic care nu au descendenți observabili nu sunt, niciodată,
observabile. Dacă nu se dorește calcularea probabilităților lor posteriori, aceste varia bile se
numesc variabile neproductive deoarece nu aduc nici o informație în forma potențialelor vide și,
ca urmare, pot fi scoase din model.
3.2.4 Regula fundamentală și teorema lui Bayes
Generalizând axioma 3 ( §3.2.1.4) pentru cazul variabilelor aleatorii X și Y se poate scrie
regula fundamentală a calculului probabilităților:
)()|( )()|( ),( XPXYP YPYXP YXP = = (3. 10)
Teorema lui Bayes rezultă imediat:
)()()|()|(YPXPXYPYXP= (3. 11)
Folosind axioma 3 și regula probabilității totale, ecuația (3. 11) se poate rescrie astfel:
) () |( ….) () |()()|()|(
Y n y YPy YXP y YPy YXPYPYXPXYP= = ++===
1 1
9
Aceasta înseamnă că numitorul din (3.11) poate rezulta din numărătorul aceleiași ecuații.
Mai mult, deoarece numitorul este, evident, același pentru toate stările lui Y, teorema lui Bayes
se mai poate scrie:
)()|( )|( YPYXP XYP∝ (3. 12)
în care ∝se citește „proporțional cu”. De reținut că factorul de proporționalitate P(X)-1 este, de
fapt, un vector al constantelor de proporționalitate, unul pentru fiecare stare a lui X, determinat
în operația de normalizare.
Împărțirea la zero în (3. 11) nu reprezintă o problemă în urma definirii 0/0=0. Pentru ca
∑=
jj j i i yPyXP xP )()|( )(
să fie zero, cel puțin unul din termenii P( xi|yj) și P(y j) trebuie să fie zero pentru fiecare j și, dacă
acesta este cazul atunci atât termenul numărătorului, P( xi|yj)P(y j) și termenul numitorului, P( xi),
în ecuația (3.11) vor fi zero.
3.2.4.1 Interpretarea teoremei lui Bayes
Dată fiind importanța teoremei lui Bayes în calculul probabilităților, este necesară
detalierea acesteia pentru o mai bună înțelegere și utilizare.
Se presupune că există două variabile (posibil două mulțimi de variabile) X și Y, un
model P( X,Y) dat în formă factorizată P( X|Z)P(Y) și observația X = x. Trebuie calculată P( Y|x).
Distribuția apriori, P( Y), exprimă încrederea inițială relativ la variabila Y iar distribuția
posteriori P( Y|x) exprimă încrederea, revizuită, relativ la Y, în lumina observație i X = x . Teorema
lui Bayes permite determinarea distribuției posteriori prin multiplicarea distribuției apriori P( Y)
cu raportul P( x|Y)/P(x ). Din nou, deoarece P( x) este o constantă pentru fiecare y∈dom( Y), se
obține:
)|()( )|( YxPYP xYP∝
Cantitatea )|( )|( xYL YxP= se numește probabilitatea lui Y dat fiind x. Ca urmare, se
poate scrie:
)|()( )|( xYLYP xYP∝ (3. 13)
În general,
posteriori ∝apriori · probabilitate
În contextul procesului de învățare automată, teorema lui Bayes jaocă un rol important.
De exemplu, considerând o distribuție apriori, P( M) pentru variabila aleatorie M putem
reda o mulțime de modele posibile. Pentru orice valoare d a unei a lte variabile D (reprezentând
date), cantitatea P( d|M) – considerată o funcție de M – este probabilitatea lui M dat fiind data d.
Distribuția posteriori a lui M dat fiind d este
)|()( )|( MdPMP dMP∝
10
3.2.4.2 Inversarea conexiunilor
Teorema lui Bayes are și o interpretare grafică. Se consideră, de exemplu, două variabile
A și B și un model P( A,B)=P( A)P(B|A ). Din nou, conform celor prezentate în §3.2.2.2, acest
model poate fi reprezentat grafic ca în fig ura 3 .6a. Pentru a aplica teorema lui Bayes se
efectuează următoarele calcule:
)(/),( )|(),( )()|()( ),(
BPBAP BAPBAP BPABPAP BAP
A
===
∑
și se obține modelul din fig ura 3 .6b. Astfel, un mod de interpretare a aplicării t eoremei lui Bayes
este prin ceea ce se numește inversarea conexiunii .
Deoarece un calcul tipic în procedura de inferență în cadrul rețelelor probabilistice este
determinarea P(X|ε), inferența poate fi interpretată ca o aplicare repetitivă a teoremei lui Bayes
sau, cu alte cuvinte, ca o secvență de inversări a conexiunilor. Shachter (1990) a exploatat a cest
mod de abordare a inferenței în stabilirea algoritmului său de inversare a conexiunilor.
Fig. 3.6 Două modele echivalente ce se pot obține, unul din celălalt, prin inversarea conexiunii
3.2.5 Factorul lui Bayes
Pentru a determina suportul relativ oferit de o observație Y=y în cazul a două ipoteze
concurente, H 0: X=x 0 și H 1: X=x 1, este utilă folosirea noțiunii de factor al lui Bayes :
)|()|(
),()|(
)(/),()(/)|(
)(/)()|(/)|(
yxLyxL
xyPxyP
xPyxPxPyxP
xP xPyxPyxPB
10
10
1 10 0
1 01 0= = = = (3. 14)
ceea ce înseamnă că factorul lui Bayes este raportul probabilităților celor două ipoteze dată fiind observația. Factorul lui Bayes este cunoscut și sub numele de raportul Bayesian al
probabilităților .
Din ecuația (3.14) se observă următoarele:
B > 1 dacă observația favorizează mai mult ipoteza H
o decât ipoteza H 1;
B < 1 dacă observația favorizează mai puțin ipoteza H o decât ipoteza H 1 și
B = 1 dacă observația nu oferă suficientă informație pentru a diferenția cele două ipoteze.
3.2.6 Independența
O variabilă X este independentă față de o altă variabilă Y în raport cu o distribuție de
probabilitate P dacă:
11
)( ),( ),( )|( Y domy X domx xP yxP ∈∀ ∈∀= (3. 15)
Această proprietate se poate exprima simbolic drept X╧PY sau, simplu, X╧Y. Simetria
independenței ( X╧Y ≡ Y╧X) poate fi verificată folosind teorema lui Bayes:
)|( )()()()|()|( )( xyP yPyPxPxyPyxP xP =⇔ = =
Relația X╧Y se numește, deseori, și independența marginală între X și Y.
Dacă X╧Y, folosind regula fundamentală (3.10) și (3.15), se obține:
)()( )()|( ),( YPXP YPYXP YXP = = (3. 16)
și, în general, ori de câte ori X1,……, X n sunt perechi de variabile aleatorii independente,
distribuția lor comună este egală cu produsul probabilităților marginale:
∏=1
ii n XP X XP )( ) ,……,( (3. 17)
O variabilă X este independentă condiționat de Y , dată fiind Z, în raport cu o distribuție de
probabilitate P, dacă
)( ),( ),( ),|( ),|( Z domz Y domy X domx zxPzyxP ∈∀ ∈∀ ∈∀ = (3. 18)
Independența condiționată stabilită de (3.17) este redată de X╧Y|Z în notarea standard
stabilită anterior.
Din nou, folosind regula fundamentală și ecuația (3.17), se obține:
)()|()|( )()|(),|( ),(),|( ),,( ZPZYPZXP ZPZYPZYXP ZYPZYXP ZYXP = = =
3.2.7 Regula lanțului
Pentru distribuția de probabilitate P( X) definită pe mulțimea X = {X1,…,X n}, se poate
utiliza, repetitiv, regula fundamentală pentru a o descompune într -un produs de distribuții de
probabilitate condiționate:
∏
1=1+1− 32 212 21
== =
n
in i in n n n nn n
X XXPXPP XP X X XPX XXPX XPX XXP XP
) ,…, |()()| ( )….. ,….|() ,…..,|() ,….() ,…..,|( )(
(3. 19)
De observat este că distribuțiile condiționate actuale, care includ factorii descompunerii ,
sunt determinate de ordinea în care se selectează primele variabile ale distribuțiilor condiționate.
Asfel, există n! factorizări diferite ale distribuției P( X), fiecărei factorizări corespunzându -i un
unic GAD. Toate aceste GAD- uri, însă, sunt echivalente în termenii proprietăților de dependență
și independență deoarece sunt toate grafuri complete și, ca urmare, nu reprezintă nici o afirmație
de independență.
3.3 Regula ( teorema ) lui Bayes – interpretarea cantitativă
Probabilitatea unui eveniment x , condiționată de cunoașterea evenimentului y (pe scurt,
probabilitatea lui x dat fiind y ) se definește astfel:
12
)(),()|(ypyxpyxp≡ (3. 20)
În cazul în care p( y) = 0, p(x│y) nu este definită.
Ținând cont de egalitatea
)(),( )()|( ),( xpxyp ypyxp yxp ⋅=⋅= (3. 21)
rezultă forma cunoscută a teoremei lui Bayes:
)()()|(|(ypxpxypyxp⋅= (3. 22)
3.3.1 Func ția densitate de probabilitate
Pentru o variabilă continuă x, funcția densitate de probabilitate p(x) se definește astfel
încât
0≥1=∫+∞
∞−)(; )( xp dxxp (3. 23)
∫=<<b
adxxp bxap )( ) ( (3. 24)
Pentru variabile continue, evenimentele sunt definite pentru apariția variabilei într -un
interval definit. De exemplu:
∫51
2−=−∈.
)( ]) 2,1.5[( dxxf xp (3. 25)
în care f (x) este funcția densitate de probabilitate a variabilei aleatorii continue x. Comparativ cu
valorile probabilității, densitățile de probabilitate pot lua valori pozitive mai mari decât 1.
3.3.2 Independența
Două evenimente sunt independente dacă se cunoaște că unul dintre ele nu oferă nici o
informație suplimentară despre cel de al doilea. Matematic, acest lucru se exprimă astfel:
)()( ),( ypxp yxp= (3. 26)
În cazul în care p( x)≠0 și p(y)≠0, independența dintre x și y este exprimată prin:
)( )( )( )( yp xyp xp yxp = ⇔= (3. 27)
Dacă
)()( ),( ygxcfyxp= (3. 28)
în care f (·) și g(·) sunt funcții pozitive iar c este o constantă oarecare, atunci x și y sunt
independente.
13
Observație
În ecuațiile (3.22) și (3.26) toți termenii reprezintă probabilități. În limba engleză, limba
”maternă” a teoremei lui Bayes, în domeniul fiabilității și calculului probabilistic există o
nuanțare a termenilor: pentru fiabilitate, folosindu- se reliability și dependability iar pentru
probabilitate există probability și likelihood. Dacă pentru reliability și dependability nu există
definiții specifice diferite în domeniul fiabilității, termenii probability și likelihood sunt, poate
cel mai bine și mai sintetic definiți de profesorul de psihologie, C. Randy Gallistel, specialist în
studiul proceselor cognitive de învățare și memorare, de la Universitatea Rutgers din New
Jersey, S.U.A:
”The distinction between probability and likelihood is fundamentally
important: probability attaches to possible results; likelihood
attaches to hypotheses ”[3.2].
În limba română de specialitate nu există, încă, astfel de nuanțări astfel că se folosesc
numai termenii, bine definiți, de fiabilitate și probabilitate cu tot dezavantajul legat de explicarea
foarte exactă a teoremei lui Bayes și a probabilităților condiționate.
3.3.3 Dependențe deterministe
Conceptul de independență poate crea unele confuzii deoarece are un sens semantic și
unul relativ la probabilitatea condiționată. Referitor la primul sens, cuvântul sugerează că nu
există nici o influență sau legătură între obiectele analizate. Al doilea sens definește independența statistică iar răspunsul la întrebarea legată de independența a două variabile rezultă
din interogarea: „cunoscând starea variabilei y știm mai multe despre variabila x decât cunoșteam
înainte de a avea informații despre y ?”. „Cunoșteam înainte” se concretizează prin „cunoșteam
p(x,y) și puteam afla ceva despre x, în special despre p( x)”.
Testarea independenței poate avea rezultate surp rinzătoare în acest context. Se consideră
două variabile binare, x și y pentru care se definește distribuția de probabilitate astfel încât
variabilele sunt, întotdeauna, într -o stare comună, cunoscută întotdeauna, astfel:
p(x = f, y = 1) = 1
p(x = f, y = 2) = 0
p(x = d, y = 1) = 0
p(x = d, y = 2) = 0
Sunt variabilele independente? Putem scrie, marginalizând, că p(x = f) = 1, p(x = d) = 0 și
p(y = 1) = 1, p (y = 2) = 0. Rezultă că p(x,y) = p( x,y) pentru toate combinațiile dintre stările lui x
și y. Ca urmare, conform relației (3.26), variabilele sunt independente. Acest lucru poate părea
curios deoarece, în acest exemplu, se cunoaște relația dintre x și y, și în special că acestea sunt,
întotdeauna, în aceeași stare comună și, deci independente. Deoa rece distribuția de probabilitate
14
este, simplist, concentrată într -o singură stare comună, cunoașterea stării lui x nu aduce nimic
suplimentar ca informație față de ceea ce se știa anterior despre starea lui y și reciproc.
3.4 Regula ( teorema ) lui Bayes – interpretarea calitativă
Importanța teoremei lui Bayes, justificare a extinderii utilizării acesteia în multiple
domenii ale științei și ingineriei, constă în faptul că relația (3.22) permite raționamente logice,
judecăți relativ la transmiterea informației și o extindere a calității rezultatelor față de analizele
de fiabilitate bazate pe statistica frecvențială clasică.
Teorema probabilității condiționate permite raționamente logice și calcule consistente.
Relația (3.22) poate fi descrisă, calitativ și din punct de vedere al transferului informației,
astfel:
]) evidenta[(] prioria)[( ate] probabilit)[|(] posterioria)[|(bpap abpbap⋅= (3. 29)
în care:
– a reprezintă ipoteza;
– b reprezintă evidența (dovada);
– p(a|b) reprezintă probabilitatea ulterioară (a posteriori), dată fiind cea anterioară p(a) (a
priori);
– p(b|a) este probabilitatea ca b să se materializeze dacă evenimentul a este adevărat;
– p(b) este factorul de normalizare, calculat cu relația următoare:
)()|( )()|( )( apabp apabp bp + = (3. 30)
ce se poate calcula ținând cont că p(a|b) + p(ā|b) este egală cu 1.
Relația (3.29) poate fi redată, mai sintetic, astfel:
informația anterioară + evidența = informația ulterioară (3. 31)
O analiză mai atentă, lo gică, a relației (3.31) ar putea redefini -o sub forma:
informația anterioară + evidența = informația actuală (3. 31’)
considerând momentul de referință prezentul . Terminologia folosită, în exclusivitate în literatura
internațională, include termenii a priori și a posteriori presupunând momentul de referință cel al
perceperii evidenței . Având în vedere acest lucru, în prezenta lucrare se adoptă logica relației
(3.31) și termenii asociați consacrați.
Principalul avantaj al statisticii Bayesiene este considerarea informației a priori, fie sub
forma a ceea ce se crede sau a ceea ce se reține din ceea ce se crede din aceasta. Informația a
priori reprezintă o ponderare s ubiectivă a valorilor pe care le poate lua un parametru, înaintea
examinării obiective a datelor. Mai concret, de exemplu se știe a priori că variabila are o distribuție normală dar valorile mediei și dispersiei se vor determina a posteriori.
Teorema lui Bayes permite reevaluarea încrederii relativ la valoarea unui parametru, date
fiind valorile deja apărute. O încredere a priori (inițială) trebuie să existe și de la aceasta se
15
pornește. Distribuția a priori dă „greutatea” relativă a încrederii care există în valorile posibile
ale parametrilor.
Regulile statisticii clasice sunt dificile. Conceptele privind testarea ipotezelor și
intervalele de încredere sunt subtile. Statistica Bayesiană se rezumă la un singur instrument:
teorema lui Bayes pentru a revizui și adapta încrederea noastră pe baza informației oferită de
date. Conceptual, este o modalitate mai directă pentru inferență. Perspectiva Bayesiană oferă mai
multe avantaje în raport cu perspectiva oferită de statistica frecvențială, convențională:
– Obiecti vitatea cercetătorilor care folosesc statistica frecvențială se obține prin neglijarea
informației de tip a priori relativ la procesul analizat, cu toate că știința domeniului
respectiv are, de regulă, unele informații pre -existente. Neglijarea acestora reprezintă o
pierdere, uneori și materială. Statistica Bayesiană utilizează ambele surse de informații:
cele de tip a priori și cele oferite de date. Ambele sunt combinate în teorema lui Bayes.
– Abordarea Bayesiană permite enunțarea directă a probabilităților parametrilor. Acest
lucru este util cercetătorilor comparativ cu stabilirea intervalelor de încredere, specifice statisticii frecvențiale și reprezintă un motiv serios pentru utilizarea statisticii Bayesiene.
– Statistica Bayesiană folosește un singur instr ument, teorema lui Bayes, în toate situațiile.
– Metodele Bayesiene sunt, deseori, mai precise decât cele frecvențiale, lucru recunoscut
chiar de utilizatorii acestora din urmă.
– Statistica Bayesiană are un mod bun de a prelucra parametrii „incomozi”, de ned orit. Pot
fi marginalizați și eliminați din distribuția comună a posteriori.
– Teorema lui Bayes oferă posibilitatea estimării distribuției observațiilor (variabilelor aferente) viitoare. Acest lucru nu este, întotdeauna, ușor de făcut în statistica frecvenț ială.
O interpretare mai detaliată privind teorema lui Bayes, din perspectiva modelării, poate fi
inițiată pornind de la ecuația următoare și ca răspuns la întrebarea „ce am putea afirma
(cunoaște) despre distribuția parametrului θ, după ce am observat ate nt datele D și folosind
cunoștințele pe care le avem despre mecanismul implicit de generare a datelor?” . În acest
context, teorema poate fi scrisă astfel:
∫= =
θθpθDpθpθDp
DpθpθDpDθp
)()|()()|(
)()()|()|( (3. 32)
Relația (3.32) formalizează modul în care un model generator p( D|θ) al setului de date,
cuplat cu o probabilitate (încredere) anterioară p(θ) despre valorile cele mai plauzibile ale
parametrului θ, ne permite să determinăm distribuția a posteriori p(θ|D) a parametrilor ținând
cont de datele observate.
Utilizarea acestui model generator corespunde tehnicilor de cercetare reale în care este
adoptat modul în care este generat fenomenul de observat (experimental, simulat, înregistrarea
unui fenomen natural, etc.) presupunând că se cunosc valorile corecte ale modelului.
Axiomele probabilității, combinate cu teorema lui Bayes, conduc la un sistem de gândire
în care logica deductivă clasică este un caz particular [3.3].
Paradigma esențială a gândirii (raționamentului) probabilistice constă în identificarea
tuturor variabilelor relevante x 1, ………, x n dintr -un domeniu și construcția unui model
probabilistic p(x1, ………, x n) al interacțiunii dintre ele. Inferența se realizează prin perceperea
16
și considerarea evidenței care fixează variabilele în s tări cunoscute calculând, în subsidiar,
probabilitățile care interesează, condiționate de această evidență.
Evidența se mai numește și probabilitate marginală sau distribuție marginală de
probabilitate. Termenul p(|D|θ), așa cum a fost menționat mai sus, indică probabilitatea ca un
model să genereze datele observate. Mai mult, dacă o vom condiționa de modelul M (impunem
un model), se poate scrie ecuația:
)|()|(),|(),|(MDpMθpMθDpMDθp = (3. 33)
unde se poate observa rol ul probabilității condiționate p(D|θ,M) și al probabilității marginale
p(D|M). Probabilitatea marginală se mai numește și probabilitatea modelului. Probabilitatea a
posteriori maximă (PAM) este cea care maximizează probabilitatea a posteriori:
),|( maxarg* MDθp θ
θ= (3. 34)
Din nou, teorema lui Bayes arată cum se pot actualiza cunoștințele a priori folosind
modelul de generare a datelor. Distribuția de probabilitate a priori p(θ) descrie inform ația care
există despre variabilă înainte de a observa datele. După ce datele D sunt cunoscute, se
actualizează distribuția a priori la cea a posteriori:
)()|( )|( θpθDp Dθp∝ (3. 35)
3.5 Ce este o rețea Bayesiană?
În §3.1 s-au făcut referiri la teorema lui Bayes fără a aborda rețelele Bayesiene deși cele
două formează un întreg complex iar definițiile prezentate au fost generale, corelate mai mult cu
domeniile transferului informației și al logicii. Motivul a fost explicitarea, cât mai detaliată, a
esenței teoremei lui Bayes.
În acest paragraf se prezintă RB ca atare cu detalii privind raționamentele și inferența.
3.5.1 Introducere în teoria grafurilor
Un graf este o pereche G = (N, L) unde N este un set finit de noduri distincte iar L ⊆NxN
reprezintă setul de legături. O pereche ordonată (u,v) ∈L reprezintă o legătură directă de la nodul
u la nodul v, nodul u fiind numit nod părinte al lui v iar v, copil ul lui u. Setul părinte copil al
unui nod v va fi notat cu pa(v) și respectiv co(v).
Așa cum se va arăta în cele ce urmează, în funcție de ceea ce reprezintă, nodurile sunt
reprezentate grafic prin cercuri, ovale sau poligoane, legăturile directe prin săg eți iar legăturile
nedirecționate prin linii. Figura 3.7a arată un graf cu 8 noduri și 8 legături (toate direcționate) în
care, de exemplu, nodul notat E are doi părinți, nodurile T și L. Etichetele nodurilor se referă fie la numele nodurilor, la numele va riabilelor reprezentate de noduri fie la etichetele descriptive
asociate cu variabilele reprezentate de noduri.
Deseori, se utilizează notațiile intuitive
vGu pentru a indica (u, v) ∈L (sau numai u → v
dacă G este subînțeles). Dacă (u, v) ∈L și (v, u) ∈L, legătura dintre u și v este legătură
nedirecționată, notată prin {u, v} ∈L sau vGu sau, simplu, prin u ― v. Se va folosi notația u ~ v
17
pentru a arăta u → v, v → u sau u ― v. Nodurile u și v se spune că sunt conectate în G dacă
v~uG
. Dacă u → v și w → v, atunci se spune că nodurile u și w sunt legate „cap la cap” în v.
Dacă L nu conține legături nedirecționate, atunci G es te un graf direcționat și dacă L nu
conține legături direcționate atunci este un graf nedirecționat . Cazurile mixte, de grafuri cu
legături direcționate și nedirecționate, nu sunt discutate aici.
Fig. 3.7 Graf aciclic direcționat GAD (a). Graf „moral” (b).
O cale (v 1, v2, …., v n) reprezintă o secvență de noduri distincte astfel încât v i ~ v i+1
pentru orice i = 1, 2, ….., n- 1; lungimea căii este n -1. Calea este o cale direcționată dacă v i →
vi+1 pentru orice i = 1, 2, ….., n- 1, v i este un ascendent al nodului v j iar v j este descendent al lui
vi pentru oricare j > i. Setul de ascendenți și descendenți ai lui v sunt notați cu as(v) și respectiv
de(v).
Setul nd(v) = N \de(v){v} reprez intă non- descendenții lui v. Setul de ascendenți as(U)
⊆N al unui set U ⊆N al unui graf G = (N, L) este setul de noduri U u∈U as(u).
O cale (v 1, v2, …., v n) de la v 1 la v n a unui graf nedirecționat G = (N, L) este blocat de un
set S⊆N dacă {v 1, v2, …., v n}∩S≠∅. Există un concept similar pentru căile grafurilor directe,
aciclice dar definiția este mai complicată.
Un graf G = (N, L) este conectat dacă, pentru orice pereche {u, v} ⊆N, există o cale
v u,…, în G. Un graf conectat G = (N, L) este de tip arbore multiplu (cunoscut și sub numele de
graf simplu conectat) dacă pentru orice pereche {u, v} ⊆V există o cale unică vu,…, în G. Un
arbore multiplu, direcționat, cu un singur nod orfan este denumit arbore cu rădăcină.
Un ciclu reprezintă o cale n 2 1 v…,v,v , de lungime mai mare decât două noduri cu
excepția cazului n 1v v= ; un ciclu direcționat este definit în același mod, evident. Un graf
direcționat fără cicluri direcționate se numește graf aciclic, direcționat – GAD (v. fig ura 3.7a).
Un graf nedirecționat se obține dintr -un GAD prin înlocuirea tuturor legăturilor direcționate cu
legături nedirecționate și se numește scheletul unui GAD.
Fie G = (N, L) un GAD. Graful nedirecționat Gm = (N, Lm ), unde Lm = {{u, v} | u și v
sunt conectate și au un copil comun în G} se numește graful moral a lui G. Aceasta înseamnă că
Gm se obține din G prin adăugarea legăturilor nedirecționate între perechile de noduri
neconectate ce au același copil și apoi înlocuind toate legăturile direcționate cu legături
nedirecționate (v. fig ura 3 .7b).
18
3.5.2 Rețele Bayesien e sau rețele probabilistice
Rețelele Bayesiene sau rețelele probabilistice reprezintă modele grafice ale interacțiunilor
cauzale în cadrul unui set de variabile. Variabilele sunt reprezentate ca noduri ale rețelei iar
legăturile (interacțiunile) ca legături directe, orientate, între noduri. Orice pereche de noduri
neconectate direct între ele indică o independență condiționată între variabilele respective și pot fi observate ușor în rețeaua respectivă. Ca urmare, rețelele probabilistice includ proprietăți referitoare la independențele și dependențele condiționate asociate variabilelor considerate în
rețea.
Grafurile, prin ceea ce reprezintă, s -au dovedit a fi un limbaj intuitiv pentru reprezentarea
acestor stări de dependență și independență fiind un excelent limbaj de comunicare și a naliză
referitor la relațiile de dependență și independență între variabilele dintr -un domeniu analizat.
Într-o manieră compactă, gama largă de ipoteze despre dependența și independența
legăturilor exprimate în reprezentarea factorială a distribuțiilor de probabilitate legate poate fi
abordată de grafurile aciclice directe direcționate – GAD.
Lanțurile de grafuri reprezintă generalizarea GAD, capabile de a reprezenta o gamă largă
de prezumții de dependență și independență [3.4], [3.5]. Creșterea complexităț ii semantice a
acestor rețele face, însă, mai puțin intuitivă probabilitatea legată a stărilor. O lucrare foarte interesantă despre limbajul folosit, interpretarea termenilor corelat cu semnificația și logica gândirii relativ la rețelele probabilistice este [3.6].
Astfel, deși au o putere expresivă maximă, lanțurile de grafuri au o relativ mică
popularitate ca modele practice ale suportului decizional.
Așa cum a fost menționat, rețelele probabilistice reprezintă o clasă de modele
probabilistice care au fost astfel denumite datorită faptului că distribuțiile legate de probabilitate
reprezentate de aceste modele pot fi descrise în mod natural, în termeni grafici și în care nodurile rețelei (grafului) reprezintă variabile în raport cu care se definește o distri buție legată de
probabilitate iar absența și prezența legăturilor înseamnă proprietăți de dependență și independență ale variabilelor considerate.
Rețelele probabilistice pot fi văzute și ca reprezentări compacte ale regulilor „cauză-
efect” de tip fuzzy care, contrar regulilor obișnuite sistemelor bazate pe logică, sunt capabile să
asigure concluzii deductive, abductive și cauzale. Concluziile deductive (denumite și concluzii
cauzale) urmează direcția exprimată de legăturile cauzale ale variabilelor unui mo del. Ca un
exemplu în acest sens: cunoscând că o protecția termică a unui transformator a funcționat , putem
trage concluzia (cu o probabilitate mare) instalația de răcire este ineficientă și/sau există o
defecțiune în înfășurări. Concluziile abductive (dia gnosticarea) parcurg direcția exprimată de
legăturile orientate (săgeți) dintre nodurile rețelei; de exemplu, observația că protecția a
funcționat dă suport evident diagnosticului ineficiență instalație răcire sau defecțiune înfășurări.
Proprietatea care stabilește inferența în rețelele probabilistice, și care rezultă din alte
paradigme de concluzionare, este abilitatea rețelelor de a realiza concluzii din legături
intercauzale : existența evidenței care determină numai o singură ipoteză ( sau un subset de
ipoteze), conduce automat la scăderea încrederii în alte ipoteze. Această proprietate este cunoscută sub numele de efectul continuator al explicației. De exemplu, pot fi două cauze ale
19
rinoreei. Existența febrei, totuși, asigură suport ide ii că răceala este cauza diminuând, în același
timp, încrederea în ipoteza alergiei drept o a doua cauză posibilă. Abilitatea rețelelor
probabilistice este că execută automat inferența unor astfel de legături intercauzale reprezentând, de fapt, puterea de a stabili concluzii pentru acestea.
Adesea, aspectul grafic al rețelelor probabilistice redă caracteristicile lor calitative iar
partea probabilistică, numerică, pe cea cantitativă. Acest paragraf se referă la aspectele calitative ale rețelelor probabilist ice, caracterizate de GAD (grafice aciclice direcționate) în care nodurile
reprezintă variabile aleatorii, variabile decizionale sau mărimi (funcții) de ieșire iar legăturile
orientate reprezintă dependențe directe, restricții informaționale sau indică dom eniile funcțiilor
mărimilor de ieșire. Diferențierile se fac prin modul specific de reprezentare al nodurilor, conform tabelului 3.1.
Rețelele Bayesiene conțin numai variabile aleatorii iar legăturile reprezintă dependențe
directe (deseori, dar nu în mod necesar, relații de cauzalitate) între variabile. Rețeaua cauzală din
figura 3.8 arată aspectul cali tativ al unei rețele Bayesiene.
Diagramele de influență pot fi considerate rețele Bayesiene perfecționate având și noduri
(variabile) decizionale și mărimi d e ieșire, asigurând și un limbaj adecvat pentru decizii
secvențiale în cadrul unui singur bloc decizional în care există o regulă fixă de luare a deciziilor. Figura 3.9 reprezintă diagrama de influență a rețelei cauzale din figura 3.8 în care au fost
intro duse două variabile decizionale (nodurile dreptunghiulare) și două mărimi (funcții) de ieșire
(nodurile în formă de diamant).
Tabelul 3.1 Modul de reprezentare grafică a diverselor tipuri de noduri ale RB
Categoria nodului Tip variabilă Simbolizare
Probab ilitate (variabilă aleatoare) Discretă
Continuă
Decizional Discretă
Continuă
Mărime de ieșire Discretă
Continuă
20
Fig. 3.8 Rețea cauzală, pentru un transformator de putere, ce permite nu numai concluzii cauzale (deductive) ci și de
tip diagnostic (abductive)
Fig. 3.9 Diagramă de influență reprezentând o problemă de decizie secvențială privind diagnosticarea stării unui
transformator de putere: inițial, decidentul trebuie să decidă dacă să măsoare sau nu temperatura și apoi, pe baza
rezultatului, să decidă soluția de r eparare. Diagrama este derivată din rețeaua cauzală din fig ura 3 .8 care a fost
perfecționată cu variabile decizionale și mărimi de ieșire.
Mai întâi, plecând de la simptomul „supratemperatură” trebuie luată decizia de a măsura
temperatura (nodul „măsurarea temperaturii” are valoarea da sau nu). Mărimea de ieșire asociată
acestei decizii, reprezentată de nodul Ut, poate fi, de exemplu, costul măsurării temperaturii (în
sensul duratei, inconvenientelor, etc.), dată fiind prezența sau absența temperaturii. Odată
măsurată, temperatura va fi cunoscută de decident (nodul cu variabila aleatorie Temperatură) înainte de a decide care este modul de remediere (variabila reparare instalație de răcire).
Această variabilă decizională poate avea stările înlocuire ventilator, reparare înfășurări
sau fără intervenție. Mărimea de ieșire (Ud), ce reprezintă repararea, depinde de acțiuni similare în curs sau ante rioare, dacă este cazul ca și de cauza reală a simptomelor.
3.5.3 Circulația informației în rețelele cauzale
Un GAD, corespunzător unui model de RB, este o reprezentare compactă grafică a
dependenței și independenței caracteristicilor distribuției comune de probabilitate reprezentată de
acel model. În acest paragraf se vor stabili regulile de circulație a informației într -un GAD) în
care fiecare conexiune reprezintă un mecanism cauzal. De exemplu, Supratemperatură → Măsurarea
temperaturii Soluție reparare Stare
Supratemperatură
cuvă Funcționare protecție
termică Ud Ineficiență
instalație răcire
Temperatură Ut Stare înfășurări
(izolație, circuit)
Supratemperatură
cuvă trafo Ineficiență
instalație răcire
Funcționare
protecție termică Concluzii cauzale (deductive)
Concluzii
cauzale Concluzii
de tip
diagnostic
21
Funcționare protecție redă faptul că prima este cauza. În mod colectiv, aceste reguli definesc
criteriul pentru înțelegerea proprietăților de relevanță sau irelevanță codate în astfel de rețele
cauzale .
Ca o bază pentru considerațiile ulterioare se detaliază un exemplu clasic, prezentat inițial
în [3.7] și preluat apoi în multe lucrări de specialitate, adaptat aici pentru o situație plauzibilă din
domeniul ingineriei energetice.
Dl. Ionescu, ajutor dispecer energetic (ADE) lucrează la un dispecerat teritorial în camera
de comandă când primește un telefo n de la dl. inginer Popescu, de serviciu consemnat la
domiciliu (ISD) pentru intervenții la o serie de stații din zonă, stații tele -supravegheate. ISD îi
spune că alarma de avarie (AA) a unei stații din apropiere a fost declanșată. Convins că pornirea
AA a vut loc ca urmare a unui semnal fals (SF) sau a unei intervenții neautorizate (IN),
semnalizările optice specifice unei situații tehnice de avarie lipsind, ADE pornește cu mașina spre stație. Pe drum aude la radio că, în zona respectivă, a avut loc un cutr emur de mică
intensitate (CMI). Știind că un astfel de fenomen poate declanșa alarma de avarie în stație, ADE decide să se întoarcă la serviciu.
Rețeaua cauzală din figura 3.10 arată cinci variabile relevante, toate de tip boolean (F, A)
ca și legăturile c auzale: SF+IN și CMI pot declanșa alarma stației, cutremurul poate determina
conținutul știrilor de la radio (SR), alarma poate determina pe ISD să -l sune pe ADE.
Telefon
ISD SF+IN CMI
AA
SR
Fig. 3.10 Rețea cauzală în cazul exemplului „semnal fals sau intervenție neautorizată (SF+IN) sau cutremur de mică
intensitate (CMI)?”
Faptul că un GAD este o reprezentare compactă a dependenței/relevanței și
independenței/irelevanței stărilor poate fi dedus din graful din fig ura 3 .10. Tabelul 3.2 include un
subset al acestor afirmații în care fiecare dintre ele este de forma „variabilele A și B sunt
(in)dependente dat fiind că valorile altor variabile C sunt cunoscute”, în care C este un set
minimal în sensul că renunțarea la oricare din elementele din C ar putea a nula afirmația. Dacă se
includ, de asemenea, seturile C ne-minimale, numărul total de afirmații relativ la dependențe și
independențe va fi de 53, ilustrând clar faptul că și în cazul rețelelor probabilistice de mici dimensiuni, modelele înglobează mii sau chiar milioane de afirmații de dependență și
independență. Pentru a stabili cum se determină astfel de afirmații într -un GAD, este convenabil
să se considere fiecare tip de conexiune de bază din graf. Se consideră graful din figura 3.10. Se
pot observa tr ei tipuri de conexiuni:
• Conexiuni de tip serie
SF+IN → AA → Telefon ISD
CMI → AA → Telefon ISD
22
• Conexiuni de tip divergent
AA ← CMI → SR
• Conexiuni de tip convergent
SF+IN → AA ← CMI
În cele ce urmează se vor analiza toate cele trei tipuri de conexiuni în termenii abilității
lor de a transmite informația dată fiind evidența și dată fără a fi cunoscută evidența variabilei din
mijloc definindu -se, în final, regula de stabilire a afirmațiilor relativ la dependență și
independență în cazul unui graf. De asemene a, se va stabili că o conexiune de tip convergent
asigură proprietatea rețelelor cauzale de a realiza analize intercauzale.
3.5.3.1 Conexiuni de tip serie
Fie conexiunea serială (lanț cauzal) din figura 3.11, referitoare la exemplul din figura
3.10.
SF+IN AA Telefon
ISD
Fig. 3.11 Conexiunea serială (lanț cauzal) fără evidență clară relativ la AA.
Evidența relativ la SF+IN va influența încrederea asupra stării Telefon și reciproc.
Tabelul 3.2 15 din totalul de 35 de afirmații de dependență și independență incluse în GAD din figura 3 .10. Fiecare
din afirmațiile listate este minimală în sensul că înlăturarea oricărui element din setul C anulează afirmația că A și B
sunt in(dependente) dat fiind C.
A B C A și B sunt independente dat fiind C
SF+IN
SF+IN
SF+IN
SF+IN
SF+IN
SF+IN
AA
SR CMI
CMI
Telefon ISD
SR
SR
Telefon ISD
SR
Telefon ISD Telefon ISD
AA
Telefon ISD
AA
Nu
Nu
Nu
Nu
Nu
Nu
Nu
Nu
SF+IN
SF+IN
SF+IN
CMI
AA
SR CMI
Telefon ISD
SR
Telefon ISD
SR
Telefon ISD
AA
AA
CMI
CMI Da
Da
Da
Da
Da
Da
23
SR Telefon ISD AA Da
Trebuie considerate două cazuri: cu și fără evidența clară asupra variabilei din mijloc
(AA).
Mai întâi , se presupune că nu există informații clare asupra stării variabilei AA. Evidența
asupra variabilei SF+IN va influența încrederea noastră asupra AA care, la rândul ei, va influența
încrederea asupra stării Telefon ISD. Invers, este, de asemenea, adevărat: dacă se primesc informații asupra stării variabilei Telefon ISD aceas ta va influența încrederea în starea AA care,
în schimb, va influența încrederea asupra SF+IN.
În concluzie, atât timp cât nu se cunosc date sigure despre AA, informațiile despre SF+IN
și Telefon ISD vor influența încrederea asupra stării celeilalte variabile. Dacă, de exemplu primind informația (din altă sursă) că AA a încetat, ADE își va revizui încrederea legată de
SF+IN pe baza telefonului primit de la ISD. Acest lucru este ilustrat în figura 3.11 prin cele două
săgeți, desenate cu linie întreruptă, semnificând că evidența poate fi transmisă prin conexiunea
serială atât timp cât nu există cunoștințe certe despre starea variabilei din mijloc.
Apoi , se presupune că nu există cunoștințe definitive legate de starea AA (conform
figurii 3.12). Dată fiind evidența clară asupra AA, orice informație despre SF+IN nu va schimba
încrederea (probabilitatea) stării SF+IN (cunoscând că AA este singura cauză asupra variabilei Telefon ISD, dacă modelul este corect). De asemenea, informația legată de Telefon ISD nu va avea influență asupra încrederii despre SF+IN în cazul cunoașterii exacte a AA.
SF+IN AA Telefon
ISD
cl-ε
Fig. 3.12 Conexiunea serială (lanț cauzal) cu evidența clară a variabilei AA.
Evidența relativ la SF+IN nu va avea nici un efect asupra încrederii stării variabilei
Telefon ISD și reciproc.
În concluzie, dacă starea variabilei din mijloc a conexiunii serie este cunoscută precis
(evidență clară) atunci fluxul de informație între celelalte două variabile nu trece prin această conexiune. Acest lucru es te ilustrat în figura 3.12 prin cele două săgeți, desenate cu linie
întreruptă, al căror sfârșit este în dreptul variabilei din mijloc arătând că informația este blocată.
De subliniat este faptul că evidență ușoară a variabilei din mijloc este insuficientă pentru
blocarea circulației informației în conexiunea serială. Se presupune, de exemplu, că s -a obținut o
informație mai puțin precisă (ușoară evidență) că AA a pornit, dar nu este sigur. În acest caz, informația legată de SF+IN (Telefon ISD) va determin a revizuirea încrederii în variabila AA și,
ca urmare, va influența asupra telefonului ISD (SF+IN). Astfel, ușoara evidență a variabilei intermediare nu este suficientă pentru a bloca circulația informației pe traseul conexiunii seriale.
Regula generală p entru circulația informației într -o conexiune serie poate fi enunțată
astfel:
Regula 1: Informația poate fi transmisă printr -o conexiune de tip serie
24
X → Y → Z cu excepția cazului în care starea lui Y este cunoscută.
3.5.3.2 Conexiuni divergente
Se consideră conexiunea divergentă din figura 3.13, referitoare la exemplul din figura
3.10.
Din nou, se presupune că se cunoaște, cert, starea variabilei CMI. Primirea informației
despre AA va influența încrederea supra variabilei CMI deoarece cutremurul este o explicație
posibilă a funcționării alarmei.
AA CMI SR
Fig. 3.13 Conexiune divergentă fără evidență asupra variabilei CMI. Evidența legată de AA va afecta probabilitatea
(încrederea) variabilei SR și reciproc.
Încrederea actualizată asupra stării variabilei CMI va avea ca rezultat actualizarea
încrederii legată de SR. Situația opusă (primirea informației prin SR) va conduce la o concluzie
similară. Astfel, se obține același rezultat, similar cu cel din cazul con exiunii seriale cu
specificația că informația poate fi transmisă printr -o conexiune divergentă dacă nu avem
cunoștințe certe despre starea variabilei intermediare. Acest lucru este ilustrat în figura 3.13.
În continuare, se presupune că starea variabilei CMI este cunoscută cert (evidența clară).
În acest caz, dacă avem informații despre starea variabilelor AA SR, acestea nu vor modifica
probabilitatea legată de starea variabilei CMI și, ca urmare, nu se va modifica nici probabilitatea altei variabile, neob servate încă. Din nou, acest rezultat este similar cu cel din cazul conexiunii
serie și este ilustrat în figura 3.14.
AA CMI SR
cl-ε
Fig. 3.14 Conexiunea divergentă cu evidența clară asupra variabilei CMI.
Evidența legată de AA nu va afecta pro babilitatea variabilei SR și reciproc.
Din nou, de menționat este că evidența ușoară a variabilei intermediare nu este suficientă
pentru blocarea circulației informației. Regula generală pentru circulația informației în cazul
conexiunii diver gente poate fi enunțată astfel:
Regula 2: Informația poate fi transmisă printr -o conexiune divergentă
X ← Y → Z cu excepția cazului în care starea lui Y este cunoscută
3.5.3.3 Conexiuni convergente
25
Se consideră conexiunea convergentă din figura 3.15, referitoare la exemplul din figura
3.10.
SF+IN AA CMI
Fig. 3.15 Conexiune convergentă fară nici o evidență asupra variabilei AA sau a descendenților săi. Informația
legată de SF+IN nu va afecta probabilitatea variabilei CMI și reciproc.
În primul rând, dacă nu există nici o evidență despre AA atunci informația despre SF+IN
nu va asigura nici o informație derivată despre CMI. Cu alte cuvinte, SF+IN nu este un indicator
al CMI și reciproc. Astfel, contrar situațiilor din cazul conexiunii serie și divergente, o conexiune
convergentă nu va asigura transmiterea informației dacă nu există evidență legată de variabila
intermediară. Acest lucru este ilustrat în figura 3.15.
În al doilea rând, dacă există evidență despre AA, informația despre SF+IN va explica
evidența despre AA și, astfel, confirmarea sau infirmarea CMI drept cauză a AA. Din nou, contrar cazurilor conexiunilor seriale și divergente, conexiunile convergente per mit transmiterea
informației oricând există evidență asupra variabilei intermediare. Acest lucru este ilustrat în figura 3.16.
Regula ilustrată în figura 3.15 exprimă faptul că, dacă nu se cunoaște nimic despre
efectul comun a două (sau mai multor) cauze, atunci cauzele sunt independente: primirea
informației despre una din cauze nu va avea impact asupra probabilității celei de a doua (celorlalte). Cu toate acestea, imediat ce va exista o evidență asupra efectului comun, cauzele devin dependente. În cazul a nalizat, dacă ADE primește un telefon de ISD privind funcționarea
AA, SF+IN și CMI sunt evenimentele posibile. Informația evidență despre o cauză sau alta o va exclude pe cealaltă drept sursă a funcționării alarmei. De subliniat este faptul că, informația primită de la ISD, chiar cu evidență ușoară asupra AA, va face ca ambele cauze, CMI și SF+IN,
să fie de luate în considerare.
SF+IN AA CMI
uș-ε
Fig 3 .16. Conexiune convergentă cu (posibil ușoară) evidență asupra AA sau a oricărui dintre descendenții săi.
Informația despre SF+IN va a fecta probabilitatea stării variabilei CMI și reciproc.
Regula generală pentru transmiterea informației în cazul conexiunii convergente poate fi
enunțată astfel:
Regula 3: Informația poate fi transmisă printr -o conexiune de tip convergent
X → Y ← Z dacă e vidența asupra lui Y sau a unuia din descendenții săi este disponibilă.
3.5.3.4 Inferența intercauzală
26
Proprietatea conexiunilor convergente, X → Y ← Z , referitoare la faptul că informația
despre starea X(Z) asigură o explicație pentru efectul observat asupra lui Y și, ca urmare,
confirmă sau infirmă Z(X) drept cauză a efectului, este denumită deseori drept „inferență
intercauzală”. De exemplu, obținerea informației de la radio asupra producerii cutremurului
determină evidența clară că acesta este cauza funcționăr ii alarmei antiefracție și, ca urmare,
explică mai departe, de ce efracția nu este cauză a funcționării alarmei.
Însușirea de a asigura inferența cauzală este unică în cazul modelelor grafice și reprezintă
cheia diferenței între stabilirea automată a concluziilor în cazul sistemelor bazate pe rețele probabilistice și altele, de exemplu bazate pe reguli de producție. Într -un sistem bazat pe reguli
va fi necesară stabilirea regulilor pentru asigurarea concluziilor intercauzale.
În concluzie, analizele din a ceastă secțiune arată că, în termenii transmiterii informației,
conexiunile seriale și divergente sunt identice în timp ce conexiunile convergente se manifestă contrar față de acestea (v. tabelul 3.3).
Tabelul 3.3 Transmiterea informației, în cazul conexiunilor serie,
divergente și convergente, în funcție de evidența supra variabilei intermediare
Conexiunea Nicio evidență Evidență ușoară Evidență clară
Serie Deschisă Deschisă Blocată
Divergentă Deschisă Deschisă Blocată
Convergentă Blocată Deschisă Deschisă
Mai precis, evidența clară blochează informația în cazul conexiunilor serie și divergente;
în rest informația are cale liberă. Pe de altă parte, pentru a bloca informația într -o conexiune
convergentă, este necesară lipsa evidenței asupra variabilei intermediare și asupra oricărui dintre
descendenții săi. În caz contrar, informația are cale liberă.
3.5.3.5 Cauzalitatea
Cauzalitatea joacă un rol important în procedura de construire a modelelor rețelelor
probabilistice . Există mai multe motive care explică de ce modelarea legăturilor cauzale este atât
de importantă, și utilă, cu toate că nu este absolut necesară existența legăturilor directe într -un
model ca rezultat al unei interpretări cauzale.
Vor fi prezentate succi nt, în continuare, aspectele legate de cauzalitate și vor fi subliniate
câteva aspecte cheie despre modelarea cauzalității. Detalii suplimentare sunt incluse în lucrări ce tratează independent acest subiect [3.8], [3.9], [3.10 ].
Ca un exemplu, se consideră variabilele supratemperatură și funcționare protecție relativ
la un transformator de putere. Bunul simț indică supratemperatura drept cauză a funcționării protecției și nu altceva (fig ura 3.17).
Faptul poate fi verificat experimental și nu forțând stările supratemperatură și
funcționarea protecției. Resetarea sau înlocuirea protecției nu va avea nici un efect asupra valorii
temperaturii înfășurărilor (sau lichidului de răcire) în timp ce eliminarea cauzei supratemperaturii
va readuce temperatura la valori normale.
27
Supratemperatur ă Funcționare
protecție
Supratemperatură Funcționare
protecție Relație cauzală
Relație non -cauzală
Fig. 3.17 Supratemperatura determină funcționarea protecției termice a unui transformator de putere nu invers
Pentru o corectă reprezentare a relațiilor de dependență și independență care există între
seturile de variabile dintr -un domeniu al unei probleme este util să se reprezinte relațiile de
cauzalitate dintre variabile prin conexiuni direcționate de la cauză la efect. Astfel, dacă X este
cauza directă a lui Y, trebuie reprezentată legătura direcționată de la X la Y. În cazul contrar, al
legăturii direcționate de la Y la X, se va obține un model ce nu va reprezenta corect dependența și
independența relațiilor din domeniul problemei.
O greșeală comună este de a neglija sensul legăturii direcționate (sensul săgeții) de la
efect la cauză, ceea ce conduce la afirmații greșite privind dependența condiționată și
independența și, ca urmare, la inferență incorectă. Revenind la exemplul SF+IN sau CMI, cineva ar putea să pună o legătură direcționată de la Telefon ISD la AA deoarece faptul că ISD telefonează lui ISD determină faptul că AA lui ADE a funcționat, etc. Experiența arată acest mod
de a concluziona este o eroare „de începător” în construirea rețelelor probabilistice, datorată
modelului mental de transmitere a informației în care evidența acționează ca „intrare” iar
concluziile derivate drept „ieșire”.
Având în vedere această abordare greșită, modelul SF+IN sau CMI din figura 3.10 va
avea toate conexiunile inversate, ca în figura 3.18.
Modelul din figura 3.18 conduce la concluzia că SF+IN și CMI sunt dependente în cazul
în care nu se știe nimic despre AA iar AA și SR sunt dependente chiar dacă evidența despre CM I
este clară. Niciuna dintre aceste concluzii nu este, evident, corectă și va conduce, prin
intermediul modelului, la inferențe eronate.
Cu toate că un model nu trebuie, obligatoriu, să aibă conexiuni care să fie interpretate
drept legături cauzale, așa cum arată exemplul anterior, existența lor fac modelul mai intuitiv și
mai ușor relativ la evidențierea corectă a relațiilor de dependență și independență.
Telefon
ISD
SF+IN AA
CMI SR
Fig. 3.18 Modelul eronat din exemplul SF+IN sau CMI în care legăturile su nt direcționate de la efect la cauză ceea
ce determină afirmații greșite relativ la dependența (condiționată) și la independența variabilelor
28
Un alt motiv care explică de ce este importantă respectarea conceptului de modelarea
cauzală se referă la faptul că înlesnește semnificativ procesul de evidențiere a probabilităților
condiționate în cadrul modelului. Dacă Y → X nu reflectă o legătură cauzală, poate fi dificilă
specificarea probabilității condiționate X = x dat fiind Y = y . De exemplu, ar fi dificil p entru
ADE să precizeze probabilitatea ca SF+IN să fi avut loc în stație sa cunoscând că AA a
funcționat sau probabilitatea ca un alt motiv sa fi determinat funcționarea AA. Astfel,
specificând probabilitatea ca AA să funcționeze, în funcție de diferite cauze, ar putea fi mai ușor, și mai natural, să asigure descrierea completă a tuturor fenomenelor locale care s -ar putea
produce.
3.5.3.6 Două criterii identice de irelevanță
Regulile 1 -3 includ componentele necesare pentru formularea unei reguli generale pentru
înțelegerea afirmațiilor privind relevanța și irelevanța celor două seturi de variabile, dată fiind (posibil) o a treia variabilă (sau set de variabile). Această regulă generală este cunoscută sub
numele de criteriul de d -separației (d -separation criterion) stabilit de Pearl [3.7].
Este demonstrat că, pentru orice distribuție de probabilitate comună, factorizată în
conformitate cu un GAD G, afirmațiile despre independenț ă implicând variabilele X
u și Xv sunt
echivalente afirmațiilor despre d -separația nodurilor u și v din G .
Astfel, criteriul de separație de tip d poate fi utilizat pentru a răspunde întrebărilor de
tipul „ X și Y sunt independente dată fiind Z ?” (în sens p robabilistic) sau, mai general, de tipul
„informația despre X este irelevantă asupra încrederii (probabilității) despre starea lui Y dată fiind
informația despre Z ?”, unde X și Y sunt variabile individuale iar Z este fie mulțimea vidă (Ø) de
variabile sau o variabilă individuală.
Criteriul d -separației (sau separației de tip d) poate fi, de asemenea, folosit cu seturi de
variabile, cu toate că acest lucru poate fi greoi. Pe de altă parte, răspunsul la astfel de întrebări poate fi eficient folosind propri etatea globală Markov [3.11], care este un criteriu echivalent cu
cel al d -separației.
Criteriul d -separației
Regulile 1 -3 pot fi sintetizate într -o nouă regulă cunoscută sub numele de d- separație
[3.7]:
Regula 4 (d -separația): O cale π = ‹u, …, v› dintr -un GAD, G = (N, L), se spune că este
blocată de S
⊆N dacă π conține un nod w astfel încât fie
• w ∈S și legăturile lui π nu sunt cap- la-cap în w, sau
• w ∉S, de(w) ∩ S = Ø și legăturile lui π se întâlnesc în w.
Pentru trei subseturi (nu, în mod necesar, disjuncte) A, B, S din N, A și B se
spune că sunt d- separate dacă toate căile dintre A și B sunt blocate de S.
Regula 4 poate fi făcută operațională prin detalierea nodurilor sau a conexiunilor. Fie
G=(N, L) un GAD al unei rețele cauzale și fie H ε ⊆ Sε ⊆N submulțimile nodurilor reprezentând
respectiv variabilele cu evidență clară ș i ușoară. Se presupune că se dorește răspuns la întrebarea
„nodurile v 1 și vn sunt d -separate în G dat fiind scenariul S ε privind evidența ?”.
29
Folosind d- separația nodurilor, răspunsul la întrebare este următorul:
Dacă pentru orice cale ‹v1, …, v n› între v1 și vn și pentru orice i = 2, …, n -1, fie
• vi ∈Hε și conexiunea v i-1 ~ v i ~ v i+1 este de tip serial sau divergentă, sau
• ({vi} de(v i))∩S ε =Ø și vi-1 → v i ← v i+1,
atunci v 1 și vn sunt d- separate dat fiind S ε; dacă nu, sunt d- conectate dat fiind S ε.
Deseori, specialiștii găsesc mai intuitiv modul de gândire în termenii transmiterii
informației, caz în care abordarea conexiunilor (sau transmiterea informației) de tipul d –
separației pare mai naturală: dacă pentr u o cale ‹v1, …, v n› între v1 și vn și pentru fiecare i = 2,
…, n- 1 conexiunea v i-1 ~ v i ~ v i+1 permite transmiterea informației de la vi-1 la vi+1, atunci v 1 și vn
sunt d- conectate; dacă nu, ele sunt d- separate.
În cazul abordării de tip transmiterea -informației, trebuie acordată atenția cuvenită
folosirii concluziei „deoarece informația poate fi transmisă de la u la v și, totodată, de la v la w,
atunci aceasta poate fi transmisă de la u la w” deoarece acest mod d e concluzionare nu se
potrivește cu acest mod de abordare. Problema este că legăturile ar putea fi comune (cap -la-cap)
în v, nepermițând transmiterea informației între părinții lui v, exceptând cazul în care evidența
relativ la v este disponibilă, sau asupra unuia din descendenții săi. Astfel, fiecare pereche de
conexiuni consecutive analizate trebuie să includă două noduri.
Un exemplu detaliat este prezentat în [3.12].
Criteriul direcțional global al lui Markov
Proprietatea direcționată globală a lui Mark ov [3.12 ] asigură un criteriu echivalent
criteriului d -separației dar care, în anumite cazuri, este mai eficient în termenii unei cerințe mai
reduse de verificare a căilor posibile dintre nodurile implicate din graf.
Regula 5 Fie G=(N, L) un GAD și A, B, S mulțimi disjuncte din N. Fiecare pereche de
noduri (α∈A, β∈B) și sunt d- separate în S exceptând cazul în care fiecare cale de la α la β este
blocată de noduri din S în graf (G pa( SBA ))m
Deși acest criteriu ar putea să apară oarecum complicat la prima vedere, este simplu de
utilizat. Conform acestuia, A este d-separată de B|S în G dacă toate căile de la A la B includ, cel
puțin o dată, un nod din S în graful moral al subgrafului GAD indus de mulțimea A BS.
3.6 Rețele Bayesiene: calcule, reprezentări, caracteristici, determinarea
distribuției comune de probabilitate
Bazele calculului probabilistic, teorema lui Bayes și, mai ales, modul de transmitere a
informației în RB au prezentate în §3.5.
În această secțiune se reiau unele chestiuni generale relativ la RB într -o abordare mai
pragmatică, mai puțin teoretică dar corectă și exactă, prin prisma celui care doreș te să utilizeze
această tehnică într -un domeniu sau altul.
Probabilități condiționate și probabilități comune
Funcția (distribuția) comună de probabilitate descrie probabilitatea comună a unui set dat
de variabile:
30
p(A 1, A 2, …,, A n) (3. 36)
În cazul în care se cunoaște valoarea tuturor probabilităților condiționate ale setului de
variabile, se pot calcula probabilitățile marginale pentru unele dintre acele variabile aleatorii
folosind tehnic a de marginalizare care stabilește că pentru stările mutual exclusive (a i, b1), ……,
(a, b m) este valabilă relația:
),( …….),( ),()',( ' (∑ ++ + =2 1 j m i i i j i i bap bap bapbap ap (3. 37)
Probabilitatea condiționată a lui A condiționată de apariția lui B este x:
Definiția 1
p(A|B) = x (3. 38)
Între probabilitatea condiționată și probabilitatea comună există legătura exprimată
de regula (legea) fundamentală a calculului probabilităților:
Definiția 2
p(A|B)p(B) = p(A,B) (3. 39)
În acest mod, probabilitatea condiționată este o variantă normalizată a probabilității
comune (pri n raportare la p(B)). Relația (3.39) nu este limitată numai la doi termeni. D acă A și B
sunt condiționate de C, se poate scrie:
Definiția 3
p(A|B,C)p(B|C) = p(A,B|C) (3. 40)
Generalizând, se poate exprima probabilitatea comună în termenii unui produs de
probabilități condiționate:
p(A1, A 2, ….., A n) = p(A 1|A2, ….., A n)p(A 2|A3, …, A n)………p(A n) (3. 41)
Relația (3.41) este cunoscută sub numele de regula lanțului .
Deoarece nu este nici o diferență între (A,B) și (B,A), rezultă:
p(A,B) = p(B,A) (3. 42)
Conform definiției 2,
p(A,B) = p(A|B)p(B) și p(B,A) = p(B|A)p(A) (3. 43)
Totodată,
p(A|B)p(B) = p(B|A)p(A) (3. 44)
Rezultă cunoscuta formulă ce exprimă teorema lui Bayes sub forma
p(A)B)p(B)|p(AA)|p(B= (3. 45)
și, în conformitate cu definiția 3:
C)|p(AC)| C)p(BB,|p(AC)A,|p(B = (3. 46)
O RB constă:
31
– dintr -un se t de variabile și unul de legături direcționate între acestea;
– fiecare variabilă are un număr finit de stări mutual exclusive;
– variabilele și legăturile direcționate formează un GAD (grafic aciclic direcționat);
– fiecărei variabile A, cu părinți B 1, B 2, ….., B n i se atașează un tabel cu probabilități
condiționate P(A|B 2, B2,…,B n).
Figura 3 .19 indică două grafuri dintre care unul, din stânga, este RB iar cel din dreapta nu
reprezintă o RB deoarece include o buclă direcționată închisă (un ciclu), CABE.
Într-o RB, fiecare nod al rețelei este independent condiționat de oricare subset de noduri
care nu sunt descendenți direcți dat fiind părinții săi. Altfel exprimat: fie nodul N al unui graf iar
non(N) orice subset de noduri care nu sunt descendenții lui N și pa(N) subsetul de noduri părinți
direcți ai lui N; în acest caz, non(N) este independent condiționat față de V:
))N(|(N ))N(),N( |N( pa p pa non p = (3. 47)
Fig. 3.19 Graful din stânga este o RB iar cel din dreapta nu este pentru că are o buclă orientată închisă (CABE)
Rezultă că, pentru toate nodurile (N 1, N 2, …., N n) ale RB, se poate scrie distribuția
comună de probabilitate:
∏
1==n
ipa p p ))N(|N( )N,….N,N(i i n 2 1 (3. 48)
Pe baza ecuației (3.48) se poate calcula orice probabilitatea condiționată a oricărui nod
sau, mai exact, a variabilei reprezentate de oricare nod, folosind procedura de marginalizare.
Oricare dintre probabilitățile condiționate comune dintr -o RB se poate determina prin
calcularea probabilității condiționate a unei variabile și a părinților săi. Aoi se poate folosi regula
lanțului pentru a determina distribuția comună de probabilitate a variabilelor din toate nodurile
rețelei.
În exemplul din figura 3.19, probabilitatea comună p(A,B,C,D,E,F) se determină folosind
regula lanțului și teoria independenței condiționate ((D,E) și (C,D) sunt condiționat inde pendente
una față de cealaltă):
p(A,B,C,D,E,F) = pP(F|C,D,E)p(A,B, C,D,E)
= p(F|C,D,E)p(C|A,E)p(D|B)p(E|B)p(B,A) (3.49)
= p(F|C,D,E)p(C|A,E)p(D|B)p(E|B)p(B|A)p(A)
32
În cazul nodurilor fără părinți (denumite și noduri orfane sau marginale), variabilele
corespunzătoare nu sunt condiționate de alte variabile iar probabilitățile lor sunt denumite și
probabilități a priori. În exemplul din fig ura 3 .19. acest statut îl are nodul A. În cazul acestui tip
de variabile, marginale, probabilitățile lor a priori sunt specificate într -un tabel de probabilități
necondiționa te.
Folosirea RB a redus numărul de probabilități condiționate cerute. De exemplu, dacă
variabilele corespunzătoare nodurilor A,B,…..F din exemplul de mai sus sunt, fiecare, de tip
boolean, se pot reține doar 2+2+4+2+2+8 probabilități condiționate dacă folosim teorema lui
Bayes comparativ cu cele 25=32 dacă se determină probabilitățile comune directe.
3.6.1 Inferența în RB
Există trei tipuri de inferențe în RB. Se va folosi structura din figura 3.19, reluată în
figura 3.20. Pentru simplificare se va presupune că toate variabilele sunt de tip boolean deși
teoria nu limitează numărul de stări. Tot pentru simplificare se va folosi o notare compactă: o
variabilă are cele două stări a și respectiv ā (non a). p(a) înseamnă probabilitatea a a variabilei A sau p(A=a).
Fig. 3.20 Ilustrativă pentru tipurile de inferență în RB
3.6.1.1 Inferența cauzală
Se presupune că se dorește calcularea probabilității condiționate p(c|e). Deoarece e este
cauza lui c, acest tip de calcul se numește raționament cauzal, e este denumită evidență în
inferență iar c este variabila de tip interogare.
Primul pas constă în expandarea lui p(c|e) în suma a două probabilități comune pentru a
menționa ambii părinți ai lui C. Astfel,
p(c|e) = p(c,a|e)+p(c,ā|e) (3. 50)
C se poate exprima condiționat și de alți părinți utilizând definiția 3 din §3.6.1:
p(c|e) = p(c|a,e)p(a|e) + p(c|ā,e)p(ā|e) (3. 51)
Deoarece A nu are părinți, ca urmare p(a|e) = p(a) iar p(ā|e) = p(ā) și d e aceea se poate
scrie
p(c|e) = p(c|a,e)p(a|e) + p(c|ā,e)p(ā|e) (3. 52)
33
Toate aceste informații se pot obține din RB din figura 3.20. De menționat că, până în
acest punct teorema lui Bayes nu a fost utilizată de loc. Dar ea demonstrează cum se poate
generaliza calculul anterior pentru situații mai complexe. Principalii pași sunt prezentați în
[3.13]:
1. Se rescrie probabilitatea condiționată dorită în termenii probabilității comune a variabilei
de tip interogare, comună cu e a însăși și cu toate variabilele părinți dar care nu sunt de tip
evidență și considerând că evidența există și percepută.
2. Se exprimă această probabilitate comună ca probabilitate a variabilei de tip interogare
condiționată de toți părinții ei.
3.6.1.2 Inferența de tip diagnostic
Cum se rezolvă problem calculării, de această dată, a probabilității condiționate p(e|c)?
În acest caz, similar cu situația din medicină, utilizăm efectul (simptomul) pentru a deduce
cauza. Acest tip de inferență se numește raționament de tip diagnostic. Acum se poate folosi
teorema lui Bayes:
p(e|c) = p(c|e)p(e)/p(c) (3. 53)
Toți termenii din stânga ecuației (3.53) pot fi calculați folosind inferența cauzală și regula
lanțului:
p(e) = p(e, b) + p(e, b) = p(e|b)p(b) + p(e| b)p(b) (3. 54)
În același mod, se poate continua cu p(b), p( b), etc. Scopul principal este de a folosi
teorema lui Bayes pentru conversia problemei în una de tip inferență cauzală.
3.6.1.3 Inferența de tip continuarea explicației
În final, se presupune că există evidența p(c) și se aplică, identic, procedeul de mai sus
pentru a calcula p(e|c).
Ce se întâmplă dacă se cunoaște însă p(a) tot ca evidență?
În acest caz p(e|c) va fi transformat în p(e|a,c) și se spune că a îl explică pe c , afectând
astfel probabilitatea lui e. Acest tip de inferență folosește un pas de tip raționament cauzal i nclus
în unul de tip diagnostic.
3.6.1.4 Separația de tip d (d- separația)
Un aspect important și, totodată, un avantaj al utilizării RB se referă la independențele
condiționate altele decât cele care implică părintele unui nod. În exemplul din figura 3.20, dacă
D este evidența, ea trebuie să aibă efect asupra lui E. Totuși, dacă B este evidența, D nu mai
influențează, în nici un fel, E (conexiune de tip divergent). Se spune, în acest caz, că B este d –
separat (dependent separat) de D și E.
Acest lucru este foarte important în teoria independenț elor probabilistice.
p(e|a,c) = p(a,c|e)p(e) / p(a,c) (teorema lui Bayes)
(3.55)
= p(a|c,e)p(c|e)p(e) / p(a,c) (definiția 3 din § 3.6)
34
Dat fiind un set de noduri (variabile) S ca evidențe într -o RB, două noduri V 1 și V 2 sunt
condiționat independente dacă, pentru fiecare cale nedirecționată între V 1 și V 2 există un nod
Vb pe acea cale, având una din următoarele proprietăți:
a) Vb aparține lui S și un capăt al căii conduce la V b iar celălal t nu.
b) Vb aparține lui S și ambele c apete ale căii nu conduc la V b.
c) Nici V b și nici un descendent al său nu aparțin lui S iar ambele capete ale căii conduc la
Vb.
Figura 3.21 ilustrează afirmațiile de mai sus: dacă nodurile E reprezintă evidențe, V 1 și
V2 sunt condiționat independente. Nodurile a, b și c care blochează transmiterea informației
corespund celor trei situații enumerate mai sus.
Fig. 3.21 Separația de tip d: nodurile E sunt evidențe din mulțimea S a nodurilor RB; a, b și c ilustrează situațiile din
text.
3.7 Diagrame de influență
Diagramele de influență sunt RB cărora li se atașează noduri ce reprezintă mărimi, fizice,
de ieșire (puteri, energii, temperaturi, debite, costuri, etc.) și noduri decizionale (figura 3 .9).
Definiții mai complete și corelate cu esența RB sunt următoarele:
1. O diagramă de influență reprezintă o vizualizare grafică intuitivă a unei probleme
de decizie. Redă elementel e cheie, inclusiv deciziile, incertitudinile și obiectivele ca noduri ale
unei rețele, intuitiv reprezentate în forme și culori. Influențele între noduri sunt reprezentate de
legături orientate [3.14].
2. Diagramele de influență reprezintă un instrumen t conceptual de modelare pentru
reprezentarea grafică a relațiilor cauzale dintre decizii, factori externi, incertitudini și mărimi de ieșire. Sunt utile pentru [3.15]:
– înțelegerea comună, consensuală, a „modului în care decurg lucrurile”;
– facilitarea comunicării între experți, factorii decizionali și acționari;
– integrarea cunoștințelor din domenii și surse diferite în scopul luării unor decizii corecte;
– promovarea unei discipline a gândirii despre relația cauză -efect;
– explicitarea incertitudinii, în special a înțelegerii ipotezelor concurente și discutării
informate despre acestea;
– definirea criteriilor de evaluare;
– stabilirea modelelor și a informațiilor necesare direct definirii criteriilor de evaluare;
V1
V2
E
E
b) a)
c)
35
– structurarea modelelor cantitative subsecvente, în special în cazul construirii modelelor
pe baza regulilor formale pentru descrierea probabilităților condiționate corespunzătoare;
– documentarea bazei pentru îmbunătățirea și transparența analizei experților.
3. O diagramă de influență este atât o formă de descriere formală a unei probleme
posibil a fi analizată de un calculator cât și o reprezentare ușor de înțeles de oameni nu numai în
viața lor de zi cu zi cât și în termenii unei eficienței tehnice într -un dom eniu specific. Astfel, o
diagramă de influență se constituie într -o punte de legătură între descrierea calitativ ă și
caracteristici cantitative [3.16].
3.8 Rețele Bayesiene dinamice
Din punct de vedere al evoluției, RB se constituie într -o concepție diferită de modelare a
evenimentelor care includ variabila timp și influența altor factori. Noul instrument pentru
modelarea seriilor de timp este cunoscut sub numele de rețea Bayesiană dinamică (RBD) [3.17],
[3.18], [3.19 ]. RBD înlocuiesc cu succes modelele Marko v ascunse care devin un caz particular
al acestora.
Fenomenele reale nu sunt detectate, observate și studiate numai într -un anumit moment ci
într-un interval de timp și printr -o succesiune dinamică de stări pentru a ajunge la concluzii
pertinente. Statisticienii și fiabiliștii folosesc diverse metode pentru raționamente legate de
relația temporală între evenimente. Domeniul este cunoscut sub denumirea generală de analiza
seriilor de timp . O serie de timp reprezintă un eșantion al unui proces aleatoriu const ând dintr -un
set de observații efectuate, secvențial, în timp.
Timpul reprezintă o dimensiune importantă și în domeniul IA și al gândirii umane, în
general. RB propriu -zise nu asigură, totuși, un mecanism care să redea dependențele temporale.
În scopul ata șării dimensiunii temporale în modelele RB se pot folosi diverse procedee care
transformă RB in rețele temporale sau dinamice.
RBD caracterizează un tip de model care descrie un sistem care își modifică în timp
caracteristicile. Un astfel de model permite monitorizarea și actualizarea sistemului supus
analizei pe un interval de timp sau chiar estimarea evoluției sale. Într -un astfel de model,
cuvântul dinamic este corelat cu forța motrică . Schimbarea naturii statice a unei RB pentru
modelarea forței motrice poate fi considerată ca adaptarea la o natură dinamică a acesteia.
Dinamica unui model este corelată, uzual, cu timpul deși natura evolutivă se poate datora și/sau schimbării parametrilor de stare. Rezultă că modelele temporale pot fi văzute ca sub -modele ale
celor dinamice. Dacă fiecare moment de timp corespunde unei stări particulare a unui sistem iar
fiecare trecere între aceste momente de timp reflectă o schimbare a parametrilor de stare și nu, în mod exclusiv, a timpului, avem de a face cu un model di namic.
Considerând și variabila timp, modelarea este de două categorii: fiecare stare este
reprezentată precis, la un anumit moment dat sau fiecare stare corespunde unui interval de timp. Totodată, un interval de timp poate fi considerat în analiză ca o su ccesiune de momente
instantanee consecutive. Rezultă că reprezentarea la momente precise de timp este mai adecvată
și mai expresivă.
Se disting două moduri de reprezentare a fenomenelor și sistemelor reale, evolutive în
timp redate în figura 3.22 .
36
RBD sunt definite uneori și drept cazuri speciale ale unor RB conectate în scopul
modelării seriilor de timp. Toate nodurile, arcele și probabilitățile asociate interpretării statice a
sistemului sunt identice cu cele ale unei RB. Variabilele pot fi interpretate d rept indicând o stare
a unei RBD deoarece cuprind și dimensiunea temporală. Stările unui sistem descris ca o RBD îndeplinesc și condiția lui Markov, definită astfel: starea unui sistem la un moment dat t depinde
numai de starea sa, imediat anterioară, de l a momentul t -1. Este definiția unui proces Markov de
ordinul 1 (fără istorie) [3.20]. În sens Bayesian, definiția este: viitorul este independent de trecut
dat fiind cunoscut prezentul.
În acest mod este extinsă o RB. Pot fi permise nu numai conexiuni în i nteriorul unui pas
de timp dar și între pașii de timp. Aceste conexiuni temporale încorporează și probabilități
condiționate dintre variabilele diferiților pași de timp. Matricea intensităților de tranziție, ce redă aceste dependențe de timp se numește, în mod obișnuit, TPC deoarece reprezintă distribuția de
probabilități condiționate în formă tabelară. Aceeași distribuție poate fi reprezentată printr -un
TPC la un anumit moment (pas de timp) dat .
Fig. 3.22 Reprezentarea RBD: în momente de timp date ale evoluției în timp a procesului (stânga); model temporal
cu multiplicarea momentelor de timp (dreapta)
Stările unui model dinamic nu trebuie (uneori nici nu pot) să fie observabile și/sau
descrise direct. Ele pot influența alte variabile ce pot fi măsurate sau determinate direct. De
asemenea, starea unor sisteme poate să nu fie unică. Poate fi văzută ca structura complexă a unor
stări care interacționează între ele. Fiecare stare a unui model dinamic, la un mom ent dat, poate
depinde de una sau mai multe stări din momente de timp anterioare și/sau de alte stări din același moment de timp (se modifică variabilele atemporale). Este demonstrat că astfel de structuri complexe pot fi reprezentate ca RBD. În general, î ntr-o RBD, stările sistemului analizat la
momentul t pot depinde de stările sistemului la momentul t- 1 și, posibil, de stările curente ale
altor noduri din RBD.
O RBD poate fi descrisă presupunând că este caracterizată de o funcție de distribuție de
probabilitate a unei secvențe de T variabile de stare ascunse X = {x
0,….., x t-1} și a unei secvențe
de T variabile observabile Y = {y0,….., y t-1}, unde T este limita de timp a evenimentului
investigat. Acesta poate fi redat de ecuația: Pasul de timp 1
Pasul de timp 2
Pasul de timp n
Pasul de timp n Pasul de timp 1
Pasul de timp 2
37
∏∏1−
1=1−
0=0 1− =T
tT
tt t t t xPxyP xxP YXP )()|( )|( ),( (3. 56)
Pentru a descrie complet o RBD trebuie definite trei categorii de parametri:
– distribuțiile de probabilitate ale tranzițiilor dintre stări P(x t|xt-1) care exprimă
dependențele de timp ale stărilor;
– distribuțiile de probabilitate P(y t|xt) care specifică dependențele nodurilor analizate
față de alte noduri la momentul de timp t;
– distribuția inițială P(x0) ce redă distribuția inițială de probabilitate, la începutul
procesului analizat.
Primii doi parametri trebuie determinați pentru toate stările și în toți pașii de timp t=1,
…., T. Este posibil ca funcțiile de distribuție a probabilităților condiționate să depindă de pasul
de timp (moment dat):
),|( )|( txxP xxPt t t t 1− 1−= (3. 57)
sau să fie independente de timp. Funcțiile de distribuție a probabilităților condiționate, în acest
caz, pot fi parametrice
),|( )|( θxxP xxPt t t t 1− 1−= (3. 58)
sau non- parametr ice, când sunt descrise de TPC. Dependent de spațiul stărilor ale variabilelor
ascunse și a celor observabile, o RBD poate fi discretă, continuă sau o combinație între ele.
Similar cu ceea ce se poate determina în cazul unei RB, pentru RBD se pot efectua
următoarele:
– calcule de inferență: estimarea tuturor funcțiilor de distribuție a probabilității pentru
stările necunoscute date fiind unele observații și distribuțiile inițiale;
– determinarea valorilor distribuțiilor de probabilitate care aproximează cel mai bine
secvența de stări ascunse care au generat secvența cunoscută de stări observate;
– estimarea parametrilor RBD, dat fiind un număr de secvențe de observații, astfel încât aceștia să aproximeze cât mai bine datele observate și să conducă la cel mai bun model al sistemului analizat;
– simplificarea: pe baza evidențierii nodurilor care sunt, din punct de vedere semantic, mai importante pentru inferența structurii RBD, selectarea celorlalte noduri ce pot fi înlăturate.
38
Referințe bibliografice
[3.1] Bayes T. Price, "An Essay towards solving a Problem in the Doctrine of Chances". Philosophical
Transactions of the Royal Society. 53: 370– 418. doi:10.1098/rstl.1763.0053
[3.2] C. Randy Gallistel, Bayes for beginners: probability and likelihood. The Observer, August 31, 2015.
[3.3] E. T. Jaynes, Probability Theory: The Logic of Science. Cambridge University Press, 2003.
[3.4] Frydenberg, M. The chain graph Markov property. Scandinavian Journal of Statistics 17: 333 –353,
1989.
[3.5] Wermuth, N. & Lauri tzen, S. L. On substantive research hypotheses, conditional independence graphs
and graphical chain models, Journal of the Royal Statistical Society, Series B 52(1): 21 –50, 1990.
[3.6] Druzel, J. M., Qualitative Verbal Explanations in Bayesian Belief Netwo rks. In Artificial Intelligence
and Simulation of Behaviour, no. 94, pp. 43 -54, 1996.
[3.7] Pearl, J. Probabilistic Reasoning in Intelligent Systems: Network of Plausible Inference. Ed Kaufmann,
M.) (San Mateo, California, 1988).
[3.8] Pearl, J. Causality: models, reasoning, and inference. Cambridge University Press.
[3.9] Spirtes, P., Glymour, C. and Scheines Causation, prediction and search. Adaptative Computation and
Machine Learning, 2nd edition, MIT Press, Cambridge, MA.
[3.10] Lauritzen S.L. and Nilsson, D. Representing and solving decision problems with limited information.
Management Science, 47, pp. 1238- 1251, 2001.
[3.11] Lauritzen, S. L., David. A. P. Larsen and Leimer, H. G., Independence properties of directed Markov
fields. Network 20(5), pp.491- 505, 1990.
[3.12] Uffe B., Kjærulff, Anders L. Madsen Bayesian Networks and Influence Diagrams: A Guide to
Construction and Analysis. Springer, 382 p., 2nd edition, 2013. ISBN 978- 1-4614- 5103- 7.
[3.13] Nilsson N,, Artificial Intelligence: a new syn thesis, pp. 513, Morgan Kaufmann,1998. ISBN:
9780080948348
[3.14] www.lumina.com/technology/influence -diagrams/
[3.15] https://www.structureddecisionmaking.org/tools/toolsinfluencediagram/
[3.16] R. A. Howard, J. E. Matheson Influence Diagrams. Decision Analysis, vol. 2, no. 3, September 2005,
pp. 127- 143. ISSN 1545- 8490.
[3.17] R. Sterritt, A. H. Marshal, C. M. Shapcott, S. I. McClean, "Exploring Dynamic Bayesian Belief
Networks for Intell igent Fault Management System," IEEE International Conference on Systems, Man and
Cybernetics V, Nashville, Tennessee, USA, pp. 3646 -3652, 2000.
[3.18] G. F. Cooper, "The Computational Complexity of Probabilistic Inference using Bayesian belief
Networks", Artificial Intelligence, vol. 42, pp. 393 -405, 1990.
[3.19] J. Cheng, D.A. Bell, W. Liu, "Learning Belief Networks from Data: An Information Theory Based
Approach", Proceedings of the Sixth ACM International Conference on Information and Knowledge Managem ent.
39
[3.2 0 ] D . I v a s , F l . M u n t e a n u , M . S p o r i ș , C -tin Pârăianu, C -tin Dârzan, Elena Istrate, Camelia Ghițescu.
Fiabilitate, mentenanță, disponibilitate și performabilitate în hidroenergetică. Ed. Prisma, ISBN 973 -99186- 5-4, Rm.
Vâlcea, 2000.
1
Capitolul 4
METODE DE CONSTRUCȚIE A REȚELELOR BAYESIENE
Metodele de învățare automată a structurii RB folosind baze de date, de selectare a
structurii optime, de calcul a parametrilor și de validare a structurii cu bazele de date, extrem de
laborioase dar eficiente prin prisma rezultatelor [4.1], [4.2], [4.3], [4.4], [4.5] etc. exced
conținutul și destinația acestui capitol astfel că nu vor fi prezentate. În cele ce urmează sunt
prezentate tehnicile de construcție manuală a RB care pot fi clasificate astfel:
a) Metoda m odelul ui structural echivalent de fiabilitate (MSEF);
b) Metoda legăturilor minimale (tie -seturi);
c) Metoda grupurilor de defectare (cut -seturi);
d) Metoda arborelui de defectare (arbore de evenimente);
e) Modele bazate pe structura tehnică a sistemului.
În cele ce urmează sunt prezentate câteva dintre aceste m etode sub forma unor studii de
caz simple, abordabile de inginerii energeticieni care doresc să asimileze tehnicile Bayesiene de
modelare, calcul și analiză.
Realizarea unei RB implică parcurgerea următoarelor trei etape principale, foarte
importante:
– alegerea setului de variabile relevante pentru procesul analizat și stabilirea valorilor
lor posibile;
– construirea structurii rețelei prin adăugarea legăturilor direcționate între nodurile
reprezentând variabilele și crearea unui GAD;
– a treia etapă, cantitat ivă, constă în efectuarea calculelor specifice (inferența).
Două aspecte cheie în acest proces sunt reprezentate de dimensiunea potențial foarte mare
a tabelelor de probabilități condiționate care trebuie specificate și semnificația valorilor
mărimilor car e trebuie introduse.
Se presupune existența unei variabile C care are P 1, P2, ….., P n drept părinți iar fiecare
dintre aceste variabile este de tip boolean. Sunt necesari 2n parametri independenți pentru a
completa tabelul de probabilități condiționate (T PC) corespunzător. În funcție de n, tabelul de
mai jos arată clar dimensiunea puternic crescătoare a TPC care trebuie specificat:
Numărul de părinți,
n Numărul de parametri din
TPC, 2n
2 4
3 8
6 64
12 4.096
24 16.777.216
30 1.073.741.824
Dificultatea nu constă, de la un moment încolo, în efectuarea calculelor relativ la durată și
la alocarea memoriei calculatorului dar, mai ales, la imposibilitatea de a specifica, numeric și
plauzibil, probabilitățile condiționate.
2
Sunt diferite modalități de simplificare a calculelor printre care cele mai utilizate sunt
modelul „noisy -or” [4.6], tabelele de probabilități deterministe sau limitarea numărului maxim
de părinți ai unui nod [4.7].
Simplificarea TPC folosind modelul „noisy -or”
Modelul noisy -or a fost, inițial, folosit de J. Pearl [4.8] ca o metodă de a simplifica
efortul de a construi și selecta o RB.
Fie variabila booleană C (copil) având drept părinți n variabile binare P i, conform figurii
4.1. Variabilele pot fi în una din stările adevărat (A) sau fals (F). Fiecare P i își exercită în mod
independent influența asupra lui C. Pentru a construi RB, se consideră distribuția sa de
probabilitate P(C|P 1, P2, ……, P n). Numărul de parametri independenți care trebuie specificat
pentru a exprima p(C|P 1, P2, ……, P n) este 2n. Funcția noisy -or prezintă avantajul folosirii unui
număr mai redus de parametri. Ideea este de a pleca de la n valori ale probabilităților p i. pi este
probabilitatea ca {C = A} condiționat de {P i = A} și {P j = F} pentru j ≠ i:
i}j 1,….n,jF}, {P[A,P|A P{C Pj i i
(4.1)
Fig. 4.1 RB și modelul noisy -or
Probabilitatea p i este denumită, deseori, probabilitate de legătură și arată faptul că
dependența cauzală între P i și C poate fi inhibată (sau suprimată). Dacă starea variabilei P i este
A, atunci probabilitatea ca ea să treacă în s tarea F este 1 – pi. Dacă P i este în starea F, ea va
rămâne în starea F. Fie rezultatul trecerii (sau nu) în cealaltă stare a variabilei P i exprimate prin
ξi, i = 1, 2, ….., n (figura 4.2). Se poate scrie relația:
n 1α….αn n n 1 1 1 n 2 1 )P|α )….p(ξ P|α p(ξ )P,….,P,P|α P(C
(4.2)
în care valorile α i ale lui α sunt fie A sau F. Funcția noisy -or este, asfel, o disjuncție logică a
versiunilor noisy (zgomot) ale variabilelor P i. Fie P A setul de variabile P i a căror stare este A iar
PF setul similar dar aflat în starea F. Distribuția lui C, condiționată de P 1, P2, …, P n este:
T iPP:ii n 2 1 ) 1 1)P,….,P,P|A P(C P
(4.3)
Se poate vedea că numărul parametrilor independenți necesari funcției de probabilitate
condiționată este redus de la 2n la 2n.
P1 Pi Pn
C P1 Pi Pn
C ξ1 ξi ξj
legături cauzale modelul noisy -or
3
Fig. 4.2 RB pentru alarmare în caz de CMI sau SF+IN
Ambele variabile, SF+IN și CMI, pot seta AA în starea declanșat dar niciodată nu vor
funcționa, împreună, în acest fel. Mecanismele de declanșare a alarmei în caz de CMI și SF+IN
sunt independente astfel că variabilele corespunzătoare reprezintă cauze independente. Variabila
SF+IN’ (respectiv CMI’) redau star ea după schimbarea (sau nu) a stării variabilei SF+IN (CMI).
Se presupune că toate variabilele sunt binare cu valori [A, F} în care A înseamnă că evenimentul
respective are loc iar F înseamnă că nu are loc.
În mod aparent, AA este în starea F numai dacă ex istența unui SF+IN sau a unui CMI nu
provoacă funcționarea AA datorită inhibiției (suprimării). Folosind modelul noisy -or, se poate
scrie
TPii)p(1 CMI)IN, SF|F p(AA
(4.4)
Probabilitatea condiționată ca {Alarma=A} se poate obține ușor astfel:
TPii)p(1 1 CMI)IN, SF|T p(AA
(4.5)
Ca urmare, TPC se poate scrie, folosind (4.4) și (4.5) după cum este ilustrat în tabelul 4.1.
Tabelul 4.1 TPC pentru RB din figura 4.2
SF+IN CMI AA = A AA = F
A T 1-(1-P1)(1-P2) (1-P1(1-P2)
A F P1 1-P1
F T P2 1-P2
F F 0 1
4.1 Modelul structural echivalent de fiabilitate (MSEF)
Orice sistem tehnic poate fi reprezentat grafic printr -o schemă logică de fiabilitate (model
structural) care exprimă legăturile dintre elemente și fiabilitatea întregului sistem.
Starea de funcționare a unui sistem poate fi determinată prin identificarea tuturor
influențelor stărilor de defect ale elementelor, asupra fiabilității sistemului.
În lucrarea [4.4], este prezentată modelarea Ba yesiană a unui subsistem de alimentare cu
energie electrică utilizând modelul structural echivalent de fiabilitate a acestuia. OR
(SAU) SF+IN CMI
CMI’ SF+IN ’
AA P1 P2
Comutare
stare
alarmă
CMI Comutare
stare AA
4
În figura 4.3 este redat subsistemul considerat, în care echipamentele primare de
comutație sunt neglijate datorită irelevanței.
Fig. 4.3 Subsistemul de alimentare cu energie electrică luat în considerare
MSEF pentru această rețea este bazat pe capacitatea de alimentare a componentelor
inclusiv pentru sursa L, (fig ura 4 .4).
Fig. 4.4 Modelul structural echivalent de fiabilitate a subsistemului analizat
Pentru acest model structural de tip punte, pot fi utilizate diferite tehnici de calcul pentru
determinarea probabilității de alimentare a sarcinii L.
Abordarea Bayesiană permite calculul probabilității de funcționare a subsistemului
condiționat de stările de defect ale componentelor, astfel că, sistemul de alimentare considerat
poate fi modelat în vederea studiului fiabilității conform fig urii 4.5.
Variabilele s, t1, t2, l1, l2 și t3 sunt asociate fiabilității componentelor subsistemului, iar
variabilele intermediare bus21, bus22, bus2, bus31, bus32 și bus3 sunt necesare pentru
modelarea și calculul tensiunilor în nodurile corespunzătoare d in sistem, pentru ca în final să se
evalueze fiabilitatea întregii rețele asociată variabilei subsystem.
Probabilitățile de funcționare și respectiv de reparare ale variabilelor marginale s -au
calculat pe baza valorilor din normativ [4.9] ale principalilor indicatori de fiabilitate (intensitatea
de defectare, λ și intensitatea de reparare, μ) astfel:
Pentru sursa s s-a considerat probabilitatea de funcționare p=0.998 și
probabilitatea de defectare q=0.002;
Pentru transformatoare:
o Transformatoa re de putere P>40 MVA: t1=t2; λ= 0.04 an-1; μ=70 an-1
o Transformator de MT: t3; λ=0.002 an-1; μ=250 an-1
Pentru linii de 110 kV cu o lungime de 90 km: l1=l2 ; λ=0,01 an-1/km; μ=600 an-1 S T1 L1
T2 L2 T3 L2
L 20kV T3
BUS4 BUS3 110kV 220kV
BUS2 BUS1 S
T1
T2
L1
5
Rețeaua Bayesiană permite introducerea de evidențe (informații noi desp re una sau mai
multe componente) și calculează automat probabilitățile de funcționare a sistemului.
În figura 4.6 este redată probabilitatea de funcționare a sistemului în condițiile apariției
unei informații noi despre variabila bus22 (bus22 – 100% down ).
Fig. 4.5 Rețeaua Bayesiană echivalentă pentru subsistemul analizat
O bară de alimentare cu energie electrică înseamnă, în acest caz, faptul că puterea
nominală poate fi transferată prin și din componentele din amonte rezultând o bară perfect fiabilă
asemănătoare celor reale.
Fig. 4.6 Probabilitatea de funcționare a sistemului condiționat de evidențe
6
4.2 Metoda legăturilor minimale (tie -set)
O altă metodă de modelare Bayesiană este reprezentată de tehnica legăturilor minimale
sau tie -seturi. Această me todă permite identificarea tuturor căilor din sistem prin care acesta să
funcționeze corect.
Metoda legăturilor minimale presupune exprimarea structurii sistemului din punct de
vedere binar sub forma unui tabel de adevăr care, în cazul rețelelor Bayesiene este reprezentat de
tabelele de probabilități condiționate ( TPC-uri).
În lucrările [4.5] și [4.10] sunt prezentate modele Bayesiene pentru diferite arhitecturi
nodale utilizând tehnica legăturilor minimale, pentru evaluarea fiabilității sistemelor.
O primă tipologie este reprezentată de arhitectura de tip punte cu o singură ba ră
secționată prezentată în figura 4.7.
Fig. 4.7 Arhitectură nodală de tip punte
A, B, C, D și E reprezintă componentele echivalente de fiabilitate pe baza cărora s -a
întocmit diagrama bloc de fiabilitate pr in metoda legăturilor minimale din f igura 4.8. Funcția scop
este alimentarea consumatorilor prin L1 sau L2.
Fig. 4.8 Diagrama bloc echivalentă de fiabilitate pentru sistemul de tip punte
prin metoda legăturilor minimale
Stările de succes ale sistemului sunt reprezentate de grupurile de componente AC, BD,
AED și BEC. Sistemul funcționează dacă unul sau mai multe grupuri sunt conectate și în stare de
funcționare.
Presupunând că toate componentele au două stări ( up, down ), fiecare cu o anumită
probabilitate de funcționare, poate fi întocmită rețeaua Bayesiană aferentă sistemului (figura
4.9).
E
L1 B S1 S2
L2 A
C D
B A
C E D E D B C A
7
Fig. 4.9 Rețea Bayesiană pentru evaluarea fiabilității sistemului de tip punte
Valorile legăturilor minimale T1, T2, T3 și T4 s -au calculat utilizând logica binară
corespunzătoare structurii și au fost introduse în tabelele de probabilități condiționate ( TPC-uri).
În tabelul 4.2 este redat TPC-ul pentru variabila T1.
Tabelul 4.2 Logica binară pentru legătura minimală T1 ( TPC – T1) ……
A funcționează Defect
C funcționează defect funcționează Defect
T1 – funcționează 1 0 0 0
T1 – defect 0 1 1 1
În fig ura 4.10 sunt redate probabilitățile de funcționare ale componentelor sistemului pe
baza cărora pot fi realizate interpretări în funcție de evidențele apărute despre una sau mai multe
componente.
Totodată pe baza acestor probabilități de funcționare (figura 4 .10), pot fi realizate analize
de senzitivitate (figura 4 .11), care pentru acest caz, arată o slabă influență a cuplei longitudinale
(E) asupra fiabilității întregului sistem.
Fig. 4.10 Probabilitatea de funcționare a sistemului
Componentele de
fiabilitate
Legăturile
minimale
(tie-seturi)
Fiabilitatea
sistemului
A C B D E
T1 T3 T2 T4
SP
8
Fig. 4.11 Probabilitatea de alimentare a sarcinii ca funcție a probabilității elementelor
În lucrarea [4.5] este prezentată o altă arhitectură nodală ce poate fi modelată utilizând
rețele Bayesiene și este reprezentată de arhitectura cu dublu sistem de bare ce conține
componente pentru evaluarea fiabilității nodurilor (fig ura 4 .12).
Fig. 4.12 Arhitectura cu dublu sistem de bare
Pentru realizarea RB aferente, s -au stabilit legăturile minimale pentr u jumătatea stângă a
figurii 4.12, și s-au considerat următoarele elemente echivalente:
a) Sursa A;
b) Cupla transversală a barei de lucru C;
c) Separatoare de bare E, F, G și H;
d) Bara de lucru M și secțiunea de bară N;
e) Linia cu echipamentele de comutație Q.
În fig ura 4.13 sunt prezentate legăturile minimale, iar în fig ura 4.14 rețeaua Bayesiană
aferentă acestora. 0.9700 0.9762 0.9825 0.9887 0.9950
0.9 0.92 0.94 0.96 0.98 1 ps pS=f(p C = p D)
pS =f(pE)
pS = f(p A = p B)
M
N I J S1
A S2
B
C C D E F F
G H L
Consumatori L1 L2 K O
P
Q R
9
Fig. 4.13 Legăturile minimale pentru partea stângă a arhitecturii cu dublu sistem de bare
Fig. 4.14 Rețeaua Bayesiană pentru partea stângă a arhitecturii nodale cu dublu sistem de bare
În RB dezvoltată, determinarea probabilității de funcționare a sistemului implică calculul
distribuției comune de probabilitate utilizând regula lanțului:
),,,,,,4(),,,,,,3(),,,,2(),,,,1()4,3,2,1 ()()()()()()()()()(),4,3,2,1,,,,,,,,,(
QMNHECATpQMNGFCATpQHMFATpQNGEATpTTTTSPpQpNpMpHpGpFpEpCpApSPTTTTQNMHGFECAp
(4.6)
Componentele A și Q au o mare importanță în determinarea fiabilității în noduri, ele fiind
conectate în serie în sistem.
Ca și în cazul sistemului de tip punte, prin introducerea unor probabilități de funcționare
pentru fiecare variabilă marginală în parte, este realizată o analiză de senzitivitate pentru a arăta
influența componentelor asupra fiabilității în noduri.
Valorile pentru variabilele marginale au fost introduse conform normativului [4.9] sub
forma unor TPC-uri astfel: p A = 0,98, p C = 0,97, p E = p F = p G = p H = 0,99, p M = p N = 0,99 și p Q =
0,97.
Fluxul probabilităților în R B construită, este redat în figura 4.15. Pentru variabilele
marginale s -au introdus valorile stabilite iar valorile pentru legăturile minimale T1, T2, T3, T4 și
pentru probabilitatea de alimentare la sfârșitul liniei L1, au fost calculate utilizând teorema lui
Bayes.
A E N G Q
A F M H Q
A F M C N G Q
A E N C M H Q
10
Fig. 3.15 Fluxul probabilităților în RB
Analiza de senzitivitate (fig ura 4. 16) arată pe de o parte, o slabă influență a cuplei
transversale (C) și a barelor (M și N) în ceea ce privește fiabilitatea nodurilor, iar pe de altă parte
o influență crescută a separatoarelor de bare (E, F, G și H) datorită prezenței acestora în fiecare
dintre cele patru legături minimale.
Fig. 4.16 Analiză de senzitivitate pentru evaluarea fiabilității arhitecturii cu dubl u sistem de bare
O ultimă arhitectură, analizată în lucrarea [4.5], ce poate fi modelată prin metoda
legăturilor minimale pentru analiza fiabilității în alimentare, este reprezentată de sistemul cu bară
dublă cu bară de transfer (sau bară de ocolire).
Pentru a putea realiza o comparație între acest tip de arhitectură și arhitectura cu dublu
sistem de bare (prezentată mai sus), autorii au analizat și stabilit legăturile minimale pentru
partea stângă a sistemului din figura 4.17.
0.95 0.955 0.96 0.965 0.97 0.975 0.98 0.985
0.9 0.92 0.94 0.96 0.98 1 ps pS=f(pC)
pS=f(pM=pN)
pS=f(pE=pF=pG=pH)
11
Fig. 4.17 Arhitectura cu dublu sistem de bare cu bară de transfer
În acest caz au fost introduse noi elemente echivalente pe lângă cele descrise pentru
arhitectura cu dublu sistem de bare și au fost considerate în stabil irea legăturilor minimale astfel:
a) Bara de transfer (bara de ocolire) W;
b) Cupla de transfer S;
c) Separatoarele barei de transfer C1 și C2;
d) Separatorul de transfer U.
De asemenea s -a stabilit ca numărul maxim de elemente echivalente considerate pentru
fiecare legătură minimală să fie 7, singura diferență dintre cele două cazuri rămânând astfel
structura arhitecturii nodale.
În figura 4.18 sunt redate legăturile minimale stabilite, iar în fig ura 4.19, RB
corespunzătoare acestora.
Fig. 4.18 Legături minimale pentru arhitectura cu dublu sistem de bare cu bară de ocolire
Pentru dezvoltarea RB corespunzătoare, s -au introdus probabilitățile de funcționare
pentru variabilele marginale conform normativului, sub formă de TPC.
M
N D
I J
S1
A S2 B
C2 E F F
G H L
Area to supply L1 L2
K O
P
Q R
C
T
S
V
U
D1 D2
W C1
A
F A G
Q
W U S M F C2 A
W U S N E C1 A N E Q
M H
C N E A M H Q
C M F A N G Q
12
B A
D C
C E B
DE A
Fig. 4.19 RB corespunzătoare arhitecturii prezentate în fig ura 4.17
Comparând rezultatele celor două arhitecturi nodale analizate, se poate observa că
includerea barei de transfer duce la o creștere a probabilității de succes a rețelei de la 0.9504 la
0.9781.
4.3 Metoda grupurilor de defectare (cut -set)
Metoda grupurilor de d efectare este de asemenea des utilizată pentru analiza fiabilității
sistemelor complexe.
Ca și în cazul metodei legăturilor minimale, această metodă presupune exprimarea
structurii unui sistem din punct de vedere binar sub forma unui tabel de adevăr. În ca zul RB
acest tabel de adevăr este reprezentat de TPC.
În lucrarea [4.10], este prezentat un exemplu de modelare utilizând tehnica grupurilor de
defectare pentru sistemul simplu de tip punte redat în fig ura 4.7.
Grupurile de defectare stabilite sunt prezen tate în fig ura 4.20, iar RB aferentă, în figura
4.21.
Fig. 4.20 Grupuri de defectare pentru arhitectura de tip punte
13
Fig. 4.21 RB construită în baza grupurilor de defectare
Logica de construire a TPC-urilor pentru metoda grupurilor de defectare este prezentată
în tabelul 4.3 pentru variabila C1.
Tabelul 4.3 Logica binară pentru grupul de defectare C1 (CPT – C1)
A funcționează defect
B funcționează defect funcționează defect
C1 – funcționează 1 1 1 0
C1 – defect 0 0 0 1
Păstrând aceleași probabilități de funcționare pentru variabilele marginale ca și în cazul
metodei legăturilor minimale, se poate observa că rezultatul final este același, și anume
pS=0.9874.
4.4 Metoda arborelui de defectare
Metoda arborilor de defectare în domeniul studiului fiabilității sistemelor tehnice, este
definită ca fiind, metoda prin care se cuantifică procesul de defectare la nivel structural, astfel
încât toate defecțiunile apărute la echipamente să fie rezultate ale unor secvențe cuantificate de
stări ale procesului de defectare.
Arborele de defectare este reprezentat ca fiind o diagramă logică ce indică relațiile
condiționate dintre un anumit defect al sistemului și posibilele defecte ale componentelor
acestuia.
Întocmirea unui arbore de defectare pentru un anumit sistem presupun e cunoașterea
tuturor defectelor posibile, a legăturilor dintre acestea și componentele sistemului, dar și a
legăturii structurale dintre defecte.
Întocmirea unui arbore de defectare are la bază metoda de analiză a modurilor de
defectare (AMDE), ce are dre pt scop identificarea defectelor ale căror consecințe duc la
funcționarea incorectă sau la defectarea întregului sistem.
14
De asemenea, putem, spune că metoda arborilor de defectare are la bază logica binară, în
care funcțiile unui echipament (componentă sau sistem), sunt asimilate unor funcții binare, ale
căror variabile sunt reprezentate de defecțiuni primare și pot fi sintetizate prin utilizarea unor
elemente de tip SAU, ȘI, NU (fig ura 4 .22).
Astfel, pe baza AMDE pot fi obținute probabilitățile de defectar e sau rata de defectare a
echipamentelor.
Fig. 4.22 Porți logice utilizate în construcția unui arbore de defectare
Un exemplu de construcție a unei RB pe baza metodei arborelui de defectare este
prezentat în lucrarea [4.11] pentru analiza fiabilității su bsistemului mixt, generator + evacuare
energie al unui sistem electroenergetic.
Pentru modelul din fig ura 4.23, având ca date de intrare probabilitățile de defectare ale
componentelor (generatoare și linii) precum și capacitățile de generare și transport ale acestora
din tabelul 4.4, autorii au întocmit arborele de defectare din figura 4.24.
Fig. 4.23 Subsistemul generator
Tabelul 4.4 Datele de intrare pentru subsistemul generator din fig ura 4.23
G1 G2 G3 L1 L2 L3
Capacitatea generatoarelor /
Capacitatea de alimentare (MW) 100 200 300 200 200 200
Probabilitatea de defectare 0,1 0,08 0,06 0,02 0,02 0,02
Funcția scop a subsistemului este asigurarea a cel puțin 375 MW putere activă
disponibilă pe barele stației alimentate prin cele trei linii electrice.
Pe baza arborelui de defectare s -a întocmit rețeaua Bayesiană din fig ura 4.24 și s-au putut
calcula, pornind de la expresia distribuției comune de probabilitate (4.7), probabilitatea de
funcționare a sistemului (putere disponibilă mai mare decât 375 MW), (4.8) prin metoda
eliminării:
G1
G2
G3 375 MW L2 L1
L3
~
~ ~
15
Fig. 4.24 Arborele de defectare a subsistemului din figura 4.23
(4.7)
(4.8)
Fig. 4.25 RB a subsistemului din figura 4.23
4.5 Modele de RB bazate pe structura tehnică a sistemului
O ul timă metodă de construcție a RB , prezentată în ace astă teză , are la bază structura
tehnică a sistemului. Pentru exemplificare, în lucrarea [4.12] este prezentat un model de RB,
construit pe baza unui sistem de alimentare cu energie electrică din două surse regenerabile
(solară și eoliană) redat în fig ura 4.26.
Scopul modelării este de a analiza riscul de întrerupere în alimentare a consumatorilor
datorită posibilelor defecte ce pot apărea în sistem. F O T G3 L3 G2 L1 L2
0 0 0
0 0 1
0 1 0
0 1 1
1 0 0
1 0 1
1 1 0
1 1 1
P(o= 1∣g3,l3,g2) g3 l3 g2
0
0
0
0
0
0
0
1
0
1
1
1 0 0
0 1
1 0
1 1 l1 l2 P(t=1∣ l1, l2)
0
0
0
1 0 0
0 1
1 0
1 1 o t P(f=1∣ o, t) L2 L1 G2 L3 G3 Defectarea sistemului
Defectarea unei
componente Defectarea a două
componente
TOLLLGGTOLLLGGP FP
,,,,,,3 2 1 2 1
3 2 1 2 1),,,,,,( )(
), (), (),, ()()()()()( ),,,,,,,(2 1 2 3 3 2 1 2 3 3 3 2 3 2 1` TOFPLLTPGLGOPLPLPGPLPGPFTOGGLLLP
16
Fig. 4.26 Sistem de alimentare cu energie electrică
Pe baza celor analizate și luând în calcul și alte posibile defecte, s -a întocmit RB din
figura 4.27 corespunzătoare sistemului din figura 4.26.
Fig. 4.27 Rețea Bayesiană pentru analiza riscului de întrerupere în alimentarea cu energie electrică a consumatorilor
Prin introducerea unor probabilități de funcționare pentru variabilele marginale și
calcularea unor probabilități condiționate pentru celelalte variabile, utilizând teorema lui Bayes,
s-a determinat în final probabilitatea riscului de întrerupere a alimentării și probabilitatea unor
daune la consumatori , figura 4.28.
Defecțiuni ale
echipamentelor de
comutație – dec
) ,,|( decsciarpiP
) ,,|( decsciarpiP
) ,,|( decsciarpiP
) ,,|( decsciarpiP
) ,,|( decsciarpiP
) ,,|( decsciarpiP
) ,,|( decsciarpiP
) ,,|( decsciarpiP
P(iar|ss, se )
P(iar|ss,
se)
P(iar|
sess, )
P(
sessiar ,| )
Daune la
consumatori – dc Acțiuni de
repunere în
funcțiune ale
operatorului – eo Întreruperea
alimentării -pi Scurt -circuit
în amonte –
sc
Întreruperea
alimentării din
surse
regenerabile – iar Sursa
eoliană – se Sursa
solară –
ss
P(ss) P(se)
P(sc) P(dec)
P(eo)
),|( pieodcP
),|( pieodcP
),|( pieodcP
),|( pieodcP
17
Fig. 4.28 RB finală cu afișarea pr obabilităților condiționate
4.6 Diagram ă de influență pentru modelarea disponibilității
întrerupătoarelor
Studiul de caz are drept scop analiza disponibilității unui întrerupător și a mecanismului
său de acționare considerându -se, totodată, evoluția în timp ( două etape) a parametrilor de
fiabilitate ca și influența mentenanței. Modelarea are la bază o RB în care nodurile reprezintă
variabile aleatorii (probabilitatea de funcționare și de defectare a celor două elemente
considerate).
Variabilele „funcții de uti litate”, alese în modelul Bayesian, reprezintă costul mentenanței
și al energiei nelivrate iar nodul de tip decizional se referă la acțiunea de mentenanță.
Modelul grafic, aciclic direc ționat (GAD) ce reprezintă sistemul fizic considerat este
prezentat în figura 4.29.
Fig. 4.29 Rețeaua Bayesiană pentru studiul disponibilității întreruptoarelor
Rețeaua din figura 4.29 este alcătuită din 9 noduri diferite: 6 noduri de tip probabilistic
(cele de tip oval), un nod de tip decizional (cel de tip dreptunghi) și două noduri de tip mărime
18
de ieșire sau funcții de utilitate (cele de tip romb). Se precizează de la început că toa te acestor
noduri le corespund variabile de tip discret.
Cele două componente ale modelului, întrerupătorul propriu -zis și mecanismul de
acționare, prin nefuncționarea lor, pot duce la o întrerupere în alimentare ceea ce determină
pierderi financiare furni zorul de energie care asigură alimentarea consumatorilor. De asemenea
se ia în considerare, în a doua etapă, funcționare după un timp îndelungat a celor două
componente, lucru care duce la uzura acestora.
Mecanismul de acționare este considerat un element cu o fiabilitate mai scăzută, de aceea
trebuie aplicată mentenanță acestui element.
Se poate observa în figura 4.29 introducerea nodului decizional de tip mentenanță, acesta
având un efect direct asupra funcționării mai bune sau mai slabe a mecanismului de acționare.
Mentenanța este caracterizată de un cost, cost care va influența încasările din energia vândută.
Nodurile de tip probabilistic Întrerupător și Mecanism acționare, considerate în a doua
etapa au legătură direct cu nodul Întrerupere_alimentare_ 1, nod care la rândul său influențează
direct nodul de tip funcție de utilitate Încasări_energie_vândută.
Figura 4.29 indică o reprezentare calitativă a rețelei. Pentru a obține o reprezentare
cantitativă trebuie întocmite tabelele cu probabilități de func ționare pentru nodurile marginale și
TPC-urile pentru nodurile de tip mărime de ieșire.
Pentru nodurile Mecanism_acționare , Întrerupător , datele de intrare sunt redate în tabelul
4.5:
Tabelul 4.5 Datele de intrare pentru variabilele marginale
Mecanism_acționare
Funcționează 0.7
Defect 0.3
Întrerupător
Funcționează 0.9
Defect 0.1
Nodul de tip Întrerupere_alimentare este influențat de starea celor două componente
menționate anterior. TPC corespunzător este redat în tabelul 4.6.
Din acest tabel se poate observa că funcționarea întrerupătorului este esențial ă în
menținerea alimentării cu energie electrică a consumatorilor.
Tabelul 4.6 TPC pentru nodul Întrerupere_alimentare
Întrerupere_alimentare
Întrerupător Funcționează Defect
Mecanism_acționare Funcționează Defect Funcționează Defect
Da 0 0.1 1 1
Nu 1 0.9 0 0
În continuare, se consideră funcționarea mecanismului de acționare și a întrerupătorului
după o perioadă de timp în care se manifestă uzura inerentă. Noile valori ale probabilităților de
funcționare a întrerupătorului sunt redate în tabelul 4.7.
După cum reiese și din acest tabel, după o perioadă de exploatare fiabilitate
întrerupătorului scade de la 0.9 la 0.8 și crește probabilitatea ca acesta să se defecteze la 0.2 .
19
Tabelul 4.7 Probabilitatea de funcționare a întrerupătorului după un timp în care se manifestă uzura
Întrerupător_1
Întrerupător Funcționează Defect
Funcționează 0.8 0
Defect 0.2 1
Pentru nodul Mecanism_acționare_1, probabilitățile condiționate, luând în considerare și
aplicarea mentenanței, sunt redate în tabelul 4.8:
Tabelul 4.8 TPC pentru variabila Mecanism_de_acționare
În cazul nodului Mecanism_acționare_1, se observă că starea acestuia depinde de starea
în care se afla anterior dar și de faptul dacă aplicăm sau nu mentenanța pentru a îmbunătăți
probabilitatea de funcționare.
Nodul de tip decizional mentenanță este caracterizat de un tabel de forma:
Tabelul 4.9 Probabilită țile inițiale ale variabilei nodului Mentenanță
În cazul în care se aplică mentenanța, costul aferent este redat de nodul de tip mărime de
ieșire (cost) corespunzător, redat în tabelul 4.10.
Costul mentenanței este eva luat la 10.000 unități bănești.
Tabelul 4.10 Costul mentenanței
Mentenață Da Nu
Cost -10000 0
Fiind definite probabilitățile nodurilor „părinți”, Mecanism_acționare 1 și Întrerupător_1,
se poate trece la definirea probabilităților condiționate de întrerupere a alimentării după o
anumită perioadă de funcționare. Tabelul 4.11 caracterizează acest nod și este prezentat mai jos:
Tabelul 4.11 TPC pentru variabila Întreruepere_alimentare_1
Întrerupere_alimentare_1
Întrerupător_1 Funcționează Defect
Mecanism_acționare_1 Funcționează Defect Funcționează Defect
Da 0 0.2 1 1
Nu 1 0.8 0 0
Nodul încasări_energie_vândută este redat în tabelul 4.12.
Mecanism_acționare_1
Mentenanță Da Nu
Mecanism_acționare Funcționează Defect Funcționează Defect
Funcționează 0.7 0.3 0.6 0.3
Defect 0.3 0.7 0.4 0.7
Mentenanță
DA 0
NU 1
20
Tabelul 4.12 Valorile aferente nodului Încasări_energie_vândută
Se poate observa ca în cazul neîntreruperii în alimentare obținem maximul de 30.000
u.b., lucru care se întâmplă doar în cazul disponibilității 100% a întrerupătorului și a
mecanismului de acționare
Odată definite tabelele de probabilitate pentru toate nodurile se poate observa
comportamentul rețelei. Rezultatele sunt prezentate în figura 4.30 în care putem observa
probabilitățile condiționate pentru fiecare nod al rețelei în ferestrele de monitorizare.
Încasările din energia vândută sunt 19483.20 u.b. Totodată, probabilitatea de funcționare
a mecanismului de ac ționare și a întrerupătorului scad, în timp, datorită uzurii. În situația
prezentată nu s -a aplicat mentenanța, costul aferent acesteia fiind 0.
Fig 4.30 Diagrama de influență pentru studiul disponibilității întrerupătoarelor
Rețeaua probabilistică permite modificarea probabilităților și actualizarea tuturor
valorilor. Se consideră cazul în care se aplică mentenanța și se obține o rețea ca în figura 4.31.
În cazul aplicării mentenanței se observă faptul că mecanismul de acționa re se readuce la
parametrii inițiali astfel că probabilitatea acestuia de funcționare va fi de 0.7 spre deosebire de
cazul anterior în care era doar de 0.51. De asemenea se înregistrează o creștere a siguranței în
alimentare deoarece în nodul Întrerupere_a limentare_1, probabilitatea ca acest lucru să se
întâmple scade de la 35.06 la 32.32. În ultimă instanță acest lucru duce și la creșterea încasărilor
din energia vândută de la 19483.20 la 20304.
Ca ultim exemplu se ia în considerare și un caz extrem, cazul funcționării 100% a
Întrerupătorului_1. Se obține rețeaua din figura 4.32.
Întrerupere_alimentare_1 Da Nu
Încasări_energie_vândută 0 30.000
21
Fig. 4.31 Diagrama de influență cu rezultate în urma aplicării mentenanței
Fig. 4.32 Rețea pentru studiul disponibilității întrerupătoarelor în cazul funcționării ideale a Întrerupătorului_1
Se poate observa că încasările cresc substanțial în acest caz până la 27060.00 u.b., dar nu
ating maximul de 30000 u.b. deoarece și mecanismul de acționare încă mai are o influență
asupra nodului Întrerupere_alimentare_1, dar șansa ca să apară o întrerupere este foarte mică,
0.98.
22
Referințe bibliografice
[4.1] R. E.Neapolitan, Learning Bayesian Networks., Prentice Hall Series in Artificial Intelligence. NJ, USA,
2003. ISBN:0130125342.
[4.2] D. Barber, Bayesian reasoning and Machine Learning, Cambridge University Press, NY, USA. 2012. ISBN
978-0-521-51814 -7.
[4.3] Kevin, P. Murphy, Machine Learning – A Probabilistic Perspective. MIT Press, 2012. ISBN 978 -0-262-
01802 -9,
[4.4] F. Munteanu, A. Ciobanu and C. Nemes, "From technical design structures to Bayesian networks in power
engineering," 2016 International Conference on Applied and Theoretical Electricity (ICATE), Craiova, 2016, pp.
1-6. doi: 10.1109/ICATE.2016.7754625
[4.5] A. Ciobanu, F. Munteanu, C. Nemes and D. Astanei, "Availability evaluation of nodal architectures using
bayesian networks", 2016, Buletinul Institutului Politehnic din Iași, Vol. 62 (66), Numărul 3, Secția
Electroteh nică, Energetică, Electronică.
[4.6] Kuang Zhou, Arnaud Martin, Quan Pan. The Belief -Noisy -OR model applied to network reliability
analysis. International Journal of Uncertainty, Fuzziness and Knowledge -Based Systems, World Scientific
Publishing, 2016. <h al-01326342v2>
[4.7] A. Darwiche, Modeling and Reasoning with Bayesian Networks, Cambridge University Press, 2009. ISBN
978-0-521-88438 -9 (chapter 5 – Building Bayesian Networks).
[4.8] Pearl, J. Probabilistic Reasoning in Intelligent Systems: Network of Plausible Inference. Ed Kaufmann, M.)
(San Mateo, California, 1988).
[4.9] ***NTE 005/2006 Normativ privind metodele și elementele de calcul al siguranței în funcționare a
instalațiilor energetice.
[4.10] A. Ciobanu, F. Munteanu and C. Nemes, "Bayesian networks utilization for reliability evaluation of
power systems," 2016 International Conference and Exposition on Electrical and Power Engineering (EPE), Iasi,
2016, pp. 837 -841. doi: 10.1109/ICEPE.2016.7781454
[4.11] Zhu Yongli, Fan Gaofeng, Huo Limin, "Reliability Assessment of Power Systems by Bayesian
Networks," in IEEE, 2002, pp. 876 -879
[4.12] Florin Munteanu, Ciprian Nemeș, “Belief networks utilization for nodal power quality and availability
assessment”, “2011 International Conference on Energy and Environment”, CIEM 2011
1
Capitolul 5
TEHNICI DE CONSTRUCȚIE AUTOMATĂ A STRUCTURII ȘI DE
CALCUL A PARAMETRILOR REȚELELOR BAYESIENE
5.1 Baze de date și informații utilizate pentru construcția rețelelor Bayesiene
Sistemele de baze de date au devenit, în ultimii ani, un aspect foarte important pentru
domeniul tehnologiei informației datorită impactului asupra modului de organizare și funcționare a
sistemelor.
O bază de date conține informații corelate logic între ele și pe baza cărora se pot face
interpretări și lua decizii.
Proprietă ți ale bazelor de date:
• Informațiile colectate sunt logice și coerente;
• Informațiile descriu un domeniu precizat și se adresează unui grup specific de utilizatori;
• Informațiile descriu aspecte reale ce pot fi analizate spre luarea deciziilor.
5.1.1 Metode de prelucrare a șirurilor de date
Orice bază de date ce urmează a fi prelucrată provine dintr -un experiment sau dintr -o
operație tehnologică ca urmare a unui proces de măsurare.
Prelucrarea și interpretarea datelor a devenit o necesitate datorită for mei rezultatelor obținute
din procesele de măsurare.
Prelucrarea șirurilor de date are la bază utilizarea principalilor parametri statistici ( Anexa
5.1).
Orice măsurătoare experimentală este afectată de erori. În principiu, este posibil ca uneori să
se cunoască limitele intervalului de valori în interiorul căruia trebuie să se afle datele ce urmează a fi prelucrate. În acest caz datele care ies în afara intervalului de variație admis se elimină, pe baza unui
test al valorii, ca fiind neconforme cu realita tea, sau afectate de erori.
Pentru evitarea luării în calcul a acestor date afectate de erori, în practică pot fi aplicate o
serie de teste și procedee pentru eliminarea acestora. Tipurile de erori și o parte dintre testele
specifice sunt prezentate în detaliu în anexa 5.2 a acestui capitol.
Deoarece orice proces de măsurare este afectat de erori aleatorii, atunci chiar rezultatele
măsurătorilor sunt aleatorii. Repetând de un număr mare de ori, în condiții identice, măsurarea unei mărimi m, se constată că rezultatele aleatorii t
i ale măsurării sunt caracterizate de o lege de repartiție
bine determinată.
Variabila aleatorie T este funcția numerică definită pe mulțimea rezultatelor ti ale unui
experiment. Variabila T ale cărei valori ti pot umple un interval t1, t2 și căreia i se poate atașa o
funcție f( t) cu proprietățile
2
f(t) ≥ 0; ∫+∞
∞−=1 )(fdtt (5. 1)
astfel încât
∫=<<2
1)(f ) (P2 1t
tdtt ttt (5. 2)
se numește variabilă aleatoare continuă.
Funcția f( t) se numește densitate de probabilitate (sau densitate de repartiție) a variabilei T (t).
Dacă măsurarea unei mărimi m se efectuează, în condi ții identice, de un număr mare de ori n,
obținându- se șiruri de valori aleatorii ti, iar din acestea, q valori se află în intervalul t1, t2,
probabilitatea
) (P /2 1<<= tTt nq (5. 3)
este o caracteristi că a intervalului t1, t2 și se numește frecvență relativă a variabilei t în intervalul
considerat.
Funcția care permite ca pentru orice interval t 1, t2 să se determine probabilitatea ) (P2 1 ttt<<
se numește repartiție de probabilitate a variabilei t.
În domeniul elementelor și sistemelor electrice, legile de distribuție sunt definite pe baza
indicatorilor de fiabilitate.
Acești indicatorii mai poartă numele de parametri sau caracteristici de fiabi litate și reprezintă
mărimi ce exprimă din punct de vedere calitativ și cantitativ, fiabilitatea produselor.
Indicatorii de fiabilitate sunt:
– Probabilitatea de bună funcționare R( t)
T)(t Prob)( )( >==tptR ( 5.4)
unde:
p(t) – probabilitatea de bună funcționare
t – variabila timp
T – limita stabilită de bună funcționare
Probabilitatea unui eveniment este o măsură a șanselor de realizare a acelui eveniment.
Probabilitatea evenimentului t se notează cu p(t) și es te un număr cuprins între 0 și 1; 1 este valoarea
unui eveniment sigur, adică produsul se află în stare de funcționare, iar apoi scade după o anumită
lege spre 0, 0 însemnând că produsul se află în stare de nefuncționare.
– Probabilitatea de defectare F( t) – se definește ca:
) ( Prob)( Tt tF <= (5. 5)
– Cuantila timpului de funcționare ( tF) – reprezintă timpul în care un produs
funcționează cu probabilitatea 1- F.
F ttF=≤) (Prob (5. 6)
– Funcția de frecvență sau densitatea de probabilitate f(t) – exprimă frecvența
defectelor pentru un interval de timp dat.
Între indicatorii densitate de probabilitate și probabilitate de defectare se poate scrie
următoarea relație:
3
∫=t
dttf tF
0)( )( (5. 7)
Între indicatorii probabilitatea de bună funcționare și densitate de probabilitate există
următoarea relație:
() ∫∫∞
=−=
tt
dttf dttf tR )( )( 1
0 (5. 8)
– Rata de defectare z(t)
)()()(tRtftz= (5. 9)
– Timpul mediu de bună funcționare
∫∫∞ ∞
=⋅==
0 0)( )( dttR dttft m MTBF (5. 10)
– Dispersia σ2 și abaterea medie pătratică σ
∫∞
⋅−=
02 2)( ) ( dttf mtσ (5. 11)
∑
=−−=0
12
0) (11N
iimtNσ (5. 12)
Descrierea detaliată a funcțiilor de repartiție cunoscute este prezentată în anexa 5.3 a acestui
capitol.
Deoarece, deseori, bazele de date conțin un volum mare de informații , intervine necesitatea
grupării acestora pe intervale de variație ale valorilor, pentru a le condensa ordonat. Aceste intervale
se numesc clase. De obicei, mărimea intervalelor care definesc clasele se ia aceiași pentru toate
clasele. În normative se recomandă ca numărul claselor să fie între 13 și 20 și să se determine cu relația:
n k log322,31+= (5. 13)
în care n este numărul datelor. Când n este mai mic de 250 este recomandată împărțirea în 10 clas e.
Pentru un număr de date mai mic de 25, gruparea în clase este irelevantă și nu aduce nici un
supliment de informație.
Aceste clase de variație sunt necesare în cazul verificării normalității repartiției datelor prin
utilizarea unor teste specifice.
Ținând cont de faptul că valorile unora dintre testele de verificare a normalității repartiției
pot fi influențate de numărul claselor în care se grupează datele, în literatura de specialitate sunt
prezentate diverse relații pentru determinarea lui k .
Pentru n >100, numărul de clase se determină cu relația: []51
2)1(75,04− = n k
4
Limitele claselor trebuie alese astfel încât să se identifice cu ușurință cărei clase îi aparține
oricare dintre datele șirului. Datele aparținând unor șiruri cronologice (dependente de timp) nu pot fi
grupate sau ordonate după mărimea lor.
Verificarea normalității repartiției datelor se poate face prin mai multe metode și teste
precum: testul χ2
(hi pătrat), testul Kolmogorov- Smirnov, testul Massey, testul S -W (Shapiro -Wilk)
(Anex a 5.4).
5.1.2 Prelucrarea datelor primare privind sursa eoliană
Parametrul cheie ce determină performanța unei turbine eoliene este viteza vântului și este în
mod normal măsurată cu un anemometru amplasat pe nacela turbinei.
Modelarea vitezei vântului este un subiect mult dezbătut în literatura de specialitate [5.1] ,
[5.2] , [5.3] datorită importanței pe care o au sursele regenerabile în producerea de energie electrică.
Natura dinamică a vântului reprezintă un obstacol pentru abordările tradiționale bazate pe
modelare fizică și matematică, fapt pentru care se face apel la ingineria predictivă.
Achiziția și prelucrarea datelor reprezintă o abordare promițătoare pentru modelarea
vântului, incluzând predicția și optimizarea puterilor, prognoza vitezei vântului, monitorizarea
curbelor de putere și diagnosticarea defectelor.
Extracția datelor implică numeroși pași precum:
1. Colectarea și analiza datelor
2. Selectarea caracteristicilor
3. Preprocesarea datelor
4. Identificarea unui model
5. Calculul și analiza parametrilor
Un studiu de caz bazat pe extracția datelor pentru modelarea disponibilității vântului este
prezentat în ideea de a evidenția acești pași.
5.1.2.1 Colectarea și analiza datelor privind viteza vântului
În acest paragraf am utilizat o bază de date ce conține valori ale vit ezei vântului înregistrate
la intervale de un minut, timp de doi ani, cu ajutorul unei stații meteorologice profesionale de tip
Vintage Pro 2 Plus (f igura 5 .1). Stația este amplasată în apropierea laboratorului LACARP –
Laborator de Cercetare Aplicată și Realizare de Prototipuri din cadrul Departamentului de
Energetică.
5
Fig. 5.1 Stația meteorologică Vintage Pro 2 Plus utilizată pentru achiziția de date
Stația poate înregistra zilnic, lunar sau anual informații în ceea ce privesc parametrii
climatici, precum viteza vântului, radiația solară, temperatură, umiditate, presiunea barometrică,
cantitatea de precipitații sau indici compuși precum punctul de rouă , doza de radiație UV, indicele
de căldură, evapotranspirația. Graficele și tabelele colectate sunt indicate pe consolă sau pe ecranul unui calculator conectat la stație.
Fig. 5.2 Viteza vântului [m/s] înregistrată pe parcursul anului 2014
În această etapă este necesar să se examineze conținutul datelor „brute”, ce urmează a fi
utilizate în modelare. De exemplu, formatul și frecvența datelor trebuie să fie preprocesate pentru uniformitate. Toate datele incomplete, eronate sau lipsă, trebuie luate în consi derare.
5.1.2.2 Selectarea caracteristicilor
Modelarea vitezei vântului în ansamblu nu reprezintă subiectul studiului de caz, dar plecând
de la extracția datelor cu privire la acest parametru s -au estimat probabilitățile funcțiilor de
distribuție pentru variabilel e aleatorii M[T
f] – durata medie de funcționare neîntreruptă și M[T r] –
durata medie de reparare n eîntreruptă.
Elementul de o mare importanță în acest studiu de caz este reprezentat de duratele
perturbațiilor vitezei vântului cu viteze considerate generic sub 4 m/s și peste 20 m/s.
6
O imagine reprezentativă a variabilei M[T f] pe parcursul intervalului de timp măsurat este
dată în fig ura 5.3.
Durata medie de bună funcționare este cuprinsă într -un interval de 6 – 12 ore și are o evoluție
pozitivă în decursul celor 2 ani, reprezentând o caracteristică pur naturală.
La începutul intervalului de măsurare se observă o fluctuație a acestei durate, mai apoi, la
sfârșitul anului 2013 și începutul anului 2014, aceasta de stabilizează, păstrând o limită de
aproximat iv 10,5 ore.
Sfârșitul anului 2014 este reprezentat de o durată medie de bună funcționare de aproximativ
12 ore, scăzând la începutul anului următor, la o valoare de aproximativ 11 ore.
Fig. 5.3 Evoluția variabilei M[Tf] înregistrată în intervalul de timp considerat
Având drept scop imunizarea generatoarelor eoliene împotriva variațiilor de scurtă durată a vitezei
vântului, datele colectate au fost clasificate în funcție de durată așa cum este prezentat în tabelul 5.1.
5.1.2.1 Preprocesarea datelor privind viteza vântului
Pentru calculul indicatorilor de fiabilitate pentru perturbații de scurtă durată a vitezei
vântului s -au luat spre analiză cinci funcții de distribuție: exponențială, Gamma, Weibull, normală și
log-normală. Parametrii au fost calculați pe baza datelor colecta te.
Tabelul 5.1 M[T f] și M[T r] pentru perturbații de scurtă durată a vitezei vântului
Variații de scurtă
durată a vitezei
vântului M[T f] /
M[T r]
înregistrări Media Variația Maxim Minim
M[T f] M[T r] M[T f] M[T r] M[T f] M[T r] M[T f] M[T r]
[min] [ore]
0 – 3 782 / 783 24.57 0.02 8895 0 1342 0.03 0 0.01
3 – 5 183 / 184 102.73 0.04 102.73 0 1347.98 0.05 0.05 0.00
5 – 7 84 / 85 224.8 0.06 123808.42 0 1798.12 0.07 0.13 0.05
7 – 10 99 / 100 184.12 0.09 79593.96 0 1440.68 0.1 0 0.01
• Distribuția exponențială
M e tF e tft t/1 ; 1)( ; )( = −= =− −λ λλ λ (5. 14)
unde: f (t) – probabilitatea funcției de distribuție;
20 40 60 80 100 120
Apr 13 Iul 13 Oct 13 Ian 14 Apr 14 Iul 14 Oct 14 Timpul de funcționare (Ore)
Limita inferioară Media Limita superioară
7
F(t) – funcția de distribuție calculată;
M – media aritmetică a șirului de date;
s2 – abaterea medie pătratică.
• Distribuția Gamma
()[ ]()[]22
2
01 1; ; )(/1)( ; / )(
sM
sMdxxe tF et tft
x t= = Γ= Γ ⋅= ∫−− −−αβ α α ββα βα (5. 15)
• Distribuția Weibull
α αβ βαβαt te tF et tf −= =−−1)( ; )(1 (5. 16)
unde
2 22
22
111;
112111
+Γ=
+Γ−
+Γ
+Γ
=
αβ
α αα
MsM (5. 17)
• Distribuția normală
2 2 )2/( 2) (
; ;
21)( ;
21)(222
s M dx e tF e tftxt
= =
=
= ∫∞−−−−
σµ
π πσσµ
(5. 18)
• Distribuția log -normală
dx e tF e tftxt
∫∞−−−−
=
=ln)2/( 2) (ln
222
21)( ;
21)(
π πσσµ
(5. 19)
unde
∑ ∑
= =− = =N
iN
ii i N x Nx
1 12 2/) (ln ;/) ln( µ σ µ (5. 20)
unde x i reprezintă valoarea i din șirul de date și N numărul datelor.
8
Fig. 5.4 M[T f], intervalul 0 – 3 min
Fig. 5.5 M[T f], intervalul 3 – 5 min
Fig. 5.6 M[T f], intervalul 5 -7 min 0 10 20 30 40 50 60
180 360 539 719 899 1079 1259 1438 1618 1798 Proc
ent
(%)
Ore (Dimensiunea intervalului = 89.906) 43
14
9
1 4 3 2 1 2 1 1 1 1 Exponențială Gamma
Log-normală
Weibull
Normală 0 1
2
3
4
5
6
7
13
27
40
53
67
80
94
107
121
134
Proc
ent (%)
Ore (Dimensiunea intervalului = 67.399) 12
2
1
1
4 2 5 3 3 1 1 Gamma
Weibull
Log-normală
Exponențială
Normală 0 20 40 60 80 100
134 269 403 537 671 806 940 1074 1208 1343 Proce
nt
(%)
Ore (Dimensiunea intervalului = 67.125) 721
19 18 9 4 1 2 2 1 2 1 1 Weibull
Gamma
Exponențială
Log-normală
Normală
9
Fig. 5.7 M[T f], intervalul 7 -10 min
5.1.2.2 Identificarea unui model
Comportamentul probabilistic al vitezei vântului indică o funcție de distribuție de tip
Weibull, pe când variabila M[T f] are o distribuție de tip Gamma.
Pentru identificarea celei mai precise funcții de distribuție s -au aplicat două teste de
verificare a normalității repartiției datelor și anume testul χ2 și testul Kolmogorov- Smirnov pentru
cele cinci funcții analizate, rezultatele fiind prezentate în tab elul 5.2.
Tabelul 5.2 Verificarea normalității funcțiilor de repartiție pentru variabila M[T f]
Exponențială Gamma Weibull Normală Log-normală
Perturbații cu durate cuprinse între 3 – 5 min
Parametrii analizați λ =9.73e-0.03
α = 0.302
β = 2.94 e-0.003
α = 0.584
β = 8.67e-0.002
μ = 1.03e0.02
σ = 1.87e0.02
μ =2.62e0.000
σ = 2.61e0.00
Testul χ2 χ2
= 0 χ2
= 0.70 χ2
= 0.38 χ2
= 0 χ2
= 0.01
Testul KS KS > 0 KS > 0.2 KS > 0.2 KS > 0 KS > 0.00
Perturbații cu durate cuprinse între 5 – 7 min
Parametrii analizați λ =4.45e-0.03
α = 0.408
β = 1.82e-0.003
α = 0.660
β = 3.41e-0.002
μ = 2.25e0.02
σ = 3.52e0.02
μ =3.92e0.000
σ = 2.28e0.00
Testul χ2 χ2
= 0 χ2
= 0.71 χ2
= 0.66 χ2
= 0 χ2
= 0.42
Testul KS KS > 0 KS > 0.2 KS > 0.2 KS > 0 KS > 0.2
Perturbații cu durate cuprinse între 7 – 10 min
Parametrii analizați λ =5.43e-0.03
α = 0.426
β = 2.31 e-0.003
α = 0.672
β = 3.62e-0.002
μ = 1.84e0.02
σ = 2.82e0.02
μ =3.45e0.000
σ = 2.58e0.00
Testul χ2 χ2
= 0 χ2
= 0.65 χ2
= 0.41 χ2
= 0 χ2
= 0.05
Testul KS KS > 0 KS > 0.2 KS > 0.2 KS > 0 KS > 0.01
Perturbații de lungă durată, mai mari de 10 min
Parametrii analizați λ =1.76e-0.03
α = 0.148
β = 2.62 e-0.003
α = 0.451
β = 2.53e-0.001
μ = 5.67e0.01
σ = 1.47e0.02
μ =2.24e0.000
σ = 2.14e0.00
Testul χ2 χ2
= 0 χ2
= 0.17 χ2
= 0.26 χ2
= 0 χ2
= 0.16
Testul KS KS > 0 KS > 0.2 KS > 0.2 KS > 0 KS > 0.00 0 10 20 30 40 50 60
14
28
43
57
72
86
100
115
129
144
Proc
ent
(%)
Ore (Dimensiunea intervalului = 72.034) 54
9 11
3 3 6
3 2 1 1 2 1 1 1 Log-normală
Gamma
Weibull
Exponențială
Normală
10
Rezultatele arată că perturbațiile de scurtă durată (mai mici de 10 min) au o distribuție de tip
Gamma, iar perturbațiile de lungă durată (mai mari de 10 min) sunt distribuite conform funcției
Weibull.
Dacă luăm în considerare toată baza de date înregistrată putem concluziona faptul că viteza
vântului are o funcție de distribuție de tip Weibull.
5.1.2.3 Calculul și analiza parametrilor
Pornind de la idea că vântul poate fi considerat un sistem auto- reparabil în care fenomenele
de uzură si îmbătrânire nu afectează s ursa eoliană cu excepția, probabilă, a considerării unor
intervale de timp extrem de mari, la scară istorică sau geologică, s -a adoptat un model de
disponibilitate simplu, cu două stări și s -au calculat indicatorii de disponibilitate.
Așa cum este menționat și în §5.1.2.2, scopul studiului de caz este imunizarea generatoarelor
eoliene la variații de scurtă durată a vitezei vântului.
Având la bază modul de determinare a constantei mecanice de timp a ansamblului motor +
mecanism, putem generaliza și pentru un generator eolian generic, luând în considerare existența
variațiilor vitezei vântului.
Viteza utilă a vântului a fost considerată între 4 m/s și 20 m/s pentru un generator eolian
generic. Zonele de turbulență reprezintă stările sursei eoliene caracterizat e d e v i t e ze s u b 4 m / s ș i peste 20 m/s.
S-a întocmit o diagramă cu 11 stări ( figura 5 .8) și este rezultatul unui model structural tip
serie, ce include perturbații cuprinse între (0- 3 minute], (3- 5 minute], (5- 7] minute și (7- 10] minute.
Fig. 5.8 Cazul 1 – Spațiul stărilor pentru viteza vântului considerând toate perturbațiile de scurtă durată
Aceste intervale de turbulență pot crea regimuri tranzitorii afectând buna funcționare a
generatorului eolian.
În funcție de constanta de timp a agregatului, acesta poate fi imun sau nu la acest tip de
perturbații. μ6 μ7 μ8 μ9 μ10
μ1 μ2 μ3 μ4 μ5 λ6 λ7 λ8 λ9 λ10
λ1 λ2 λ3 λ4 λ5 10 9 8 7 6
5 4 3 2 1 0
Defect
Defect Succes
t≤3 min 3≤t≤5 min 5≤t≤7 min 7≤t≤10 min t>10 min
11
Pentru cazul 1 din figura 5.8, s -au calculat următorii indicatori de fiabilitate:
T – durata de referință
T= 2 ani = 17520 [h]
[]%0P PS=
[]∑==n
i i R P P1%
• Media timpului total de funcționare:
()[] []h 8028, 15912TPt M0=⋅= (5. 21)
• Media timpului total de nefuncționare:
[] []h 1972, 1607TP)t(MR=⋅= (5. 22)
• Media numărului de întreruperi (defectări):
[] [] ∑
==⋅⋅=10
10 626, 1615 )(
ii h PT t M λ ϑ (5. 23)
• Media timpului de funcționare neîntreruptă :
[][]
[][]ht Mt MTMf 8493,9)()(= =ϑα (5. 24)
• Media timpului de defect neîntrerupt:
[][]
[][]ht Mt MTMd 99478,0)()(= =ϑβ (5. 25)
• Intensitatea de defectare echivalentă
[][]110153,01 −== hTMfechivλ (5. 26)
• Intensitatea de reparare echivalentă
[][]100524,11 −== hTMdechivµ (5. 27)
Pentru a analiza evoluția indicatorilor în funcție de constanta mecanică de timp a agregatului
Ctimp, s-au efectuat aceleași calcule și pentru următoarele cazuri, valorile rezultate regăsindu -se în
tabelul 5.3:
12
Fig. 5.9 Cazul 2 – Spațiul stărilor pentru viteza
vântului considerând constanta mecanică de timp C timp
> 3 min
Fig. 5.10 Cazul 3 – Spațiul stărilor pentru viteza
vântului considerând constanta mecanică de timp C timp
> 5 min
Fig. 5.11 Cazul 4 – Spațiul stărilor pentru viteza
vântului considerând constanta mecanică de timp C timp
> 7 min
Fig. 5.12 Cazul 5 – Spațiul stărilor pentru viteza
vântului considerând constanta mecanică de timp C timp
> 10 min
λ4 λ9
μ4
Succes μ3 λ3 λ8
λ2 μ7
λ7
λ6 λ1 μ10
μ5 λ10
λ5 10
9
8
7
6
5 4
3
2
1 0
Defect
Defect
t >10 min Ctimp >10 min
μ1 μ6 μ8
μ2 μ3 λ3 λ8
μ2 λ2 μ7
λ7
λ6 λ1 μ9 μ10
μ4 μ5 λ9 λ10
λ4 λ5 10 9
8
7
6
5 4 3
2
1 0
Defect
Defect Succes
7≤t≤10 min t>10 min Ctimp > 7 min
μ1 μ6 μ8
μ2 λ2
μ7 λ7
λ6 μ1 μ6 λ1 μ8 μ9 μ10
μ3 μ4 μ5 λ8 λ9 λ10
λ3 λ4 λ5 10 9 8
7
6
5 4 3 2
1 0
Defect
Defect Succes
5≤t≤7 min 7≤t≤10 min t>10 min Ctimp > 5 min μ1 μ6
λ1 λ6 μ7 μ8 μ9 μ10
μ2 μ3 μ4 μ5 λ7 λ8 λ9 λ10
λ2 λ3 λ4 λ5 10 9 8 7
6
5 4 3 2 1 0
Defect
Defect Succes
3≤t≤5 min 5≤t≤7 min 7≤t≤10 min t>10 min Ctimp > 3 min
13
Tabelul 5.3 Valorile finale pentru indicatorii de fiabilitate [][][][]d f TM TMt Mt M , ,)( ,)(βα
t=0 t> 3min 3 < t < 5min 5 < t < 7 min 7 < t < 10 min
M[α(t)] 15912.80 16918.48 17029.87 17115.81 17185.82
M[β(t)] 1607.19 601.50 490.10 404.19 334.18
M[T(f)] 98.49 26.10 32.11 419.83 56.62
M[T(d)] 0.99 0.93 0.92 0.99 1.10
PS 0,908 0,966 0,972 0,977 0,981
Se poate observa că media timpului total de funcționare, 𝑀[𝛼(𝑡)], și media timpului de
funcționare neîntreruptă, 𝑀�𝑇𝑓�, cresc de la un caz la altul iar media numărului total de
întreruperi, 𝑀[𝛽(𝑡)], descrește. Media timpului de defect neînrerupt, 𝑀[𝑇𝑑], înregistreză mici
fluctuații în jurul valorii 1.
Dacă duratele perturbațiilor depășesc limitele definite de constanta mecanică de timp, atunci
nu sunt considerate ca fiind perturbații, generatorul eolian menținându- se în stare de succes.
În figura 5.13 este prezentată probabilitatea de succes a sistemului, caracterizată de faptul că
generatorul eolian nu este influențat de variațiile vitezei vântului sub sau peste limita admisă și nici
de duratele acestora.
Probabilitatea de succes este evident mai mare când constanta mecanică de timp este de peste
10 minute (cazul 5), astfel că putem concluziona că prin creșterea energiei stocate sub formă de
energie cinetică într -un volant, putem elimina o mare par te din perturbații.
Fig. 5.13 Probabilitatea de succes a turbinei eoliene
5.1.3 Prelucrarea datelor primare privind sursa solară
Achiziția datelor primare privind sursa solară a devenit un subiect de mare importanță în
analiza fiabilității panourilor fotovolt aice în scopul maximizării performanței acestora.
Prelucrarea datelor primare privind sursa solară este discutată în continuare pe baza datelor
achiziționate cu ajutorul unei stații meteorologice profesionale
Parametrul de o mare importanță în acest caz este reprezentat de radiația solară înregistrată. 0.860 0.880 0.900 0.920 0.940 0.960 0.980 1.000
t=0 t> 3 min 3 < t < 5
min 5 < t < 7
min 7 < t < 10
min PS
14
Baza de date luată în considerare conține valori ale parametrilor climatici printre care și
radiația solară, înregistrate la intervale de un minut pe parcursul anului 2016.
În tabelul 5.4 sunt prezentați principalii parametri statistici ai bazei de date considerate.
Tabelul 5.4 Principalii parametri statistici ai bazei de date analizate
Valoarea
medie Variația Deviația
Standard Min Max Număr
înregistrări
Temperatura 11.291 84.897 9.213 -14.2 36 458228
Umiditatea 69.964 282.108 16.796 0 96 458228
Viteza vântului 1.098 1.67 1.292 0 10.7 458228
Indexul de încălzire 11.116 87.00074 9.327 -14.3 40 458228
Indexul temperatura -umiditate –
vânt 10.659 94.751 9.734 -17.9 40 458228
Indexul temperatura -umiditate –
radiație -vânt 10.869 128.346 11.329 -20.2 46.4 458228
Presiune barometrică 762.011 41.533 6.444 741.7 779.9 458228
Radiație solară 125.96 46992.752 216.778 0 1188 458228
Evapotraspirație 0.0015 0.00045 0.0214 0 0.66 458228
Datele cu privire la radiația solară pot fi discretizate în funcție de un anumit număr de
intervale de variație ales și pentru diferite metode de selecție ( figura 5 .14), iar evoluția în timp a
acestui p arametru este redată în figura 5.15.
Fig. 5.14 Discretizarea parametrului radiația solară pe 5 intervale de variație după metoda ierarhică
15
Fig. 5.15 Evoluția în timp a radiației solare
Repartiția datelor privind radiația solară comparativ cu funcția normală de distribuție este
redată în figura 5.16, și se poate observa faptul că radiația solară are o distribuție diferită de cea
normală.
Fig. 5.16 Analiză comparativă între distribuția empirică a datelor privind radiația solară și funcția normală de distribuție
Complexitatea bazei de date ne per mite de asemenea și compararea mărimilor pe intervalul
de timp analizat. În figura 5.17 este prezentată evoluția în timp pentru doi parametri: viteza vântului
și radiația solară, iar în figura 5.18 este redată o analiză comparativă între acești parametri.
În lucrarea [5.4] este propusă o analiză comparativă între puterea generată de un panou
fotovoltaic și radiația solară captată de respectivul panou în scopul determinării performanței
sistemului utilizând coeficienți de corelație.
16
Fig. 5.17 Variația vitezei vântului și a radiației solare în unități relative, pe parcursul anului 2016
Fig. 5.18 Analiză statistică a corelației între radiația solară și viteza vântului
În acest studiu de caz a fost utilizată o bază de date ce conține valori ale radiației solare pe o
perioadă de 3 ani (2014, 2015 și 2016), înregistrate cu stația meteorologică prezentată în §4.1.2.1.
Lucrarea este focalizată pe analiza numerică dintre cantitatea de energie produsă de un panou
fotovoltaic cu o putere instalată de 3 kW și radiația solară pe plan orizontal colectată de stația meteo.
Datele colectate au fost prelucrate în vederea identificării valorilor lipsă sau a valorilor ce se
află în afara limitelor admisibile.
În tabelul 5.5 sunt prezentate valorile lunare ale ra diației solare înregistrate, pe baza cărora s –
a putut calcula cantitatea globală anuală de energie produsă în plan orizontal:
• 2014 – 1077.2 kWh/m2
• 2015 – 1121.4 kWh/m2
• 2016 – 1137.30 kWh/m2
17
Tabelul 5 .5 Valorile globale lunare ale radiației solare
Gh (kWh /m2/lună)
Luna 2014 2015 2016
Ianuarie
Februarie
Martie
Aprilie
Mai
Iunie
Iulie
August
Septembrie
Octombrie
Noiembrie
Decembrie 24,75
39,08
84,6
97,15
150,74
135,51
149,84
152,62
126,03
67,43
27,66
21,78 26,48
45,78
79,84
117,94
169,27
195,66
151,84
135,87
92,17
59,28
23,48
23,78 24,82
40,73
88,45
132,84
147,8
170,29
173,40
149,49
99,97
50,98
32,36
26,13
Panoul fotovoltaic a fost continuu monitorizat în ceea ce privește schimbul de energie între
sistem și rețeaua electrică locală. În fig ura 5.19 este redată producția lunară de energie a panoului
solar, pe baza căreia s -a calculat cantitatea anuală de energie produsă:
• 2014 – 3012,34 kWh / an
• 2015 – 3431,26 kWh / an
• 2016 – 3329,47 kWh / an
Fig. 5.19 Producția lunară de energie a panoului fotovoltaic
Calculul coeficientului de corelație s -a realizat pe baza valorilor lunare ale producției de
energie a panoului și valorilor lunare ale radiației solare, utilizând relația (5. 28).
())( )(), cov(,2 2YDXDYXYX⋅=ρ (5. 28)
unde:
18
– ()YX,ρ – reprezintă o măsură a dependenței dintre cele două variabile (producția de energie și
radiația solară);
– 2D – reprezintă dispersia variabilei;
– ), cov( YX – reprezintă corelația sau covarianța variabilelor și este calculată cu relația:
)( )( )( ), cov( YMXM XYM YX ⋅−= (5. 29)
Valorile numerice lunare și respectiv anuale ale c oeficientului de corelație sunt prezentate în
tabelele 5.6, 5.7.
Tabelul 5.6 Valorile lunare ale coeficientului de corelație
Luna 2014 2015 2016
Ianuarie
Februarie
Martie
Aprilie
Mai
Iunie
Iulie
August
Septembrie
Octombrie
Noiembrie
Decembrie 0,5990
0,7642
0,8825
0,9461
0,9598
0,9578
0,9459
0,9495
0,8953
0,7897
0,7735
0,4871 0,6001
0,7717
0,8875
0,9385
0,9228
0,9152
0,9233
0,9345
0,8693
0,7895
0,6437
0,3950 0,6487
0,7550
0,9068
0,9493
0,9489
0,9517
0,9430
0,9337
0,9007
0,8454
0,6035
0,4602
Tabelul 5.7 Valorile anuale ale coeficientului de corelație
Anul 2014 2015 2016
Coeficient de corelație 0,9860 0,9910 0,9940
Rezultatele analizei coeficientului de corelație arată o puternică legătură între cele două
variabile. Este de observat faptul că valorile coeficientului de corelație sunt pozitive pe parcursul
celor trei ani analizați, înregistrând un maxim de 0,9598 în l una iunie 2014, când poziția soarelui pe
cer sa aflat la o altitudine de 66.17°.
Cea mai slabă corelație între cele două variabile se înregistrează în sezonul de iarnă, în luna
decembrie 2015 cu o valoare de 0.3950, datorită altitudinii scăzute a soarelui (19.38°) și a umbririlor temporare cauzate de depunerile de zăpadă sau înălțimile clădirilor din proximitatea panoului.
Concluzionând, putem spune că performanța panoului fotovoltaic este afectată de mai mulți
parametri, inclusiv de resursele solare locale precum și de umbririle permanente sau temporare ale acestuia, în special în sezonul rece.
5.2 Algoritmi de construcție a structurii rețelelor Bayesiene
Construcția unor rețele probabilistice poate implica o muncă laborioasă intensivă, datorită
complexității modelelor și a numărului mare de algoritmi existenți.
Construcția RB implică parcurgerea unor pași precum: identificarea variabilelor,
identificarea stărilor variabilelor, stabilirea relațiilor de dependență/ independență și c odarea
19
acestora sub forma u nui graf aciclic direcționat (GAD) și în final extragerea probabilităților
condiționate și funcțiilor de utilitate.
Tehnicile de modelare automată sunt utilizate în procesele de dezvoltare ale modelelor din
mai multe motive precum: simplificarea informație i extrase, identificarea unor proprietăți ale
problemei analizate ce nu sunt ușor de cuprins într -un GAD, reducerea complexității modelului și
creșterea eficienței inferenței în cadrul modelului.
Acest subcapitol este dedicat descrierii unor algoritmi de învățare a structurii RB, precum:
a) Algoritmul Naive Bayes (NB)
b) Algoritmul Augmented Naiv e Bayes ( ANB )
c) Algoritmul Tree Augmented Naive Bayes (TANB)
d) Algoritmul Bayesian Search (BS)
e) Algoritmul PC
f) Algoritmul Essential Graph Search (EGS )
g) Algoritmul Greedy Thick Thinning (GTT)
5.2.1 Algoritmul Naive Bayes (NB)
Modelele grafice probabilistice restrictive sunt folosite atunci când, modelul are o
complexitate redusă dar totuși este necesară o capacitate mare de calcul.
Acestea sunt utilizate cu precădere în rezolvarea pro blemelor de clasificare, atunci când
scopul este de a integra o variabilă într -o clasă de variabile pe baza unor observații asupra
proprietăților respectivei variabile.
Modelul NB este unul dintre cele mai simple modele grafice probabilistice restrictive, dar și
foarte utilizat datorită simplității sale reprezentaționale și de calcul, păstrând în același timp o
performanță impresionantă în rezolvarea problemelor de clasificare.
În continuare se vor prezenta detalii și exemple care au la bază modelul NB, dat orită faptului
că acest model este printre cele mai uzuale pentru rezolvarea problemelor de clasificare.
Fie C variabila clasă marginală, cu o singură stare pentru fiecare clasă posibilă și
{}n 1I,…,IΙ= setul de variabile (atribute, caracteristic i sau indicatori), unde fiecare variabilă
reprezintă o proprietate observată și inclusă în model.
Structura modelului NB este motivul pentru care rețeaua este atât de simplă și eficientă.
Structura modelului NB este ilustrată în fig ura 5.20 unde C, variabi la clasă este singurul
părinte pentru fiecare atribut. Modelul NB presupune ca între perechile de atribute să existe o relație
de independență condiționată, dată fiind variabila clasă.
20
Fig. 5.20 Structura modelului Naive Bayes (NB)
Setul de distribuții condiționate de probabilitate ce reiese din modelul NB este alcătuit din
distribuția a priori de probabilitate P(C) a variabilei clasă și, distribuția c ondiționată de probabilitate
P(I i|C) a atributului I i dată fiind clasa pentru oricare ar fi i=1,..,n.
Ținând cont de aceste aspecte, calculul distribuției comune de probabilitate indus de modelul
NB se realizează utilizând relația (5.30).
()()()()∏
== =n
ii n , |I I,…,I, X
11 C P CP CP P (5. 30)
Inferența probabilistică în cazul modelului NB implică calcularea distribuției de probabilitate
P(C|ε), unde ε reprezintă evidența sau observațiile făcute asupra unui subset de atribute ce aparțin
aceleiași variabile ce urmează a fi clasificată.
Oricare ar fi un set de observații ε ={i 1, …, i m}, putem calcula probabilitatea clasei astfel:
()()()∏
∈==
εiC|iP C|εPε|CL (5. 31)
Probabilitatea a posteriori a vari abilei clasă poate fi calculată ca produs între probabilitatea a
priori și probabilitatea apariției evidenței prin normalizare ()()()Cε|CLαε|C P P= , unde
()()() ( )1 1P P− −∑==CCε|CL ε α , sau poate fi calculată conform teoremei lui Bayes astfel:
()()()
()εC C|εε|CPP PP= (5. 32)
În ciuda simplității sale și a susținerii puternice a independenței perechilor de atribute, dată
fiind clasa, modelul NB a dovedit în practică performanțe excelente în rezolvarea multor proble me
de clasificare. Acest lucru face ca modelul NB să fie atât de popular.
5.2.2 Algoritmul Augmented Naive Bayes (ANB)
Performanța unei RB în rezolvarea unor probleme de clasificare poate fi îmbunătățită dacă
procedura de învățare a structurii ține cont de starea variabilei clasă. O metodă simplă pentru
asigurarea acestui aspect (detaliată în lucrarea [5.5] ), este realizat ă prin influențarea structurii rețelei
astfel încât să existe legături de la variabila clasă către fiecare din variabilele atribute ale acesteia. C
I1 In …
21
Acest lucru asigură faptu l că în rețeaua creată (fig ura 5 .20), probabilitatea P(C|I 1,…, I n) va
lua în conside rare toate atributele.
În scopul de a îmbunătăți un clasificator bazat pe acest tip de influență, în lucrarea precizată,
autorii propun mărirea structurii naive Bayesiene cu legături între atribute, acolo unde este cazul,
astfel încât ipoteza unei independențe condiționate între atribute să fie repartizată. Astfel de structuri
poartă numele de rețele Bayesiene naive de tip evolutiv , iar laturile implicate sunt laturi evolutive .
Într-o structură evolutivă (fig ura 5 .21), o legătură de la I i la I j implică f aptul că influența lui
Ij asupra evaluării variabilei clasă depinde și de valoarea lui I i.
Această legătură afectează procesul de clasificare deoarece anulează ipoteza clasificatorului
naiv Bayesian asupra independenței dintre atribute astfel încât probabilitatea P(I j|C) este
considerabil diminuată, iar atunci când este luată în considerare și dependența dintre atribute
probabilitatea P(I j|C,I i) este mare.
În această situație, clasificatorul naiv Bayesian va supra aprecia probabilitatea variabilei de
clasă luând în considerare două observații puțin probabile, în timp ce rețeaua evolutivă din figura
5.21, nu va realiza acest lucru.
Fig. 5.21 Structura modelului naiv Bayesian de tip evolutiv
Adăugarea celui mai bun set de laturi evolutive este o problemă care nu poate fi rezolvată,
deoarece este echivalentă cu învățarea celei mai bune rețele Bayesi ene în care C este variabila
rădăcină. Astfel, chiar dacă am putea îmbunătăți performanțele unui clasificator naiv Bayesian în acest fel, efortul de calcul necesar este cu mult crescut și duce la diminuarea avantajelor metodei..
Cu toate acestea, prin impu nerea unor restricții acceptabile asupra structurii, putem identifica setul
optim de laturi evolutive în timp polinomial.
5.2.3 Algoritmul Tree Augmented Naive Bayes (TANB)
O altă abordare pentru menținerea structurii de bază a clasificatorului naiv Bayesian este
reprezentată de extensia acestui algoritm într -unul de tip arbore evolutiv .
În lucrarea [5.5] , autorii propun această metodă pentru învățarea structurii rețelelor.
Algoritmul TANB utilizează ipoteza că variabila clasă nu are ”părinți”, și fiecare variabilă atribut
are drept predecesori variabila clasă și cel mult o altă variabilă atribut. Astfel, fiecare variabilă
atribut poate avea o latură evolutivă.
Algoritmul TANB are la baz ă o metodă bine cunoscută, valorificată în anul 1968 de către
Chow și Liu, [5.6] , care are drept principiu întocmirea structurii rețelelor Bayesiene arborescente. C
Ii In … Ij
22
Un graf aciclic direcționat (GAD) ce are ca variabile { X1, …, Xn} poate fi denumit arbore
dacă ∏ iXconține exact un părinte pentru toate Xi, cu excepția variabilei marginale. O rețea
arborescentă poate fi descrisă prin identificarea variabilei părinte pentru fiecare variabilă atribut .
O funcție { }{ }n,…, n,…,:π 0→ 1 poate defi ni un arbore pentru X 1,…, Xn dacă există exact un
singur i astfel încât ()0=iπ (denumit și rădăcina arborelui), și nu există secvențe i 1,…, i k astfel încât
1+=)(j ji iπ pentru kji <≤ și 1=)( i iπk . O astfel de funcție definește arborele unei rețele unde
{})i(π iX X=∏ dacă π( i) > 0, și =∏ iX∅ dacă π( i) = 0.
În lucrarea [5.6] , autorii descriu o procedură de construcție a rețelelor Bayesiene
arborescente cu ajutorul bazelor de date. Această procedură reduce problema construirii unui arbore
cu probabilitate maximă pentru a identifica în graf structura arborescentă cu numărul maxim de
ramuri.
Problema identificării unui astfel de arbore constă în selectarea unui subset de arce din graf
astfel încât, arcele selectate să constituie un arbore, iar suma ponderilor atașate acestora să fie
maximă.
Metoda de construcție a unui arbore după principiul Chow – Liu constă în parcurgerea a patru
pași:
Se calculează ()j i Pˆ ; I
DYX pentru fiecare pereche de variabile, i ≠ j, unde
()()()
()()∑=
yx yxyxyx YX
,PˆPP,Plog,P ; I
D (5. 33)
este funcția informației mutuale . Altfel vorbind, această funcție măsoară cantitatea de informație
conținută de Y despre X. Pentru o descriere detaliată a acestei funcții, vezi anexa 5.5.
Se construiește un graf complet nedirecționat în care nodurile sunt variabile din X.
Ponderea fiecărei laturi ce conectează Xi de X j se notează cu ()j i Pˆ Y;XI
D.
Se construiește arborele cu ponderea maximă.
Se transformă arborele nedirecționat rezultat într -unul direcționat, selectând o variabilă
rădăcină și setând direcția tuturor laturilor spre exteriorul acesteia.
Această metodă conduce la identificarea arborelui cu probabilitate maximă ținând cont de
baza de date D introdusă.
Teorema 1 [5.6] : Fie D o colecție de N cazuri a lui X 1,…, Xn. Procedura construirii arborelui,
conduce la identificarea unui arbore B T care maximizează ()D|BLLT și are complexitatea de timp
()NnO⋅2.
Acest rezultat poate fi adaptat pentru învățarea probabilității maxime a unei structuri TANB .
Fie setul de variabile de tip atribut A 1,…, An și C variabila clasă. Putem spune că B este un model
TANB dacă =∏C∅ și există o funcție π care definește un arbore în A1,…, An astfel încât
23
(){} ∏=iπ i A,C A dacă π( i) > 0 , ș i {}∏=C Ai dacă π( i) = 0. Problema de optimizare constă în
găsirea unui arbore care să definească funcția π pentru A1,…, An astfel încât probabilitatea
logaritmică să fie maximă.
Această problemă de optimizare poate fi rezolvată prin utilizarea unei proceduri, numită în
continuare Construcția – TANB, care urmează regulile de bază ale principiului Chow – Liu, cu
excepția că în loc să folosească informația mutuală dintre două atribute, utilizează informația
mutuală condiționată dintre atribute dată fiind variabila clasă. Această funcție este definită d e
relația:
()()()
()()∑=
zyx z|yz|xz|yx,zy,x, Z|YX
,,PP PPlog P ; I (5. 34)
Altfel vorbind, această funcție măsoară cantitatea de informație transmisă de Y despre X
atunci când valoarea lui Z este cunoscută. Pentru o descriere detaliată a acestei funcții, vezi anexa
5.5.
Procedura Construcției – TANB constă în parcurgea a cinci pași:
Calcularea ()C|A;AIj i PˆD pentru fiecare pereche de variabile atribut, ji≠.
Construcția unui graf complet nedirecționat în care nodurile reprezint ă variabilele atribut
A1,…, A n; și notarea ponderilor fiecărei laturi ce conectează A i de A j cu ()C|A;AIj i PˆD.
Se construiește arborele cu ponderea maximă.
Se transformă arborele nedirecționat rezultat într -unul direcționat prin alegerea unei variabile
rădăcină și setarea direcției tuturor laturilor spre exteriorul acesteia.
Construirea unui model TANB prin adăugarea unui nod notat C și a unor laturi de la C către
fiecare A i.
Teorema 2 Fie D o colecție de N cazuri din C , A1,…, An. Procedura Construcției – TANB
construiește un model TANB notat BT care maximizează ()D|BLLT și are complexitatea de timp
()NnO⋅2.
Reformulând expresia probabilității logaritmice descrisă în anexa 5.5, avem:
() () tătan cons X;XI N D|BLL
iDXi i Pˆ T + ⋅=∑∏ (5. 35)
Astfel maximizarea probabilității logaritmice este echivalentă cu maximizarea termenului
() ∑∏
iDXi i Pˆ X;XI .
Acest termen poate fi adaptat pentru modele TANB . Fie BT un model TANB definit prin
π(∙). Din moment ce var iabila C nu are părinți, avem ()0=∏C;CI
DPˆ . Deoarece părinții lui Ai sunt
24
definiți de π, putem stabili ()()()C,A;AI A;AIiπ i Pˆ i i PˆD D=∏ dacă π( i) > 0 ș i
()()C;AI A;AIi Pˆ i i PˆD D=∏ dacă π( i) = 0. Prin urmare trebuie să maximizăm termenul
()()()
() ()∑ ∑
0> 0=+
iπ,i iπ,ii Pˆ iπ i Pˆ C;AI C,A;AI
D D (5. 36)
Putem simplifica acest termen utilizând legea lanțului pentru informația mutuală:
()()()ZYX ZX ZYX |; I ; I ,; IP P P + = . Prin urmare putem rescrie (5. 36) astfel:
()()()
()∑ ∑
0>+
iπ,iiπ i Pˆ
ii Pˆ C|A;AI C;AI
D D (5. 37)
De observat este faptul că primul termen din (5.37) nu este afectat oricare ar fi alegerea lui
π(i) și că modelul TANB identificat prin procedeul Construcției – TANB garantează maximizarea
acestui termen și prin urmare maximizarea probabilității logaritmice.
Primul pas al procedeului Construcției – TANB are complexitatea ()NnO⋅2, iar pasul trei are
complexitatea de tipul ()nlognO2. Deoarece, de obicei, N > log n, obținem complexitatea de timp
specificată.
În lucrarea [5.5] este prezentată aplicarea acestui model pentru un set de date. Autorii
demonstrează performanța modelului TANB comparativ cu alte modele naive Bayesiene.
5.2.4 Algoritmul Bayesian Search (BS)
Acest algoritm [5.7] reprezintă o metodă de determinare a probabilităților relative ale
diferitelor structuri ale rețelelor de încredere, dată fiind o bază de date și un set de ipoteze explicite.
Se consideră problema identificării structurii unei rețele de încredere cu probabilitatea
maximă construită dintr -o bază de date.
Fie D o bază de date ce conține o serie de cazuri, Z este setul de variabile reprezentat de D ,
iar
iSBși
jSBsunt două structuri ale rețelei de încredere care conțin exact aceleași variabile care sunt
în Z.
Metoda analizată presupune calcularea rapoartelor pentru perechi de structuri de rețea, de
forma()()D|BP/D|BP
j i S S , astfel încât să putem ordona un set de structuri în funcție de
probabilitățile posterioare. Pentru a calcula raportul dintre probabilitățile posterioare, trebuie să
calculăm în prealabil ()D|BP
iS și ()D|BP
jS și să utilizăm următoarea echivalență:
()
()()
()
()
()()
()D,BPD,BP
DPD,BPDPD,BP
D|BPD|BP
ji
ji
ji
SS
SS
SS= = (5. 38)
25
Fie BS structura unei rețele Bayesiene ce conține exact aceleași variabile din Z. Ecuația de
calcul a probabilității ()D,BPS poate fi construită pe baza a patru ipoteze:
Ipoteza 1: Variabilele bazei de date D , notate cu Z , sunt discrete. Presupunând că BS conține
exact aceleași variabile din Z putem aplica ipoteza 1 astfel:
()()()()P S S PBP S S dBBPB|BfB,B|DP D,BP
P∫= (5. 39)
unde BP este un vector ale cărui valori denotă atributele de probabilitate condiționată asociate
structurii rețelei BS, iar f este funcția densitate de probabilitate a lui BP condiționată de BS. De
observat este faptul că ipoteza unor variabile discrete ne conduce la utilizarea funcției comasate d e
probabilitate P(D|B S, BP) (5.39), în locul funcției de densitate f(D|B S,BP). Integrala din (5. 39) ia în
considerare toate valorile posibile ale atributelor lui B P. Prin urmare, integrala ia în considerare toate
rețelele de încredere posibile care pot avea structura BS. Integrala reprezintă un multiplu întreg și
variabilele de integrare sunt probabilitățile condiționate asociate structurii BS.
Ipoteza 2 : Cazurile c e aparțin bazei de date sunt independente, dat fiind un model de rețea de
încredere.
Un exemplu simplu pentru care ipoteza 2 este posibilă este bine cunoscuta aruncare a unei
monede. Dacă se știe cu certitudine că moneda este una normală (sunt 50% șanse s ă cadă pe oricare
parte), atunci faptul că la prima aruncare (cazul 1) rezultatul este „cap”, nu influențează convingerea
noastră că la cea de -a doua aruncare (cazul 2) rezultatul va fi tot „cap”.
Dată fiind ipoteza 2, putem rescrie ()D,BPS astfel:
() ()()() ∫∏
=
1=PBP S S Pm
hP S h S dBBPB|Bf B,B|CP D,BP (5. 40)
unde m este numărul de cazuri din D iar C h este cazul h din D .
Ipoteza 3 : Nu există nici un caz care să conțină variabile cu valori lipsă.
Ipoteza 3 nu este în general valabilă pent ru bazele de date reale, unde deseori există valori
lipsă. Totuși această ipoteză facilitează aplicarea metodei de bază pentru calculul ()D,BPS .
Ipoteza 4 : Funcția de densitate f(BP|BS) din ecuațiile (5.39) și (5.40) este uniformă.
Fie structura unei RB (figura 5 .22) notată cu B S1, construită din baza de date D (tabelul 5.8).
Fig. 5.22 Structura unei rețele Bayesiene, notată cu BS1
Vom reprezenta variabilele părinți ai lui X i sub forma unei liste de variabile, notate cu π i.
Vom utiliza w ij pentru a evidenția instanța unică j a valorilor variabilelor din π i, ținând cont
de ordonarea cazurilor în D . wij reprezintă o valoare sau o instanță din π i. Spre exemplu, considerăm
nodul x2 din BS1 împreună cu valorile acestuia din tabelul 3.1. Nodul x1 este variabila părinte a lui x1 x2 x3
26
x2 în BS1, prin urmare π 2=(x1). În acest exemplu, w 21=prezent , deoarece în tabelul 5.8, prima
valoare unică a lui x1 este valoarea prezent , iar w 22=absent , deoarece cea de- a doua valoare unică a
lui x 1 este valoarea absent .
Tabel ul 5.8 Exemplu de bază de dat e.
Cazuri Valorile variabilelor pentru fiecare caz în parte
x1 x2 x3
1 Prezent Absent Absent
2 Prezent Prezent Prezent
3 Absent Absent Prezent
4 Prezent Prezent Prezent
5 Absent Absent Absent
6 Absent Prezent Prezent
7 Prezent Prezent Prezent
8 Absent Absent Absent
9 Prezent Prezent Prezent
10 Absent Absent Absent
Prin introducerea unor notații suplimentare vom facilita aplicarea ipotezelor precedente.
Date fiind cele patru ipoteze, putem concluziona următoarele.
Fie Z un set de n variabile discrete, unde o variabilă x i în Z are r i valori posibile atribuite ( vi1,
…,
iirv). Fie D o bază de date cu m cazuri, unde fiecare caz conține o valoare atribuită pentru fiecare
variabilă din Z. Fie B S notarea unei structuri a rețelei Bayesiene ce conține exact aceleași variabile
din Z. Fiecare variabilă xi din BS are un set de părinți notat cu π i. Fie w ij notația valorii unice j din
πi. Presupunând că există qi valori unice a lui π i, se definește Nijk ca fiind numărul de cazuri din
D în care variabila xi are valoarea vik iar π i are valoarea w ij.
Dacă ∑
1==ir
kijk ij N N și ținând cont de cele patru ipoteze putem scrie:
()()()
()∏ ∏∏
1= 1=1= 1−+1−=i i r
kijkn
iq
j i iji
S S Nr NrBP D,BP !!! (5. 41)
Prin maximizarea lu i P(BS, D) pentru toate structurile B S asociate bazei de date putem
identifica structura cu probabilitatea maximă.
Fie Q setul de structuri de rețele Bayesiene ce conțin exact aceleași variabile ca și setul Z,
asociate bazei de date D , putem determina
()()
()∑
∈=
QBSS
S
Si
iD,BPD,BPD|BP (5. 42)
5.2.5 Algoritmul PC
Una dintre cele mai cunoscute și utilizate proceduri bazate pe restricții este și algoritmul PC.
Acest algoritm este de fapt o metodă cu pas înapoi , care preia ca și date de intrare baza de date D
împreună cu un set de variabile K și oferă la ieșire un graf hibrid denumit și graf aciclic direcționat
27
parțial (GADP). Fiabilitatea și corectitudinea acestui algoritm au fost demonstrate pe baza unor
ipoteze în lucrarea [5.8].
Principalii pași ai algoritmului PC sunt:
1. Identificarea structurii grafului nedirecționat.
Algoritmul PC pornește de la un graf complet nedirecționat, adică un graf în care toate
nodurile sunt conectate între ele. Având în vedere un anumit nivel de semnificație ales și o ordinare specifică a variabilelor, algoritmul PC efectuează teste statistice pentru a decide dacă să îndepărteze
sau să mențină laturile dintre perechile de noduri din graf.
În detaliu, algoritmul PC verifică relațiile marginale și condiționate dintre nodurile adiacente,
i și j, dat fiind un set de variabile condiționat S, de creștere a cardinalității.
Pentru datele categorice, algoritmul efectuează teste statistice similare cu χ
2. Mărimea de
ieșire din acest prim pas este structura grafului nedirecționat cu reprezentarea tuturor nodurilor și a
laturilor.
2. Identificarea structurilor de tip V.
În cel de- al doilea pas al algoritmului se identifică structurile de tip V prin analiza
rezultatelor testelor. Dacă două variabile aleatoare Xi și Xj au rezultat ca fiind necondiționat
independente dat fiind un subset S ij=X y atunci rezultă o structură de tip V (fig ura 5 .23a), în caz
contrar, laturile rămân nedirecționate (fig ura 5 .23b).
Fig. 5.23 Structură de tip V (a); Structură nedirecționată (b)
Mărimea de ieșire din acest pas este identificarea unui GADP.
3. Transformarea GADP rezultat din pasul 2, într -un GAD.
În acest ultim pa s, toate legăturile nedirecționate sunt orientate fără a produce structuri de tip
V adiționale sau cicluri.
În ultimii ani, algoritmul PC a devenit un punct de referință și un standard de excelență
pentru dezvoltarea de noi strategii bazate pe restricții. Motivul principal se datorează fiabilității
demonstrate a algoritmului [5.8 ]. O variantă a algoritmului PC este reprezentată de algoritmul căii
condiționate necesare ( Necessary Path Condition – NPC ) [5.9] , ce urmărește în mod eficient
rezolvarea problemel or provenite din seturi limitate de date.
b. a. i y j i y j
28
5.2.6 Algoritmul Essential Graph Search (EGS)
A lucra direct cu GAD -uri poate fi uneori nefavorabil datorită netrasabilității, mai ales a
resurselor temporale implicate. Soluția prezentată de algoritmul EGS, este bazată pe reducerea
complexității prin utilizarea claselor echivalente a GAD -urilor.
În timp ce algoritmul BS se bazează, în esență, pe o procedură de căutare și ierarhizare
pentru a detecta domeniul structurilor de rețea sau GAD -uri, algoritmul EGS [5.10 ] identifică inițial
o structură grafică esențială care să conțină atât arce orientate cât și neorientate și care să nu formeze
cicluri direcționate.
Esența algoritmului EGS , care permite generarea unei structuri de rețea corespunzătoare
bazei de date, este reprezentată în figura 5.24 luând în considerare următoarele ipoteze:
• P(α) este distribuția nivelului de semnificație α, 0<α<1;
• I(x,y|Mbs) este un test de independență condiționată pentru fiecare două noduri x și y
dat fiind Mbs;
• order (M) specifică ordinea în care independențele condiționate dintre x și y trebuie
verificate;
• n este un integrator;
• m reprezintă numărul de conversii aleatorii a EGS în Mbs (GAD -uri);
• EG este un graf esențial;
• PC este algoritmul utilizat pentru identificarea E G corespunzător grafului cauzal
generat de baza de date.
Fig. 5.24 Algoritmul EGS simplificat
29
Multe variații ale acestui algoritm sunt posibile. Datorită faptului că valoarea metrică
utilizată nu este invariantă față de GAD -urile din aceeași clasă de echivalență, poate fi mai rezonabil
să se genereze și să memoreze toate GAD -urile posibile, decât să se aleagă aleatoriu un singur GAD .
O altă posibilitate este utilizarea unei funcții de ierarhizare care este invariantă indiferent de
transformările claselo r de echivalență.
5.2.7 Algoritmul Greedy Thick Thinning (GTT)
Abordările algoritmice pentru rezolvarea problemelor de tip NP – hard se împart în două mari
categorii: categoria algoritmilor euristici bazați pe tehnica căutării și ierarhizării structurilor de rețea
și categoria algoritmilor deterministici care au la bază considerațiile statistice asupra setului supus
învățării.
Unul dintre cei mai performanți algoritmi din categoria deterministă este algor itmul GTT
[5.11]. Plecând de la un graf complet, algoritmul GTT se folosește de algoritmul PC, pentru a reduce numărul arcelor în baza testelor de independență condiționată.
Următorul pas pe care algoritmul GTT îl face este de a adăuga și apoi a înlătura arce, notând
și evaluând fiecare rețea după fiecare modif icare utilizând un set de date euristice pentru a evita
convergența prematură.
Scopul fi nal al acestui algoritm este de a identifica structura de rețea optimă care totodată să
ia în considerare minimizarea metricii rețelei.
5.3 Criterii de selecție a RB
În literatura de specialitate sunt prezentate două mari categorii de tehnici pentru învățarea
structurii unei RB.
• Tehnici bazate pe restricții – ce presupun stabilirea unei structuri care să conțină
restricții de independență corespunzătoare celor detectate în baza de date;
• Tehnici de selecție – ce presupun detectarea structurii care poate reprezenta o
distribuție de probabilitate corespunzătoare bazei de date, sau generată de aceasta;
Problema identificării unei structuri optime de RB este una dificilă datorită faptului că
numărul de structuri de rețea crește exponențial în funcție de numărul variabilelor. Operațiile de inferență presupun:
• Calcularea probabilităților a posteriori pentru o variabilă asupra căreia nu s -au făcut
observații dată fiind o evidență;
• Calcularea celei mai probabile stări comune pentru toate variabilele asupra cărora nu
există observații ≡ cea mai probabilă explicație ( CPE );
• Calcularea celei mai probabile stări comune pentru o parte dintre variabilele asupra
cărora nu există observații ≡ atribuirea maximă a posteriori ( AMP );
• Calcularea celei mai relevante explicații parțiale a evidențelor ≡ cea mai relevantă
explicație ( CRE ).
30
La modul general, dată fiind o bază de date T={y1,…, yN} și o funcție de selecție ϕ , învățarea
unei R B presupune identificarea unei RB nBB∈ care să maximizeze valoarea ϕ( B, T).
Optimizarea lui ϕ implică o căutare euristică și metaeuristică într-un spațiu restricționat
definit de structurile rețelei, clasele de echivalență ale acestor structuri și asocierea cu variabilele
rețelei.
În ceea ce privește alegerea algoritmilor pentru realizarea acestei căutări pot fi utilizați unii
dintre cei mai cunoscuți precum: metoda urcării rapide a pantei , metoda asocierilor simulate ,
algoritmi genetici sau căutarea tabu.
Funcțiile de selecție sau criteriile de ierarhizare ce permit selectarea rețelei optime care să
corespundă bazei de date atașate sunt prezentate în ceea ce urmează.
• Criteriul Bayesian: pur Bayesian ( B), Bayesian Dirichlet ( BD) [5.12], tipul K2 [5.13],
Bayesian Dirichlet luând în considerare probabilitatea echivalentă și structura posibilă ( BDe)
[5.12], criteriul de selecție BDeu (o formă a criteriului BDe) [5.14];
• Criterii de selecție ce au la bază informația teoretică: probabilitatea logaritmică ( PL),
lungimea descrierii minime/ criteriul informațional Bayesian LDM/CIB , criteriul
informațional Akaike ( CIA), probabilitatea minimă normalizată ( PMN ), teste de informație
mutuală ( TIM ), etc.
Pentru o mai bună înțelegere și pentru a putea compara aceste criterii de selecție sunt
necesare următoarele detalii:
• Criteriul de selecție B presupune calcularea P( B|T) pentru toate rețelele pos ibile și selectarea
acelei rețele cu probabilitatea a posteriori maximă; luând în considerare avantajul lucrului în
spațiul logaritmic se preferă utilizarea lui log(P( B|T)) și nu a lui P( B|T).
• Criteriul de selecție BD este definit ținând cont de o serie de ipoteze importante, prezentate
în [5.12 ], și poate fi calculat cu relația:
∏∏∏
1=1=1=
+ ⋅⋅+ ⋅=
ii
r
kijk ijk ijkn
iq
jij ij ij
NΓ N NΓN NΓ NΓ B TB
))] (/) (()) (/)([( )(P),(P
' '` '
(5. 43)
)| , (P' 'Gw XΠx X N Nij i ik i ijk = =×=
unde Γ este funcția Gamma, P( B) este probabilitatea a priori a rețelei B, r i este numărul de stări ale
variabilelor aleatoare X i, i=1, …, n; q i, Nij, date de relația (5.44), reprezintă numărul configurațiilor
posibile a setului de părinți iXΠ a lui X i, și numărul de apariții în baza de date T unde variabilele
din iXΠ iau configurația corespunzătoare valorii j, wij(1 ≤ j ≤ qi) și respectiv, Nijk este numărul de
apariții în baza de date T unde variabila Xi ia cea de- a k valoare xik și variabilele din iXΠ iau cea
de-a j configurație wij.
∑∏
1= ∈= =i
iX jr
kijk ij
ΠXj i N N r q (5. 44)
Un nou criteriu de selecție BD este prezentat în [5.15]
31
∑∑∑
1=1=1=
+ +++ + =
ii
r
kijk ijk ijkn
iq
jij ij ij
NΓ N NΓN NΓ NΓ B TB
)]} (/) ( log[)] (/()( {log[ ))(Plog(),(BD
' '' '
(5. 45)
• Criteriul de selecție K2 este un caz specific ce aparține criteriului BD:
∑∑∑
1=1=1=
++1−+1− + =2
ii
r
kijkn
iq
ji ij i
Nr N r B TBK
)}! log(])! /()! {log[( ))(Plog(),(
(5. 46)
considerând 1='
ijkN corespunzător unei situații cu zero înregistrări.
• Criteriul BDe [5.12] are aceeași formă cu cea prezentată în (5.43).
Diferența este dată de prezența unor noi ipoteze în comparație cu
BD: probabilitatea echivalentă și posibilitatea structurii.
Prima ipoteză stabilește faptul că două GAD -uri sunt echivalente dacă conțin distribuții
comune de probabilitate. Dată fiind RB B, baza de date T poate fi văzută drept ca un set
multinominal a spațiului comun D cu parametrii
n ir x Θi i x x Dn,…, , ,…., } θ{…… 1∈1= =
1
unde ∏1==
1n
iΠx x xix i n | ,…. θ θ
Acest aspect este bazat pe ipotezele criteriului de selecție BD: dat fiind un GAD G astfel
încât P( G)>0 atunci Θij este distribuit Dirichlet pentru toate Θ ij din Θ G. Date fiind două GAD -uri, G
și G’ astfel încât P( G)>0 și P(G')>0, dacă G ș i G’ sunt echivalente, atunci ρ(Θ D|G) = ρ (ΘD|G').
Cea de- a doua ipoteză ia în calcul faptul că pentru oricare GAD complet G avem P( G)>0 (un GAD
este complet dacă structura scheletului este completă).
În final, criteriul de selecție BDe este dat tot de (5.43) considerând faptul că ρ(Θ D|G) este
Dirichlet cu un set echivalent de dimensiune N’ pentru un GAD complet din D . de acestă dată, în
(5.43), dimensiunea setului echivalent N’ arată gradul de încredere în distribuția a priori.
• Criteriul de selecție BDeu [5.14] este un caz particular al BDe și este dat de
∑∑∑
1=1=1=
+ ++ + + =
ii
r
kii ii ijkn
iq
ji ij i
qrNΓqrN NΓqN NΓqNΓ B TB
)]} /(/) / ( log[)]/ (/)/( {log[ ))(Plog(),( BDeu
' '' '
(5. 47)
Dacă ( )()ii ij i ik i qr Gw X x XP / | , 1== =∏ . Criteriul BDeu este dependent de un par ametru și
anume dimensiunea echivalentă a setului de date N’ care trebuie să fie selectat cu atenție și repetat.
32
• În ceea ce privește tipul informațiilor teoretice ale criteriilor de selecție, utilitatea și
complexitatea acestora nu poate fi cuprinsă în paginile acestei teze. O scurtă prezentare a
metodei testării informației mutuale ( TIM ) este descrisă în continuare datorită interesului pe
care în prezintă [5.16], [5.17], [5.18 ].
În esență informația mutuală între două variabile Xi și Xj este descrisă de:
∑∑=
i j x xj i i j i j i x x x xx XX )](P)(P/((Plog[),(P ),(MIT (5. 48)
Criteriul TIM [5.17 ] este dat de:
∑ ∑
≠1= 1=
− 2=n
Πis
jj i X i
ΦiXi
iil ΠXNI TB)(σ α*,χ ) ;( )|(MIT (5. 49)
unde I(Xi; ПXi) este informația mutual între Xi și ПXi în RB ce măsoară relația dintre fiecare
variabilă și părinții acesteia. Cel de- al doilea termen reprezintă penalizarea asociată testului de
independență Pearson χ2, α este un parametru liber care arată nivelul de încredere relativ la testele
statistice, ))(σ),…,(σ( σ* * *
i i i i s1= denotă orice permutare a setului index (1, …., s i) a variabilelor din
ПXi = (Xi1, …., X isi) cu
)(σ )(σ )(σ* * * …
ii i i si i ir r r ≥≥≥2 1
unde rij este numărul de configurații posibile când setul părinte a lui Xi este limitat doar lui X j.
Gradul de libertate )(σ*j iil corespunde
1= 1−1−2= 1−1−
=∏1−
1=
j r rs j r r r
l
j i ij
ki ki j i i
j i
ii i
i) )( (,…, ) )( (
)(σ)(σ )(σ
)(σ
** *
* (5. 50)
5.4 RB pentru calcularea indicatorului de fiabilitate LOLP
Acest studiu de caz a fost inițiat în cursul derulării unui stagiu de cercetare în cadrul
programului Erasmus+ împreună cu doi membri ai departamentului de informatică a Universității
din Aalborg, Danemarca.
O parte din rezultatele acestui studiu (fig ura 5 .25) sunt disponibile pe pagina oficială a
companiei Hugin și pot fi accesate http://demo.hugin.com/example/PowerRenewables .
În lucrarea [5.19], este prezentată importanța RB în domeniul modelării puterii nodale din punct de vedere calitativ, cu intenția de a detecta și disponibilitatea resurselor regenerabile: panouri solare și
turbine eoliene.
În prezentul studiu de caz, am analizat o parte a acestei rețele electrice ( figura 5 .26), ce este
alimentată din surse regenerabile, luând în considerare sarcina (L), posibilele defecte ale
componentelor din amonte, scurtcircuite și de asem enea și fiabilitatea corelată a surselor: S – iradiație
solară și W – viteza vântului.
33
Fig. 5.25 Pagina de start a modelului Bayesian pentru analiza disponibilității surselor regenerabile de pe site -ul
companiei Hugin
Pentru implementarea modelului de R B pentru analiza disponibilității în alimentare a
consumatorilor și implicit a riscului de întrerupere în alimentare, doar din surse regenerabile (solare
și eoliene), am utilizat informații ale experților din domeniu, informații din literatura de specialitate
specifică și o bază de date ce cuprinde valori ale vitezei vântului și ale iradiației solare.
Baza de date provine de la o stație meteorologică prof esională, aflată în apropierea
Laboratorului de C ercetare Aplicată și Realizare Prototipuri – LACARP, d in cadrul departamentului
de Inginerie Energetică al Universității Tehnice ”Gheorghe Asachi”, din Iași.
Stația a înregistrat informații despre parametrii climatici la intervale de un minut. Baza de
date utilizată în studiul de caz conține informațiile colectate de stația meteorologică pe o perioadă de
5 luni din anul 2013.
34
Fig. 5.26 Rețeaua electrică de referință considerată pentru analiza riscului de întrerupere în alimentare:S – sursa solară,
W- sursa eoliană, R – întrerupător, G – rețeaua electrică locală
Pentru procesarea datelor, generarea de modele și calculele de probabilitate am utilizat ca și
instrument pachetul informatic Hugin Expert.
Ca și punct de plecare, pentru a putea dezvolta modelul de rețea, am construit în figura 5.27
o structură inițială a RB.
Fig. 5.27 Structura inițială a RB
Plecând de la figura 5.27, am utilizat pachetul Hugin pentru a construi un model unde:
• W (Sursa eoliană) a fost introdusă drept funcție de distribuție de probabilitate pentru
viteza vântului (tipul și parametrii rezultând din baza de date);
• S (Sursa solară) a fost introdusă drept funcție de distribuție de probabilitate pentru
iradiația solară (tipul și parametrii rezultând din baza de date);
35
• PW (Puterea provenită din sursa eoliană) reprezintă puterea generată de o turbină
eoliană cu o putere nominală de 10 kW. Puterea generată ca funcție a vitezei vântului
este dată de (5.51)
≤≤≤≤−−×
=−−
−−
else other0for Pfor) ( P
)(PWoff cut rated ratedrated in cut
in cut ratedin cut rated
ww www ww www
w
(5. 51)
• PS (Puterea provenită din sursa solară) reprezintă puterea generată de un panou solar
cu o putere nominală de 10 kW. Puterea generată ca funcție a iradiației solare este dată de (5.52);
S PS ××××=pc f m m NP N A (5.52)
unde: Am este aria panoului solar, N m este eficiența modulului de referință (considerată 0,11), Pf
este factorul de ambalare (considerat 0,9), N pc este eficiența condiționată a puterii (considerată
0,86), și S este iradiația solară înregistrată în baza de date.
• PR (Puterea generată de sursele regenerabile) calculată prin însumarea variabilelor PW și PS;
• PL (Sarcina) reprezintă puterea cerută de cons umatori și este exprimată în p.u luând
în considerare puterea nominală;
• LOLP (Probabilitatea de întrerupere a alimentării) este calculată ca fiind
probabilitatea ca PR < PL.
Rețeaua a fost construită prin inserarea bazei de date cu informații despre vitez a vântului și
iradiația solară în programul informatic utilizat, așa cum este prezentat în fig urile 5.28 ș i 5.29.
Fig. 5.28 Inserarea bazei de date în Hugin Expert
36
Fig. 5.29 Inserarea fișierului cu baza de date pe 5 luni
Datele au fost procesate, iar variabilele au fost discretizate în clase de variabile pentru a
minimiza numărul de stări ale acestora în tabelul de probabilități condiționate (TPC) corespunzător.
După procesarea bazei de date a fost necesară stabilirea unor constr ângeri între variabile așa
cum este prezentat în figura 5.30.
Fig. 5.30 Stabilirea constrângerilor în RB
Software -ul Hugin Expert are capacitatea de a învăța din datele inserate, utilizând algoritmi
de învățare specifici, pentru identificarea structurii GAD -ului care defineș te cel mai bine seturile de
relații de dependență sau independență condiționate, care reies din baza de date prin teste statistice.
În acest model am utilizat algoritmul NPC, pentru învățarea structurii, algoritm care
introduce conceptul de latură ambiguă. Când utilizăm un algoritm bazat pe constrangeri pentru învățarea structurii unei RB, este
important să decidem asupra unui nivel de semnificație α, care va fi utilizat în realizarea testelor
statistice.
37
Pentru acest studiu de caz, am utilizat nivelul α = 0.05, astfel algoritmul NPC a realizat o
secvență de teste statistice pentru perechi de variabile condiționat independente.
În esență, acest algoritm spune: pentru ca două variabile ”WindSpeed” și “SolarRad” să fie
condiționat independente față de un set minimal “Date, Time, DayType”, trebuie să existe o cale
între “WindSpeed” și fiecare “Date, Time, DayType” (care să nu treacă prin “SolarRad”) și între
“SolarRad” și fiecare “Date, Time, DayType” (care să nu treacă prin “WindSpeed”) , așa cum este
prezentat în fig ura 5.31.
Fig. 5.31 Algoritmul NPC în Hugin Expert
Mai mult decât atât, algoritmul se asigură că orice neconformitate din rezultatele obținute să
fie raportată utilizatorului, astfel încât, cel din urmă poate decide asupra menținerii sau excluderii
unor laturi ambigue din rețea.
RB generată conține variabilele descrise în baza de date. Pentru a putea calcula indicatorul de
fiabilitate LOLP, a fost necesară introducerea unor noduri auxiliare, noduri cu stări și valori
constante precum: Vr, Pr, Am, Nm, Pf, Npc și Load Power.
Valorile pentru nodul ”Load Power” au fost luate în conformitate cu Sistemul Test de
Fiabilitate și au fost inserate în TPC -ul corespunzător.
Variabilele “WindPower”, “SolarPower”, “RenewablesPower” și “LOLP” sunt dependente
condiționat de alte noduri și au fost calculate prin inserarea în programul software a ecuațiilor (5.51)
și (5.52) sub următoarea formă:
• Pentru calculul nodului “WindPower”
if (and (w cut-in < WindSpeed, WindSpeed < Vr), Pr * ((WindSpeed – wcut-in) / (Vr – wcut-in)), if
(and (WindSpeed > Vr, WindSpeed < w cut-off), Pr, 0))
unde: Vr = wrated = 7 m/s; WindSpeed = w (database); wcut-in = 4 m/s; w cut-off = 20 m/s and Pr = P rated
= 10 kW.
• Pentru calculul variabilei “SolarPower”
if (SolarRad > 0, A m * N m * P f * N pc * SolarRad, 0)
38
Pentru calculul variabilei “RenewablesPower” sau însumat valorile celor două surse de
putere menționate mai sus, iar pentru stabilirea valorii indicatorului “LOLP” sau comparat valorile
puterii generate din surse regenerabile și puterea cerută de consumatori.
Structura învățată a RB generată de software -ul Hugin Expert este prezentată în fig ura 5.32.
Fig. 5.32 Structura învățată a RB generată de software- ul Hugin Expert
Ideea de bază a acestui studiu de caz a fost de a vedea dacă, când și în ce condiții două surse
cumulate de energie regenerabilă pot satisface cererea de energie.
Producția maximă de energie din panoul solar corespunde unei puteri cuprinse între 1,5 – 2
kW, cu o probabilitate de 36% și este obținută atunci când iradiația solară depășește 244 W/m2.
Turbina eoliană generează o putere maximă de 9 – 10 kW, cu o probabilitate de 32%, atunci
când viteza vântului atinge pragul de 7 m/s.
Valori mai mari ale vitezei vântului și ale radiației solare produc aceeași can titate de energie,
dar cu probabilități mai ridicate.
Combinate, aceste două surse de putere pot produce suficientă energie pentru a satisface
cererea doar atunci când turbina eoliană sau ambele surse ating producția maximă de energie.
5.5 Utilizarea RBD pentru prognoză meteo și evaluarea disponibilității resurselor
regenerabile
Detectarea tiparelor temporale din date meteorologice este o sarcină dificilă datorită lipsei de
cunoaștere a dependențelor dintre parametri. Parametrii climatici nu sunt doar variabile pur aleatorii,
ci și dependențele dintre aceștia sunt aleatorii. De aceea, prognoza meteo păstrează întotdeauna atributul "probabil" chiar și pentru intervale scurte de timp.
RBD pot fi folosite pentru a extinde capacitatea RB pen tru c alculele de încredere legate de
procesele cu schimbare dinamică.
În principiu există două tehnici pentru analiza unui proces dependent din punct de vedere
temporal:
39
• Abordarea de tip segmentare a timpului constând în captarea stărilor procesului în
evoluție în pași de tim p, așa cum este ilustrat în figura 5.33;
• Descompunerea RB în modele sau submodele identice multiplicate pentru fiecare etapă de timp a șa cum este detaliat în figura 5.34.
Fig. 5.33 RBD pentru modelarea evoluției unui proces în
pași de timp Fig. 5.34 RB multiplicată temporal
În lucrarea [5.20], autorii au utilizat o versiune adaptată a RBD comparativ cu ce este
prezentat în lucrarea [5.21 ], versiune ce a fost implementată în programul specializat Genie [5.22],
[5.23].
5.5.1 Baza de date cu parametrii climatici
Informațiile despre parametrii climatici au fost înregistrate minut de minut, timp de 4 ani,
2013 – 2016, cu ajutorul unei stații meteorologice profesionale Davis de tip Vintage Pro2 Plus.
Stația a colectat informații despre 9 parametri climatici, simpli și compuși, prezentați în tabelul 5.9,
și a adunat în cei 4 ani peste 1.8 milioane de rânduri de date printre care se regăsesc inevitabil și
erori sau valori lipsă.
Prin urmare, a fost necesară o curățare a datelor, înlocuiri cu valoarea zero, valori medii sau
similare prin utilizarea unor diferite tehnici robuste, pentru evitarea luării în calcul a înregistrărilor
eronate și pentru păstrarea unei precizii acceptabile a rezultate lor finale.
De asemenea s -a realizat și o procedură de discretizare a datelor, în scopul identificării
structurii RB. Pasul de timp 1
Pasul de timp 2
Pasul de timp n
Pasul de timp n Pasul de timp 1
Pasul de timp 2
40
Tabelul 5.9 Indicatori înregistrați pentru prognoza meteorologică
Parametrii climatici și acronime în
RBD (variabile aleatorii) Precizia Valori limită Unități de
măsură
Evapotranspirație – ET (ET) 5% 0 – 19999.9 mm
Presiune barometrică– Bar (B) 0.8 mm Hg
1.0 mb 410 – 820 mm Hg
540 – 1100 mb mm Hg
mb
Umiditatea exterioară – Out humid
(OU) 3% 0% – 100% %
Iradiația solară – Solar rad (SR) 5% 0 – 1800 W/m2
Temperatura exterioară –Temp out
(TO) 0.5 -40 – +65 0C
Viteza vântului – Wind speed (WS) 5% 1 – 67 m/s
Indice de încălzire – Heat index (HI) 1.5 -40 – +74 0C
Indice temperatură, umiditate, vânt –
THW index (THW) 2 -68 – +64 0C
Indice temperatură, umiditate, radiație,
vânt –THSW index (THSW) 2 -68 – +64 0C
5.5.2 Crearea structurii RB utilizând algoritmul Bayesien Search (BS)
În literatura de specialitate există foarte multe metode de învățare ce pot fi utilizate pentru
identificarea unei structuri optime de RB pentru o bază de date.
Una dintre cele mai simple metode de învățare este algoritmul prezentat în detaliu în
raport ul de cercetare anterior. Esența acestui algoritm este bazată pe identificarea celei mai
probabile structuri de RB, dată fiind o bază de date, prin calcularea probabilității P(Mbs|Md).
Se consideră următoarele ipoteze:
– Algoritmul compară două sau mai multe structuri de RB, (Mbs i, Mbs j, Mbs k, …),
generate de aceeași bază de date Md și calculează probabilitatea condiționată în
funcție de regula fundamentală de probabilitate:
), (), (
)(/), ()(/), () () (
Md MbsPMd MbsP
MdP Md MbsPMdP Md MbsPMd MbsPMd MbsP
ji
jiji
= ==
(5.53)
– Baza de date unică M include variabilele meteorologice:
} , ,,,,, ,,{ THW THSWHWSTOSR OUBET M≡
care sunt variabilele dependente condiționate ale Mbs.
– Un rând de variabile din baza de date reprezintă un caz.
– Cazurile sunt presupus e a fi condiționat independente așa cum este exprimat în
ecuația (5.54)
P PMbsm
vP v dMbs MbsP Mbs Mbsf Mbs MbsCP Md MbsP
P) () ( ) , ( ), (∫∏ ×
=
1= (5. 54)
– Variabilele continue înregistrate au fost discretizate în 4 clase de variație și nu includ valori lipsă.
41
Pe baza acestor ipoteze, algoritmul calculează probabilitatea
∏∏ ∏
== =−+−=n
iq
jr
kijk
i ijii i
Nr NrMdP Md MbsP
1 1 1!)!1 ()!1()( ), ( (5. 55)
unde
– n este numărul de variabile discrete xi;
– fiecare variabilă are ri valori (v i1, vi2, …., v iri);
– qi este valoarea instantanee unică a setului de variabile părinți π i a variabilei x i în
Md;
– Nijk este numărul de cazuri din Md în care variabila x i are valoarea v ik, pe când setul
de variabile π i este instanțiat ca w ij;
∑
==jr
kijk ij N N
1 (5. 56)
Algoritmul identifică structura optimă reducând numărul de structuri posibile
considerând informațiile a priori egale P(Mbs) = C în Mbs și maximizând P(Mbs|Md). Astfel
ecuați a (5.3) devine
∏∏ ∏
1=1= 1=1−+1−=n
iq
jr
kijk
i iji
d bsi i
Nr NrC M MP !)! ()! () , (
(5. 57)
Maximum din P(M bs|Md) semnifică maximum din cel de -al doilea produs:
∏∏ ∏
1= 1= 1=
1−+1−=n
iq
jr
kijk
i iji
πd bsMi i
i bsNr NrC M MP !)! ()! (max ) , ( max (5. 58)
5.5.3 Structura RB furnizată de baza de date
În fig ura 5.35 este prezentată o mostră a bazei de date ce conține 10 cazuri pentru 9
variabile meteorologice din Md . Pentru a putea aplica algoritmul , a fost necesară discretizarea
valorilor variabilelor.
Testele realizate au demonstrat că structura RB este dependentă de an sau chiar de luna
din an, ceea ce conduce la întâmpinarea unor dificultăți în stabilirea unei structuri finale. În
vederea soluționării acestui aspect, s -a apelat la opinia experților climatologi, astfel putându -se
valida o structură finală corespunzătoare bazei de date și care totodată să minimizeze erorile.
a)
42
b)
Fig. 5.35 Variabilele meteo rologice înregistrate în baza de date în formă continuă (a) și în formă discretizată (b)
Structura RB construită pentru întreaga bază de date pe 4 ani este prezentată în fig ura
5.36.
Fig. 5.36 Structura RB generată de algoritmul
Algoritmul arată că v ariabila „ET” este condiționat independentă față de restul
variabilelor, pe când „Heat index” este considerată a fi variabilă marginală.
Dată fiind independența condiționată a variabilei „ET”, în continuare aceasta a fost
eliminată din calcule.
În figura 5.37 sunt reprezentate probabilitățile condiționate ale claselor de variabile
pentru primul pas de timp.
Fig. 5. 37 Probabilitățile condiționate pentru clasele de variabile meteorologice pentru primul pas de timp
Un aspect important în construcția unei RB este verificarea erorilor, ce implică abordarea
unei proceduri inversate: verificarea structurii RB rezultate cu baza de date.
43
Există o varietate de tehnici pentru realizarea acestei verificări, iar una dintre cele mai
simple este realizată în acest caz, prin verificarea aleatorie a rezultatelor obținute în RB
considerând drept evidență n- 1 variabile și constatând că cea de-a n a variabilă (THSW în figura
5.38) are aceeași valoare ca și în baza de date.
Fig. 5.38 Setarea aleatorie a evidențelor pentru n -1 variabile și verificarea valorii variabilei n (THSW)
O metodă mai elegantă pentru verificarea erorilor ar fi prin utilizarea metodelor specifice
bazate pe:
• Precizia generală, care este un rezultat numeric (%) ce arată numărul de
înregistrări care au fost corect estimate de rețea din numărul total; pentru RB din figura 5.36, precizia maximă a fost 0.8553 pentru viteze ale vântului cuprinse
între 10 – 12 [m/s] (clasa s3) și 0.5416 pentru o iradiație solară mai mare de 684
[W/m
2] (clasa s4);
• Matricea de confuzie [5.24] arată același rezultat în ceea ce privește numărul de înregistrări corect și incorect clasificate;
• Caracteristica de funcționare a receptorului – CFR pentru fiecare stare a fiecărei
clase de variabile [5.24]. Figura 5.39 prezintă CFR pentru clasa s3 a vitezei
vântului și valoarea asociată pentru ZSC – Zona sub CFR, în timp ce fig ura 5.40
include aceeași informație, dar pentru clasa s4 a iradiației solare;
• Caracteristica de calibrare ar putea reprezenta o măsură importantă a performanțe i
a unui model probabilistic [5.24].
44
Fig. 5.39 CFR pentru clasa 3 [10 -12 m/s] a vitezei vântului și ZSC=0.7298
Fig. 5.40 CFR pentru clasa 4 [ ≥684 W/m2] a radiației solare și ZSC=0.6974
5.5.4 Analiza rețelei Bayesiene dinami ce – RBD
O analiză în pași de timp pentru o RB este o sarcină complexă din punctul de vedere al
timpului de calcul și a resurselor computerizate chiar și în cazul unei rețele rela tiv simple cum
este cea din figura 5.36.
45
RBD creată a fost analizată timp de câteva luni, datorită unor limitări ale calculatorului,
în special memoria. În lucrarea [5.20], a fost utilizat un calculator Intel® Core™ i3- 2120 CPU
@ 3.30 GHz, sistem de operare pe 64- bit, procesor x64 cu 4.00 GB RAM.
RB din figura 5.36 a fost generată utilizând înregistrările din întreaga bază de date pe
când RB din figura 5.41 s-a obținut prin utilizarea tehnicii indicate în fig ura 5.34 pentru 5 pași de
timp.
Iradiația solară și viteza vântului au fost variabilele ț intă în acest caz, pentru care în fig ura
5.42 sunt afișate probabilitățile dinamice ale claselor corespunzătoare.
Fig. 5.41 RB nerulată pentru primul pas de timp
Aceste probabilități condiționate dependente de timp pentru resursele regenerabile permit
calcularea puterii corespunzătoare generate de sursele regenerabile.
Detalii în ceea ce privesc probabilitățile dinamice ale vitezei vântului și respectiv ale
iradiației solare sunt prezentate în fig urile 5.43 ș i 5.44.
Puterea generată de sursa eoliană poate fi calculată cu ecuația următoare:
][213WvAc Pwind ⋅⋅⋅=ρ
(5. 59)
unde c este eficiența generatorului, ρ este densitatea aerului [kg/m3], A este aria în care vântul
este perpendicular pe generator [m2], iar v este viteza vântului [m/s].
46
Fig. 5.42 Probabilitățile condiționate dinamice pentru iradiația solară și viteza vântului generate de RBD
Pentru un panou solar, puterea generată poate fi calculată astfel:
][p r solar WPHrS P ⋅⋅⋅= (5. 60)
unde S este suprafața totală a panoului solar [m2], r este eficiența panoului solar [%], H este
iradiația solară [W/m2], P r este raportul performanței (cuprins între 0,5 și 0,90).
Fig. 5.43 Prob abilitățile condiționate pentru clasele vitezei vântului pentru primele 5 luni din 2016
47
Fig. 5.44 Probabilitățile condiționate pentru clasele iradiației solare pentru primele 5 luni din 2016
Utilizând ecuațiile (5.59) și (5.60) împreună cu probabilitățile de distribuție a claselor de
variabile ce conțin resurse regenerabile, putem calcula în final distribuțiile de putere și respectiv
energie ce pot fi generate de cele două surse.
5.5.5 Crearea structurii RB utilizând algoritmul Esential Graph Sear ch (EGS)
Un graf esențial este o categorie specială de grafuri înlănțuite, care deține atât arce
direcționate, cât și cele nedirecționate, dar fără cicluri direcționate.
Pentru a putea specifica o clasă de echivalență este necesar și suficient să identif icăm în
structura GAD un set de legături nedirecționate adiacente și un set de structuri de tip V.
Procedura pe care se bazează algoritmul constă în:
Date de intrare: Fie D o bază de date ce conține un set de variabile V, o distribuție P(α)
pentru nivel ul de semnificație α, un set de test de independențe I(x, y|S) , o configurație inițială
pentru ordin(V) , și un număr întreg n de structuri.
Mărime de ieșire: un graf esențial;
Se repetă:
1. Se identifică nivelul α din P(α) .
2. Se utilizează algoritmul PC (dezvoltat în raportul de cercetare II) peste setul ( α, ordin(V),
D, I) pentru a genera un graf esențial notat G’.
3. Se transformă în mod aleatoriu graful G’ într-un GAD notat S’.
4. Se calculează P(D, S’ ) și se menține structura cu valoarea maximă.
5. În mod alea toriu se generează o configurație diferită pentru ordin(V) .
Până când: Sunt generate n structuri fără să schimbăm valoarea maximă a lui P (D, S’ ).
Multe variații ale acestui algoritm sunt posibile. Datorită faptului că valoarea metrică
utilizată nu este invariantă față de GAD -urile din aceeași clasă de echivalență, poate fi mai
rezonabil să se genereze și să memoreze toate GAD -urile posibile, decât s ă se aleagă aleatoriu un
48
singur GAD. O altă posibilitate este utilizarea unei funcții de ierarhizare care este invariantă
indiferent de transformările claselor de echivalență.
Datorită faptului că algoritmul lucrează pe baza GAD -urilor, este posibil ca uneori să nu
se poată urmări cel puțin din punctul de vedere al resurselor temporale implicate.
Soluția reprezentată de se bazează pe reducerea complexității prin utilizarea unor clase
echivalente de GAD -uri. În timp ce se bazează, în esență, pe o procedură de căutare și
clasificare pentru a detecta domeniul structurilor de rețea sau GAD -urile (grafice aciclice
direcționate).
Se prezintă, în cele ce urmează, o RB mai detaliată și mai precisă decât cea precedentă,
construită pe baza datelor meteo înregis trate timp de 4 ani (2013 – 2016). Structura rețelei a fost
întocmită iar parametrii au fost calculați folosind algoritmul EGS. Comparativ cu algoritmul BS , EGS este mai laborios și consumator important de resurse
ale calculatorului (timp și memorie) dar rețeaua redă mai bine dependențele fine între variabilele
considerate.
Un exemplu este, în acest sens, faptul că rețeaua din figura 5.46 arată că soarele este
”forța motrice” în determinarea condițiilor meteorologice. Legăturile pornesc majoritar de la
această variabilă către celelalte cum mai puțin evident este arătat în rețeaua din figura 5.38. Este
adevărat că, în situații reale, iradiația solară este diminuată de poluare și gradul de nebulozitate.
Rețeaua a fost construită folosind datele primare dis cretizate, de această dată, nu în 4 ci în
5 clase de variație pentru o modelare mai exactă și calcule mai precise.
Viteza vântului și iradiația solară au fost discretizate conform tabelului următor:
Tabelul 5.10 Discretizarea valorilor ce caracterizează resurselor regenerabile
Clase de
variație Viteza vântului
[m/s] Obs. Iradiația solară
[W/m2] Obs.
S1 < 2 2 m/s este viteza minimă
utilă a sursei eoliene ≤100 Iradiația solară maximă
înregistrată a fost 1195 [W/m
2]
Puterea sursei solare (cu valoarea
nominală de 10
kW pentru 1000 [W/m
2]) a fost
considerată proporțională cu iradiația solară; S2 2 – 5 Pentru aceste valori,
puterea sursei eoliene este
cea nominală; în exemplul
considerat, 10 kW 100 – 300
S3 5 – 10 300 – 700
S4 10 – 12 700 – 900
S5 Viteza maximă utilă sursei
eoliene este 20 m/s; viteza
maximă înregistrată a fost
de 13.4 m/s > 900
Un aspect extrem de important este legat de independența sau dependența celor două
resurse (și respectiv surse) regenerabile. Literatura oferă exemple care nu stabilesc foarte clar
acest aspect. O analiză a datelor înregistrate a condus la stabilirea corelației prezentate în fig ura
5.45. Au fost determinați coeficienții de corelație pe timpul zilei, când există ambele resurse și
respectiv pe inte rvalul de timp total, așa cum rezultă din fig ura 5.45.
49
Fig. 5.45 Coeficienții de corelație între iradiația solară și viteza vântului pe durata celor patru de înregistrări
Rezultatele arată o dependență relativ slabă lăsând posibilitatea de a considera resursele
independente, ipoteză asumată în studiul și calculele ce urmează.
Rețeaua Bayesiană rezultată are structura din fig ura 5.46 în care sunt prezentate și
rezultatele calculelor referitoare la probabilitățile claselor de variație a celor 9 variabile aleatoare.
Fig. 5.46 RB generată de algoritmul EGS pe baza datelor pe o perioadă de 4 ani și distribuțiile discrete ale
variabilelor meteorologice
Probabilitățile claselor de variație ale parametrilor resurselor regenerabile sunt prezentate
în fig ura 5.47 pentru viteza vântului și respectiv în fig ura 5.48 pentru iradiația solară.
50
Fig.5.47 Probabilitățile condiționate ale claselor de variație a vitezei vântului
Fig. 5.48 Probabilitățile condiționate ale claselor de variație a iradiației solare
Ceea ce interesează, în mod deosebit, este puterea disponibilă a surselor de energie
electrică ce folosesc resursele regenerabile. Pornind de la ipoteza independenței resurselor a fost
utilizată metoda Calabrese (binomială) pentru calculul distribuției discrete a puterii disponibile
totale. În tabelul 5.11 sunt prezentate toate datele necesare calculului probabilităților claselor de
variație a puterii totale.
Tabelul 5.11 Stările posibile, clasele de putere totală și probabilitățile asociate
Nr. stare Stare resurse Putere disponibilă totală [kW] Probabilitate
clasă putere totală
[x10-3] Eoliană
[m/s] Solară
[W/m2] Eoliană Solară Totală
1 < 2 0 – 100 0 0 – 1 0 – 1 540.000
2 2 – 10 – 100 0 – 10 0 – 1 0 – 11 140.200
3 10 – 19 0 – 100 10 0 – 1 10 – 11 0.539
4 < 2 100 – 300 0 1 – 3 1 – 3 109.450
5 2 – 10 100 – 300 0 – 10 1 – 3 1 – 13 28.420
6 10 – 19 100 – 300 10 1 – 3 11 – 13 0.100
7 < 2 300 – 700 0 3 – 7 3 – 7 103.100
8 2 – 10 300 – 700 0 – 10 3 – 7 3 – 17 26.810
9 10 – 19 300 – 700 10 3 – 7 13 – 17 0.110
10 < 2 700 – 900 0 7 – 9 7 – 9 35.129
11 2 – 10 700 – 900 0 – 10 7 – 9 7 – 19 9.120
12 10 – 19 700 – 900 10 7 – 9 17 – 19 0.030
13 < 2 > 900 0 > 9 > 9 5.549
14 2 – 10 > 900 0 – 10 > 9 0 – 19 1.439
15 10 – 19 > 900 10 > 9 > 19 (max. 20) 0.004
În fig ura 5.49 este reprezentată distribuția de probabilitate a puterii totale din surse
regenerabile. 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
s1≤2 2<s2≤5 5<s3≤10 10<s4≤12 s5>12 Probabilitate
Viteza v ântului [m/s]
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
s1≤1 1<s2≤3 3<s3≤7 7s<4≤9 s5>9 Probab ilitate
Iradiația solară [102 x W/m2]
51
Fig. 5.49 Distribuția comună de probabilitate a puterii totale disponibile generate de sursele regenerabile
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Prob abilitate
Puterea totală disponibilă din surse regenerabile
[kW]
52
Referințe bibliografice
[5.1] Flores P, Tapia A, Tapia G. Application of a control algorithm for wind speed prediction and active power
generation. Renewable Energy 2005, 30(4):523 –36
[5.2] Sideratos G, Hatziargyriou ND. An advanced statistical method for wind power forecasting. Power Systems
2007;22(1):258 –65.
[5.3] Sfetsos A., A comparison of various forecasting techniques applied to mean hourly wind speed time series.
Renewable Energy 2000, 21(1), 23 –35.
[5.4] Florin MUNTEANU , Ciprian NEMES, Dragos ASTANEI, Alexandra CIOBANU, ” Data mining for wind
availability modeling”, 7th International Conference on Energy and Environment; CIEM 2015 Conference
Proceedings
[5.5] Nir Friedman, Dan Geiger, Moises Goldszmidt, „Bayesian Network Class ifiers”, in Machine Learning, 29,
131– 163 (1997), 1997 Kluwer Academic Publishers. Manufactured in The Netherlands.
[5.6] C. Chow and C. Liu, "Approximating discrete probability distributions with dependence trees," in IEEE
Transactions on Information Theory , vol. 14, no. 3, pp. 462 -467, May 1968. doi: 10.1109/TIT.1968.1054142
[5.7] Cooper, Gregory F., Herskovits, Edward, "A Bayesian method for the induction of probabilistic networks
from data", Machine Learning, 1992, vol.9, pg. 309 – 347, issn – 1573- 0565, doi – 10.1007/BF00994110.
[5.8] Kalisch, M. & Buhlmann. Estimating high- dimensional directed acyclic graphs with the PCalgorithm. The
Journal of Machine Learning Research 8, 613 -636 (2008)
[5.9] Steck, H. Constraint -Based Structural Learning in Bayesian Networks using Finite Da ta. PhD thesis,
Institut fur Informatik der Technischen Universit¨at M¨unchen (2001)
[5.10] D. Dash, M. J. Druzdzel: A Hybrid Anytime Algorithm for the Construction of Causal Models From Sparse
Data. Proceedings of the !5th Annual Conference on Uncertainty in Art ificial Intelligence, pp. 142 -149, Morgan
Kaufmann Publishers, Inc. San Francisco, CA, 1999.
[5.11] Tonda A.P., Lutton E., Reuillon R., Squillero G., Wuillemin PH. (2012) Bayesian Network Structure
Learning from Limited Datasets through Graph Evolution. In: Mora glio A., Silva S., Krawiec K., Machado P.,
Cotta C. (eds) Genetic Programming. EuroGP 2012. Lecture Notes in Computer Science, vol 7244. Springer, Berlin, Heidelberg
[5.12] Heckerman D., Geiger D., Chickering D.M. (1995), “Machine Learning”, Vol.20, Sept, pg. 197 -243.
doi:10.1023/A:1022623210503.
[5.13] Cooper G.F., Herskovits E. (1992), “Machine Learning”, pg. 309- 347. doi:10.1007/BF00994110.
[5.14] Buntine W. (1991), “Theory refinement on Bayesian networks”, Proceedings of the 7th Conference on
Uncertainty in Artificial Intelligence, Los Angeles, CA, July 13 -15, pg. 52- 60.
[5.15] Needham J.C., Bradford R.J., Bulpitt J.A., Westhead R.D. (2007), ”A Primer on Learning in Bayesian
Networks for Computational Biology”, PLoS Computational Biology, Volume 3, Issue 8.
[5.16] Vinh NX., Chetty M., Cop pel R., Wangikar P.P. (2011), “Global MIT: learning globally optimal dynamic
Bayesian network with the mutual information test criterion”, Bioinformatics, Oct. 1, 27(19), 2765- 6. doi
10.1093/bioinformatics/btr457.
[5.17] L.M. de Campos (2006), “A scoring functi on for learning Bayesian networks based on mutual information
and conditional independence tests”, Journal of machine learning research, pgs. 2149 -2187. ISSN 1533- 7928
[5.18] Silva J.; Narayanan S.S. (2010), “Nonproduct Data -Dependent Partitions for Mutual Inform ation
Estimation: Strong Consistency and Applications”, IEEE Trans. Signal Process, 58, 3497 –3511.
[5.19] Munteanu F., Nemes C. (2012), “Belief networks utilization for nodal power quality and availability
assessment”, U.P.B. Sci. Bull., Series C, Vol. 74, Iss. 1, ISSN 1454- 234x.
[5.20] Alexandra Ciobanu, F. Munteanu, C. Nemes, Mihaela Adochitei, ”Dynamic Bayesian Network for Weather
Forecast and Evaluation of Renewable Resources Availability”. Proceedings of the 24th Conference of Energy Engineering, Oradea, Romania. S ession I, paper 1.
[5.21] J. Hulst, “Modelling physiological processes with dynamic Bayesian networks”. MSc thesis. TU Delft,
2006.
[5.22] www.bayesfusion.com
[5.23] *** Genie package software. User Manual.
[5.24] Fawcett, Tom (2006). "An Introduction to ROC Analysis" . Elsevier – Pattern Recognition Letters. 27 (8):
861– 874. doi:10.1016/j.patrec.2005.10.010
1
CONTRIBUȚII PERSONALE ȘI DIRECȚII DE CERCETARE
O cercetare bibliografică exhaustivă privind utilizarea RB ca tehnici de inteligență
artificială în general și pentru analiza disponibilității în electroenergetică în special, a condus la
selectarea a peste …. lucrări din care …. cărți, …. teze de doctorat, … articole științifice indexate
în baze de date de prestigiu.
Literatura românească este relativ săracă în rezultate a cercetării în domeniu selectând pe
baza acesteia un număr de … lucrări.
Rezultatele cercetărilor efectuate pe durata stagiului de doctorat, concretizate în cele 12
lucrări publicate pot fi sintetizate prin contribuțiile personale aduse în domeniul tezei:
– Stabilirea unui model logic, cu exemplificare din domeniul electroenergetic, pentru
ilustrarea principiului de transfer al informației în structuri elementare ale RB: conexiune serială, convergentă și divergentă;
– Întocmirea unui set de RB asociate principalel or tipuri de arhitecturi nodale ce permit în
mod flexibil determinarea in dicatorilor de fiabilitate [6.1], [6.2], [6.3] ;
– Monitorizarea (î nregistrarea , selectarea și prelucrarea) unui volum important de
informații [6.4], [6.5], [6.6] , privind parametrii meteorologici inclusiv cei ai resurselor regenerabile [6.7], [6.8] care a u stat la baza întocmirii structurii RB pentru studii de
disponibilitate în electroenergetică; în acest scop a fost utilizată stația meteorologică profesională Vintage Pro2Plus din cadrul Laboratorului de Cercetare Aplicată și Realizare de Prototipuri – LACARP din cadrul departamentului de energetică;
– Modelarea probabilistică a resurselor de energie regenerabilă (solară și eoliană) cu
evidențierea coeficienților Pearson de corelare dinamică [6.9], [6.10];
– Întocmirea unei RB pentru calculul indicatorului de fiabilitate LOLP generalizat, inclus
în baza de date a companiei Hugin [6.11];
– Întocmirea unei RBD folosind algoritmul BS pentru evaluarea probabilistică a disponibilității resurselor regenerabile [6.12];
– Întocmirea structurii, calculul parametrilor și an aliza erorilor pentru o RB capabilă de
prognoze meteorologice, estimări ale parametrilor resurselor regenerabile precum și a
celor corespunzători surselor regenerabile (puteri/ energie) folosind algoritmul EGS [6.10];
– Întocmirea unei diagrame de influență ce are la bază modelarea unui întrerupător, a
mecanismului său de acționare, considerând și decizii de corelare ale costurilor de
mentenanță în funcție de uzură.
Cercetarea efectuată și rezultatele obținute profilează următoarele direcții de cercetare:
– Dezvoltarea RB pilotate de date, cu generarea automată a structurii și optimizarea
parametrilor în scopul modelării subsistemelor autonome de alimentare cu energie
electrică din surse regenerabile; Generarea și consumul local alături de minimizarea
interacțiu nii cu rețeaua constituie ținte de optimizare;
– Consolidarea bazei de date existente în scopul creșterii preciziei calculelor probabilistice
privind echilibrul între energia electrică produsă și consumată;
– Testarea de noi algoritmi pentru optimizarea timpului și resurselor de calcul concomitent
cu creșterea preciziei rezultatelor;
2
– Extinderea utilizării RB și a diagramelor de influență pentru mdelarea subsistemelor de
generare, transport și distribuție a sistemelor electroenergetice;
– Folosirea tehnicilor Baye siene pentru modelarea resurselor și surselor multiple
regenerabile în scopul creșterii autonomiei în alimentarea sustenabilă cu energie electrică
și termică din hub- uri specializate.
3
Referințe bibliografice
[6.1] Alexandra Ciobanu, F. Munteanu, C. Nemes and D. Astanei, "Availability evaluation of
nodal architectures using Bayesian networks", 2016, Buletinul Institutului Politehnic din Iași,
Vol. 62 (66), numărul 3, Secția Electrotehnică, Energetică, Electronică.
[6.2] Alexandra Ciobanu, F. Munteanu and C. Nemes, "Bayesian networks utilization for
reliability evaluation of power systems," 2016 International Conference and Exposition on Electrical and Power Engineering (EPE) , Iasi , 2016, pp. 837- 841. doi:
10.1109/ICEPE.2016.7781454; WOS:000390706300164.
[6.3] F. Munteanu, Alexandra Ciobanu and C. Nemes, "From technical design structures to
Bayesian networks in power engineering," 2016 International Conference on Applied and
Theoret ical Electricity (ICATE) , Craiova, 2016, pp. 1- 6. doi: 10.1109/ICATE.2016.7754625;
WOS:000390767500025
[6.4] D. Astanei, F. Munteanu, C. Nemes, Alexandra Ciobanu , M. Ionescu and M. Adochitei,
"Light flicker detection using high- speed imaging," 2017 International Conference on Modern
Power Systems (MPS) , Cluj -Napoca, 2017, pp. 1- 4. doi: 10.1109/MPS.2017.7974448.
WOS:000428462600076.
[6.5] D. Astanei, C. Nemes, F. Munteanu and Alexandra Ciobanu , "Annual energy production
estimation based on wind s peed distribution," 2016 International Conference and Exposition on
Electrical and Power Engineering (EPE) , Iasi, 2016, pp. 862- 867. doi:
10.1109/ICEPE.2016.7781459; WOS:000390706300169.
[6.6] Alexandra Ciobanu , F. Munteanu, C. Nemes and D. Astanei, "Avail ability model of wind
and solution to immunize the generators against short time perturbations," 2016 International Symposium on Fundamentals of Electrical Engineering (ISFEE) , Bucharest, 2016, pp. 1- 6; doi:
10.1109/ISFEE.2016.7803166; WOS:000392434400018
[6.7] Florin Munteanu, Ciprian Nemes, Dragoș Astanei, Alexandra Ciobanu , ” Data Mining for
Wind Availability Modeling ”, 2015, International Conference on Energy and Environment
(CIEM), Iași 2015.
[6.8] C. Nemes, M. Adochitei, F. Munteanu, Alexandra Ciobanu and O. Neagu, "Self –
consumption enhancement on a low -voltage grid- connected photovoltaic system," 2018 IEEE
International Energy Conference (ENERGYCON) , Limassol, 2018, pp. 1- 6. doi:
10.1109/ENERGYCON.2018.8398839.
[6.9] C. Nemeș, F. Munteanu, D. A stanei, Alexandra Ciobanu , M. Adochiței and M. Larion, "A
correlation between photovoltaic system production and local solar resources," 2017 14th
International Conference on Engineering of Modern Electric Systems (ICEMES) , Oradea, 2017,
pp. 47- 50; doi: 10.1109/EMES.2017. 7980378. WOS:000427085200011.
[6.10] F. Munteanu, Alexandra Ciobanu and C. Nemes, "A Bayesian Approach of the
Availability Complementarity of Renewable Resources," 2018 International Conference and
Exposition on Electrical And Power Engine ering (EPE) , Iasi, 2018, pp. 0731- 0736. doi:
10.1109/ICEPE.2018.8559738.
[6.11] Alexandra Ciobanu , F. Munteanu, C. Nemes and D. Astanei, "Data – driven Bayesian
networks for reliability of supply from renewable sources," 2017 International Conference on
4
Optimization of Electrical and Electronic Equipment (OPTIM) & 2017 Intl Aegean Conference
on Electrical Machines and Power Electronics (ACEMP) , Brasov, 2017, pp. 84- 89; doi:
10.1109/OPTIM.2017.7974952. WOS:000426909600012
[6.12] Alexandra Ciobanu , F. Munteanu, C. Nemeș, Mihaela Adochiței “ Dynamic Bayesian
Network for weather forecast and evaluation of renewable resources availability”. Journal of
Sustainable Energy, vol. 9, no. 2, 2018.
ANEXA 5.1
PRINCIPALII PARAMETRI STATISTICI
Principalii parametri statistici ai unui șir de n date xi se mai numesc și valori tipice de selecție.
A. Parametrii de tendință
a. Media aritmetică a șirului de date:
∑
1=1=n
iixnx (A5. 1.1)
b. Mediana este un indicator al tendinței centrale, și anume este valoarea față de care frecvența valorilor
mai mici este egală cu frecvența valorilor mai mari decât ea.
• dacă n este impar 21+=/) (n ex M ; (A5. 1.2, a)
• dacă n este par ) (/ / 1+22+21=n n e x x M . (A5.1.2, b)
c. Modul șirului de date:
) ( x M x Me o −3+= (A5. 1.3)
d. Valoarea centrală a șirului de date:
) (min max x x xc +21= (A5. 1.4)
în care x max este cea mai mare din valorile x i, iar x min, cea mai mică.
B. Parametrii folosiți ca indici de împrăștiere:
a. Abaterea medie pătratică
∑
1=2−1=n
iii xxn
ns ) ( (A5. 1.5)
în care n i este frecvența absolută corespunzătoare valorii xi.
b. Dispersia
∑
1=2 2−1=n
iii xxnns ) ( (A5. 1.6)
c. Amplitudinea șirului de date este diferența dintre valoarea cea mai mare xmax și valoarea cea mai mică
xmin din șirul de date:
min max x xR−= (A5. 1.7)
d. Coeficientul de variație
xs Cv /= (A5. 1.8)
e. Abaterea medie absolută
∑
1−−1=n
iii m xxnnA (A5.1.9)
f. Coeficientul de asimetrie
322
3
1=
)()(
sμβ (A5. 1.10)
unde s2 este dat de relația (A5.1.6), iar
∑
1=3
3 −1=n
iii xxnnμ ) ( (A5.1.11)
ANEXA 5.2
ELIMINAREA DATELOR AFECTATE DE ERORI
Clasificarea erorilor după natura acestora:
• Erori grosolane (greșeli): Caracteristic erorilor grosolane este faptul că nu sunt conforme cu realitatea. Ele sunt
greșeli de măsurare ca urmare a încălcării principiilor generale de măsurare sau o consecință a unei erori a
operatorului. Eroarea grosolană diferă esențial de celelalte date. La o repetare a măsurătorilor, erorile grosolane au o probabilitate foarte mică de a se reproduce, ceea ce permite depistarea lor cu ușurință.
• Erori sistematice: este posibil ca o influență oarecare, acționând singură asupra măsurării, să producă o eroare
cu o anumită valoare, nenulă, aproximativ constantă, care să afecteze toate datele experimentale. Acesta este
cazul erorilor sistematice ce se pot datora unei reglări sau etalonări incorecte ale aparatelor de măsură, unei
erori ale operatorului sau condițiilor experimentale. Erorile sistematice nu se elimină la o repetare a măsurării
fapt pentru care depistarea lor se poate realiza doar prin măsurarea aceleiași mărimi prin metode diferite sau cu alt aparat de măsură.
• Erori aleatorii (accidentale , întâmplătoare): Ca urmare a variabilității naturale a proceselor și fenomenelor,
precum și a interacțiunilor multiple asupra unui experiment, orice proces de măsurare este influențat de o multitudine de factori. Influența individuală a fiecăruia dintre a cești factori este neglijabilă, fapt ce face
imposibilă depistarea și înlăturarea lor, efectul global fiind producerea unor erori aleatorii inevitabile. Un control eficient presupune o normare prealabilă a preciziei, adică stabilirea zonei maxime admisibil e de
existență a erorii de măsurare pe care o poate avea sistemul. Depășirea acestei valori semnalează funcționarea
necorespunzătoare a lanțului de măsurare și faptul că datele furnizate nu reflectă realitatea.
Clasificarea erorilor după originea lor:
• Principiul sau metoda de măsurare . Este posibil ca teoria însăși a procedeului de măsurare utilizat să nu fie
valabilă pentru operația de măsurare ce se realizează.
• Mijloacele de măsurare . Aparatele cu care se realizează măsurarea sunt imperfecte, având unele caracteristici
tehnice limitate: acuratețea, fidelitatea, sensibilitatea.
• Mediul ambiant. Variațiile temperaturii, umidității, presiunii atmosferice, etc. pot influența rezultatele
măsurătorilor.
• Obiectul supus măsurării. În timpul realizării măsurătorilor , obiectul însuși poate suferi modificări sub
influența variațiilor unor factori interni sau externi.
• Operatorul. Erorile comise de operator pot fi datorate imperfecțiunii simțurilor, neatenției, incompetenței,
neglijenței, etc.
Testul IRWIN (testul λ )
Dacă șirul de n date se ordonează în sens crescător sau descrescător, valorile susceptibile a fi aberante sunt cele
de la extremitățile șirului. Pentru verificarea valorii suspecte x
n se calculează valoarea:
sx xλn n1−−= (A5. 2.1)
unde: xn este valoarea considerată a fi aberantă iar s este abaterea medie pătratică a șirului de n date.
2=s s (A5.2.2)
Dispersia este calculată la rândul său cu relația:
[]∑
1=2 2−1==n
iixxnsxD ) ( (A5.2.3)
Valorile critice ale metodelor de analiză a șiruri lor de date, stabilite pentru un anumit nivel de încredere propus
sunt date în tabelul A5.2.1.
Tabelul A5.2.1 Valorile critice ale testelor pentru eliminarea datelor aberante
Denumirea
testului IRWIN GRUBBS ROMANOVSKI
Expresia
analitică a
testului sx xn n 1−−=λ
,sxx
vn−
=
1−−
=∗
nnsx x
t
Numărul
datelor
șirului Nivelul de încredere, α
0.95 0.98 0.99 0.95 0.98 0.99 0.95 0.98 0.99
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 1.79
1.64
1.51
1.39
1.31
1.24
1.20
1.18
1.14
1.11
1.09
1.07
1.06
1.05
1.04
1.03
1.03
1.03 2.17
2.05
1.93
1.81
1.69
1.57
1.51
1.46
1.43
1.41
1.39
1.37
1.35
1.33
1.31
1.29
1.28
1.27 2.90
2.75
2.60
2.45
2.30
2.16
2.09
2.03
2.00
1.97
1.94
1.91
1.88
1.86
1.84
1.82
1.81
1.80 1.41
1.71
1.92
2.07
2.18
2.27
2.35
2.41
2.47
2.52
2.56
2.60
2.64
2.67
2.70
2.73
2.75
2.78 1.41
1.72
1.96
2.13
2.27
2.37
2.46
2.54
2.61
2.66
2.71
2.76
2.80
2.84
2.87
2.90
2.93
2.96 1.41
1.73
1.97
2.16
2.31
2.43
2.53
2.62
2.69
2.75
2.81
2.86
2.91
2.95
2.98
3.02
3.05
3.08 4.93
3.56
3.04
2.78
2.62
2.51
2.43
2.37
2.33
2.29
2.26
2.24
2.22
2.20
2.18
2.17
2.16
2.15 8.04
5.08
4.11
3.64
3.36
3.18
3.05
2.96
2.89
2.83
2.78
2.74
2.71
2.68
2.66
2.64
2.62
2.60 11.46
6.53
5.04
4.36
3.96
3.71 3.54
3.41
3.31
3.23
3.17 3.12
3.08
3.04
3.01
3.00
2.95
2.93
Astfel, comparând valoarea lui λ cu valoarea critică λ critic (stabilită în tabelul A5.2.1), valoarea x n se elimină
din șirul de date dacă:
λ ≥ λ critic (A5.2.4)
În caz contrar nu sunt motive suficiente pentru aceasta. Nivelul de încredere al concluziei este α .
Dacă valoarea xn a fost eliminată se recalculează abaterea medie pătratică pentru cele n-1 valori rămase și testul
se aplică din nou, procesul continuând până când nu se mai elimină date ale șirului.
Observație: Testul IRWIN nu este suficient în cazul care, în cadrul șirului de date există mai multe valori
suspecte, iar valoarea dispersiei este mare, în acest caz fiind necesară aplicarea celorlalte metode.
Testul GRUBBS (testul v)
Acest test se aplică în general șirurilor mari de date (n ≥ 100), metoda de eliminare constând în compararea
valorii considerate aberantă xn cu valoarea medie x, calculată.
Ordonând șirul de n date în sens crescător sau descrescător, se va verifica dacă valoarea xn nu este aberantă.
Pentru aceasta se calculează expresia:
,sx x
vn−
= (A5. 2.5)
în care ,s reprezintă abaterea medie pătratică a șirului de date, calculată cu expresia:
∑
1=2−1−1=n
iixxns ) (, (A5. 2.6)
Comparând valoarea v cu valoarea critică vcritic, din tabelul A5.2.1, determinarea x n se elimină din șirul de date
dacă v > vcritic; în caz contrar nu sunt motive suficiente pentru aceasta. Nivelul de încredere al concluziei este α .
Testul ROMANOVSKI (testul t)
Fie x* valoarea din șirul de n date pentru care se face verificarea.
Acest test presupune de asemenea o metodă de eliminare ce constă în compararea valorii considerate aberante
x* cu valoarea medie x, corespunzătoare celorlalte n-1 valori din șirul de rezultate. Testul Romanovski se aplică pentru
șiruri de valori n < 100. În acest caz, calculul valorii medii x se realizează cu formula:
1−+++=21
nx xxxn … (A5.2.7)
De asemenea este necesar să se calculeze abaterea medie pătratică, neglijându -se valoarea aberantă x*, (pentru
n-1 valori).
În continuare se determină raportul:
1−−
=
nnsx x
t*
(A5. 2.8)
Rezultatul acestui raport se compară cu valorile critice (tabelul A5.2.1) stabilite pentru un anumit nivel de
încredere ales, iar dacă valoarea t depășește valoarea tcritic
t ≥ t critic (A5.2.9)
atunci rezultatul este că valoarea considerată aberantă x* poate fi elimin ată din șirul de date cu un nivel de încredere α.
În caz contrar, se impune concluzia că nu există motive suficiente de eliminare a valorii x*.
ANEXA 5.3
FUNCȚII DE REPARTIȚIE A ȘIRURILOR DE DATE
1. Legea normală sau repartiția Gauss -Laplace
Legea care stă la baza metodelor de prelucrare a datelor de măsurare este legea normală, utilizată de Gauss în
studiul și fundamentarea teoriei erorilor.
Repartiția normală apare pentru prima dată într -o lucrare a lui Abraham de Moivre, publicată în 1733, iar în
1744 este preluată de Laplace. Repartiția de probabilitate normală (denumită și Gauss -Laplace), este definită prin
densitatea de probabilitate de f orma:
22
2−−
21=σmt
σme
πσtf) (
;)( (A5.3.1)
pentru 0>+∞<<−∞ σ x ; în care m = MTBF (media timpului de bună funcționare) este adevărata valoare a mărimii
măsurate, iar σ este abaterea medie pătratică.
Forma funcției de repartiție a variabilei aleatoare t care are o repa rtiție normală este dată în figura A5.3.1,a, și
poartă denumirea de clopotul lui Gauss, cu valori maxime pentru t=m= MTBF.
Fig. A5.3.1 Reprezentarea grafică a funcției normale de repartiție pentru variabila aleatoare t (a);
Variația indicatorilor de fiabilitate (b)
Această lege este caracterizată de variația indicat orilor de fiabilitate, figura A5.3.1(b), remarcându -se faptul că
este valabilă pentru sfârșitul duratei de viață a produselor.
2. Repartiția log- normală
Putem spune că o variabilă aleatoare t urmează legea lo g-normală , figura A5. 3.2, (logaritmică normală) cu
parametrii m și σ, ( 0>∈σRm , ) dacă densitatea sa de probabilitate este de forma:
22
2−−
21=σmt
σme
πσtf) (ln
,)( (A5.3.2)
unde m și σ reprezintă parametrii repartiției log -normale; valoarea medie și respectiv, dispersia logaritmului variabilei
aleatoare x.
Funcția de repartiție a variabilei t este F(t) = 0 pentru t ≤ 0, iar pentru t > 0 este:
dx e
πtFtx∫∞−2−2
21=ln)/()( ( A5.3.3)
(b)
Fig. A5.3.2 Reprezentarea grafică a funcției log -normale de repartiție pentru variabila aleatoare t
3. Repartiția Weibull
Legea Weibull este folosită pentru modelarea fenomenelor de cădere cu cauze complexe care intervin în testarea
durabilității componentelor sistemelor electronice, hidraulice, electrice, etc.; această repartiție are o deosebită importanț ă
pentru studiul preciziei aparat elor de măsurat.
Putem spune că o variabilă aleatoare t urmează o repartiție de tip Weibull , figura A5. 3.3, dacă densitatea sa de
probabilitate este de forma:
()()
−−⋅−⋅=0 1−
0θttttθβtfβ
βexp )( ( A5.3.4)
sau
−−⋅
−⋅=01−
0β β
ηtt
ηtt
ηβtf exp )( ( A5.3.5)
unde: β – parametru de formă
θ – parametru de scară
η – durata de viață
t0 – parametru de loc sau durata minimă fără defect
Fig. A5.3.3 Reprezentarea grafică a funcției Weibull de repartiție pentru variabila aleatoare t
4. Repartiția exponențială
Legea exponențială, figura A5.3.4, este un caz particular al repartiției Weibull.
Această lege este caracterizată de z(t)= constant = λ .
Densitatea de probabilitate a unei variabile aleatoare t ce are o repartiție exponențială este de forma:
0≤00>=−
tt eλtftλ
,,)( ( A5.3.6)
Indicatorii de fiabilitate specifici acestei legi de repartiție se calculează cu relațiile:
) exp()( tλ tR ⋅−= ( A5.3.7)
λtz=)( (A5.3.8)
λMTBFm1== ( A5.3.9)
221=
λσ ( A5.3.10)
Fig. A5.3.4 Reprezentarea grafică a funcției exponențiale de repartiție pentru variabila aleatoare t
5. Repartiția Gamma
Variabila aleatoare t urmează o repartiție de tip Gamma, figura A5.3.5, cu parametrii η și λ dacă densitatea sa de
probabilitate are expresia:
0>0>0≥ ⋅⋅=−1−ηλ t e tηΓλtftλ nη
, , ,)()( ( A5.3.11)
în care: ∫∞
0−1−= dtetηΓtη)(
η reprezintă parametru de formă; η = 1 are o repartiție exponențială.
Fig. A5.3.5 Reprezentarea grafică a funcției Gamma de repartiție pentru variabila aleatoare t
6. Repartiția Student (t)
Repartiția t (Student), figura A5.3.6, este o repartiție auxiliară, care la creșterea numărului gradelor de libertate
tinde asimptotic către repartiția normală.
Putem spune că o variabilă aleatoare t urmează o repartiție de tip St udent, cu v = n+1 grade de libertare, dacă
are densitatea de probabilitate de forma:
RvRtt
vΓvπvΓ
tfv
∈∈
2+1⋅
2⋅
21+
=21+−2
, , )( ( A5.3.12)
Repartiția Student se utilizează pentru verificarea ipotezelor referitoare la mediile populațiilor normale, când nu
se cunosc dispersiile teoretice.
Fig. A5.3.6 Reprezentarea grafică a funcției de repartiție Student pentru variabila aleatoare t
7. Repartiția Fisher -Snedecor
O variabilă aleatoare t urmează legea de repartiție Fisher -Snedecor , figura A5.3.7, cu parametrii n 1 și n2,
*) ,( N nn∈21 dacă densitatea sa de probabilitate este de forma:
0≤ 00>
+1
2
2
2+
⋅
=2+−
211−2
2 121
2
2121
11
tt tnntnΓnΓn nΓ
nn
tfnnnn
,,)( ( A5.3.13)
Parametrii n1 și n2 se mai numesc și grade de libertate. Funcția f din relația ( A5.3.13) este o densitate de
probabilitate deoarece Rt tf ∈∀0≥, )( și ∫∞
∞−1=dttf)( . Pentru verificarea relației avem:
∫ ∫∞
∞−∞
02+−
211−
2
2 121
2
2121
11
+1
2
2
2+
⋅
= dt tnntnΓnΓn nΓ
nndttfnnnn
)( ( A5.3.14)
Fig. A5.3.7 Reprezentarea grafică a funcției de repartiție Fisher – Sned ecor pentru variabila aleatoare t
8. Repartiția binomială
O variabilă aleatoare discretă t urmează legea binomială, figura A5.3.8, cu parametrii n și p, dacă ia valorile 0,
1, 2,…, n cu probabilitățile:
n k qpC ktPknkk
n ,…,, , ) ( 210= ==− (A5.3.15)
unde q = 1- p
Tabloul repartiției variabilei aleatoare t este de forma:
2 1 0
0 2−221−1 00qpC qpC pqC qpCntnn
nn
nn
nn
n ……: ( A5.3.16)
Se poate observa faptul că:
∑∑
0= 0=− −1=+= =n
kn
kn kknk
nknkk
n qp q pC qpC ) ( ( A5.3.17)
Fig. A5.3.8 Reprezentarea grafică a funcției binomiale de repartiție pentru variabila aleatoare t
ANEXA 5.4
Verificarea normalității repartiției datelor
Testul χ2 (hi pătrat)
Cel mai important și mai des utilizat dintre testele de verificare a normalității unui șir de date este testul χ2.
Acesta este un test cantitativ și constă în calcularea valorii
()∑
1=2−=k
i ii i
NpNp n2χ (A5.4.1)
în care: n i – numărul de valori al clasei i;
∑
1==k
iin N – numărul total de valori (date);
k – numărul claselor;
pi – probabilitatea teoretică corespunzătoare frecvenței de apariție a valorii xi, în cazul unei repartiții
normale.
Valoarea χ2 calculată cu relația ( A5.4.1) se compară cu o valoare χ2
v,α, critic determinată în funcție de un
parametru v numit grad de libert ate și pentru un nivel de încredere α.
Dacă suma ( A5.4.1) depășește valoarea critică χ2
v,α, atunci cu o certitudine având probabilitatea α se poate
considera că funcția de repartiție a datelor diferă de cea normală.
Pentru aplicarea testului χ2 este necesar să se respecte următoarele condiții:
20≤≤105≥50≥ k n Ni; ;
Dacă clasele extreme au mai puțin de cinci date fiecare, atunci aceste clase se contopesc cu cele alăturate lor și
numărul gradelor de libertate este egal cu numărul claselor, minu s 3. Dacă una din clasele extreme are mai puțin de cinci
date, atunci această clasă se contopește cu cea alăturată și numărul gradelor de libertate este egal cu numărul claselor,
minus 2. Dacă toate clasele au mai mult de cinci date fiecare, atunci numărul gradelor de libertate este egal cu numărul
claselor, minus 1.
Pentru aplicarea efectivă a testului, trebuie parcurși următorii pași:
• Se calculează media aritmetică x și abaterea medie pătratică s a șirului de date, utilizând
relațiile (A5.1.1) și respectiv ( A5.1.5).
• Se calculează pentru fiecare clasă i valoarea
sxxti
i−= ( A5.4.2)
în care x i este limita superioară a clasei i.
• Se calculează probabilitățile teoretice pi cu relația
()()1−−=i i i tΦtΦp (A5.4.3)
pentru care se va avea în vedere că
()∫
02−2
21=t
tdt e
πtΦ/ (A5.4.4)
este funcția de probabilitate integrală și că )( )( ;,)( tΦ Φ Φ −=−∞50=+∞ .
• Se calculează suma ( A5.4.1);
• Se caută în tabelul A5.4.1, valoarea χ2
critic, corespunzătoare numărului gradelor de libertate v
stabilit și al nivelului de încredere α convenabil ales.
• Se compară valoarea χ2 calculată cu relația ( A5.4.1), cu valoarea χ2
critic, și se formulează o
concluzie privind acceptarea sau respingerea ipotezei de normalitate a repartiției datelor.
• Când nu sunt suficiente argumente pentru a respinge ipoteza normalității repartiției datelor, se
acceptă această ipoteză; o valoare mică a valorii calculate χ2 nu constituie o demonstrație a normalității;
• Cu cât numărul datelor este mai mare, ansamblul de factori cu acțiune simetrică este mai
stabil și certitudinea concluziei formulate pe baza testului χ2 crește;
• Eficiența testului χ2 crește dacă în fiecare din clasele de grupare a datelor se află aproximativ
același număr de date;
• Testul are o mare putere de discriminare în cazul unor repartiții intens asimetrice și este mai
puțin eficient când repartiția este simetrică (dar diferită de cea normală).
Tabelul A5.4.1 Valorile critice χ2
v,α pentru nivelul de încredere α și numărul de grade de libertate v
α
v 0,8 0,9 0,95 0,98 0,99 0,995 0,998 0,999
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 5,99
7,29
8,56
9,8
11,0
12,2
13,4
14,6
15,8
17,0
18,2
19,3
20,5
21,6
22,8
23,9
25,0 7,78
9,24
10,6
12,0
13,4
14,7
16,0
17,3
18,5
19,8
21,1
22,3
23,5
24,8
26,0
27,2
28,4 9,49
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
23,7
25,0
26,3
27,6
28,9
30,1
31,4 11,67
13,39
15,03
16,6
18,2
19,7
21,2
22,6
24,1
25,5
26,9
28,3
29,6
31,0
32,3
33,7
35,0 13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6 14,9
16,7
18,5
20,3
22,0
23,6
25,2
26,8
28,3
29,8
31,3
32,8
34,3
35,7
37,2
38,6
40,0 16,9
18,9
20,7
22,6
24,3
26,1
27,7
29,4
31,0
32,5
34,0
35,6
37,1
38,6
40,1
41,6
43,1 18,5
20,5
22,5
24,3
26,1
27,9
29,6
31,3
32,9
34,5
36,1
37,7
39,3
40,8
42,3
43,8
45,3
Testul Kolmogorov -Smirnov
Testul Kolmogorov – Smirnov este un test de normalitate, bazat pe proprietățile matematice demonstrate de cei
doi mari matematicieni ruși.
Acest test este utilizat datorită faptului că oferă posibilitatea de decizie asupra ipotezei norm alității atât analitic,
cât și grafic.
Verificarea concordanței dintre o repartiție teoretică și una experimentală poate fi realizată cu ajutorul testului
Kolmogorov- Smirnov prin parcurgerea următorilor pași:
• Datele supuse prelucrării se grupează în inter vale, determinându -se astfel numărul k de clase
și se calculează valorile frecvențelor absolute ai și respectiv relative f i corespunzătoare;
• Se calculează valorile mediei aritmetice și abaterea medie pătratică cu relațiile (A5.1.1) și
respectiv ( A5.1.5).
• Se calculează valorile funcției de repartiție experimentale cu relația:
()∑=i ie f xF ( A5.4.5)
• Se calculează diferența )( )(i ie xF xF0−
unde F0(xi) este funcția de distribuție normală.
• Se determină valoarea maximă a diferenței
)( )( maxi ie e xF xF D0− = ( A5.4.6)
• Decizia asupra ipotezei normalității funcției de repartiție se ia în ținând cont de valoarea
critică a testului d1-α, n (unde α reprezintă eroarea, iar 1 -α nivelul de încredere al testului) (tabelul A5.4.2) astfel:
Dacă nα ed D,−1≤ , atunci se acceptă ipoteza normalității
Dacă nα ed D,−1> , atunci se respinge ipoteza normalității
• Pentru reprezentarea grafică, vor fi calculate cele două limite, inferioară și superioară, cu
relațiile:
()nα id xF LI,−1 0−= (A5.4.7)
()nα id xF LS,−1 0+= (A5.4.8)
Decizia grafică de respingere a normalității se adoptă atunci când funcția de distribuție cumulativă empirică
iese în afara limitelor inferioară și superioa ră.
Tabelul A5.4.2 Valorile critice aproximative ale testului Kolmogorov – Smirnov în funcție de efectivul
eșantionului n și nivelul de încredere 1−α.
1-α 0,80 0,85 0,90 0,95 0,99
d1-α,n
n071,
n141,
n221,
n361,
n631,
Testul Massey
Acest test este destinat pentru verificarea normalității unor selecții cu un volum între 8 și 32 unități statistice.
Fie x1, x2, …, x n rezultatele obținute prin măsurarea unei mărimi X. se calculează valorile variabilei aleatorii
()sxx yi i /−= , în care x și s sunt media aritmetică și abaterea medie pătratică calculate cu relațiile (A5.1.1) și
respectiv ( A5.1.5).
Se calculează valorile funcției Ф( yi) cu relația ( A5.4.4) și se determină valorile funcției relative cumulate F(yi)
a șirului de date, cu care se calculează expresia:
50−−= ,)( )(i i i yΦ yF d ( A5.4.9)
a cărei valoare maximă se notează cu dmax. Dacă dmax< d critic, repartiția este normală, în care dcritic se găsește în
tabelul A5.4.3, funcție de numărul datelor n și nivelul de încredere α .
Tabelul A5.4.3 Valorile critice d critic ale testului Massey pentru verificarea normalității
n α n α n α
0,95 0,90 0,95 0,90 0,95 0,90
8
9
10
11
12
13
14
15 0,140
0,134
0,130
0,129
0,128
0,128
0,128
0,127 0,163
0,158
0,156
0,155
0,154
0,153
0,151
0,148 16
17
18
19
20
21
22
23 0,126
0,128
0,122
0,120
0,117
0,115
0,113
0,112 0,144
0,142
0,138
0,136
0,133
0,131
0,129
0,128 24
25
26
27
28
29
30
32
0,110
0,109
0,108
0,107
0,105
0,104
0,102
0,099 0,126
0,124
0,121
0,120
0,118
0,116
0,114
0,111
Anexa 5.5
Interpretarea teoretică a probabilității logaritmice
Se consideră un set finit {}nX X,…, U1= de variabile aleatoare unde fiecare variabilă Xi poate lua valori dintr –
un set finit notat cu Val (Xi).
Fie P distribuția comună de probabilitate a variabilelor d in U, și X , Y, Z subseturi din U.
În mod formal, o rețea Bayesiană pentru U este reprezentată de 〉〈= Θ,G B . Prima componentă, G, reprezintă
un graf aciclic direcționat (GAD) ale cărui noduri corespund variabilelor aleatoare X1,…, Xn, iar laturile reprezintă
dependențe directe între variabile.
Cea de- a doua componentă, Θ, reprezintă setul de parametri care cuantifică rețeaua. Acesta conține un
parametru ()∏=∏i i B x xx xP θ
i i|| pentru fiecare valoare posibilă xi a lui X i, și ∏ ixa lui ∏ iX, unde ∏ iX
reprezintă setul de variabile părinți al lui Xi din G.
Astfel rețeaua Bayesiană B este definită de o distribuție comună de probabilitate dată de relația:
()()∏ ∏∏
1= 1=1∏= =n
iX Xn
ii i B n Bi iθ X XP X XP|| ,…, ( A5.5.1)
Problema învățării unei rețele Bayesiene poate fi declarată astfel: Dat fiind un set de antrenare {}Nu u D ,…,1=
,de instanțe ale lui U, să se identifice rețeaua B care se potrivește cel mai bine cu D. Rezolvarea acestei probleme implică
introducerea unor funcții de ierarhizare care să evalueze fiecare rețea ținând cont de setul de antrenare.
Două dintre funcțiile de ierarhizare foarte des utilizate pentru învățarea rețelelor Bayesiene sunt funcția de
ierarhizare Bayesiană și o funcție bazată pe principiul lungimii minimale a descrierii (LMD). Diferențele dintre cele
două funcții de ierarhizare nu fac parte din s copul acestei anexe, fapt pentru care, în continuare ne vom concentra doar
asupra funcției LMD (pentru mai multe informații asupra acestui principiu vezi [5.7]).
Funcția LMD elimină principiul învățării rețelelor prin comprimarea datelor. Mai precis, scop ul celui care
dorește să învețe este de a găsi un model care să faciliteze o descriere cât mai scurtă a bazei de date inițiale. Lungimea
acestei descrieri ia în considerare descrierea modelului în sine și descrierea datelor utilizând modelul. În contextul învățării RB, modelul reprezintă rețeaua însăși. Conform principiului LMD, ar trebui să alegem o rețea B astfel încât
lungimea combinată a descrierii rețelei și a datelor codificate (ținând cont de P
B) să fie redusă la minimum.
Să presupunem că B este o rețea Bayesiană a lui U care a fost învățată din setul de antrenare {}Nu u D ,…,1= ,
unde fiecare ui atribuie o valoare pentru toate variabilele din U .
Funcția de ierarhizare LMD a rețelei B este dată de relația:
() ()DBLLBNDB |log| LMD −2= ( A5.5.2)
Unde Beste numărul de parametri din rețea. Primul termen reprezintă lungimea descrierii rețelei B, mai exact,
calculează numărul de biți necesari pentru a codifica rețeaua B, unde ½* logN biți sunt utilizați pentru fiecare parametru
Θ. Cel de -al doilea termen reprezintă negația probabilității logaritmice a lui B condiționat de D care se calculează cu
(A5.5.3) și măsoară numărul de biți necesari pentru a descrie D în baza distribuției de probabilitate PB.
() ()()∑
1==N
ii BuP DBLL log | (A5.5.3)
Probabilitatea logaritmică are de asemenea o interpretare statistică și anume: cu cât aceasta este mai mare cu
atât B este mai aproape de a modela distribuția de probabilitate pentru baza de date D.
Fie DPˆdistribuția empirică definită de frecvența evenimentelor din D, reprezentate ca () ()∑11=
jj A D uNAPˆ
pentru fiecare eveniment ()UValA⊆ , unde ()1=1uAdacă Au∈ și ()0=1uA dacă Au∉. Aplicând ( A5.5.1)
pentru probabilitatea logaritmică și schimbând ordinea de sumare putem scrie descompunerea probabilității logaritmice conform structurii rețelei B.
() ()
()
()∑∑∏
1=
∈∈
∏∏∏=N
i
X ValxX Valxx x i i D
i ii Ii iθ x xP N DBLL|log , ˆ | ( A5.5.4)
Astfel putem spune că această expresie este maximizată când
()∏=∏i i D x xx xP θ
i i| ˆ
| (A5.5.5)
Interpretarea teoretică a informației privind probabilitatea logaritmică ține cont de entropia variabilelor
condiționate de distribuția comună de probabilitate.
Entropia lui X (condiționat de P) este definită ca fiind ()()().X logX X∑−=
XP P P H
Funcția HP(X) este numărul optim de biți necesari pentru a stoca valoarea lui X , care măsoară cantitatea de
informații transmise prin X. Mai precis, presupunând că x1,…, xm este o secvență de eșantioane independente a lui X,
conform P(X), atunci nu putem reprezenta x1,…, xm cu mai puțin de m*H P(X) biți (presupunând că m este cunoscut).
Ținând cont de această interpretare, sunt ușor de înțeles proprietățile entropiei.
În primul rând, entropia are întotdeauna valori non -negative, deoarece lungimea codificării nu poate fi negativă.
În al doilea rând, entropia poate lua valoarea 0, dacă și numai dacă, X este perfect previzibil, adică o valoare a
lui X are probabilitatea 1. În acest caz, putem reconstrui x 1,…, xm fără să privim codificarea. În cele din urmă, entropia
este maximă atunci când P( X) este total neinformativă, adică lui X i se atribuie o probabilitate uniformă.
Fie B rețeaua Bayesiană a lui U care a fost învățată din setul de antrenare D, iar Θ satisface ( A5.5.5). Entropia
asociată lui B este pur și simplu ()U
BPH .
Aplicând (A5.5.1) pentru log P B(u), mut ând produsul în afara logaritm ului și schimb ând ordin ea de sumare
putem scrie ecuația:
() () ∑∑∏
∏∏−=
i x xx x i i D P
i ii i Bθ x xP H
,|log , ˆ U (A5.5.6)
de unde reiese ()()DBLLNH
BP | U1−= , utilizând ( A5.5.6). Această egalitate are o serie de consecințe. În primul rând
implică faptul că ()DBLL |− este numărul optim de biți necesari pentru a descrie D, presupunând că PB este distribuția
din care provine D . Această observație justifică utilizarea termenului ()DBLL |− pentru măsurarea reprezentării lui D
în schema codificată pe principiul LMD. În al doilea rând această egalitate sugerează faptul că maximizarea
probabilității logaritmice este echiv alentă cu identificarea unui model care să minimizeze entropia.
Un alt mod de interpretare a acestui proces se realizează prin utilizarea entropiei încrucișate , cunoscută și sub
denumirea de divergența Kullback – Leibler . Această entropie încrucișată este o metodă de măsurare a distanței dintre
două distribuții de probabilitate care se poate calcula astfel:
()() ( )
()()()
()xxlogx X||X
X xQPP Q PD
Val∑
∈= ( A5.5.5)
Interpretarea teoretică a informației în ceea ce privește entropia încrucișată ține cont de redundanța medie
înregistrată la codificare atunci când utilizăm o măsură greșită a probabilității.
Altfel vorbind, este încurajată suprasolicitarea lui ()() ( )X||XQ PD pentru fiec are codificare a probelor lui P (X)
presupunând că X este distribuit conform Q . Astfel, o codificare a lui x 1,…, xm va avea lungimea de
()()() ( ) ( )X||X x Q PD HmP+ biți, cu ()() ( )X||XQ PmD mai mult decât lungimea optimă. Dată fiind interpretarea
entropiei încrucișate, nu este surprinzător faptul că minimizarea lui ()() ( )U ||UˆB D P PD este echivalentă cu minimizarea
lui ()U
BPH și, de asemenea, este echivalentă cu minimizarea lui ()DBLL |.
O măsură asociată entropiei este și entropia condiționată, care măs oară entropia lui X când se cunoaște
valoarea lui Y : ()()()() ∑∑−=
x yy|x logy|x y Y|X P P P HP . În termenii codării, ()Y|XPH măsoară numărul optim
de biți necesari pentru codarea valorii lui X când valoarea lui Y este cunoscută și se poate spune că, intuitiv, cunoscând
valoarea lui Y , codarea lui X devine mai compactă: ()()X Y|XP P H H ≤ . Diferența dint re cele două valori poartă
numele de informație mutuală între X și Y, și măsoară câtă informație conține Y despre X.
Informația mutuală poate fi definită astfel:
()()()()()
()() ∑= −=
y,xyxy,xlogyx Y|X X Y;XPPP,P H H IP P P ( A5.5.6)
Aplicând aceste definiții în (A5.5.4) putem rescrie:
() ()() () ∑ ∑ ∑∏ ∏− = −=
i i ii P i i P i i PX H N X XI N X X H N DBLL
D D Dˆ ˆ ˆ ; | | ( A5.5.7)
Pe baza acestei ecuații putem face următoarele două observații:
1. ()i PX H
Dˆ este independent de alegerea lui B. astfel pentru a maximiza ()DGLL | trebuie să maximizăm doar
primul termen. Această reprezentare oferă o soluție atrăgătoare, deoarece înseamnă maximizarea corelării
dintre fiecare X i și părinții săi.
2. Reprezentarea ne permite să demonstrăm cu ușurință că rețelele complete maximizează probabilitatea
logaritmică: dacă B` are un superset de arce în B , atunci ∏∏′⊆i i X X , pentru toate i ; deoarece
()()Z Y;X Y;X ∪≤I I , putem spune că ()()DBLL DBLL `| |≤ .
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: ADE – ajutor dispecer energetic AA – alarmă de avarie AMDE – metodă de analiză a modurilor de defectare ANB – Algoritmul Augmented Naive Bayes AMP –… [615200] (ID: 615200)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
