Fiabilitate Si Diagnoza
Gheorghe M.Panaitescu
FIABILITATE SI DIAGNOZǍ
Note pentru studentii
care urmeazǎ cursurile cu frecventǎ redusǎ
Universitatea “Petrol-Gaze” Ploiesti
Catedra Automaticǎ si calculatoare
2007
2
CUVÂNT INTRODUCTIV
Lucrarea aceasta este o versiune scrisǎ amelioratǎ a cursului de Fiabilitate si diagnozǎ, tinut pe durata unui semestru, câte douǎ ore pe sǎptǎmânǎ, la anul V, specializarea Automaticǎ si informaticǎ industrialǎ cursuri de zi, din cadrul Facultǎtii de inginerie mecanicǎ si electricǎ a Universitǎtii “Petrol-Gaze” Ploiesti. Este produsul unei experiente de predare de peste zece ani. Versiunea de fatǎ este revǎzutǎ si, asa cum s-a spus, amelioratǎ în vederea instruirii primelor promotii de la specializarea amintitǎ, care urmeazǎ cursurile cu frecventǎ redusǎ. Într- un plan de învǎtǎmânt mai recent, acest curs a fost introdus ca disciplinǎ optionalǎ si la anul V, specializarea Electronicǎ aplicatǎ, cursuri de zi.
Textul care urmeazǎ se constituie practic într-un manual de Fiabilitate si diagnozǎ. Prin adǎugarea de explicatii si exemple în text si de probleme si exercitii de autoverificare la finalul fiecǎrui capitol se faciliteazǎ accesul studentilor la esenta problemelor de sigurantǎ în functionare a sistemelor.
Studentii au la dispozitie si un Ghid de lucrǎri la aceeasi disciplinǎ, Fiabilitate si diagnozǎ. Ca si prezentele Note, acesta este afisat pe serverul catedrei Automaticǎ si calculatoare, ac.upg-ploiesti.ro, în scopul accesului "on line" de acasǎ sau la facultate în timpul aplicatiilor prevǎzute la aceastǎ disciplinǎ.
4
C U P R I N S
NOTIUNI INTRODUCTIVE 9
Probleme si exercitii de autoevaluare
COMPLEMENTE DE TEORIA PROBABILITǍTILOR SI STATISTICǍ MATEMATICǍ 15
Spatiul evenimentelor
Probabilitǎti
Probabilitǎti conditionate
Variabile aleatoare
Verificarea experimentalǎ a legilor de repartitie
Probleme si exercitii de autoevaluare
INDICATORI DE FIABILITATE 35
Fiabilitatea sistemelor fǎrǎ reînnoire
Uzura
Legi de repartitie utilizate in teoria fiabilitǎtii sistemelor Aproximǎri ale functiilor densitate de repartitie prin exponentiale Aproximarea discretǎ
Probleme si exercitii de autoevaluare
SISTEME CU SCHIMBARE 51
Reînnoirea ca proces aleator
Disponibilitatea sistemelor
Probleme si exercitii de autoevaluare
FIABILITATEA STRUCTURALǍ 59
Tratarea sistemelor prin observarea stǎrii
Tratarea structuralǎ a sistemelor
Metode structurale
Probleme si exercitii de autoevaluare
FIABILITATEA PROGRAMELOR DE CALCUL 71
Generalitǎti
Modelul Jelinski-Moranda
Extinderi ale modelului Jelinski-Moranda Modelele Goel-Okumoto (I) si Musa Modelele Littlewood si Littlewood-Verrall Modele cu ratǎ de defectare variabilǎ Probleme si exercitii de autoevaluare
DIAGNOZA SISTEMELOR SI RECUNOASTEREA FORMELOR
85
Generalitǎti
Recunoasterea formelor prin clasificare, clasificatori
Diagnozǎ prin retele neuronale artificiale
Probleme si exercitii de autoevaluare
6
DIAGNOZǍ PRIN ANALIZA COMPONENTELOR PRINCIPALE
99
Generalitǎti
Analiza Componentelor Principale (ACP)
Detectarea defectiunilor cu ajutorul analizei componentelor principale
Diagnoza prin analiza componentelor principale
Învǎtarea de diagnostice noi
Probleme si exercitii de autoevaluare
DETECTAREA FUNCTIONǍRII NECONFORME SI DIAGNOZA CU FILTRE KALMAN EXTINSE (EKF) 109
Filtre Kalman extinse
Compensarea filtrelor Kalman extinse
Detectarea schimbǎrilor datorate fenomenelor nemodelate
(defectiunilor)
Probleme si exercitii de autoevaluare
SISTEME TOLERANTE LA DEFECTE 117
Memorii ieftine exploatate în conditii de sigurantǎ
Strategia generalǎ
Algoritmul RS-RAID
Calculul si întretinerea cuvintelor de verificare
Recuperarea din crash Aritmetica în câmpurile Galois Sumarul algoritmului
Probleme si exercitii de autoevaluare
BIBLIOGRAFIE 139
8
NOTIUNI INTRODUCTIVE
Sistemele hardware si software sunt create uzual pentru a îndeplini anumite sarcini, pentru a atinge anumite obiective de naturǎ tehnicǎ- tehnologicǎ, din domeniul cunoasterii etc. Este foarte important ca aceste sisteme sǎ functioneze adecvat, adicǎ întreruperile nedorite, necomandate sǎ fie cât mai rare si cât mai scurte, iar dacǎ se produc, depanarea sau înlocuirea sǎ fie posibile, mǎcar una dintre ele si sǎ nu fie excesiv de îndelungate. Desigur, toate aceste conditii trebuie satisfǎcute nuantat deoarece totdeauna sunt implicate costuri. Nu este nici pe departe necesar a se crea sau a se achizitiona un aparat capabil sǎ functioneze practic fǎrǎ cusur ani la rând dacǎ utilizarea lui vizeazǎ câteva sǎptǎmâni. Un asemnea aparat ar costa foarte mult. În asemenea împrejurǎri, este rational a uza de unul mai ieftin, mai putin durabil, dar care în acele sǎptǎmâni este suficient de sigur pentru a servi atingerii telului propus. Problema readucerii sistemului defect la parametrii functionali normali în raport cu obiectivul urmǎrit se poate face, asa cum în treacǎt s-a spus, prin operatii de depanare sau prin înlocuirea integralǎ. Si aici trebuie cumpǎnit prin prisma costurilor: depanarea poate costa uneori mai mult decât înlocuirea, alteori depanarea pur si simplu nu este posibilǎ.
Timpul necesar depanǎrii unui sistem care subit devine nefunctional include si o prealabilǎ diagnosticare care ea însǎsi are o duratǎ uneori semnificativǎ. Un echipament sau un program de calcul defect nu trebuie demontat, reanalizat în întregime ci numai în acea parte a lui sau în acea reuniune de pǎrti vinovatǎ de proasta functionare sau de nefunctionare. Din nou, diagnoza corectǎ este o problemǎ care implicǎ importante
cheltuieli de bani si de timp. Readucerea la standardul functional necesar depinde în mare mǎsurǎ de iscusinta cu care este pus diagnosticul. Este aproape de la sine înteles cǎ punerea diagnosticului si remedierea defectelor nu sunt totdeauna faze succesive. Uneori faza de diagnosticare merge paralel si se împleteste cu operatiile de depanare propriu-zisǎ.
În legǎturǎ cu functionarea sau nefunctionarea sistemelor, fie ele hardware sau software, sunt câteva concepte care trebuie definite cel putin provizoriu încǎ de pe acum. Astfel, se vorbeste de capacitatea operationalǎ a unui sistem în functiune, care nu este altceva decât capacitatea acelui sistem de a îndeplini anumite cerinte operationale, într- un interval de timp dat, în conditii specificate. Fiabilitatea în sens larg sau disponibilitatea unui sistem constǎ în capacitatea lui de a îndeplini corect functiunile pentru care este gândit, la un moment dat sau pe un interval de timp precizat, dacǎ sistemul este folosit, exploatat în anumite conditii si dacǎ este întretinut corespunzǎtor. Mentenabilitatea este capacitatea sistemului de a putea fi mentinut sau repus în functiune într- un timp precizat dacǎ întretinerea sau repararea sunt fǎcute urmând anumite proceduri recomandate si folosind resursele prescrise. Securitatea unui sistem este capacitatea de a prezerva starea de sǎnǎtate a oamenilor, de a nu pune în pericol valori materiale prin functionare defectuoasǎ.
Un sistem poate fi compus din mai multe subsisteme. Functionarea fiecǎrui subsistem se reflectǎ într-un anumit mod în functionarea ansamblului. Relatia întreg-parte, sistem-componentǎ nu poate fi totdeauna definitǎ univoc. În principiu orice sistem este alcǎtuit din pǎrti. Detalierea în pǎrti este de cele mai multe ori la alegerea analistului de sistem. Frecvent pǎrtile corespund unor subunitǎti structurale clar diferentiabile fizic.
Functionarea sistemului este, asa cum s-a spus, într-o anumitǎ relatie cu functionarea pǎrtilor dar nu neapǎrat defectarea unei pǎrti coincide cu scoaterea din functie a întregului sistem. Sistemul poate functiona uneori
si cu unele pǎrti ale lui defecte. Asadar, sistemul poate avea anumite redundante constructive create de cele mai multe ori cu premeditare, care fac ca unele pǎrti sǎ poatǎ suplini alte pǎrti nefunctionale la un moment dat. Desigur, si redundantele costǎ dar ele pot contribui la o importantǎ crestere în siguranta în functionare a sistemului, de cele mai multe ori cu cheltuieli semnificativ mai mici decât cele asociate unui sistem fǎrǎ redundante dar foarte rafinat.
Aceastǎ enumerare sumarǎ de aspecte legate de functionarea în sigurantǎ a sistemelor hardware sau software fǎrǎ deosebire decât cel mult în nuante dau o imagine destul de cuprinzǎtoare a obiectului si obiectivelor acestui curs de Fiabilitate si diagnozǎ.
Definirea bunei functionǎri si a defectǎrilor nu este universalǎ. În toate cazurile functionarea si nefunctionarea sunt situatii/evenimente contrarii. În sens cuprinzǎtor, buna functionare a unui sistem corespunde îndeplinirii unui set de obiective conform destinatiei prin proiect a respectivului sistem. Obiectivele însesi trebuie definite precis pentru a putea defini apoi corect buna functionare a sistemului.
Defectiunile pot fi clasificate în diferite moduri. Dacǎ se considerǎ momentul aparitiei lor defectiunile pot fi:
a) infantile, dacǎ apar în perioada de exploatare de început;
b) de îmbǎtrânire, dacǎ sunt datorate uzurii componentelor sistemului;
c) accidentale, dacǎ sunt datorate unor solicitǎri bruste, întâmplǎtoare;
acestea au o frecventǎ mai micǎ decât cele din celelalte categorii.
Alte posibile clasificǎri ale defectiunilor sunt date în tabelul prezentat în continuare:
Conditiile aparitiei
Provenienta
Posibilitatea eliminǎrii cauzelor
În conditii normale, în conditii
anormale
Din proiectare, din executie, din
exploatare
Eliminabile, neeliminabile
Posibilitatea de utilizare ulterioarǎ a sistemului
Mijlocul de eliminare
Utilizare totalǎ, utilizare partialǎ
Prin schimbarea elementului defect, prin reglare
Frecventa aparitiei Unicǎ, repetatǎ
Posibilitatea de prognozǎ Neprognozabile, prognozabile
Complexitatea interventiilor pentru eliminare
Consecintele
Interventii simple, interventii
complexe
Primejdioase, majore, neprimejdioase,
minore
Modul de depistare Defectiuni vizibile, defectiuni ascunse
Gradul de dependentǎ între
defectiuni
Modificarea caracteristicilor
functionale
Defectiuni dependente, defectiuni mutual independente
Modificare bruscǎ, modificare lentǎ
Pentru mentinerea în functie a sistemelor sau înlocuirea lor oportunǎ existǎ desigur politici, de la caz la caz, în parte sau total diferite. Cursul prezent încearcǎ sǎ stabileascǎ câteva modele adecvate pentru procesul de deteriorare a calitǎtilor functionale ale sistemelor hardware si/sau software si câteva modalitǎti de detectare si de diagnosticare a defectiunilor posibile. Nici utilizarea redundantelor în sistemele complexe si implicit o anumitǎ tolerantǎ la defecte nu este ignoratǎ. Autorul acestor Note de curs nǎdǎjduieste cǎ, pornind de la aceste notiuni mai curând sumare de fiabilitate si diagnozǎ, viitorii ingineri automatisti sau electronisti vor putea dezvolta propriile lor metode si mijloace de tratare a problematicii complexe din domeniu.
Probleme si exercitii de autoevaluare
Exercitiul 1.
Încercati o definire calitativǎ a relatiei între fiabilitatea, disponibilitatea, mentenabiltatea si securitatea unui sistem.
Exercitiul 2.
Încercati o clasificare a disfunctiilor unui sistem în raport cu momentul manifestǎrii lor.
Exercitiul 3.
Încercati o clasificare a defectiunilor unui sistem dupǎ criteriile date în tabelul din corpul capitolului prezent.
14
COMPLEMENTE DE TEORIA PROBABILITǍTILOR SI STATISTICǍ MATEMATICǍ
Siguranta în functionare a diverselor sisteme are un vǎdit caracter aleator. Starea de functionare sau nefunctionare la un moment dat este imprevizibilǎ în sens determinist dar cuantificabilǎ sub aspectul stǎrii probabile a sistemului la acel moment. De aceea, în capitolul prezent sunt (re)aduse în discutie câteva elemente de teoria probabilitǎtilor si de statisticǎ matematicǎ absolut necesare în întelegerea si tratarea consistentǎ a problemelor de fiabilitate si diagnozǎ.
Spatiul evenimentelor
Se noteazǎ cu E spatiul evenimentelor – multimea evenimentelor posibile relative la un experiment.
Exemplu: dacǎ experimentul constǎ în observarea stǎrii de functionare a unui sistem atunci cele douǎ rezultate posibile, sistemul este functional si sistemul este disfunct sunt evenimente.
Între evenimente poate avea loc o relatie de implicatie, scrisǎ A B . Implicatia constǎ în regula: producerea evenimentului A conduce la producerea necesarǎ a evenimentului B. Implicatia reciprocǎ, A B si B A înseamnǎ egalitatea sau echivalenta celor douǎ evenimente.
Cu evenimente se pot face operatii, douǎ binare si una unarǎ, care au ca rezulatate alte evenimente. Acestea sunt respectiv:
Reuniunea, notatǎ A B , cu rezultatul un eveniment care constǎ în producerea a cel putin unuia din cele douǎ evenimente, A sau B; Intersectia, notatǎ A B , cu rezultatul un eveniment care constǎ în producerea ambelor evenimente concomitent, si A, si B;
Luarea complemetarului sau a contrarului unui eveniment A, notat cu A
, care face dintr-un eveniment contrarul lui.
Operatiile binare sunt asociative si comutative si pot fi iterate pentru mai mult de douǎ evenimente.
Între evenimentele unui spatiu se introduc si douǎ evenimente speciale,
– evenimentul imposibil si E – evenimentul sigur.
Relatia A B exprimǎ incompatibilitatea mutualǎ a celor douǎ evenimente. Producerea unuia exclude producerea celuilalt.
E este o multime partial ordonatǎ, relatia de ordine este implicatia. Evenimentele limitǎ inferioarǎ în sirurile ordonate complete se numesc atomi sau evenimente elementare. Celelalte evenimente sunt evenimente compuse. Ele se obtin din alte evenimente, în particular din cele elementare, prin operatiile definite mai sus.
O multime de evenimente E împreunǎ cu operatiile de reuniune, de intersectie si de luare a complementarului, cu evenimentul imposibil si evenimentul sigur incluse se organizeazǎ ca o algebrǎ booleanǎ.
Fie multimea tuturor evenimentelor atomice sau elementare dintr-o multime de evenimente finitǎ E. Evident . Multimea si evenimentele compuse obtinute prin reunirea si intersectarea
evenimentelor elementare se organizeazǎ ca un corp. O submultime a
multimii de pǎrti ale multimii atomice asemenea, ca un corp dacǎ
K P(
) se organizeazǎ, de
A K A, B K A, B K
A K
A B K A B K
În aceste coditii perechea ( , K) este un corp de evenimente si este un – corp sau corp borelian dacǎ orice reuniune sau intersectie de evenimente din K, finitǎ sau infinitǎ apartine multimii K.
Într-un spatiu E complet si atomic, orice eveniment A se poate scrie
ca o reuninune de elemente din :
A i
i
O multime de evenimente Ai
K (i = 1, 2, …, n) mutual incompatibile,
altfel spus care satisfac relatiile Ai
Aj pentru
Ai , A j
K cu i j ,
este o partitie a unui eveniment A
K dacǎ
n
Ai A
i 1
Dacǎ A = atunci evenimentele din familia Ai
K (i = 1, 2, …, n) cu
proprietǎtile mentionate alcǎtuiesc un sistem complet de evenimente.
Probabilitǎti
Pe multimea evenimentelor dintr-un corp K se defineste o functie realǎ P
numitǎ probabilitate, care are proprietǎtile:
P( A)
0 pentru A K
P( ) = 1
P Ai
P( Ai )
cu reuniunea si suma pe toate valorile indicelui i ai unei familii de
evenimente Ai
K , douǎ câte douǎ mutual incompatibile, adicǎ
Ai Aj ori de câte ori i j .
Dacǎ ultima proprietate are loc si pentru reuniuni numerabile atunci probabilitatea P se numeste complet aditivǎ (sau -aditivǎ) pe corpul (borelian) de evenimente ( , K).
Tripletul ( , K, P) se numeste câmp (borelian) de probabilitate. Dacǎ este o multime finitǎ atunci ( , K, P) este un câmp de probabilitate discret.
Probabilitatea P are alte câteva proprietǎti derivate din cele trei de mai
sus.
Probabilitatea evenimentului imposibil
P( ) 0
Relatia dintre probabilitǎtile evenimentelor contrare
P( A)
1 P( A )
Probabilitatea evenimentului diferentǎ, A B A B
P( A B )
P ( A)
P ( A B)
Limitele inferioarǎ si superioarǎ pentru functia P
0 P( A) 1
Probabilitatea evenimentului diferentǎ simetricǎ,
A B ( A B)
(B A)
P( A B)
P( A)
P (B)
2 P( A B )
Probabilitatea reuniunii a douǎ evenimente oarecare
P( A B)
P( A)
P( B)
P( A B)
O extindere a relatiei ultime pentru reuniunea a n evenimente oarecare
este
n
P Ai
n
( 1) j 1
cu S j
P( A
1
i i i n
…
A ) j n
j .
i 1
Dacǎ F
j 1
Ai i I
1 , 2 ,… , j
este o familie numerabilǎ de evenimente mutual
exclusive atunci
P Ai
i I
0 . Dacǎ familia F
Ai i I
este si
exhaustivǎ, adicǎ este un sistem complet de evenimente, atunci
P Ai 1.
i I
Probabilitǎti conditionate
Evenimentele se pot conditiona reciproc. Producerea unui eveniment poate modifica probabilitatea de producere a unui alt eveniment. Relatia
de bazǎ pentru calculul unei probabilitǎti conditionate este
PB ( A)
P( A / B)
P( A
B) / P(B)
cu evenimentul care conditioneazǎ trecut ca indice sau, în argument, dupǎ caracterul despǎrtitor "/".
În general,
p( A / B )
P ( A) si P(B / A)
P( B)
ceea ce indicǎ o dependentǎ între cele douǎ evenimente. Dacǎ are loc egalitatea în ambele cazuri, atunci evenimentele sunt independente.
Dacǎ probabilitatea unei intersectii finite de evenimente este nenulǎ
n
P Ai 0
i 1
atunci probabilitatea respectivǎ se poate calcula cu formula
n
P Ai
i 1
n 1
P An / Ai
i 1
P( A2 / A1 )P ( A1 )
care se demonstreazǎ inductiv.
Dacǎ ( Ai )i 1, n
este o partitie a câmpului atunci probabilitatea unui
eveniment oarecare se poate calcula cu relatia
P( A)
n
P( Ai ) P ( A / Ai )
i 1
cunoscutǎ ca formula probabilitǎtii totale. Mai este de retinut formula lui Bayes:
P( Ai / A)
P( Ai ) P( A / Ai ) /
n
P( Ai ) P( A / Ai )
i 1
care în aceleasi conditii, ( Ai )i 1, n
o partitie a câmpului , permite calculul
probabilitǎtii fiecǎrui eveniment al partitiei conditionat de evenimentul
A K , altfel oarecare.
Variabile aleatoare
Variabilǎ aleatoare este o functie X :
R astfel încât
{X x} {
/ X ( )
x} K x R
Un exemplu de variabilǎ aleatoare îl constituie functia indicator a unui
eveniment A K
0 A
A 1 A
Dacǎ X este o variabilǎ aleatoare definitǎ pe câmpul ( , K, P) atunci
pentru oricare douǎ valori x1 , x2
R, x1
x2 toate intervalele finite sau
infinite delimitate de cele douǎ valori corespund unor evenimente din K
si, prin generalizare, pentru orice multime I, reuniune de intervale din R, se poate calcula
PX ( I )
P[ X ( ) I ]
P[ X
1 ( I )]
Functia PX(I) este distributia de probabilitate a variabilei aleatoare X. Se poate vorbi asadar de PX ca de o probabilitate definitǎ pe câmpul (R, KX)
în care K X
I R / X
1 (I ) K .
Dacǎ variabila aleatoare X ia valori într-o multime cel mult numerabilǎ
{xi / xi
atunci ea se numeste discretǎ si
i I
R, i I , I N }
PX (xi ) 1
PX (J )
xi J
PX (xi )
J K X
Dacǎ X variazǎ continuu pe un interval I
K X atunci
PX ( I )
si este o functie absolut continuǎ.
f X ( x)dx
I
Functia f X ( x) este densitatea de probabilitate sau densitatea de
repartitie a variabilei X, este nenegativǎ pentru orice x si are proprietatea
f X ( x )dx 1
Functia care urmeazǎ se numeste functie de repartitie a variabilei
aleatoare X
FX (x)
P[ X ( ) x]
PX [( , x)]
Functia este nedescrescǎtoare pe întreaga axǎ realǎ
a b FX (a)
FX (b)
a,b R
si este continuǎ la stânga în fiecare punct lim
x a , x
a FX
( x)
FX (a) a R
Valorile minimǎ si maximǎ sunt date de
lim
lim
x FX
( x) 0
x
FX (x) 1
Eventualele discontinuitǎti sunt de speta primǎ si sunt cel mult numerabile.
Orice functie cu proprietǎtile de mai sus are corespondent un câmp de probabilitate.
Pentru o variabilǎ aleatoare discretǎ functia de repartitie este o functie în
scarǎ
FX (x)
x i x
PX ( xi )
Pentru o variabilǎ aleatoare continuǎ sunt valabile în general relatiile
FX ( x)
x
f X ( x)dx, f X
(x)
d F ( x)
dx
Pentru orice interval [a, b)
PX {[a, b)}
R
FX (b)
FX (a) si PX (a ) 0
Se noteazǎ cu V( , K, P) multimea tuturor variabilelor aleatoare definite pe câmpul de probabilitate ( , K, P). Evident, existǎ foarte multe
asemenea variabile.
Dacǎ variabilele aleatoare
X ,Y
V ( , K , P) , atunci suma, produsul celor
douǎ variabile aleatoare, modulul, puterea, în general o functie mǎsurabilǎ Borel de oricare dintre ele sunt variabile aleatoare din multimea V( , K, P).
Dependenta a douǎ variabile aleatoare din aceeasi familie V( , K, P) se poate exprima printr-o formulǎ asemǎnǎtoare cu cea a probabilitǎtii
conditionate a evenimentelor:
P( X A / Y B)
P ( X A,Y B) / P(Y B)
cu A
K X si B
KY . Într-o manierǎ asemǎnǎtoare se pot defini functii
de repartitie conditionate.
Variabilele aleatoare sunt descrise uneori prin asa-numitele momente. Momentele ordinare se calculeazǎ cu relatia
r r i i
i
dacǎ este vorba de o variabilǎ aleatoare discretǎ si suma se calculeazǎ pe toate valorile xi pe care variabila le poate lua, sau cu relatia
m x r f ( x)dx
dacǎ variabila este de tip continuu. Numǎrul r este totdeauna un numǎr natural si se vorbeste de momentul de ordinul r al variabilei, trecut în formulele date si ca indice al momentului calculat.
Între momentele obisnuite, ordinare se retine momentul de ordinul 1, care se mai numeste si media variabilei aleatoare. În notatia curentǎ indicele r
= 1 se omite si de aceea pentru medie se utilizeazǎ deseori notatia m. Momentele centrate sunt similare celor ordinare dar sunt calculate pentru abaterile de la media m definitǎ mai devreme. Astfel, pentru variabile discrete se scrie
M r pi ( xi
i
m) r
pentru variabilele continue se scrie
M r ( x
m) r f (x)dx
iarǎsi cu r un numǎr natural.
Cazul r = 2 particularizeazǎ momentul centrat la asa-numita dispersie sau variantǎ a variabilei aleatoare, care este notatǎ uzual cu .
Media si dispersia sunt importante sub aspect practic pentru cǎ sunt valori
care dau mǎsura modului în care valorile unei variabile aleatoare se grupeazǎ. Valorile efectiv luate de o variabilǎ aleatoare se grupeazǎ în jurul mediei, iar gruparea aceasta poate fi mai strânsǎ sau mai largǎ dupǎ cum dispersia variabilei este mai micǎ sau mai mare. Din observatii experimentale se pot evalua media valorilor observate, o medie experimentalǎ, care tinde în probabilitate cǎtre media teoreticǎ m si o
dispersie empiricǎ estimatoare a dispersiei (teoretice) 2.
Sunt date în continuare câteva exemple de legi de repartitie pentru variabile aleatoare de tipuri variate.
P R O B A B IL ITA TI
1
0 . 8
0 . 6
0 . 4
0 . 2
0
0 1 2 3 4 5 6 7
F U N C TIA D E R E P A R TITIE
1
0 . 8
0 . 6
0 . 4
0 . 2
0
0 1 2 3 4 5 6 7
x
O variabilǎ aleatoare asociatǎ cu zarul perfect
O repartitie discretǎ uniformǎ este aceea asociatǎ zarului perfect aruncat pe o suprafatǎ planǎ orizontalǎ. Celor sase evenimente atomice asociate cu cele sase fete ale zarului li se pot asocia valori oarecare, reale, în numǎr de cel mult sase, în particular chiar numǎrul de puncte, 1, 2, 3, 4, 5 sau 6, observate pe fata de deasupra la fiecare aruncare. Diagramele alǎturate aratǎ probabilitǎtile asociate valorilor pe care variabila le ia efectiv si functia ei de repartitie.
Alte câteva legi de repartitie teoretice, foarte utilizate si în modelarea fiabilitǎtii sistemelor sunt prezentate pe scurt în continuare.
Dintre legile de repartitie pentru variabile aleatoare discrete sunt de mentionat legea binomialǎ sau legea lui Bernoulli si legea lui Poisson. Legea binomialǎ se referǎ la o variabilǎ aleatoare m care ia un numǎr finit de valori exclusiv în multimea numerelor naturale. Probabilitǎtile sunt
calculate cu relatia
m m n m
P(m)
Cn p (1 p)
cu 0 m n si p un numǎr în intervalul [0,1]. Se observǎ si motivul pentru care legea se numeste “binomialǎ”: probabilitǎtile P(m) sunt termeni din dezvoltarea puterii a n-a a binomului [p + (1 – p)]. Variabila aleatoare m are media np si dispersia np(1 – p). Modelul fizic generator al acestor numere naturale aleatoare îl constituie o urnǎ cu bile de douǎ culori. Evenimentele constau în extragerea repetatǎ a câte unei bile dupǎ care bila extrasǎ este reintrodusǎ în urnǎ. Variabila m reprezintǎ numǎrul bilelor de o anumitǎ culoare din cele douǎ, în n extrageri succesive, conform schemei cu bila returnatǎ. Numǎrul p reprezintǎ proportia de bile de acea culoare în urnǎ, cu alte cuvinte probabilitatea de obtinere la o extragere simplǎ a unei bile de culoarea respectivǎ.
Legea Poisson se referǎ la o variabilǎ aleatoare m care ia de data aceasta un numǎr infinit de valori, toate numere naturale. Probabilitǎtile de
aparitie a diferitelor valori se calculeazǎ cu relatia
P(m)
m
exp( )
m!
în care este un parametru real strict pozitiv. Media variabilei este , dispersia ei este, de asemenea, . Un modelul fizic îl reprezintǎ numǎrul dezintegrǎrilor radioactive, numǎrul de apeluri telefonice solicitate într-o
centralǎ etc. într-un interval de timp precizat, scurt.
D E N S ITA TE A D E P R O B A B IL ITA TE
1
0 . 8
0 . 6
0 . 4
0 . 2
0
-1 -0 . 5 0 0 . 5 1 1 . 5 2
F U N C TIA D E R E P A R TITIE
1
0 . 8
0 . 6
0 . 4
0 . 2
0
-1 -0 . 5 0 0 . 5 1 1 . 5 2
x
Legea de repartitie uniformǎ
O variabilǎ aleatoare de tip continuu interesantǎ este aceea care este uniform repartizatǎ pe un inteval finit. Valorile pe care le poate lua o asemenea variabilǎ au sanse egale de a apǎrea experimental. Functia de repartitie nu poate fi altfel decât linarǎ: ea este integrala unei functii constante pe intervalul valorilor posibile ale variabilei aleatoare, nule pentru alte valori. Intervalul [a, b], altfel oarecare dar cu a < b poate fi redus la intervalul standard [0, 1] prin relatia simplǎ
x’ = (b – x)/(b – a)
Trecerea inversǎ este imediatǎ. Figurile alǎturate cuprind graficul functiei densitate de repartitie si graficul functiei de repartitie a unei variabile aleatoare uniform repartizatǎ pe intervalul [0, 1].
Practic toate limbajele de programare evoluate au implementatǎ sub diferite nume (random, rand etc.) o functie generatoare de numere (pseudo)aleatoare uniform repartizate în intervalul [0, 1]. Pentru simularea fenomenelor aleatoare diverse aceastǎ functie este de mare utilitate.
O altǎ lege de repartitie care descrie o variabilǎ aleatorea de tip continuu este legea normalǎ sau legea gaussianǎ. Aceastǎ lege de repartitie este de importantǎ fundamentalǎ în calculul probabilitǎtilor si în statistica matematicǎ si are multiple aplicatii practice. Aproape ori de câte ori factori întâmplǎtori numerosi actioneazǎ asupra unui sistem, actiunea combinatǎ a acestora este perceputǎ prin fenomene cantitative decrise foarte bine de legea normalǎ cunoscutǎ si sub denumirea de legea lui
Gauss.
D E N S ITA TE A D E P R O B A B IL ITA TE
1
0 . 8
0 . 6
0 . 4
0 . 2
0
-3 -2 -1 0 1 2 3
F U N C TIA D E R E P A R TITIE
1
0 . 8
0 . 6
0 . 4
0 . 2
0
-3 -2 -1 0 1 2 3
x
Legea de repartitie normalǎ
Expresia functiei densitate de probabilitate (densitate de repartitie) pentru
o variabilǎ normalǎ (gaussianǎ) x este
( x m )2
f (x)
1 e 2 2
2
Media si dispersia ei apar explicit ca parametrii ai functiei densitate: media este m, dispersia este 2. În figurile alǎturate sunt reprezentate cele douǎ functii pereche, functia densitate de repartitie si functia de repartitie pentru o variabilǎ normal distribuitǎ, de medie nulǎ si cu dispersia egalǎ cu unitatea. Aceastǎ variabilǎ este numitǎ variabila normalǎ normatǎ. Desi
ar putea pǎrea particularǎ ea este, dimpotrivǎ, foarte generalǎ. Orice
variabilǎ normalǎ de medie m si de dispersie 2 poate fi redusǎ la o variabilǎ normatǎ prin formula simplǎ
z = (x – m)/
Dupǎ utilizarea variabilei z de medie zero si de dipsersie unitarǎ, tabelatǎ si implementatǎ pe calculatoare, se revine printr-o relatie la fel de simplǎ la variabila originarǎ x.
Legile de repartitie sunt, desigur, numeroase si modelarea unui fenomen aleator natural cu o lege matematicǎ adecvatǎ reprezintǎ uneori o problemǎ.
Verificarea experimentalǎ a legilor de repartitie
Observarea unui fenomen aleator conduce uzual la acumularea unor date experimentale în volum fatalmente finit. Aceste date, sǎ admitem cǎ ele sunt în numǎr de n, se pot folosi la aprecierea reprezentativitǎtii unei anumite legi de repartitie pentru fenomenul observat.
Fie t variabila aleatoare observatǎ. Dacǎ axa t este împǎrtitǎ în m intervale, valorile observate pot fi sortate si numǎrate pe fiecare din aceste intervale obtinându-se frecventele nk si frecventele relative nk /n pentru fiecare interval Ik (k = 1, 2, …, m).
Dacǎ se admite cǎ densitatea de repartitie este f(t) atunci se pot calcula
probabilitǎtile
asociate fiecǎrui interval Ik.
pk f (t )dt
I k
Frecventele relative sunt estimǎri experimentale ale probabilitǎtilor pentru fiecare din aceste intervale. Se constatǎ, desigur, diferente între probabilitǎti si estimǎrile lor. Aceste diferente pot servi la formularea unor ipoteze privind adecvarea modelului teoretic la experimentul observat.
O modalitate de decizie asupra acestei adecvǎri se bazeazǎ pe retinerea diferentei celei mai importante în valoare absolutǎ si compararea ei cu tabele specifice care dau anumite norme în ceea ce priveste abaterea maximǎ îngǎduitǎ. Este vorba aici de utilizarea testului Kolmogorov- Smirnov.
O altǎ posibilitate mai larg utilizatǎ este aceea care folseste variabila 2, o variabilǎ aleatoare care se prezintǎ ca o sumǎ de pǎtrate ale unor variabile z normale normate independente si este caracterizatǎ de un numǎr de grade de libertate egal cu numǎrul termenilor însumati. Matematicienii
statisticieni au stabilit cǎ suma
m 2
2 k k
k 1 npk
este într-adevǎr o variabilǎ 2 cu m grade de libertate. Valorile de provenientǎ experimentalǎ sunt comparate cu valori tabelare asociate unor nivele de semnificatie date (uzual 95%). Pentru a accepta ipoteza cǎ o lege de repartitie este reprezentativǎ pentru variabila aleatoare observatǎ este necesar ca valoarea 2 calculatǎ sǎ fie sub valoarea corespunzǎtoare nivelului de semnificatie ales, indicatǎ de tabele sau evaluatǎ direct.
Variabile aleatoare multidimensionale
Variabilele aleatoare din expunerea teoreticǎ sau din exemplele prezentate mai sus au fost pânǎ acum simple, adicǎ a fost vorba în toate cazurile de o
singurǎ aplicatie X :
R legatǎ de un unic câmp de probabilitate (
K P). Se pot imagina variabile aleatoare cu mai multe componente, variabile sub forma unor vectori cu componente aleatoare definite relativ la un acelasi câmp de probabilitate sau la câmpuri de probabilitate diferite. Astfel legea urmǎtoare se referǎ la o variabilǎ aleatoare vectorialǎ.
Legea normalǎ n-dimensionalǎ datǎ de densitatea de repartitie
f (x)
1 e
n
1 ( x m )T W
2
1 ( x m )
(2 ) 2
det W
cu media m, un vector cu n componente, si cu matricea de covariatie W, o matrice (nxn) pozitiv definitǎ. Pentru ca exemplul sǎ aibǎ consistenta necesarǎ trebuie definitǎ mai exact matricea W.
Este de comentat în prealabil problema corelatiei a douǎ variabile aleatoare care pot fi independente, caz în care valorile uneia nu influenteazǎ în nici un fel valorile pe care le poate lua cealaltǎ, dar pot fi mai mult sau mai putin dependente ceea ce înseamnǎ cǎ dacǎ una din variabile a luat o valoare atunci legea de repartitie a celeilalte se modificǎ în functie de acea valoare a primei variabile.
Fiind date douǎ variabile aleatoare x si y de medii nule, media produsului lor M(xy) se numeste covariatie. Dacǎ covariatia este nulǎ se poate spune în general cǎ cele douǎ variabile nu sunt corelate. Dimpotrivǎ, dacǎ M(xy)
≠ 0 variabilele sunt corelate, existǎ o corelatie între ele, existǎ o dependentǎ între valorile pe care ele le iau în sensul arǎtat putin mai devreme. Dacǎ mediile sunt diferite de zero, afirmatia si definitia se mentin pentru abaterile de la medie. Întrucât covariatia M(xy) poate lua
valori foarte diferite, pentru o apreciere cantitativǎ mai riguroasǎ a tǎriei corelatiei se utilizeazǎ coeficientul de corelatie
M ( xy)
M ( x2 ) M ( y2 )
care ia valori în intervalul [–1, 1] si în expresia cǎruia se disting dispersiile celor douǎ variabile, M(x2) si M(y2). O valoare pentru apropiatǎ de extremele intervalului indicǎ o corelatie strânsǎ, o valoare apropiatǎ de zero exprimǎ o corelatie slabǎ.
Componentele unui vector aleator, privite ca variabile aleatoare simple
sunt mutual mai mult sau mai putin corelate. Se defineste ca matrice a covariatiilor unui vector aleator x media produsului dintre vector si transpusul sǎu M(xxT). Se obtine o matrice pǎtratǎ simetricǎ care are pe diagonalǎ dispersiile individuale ale componentelor vectorului aleator. Aceasta este matricea W a covariatiilor utilizatǎ în particular în expresia densitǎtii de repartitie a variabilei aleatoare normale multidimensionale din exemplul de mai sus. Dacǎ matricea covariatiilor este diagonalǎ (are toate elementele nule cu exceptia celor de pe diagonala principalǎ) atunci componentele sunt mutual independente. Împǎrtirea fiecǎrui element al matricei covariatiilor cu produsul abaterilor medii pǎtratice ale componentelor vectorului x care corespund pozitiei în matrice produce o matrice a coeficientilor de corelatie, cu 1 pe diagonalǎ, cu valori in intervalul [–1, 1] în rest.
Pentru variabilele aleatoare vectoriale cu componente continue se defineste o functie de repartitie printr-o integralǎ multiplǎ, o extindere a integralei din cazul variabilelor simple.
Probleme si exercitii de autoevaluare
Problema 1.
Se alege la întâmplare o lunǎ a anului. Apoi se alege o zi din acea lunǎ tot la întâmplare (se admite cǎ anul nu este bisect).
a) Descrieti toate rezultatele (lunǎ, zi) care formeazǎ spatiul evenimentelor pentru acest experiment aleator
b) Care este probabilitatea ca luna sǎ fie de 31 de zile?
c) Care este probabilitatea ca ziua aleasǎ sǎ fie între a zecea
(inclusiv) si a douǎzecea (inclusiv)?
d) Care este rǎspunsul la punctul c. dacǎ anul este bisect?
Problema 2.
Fie A, B evenimente produse de un acelasi experiment aleator. Dacǎ probabilitatea ca cel putin unul din cele douǎ evenimente sǎ se producǎ este 0,7 si dacǎ probabilitatea ca cel putin unul din cele douǎ evenimente sǎ nu se producǎ este 0,6, calculati probabilitatea ca exact unul dintre cele douǎ evenimente sǎ se producǎ.
Problema 3.
Trei evenimente A, B, C asociate cu un anumit experiment aleator satisfac relatiile urmǎtoare:
P(A) = 0,25; P(B) = 0,2; P(C) = 0,25
P(A B) = 0,1; P(A B C) = 0,05; P(A C) = 2P(B C) Probabilitatea ca cel putin douǎ din evenimentele A, B, C sǎ se producǎ este 0,3
a) Calculati probabilitatea ca nici unul dintre cele trei evenimente
sǎ nu se producǎ
b) Calculati probabilitatea ca sǎ se producǎ exact unul dintre cele trei evenimente
Problema 4.
Se aruncǎ douǎ zaruri, unul corect, altul incorect. Cel incorect are probabilitǎtile fetelor cu 1, 2, 3, 4, 5, 6 puncte nu egale ci P(1) = P(2) = P
(3) = 2P(4) = 2P(5) = 2P(6). Fie X variabila aleatoare care ia valorile de pe zarul corect si Y variabila aleatoare care ia valori conform zarului incorect.
a) Calculati probabilitǎtile asociate valorilor variabilei aleatoare Y
b) Calculati valorile medii si dispersiile celor douǎ variabile aleatoare X
si Y
c) Fie Z variabila aleatoare Z = X – Y. Valorile posibile ale lui Z sunt 0,
±1, ±2, ±3, ±4, ±5. Evaluati probabilitǎtile P(Z = 0), P(Z = ±1), P(Z =
±2), P(Z = ±3), P(Z = ±4), P(Z = ±5). Faceti o diagramǎ P(Z = z) cu z
în abscisǎ, pentru z = 0, ±1, ±2, ±3, ±4, ±5.
d) Fie S o secventǎ de 36 de perechi (i, j), cu i = 1, 2, 3, 4, 5, 6 valori ale variabilei aleatoare X, cu j = 1, 2, 3, 4, 5, 6 valori ale variabilei aleatoare Y. În altǎ exprimare X(i, j) = i, Y(i, j) = j pentru oricare din perechile (i, j) S. Fie evenimentul Z = 4. Calculati probabilitatea ca evenimentul acesta sǎ nu aparǎ nici mǎcar o datǎ într-o asemenea secventǎ.
Problema 5.
O variabilǎ aleatoare continuǎ X are functia de densitate de probabilitate
f X ( x)
2x x
0 x
[0,1]
R \ [0,1]
a) Verificati cǎ functia de mai sus este într-adevǎr o densitate de probabilitate.
b) Calculati media si dispersia variabilei aleatoare.
c) Comparati valorile de la punctul anterior cu media, respectiv dispersia unei variabile aleatoare continue uniform repartizatǎ pe intervalul [0,1].
Problema 6.
Fie X o variabilǎ aleatoare continuǎ cu densitatea de probabilitate
f X ( x)
e x x 0
0 x 0
(legea de repartitie exponentialǎ).
a) Verificati cǎ functia de mai sus este o densitate de probabilitate (sub alt nume, o densitate de repatitie).
b) Stabiliti functia de repartitie a variabilei X
c) Calculati probabilitatea ca variabila X sǎ ia valori cuprinse între 1 si 2. d) Calculati media si dispersia variabilei X.
Exercitiul 1.
Se dau densitǎtile de repartitie
f1 (x )
1 x
0 în
[0,1]
rest si
f 2 ( x)
2x x
0 în
[0,1]
rest .
Se noteazǎ cu 2 , respectiv cu 2
dispersiile celor douǎ variabile
1 2
aleatoare care au repartitiile descrise de f1(x), f2(x). Marcati în seventa de mai jos relatia corectǎ între cele douǎ dispersii.
Exercitiul 2.
a) 2
2 ; b) 2
2 ; c) 2 2
Se dǎ o variabilǎ aleatoare Z care este suma a douǎ variabile aleatoare X si
Y de medii nule si de dispersii 2 , respectiv 2 . Dispersia 2 a
X Y Z
variabilei Z este suma dispersiilor celor a douǎ variabile aleatoare X si Y
a) totdeauna, b) niciodatǎ, sau
c) numai atunci când X si Y sunt variabile aleatoare independente?
Exercitiul 3.
Care din legile de repartitie binomialǎ, poissonianǎ, uniformǎ pe un interval, normalǎ se referǎ la variabile aleatoare de tip discret?
a) binomialǎ si poissonianǎ,
b) poissonianǎ, si uniformǎ pe un interval, c) uniformǎ pe un interval si normalǎ
34
INDICATORI DE FIABILITATE
Dacǎ T este durata de functionare a unui sistem pânǎ la defectare atunci F (t) este notatia pentru functia de repartitie a varibilei aleatoare T si este probabilitatea ca durata de functionare sǎ fie mai micǎ decât valoarea t. Complementara probabilitǎtii de defectare este functia de fiabilitate R(t) care reprezintǎ probabilitatea ca sistemul sǎ functioneze corect în
intervalul (0, t):
R(t) = 1 – F(t)
Ambele functii se referǎ la evenimente care se produc în intervalul specificat si nu în momentul t. Ele sunt o notatie mai simplǎ pentru douǎ functii de interval: F(0, t) si R(0, t).
Pentru un interval oarecare de duratǎ x care începe la momentul t,
probabilitatea de defectare este
F (t, t x)
P(t T
t x)
F (t
x) F (t )
si apare ca o probabilitate asociatǎ intervalului (t, t + x) scrisǎ în conditia certitudinii unei functionǎri corespunzǎtoare pânǎ la momentul t. Relaxarea absolut necesarǎ a conditiei de certitudine, care oricum nu
poate exista, conduce natural la o formulǎ de probabilitate conditionatǎ
F (t , t x )
P(t T t x) / P(T t ) [ F (t x)
F (t )] / R (t )
si analog, pentru functia de fiabilitate
R(t ,t x)
P(T t x) / P (T t )
R(t x) / R(t )
Functia R(t, t + x) se mai numeste si functia de fiabilitate remanentǎ.
Functia de distributie F(t) poate avea o derivatǎ
f (t)
lim
t
F (t t) F (t )
0 t
dF (t )
dt
care este o densitate de probabilitate cu semnificatia de probabilitate de defectare în intervalul (t, t + t) când întinderea lui tinde cǎtre zero. Densitatea de probabilitate dǎ uzual numele distributiei si dǎ sens cantitativ probabilitǎtii de defectare în jurul momentului t.
Pentru descrierea pericolului de defectare în jurul unui moment dat se
defineste rata de defectare
z(t )
lim
F (t t ) F (t)
f (t )
t 0 R(t ) t
R(t )
care printr-o înlocuire de-acum familarǎ devine
z(t )
1 dR
R(t ) dt
Relatia ultimǎ tratatǎ ca o ecuatie diferentialǎ si integratǎ conduce la
R(t )
t
z ( u ) d u
e 0
relatie de mare importantǎ între indicatorii de fiabilitate.
Media timpului de functionare este
si dupǎ o integrare prin pǎrti
m tf (t )dt
0
m R (t )dt
0
Aceasta este media timpului pânǎ la defectare (Mean Time To Failure – MTTF). Defectarea este presupusǎ unicǎ. În cazul readucerii (repetate) a sistemului la parametrii initiali, dupǎ fiecare defectare se poate vorbi de timpul mediu între douǎ defectǎri succesive (Mean Time Between Failure
– MTBF). În cazul readucerii sistemului într-o stare diferitǎ de cea initialǎ media m se referǎ la timpul mediu pânǎ la prima defectare (Mean Time To First Failure – MTTFF). S-au dat aici si denumirile în limba englezǎ si prescurtǎrile lor deoarece în multe lucrǎri din domeniu atât denumirile cât si prescurtǎrile sunt utilizate ca atare.
1 . 4
1 . 2
1
0 . 8
0 . 6
0 . 4
0 . 2
0
0 2 4 6 8 1 0 1 2 1 4 1 6 1 8 2 0
D u ra t a (u . t . )
O altǎ medie importantǎ este
m(t)
R(t , t x)dx
0
1
R (t )
R (u)du
Aceasta este media timpului de functionare rǎmas pânǎ la defectarea unui sistem. Pentru t = 0, media ultimǎ coincide cu media din relatia anterioarǎ.
Se calculeazǎ uneori si o dispersie a timpului de functionare
D (t m)2 f (t )dt; D
0
Aceastǎ dispersie mǎsoarǎ gradul de uniformitate a performantelor unor sisteme identice. O tenhologie bine pusǎ la punct în productia acelor sisteme conduce la dispersii mici.
Se pot defini, de asemenea, cvantile ale timpului de functionare ca solutii
ale ecuatiei F (t
) cu o probabilitate specificatǎ, legatǎ de cele mai
multe ori de un timp de garantie.
1
0 . 9
0 . 8
0 . 7
0 . 6
0 . 5
0 . 4
0 . 3
0 . 2
0 . 1
0
0 2 4 6 8 1 0 1 2 1 4 1 6 1 8 2 0
D u ra t a (u .t . )
În evaluarea a douǎ sisteme sub aspectul fiabilitǎtii se comparǎ mai multi parametri, în raport cu situatia concretǎ. În figura alǎturatǎ sistemul 1 este potrivit pentru o duratǎ de utilizare limitatǎ, inferioarǎ celei care corespunde punctului de intersectie a graficelor pentru fiabilitǎti; sistemul
2 este potrivit unei misiuni tehnologice nedefinite ca duratǎ. Se mai pot compara mediile timpilor de functionare pânǎ la prima defectare si alte valori caracteristice.
Uzura
Uzura este un fenomen fizic prezent în foarte multe sisteme de tipul hardware. Sistemele software sunt fǎrǎ uzurǎ. Pentru acestea nu existǎ un echivalent al uzurii fizice din cazul sistemelor hardware. Uzura moralǎ a unor programe despre care se vorbeste adesea nu intrǎ în preocupǎrile prezentului curs.
Uzura (fizicǎ) este calificatǎ drept pozitivǎ dacǎ functia de fiabilitate R(t, t + x) este descrescǎtoare cu t pe intervalul (0, ∞) pentru orice x ≥ 0. Asadar, pentru un sistem cu uzurǎ pozitivǎ fiabilitatea scade cu cresterea vârstei. Invers, sistemul este cu uzurǎ negativǎ dacǎ functia R(t, t + x) este crescǎtoare cu t pentru orice x ≥ 0.
Transferând definitia în termeni de ratǎ de defectare, care se poate scrie si
sub forma
z(t )
lim
x 0
R(t ) R(t x)
xR(t )
lim
x 0
R(t, t x)
x
se considerǎ cǎ sistemul este cu uzurǎ pozitivǎ dacǎ rata de defectare z(t)
este o functie crescǎtoare si cu uzurǎ negativǎ dacǎ z(t) este descrescǎtoare. Invers, din relatia
t x
z( u) d u
R(t ,t x) e t
se deduce relatia de crestere/descrestere a functiei de fiabilitate si a ratei de defectare în cazurile uzurii pozitive sau negative.
Uzura medie. Se numeste sistem cu uzurǎ medie pozitivǎ un sistem
pentru care functia (1 / t ) ln(1 / R )
este crescǎtoare în timp. Functia are o
t
scriere echivalentǎ, (1 / t )
0
z(u)du , care are în vedere rata defectǎrilor.
Sistemele cu functia mentionatǎ descrescǎtoare sunt sisteme cu uzurǎ medie negativǎ. Sub aspect practic, sistemele cu uzurǎ pozitivǎ sunt afectate de un proces de deteriorare functionalǎ progresivǎ, iar sistemele
cu uzurǎ negativǎ functioneazǎ din ce în ce mai bine pe mǎsura trecerii
timpului. Lipsa de variatie, constanta functiei (1 / t ) ln(1 / R )
cu lipsa uzurii.
echivaleazǎ
Uzura pozitivǎ nu face defectarea sistemului iminentǎ la un anumit moment cum nici uzura negativǎ nu exclude defectarea pânǎ la un anumit moment. Fenomenul defectǎrii rǎmâne aleator, imprevizibil, numai parametrii legilor de repartitie se modificǎ diferit într-un caz sau în celǎlalt.
În lucrǎrile de specialitate în limba enlgezǎ sau în alte limbi, pentru a califica un sistem din punct de vedere al uzurii se utilizeazǎ unele prescurtǎri mai mult sau mai putin consacrate care sunt reproduse imediat:
IFRA – Increasing Failure Rate Average – medie a ratei de defectare crescǎtoare
DFRA – Decreasing Failure Rate Average – medie a ratei de defectare descrescǎtoare
IFR – Increasing Failure Rate – ratǎ de defectare crescǎtoare
DFR – Decreasing Failure Rate – ratǎ de defectare descrescǎtoare Aceste calificative sunt în relatia IFR IFRA, DFR DFRA. Implicatiile nu sunt valabile si invers.
Demonstratie. Dacǎ un sistem este IFR atunci functia ln[1/R(t)] este
convexǎ
ln 1
R(t )
t
z(u)du
0
ln 1
R(t )
z(t )
ln 1
R(t)
z (t) 0
derivata unei functii convexe pozitive care trece prin origine este crescǎtoare pe intervalul (0, ∞) si atunci se poate afirma cǎ functia
ln 1
R(t )
ln 1
R(0)
t
este crescǎtoare pe acelasi interval. Acelasi mers al demonstratiei pentru
DFR tinând seama de concavitatea functiei ln[1/R(t)].
În ipoteza cǎ functia ln[1/R(t)] nu este derivabilǎ, de pildǎ în cazul sistemelor cu ratǎ de defectare constantǎ pe portiuni, implicatiile de mai sus rǎmân valabile.
Sistemele cu degradare sunt sisteme pentru care functia de fiabilitate relativǎ la o utilizare de duratǎ x care începe la momentul t este mai micǎ decât functia de fiabilitate pentru intervalul (0, x) oricare ar fi vârsta t si
oricare ar fi durata x
R(t ,t x)
R( x),
t, x 0
cu alte cuvinte, dupǎ utilizare un asemenea sistem este inferior unuia nou (NBU – New Better than Used. Un sistem IFR este NBU dar nu totdeauna si invers (exercitiu).
Se poate vorbi si de sisteme fǎrǎ degradare (NWU – New Worse than
Used), pentru care
R(t ,t x)
R( x),
t, x 0
cu implicatia DFR NWU dar nu si reciproc.
Asadar calitǎtile NBU (NWU) sunt mai generale decât IFR (DFR) si chiar decât IFRA (DFRA). Ultima afirmatie se sustine prin demonstratia care
urmeazǎ.
Prin definitie un sistem IFRA are functia (1 / t ) ln(1 / R )
crescǎtoare si,
implicit, [1 / R]1 / t crescǎtoare si [ R(t )]1/ t
atunci
descrescǎtoare. Se poate scrie
1 1
si apoi
[ R(t x)]t x
[R (t )]t
x
R(t , t x) [R (t )] t
deoarece R(t, t + x) = R(t + x)/R(t).
Pentru un x
[0, t ] are loc
1 1
[ R(t )]t
[R (x)] x
si apoi, tinând seamǎ de relatia anterioarǎ, rezultǎ
1 . x
R(t , t x) [R (x)] x
R( x)
ceea ce exprimǎ calitatea de NBU a sistemului.
Fie acum x > t. Cum functia [ R(t )]1/ t
este descrescǎtoare, se poate scrie
1 1
[ R(t )]t
[R (x)] x
si apoi din relatiile de mai sus se poate scrie iarǎsi
1 1
si mai departe
[ R(t x )]t x
[R( x)] x
dar, de data aceasta
t
R( x, x t ) [R (x)] x
1 1
de unde rezultǎ
[ R( x)]x
[ R(t )]t
R( x, x t )
R(t)
ceea ce înseamnǎ, din nou, cǎ sistemul este NBU.
Sisteme cu degradare în medie. Un sistem cu degradare în medie este un sistem care are media timpului de functionare rǎmas mai micǎ decât media timpului de functionare a sistemului, m(t) < m (NBUE – New Better than Used in Expectation). Relatia din definitie este, în dezvoltare,
tot una cu
0
sau dupǎ mici modificǎri
R(t ,t x)dx R( x)dx
0
R( x)dx
t
mR(t )
Implicatia NBU NBUE este acum evidentǎ.
Existǎ sisteme care nu pot fi încadrate în nici una din categoriile mentionate. Acestea sunt sistemele fǎrǎ uzurǎ care se exprimǎ în termeni
de fiabilitate astfel
R(t ,t x)
R( x),
t , x 0
Pentru sistemele de acest gen functia de repartitie a duratelor de viatǎ,
altfel spus a duratelor de functionare pânǎ la (prima) defectare este
F (t ) 1
e t , densitatea repartitiei lor este f (t)
e t , rata
defectǎrilor este constantǎ z(t ) , iar media si dispersia duratelor de
viatǎ sunt m(t )
m 1 /
, respectiv 2 1 /
2 . Una din aplicatiile
importante ale acestui model se referǎ la sistemele software.
Legi de repartitie utilizate in teoria fiabilitǎtii sistemelor
Pentru sistemele fǎrǎ reînnoire, adicǎ pentru acele sisteme care odatǎ defecte sunt iremediabil defecte, durata lor de viatǎ este o variabilǎ
aleatoare.
2
O variabilǎ aleatoare este complet definitǎ de functia ei de repartitie. Durata de viatǎ este o variabilǎ aleatoare de tip continuu, prin urmare functia de repartitie este o functie continuǎ si derivabilǎ în raport cu timpul pânǎ la prima (si ultima) defectare. În cazul continuitǎtii variabilei, densitatea ei de repartitie este de asemenea capabilǎ sǎ o descrie complet. Tabelul alǎturat contine un numǎr de densitǎti de repartitie a duratei de viatǎ a sistemelor, foarte frecvent utilizate si confirmate de practicǎ. Legile de repartitie cuprinse în tabel sunt departe de a fi acoperitoare pentru toate situatiile practice posibile.
Aproximǎri ale functiilor densitate de repartitie prin exponentiale
Aproximarea este necesarǎ ori de câte ori nici una din densitǎtile de repartitie consacrate nu se potriveste unei anumite experiente privind fiabilitatea unui sistem. Aproximarea se poate realiza în trei moduri, conform modelelor în serie, în paralel sau în triunghi.
Aproximarea serie constǎ într-o combinatie liniarǎ de exponentiale
f (t )
n
it i i
i 1
n
cu coeficientii i îndeplinind conditia i
i 1
1 , adicǎ combinatia liniarǎ
este convexǎ.
Interpretarea fizicǎ a combinatiei este aceea a unui sistem cu mai multe moduri de defectare, mutual incompatibile. Exemplele practice le furnizeazǎ sistemele a cǎror defectare poate consta într-un scurtcircuit sau într-o întrerupere. Fiecare din modalitǎtile de defectare respectǎ o lege probabilisticǎ exponentialǎ, are o probabilitate de producere i si are un parametru i specific.
Aproximarea paralel are în vedere un timp de functionare pânǎ la
defectare, care se prezintǎ ca o sumǎ de durate aleatoare independente una
de alta, fiecare cu o lege exponentialǎ de parametru i. Compunerea densitǎtilor de repartitie a douǎ din aceste durate statistic independente se
face prin operatia de convolutie
fi j (t ) ( f i * f j )(t )
fi ( ) f j (t )d
operatie care se poate repeta prin adǎugarea altor functii pânǎ la completa lor epuizare. Dacǎ se noteazǎ mai simplu functia rezultatǎ cu f(t) atunci,
cu transformarea Laplace, se obtine
f * (s)
L[ f (t)]
n
i
i 1 s i
Dacǎ parametrii i sunt distincti atunci prin transformarea Laplace inversǎ se obtine o combinatie liniarǎ de exponentiale asemǎnǎtoare celei de la aproximarea serie. Dacǎ parametrii i sunt si cu repetitie se obtin repartitii de ordine întregi diferite. În cazul în care toti i au aceeasi valoare se
obtine o repartitie unicǎ, de ordinul întreg n – 1.
Aproximarea triunghi se potriveste sistemelor care trec prin mai multe stǎri intermediare (ca sistemele în paralel) dar nu trebuie sǎ le parcurgǎ obligatoriu pe toate. Defectarea care scoate din functiune sistemul se poate produce în orice moment, indiferent de starea curentǎ a sistemului. Descrierea este foarte sugestivǎ printr-un graf al tranzitiilor. Alǎturat este
dat un astfel de graf.
0 1 2 k – 1
k
Tranzitiile posibile într-un interval t sunt (0 1), (1 2), …, (k – 2 k
– 1) dar si (0 k), (1 k), (2 k), …, (k – 1 k) pe lângǎ stationarea în
nodul curent 0, 1, 2, …, k – 1. Se întelege cǎ starea k este starea de nefunctionare.
Probabilitǎtile asociate tranzitiilor sunt proportionale cu intervalul t si sunt respectiv t, t, …, k t, apoi k t, k t, …, k t si încǎ 1 – ( i+ k t pentru persistenta sistemului în starea i. Trecerea dintr-o stare în alta are toate caracteristicile unui proces Markov. Probabilitǎtile
stǎrilor la un moment dat sunt
pi (t )
cu
i
dij exp[ (
j 1
j k j )t]
dij
i 1
1
i
( i j k i k j )
l 1
l j
Combinatiile de exponentiale în schemele serie, paralel, triunghi oferǎ o multitudine de posibilitǎti de aproximare a fiabilitǎtii sistemelor reale. Grafurile asociate sunt desigur mai complicate. Oricare ar fi modelul ales el trebuie trecut printr-un test de concordantǎ cu date experimentale.
Aproximarea discretǎ
Aproximarea discretǎ se realizeazǎ prin juxtapunerea pe intervale adecvate a unor legi exponentiale. Pe fiecare interval uzura este
consideratǎ constantǎ. Functia de fiabilitate este în cazul aproximǎrii
R * (t )
exp
i 1
j (t j
j 1
t j 1 )
i (t
ti )
t [ti 1 , ti ]
0 t ti
Demonstrarea faptului cǎ orice lege realǎ de repartitie poate fi aproximatǎ discret este facilǎ.
Operatia de punere în acord a modelului cu realitatea este cunoscutǎ sub numele de estimare de parametri. Cu cât sunt în joc mai multi parametri cu atât problema este mai complicatǎ.
Una din metodele de estimare a parametrilor este cea a verosimilitǎtii maxime. Pentru a utiliza aceastǎ metodǎ se construieste functia de verosimilitate L(X/ ) care contine vectorul X al observatiilor experimentale si vectorul al parametrilor de estimat. Încercǎrile experimentale pot fi trunchiate (sau cenzurate, cum se mai spune), cu sau fǎrǎ înlocuire. Fie o încercare cenzuratǎ, fǎrǎ înlocuire, si o lege
exponentialǎ. Atunci
L(t1 ,t2
,…,tr / )
A r ( e
t 1 )( e
t2 )…( e
t r )(e
tr )n r
r r [
n
cu
t ( n r) t ]
r
r r T
n
r
T ti
(n r )tr
i 1
Functia de verosimilitate este maximǎ pentru valoarea care anuleazǎ
d
derivata
d
L(T
/ ) , adicǎ verificǎ ecuatia
r r 1 T
r r T
An r e An T e 0
ceea ce conduce la verosimilǎ.
r
si apoi la
r
T , care este estimatia maxim
Trebuie verificat dacǎ estimatia este nedeplasatǎ sau, cum se mai spune, este absolut corectǎ, adicǎ are proprietatea
g ( / )d
Integrala este o medie a variabilei aleatoare , cu luarea în considerare a
densitǎtii de repartitie conditionatǎ g( / ) .
În cazul parametrului unic de mai sus, se scrie mai întâi diferit variabila
T
r
T ti
i 1
(n r)tr
nt1
(n 1)(t2
t1 ) (n
2)(t3
t2 )
… (n
r 1)(t r
tr 1 )
Se noteazǎ sk
(n k
1)(t k
t k 1 ) ceea ce face ca
r
T si
i 1
Vectorul aleator sT
[s1 s2 …sr ] are densitatea de repartitie
L(t , t
,…,t )
Ar r e T
L(s , s
,…, s )
1 2 r
n
1 2 r
V s1
t1
…
sr
t1
…
…
…
V s1
t r
…
sr
t r
n
n 1
…
0
0
n 1
…
0
…
…
…
…
0
0
…
n r 1
cu determinantul functional bidiagonal (toate elementele de deasupra diagonalei principale si toate elementele de sub diagonala a doua sunt nule).
Fiecare din variabilele s i este independentǎ de celelalte si este repartizatǎ
exponential cu acelasi parametru . Rezultǎ
r 1 T
g (T
/ ) ( T ) e
(r)
cu r determinat. Media parametrului estimat este
r 1 T
M ( ˆ)
r ( T ) e dT
rEr
0 T
T r 2e
(r
T dT
1)!
rEr (r 2)!
r
(r 1)! 0
(r 1)! r 1 r 1
ceea ce indicǎ o estimatie deplasatǎ. Estimatia nedeplasatǎ este
ˆ r 1
T
Probleme si exercitii de autoevaluare
Problema 1.
Preluati una (sau mai multe) din legile de repartitie a duratelor de viatǎ date în tabelul din corpul capitolului curent si verificati expresiile indicate pentru mediile si dispersiile MTTF.
Problema 2.
Pentru repartitia asupra cǎreia ati optat la problema precedentǎ (sau pentru altǎ repartitie), evaluati rata defectǎrilor. Alegeti o a doua lege de repartitie, potriviti aceeasi duratǎ medie de viatǎ si comparati ratele de defectare pe axa timpului pentru cele douǎ repartitii selectate.
Problema 3.
Generati aleator un numǎr n de durate de viatǎ (10 ≤ n ≤ 20) conform unei anumite legi de repartitie. Alterati cu bunǎ stiintǎ câteva (douǎ, trei) dintre acestea. Verificati apoi sensibilitatea criteriului 2 în verificarea potrivirii datelor “experimentale” cu legea de repartitie utilizatǎ.
Indicatie: cele trei probleme se recomandǎ a fi rezolvate uzând de
pachetul Matlab, subpachetul stats, care contine implementǎri eficace ale functiilor din tabel.
50
SISTEME CU SCHIMBARE Reînnoirea ca proces aleator
Se presupune cǎ sistemele tratate în aceastǎ sectiune pot fi readuse în stare de functionare de îndatǎ ce se constatǎ o defectiune care le scoate din functiune. Se admit interventii de foarte scurtǎ duratǎ, practic neglijabilǎ. O interventie înseamnǎ o reînnoire. Evolutia sistemului este marcatǎ de momentele de reînnoire t1, t2, …, tn si de intervalele între reînnoiri X1, X2,
…, Xn. Numǎrul de reînnoiri NT petrecute în intervalul (0,t) este un proces aleator discret. În ceea ce priveste variabilele Xi (i = 1, 2, …, n), apare rationalǎ acceptarea ipotezei independentei lor. Acest fapt permite tratarea în fiecare interval a acelorasi indicatori de fiabilitate. În realitate schimbǎrile pot influenta fiabilitatea sistemului, uneori în bine, alteori în rǎu.
Fie Ri(x) functia de fiabiliate pe inervalul (ti-1, ti). Reînnoirile se clasificǎ dupǎ relatia între functiile Ri(x).
Reînnoire propriu-zisǎ este o reînnoire care aduce sistemul în aceeasi stare de dinaintea defectǎrii, Ri(x) = R(x) pentru orice i. Se mai numeste proces de reînnoire simplu. Alte tipuri de reînnoiri sunt cazuri mai generale. De pildǎ, dacǎ R1(x) > R2(x) > … > Rn(x) reînnoirile sunt pozitive, iar dacǎ R1(x) < R2(x) < … < Rn(x) reînnoirile sunt negative.
Sunt interesante sub aspect practic reînnoirile fǎrǎ modificarea de la o reînnoire la alta a gradului de uzurǎ. Reînnoirea în aceste cazuri poate fi pozitivǎ sau negativǎ, dupǎ tipul de uzurǎ a sistemului. La un sistem fǎrǎ uzurǎ reînnoirea este simplǎ.
Procesul aleator NT are descrierea matematicǎ prezentatǎ mai jos.
Fie intervalul (0, t), intervalul relativ scurt (t, t + t). Probabilitatea ca pânǎ la momentul t + t sǎ se fi produs r reînnoiri se noteazǎ
Pr (t t )
P ( Nt t
r ) . Cele r reînnoiri se pot produce în mai multe
moduri, conform tabelului care urmeazǎ.
În intervalul (0, t) În intervalul (t, t + t)
r 0 r-1 1 r-2 2
… …
0 r
La un sistem fǎrǎ uzurǎ, probabilitatea defectǎrii în intervalul (t, t + t) este t + O[( t)2], este asadar, exceptând un infinit mic de ordin superior lui t, proportionalǎ cu durata (scurtǎ) t. Defectǎrile multiple în intervalul t sunt în aceste conditii practic excluse. Se poate scrie relatia
de recurentǎ
Pr (t
t ) Pr 1
(t ){ t
O[(
t) 2 ]}
Pr (t ){1
t O[(
t ) 2 ]}
care prin trecere la limitǎ (
t 0)
conduce la
dPr (t)
P (t )
P (t )
dt r r 1
Aceasta este o ecuatie diferentialǎ care se integreazǎ dupǎ o prealabilǎ
schimbarea de functie, Pr (t )
vr (t )e
t , si rezultatul integrǎrii este
P (t) ( t ) e t
r r!
care este exact legea de repartitie Poisson, modelul adecvat pentru cel mai simplu proces de reînnoire.
Media numǎrului de reînnoiri în intervalul (0, t) poartǎ numele de functie
de reînnoire
H(t) = M(Nt) = t
Se defineste de asemenea, densitatea de reînnoire
si o dispersie a reînnoirilor
h(t )
dH (t )
dt
2 2 2
D(t )
M ( N t )
H (t ) ( t )
care este dependentǎ de timp.
Pentru sistemele cu uzurǎ evaluǎrile sunt mai complicate dar nu extrem de complicate. Existǎ relatia
H (t )
t
z(t )dt
0
care leagǎ functia de reînnoire de rata de defectare. Rezultǎ imediat cǎ h(t) = z(t). Si pentru cǎ
H (t ) ln 1
R(t )
pentru un interval (t1, t2) se obtine
H (t , t )
H (t )
H (t ) ln 1
ln 1
ln 1
1 2 2 1
R(t )
R(t )
R(t , t )
2 1 1 2
Cazul general cere efectuarea unei distinctii între tipurile de înlocuire (propriu-zisǎ, negativǎ sau pozitivǎ). Pentru a distinge între tipurile de reînnoire, pe baza unor intervale între reînnoiri consecutive, uzual primele
trei, se formuleazǎ o ipotezǎ de nul de genul
si alternativa
H0: Ri 1 ( x)
Ri ( x)
Ri 1( x)
H1 : Ri 1 (x )
Ri ( x)
Ri 1 ( x)
Dacǎ xi , xi
, xi
sunt duratele de functionare pânǎ la a treia înlocuire
1 2 3
corespunzǎtoare sistemului i din esantionul (i = 1, 2, …, n) atunci functiile
1 pentru xi xi xi
Zi 0
1 2 3
altminteri
sunt prin valorile lor argumente împotriva (Zi = 1) sau în favoarea (Zi = 0)
caracterului pozitiv al reînnoirilor. Discriminarea se face prin suma
n
S Zi
i 1
în raport cu o valoare-criteriu k cititǎ în tabele specializate sau calculatǎ dar corespunzǎtoare unei valori asociatǎ riscului de a respinge ipoteza H0 când ea este de fapt corectǎ. Dacǎ valoarea k majoreazǎ valoarea calculatǎ S atunci se acceptǎ ca valabilǎ ipoteza alternativǎ H1. Riscul se
asociazǎ asadar probabilitǎtii
k
r r n r
P( S k )
Cn p0 (1
r 0
p0 )
cu p0
P(Zi
1 / H0 )
1 / 6
în cazul reînnoirilor propriu-zise, ceea ce
face din relatia de mai sus o ecuatie în k .
Dacǎ sistemul este de tipul cu reînnoire propriu-zisǎ, asadar este readus mereu la starea din momentul t = 0, atunci
P( N t r)
P(Tr t )
Numǎrul de reînnoiri produse în intervalul (0, t) este mai mare decât r dacǎ si numai dacǎ durata Tr scursǎ pânǎ la reînnoirea cu numǎrul r este inferioarǎ lui t.
Se noteazǎ cu Kr(t) functia de repartitie a duratei Tr si cu kr(t) densitatea ei de repartitie. Procesul aleator Nt poate fi exprimat cu ajutorul acestor
functii
P( N t
r) P( N t
r) P( N t
r 1)
Kr (t )
Kr 1 (t )
cu r = 1, 2, … si K0(t) = 1.
Variabila Tr = X1 + X2 + … + Xr are o densitate de repartitie care se calculeazǎ pe baza unor intervale între reînnoiri consecutive, uzual
primele trei cu relatia kr (t )
f (t )
f (t ) …
f (t ) , o convolutie
multiplǎ de r factori identici. Prin transformarea Laplace rezultǎ
* * r
* * r
kr ( s) [ f
( s)] si Kr (s) (1 / s)[ f
(s)]
. În cazul unui proces de
reînnoire general, densitatea de repartitie pe primul interval este f1(t), diferitǎ de densitatea f(t) pentru intervalele urmǎtoare. Atunci avem
* * * r 1
* * * r 1
pentru kr ( s)
f1 ( s)[ f
(s)]
si pentru Kr (s) (1/ s) f1 ( s)[ f
( s)] .
Functia de reînnoire este
H (t )
si
rP ( N t r 1
r ) r[ Kr (t )
r 1
Kr 1 (t )]
Kr (t )
r 1
h(t)
dH (t )
dt
kr (t )
r 1
În domeniul Laplace, pentru reînnoirea simplǎ
h* ( s) [ f *( s)]r
fE* (s)
*
r 1 1
si
f (s)
H * (s)
fE* (s)
Pentru cazul general
s[1
f * (s)]
h* ( s)
f * (s)[ f * (s)]r 1
f *( s)
*
r 1 1
f (s)
H * (s)
f * (s)
s[1
f * (s)]
care poate redeveni modelul procesului simplu prin substituirea functiilor
f (t ),
f * ( s)
în loc de f (t ),
f * (s) .
1 1
În general
h (t)
f1 (t )
h(t )
f (t )
f1 (t )
t
h( ) f (t )d
0
relatie cunoscutǎ si ca ecuatia reînnoirii. În jurul momentului t se poate produce prima reînnoire cu o probabilitate exprimatǎ de f1(t). Dacǎ reînnoirea anterioarǎ s-a produs la momentul , o reînnoire de un ordin oarecare produsǎ în jurul momentului t are sansa/probabilitatea de a se
produce exprimatǎ de integrala de convolutie.
Disponibilitatea sistemelor
Disponibilitatea se referǎ la sistemele cu reînnoire pentru care durata reînnoirii înceteazǎ sǎ mai fie neglijabilǎ. Mai mult, este aleatoare si este ea însǎsi descrisǎ de o functie de repartitie a timpului în care se realizeazǎ reînnoirea, de o densitate de repartitie a duratei reînnoirii asociatǎ cu probabilitatea ca sistemul sǎ fie pus în functiune în jurul momentului t. Probabilitatea punerii în functiune în jurul acelui moment conditionatǎ de
neîncheierea reînnoirii la acel moment
z (t )
f 2 (t )
1 F2 (t )
produce un gen de ratǎ a punerilor în functiune a sistemului, similarǎ întrucâtva cu rata de defectare definitǎ pentru intervalele în care sistemul este functional. În mod analog se pot evalua media timpului de reînnoire, dispersia acestuia etc.
Un sistem de acest gen poate fi tratat cu metodele de la sistemele cu timp de reînnoire neglijabil dar cu densitatea de repartitie a duratei de viatǎ diferitǎ pe primul interval fatǎ de urmǎtoarele. Astfel, un sistem cu reînnoire integralǎ devine un sistem cu reînnoire generalǎ punând pentru
primul interval densitatea de repartitie f1(t) si pentru urmǎtoarele
f1 (t )
f 2 (t ) s.a.m.d.
În domeniul Laplace, pentru momentele repunerii în functiune
h* s f1 ( s) f 2 (s)
2 ( )
1 f * (s) f * (s)
H * s f1 ( s) f2 (s)
Pentru defectǎri
2 ( )
s[1
f * (s) f * ( s)]
h* s f1 ( s)
1 ( )
1 f * (s) f * (s)
H * s f1 ( s)
1 ( )
s[1
f * (s) f * ( s)]
Media timpului de functionare se numeste disponibilitate.
Sub aspect organizatoric strategiile de reînnoire elaborate în raport cu caracteristicile de fiabilitate pot fi periodice sau neperiodice. Strategiile tin seama de caracteristicile statistice discutate mai sus.
Probleme si exercitii de autoevaluare
Problema 1.
O tehnologie necesitǎ printre altele un sistem/aparat/echipament a cǎrui duratǎ de viatǎ este o variabilǎ aleatoare distribuitǎ conform legii de
repartitie gamma cu densitatea de probabilitate (densitatea de repartitie)
f (t)
( t)V 1 eE t
( )
Se admite cǎ tehnologia este una de campanie: ea este utilizatǎ pe o duratǎ fixatǎ dinainte, T unitǎti de timp, dupǎ care nu mai prezintǎ interes (ar putea fi vorba de pildǎ de atingerea unui astru din sistemul solar, cu o navǎ interplanetarǎ fǎrǎ echipaj uman, fǎrǎ recuperarea navei).
Pentru derularea tehnologiei, în fiecare moment necesarul strict este de un sistem de genul mentionat. Pentru acoperirea perioadei T se folosesc mai multe sisteme identice în schema rezervei-imediat-accesibile. Asadar, de îndatǎ ce un aparat de tipul în discutie se defecteazǎ, un altul functional, proaspǎt îi preia sarcinile.
În conditiile arǎtate, se cer urmǎtoarele:
a) valoarea ratei de defectare a unui sistem pentru momentul t egal cu media duratei de viatǎ a sistemului;
b) dispersia duratelor de viatǎ pentru un sistem;
c) fiabilitatea unui sistem dupǎ t = T/3 unitǎti de timp de functionare corectǎ;
d) evaluarea numǎrului de echipamente (numǎr care include pe primul pus în functiune si rezerva/rezervele) care asigurǎ cu o probabilitate de 0,95 desfǎsurarea fǎrǎ întrerupere a tehnologiei pânǎ la momentul
T, altfel spus, o probabilitate asociatǎ cu un risc de 5% ca tehnologia sǎ nu-si îndeplineascǎ obiectivul;
e) aceeasi evaluare ca la punctul anterior pentru un risc de 1%. Date numerice: = 110, = 3, T = 365 zile.
FIABILITATEA STRUCTURALǍ Tratarea sistemelor prin observarea stǎrii
Tratarea fiabilitǎtii unui sistem ca un întreg nu este totdeauna productivǎ. Deseori se pune problema ca întregul sǎ fie înteles ca o reuniune de subsisteme, fiecare în parte cu caracteristici de fiabilitate proprii.
Este cunoscutǎ reprezentarea sistemelor prin ecuatii de stare si ecuatii de observare care pun în evidentǎ anumite intrǎri ale sistemului, anumite variabile de stare si anumite manifestǎri cantitative observate (iesiri). În
general, ecuatiile se prezintǎ în forma
x(t )
y (t )
g[x(t ), u(t )]
h[ x(t), u(t )]
dar este posibilǎ, în conditiile unei alegeri adecvate a variabilelor de stare
x(t), o exprimare mai simplǎ
x(t )
y(t )
g[x(t ), u(t )]
h[ x(t)]
în care observatiile (iesirile) y(t) depind explicit numai de starea sistemului si numai indirect de variabilele de intrare u(t).
Un sistem descompus în pǎrtile lui componente aduce unele din variabilele sale interne, de stare, în calitatea de variabile de interconectare a subsistemelor care îl compun. În contextul nou, unele variabile de stare preiau rolul de intrǎri (iesiri) ale subsistemelor componente. Ansamblul poate fi descris satisfǎcǎtor folosind numai aceste variabile care interconecteazǎ diferitele pǎrti ale sistemului.
În studiile de fiabilitate intrǎrile sistemelor sunt considerate solicitǎrile curente, care au un caracter aleator si care nu intrǎ în categoria variabilelor manipulabile. De aceea ele pot fi încadrate în submultimea variabilelor de stare necontrolabile dar al cǎror efect este observabil.
Aceste variabile care fac functionarea sistemului mai mult sau mai putin
sigurǎ se grupeazǎ într-un vector cu componente dublu indexate, j ,
cu indicele inferior care se referǎ la subsistemul modelat si cu cel superior care numǎrǎ variabilele pentru acel subsistem. Astfel, subsistemul j poate avea lj asemenea variabile.
Cu aceste notatii, varabila de iesire de indice i din totalul de p se exprimǎ
astfel:
( (1 ) ,
( 2 ) ,… ,
( l 1 ) ,
(1) ,
( 2 ) ,…,
( l2 ) , …,
(1 ) ,
( 2 ) ,… ,
( l n ) )
yi f 1 1
1 2 2 2
n n n
unde se observǎ n subsisteme componente, fiecare cu un numǎr de variabile, care inventariate duc la numǎrul total
N = l1 + l1 + … + ln
Sistemul în ansamblul lui se considerǎ cǎ functioneazǎ corect dacǎ au loc concomitent relatiile
yi mi n yi
yi max (i
1,2, … , p)
în care limitele inferioare si superioare definesc intervale de tolerantǎ pentru varibilele observate yi.
Desigur, valorile variabilelor observate sunt aleatoare asa încât fiabilitatea
sistemului se poate evalua ca
p
RS P[( yi min yi
i 1
yi max )]
în subtext considerându-se cǎ evenimentele intersectate sunt independente, o ipotezǎ acceptabilǎ dacǎ se doreste evitarea unor
complicatii de calcul insurmontabile. Valorile yi pot fi puse în legǎturǎ cu
variabilele ( k )
, aleatoare la rândul lor
( k ) ( k )
( k ) (
1,2, …, ;
1,2,… , )
j mi n j
j max
k l j j n
Fiecare componentǎ are functia proprie de fiabilitate, calculatǎ ca
probabilitate a intersectiei unor evenimente independente
l j
( k ) ( k )
( k )
R j P[ (
j mi n j
j max )] ( j
1,2,…, n)
k 1
De observat cǎ fiabilitatea unei (oricǎrei) componente este definitǎ în raport cu un criteriu exterior, cel derivat din conditiile de bunǎ functionare a ansamblului.
Modelarea fiabilitǎtii sistemului pe aceastǎ cale este foarte complicatǎ chiar si pentru sisteme de micǎ anvergurǎ. Pentru aprecierea fiabilitǎtii sistemului este necesarǎ evaluarea functiilor de fiabilitate ale fiecǎrei
componente în parte. În context, este presupusǎ cunoscutǎ toatǎ gama de
legi de repartitie ale varabilelor ( k )
. Ulterior, tinând seama de structura
sistemului, trebuie calculate variabilele de performantǎ yi si densitǎtile lor de repartitie. Abia dupǎ aceea se poate aprecia fiabilitatea sistemului.
O asemenea abordare are o singurǎ sansǎ: simularea Monte Carlo, dificilǎ
si aceasta din cauza necesitǎtii de a produce în decursul simulǎrii
procesele aleatoare ( k ) .
Tratarea structuralǎ a sistemelor
Analiza fiabilitǎtii pe baze logic-structurale este mult mai convenabilǎ si chiar dacǎ nu este foarte exactǎ ea este suficient de acoperitoare. Modelele din aceastǎ categorie se numesc modele logice. În locul variabilelor
multiple yi se utilizeazǎ o singurǎ variabilǎ S bivalentǎ: S = 1 dacǎ pentru
orice i = 1, 2, …, p avem yi mi n yi
yi max , S = 0 dacǎ pentru un i avem
yi yi min sau yi
yi max . Atunci
RS = P(S = 1)
Similar, pentru fiecare subsistem j o variabilǎ xj ia valoare 1 sau 0 dupǎ
cum toti parametrii ( k )
sunt în limitele permise sau vreunul din ei (cel
putin unul) este în afara intervalului îngǎduit. Si aici fiabilitatea
subsistemului este datǎ de
Rj = P(xj = 1)
Introducerea variabilelor binare S si xj (j = 1, 2, …, n) creazǎ posibilitatea exprimǎrii primei ca o functie booleanǎ de cele din urmǎ
S (x1 , x2 , …, xn )
Scopul analizei logico-structurale este stabilirea unei relatii functionale între fiabilitatea sistemului si fiabilitǎtile subsistemelor componente
RS (R1, R2 ,… , Rn )
Este oare o simplificare în aceastǎ manierǎ de modelare? Rǎspunsul este afirmativ.
Prima simplificare constǎ în faptul cǎ functiile de fiabilitate ale componentelor sunt cunoscute, deci nu este necesar un calcul prealabil, altminteri destul de complicat, al functiilor de fiabilitate ale fiecǎrui subsistem. Sunt posibile neconcordante dar calculele sunt considerabil simplificate. A doua simplificare majorǎ tine de exprimarea booleanǎ mult mai simplǎ fatǎ de exprimarea functionalǎ descrisǎ mai sus.
Exemplu comparativ. Fie sistemul automat cu reglare dupǎ abatere din
figurǎ
Modelul functional are în vedere un vector al perfomantelor unidimensional y = z/z. O posibilǎ descompunere în douǎ subsisteme ar putea fi: un subsistem obtinut prin combinarea regulatorului (R) cu instalatia tehnologicǎ reglatǎ (ITR) si celǎlalt subsistem traductorul (T) de
pe calea de reactie. Functiile de transfer se noteazǎ cu Hd(s) pentru primul
subsistem si cu Hr(s) pentru conexiunea inversǎ. Se admite cǎ mǎrimea de
referintǎ este riguros constantǎ z0. Factori aleatori diversi actioneazǎ asupra parametrilor din functiile Hd(s) si Hr(s) si îi modificǎ. În regim stationar functia de transfer conduce la
z Hd z
1 Hd Hr
Prin logaritmare si derivare se obtine
dz 1 dHd
Hd Hr dHr
z 1 Hd Hr Hd
1 Hd Hr Hr
care dupǎ înlocuirea diferentialelor cu diferente finite exprimǎ eroarea stationarǎ relativǎ y în functie de abaterile relative ale amplificǎrii componentelor. Acesta este modelul functional al sistemului. Buna
functionare este consideratǎ aceea pentru care y asa încât fiabilitatea
sistemului este
Dar
RS P y
y z
1 Hd
Hd Hr Hr
z 1 Hd Hr Hd
1 Hd Hr Hr
admitând cǎ toate amplificǎrile sunt pozitive. Acum, dacǎ se pune
d r , din relatia de mai sus rezultǎ domeniile de variatie admisibile pentru parametrii sistemului
E Hd
(1 H H )
Hd
Hr
Hr
d d r
1 Hd Hr
Hd Hr
Functiile de fiabilitate individuale sunt
Hd
Rd P
Hd
d (1
Hd Hr )
Rr P
E Hr
Hr
Pentru a stabili functia de fiabilitate a sistemului pe baza modelului functional trebuie parcurse pentru momente diferite urmǎtoarele etape:
1. Stabilirea densitǎtilor de repartitie ale parametrilor Hd si Hr;
2. Calculul functiilor de fiabilitate pentru cele douǎ componente;
3. Calculul functiei de repartitie a parametrului de performantǎ y;
4. Calculul functiei de fiabilitate a sistemului. Dificultatea majorǎ este încorporatǎ în etapa a treia.
În varianta logicǎ functionarea corectǎ este asiguratǎ dacǎ ambele
componente functioneazǎ corect
S = xd xr
si functia de fiabilitate a sistemului se exprimǎ ca
RS P( S 1)
P( xd
1) P( xr
1) Rd Rr
Metode structurale
Modelele structurale pot fi dublate de asa-numitele grafuri de semnal. Un graf de semnal dǎ ideia de continuitate intrare-iesire pentru o structurǎ conexǎ complexǎ. Existenta unui drum de la intrare la iesire este asimilatǎ aici cu functionarea corectǎ a sistemului.
Modelul serie pentru care defectarea fie si a unui singur subsistem scoate
sistemul din functiune are graful de semnal din figura alǎturatǎ.
Functia care leagǎ starea de functionare (sau de nefunctionare) a
sistemului de starea functionalǎ a componentelor este
S x1
si functia de fiabilitate are expresia
x2 … x n
RS P( S 1)
n n
P (xi 1) Ri
i 1 i 1
În particular, se poate spune cǎ un sistem serie alcǎtuit din subsisteme fǎrǎ
uzurǎ este la rându-i un sistem fǎrǎ uzurǎ. Într-adevǎr
n
n t i
i t i 1 S t
RS e e e
i 1
Sistemele paralel sunt sisteme pentru care defectarea se produce numai în cazul defectǎrii tuturor componentelor. Starea functionalǎ a sistemului se
leagǎ de starea componentelor conform relatiei
S x1
x2 … xn
Analiza cantitativǎ a fiabilitǎtii sistemului tine seamǎ de independenta defectǎrilor. O binecunoscutǎ relatie datoratǎ lui De Morgan permite
scrierea
S x1
x2 … xn
x1 x 2
. .. x n
cu barele pentru operatia de negare. Stǎrile de functionare si de nefunctionare sunt complementare asa încât se scrie mai întâi, pentru
functia de repartitie a duratei de viatǎ
si apoi
FS P( S 1)
n n
P (xi 1) Fi
i 1 i 1
RS 1 FS
n
1 (1
i 1
Ri )
Sistemele sunt uzual mai complicate decât cele serie sau paralel. Unele, cele mai putin complexe pot fi combinatii de subsisteme unele serie, altele paralel. Poate fi vorba de o reuniune de intersectii sau o intersectie de reuniuni, deci de secvente de subsisteme legate în graful de semnal în paralel sau de grupe de subsisteme în paralel care la rându-le sunt conectate în serie. Calculul functiei globale de fiabilitate din functiile de fiabilitate individuale nu este deloc complicat în aceste situatii.
Existǎ însǎ sisteme care nu sunt nici serie, nici paralel, nici serie-paralel si nici paralel-serie. Aceasta se întâmplǎ când variabila booleanǎ asociatǎ stǎrii de functionalitate a unui subsistem apare în doi sau mai multi termeni (factori) cum ar fi în cazul
S [x1 (x2
x3 )] [x3 (x4
x5 )]
în care x3 apare mai mult decât o datǎ.
În principiu orice functie booleanǎ poate exprima structura unui sistem. Existǎ însǎ sisteme asa-zis coerente pentru care performantele sunt cu atât mai bune cu cât sunt active (în bunǎ stare de functionare) mai multe
subsisteme componente
( x1 , x2 ,… , xn )i
( x1 , x2 , … , xn ) j
( )i
( ) j
Semnul de inegalitate trebuie înteles ca aplicat tuturor componentelor vectorilor binari comparati. De retinut un detaliu: nu toate sistemele reale sunt coerente!
O metodǎ de tratare generalǎ se bazeazǎ pe formula probabilitǎtii totale. Pentru aceasta variabila (variabilele) care se repetǎ în functia de structurǎ sunt fǎcute pe rând 1 si 0. Prin aceastǎ comutare, functia booleanǎ care leagǎ starea functionalǎ a sistemului de starea componentelor ar putea fi adusǎ de fiecare datǎ la una din formele serie-paralel sau paralel-serie. Dacǎ acesta este cazul, formele acestea permit calculul unor probabilitǎti conditionate si apoi al functiei de fiabilitate generale, prin evaluarea
probabilitǎtii totale. În etape, se evalueazǎ
apoi
si în final
S / ( x j
S / ( x j
1) (x1 , x2 , … , x j 1 ,1, x j 1 ,.. ., xn )
0) ( x1 , x2 , . .. , x j 1 ,0, x j 1 , .. ., xn )
RS P( S 1)
P( S
1 / x j
1) P( x j
1) P (S
1 / x j
0) P( x j 0)
RS / j Rj
RS / j (1
Rj )
cu notatii evidente. Dacǎ sistemul cu xj fixat succesiv la valorile 0 sau 1 nu este combinatie de structuri serie si paralel atunci se aplicǎ metoda probabilitǎtii totale încǎ o datǎ. Dacǎ structura rezultatǎ prin atribuirea xj =
0 nu este de un tip simplu de tratat, atunci
RS / j
RS / j k Rk
RS / j k (1
Rk )
Metoda probabilitǎtii totale permite evaluarea cu usurintǎ a asa-ziselor ponderi ale fiecǎrui subsistem în functionarea sistemului definite si notate
astfel
RS
Rj
R R
S / j
Mai departe este dat un exemplu, o retea de comunicatii care conecteazǎ patru localitǎti prin linii directe între fiecare douǎ localitǎti din sistem, linii permeabile în ambele sensuri. Datǎ fiind structura retelei, transmiterea informatiei între douǎ localitǎti se poate face pe mai multe rute. De pildǎ, legǎtura de la (a) la (b) se poate face fie direct, fie pe trasee
care includ alte localitǎti. Functia
S x1
x2 x6
x4 x5
x2 x3 x4
x3x5 x6
exprimǎ posibilitatea (S = 1) sau imposibilitatea (S = 0) de a conecta cele douǎ localitǎti. Variabilele binare xi (i = 1, 2, …, 6) exprimǎ starea de
functionare sau nefunctionare a liniilor din figurǎ.
Graful de semnal este reprezentat în figura urmǎtoare
Sistemul nu este reductibil la structuri serie si paralel. Variabila x3, de
pildǎ, se repetǎ si atunci
S / ( x3 1) x1
x2 x6
x4 x5
x2x4
x5 x6
x1 [( x2
x5 )( x4
x6 )]
ceea ce se întâmplǎ când circuitul (3) este un scurtcircuit si
S / ( x3 0) x1
x2 x6
x4 x5
pentru o întrerupere pe acelasi circuit. Fiabilitǎtile conditionate sunt
2 2 5 4 3 2
RS / 3
1 (1
R){1 [1 (1
R ) ] }
R 5R
8R 4R R
R
S / 3
1 (1
R)(1
R 2 )2
R5 R4
2R3
2 R2 R
si prin formula probabilitǎtii totale se obtine fiabilitatea sistemului
6 5 4 2
R R R R (1 R)
S / 3
2 R 7R 7 R
2 R R
Ponderea pentru elementul (3) este
RS R R
2 R5
6 R4
6R 3
2R2
2R 2 (1
R)3
S / 3
3
S / 3
Pentru simplitate, s-a considerat cǎ fiabilitatea oricǎrei linii la momentul retinut pentru evaluǎri este R.
Probleme si exercitii de autoevaluare
Problema 1.
Scrieti expresia fiabilitǎtii unui sistem 5MR (cinci module identice în paralel conectate la un voter, vot majoritar) si calculati valoarea MTTF. Problema 2.
Arǎtati cǎ MTTF pentru un sistem paralel cu N module identice, fiecare
cu o ratǎ a defectǎrii constantǎ, este
n 1
Problema 3.
k 1 k
Scrieti expresia sistemului serie/paralel din figurǎ. Fiecare din cele cinci module are functia de fiabilitate R(t).
Probleam 4.
Patru module identice sunt conectate la un voter ideal (sigur) astfel cǎ dacǎ trei module produc aceeiasi iesire ea este produsǎ si la iesirea voterului. Se noteazǎ cu R(t) fiabilitatea fiecǎrui modul. Scrieti expresia fiabilitǎtii sistemului.
Problema 5.
Arǎtati cǎ MTTF pentru un sistem duplex cu douǎ procesoare active identice este 1/(2 ) + c/ cu c factorul de acoperire (probabilitatea ca starea de disfunctie a oricǎrui procesor este detectatǎ corect).
Problema 6.
Calculati fiabilitatea unui sistem NMR (N module identice în paralel conectate la un voter, iesirea prin vot majoritar) în conditiile urmǎtoare: procesoarele esueazǎ cu probabilitatea p si voterul (unic) esueazǎ cu
probabilitatea v N . Pentru p = 0,0001 si v = 0,00001 reprezentati grafic fiabilitatea sistemului ca functie de N, pentru N variabil de la 3 la 27 cu pasul 2.
70
FIABILITATEA PROGRAMELOR DE CALCUL Generalitǎti
Un program poate fi privit ca o functie care aplicǎ o multime de date care îi sunt furnizate, pe o multime de rezultate. La fiecare executie programul primeste un set de date si poate produce rezultate corecte, într-un fel asteptate, poate produce rezultate eronate sau poate executa operatiuni un timp indefinit, ceea ce echivaleazǎ cu a nu produce nici un rezultat. Ultimele douǎ situatii reprezintǎ defectiuni ale programului. Ele pot fi remediate si programul poate executa din nou calcule pânǎ la aparitia unei alte situatii de “panǎ”. Si în cazul studiului fiabilitǎtii programelor de calcul sunt necesare modele matematice comportǎrii modulelor software. De aceea, în continuare sunt prezentate câteva dintre multele modele pe care literatura le propune.
Modelul Jelinski-Moranda
Sub aspect istoric, modelul Jelinski-Moranda este unul dintre primele modele ale fiabilitǎtii programelor. Modelul se bazeazǎ pe câteva ipoteze. Se admite cǎ:
a) intervalele de timp între defectǎrile succesive sunt variabile aleatoare independente distribuite dupǎ legi exponentiale cu parametri posibil diferiti;
b) rata de defectare este proportionalǎ cu numǎrul de erori latente ale programului;
c) la fiecare defectare a programului se efectueazǎ o depanare de duratǎ neglijabilǎ, prin care se eliminǎ o eroare si numai una.
Conform acestor ipoteze, programul cunoaste un proces de reînnoire cu reînnoiri negative. Rata lui de defectare scade la fiecare defectare/depanare. Între depanǎri rata defectǎrii este, desigur, constantǎ deoarece lipseste uzura.
Dacǎ N(t) este numǎrul curent de erori rǎmase (reziduale) atunci N(0) = N
este numǎrul de erori initiale. Cu eliminarea unei erori la fiecare depanare, pentru un interval de functionare Xk, numǎrul de erori încǎ prezente pe
durata acestui interval este N(t) = N – k + 1 cu t
[tk
1 , tk ] . Rata de
defectare în fiecare interval este constantǎ si este proportionalǎ cu N(t)
z(t ) k
N (t ) ( N k 1)
pentru orice interval [tk – 1, tk] de lǎrgime Xk, k = 1, 2, …, N. Numǎrul initial de erori N si constanta de proportionalitate sunt parametrii modelului.
Functia de fiabilitate în intervalul [tk – 1, tk] este
Rk ( x)
e ( N k
1) x
si media duratei între defectǎrile numǎrul k – 1 si numǎrul k, în ordinea aparitiei, este
m 1
k ( N k 1)
Un observator poate face în momentul t
[tk
1 ,tk ]
o predictie asupra
aparitiei urmǎtoarei defectǎri prin evaluarea functiei de fiabilitate asociate intervalului curent de timp R(t, t + x) si prin calculul duratei medii m(t) a vietii rǎmase pânǎ la urmǎtoarea defectare. Aceste functii au exact
expresiile scrise deja într-un capitol mai sus
R(t , t x)
1 e
Rk (t ) x
( N k
1) u du e
( N k
1) x
m(t)
1
( N k 1)
din cauzǎ cǎ rata de defectare în fiecare interval [tk – 1, tk] este constantǎ.
Dacǎ M(t) este numǎrul de defectǎri în intervalul (0, t) atunci N = N(t) + M(t). Expresia aceasta care descrie în fond un proces de reînnoire permite prognozarea numǎrului de interventii de efectuat într-un interval oarecare
si a numǎrului de erori reziduale ale programului.
Dacǎ Pr (t)
P[ M (t )
r] reprezintǎ distributia numǎrului de defectǎri în
intervalul (0, t) cu t fixat, atunci în intervalul initial, pânǎ la prima defectare
P0 (t )
e 0 t
e Nt
iar conditia initialǎ a procesului este
Pr (0)
0; r
1,2, …, N
Probabilitatea ca în intervalul scurt (t, t + t) sǎ se producǎ defectarea k
este proportionalǎ cu t si factorul de proportionalitate este
k ( N k
1) .
În intervalul (t, t + t) procesul este descris de sistemul alcǎtuit din
ecuatia cu diferente
Pr (t
t ) Pr (t)(1
r 1 t )
Pr 1 (t ) r t
scrisǎ pentru r = 1, 2, …, N –1, la care se adaugǎ ecuatia pentru ultima
eroare
PN (t t )
PN (t )
PN 1 (t ) N t
Pentru t din ce în ce mai mic sistemul algebric de ecuatii aproximative
de mai sus se transformǎ în sistemul de ecuatii diferentiale
dPr (t)
P (t )
P (t )
dt r
1 r r r 1
dPN (t )
dt
N PN
1 (t )
Cu conditiile initiale mentionate mai devreme, solutia sistemului este
r t N r t r
Pr (t)
CN (e
) (1 e )
pentru orice r = 1, 2, …, N. Factorii e t si 1 e t sunt probabilitǎti care se asociazǎ, evident, manifestǎrii unei erori în intervalul (0, t), respectiv
eliminǎrii unei erori latente în acelasi interval. Cele douǎ probabilitǎti complementare intervin într-o lege binomialǎ cu parametrii N si 1 e t .
Functia de reînnoire, media numǎrului de defectǎri în rǎstimpul (0, t), este
H (t )
N (1
e t )
care are o variatie exponentialǎ. Modelul în discutie are o crestere
exponentialǎ a fiabilitǎtii. Densitatea de reînnoire este
h(t)
dH (t )
dt
N e t
Se poate aprecia de asemenea comportarea statisticǎ a numǎrului de erori remanente la momentul t dat de relatia N(t) = N – M(t), care are în vedere numǎrul initial de erori si numǎrul de erori eliminate în urma aparitiei lor în intervalul (0, t).
Din probabilitatea aparitiei a r erori în intervalul (0, t), a cǎrei expresie
este datǎ mai sus, se poate scrie imediat
k t k t N k
Qk (t )
P[ N (t )
k ] CN (e
) (1 e )
o lege binomialǎ cu parametrii N si e t . Numǎrul mediu de erori remanente este Ne t si probabilitatea ca toate erorile sǎ fie eliminate în
intervalul (0, t) este
Q0 (t )
P[ N (t )
0] (1
e t ) N
Aceastǎ relatie permite calculul timpului de testare necesar pentru ca în mǎsura datǎ de probabilitatea Q0 sǎ putem afirma cǎ programul nu mai are
nici o eroare
t 1 ln 1
0
N
0
De asemenea, se poate evalua timpul mediu necesar eliminǎrii tuturor erorilor
D 1 1
… 1
N ( N 1)
Dacǎ se estimeazǎ parametrii N si din observarea a n erori pânǎ la momentul t, atunci se pot face aprecieri importante si interesante asupra
comportǎrii programului în continuare. Functia de fiabilitate pentru
intervalul (t, t + x) este exponentialǎ cu rata de defectare (N – n)
R(t ,t x)
e ( N n ) x
Dacǎ se impune o anumitǎ probabilitate de bunǎ functionare R, atunci
durata x corespunzǎtoare este
x 1 ln 1
R ( N n) R
si durata medie pânǎ la urmǎtoarea defectare este
m(t)
1 ( N n)
Numǎrul de defectǎri în intervalul (t, t + x) se distribuie binomial cu
parametrii N – n si
r x r x N n r
P[ M (t ,t x) r]
Functia de reînnoire este
CN n (1 e
) (e )
H (t ,t x ) ( N n )(1
e x )
Numǎrul erorilor remanente la momentul t + x este k dacǎ în intervalul (t,
t + x) se produc si sunt remediate N – n – k erori si probabilitatea asociatǎ este
Qk (t x)
P[ N (t x) k ]
P[M (t,t x )
N n k ]
N n k (1 e
x ) N
n k (e
x )k
Durata de testare suplimentarǎ necesarǎ pentru a elimina toate erorile este
1 1
x ln
0
1
1
N n
0
si durata medie pânǎ la eliminarea tuturor erorilor este
D(t )
1 1
… 1
( N n) ( N n 1)
Estimarea parametrilor N si se poate face pe baza observatiilor
experimentale asupra duratelor succesive de functionare între defectǎri,
x1 , x2 , …, xn
pânǎ la a n-a. Pentru unul dintre intervale, densitatea de
repartitie este
f k (xk / N , ) ( N k
1)e
( N k
1) x k
Densitatea de repartitie pentru vectorul observatiilor x1, x2 , …, xn
este
n
n
n k 1
( N k
1 ) x k
f (x1 , x2 , …, xn / N , ) ( N k
1)e
k 1
Logaritmul acestei functii este o functie de verosimilitate convenabilǎ pentru maximizat
L(x1 , x2 , … , xn / N , )
n
n ln ln ( N k
n
1) ( N k
1) xk
k 1 k 1
Anularea derivatelor partiale conduce la un sistem de douǎ ecuatii cu
necunoscutele N si . Valorile rezultate N
si sunt estimǎri prin
metoda verosimilitǎtii maxime ale parametrilor teoretici N si . Experienta aratǎ cǎ estimatiile au tendinta de a fi infinit, respectiv zero, ceea ce este desigur neconvenabil. În asemenea împrejurǎri experimentul se prelungeste.
Extinderi ale modelului Jelinski-Moranda
O primǎ extindere are în vedere rezolvarea la fiecare defectare nu a unei singure erori ci a unei fractii date 1 – c, constantǎ, din numǎrul total de erori N. În aceste conditii, numǎrul de erori remanente evolueazǎ dupǎ
schema de mai jos
N t cN t
[0, t1 ) [t1 , t2 )
N (t)
c2 N
t [t2
, t3 )
k
c N t
[tk ,t k 1 )
pânǎ la epuizarea tuturor erorilor.
Rata defectǎrilor se mentine constantǎ pe intervale si proportionalǎ cu numǎrul erorilor remanente
0 N
1 cN c 0
t [0, t1 )
t [t1 , t 2 )
z(t )
c2 N
c 0 t
[t 2
, t3 )
c k N
c 0 t
[t k , tk 1 )
Parametrii acestei variante a modelului în discutie sunt si c cu N si neprecizate. Asadar, modelul nu poate prezice nici numǎrul de defectǎri într-un interval de timp dat si nici numǎrul de erori remanente la un moment dat. Se pot însǎ evalua functia de fiabilitate, durata medie rezidualǎ de viatǎ, se poate prevedea când urmeazǎ a se produce
urmǎtoarea defectare. Astfel
R(t , t x)
e c 0 x
tk t t x tk 1
m(t ) 1
0
Metoda verosimilitǎtii maxime de estimare a celor doi parametri pe baza
observatiilor experimentale x1, x2 ,…, xn
– duratele de functionare între
defectǎri pânǎ la defectarea a n-a – are în vedere densitatea de repartitie a vectorului observatiilor
n
n k 1
n
0 c k 1 x k
k 1
f ( x1 , x2 ,…, xn / c, 0 )
care logaritmatǎ produce
0 ( c )e
k 1
n n
k 1
L(x1 , x2 ,… , xn / c, 0 )
nln 0
ln c (k 1)
k 1
0 c xk
k 1
Prin minimizarea acestei functii se obtin estimatiile
asigurǎ minimul se obtin prin rezolvarea sistemului
si c . Valorile care
în necunoscutele si c.
L L
0 , 0
0 c
Varianta aceasta a modelului Jelinski-Moranda este cunoscutǎ si sub denumirea de varianta geometricǎ.
Existǎ si o variantǎ hibridǎ care are în vedere douǎ categorii de erori latente: o primǎ categorie conformǎ modelului geometric, eliminate în schema geometricǎ fractionar-constantǎ; o a doua categorie de erori cu
incidentǎ poissonianǎ de parametru repartitia Poisson este repartitia
pentru variabila aleatoare k discretǎ, P(k; )
k
e , cu > 0 , care
k !
permit eventual reluarea programului fǎrǎ remediere. Modelul Jelinski- Moranda hibrid este cu ratǎ a defectǎrilor constantǎ între douǎ defectǎri
succesive
z(t ) k
k 1
0
t [tk
1 ,tk )
Dezvoltarea predictiilor este în bunǎ mǎsurǎ similarǎ celor expuse mai sus.
Modelele Goel-Okumoto (I) si Musa
Modelul Goel-Okumoto (versiunea I) compenseazǎ una din rigiditǎtile modelului Jelinski-Moranda si a variantelor lui. Este vorba de ipoteza rezolvǎrii obligatorii a unei (unor) erori la fiecare defectare. Acest model admite continuarea executǎrii programului fǎrǎ remediere, remedierea însǎsi fiind un eveniment care se poate produce cu o probabilitate precizatǎ p.
Procesul aleator al reînnoirilor nu mai coincide în acest caz cu acela al eliminǎrii erorilor. Dacǎ Pr(t) = P[M(t) = r] descrie procesul aleator al eliminǎrii erorilor, adicǎ este probabilitatea eliminǎrii a r erori în intervalul (0, t), atunci probabilitatea eliminǎrii celei de a k erori în
intervalul (t, t + t) este produsul dintre probabilitatea ca eroarea k sǎ se
manifeste în intervalul specificat, k t, cu k
( N k
1) , si
probabilitatea p ca acea eroare sǎ fie eliminatǎ cu ocazia aparitiei ei.
Pentru r = 0 se poate scrie ecuatia cu diferente
P0 (t t )
P0 (t )[1
p N t ]
care prin trecere la limitǎ se transformǎ în ecuatia diferentialǎ
dP0 (t )
dt
p NP0 (t )
prin rezolvarea cǎreia, cu conditia initialǎ P0(0) = 1, se obtine
P t e p Nt
Dacǎ pânǎ la momentul t s-au remediat r sau r – 1 erori, probabilitatea ca dupǎ încǎ un interval scurt t sǎ fie rezolvate (tot) r erori (r = 1, 2, …, N –
1) este aproximativ
Pr (t
t ) Pr (t )[1
p ( N
r) t ]
Pr 1 (t ) p ( N
r 1) t
De asemenea, probabilitatea ca pânǎ la t + t sǎ se remedieze toate cele N
erori este
PN (t
t ) PN (t )
PN 1 (t ) p t ]
Ambele relatii cu diferente finite, prin trecere la limitǎ, t 0 , devin ecuatii diferentiale
dPr (t)
p ( N r ) P (t )
p ( N r
1) P
(t )
dt r r 1
dPN (t )
dt
p PN
1 (t )
Prin rezolvarea sistemului de ecuatii diferentiale rezultat, cu conditiile initiale Pr(0) = 0 pentru toti r, se obtine
r p t N r p t r
Pr (t)
CN (e
) (1 e )
o lege binomialǎ de parametri N si (1 e p t ) . Numǎrul mediu de erori eliminate este dat de relatia
M (t )
H (t )
N (1
e p t )
Repartitia numǎrului de erori remanente este descrisǎ de o lege care este
tot binomialǎ
r p t r p t N r
Qr (t )
P[ N (t )
r] CN (e
) (1 e )
Modelul Musa este bazat pe aceleasi ipoteze ca si cel anterior. Ia însǎ în considerare timpul de utilizare a unitǎtii centrale a calculatorului (CPU). Acest timp este multiplicat cu un factor de compresie c, raportul dintre durata echivalentǎ de operare si durata de testare. Erorile latente care se manifestǎ în timpul de testare sunt eliminate cu probabilitatea p. În faza de utilizare propriu-zisǎ nu mai au loc eliminǎri de erori. Factorul de contractie exprimǎ proportia în care executiile din faza de operare curentǎ au fost reduse prin alegerea metodelor de proiectare si testare. De pildǎ o orǎ de testare poate echivala cu mai multe ore de utilizare curentǎ. Se noteazǎ cu M0 = N/p numǎrul maxim de defectǎri, necesar pentru eliminarea tuturor erorilor programului. Tinând seama de factorul de compresie, numǎrul mediu de defectǎri observate în intervalul (0, t)
devine
H (t )
M0 (1
e p ct )
cu t timpul de rulare curentǎ a programului. Având în vedere relatia dintre
N si M0 si rezultatul m0 = 1/( N) care exprimǎ durata medie pânǎ la prima defectare, rezultǎ
H (t )
M0 (1
ct
e m0 M 0 )
relatie caracteristicǎ modelului Musa.
Modelele Littlewood si Littlewood-Verrall
Modelele prezentate mai devreme au o limitare datǎ de faptul cǎ este un coeficient constant. Littlewood propune un model în care fiecare eroare are ponderea proprie i, i = 1, 2, …, N. Cu aceastǎ completare, rata
defectǎrilor capǎtǎ o expresie nouǎ
z(t )
N n
n 1 i i 1
t [tn ,tn 1 )
Desigur, ponderile erorilor nu pot fi în totalitate cunoscute. Se foloseste uzual o distributie apriori subiectivǎ a acestor ponderi
1 i
f a ( i )
( i ) e
( )
o lege , aceeasi pentru orice indice i = 1, 2, …, N, ceea ce subliniazǎ
faptul cǎ ierarhizarea erorilor nu este posibilǎ înainte de a se manifesta.
La momentul t
[tn , tn 1 )
când n erori s-au manifestat deja, se poate
preciza aposteriori repartitia prin intermediul ecuatiei lui Bayes. Pentru aceasta se observǎ cǎ probabilitatea ca în intervalul (0, t) eroarea i sǎ nu se
manifeste este e i t . Ecuatia Bayes dǎ distributia aposteriori a acelei erori
f p ( i )
f ( )eE i t
i t
fa (
0
i )e d i
care dupǎ înlocuirea densitǎtii apriori devine
1 ( t ) i
f ( ) ( t ) [( t ) i ] e
p i ( )
asadar o repartitie cu parametrii si t cu t
[tn ,tn 1 ) .
Varianta Littlewood-Verrall, mai veche, nu cuprinde printre parametri numǎrul total de erori latente N. Predictiile se referǎ în acest caz la intervalul de timp cu un început arbitrar si cu finalul la eroarea urmǎtoare.
Modele cu ratǎ de defectare variabilǎ
Aceste modele au în vedere rate de defectare de forma
z(t ) ( N k
1) (t )
t [t k
1 ,tk )
cu (t) o functie de timp precizatǎ. Coeficientul înceteazǎ a mai fi constant sau constant pe intervale.
Dacǎ functia (t) este liniarǎ atunci
z(tn
x) ( N n) x x
[0, tn 1
tn )
si este vorba despre modelul Schick-Wolverton. Expresia ultimǎ aratǎ cǎ rata defectǎrii revine la zero dupǎ fiecare defectare/remediere a defectului. În cazul liniar
R(tn ,tn
x) e
x
z( t n
0
x ) d x
1
( N n ) x
e 2
Durata medie a intervalului pânǎ la defectarea urmǎtoare este
m(t )
R(t , t x )dx
n n n
0
2( N n)
Cazul general cu (t) o functie oarecare este cunoscut sub numele de modelul Shanthikumar. Pentru acest caz expresia functiei de reînnoire
este
H (t)
N[1
a (t )]
N 1 e
t
( t) d t
0
si cea a probabilitǎtii care descrie procesul aleator al defectǎrilor este
r N r r
Pr (t)
CN [a (t )] [1
a (t )]
o lege binomialǎ de parametrii N si [1 – a(t)] cu a(t) integrala care apare în exponentiala din formula precedentǎ.
Un caz particular de importantǎ practicǎ este acela în care ponderea (t)
are expresia
(t )
ceea ce transformǎ functia a(t) în
be b t
a(t )
e (1 e
bt )
Acesta este modelul Goel-Okumoto (versiunea II). Procesul de
manifestare a erorilor este poissonian
P[ M (t )
r] [ (1 e )] e r!
(1 e bt )
În subtext, produsul N este finit dar N si tind concomitent la infinit, respectiv la zero, ceea ce echivaleazǎ cu un numǎr de erori foarte mare independente una de cealaltǎ.
Functia de reînnoire are în acest caz o formǎ exponentialǎ
H (t ) (1
e b t )
Ca o concluzie a acestei sectiuni se poate retine numǎrul apreciabil de modele, posibilitǎtile largi de testare a programelor, dintre care pentru sigurantǎ se alege uzual situatia cea mai dezavantajoasǎ.
Varietatea mare de modele oferite de literaturǎ aratǎ cât de importantǎ este problema functionǎrii sigure a produselor software.
Probleme si exercitii de autoevaluare
Problema 1.
Se considerǎ un program cu N = 50 erori initiale. Factorul de proportionalitate din modelul de fiabilitate Jelinski-Moranda se estimeazǎ a fi = 0.005 erori/unitatea de timp. Pânǎ la momentul t s-au manifestat si s-au remediat n = 40 de erori. Care este durata asteptatǎ (medie) de functionare a programului pânǎ la aparitia unei noi erori?
84
DIAGNOZA SISTEMELOR SI RECUNOASTEREA FORMELOR Generalitǎti
Diagnoza sistemelor (fault detection) utilizeazǎ între altele metoda numitǎ recunoasterea formelor (pattern recognition).
Termenul forme asa cum este utilizat în recunoasterea formelor reprezintǎ o generalizare a ceea ce îndeobste se întelege prin formǎ când se face referire la geometria unor obiecte, o extindere la formele de manifestare ale unor structuri din naturǎ. În acest cadru general, fenomenele, obiectele si sistemele din naturǎ au anumite forme de manifestare (patterns) care fac posibilǎ distinctia între tipuri/clase diferite de fenomene/
obiecte/sisteme.
Într-o exprimare matematicǎ abstractǎ elementele unui spatiu C al claselor sunt asociate prin intermediul unei aplicatii G pe un spatiu P al formelor (de manifestare). Formele din spatiul P sunt asociate la rândul lor prin
mijlocirea unei alte aplicatii M pe spatiul F al observatiilor sau al mǎsurǎtorilor.
Numai elementele spatiului F sunt nemijlocit accesibile. În general functiile M si G nu sunt inversabile asa încât trecerea de la spatiul observatiilor înapoi la spatiul formelor si apoi la spatiul claselor pe o cale univocǎ nu este posibilǎ.
În circumstantele de mai sus, recunoasterea formelor este o tehnicǎ de a obtine informatia în formǎ redusǎ (reduction), de a aplica (mapping) informatia, de a eticheta informatia (labeling).
În procesul de clasificare apare problema dublǎ a clasificǎrii corecte sau gresite si/sau a posibilitǎtii de a distinge sau a face confuzie între forme care apartin unor clase diferite.
Recunoasterea formelor prin clasificare, clasificatori
Iatǎ câteva definitii specifice. Prin clasificarea unor forme se întelege asocierea datelor observate uneia sau alteia dintre cele c clase prespecificate, pe baza extragerii caracteristicilor/atributelor semnificative si pe baza analizei acestor atribute. Recunoasterea unor forme constǎ în abilitatea de a clasifica. Uneori se creazǎ o a (c + 1)-a clasǎ care corespunde inclasificabilului (clasa “necunoscut” sau “decizie imposibilǎ”). O clasǎ de forme este o multime de forme care împart uzual unele atribute comune, cunoscutǎ fiind originea lor comunǎ. Cheia definirii unor astfel de clase stǎ în capacitatea de a identifica atribute sau caracteristici potrivite si mǎsuri adecvate ale similaritǎtii formelor. Uneori este necesarǎ o preprocesare, o operatie de filtrare sau de transformare a datelor brute pentru a facilita evaluǎrile menite a extrage caracteristici ale formelor si a minimiza zgomotul. Zgomotul este un concept care-si are originea în transmiterea informatiei. În recunoasterea formelor zgomotul reprezintǎ o serie de adaosuri strǎine de fenomenul observat cum sunt distorsiunile sau erorile asupra datelor/formelor, erorile în faza de
preprocesare, erorile în extragerea caracteristicilor/atributelor, erorile în datele de instruire si de verificare.
Un clasificator este uzual o functie dar poate fi si un algoritm care face o partitionare a spatiului caracteristicilor în regiuni de decizie purtând anumite etichete. Dacǎ vectorul caracteristicilor în particular numerice este d-dimensional atunci regiunile sunt o partitie a spatiului Rd. Regiunile sunt prin urmare formate din puncte separate. Exceptie fac universurile vagi (fuzzy) unde regiunile de decizie se întrepǎtrund. Între regiunile de decizie existǎ frontiere de decizie. Dacǎ regiunile sunt definite, atunci procesul de clasificare este simplu. Se aplicǎ unei forme eticheta regiunii cǎreia îi apartine. Problema definirii acestor regiuni este însǎ dificilǎ si este cheia întregii probleme a clasificǎrii. Clasificatorii se bazeazǎ pe functii discriminante. Într-o clasificare în c clase, functiile discriminant gi
(x), i = 1, 2, …, c actioneazǎ dupǎ regula atribuie forma x clasei wm
(regiunii Rm) dacǎ gm ( x)
gi ( x), i
1,2,…, c; i m . O frontierǎ de
decizie este definitǎ de egalitatea
g k ( x)
g l ( x), k l .
Instruirea unui sistem de recunoastere a formelor, învǎtarea formelor de cǎtre un astfel de sistem tine seama de experienta sau de cunostintele apriori care trebuie totdeauna utilizate la proiectarea unui sistem de recunoastere a formelor. Acele cunostinte se constituie în asa-numitele multimi de învǎtare. Ele constituie o bazǎ de date care furnizeazǎ informatii importante asupra modului cum trebuie asociate datele observate cu clase de forme. Instruirea/învǎtarea utilizeazǎ forme tipice, reprezentative pentru formele care apar în aplicatia realǎ.
Sunt utilizate mai multe variante ale recunoasterii formelor: una este varianta statisticǎ, alta este varianta sintacticǎ/structuralǎ si, mai nou, varianta cu retele neuronale.
Procedurile ingineriei sistemelor de recunoastere a formelor parcurg orientativ urmǎtorii pasi:
1. Studiul claselor de forme sub aspectul structural si sub aspectul probabilistic. Explorarea posibilitǎtilor de definire a unor mǎsuri ale
similaritǎtii/disimilaritǎtii între clase/în interiorul claselor. Studiul unor aspecte deformante, al unor proprietǎti invariante si al surselor de zgomot.
2. Determinarea accesibilitǎtii unor caracteristici/mǎsurǎtori specifice.
3. Evaluarea performantelor sistemului de recunoastere a formelor raportatǎ la resursele disponibile, acuratetea clasificǎrilor raportatǎ la resursele hard.
4. Disponibilitatea unor date de verificare/instruire (training sets).
5. Disponilbiltatea unor tehnici de-a gata de recunoastere a formelor.
6. Dezvoltarea unor posibilitǎti de simulare a sistemului de recunoastere a formelor.
7. Verificarea/instruirea sistemului (training).
8. Verificarea performantelor sistemului prin simulare.
9. Parcurgerea iterativǎ a pasilor de mai sus pentru ameliorarea performantelor sistemului de recunoastere a formelor.
În sistemele de recunoastere a formelor se folosesc variate mǎsuri de
similitudine. În spatiile metrice, distanta euclidianǎ
d ( x, y) x y
( x y)T ( x y)
d
(xi
i 1
y ) 2
sau metrica mai generalǎ
d p ( x, y)
d
xi yi
i 1
1 / p
sunt utilizate foarte frecvent. Foarte uzualǎ este si distanta ponderatǎ
d 2 ( x, y) ( x
y)T Q( x y) x y
Q
cu Q o matrice de ponderi pozitiv definitǎ, care dacǎ este si simetricǎ se poate factoriza sub forma Q = TTT si atunci matricea T reprezintǎ o posibilǎ transformare de spatiu liniar
x1 = Tx y1 = Ty
cu norma euclidianǎ în spatiul adresǎ egalǎ cu cea ponderatǎ în spatiul sursǎ.
Pentru distantele mentionate, care sunt derivate din produsul scalar de
vectori x, y
, sunt valabile inegalitatea lui Schwartz si inegalitatea
triunghiului. Dacǎ x1
pe directia x.
x / x
atunci x1 , y
este proiectia vectorului y
Dacǎ vectorii x si y sunt binari de aceeasi lungime atunci este de utilizat distanta Hamming definitǎ ca suma în multimea numerelor naturale a rezultatelor însumǎrii modulo 2 a bitilor de acelasi rang ai celor doi vectori.
Pentru multimi finite se foloseste metrica Tanimoto
d ( A, B)
1 card ( A B)
1 card ( A B)
card ( A B)
card ( A)
card (B)
card ( A B)
mai ales atunci când elementele multimilor sunt egale ca importantǎ. În
multe situatii, distanta Levenshtien
d L ( A, B ) max{card ( A), card ( B)}
este mai potrivitǎ.
card ( A B)
Pentru siruri/secvente de numere, fie acestea u si v, se au în vedere lungimile care pot fi diferite si ordinea elementelor. Elemente utilizate în constructia mǎsurilor de similitudine si/sau lipsei de similitudine sunt incluziunea (un sir contine un alt sir), suprapunerea (subsirul cel mai cuprinzǎtor comun celor douǎ siruri), similaritatea variationalǎ (costul minim al convertirii unui sir la altul) etc.
Din descompunerea distantei
d ( x
y) 2
x 2 2 xy y 2
rezultǎ o contributie constantǎ irelevantǎ datǎ de termenii prim si ultim din expresia desfǎsuratǎ si o contributie care poate fi o mǎsurǎ a similitudinii datǎ de termenul central. Un maxim al acestuia din urmǎ produce un minim al distantei între formele x si y. Termenul central, fǎrǎ coeficientul –2, este covariatia nenormalizatǎ a celor douǎ caracteristici
complete x si y. Împǎrtirea cu produsul normelor, dacǎ astfel de norme sunt definite, conduce la covariatia normalizatǎ sau corelatia caracterisiticilor. Un maxim al acesteia presupune o asemǎnare/ similitudine pronuntatǎ a celor douǎ forme.
Varianta unui spatiu scalat este exemplificatǎ prin forma prototip
(template) (1 2 3 4) de regǎsit în secventa de intrare (7 6 3 4 1 2 4 3 1 2 3
4 5 6 5 4). Prin medierea numerelor douǎ câte douǎ se obtin forma prototip (1,5 3,5) si respectiv, secventa (6,5 3,5 1,5 3,5 1,5 3,5 5,5 4,5) si, dupǎ o nouǎ mediere, în aceeasi manierǎ se obtin (2,5) si (5 2,5 2,5 5). Recunoasterea se produce în trepte. Este aici de observat economia de calcule multiplicative fatǎ de metoda corelatiei.
Metoda spatiului scalat este generalizabilǎ prin crearea unei familii de
caracteristici
( x, y)
f ( x) g ( x u, y)du
cu f(x) forma de recunoscut si g(x, y) un nucleu al unor convolutii în care apare si parametrul de scalare y.
O functie nucleu foarte utilizatǎ este functia Gauss
g ( x, y)
2
1 exp 1 x
2 y 2 y
care este un nucleu de continut unitar adicǎ integrala lui pe axa realǎ este egalǎ cu 1. El realizeazǎ o netezire variabilǎ cu rezolutia datǎ de parametrul y.
Diagnozǎ prin retele neuronale artificiale
Amprentele defectiunilor diverse se pot recunoaste prin mijlocirea retelelor neuronale artificiale. Retelele neuronale artificiale sunt reproduceri încǎ modeste ale retelelor de neuroni ale fiintelor vii, în particular ale celor umane. Retelele naturale de neuroni sunt cele mai
rafinate sisteme de prelucrare a informatiei. Chiar dacǎ vitezele sunt de cele mai multe ori inferioare celor realizate de calculatoare, o retea cum este creierul uman depǎseste în rafinament orice calculator electronic. În tratarea informatiei suntem capabili a percepe, a prelucra semnalele primite, a extrage catacteristici reprezentative dintr-o lume foarte complexǎ si a decide. Aceste operatii le efectuǎm curent, cu o vitezǎ cel putin acceptabilǎ, în conditiile unei adaptabilitǎti comportamentale remarcabile vis-à-vis de situatii noi. Aceastǎ din urmǎ caracteristicǎ este datoratǎ reflexelor rapide (de pildǎ dimesionarea pupilarǎ în raport cu intensitatea sursei de luminǎ) si capacitǎtii de a învǎta. Dacǎ reflexele sunt în mare mǎsurǎ similare unor scheme automate simple, capacitatea de a învǎta se referǎ la adaptarea lentǎ la a executa o actiune nouǎ (mersul pe bicicletǎ, de pildǎ) sau la a aplica o teorie matematicǎ nouǎ. Un sportiv de performantǎ repetǎ de nenumǎrate ori aceleasi scheme la antrenament pânǎ când anumite miscǎri devin aproape inconstiente. Dobândeste astfel reflexe noi prin învǎtare. Matematicianul aplicǎ anumite elemente teoretice la rezolvarea unor probleme si prin exercitiu repetat învatǎ sǎ rezolve si sǎ formalizeze aspecte noi ale disciplinei sale.
Neuronul ca celulǎ de bazǎ a retelelor neuronale are un numǎr de intrǎri si o iesire unicǎ. Iesirea poate fi intrare pentru alti neuroni, uzual dupǎ o multiplicare cu un anumit numǎr. Figura alǎturatǎ prezintǎ schematic un
neuron cu trei intrǎri.
Celula neuronalǎ este caracterizatǎ de o asa-numitǎ functie de activare, care aplicǎ intrǎrile pe multimea valorilor de iesire. Functia de activare
pentru celulele neuronale naturale este consideratǎ a fi de forma unui salt
marcat de un prag de sensibiltate xp, conform figurii care urmeazǎ.
Variabila x este o combinatie liniarǎ a intrǎrilor reale multiple, care provin din ambiantǎ sau de la alti neuroni. Coeficientii acelei combinatii liniare se numesc ponderi. Se observǎ cǎ neuronul are un prag de sensibiltate care produce o iesire nenulǎ numai dacǎ este depǎsit. Un x sub pragul xp face ca iesirea sǎ fie zero (nu produce iesire).
O retea neuronalǎ, fie ea naturalǎ sau artificialǎ este compusǎ din neuroni interconectati în moduri foarte diverse. Conectarea poate fi ciclicǎ, adicǎ pe o cale mai scurtǎ sau mai lungǎ cel putin un neuron din retea îsi serveste siesi intrǎri, de regulǎ mijlocit. Asemenea retele se numesc retele Hopfield si au parte de o atentie aparte si de o tratare specificǎ în literatura de specialitate.
Foarte prezente în aplicatiile ingineresti sunt însǎ retelele stratificate pentru care structura este de asa naturǎ încât celulele neuronale sunt organizate în straturi. Se disting un strat de intrare si un strat de iesire, singurele care contin celule în contact nemijlocit cu mediul ambiant. Celulele din stratul de intrare primesc stimuli din exterior, cele din stratul de iesire genereazǎ iesiri ale retelei, rezultate ale unor calcule multiple executate predominant în paralel. Mai existǎ unul sau mai multe straturi ascunse formate din celule la care accesul nemijlocit pentru a mǎsura/observa intrǎrile si/sau iesirile nu este posibil. Conexiunile sunt numai de la un strat la altul într-o ordine a straturilor bine stabilitǎ. Stratul de intrare furnizeazǎ intrǎri primului strat ascuns. Acesta stratului ascuns urmǎtor (dacǎ existǎ un strat ascuns urmǎtor). Un penultim strat, si acesta
ascuns serveste intrǎri stratului de iesire. Niciodatǎ nu are loc un transfer de informatie între celulele unui aceluiasi strat de neuroni, niciodatǎ spre un strat anterior. Figura alǎturatǎ, care are înfǎtisarea unui graf orientat cu celule neuronale în noduri si cu legǎturile între neuroni pe arce reprezintǎ
tocmai o retea stratificatǎ. Reteaua reprezentatǎ are un singur strat ascuns.
Arcelor li se ataseazǎ anumite valori denumite ca si mai devreme ponderi. Arcele împreunǎ cu ponderile atasate reprezintǎ regula matematicǎ de realizare a acelor combinatii liniare a intrǎrilor simple sau multiple ale fiecǎrui neuron, intrǎri provenite din mediul ambiant sau care sunt iesiri ale neuronilor dintr-un strat precedent. Fuctiile de activare dau regula de calcul al iesirilor neuronilor si implicit al intrǎrilor pentru stratul neuronal urmǎtor.
Un element caracteristic al oricǎrei retele neuronale este capacitatea de învǎtare. Învǎtǎtura acumulatǎ de o retea de neuroni cu functii de activare precizate este stocatǎ în ponderile asociate conexiunilor dintre neuroni. Într-un proces de instruire, cum frecvent se spune în aplicatiile tehnice ale retelelor neuronale artificiale, ponderile sunt aranjate de asa naturǎ încât la intrǎri similare, rǎspunsul retelei, cu alte cuvinte iesirile ei sǎ fie similare dacǎ nu identice. Instruirea unei retele se face pe o multime de perechi intrǎri-iesiri observate experimental, numitǎ si multime de
învǎtare, multime fatalmente finitǎ. În cursul învǎtǎrii/instruirii retelei, ponderile sunt ajustate algoritmic pentru ca un anumit criteriu de penalitate sǎ fie minimizat. Intrǎrile sunt uzual valori observate ale unor mǎrimi fizice. Iesirile pot fi niste etichete (acestea ar putea fi diagnostice, de pildǎ) sau alte mǎrimi care sunt legate functional de intrǎri nu prin relatii functionale clar formulate si deci tratabile prin calcule aritmetice simple ci într-o manierǎ mai curând tainicǎ, misterioasǎ. Rezultǎ din ultima afirmatie cǎ retelele neuronale pot fi utilizate atât la clasificǎri cât si la interpolǎri de functii învǎluite în mister cum sunt uneori relatiile între variabile.
Clasificǎrile pot avea în vedere simptome ale unei functionǎri defectuoase a unui organism viu sau a unui sistem tehnic. În cazul acesta multimea de învǎtare, o multime de perechi intrǎri-iesiri se clasificǎ prin etichetare: fiecare set de intrǎri se asociazǎ cu un dignostic care are eventual un nume. Reteaua neuronalǎ este instruitǎ ca la iesire sǎ producǎ indicatorul celui mai probabil diagnostic. Astfel instruitǎ, reteaua poate recunoaste diagnosticele respective chiar dacǎ, cum se întâmplǎ deseori, simptomele introduse ca intrǎri nu reproduc riguros simptome-intrǎri din multimea de învǎtare. Indicatorii de diagnostic obtinuti la iesire ar putea fi un vector binar, câte un bit pentru fiecare diagnostic. Desigur, iesirea se poate nuanta în numere în intervalul [0,1] care sǎ dea numai o indicatie a diagnosticului/diagnosticelor cel/cele mai probabile. Decizia corectǎ trebuie sprijinitǎ mai departe pe alte informatii, pe experienta acumulatǎ de experti sau de un sistem expert ca element de inteligentǎ artificialǎ orientat pe diagnozǎ.
În procesul de instruire/învǎtare este necesar un asa-numit criteriu de penalitate care trebuie minimizat prin modificarea ponderilor atasate legǎturilor dintre neuronii retelei. Cele mai utilizate criterii sunt cele bazate pe distante, de pildǎ cel al celor mai mici pǎtrate. Iesirile observate experimental în conditii de intrǎri cunoscute, si acestea observate, se constituie în valori tintǎ pentru învǎtare. Valorile calculate cu reteaua
neuronalǎ trebuie sǎ vinǎ în procesul de învǎtare cât mai aproape de valorile tintǎ. Sub aspectul calculului efectiv problema este de a stabili un extrem. Existǎ metode variate de stabilire a extremelor functiilor. Metodele de gradient întâmpinǎ o dificultate majorǎ în cazul fuctiilor de activare de tipul salt/prag mentionate mai devreme: aceste functii nu sunt derivabile. De aceea functiile de activare pentru retelele neuronale au fost fǎcute continue si derivabile printr-o usoarǎ modificare. Modificarea
conduce la functia sigmoidalǎ care are expresia
( x)
1
si graficul din figura de mai jos.
1 e ( x x p )
Functia sigmoidalǎ este tot de tipul salt dar saltul este neted. Saltul se apropie oricât de mult de saltul net din cazul functiei prag pe mǎsurǎ ce constanta pozitivǎ creste. Functia de activare rǎmâne însǎ derivabilǎ
ceea ce este foarte important pentru metodele de gradient.
Referitor la structura retelelor neuronale se pune întrebarea (dublǎ) naturalǎ: câte straturi de neuroni sunt necesare, câte celule sunt necesare în fiecare strat de neuroni?
Stratul prim, cel de intrare trebuie sǎ continǎ atâtea celule câte componente are vectorul intrǎrilor retelei. Stratul ultim care produce iesirile retelei trebuie sǎ continǎ nici mai mult nici mai putin decât numǎrul de componente ale vectorului de iesire. Rolul oricǎrui strat neuronal interior/ascuns este acela de a re-formula/re-aplica iesirile stratului anterior pentru a obtine o reprezentare mai clar separabilǎ, mai
limpede clasificabilǎ a datelor. Straturile interioare sunt cele care permit atasarea unei semantici combinatiilor de intrǎri ale stratului.
Kolmogorov a dat de timpuriu un rǎspuns (partial) la problema numǎrului
de celule dintr-un strat ascuns. Rǎspunsul bazat pe teoria aproximǎrii
functiilor sunǎ astfel: fiind datǎ o functie continuǎ : I d
Rc , ( x) y ,
unde I = [0, 1] si în consecintǎ Id este cubul unitate d-dimensional, functia poate fi implementatǎ într-o retea neuronalǎ cu exact trei straturi, cu d unitǎti (celule) în stratul de intrare, cu (2c + 1) neuroni într-un unic strat
ascuns si cu c unitǎti în stratul de iesire.
Teorema datǎ de Kolmogorov este numai o teoremǎ de existentǎ. Construirea efectivǎ a functiilor de activare este deschisǎ. Posibilitǎtile de aproximare a functiei cu functii de un gen sau altul rǎmâne obiectul unor investigatii de naturǎ mai curând aplicativǎ.
Dupǎ cum s-a arǎtat mai devreme, retelele neuronale artificiale sunt deja
larg utilizate pentru a rezolva probleme de învǎtare în diverse domenii. Prin utilizarea unor date experimentale existente, retelele neuronale “învatǎ” relatiile între intrǎri si iesiri. Relatiile sunt aproape totdeauna neliniare si sunt cu totul empirice, fǎrǎ apel la vreo teorie din fundamentele fizicii, ale chimiei etc. Sub acest unghi, retelele neuronale sunt pur si simplu modele regresionale complexe a cǎror structurǎ este determinatǎ empiric. Desi retelele neuronale artificiale au fost inspirate încǎ de la începuturi de retelele de celule nervoase ale organismelor vii, dezvoltǎrile aplicative ulterioare ale acestor retele, pânǎ la cele mai recente, cunoscute si sub numele de modele conexioniste sunt produse ale progreselor recente înregistrate de analiza functionalǎ.
O retea neuronalǎ tipicǎ (desigur dintre cele stratificate, deocamdatǎ cele mai utilizate) este constituitǎ din mai multe straturi de noduri interconectate, fiecare nod cu o functie de activare si ponderi pe fiecare arc care conecteazǎ nodurile retelei între ele. Iesirea fiecǎrui nod este o functie neliniarǎ de toate intrǎrile sale. Astfel, reteaua este o dezvoltare a relatiei neliniare necunoscute între intrǎrile x si iesirile F într-un spatiu
generat de asa-numitele functii de activare ale nodurilor retelei. În particular, învǎtarea prin propagare directǎ în retele stratificate poate fi privitǎ ca sintetizarea unei aproximǎri a unei functii multidimensionale în
spatiul generat de functiile de activare i (x) , (i = 1, 2, …, m), adicǎ
F ( x)
m
ci i ( x)
i 1
Cu date empirice la dispozitie, cu functiile de activare date si cu topologia retelei cunoscutǎ, parametrii ci, (i = 1, 2, …, m) sunt ajustati astfel încât eroarea aproximǎrii sǎ fie minimǎ.
Douǎ tipuri de functii de activare sunt utilizate de obicei: functiile globale si functiile locale.
Functiile de activare globale sunt active pe un domeniu larg de valori ale intrǎrilor si asigurǎ o aproximare globalǎ a datelor empirice. Functiile de activare locale sunt active numai într-o vecinǎtate restrânsǎ a unei valori de intrare. Efectul lor se estompeazǎ pentru valori situate departe de centrul de receptivitate al functiei de activare. Cele mai cunoscute functii de activare globale (exemplificate mai devreme) sunt pragul liniar unitar utilizat în celulele numite perceptron si functia sigmoidalǎ utilizatǎ în retelele cu propagare secventialǎ inversǎ (BPN – Back Propagation Network).
Functiile de tipul radial sunt în esentǎ locale si sunt utilizate în retelele cu baze de functii radiale (RBFN – Radial Basis Function Network). Figura
care urmeazǎ reprezintǎ o asemenea functie.
În general, o functie radialǎ asociatǎ unui nod este de forma
i ( x)
h x xi
Functia gaussianǎ în varianta ei multidimensionalǎ
(x) detW exp
1 ( x x )T W ( x x ) ,
x R n
i n 2 i i
(2 ) 2
cu W o matrice pozitiv definitǎ este de tipul radial.
În cazul unidimensional ea se scrie ca
i ( x)
1 ( x x ) 2
exp i , x R
2 i 2 i
Retelele de tipul RBFN pot, de asemenea, sǎ aproximeze functiile continue cu o eroare oricât de micǎ.
Probleme si exercitii de autoevaluare
Problema 1.
Fie o retea neuronalǎ artificialǎ stratificatǎ cu stratul de intrare format din
2 neuroni, cu douǎ straturi ascuse având 7, respectiv 5 neuroni si cu stratul de iesire alcǎtuit din 3 neuroni. Câte ponderi se stabilesc în procesul de instruire a retelei?
Care sunt dimensiunile vectorilor x si y, de intrare si de iesire, din care sunt alcǎtuite perechile de vectori (xT, yT) din multimea de învǎtare pentru reteaua neuronalǎ specificatǎ?
DIAGNOZǍ PRIN ANALIZA COMPONENTELOR PRINCIPALE Generalitǎti
Sistemele automate, în care trebuie incluse si obiectele automatizate sunt supuse posibilitǎtii de a se defecta si de a devia de la regimul normal de functionare. Efectele functionǎrii defectuoase sunt multiple: reducerea calitǎtii, diminuarea eficientei, deteriorǎri partiale ale echipamentelor, opriri ale instalatiilor, producerea unor situatii vecine cu hazardul sau chiar periculoase, impact negativ asupra mediului ambiant etc. Detectarea promptǎ a defectiunilor si localizarea lor sunt prin urmare de foarte mare importantǎ.
Problema foarte dezbǎtutǎ în literaturǎ cunoaste douǎ abordǎri curente: a) prin metode bazate pe modele; b) prin metode bazate pe cunostinte apriori.
În primul caz este utilizatǎ ipoteza cǎ defectiunile produc modificǎri ale anumitor parametri fizici care produc la rându-le modificǎri ale parametrilor si/sau variabilelor de stare ale sistemului. Monitorizarea stǎrii sau parametrilor sistemului face parte din detectarea si diagnosticarea defectiunilor. Dezvoltarea unor modele cuprinzǎtoare este însǎ delicatǎ, uneori imposibilǎ, pentru majoritatea proceselor conduse automat.
În cazul al doilea sunt posibile abordǎri bazate pe anumite reguli formulate în raport cu structura procesului si din functiile tehnologice ale unitǎtilor de bazǎ sau pe simulǎri mai curând calitative. În cazul regulilor, uzual simptomele de rea functionare sunt urmǎrite în sensul invers al
propagǎrii lor. În cazul simulǎrii, modelele calitative descriu comportarea sistemului atât în conditii normale cât si în conditii anormale. Se comparǎ de data aceasta comportarea anticipatǎ pe baza modelului cu observatiile recoltate efectiv de pe sistem. Este asadar necesarǎ crearea în prealabil a unei baze de cunostinte, ceea ce consumǎ evident timp si efort calificat. Cum s-a discutat în sectiunea precedentǎ, o posibilitate relativ putin consumatoare de timp si efort o reprezintǎ sistemele de diagnozǎ bazate pe retele neuronale artificiale. Pentru aceasta este necsarǎ o bazǎ de date de instruire care sǎ cuprindǎ situatii tipice de functionare defectuoasǎ si simptomele asociate. Prin instruire (training) relatia între defectiuni si formele lor de manifestare poate fi învǎtatǎ sub forma stabilirii ponderilor asociate conexiunilor din retea. Reteaua instruitǎ poate fi apoi utilizatǎ pentru a asocia o functionare defectuoasǎ ulterioarǎ cu una din situatiile identificate anterior.
Pe durata operǎrii unei instalatii, o serie întreagǎ de variabile sunt monitorizate si depuse în baze de date. Se spune cǎ de regulǎ companiile sunt bogate în date dar sunt sǎrace în informatie, asta mai ales pentru procesele care au principii de functionare vag întelese sau suficient întelese dar foarte greu de modelat. În aceste cazuri limitǎ, singura sansǎ si totodatǎ sursǎ pentru a adânci întelegerea procesului o reprezintǎ datele produse de mǎsurǎtori. Analiza mutivariabilǎ a acestor date este (si) în atentia multor specialisti în probleme de detectare a defectiunilor si în diagnozǎ. Dat fiind volumul apreciabil de date, acesta trebuie redus la conditia de informatie si metoda utilizatǎ este cunoscutǎ ca Analiza Componentelor Principale (ACP) sau ca Proiectia pe Structura Latentǎ (PSL). Ea se bazeazǎ pe faptul cǎ practic numai un numǎr redus de variabile determinǎ procesul si prin ACP/PSL se stabileste un gen de dimensionalitate realǎ a procesului automatizat. Supravegherea procesului poate fi atunci realizatǎ într-un spatiu al unor variabile latente, spatiu de dimensionalitate rezonabilǎ. Aceastǎ tratare este eficientǎ acolo unde numǎrul de defectiuni posibile este limitat. Dacǎ defectiunile sunt mai de
numeroase, devine dificil a clasifica si/sau a identifica o gamǎ mare de functionǎri neconforme în raport cu posibilitǎtile de reprezentare oferite de un reper redus ca dimensiuni.
Analiza Componentelor Principale (ACP)
ACP este una din cele mai rǎspândite metode statistice de analizǎ multivarabilǎ. În esentǎ, variabilele observate afectate de zgomote si mutual corelate sunt reduse la o multime de variabile latente, care sunt un gen de sumar al informatiei relevante, prin proiectarea informatiei brute pe un subspatiu de dimensiune mai redusǎ. ACP este o procedurǎ de a explica întreaga variatie a datelor observate, grupate într-o matrice X R m n , cu m si n numǎrul de observatii, respectiv numǎrul de variabile
observate. Descompunerea conformǎ ACP este datǎ de
X t1 1
T … T E
unde ti si pi sunt, pentru orice i = 1, 2, …, k, vectori score si loading, iar E este o matrice de diferente reziduale. Vectorii ti sunt ortogonali, ca si vectorii pi la rândul lor, dar cei din urmǎ sunt în plus de lungime egalǎ cu unitatea. Prima componentǎ principalǎ este aceea care explicǎ cea mai mare parte a variatiilor, t1 = Xp1. În spatiul n-dimensional al vectorilor pi , vectorul p1 este pe directia celei mai mari variabilitǎti si vectorul t1 este proiectia fiecǎrui vector de observatii pe directia datǎ de p1.
A doua componentǎ principalǎ este aceea care este a doua ca importantǎ, ca magnitudine. Ea este ca si prima o combinatie liniarǎ a vectorilor variabilelor observate si este ortogonalǎ în raport cu prima. Mai departe, componentele sunt ordonate descrescǎtor, în ordinea contributiei lor la variatia generalǎ a datelor observate. Pentru o matrice X de rang n se pot stabili n asemenea componente. Dacǎ sunt corelatii puternice si zgomot important atunci se retin numai k < n astfel de componente, care sunt suficiente uzual pentru a explica variabilitatea datelor observate. Restul sunt la nivelul zgomotelor si prin eliminarea lor, procedurǎ obisnuitǎ, se
obtine un benefic efect de filtrare. Calculul componentelor principale se poate face pe cǎi diverse. Una din posibilitǎti constǎ în determinarea asa- numitelor valori singulare ale matricei X si apoi descompunerea acesteia
conform relatiei
X U V T
u v T
u v T
…
u v T
1 1 1
2 2 2
n n n
în care valorile singulare sunt ordonate în ordine descrescǎtoare:
1 2 …
n . Prima componentǎ principalǎ este u1, primul vector
loading este v1.
Algoritmul alternativ este cel al celor mai mici pǎtrate partiale, un algoritm iterativ si neliniar. Acest algoritm calculeazǎ pe rând fiecare componentǎ principalǎ. Perechea t1, p1 este calculatǎ din matricea X,
celelalte din matricile rezidualelor rezultate la fiecare etapǎ
1 1 E1
T
1 2 2 2
si tot asa în continuare. Algoritmul în detaliu contine pasii de mai jos si se aplicǎ pentru fiecare componentǎ principalǎ prin înlocuirea matricii X în
pasii urmǎtori cu Ei , i
1,2,…, n 1 .
(1) Se selecteazǎ un vector xj din X si se redenumeste t1, t1 = xj;
T T
(2) Se calculeazǎ
p1 : p1
t1 X / t1 t1 ;
(3) Se normalizeazǎ
p1 : p1
p1 / p1 ;
(4) Se calculeazǎ t1 : t1
Xp / pT p ;
(5) Se comparǎ t1 utilizat în pasul (2) cu cel calculat la pasul (4); dacǎ sunt sensibil aceiasi se încheie calculul, dacǎ nu se reia cu pasul (2).
Detectarea defectiunilor cu ajutorul analizei componentelor principale
Pentru monitorizarea cu succes a unui proces sunt colectate date si se dezvoltǎ componentele principale. ACP poate fi sensibilǎ la scarǎ. De
aceea este necesarǎ o prealabilǎ scalare a datelor, o standardizare a lor. Datele observate se centreazǎ pe valorile medii si se aduc la dipersie unitarǎ (medii si dispersii bazate pe observatiile experimentale). Pe baza acestor date modificate se poate elabora un set de diagrame/nomograme utile în monitorizarea procesului. Pentru fiecare diagramǎ se poate defini o înfǎsurǎtoare a regimurilor normale de functionare. Odatǎ dezvoltat modelul ACP cu k componente principale, X = TPT, valorile normalizate ale fiecǎrei variabile xij pot fi calculate pentru fiecare nouǎ observatie. Aceste valori pot fi apoi folosite pentru a evalua eroarea pǎtraticǎ
prezisǎ
EPP
k
( xij
j 1
xij )
În figura urmǎtoare axele t1 si t2 sunt axele de monitorizare si axa verticalǎ
este tocmai EPP.
Fiecare nouǎ observatie este amplasatǎ în cadrul acestei diagrame în noile coordonate t1, t2 si EPP. Regimurile normale sunt în interiorul cilindrului eliptic (eliptic în cazul zgomotelor gaussiene), regimurile inacceptabile cad în afara acestuia.
O monitorizare în timp prin intermediul EPP utilizeazǎ repartitia 2. Figura urmǎtoare ilustreazǎ limita de deasupra a cilindrului, dincolo de care apar motive de alertǎ. Depǎsirea de cǎtre EPP a limitei de deasupra produce alerta necesarǎ.
Proasta functionare a procesului poate produce una din urmǎtoarele douǎ situatii: sau defectiunea modificǎ structural corelatia între variabilele observate si atunci modelul ACP nu mai este valabil deoarece apare posibilitatea unor erori de predictie inadmisibile, sau nu are loc acea modificare a corelatiei si atunci EPP rǎmâne în limite normale dar punctele asociate noilor observatii se plaseazǎ înafara înfǎsurǎtoarei regimurilor normale dar sub limita de sus a EPP.
Diagnoza prin analiza componentelor principale
Diagnoza presupune specificarea/localizarea defectiunii. Defectiuni diferite produc grupǎri de puncte (clusters) diferite în spatiul
ti EPP i
1,2,…, k . Diagnosticul poate fi identificat prin inspectarea
acestui spatiu, dar în prealabil acestor defectiuni diferite trebuie sǎ li se ia amprentele. Date fiind corelatiile între variabilele observate, aparitia unei defectiuni face ca mǎsurǎtorile sǎ se deplaseze într-o directie destul de clar precizatǎ. Prin ACP se poate constitui o bibliotecǎ de directii asociate cu defectiunile posibile utilizabilǎ în clasificarea defectiunilor care pot apǎrea.
Mǎsurǎtorile, rezultatele observatiilor sunt grupate în matricea
cuprinzǎtoare X x1
x2 …
xn , alcǎtuitǎ din coloanele
x1, x2 ,…, xn
R m 1
. Dacǎ se noteazǎ cu M m1
m2 … mn
vectorul
mediilor si cu S s1
s2 . ..
sn vectorul deviatiilor standard calculate
din datele nominale ale procesului, M , S R1 n , datele din matricea X pot fi centrate si scalate conform relatiei
X X 1 1
…
1 T M
diag 1
s1
1 … 1
s2 sn
Fie acum o defectiune anumitǎ din cele cunoscute, care se si manifestǎ. Primul vector încǎrcat asociat defectiunii este centrat si scalat cunform
relatiei de mai sus. Prin ACP se obtine o directie în spatiul
ti , (i
1,2,…, k ) . Este de observat cǎ vectorii ti , pi nu sunt unici. Tot asa
de bine si vectorii – ti , – pi (ti , pi cu semnul schimbat) sunt acceptabili sub aspect matematic. Din punct de vedere practic cele douǎ situatii nu sunt echivalente. Lucrurile se pun la punct prin comparatii care recurg la datele experimentale.
Prin punerea laolaltǎ a mai multor defectiuni se obtine amintita bibliotecǎ
care formal poate fi reprezentatǎ de o matrice F D1
directiilor (normalizate) Di ale defectiunilor i = 1, 2, …, N.
D2 … DN a
Mǎsurǎtorile asupra unor variaile de proces care sunt monitorizate curent pot fi analizate prin ACP în modul descris imediat. Fie MD primul vector
(normalizat) încǎrcat la aparitia unei defectiuni. Alinierea între MD si
directia defectiunii i poate fi mǎsuratǎ prin produsul scalar T
care
este cosinusul unghiului celor doi vectori unitari. Un cosinus apropiat de unitate indicǎ directii paralele sau aproape paralele. Extrema cealaltǎ, cosinus nul înseamnǎ ortogonalitate. Cosinusi de valori intermediare reprezintǎ situatii intermediare. Aceasta este calea de a stabili defectiunea cea mai probabilǎ: prin compararea unghiurilor fǎcute de informatia curentǎ reprezentatǎ de MD cu directiile asociate defectiunilor din
bibliotecǎ. Se poate marca un prag de diagnosticare , subunitar dar
apropiat de unitate, fatǎ de care T
probabilǎ a defectiunii i.
sǎ semnaleze prezenta
Diagnoza este deci o problemǎ de diferentiere a defectiunilor. Este posibilǎ distinctia clarǎ între diverse defectiuni prin mijlocirea mǎsurǎtorilor curente? Distinctia este cu atât mai netǎ cu cât unghiurile
dintre directiile asociate defectiunilor însesi sunt mai mari. Ideal este ca
dacǎ pragul discriminator este , atunci
DT D
cos(2 cos 1 )
2 2 1
ceea ce asigurǎ riscuri reduse de clasificare eronatǎ, de confuzii între
diagnostice. Cazurile în care conditia nu este îndeplinitǎ pentru toate
perechile ( Di , Dj ) i j
se pot rezolva prin suplimentarea listei de
variabile observate, mǎsurate, prin luarea în considerare a unui al doilea, al treilea s.a.m.d. vector de observatii pânǎ la elucidarea situatiei. Prin aceste suplimente de informatie unghiurile dintre directiile defectiunilor din spatiul acesta secundar, redus pot sǎ devinǎ convenabile si riscul erorilor de clasificare poate fi diminuat.
Din alt unghi de vedere, fiind datǎ biblioteca de defectiuni se poate evalua
pragul de discriminare
cos( 1 cos
2
1 (max DT D ))
(1 max DT D
) / 2
cu maximul luat pe toate perechile de indici i j .
Învǎtarea de diagnostice noi
Tratarea conform schemei de mai sus poate rǎspunde si la defectiuni noi, care nu se gǎsesc în bibliotecǎ. Defectiunile noi pot fi învǎtate si depuse în bibliotecǎ în timpul operǎrii sistemului de diagnosticare. Când sunt detectate anomalii care nu pot fi clasificate în tipurile depuse în bibliotecǎ, este probabil cǎ o nouǎ defectiune, necunoscutǎ s-a produs. Directia ei se depune în bibliotecǎ pentru utilizǎri viitoare. Astfel biblioteca de diagnostice se actualizeazǎ.
Probleme si exercitii de autoevaluare
Problema 1.
Generati o matrice X de 20 de linii cu elemente aleatoare normal distribuite, dupǎ regulile urmǎtoare:
Pe prima coloanǎ valorile x1 ale unei variabile aleatoare normal distribuite cu media nulǎ si dispersia unitarǎ;
Pe coloana a doua valorile x2 ale unei variabile aleatoare normal distribuite cu media nulǎ si dispersia unitarǎ, diferitǎ si independentǎ de precedenta;
Pe coloana a treia o combinatie liniarǎ x3 = x1 + x2 a celor de pe primele coloane.
Calculati componentele principale prin cele douǎ metode, cea iterativǎ si cea prin valori singulare. Verificati dimensionalitatea realǎ a matricei. Încercati aceasi procedurǎ în cazul în care se adaugǎ o a patra coloanǎ cu elemente egale cu produsul element-cu-element al primelor douǎ colane. Problema 2.
Se presupune cǎ cele 3 (4) valori de pe fiecare linie a matricei din
problema precedentǎ sunt observatii experimentale succesive. Definiti câteva directii în spatiul restrâns al componentelor principale asociate unor presupuse defectiuni. Generati linii noi în matricea X dupǎ acelasi reguli.
Încercati diagnostice în raport cu directiile-diagnostice definite mai devreme.
108
DETECTAREA FUNCTIONǍRII NECONFORME SI DIAGNOZA CU FILTRE KALMAN EXTINSE (EKF)
Filtre Kalman extinse
Capitolele anterioare au adus în discutie diverse metode liniare de detectie a defectiunilor si de diagnozǎ. Partial acele metode sunt susceptibile de a fi aplicate si pentru sisteme neliniare.
Obiectul capitolului prezent îl constituie metodele tipic neliniare bazate pe filtrele Kalman extinse. Pentru problema detectǎrii defectiunilor în functionarea unui sistem cu modele cuplate static si dinamic se foloseste un filtru Kalman care estimeazǎ concomitent atât parametrii cât si starea sistemului. În cadrul discret în timp, modelul unui sistem stochastic
general poate fi descris matematic de ecuatiile urmǎtoare:
xd (t )
fd [t , xd (t
1), xs (t
1); (t
1)] wd
0 f s[t , xd (t ), xs (t ); (t )] ws
y(t )
h[t , xd (t ), xs (t ); (t )]
v(t )
care sunt, respectiv, modelul dinamic, modelul static si ecuatia de mǎsurare. Notatiile au semnificatiile urmǎtoare:
v(t) – zgomotul aditiv al mǎsurǎtorilor;
w(t) – zgomotul aditiv al procesului, la care se adaugǎ indicii d sau s
pentru dinamic sau static;
xd(t) – variabilele de stare cu dinamicǎ lentǎ; xs(t) – variabilele de stare cu dinamicǎ rapidǎ; y(t) – vectorul observatiilor;
(t ) [cT (t ), d T (t )]
nemǎsurate du(t).
– vectorul cu coeficientii fizici c(t) si perturbatiile
Pentru a cuprinde variatia temporalǎ a parametrilor se presupune cǎ vectorul (t) variazǎ conform relatiei (random walk)
(t ) (t 1) w
Pentru a estima concomitent vectorul de stare si vectorul parametrilor se
defineste un vector extins al stǎrii sistemului
T T T T
z(t )
[ xd (t ) xs (t )
(t )]
Algoritmul de estimare pe baza secventei de observatii y(0), y(1),…, y(t )
se prezintǎ astfel:
(t )
z (t )
K (t )[ y(t )
h (t , z (t ))]
K (t )
P (t )H T (t )Q 1 (t )
P(t )
M (t )
M (t )H T (t )[ H (t ) M (t ) H T (t )
Q (t )] 1 H (t) M (t )
M (t )
F (t
1) P(t
1)F T (t 1)
Qw (t 1)
h(t , z (t ))
M (0) M0
z (0) z0
cu H (t )
z , M (t )
E {(z(t)
z (t ))( z(t )
z (t ))T } o matrice
de covariatie evaluatǎ înainte de mǎsurǎtorile de la momentul t, K(t) amplificarea Kalman, Qv(t) matricea de covariatie a mǎsurǎtorilor si z (t ) estimarea lui z(t) înaintea masurǎtorii de la momentul t. Matricile F(t) sunt definite prin submatricile lor Fij (i, j = 1, 2, 3):
F f d
F fd
F f d
1 1 1 2 13
xd xs
F2 1
f s
1 f fˆ
F22
xs
f s
xs
xd
1
f s
xd
xd
fˆ
xs
F23
f s
xs
1 f fˆ
x d
f s
F31 = 0 F32 = 0 F33 = I
De asemenea, matricea Qw(t) este definitǎ prin submatricile ei Qij (i, j = 1,
2, 3):
Q Q Q Q f s
T T
f s Q 0
11 d 12 1 3
d s
Q2 1
f s
xs
1
f s Q
xd
f s
22
s
1
f s
s
d
T
f s
d
d
fs
T
Q f s
T
f s
xs
Q23
f s
xs
1
f s Q
T
Q 0 Q Q f s
T
f s Q Q
31 3 2 33
s
În expresiile de mai sus
f s
x
f s
z
z z (t 1 )
fˆ
si z
f d
z
z zˆ (t )
Matricile Qd , Qs si Q sunt matricile de covariatie ale zgomotelor atasate variabilelor dinamice, variabilelor statice, respectiv parametrilor din modelul sistemului.
În general, structura algoritmicǎ a filtrului Kalman extins este aceiasi ca în cazul filtrului Kalman extins pentru modelele dinamice neliniare. Diferenta principalǎ constǎ în calculul matricii sistemului F si în introducerea matricii generalizate de covariantǎ a zgomotelor sistemului Qw care includ termenii interactionali static-dinamic adecvati.
Compensarea filtrelor Kalman extinse
Filtrul Kalman extins are un rǎspuns adecvat la variatiile parametrice dacǎ acestia îsi modificǎ valoarea relativ lent. Contrar acestei cerinte, în sistemele de detectare a erorilor variatia parametrilor necunoscuti poate fi bruscǎ si poate apǎrea în orice moment. Întrucât în filtrarea Kalman extinsǎ matricea de covariatie a erorilor în parametrii necunoscuti scade monoton, filtrul nu poate estima eficient schimbǎrile parametrilor mai târzii în timp. Pentru a preveni o degradare a filtrǎrii de acest gen s-au propus mai multe metode de prevenire a descresterii monotone a amplificarilor filtrului prin anumite conditii suplimentare.
În metoda datoratǎ lui Yoshimura, de pildǎ, conditia suplimentarǎ care
trebuie verificatǎ este
n (t )
d M (t
i
1/ 2
1)
unde i
si (t )
sunt valorile nominale, respectiv estimatiile
parametrilor i, M
(t ) este dispersia erorilor din i, iar d este o constantǎ
pozitivǎ, uzual 1,96 corespunzǎtoare unui interval de încredere de 95%
pentru o variabilǎ z N (0;1) .
Dacǎ inecuatia de mai sus este verificatǎ pentru cel putin un indice, atunci
se modificǎ M
(t ) si se înlocuieste cu
2 2
M m (t 1)
i
i i (t ) d
în plus, valorile i
se înlocuiesc cu estimatiile lor, n
(t ) .
Detectarea schimbǎrilor datorate fenomenelor nemodelate
(defectiunilor)
Când un filtru este actionat de elemente calitative, de cunostinte compilate, el nu modeleazǎ obligatoriu corect comportarea sistemului. Este asadar foarte important a stabili dacǎ filtrul urmǎreste comportarea
realǎ a sistemului. Defectiunea sau defectiunile presupuse pot fi atunci eliminate ori acceptate pe baza validitǎtii modelului filtrant.
Se poate efectua o varietate de teste statistice asupra contributiilor noi
(innovations) sau asupra rezidualelor pentru a determina cât de valid este
modelul utilizat în proiectarea filtrului. Secventa inovatoare [ (t)] si
matricea ei de covariatie S
(t )
M [ (t )
T (t )] sunt date de
(t )
y(t )
h (t, z (t ))
S (t )
H (t ) M (t )H T (t )
Qv (t )
Dacǎ filtrul reflectǎ corect comportarea curentǎ a sistemului atunci secventa inovatoare este o secventǎ aleatoare gaussianǎ independentǎ, cu media nulǎ si covarianta datǎ de S (t). Dacǎ, dimpotrivǎ, din cauza fenomenelor nemodelate apare o anomalie atunci parametrii statistici ai secventei [ (t)] se modificǎ. Pentru supraveghere pe baza unei astfel de secvente de inovare (de reziduale) se poate utiliza testul obtinut prin raportarea secventialǎ a probabilitǎtilor.
Pentru fiecare componentǎ (t) se admit ipotezele alternative urmǎtoare:
Ipoteza H0: (t) este o secventǎ aleatoare gaussianǎ independentǎ de
medie nulǎ si de dispersie S
(t )
i
Ipoteza H1: (t) este o secventǎ aleatoare gaussianǎ independentǎ de
medie a (t) nenulǎ si de dispersie S
(t )
i
În formularea celor douǎ ipoteze alternative, S
(t ) este componenta din
pozitia (i, i) a matricei de covariatie S (t), iar ai (t )
constantǎ adecvatǎ.
a S (t ) cu a o
Testul raportului secvential al probabilitǎtilor este definit ca logaritmul functiei de verosimilitate compusǎ
l ln p( i (1), i (2), … , i (t ) / H1 )
i p( (1), (2),… , (t ) / H )
i i i 0
Pentru o secventǎ aleatoare gaussianǎ independentǎ [ (t)] functia din
expresia ultimǎ se poate evalua recursiv cu relatia
li (t)
li (t 1)
1
a i (t ) 2 a
în care i (t )
i (t ) /
S (t) este o cantitate normalizatǎ de medie a si
cu dispersia 1 (o valoare tipicǎ pentru a este unitatea). Un test al semnului constantei a se realizeazǎ prin schimbarea lui a în – a. O modificare a
testului pentru raportul secvential al probabilitǎtilor are forma
l * (t )
li (t ) pentru
0 pentru
li (t) 0
li (t ) 0
Cu testul modificat decizia este definitǎ astfel:
* ( )
dacǎ li
t s
* ( )
se retine ipoteza H1
dacǎ 0 li t
s se continuǎ cu o altǎ observatie.
Pragul s se alege conform unei conditii de timp mediu între alarme false
T 2 (e s 1)
m ediu
a 2 s
sau conform unor probabilitǎti stabilite pentru alarmǎ falsǎ ( ) si pentru alarmǎ ratatǎ ( )
(e s
1) B A e 1
s 1 e A
în care A ln[ / (1
)] si B ln[(1
) / ] . Pentru = = 0,05
rezultǎ s
4,06 .
Probleme si exercitii de autoevaluare
Exercitiul 1.
Revedeti proprietǎtile filtrelor Kalman la capitolul corespunzǎtor al cursului Modelarea si simularea dinamicii sistemelor.
Exercitiul 2.
Faceti comparatie între filtrele Kalman descrise la cursul Modelarea si simularea dinamicii sistemelor si filtrele Kalman extinse prezentate în sectiunea curentǎ si utilizate în probleme de diagnozǎ.
Exercitiul 3.
De ce este necesarǎ liniarizarea sistemului supravegheat cu ajutorul filtrelor Kalman extinse?
Exercitiul 4.
Pentru sistemul dinamic din figurǎ
scrieti filtrul Kalman extins de estimare a stǎrii sistemului si a parametrilor lui. Încercati sǎ stabiliti reactia/sensibilitatea filtrului la înfundarea uneia din conducte, cea de alimentare sau cea de evacuare.
116
SISTEME DE DISCURI TOLERANTE LA DEFECTE
Pentru a spori siguranta în functionare, sistemele de memorii pot fi structurate în asa manierǎ încât prin utilizarea unor redundante ele sǎ manifeste o anumitǎ tolerantǎ la defecte. În alti termeni, prin mǎsuri prealabile anumite subsisteme pot suplini alte subsisteme, care dintr-un motiv sau altul se defecteazǎ. Iatǎ în continuare un exemplu semnificativ în ceea ce priveste toleranta la defecte a sistemelor de memorare, în particular memorarea pe disc.
Memorii ieftine exploatate în conditii de sigurantǎ
Fie n dispozitive de memorare, D1, D2, …, Dn. Fiecare dintre ele contine k octeti si sunt dispozitive de stocat date. Fie alte m dispozitive de memorare C1, C2, …, Cm. Si acestea contin fiecare tot câte k octeti si sunt denumite dispozitive de verificare. Continutul fiecǎrui dispozitiv de verificare se calculeazǎ din continutul dispozitivelor de date. Problema este a calcula continutul dispozitivelor Ci în asa mod încât oricare m dispozitive din D1, D2, …, Dn, C1, C2, …, Cm s-ar defecta, continutul dispozitivelor defecte sǎ poatǎ fi reconstituit din continutul dispozitivelor în functie.
Strategia generalǎ
Formal, modelul defectului este acela al unei pierderi de informatie prin stergere. Dacǎ un dispozitiv se defecteazǎ el iese din joc si sistemul
recunoaste aceastǎ situatie de inutilitate. Pierderea aceasta diferǎ de aparitia unor erori, caz în care defectarea se manifestǎ prin stocarea si restituirea unor valori incorecte care pot fi recunoscute printr-un anume gen de codare intrinsecǎ.
Calculul continutului fiecǎrui dispozitiv de verificare Ci necesitǎ o functie Fi aplicatǎ tuturor dispozitivelor de date. Formulele urmǎtoare sunt un exemplu pentru n = 8 si m = 2. Continutul dispozitivelor de verificare C1
si C2 se obtine prin evaluarea functiilor F1, respectiv F2.
C1 F1 (D1 , D2 ,D 3 , D4 , D5 , D6 , D7 , D8 )
C2 F2 (D1 , D2 ,D 3 , D4 , D5 , D6 , D7 , D8 )
Metoda de codare RS-RAID (RS – de la Reed-Solomon, RAID – de la Redundant Arrays of Inexpensive/Independent Disks) divide fiecare dispozitiv de memorare în cuvinte. Fiecare cuvânt este alcǎtuit din w biti, numǎr ales de programator dar raportat la anumite restrictii. Asadar,
fiecare dispozitiv contine
l (k octeti )
8 biti
octet
1 cuvânt
w biti
8k cuvin te w
Functiile de codare Fi opereazǎ pe cuvinte cu rezultatul tot în cuvinte, ca în relatiile urmǎtoare, unde xi,j reprezintǎ cuvântul j din dispozitivul de
memorare Xi.
Pentru notatii mai simple, cu un indice mai putin, se admite cǎ fiecare dispozitiv retine un cuvânt si numai unul. Pe calea aceasta problema se reduce la n cuvinte-date, d1, d2, …, dn si la m cuvinte de verificare c1, c2,
…, cm calculate din cuvintele-date în asa mod încât pierderea oricǎror m
cuvinte sǎ fie toleratǎ. Pentru calculul unui cuvânt de verificare ci depus în
dispozitivul Ci se aplicǎ functia Fi cuvintelor-date
ci Fi (d1 , d 2 ,…, d n )
Dacǎ un cuvânt-datǎ din dispozitivul Dj este actualizat de la dj la dj’ atunci fiecare din cuvintele de verificare ci trebuie recalculat prin utilizarea unei
functii Gi,j astfel încât
ci Gi , j (d j , d j , ci )
Când m dispozitive de memorare clacheazǎ se reconstruieste sistemul dupǎ cum urmeazǎ. Mai întâi, pentru fiecare dispozitiv defect Dj se construieste o functie care sǎ recupereze continutul lui Dj din cuvintele depuse în dispozitivele functionale. Când operatia aceasta este încheiatǎ se reconstituie continutul unor eventuale dispozitive de verificare disfuncte Ci, cu ajutorul functiilor Fi.
De exemplu, presupunând cǎ m = 1, paritatea n + 1 se poate descrie în termenii generali de mai sus. Existǎ numai un dispozitiv de verificare C1 si lungimea cuvântului este de 1 bit (w = 1). Pentru calculul cuvâtului de verificare c1 se ia paritatea prin SAU EXCLUSIV (XOR) a cuvintelor de
date
c1 F1 (d1 , d 2 ,…, d n ) d1
d 2 … d n
Dacǎ cuvântul de pe suportul Dj se schimbǎ din dj în dj’ atunci c1 se recalculeazǎ din paritatea vechiului cuvânt si din cele douǎ cuvinte-date
c1 G1, j (d j , d j , c1 ) c1 d j d j
Dacǎ un dispozitiv se defecteazǎ atunci fiecare cuvânt poate fi reconstituit
prin paritate a cuvintelor de pe dispozitivele rǎmase în functie
d j d1
…
d j 1
d j 1
… d n c1
Sistemul este rezistent la defectarea oricǎrui (unic) suport.
O reformulare a problemei sunǎ astfel: sunt date n date d1, d2, …, dn , toate de dimensiunea w. Se definesc functiile F si G care sunt utilizate pentru a calcula si pentru a întretine, a mentine actuale cuvintele de verificare c1, c2, …, cm. Se face o descriere a modului cum se reconstituie cuvintele pe
orice suport esuat când numǎrul de dispozitive de memorare defecte nu depǎseste m. Odatǎ cuvintele-date reconstituite se recalculeazǎ cuvintele de verificare din cuvintele-date cu ajutorul functiilor F. Sistemul este refǎcut în întregime.
Algoritmul RS-RAID
Trei aspecte sunt deosebite în aplicarea algoritmului. Primul constǎ în utilizarea matricilor Vandermonde (Alexandre-Théophile Vandermonde,
1735-1796) pentru calculul si mentinerea cuvintelor de control, al doilea este utilizarea eliminǎrii Gauss pentru recuperarea din starea de nefunctionare si al treilea, utilizarea aritmeticii specifice câmpurilor Galois. Acestea toate sunt detaliate în continuare.
Calculul si întretinerea cuvintelor de verificare
Functiile Fi sunt prin definitie combinatii liniare ale cuvintelor-date
ci Fi (d 1 , d 2 ,…, dn )
n
d j fi , j
j 1
Cu alte cuvinte, dacǎ se adoptǎ o reprezentare matricialǎ cu D si C vectori
si Fi linii într-o matrice F
FD = C
Matricea F este definitǎ ca o matrice Vandermonde mxn cu fi,j = ji – 1, ceea ce face din relatia de mai sus
f1,1
f 2,1
f m ,1
f1, 2
f 2 , 2
f m , 2
f1,n d1
f 2, n d 2
f m , n d n
1 1
1 2
1 2 m 1
1
3
3 m 1
1 d1 c1
n d2 c2
nm 1 d c
Când unul din cuvintele-date dj se schimbǎ în dj’ cuvintele de verificare trebuie schimbate în consecintǎ. Prin scǎderea portiunii din cuvântul de
verificare care corespunde lui dj si adunarea cantitǎtii necesare pentru dj’
se obtine pentru Gi,j definitia din relatia de mai jos
ci Gi , j (d j , d j , ci ) ci
f i , j (d j
d j )
Asadar, calcularea si întretinerea cuvintelor de verificare pot fi fǎcute printr-o aritmeticǎ simplǎ, dar dupǎ regulile date mai departe.
Recuperarea din crash
Pentru a explica recuperarea aceasta, se definesc matricea
I
A si
F
vectorul
D
E . Apoi se scrie ecuatia AD = E care în formǎ detaliatǎ
C
Se observǎ cǎ fiecare suport din sistem are o linie în matricea A si în vectorul E. Dacǎ un dispozitiv esueazǎ esecul se materializeazǎ în relatia de mai sus prin ignorarea/stergerea liniei care corespunde acelui dispozitiv. Rezultǎ o matrice A’ si un vector E’ cu linii mai putine dar care verificǎ o ecuatie asemǎnǎtoare cu cea de mai sus
A’D = E’
Dacǎ exact m dispozitive sunt inutilizabile atunci matricea A’ este o matrice nxn. Deoarece matricea F este de tipul Vandermonde orice submultime de linii ale ei este liniar independentǎ. Matricea A’ este, asadar, nesingularǎ si valorile care compun vectorul D pot fi calculate din
ecuatia matricialǎ de mai sus prin eliminare Gauss. Prin urmare toate datele pot fi recuperate.
Cu D odatǎ obtinut, valorile oricǎrui suport cu date de verificare Ci esuat pot fi si ele reconstituite. Dacǎ sunt mai putin de m dispozitive cu probleme, alegerea la întâmplare a unui numǎr de exact n linii din A’ permite eliminarea gaussianǎ si continuarea este evidentǎ. Sistemul tolereazǎ pânǎ la m dispozitive inutilizabile.
Aritmetica în câmpurile Galois
O preocupare majorǎ în algoritmul RS-RAID o constituie domeniul calculelor care este o multime de cuvinte binare de lungime fixǎ w. Recuperarea dintr-o eroare comisǎ obisnuit ar putea consta în efectuarea unor calcule modulo 2w. Maniera aceasta însǎ nu functioneazǎ deoarece împǎrtirea nu-i definitǎ pentru orice pereche de elemente. De exemplu,
3:2 modulo 4 nu este definitǎ. Aceastǎ situatie face eliminarea Gauss imposibilǎ în foarte multe cazuri.
Câmpurile cu 2w elemente sunt câmpuri Galois – notate GF(2w) – un subiect fundamental în algebra abstractǎ. Mai jos se definesc moduri eficiente de a aduna, scǎdea, multiplica si împǎrti elemente apartinând unui câmp Galois.
Elementele unui câmp Galois GF(2w) sunt întregi de la zero la 2w – 1. Adunarea si scǎderea sunt aplicatii simple: operatii XOR (SAU
EXCLUSIV). De pildǎ, în GF(24)
11 7
11 7
1011
1011
0111
0111
1100 12
1100 12
Multiplicarea si diviziunea sunt mai complexe. Când w este mic, 16 sau mai mic, se utilizeazǎ tabele de logaritmi lungi de 2w – 1. Tabelul contine indici, o functie gflog si o functie gfilog. Ambele functii sunt functii cu valori întregi. Prima este listatǎ pentru indici de la 1 la 2w – 1 si este o listǎ de logaritmi în câmpul Galois, a doua este definitǎ pentru indici de la 0 la
2w – 2 si contine rezultatul operatiei inverse logaritmǎrii. Evident, compunerea celor douǎ functii, în orice ordine produce functia identitate, gflog[gfilog(i)] = i, gfilog[gflog(i)] = i. Cu aceste functii se pot executa operatiile de multiplicare si de împǎrtire prin luarea logaritmilor factorilor, prin calculul sumei sau a diferentei valorilor obtinute (ca elemente ale câmpului) si revenirea la rezultat prin operatia inversǎ. Iatǎ
un tabel de logaritmi pentru w = 4.
Evident, numai numerele nenule au logaritmi. Logaritnul invers al unui numǎr i este egal cu logaritmul invers al numǎrului [i mod (2w – 1)]. Exemple de calcule în aritmetica din GF(24):
3*7 = gfilog[gflog(3) + gflog(7)] = gfilog[4 + 10] = gfilog[14] = 9
13*10 = gfilog[gflog(13) + gflog(10)] = gfilog[13 + 9] = gfilog[7] = 11
13/10 = gfilog[gflog(13) – gflog(10)] = gfilog[13 – 9] = gfilog[4] = 3
3/7 = gfilog[gflog(3) – gflog(7)] = gfilog[4 – 10] = gfilog[9] = 10
Asadar, o multiplicare sau o diviziune necesitǎ trei apeluri la tabel – douǎ pentru logaritmi si unul pentru inversul logaritmului –, o adunare sau o scǎdere si o operatie de tip modulo.
Aritmetica unui câmp Galois are fundamentele date în continuare.
Un câmp GF(n) este o multime de n elemente închisǎ la operatiile de adunare si multiplicare, cu un invers (opus) raportat la adunare pentru fiecare element, cu un invers raportat la operatia de înmultire pentru fiecare element nenul. Câmpul GF(2) de exemplu, contine douǎ elemente, adunarea si înmultirea se practicǎ modulo 2 (operatorii XOR si AND, respectiv). Analog, dacǎ n este prim atunci GF(n) este multimea {0, 1, …, n – 1} în care adunarea si înmultirea se practicǎ modulo n.
Dacǎ n > 1 nu este prim, atunci multimea {0, 1, …, n – 1} cu adunarea si multiplicarea modulo n nu este câmp. De exemplu, dacǎ n = 4 atunci multimea {0, 1, 2, 3}, închisǎ la adunare si înmultire nu este câmp deoarece 2 nu are un invers la înmultire, nu existǎ a astfel încât 2a = 1 (mod 4). Asadar, nu se poate face codarea cu cuvinte binare de lungime w
> 1 cu operatiile de adunare si înmultire modulo 2w. În loc trebuie utilizat câmpul Galois corespunzǎtor.
Explicatiile relative la câmpurile Galois uzeazǎ de polinoamele într-o nedeterminatǎ cu coeficienti în GF(2). Adicǎ, dacǎ r(x) = x + 1 si s(x) = x atunci r(x) + s(x) = 1 doarece x + x = (1 + 1)x = 0x = 0. Mai mult, se pot lua polinoame de acest gen modulo alte polinoame conform cu identitatea: dacǎ r(x) mod q(x) = s(x), atunci s(x) este un polinom de grad inferior lui q(x) si r(x) = q(x)t(x) + s(x) cu t(x) un polinom în x.
Dacǎ, de exemplu, r(x) = x2 + x si q(x) = x2 + 1 atunci r(x) mod q(x) = x +
1.
Fie acum q(x) un polinom primitiv de gradul w cu coeficienti în GF(2). Primitiv înseamnǎ cǎ polinomul nu are divizori cu coeficienti în GF(2) si polinomul x este generatorul câmpului GF(2w). Cum genereazǎ x câmpul? Se considerǎ initial elementele obligatorii 0, 1 si x si se continuǎ enumerarea elementelor obtinute prin multiplicarea ultimului element cu x si retinerea rezultatului modulo q(x). Enumerarea se încheie cu elementul pentru care rezultatul modulo q(x) este egal cu 1.
Dacǎ, de exemplu, w = 2 si q(x) = x2 + x + 1 atunci primele elemente sunt
0, 1 si x, iar x2 mod q(x) = x + 1 si cele patru elemente ale câmpului GF(4) sunt {0, 1, x, x + 1}. Un al cincilea element nu existǎ deoarece x(x + 1) = x2 + x care luat modulo q(x) produce 1, element deja existent.
Câmpul general GF(2w) se construieste prin gǎsirea unui polinom primitiv q(x) de gradul w peste GF(2) urmatǎ de enumerarea elementelor generate de x. Adunarea si multiplicarea elementelor câmpului se fac dupǎ regulile adunǎrii si multiplicǎrii polinoamelor cu grija de a lua totdeauna
rezultatul modulo q(x). Un asemenea câmp se mai scrie ca GF(2w)= GF(2) [x]/q(x).
Acum, pentru a uza de un câmp GF(2w) în algoritmul RS-RAID este necesarǎ definirea unei aplicatii a elementelor din acest câmp pe cuvinte binare de lungime w. Un polinom r(x) din GF(2w) poate fi aplicat pe un cuvânt binar b de lungime w prin punerea celui de al i-lea bit din b egal cu coeficientul puterii xi din polinom. Pentru GF(4) = GF(2)[x]/x2 + x + 1 se
obtine tabelul urmǎtor
Adunarea elementelor se realizeazǎ prin operatia SAU EXCLUSIV (XOR) bit cu bit. Multiplicarea este mai complicatǎ: se iau elementele sub forma polinomialǎ, se multiplicǎ ca polinoame si se ia rezultatul modulo q(x). Tabelele de logaritmi ca acela de mai sus se bazeazǎ pe o tabelǎ de compunere ca aceea datǎ pentru cazul GF(4).
Pentru alte valori w, polinoame primitive q(x) se gǎsesc în literaturǎ. Iatǎ
câteva:
w = 4: x4 + x + 1
w = 8: x8 + x4 + x3 + x2 + 1 w = 16: x16 + x12 + x3 + x + 1 w = 32: x32 + x22 + x3 + x + 1 w = 64: x64 + x4 + x3 + x + 1
Cu elementul de pornire x0 = 1, GF(2w) se completeazǎ prin enumerarea elementelor obtinute prin multiplicarea cu x a ultimului element enumerat si luarea rezultatelor modulo q(x). Tabelul care urmeazǎ cuprinde cazul câmpului GF(24) cu polinomul primitiv q(x) = x4 + x + 1. În acelasi tabel
se observǎ si modul cum se genereazǎ tabelele de logaritmi si de invers-
logaritmi prezentate mai devreme.
Sumarul algoritmului
Fiind date n dispozitive pentru date si m dispozitive de control, algoritmul RS-RAID care le face tolerante la cel mult m defecte se aplicǎ urmǎtoarea secventǎ de operatii:
1. Se alege o valoare pentru w astfel ca 2w > m + n. Este convenabil a se alege w = 8 sau w = 16, ceea ce conduce la cuvinte numǎrate în octeti (bytes). Pentru w = 16 suma m + n poate fi pânǎ la 65535.
2. Se stabilesc tabelele cu functiile gflog si gfilog dupǎ metoda datǎ mai devreme
3. Se calculeazǎ matricea F care este o matrice Vandermonde mxn: fi,j =
ji – 1 (pentru 1 i
m , 1
j n ) cu operatii în GF(2w).
4. Matricea F se foloseste la calculul si la întretinerea dispozitivelor de verificare, din cuvinte depuse pe dispozitivele de date. Iarǎsi, operatiile se fac în GF(2w).
5. Dacǎ un numǎr de dispozitive, mai putine de m clacheazǎ atunci ele se reconstituie în maniera care urmeazǎ. Se aleg oricare n dispozitive din cele rǎmase în functie si se construiesc matricea A’ si vectorul E’ ca mai sus. Se rezolvǎ apoi pentru D ecuatia A’D = E’. Prin aceasta datele de pe dispozitivele de stocare a datelor sunt recuperate. Acum se pot reconstitui si dispozitivele de verificare esuate, prin utilizarea matricii F.
Un exemplu. Se presupune cǎ sunt trei suporturi de date si trei suporturi de verificare si fiecare dintre ele detine un megaoctet. Asadar, n = 3 si m =
3. Se alege w = 4, asa încât 2w > m + n. Pentru multiplicǎri se foloseste
tabelul dat mai devreme pentru GF(24). În aceste conditii matricea F este
10
F 11
12
20 30
21 31
22 32
1 1 1
1 2 3
1 4 5
Se pot calcula acum cuvintele de verificare prin relatia C = FD. Se admite cǎ primele cuvinte stocate pe cele trei dispozitive de date sunt, respectiv,
3, 13, 9. Calculul cuvintelor de control C1, C2, C3 produce valorile
urmǎtoare:
C1 1*3
C2 1*3
C3 1*3
1*13
2*13
4*13
1*9
3*9
5*9
3 13 9
3 9 8
3 1 11
0011
0011
0011
1101
1001
0001
1001
1000
1011
0111 7
0010 2
1001 9
Dacǎ, de pildǎ, continutul dispozitivului de date cu indicele 2 se modificǎ si primul numǎr devine 1, atunci fiecare din dispozitivele de verificare
primeste valoarea (1
13)
(0001
1101)
1100
12 , care este utilizatǎ
pentru recalcularea valorilor de verificare
C1 7
1*12
0111
1100
1011 11
C2 2
2 *12
2 11
0010
1011
1001 9
C3 9
4 *12
9 5 1001
0101
1100 12
Dacǎ D2, D3 si C3 se pierd atunci, din matricea A si din vectorul E se sterg liniile care corespund dispozitivelor defecte pentru a obtine ecuatia A’D =
E’
Prin eliminare Gauss se poate inversa matricea A’ si se obtine
si valorile reconstituite sunt
D2 2 * 3
D3 3 * 3
3 *11
2 *11
1* 9
1* 9
6 14 9 1
5 5 9 9
Cu matricea F se poate reconstitui si
C3 1* 3
4 *1
5 * 9
3 4 11 12
si sistemul este recuperat în întregime.
Existǎ si alte sisteme RAID la care se fac scurte referiri în continuare.
RAID nivelul 0 (fǎrǎ redundantǎ)
Un sistem de discuri non-redundant (sau de nivel 0) are costul cel mai scǎzut din cauza lipsei oricǎrei redundante. Schema aceasta oferǎ cea mai bunǎ performantǎ la scriere deoarece nu necesitǎ vreodatǎ actualizarea vreunei informatii redundante. Surpinzǎtor, nu are cea mai bunǎ performantǎ la citire. Schemele redundante (ca aceea numitǎ “în oglindǎ” sau “oglinditǎ”, care creeazǎ duplicate ale datelor) pot executa mai bine citirile prin planificarea selectivǎ a cererilor pe discul cu timpul de cǎutare mediu cel mai scurt si întârzierea rotativǎ cea mai micǎ. Fǎrǎ redundante, orice cǎdere a unui disc va produce pierderi de date. Sistemele de discuri
fǎrǎ redundante sunt larg utilizate în supercalcul unde performanta si capacitatea trec ca importantǎ înaintea fiabilitǎtii.
Sistem de discuri fǎrǎ redundante
RAID nivelul 1 (sisteme “în oglindǎ”)
Sistemul traditional denumit “în oglindǎ” sau “cu umbrǎ” utilizeazǎ de douǎ ori mai multe discuri decât un sistem de discuri fǎrǎ redundante. Ori de câte ori un articol-datǎ este scris pe un disc el este scris si pe un disc redundant, astfel existǎ totdeauna douǎ cópii ale informatiei, douǎ exemplare. Când articolul trebuie citit, el poate fi recuperat de pe disc cu întârzieri de asteptare, de cǎutare si rotationale mai scurte. Dacǎ un disc se defecteazǎ, copia este utilizatǎ pentru serviciul cerut. Oglindirea este utilizatǎ frecvent în aplicatii cu baze de date când accesibilitatea si viteza tranzactiilor sunt mai importante decât eficienta stocǎrii.
Sistem de discuri “în oglindǎ”
RAID nivelul 2 (memorie în stilul codurilor corectoare de erori)
Sistemele de memorii asigurǎ recuperarea din starea de disfunctie a unor componente la costuri mai reduse decât prin oglindire, dacǎ folosesc codurile Hamming. Codurile Hamming fac verificǎri de paritate pe submultimi de componente distincte si suprapuse. În una din variantele
acestei scheme, patru discuri de date necesitǎ trei discuri redundante, unul mai putin decât în cazul sistemului oglindǎ. Deoarece numǎrul de discuri redundante este proportional cu logaritmul numǎrului total de discuri din sistem, eficienta memorǎrii creste odatǎ cu numǎrul discurilor de date.
Sistem de discuri în stilul codurilor corectoare de erori
Dacǎ unul (si numai unul) din discuri cade, componentele mai multor discuri de paritate devin inconsistente cu datele si componenta defectǎ este identificatǎ: este componenta comunǎ tuturor subseturilor incorecte. Informatia pierdutǎ este recuperatǎ prin regulile obisnuite ale codului Hamming utilizat.
RAID nivelul 3 (paritate cu biti intercalati)
Se pot aduce îmbunǎtǎtiri sistemului din paragraful anterior prin observarea faptului cǎ spre deosebire de cǎderea elementelor de memorie, controlerele discurilor pot identifica usor care disc este cel cu defect. Astfel, pentru recuperarea informatiei pierdute se poate utiliza un singur disc de paritate si nu un set de discuri de paritate.
Sistem cu paritate prin biti intercalati
Într-un sistem de discuri cu paritate de biti intercalati, datele sunt conceptual intercalate bit-cu-bit pe discurile de date si se adaugǎ un singur disc de paritate pentru a tolera cǎderea unui disc (si numai a unuia).
Fiecare cerere de citire acceseazǎ toate discurile de date si fiecare cerere de scriere acceseazǎ toate discurile de date si discul de paritate. Astfel numai o cerere poate fi servitǎ la un moment dat. Deoarece discul de paritate contine numai informatia de paritate si nu date, discul de paritate nu poate participa la citiri, ceea ce produce o usoarǎ scǎdere în performanta la citire fatǎ de sistemele cu redundante care distribuie informatia de paritate si datele pe toate discurile. Sistemele de discuri cu paritate pe biti intercalati sunt utilizate frecvent în aplicatii care cer o lǎrgime de bandǎ mare dar nu viteze intrare-iesire mari. Mai sunt si simplu de implementat.
RAID nivelul 4 (paritate pe blocuri intercalate)
Existǎ o similitudine între sistemele de discuri cu intercalare de biti si cele cu intercalare de blocuri. Deosebirea constǎ în obiectul operatiei de intercalare: nu intercalare de biti ci de blocuri de dimensiune arbitrarǎ. Dimensiunea acestor blocuri este denumitǎ unitatea de stripare (striping). Citirile cerute, mai mici decât unitatea de stripare acceseazǎ numai un disc de date. Cererile de scriere trebuie sǎ actualizeze blocurile de date cerute si trebuie totodatǎ sǎ calculeze si sǎ actualizeze blocul de paritate. Pentru scrieri de mare întindere care ating blocuri pe toate discurile, paritatea este calculatǎ observînd cum diferǎ datele noi de cele vechi si aplicând acele diferente pe blocul de paritate. Scrierile de micǎ întindere cer asadar patru operatii de intrare-iesire pe disc: una pentru a scrie articolul nou, apoi douǎ pentru a citi vechiul articol si vechea paritate pentru a calcula noua informatie de paritate si una de scriere a noii paritǎti. Aceastǎ operatie este cunoscutǎ ca o procedurǎ citeste-modificǎ- scrie. Deoarece un sistem de discuri cu paritate cu intercalare de blocuri are numai un disc de paritate, care trebuie actualizat la toate operatiile de scriere, discul de paritate poate deveni cu usurintǎ un loc îngust, o strangulare. Din cauza acestei posibile limitǎri sunt de preferat sistemelor
de discuri cu paritate pe blocuri, sistemele de discuri cu paritate pe blocuri distribuite.
Sistem de discuri cu paritate pe blocuri intercalate
RAID nivelul 5 (paritate pe blocuri intercalate distribuite)
Sistemele de discuri cu paritate pe blocuri distribuite eliminǎ strangularea de pe discul de paritate care se constatǎ la sistemele cu paritate pe blocuri intercalate prin distribuirea informatiei de paritate uniform pe toate discurile. Un avantaj suplimentar al distribuirii informatiei de paritate uniform pe toate discurile, frecvent trecut cu vederea, constǎ în distribuirea si a datelor pe toate discurile si nu ca în cazul anterior, pe toate cu exceptia unuia. Aceasta permite tuturor discurilor sǎ participe la servirea operatiilor de citire spre deosebire de schemele redundante cu discuri de paritate dedicate, în care discurile de paritate nu pot participa la servirea solicitǎrilor de citire. Sistemele cu paritate pe blocuri intercalate distribuite au una dintre ele mai bune performante pentru citiri restrânse, citiri lungi si scrieri lungi, între toate sistemele de discuri cu redundante. Cu toate acestea, cererile de citire de lungime restrânsǎ sunt întrucâtva ineficiente comparativ cu schemele redundante, cum sunt cele cu oglindire, datoritǎ necesitǎtii de a executa operatii citeste-modificǎ-scrie pentru actualizarea paritǎtii. Aceasta este partea slabǎ majorǎ a sistemelor RAID de nivelul 5, în ceea ce priveste performantele.
Metoda exactǎ utilizatǎ pentru a distribui paritatea în sistemele cu paritate distribuitǎ în blocuri intercalate are impact asupra performantelor. Figura alǎturatǎ ilustreazǎ cea mai bunǎ distributie a informatiei de paritate (discurile gri), numitǎ distributie de paritate simetricǎ la stânga.
Sistem de discuri cu paritate pe blocuri intercalate distribuite
O proprietate utilǎ a acestui gen de distributie constǎ în faptul cǎ ori de câte ori sunt traversate secvential unitǎtile de stripare, fiecare disc este accesat în succesiune o datǎ înainte de a fi accesat a doua oarǎ. Aceastǎ proprietate reduce conflictele de disc atunci când sunt servite solicitǎrile
mari.
Sistem RAID de nivelul 5 cu simetrie la stânga
RAID nivelul 6 (redundante P + Q)
Paritatea este un cod redundant capabil a corecta orice defectare singularǎ care se autoidentificǎ. Dacǎ sunt luate în considerare sisteme cu discuri mai numeroase, este necesar a utiliza coduri mai puternice, capabile sǎ tolereze defecte multiple. Mai mult, când un disc într-un sistem protejat prin paritate cade, recuperarea continutului discului defect reclamǎ lectura cu succes a continutului tuturor discurilor functionale. În aceste cazuri, probabilitatea de a întâlni în cursul recuperǎrii o eroare de citire necorectabilǎ poate fi semnificativǎ. Asadar, aplicatiile cu cerinte de
fiabilitate mai severe trebuie tratate cu coduri corectoare de erori mai puternice.
Sistem de discuri cu redundante P + Q
O astfel de schemǎ, denumitǎ adesea schemǎ cu redundantǎ P + Q, foloseste codurile Reed-Solomon pentru protectia fatǎ de cǎderea a pânǎ la douǎ discuri utilizând cel putin douǎ discuri redundante. Sistemele de discuri cu redundante P + Q sunt structural foarte asemǎnǎtoare sistemelor cu paritate distribuitǎ bloc-intercalatǎ si opereazǎ în mare mǎsurǎ în acelasi mod. În particular, sistemele de discuri cu redundnate P + Q executǎ operatii scurte de scriere în maniera citeste-modificǎ-scrie cu deosebirea cǎ în loc de patru accesǎri de disc sunt aici necesare sase accesǎri pentru a actualiza atât informatiile P cât si cele Q.
Sistemele RS-RAID prezentate cu mai multe detalii în prima parte a acestei sectiuni se încadreazǎ în aceastǎ clasǎ de sisteme de nivelul 6.
Alte sisteme RAID
Literatura mai mentioneazǎ:
a) Sistemele de nivel 0+1 – oglindǎ si stripare – cu douǎ subsisteme 0 cu stripare si un subsistem 1 suprapus acestora. Se utilizeazǎ si pentru replicarea datelor pentru partajarea lor.
b) Sistemele de nivel 1+0 – stripare pe oglinzi – în care sunt create subsisteme RAID 1 si peste acestea un subsistem RAID 0 de stripare.
c) Sisteme de nivelul 7 – un sistem brevetat de Storage Computer
Corporation care adaugǎ sectiuni cache la sistemele de nivelul 3 si 4.
d) Sisteme RAID S – proprietar EMC Corporation – sisteme cu paritate si stripare utilizate în sistemele proprii de memorie Symmetrix.
Timpul mediu pânǎ la defectare în functie de capacitatea de memorare
Comparatii de costuri si de performante
Primele trei mǎsuri prin care se evalueazǎ un sistem de discuri sunt fiabilitatea, performanta si costul. Sistemele RAID de la 0 la 6 acoperǎ o gamǎ largǎ de compromisuri între aceste trei mǎsuri. Este important a lua în considerare toate aceste trei mǎsuri pentru a întelege deplin valoarea si costul fiecǎrei organizǎri ale sistemelor de discuri. Despre fiabilitate – în graficul alǎturat.
Linia cea mai de jos (romburi) reprezintǎ timpul mediu pânǎ la defectare pentru un singur disc. Într-un sistem fǎrǎ redundante (RAID 0) aceasta produce pierderea datelor. Linia urmǎtoare (triunghiuri) aratǎ timpul mediu pânǎ la pierderea de date, MTDL (Mean Time to Data Loss) pentru un sistem RAID 5 cu probabilitatea de a gǎsi un defect latent dupǎ reconstruire a informatiei. De observat cǎ un sistem RAID 5 cu capcitatea totalǎ mai mare de 5 TB ar putea pierde date de mai multe ori în decursul unui an. Pentru a ilustra impactul defectelor latente asupra calculului MTDL, sau timpul mediu pânǎ la eroarea aditionalǎ, MTAF (Mean Time
to Additional Failure), curba urmǎtoare (pǎtrate) aratǎ probabilitatea cǎderii din cauza a douǎ erori de disc, care ignorǎ defectele latente, pentru un sistem RAID 5. Ignorarea impactului defectelor latente aratǎ cǎ MTDL pentru un sistem RAID 5 rǎmâne destul de bun chiar la capacitǎti de peste
5 TB. Linia cea mai de sus (cercuri) aratǎ MTDL pentru un sistem RAID
6 cu luarea în considerare a probabilitǎtii de a gǎsi defecte latente. Linia aratǎ MTDL pentru sistemele RAID 6, chiar tinând seamǎ de impactul defectelor latente, care este cu ordine de mǎrime mai bun decât cel pentru un sistem RAID 5 comparabil.
Pentru întelegerea mai exactǎ a modului în care defectele latente din sistemele RAID 5 afecteazǎ MTDL sǎ examinǎm probabilitatea de a întâlni un defect latent în timpul operatiei de reconstruire. Dacǎ un controler de RAID 5 întâlneste un defect în timpul reconstruirii, datele utilizatorului sunt pierdute deoarece discul defect si sectorul defect reprezintǎ douǎ elemente lipsǎ, ceea ce depǎseste capacitatea sistemului
RAID 5 de a recupera date pierdute.
Probabilitatea erorilor de citire irecuperabile în timpul reconstructiei
Rata erorilor nerecuperabile ale discului: 1 la 1014 biti cititi
Figura alǎturatǎ aratǎ probabilitatea de a gǎsi un defect latent în timpul reconstructiei sistemului la capacitǎti ale discurilor variate, din ce în ce mai mari. Pentru sisteme foarte mari de discuri de mare capacitate, ar fi surprinzǎtor a nu gǎsi un defect latent în timpul reconstructiei. Graficul presupune o ratǎ a erorilor tipicǎ pentru discuri din clasa desktop. Probabilitatea este un ordin de mǎrime mai micǎ pentru discuri din clasa enterprise.
Probleme si exercitii de autoevaluare
Problema 1.
Un sistem de memorii tolerant la defecte poate fi recuperat dintr-o stare alteratǎ prin aritmetica din câmpul Galois GF(25) generat de polinomul primitiv x5 + x2 + 1. Care din operatiile urmǎtoare nu este corectǎ?
a) 2*k + 3*k = k; b) 30 + 20 = 10; c) 7*5 = 27
Exercitiul 1.
Revedeti tipurile de sisteme RAID si retineti avantajele si dezavantajele fiecǎrui tip.
Exercitiul 2.
Stabiliti o tabel de logaritmi si puteri în câmpul Galois GF(25).
Exercitiul 3.
Stabiliti un polinom primitiv pentru câmpul Galois GF(26).
138
BIBLIOGRAFIE
1. Cǎtuneanu, V.M. si A.Mihalache Bazele teoretice ale fiabilitatii
Ed.Academiei RSR, Bucuresti 1983
2. Chen, P.M. si altii RAID: High-Performance, Reliable Secondary
Storage ACM Computer Surveys, 1994
3. Dumitrescu, D. si H.Costin Retele neuronale. Teorie si aplicatii, Ed.Teora, Bucuresti, Sibiu, 1996
4. Mihalache, A. Când calculatoarele gresesc. Fiabilitatea sistemelor de programe (software), Ed.Didacticǎ si pedagogicǎ, Bucuresti 1995
5. Plank, J.S. A Tutorial on Reed-Solomon Coding for Fault-Tolerance in RAID-like Systems [anonimizat] (1999)
6. Popovici, Al.A. Proiectarea securitǎtii sistemelor complexe, Ed.Stiintificǎ si enciclopedicǎ, Bucuresti 1988
7. Stefǎnescu, C. Sisteme tolerante la defecte, Matrix Rom, Bucuresti
1999
8. Vancea, R., St.Holban si D.Ciubotariu Recunoasterea formelor.
Aplicatii, Ed.Academiei RSR, Bucuresti 1989
140
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Fiabilitate Si Diagnoza (ID: 115496)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
