Matematică și Informatică Aplicate în Inginerie [606008]

UNIVERSITATEA POLITEHNICA DIN BUCUREȘTI
FACULTATEA DE ȘTIINȚE APLICATE
Matematică și Informatică Aplicate în Inginerie

Proiect de Licență

Coordonator științific :

Lect.dr. Tiberiu VASILACHE

Absolvent: [anonimizat]

2017

2
UNIVERSITATEA POLITEHNICA DIN BUCUREȘTI
FACULTATEA DE ȘTIINȚE APLICATE
Matematică și Informatică Aplicate în Inginerie

Apro bat
Decan :
Prof. dr. Emil Petrescu

Sisteme optimale și metode rezolvare a
ecuației Riccati

Coordonator științific: Absolvent: [anonimizat].dr. Tiberiu VASILACHE Ramona -Maria DUMITRESCU

București
2017

3
CUPRINS

1. Introducere
2. Control optimal
2.1 Noțiuni de calcul variațional
2.2 Condiții necesare de optimalitate
3. Optimizarea cu criteriu pătratic a sistemelor liniare
3.1 Problema de optimizare liniar pătratică
3.2 Soluția problemei liniar pătratice cu timp final finit (EDMR)
3.3 Problema reglării optimale a mărimii de ie șire
3.4 Regulatorul liniar pătratic
4. Ecuaț iei mariceală Riccati cu metode de rezolvare
4.1 Ecuația matriceal ă algebrică Riccati (EMAR)
4.2 Metode de rezolvare a ecuației matriceale algebrice Riccati
4.2.1 Metoda Potter
4.2.2 Metoda Schur
4.2.3 Metoda Newton
4.2.4 Metode specifce program ului MATLAB
5.Aplicații
6.Concluzii
7.Anexe
8.Bibliografie

4
1. Introducere

Controlul optimal devine cunoscut după al doilea război mondial odată cu apariția războiului
rece, când matematicienii au fost implicați în noua confruntare dintre SUA și URSS. O
provocare matematică a celor vremuri cu care s -au confruntat a fost : Care este traiectoria
optimal ă a unui avion ce urmează a fi direcționat dintr-o poziție de croazier ă dată, într-o poziț ie
favorabil ă necesară răspunderii unui posibil atac?
Răspunsul la acestă problem ă a fost ușor de sesizat . Matematicienii au recunoscut imediat
asemănarea cu întrebarea lui John Bernoulli din 1969 : Care este curba celei mai rapide coborâri
între două puncte date într -un plan vertical? , care și-a imaginat în acest fel problema
brachistochronei (în grecește, brachistos=cel mai scurt, chrones=timp).
În ultimele decade domeniile teoriei controlului și optimizării au fost la interfața dintre
creativitatea matematică, inginerie si informatică. Scopul teoriei controlului este să ajute la
îınțelegerea principiilor fundamentale ale controlului și să le carac terizeze matematic într -un
mod ce poate fi folosit pentru obținerea exactă a unor controale ce ne ajută să îndeplinim un scop
precizat. De fapt, scopul optimizării performanțelor ne duce către controlul optimal ce ilustrează
afinitatea dintre teoria contro lului, calculul variațional și optimizare.
Optimizarea poate fi definită ca știința determinării «celei mai bune» soluții la anumite probleme
definite matematic, care sunt adesea modele ale realității fizice.
A face « cel mai bine posibil » este sensul or icărei atitudini naturale în viața de zi cu zi .
Pentru un inginer « a face cel mai bine posibil » ar trebui să f ie un obiectiv permanent atunci
când are de conceput o clădire, de dimensionat o instalație etc.
Metodele de optimizare au o largă aplicabilitat e în aproape orice activitate în care sunt prelucrate
informațiile numerice: știință, inginerie, matematică, economie etc. O selecție a domeniilor în
care apar probleme de optimizare ar cuprinde: proiectarea reactoarelor chimice, a aparatelor
aerospația le, a clădirilor, a podurilor, în diferite ramuri ale analizei numerice, principii în sisteme
de ecuații diferențiale și cu derivate parțiale etc.
Lucrare a de față își propune să prezinte controlul optimal aflat în strânsă legatură cu teoria
sistemelor și mod ul în care ecuația matriceală Riccati poate ajuta în găsirea unei comenzi
optimale ce minimizează o func țională asociată unei reprezentari în spațiul stărilor a unui system
fizic. Conținutul lucrării se axează în principal pe rezolvarea problemei liniar pătratice și
aparițiile acesteia în diverse domenii, mai multă atenție a fost acordat ă ecuaț iei matriceale
algebrice Riccati .
În acest sens al 2-lea capitol abordează aspectele teoretice cu privire la conceptul general de
control optimal. De asemenea, sunt ilustarte și noțiunile de calcul variațional care au o temelie
esențială asupra controlului optimal și condițiile necesare de optimalitate.
În capitolul al 3-lea este realizată o prezentare generală a o ptimizării cu criteriu pătratic a
sistemelor liniare, făcându -se referie la problema de optimizare pătratică , la soluția problemei
liniar pătratice cu timp final finit, p roblema reglării optimale a mărimii de ie șire si a r egulatorului
liniar pătratic.
Capitolul al 4-lea intitulat “Ecuației mariceală Riccati cu metode de rezolvare ” se centreaz ă pe
ecuația matriceală algebrică Riccati și prezintă principalele metode de rezolvare ale acesteia.
Metodele de rezolvare folosite pe parcursul acestei lucrări sunt: rezolvarea analitică, metoda
Potter, metoda Sc hur și m etoda Newton.

5
Capitol ul al 5 -lea conține prezentarea în întregime a aplicațiilor. Sunt prezentate exemple
ce pot fi rezolvate atât analitic, cât și folosind programul MATLAB.

6
2. Control Optimal

2.1 Noțiuni de calcul variațional

Se dă sistem ul Σ descris de ecuația de stare :
),(xtfx
,
mR x tx 0 0)( (2.1)
Aici,





)()(
)(1
txtx
tx
n este vectorul de stare și
f o funcție vectorială de clasă .
Căutăm construirea unui sistem Hamilton canonic , pentru găsir ea extremalelor
funcționalei
  2
1),,,,,,( ],,[][1 1 1t
tn n n dtx xx xtL x xIxI  
(2.2)
în mulțimea
},1, )(, )(|]),([ )),(( ),,({2 1 210
212
1 n ib txa txttC ttC x xx Mi i i i n     
,
unde
abi nii,, ,1 sunt numere reale date . Integrând prin pă rți termenii ținând seama de
proprietăț ile funcțiilor și aplic ând lema fundamentală , deducem sistemul de ecuaț ii diferenț iale
ordinare de ordinul al doilea
















0. ………. ………. ……….00
2 21 1
i i xL
dtd
xLxL
dtd
xLxL
dtd
xL
,
n i,1 . (2.3)
care este un sistem de n ecuații diferențiale de ordinul al doilea cu n funcții necunoscut
x xn 1,,
și care mai poate fi scris și sub forma

7





2
12
12
0 1L
xxxL
xxxL
xtL
xi n
i jj
jn
i jj
jn
i i 
   , ,. (2.4)
Ecuațiile sistemului (2.3) se numesc ecuaț ii Euler –Lagrange , iar orice soluții ale
acestui sistem s e numesc extremale ale funcționalei (2.2) .
Acest sistem poate fi rezolvat în raport cu
 x xn 1, dacă Hessianul este nenul, adică
0 det
,12






 njij ixxL

. (2.5)
Luând ca variabile canonice (hamiltoniene)
pL
xi
i
 și
xi ni, ,1 , iar
 x xn 1,, ca
variabile, putem scrie sistemul
),,,,,,(1 1 n n
ii x xx xtxLp  
(2.6)
Întrucât (2 .5) este îndeplinită, teorema funcțiilor implicite afirmă că soluția (locală) a
sistemu lui (2 .6) există și are forma
x ftx xp p j j n n (,,,,,,) 1 1
(2.7)
Cu alte cuvinte, Hamiltonianul funcționalei (2.2) este funcția
Htx xp p xL
xLn n j
j jn
(,,,,,,)1 1
1


, (2.8)
Adică
H xp Ljj
jn


1
(2.9)
unde
xj sunt date de (2.6).
Reconsiderând Lagrangia nul ca fiind

8

L xp Htx xp pjj
jn
n n 

11 1 (,,,,,,)  (2.10)
rescriem sistemul Euler –Lagrange corespunzător:





0 ) (0 ) (
i ii i
pL
pL
dtdxL
xL
dtd


 
d
dtpH
x
d
dtxH
pi
i
i
i()
()



0
0 0 .
Astfel, se obține sistemul Hamilton canonic




iiii
pHppHx

,
care înlocuiește sistemul Euler –Lagrange (2.3) și care este un sistem de 2 n ecuații diferențiale de
ordinul I cu 2 n funcții necunoscute
xp i nii,, ,1 .
Acesta mai poate fi scris și în forma







pxHJpx
dtd , unde





n nn n
O II OJ .
Exemplul 2.1.
Considerăm funcționala:
 
02
22
1 2 1 2 1 ]))(( ))((2)()(2[(],[ dttx tx txtx xxI

pentru care dorim să obținem sistemul Euler -Lagrange și sistemul Hamilton canonic.
Sistemul Euler -Lagrange devine:

9














00
2 21 1
xL
dtd
xLxL
dtd
xL







0 2 20 2 4 2
0 2 20 2 4 2
2 11 1 2
2 11 1 2
x xx x x
xdtdxxdtdx x
Introducem momentul generalizat
),(2 1pp p
1 2 1 2 1 1 2),,,,( x xxxxtp 

2 2 1 2 1 2 2),,,,( x xxxxtp 

și Lagran gianul care trebuie să fie regulat, adică
0 det
,12






 njij ixxL


De aici rezultă că:
042 002det
L este regulat
Atunci
2 21 1
2
221
11
2121
22
p xp x
xxLpxxLp







,
deci Hamiltonianul corespunzător este :
 )41
412 2(21
212
12
12
1 212
22
1 22 11 p p x xx p p L pxpx H
 2 21
41
412 12
12
12xx x p p

Obținem sistemul Hamilton canonic :

10





1
221 2
112
221
11
24 22121
xxHpx xxHpppHxppHx

În continuare căutăm soluția generală pentru
1x și pentru
2x . Pornim de la siste mul Euler –
Lagrange obținut deja


0 2 20 2 4 2
2 11 1 2
x xx x x

Împărțim prin 2 și rescriem sistemul :


00 2
2 11 1 2
xxxx x

Din a doua ecuație rezultă următoarele :
ivx x x x xx2 1 2 1 2 1 0  și astfel
prima ecuație devine :
0 22 2 2 ivxx x .
Pornind de la acestă ecuație încercăm să obținem un sistem fundamental de soluții.
0 22 2 2 ivxx x

4
2 r xiv

2
2r x

12r x

01 22 4 r r

Notăm
t r2 .

Avem solu iile:
2 ,10 1 010)1 (0)1( 012
2,12 22 22 2

ami r r rrt t t

11

Pentru
0 și
1 obținem sistemul fundamental de soluții
t tt tet t emi rttt tet t emir
tt
att
a
cos coscos cos2 ,sin sinsin sin2 ,
21




Scriem soluțiile generale ale funcționalei:
ttCttCt Ct Ctx cos sin cos sin )(4 3 2 1 2 
,
R CCCC 4 3 2 1 ,,,
t Ct CttCt Ct Ct Ctx sin cos cos sin sin cos )(4 4 3 3 2 1 2 
,

,
ttCttCt C Ct C C tx cos sin cos)2 ( sin)2 ()(4 3 3 2 4 1 1   
,

t tet emi rt tet emir
tt
att
a


coscos2 ,sinsin2 ,
21

t tCttCt C C t C Ct Ct Ct CttCt Ct Ct Ct C tx
cos sin cos)2 ( sin)2 (cos sin sin sin cos cos cos sin )(
4 3 3 2 4 14 4 4 3 3 3 2 1 2
  
R CCCC 4 3 2 1 ,,,
R CCCC 4 3 2 1 ,,,
. ,,,4 3 2 1 R CCCC 

12
2.2 Formularea problemei fundamentale în teoria controlului optimal

Considerăm dat un proces evolutiv, a cărui stare este descrisă printr -un număr de
parametr i de stare
ix , ansamblul lor constituind un punct figurativ
x (sau variabilă de stare), al
unei varietăți
X , spațiul stărilor (în particular domeniu din
nR ), ca și printr -un număr de
parametrii de comandă
au , ansamblul lor constituind un punct figurativ numit variabilă de
control sau de comandă și aparținând unei varietăți
U (domeniu din
mR ). O dată cu varietățile
X
și
U vom considera și varietățile lor tangente și cotangente.
Considerăm sistemul:
 (,,), () xftxu xt x  1 1
(2.11)
pentru
tItt[,]12 și funcția
nUXIf R :  continuă și cu derivate continue pe porțiuni
))(,),(),(,),(),(,( :1 2 1 tu tutx txtxtf tfl n i i   
,
n i ,,2,1 .
Ea se identifică cu evoluți a unui sistem dinamic, descrisă prin ecuația:
)(),(,)(tutxtfdttdx
,
10, t tt (2.12)
numită sistem de control .
Numind în general o funcție
UIu: funcție de control sau de comandă , care
introdusă în sistemul (2.1 2) îl transformă pe acesta într -un sistem dinamic obișnuit pentru care o
soluție a
XIx: este o funcție de stare. Vom spune că sistemul (2.12) guvernează un proces
de evoluție.
Sistemul (2.12) se nume ște sistem controlat , iar perechea de funcții
)( : txtx ,
)( : tutu
(definte pe
I ) care verifică sistemul (2.11), poartă respectiv numele de traiectorie
admisibilă și de control admisibil . Vom spune că sistemul (2.11) guvernează procesul evolutiv,
t
reprezintă timpul și
dtdxx este viteza de variație a parametrului de stare
x .
Dacă funcția
f nu depinde explicit de ti mp, atunci procesul evolutiv descris de sistemul
(2.11) se numește staționar sau autonom , în caz contrar, este nestaționar sau neautonom .
Notăm cu
T spațiul traiectorilor admisibile, U spațiul comenzilor admisibile și X spațiul
stărilor.
Alegem funcționala de cost dată de ecuația :

13

Ju LtxtutdtMtxttxt
tt
() (,(),()) (,(),,())   
12
1 12 2 (2.13)
unde primul termen dat de integral ă este criteriul de tip Lagrange, iar cel de -al doilea termen
este criteriul de tip Mayer. O astfel de funcțională de cost , conținând ambele criterii este numită
criteriu de tip Bolza (L este Lagrangianul , iar M este Mayerianul).
Vom presupune că,
R UXIL: este o funcție de clasă C1 pozitivă, ia r
R R R 2 1 : X X M
o funcție convexă de clasă C1, unde
X XX X 1 2 , .
În contextul următor , problema controlului optimal este determinarea unei comenzi
~()u
U care să realizeze minimul funcțional ei de cost J(u), astfel încât
Ju Ju () () ~ ,
)(u
U , unde ,
Ju Ltxtutdt Mtxttxt
tt
(~) (,~(),~()) (,~(),,~())   
12
1 12 2

și
)(~tx este soluția sistemului (2.11) ce corespunde comenzii optimale
)(~tu .
Având o traiectoria optimală
(~(),~()) xu și o variație mică a sa
((),()) xu T de forma:



)( )(~)()( )(~)(
tk tututh txtx
 (2.14)
cu   R și h(t), k(t) funcții vectoriale arbitrare fixate de dimensiuni respectiv n și m. Costul
corespunzător poate fi privit ca funcție de :

Astfel,
(~(),~()) xu este o traiectorie optimală,
Ju F (~) () 0 , deci  = 0 este un punct de
minim pentru F(). Prin urmare , conform teoremei lui Fermat rezultă că ,
 F()0 0 . (2.15)
Derivăm funcția
()F :

F Ju Ju k Ltxt htut ktdt
Mtxt httxt httt
() () (~) (,~() (),~() ())
(,~() (),,~() ()).   
    
  
12
1 1 1 2 2 2

14

)( )( )( )( )(2 2 1 12
1th
xMth
xMdttkuLthxLFT T t
tT T
















 , (2.16)
unde derivatele parțiale sunt calculate pentru
(~() (),~() ()) xt htut kt     .
Conform relației ( 2.15) rezultă că , traiectoria optimală verifică ecuația :
0)( )( )( )(2 2 1 12
1












th
xMth
xMdttkuLthxLT T t
tT T




(2.17)
Formăm Hamiltonianul problem ei de control optimal (2.11), (2.13 ) pri n
R RRRR n m nH:
:
),,()( ),,( )()( ),,( ),,,( uxtftp uxtLtxtp uxtL puxtHT T    
,
unde
] [1 nTp p p este vectorul multiplicatorilor Lagrange; se numește și vectorul adjunct al
lui x.
Atunci
Ltxu HtxupptftxuT(,,) (,,,)()(,,)   și ecuația (2.16) devine:








 






 FH
xhtH
uktdt ptf
xhtf
uktdt
M
xhtM
xhtT T
tt
T
tt
T T() () () () () ()
() ().0
12
12
1122







Dacă notăm
htdxktdu () ,() , avem


f
xhtf
uktdf dxht () ()() 
.
Integrând prin părți cea de-a doua integrală din (2.16) obținem
pthtdt ptht pthtdtT
tt
T
tt T
tt
()() ()()()()
12
12
12
  

deci, pentru
(~,~)xu avem

15

0)( )( )( )( )( )( )0(2 221 112
1














th tp
xMth tp
xMdttkuHthpxHFT T t
tT T




pentru orice h(t), k(t) (suficient de mici).
Având la bază rezultatele obținute mai sus , enunțăm teorema de optimalitate:
Teorema 2.2.1 Dacă
(~(),~()) xu este o traiector ie optimală a sistemului (2.11) cu
funcționala de cost (2.13), atunci există multiplicatorii Lagrange
p pn 1 , astfel încât
(~(),~()) xu
verifică următoarele condiții necesare :
i. sistemul canonic:
),~,~,(~puxtpHx
(2.18)
),~,~,( puxtxHp
(2.19)
ii. ecuația de control optimal:

H
utxup (,~,~,)0 ; (2.20)
iii. condițiile de transversalitate:
0)()( )()(2 2 2 1 1 1



 th tp
xMth tp
xMT T

 . (2.21)

16
3. Optimizarea cu criteriu pătratic a sistemelor liniare

3.1 Problema de optimizare liniar pătratică
Considerăm sistemul liniar (variabil în timp)  :
() ()()()() xtAtxtBtut  
(2.22)
cu condiția ințială fixată
xt x ()1 1 și funcționala de cost pătratică
  )()(21)()()( )()()(21)(2 22
1tMxtx dttutRtutxtQtx uJTt
tT T  
, (2.23)
unde
o
ACInn(, ) R ,
BCInm(, ) R matrice continue pe
Itt[,] 12 .
o
nnMR este o matrice reală, nenegativ definită (
0 , = M M MT );
o
QCInn(, ) R ,
RCImm(, ) R și pentru orice
],[21ttt ,
0 )(tQ (matrice reală,
simetrică, semipozitiv definită



n TT
Rx QxxtQ tQ
,0)( )( , iar
0 )(tR (matrice real ă,
simetrică, pozitiv definită



0 ,0)( )(
u RxutR tR
TT .
Dorim determinarea unei comenzii optimale
)(u în circuit închis pe intervalul
],[21tt care să
minimizeze funcționala de cost (2.19 ).

Ținem cont și de urmatoarele observații , referitoare la matricele funcționalei de cost și
anume:
– Q,R și M sunt dependente de
t , atunci când se doreș te o ponderare în timp a
influen țelor componentelor respective în diverse perioade ale intervalului de
optimizare
],[21tt ;
– R nu poate fi nulă, căci indicele de calitate nu ar mai depinde de comandă
– una din matricele M sau Q poate fi nulă, dar nu ambele, căci problema de optimiz are ar
admite în acest caz soluț ia trivială
0)(tu .
Aplicăm teorema de optimalitate prin etapele următoare:
Etapa 1. Scriem Hamiltonianul:
Htxup xQx uRu pAx BuT T T(,,,) [ ] ( )  1
2
(2.24)
Etapa 2. Scriem sistemul canonic (2.18) , (2.19) :

17

Bu AxpHx  (2.25)
pA Qx pA tQx xtQxHpTTQQ
T T T  
) ))( (21)(21(
(2.26)

Etapa 3. Determinăm ecuația comenzii optimal e
)(~tu din (2.20 ):
0 )( 0  pButRuHT

(2.27)
înmulțind la stânga cu
R1 (există, deoarece R >0), rezultă comanda optimală:
pBR tuT1)(~ 
(2.28)
Prin intermediul matricei Hessiane v erificăm dacă
)(~tu realizează minimizarea :


2
20H
uRt() ,
cu alte cuvinte,
)(~tu realizează mini mul problemei și, conform (2.28 ) este unică.
Etapa 4. Înlocuim (2.28)
)(~tu în ecuația ( 2.25),(2.26) și obținem tripletul
))(~),(~),(~( tptutx , care
verifică sistemul de ecuații diferențiale:
ptBtRtBxtAxT)()()( )(1
(2.29)
ptAxtQ pT)( )(
(2.30)
sau

x
pHx
p



 , unde matricea hamiltoniană
H are forma

HA BR tB
Qt AT
T
 



1()
() . (2.31)

Etapa 5. Scriem condițiile de transversalitate, cu stare inițiala fixată și stare finală liberă :

18

xt x ()1 1
)( )(2
22 tMxxMtp 
.
Astfel, sistemul (9.29), (9.30 ) poate fi rezolvat pentru a obține
))(~),(~( tptx .

19
3.2 Soluția problemei liniar pătratice cu timp final finit (EDMR)
Considerăm legea de comandă optimală
)()( )( txtFtu , cu
)(tF o m× n matrice
continuă pe
].,[21tt Astfel, căutăm o matrice P(t) unde vectorul adjunct p să fie de forma
ptPtxt () ()()
, cu condiția finală
M tP)(2 .
Sistemul de ecuații diferențiale (2.29) și (2.30) devin :
 xPB BRAxT1
.
PxA Qx xPxPpT

Înlocuim
x și obținem:
 PAPPA QPBR BPxT T 10
, pentru orice
xX .
Rezultă că P trebuie să fie soluție a ecuației diferențiale matriceale Riccati (EDMR)
PAPPA QPBR BPT T 10
(2.32)
cu condiția finală
M tP)(2
, deoarece
)( )()( )(2 2 2 2 tMx txtP tp   . (2.33)
Considerând implementată legea de comandă optimală (Fig. 1), se constată imediat că
aceasta furnizează, corespunzător inițializării arbitrare
1x , o soluție în circuit deschis a problemei
liniar pătratice . Altfel spus, în timp ce determi narea unei soluții în circuit deschis a problemei
liniar pătratice trebuie făcută ori de câ te ori se schimbă inițializarea
1x , cunoașterea unei soluții
în circuit închis, explicitată prin matricea F(t), permite autogenerarea, prin schem a din Fig. 1, a
unei soluții în circuit deschi s, oricare ar fi inițializarea
1x .

(Fig.1)
)()( )()( )( tutBtxtAtx  
1 1)( t tx

)(tx
)(tF
)(tu

20
În consecință, am demonstrat că
1Tu R B Px
este comanda optimală , iar în acest caz matricea
P(t) este soluția ecuației Riccati ( 2.32) cu condiția finală ( 2.33).
Presupunem în continuare că P(t) este soluție a ecuației ( 2.32) cu condiția finală ( 2.33). și
arătăm că
1Tu R B Px
realizează minimul funcționalei . Astfel că înce rcăm demonstrația în
sens invers.
Remarcăm că (2.32) este o ecuație simetrică , deci soluția sa îndeplinește
PPT .
Calculăm :
 d
dtxtPtxt xPx xPxxPxT T T T()()()  
      uB xAPx x PA APQPBR BPxxPAx BuTT TT T T T T 1( )

 uBPx xPBu xQx xPBR BPxTT T T T T1
.
Integrăm pe
[,] tt12 și înmulțim cu ½ ecuațiile după care le egalăm și obținem :
 1
21
21
21
2
12 2 2 1 1 12
12d
dtxtPtxtdt
txtPtxt xtPtxt xtPtxtTt
T
tt T T()()() ()()()| ()()() ()()()    

   )()()(21)()(21)33.2(
1 1 1 2 2 txtPtx tMxtxT T
   1
21
12
xPBR BPQxuBPx xPBu dtT T TT T
tt
( )
,
Astfel, funcționala de cost se rescrie:
   Ju uRBPx RuRBPxdt xtPtxtTTT
tt
T() ()()()    1
21
21 1
1 1 1
12
.
Deoarece, R(t) >0 intergrandul este o formă pătratică strict pozitiv definită , rezultă că
J(u) este minim dacă
u RBPxT1 . Altfel, comanda optimală are forma
PxBR uT1 ~  , iar
costul minim devine :
Ju Ju xtPtxtT(~)min () ()()()  1
21 1 1
. (2.34)

21
Cu cele enunțate mai sus, am demonstrat sinteza Kalman –Letov enunțată prin următorea
teoremă:
Teorema 3.2.1 Problema liniar pătratică (2.22), (2.2 3) are o unică soluție optimală de
tip feedback
~()ut
RtBtPtxtT() ()()()1 (2.35) , unde matricea reală și simetrică P(t) este
soluția ecuației diferențiale Riccati
PAPPA QPBR BPT T 10 , cu condiția finală
MtP)(
.
Pentru cazul în care timpul final
2t tinde spre infinit ecua ția matricial ă Riccati devine:
01 PB PBRQPA PAT T
.
În continuare căutam soluția EDMR considerând astfel
(,)tt1 și
(,)tt1 matricele
fundamentale ale sistemelor (2.29) și (2.30)

xAx BR Bp
p Qx ApT
T
1
,
pt Mxt () () 2 2 .
Atunci soluția ecuației diferențiale maticeale Riccati (2.32) este

Pt tt tt () (,) (,) 21
2 . (2.3 6)
Demonstrație:
 și  verifică egalitățile de mai jos:
(,) ()(,) () ()()(,),(,)
(,) ()(,) ()(,) ,(,)   
   tt Attt BtR tBt tt tt I
tt Qttt At tt tt MT
T2 21
2 22
2 2 2 22  
  

Prin derivarea egalității
  (,) ()(,) tt Pttt 2 2  obținem
()(,)(,) ()(,) Pttt tt Pttt   2 2 2   
(înlocuim
  (,) ()(,) tt Pttt 2 2  )
   QtAtPtPtAtPtBtR tBtPt ttT T() ()() ()() ()() ()()()(,)1
2
,

22
iar înmulțind la dreapta cu
 1
2 2 (,) (,) tt tt obținem (2.32). Deci unica soluție a ecuației
Riccati este (2.36 ).
Partiționăm matricea fundamentală
Utt(,)2 corespunzătoare matricei hamiltoniene
H
(2.31) sub forma
UttU tt U tt
U tt U tt(,)(,) (,)
(,) (,)211 2 12 2
21 2 22 2


;
prin urmare, soluția proble mei Cauchy
(,)
(,)()(,)
(,)

tt
ttHttt
tt2
22
2




,

(,)
(,)tt
ttI
M22
22




este

(,)
(,)(,)tt
ttUttI
M2
22



 , deci

(,) (,) (,)
(,) (,) (,)tt U tt U ttM
tt U tt U ttM2 11 2 12 2
2 21 2 22 2 
  .
Așadar soluția ( 2.36) a ecuației Riccati poate fi scrisă și ca

  ~() (,) (,) (,) (,) Pt U tt U ttMU tt U ttM   
21 2 22 2 11 2 12 21 (2.37)
iar sinteza Kalman –Letov (2.35 ) capătă forma

~() ()() ut Ktxt , unde
KtR tBtPtT() ()()~() 1 .

23
3.3 Problema reglării optimale a mărimii de ie șire
Considerăm problema determinării unei sinteze pentru sistemul complet observabil :
utBxtAx )( )(
,
1 1)( x tx (2.33)

)()(txtCy (2.34)
care să minimizeze funcționala pătrati că de cost referitor la ieșirea
y .
Funcționala pătratică de cost asociată sistemului este:
 Ju ytQtytutRtutdt ytMytT
yT
tt
T
y () ()()() ()()() () ()    1
21
2
12
2 2
(2.35)
unde
Qty ()0 , R(t) > 0,
My0 .
Teorema 3.3.1 Comanda optimală (de tip feedback) a sistemului este
~() ()()()() ut R tBtPtxtT1
(2.36)
unde P(t) este soluția ecuației diferentiale Riccati
PAPPA CQCPBR BPT T
yT  10
(2.37)
cu condiția finală
Pt CMCT
y ()2
. (2.38)
Demonstrație:
Perechea ( C, A) este observabilă
 ieșirea y determină în mod unic starea x .
Înlocuind în (2.35) ieșirea
yCtx() vom obține funcționala (2.23) cu matricele
.CMC MCQCQ
yTyT


Aici, matricele sunt simetrice pozitiv definite pentru că
0yM și
0yQ .
Astfel că rezultatul este o cosecință a teoremei ( 3.2.1 ).
Observații:
– Desi problema este formulată în legătură cu mărimea de iesire y ,regulatorul optimal este
realizat cu reacție după stare, presupusă accesibilă si măsurabilă .
– Dacă stările nu sunt accesibile si măsurabile, pentru rezolvarea problemei trebuie introdus
un estimator .

24
3.4 Regulatorul liniar pătratic
Considerăm sistemul complet observabil :
() ()() ()(),() xtAtxtBtut xt x   1 1
(2.39)

)()( )( txtCty (2.40)
si z(t) ieșirea dorită .
Dorim să construim o comandă optimală cu feedback astfel încât aceasta să minimizeze
funcționala pătratică de cost J(u). În acest scop consideră m eroarea
etztyt ()()()  și
introducem funcționala dată de
 Ju etQtetutRtutdt etMeteT
eT
tt
T
e () ()()() ()()() () ()    1
21
2
12
2 2
.
Eroarea se poate expri ma si în func ție de stare
)()( )( )( txtCtzte  și atunci funcționala se
rescrie corespunzător .
Considerăm Hamiltonianul acestei probleme:
Htxup zCx QzCx uRu pAx BuT
eT T(,,,) [( ) ( ) ] ( )  1
2
.
Condiția de optimalitate (2.20) implică
~u RBpT1 , deci sistemul canonic (2.18), (2.19)
devine
xH
pAx BR BpT 
1

 ( ) pH
xCQzCx Ap CQCx ApCQzT
eT T
eT T
e   

.
Deoarece ultima ecuație este neomogenă, conținând un termen în z căutăm o soluție de forma
ptPtxtrt () ()()()  
(2.41)
care să verifice co ndiția de transversalitate (2.21 ) cu stare inițială fixată
     ptxetMetxztCtxt MztCtxtT
e
ttT
ett() () () () ()() () ()()21
21
2
22

   



    Ct MCtxt Ct Mzt Ptxt rtT
eT
e () ()() () () ()()() 2 2 2 2 2 2 2 2
,
unde
xt()2 și
zt()2 sunt vectori arbitrari. De aici rezultă
Pt Ct MCtT
e () () ()2 2 2 
,
rt Ct MztT
e () () ()2 2 2  . (2.42)

25
În consecință, din (2.41) obținem
 ( ) pPxPxrPxPAx PBR BPx rrT 1

  CQCx APx rCQzT
eT T
e ( ) .
O soluție de forma (2.41) este dată de soluțiile ecuației diferențiale Riccati și ecuației diferențiale
liniare
PAPPA CQCPBR BPT T
eT 10
(2.43)
  r PBR B ArCQzT T T
e  1
(2.44)
cu condițiile finale (2.42).
Astfel, comanda optimală va fi
~()ut
  RtBtPtxtRtBtrtT T() ()()() () ()()1 1
, (2.45)
unde prima component ă este ob ținută prin reac ția de stare și este independentă de z(t), iar a doua
componentă reprezintă o intrare r(t) impusă de valoarea dorită z(t).
O reprezentare a sistemului de mai sus este dat î n urmatoarea figură :

)(tz
QCT

)(t MT
e
)(0tr
)(tr





)(1tx
)(tMe
)(tx
)(ty
TB BR1
C

26
4. Ecuației mariceală Riccati cu metode de
rezolvare

4.1 Ecuația marticeală algebrică Riccati (EMAR)

Considerăm ecuația marticeală algebrică Riccati (EMAR)
0 XRX XAXAQT
(4.1)
unde maticel e
nnCXRQA,,, și
XQ, sunt matrice simerice (
TQQ ,
TRR ).
În investigarea existenței și unicității soluțiilor pentru ecuația Riccati , studiul este strâns legat de
subspațiile invariante ale matricei Hamiltoniene
nn22 .
Definim matrice a Hamiltoniană


TA QR AH
(4.2)
și enunțăm următoarea Lemă în scopul de a verifica dacă valorile proprii ale lui H sunt distribuite
sime tric în raport cu axa imaginară
iR .

Lema 4.2.1 Rădăcinile polinomului
) det()(2HI p  sunt distribuite simetric în raport cu axa
imaginară
iR .
Demonstrație: Verificăm
TH JHJ1 , unde J este de forma:

O II OJ
nn . Atunci:
TT
T
nnH J
R AAQ
A QR A
O II OJH 





1
. Astfel, Lema 4.2.1 este o consecință a
identității verificate.
Dacă
iR H)( , atunci se admite o forma Jordan a ma tricei H :
1
21
00
 UJJUH
, (4.3)
unde,
)(1J și
)(2J .
Fiind



21
XX
OIUn și
nnC JJ2 1, ,
1J , atunci avem



21
21
XX
XXH
(4.4)
și
)( .

27
Lema 4.2. 2 Dacă
iR H)( și (4.4) este bine definită pentru o matrice
nnC (nu
neapărat în formă Jordan), atunci:
1 2 2 1 XX XXT T
. (4.5)
Demonstrație: Având în vedere matricea
1 2 2 1 XX XXZT T calculăm
Z :
T TX X Z2 1


21
XXJ

T TX X2 1


21
XXJH

T TX X2 1


21
XXJHT

T T TX X2 1


21
XXJ

ZT
Prin urmare, matricea Z este o soluție a ecuației
OZ ZT
.C
Cu toate acestea, deoarece
)( și
)(T rezultă din (4.5) că
OZ este singura
soluție a ecuației scrise mai sus.
Teoremă 4.2.1 Dacă
iR H)( și matricea
1X din (4.4) este inversabilă, atunci:
a) Matricea
1
1 2 XX X este o soluție a ecuației maticeale algebrice Riccati (4.1).
b)
TXX .
c)
 C RXA ) ( .
Demonstrație:
1X este inversabilă și
1
1 2 XX X , atunci:
1
1 1

XXXI
XIHn n
.
Deci,
1
1 1 XX RXA

) (1
1 1 XXX XAQT
.
Prin urmare ,

28

) ( RXAX XAQT.
Astfel, se verifică a). Următoarea a firmați e b) este evidentă prin lema 4.2.2, pe când c) rezultă
din formula
1
1 1 XX RXA și a faptului că
 C)( .
Cu toate acestea teorema 4.2. 1 stabilește condițiile ce garantează existența unei soluții X a
ecuației matriceale Riccati (4.1) astfel încât
 ) ( RXA . O teoremă reciprocă a acesteia
este:
Teoremă 4.2.2 Dacă
TXX este o soluție a ecuației EMA R astfel încât
 ) ( RXA ,
atunci matricea Hamilton nu are valori proprii pe axa imaginară (
iR H)( ) și maricea
1X
din (4.4) este inversabilă.
Demonstrație: Dacă
X este o soluție a EMAR cu propietățile aferente atunci:




Tn
A QR A
XIH
RXAXI
XAQRXA
XIn
Tn




.
În plus, după următoarea descompunere Jordan a matricei H obținem:
1
1 PPJ RXA
.
Observăm cu ușurință că
1PJXIPXIHn n


,
cu ajutorul căruia se identifică spațiul n-dimensional generat de coloanele matricei:



XPPPXIn
.
Acesta fiind spațiul generat de vectorii proprii ai matricei H corespunzători în
 .
Deci,(
iR H)( ) și prin urmare,
P X1 este o matrice inversabil ă.
Teoremă 4.2.3 Ecuația Riccati are cel mult o soluție
nnCX astfel încât
TXX și
 ) ( RXA
.
Demonstrație: Considerăm X și Y soluții Hermitice pereche ale ecuației Riccati, astfel încât
 ) ( RXA
și
 ) ( RYA . Atunci avem:
00

YRY YAYAQXRX XAXAQ
TT
0 ) () (  YRY XRXAYX YXAT
.
Cu toate astea, deoarece
TYY ecuația rezultată mai sus poate fi rescrisă astfel:

29

0) )( () () (   RXAYX YX RYAT.
unde,
YX este soluția unei ecuații de forma
0ZC BZ
.
Aici,
)(B și
)(C . Prin urmare, această ecuație are cel mult o soluție. În acest fel
nnOZ
este soluție. Asta reprezintă ca acesta este unica soluție. Tot de aici rezultă că
YX .
Deci, ecuația Riccati nu are decât o soluție.
În continuare, următoarea teoremă oferă condițiile în care constrângerile impuse matricei H din
teorema 4.2.1 sunt îndeplinite atunci când:
HBB B și
CCQH .
Teoremă 4.2.4 Considerăm matricele
nnCA ,
nnCB ,
nnCC și presupunem că
nCI Arangn

, pentru
)(
iR (4.6)
și
 n BI A rangn 
, pentru
)(
 . (4.7)
Atunci există exact o s ingură soluție h ermitică X pentru EMAR având forma:
0  CCX XBB XAXAT T T
(4.8)
astfel încât
 ) ( XBBAT . În plus, acesată soluție X este pozitiv semidefinită în
nC , iar
dacă A, B și C sunt matrice reale
nnRX .
Demonstrație: Fie




T TT
A CCBB AH

și presupunem condițiile din teoremă îndeplinite:





T TT
A CCBB A


yx

yx
,
pentru o anumită alegere
nCx și
C . Atunci
yBBxI AT
n ) ( și
CxC yI AT
nT ) (
.
Prin urmare,
2
2, ,) ( yB yyBB yxI AT T
n   

și

30

2
2, ) (, ,) ( Cx CxCx yI Ax yxI AT
nT
n     
.
Astfel,
yxI A yxI A yxn n ,) ( ,) ( ,) (     

2
22
2Cx yBT

de unde reiese că:
0 0 yBT
și
0Cx .
Asta implică:
0
xCI An
și
0  BI AynT ,
când
iR . Însă, ținând seama de condițiile impuse de teoremă acest lucru este valabil doar
dacă
0x și
0y , deci
iR H)( .
În continuare arătăm dacă (4.6) și (4.7) îndeplinesc condițiile din teorema și verificăm dacă





T TT
A CCBB A


21
XX


21
XX
și
nXXrang 

21 ,
unde
nnC XX,,2 1 și
)( . Atunci
1X este inversabilă.
Presupunem că,
1XKeru . Atunci
uXuXBBT 1 2

și, deoarece
2 1 1 2 XX XXT T conform lemei 4.2.2 avem:
02 1 1 2 2 22
2     uXXuuXXuuXBBXu uXBT T T T T T T
.
Obținem,
02uXBT și
02 1   UXBB UXT
,
care înseamnă faptul că nucleul lui
1X este invariant față de
 și
0)(1X Ker sau
v v
pentru un punct
 și un vector nenul
1XKerv .
În ultimul caz avem
01 1 2   vX vXvXBBT

31
și
vX vXvXAT
2 2 2 

echivalent cu
T
nT TBI AXv 02   , pentru
)(
 .
Deci ,
02vX implică:


21
XX
1 0 0 0
1X Ker v vX
este inversabilă.

Prin urmare, luând în vedere teoremele enunțate anterior, există o soluție hermitică a ecuației
Riccati, astfel încât
 ) ( XBBAT . Dacă maticele A,B și C sunt reale, atunci
X este o
soluție hermitică a ecuației Riccati, astfel încât
 ) ( XBBAT . Așadar,
nnRX . Ceea ce
rămâne de verificat este dacă X este o soluție pozitiv semidefinită în raport cu
nC , iar pentru
acest lucru este ma i convenabil să rescriem ecuația Riccati
0  CCX XBB XAXAT T T

astfel:
X XBBCC XBBAXXXBBAT T T T T  ) ( ) (

care este de forma
Q XAXAT1 1
,
unde
)(1A și
0Q .
Teoremă 4.2.5 Fie
nnCA ,
knCB ,
nnCQ ,
kkCR și presupunem că
0Q ,
0R .
nQI Arangn

, pentru
)(
iR (4.10)
și
 n BI A rangn  , pentru
)(
iR . Atunci există exact o soluție hermitică pentru
ecuația Riccati
01  T TB XBR XAXAQ
, (4.11)
astfel încât
  ) (1XB BRAT . Prin urmare, această soluție X este p ozitiv semidefinită
peste
nC , și dacă A,B și C sunt matice reale, atunci
nnRX .
Demonstrație: Dacă
0Q , atunci există o matice
nnCC astfel încât
QCCT și
r ramgQ rangC 
. Astfel, la stabilirea
21
1
BR B putem observa că:

32






TT
A QB BR A1





T TT
A CCBB A1.
În plus, ajutându -ne de condiția


CI An
0u

0
uQI An

ne rezultă faptul că :
nCI Arangn

, pentru
)(
iR ,
Din condiția
   BI A rangn




21
BRI A rangn
,
ajungem la concluzia că :
 n BI A rangn 1
, pentru
)(
 .

33
4.2 Metode de rezolvare a ecuației matriceale algebrice
Riccati

Fie ecuația algebrică matric eală Riccati cu forma generală:
01 QPB PBRPA PAT T

Ecuația matric eală Riccati degenerată este neliniară, motiv pentru care în majoritatea cazurilor nu se
obțin soluții analitice. Deci, prezentăm în continuare câteva metode de rezolvare numerică:

4.2.1 Metoda Potter
La această metodă c onstruim matricea hamiltoniană de forma:
H=





TT
A QB BR A1 .
Dacă p resupunem că matricea H are vectorii proprii liniari independenți și dacă matricea
P~ este
o soluție a ecuației algebrice Riccati , atunci :
1
1121VVP
,
unde matricea vectorilor proprii V s -a partiționat în forma:


22 2112 11
V VV VV
.
Prin urmare, vectorul format din
11V și
21V reprezent ă vectorii proprii corespunzători valorilor
proprii stabile.
4.2.2 Metoda Schur
Algoritmul sumar al metodei este:
Se calcul ează descompunerea Schur a matricii H dată de :

34

TU





TT
A QB BR A1
U


2212 11
0SS S ,
unde
nn
ijR S , iar
nnR U22 este o matrice de transformare ortogonală astfel determinată,
încât valorile proprii ale matricei
11S să fie stabile, respectiv valorile proprii ale matricei
22S
instabile.
Partiționând maticea
U obținem:


22 2112 11
U UU UU
,
nn
ijR U .
Prin urmare, soluția ecuației algebrice Riccati este:
1
11 21~  UUP
,
ținând cont că matricea
P~ este simetrică :
21 11~U UP
T TUP U21 11~
.
4.2.3 Metoda Newton
Este o metodă iterativă bazată pe rezolvarea iterativă a unor ecuații Ljapunov. Algoritmul
metodei este:
1. Se alege o valoare inițială
0~P astfel încât , matricea
0 1~PB BRAT să fie stabilă .
(k=0)
2. Dacă matricea
)~(~ 1 0kP P verifică ecuația algebrică Riccati cu o precizie
impusă, atunci ea este soluția stabilizatoare si se termină algoritmul, în caz contrar se
continuă iterația :
    Q PB BR PA P PAk T k k k T 1 1 1 1 1 ~ ~ ~ ~ .

35
3. Se rezolvă ecuația Lyapunov de unde se obține valoar ea
)~(~ 1 1kPP
  0~ ~ ~ ~ ~ ~ 1 1 1 1 1        k T k k k kTkPB BRPQ P BRA P P P BRA
și iterația
se continuă de la pasul 2.
4.2.4 Metode specifce programului MATLAB
În programul MATLAB găsim diferite comenzi pentru a afla soluția ecuației algebrice Riccati.
Astfel , funcțiile MATLAB care pot fi folosite la implementarea metodelor prezentate sunt:
 lqr , schur, ordschur, eig, newton, ode45, are etc.

36

Similar Posts