Identificarea Sistemelor Continue Neliniare în Timp

Cuprins

Introducere…………………………………………….…………………..…………2

Problematica identificării sistemelor……………………………….………….……8

2.1 Generalități……………………………………………………………….………8

2.2 Cerințe pentru identificarea modelelor continue în timp…………..….……15

2.3. Dezvoltări recente în identificarea sistemelor continue neliniare în timp..29

2.3.2 Metode de modulare a funcțiilor………………………………….……30

2.3.3 Studii aplicate ale metodei Hartley…………………………………….33

Introducere în procesarea semnalelor adaptive…………………..……………39

Procesarea semnalelor cu ajutorul filtrelor Wiener……………….…….…39

Filtre adaptive……….………………………………………………….….….45

Metode de analiză a funcției de bază……………………………………………57

Bibliografie………………………………………………………………………….67

Anexe

1. Introducere

Identificarea sistemelor neliniare reprezintă un domeniu în plină dezvoltare. Printre diferitele abordări asupra problematicii au fost metodele neparametrice, care sunt în esență tehnici de studiu în domeniul frecvențelor. Aceste metode includ și tehnicile de identificare cu ajutorul seriilor Volterra, care caracterizează răspunsul intrare – ieșire prin medierea unei sume de convoluții multifrecvențiale. Totuși, pentru simulările în domeniul timp, este convenabilă construcția unei realizări neliniare în spațiul stărilor a acestor hărți, ceea ce creează dificultăți în practică.[11] Pe de altă parte, au fost elaborate și metode parametrice pe baza modelelor, structurate sau nestructurate din domeniul timpului.Modelele nestructurale, sau modelele black-box[7,12] se bazează în majoritatea cazurilor pe rețele neuronale în explorarea aproximărilor proprietăților funcțiilor. Modelele structurate, sau grey-box [3-5,10] au la bază interconexiunea unor subsisteme liniare și neliniare.

Este esențial să se cunoască și să se înțeleagă un sistem înainte de a fi manipulat și controlat. Modelarea și identificarea se întâmplă să fie o pereche conjugată de activități, în procesul de dezvoltare a informațiilor despre sistem. Sunt lucruri necesare practicii controlului automat. Modelarea în sine constituie o arie vastă și bogată în găzduirea unor metode bine stabilite, și care au la bază o varietate de principii. Printre multele variante, modelarea pe bazele principiilor fizice poate cu greu să fie supra-parametrizată, în particular pentru sistemele fizice. Aplicarea principiilor fizice în modelarea unui sistem fizic oferă modelul matematic cu parametrii cheie, în formă generală. Modelul rezultat cu parametrii generali reprezintă de fapt o clasă de modele din care căutarea unui model particular se face prin identificarea și estimarea parametrilor sistemului. Multe studii în vastul domeniu al identificării sistemelor pot fi găsite în literatura de specialitate.

Problema identificării sistemelor, așa cum este ea definită în formă generală de Zadeh (1962), este prezentată în figura 1. Este caracterizată de trei chestiuni: O clasă de modele, o clasă de semnale de intrare și un criteriu. O încercare de rezolvare a problemei de identificare a sistemului va avea succes și un rezultat folositor, dacă problema de identificare este bine formulată în sensul entităților de mai sus.

În mod uzual un algoritm recursiv sporește utilitatea metodei. Identificarea sistemelor nu este, în mod obișnuit, un pur exercițiu doar de dragul exercițiului, el servește unui scop mai mare în funcție de ceea ce se dorește să se obțină și să se prelucreze odată cu rezultatele identificării. Astrom și Eykhoff (1971) și multe din studiile ce au urmat tratează rolul celor trei entități din problema de identificare a sistemelor. De exemplu, o clasificare a metodelor principale este bazată pe criteriul

Clasa modelelor neliniare de tip bloc–orientat include modele complexe care sunt compuse din sisteme liniare dinamice și elemente neliniare statice. Modelele Wiener și Hammerstein sunt cele mai cunoscute și cele mai implementate membrii ai acestei clase. Un model se numește Wiener dacă blocul dinamic liniar precede blocul neliniar. În cazul sistemelor Hammerstein conexiunea este inversată. Modelele compuse din elemente statice neliniare pot fi realizate în diferite forme ca de exemplu polinoame, spline-uri, funcții de bază, wavelet, rețele neuronale și modele fuzzy. Modelele cu răspuns la impulsuri, sau transfer de pulsuri, și modelele în spațiul stărilor sunt reprezentări comune ale sistemelor dinamice liniare. În funcție de formele de realizare ale acestor elemente, pot fi obținute diferite structuri de sisteme Wiener și Hammerstein. Pentru a le evalua și compara, vor fi luate în considerare, uzual următoarele proprietăți: precizia estimării, comportamentul la extrapolare, comportamentul interpolării, netezimea, sensibilitatea la zgomote, metodele disponibile de optimizare a parametrilor, precum și metodele disponibile pentru optimizarea structurii.

Modelele polinomiale sunt larg utilizate pentru exprimarea modelelor neliniare. Un mare avantaj al modelelor polinomiale îl reprezintă optimizarea efectivă a parametrilor, optimizare care poate fi realizată off-line prin metoda celor mai mici pătrate sau on-line cu ajutorul variantei recursive a celor mai mici pătrate. Mai mult, selecția structurii poate fi, de asemenea, efectuată prin algoritmul ortogonal al celor mai mici pătrate, în care mulțimea regresorilor este transformată într-o mulțime de vectori de bază ortogonali. Cu acest algoritm, este posibil calculul contribuției individuale a fiecărui vector de bază la variația ieșirii.

Modelele polinomiale prezintă totuși și câteva dezavantaje fundamentale. În primul rând, deși în principiu poate fi aproximată orice funcție continuă printr-un polinom, unele funcții neliniare necesită polinoame de ordin foarte mare.

În modelele MIMO, numărul de parametrii crește considerabil pe măsură ce crește numărul de intrări. Această creștere produce o creștere a incertitudinilor și poate induce probleme la implementarea numerică a optimizării. Dezavantajele introduse de ordinul mare al polinomului sunt prezente în proprietățile de interpolare și extrapolare prin introducerea unor oscilații. Prin urmare, în practică, aplicarea modelelor polinomiale este recomandată numai în anumite clase specifice în care structura sistemului poate fi presupusă a fi aproximată prin tipul polinomial.

O alternativă la modelele polinomiale sunt modelele de tip rețele neuronale de arhitectură perceptron multistrat. Perceptronii multilayer sunt rețele neuronale de tip reacție inversă conținând unul sau mai multe straturi ascunse de elemente neliniare, dar cea mai cunoscută metodă în practică este alegerea unui singur strat.

În mod evident, astfel de modele nu sunt lipsite de dezavantaje. Cele mai importante dintre acestea sunt utilizarea metodelor de optimizare locală pentru actualizarea ponderilor, și riscul de a găsi un minim local superficial. Aceasta duce adesea la necesitatea unui training repetat cu diferite valori inițiale ale ponderilor. Mai mult, tehnicile de încercare și eroare trebuie utilizate pentru anumiți parametrii ca de exemplu în cazul ponderilor inițiale, a vitezei de învățare, etc. De asemenea, metodele disponibile de optimizarea a modelului structurii sunt mai degrabă computaționale.

Acum, odată cu dezvoltarea metodelor de identificarea a sistemelor Wiener și Hammerstein este posibilă sistematizarea diferitelor tehnici și prezentarea lor într-un cadru de lucru unificat. Vom încerca o astfel de prezentare în această lucrare prin revizuirea abordărilor existente în literatura de specialitate împreună cu studii personale, teoretice dar și practice, ce nu au fost încă publicate.

Modelele sistemelor Wiener și Hammerstein descrise de rețele neuronale studiate în capitolele următoare sunt compuse din perceptroni multistrat cu un element neliniar și unul sau mai multe noduri liniare cu întârziere constituind modelul părții liniare dinamice. Modelele Wiener, serie-paralel conțin, de asemenea, încă un model de perceptron al elementului neliniar de pe reacția inversă.

În continuare vor fi luate în discuție două configurații de bază ale modelelor, adică modelele serie – paralel și paralel. În configurația serie-paralel, gradientul poate fi calculat prin bine-cunoscuta metodă a propagării înapoi. În cazul modelelor paralel, nu poate fi obținută decât o aproximare brută a gradientului prin metoda amintita mai sus. Prin urmare ar trebui analizate două metode, amintite ca fiind, metoda de sensibilitate și metoda de propagare înapoi în timp, care oferă valoarea exactă a gradientului sau o aproximare mai corectă. Toate aceste metode de calcul al gradientului sunt obținute într-o manieră unitară, pentru ambele cazuri, SISO și MIMO. Complexitatea calculelor acestor metode este analizată și exprimată în termenii ordinelor polinomiale și a numărului de pași de timp parcurși în cazul metodei propagării înapoi în timp trunchiate. De asemenea, va fi analizată acuratețea calculelor gradientului cu metoda propagării înapoi în timp trunchiate. Este demonstrat faptul că acuratețea calculelor gradientului depinde de numărul de pași discreți de timp necesari pentru răspunsul la impuls a sensibilității modelelor pentru eliminarea variațiilor. Pe baza acestor rezultate, vor fi propuse proceduri adaptive pentru ajustarea dimensiunii pașilor de timp în vederea obținerii gradului de acuratețe. Originalitatea lucrării constă în analiza abordării a identificării sistemelor Wiener și Hammerstein și a prezentării câtorva rezultate experimentale. Vor fi analizate următoarele modele de calcul ale gradientului atât pentru cazul sistemelor SISO cât și pentru cazul MIMO:

propagarea inversă pentru modelele serie – paralel Wiener

propagarea inversă pentru modelele paralel Wiener

metoda de sensibilitate pentru modelele Wiener

propagarea inversă trunchiată pentru modelele paralel Wiener

propagarea inversă pentru modelele serie – paralel Hammerstein

propagarea inversă pentru modelele paralel Hammerstein

metoda de sensibilitate pentru modelele Hammerstein

propagarea inversă trunchiată pentru modelele paralel Hammerstein

Având regulile pentru calculul gradienților, se pot implementa o serie de algoritmi de învățare.

Un alt pachet de metode de identificare discutate în lucrare au la bază reprezentarea polinomială a sistemelor:

metoda celor mai mici pătrate pentru sistemele polinomiale Wiener, cu termeni liniari;

metoda celor mai mici pătrate pentru sistemele polinomiale Wiener, fără termeni liniari;

metode combinate, cele mai mici pătrate și variabile instrumentale, pentru sisteme Wiener cu termeni liniari;

metode combinate, cele mai mici pătrate și variabile instrumentale, pentru sisteme Wiener fără termeni liniari;

metode recursive de predicție a erorii

metode recursive a regresiei pseudoliniară

Toate aceste metode de identificare bazate pe modelele polinomiale implică o reprezentare a unei funcții de transfer de tip puls a dinamicilor sistemului și modelele polinomiale ale elementului neliniar, sau invers. În ciuda faptului că ambele modele, atât Wiener cât și Hammerstein, pot fi exprimate în forme liniare în parametrii, astfel de transformări vor conduce la redundanța parametrilor deoarece modelele rezultate vor avea un număr mai mare de parametrii față de cei originali. Datorită creșterii numărului de parametrii ai modelelor rezultate vom obține la sfârșit creșterea ordinului modelului. În plus, ca rezultat va crește și eroarea de variație ceea ce va duce la erori de calcul. Mai mult, transformarea unui astfel de sistem într-unul liniar in parametrii implică faptul că neliniaritatea ar trebui să fie inversabilă(reversibilă), adică neliniaritatea ar trebui să fie strict monotonă. Pe parcurs vom demonstra că estimarea parametrilor prin metoda celor mai mici pătrate sunt inconsistente, pentru cazul de față. Pentru obținerea unor soluții consistente va fi necesară o combinare a tehnicilor(de exemplu am putea combina metoda celor mai mici pătrate cu metode de variabile instrumentale).

Modelele Hammerstein, dar și Wiener se pot regăsi ca formă în modelarea a numeroase aplicații industriale, și iată câteva dintre aceste aplicații:

modelarea proceselor de neutralizare ale ph-ului;

modelarea schimburilor de căldură;

modelarea coloanelor de distilare;

modelarea proceselor de separare cromatografice;

modelarea reactorului de polimerizare;

modelarea proceselor hidraulice și pneumatice;

modelarea sistemelor optice dinamice;

modelarea sistemelor de filtrare a zgomotelor;

modelarea evaporatorului(vaporizatorului) de zahăr.

2. Problematica identificării sistemelor

2.1 Generalități

Un sistem poate fi definit ca o colecție de unul sau mai multe obiecte interconectate. Un obiect este o entitate fizică cu caracteristici sau atribute specifice. Obiectele pot fi izolate sau în interacțiune în anumit sens, acestea din urmă fiind frecvent întâlnite în lumea reală.

Atributele unui obiect sunt descrise prin intermediul "parametrilor", variabilelor". Parametrii sunt atribute intrinseci ale obiectelor, în timp ce variabilele sunt atribute necesare pentru a descrie interacțiunea între obiecte. Altfel spus, parametrii și variabilele sunt elemente utilizate în diverse teorii, dacă acestea există, necesare pentru a explica starea și evoluția unui sistem. Când există o astfel de teorie, variabilele și parametrii sunt cuvinte din limbajul natural, semnificațiile uzuale, prin intermediul cărora putem descrie sistemul.

Tot ce nu aparține sistemului face parte din mediul ambiant al acestuia. Mediul ambiant este aproape întotdeauna în interacțiune cu sistemul cercetat doar în puține cazuri sistemul este "izolat" de mediul său. În cazurile reale, orice sistem face parte dintr-un supersistem care include observatorul universul cunoscut lui. În acest caz se pot pune următoarele întrebări: când obiect aparține sistemului si când mediului sau ambiant? Daca un obiect interacționează cu sistemul trebuie sau nu sa fie considerat ca parte componenta acestuia? Răspunsul la aceste întrebări este simplu. Ceea ce constituie sistem depinde de punctul de vedere al observatorului. Sistemul poate fi, exemplu, un amplificator, o bucla de reglare care conține mai multe amplificatoare pe lângă alte elemente, o unitate de prelucrare chimica care conține mai multe bucle de reglare etc. Împărțirea în sistem si mediu înconjurător este deci subiectiva, stabilirea frontierei sistemului depinzând atât scopul urmărit de observator cât si de aspectele matematice ale modelarii.

Interacțiunile între obiectele unui sistem sunt descrise prin relațiile care leagă variabilele asociate obiectelor, o importanta deosebita având relațiile cauzale. Variabilele prin care mediul acționează asupra sistemului sunt mărimi intrare pentru sistem, iar cele prin care sistemul acționează asupra mediului sunt mărimile de ieșire ale sistemului.

Sistemele pot fi clasificate din multe puncte de vedere. Sistemele care variabilele si relațiile între variabile sunt independente de timp sunt sisteme statice. În opoziție, sistemele dinamice sunt cele pentru care timpul joaca un rol deosebit în descrierea variabilelor si/sau a relațiilor dintre acestea.

Fie x si y doua variabile ale unui sistem dinamic în care variațiile timp ale lui x reprezintă cauza variațiilor în timp ale lui y(x este cauza si y este efect). Principiul cauzalității, valabil pentru sistemele fizice, afirma ca "numai trecutul poate influenta prezentul si viitorul", astfel încât este afectata numai de , cu și nu de cu . O problema care se pune este daca variabilele implicate în descrierea sistemului dinamic își modifica valorile orice moment de timp sau numai în anumite momente discrete de timp.

Desigur, exista, din acest punct de vedere, sisteme continue în timp si sisteme cu timp discret. Experimental însa nu este posibil de stabilit daca variațiile sunt continue sau discrete în timp deoarece observațiile asupra variabilelor (măsurătorile) au nevoie de un timp propriu pentru rezoluție. Din aceasta cauza trebuie sa luam o decizie apriorica daca vom trata un sistem ca fiind continuu sau discret. Daca sistemul (obiectul) este tratat ca fiind continuu, atunci variabilele sale trebuie descrise la toate momentele de timp din intervalul de observare. În caz contrar, sunt suficiente numai valorile variabilelor la momentele de timp relevante. În multe cazuri descrierea continua a unui sistem dinamic este excesiv detaliata. În astfel de situații este posibila o echivalare cu un sistem discret reținând numai valorile variabilelor la momente de timp discretizate cu un anumit pas. Desigur, cu cât acest pas este mai mic cu atât echivalenta între cele doua sisteme este mai puternica. Decizia în tratarea unui sistem ca fiind continuu sau discret este deci subiectiva; totuși, deoarece datele observate (disponibile) prin măsurători sunt în majoritatea cazurilor discretizate în timp, decizia de a trata un sistem ca fiind discret este rezonabila.

Un sistem este determinist daca valorile variabilelor (în cazul unui sistem static) sau variațiile variabilelor (în cazul unui sistem dinamic) sunt predictibile. În caz contrar, sistemul este probabilistic sau stohastic. În viata reala nu exista însa certitudini. Daca incertitudinea este nesemnificativa, ea poate fi ignorata si sistemul poate fi tratat ca fiind determinist, deși aceasta tratare constituie o idealizare a realității. Daca incertitudinile sunt mari, semnificative, ele nu pot fi ignorate si sistemul trebuie considerat ca atare, adică stohastic, si caracterizat corespunzător.

Analiza unui sistem poate fi realizata cu ajutorul modelelor deduse si verificate prin încercări experimentale succesive. Pornind de la observațiile asupra sistemului analizat se creează un model al acestuia pe baza căruia se pot proiecta noi experimente care pot confirma sau infirma modelul. Din acest punct de vedere observațiile si încercările experimentale sunt fundamentale în domeniul științelor naturale si tehnice.

Prin model se înțelege o reprezentare a aspectelor esențiale ale unui sistem, care prezintă cunoștințele asupra acelui sistem într-o forma utilizabila, adecvata scopului pentru care este necesar modelul.

Nu este necesar ca modelul sa descrie amănunțit mecanismul real al sistemului. El poate doar sa simuleze comportarea sistemului. Cunoștințele despre sistem concretizate în model trebuie prezentate într-o forma utilizabila. Acesta este un aspect esențial deoarece modelul trebuie sa ofere o baza pentru decizii. Daca modelul este prea complicat, utilitatea lui devine discutabila. O caracteristica dominanta a construirii modelelor este relativa simplitate, în acest sens modelul fiind o reprezentare cu complexitate redusa a realității. Totuși, în multe cazuri, complexitatea modelului trebuie sa aibă o anumita corespondenta cu complexitatea realității. Modelele pot fi clasificate în doua categorii principale:

1 – modele materiale (sau fizice)

2 – modele abstracte (sau formale).

Modelele fizice, după cum sugerează si denumirea, reprezintă replici, la scara redusa de regula, ale sistemelor originale, atunci când acestea pot fi construite. Ele sunt utilizate în multe domenii ale tehnicii (construcții, navigație, hidrotehnica etc.) în special acolo unde încercările experimentale asupra sistemului original sunt costisitoare sau imposibile. Studiile asupra modelelor fizice sunt aplicabile numai daca se cunosc relațiile de similitudine între sistemul or iginal si replica sa la scara redusa. Din categoria modelelor abstracte fac parte evident modelele matematice. Un model matematic al unui sistem este o reprezentare simbolica într-o formulare matematica abstracta.

Simbolurile au sensuri matematice precise, iar manipularea lor este conforma cu regulile logicii si matematicii. O formula matematica este un model în sine numai daca sunt precizate corespondentele dintre variabilele si parametrii sistemului si variabilele si parametrii care intervin în formula matematica.

Doua sisteme sunt analoage daca modelele lor matematice sunt identice ca forma. Aceasta implica existenta unei corespondente biunivoce între variabilele celor doua sisteme. În acest sens este binecunoscut exemplul analogiei dintre un oscilator electric si unul mecanic, ambele descrise de o ecuație diferențiala ordinara de ordinul doi. În acest caz exista corespondente între variabile.

O categorie aparte de modele o constituie modelele de simulare. Acestea "imită" într-un anumit sens numai unele aspecte ale sistemului dat.Astfel, o lampă de cuarț cu vapori de mercur simulează soarele în sensul ca aspectele celor două sisteme sunt asemănătoare într-o anumită zonă. Modelul planetar al lui Ptolemeu (modelul geocentric) este un model de simulare a mișcării aștrilor pe bolta cereasca, modelul heliocentric al lui Copernic este un model fizic, iar modelul lui Kepler este un model matematic.

Nu se poate spune ca un model de simulare nu este utilizabil, dacă ne gândim că de la Ptolemeu la Copernic orientarea în navigație s-a făcut după un astfel de model, însa el are numeroase inconveniente.

Majoritatea proceselor tehnologice sunt supuse unor influențe neprevizibile ale mediului ambiant sau ale unor factori interni cum ar fi uzura, îmbătrânirea etc., ceea ce face ca funcțiunea de conducere a acestor procese sa fie afectată de o anumita incertitudine. Reacția negativă după mărimea de ieșire poate micșora aceasta incertitudine sau poate deplasa efectul ei într-un domeniu de valori nesemnificative. Totuși, în cazuri în care se produc variații foarte mari ale parametrilor, care conduc la folosirea reglării adaptive, sau când sunt impuse cerințe foarte stricte pentru optimizare, care conduc la reglare optimală, sunt necesare cunoștințe mult mai precise asupra procesului care se reglează, cunoștințe care trebuie permanent actualizate.

Principiul reglării duale al lui Feldbaum implica doua funcțiuni, realizate simultan, si anume:

– studiul sau învățarea caracteristicilor procesului;

– dirijarea procesului spre starea cerută.

Tratarea simultană a celor doua funcțiuni conduce la o teorie care implica probleme de calcul deosebite chiar pentru sisteme simple. În 1970 K.I.Aström sugerează ipoteza separației, fireasca de altfel, a problemei de proiectare în doua parți:

determinarea unui model matematic pentru procesul reglat;

calculul regulatorului (control).

Sistemul de conducere proiectat pe baza ipotezei de separare poate fi mai simplu sau mai complex. Cu cât legea de reglare este mai sofisticată cu atât se cer informații mai amănunțite despre proces si despre perturbațiile acestuia. În schimb acordarea empirica a unui regulator PID necesită numai valoarea factorului de amplificare si constantele principale de timp. Din acest punct de vedere, scopul identificării poate fi determinarea unor caracteristici dinamice pentru acordarea empirica a unui regulator PID, proiectarea analitică a unui regulator stabil, proiectarea unei strategii optimale de tranziție între doua stări ale procesului sau proiectarea unui regulator optimal stohastic care să minimizeze variațiile ieșirii datorate zgomotelor.

De la un scop la altul, atât modelul procesului cât si precizia cerută lui sunt altele. În funcție de scopul identificării se ridica o serie de probleme legate de clasa de modele pe care trebuie s-o adoptăm într-o situație concretă, de criteriile de apreciere a calității modelului, de modul în care putem utiliza cunoștințele apriorice despre proces, de strategia pe care o folosim pentru a dobândi cunoștințele care lipsesc despre proces, de modul în care pot fi tratate neliniaritățile s.a.

Indiferent de problemele ridicate, modelul pentru un proces poate fi obținut fie pe cale analitică, fie pe cale experimentală, fiecare abordare având avantajele si dezavantajele sale. În cadrul identificării analitice modelele sunt obținute pe baza unor legități fizico-chimice, legea conservării masei, energiei etc. Aceste modele au un domeniu larg de valabilitate, coeficienții ecuațiilor care intervin având semnificații fizice directe. Deducerea lor presupune însă cunoștințe complete despre sistem si mediul său ambiant, ceea ce necesită timp îndelungat. Modelele obținute pe aceasta cale sunt în general complicate, conducând la sisteme de reglare complexe. Dacă ținem seama că există încă numeroase procese care au la bază legități insuficient cunoscute, este justificată cea de a doua abordare a problemei de identificare. Identificarea experimentală constă în determinarea unui model pentru proces cunoscând date de intrare si ieșire din proces. Deși majoritatea metodelor conduc la modele simple, acestea sunt presupuse liniare, ceea ce restrânge aplicabilitatea lor la variații mici, în jurul unui punct de funcționare. De cele mai multe ori este avantajoasă cuplarea identificării analitice cu cea experimentală, prin modelare analitică ajungând la o clasa de modele ai căror parametri vor fi estimați utilizând date experimentale.

Informațiile apriorice sunt de o importanță deosebită în identificare. Cunoștințele dobândite de experimentator prin înțelegerea fizică a procesului examinat pot conduce la o anumită structură a modelului, uneori pot conține chiar informații asupra valorilor aproximative ale unor parametrii, ceea ce simplifică algoritmul de identificare. De asemenea, informațiile apriorice constituie baza proiectării experimentului de identificare. Putem cunoaște astfel în ce măsură variabilele de intrare influențează ieșirile, dacă este posibilă aplicarea unui semnal de probă și ce caracteristici trebuie sa aibă acesta pentru a obține o informație cât mai bogată despre proces, dacă este necesară observarea în funcționarea normală, în bucla închisă sau deschisă, care este intervalul de eșantionare cel mai potrivit pentru culegerea și prelucrarea datelor ș.a.m.d. Cu cât informațiile apriorice sunt mai puține cu atât riscul eșecului în obținerea unui model utilizabil este mai mare. În majoritatea situațiilor tehnice abordarea procesului ca celebra "cutie neagra" nu este realistă. În general, informațiile apriorice, completate cu cele dobândite pe baza unor experimente, permit adoptarea unei anumite structuri pentru model.

Există avantaje și dezavantaje inerente fiecărui tip de model. Modelele neparametrice sunt, teoretic, modele infinit dimensionale, mai dificil de utilizat direct pentru proiectarea regulatorului decât cele parametrice, în schimb sunt mai ușor de obținut daca utilizăm semnalele de proba sau chiar cele din funcționarea normală. Obținerea modelelor parametrice necesită precizarea structurii, ceea ce nu este totdeauna posibil. Modelele continue sunt mult mai puțin manevrabile din punct de vedere numeric decât cele discrete, deși acestea din urma sunt mai rar întâlnite în practica, marea majoritate a proceselor industriale fiind continue. În consecință un sistem discret poate fi considerat ca o aproximare a unuia continuu, aproximație utila atunci când echipamentul de măsură este numeric, când se utilizează canale de comunicație cu timp divizat sau când datele sunt prelucrate de un calculator numeric. În aceasta situație experimentatorul poate opta pentru un model care se pretează cel mai bine experimentului de identificare, pe care sa-l transforme apoi (sa-i schimbe reprezentarea) într-unul care se pretează cel mai bine la rezolvarea problemei controlului. Apare astfel necesitatea schimbărilor de reprezentare a modelelor, fiecare schimbare introducând erori care trebuie luate în considerație pentru a fi ameliorate.

Pentru un model cu structura dată este necesara operațiunea de estimare a parametrilor. Aceasta este definită drept determinarea experimentală a valorilor parametrilor ecuațiilor care guvernează comportarea dinamică sau staționară, presupunând că structura modelului este cunoscută. În estimarea parametrilor trebuie să se țină seama de nivelul zgomotelor care afectează datele intrare-ieșire, de posibilitățile hardware si software.

Verificarea modelului constă în determinarea preciziei lui astfel încât sa fie valabilă ipoteza separării, precum si verificarea adecvanței modelului la proces. În cazurile în care modelul nu corespunde dintr-un anumit punct de vedere este necesară reconsiderarea fie a structurii pentru o clasa precizată fie a clasei de modele (de exemplu considerarea unor modele neliniare în locul celor liniare). Dacă în urma acestor intervenții modelul nu corespunde este posibil ca experimentul sa nu fie corespunzător planificat datorită informațiilor apriorice neconsistente si în acest caz experimentul trebuie reproiectat.

Semnalele de intrare condiționează în mod esențial rezultatele oricărui experiment de identificare, proiectarea si analiza lor dezvoltându-se în paralel cu studiul algoritmilor de identificare.

Dezvoltarea tehnicii de calcul a făcut posibilă aplicarea unor metode de identificare a căror utilizare nu este condiționata de un tip special de semnal, singura condiție impusă semnalului de intrare fiind cea de persistență, noțiune care exprima capacitatea unui semnal de a pune în evidentă caracteristicile dinamice ale procesului. Acest lucru implică prelucrarea datelor experimentale cu algoritmi relativ complicați, dar care oferă avantaje considerabile.

Este esențial să se cunoască și să se înțeleagă un sistem înainte de a fi manipulat și controlat. Modelarea și identificarea se întâmplă să fie o pereche conjugată de activități, în procesul de dezvoltare a informațiilor despre sistem. Sunt lucruri necesare practicii controlului automat. Modelarea în sine constituie o arie vastă și bogată în găzduirea unor metode bine stabilite, și care au la bază o varietate de principii. Aplicarea principiilor fizice în modelarea unui sistem fizic oferă modelul matematic cu parametrii cheie, în formă generală. Modelul rezultat cu parametrii generali reprezintă de fapt o clasă de modele din care căutarea unui model particular se face prin identificarea și estimarea parametrilor sistemului.

2.2 Cerințe pentru identificarea modelelor continue în timp

Principala dificultate în mânuirea modelelor continue în timp se datorează prezenței operatorilor de derivare asociați semnalelor de intrare, respectiv ieșire. În timp ce aceste semnale sunt disponibile prin măsurători, influențate de zgomotele de măsură, generarea directă a derivatelor nu este totuși de dorit. Această dificultate poate fi îndepărtată prin procesarea semnalelor într-o manieră în care să se obțină o reprezentare dorită a derivatelor. Alternativ, discretizarea modelelor continue în timp se poate face prin aplicarea unui operator de discretizare neconvențional care este în concordanță cu perechea continuă., în sensul că modelul discret converge către modelul continuu original pe măsură ce intervalul de eșantionare tinde la zero. Numeroasele abordări prezentate în literatura de specialitate pot fi clasificate așa cum sunt redate în figura următoare

O clasificare a abordărilor în identificarea sistemelor continue

Numeroasele metode de identificare a sistemelor continue în timp pot fi clasificate în forma unui arbore, pe baza indicațiilor ce se pot vedea din Fig.3, astfel vor rezulta următoarele

Conform figurii 3 aceste clase sunt:

A: abordări utilizând semnale discrete pentru a identifica un model discret, care va fi apoi convertit în forma să continuală.

B: abordări utilizând semnale continuale pentru a identifica direct un model continual

C: utilizând semnale discrete se vor crea modele neconvenționale discrete și apoi se vor trece în forma continuală.

Nevoia de a genera derivatele în modelele continue în timp este eliminată printr-o clasă de tehnici de procesare a semnalelor. Cea mai reprezentativă metodă a acestor tehnici este metoda de modulare a funcțiilor (Shinbrot 1957).

Modele continue în timp pentru sistemele dinamice

Vom discuta pentru început clasa sistemelor dinamice liniare invariabile în timp, stabile asimptotic cu intrarea și ieșirea . Descrierea intrare – ieșire a unui astfel de sistem în termenii funcției sale de transfer necunoscute, este:

(1a)

Termenul reprezintă componenta răspunsului sistemului la intrarea , reprezintă partea stochastică a ieșirii, iar este variabila complexă . În cazul unui sistem MIMO, , și sunt vectori de dimensiuni corespunzătoare și este matricea funcțiilor de transfer.

Pentru modelele liniare putem transcrie o relație generică, de forma:

[vectorul transpus al măsurilor][vectorul de parametrii]=[o singură măsură a ieșirii]

Utilizând această ecuație împreună cu câteva măsurători făcute la diferite momente de timp, se poate dezvolta un set de ecuații care pot fi transcrise în forma:

[Matrice a mărimilor măsurate][Vectorul parametrilor]=[vectorul mărimilor de ieșire]

Etapa de pregătire a datelor

Această etapă implică anumite operații necesare conversiei termenilor derivați din modelul continuu în timp, din formele lor abstracte și ideale în acele forme care să fie realizabile fie prin procesarea semnalelor fie și prin calcule. Aceste două operații sunt liniare; prima este dinamică iar cea de-a doua este de natură algebrică. Ca o ilustrare simplă a acestei etape, fie un model descris de o funcție de transfer de ordinul I:

Care corespunde ecuației diferențiale

Făcând măsurători la momentele și se va genera un sistem de ecuații de forma

În care ar trebui să fie ales în mod corespunzător.

Fie acum o mulțime de funcții de modulație cunoscute:

Cu derivate cunoscute și de grad corespunzător. În cazul exemplului prezentat mai sus, prima derivată va fi suficientă. Înmulțim ecuația diferențială cu , apoi integrăm pe intervalul , și rezultă

Integrând prin părți primul termen și utilizând condițiile va rezulta

Termenii, care implică semnalele sistemului, din această ecuație se pot calcula chiar dacă numai off-line. Vectorul denumit generic vectorul transpus al măsurilor va fi dat în acest caz de:

Vectorul de parametrii va fi , iar vectorul ieșirilor va fi

Calculele din metoda modulării funcțiilor pot fi făcute on-line, ca un proces de măsurare prin alegerea funcțiilor de forma celor ridicate la răspunsul la impuls a unui lanț de filtre având elemente identice, fiecare având o funcție de transfer de forma . Aceasta conduce la așa numita metodă Poisson a momentelor. Transformarea Poisson a unui semnal la dă funcționala momentului Poisson

Transformările derivatelor semnalelor de ieșire, respectiv de intrare pot fi exprimate ca sume liniare ponderate a acestor semnale, obținând astfel

Iar vectorul ieșirilor este . În expresia anterioară reprezintă transformata Laplace inversă a .

Un set de ecuații va putea fi dezvoltat fie prin aplicarea transformărilor Poisson la un nivel minim și variind momentul fie aplicând transformarea la diferite nivele și ținând fixat momentul . Strategia prezentată anterior este cea mai des utilizată datorită simplității și a posibilităților de implementare on-line. Termenii care implică derivate de ordin ridicat ale semnalelor procesului dau mărimea vectorului de valori inițiale ale vectorului de măsuri. Deoarece sunt necunoscuți, ar trebui separați și incluși în vectorul parametrilor ca necunoscute adiționale în vederea estimării lor împreună cu parametrii uzuali ai sistemului. Atunci când se cuplează cu etapa de simulare, algoritmul combinat devine unul de combinare a estimării atât a stării sistemului cât și a parametrilor ceea ce implică atenție deosebită.

Dacă este ales a fi foarte mare în raport cu constantele de timp ale sistemului de identificat, și dacă transformarea Poisson este făcută pentru un mare, efectul condițiilor inițiale devine insignifiant. Prin urmare, termenii asociați acestora pot fi eliminați din vectorul măsurilor. Algoritmul de estimare rezultat, în acest mod, se va aplica numai parametrilor sistemului. Totuși, această estimare va avea ca rezultat o filtrare foarte slabă a zgomotelor și va conduce la apariția acestora în estimări.

Transformarea Poisson aplicată pentru este un caz particular și trebuie tratat cu atenție și conduce la așa numita abordare prin ecuații integrale. Operațiile integrale pot fi efectuate automat prin aplicarea unui filtru digital pe eșantioane ale semnalelor proceselor. Un filtru tipic de integrare liniară este prezentat în continuare (Zao et all 1991, 1992; Yang et all 1993)

Fig. 6. Filtru liniar de integrare

Acesta este un modul de semnal digital în care semnifică operatorul de schimbare și o mulțime de ponderi specificate prin formula de integrare aleasă pentru integrala j.

O cale interesantă de a studia integralele este “abordarea prin ecuații integrale” , adică reprezentarea semnalelor procesului prin serii de funcții ortogonale pe intervalul . Pentru a exemplifica vom considera primele două componente ale extensiei în cazul în care sunt implicate toate semnalele, și vom avea:

și le vom insera în ecuația integrală a sistemului, rezultând

în care reprezintă o funcție treaptă unitate la momentul , cu și componentele spectrale ale , respectiv . Mai departe, fie

Ecuația integrală va fi transformată într-o formă algebrică în care matricea măsurilor va fi

iar vectorul mărimilor de ieșire

Această metodă poate fi aplicată unei arii mari de sisteme de funcții ortogonale, aceasta include și categoria funcțiilor continue ca de exemplu Fourier, Chebyshev, Jacobi, Laguerre, Legendre (Datta and Mohan, 1995), dar și funcții constante pe porțiuni (Rao 1983) ca de exemplu Walsh, Haar. Clasa funcțiilor hibride general ortogonale propuse de Patra și Rao (1996) surprind aspectele de continuitate ale sistemelor continue și discontinuitățile sistemelor constante pe porțiuni. Funcțiile hibride sunt capabile să reprezinte eficient un spectru larg de semnale întâlnite în practică, inclusiv pe acelea din sistemele de comutație. În lucrarea publicată de Patra și Rao în 1996 este prezentată o istorie a literaturii funcțiilor ortogonale.

Metodele prezentate anterior reprezintă tehnicile de procesare ale primei etape din algoritmul de identificare a sistemelor continue, apoi etapa următoare va fi operația de procesare a semnalelor, iar sarcina obținerii sistemului de ecuații din cele generale, este îndeplinită prin aplicarea anumitor operații matriceale într-un cadru algebric elegant care a fost dezvoltat în anii șaptezeci – optzeci.

2.2.2.2 Metode discrete în timp neconvenționale

Ecuațiile diferențiale reprezentând modelul sistemelor continue pot fi discretizate în vederea obținerii descrierii sistemelor în domeniul discret – domeniu care diferite variante, depinzând de alegerea aproximării. Tabelul 1 prezintă câteva posibilități în care fiecare formă pentru are legătură cu operatorul discret convențional definit ca . Astfel operatorul descrie aproximarea discretă a operatorului diferențial continuu.

Numeroasele posibilități de discretizare a sistemelor continuale, dar și relațiile dintre acestea și tehnicile de procesare sunt prezentate pe scurt în figura 7, iar detaliile legate de acestea sunt date în literatura de specialitate în lucrarea Mukhopadhyay et al(1992). Din sistemul de ecuații rezultat, parametrii pot fi estimați fie aplicând calcul prin blocuri, fie aplicând un algoritm recursiv. Algoritmul recursiv este aplicabil datorită proprietăților inerente ale unor metode de procesare a semnalelor. De exemplu, metodele prezentate anterior conduc la rezolvări prin algoritmi recursivi. Operatorul așa cum este cunoscut se referă doar la versiunile în care apare operatorul de întârziere cu un pas. În forma să mai generală este cunoscut ca operatorul .

Dezvoltări recente ale tehnicilor Poisson includ și studii în alegerea constantei filtrului Poisson și influența sa asupra estimărilor. Problema distribuției bias-ului a fost de asemenea analizată pentru a găsi o formă de reprezentare potrivită pentru algoritmul de estimare. În următoarea etapă a identificării sistemelor continue în timp, sunt aplicate proceduri standard ca de altfel și în cazul sistemelor discrete.

Etapa de estimare

După etapa de pregătire a datelor se trece la estimarea parametrilor sistemelor. În continuarea acestui subcapitol ne vom referi la figurile 8 și 9 și vom comenta pe marginea lor.

Vom considera modelul de forma

(1b)

în care cel de al doilea termen înglobează efectele combinate ale , dinamicile nemodelate (datorate simplificărilor) și posibilele condiții inițiale necunoscute. Acest termen format generic din modelul zgomotului și se numește zgomot alb. Tabelul 2 face un sumar al diferitelor abordări de estimare, în care este funcția de transfer a unui filtru iar și sunt polinoame în s.

Tabelul 2. Diferite abordări ale estimării parametrilor

Fie mulțimea măsurilor eșantionate la intervale de timp egale, de lungime

(2)

Având dată mulțimea și câteva date importante ale dinamicilor sistemului cunoscute, problema de identificare constă în obținerea funcției în termenii parametrilor care descriu cel mai bine dinamicile sistemului în sensul minimizării erorii.

Fie funcția de transfer a modelului estimat, în care este vectorul parametrilor. În termenii funcției ecuația care descrie sistemul intrare – ieșire devine

(3)

în care cel de al doilea termen înglobează efectele combinate ale , dinamicilor nemodelate (datorate simplificărilor modelelor) și posibil și a condițiilor inițiale necunoscute. Acest termen este numit generic modelul zgomotului. Deocamdată ne vom ocupa însă de primul termen al ecuației 3, dar algoritmul este valabil și pentru cel de al doilea termen.

Un model general de aproximare parametrică este cel polinomial black – box

(4)

aceasta fiind aproximarea discretă a ecuațiilor diferențiale continue a modelului prezentat de Box-Jenkins (1970) (Unbehauen and Rao 1987). În care, descrie o aproximare discretă a operatorului de derivare din domeniul timp continuu și nu operatorul uzual de întârziere cu un pas, și sunt eșantioane ale semnalelor de intrare, respectiv de ieșire, și este o secvență de variabile aleatoare independente uniform distribuite de valoare medie nulă. și sunt polinoame în ale căror coeficienți sunt aranjați astfel încât să formeze vectorul parametrilor . Cazurile particulare ale acestor forme duc la modele particulare ca de exemplu modelele autoregresive (AR), de medie alunecătoare (MA), autoregresive cu medie alunecătoare (ARMA), etc. În particular, pentru a caracteriza procesele stochastice staționare va fi utilizat următorul model ARMA

(5)

în care

și

ai cărui coeficienți apar în părțile AR și MA ale modelului. Sub aceste aspecte termenii AR, MA și ARMA fac referire la reprezentarea din domeniul continuu a modelului sistemului, în care însă reprezintă aproximarea discretă a operatorului diferențial din domeniul continuu și nu operatorul de întârziere cu un pas.

Modelul ARMA dat de ecuația (5) este utilizat adesea pentru a reprezenta estimarea analizei spectrale și analiza unor serii de timp. În identificarea sistemelor, în care scopul este caracterizarea relațiilor dinamice intrare – ieșire se poate utiliza următorul model

(6)

unde

și

În acest caz termenul MA este format uzual din semnalul de intrare al procesului, cunoscut de regulă. Fără a mai face alte notații vom avea

(7)

ca “ARMA determinist” și acest model este neliniar în parametrii. Cu această structură modelul erorii ieșirii în forma eșantionată este dat de

(8)

Una din formele pe care le poate lua criteriul de minimizare, în acest caz ar putea fi

(9)

Minimizare care se va face în raport de variabila . Deoarece eroarea ieșirii, așa cum este ea prezentată în forma din ecuația 8 este neliniară în parametrii, acesta este un caz de optimizare neliniară. Într-o încercare de a simplifica situația cele mai multe soluții pentru identificare recurg la următoarea ecuație a erorii

(10)

și a criteriului

(11)

În acest caz este un operator dinamic liniar, de ordin corespunzător pentru izolarea parametrilor doriți direct din ecuațiile diferențiale. Acești operatori execută de asemenea și o prefiltrare utilă pentru eliminarea frecvențelor neimportante din datele de proces. Deoarece ecuația 10 este liniară în parametrii, estimarea va fi simplificată la metoda de estimare recursivă a celor mai mici pătrate. Totuși minimizarea EE prezintă anumite dezavantaje.

Estimarea cu bias: estimărilor parametrilor le vor fi aplicate bias-uri în momentul în care EE nu este alb(Eykhoff, 1974). Pentru a îndepărta bias-ul se pot aplica diferite variante ale algoritmului celor mai mici pătrate ca de exemplu algoritmul generalizat sau metoda variabilelor instrumentale. Tehnicile prezentate, dar și multe alte metode necesită calcule, sunt metode computaționale. Aplicarea acestor tehnici implică faptul că mărimile măsurabile sunt generate de un model ARMA, și zgomotele măsurabile sunt distribuite Gauss. Totuși, performanța unora dintre acestea nu este satisfăcătoare în momentul apariției unei erori de modelare signifiante, ca de exemplu în cazul în care eroarea nu are distribuție Gauss.

Modelele reductibile(pentru sistemele MIMO): Fie – intrări și ieșiri ale unui sistem descris de matricea funcțiilor de transfer

(12)

și

Formularea ecuației erorii necesită o formă canonică care impune ca toate funcțiile din matricea funcțiilor de transfer să aibă cel puțin același numitor. Condiția anterioară vine din faptul ca termenii prezenți la numitor influențează vectorul de parametrii mărindu-l sau micșorându-l. Pentru a reduce parțial mărirea vectorului de parametrii matricea funcțiilor de transfer va suferi o decompoziție așa încât să se ajungă la submodele SISO. În acest mod un algoritm în două etape a fost propus de Diekmann și Unbehauen (1979) pentru identificarea modelelor discrete, iar versiunea pentru modelele continue a fost propusă de Mukhopadhyay et al.(1991).

Distribuția erorilor de setimare: Modelarea proceselor fizice este de obicei asociată cu un grad de submodelări. Acest fapt cuplat cu apariția zgomotelor de măsurare are rezultate prin aplicarea metodei de estimare cu bias. Totuși, este posibil să se elimine bias-ul datorat zgomotelor de măsurare, însă nu se vor putea elimina total.

Utilizând teorema lui Parseval descrierea în domeniul timp a criteriului ecuației erorii din ecuația (11), cu limita va fi

(13)

unde este transformata Fourier a semnalului de intrare iar este modelul real. Primul termen din partea dreaptă a ecuației (13) este o funcție de ponderare care trece cel de al doilea termen(bias-ul) printr-un domeniu de frecvențe. Cu structura ARMA aleasă, este clar că funcția pondere este o funcție de parametrii necunoscuți ceea ce face ca proiectarea on-line să fie practic imposibilă.

2.3. Dezvoltări recente în identificarea sistemelor continue neliniare în timp

Metodele de modelare și identificare utilizate pentru cazul sistemelor liniare continue în timp sunt în principiu metode care conduc către rezolvarea problemelor prin calcule ale unor ecuații sau sisteme de ecuații algebrice. Din păcate aceste metode nu sunt aplicabile în cazul sistemelor neliniare invariabile în timp. Principala dificultate, în general, este aceea că ecuațiile diferențiale neliniare care descriu aceste sisteme, nu sunt integrabile ceea ce conduce desigur la imposibilitatea de a aplica metode integrale sau metodele de filtrare. Astfel de metode pot fi aplicabile numai dacă ecuațiile neliniare sunt exact integrabile, adică termenii lor pot fi scriși ca derivate ale unor funcții calculabile ale semnalelor măsurabile, și în acest caz vom avea un sistem neliniar integrabil.

Cea de a doua dificultate este cea legată de greutatea cu care se fac calculele. Pentru a trece la calcule este necesar să se poată obține aproximări ale derivatelor și ale numeroșilor termeni neliniari. Singura excepție este cazul în care se va utiliza o dezvoltare în serie Fourier, în care coeficienții pot fi calculați utilizând transformata Fourier rapidă. Alt avantaj al acestei metode este relația simplă dintre spectrul Fourier al semnalului și derivatele lui. Această abordare a fost introdusă de Pearson (Perason and Lee 1985, Pearson 1988, 1992, Pearson et all 1993).

Toate motivele prezentate mai sus au dus la concluzia că utilizarea tehnicilor standard liniare nu este posibilă decât în câteva cazuri speciale de sisteme neliniare, ca de exemplu cazul sistemelor biliniare, ale sistemelor Hammerstein. De asemenea în literatura de specialitate a mai fost propusă o abordare și anume cea a întârzierii variabilelor de stare prin aplicarea de filtre (Tsang and Billings, 1994). În principiu metoda presupune asocierea semnalelor de intrare, respectiv de ieșire întârziate prin aplicarea unor filtre, cu derivatele de ordin superior ale variabilelor de stare ale filtrelor și apoi trecute prin algoritmul de estimare al celor mai mici pătrate.

În afară de tehnicile amintite în cele de mai sus există însă și abordări pentru identificarea parametrilor sistemelor neliniare continue în timp descrise prin modelele lor din spațiul stărilor, prin aplicarea unei quasi-liniarizări sau a integrării principiilor de invarianță pentru a converti sarcina estimării parametrilor la una de rezolvare a unei probleme neliniare cu limitare în două puncte. Totuși, aceste metode sunt solicitante din punctul de vedere al volumului de calcule.

Datorită dificultăților menționate anterior majoritatea studiilor de cercetare în domeniul identificării sistemelor neliniare au fost direcționate către studiul modelelor discrete, ca de exemplu modele polinomiale Kolmogorov – Gabor (Kortmann and Unbehauen 1987, Kortmann et al. 1988), rețele neuronale (Narendra and Parthosarathy 1990, Chen et al. 1990).

Parcurgând literatura de specialitate se poate spune ca cea mai utilizată metodă în identificarea sistemelor neliniare este cea a modulării funcțiilor.

2.3.2. Metode de modulare a funcțiilor

Conceptul de modulare a funcțiilor a fost introdus în 1957 de către Shinbrot și este cunoscută sub numele de metoda lui Shinbrot a momentelor funcționalelor. Ideea principală a acestei metode este utilizarea modulării funcțiilor în vederea convertirii expresiei diferențiale a ecuației intrării – ieșirii sistemului într-o secvență de ecuații algebrice. Shinbrot (1957) a prezentat o teorie generală sub numele de metode de ecuații ale mișcării pentru analiza sistemelor dinamice și a ales funcțiile de modulație de forma

(37)

în care și . Funcția a fost aleasă arbitrar dar trebuie să îndeplinească condițiile de mărginire în două puncte dată de la momentele . Această abordare a fost aplicată de asemenea la identificarea sistemelor cu alegerea funcțiilor de modulație sub diferite forme: trigonometrice (Perason and Lee, 1983), Fourier (Pearson and Lee, 1985; Pearson, 1992), funcții spline (Maletinsky, 1979).

Pearson a folosit funcții de modulație în formă Fourier și a dezvoltat a clasă de modele ale unor operatori diferențiali neliniari intrare–ieșire care pot fi implementați pentru identificarea parametrilor. Pe baza metodei momentelor funcționalelor Pearson a folosit următoarea funcție de modulație Fourier pentru formularea tehnicii de identificarea a celor mai mici pătrate, adică o funcție Fourier de ordinul n definită pe intervalul de forma:

(38)

unde se referă la indexul frecvențelor de modulație, joacă rolul unei frecvențe de rezonanță, și este o secvență de ordinul n de funcții de modulație care satisfac condițiile de a fi suficient de netede și condiția de mărginire a celei de a doua extremități, la și este satisfăcută pentru fiecare m. Forma generală a modelului operatorului determinist neliniar diferențial intrare – ieșire dezvoltat de Pearson (1992) este dată de:

(39)

unde

sunt funcții date de vectorul de parametrii ;

și sunt funcții specificate de perechea intrare– ieșire ;

sunt polinoame fixe de grad n în operatorul diferențial ;

.

Astfel pasul inițial al acestei metode constă în rescrierea modelului în forma ecuației (39), care poate descrie o gamă largă de procese și sisteme fizice. Apoi, este posibilă introducerea unei funcții de cost utilizând transformata Fourier pentru un set dat de date intrare – ieșire pe un interval de observație precizat, și minimizarea criteriului va duce la estimarea parametrilor sistemului prin metoda celor mai mici pătrate. Metoda funcțiilor de modulare Fourier a demonstrat de-a lungul timpului că este aplicabilă și se pot obține rezultate bune în identificarea parametrilor atât în cazul liniar cât și în cazul sistemelor neliniare.

Metoda funcțiilor de modulație de tip spline (Maletinsky, 1979) are la bază formularea ecuației erorii, și este liniară în parametrii. Prin această metodă parametrii unei ecuații diferențiale pot fi estimați fie prin tehnica celor mai mici pătrate fir prin variabilele instrumentale. Abordarea are ca rezultat o clasă specială de modele ale proceselor, care este liniară în parametrii și are la bază integrarea momentelor ponderate ale semnalelor măsurate intrare – ieșire ale procesului și mai departe potrivite pentru o implementare digitală. Metoda a fost aplicată sistemelor liniare și s-au putu constata rezultate interesante. Totuși, pentru a fi aplicată și modelelor neliniare această metodă necesită studii mai amănunțite.

O altă manieră de identificare a sistemelor neliniare ar fi metoda propusă de Hartley pentru modularea funcțiilor (Patra and Unbenhauen, 1995; Daniel – Berhe and Unbenhauen, 1996). Această metodă a fost introdusă de Patra și Unbenhauen (1995) ca un nou membru în clasa familiei funcțiilor de modulație, dată de modelul

(40)

În care este indexul frecvenței de modulație, este frecvența naturală, și este o secvență de ordinul n de funcții de modulație, de tip Hartley, care satisfac condițiile de a fi suficient de netede și condiția de mărginire a celei de a doua extremități,

pentru și (41)

este satisfăcută pentru fiecare m, iar este derivata a unei funcții care face parte din clasa funcțiilor Hartley .

Aceste funcții de modulație sunt strâns legate de funcțiile de modulație de tip Fourier. Făcând un studiu comparativ între cele două metode s-a putu observa că metoda Hartley prezintă un avantaj și anume că funcțiile implicate sunt reale iar spectrul lor poate fi calculat eficient astfel încât să se poată utiliza și algoritmi rapizi pentru variantele discrete.

Această nouă metodologie este aplicabilă unei largi categorii de sisteme neliniare continue în timp prin definirea unui set de funcții Hartley care să exprime procesele reale. Metoda se bazează totuși pe modelele de operatori diferențiali definiți de Pearson și a fost aplicată identificării parametrice în vederea obținerii unui algoritm al celor mai mici pătrare eficient. Aplicabilitatea metodei și-a demonstrat eficiența de-a lungul timpului în aplicațiile de identificare ale sistemelor de tip Hammerstein, ale modelelor integrabile, etc.

2.3.3. Studii aplicate ale metodei Hartley

Exemplificarea metodei va ține seama de aspectele teoretice discutate anterior și vor fi implementate 3 cazuri de sisteme și anume Hammerstein, sisteme continue neliniare integrabile și convolutive.

Forma de la care se pleacă sunt funcțiile de modulație date de (40), transformata Hartley și spectrul. Transformata Hartley, introdusă pentru prima oară de Hartley în 1942, este o formulă alternativă la o transformare funcțională armonică similară celei Fourier. Poate fi obținută din transformarea Fourier prin înlocuirea funcției exponențiale

cu .

Transformarea Hartley a unui semnal atât pentru domeniul continuu cât și pentru discret este dată de:

CONTINUU (42)

și

DISCRET (43)

Fie componenta spectrală m a funcției de tip Hartley a semnalului continuu dată de

(44)

Dacă este derivata de ordin a semnalului , atunci spectrul corespunzător este dat de:

(45)

unde . În plus, dacă semnalele și sunt de forma , atunci spectrumul acestui produs este dat de

(46)

în care

sunt părțile impare, respectiv pare ale funcției , și operatorul reprezintă cele două convoluții în forma simplificată.

2.3.3.1 Studiu de caz: Sistem continuu în timp de tip Hammerstein

Fie sistemul neliniar Hammerstein având o singură intrare și ieșirea . Sistemul poate fi modelat în spațiul stărilor, iar modelul neliniar diferențial este dat de

(47)

în care . Multiplicăm relația cu și , apoi integrăm pe intervalul , obținând:

(48a)

Înlocuind , ținând cont de (40), în (48a), integrând mai apoi până ce toate derivatele se transferă funcțiilor , simplificând și aplicând notațiile de la spectrul Hartley vom obține

(48b)

Fie , atunci (48b) poate fi rescris ca o regresie liniară

(49)

Unde

Fie o secvență de observații pentru momentele . Atunci ecuații regresie de forma (49) pot fi reprezentate ca o ecuație de vectori de forma:

(50)

În care

și

Și de aceeași formă va fi și

.

Funcția obiectiv va fi minimizarea unei funcții de cost de forma:

(51)

Minimizând criteriul în raport cu vectorul de parametri necunoscuți vom obține estimarea celor mai mici pătrare:

(52a)

Din acest punct se pot face câteva modificări ca de exemplu introducerea unei matrici de ponderi simetrică, pozitiv definită, , în definiția criteriului , care implică obținerea unei estimări a celor mai mici pătrare ponderată a vectorului de necunoscute , dată de:

(52b)

Într-o manieră asemănătoare se poate dezvolta o procedură de estimare a parametrilor sistemelor neliniare integrabile, de exemplu pentru sistemele neliniare integrabile, continue în timp vom avea următoarea formă:

(53)

unde reprezintă derivata de ordin a funcției diferențiabile cunoscute . Înmulțind ecuația (53) cu și integrând pe intervalul va rezulta:

(54)

În plus, pentru o categorie mai mare de modele neliniare continue în timp descrise prin modelul:

(55)

unde este o altă funcție specificată de perechea intrare-ieșire , aplicând pe ecuației (55) și apoi înlocuind în (46) vom obține următoarea formă finală:

(56)

Aplicând niște transformări potrivite ecuațiilor (54) și (56) vom putea ajunge la o formă în termenii unei regresii așa cum este cea indicată în (49), iar parametrii vor putea fi estimați prin tehnicile standard al celor mai mici pătrate perfecte. Unul dintre principalele avantaje al acestei noi clase de funcții de modulație este acela că au ca rezultat un set de ecuații algebrice cu coeficienți reali, rezolvarea problemelor se face într-un context în care nu se ține seama de condițiile de limite, iar calculele pot fi făcute aplicând algoritmi rapizi.

În general, dacă un sistem este dat în forma unui model neliniar diferențial de intrare-ieșire descris prin ecuația (39), în timp ce datele de intrare/ieșire sunt diponibile pentru o durată arbitrară de timp și, de asemenea sunt precizate funcțiile dar și polinoamele și funcțiile de vectorul parametrilor necunoscuți , atunci cu prețul pierderii generalității clasei de sisteme putem rearanja ecuațiile astfel încât șă se muleze pe regresiile de forma (49), respectiv (50) pentru o clasă de sisteme neliniare cu ajutorul ecuațiilor (54) și (56).

În continuare se va face o sinteză a modului de lucru având la bază teoria prezentă în literatura de specialitate, astfel pentru a rezolva o problemă ca cea expusă anterior am putea urmării pașii unui algoritm simplu prezentat în continuare:

Se va rezolva sistemul diferențial de ecuații utilizând formulele Runge-Kutta pe un interval precizat, pentru a obține datele de intrare – ieșire ale sistemului.

Se va adăuga un zgomot semnalului de ieșire , de regulă putem utiliza un zgomot aditiv Gaussian, cu o valoare fixată a raportului(procentului) zgomot/semnal.

Se va calcula transformarea Hartley pentru datele de intrare (de exemplu pentru o aproximare mai bună se poate utiliza regula lui Simpson).

Se va calcula spectrul Hartley și unele din derivate.

Se va aplica formula (46).

Se vor estima parametrii utilizând cele mai mici pătrate ponderate.

Se vor repeta pașii 2. – 6. conform algoritmului ales pentru generare și apoi se va face media valorilor parametrilor și se va calcula deviația standard.

Se vor repeta pașii 2. – 7. pentru valori diferite ale procentului de zgomot.

Pentru sistemul Hammerstein prezentat în teoria anterioară vom presupune că am aplicat la intrare un semnal de forma pe intervale de lungime . Mai departe lungimea intervalului de înregistare a fost împărțit în , dar se vor reține numai puncte signifiante din spectru.

3. Introducere în procesarea semnalelor adaptive

În această secțiune se vor dezvolta metode adaptive pentru identificarea sistemelor neliniare. Mai întâi vom trece în revistă câteva detalii importante despre filtrarea liniară adaptivă. Filtrele adaptive au fost studiate încă din anii 60 de către Widrow. Dezvoltările sale au la bază teoria filtrelor Wiener pentru estimarea liniară optimă. Există însă și alte abordări în dezvoltarea algoritmilor filtrelor adaptive, ca de exemplu filtrele Kalman, cele mai mici pătrate, etc. În continuare se va dezvolta teoria filtrelor Wiener și a celor mai mici pătrate atât cât influențează ele filtrele adaptive. Mai întâi vom dezvolta filtrele clasice Wiener, apoi filtrul adaptiv cu gradient stochastic în forma algoritmului celor mai mici pătrate.

Procesarea semnalelor cu ajutorul filtrelor Wiener pentru estimarea optimă liniară

Lucrările lui Norbert Wiener au dezbătut atât problematicile filtrelor liniare cât și ale celor neliniare. Pentru cazul liniar el a dezvoltat bine cunoscutul filtru Wiener pe baza căruia s-a produs convergența cu filtrele adaptive. De asemenea, așa cum s-a putut observa de-a lungul timpului modelul său pentru sisteme neliniare fără memorie realizează modele de serii Volterra trunchiate ale sistemelor neliniare.

Filtrul clasic Wiener este utilizat pentru estimarea liniară optimală a secvenței dorite de semnal din semnalul de intrare, așa cum este arătat în figura următoare:

Filtrul descris în figura anterioară poate fi un filtru FIR (filtru cu durată finită a răspunsului la impuls) sau unul IIR (filtru cu durată infinită a răspunsului la impuls). Problematica ce va urma vom presupune că o dezvoltăm pe un filtru FIR.

Presupunem cunoscuți anumiți parametrii statistici (de exemplu, funcții de medie sau de corelație) ai semnalului de intrare și un zgomot nedorit. Filtrul Wiener rezolvă problema proiectării unui filtru liniar cu zgomot la intrare și cerința de minimizare a efectului zgomotului la ieșirea filtrului conform unor criterii statistice. Se va genera apoi un semnal de eroare prin extragerea semnalului dorit din semnalul de ieșire al filtrului. Criteriul statistic utilizat frecvent este media pătratică a erorii și are forma:

(3.1)

O alegere de dorit a acestui criteriu de performanță (funcție de cost) trebuie să conducă la o matematică simplă și tot odată la o singură soluție de optim. Pentru alegerea criteriului de medie pătratică a erorii și a filtrului FIR, avem o funcție de performanță cuadric, ceea ce înseamnă că punctul de optim este singular (Fig. 3.2). Dacă împreună cu criteriul vom alege un filtru IIR vom avea o funcție de performanță noncuadrică adică o funcție multi–modală cu mai multe puncte de minim.

În figura 3.2

Dacă presupunem că W este vectorul fixat al ponderilor vom putea scrie

Fie

ieșirea va fi

(3.2)

iar eroarea

(3.3)

Prin urmare, criteriul de performanță (funcția de cost) va fi

Vom căuta un optim care să minimizeze funcția de performanță .

Vom defini vectorul de corelație de trecere (cross – corelation), de dimensiune

(3.4)

și matricea de autocorelație

(3.5a)

Unde reprezintă funcția de autocorelație dată de

Pentru o întârziere de k pași vom avea și reprezentând funcțiile de autocorelație. Prin urmare

(3.5b)

Matricea are câteva proprietăți foarte interesante pe care le vom prezenta în continuare:

Dacă intrarea este un proces stochastic discret în timp staționar, atunci matricea este o matrice Hermit . Adică .

Pentru intrare staționară funcția de autocorelație va fi:

unde

Dacă intrarea este un proces stochastic discret în timp staționar, atunci este de formă Toeplitz. Aceasta înseamnă că elementele de pe diagonala stângă (principală) sunt la fel pe orice diagonală.

Dacă intrarea este un proces stochastic discret în timp staționar, atunci este definită nenegativ și cel mai probabil va fi pozitiv definită. Aceasta înseamnă că toate valorile proprii ale matricei sunt mai mari sau egale cu zero.

Dacă intrarea este un proces stochastic discret în timp staționar în sens larg, atunci este nesingulară.

Dacă intrarea este un proces stochastic discret în timp staționar, atunci în care

este vectorul de date de intrare și

este vectorul inversat, transpus al datelor de intrare.

Acesta este rezultatul proprietății de staționaritate a intrării. De reținut de asemenea că deoarece este o matrice Hermit, atunci matricea a vectorului inversat este identică cu vectorul de intrare .

Dacă intrarea este un proces stochastic discret în timp staționar în sens larg, atunci poate fi partajată după cum urmează:

sau ca

unde este funcția de autocorelație a intrării , pentru întârziere zero.

și

Mai sunt și alte proprietăți dar cele prezentate mai sus sunt printre cele mai importante pentr scopul propus în acest studiu.

De reținut faptul că

Și pentru cazul predicției liniare . Atunci vectorul, de dimensiune, de corelație de trecere (cross-corelation) pentru filtrele FIR este

Ținând cont de cele prezentate mai sus vom obține:

(3.6)

Aceasta este o funcție cuadrică a vectorului de ponderi. Prin urmare soluția optimă va fi un punct singular al funcției de performanță.

Pentru a minimiza funcția anterioară, mai întâi o vom deriva în raport cu vectorul de ponderi și apoi vom egala cu zero, obținând pentru început:

unde vectorul gradient este un vector coloană definit ca:

Vom obține

(3.7)

Apoi, egalând cu zero ecuația și rezolvând-o vom obține:

(3.8)

Aceasta este ecuația Wiener – Hopf care minimizează criteriul de performanță în sensul erorii medii pătratice.

Valoarea minimă a funcției de performanță, , este

(3.9a)

De asemenea,

(3.9b)

Principiul ortogonalității se aplică și filtrelor Wiener. La punctul de optim, eroarea de estimare, nu este corelată cu intrările preluate de filtru. Aceasta înseamnă că:

Un corolar la aceasta este și faptul că ieșirea filtrului este ortogonală pe eroarea de estimare în punctul de optim:

De asemenea se poate reține și faptul că

(3.10)

Implementarea ecuației Wiener – Hopf este dificilă în practică deoarece necesită cunoașterea matricei de auto–corelație a vectorului intrărilor dar și matricea de cross–corelation a vectorului de intrare și a răspunsului dorit. De cele mai multe ori proprietățile statistice ale intrărilor și ale răspunsului dorit sunt necunoscute.

De asemenea, cerințele de calcul necesare inversării matricei sunt destul de costisitoare. De exemplu pentru o matrice de dimensiune acestea sunt .

Prin urmare, există o anume nevoie de determinare recursivă a vectorului de ponderi care să dea minimul funcției de performanță, ceea ce implică utilitatea filtrelor adaptive.

3.2. Filtre adaptive (Algoritmi bazați pe cele mai mici pătrate)

Filtrele adaptive sunt utile în situațiile în care caracteristicile semnalelor de intrare sau ale parametrilor sistemelor sunt necunoscute sau variază în timp. Proiectarea filtrului trebuie să se adapteze continuu la schimbările mediului.

Figura 5.3. ilustrează cerințele unui filtru adaptiv, și anume: structura unui filtru, performanța măsurii și algoritmul adaptiv de update, în care semnalul de intrare este , răspunsul dorit al sistemului este , eroarea sistemului este dată de iar ieșirea sistemului este .

Ieșirea filtrului adaptiv, este comparată cu răspunsul dorit . Semnalul de eroare astfel generat este utilizat pentru adaptarea parametrilor filtrului în vederea scăderii diferenței dintre ieșirea obținută și cea dorită, sau echivalentă pentru a obține o eroare cât mai mică(eroarea să tindă la zero).

Minimizarea unei funcții a erorii semnalului va fi utilizată în proiectarea filtrului, iar alegerea criteriului de performanță depinde de aplicație. Există o varietate de posibile funcții ce pot fi utilizate, dar cea mai cunoscută este funcția erorii medie pătratice deoarece ea conduce la o suprafață cuadrică, iar forma acesteia este

În afară de cele prezentate mai sus, mai putem alege, de asemenea structura filtrului putând analiza de exemplu filtre FIR, IIR, latice, etc. Dacă optăm pentru un filtru FIR, atunci putem scrie

Substituind ultimele două ecuații în prima vom minimiza criteriul așa cum am prezentat în subcapitolul anterior. Metoda de minimizare impune updatarea vectorului de ponderi în sensul negativ al pașilor gradientului, conform formulei:

(3.11)

Aceasta înseamnă schimbarea vectorului de ponderi înspre gradientul negativ în fiecare punct de pe suprafața de performanță în fiecare moment de timp, t. Numărul schimbărilor va fi proporțional cu constanta de unități, , denumită și pas de timp. În unele cazuri va fi variat .

Pentru cazul filtrului FIR cu intrare staționară, gradientul funcției de cost s-a arătat a fi de forma:

Înlocuind în formula anterioară vom obține algoritmul:

(3.12)

Acesta este algoritmul adaptiv cu un pas înapoi. Totuși, acesta necesită și cunoașterea lui și , care sunt cantități statistice, dificil de determinat în practică.

Algoritmul celor mai mici pătrate poate fi derivat din următoarele două abordări:

Substituind funcțiile de cost instantanee cu cea originală .

Utilizând o estimare a gradientului în locul gradientului actual exprimat mai sus. Aceasta înseamnă utilizarea estimărilor pentru calculul termenilor și din ecuația .

Ambele abordări conduc la același rezultat.

Utilizând prima metodă:

Prin urmare, înlocuind: , vom avea:

(3.13)

Utilizând cea dea doua metodă:

O estimare a gradientului real este dată de

în care noii parametrii utilizați sunt estimările instantanee ale lui și :

și

Prin urmare

(3.14)

Din nou, algoritmul de update cu un pas înainte este dat de:

(3.15)

Un alt exemplu cu o funcție de cost alternativă este:

(3.16)

Atunci când obținem algoritmul de medie cuatrică . Pentru a analiza alte dezvoltări ale algoritmului prezentat se poate studia în literatura de specialitate care este destul de amplă.(Walach 1984, Chang 1998a).

Există de asemenea alte tipuri de funcții de cost, iar dintre acestea destule nu conduc către suprafețe de performanță cuadrice.

Convergența algoritmului propus poate fi analizată și studiată în lucrările Diniz 2002, Haykin 1996 și Sayed 2003.

3.3 Aplicații ale filtrelor adaptive

Tehnicile de filtrare adaptive au aplicabilitate în câteva domenii ca de exemplu:

identificarea sistemelor;

predicția liniară;

egalizarea canalelor (filtrare/modelare inversă);

atenuarea(eliminarea) zgomotelor.

Aplicațiile dedicate identificării sistemelor sunt prezentate în figura 3.4, din care se poate observa că răspunsul adaptiv dorit al filtrului reprezintă tot odată ieșirea sistemului necunoscut. Celelalte metode de aplicare a filtrelor adaptive diferă de modul de determinare a răspunsului dorit.

În figura 3.5 este prezentată aplicația de predicție cu ajutorul filtrelor. În acest caz răspunsul dorit, coincide cu intrarea , dar întrarea în filtrul adaptiv este versiunea întârziată a intrării în sistem. Convergența algoritmului este asigurată în condițiile în care filtrul adaptiv face o predicție bună a intrării sistemului pe baza intrării întârziate.

Următoarea figură prezintă o schemă bloc a unei aplicații cu filtru adaptiv utilizată pentru modelarea egalizării unui canal. Aici filtrul adaptiv este înseriat cu canalul și la funcționare se va obține inversul semnalului din canal astfel încât ieșirea este numai o versiune întârziată a intrării originale . De asemenea, răspunsul dorit este format prin întârzierea semnalului di intrare.

Ultima aplicație, prezentată aici, este reducerea efectelor zgomotelor, aplicație prezentată în figura 5.7. Se poate observa că în acest caz filtrul are două intrări corelate. Filtrul adaptiv acționează asupra unei intrări decorelând-o de cealaltă. Dacă una din intrări e versiunea alterată de zgomot a celeilalte atunci vom avea ca rezultat un semnal din care s-a eliminat zgomotul.

3.4. Metoda celor mai mici pătrate pentru estimarea optimă liniară

Fie secvența de intrări dorite și date de intrare unde este numărul total de eșantioane. Se presupune că cele două semnale sunt variabile stochastice.

Problema este determinarea parametrilor filtrului astfel încât datele de intrare sunt filtrate, iar semnalul de ieșire se apropie foarte mult de ieșirea dorită, în sensul minimizării erorilor.

unde

(3.17)

La formularea problemei este necesar să se precizeze care sunt parametrii necunoscuți și care sunt cei ce trebuie identificați. În acest caz problema se transformă într-o problemă de filtrare optimală. Parametrii necunoscuți sunt coeficienții filtrului iar parametrii cunoscuți sunt datele de intrare în filtru și performanțele constructive ale filtrului.

Ca în cazul multor probleme de optimizare, datele cunoscute din problemă pot fi partajate în trei părți, din punct de vedere geometric, așa cum este ilustrat în figura 3.8. (pentru cazul și ):

vectorul de ieșire dorit:

Date cunoscute: vectorul de ieșire calculat și domeniile lui

Vectorul de ieșire, prezentat mai sus este o combinație liniară a vectorilor de intrare. Cu alte cuvinte, ieșirea poate fi un vector situat în subspațiul generat de cei M vectori de intrare.

Din punct de vedere geometric “distanța” dintre vectorul dorit și cel calculat este dată de: .

Se poate demonstra că vectorul dorit de ponderi poate fi obținut ca o soluție a următoarei ecuații:

în care * semnifică operatorul Hermitian (adică, operația care combină conjugatul cu transpusul).

În cazul în care are rang maxim pe coloană, soluția este dată de:

(3.18)

Aceasta este așa numita ecuație normală și arată că pentru orice structură a modelului care are la ieșire o funcție liniară de intrare, vectorul de ponderi optim poate fi determinat prin această ecuație.

În continuare vom privi problema din alt punct de vedere.

Problema care se pune este estimarea parametrilor necunoscuți:

Fie vectorul de date precizat

,

Atunci va fi generat de în care reprezintă ponderile optimale și vectorul erorilor de măsurare, care în practică sunt de natură statică și are următoarele proprietăți:

Soluția este utilizarea unui model de filtru liniar transversal pentru alegerea filtrului de ponderi astfel încât să se minimizeze criteriul , în care

unde

reprezintă eroarea de estimare

reprezintă ieșirea filtrului

Putem alege limitele și ale criteriului în patru moduri diferite:

metoda covarianței

metoda autocorelației

metoda de pre-ferestruire

metoda de post-ferestruire

Utilizând metoda de covarianță

Vom defini vectorul de eroare estimat

Vom defini vectorul răspunsului dorit

apoi

cu

este o matrice de dimensiuni (pentru cazul metodei de covarianță), dimensiunea acesteia depinde de metoda utilizată, însă. În continuare vom prezenta forma acestei matrici în funcție de metoda aleasă, astfel pentru:

metoda covarianței

Aceasta înseamnă că nu s-a făcut nici o ipoteză asupra intervalului datelor de ieșire,

metoda autocorelației

Aceasta înseamnă că datele înainte de momentul și după momentul sunt nule.

– metoda de pre-ferestruire

această metodă presupune că datele priori momentului sunt nule, iar asupra datelor anterioare momentului nu se face nicio ipoteză.

metoda post-ferestruire

această metodă presupune că asupra dateloe priori momentului nu s-a făcut nicio ipoteză, iar datele anterioare momentului sunt nule.

Proprietățile ecuațiilor soluție pentru cele mai mici pătrate/normale:

estimarea celor mai mici pătrate este unică dacă spațiul nul al matricei de date este zero. Pentru cazul în care se utilizează metoda covarianței, matricea unde . Spațiul nul al lui este spațiul tuturor vectorilor astfel încât

cel puțin coloane sunt liniar independente

este supradeterminat (mai multe ecuații decât necunoscute)

este nesingulară

este unică

La punctul de optim, eroarea de medie pătratică minimă este dată de

Deoarece (ecuația normală), avem

Ținând cont de toate acestea atunci când care este o problemă de estimare

numai când

4. Metode de analiză a funcției de bază

Optimizarea funcției de bază pentru subspații de bază neliniare

Pentru sistemele nelinare cu intrări neliniare măsurabile, se va utiliza un algoritm de identificare a subspațiului în vederea determinării dinamicilor liniare cu reprezentări neliniare, ca fiind o combinație de funcții de bază. O tehnică selectivă de rafinare și un algoritm de optimizare tip quasi-newton vor fi utilizați pentru a îmbunătății soluțiile. Pentru ambele metode vor putea fi folosite drept funcții de bază atât funcții polinomiale, cât și spline, sinusoide sau wavelets. Ambele abordări pot fi utilizate în identificarea funcțiilor neliniare cu argumente multiple.

Identificarea sistemelor neliniare este un domeniu în continuă creștere. Printre numeroasele metode care au fost elaborate se găsesc și metodele neparametrice, care sunt la bază metode frecvențiale. Aceste metode includ tehnici de identificare a nucleelor Volterra, care caracterizează răspunsul intrare – ieșire prin media unei sume de convoluții multifrecvențiale. Totuși, pentru simulări în domeniul timp, este convenabil să se construiască realizări neliniare în spațiul stărilor ale acestor reprezentări, lucru ce se poate dovedi destul de dificil în practică. Pe de altă parte metodele parametrice au fost dezvoltate pe modelele structurale și nestructurale din modelele din domeniul timp. Modelele nestructurale se bazează adesea pe modelele rețelelor neuronale. Modelele structurate sunt bazate pe interconexiunea dintre sistemele liniare și neliniare.

Cele mai comune structuri ale unor astfel de sisteme sunt modelele Hammerstein, Wiener, structurile neliniare cu reacție și sistemele combinate Hammerstein/ reacție.(Fig.4.1, Fig.4.2, Fig.4..3, Fig.4.4). Aceste modele implică o interconexiune între un bloc liniar și un bloc neliniar. Identificarea unor astfel de modele a fost practicată pentru o gamă largă de sisteme așa cum se poate vedea studiind [1,2,6,14]. În practică s-a ajuns la concluzia că identificarea sistemelor Wienner este mai dificilă față de identificarea Hammerstein, iar motivul acestei dificultăți provine din faptul că identificarea unei structuri neliniare este mult mai simplă atunci când avem la dispoziție informații măsurabile asupra intrărilor.

Modelul Hammerstein/ reacție poate fi privit ca o realizare a unui sistem neliniar. În concordanță, reprezentarea unui sistem neliniar nu este unică. S-a arătat în [14] că nu există o identificare unică a unui sistem neliniar, și pot interveni modificări fie la coeficienți sau termeni de bias ai părții neliniare.

Având în vedere faptul că identificarea sistemelor neliniare este facilitată de prezența informațiilor despre mărimile de intrare, o formulă generală de prezentarea a metodelor unei astfel de identificări a fost prezentată în [8] utilizând un algoritm de identificare pe subspații [9,13], împreună cu o extensie de bază, dată, pentru hărțile neliniare. Extinderea funcțiilor a fost aleasă a fii liniară în parametrii,fapt ce permite reinterpretarea problemei neliniare ca o problemă de identificare liniară cu intrări generalizate. Capacitatea de aplicabilitatea multivariabilă a algoritmilor de identificare pe subspații este esențială pentru această abordare, permițând un număr arbitrar de intrări generalizate. În plus, acești algoritmi identifică numai coeficienții funcțiilor de bază, nu funcțiile. Deci, fără o cunoaștere apriori a formei neliniarităților este foarte posibil ca numărul funcțiilor de bază utilizate să fie mare, crescând astfel dimensiunile problemei.

În vederea acestei probleme, lucrarea de față dezvoltă două tehnici pentru rafinarea iterativă a funcțiilor de bază reprezentând descrierile neliniare, și care sunt funcții ale intrărilor măsurabile. Așa cum a fost prezentat în [8], ambele tehnici utilizează un algoritm de identificare a subspațiilor pentru a identifica dinamicile liniare pentru un set de funcții de bază reprezentând funcțiile neliniare.

Prima tehnică utilizează rafinamentul selectiv pentru îmbunătățirea funcțiilor neliniare. Prin aplicarea unei decompoziții singulare matricei de intrare, neliniaritățile dominante sunt identificate cu setul de funcții de bază alese. În continuare, o colecție de funcții de bază aleatoare va fi introdusă pentru îmbunătățirea reprezentărilor neliniarităților dominante. Dacă acest proces va fi iterat se va ajunge la rafinarea problemei.

Cel de al doilea algoritm optimizează un set fix de funcții de bază prin utilizarea unui cod pentru optimizarea quasi Newton. Reprezentarea unei hărți neliniare este îmbunătățită sistematic prin modificarea funcțiilor de bază, mai degrabă decât prin adăugarea de noi funcții la mulțime. Un algoritm de identificare pe subspațiu va fi utilizat pentru identificarea dinamicilor liniare pentru un set dat de funcții de bază reprezentând funcțiile neliniare. Pentru cazul particular al matricei din spațiul stărilor , funcțiile de bază vor fi optimizate utilizând un algoritm de optimizare quasi-newton.

Ambele tehnici sunt flexibile pentru a fi implementate. De exemplu, ca funcții de bază arbitrare ar putea fi utilizate funcțiile polinomiale , sigmoide, sinusoidale, etc. De fapt, pentru a reprezenta o hartă neliniară s-ar putea folosi o rețea neuronală multi layer.

4.2. Formularea problemei

Fie sistemul neliniar discret în timp

(4.1)

(4.2)

unde și . Funcțiile F și G pot fi scrise în forma componentelor lor scalare, ca fiind:

(4.3)

unde, pentru toți și pentru . Definind

(4.4)

sistemul (4.1) și (4.2) poate fi ilustrat ca în figura 5, unde iar L reprezintă sistemul liniar

(4.5)

(4.6)

unde este privit ca intrare nemăsurabilă exogenă pentru L,

Principala trăsătură a modelului (4.5), (4.6) este faptul că toate intrările părții neliniare sunt măsurabile. Prin urmare modelul (4.1), (4.2) include un model Hammerstein și unul cu reacție, așa cum sunt ele prezentate în fig.4.1, respectiv fig.4.3. Totuși, acest model nu conține un model Wiener.

Vom presupune în continuare că funcțiile și pot fi dezvoltate în termenii funcțiilor de bază , și căpătând următoarele forme:

(4.7)

(4.8)

Funcțiile sunt funcții de bază comune ambelor componente, și . Definind și ca:

Va rezulta din (4.7) și (4.8)

(4.9)

(4.10)

Unde și . Astfel (2.1), (2.2) pot fi rescrise ca:

(4.11)

(4.12)

Sau, mai compact

(4.13)

(4.14)

În care

(4.15)

Ca un caz particular al sistemului prezentat în figura 5, vom considera sistemul Hammerstein

(4.16)

(4.17)

În care acum funcția depinde numai de intrarea . În cazul în care și sunt reprezentate de un set comun de funcții de bază va rezulta că:

(4.18)

În care și . Deci (2.16), (2.17) se vor putea rescrie ca fiind

(4.19)

(4.20)

Scopul problemei de identificare neliniară este construirea modelelor L și N având date măsurile

pe intervalul . Semnalul se presupune indisponibil. Totuși, când este aproximat prin și sunt aproximate prin semnalul calculat (estimat), de forma:

(4.21)

Va fi disponibil ca intrare pentru blocul liniar L.

4.3. Algoritmii de identificare

Cu funcțiile de bază specificate, algoritmii de identificare a subspațiilor [9,13] pot fi aplicați direct sistemului dat de (4.5), (4.6) cu semnalul calculat jucând rolul intrării exogene. Aceasta este abordarea prezentată în [8]. Totuși, alegerea funcțiilor de bază rămâne dificultatea principală. Tipul ales al funcțiilor de bază (de exemplu funcții polinomiale) va avea în general o influență puternică asupra numărului de funcții de bază necesare atingerii unei aproximări a hărții(diagramei) neliniarităților pentru aplicații particulare. Din păcate, algoritmii de identificare a subspațiilor neliniare determină coeficienții matricilor dar nu și funcțiile de bază în sine.

Pentru a dezbate această dificultate vom ilustra pentru un sistem Hammerstein dat de (4.19), (4.20) următorii 2 algoritmi.

4.3.1 Algoritm selectiv de rafinare

Pentru a începe, se va considera setul inițial de funcții de bază cu și fie estimările matricilor date de algoritmul de identificare a subspațiilor. În continuare, vom considera valoarea singulară pentru decompoziția scrisă în notațiile standard, ca fiind

(4.3.1)

Apoi, vom reține cea mai mare valoare singulară din pentru a obține aproximarea , unde și matricile și sunt complete(au rang maxim atât pe linii cât și pe coloane). Valoarea reținută poate fi înglobată fie în , fie în rezultând aproximarea:

(4.3.2)

În care matricea și care satisface relația și este un vector coloană cu elemente funcții neliniare. Motivația acestei proceduri este reținerea numai a acelor valori scalare de funcții neliniare din care să se facă o combinație liniară de funcții de bază. Deoarece , cele componente ale lui pot fi considerate ca neliniarități dominante, în timp ce alegerea lui reflectă rangul mapării neliniare . Deci numărul neliniarităților dominante este efectiv rangul hărții neliniare.

Pentru rafinarea mapării se repetă procedura anterioară cu un nou set de funcții de bază , cu , în care sunt aleși a fi cele componente ale vectorului , și sunt alese aleator. Repetând procedura anterioară va rezulta o nouă estimare și aproximarea

(4.3.3)

Unde sunt estimările lui , respectiv obținute din algoritmul de identificare la iterația curentă. De reținut că componentele neliniarității dominante vor fi acum combinații liniare de funcții de bază. Totuși, numărul de componente este fixat la .

Algoritmul prezentat este implementat cu câteva opțiuni. În special numărul de funcții de bază introduse la fiecare iterație este ales manual. În plus, numărul de neliniarități dominante reținut la fiecare pas este de asemenea specificat de utilizator.

4.3.2 Algoritmul de optimizare a funcțiilor de bază

Acest algoritm presupune optimizarea unui set fix de funcții de bază în loc să se introducă funcții de bază adiționale. O alegere convenabilă de funcții de bază sunt cele de tip radial deoarece se pot programa ușor și se pot mânuii ușor pentru intrări multiple. Astfel de funcții, de forma

(4.3.4)

În care determină împrățtierea funcției și determină centrul funcției. Pentru identificarea neliniară, vom optimiza un set de funcții radiale de bază în și și vom identifica dinamicile liniare utilizând un algoritm de identificare pe subspații. Prin optimizarea unei mulțimi fixe de funcții de bază, se va obține o reprezentare mai precisă a hărții neliniare, cu un număr mai mic de funcții de bază față de cazul în care s-arutiliza algoritmul prezentat în subcapitolul anterior.

Eroarea de identificare este definită în foma unei erori medii a ieșirii prin:

(4.3.5)

Unde și reprezintă ieșirea dorită, respectiv actuală a sistemului, iar reprezintă lungimea mulțimii de date.

În continuare, rescriind în termenii matricilor și , (3.5) devine

(4.3.6)

Utilizând un set de de funcții de bază radiale pentru ecuația (3.6) devine

(4.3.7)

Gradientul fiecărui în funcție de parametrii și pot fi calculați ca:

(4.3.8)

Și

(4.3.9)

deoarece

gradienții (4.3.8) și (4.3.9) pot fi evaluați.

Prin calcularea acestor gradienți, va fi utilizat un cod de optimizare BFGS quasi – Newton pentru optimizarea parametrilor funcțiilor de bază. Deoarece nu se pot estima simultan toți parametrii implicați se vor face alternativ optimizarea funcțiilor de bază și identificarea parametrilor modelului din spațiul stărilor.

Mai întâi va fi aleasă o mulțime de funcții de bază, și apoi vor fi identificate dinamicile liniare utilizând un algoritm pe subspații. Odată determinate matricile pentru spațiul stărilor, vor fi optimizate funcțiile de bază. Pentru mulțimea de funcții de bază optimizate se va face din nou identificare, și așa mai departe.

BIBLIOGRAFIE

[1]. L. Ljung. System Ident$cation: Theory for the User. Prentice Hall, 2nd edition, 1999.

[2]. H. Bourdache-Siguerdidjane, Optimal feedback control of nonlinear systems, Automatica 23 (3), 1987, 365-372.

[3]. H. Bourdache-Siguerdidjan, On application of a new method for computing optimal nonlinear feedback controls, Opt. Contr. Appl. Methods 8, 1987, 397-409

[4]. E.-W. Bai. "An optimal two stage identification algorithm for Hammerstein-Wiener nonlinear systems". In Proc. Anzer: Contr: Conf, pages 2756-2760, Philadelphia, PA, 1989.

[5]. (Chang 2003) Chang, Shue-Lee and Ogunfunmi, Tokunbo, “Stochastic Gradient Based Third-order Volterra System Identification by Using Nonlinear Wiener Adaptive Algorithm,” IEE Proceedings-Vision, Image and Signal Processing, vol. 150, no. 2, pp. 90–98, April 2003.

[6]. (Ogunfunmi 1998) Ogunfunmi, Tokunbo and Chang, Shue-Lee, “Nonlinear Adaptive Filters: Comparison of the Wiener and Volterra Models,” Proceedings of International Conference on Signal Processing Applications and Technology (ICSPAT), Toronto, Ontario, Canada, 1998.

[7]. Ogunfunmi Tokunbo , Adaptive Nonlinear System Identification.The Volterra and Wiener Model Approaches, Springer Science, ISBN 978-0-387-26328-1, 2007

[8]. Ikonen E., Najim K. (2001) Identification of Wiener systems with steady-state non-linearities. In: Proc. Europ. Contr. Conf., ECC’01, Porto, Portugal, CDROM.

[9]. Janczak A. (2000) Least squares identification of Wiener systems. In: Domek

S., Kaszy´nski R. (eds) Proc. 6th Int. Conf. Methods and Models in Automation and Robotics, MMAR’2000, Technical University of Szczecin Press, Szczecin, 933–938

Similar Posts