Program de studii: [626085]
UNIVERSITATEA POLITEHNICA DIN BUCURES TI
FACULTATEA DE S TIINT E APLICATE
Program de studii:
Matematic a s i Informatic a Aplicat a^n Inginerie
PROIECT DE DIPLOM A
COORDONATOR
S TIINT IFIC,
Prof. Dr. Vladimir BalanABSOLVENT: [anonimizat] ¸-C˘ at˘ alin Popa
Bucure¸ sti 2017
Aprobat Decan ,
Prof. Univ. Dr. Emil PETRESCU
PROIECT DE DIPLOM A
Aplicat ii ale algoritmilor single-frame ^ n
reconstruct ia imaginilor cu super-rezolut ie
COORDONATOR
S TIINT IFIC,
Prof. Dr. Vladimir BalanABSOLVENT: [anonimizat] ¸-C˘ at˘ alin Popa
Bucure¸ sti 2017
1
Cuprins
1 Introducere 3
Generalit˘ at ¸i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Situat ¸ia actual˘ a a temei de studiu . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Structura lucr˘ arii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Imaginea digital a 8
Introducere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Ce este imaginea? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Ce fel de valori sunt ˆ ın imagine? . . . . . . . . . . . . . . . . . . . . . . . . . 9
Care este elementul de baz˘ a al unei imagini? . . . . . . . . . . . . . . . . . . 9
Preluarea imaginilor digitale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Platforme satelitare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Platforme aeriene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Platforme terestre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Memorarea, transmisia ¸ si compresia imaginilor digitale . . . . . . . . . . . . . . . 11
Memorarea imaginilor digitale . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Transmisia imaginilor digitale . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Compresia imaginilor digitale . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3 Istoric tehnic 15
4 Tehnologii si metode pentru obt inerea imaginilor cu super-rezolut ie 17
Modelul observat ¸ional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Algoritmi de super-rezolut ¸ie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Metode bazate pe interpolare . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Metode ˆ ın domeniul frecvent ¸ei . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Metode bazate pe regularizare . . . . . . . . . . . . . . . . . . . . . . . . . . 22
5 Super-rezolut ie single-frame 25
Etapa de extragere a caracteristicilor . . . . . . . . . . . . . . . . . . . . . . . . . 25
Etapa de ˆ ınv˘ at ¸are . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Etapa de reconstruct ¸ie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
6 Comparat ie a performant ei ^ ntre diferite tehnici de rezolut ie 29
Metode de m˘ asurare ¸ si optimizare a calit˘ at ¸ii imaginii . . . . . . . . . . . . . . . . 29
2
7 Super-rezolut ie folosind Sparse representation 30
Recuperarea semnalului bazat˘ a pe reprezentare sparse . . . . . . . . . . . . . . . . 30
Notat ¸ii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Constrˆ angeri ale super-rezolut ¸iei . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Constrˆ angerea de reconstruct ¸ie . . . . . . . . . . . . . . . . . . . . . . . . . 31
Sparsity prior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Super-rezolut ¸ia imaginilor generale folosind Sparsity . . . . . . . . . . . . . . . . . 32
Modelul local folosind reprezentarea sparse . . . . . . . . . . . . . . . . . . . 33
Aplicarea constrˆ angerii de reconstruct ¸ie global˘ a . . . . . . . . . . . . . . . . 34
Interpretarea optimiz˘ arii globale . . . . . . . . . . . . . . . . . . . . . . . . . 35
Super-rezolut ¸ie facial˘ a folosind Sparsity . . . . . . . . . . . . . . . . . . . . . . . . 36
Modelul factoriz˘ arii matricei nenule (NMF) . . . . . . . . . . . . . . . . . . . 37
Super-rezolut ¸ie facial˘ a ˆ ın doi pa¸ si . . . . . . . . . . . . . . . . . . . . . . . . 38
8 Completarea perechii de dict ionare 40
ˆInv˘ at ¸area unui singur dict ¸ionar . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
ˆInv˘ at ¸area dict ¸ionarelor simultan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Reprezentarea caracteristicilor fragmentelor cu rezolut ¸ie sc˘ azut˘ a . . . . . . . . . . 42
9 Aplicarea algoritmului si analiza rezultatelor 45
Super-rezolut ¸ie single image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Super-rezolut ¸ia imaginilor generale . . . . . . . . . . . . . . . . . . . . . . . 46
Super-rezolut ¸ie facial˘ a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Influent ¸a m˘ arimii dict ¸ionarelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Bibliograe 51
Index 61
3
1 Introducere
Generalit at i
Prelucrarea imaginilor digitale este un domeniu complex, dinamic, cu numeroase aplicat ¸ii ˆ ın
diverse domenii. Noile tehnologii folosite ˆ ın industria circuitelor integrate au permis apli-
carea a noi algoritmi ¸ si metode pentru extragerea informat ¸iilor utile din imagine: algoritmi
paraleli, clasificatoare bazate pe ret ¸ele neuronale, etc. Exist˘ a acum diverse implement˘ ari
de sisteme ˆ ın timp real, bazate pe prelucrarea de imagini, sisteme utilizate ˆ ın industria
militar˘ a, medicin˘ a, sisteme de control automat a proceselor industriale. S-au adus diverse
ˆ ımbun˘ at˘ at ¸iri pentru sisteme de procesare a amprentelor digitale, recunoa¸ sterea formelor, a
fet ¸ei, a textelor. Pentru zonele aglomerate sau de interes strategic au fost proiectate ¸ si im-
plementate sisteme de securitate ¸ si supraveghere bazate pe vederea artificial˘ a. Prelucrarea
imaginilor digitale reprezint˘ a un domeniu foarte larg, de sine st˘ at˘ ator. Acest domeniu are la
baz˘ a o teorie matematic˘ a riguroas˘ a, bine pus˘ a la punct, care implementat˘ a pe diverse ma¸ sini
de calcul este mare consumatoare de resurse mai ales atunci cˆ and ne referim la utilizarea
ˆ ın timp real a informat ¸iilor extrase din imagini [2]. ˆIntr-un sens cˆ at mai general, o imagine
este o descriere a variat ¸iei unui parametru pe o suprafat ¸˘ a. Prelucrarea imaginilor poate fi
considerat˘ a ¸ si o ramur˘ a a prelucr˘ arii digitale de semnal. Prelucrarea imaginilor ¸ si ˆ ın general
prelucrarea digital˘ a a semnalelor presupune un consum relativ mare de resurse de calcul ¸ si
memorie. Implementarea algoritmilor specifici se poate face pe sisteme clasice (PC-uri) sau
pe sisteme dedicate de timp real numite procesoare digitale de semnal (DSP = Digital Signal
Processing ) [107].
Prelucrarea imaginilor include mai multe discipline:
•fotogrametria si teledetect ia – constituie tehnici moderne de investigare a insta-
bilit˘ at ¸ilor incipiente ¸ si a alunec˘ arilor de teren pe arii largi prin intermediul ortofoto-
planului (imaginilor) ¸ si al modelului digital al terenului;
•vederea articial a (computer vision, robot vision );
•inteligent a articial a ;
•imagini generate de calculator .
Inteligent ¸a artificial˘ a ¸ si prelucrarea imaginilor sunt domenii ce se ˆ ıntrep˘ atrund [37]. Un
num˘ ar important din algoritmii folosit ¸i la prelucrarea imaginilor utilizeaz˘ a metode ¸ si tehnici
din domeniul inteligent ¸ei artificiale: ret ¸ele neuronale, logica fuzzy. Pe de alt˘ a parte, inteligent ¸a
artificial˘ a presupune proiectarea ¸ si construirea de sisteme capabile s˘ a realizeze funct ¸ii ale in-
telectului uman:
•ˆ ınv˘ at ¸area prin experient ¸˘ a;
4
•ˆ ınt ¸elegerea limbajului natural;
•utilizarea unui rat ¸ionament pentru rezolvarea unor probleme sau luarea unor decizii.
Toate acestea presupun ˆ ıns˘ a ¸ si acumularea unei anume cantit˘ at ¸i de informat ¸ie (baza
de cuno¸ stint ¸e, informat ¸ii din mediu etc.) rezultat˘ a ˆ ın urma exploat˘ arii imaginilor digitale.
Aceast˘ a informat ¸ie este preluat˘ a de sistemele inteligente prin intermediul senzorilor ¸ si creaz˘ a
o imagine a mediului ˆ ın momentul prelu˘ arii datelor. Din imaginea astfel obt ¸inut˘ a trebuie
extrase informat ¸iile utile. Aceste informat ¸ii sunt stocate ˆ ın cadrul sistemului de informat ¸ii
spat ¸iale sau Sistem Informatic Geografic (GIS). Un GIS este un ansamblu de persoane, echipa-
mente, programe, metode si norme avˆ and ca scop culegerea, validarea, stocarea, analiza ¸ si
vizualizarea datelor geografice [79]. Este un instrument implementat pe calculator pentru
realizarea h˘ art ¸ilor ¸ si analiza lucr˘ arilor ce exist˘ a ¸ si a evenimentelor ce se petrec pe p˘ amˆ ant.
Tehnologia GIS combin˘ a operat ¸iile uzuale de baze de date precum integrarea ¸ si analiza statis-
tic˘ a cu avantajele vizualiz˘ arii unice ¸ si analizei geografice oferite de c˘ atre h˘ art ¸i [14].
Situat ia actual a a temei de studiu
Tema dezvoltat˘ a poate fi structurat˘ a ˆ ın mai multe componente ¸ si anume:
1.preluarea ¸ si prelucrarea imaginilor digitale;
2.filtrarea neliniar˘ a ˆ ın prelucrarea imaginilor digitale;
3.restabilirea imaginilor.
La o analiz˘ a sumar˘ a a situat ¸iei actuale a temei dezvoltate se observ˘ a diferent ¸e mari ˆ ıntre
situat ¸ia pe plan internat ¸ional ¸ si cea nat ¸ional˘ a. Aceast˘ a diferent ¸˘ a este dat˘ a de:
•o anumit˘ a incoerent ¸˘ a a cadrului legislativ nat ¸ional;
•de faptul c˘ a nu exist˘ a structuri specializate cu sarcini precise ¸ si finant ¸are sustenabil˘ a;
•de inexistent ¸a unui sistem de informat ¸ii spat ¸iale unitar ¸ si eficient, cu o infrastructur˘ a
tehnologic˘ a ¸ si informatic˘ a modern˘ a ¸ si ment ¸inut˘ a.
Pentru a recupera r˘ amˆ anereaˆ ın urm˘ a este necesar˘ a o standardizare a modului de preluare,
procesare ¸ si stocare a datelor. Problema nu este legat˘ a de asigurarea platformei tehnologice
ci de crearea unitar˘ a a bazei de date ¸ si corelarea bazelor de date existente cu cea nou creat˘ a.
Riscul major, ˆ ın cazul ˆ ın care nu este realizat˘ a o proiectare adecvat˘ a este acela c˘ a poate
genera disfunct ¸ionalit˘ at ¸i, ineficient ¸˘ a, suprapuneri, litigii, cheltuieli inutile ¸ si costuri mari
pentru remedierea acestora. Pentru evitarea acestui risc este necesar˘ a realizarea de norme ¸ si
metodologii unitare ¸ si detaliate. ˆIn acest sens:
5
•ˆ ın luna mai 2007 a intrat ˆ ın vigoare Directiva 2007/2/CE privind stabilirea infrastruc-
turii pentru informat ¸iile spat ¸iale ˆ ın cadrul Comunit˘ at ¸ii Europene (INSPIRE).
INSPIRE a fost init ¸iat˘ a din cauza lipsei de coordonare, lipsei standardelor, a datelor
¸ si restrict ¸iilor politice privind geo-informat ¸iile necesare implement˘ arii politicilor comu-
nitare din domeniul mediului ¸ si al politicilor sau activit˘ at ¸ilor care ar putea avea impact
asupra mediului [128].
•ˆ ın data de 29 ianuarie 2010 a fost publicat˘ a ˆ ın Monitorul Oficial Ordonant ¸a de Guvern
nr. 66/2010 privind instituirea Infrastructurii Nat ¸ionale pentru Informat ¸ii Spat ¸iale ˆ ın
Romˆ ania ˆ ın vederea implement˘ arii Directivei INSPIRE. Transpunerea acestei directive
are un rol major pentru Romˆ ania, deoarece pune bazele cre˘ arii geo-portalului unic la
nivel nat ¸ional, geo-portalul INSPIRE, prin intermediul c˘ aruia se va asigura accesul la
informat ¸ia spat ¸ial˘ a din Romˆ ania. Portalul va fi creat atˆ at de institut ¸iile statului, cˆ at
¸ si de creatorii de date privat ¸i. De asemenea, acest geo-portal va reprezenta punctul
unic de acces la geo-portalul INSPIRE creat la nivel european ¸ si va asigura accesul
la informat ¸ia spat ¸ial˘ a pentru a putea lua decizii mult mai bune ˆ ın cadrul politicilor
de dezvoltare sectorial˘ a, politicilor de mediu, ˆ ın cazul intervent ¸iilor pentru situat ¸ii de
urgent ¸˘ a ¸ si pentru planificare urban˘ a [129].
Din punct de vedere al dezvolt˘ arii de tehnici de monitorizare pe plan nat ¸ional putem spune
c˘ a exist˘ a preocup˘ ari ¸ stiint ¸ifice, una dintre ele fiind chiar premiat˘ a la Salonul Internat ¸ional de
Inventic˘ a de la Hamburg, proiect intitulat TerraRisc [130]. Proiectul TerraRisc (Suport de-
cizional pentru managementul riscului producerii de alunec˘ ari de teren ˆ ıntr-o zon˘ a geografic˘ a
expus˘ a la risc de catastrofe naturale), a fost gˆ andit s˘ a asigure suportul decizional pentru
managementul riscului producerii de alunec˘ ari de teren ˆ ıntr-o zon˘ a geografic˘ a expus˘ a la risc
de catastrofe naturale ¸ si a fost implementat de un consort ¸iu format din:
•Institutul pentru Tehnic˘ a de Calcul (ITC);
•Institutul de Proiectare ˆ ın Automatiz˘ ari (IPA);
•Facultatea de Geologie ¸ si Geofizic˘ a ¸ si Software din cadrul Universit˘ at ¸ii Bucure¸ sti;
•Sisteme Informatice BUCOVINA SA Suceava [45].
Structura lucr arii
Lucrarea este structurat˘ a ˆ ın nou˘ a capitole ce abordeaz˘ a din punct de vedere teoretic ¸ si practic
cˆ ateva dintre tehnicile avansate de filtrare neliniar˘ a ˆ ın prelucrarea imaginilor digitale.
Primul capitol, intitulat “Introducere” prezint˘ a concepte fundamentale privind imaginile
digitale ¸ si prelucrarea acestora. Pe lˆ ang˘ a aceasta se prezint˘ a stadiul actual al cunoa¸ sterii atˆ at
pe plan nat ¸ional cˆ at ¸ si internat ¸ional.
6
Al doilea capitol intitulat “Imaginea digital˘ a” abordeaz˘ a, din punct de vedere teoretic,
pe scurt, not ¸iuni generale legate de imaginea digital˘ a ¸ si anume: definit ¸ii, propriet˘ at ¸i, tipuri
(clase), moduri de reprezentare a imaginilor, modul de achizit ¸ionare a imaginilor analogice
¸ si transformarea acestora ˆ ın imagine digital˘ a. Sunt prezentate apoi cele mai utilizate moduri
de preluare a imaginilor digitale (prin exemplificarea celor mai importante echipamente ex-
istente) ¸ si anume cu ajutorul platformelor satelitare, a platformelor aeriene ¸ si a sistemelor
de scanare terestre. ˆ ın continuare este prezentat pe scurt modul de preluare, memorare,
transmisie ¸ si compresie a imaginilor digitale. Urmeaz˘ a expunerea teoretic˘ a a modului de
prelucrare ¸ si transformare a imaginilor. ˆIn cadrul prezent˘ arii prelucr˘ arii imaginilor digi-
tale se abordeaz˘ a prelucrarea radiometric˘ a ¸ si cea geometric˘ a. Prelucr˘ arile radiometrice sunt
prelucr˘ ari pozit ¸ional invariante, se efectueaz˘ a operat ¸ii asupra nivelului de gri sau culoare a
planului imagine. Aceste prelucr˘ ari sunt specifice calibr˘ arii interne sau externe a senzorilor
de preluare (ˆ ın mod relativ sau absolut) ˆ ınt˘ aririi sau sl˘ abirii contrastului imaginii, filtr˘ arii sau
analizei imaginilor de prelucrat [116]. Conform [117] – problema corect ¸iilor radiometrice ˆ ın
teledetect ¸ie prezint˘ a anumite analogii cu cea a fotogramelor aeriene. S ¸i ˆ ın acest caz are loc un
transfer de energie de la suprafat ¸a p˘ amˆ antului, pˆ an˘ a la nivelul mediului magnetic de stocare
a informat ¸iei. Acest transfer este afectat de efectele perturbatoare ale mediilor traversate:
efectele atmosferei, zgomotul instrumental al senzorului ¸ si zgomotulˆ ınregistr˘ arii la sol. Trans-
form˘ arile geometrice sunt utilizate pentru aducerea la scara dorit˘ a a acestor imagini, precum
¸ si pentru modificarea rezolut ¸iei geometrice a imaginii de prelucrat. ˆ ın ˆ ıncheierea acestui
capitol sunt prezentate din punct de vedere teoretic urm˘ atoarele categorii de transform˘ ari de
imagine: transform˘ ari unitare ortogonale bidimensionale, sinusoidale, transformarea cosinus
discret˘ a, transformarea sinus discret˘ a, transformarea Hartley ¸ si transform˘ ari rectangulare.
Al treilea capitol intitulat “Istoric tehnic” prezint˘ a progresele f˘ acute ˆ ın domeniul imag-
inilor digitale ¸ si al super-rezolut ¸iei ˆ ın ultimii 25 de ani.
Capitolul patru intitulat “Tehnologii ¸ si metode pentru obt ¸inerea imaginilor cu super-
rezolut ¸ie” prezint˘ a diversele metode implementate pentru obt ¸inerea super-rezolut ¸iei, cu par-
ticularit˘ at ¸ile ¸ si avantajele fiec˘ areia.
Capitolul cinci intitulat “Super-rezolut ¸ie single-frame” prezint˘ a metoda single-frame de
obt ¸inere a super-rezolut ¸iei ¸ si etapele acesteia ˆ ın detaliu.
Capitolul ¸ sase intitulat “Comparat ¸ie a performant ¸ei ˆ ıntre diferite tehnici de rezolut ¸ie”
prezint˘ a modalit˘ at ¸ile de evaluare a calit˘ at ¸ii imaginilor ¸ si a diferent ¸ei dintre imaginea cu
super-rezolut ¸ie obt ¸inut˘ a ¸ si cea original˘ a.
Capitolul ¸ sapte intitulat “Super-rezolut ¸ie folosind sparse representation ” prezint˘ a metoda
propus˘ a ˆ ın aceast˘ a lucrare ˆ ın detaliu.
Capitolul opt intitulat “Completarea perechii de dict ¸ionare” detaliaz˘ a modul ˆ ın care sunt
obt ¸inute dict ¸ionarele folosite ˆ ın metoda sparse representation .
7
Capitolul nou˘ a intitulat “Aplicarea algoritmului ¸ si analiza rezultatelor” prezint˘ a rezul-
tatele obt ¸inute folosind algoritmul propus ˆ ın aceast˘ a lucrare ¸ si compararea acestora cu cele
ale altor algoritmi cunoscut ¸i.
Capitolul zece intitulat “Concluzii” prezint˘ a concluziile acestei lucr˘ ari ¸ si urm˘ atorii pa¸ si
ˆ ın cercetarea acestui domeniu.
8
2 Imaginea digital a
Introducere
Tehnologia Digilal lmaging (imaginile digitale captate ¸ si prelucrate pe calculator) revolut ¸ioneaz˘ a
continuu arta fotografic˘ a. Majoritatea imaginilor pe care le vedem tip˘ arite au fost create
folosind tehnologii digitale. Prelucrarea digital˘ a se extinde de la un nivel primar al retu¸ s˘ arii
imaginilor noi, pˆ an˘ a la montajele fotografice foarte elaborate ¸ si prelucrate, utilizate curent
ˆ ın industria reclamelor.
Ce este imaginea?
Imaginea este un ansamblu de valori plasate dup˘ a o form˘ a spat ¸ial˘ a de dimenisune suprauni-
tar˘ a (plan, volum, etc, dar nu o dreapta).
Simplist, imaginea poate fi interpretat˘ a ca un tablou sau matrice [103].
Figure 1: Reprezentarea unei matrici.
La ˆ ınceput, imaginile sunt semnale, dar nu funct ¸ii temporale, ci funct ¸ii definite pe un
domeniu spat ¸ial. Orice imagine este o structur˘ a bidimensional˘ a (tablou, matrice) de date.
Un element al imagini se nume¸ ste pixel. Aceste date pot fi numere naturale, reale sau
complexe, reprezentate ˆ ıns˘ a pe un num˘ ar finit de bit ¸i [104]. Dup˘ a tipul datelor din acest˘ a
structur˘ a bidimensional˘ a, imaginile prelucrate pot fi ˆ ımp˘ art ¸ite ˆ ın mai multe categorii:
•imagini scalare, ˆ ın care fiecare component˘ a este un scalar:
{imaginile monocrome (ˆ ın care punctele au doar dou˘ a valori posibile, ce corespund
unui cont ¸inut binar al imaginii, ˆ ın general alb-negru) ;
{imaginile alb – negru (cu nivele de gri).
•imagini vectoriale, ˆ ın care fiecare component˘ a este un vector de numere. Imaginea
vectorial˘ a este compus˘ a din mai multe straturi de imagini scalare.
{cazul particular cel mai de interes este acela al imaginilor color, ˆ ın care vectorul
are trei elemente (ce corespund celor trei constituente de baz˘ a ale oric˘ arei culori);
9
{tot ˆ ın imaginile vectoriale intr˘ a ¸ si imaginile stereo (o pereche de imagini ale
aceleia¸ si scene, luate din unghiuri diferite) ¸ si secvent ¸ele de imagini.
Ce fel de valori sunt ^ n imagine?
ˆIntr-o imagine ˆ ıntˆ alnim valori digitale – numere reprezentate cu un num˘ ar finit de bit ¸i, dup˘ a
un format standard pentru un calculator (digital). Este foarte important s˘ a ¸ stim c˘ a digital
̸=numeric . Rezultatul oric˘ arui calcul este numeric, dar nu orice num˘ ar este digital.
Care este elementul de baz a al unei imagini?
Elementul de baz˘ a al unei imagini este pixelul. Pixelul, sau unitatea de imagine, este cel
mai mic element de pe o suprafat ¸˘ a de afi¸ sare, c˘ aruia i se poate atribui ˆ ın mod independent
o singur˘ a valoare a intensit˘ at ¸ii sau o culoare. Fiec˘ arui pixel i se va atribui un num˘ ar care va
fi asociat cu o culoare. Entit˘ at ¸ile grafice sunt construite din mult ¸imi de pixeli. Prin definit ¸ie
se alege originea imaginii, cu coordonatele (0,0), ˆ ın colt ¸ul stˆ anga sus a imaginii [2].
ˆIn analiza imaginilor digitale, un dispozitiv de achizit ¸ie converte¸ ste imaginea ˆ ıntr-un
num˘ ar discret de pixeli. Fiec˘ arui ( x, y) i se atribuie o valoare a culorii ¸ si luminozit˘ at ¸ii.
Stocarea datelor se face ˆ ın matrici de tip ˆ ıntreg.
O imagine digital˘ a are urm˘ atoarele propriet˘ at ¸i:
•rezolut ¸ia unei imagini este num˘ arul de linii ¸ si coloane al matricii ˆ ın care este stocat˘ a
imaginea. Definit ¸ia unei imagini (engl. ” pixel depth ”) indic˘ a num˘ arul de culori sau
nuant ¸e de gri care pot fi distinse ˆ ıntr-o imagine. Definit ¸ia mai ˆ ınseamn˘ a num˘ arul de
bit ¸i folosit ¸i pentru codificarea intensit˘ at ¸ii fiec˘ arui pixel. Pentru o definit ¸ie n, un pixel
poate lua 2nvalori diferite. Spre exemplu, pentru n= 8 un pixel poate lua 256 valori
diferite, ˆ ın domeniul [0,255], pentru n=16 un pixel poate lua 65536 valori diferite ˆ ın
domeniul[0,65535] sau [ -32768, 32767].
•num˘ arul de plane ale unei imagini este num˘ arul de matrici care compun imaginea. O
imagine ˆ ın niveluri de gri sau pseudo-color este compus˘ a dintr-un singur plan, pe cˆ and
o imagine color (engl. ” true color ”) este compus˘ a din trei plane (ro¸ su, verde ¸ si albastru,
RGB) [107].
ˆIn imaginile cu nuant ¸e de gri, cele trei valori ale unui pixel, atribuite culorilor ro¸ su, verde,
albastru sunt combinate pentru a conduce la o singur˘ a valoare. Aceast˘ a valoare este recon-
vertit˘ a ˆ ın ro¸ su/verde/albastru la afi¸ sajul pe monitor. Acest˘ a conversie este efectuat˘ a de o
tabel˘ a de echivalare a nuant ¸elor de gri cu culorile, numit˘ a palet˘ a sau, ˆ ın limba englez˘ a, ” Look
Up Table ” (LUT). ˆIn cazul imaginilor ˆ ın culori ( true color ) intensit˘ at ¸ile pentru culorile de
baz˘ a ro¸ su/verde/albastru sunt codificate de trei valori diferite. Imaginea este o combinat ¸ie
10
a trei matrici de pixeli corespunz˘ atoare celor trei componente [113].
Exist˘ a patru tipuri (clase) de imagini digitale:
1.alb-negru (b/w), cu un bit per pixel;
2.ˆ ın nuant ¸e de gri, 8 bit ¸i per pixel (256 nivele de gri) sau 16 bit ¸i per pixel (65536 nivele
de gri);
3.color (32 bit ¸i, cˆ ate 8 pentru fiecare culoare de baz˘ a plus ˆ ınc˘ a opt pentru a¸ sa numitul
canal alfa);
4.complexe.
Pentru toate tipurile de imagini exist˘ a mai multe formate de stocare, dup˘ a firma sau
asociat ¸ia profesional˘ a care le-a definit (TIFF, GIF, JPG, BMP, TGA, DICOM, etc.). Struc-
tura tipic˘ a a unui sistem de prelucrare ¸ si analiz˘ a a imaginilor este prezentat˘ a ˆ ın Figura 2.
Figure 2: Reprezentarea unei matrici.
Preluarea imaginilor digitale
Imaginile preluate de la mare ˆ ın˘ alt ¸ime (din avion sau satelit) permit utilizatorului o vedere
de ansamblu, iar atunci cˆ and rezolut ¸ia o permite, asigur˘ a ment ¸inerea nivelului de detaliere
necesar pentru aprecierea modific˘ arilor intervenite ˆ ın natur˘ a.
Platforme satelitare
Satelit ¸ii p˘ amˆ antului, ˆ ın zbor liber, se ment ¸in pe orbite pentru o perioad˘ a de operat ¸ionalitate
de cˆ ateva luni sau ani, ˆ ın funct ¸ie de altitudinea la care opereaz˘ a.
11
Platforme aeriene
Platformele aeriene sunt platforme aeropurtate (elicopter sau avion) prev˘ azute cu senzori
optico-mecanici sau opto-electronici de mare rezolut ¸ie. Funct ¸ie de pozit ¸ia senzoruluiˆ ın timpul
prelu˘ arii fotogramele pot fi nadirale, ˆ ınclinate sau panoramice. Atunci cˆ and senzorul este un
sistem radar se poate vorbi de radargrametrie iar cˆ and imaginile exploatate sunt holograme,
se vorbe¸ ste de hologrametrie.
Platforme terestre
Platformele terestre pot fi fixe ( laser scanner , stat ¸ii totale cu preluare de imagine ¸ si camere
digitale) sau mobile (sisteme integrate de pozit ¸ionare).
Memorarea, transmisia si compresia imaginilor digitale
Memorarea imaginilor digitale
Memorarea digital˘ a pentru aplicat ¸ii de prelucrare de imagini poate fi clasificat˘ a ˆ ın trei cate-
gorii principale:
•memorarea pe termen scurt pentru nevoile proces˘ arii propriu-zise;
•memorarea on-line pentru accesare relativ rapid˘ a a imaginilor;
•memorarea ˆ ın vederea arhiv˘ arii, caracterizat˘ a prin faptul c˘ a accesul la imagini este mai
put ¸in frecvent.
Transmisia imaginilor digitale
Problema comunicat ¸iei ˆ ın prelucrarea digital˘ a de imagini implic˘ a, pe de o parte, comunicarea
local˘ a ˆ ıntre sisteme de prelucrare ¸ si comunicarea la distant ¸e mari, pe de alt˘ a parte. Hardware –
ul ¸ si software -ul pentru comunicat ¸ii locale este oferit, ˆ ın general, de facilit˘ at ¸ile ret ¸elelor de
calculatoare, cu toate c˘ a rata de transmisie necesar˘ a pentru imagini este mult mai mare decˆ at
pentru alte tipuri de transmisii de date. Pentru comunicat ¸ia cu mediul (inclusiv cu utilizatorul
uman), calculatorul electronic dispune de un sistem de intrare care asigur˘ a transferul de date
din exterior c˘ atre unitatea central˘ a de prelucrare (sau c˘ atre memoria principal˘ a) ¸ si de un
sistem de ie¸ sire care realizeaz˘ a transferul de date de la UCP (sau de la memoria principal˘ a)
spre exterior. Sistemele de intrare ¸ si de ie¸ sire (pe scurt I/E sau I/O: Input/Output) includ
o mare diversitate de aparate ¸ si dispozitive grupate sub numele de echipamente periferice.
Transferul de date dintre echipamentele periferice ¸ si calculatorul propriu-zis se realizeaz˘ a prin
intermediul unor conexiuni care asigur˘ a leg˘ atura cu magistralele (bus-urile) calculatorului.
12
ˆIn funct ¸ie de sensul ˆ ın care se face transferul de date, comunicarea dintre calculator ¸ si
echipamentul periferic poate fi:
•Half duplex, la care transferul se face la un moment dat numai ˆ ıntr-un singur sens (fie
de la calculator la periferic, fie de la periferic la calculator);
•Full duplex, la care transferul se face simultan ˆ ın ambele sensuri;
ˆIn funct ¸ie de num˘ arul de bit ¸i transportat ¸i simultan printr-o conexiune, exist˘ a:
•transmisie paralel˘ a, prin care, la un moment dat, este transportat simultan un grup de
bit ¸i (de regul˘ a, grupul este format din 8 bit ¸i de date, plus unul sau mai mult ¸i bit ¸i de
control);
•transmisie serial˘ a, prin care, la un moment dat, este transportat un singur bit.
Pentru c˘ a bus-ul calculatorului este, de regul˘ a, paralel, transmisia serial˘ a presupune con-
versia din paralel ˆ ın serial ¸ si invers, ceea ce se realizeaz˘ a prin intermediul unui circuit denumit
prescurtat UART (Universal Asynchronous Receiver/Transmitter).
Compresia imaginilor digitale
Termenul de compresie se refer˘ a la totalitatea metodelor ce au drept scop reducerea cantit˘ at ¸ii
de date necesare pentru reprezentarea unei imagini. Compresia este folosit˘ a ˆ ın special pentru
stocarea sau transmiterea imaginilor. S˘ a consider˘ am cazul unei imagini de dimensiune 512 ×
512 pixeli. Dac˘ a aceasta este o imagine ˆ ın tonuri de gri, iar fiecare pixel este codat cu 8 bit ¸i,
atunci cantitatea de date necesar˘ a pentru a reprezenta aceast˘ a imagine este: 512 ×512×8 =
29×29×23= 221≈2Mb.
Din acest calcul ne putem da seama c˘ a pentru a stoca o imagine avem nevoie de spat ¸iu
considerabil, iar pentru transmiterea ei avem nevoie de un canal de transmisiune de band˘ a
larg˘ a, de care nu dispunem ˆ ıntotdeauna.
Metodele de compresie se pot clasifca astftel:
•Metode de compresie la nivel de pixel – aceste metode nu t ¸in cont de corelat ¸ia care
exist˘ a ˆ ıntre pixelii vecini, codˆ and fiecare pixel ca atare. Acest tip de compresie este f˘ ar˘ a
pierdere de informat ¸ie, adic˘ a imaginea init ¸ial˘ a poate fi ref˘ acut˘ a perfect din imaginea
comprimat˘ a. Exemple de astfel de metode:
{codarea Huffman;
{codarea LZW (Lempel-Ziv-Walsh);
{codarea RLE (Run Length Encoding).
13
•Metode de compresie predictive – aceste metode realizeaz˘ a compresia folosind corelat ¸ia
care exist˘ a ˆ ıntre pixelii vecini, dintr-o imagine. Exemple de astfel de metode:
{codarea cu modulat ¸ie “delta”;
{codarea DPCM (Diferent ¸ial Pulse Code Modulation).
•Metode de compresie cu transformate – aceste metode se bazeaz˘ a pe scrierea imaginii
ˆ ıntr-o alt˘ a baz˘ a, prin aplicarea unei transform˘ ari unitare, a.ˆ ı. energia imaginii s˘ a fie
concentrat˘ a ˆ ıntr-un num˘ ar cˆ at mai mic de coeficient ¸i.
•Alte metode de compresie:
{cuantizarea vectorial˘ a;
{codarea folosind fractali;
{codarea hibrid˘ a.
Pentru a dezvolta conceptul de super-rezolut ¸ie trebuie ca mai ˆ ıntˆ ai s˘ a se prezinte ce este
rezolut ¸ia unei imagini, respectiv ce este un pixel. Imaginile digitale sunt create cu ajutorul
unui senzor optic format din celule (fotodiode) ce transform˘ a orice impuls luminos receptat
ˆ ıntr-un semnal electric ce este apoi amplificat ¸ si transformat ˆ ın intensitatea luminoas˘ a a unui
pixel [124]. Un pixel poate fi definit ca fiind cea mai mic˘ a unitate component˘ a a unei imagini.
Rezolut ¸ia reprezint˘ a num˘ arul de pixeli dintr-o imagine ¸ si este prezentat˘ a sub forma: num˘ ar
de pixeli pe vertical˘ a ×num˘ ar de pixeli pe orizontal˘ a, de exemplu 600 ×800. Uneori ea
mai apare ¸ si ca produsul dintre cele dou˘ a numere, folosindu-se o supraunitate a pixelului ¸ si
anume Megapixelul, adic˘ a un milion de pixeli [124]. A¸ sadar, cu cˆ at rezolut ¸ia unei imagini
este mai mare, cu atˆ at aceasta reprezint˘ a mai fidel obiectele ce au fost capturate ¸ si cont ¸ine
mai mult˘ a informat ¸ie.
Rezolut ¸ia se refer˘ a de asemenea la capacitatea senzorului optic de a m˘ asura pˆ an˘ a ¸ si cele
mai mici obiecte, lucru care este direct dependent de m˘ arimea pixelului [115]. A¸ sadar prin
super-rezolut ¸ie ne referim la ˆ ımbun˘ at˘ at ¸irea rezolut ¸iei unei imagini prin alte metode decˆ at
celehardware pentru o calitate cˆ at mai bun˘ a a imaginii ¸ si pentru a extrage informat ¸ii cˆ at
mai precise asupra obiectului observat [125].
De¸ si tehnologia care st˘ a la baza captur˘ arii imaginilor digitale se dezvolt˘ a exponent ¸ial, pe
zi ce trece apar noi sisteme optice capabile de a captura o imagine cu o rezolut ¸ie de pˆ an˘ a
la 4096×2160 pixeli [126], acestea totu¸ si necesit˘ a o dimensiune mare de spat ¸iu de stocare,
lucru ce face ca problema obt ¸inerii unei imagini cu super-rezolut ¸ie dintr-o imagine cu rezolut ¸ie
normal˘ a sau sc˘ azut˘ a s˘ a fie ˆ ınc˘ a una de actualitate. De asemenea sistemele de supraveghere
tind s˘ a sacrifice rezolut ¸ia ˆ ın favoarea unei perioade de funct ¸ionare mai lung˘ a.
O alt˘ a zon˘ a ˆ ın care se dore¸ ste o imagine cˆ at mai bun˘ a este imagistica satelitar˘ a, dorin-
du-se bineˆ ınt ¸eles o imagine cˆ at mai clar˘ a a zonei studiate [67]. Cˆ and vorbim de astfel de
14
imagini, puterea de magnificare a satelitului are o limitare, iar cˆ and aceasta este atins˘ a ˆ ınc˘ a
sunt cazuri ˆ ın care se dore¸ ste ˆ ımbun˘ at˘ at ¸irea calit˘ at ¸ii imaginii. Imagistica medical˘ a este de
asemenea un domeniu ˆ ın care se doresc o rezolut ¸ie ¸ si respectiv o calitate a imaginii cˆ at mai
ridicate, pentru a ajunge la un diagnostic corect, iar radiat ¸ia la care este supus pacientul
s˘ a fie minim˘ a [38]. Luˆ and ˆ ın considerare cele de mai sus ˆ ımbun˘ at˘ at ¸irea rezolut ¸iei este ˆ ınc˘ a
dorit˘ a ˆ ın multe domenii, iar prin alte metode decˆ at cele hardware care pot deveni costisitoare
¸ si care pot ˆ ımbun˘ at˘ at ¸i rezolut ¸ia ˆ ıns˘ a pˆ an˘ a la un anumit punct. Pentru a folosi conceptul de
algoritmi single-frame ˆ ın obt ¸inerea super-rezolut ¸iei este nevoie s˘ a elabor˘ am not ¸iunile single-
frame ¸ simulti-frame . Conceptul de multi-frame const˘ a ˆ ın folosirea a mai multor imagini cu
rezolut ¸ie sc˘ azut˘ a ale aceluia¸ si cadru pentru a forma o imagine cu super-rezolut ¸ie. Pentru a
face acest lucru se folose¸ ste de obicei o metod˘ a numit˘ a sub-pixel alignment ce este prezentat˘ a
ˆ ın Figura 3 [115].
Figure 3: Metoda multi-frame
Figura 3 ilustreaz˘ a sumar procedeul prin care este obt ¸inut˘ a o imagine ˆ ımbun˘ at˘ at ¸it˘ a ca-
litativ din trei imagini ale aceluia¸ si cadru. ˆIn partea din stˆ anga se afl˘ a cele trei imagini
init ¸iale, iar cu ajutorul unor tehnici de super-rezolut ¸ie ce includ sub-pixel alignment se obt ¸ine
imaginea din dreapta.
15
3 Istoric tehnic
Ast˘ azi, cei mai folosit ¸i senzori de imagine sunt CCD ( charge-coupled devices ) ¸ si CMOS
(complementary metal oxide semiconductors ) [77, 85], iar pentru a obt ¸ine o imagine cu o
rezolut ¸ie ˆ ınalt˘ a una dintre solut ¸ii ar fi s˘ a dezvolt˘ am dipozitive optice mai avansate. O metod˘ a
ar fi reducerea m˘ arimii unui pixel, ˆ ıns˘ a acest lucru afecteaz˘ a cantitatea de lumin˘ a disponi-
bil˘ a, a¸ sadar ar trebui m˘ arit˘ a senzitivitatea senzorului, iar calitatea imaginii va fi afectat˘ a de
zgomotul de imagine numit shot noise [127].
Figure 4: Zgomot de imagine
Mai mult decˆ at atˆ at, modele de a¸ sezare a pixelilor non-rectangulare, cum ar fi modelul
hexagonal super CCD de la Fijifilm sau modelul transfer-ortogonal CCD au fost folosite
pentru a ˆ ımbun˘ at˘ at ¸i spatial sampling rate [85]. Alte metode includ m˘ arirea chip-ului sau a
lungimii focale, ˆ ıns˘ a aceasta ar cauza o cre¸ stereˆ ın capacitant ¸˘ a, respectiv a m˘ arimii ¸ si greut˘ at ¸ii
camerelor. A¸ sadar aceste metode sunt considerate ineficiente datorit˘ a limit˘ arilor impuse de
industria optic˘ a actual˘ a ¸ si de cea a product ¸iei de senzori [74]. ˆIn comparat ¸ie cu CMOS-
urile, CCD-urile au avantaje ˆ ın ceea ce prive¸ ste minimizarea zgomotului, rezolut ¸ia imaginii,
senzitivitatea senzorilor ¸ si dezvoltarea tehnologic˘ a [77]. Din p˘ acate camerele bazate pe CCD
au pret ¸uri ridicate a¸ sadar tehnologiile bazate pe CMOS sunt din ce in ce mai investigate.
Senzorii CMOS ¸ stiint ¸ifici – sCMOS ofer˘ a o rezolut ¸ie mai mare ¸ si o rat ¸ie semnal-zgomot
(SNR) mare, ˆ ıns˘ a utilizarea practic˘ a r˘ amˆ ane o provocare. Per total, datorit˘ a limit˘ arilor
tehnologiilor hardware , cercetarea ˆ ımbun˘ at˘ at ¸irii rezolut ¸iei prin metode software este ˆ ınc˘ a o
necesitate. Avˆ andˆ ın vedere conceptele super-rezolut ¸iei, prima problem˘ a care trebuie adresat˘ a
este cea a obt ¸inerii unei imagini cu super-rezolut ¸ie din mai multe imagini observate a c˘ aror
rezolut ¸ie este sc˘ azut˘ a. ˆIn general, dac˘ a exist˘ a destul˘ a informat ¸ie ˆ ın imaginile cu rezolut ¸ie
sc˘ azut˘ a, obt ¸inerea unei imagini cu super-rezolut ¸ie este fezabil˘ a [38,56]. ˆIns˘ a acest lucru este
posibil doar dac˘ a imaginile observate cu rezolut ¸ie sc˘ azut˘ a nu pot fi obt ¸inute una din cealalt˘ a
prin ree¸ santionare ( resampling ) sau transform˘ ari ca translat ¸ii/rotat ¸ii, altfel nu se pot obt ¸ine
16
rezultate eficiente. Pentru a implementa ˆ ıntr-o aplicat ¸ie conceptul de super-rezolut ¸ie, s-a
ˆ ıncercat obt ¸inerea unei imagini prin modificarea ¸ si controlarea hardware -ului. Senzorii pot fi
setati ˆ ın a¸ sa fel ˆ ınc˘ at s˘ a extrag˘ a informat ¸ii cu un a¸ sa numit sub-pixel displacement sau mai
multe ”priviri” asupra aceleia¸ si scene. Agent ¸ia spat ¸ial˘ a francez˘ a ne poate oferi una dintre
cele mai de succes cazuri ˆ ın domeniul imaginilor prin satelit, aceasta folosind un senzor CCD
ˆ ın satelitul SPOT-5 ce poate ˆ ıncorpora dou˘ a CCD-uri a cˆ ate 12.000 pixeli fiecare [56]. Cele
dou˘ a CCD-uri sunt desincronizate cu cˆ ate o jum˘ atate de pixel pe vertical˘ a ¸ si orizontal˘ a. Din
moment ce ambii senzori pot captura imagini ˆ ın acela¸ si moment, se poate obt ¸ine un set de
date cu doar o decalare de jum˘ atate de pixel, informat ¸ie ce poate fi procesat˘ a cu ajutorul
unor tehnici de super-rezolut ¸ie pentru a obt ¸ine o imagine cu o rezolut ¸ie ridicat˘ a calitativ mai
bun˘ a. Camerele Leica ADS40 folosesc un mecanism similar celui de pe SPOT-5 [83]. Mai
mult decˆ at atˆ at, folosind pixeli CCD compu¸ si din sub-pixeli cu forme ¸ si organiz˘ ari diferite se
pot obt ¸ine imagini cu super-rezolut ¸ii ˆ ımbun˘ at˘ at ¸ite [11].
17
4 Tehnologii si metode pentru obt inerea imaginilor cu
super-rezolut ie
Urmeaz˘ a s˘ a discut˘ am metodele principale de obt ¸inere a unei imagini cu super-rezolut ¸ie
din mai multe observat ¸ii cˆ at ¸ si dificult˘ at ¸ile ˆ ıntˆ ampinate ˆ ın folosirea lor. Problema principal˘ a
este modul ˆ ın care este folosit˘ a informat ¸ia suplimentar˘ a din multiplele observat ¸ii. ˆIn anul
1964 J.L. Harris, ˆ ın lucrarea sa: ”Diffraction and resolving power” [40] a stabilit o fundat ¸ie
teoretic˘ a pentru abordarea super-rezolut ¸iei introducˆ and teoreme ce pot fi folosite pentru a
rezolva problema difract ¸iei ˆ ıntr-un sistem optic. Douazeci de ani mai tarziu, R.Y. Tsai ¸ si
T.S. Huang [100] au abordat pentru prima dat˘ a ideea de super-rezolut ¸ie pentru a ˆ ımbun˘ at˘ at ¸i
imaginile provenite de la Landsat TM. De atunci super-rezolut ¸ia a devenit un subiect de
interes pentru mult ¸i cercet˘ atori, atˆ at pe plan teoretic cˆ at ¸ si practic. Tehnicile de super-
rezolut ¸ie au fost dezvoltate ¸ si ˆ ımbun˘ at˘ at ¸ite de mai bine de trei decenii, iar progresele f˘ acute
pot fi rezumate dup˘ a cum urmeaz˘ a.
La ˆ ınceput majoritatea metodelor se bazau pe domeniul de frecvent ¸˘ a [100]. Algoritmii
ce se folosesc de domeniul de frecvent ¸˘ a funct ¸ioneaz˘ a prin a crea o leg˘ atur˘ a ˆ ıntre imaginile
cu rezolut ¸ie ˆ ınalt˘ a (HR) ¸ si cele observate cu rezolut ¸ie sc˘ azut˘ a (LR) bazat˘ a pe cˆ ateva baze
teoretice simple ¸ si avˆ and o eficient ¸˘ a computat ¸ional˘ a ridicat˘ a. ˆIns˘ a chiar ¸ si aceste metode au
limi˘ ari ˆ ın ceea ce prive¸ ste procesarea unor imagini cu mi¸ sc˘ ari complexe.
Datorit˘ a inconvenientelor algoritmilorˆ ın domeniul frecvent ¸ei, metodeleˆ ın domeniul spat ¸ial
(spatial domain ) au devenit principalul subiect [74]. Principalele metode includ iterative
back-projection (IBP) [44], projection onto convex sets (POCS) [69], metodele regularizate ¸ si
o multitudine de algoritmi hibrid [29]. Primele lucr˘ ari elaborate ofer˘ a descrieri ¸ si explicat ¸ii
ale acestor metode. Printre acestea, metodele regularizate sunt cele mai populare datorit˘ a
eficient ¸ei ¸ si flexibilit˘ at ¸ii, de aceea cele mai recente studii in domeniul super-rezolut ¸iei s-au
axat pe framework -uri regularizate [74]. Din aceast˘ a cauz˘ a o s˘ a ne orient˘ am atent ¸ia c˘ atre
evolut ¸ia metodelor regularizate, ˆ ın special ˆ ın ultimii zece ani. De asemenea o s˘ a facem o
scurt˘ a trecere peste progresul algoritmilor de optimizare si set˘ arii parametrilor ( parameter
setup ).
Modelul observat ional
Modelul observat ¸ional prezint˘ a modul ˆ ın care au fost obt ¸inute imaginile cu rezolut ¸ie sc˘ azut˘ a
(LR) ¸ si modeleaz˘ a parametrii care transform˘ a imaginea cu rezolut ¸ie ˆ ınalt˘ a (HR) ˆ ın imaginea
LR. Modelul observat ¸ional este esent ¸ial ˆ ın obt ¸inerea super-rezolut ¸iei cˆ and vine vorba de un
cadru regularizat. ˆInainte de a ˆ ıncepe procesul reconstruct ¸iei trebuie s˘ a ne ˆ ındrept˘ am atent ¸ia
c˘ atre procesul prin care este obt ¸inut˘ a imaginea. Acesta poate fi influent ¸at de diver¸ si factori
externi cum ar fi mi¸ scarea, difract ¸ia optic˘ a, zgomotul de imagine sau under-sampling -ul.ˆIn
18
general lu˘ am ˆ ın considerare ca factori ce influent ¸eaz˘ a imaginea obt ¸inut˘ a zgomotul, efectul de
blur,warping -ul ¸ si down-sampling -ul, ajungˆ and la urm˘ atorul model observat ¸ional:
yk=OkDkBkMkz+nk, (1)
unde sunt folosite kimagini init ¸iale cu rezolut ¸ie sc˘ azut˘ a. Fie N1k×N2km˘ arimea imagi-
nii init ¸iale k, iar L1kN1k×L2kN2km˘ arimea imaginii reconstruite influent ¸at˘ a de factorii de
m˘ arire orizontal˘ a ¸ si vertical˘ a L1k, respectiv L2k.ˆIn (1) z este forma vectorial˘ a a imaginii
reconstruite cu o dimensiune de L1kN1kL2kN2k×1, adic˘ a z= [z1, z2,···, zL1kN1kL2kN2k]T, ¸ si
yk= [yk;1, yk;2,···, yk;N1kN2k]Teste vectorul imaginii kobt ¸inute. Dkeste matricea de down-
sampling de m˘ arime N1kN2k×L1kN1kL2kN2k,Bkeste operatorul de blurring de m˘ arime
L1kN1kL2kN2k×L1kN1kL2kN2k, iarMkeste matricea de warp ce descrie informat ¸ia de mi¸ scare
(translat ¸ii, rotat ¸ii,etc.). nk(N1kN2k×1) reprezint˘ a zgomotul de imagine. Okeste operatorul
care exclude pixelii neobservabili din imaginea k[82,83,123]. ˆIn acest fel putem aborda atˆ at
problema super-rezolut ¸iei cˆ at ¸ si pe cea a reconstruct ¸iei p˘ art ¸ilor lips˘ a dac˘ a imaginile init ¸iale
sunt afectate. Din (1) se poate obt ¸ine modelul observat ¸ional pentru super-rezolut ¸ie single-
frame dac˘ a egal˘ am kcu 1. Dac˘ a MksiDksunt excluse acesta devine un model pentru
restaurarea imaginilor afectate de zgomot, blurring sau informat ¸ie lips˘ a. Mai jos avem o
schem˘ a a modelului observat ¸ional:
Figure 5: Modelul observat ¸ional
Algoritmi de super-rezolut ie
ˆIn continuare vom prezenta principalii algoritmi de obt ¸inere a super-rezolut ¸iei atˆ at single-
frame cˆ at ¸ si multi-frame .
19
Metode bazate pe interpolare
Interpolarea este procesul de estimare a unor pixeli noi printre pixelii deja obt ¸inut ¸i ai unei
imagini. Aceste tehnici s-au dovedit a fi eficiente ˆ ın multe cazuri practice, fiind unele dintre
cele mai u¸ soare metode de a m˘ ari rezolut ¸ia unei imagini. Multe dintre software -urile com-
erciale, cum ar fi PhotoZoom Pro ,Qimage ,Genuine Fractals sau chiar Photoshop folosesc
metode de interpolare pentru a modifica m˘ arimea unei imagini. Algoritmii de interpolare in-
clud trei mari pa¸ si in obt ¸inerea super-rezolut ¸iei, dup˘ a cum urmeaz˘ a: ˆ ınregistrare, interpolare
¸ si restaurare. Primul pas este procesul de aliniere a tuturor imaginilor obt ¸inute din punct
de vedere geometric, folosind ca referint ¸˘ a o imagine predefinit˘ a numit˘ a imagine de referint ¸˘ a.
Imaginile obt ¸inute pot suferi de rotat ¸ii, translat ¸ii sau sub-pixel displacement , a¸ sadar trebuie
aliniate, astfel ˆ ıncˆ at parametrii de mi¸ scare s˘ a fie aproximat ¸i corect ˆ ınainte de a ˆ ıncerca s˘ a
le unim pentru a crea o imagine cu super-rezolut ¸ie. Estim˘ ari incorecte ale parametrilor de
mi¸ scare pot conduce la o imagine cu super-rezolut ¸ie ce cont ¸ine diverse artefacte vizuale ce
se pot accentua de la o imagine la alta. ˆInregistrarea are loc fie ˆ ın domeniul spat ¸ial fie ˆ ın
domeniul frecvent ¸ei. Domeniul frecvent ¸ei este descris ˆ ın am˘ anunt ˆ ın sect ¸iunea urm˘ atoare.
Domeniul spat ¸ial are de asemenea varii metode de a estima mi¸ scarea, Keren et al. [50] au pro-
pus un algoritm bazat pe seria Taylor ce estimeaz˘ a parametrii de mi¸ scare cu precizie de sub-
pixel. J.R. Bergen ¸ si asociat ¸ii [3] au propus un cadru ierarhic pentru estimarea parametrilor
de mi¸ scare cum ar fi metode planare sau afine. Peleg ¸ si Irani [44] au dezvoltat o modalitate
interactiv˘ a cu multiple rezolut ¸ii pentru estimarea parametrilor de mi¸ scare. Pentru estimarea
acestor parametri unele metode mapeaz˘ a ˆ ıntreaga imagine, iar altele doar anumite caracter-
istici ce sunt comune printre imaginile cu rezolut ¸ie sc˘ azut˘ a [13]. Unele metode estimeaz˘ a
atˆ at imaginea cu super-rezolut ¸ie cˆ at ¸ si parametrii de mi¸ scare folosind metode Bayesiane, una
din aceste metode este explicat˘ a de Hardie et al. [39]. Mai recent, G. Botella ¸ si asociat ¸ii au
prezentat o metod˘ a de aproximare bazat˘ a pe gradient [10].
Pe lˆ ang˘ a ˆ ınregistrare, un rol important ˆ ın estimarea unei imagini cu super-rezolut ¸ie ˆ ıl
joac˘ a interpolarea. Exist˘ a foarte multe metode de interpolare, iar complexitatea fiec˘ areia
const˘ a ˆ ın num˘ arul de pixeli adiacent ¸i folosit ¸i pentru a estima pixelii nou creat ¸i (interme-
diari). Cele mai cunoscute metode de interpolare sunt: cel mai apropiat vecin ( nearest
neighbor ), metode biliniare si bicubice. Cel mai apropiat vecin este cea mai simpl˘ a metod˘ a
de interpolare ce const˘ a ˆ ın folosirea celor mai apropiat ¸i pixeli de pixelul pe care dorim s˘ a
ˆ ıl aproxim˘ am. Aceasta are ˆ ıns˘ a un mare dezavantaj, ¸ si anume tr˘ as˘ aturi liniare sub forma
de treapt˘ a vizibile ˆ ın imaginea cu super-rezolut ¸ie. Metoda biliniar˘ a calculeaz˘ a o medie a
celor mai apropiat ¸i 2 ×2 pixeli vecini pentru a estima valoarea pixelului interpolat. Analog,
metoda bicubic˘ a folose¸ ste cei mai apropiat ¸i 4 ×4 pixeli pentru a estima valoarea pixelului
interpolat. ˆIn ambele metode pixelii mai apropiat ¸i de pixelul estimat au un procentaj mai
ridicat ˆ ın estimarea acestuia. Deoarece translat ¸iile dintre imaginile cu rezolut ¸ie sc˘ azut˘ a sunt
20
inegale, este nevoie de metode neuniforme de interpolare pentru a folosi toate imaginile cu
rezolut ¸ie sc˘ azut˘ a ˆ ın cea cu super-rezolut ¸ie. ˆIn 1992 Ur ¸ si Gross [101] au dezvoltat o metod˘ a
de interpolare neuniform˘ a pentru un set de imagini translatate folosind o teorem˘ a general-
izat˘ a de multi-channel sampling . Exist˘ a multe alte metode complexe de interpolare folosite
pentru a redimensiona o singur˘ a imagine, cum ar fi: Cubic B-spline [119], New Edge-Directed
Interpolation (NEDI) [58], ¸ si Edge-Guided Interpolation (EGI) [120]. Pe scurt, metoda Cubic
B-spline cuprinde port ¸iuni ale unei curbe continue ce trece prin anumite puncte. Fiecare
din acele puncte reprezint˘ a procentaje, iar acele procentaje sunt coeficient ¸ii unui polinom
de gradul trei. Rolul metodei este de a calcula acele procentaje folosite ulterior pentru
a obt ¸ine imaginea cu super-rezolut ¸ie. NEDI [58] este o metod˘ a de interpolare direct ¸ional
adaptiv˘ a bazat˘ a pe covariant ¸˘ a ˆ ın care pixelii interpolat ¸i sunt estimat ¸i cu coeficient ¸ii locali
ai covariant ¸ei imaginii cu rezolut ¸ie sc˘ azut˘ a bazat ¸i pe dualitatea geometric˘ a dintre covariant ¸a
imaginii cu rezolut ¸ie sc˘ azut˘ a ¸ si imaginea cu super-rezolut ¸ie. EGI [120] divide vecin˘ atatea
fiec˘ arui pixel ˆ ın dou˘ a subseturi de observat ¸ie ˆ ın dou˘ a direct ¸ii ortogonale. Fiecare subset de
observat ¸ie aproximeaz˘ a un pixel lips˘ a. Algoritmul apoi contope¸ ste cele dou˘ a valori aproxi-
mate ˆ ıntr-o estimare mai robust˘ a folosind estimarea liniar˘ a MMSE ( minimum mean square
error ). Alte metode de interpolare cuprind interpolarea Gradient-Based Adaptive (GBA) [19]
¸ si modelul de interpolare autoregresiv [121]. Aceste metode sunt extrem de eficiente ¸ si con-
serv˘ a majoritatea informat ¸iei din imagine, ˆ ıns˘ a timpul de procesare ¸ si costul computat ¸ional
sunt mai mari fat ¸˘ a de metodele clasice.
Pa¸ sii de ˆ ınregistrare, interpolare ¸ si restaurare aferent ¸i metodei de super-rezolut ¸ie pot
fi sust ¸inut ¸i iterativ petru a obt ¸ine o imagine cu super-rezolut ¸ie din mai multe imagini cu
rezolut ¸ie sc˘ azut˘ a prin metoda Iterative Back Projection (IBP) [44]. ˆIn aceast˘ a metod˘ a ima-
ginea cu super-rezolut ¸ie este estimat˘ a prin a minimiza iterativ eroarea dintre imaginile cu
rezolut ¸ie sc˘ azut˘ a observate ¸ si cele simulate. Aceast˘ a metod˘ a este foarte simpl˘ a ¸ si u¸ sor de
ˆ ınt ¸eles, ˆ ıns˘ a nu ofer˘ a accea¸ si solut ¸ie de fiecare dat˘ a datorit˘ a problemei inverse gre¸ sit formu-
late. Alt˘ a abordare a super-rezolut ¸iei u¸ sor de implementat este Projection Onto Convex Set
(POCS) propus˘ a de Oskoui ¸ si Stark [89]. ˆIn aceast˘ a metod˘ a un set de constrˆ angeri este definit
pentru a restrˆ ange spat ¸iul imaginii cu super-rezolut ¸ie. Seturile de constrˆ angeri sunt convexe
¸ si reprezint˘ a anumite caracteristici ale imaginii cu super-rezolut ¸ie pe care le dorim, cum ar fi
smoothness -ul, pozitivitatea ¸ si reliability -ul. Intersect ¸ia tuturor acestor seturi de caracteristici
reprezint˘ a spat ¸iul de solut ¸ii permisibile. A¸ sadar problema este redus˘ a la a g˘ asi intersect ¸ia
seturilor de constrˆ angeri. Pentru a g˘ asi o astfel de solut ¸ie, un operator de proiect ¸ie este
aflat pentru fiecare set de constrˆ angeri. Acest operator proiecteaz˘ a o estimare a imaginii cu
super-rezolut ¸ie asupra setului de constrˆ angeri asociat. Folosind aceast˘ a modalitate iterativ,
se poate obt ¸ine o solut ¸ie bun˘ a la suprafat ¸a intersect ¸iei celor kseturi de constrˆ angeri convexe.
Algoritmul original nu includea ¸ si zgomotul de observare [89]; a¸ sadar a fost ˆ ımbun˘ at˘ at ¸it de
21
mult ¸i alt ¸i cercet˘ atori. Tekalp et al. [94] au extins metoda pentru a ˆ ıncorpora zgomotul. Patti
et al. [75] au dus algoritmul ¸ si mai departe ad˘ augˆ and blur-ul, timpul de diafragm˘ a diferit de
zero, zgomot de senzor ¸ si structuri arbitrare de sampling .
Metode ^ n domeniul frecvent ei
O alt˘ a abordare cunoscut˘ a pentru a obt ¸ine o imagine cu super-rezolut ¸ie este domeniul
frecvent ¸ei [62,100,102]. Chiar prima tehnic˘ a de super-rezolut ¸ie folosit˘ a de Tsai ¸ si Huang [100]
folosit˘ a pe imaginile obt ¸inute prin satelit a fost bazat˘ a pe domeniul frecvent ¸ei. Mult ¸i alt ¸i
cercet˘ atori au extins aceast˘ a metod˘ a pentru a construi altele. Aceast˘ a metod˘ a presupune
transformarea imaginilor cu rezolut ¸ie sc˘ azut˘ a ˆ ın domeniul Transformatei Fourier Discrete
(DFT), iar imaginea cu super-rezolut ¸ie este estimat˘ a ˆ ın acest domeniu, dup˘ a care este trans-
format˘ a ˆ ınapoi ˆ ın domeniul spat ¸ial.
Tsai ¸ si Huang [100] au presupus c˘ a imaginile de la satelit sunt similare, dar translatate
global ¸ si c˘ a pot fi considerate ca fiind imaginile under-sampled ale unei scene statice necunos-
cut˘ a. Parametrii de translat ¸ie si aliasing sunt folosit ¸i pentru a determina un set de ecuat ¸ii
care leag˘ a DFT a imaginilor cu rezolut ¸ie sc˘ azut˘ a de transformata Fourier continu˘ a (CFT)
a imaginii cu super-rezolut ¸ie necunoscut˘ a ( Fy=ϕFx;Fyeste DFT a imaginii cu rezolut ¸ie
sc˘ azut˘ a y, iarFxeste CFT a imaginii cu super-rezolut ¸ie necunoscute x) [9]. Matricea sistemu-
luiϕeste format˘ a din informat ¸ia de mi¸ scare dintre imaginile cu rezolut ¸ie sc˘ azut˘ a. A¸ sadar
problema super-rezolut ¸iei este redus˘ a la a afla CFT a imaginii cu super-rezolut ¸ie cu ajutorul
DFT a imaginilor cu rezolut ¸ie sc˘ azut˘ a ¸ si a matricei sistemului. Aceast˘ a problem˘ a simpli-
ficat˘ a este rezolvat˘ a de obicei cu ajutorul metodei celor mai mici p˘ atrate [74]. Blur-ul ¸ si
zgomotul ˆ ın timpul obt ¸inerii imaginii au fost ignorate ˆ ın studiul lui Huang si Tsai, ˆ ıns˘ a Kim
et al. [51] ¸ si-au extins munca luˆ and in calcul ¸ si aceste efecte. Metoda corel˘ arii este dese-
ori folosit˘ a pentru a descoperi parametrii de mi¸ scare ˆ ın domeniul frecvent ¸ei. Parametrii de
mi¸ scare sunt determinat ¸i datorit˘ a faptului c˘ a imaginile mutate difer˘ a ˆ ın domeniul frecvent ¸ei
doar printr-o schimbare de faz˘ a [62,102]. Schimbarea de faz˘ a dintre cele dou˘ a imagini poate
fi obt ¸inut˘ a prin corelarea acestora. Folosind corelarea fazelor atˆ at rotat ¸ia cˆ at ¸ si scalarea
imaginii pot fi transformate ˆ ın mi¸ sc˘ ari verticale sau orizontale. Pentru a minimiza erorile
datorit˘ a aliasing -ului se pot folosi doar anumit ¸i coeficient ¸i Fourier discret ¸i [102]. Dup˘ a ce se
estimeaz˘ a parametrii de ˆ ınregistrare, imaginile cu rezolut ¸ie sc˘ azut˘ a sunt combinate conform
relat ¸iei dintre coeficient ¸ii transformatei Fourier discrete ai imaginilor cu rezolut ¸ie sc˘ azut˘ a ¸ si
imaginea cu super-rezolut ¸ie necunoscut˘ a. Avantajul metodei domeniului de frecvent ¸˘ a este
c˘ a aceasta este u¸ sor de aplicat ¸ si functioneaz˘ a mai bine ˆ ımpotriva aliasing -ului decˆ at metoda
domeniului spat ¸ial. Dezavantajul acesteia este c˘ a se limiteaz˘ a la mi¸ scarea global˘ a, a¸ sadar
funct ¸ioneaz˘ a doar pentru translat ¸ii ¸ si rotat ¸ii planare [102]. Mai tˆ arziu transformata Fourier
esteˆ ınlocuit˘ a de Transformata Cosinus Discret˘ a (DCT) [81] ¸ si Transformata Wavelet Discret˘ a
22
(DWT) [70].
Rhee ¸ si Kang [81] au modificat metoda bazat˘ a pe transformata Fourier pentru a folosi
tehnici regularizate de deconvolut ¸ie folosind DCT. Aceast˘ a metod˘ a funct ¸ioneaz˘ a chiar ¸ si
pentru cazurile cu informat ¸ie despre sub-pixeli insuficient˘ a sau cele gre¸ sit formulate. DCT
folose¸ ste doar coeficient ¸i reali, a¸ sadar este mai put ¸in costisitoare din punct de vedere compu-
tat ¸ional decˆ at domeniul Fourier. Nguyen ¸ si Milanfar [70] au folosit interpolare wavelet urmat˘ a
de metoda de restaurare pentru super-rezolut ¸ie. Ace¸ stia au calculat mai ˆ ıntˆ ai coeficient ¸ii de
und˘ a ( wavelet ) ai imaginilor cu rezolut ¸ie sc˘ azut˘ a ¸ si apoi i-au interpolat pentru valorile blu-
rate ˆ ın puncte de pe imaginea cu super-rezolut ¸ie. Prin deconvolut ¸ia valorilor interpolate cu
blur-ul cunoscut se poate estima o imagine cu super-rezolut ¸ie. El-Khamy ¸ si asociat ¸ii [30] au
ˆ ınregistrat toate imaginile cu rezolut ¸ie sc˘ azut˘ a direct ˆ ın domeniul wavelet . Dup˘ a ˆ ınregistrare,
coeficient ¸ii wavelet au fost unit ¸i, iar zgomotul a fost ˆ ınl˘ aturat folosind o metod˘ a de regu-
larizare. Metode de interpolare au fost apoi folosite pentru a obt ¸ine coeficient ¸ii wavelet ai
imaginii cu super-rezolut ¸ie, iar la sfˆ ar¸ sit cu ajutorul unei transformate inverse wavelet s-a
obt ¸inut imaginea cu super-rezolut ¸ie ˆ ın domeniul spat ¸ial. Chappalli ¸ si Bose [17] au imple-
mentat tehnici software de thresholding pentru a ˆ ındep˘ arta zgomotul asociat coeficient ¸ilor
wavelet . Fermuller ¸ si Ji [46, 47] au descompus coeficient ¸ii wavelet ˆ ın dou˘ a p˘ art ¸i folosind o
schem˘ a de rezolut ¸ii multiple. Acei coeficient ¸i au fost apoi interpolat ¸i, filtrat ¸i ¸ si recombinat ¸i
pentru a obt ¸ine imaginea simulat˘ a. Imaginea final˘ a era obt ¸inut˘ a folosind metoda IBP cu
criterii eficiente de regularizare pentru a elimina zgomotul la fiecare pas. Recent, atent ¸ia
cercet˘ atorilor s-a ˆ ındreptat c˘ atre transformarea contourlet , avantajul acesteia fat ¸˘ a de cea
wavelet fiind c˘ a aceasta poate captura muchiile dintr-o imagine ˆ ın orice direct ¸ie, nu doar
orizontal sau vertical [111].
Metode bazate pe regularizare
Problema obt ¸inerii imaginilor cu super-rezolut ¸ie este una al c˘ arei solut ¸ie nu este unic˘ a, dup˘ a
cum s-a putut observa. O alt˘ a metod˘ a de obt ¸inere a acestor imagini este folosind un termen
de regularizare. [52] Aceast˘ a metod˘ a ˆ ıncorporeaz˘ a cuno¸ stint ¸e anterioare asupra imaginilor
cu rezolut ¸ie ˆ ınalt˘ a pentru a rezolva problema super-rezolut ¸iei. Dou˘ a abord˘ ari principale ale
regulariz˘ arii sunt metodele deterministe ¸ si cele stocastice. Metoda determinist˘ a introduce un
termen al regulariz˘ arii care transform˘ a problema subdeterminat˘ a ˆ ın una corect determinat˘ a.
Imaginea cu rezolut ¸ie ˆ ınalt˘ a Xeste estimat˘ a minimizˆ and urm˘ atoarea funct ¸ie de cost:
X= arg minN∑
k=1∥yk−HkX∥2+λ∥RX∥2(2)
unde λeste constanta de regularizare, iar Reste termenul de regularizare. Metoda celor mai
mici p˘ atrate folose¸ ste constante de netezime ca a priori .ˆIn acest caz Rdevine filtrul high
23
pass ce minimizeaz˘ a cantitatea frecvent ¸elor ˆ ınalte din imaginea obt ¸inut˘ a, iar λcontroleaz˘ a
informat ¸ia din frecvent ¸ele ˆ ınalte. O valoare mai mare pentru λpoate netezi imaginea recon-
struit˘ a, lucru ce poate fi benefic dac˘ a sunt disponibile put ¸ine imagini cu rezolut ¸ie sc˘ azut˘ a sau
acestea cont ¸in mult zgomot. Pe de alt˘ a parte, valori mici ale lui λdetermin˘ a obt ¸inerea unei
imagini ce poate cont ¸ine zgomot, lucru ce poate fi trecut cu vederea daca sunt disponibile
multe imagini init ¸iale ce au pe deasupra si putin zgomot. [74] Estimatorul celor mai mici
p˘ atrate Tikhonov regularizat folose¸ ste norma l2a derivatei de ordin doi a reconstruct ¸iei ima-
ginii cu rezolut ¸ie ˆ ınalt˘ a ca ¸ si termen de regularizare. [78] Norma l2nu asigur˘ a o solut ¸ie unic˘ a.
Farsiu et al. [31] au c˘ autat o alternativ˘ a ˆ ın minimizarea normei l1pentru obt ¸inerea super-
rezolut ¸iei mai rapid. Kim ¸ si Bose [51] propun un algoritm recursiv ponderat bazat pe cele
mai mici p˘ atrate pentru obt ¸inerea super-rezolut ¸iei. Ponderea depinde de cuno¸ stint ¸ele deja
acumulate asupra imaginii, algoritmul oferind o pondere mai mare imaginilor cu rezolut ¸ie
sc˘ azut˘ a ce au SNR mare. Avˆ and ponderi diferite problema devine una general˘ a de estimare
a celor mai mici p˘ atrate. Tot ce mai r˘ amˆ ane de f˘ acut este interpolarea ¸ si restaurarea ˆ ıntr-o
imagine cu super-rezolut ¸ie.
Metoda stocastic˘ a [4,7,18,55,93,97,99,105,106], mai ales metoda Maximum A-Posteriori
(MAP), este cunoscut˘ a deoarece ofer˘ a o metod˘ a convenabil˘ a ¸ si flexibil˘ a de a folosi informat ¸ie
a priori ¸ si deoarece creeaz˘ a o leg˘ atur˘ a puternic˘ a ˆ ıntre imaginile observate ¸ si cea cu rezolut ¸ie
ˆ ınalt˘ a necunoscut˘ a. Metoda const˘ a ˆ ın g˘ asirea estim˘ arii MAP a imaginii cu rezolut ¸ie ˆ ınalt˘ a
pentru care o probabilitate posteriori P(X|Y) este maxim˘ a [97].
ˆXMAP= arg min
XP(X|Y) (3)
Folosind teorema lui Bayes, ecuat ¸ia 3 poate fi rescris˘ a dup˘ a cum urmeaz˘ a [97]:
ˆXMAP= arg min
X[logP(Y|X)] + log P(X) (4)
unde P(Y|X) este funct ¸ia de probabilitate, iar P(X) este prior .Markov Random Field
(MRF) este deseori folosit ca ¸ si model priori , iar funct ¸ia de densitate de probabilitate (PDF)
a zgomotului este folosit˘ a pentru a determina funct ¸ia de probabilitate. Imaginea cu rezolut ¸ie
ˆ ınalt˘ a este obt ¸inut˘ a aflˆ and rezultatul ecuat ¸iei 4.
Printre cele mai folosite modele pentru imaginea priori se num˘ ar˘ a norma TV [4], norma
l1a gradient ¸ilor orizontal ¸ si vertical [105], norma Simultaneous Autoregressive (SAR) [106],
modelul MRF Gaussian [39, 97], modelul MRF Huber [18], modelul MRF ce cont ¸ine o dis-
continuitate adaptiv˘ a [93], modelul non-stat ¸ionar Gaussian pe doua nivele [7] ¸ si modelul
Conditional Random Field (CRF) [55]. Un caz aparte al MAP, ˆ ın care informat ¸ia priori a
imaginii cu rezolut ¸ie ˆ ınalt˘ a nu este dat˘ a se nume¸ ste Maximum Likelihood Estimation (MLE).
Tom ¸ si Katsaggelos [99] au luat ˆ ın considerare folosirea acestei metode pentru obt ¸inerea
super-rezolut ¸iei, ˆ ıns˘ a deoarece este necesar˘ a informat ¸ie a priori datorit˘ a solut ¸iei sistemului
subdeterminat, r˘ amˆ ane o metod˘ a rar folosit˘ a.
24
ˆIn super-rezolut ¸ia multi-frame , mai multe imagini sunt combinate pentru a obt ¸ine o sin-
gur˘ a imagine cu rezolut ¸ie ˆ ınalt˘ a. ˆIn timpul contopirii acestor imagini cu rezolut ¸ie sc˘ azut˘ a
metode de aproximare a pixelilor sunt folosite, iar acestea pot blura (estompa) imaginea fi-
nal˘ a. A¸ sadar sunt necesare metode de eliminare a blur-ului din imagini [74,97]. Aproximarea
nucleului de blur(blur kernel ) are un rol important ˆ ın obt ¸inerea super-rezolut ¸iei, ˆ ıns˘ a multe
metode folosesc un nucleu deja cunoscut pentru simplitate. Acest nucleu deja ¸ stiut poate
ajuta la estimare unei imagini cu rezolut ¸ie ˆ ınalt˘ a dintr-un set de imagini cu rezolut ¸ie sc˘ azut˘ a,
ˆ ıns˘ a pentru imagini obt ¸inute din practic˘ a, ce au alt blur de mi¸ scare, nucleul de blur poate
fi total diferit [60]. Pentru estimarea nucleului de blurˆ ın cadrul Bayesian sunt propu¸ si nu-
mero¸ si algoritmi. Liu ¸ si Sun [60] au propus recent o metod˘ a Bayesian˘ a ce calculeaz˘ a simultan
nivelul de zgomot, nucleul de blur,blur-ul de mi¸ scare ¸ si imaginea cu rezolut ¸ie ˆ ınalt˘ a. Un al-
goritm de deconvolut ¸ie oarb˘ a poate fi folosit cˆ and nu avem nicio informat ¸ie despre nivelul de
zgomot sau nucleul de blur. Metodele de deconvolut ¸ie oarb˘ a recupereaz˘ a funct ¸ia de blurring
din imaginile cu rezolut ¸ie sc˘ azut˘ a ¸ si aproximeaz˘ a imaginea cu rezolut ¸ie ˆ ınalt˘ a f˘ ar˘ a informat ¸ii
init ¸iale asupra imaginii originale sau a blur-ului [5,49,86–88]. Sroubek et al. [86] au dezvoltat
un model de deconvolut ¸ie oarb˘ a pe canale multiple pentru super-rezolut ¸ie, unde imaginile cu
rezolut ¸ie sc˘ azut˘ a sunt unite minimizˆ and funct ¸ia de energie E(X, h).
E(X, h) = arg minK∑
k=1∥yk−DHkX∥2+αQ(X) +βR(h) (5)
Primul termen din ecuat ¸ie este termenul de fidelitate, iar ceilalt ¸i doi termeni sunt termeni
de regularizare. Q(X) este termenul folosit pentru netezire, iar R(h) este termenul PSF.
A¸ sadar regularizarea este aplicat˘ a atˆ at ˆ ın domeniul de blur, cˆ at ¸ si ˆ ın cel al imaginii. Bai
¸ si asociat ¸ii [5] au propus o metod˘ a ˆ ın domeniul frecvent ¸ei ce selecteaz˘ a adaptiv parametrul
termenului de regularizare. ˆIn [49,87,88] metode combinate de deconvolut ¸ie oarb˘ a ¸ si estimator
MAP sunt folosite pentru a estima blur-ul, respectiv imaginea cu rezolut ¸ie ˆ ınalt˘ a.
25
5 Super-rezolut ie single-frame
Dup˘ a cum am v˘ azut, o multitudine de algoritmi multi-frame pentru obt ¸inerea super-rezolut ¸iei
au fost dezvoltat ¸i, ˆ ıns˘ a ace¸ stia depind foarte mult de precizia aproxim˘ arii parametrilor de
ˆ ınregistrare [68]. Metodele de ˆ ınregistrare au ˆ ın principal constrˆ angeri cauzate de mi¸ scarea
global˘ a, ˆ ıns˘ a componente diferite ale aceleia¸ si scene pot avea mi¸ sc˘ ari total diferite ˆ ın practic˘ a.
ˆIn aceste cazuri metodele de super-rezolut ¸ie multi-frame nu duc la un rezultat favorabil, uneori
imaginile init ¸iale avˆ and o calitate a informat ¸iei mai bun˘ a decˆ at cele cu super-rezolut ¸iei.
Mai mult decˆ at atˆ at informat ¸iile stocate ˆ ın frecvent ¸ele ˆ ınalte ce sunt pierdute ˆ ın timpul
achizit ¸iei imaginilor nu pot fi recuperate folosind tehnici multi-frame . O metod˘ a alternativ˘ a
este folosirea algoritmilor de super-rezolut ¸ie bazat ¸i pe o singur˘ a imagine.
Figure 6: Super-rezolut ¸ie bazat˘ a pe ˆ ınv˘ at ¸areMajoritatea algoritmilor de super-rezolut ¸ie
bazat ¸i pe o singur˘ a imagine folosesc meca-
nisme de ˆ ınv˘ at ¸are ¸ si sunt numit ¸i algoritmi
de super-rezolut ¸ie bazat ¸i pe ˆ ınv˘ at ¸are. Acest
mecanism de ˆ ınv˘ at ¸are extrage informat ¸ia din
frecvent ¸ele ˆ ınalte pierdut˘ a ˆ ın procesul de
capturare a imaginilor folosind surse externe
(training set ) ¸ si une¸ ste aceast˘ a informat ¸ie
cu imaginile cu rezolut ¸ie sc˘ azut˘ a capturate,
obt ¸inˆ andu-se astfel o imagine cu super-
rezolut ¸ie [111]. Acest set de antrenament
(training set ) este format din un num˘ ar mare
de imagini cu rezolut ¸ie ˆ ınalt˘ a ¸ si versiunea
lor simulat˘ a de imagini cu rezolut ¸ie sc˘ azut˘ a.
Eficient ¸a algoritmilor bazat ¸i pe ˆ ınv˘ at ¸are de-
pinde extrem de mult de aceste imagini aflate
ˆ ın setul de antrenament, a¸ sadar acestea trebuie aleseˆ ın a¸ sa felˆ ıncˆ at s˘ a fie similare cu imaginile
ce urmeaz˘ a a fi capturate ˆ ın practic˘ a ¸ si s˘ a cont ¸in˘ a informat ¸ii de frecvent ¸˘ a ˆ ınalt˘ a [111].
Figura 6 reprezint˘ a o schem˘ a a algoritmilor de super-rezolut ¸ie bazat ¸i peˆ ınv˘ at ¸are. Metodele
de super-rezolut ¸ie bazate pe ˆ ınv˘ at ¸are cuprind urm˘ atoarele trei etape: extragerea caracteris-
ticilor, ˆ ınv˘ at ¸area ¸ si reconstruct ¸ia.
Etapa de extragere a caracteristicilor
Aceast˘ a etap˘ a presupune extragerea caracteristicilor setului de imagini de antrenament dar ¸ si
ale imaginii de test separat. Init ¸ial imaginile sunt segmentate ˆ ın buc˘ at ¸i mai mici ce sunt apoi
redimensionate ¸ si scalate cu ajutorul unor filtre. Buc˘ at ¸ile din imaginea cu rezolut ¸ie ˆ ınalt˘ a
26
¸ si corespondentele lor din imaginea cu rezolut ¸ie sc˘ azut˘ a ce a fost obt ¸inut˘ a sunt grupate
ˆ ın perechi. Apoi caracteristicile buc˘ at ¸ilor din setul de antrenament sunt extrase. Analog,
caracteristicile imaginilor de test sunt extrase. ˆIn acest moment exist˘ a cˆ ateva tehnici de
extragere a caracteristicilor ce au fost dezvoltate de diver¸ si cercet˘ atori. De exemplu, ˆ ın [16,32,
112,113,118] un filtru de schimbare a benzii, pe cˆ andˆ ın [91] sunt folosite atˆ at frecvent ¸eleˆ ınalte
cˆ at ¸ si cele joase ale imaginilor. Asem˘ an˘ ator, obt ¸inerea derivatelor Gaussiene [92], derivatelor
gradientului [6], piramidei Laplaciene [59] ¸ si piramidei Steerable [90] au fost propuse. Mult ¸i
cercet˘ atori au folosit valorile lumiant ¸ei ca f ¸iind cea mai important˘ a parte a muncii lor [8,
21, 35, 41, 64, 71, 84, 108]. Coeficient ¸ii DCT [72], transformarea wavelet [63], transformarea
contourlet [111] ¸ si Principle Component Analysis (PCA) [43] au fost folosite ca ¸ si caracteristici
ˆ ın super-rezolut ¸ie bazat˘ a pe ˆ ınv˘ at ¸are.
Etapa de ^ nv at are
Caracteristicile extrase din setul de antrenament ¸ si cele extrase din imaginile cu rezolut ¸ie
sc˘ azut˘ a capturate sunt egalate (sincronizate) folosind modele de ˆ ınv˘ at ¸are. Asem˘ an˘ ator mod-
elelor de extragere a caracteristicilor, mai multe modele de ˆ ınv˘ at ¸are au fost propuse ˆ ın ultimii
ani. Cele mai cunoscute metode sunt Best Matching [6,41,90,91], MRF [32,63,92,111], Neigh-
bor Embedding [8,15,34,36] ¸ si Sparse Representation [21–25,48,112–114,118,122]. Printre alte
metode mai rar ˆ ıntˆ alnite se num˘ ar˘ a PCA Construction [108], Canonical Correlation Analy-
sis[43], Locally Linear Embedding Construction [16], Content-based Classification ¸ siClass-
specific Predictors [59], Position-patch Construction [64] ¸ si Support Vector Regression [72].
Glasner et al. [35] au introdus o metod˘ a ce combin˘ a super-rezolut ¸ia bazat˘ a pe ˆ ınv˘ at ¸are cu
cea bazat˘ a pe reconstruct ¸ie. Algoritmul de ˆ ınv˘ at ¸are asociaz˘ a caracteristici ale imaginii cu
rezolut ¸ie sc˘ azut˘ a capturate cu cele ale imaginilor cu rezolut ¸ie sc˘ azut˘ a din setul de antre-
nament. Deoarece imaginile cont ¸inute ˆ ın setul de antrenament, respectiv cele cu rezolut ¸ie
sc˘ azut˘ a ¸ si cele cu rezolut ¸ie ˆ ınalt˘ a, sunt organizate ˆ ın perechi, caracteristicile fragmentelor
din imaginile cu rezolut ¸ie ˆ ınalt˘ a ce corespund celor din imaginile cu rezolut ¸ie sc˘ azut˘ a sunt
aplicate imaginii capturate ¸ si sunt alese pentru super-rezolut ¸ie.
Etapa de reconstruct ie
Algoritmii de ˆ ınv˘ at ¸are ¸ si de extragere a caracteristicilor aproximeaz˘ a caracteristicile imag-
inii cu rezolut ¸ie ˆ ınalt˘ a din imaginea capturat˘ a. Aceste caracteristici sunt apoi implemen-
tate asupra fragmentelor din imaginea cu rezolut ¸ie sc˘ azut˘ a pentru a obt ¸ine un fragment cu
rezolut ¸ie ˆ ımbun˘ at˘ at ¸it˘ a. Ultimul pas este de a reuni toate fragmentele ˆ ıntr-o imagine cu super-
rezolut ¸ie [111]. O descriere detaliat˘ a a acestui proces se reg˘ ase¸ ste ˆ ın figura 6. Exist˘ a multe
metode bazate pe ˆ ınv˘ at ¸are dezvoltate pˆ an˘ a acum ˆ ıns˘ a metoda bazat˘ a pe exemple propus˘ a
27
de Kim ¸ si Kwon [53, 54] dep˘ a¸ se¸ ste multe alte metode de ultim˘ a or˘ a. Aceast˘ a metod˘ a se
bazeaz˘ a pe cadrul deja stabilit de Freeman et al. [32] ce stabile¸ ste perechile de fragmente
din imaginile cu rezolut ¸ie ˆ ınalt˘ a, respectiv cele cu rezolut ¸ie sc˘ azut˘ a ˆ ın etapa de antrenament.
ˆIn etapa de ˆ ınv˘ at ¸are fiecare fragment al imaginii cu rezolut ¸ie sc˘ azut˘ a capturat˘ a este com-
parat cu seturile de fragmente ale imaginilor cu rezolut ¸ie sc˘ azut˘ a de antrenament ce erau
deja ˆ ınregistrate ¸ si folosind metoda de c˘ autare al celui mai apropiat vecin se g˘ ase¸ ste cel
mai asem˘ an˘ ator fragment al imaginilor cu rezolut ¸ie sc˘ azut˘ a de antrenament ¸ si se folose¸ ste
imaginea cu rezolut ¸ie ˆ ınalt˘ a asociat˘ a. Totu¸ si, metoda lui Freeman et al. [32] duce deseori
la o imagine cu blurdatorit˘ a algoritmului nearest neighbor . Kim ¸ si Kwon [53] au modificat
aceast˘ a metod˘ a ˆ ınlocuind c˘ autarea celui mai apropiat vecin cu sparse kernel ridge regression .
ˆIn algoritmul lor regresia kernel ridge este folosit˘ a pentru a crea o hart˘ a ˆ ıntre fragmentele
imaginii capturate ¸ si fragmentele perechilor de imagini din setul de antrenament. Aceast˘ a
metod˘ a produce totu¸ si un efect de blur¸ si de rotunjire la frontiere, ˆ ıns˘ a acestea sunt u¸ sor de
eliminat ˆ ın postprocesare [53].
ˆIn ultimii zeci de ani s-au desf˘ a¸ surat studii masive asupra algoritmilor de sparse repre-
sentation .Sparse representation este procedeul de aproximare a unei imagini sau a unui
semnal folosind combin˘ ari liniare a unui set restrˆ ans de semnale elementare numite atomi.
Atomii sunt ale¸ si ori dintr-un set predefinit de funct ¸ii (dict ¸ionar bazat pe analiz˘ a), cum ar fi
Transformarea Discret˘ a Cosinus (DCT), ori ˆ ınv˘ at ¸at ¸i dintr-un set de antrenament (dict ¸ionar
bazat pe ˆ ınv˘ at ¸are). Principalul avantaj al acestor algoritmi este c˘ a coeficient ¸ii reprezent˘ arii
semnalului sunt risipit ¸i, adic˘ a exist˘ a foarte mult ¸i coeficient ¸i ce sunt egali cu zero ¸ si foarte
put ¸ini diferit ¸i de zero. Mai exact, considerˆ and un semnal de timp discret ¸ si finit x∈RN¸ si
un dict ¸ionar complet D∈RNK;N < K . Scopul este s˘ a reprezent˘ am semnalul xfolosind
dict ¸ionarul Dˆ ın a¸ sa fel ˆ ıncˆ at eroarea reprezent˘ arii semnalului ∥Dα−x∥2, unde αeste vec-
torul sparse representation , este minimizat˘ a. Pentru a reprezenta un semnal folosind sparse
representation este necesar s˘ a se rezolve urm˘ atoarea problem˘ a de optimizare [113].
arg min
∥α∥0,unde x=Dα (6)
Sparse representation a devenit un domeniu major de cercetare ˆ ın procesarea semnalelor.
Folosind aceast˘ a metod˘ a cˆ at ¸iva cercet˘ atori au propus algoritmi bazat ¸i pe ˆ ınv˘ at ¸are pentru
obt ¸inerea super-rezolut ¸iei [21–25,48,112–114,118,122]. Super-rezolut ¸ia bazat˘ a pe sparse re-
presentation calculeaz˘ a aproximarea sparse a fragmentului din imaginea cu rezolut ¸ie sc˘ azut˘ a
capturat˘ a ¸ si folose¸ ste coeficient ¸ii aproxim˘ arii pentru a estima fragmentul cu rezolut ¸ie ˆ ınalt˘ a.
Aceast˘ a metod˘ a folose¸ ste dou˘ a dict ¸ionare Dh¸ siDlcompletate concomitent din fragmente
cu rezolut ¸ie ˆ ınalt˘ a ¸ si sc˘ azut˘ a. Exist˘ a o necesitate de a accentua similaritatea codific˘ arii
sparse dintre fragmentul cu rezolut ¸ie sc˘ azut˘ a ( j=Dlβ) ¸ si cel cu rezolut ¸ie ˆ ınalt˘ a ( l=Dhα).
Dict ¸ionarul extras din fragmentul cu rezolut ¸ie ˆ ınalt˘ a, Dh, este aplicat cu reprezentarea sparse
a fragmentului cu rezolut ¸ie sc˘ azut˘ a ( Dhβ) pentru a obt ¸ine fragmentul cu super-rezolut ¸ie.
28
Zeyde et al. [118] au aplicat algoritmul de ˆ ınv˘ at ¸are a dict ¸ionarului K-SVD pentru a afla
perechea rezolut ¸ie ˆ ınalt˘ a – rezolut ¸ie sc˘ azut˘ a din dict ¸ionar, lucru ce a m˘ arit performant ¸a
acestei metode.
Folosind metoda sparse representation , fragmentul final cu super-rezolut ¸ie al imaginii este
generat din combinarea coeficient ¸ilor sparse ai fragmentului cu rezolut ¸ie sc˘ azut˘ a ¸ si dict ¸ionarul
rezolut ¸iei ˆ ınalte. Eficacitatea metodei depinde atˆ at de coeficient ¸ii sparse ai imaginii cu
rezolut ¸ie sc˘ azut˘ a cˆ at ¸ si de dict ¸ionarul rezolut ¸iei ˆ ınalte [96]. Mult ¸i cercet˘ atori au propus
noi algoritmi pentru a estima mai bine dict ¸ionarul rezolut ¸iei ˆ ınalte ¸ si coeficient ¸ii sparse ai
imaginii cu rezolut ¸ie sc˘ azut˘ a. Zhang ¸ si asociat ¸ii [122] au propus o metod˘ a a ˆ ınv˘ at ¸˘ arii unui
dict ¸ionar dual ce const˘ aˆ ınˆ ınv˘ at ¸area dict ¸ionarului principal ¸ siˆ ınv˘ at ¸area dict ¸ionarului rezidual
pentru a recupera informat ¸ia frecvent ¸elor ˆ ınalte pentru rezolut ¸ia ˆ ınalt˘ a principal˘ a ¸ si rezolut ¸ia
ˆ ınalt˘ a rezidual˘ a. Detalii adit ¸ionale pot fi ad˘ augate imaginii cu rezolut ¸ie sc˘ azut˘ a folosind pro-
cesul de ˆ ınv˘ at ¸are double-channel . Deoarece imaginea cu super-rezolut ¸ie final˘ a este obt ¸inut˘ a
din coeficient ¸ii sparse ai imaginii cu rezolut ¸ie sc˘ azut˘ a ¸ si dict ¸ionarul rezolut ¸iei ˆ ınalte ˆ ınv˘ at ¸at,
randamentul metodei depinde atˆ at de coeficient ¸i cˆ at ¸ si de dict ¸ionar. Yang et al. [114] au
redus timpul de execut ¸ie a super-rezolut ¸iei prin sparse representation folosind un model de
ˆ ınv˘ at ¸are prin ret ¸ea neural˘ a pentru interferent ¸˘ a sparse rapid˘ a ¸ si procesarea selectiv˘ a a carac-
teristicilor vizuale proeminente. Folosind metodele analitice, dar ¸ si pe cele bazate peˆ ınv˘ at ¸are,
Kanakaraj ¸ si Kathiravan [48] au perfect ¸ionat metoda de ˆ ınv˘ at ¸are a dict ¸ionarului.
Dong et al. [24] au propus o metod˘ a de sparse representation bazat˘ a pe grupare, numit˘ a
Adaptive Sparse Domain Selection (ASDS) pentru a ˆ ımbun˘ at˘ at ¸i dict ¸ionarul. Aceast˘ a metod˘ a
presupune adunarea fragmentelor imaginiiˆ ın mai multe grupuri, iar un sub-dict ¸ionar compact
este ˆ ınv˘ at ¸at din fiecare grup. Pentru fiecare fragment al imaginii, cel mai bun sub-dict ¸ionar
poate fi ales, ce poate reconstrui imaginea mai bine decˆ at un dict ¸ionar global. ˆIntr-un alt
studiu Dong et al. [25] au propus interpolarea imaginilor bazat˘ a pe sparse representation
care ˆ ıncorporeaz˘ a auto-similarit˘ at ¸ile nelocale ale imaginii ˆ ın modelul sparse representation .
Termenul de auto-similaritate se refer˘ a la similaritatea valorilor pixelilor din imagine sau a
structurii acestora ˆ ın diverse locuri din imagine. Algoritmul include un model autoregresiv
nelocal ca un nou termen de fidelitate ˆ ın metoda sparse representation , lucru ce reduce
coerent ¸a dintre dict ¸ionare ¸ si face metoda mult mai eficient˘ a. Dong ¸ si asociat ¸ii nu numai
c˘ a au estimat un dict ¸ionar al rezolut ¸iei ˆ ınalte mai bun pentru fiecare fragment al imaginii,
dar au ¸ si folosit auto-similaritatea nelocal˘ a a imaginii pentru a obt ¸ine o aproximare bun˘ a a
coeficient ¸ilor sparse representation ai imaginii cu rezolut ¸ie sc˘ azut˘ a. Recent, Dong et al. au
propus dou˘ a noi metode pentru extragerea coeficient ¸ilor sparse dintr-o imagine cu rezolut ¸ie
sc˘ azut˘ a cˆ at mai apropiat˘ a posibil de imaginea original˘ a folosind constrˆ angeri de diminuare
(sparsity constraints ) nelocale. Acestea sunt Centralized Sparse Representation (CSR) [22] ¸ si
Nonlocally Centralized Sparse Representation (NCSR) [23].
29
6 Comparat ie a performant ei ^ ntre diferite tehnici de
rezolut ie
Metode de m asurare si optimizare a calit at ii imaginii
Pentru a compara performant ¸a metodelor de super-rezolut ¸ie, Peak-SNR (PSNR) ¸ si Similari-
tatea Structural˘ a (SSIM) dintre imaginea cu super-rezolut ¸ie aproximat˘ a ¸ si cea original˘ a sunt
calculate. PSNR-ul este calculat folosind Mean Square Error (MSE), ce este eroarea medie
dintre imaginea original˘ a ¸ si cea obt ¸inut˘ a prin super-rezolut ¸ie. Fie o imagine m×ncu super-
rezolut ¸ie notat˘ a ˆX(i, j) ¸ si imaginea original˘ a X(i, j), MSE ¸ si PSNR sunt definite dup˘ a cum
urmeaz˘ a:
MSE =1
mnm 1∑
i=0n 1∑
j=0[X(i, j)−ˆX(i, j)]2(7)
PSNR = 20 log10(L√
MSE)
(8)
Index-ul SSIM calculeaz˘ a similaritatea dintre imaginea original˘ a ¸ si cea cu super-rezolut ¸ie
[109]. Acesta ia ˆ ın considerare lumiant ¸a, contrastul ¸ si schimb˘ arile structurale dintre cele dou˘ a
imagini. Index-ul SSIM este calculat dup˘ a cum urmeaz˘ a:
SSIM (x,ˆx) =(2µxµ^x+c1)(2σx^x+c2)
(µ2
x+µ2
^x+c1)(σ2
x+σ2
^x+c2)(9)
unde µx¸ siµ^xsunt mediile, iar σx¸ siσ^xsunt deviat ¸iile standard ale imaginilor original˘ a ¸ si
cea cu super-rezolut ¸ie, σx^xeste covariant ¸a lui X¸ siˆX, c 1, c2sunt constante. SSIM m˘ asoar˘ a
similaritatea dintre dou˘ a imagini. Cˆ and imaginea cu super-rezolut ¸ie este foarte aproape de
cea original˘ a, valoarea SSIM-ului se apropie de 1.
30
7 Super-rezolut ie folosind Sparse representation
Recuperarea semnalului bazat a pe reprezentare sparse
Problema ˆ ın obt ¸inerea unei imagini cu rezolut ¸ie ˆ ınalt˘ a dintr-o imagine cu rezolut ¸ie sc˘ azut˘ a
este subiectul acestei lucr˘ ari. Similar metodelor bazate pe ˆ ınv˘ at ¸are prezentate anterior,
principalele surse de informat ¸ie sunt fragmentele imaginii capturate, ˆ ıns˘ a ˆ ın loc s˘ a lucr˘ am
cu perechile de fragmente obt ¸inute din imaginile cu rezolut ¸ie sc˘ azut˘ a ¸ si cele cu rezolut ¸ie
ˆ ınalt˘ a [112], abord˘ am o reprezentare compact˘ a a acestor perechi pentru informat ¸ia a pri-
ori, ˆ ımbun˘ at˘ at ¸ind ˆ ın acest fel timpul de execut ¸ie. Aceast˘ a abordare este propus˘ a datorit˘ a
descoperirilor f˘ acute ˆ ın cercetarea semnalelor sparse ce dovede¸ ste c˘ a se pot obt ¸ine relat ¸ii de
liniaritare ˆ ıntre semnalele rezolut ¸iei ˆ ınalte folosind proiect ¸iile lor cu rezolut ¸ie sc˘ azut˘ a [12,26].
FieD∈RnKun dict ¸ionar complet cu Ksurse ¸ si un semnal x∈Rnce poate fi reprezentat
ca o combinat ¸ie liniar˘ a sparse ce respect˘ a D. Adic˘ a semnalul xpoate fi scris ca x=Dα0,
unde α0∈RKeste un vector cu foarte put ¸ine elemente ( ≪K) nenule. ˆIn practic˘ a se poate
observa un set limitat de m˘ asur˘ atori yale lui x:
y=Lx=LDα0, (10)
unde L∈Rkn, cu k < n , este matricea de proiect ¸ie. ˆIn contextul super-rezolut ¸iei
prezentat, xeste o imagine cu rezolut ¸ie ˆ ınalt˘ a (sau un fragment de imagine), iar yeste
corespondenta sa cu rezolut ¸ie sc˘ azut˘ a. Dac˘ a dict ¸ionarul Deste complet, ecuat ¸ia x=Dα
este subdeterminat˘ a pentru coeficient ¸ii αnecunoscut ¸i. Ecuat ¸ia y=LDαeste cu atˆ at mai
mult subdeterminat˘ a. Totu¸ si, sub condit ¸ii favorabile, solut ¸ia sparse α0a acestei ecuat ¸ii va fi
unic˘ a. Mai mult decˆ at atˆ at, dac˘ a Dsatisface o condit ¸ie de izometrie potrivit˘ a, atunci pentru
o varietate de matrici L, orice reprezentare liniar˘ a a unui fragment cu rezolut ¸ie ˆ ınalt˘ a x, ˆ ın
concordant ¸˘ a cu Dpoate fi recuperat (aproape) perfect din fragmentul cu rezolut ¸ie sc˘ azut˘ a a
imaginii [26,80].
Reprezentarea sparse a fost aplicat˘ a cu succes ˆ ın multe alte probleme inverse ˆ ın proce-
sarea imaginilor, cum ar fi eliminarea zgomotului [29] ¸ si restaurarea imaginilor [65], deseori
ˆ ımbun˘ at˘ at ¸ind cele mai noi metode. De exemplu, ˆ ın [29], autorii folosesc algoritmul K-SVD [1]
pentru a ˆ ınv˘ at ¸a un dict ¸ionar complet din fragmentele unor imagini naturale ¸ si s˘ a ˆ ıl aplice cu
succes ˆ ın problema elimin˘ arii zgomotului din imagini. ˆIn metoda prezentat˘ a ˆ ın aceast˘ a lu-
crare, nu se calculeaz˘ a direct reprezentarea sparse a fragmentului cu rezolut ¸ie ˆ ınalt˘ a. Metoda
presupune folosirea a dou˘ a dict ¸ionare cuplate, Dhpentru fragmente cu rezolut ¸ie ˆ ınalt˘ a, iar
Dlpentru fragmente cu rezolut ¸ie sc˘ azut˘ a. Reprezentarea sparse a unui fragment cu rezolut ¸ie
sc˘ azut˘ a, ˆ ın ceea ce prive¸ ste dict ¸ionarul Dl, o s˘ a fie folosit˘ a direct pentru a recupera frag-
mentul cu rezolut ¸ie ˆ ınalt˘ a corespunz˘ ator din Dh. Se poate obt ¸ine o solut ¸ie local˘ a consis-
tent˘ a dac˘ a fragmentele imaginii sunt suprapuse ¸ si o condit ¸ie ca zonele ce se suprapun din
31
fragmentele cu super-rezolut ¸ie s˘ a se potriveasc˘ a este impus˘ a. Spre deosebire de algoritmul
K-SVD, se ˆ ıncearc˘ a ˆ ınv˘ at ¸area celor dou˘ a dict ¸ionare ˆ ıntr-un mod probabilistic similar cu cel
prezentat ˆ ın [57]. Pentru a impune ca perechile de fragmente ale imaginilor sa aib˘ a ace-
lea¸ si reprezent˘ ari sparse ce respect˘ a Dh¸ siDl, cele dou˘ a dict ¸ionare sunt ˆ ınv˘ at ¸ate simultan,
concatenˆ andu-le folosind normalizarea. Dict ¸ionarele compacte ˆ ınv˘ at ¸ate vor fi aplicate atˆ at
asupra unor imagini generale, cˆ at ¸ si asupra imaginilor faciale pentru a demonstra eficient ¸a
acestei metode. Comparativ cu metodele bazate pe fragmente, acest algoritm are nevoie
doar de cele dou˘ a dict ¸ionare compacte ˆ ınv˘ at ¸ate, ˆ ın loc de o baz˘ a de date cu fragmente de
antrenament masiv˘ a. Calculul, bazat ˆ ın mare pe programare liniar˘ a sau optimizare convex˘ a
este mult mai eficient ¸ si scalabil, fat ¸˘ a de [16, 32, 92]. Recuperarea reprezent˘ arii sparse este
f˘ acut˘ a folosind dict ¸ionarul rezolut ¸iei sc˘ azute, dict ¸ionarul rezolut ¸iei ˆ ınalte fiind folosit pentru a
calcula imaginea cu rezolut ¸ie ˆ ınalt˘ a final˘ a. Reprezentarea sparse calculat˘ a selecteaz˘ a adaptiv
cele mai relevante baze ale fragmentelor din dict ¸ionar, ce reprezint˘ a cˆ at mai bine fragmentul
cu rezolut ¸ie sc˘ azut˘ a ce trebuie procesat. Aceast˘ a abordare duce la o performant ¸˘ a ridicat˘ a,
atˆ at calitativ cˆ at ¸ si cantitativ ¸ si genereaz˘ a texturi mai clare ¸ si frontiere mai evident ¸iate, com-
parat cu metode [16] care folosesc un num˘ ar fix de vecini apropiat ¸i. ˆIn plus, reprezentarea
sparse este eficient˘ a ˆ ımpotriva zgomotului de imagine [29], a¸ sadar acest algoritm elimin˘ a ¸ si
zgomotul, pe cˆ and alte metode nu pot obt ¸ine super-rezolut ¸ia ¸ si elimina zgomotul ˆ ın acela¸ si
timp.
Notat ii
Sunt notate cu X¸ siYimaginile cu rezolut ¸ie ˆ ınalt˘ a, respectiv cele cu rezolut ¸ie sc˘ azut˘ a, iar
cux¸ siyfragmentele cu rezolut ¸ie ˆ ınalt˘ a, respectiv cele cu rezolut ¸ie sc˘ azut˘ a. Se folose¸ ste D
pentru a reprezenta dict ¸ionarul pentru codarea sparse , iarDheste dict ¸ionarul fragmentelor
cu rezolut ¸ie ˆ ınalt˘ a ¸ si Dlcel al fragmentelor cu rezolut ¸ie sc˘ azut˘ a. Literele mici ˆ ıngro¸ sate
reprezint˘ a vectori. Literele mici neˆ ıngro¸ sate reprezint˘ a scalari. Literele mari neˆ ıngro¸ sate
reprezint˘ a matrici, de exemplu Seste folosit˘ a ca matrice de scalare.
Constr^ angeri ale super-rezolut iei
Problema super rezolut ¸iei este: dat˘ a fiind o imagine cu rezolut ¸ie sc˘ azut˘ a Y, s˘ a se recupereze
o imagine Xcu o rezolut ¸ie mai ridicat˘ a al aceluia¸ si cadru. Dou˘ a constrˆ angeri sunt formulate
pentru a ajuta la rezolvarea acestei probleme: 1) constrˆ angerea de reconstruct ¸ie, ce impune ca
imaginea Xrecuperat˘ a s˘ a fie ˆ ın concodrant ¸˘ a cu imaginea de intrare Y¸ si s˘ a respecte modelul
observat ¸ional al imaginii; iar 2) sparsity prior , ce presupune ca fragmentele cu rezolut ¸ie ˆ ınalt˘ a
s˘ a fie reprezentate sparse ˆ ıntr-un dict ¸ionar complet ales ¸ si c˘ a reprezent˘ arile lor sparse pot fi
recuperate din imaginea original˘ a a c˘ arei rezolut ¸ie este sc˘ azut˘ a.
32
Constr^ angerea de reconstruct ie
Imaginea cu rezolut ¸ie sc˘ azut˘ a observat˘ a Yeste o versiune scalat˘ a ¸ si estompat˘ a a imaginii cu
rezolut ¸ie ˆ ınalt˘ a X:
Y=SHX. (11)
Aici, Hreprezint˘ a un filtru de estompare ( blur), iar Seste operatorul de scalare.
Problema super-rezolut ¸iei este totu¸ si una subdeterminat˘ a , deoarece pentru o imagine
primit˘ a ca intrare Y, exist˘ a o infinitate de imagini cu rezolut ¸ie ˆ ınalt˘ a Xce satisfac con-
strˆ angerea de mai sus. Pentru a regulariza problema folosim prior -ul urm˘ ator asupra frag-
mentelor xdinX.
Sparsity prior
Fragmentele xale imaginii cu rezolut ¸ie ˆ ınalt˘ a Xpot fi reprezentate ca o combinat ¸ie liniar˘ a
sparse ˆ ıntr-un dict ¸ionar Dhformat din fragmente cu rezolut ¸ie ˆ ınalt˘ a extrase din imagini de
antrenament:
x≈Dhαpentru α∈RKcu∥α∥0≪K. (12)
Reprezentarea sparse αeste obt ¸inut˘ a reprezentˆ and fragmentele yale imaginii de intrare
Y, respectˆ and dict ¸ionarul rezolut ¸iei sc˘ azute Dl, antrenat simultan cu Dh.
Aceast˘ a metod˘ a poate fi aplicat˘ a atˆ at asupra imaginilor generale cˆ at ¸ si asupra celor faciale.
Pentru super-rezolut ¸ia imaginilor generale, problema este ˆ ımp˘ art ¸it˘ a ˆ ın dou˘ a p˘ art ¸i. Prima,
dup˘ a cum este sugerat de c˘ atre sparsity prior -ul din Ecuat ¸ia 12, este g˘ asirea reprezent˘ arii
sparse pentru fiecare fragment local, respectˆ and compatibilitatea dintre vecini. Apoi, folosind
rezultatul obt ¸inut la primul pas, regulariz˘ am ¸ si perfect ¸ion˘ am ˆ ıntreaga imagine folosind con-
strˆ angerea de reconstruct ¸ie prezentat˘ a ˆ ın Ecuat ¸ia 11. Aceast˘ a metod˘ a presupune folosirea
unui model local din sparsity prior pentru a recupera frecvent ¸ele ˆ ınalte pierdute ce corespund
detaliilor locale. Modelul global din constrˆ angerea de reconstruct ¸ie este apoi aplicat pentru a
elimina posibilele artefacte provenite din prima etap˘ a ¸ si pentru a face imaginea mai natural˘ a
¸ si consistent˘ a.
Imaginile faciale difer˘ a de cele generale deoarece acestea au o anumit˘ a structur˘ a, a¸ sadar
constrˆ angerile de reconstruct ¸ie sunt mai eficiente pe un astfel de spat ¸iu. Pentru super-re-
zolut ¸ie facial˘ a cei doi pa¸ si prezentat ¸i mai sus sunt inversat ¸i pentru a profita de avantajul
oferit de structura fet ¸ei. Mai ˆ ıntˆ ai este g˘ asit un subspat ¸iu potrivit pentru fet ¸ele umane ¸ si
sunt aplicate constrˆ angerile de reconstruct ¸ie pentru a recupera o imagine cu o rezolut ¸ie medie.
Apoi detaliile locale sunt recuperate folosind sparsity prior -ul pentru fragmentele imaginii.
33
Super-rezolut ia imaginilor generale folosind Sparsity
Modelul local folosind reprezentarea sparse
Asem˘ an˘ ator metodelor bazate pe fragmente, algoritmul propus presupune obt ¸inerea unui
fragment cu rezolut ¸ie ˆ ınalt˘ a dintr-un fragment cu rezolut ¸ie sc˘ azut˘ a ce apart ¸ine imaginii cap-
turate. Pentru aceast˘ a metod˘ a sunt necesare dou˘ a dict ¸ionare Dh¸ siDlce sunt completate
simultan ¸ si au aceea¸ si reprezentare sparse pentru fiecare pereche de fragmente cu rezolut ¸ie
ˆ ınalt˘ a, respectiv sc˘ azut˘ a. Se calculeaz˘ a valoarea medie a pixelilor pentru fiecare fragment,
astfel ˆ ıncˆ at dict ¸ionarul s˘ a reprezinte o anumit˘ a textur˘ a ¸ si nu o intensitate absolut˘ a. ˆIn pro-
cesul de reconstruct ¸ie valoarea medie pentru fiecare fragment al imaginii cu rezolut ¸ie ˆ ınalt˘ a
este obt ¸inut˘ a folosind versiunea cu rezolut ¸ie sc˘ azut˘ a a aecstuia.
Pentru fiecare fragment al imaginii capturate yse g˘ ase¸ ste o reprezentare sparse ce este
ˆ ın concordant ¸˘ a cu dict ¸ionarul Dl. Pentru obt ¸inerea fragmentului cu rezolut ¸ie ˆ ınalt˘ a x, cores-
pondentul cu rezolut ¸ie ˆ ınalt˘ a al acestuia, ce poate fi g˘ asit ˆ ın dict ¸ionarul Dheste aflat. Pro-
blema g˘ asirii unei reprezent˘ ari sparse a luiypoate fi formulat˘ a dup˘ a cum urmeaz˘ a:
min∥α∥0a.ˆ ı.∥FDlα−Fy∥2
2≤ϵ, (13)
unde Feste un operator (liniar) de extragere a caracteristicilor. Principalul obiectiv al
luiFeste de a oferi o constant˘ a ce arat˘ a cˆ at de bine este aproximat yde c˘ atre coeficient ¸ii α.
ˆIn mod normal se caut˘ a un αce satisface∥Dlα−y∥2≤ϵ, ˆ ıns˘ a pentru super-rezolut ¸ie este
mai eficient s˘ a ˆ ınlocuim norma 2 cu o norm˘ a p˘ atrat˘ a ∥·∥ FTFce elimin˘ a erorile de frecvent ¸˘ a
ˆ ınalt˘ a proeminente. Alegerea lui Fva fi discutat˘ a ˆ ın una din sect ¸iunile ce urmeaz˘ a. De¸ si
problema optimiz˘ arii prezentat˘ a ˆ ın 13 este ˆ ın general una nedeterminat˘ a, rezultate obt ¸inute
de [27, 28] sugereaz˘ a c˘ a, atˆ at timp cˆ at coeficient ¸ii αsunt suficient ¸i de sparse , ace¸ stia pot fi
aflat ¸i minimizˆ and norma l1dup˘ a cum urmeaz˘ a:
min∥α∥1a.ˆ ı.∥FDlα−FY∥2
2≤ϵ. (14)
Multiplicatorii Lagrange ofer˘ a o formul˘ a echivalent˘ a,
min
∥FDlα−Fy∥2
2+λ∥α∥1, (15)
unde λeste termenul ce controleaz˘ a cˆ at de fidel˘ a s˘ a fie aproximarea lui y¸ si cˆ at de sparse
s˘ a fie solut ¸ia. Aceast˘ a metod˘ a de a regulariza regresia liniar˘ a folosind norma l1este cunoscut˘ a
ˆ ın statistic˘ a drept lasoul [98].
Rezolvarea Ecuat ¸iei 15 individual pentru fiecare fragment local al imaginii nu asigur˘ a
compatibilitatea dintre fragmentele vecine. Aceast˘ a compatibilitate este impus˘ a folosind
un algoritm one-pass similar cu cel propus de Freeman [32]. Desigur c˘ a exist˘ a mai multe
metode de a impune aceast˘ a compatibilitate, de exemplu Chang et. al. [16] propun ca valorile
34
regiunilor ce se suprapun s˘ a fie mediate, ceea ce duce desigur la un efect de estompare asupra
imaginii finale. Un alt algoritm este cel greedy one-pass [32] care ofer˘ a aproximativ acelea¸ si
rezultate ca utilizarea modelului MRF complet [33]. Algoritmul propus nu se bazeaz˘ a pe
modelul MRF, dar se aseam˘ an˘ a acestuia datoruit˘ a utiliz˘ arii fragmentelor de imagine cu
rezolut ¸ie ˆ ınalt˘ a reconstruite precedent asupra regiunilor ce se suprapun. Fragmentele sunt
procesate folosind scanarea de tip raster a imaginii, adic˘ a de la stˆ anga la dreapta ¸ si de
sus ˆ ın jos. Ecuat ¸ia 14 este modificat˘ a astfel ˆ ıncˆ at reconstruct ¸ia cu super-rezolut ¸ie Dhαa
fragmentului ys˘ a fie constrˆ ans˘ a pentru a respecta fragmentele cu super-rezolut ¸ie adiacente
obt ¸inute la pasul anterior. Problema optimiz˘ arii ce rezult˘ a din aceste constrˆ angeri este:
min∥α∥1a.ˆ ı.∥FDlα−FY∥2
2≤ϵ1,
∥PDhα−ω∥2
2≤ϵ2, (16)
unde matricea Pextrage regiunea suprapunerii dintre fragmentul curent ¸ si imaginea cu
rezolut ¸ie ˆ ınalt˘ a obt ¸inut˘ a la pasul precedent, iar ωcont ¸ine valorile imaginii cu rezolut ¸ie ˆ ınalt˘ a
reconstruit˘ a anterior ˆ ın zona suprapunerii.
Ecuat ¸ia 16 poate fi reformulat˘ a ca
min
∥˜Dα−˜y∥2
2+λ∥α∥1, (17)
unde ˜D=
FDl
βPDh
¸ si˜y=
Fy
βω
.
Parametrul βcontroleaz˘ a compromisul dintre g˘ asirea unui fragment cu rezolut ¸ie ˆ ınalt˘ a
care este compatibil cu vecinii ¸ si respectarea fragmentului cu rezolut ¸ie sc˘ azut˘ a init ¸ial. Pentru
a simplifica problema, alegem β= 1 ˆ ın toate simul˘ arile. Dat˘ a fiind solut ¸ia optimal˘ a pentru
Ecuat ¸ia 17, α, fragmentul cu super-rezolut ¸ie poate fi calculat ca x=Dhα.
Aplicarea constr^ angerii de reconstruct ie global a
Se poate observa c˘ a Ecuat ¸ia 14 ¸ si Ecuat ¸ia 16 nu necesit˘ a o egalitate strict˘ a ˆ ıntre fragmentul
cu rezolut ¸ie sc˘ azut˘ a y¸ ¸ si reconstruct ¸ia acestuia Dlα. Datorit˘ a acestui fapt ¸ si al zgomotului de
imagine, imaginea cu rezolut ¸ie ˆ ınalt˘ a X0obt ¸inut˘ a prin metoda sparse representation poate
s˘ a nu verifice ˆ ın totalitate constrˆ angerea de reconstruct ¸ie din Ecuat ¸ia 11. Aceast˘ a problem˘ a
este eliminat˘ a proiectˆ and X0asupra spat ¸iului solut ¸iilor SHX=Y, adic˘ a
X= arg min
X∥SHX−Y∥2
2+c∥X−X0∥2
2. (18)
35
Algoritmul 1 : Super-rezolut ¸ie folosind sparse representation
1:Intrare: dict ¸ionarele Dh,Dl¸ si o imagine cu rezolut ¸ie sc˘ azut˘ a Y.
2: Pentru fiecare fragment 3 ×3ydinY, ˆ ıncepˆ and cu colt ¸ul stˆ anga sus, cu o suprapunere
de 1 pixel ˆ ın fiecare direct ¸ie,
◦Se calculeaz˘ a media pixelilor din fragmentul y¸ si o not˘ am cu m.
◦Se rezolv˘ a problema optimiz˘ arii cu ˜D¸ si˜yprezentate ˆ ın Ecuat ¸ia 17:
min ∥˜Dα−˜y∥22+λ∥α∥1.
◦Se genereaz˘ a fragmentul cu rezolut ¸ie ˆ ınalt˘ a x=Dhα.Se pune fragmentul x+m
ˆ ıntr-o imagine cu rezolut ¸ie ˆ ınalt˘ a X0.
3: Sfˆ ar¸ sit.
4: Folosind metoda gradient descent se g˘ ase¸ ste cea mai apropiat˘ a imagine de X0care
satisface constrˆ angerea de reconstruct ¸ie:
X= arg min
X∥SHX−Y∥2
2+c∥X−X0∥2
2.
5:Ie sire: imaginea cu super-rezolut ¸ie X.
Solut ¸ia acestei probleme de optimizare poate fi calculat˘ a folosind metoda gradient descent .
Ecuat ¸ia acestei metode iterative este:
Xt+1=Xt+ν[HTST(Y−SHXt) + (X−X0)], (19)
unde Xteste estimarea imaginii cu rezolut ¸ie ˆ ınalt˘ a dup˘ a titerat ¸ii, iar νeste m˘ arimea
pasului metodei gradient descent .
Imaginea rezultat˘ a Xdup˘ a aplicarea optimiz˘ arii de mai sus este considerat˘ a imaginea
cu super-rezolut ¸ie final˘ a. Aceasta este cˆ at de aproape posibil de imaginea X0¸ si ˆ ın acela¸ si
timp respect˘ a constrˆ angerea de reconstruct ¸ie. Tot acest proces de obt ¸inere a super-rezolut ¸iei
este prezentat ˆ ın Algoritmul 1.
Interpretarea optimiz arii globale
Algoritmul prezentat anterior poate fi perceput ca un caz aparte a unei probleme inverse ˆ ın
procesarea imaginilor, ce folose¸ ste ca ¸ si cadru general sparse representation . Idei asem˘ an˘ atoare
au fost implementate ˆ ın compresia imaginilor, eliminarea zgomotului din acestea [29], sau
36
restaurarea imaginilor [65]. Pe lˆ ang˘ a plasarea problemei prezentate ˆ ıntr-un cadru mai am-
plu, aceste observat ¸ii sugereaz˘ a posibilitateaˆ ımbun˘ at˘ at ¸irii performant ¸elor, o dat˘ a cu cre¸ sterea
complexit˘ at ¸ii computat ¸ionale.
Dac˘ a ar fi disponibile destule resurse computat ¸ionale, ar putea fi aproximate simultan
toate fragmentele dintr-o imagine. Mai mult decˆ at atˆ at, ˆ ıntreaga imagine cu rezolut ¸ie ˆ ınalt˘ a
Xpoate fi tratat˘ a ca o variabil˘ a. ˆIn loc de a impune ca Xs˘ a fie reprodus˘ a perfect de
coeficient ¸ii sparse α, putem penaliza diferent ¸a dintre X¸ si imaginea cu rezolut ¸ie ˆ ınalt˘ a dat˘ a de
ace¸ sti coeficient ¸i, acceptˆ and astfel unele solut ¸ii care nu sunt perfect sparse , dar care respect˘ a
mai bine constrˆ angerea de reconstruct ¸ie. Acest lucru conduce la urm˘ atoarea problem˘ a de
optimizare:
X= arg min
X;fijg{∥SHX−Y∥2
2+λ∑
i;j∥αij∥0
+γ∑
i;j∥Dhαij−PijX∥2
2+τρ(X)}. (20)
Aici, αijreprezint˘ a coeficient ¸ii ce corespund fragmentului ( i, j) din X, iarPijeste o ma-
trice de proiect ¸ie ce selecteaz˘ a fragmentul ( i, j) din X. O funct ¸ie ρ(X) ˆ ınglobeaz˘ a informat ¸ia
prior asupra imaginii cu rezolut ¸ie ˆ ınalt˘ a. Aeast˘ a funct ¸ie poate s˘ a depind˘ a de categoria ima-
ginii sau poate avea o form˘ a general˘ a, ca ¸ si termen al regulariz˘ arii (de exemplu: Huber MRF,
variat ¸ia total˘ a, variat ¸ia total˘ a bilateral˘ a).
Algoritmul 1 poate fi interpretat ca o aproximare eficient˘ a din punct de vedere cumputat ¸ional
a Ecuat ¸iei 20. Pasul sparse representation genereaz˘ a coeficient ¸ii αminimizˆ and suma dintre
al doilea ¸ si al treilea termen din Ecuat ¸ia 20. Termenul sparse∥αij∥0este relaxat la∥αij∥1,
iar termenul fidelut˘ at ¸ii rezolut ¸iei ˆ ınalte ∥Dhαij−PijX∥2este aproximat prin versiunea sa
pentru rezolut ¸ie sc˘ azut˘ a ∥FDlαij−Fyij∥2.
Se poate observa c˘ a atunci cˆ and coeficient ¸ii αsunt fixat ¸i, al treilea termen din Ecuat ¸ia 20
penalizeaz˘ a diferent ¸a dintre imaginea cu super-rezolut ¸ie X¸ si reconstruct ¸ia dat˘ a de coeficient ¸ii:∑
i;j∥Dhαij−PijX∥22≈ ∥X0−X∥22. A¸ sadar, pentru valori mici ale lui γ, pasul back-
projection din Algoritmul 1 minimizeaz˘ a suma dintre primul ¸ si al treilea termen al Ecuat ¸iei
20.
Totu¸ si, Algoritmul 1 nu include ¸ si alt˘ a informat ¸ie prior ˆ ın afar˘ a de cˆ at de sparse sunt
coeficient ¸ii reprezent˘ arii, de exemplu, ρ(X) este absent ˆ ın calculul aproxim˘ arii. ˆIn practic˘ a
se poate observa c˘ a, folosind un dict ¸ionar potrivit, informat ¸ia prior poate fi doar cea legat˘ a
desparsity , aceast˘ a informat ¸ie fiind suficient˘ a pentru a obt ¸ine o super-rezolut ¸ie bun˘ a. Dac˘ a
totu¸ si mai exist˘ a ¸ si alte informat ¸ii legate de semnalul rezolut ¸iei ˆ ınalte acestea pot fi incluse
ˆ ın pasul reconstruct ¸iei globale al algoritmului.
37
Super-rezolut ie facial a folosind Sparsity
ˆImbun˘ at˘ at ¸irea calit˘ at ¸ii ¸ si clarit˘ at ¸ii imaginilor ce cont ¸in fet ¸e este deseori dorit˘ a, ˆ ın special
ˆ ın domeniul supravegherii video, unde mereu distant ¸a dintre camer˘ a ¸ si obiectul (persoana)
de interes este mare. Spre deosebire de super-rezolut ¸ia imaginilor generalizat˘ a prezentat˘ a
anterior, imaginile ce cont ¸in fet ¸e au anumite caracteristici ce fac super-rezolut ¸ia s˘ a fie mai
u¸ sor de obt ¸inut. A¸ sadar, pentru super-rezolut ¸ie facial˘ a se poate lucra cu o imagine de intrare
ce are o rezolut ¸ie chiar mai sc˘ azut˘ a decˆ at cea din cazul general. Ideea de baz˘ a este de a
folosi ˆ ıntˆ ai prior -ul oferit de structura fet ¸ei pentru a aduce imaginea la o rezolut ¸ie medie
rezonabil˘ a, iar apoi implementarea modelului sparse local pentru a recupera detaliile. Mai
exact, solut ¸ia poate fi ˆ ımp˘ art ¸it˘ a ˆ ın dou˘ a etape: 1) modelul global: folosind constrˆ angerea de
reconstruct ¸ie se obt ¸ine o imagine facial˘ a cu o rezolut ¸ie medie, aceast˘ a solut ¸ie este c˘ autat˘ a
doar ˆ ın subspat ¸iul fet ¸elor; iar 2) modelul local: folosind modelul sparse local, se recupereaz˘ a
detaliile imaginii ¸ si se obt ¸ine rezolut ¸ia dorit˘ a.
Modelul factoriz arii matricei nenule (NMF)
Pentru super-rezolut ¸ie, cea mai folosit˘ a metod˘ a pentru modelarea fet ¸ei umane este principal
component analysis (PCA), ce alege un subspat ¸iu de dimensiuni mici ce captureaz˘ a cˆ at mai
mult posibil din valorile variant ¸ei. Totu¸ si, bazele PCA sunt holistice ¸ si tind s˘ a genereze
fet ¸e netede asem˘ an˘ atoare mediei. Mai mult decˆ at atˆ at, deoarece componentele principale ale
reprezent˘ arii pot avea valori negative, reconstruct ¸ia PCA este deseori greu de interpretat.
De¸ si fet ¸ele sunt obiecte cu multe particularit˘ at ¸i, acestea au cˆ ateva p˘ art ¸i comune, cum
ar fi ochii, sprˆ ancenele, nasul, gura ¸ si b˘ arbia. Nonnegative matrix factorization (NMF) [57]
propune reprezentarea semnalelor din imagine ca o combinat ¸ie cumulativ˘ a de caracteristici
locale. Pentru a g˘ asi un astfel de subspat ¸iu, NMF poate fi formulat˘ a ca urm˘ atoarea problem˘ a
de optimizare:
arg min
U;V∥X−UV∥22cuU≥0, V≥0, (21)
unde X∈Rnmeste matricea de date, U∈Rnreste matricea baz˘ a ¸ si V∈Rrmeste
matricea coeficient ¸ilor. ˆIn acest context, Xeste construit˘ a dintr-un set de imagini faciale
de antrenament, a c˘ aror rezolut ¸ie este ˆ ınalt˘ a ¸ si care sunt deja aliniate ca ¸ si vectori coloan˘ a.
Num˘ arul de baze rpoate fi ales ca n∗m/(n+m), num˘ ar care este mai mic decˆ at n¸ sim¸ si
duce la o reprezentare mai compact˘ a. Se poate ar˘ ata c˘ a un minim local al Ecuat ¸iei 21 poate
fi obt ¸inut dac˘ a aplic˘ am urm˘ atoarele reguli:
38
Vij←− Vij(UTX)ij
(UTUV)ij
Uki←− Uki(XVT)ki
(UV VT)ki, (22)
unde 1≤i≤r,1≤j≤m¸ si 1≤k≤n. Matricea baz˘ a Uastfel obt ¸inut˘ a este deseori ¸ si
sparse .
Super-rezolut ie facial a ^ n doi pa si
FieX¸ siYreprezent˘ arile cu rezolut ¸ie ˆ ınalt˘ a, respectiv cu rezolut ¸ie sc˘ azut˘ a ale unei fet ¸e. Se
obt ¸ine YdinXnetezind ¸ si scalˆ and conform Ecuat ¸iei 11. Se dore¸ ste recuperarea imaginii
Xdin imaginea Y.ˆIn acest context se poate considera c˘ a Ya fost deja aliniat˘ a conform
bazei de date de antrenament, ori prin selectarea manual˘ a a punctelor cheie din imagine, ori
folosind un algoritm de detect ¸ie a fet ¸ei, cum ar fi cel folosit ˆ ın [61]. Se poate obt ¸ine solut ¸ia
optimal˘ a pentru Xfolosind criteriul maximum a posteriori (MAP):
X= arg max
Xp(Y|X)p(X). (23)
Aici, p(Y|X) modeleaz˘ a procesul de observare a imaginii, de obicei presupunˆ and existent ¸a
zgomotului Gaussian ˆ ın imaginea Y,p(Y|X) = 1 /Zexp(−∥SHU c−Y∥22/(2∗σ2)) cu Zca
factor de normalizare ¸ si p(X) un prior al imaginii cu rezolut ¸ie ˆ ınalt˘ a X, de obicei sub forma
exponent ¸ial˘ a p(X) = exp(−cρ(X)). Folosind regulile din Ecuat ¸ia 22 putem obt ¸ine matricea
baz˘ a U, ce este compus˘ a din baze sparse . Fie Ω un subspat ¸iu al imaginilor faciale acoperit
deU.ˆIn acest subspat ¸iu Ω, problema super-rezolut ¸iei prezentat˘ a ˆ ın Ecuat ¸ia 23 poate fi
formulat˘ a folosind constrˆ angerile de reconstruct ¸ie ca:
c= arg min
c∥SHU c−Y∥2
2+ηρ(Uc) cu c≥0, (24)
unde ρ(Uc) este un termen prior ce regularizeaz˘ a solut ¸ia cu rezolut ¸ie ˆ ınalt˘ a, c∈Rr1este
vectorul coeficient folosit pentru estimarea imaginii faciale cu rezolut ¸ie ˆ ınalt˘ a ¸ si care apart ¸ine
subspat ¸iului Ω, iar ηeste un parametru folosit pentru a echilibra fidelitatea reconstruct ¸iei ¸ si
informat ¸ia din prior .ˆIn aceast˘ a lucrare este folosit˘ a o imagine prior generic˘ a ce impune ca
solut ¸ia s˘ a fie neted˘ a. Folosind o matrice pentru high pass filtering notat˘ a cu Γ, forma final˘ a
a Ecuat ¸iei 24 este:
c= arg min
c∥SHU c−Y∥2
2+η∥ΓUc∥2cuc≥0. (25)
Imaginea cu rezolut ¸ie medie ˆXeste estimat˘ a de Uc. Termenul prior din Ecuat ¸ia 25 reduce
componentele cu frecvent ¸˘ a ˆ ınalt˘ a, rezultˆ and o imagine final˘ a cu o netezime mai puternic˘ a.
39
Acest lucru este rectificat folosind modelul fragmentelor locale bazat pe sparse representation
ment ¸ionat anterior. Tot acest algoritm este rezumat ˆ ın Algoritmul 2 prezentat mai jos.
Algoritmul 2 : Reconstruct ¸ia imaginilor faciale folosind sparse representation
1:Intrare: matricea baz˘ a sparse U, dict ¸ionarele Dh¸ siDl, o imagine facial˘ a cu rezolut ¸ie
sc˘ azut˘ a ce a fost deja aliniat˘ a Y.
2: G˘ asirea unei imagini faciale netede ˆXdin subspat ¸iul acoperit de Ufolosind urm˘ atorii
pa¸ si:
◦Se rezolv˘ a problema optimiz˘ arii din Ecuat ¸ia 25:
arg min c∥SHU c−Y∥22+η∥ΓUc∥2cuc≥0.
◦ˆX=Uc
3: Pentru fiecare fragment ydinˆX, ˆ ıncepˆ and cu cel din colt ¸ul stˆ anga sus ¸ si
suprapunˆ andu-le cu cˆ ate un pixel ˆ ın fiecare direct ¸ie,
◦Se calculeaz˘ a ¸ si se noteaz˘ a cu mvaloarea medie a pixelilor din y.
◦Se rezolv˘ a problema optimiz˘ arii cu ˜D¸ si˜ydefinite ˆ ın Ecuat ¸ia 17:
min ∥˜Dα−˜y∥22+λ∥α∥1.
◦Se genereaz˘ a fragmentul cu rezolut ¸ieˆ ınalt˘ a x=Dhα+m. Fragmentul xeste introdus
ˆ ın imaginea cu rezolut ¸ie ˆ ınalt˘ a X.
4:Ie sire: imaginea facial˘ a cu super-rezolut ¸ie X.
40
8 Completarea perechii de dict ionare
ˆIn capitolul precedent a fost prezentat˘ a regularizarea problemei super-rezolut ¸iei folosind
prior -ul sparse conform c˘ aruia fiecare pereche de fragmente cu rezolut ¸ie ˆ ınalt˘ a, respectiv
rezolut ¸ie sc˘ azut˘ a are aceea¸ si reprezentare sparse impus˘ a de dict ¸ionarele Dh¸ siDl. O metod˘ a
simpl˘ a de a obt ¸ine cele dou˘ a dict ¸ionare este de a e¸ santiona perechi de fragmente ale ima-
ginilor direct, p˘ astrˆ and ˆ ın acest fel corespondent ¸a dintre fragmentul cu rezolut ¸ie ˆ ınalt˘ a ¸ si cel
cu rezolut ¸ie sc˘ azut˘ a [112]. Totu¸ si, o astfel de metod˘ a duce la obt ¸inerea unor dict ¸ionare volu-
minoase, a¸ sadar un cost computat ¸ional ridicat. Acest capitol prezint˘ a o metod˘ a mai eficient˘ a
de a obt ¸ine o pereche de dict ¸ionare mai compact˘ a pentru a mic¸ sora volumul de calcule.
^Inv at area unui singur dict ionar
Problema sparse este cea a g˘ asirii unei reprezent˘ ari sparse a semnalelor, ce respect˘ a un
dict ¸ionar complet D. Dict ¸ionarul este de obicei construit folosind un set de exemple de
antrenament X={x1, x2, …, x t}.ˆIn general, un dict ¸ionar compact care s˘ a garanteze c˘ a
reprezentarea sparse din Ecuat ¸ia 13 poate fi obt ¸inut˘ a din minimizarea l1ˆ ın Ecuat ¸ia 14 este
greu de obt ¸inut. Din fericire mult ¸i algoritmi sparse prezentat ¸i anterior sunt eficient ¸i ˆ ın prac-
tic˘ a. Pentru exemplele prezentate ˆ ın aceast˘ a lucrare se folose¸ ste urm˘ atoarea formulare:
D= arg min
D;Z∥X−DZ∥2
2+λ∥Z∥1cu∥Di∥2
2≤1, i= 1,2, …, K, (26)
unde norma l1∥Z∥1este folosit˘ a pentru a impune sparsity -ul, iar constrˆ angerile normei l2
asupra coloanelor lui Delimin˘ a ambiguitatea scal˘ arii. F˘ ar˘ a aceste constrˆ angeri costul poate
fi mereu redus ˆ ımp˘ art ¸ind Zlac > 1 ¸ si ˆ ınmult ¸ind Dcuc > 1. Aceast˘ a formulare a fost
studiat˘ a intensiv ˆ ın [57,66,73]. Ecuat ¸ia 26 nu este convex˘ a ˆ ın D¸ siZˆ ın acela¸ si timp, dar este
convex˘ a ˆ ın una din ele cˆ and cealalt˘ a este fixat˘ a. Optimizarea este f˘ acut˘ a alternativ asupra
luiD¸ siZ:
1. Se init ¸ializeaz˘ a Dcu o matrice Gaussian˘ a oarecare, ce are fiecare coloan˘ a normalizat˘ a.
2. Se fixeaz˘ a D¸ si se actualizeaz˘ a Zdup˘ a cum urmeaz˘ a:
Z= arg min
Z∥X−DZ∥2
2+λ∥Z∥1, (27)
ce poate fi rezolvat˘ a eficient folosind programarea liniar˘ a.
3. Se fixeaz˘ a Z¸ si se actualizeaz˘ a Ddup˘ a cum urmeaz˘ a:
D= arg min
D∥X−DZ∥2
2cu∥Di∥2
2≤1, i= 1,2, …, K, (28)
41
ce poate fi rezolvat˘ a folosind multe pachete de optimizare bazate pe programare p˘ atratic˘ a.
4. Se reitereaz˘ a pa¸ sii 2) ¸ si 3) pˆ an˘ a acestea converg. ˆIn aplicat ¸ia Matlab prezentat˘ a s-a
folosit un pachet Matlab dezvoltat ˆ ın [57].
^Inv at area dict ionarelor simultan
Date fiind perechile de fragmente ale imaginilor e¸ santionate P={Xh, Yl}, unde Xh=
{x1, x2, …, x n}este setul fragmetelor din imaginea cu rezolut ¸ie ˆ ınalt˘ a, iar Yl={y1, y2, …, y n}
este setul fragmentelor cu rezolut ¸ie sc˘ azut˘ a corespunz˘ atoare. Scopul este de a forma cele
dou˘ a dict ¸ionare pentru fragmentele cu rezolut ¸ie ˆ ınalt˘ a, respectiv cele cu rezolut ¸ie sc˘ azut˘ a,
astfel ˆ ıncˆ at reprezentarea sparse a fragmentului cu rezolut ¸ie ˆ ınalt˘ a s˘ a fie la fel ca cea a
fragmentului cu rezolut ¸ie sc˘ azut˘ a corespunz˘ ator. Aceasta este o problem˘ a dificil˘ a datorit˘ a
modelului subdeterminat al super-rezolut ¸iei. Problemele cod˘ arii sparse individuale pentru
fragmentele cu rezolut ¸ie ˆ ınalt˘ a ¸ si cele cu rezolut ¸ie sc˘ azut˘ a sunt:
Dh= arg min
fDhZg∥Xh−DhZ∥2
2+λ∥Z∥1, (29)
respectiv
Dl= arg min
fDlZg∥Yl−DlZ∥2
2+λ∥Z∥1. (30)
Aceste ecuat ¸ii sunt unite pentru a fort ¸a reprezent˘ arile cu rezolut ¸ieˆ ınalt˘ a ¸ si cele cu rezolut ¸ie
joas˘ a s˘ a aib˘ a acela¸ si cod, astfel obt ¸inˆ and:
min
fDhDlZg1
N∥Xh−DhZ∥2
2+1
M∥Yl−DlZ∥2
2+λ(1
N+1
M)∥Z∥1, (31)
unde N¸ siMsunt dimensiunile fragmentelor imaginilor cu rezolut ¸ie ˆ ınalt˘ a, respectiv a
celor cu rezolut ¸ie sc˘ azut˘ a, ˆ ın form˘ a vectorial˘ a. Aici, 1 /N¸ si 1/Mechilibreaz˘ a cei doi termeni
de cost din Ecuat ¸ia 29 ¸ si Ecuat ¸ia 30.
Ecuat ¸ia 31 poate fi rescris˘ a ca:
min
fDhDlZg∥Xc−DcZ∥2
2+λ(1
N+1
M)∥Z∥1, (32)
sau
min
fDhDlZg∥Xc−DcZ∥2
2+ˆλ∥Z∥1. (33)
Unde
42
Xc=
1√
NXh
1√
MYl
,Dc=
1√
NDh
1√
MDl
. (34)
A¸ sadar, putem folosi aceea¸ si metod˘ a de ˆ ınv˘ at ¸are folosit˘ a ˆ ın cazul unui singur dict ¸ionar ¸ si
pentru a antrena dou˘ a dict ¸ionare ˆ ın scopul super-rezolut ¸iei. A se observa c˘ a, deoarece sunt
folosite caracteristici ale fragmentelor imaginilor cu rezolut ¸ie sc˘ azut˘ a, Dh¸ siDlnu sunt conec-
tate simplu printr-o transformare liniar˘ a; dac˘ a acesta ar fi fost cazul, procesul de antrenare
din Ecuat ¸ia 33 ar depinde doar fragmentele imaginilor cu rezolut ¸ie ˆ ınalt˘ a (detaliile sunt
prezentate ˆ ın sect ¸iunea ce urmeaz˘ a).
Figura 7 ilustreaz˘ a dict ¸ionarul completat folosind Ecuat ¸ia 33 pentru imagini generale.
Vizualizarea dict ¸ionarului este un bun mod de a observa anumite modele ( patterns ) ˆ ın frag-
mentele de imagini, cum ar fi orientarea muchiilor, lucru posibil datorit˘ a compactit˘ at ¸ii aces-
tuia ¸ si care nu ar fi fost la fel de u¸ sor de observat folosind doar fragmentele e¸ santionate.
Figure 7: Dict ¸ionarul fragmentelor cu rezolut ¸ie ˆ ınalt˘ a obt ¸inut din Ecuat ¸ia 33 folosind 100,000
de fragmente cu rezolut ¸ie ˆ ınalt˘ a ¸ si rezolut ¸ie sc˘ azut˘ a extrase din imagini generale. Sunt
obt ¸inut ¸e 512 p˘ art ¸i ale dict ¸ionarului, fiecare parte avˆ and m˘ arimea 9 ×9.
Reprezentarea caracteristicilor fragmentelor cu rezolut ie sc azut a
ˆIn ecuat ¸ia 13 este folosit un operator de extragere a caracteristicilor, F, pentru a asigura cal-
culul coeficient ¸ilor ˆ ın a¸ sa fel ˆ ıncˆ at ace¸ stia s˘ a acopere partea cea mai relevant˘ a a semnalului
rezolut ¸iei sc˘ azute, avˆ and a¸ sadar o aproximare mai bun˘ a a fragmentului cu rezolut ¸ie ˆ ınalt˘ a.
ˆIn general Feste un filtru high-pass . Aceast˘ a opt ¸iune este aleas˘ a deoarece este cunoscut c˘ a
oamenii sunt mai sensibili la cont ¸inutul cu frecvent ¸e ˆ ınalte ale unei imagini. De asemenea,
43
cont ¸inutul cu frecvent ¸e ˆ ınalte al imaginilor cu rezolut ¸ie sc˘ azut˘ a este probabil cea mai im-
portant˘ a parte ˆ ın obt ¸inerea cont ¸inutului cu frecvent ¸e ˆ ınalte pierdut al imaginii cu rezolut ¸ie
ˆ ınalt˘ a.
ˆIn literatura de specialitate cercet˘ atorii au sugerat extragerea anumitor caracteristici ale
fragmentelor cu rezolut ¸ie sc˘ azut˘ a pentru a ˆ ımbun˘ at˘ at ¸i acuratet ¸ea aproxim˘ arii imaginii cu
super-rezolut ¸ie. Freeman et al. [32] au folosit un filtru high-pass pentru a extrage ca ¸ si
caracteristic˘ a a unui fragment informat ¸ia despre muchii din fragmentele cu rezolut ¸ie sc˘ azut˘ a.
Sun et al. [92] au folosit un set de derivate ale filtrului Gaussian pentru a extrage frontierele
din fragmentele cu rezolut ¸ie sc˘ azut˘ a. Chang et al. [16] au folosit gradientul de ordinul ˆ ıntˆ ai
¸ si pe cel de ordin doi ale fragmentelor ca ¸ si reprezentare.
Metoda prezentat˘ a folose¸ ste de asemenea derivate de ordinul ˆ ıntˆ ai ¸ si doi ca ¸ si caracteristici
ale fragmentului cu rezolut ¸ie sc˘ azut˘ a datorit˘ a eficient ¸ei ¸ si simplit˘ at ¸ii lor. Cele patru filtre
1-D folosite pentru a extrage derivatele sunt:
f1= [−1,0,1], f 2=f1T,
f3= [1,0,−2,0,1], f 4=f3T, (35)
unde fTeste transpusa lui f. Aplicarea acestor patru filtre duce la obt ¸inerea a patru
vectori de caracteristici pentru fiecare fragment. Ace¸ sti patru vectori sunt concatenat ¸i ˆ ıntr-
un singur vector ce reprezint˘ a caracteristica final˘ a a acelui fragment cu rezolut ¸ie sc˘ azut˘ a.
Totu¸ si, ˆ ın metoda prezentat˘ a cele patru filtre nu sunt aplicate direct asupra fragmentelor cu
rezolut ¸ie sc˘ azut˘ a, ci sunt aplicate direct imaginilor de antrenament. ˆIn acest fel, pentru fiecare
imagine cu rezolut ¸ie sc˘ azut˘ a de antrenament se obt ¸in patru h˘ art ¸i ale gradientului ( gradient
maps ). La final se extrag patru fragmente cu aceea¸ si locat ¸ie din acele h˘ art ¸i ale gradientului
¸ si sunt concatenate ˆ ın vectorul caracteristicilor final. A¸ sadar reprezentarea caracteristicilor
pentru fiecare fragment cu rezolut ¸ie sc˘ azut˘ a cont ¸ine ¸ si informat ¸ia legat˘ a de pixelii vecini,
lucru ce duce la o compatibilitate ˆ ıntre vecini mult mai mare, ceea ce este de asemenea dorit
ˆ ın cadrul algoritmului de reconstruct ¸ie.
ˆIn practic˘ a s-a observat c˘ a este mai eficient s˘ a se extrag˘ a caraceristicile din versiunea
m˘ arit˘ a (scalat˘ a) a imaginii cu rezolut ¸ie sc˘ azut˘ a ˆ ın locul celei originale. A¸ sadar, mai ˆ ıntˆ ai
imaginea cu rezolut ¸ie sc˘ azut˘ a este m˘ arit˘ a cu un factor de doi folosind bicubic interpolation
¸ si apoi sunt extrase caracteristicile din aceasta. Este folosit un factor al scal˘ arii de doi
din considerente dimensionale. De exemplu, pentru fragmente 3 ×3 ale imaginii cu rezolut ¸ie
sc˘ azut˘ a, m˘ arind imaginea cu un factor al scal˘ arii de doi, caracteristica final˘ a (vectorul) pentru
acel fragment cu nou˘ a pixeli ar fi de dimensiune 6 ×6×4 = 144. Deoarece ¸ stim dimensiunea
scal˘ arii este u¸ sor s˘ a facem leg˘ atura dintre fragmentele cu rezolut ¸ie ˆ ınalt˘ a ale imaginii ¸ si
44
fragmentele cu rezolut ¸ie sc˘ azut˘ a scalate. Datorit˘ a modului de extragere a caracteristicilor din
fragmentele cu rezolut ¸ie sc˘ azut˘ a ale imaginii, cele dou˘ a dict ¸ionare Dl¸ siDhnu sunt conectate
liniar, ceea ce face ca procesul de ˆ ınv˘ at ¸are simultan˘ a din Ecuat ¸ia 33 s˘ a fie rezonabil.
45
9 Aplicarea algoritmului si analiza rezultatelor
ˆIn acest capitol sunt prezentate rezultatele obt ¸inute ˆ ın urma aplic˘ arii algoritmului pentru
obt ¸inerea super-rezolut ¸iei prezentat anterior, atˆ at asupra imaginilor generale cˆ at ¸ si asupra
celor faciale. Sunt prezentat ¸i apoi cˆ at ¸iva factori de influent ¸˘ a asupra algoritmului prezentat,
cum ar fi m˘ arimea dict ¸ionarului, imagini de intrare ce cont ¸in zgomot ¸ si constrˆ angerile de
reconstruct ¸ie global˘ a.
ˆIn experimentele prezentate imaginea cu rezolut ¸ie sc˘ azut˘ a ce este primit˘ a la intrare este
m˘ arit˘ a cu un factor de trei pentru imaginile generale ¸ si un factor de patru pentru cele faciale,
acesta fiind modul obi¸ snuit ˆ ın super-rezolut ¸ia single frame . Pentru super-rezolut ¸ia imaginilor
generale, fragmentele imaginilor cu rezolut ¸ie sc˘ azut˘ a sunt de dimensiune 3 ×3 (ce sunt m˘ arite
la 6×6) ¸ si se suprapun cu un pixel fat ¸˘ a de fiecare fragment vecin, iar corespondentul acestui
fragment este cel cu rezolut ¸ie ˆ ınalt˘ a de dimensiune 9 ×9 cu o suprapunere de trei pixeli.
Pentru super-rezolut ¸ia facial˘ a sunt alese fragmente de dimensiuni 5 ×5 atˆ at pentru imaginile
cu rezolut ¸ie sc˘ azut˘ a, cˆ at ¸ si pentru cele cu rezolut ¸ie ˆ ınalt˘ a.
Pentru imaginile color algoritmul prezentat este aplicat doar asupra canalului luminant ¸ei,
deoarece oamenii sunt mai sensibili la schimb˘ ari de aceast˘ a natur˘ a. Straturile culorilor (Cb,
Cr) sunt apoi interpolate folosind plain bicubic interpolation .
Figure 8: Reprezentarea codific˘ arii YCbCr ¸ si a canalelor cu care se lucreaz˘ a.
Rezultatele diferitelor metode sunt evaluate atˆ at vizual, cˆ at ¸ si calitativ folosind root
mean square error (RMSE). De¸ si RMSE este des folosit˘ a ˆ ın procesarea imaginilor, nu este
foare eficient˘ a ˆ ın evaluarea calit˘ at ¸ii vizuale a imaginii [110]. Deoarece este modificat canalul
iluminant ¸ei, RMSE-ul este de asemenea raportat doar la acest canal.
46
Super-rezolut ie single image
Super-rezolut ia imaginilor generale
Metodele prezentate sunt aplicate asupra imaginilor generale, cum ar fi cele cu flori, cl˘ adiri ¸ si
fet ¸e umane. Cele dou˘ a dict ¸ionare pentru fragmentele cu rezolut ¸ie ˆ ınalt˘ a, respectiv rezolut ¸ie
sc˘ azut˘ a sunt antrenate folosind 100,000 de perechi de fragmente e¸ santionate din imagini
naturale ce sunt desc˘ arcate de pe Internet. M˘ arimea dict ¸ionarului este fixat˘ a la 1024 ˆ ın toate
experimentele, ce ofer˘ a un echilibru din punct de vedere computat ¸ional ¸ si al calit˘ at ¸ii imaginii.
ˆIn urm˘ atoarea sect ¸iune sunt prezentatele efectele diferitelor m˘ arimi ale dict ¸ionarelor asupra
super-rezolut ¸iei. ˆIn algoritmul super-rezolut ¸iei prezentat ˆ ın Ecuat ¸ia 17, alegerea valorii lui λ
depinde de nivelul de zgomot din imaginea de intrare. Pentru imagini generale cu zgomot
sc˘ azut, este ales λ= 0.01 ˆ ın toate experimentele deoarece ofer˘ a rezultate favorabile.
Imaginea 9 compar˘ a ie¸ siri ale metodei propuse cu cele ale metodei neighborhood em-
bedding [16]. Metoda neighborhood embedding este asem˘ an˘ atoare cu cea propus˘ a deoarece
ambele folosesc ponderile combinat ¸iilor liniare obt ¸inute din fragmentul cu rezolut ¸ie sc˘ azut˘ a
pentru a general fragmentul cu rezolut ¸ie ˆ ınalt˘ a dorit. Spre deosebire de metoda propus˘ a,
metoda neighborhood embedding folose¸ ste un num˘ ar fix ( k) de vecini pentru a stabili bazele
reconstruct ¸iei ¸ si nu include o etap˘ a de antrenare a dict ¸ionarului. Pentru o comparat ¸ie corect˘ a
sunt folosite 100,000 de fragmente pentru neighbor embedding ¸ si sunt ˆ ıncercate diverse valori
ale lui kpentru a obt ¸ine cele mai bune rezultate din punct de vedere vizual. Folosind o
pereche de dict ¸ionare compacte, metoda propus˘ a este mai rapid˘ a ¸ si genereaz˘ a rezultate mai
clare din punct de vedere al muchiilor ( sharp edges ). Se poate observa ˆ ın imaginea 9 diferent ¸a
dintre diverse metode ¸ si cea propus˘ a, cum ar fi textura frunzelor sau pistruii de pe nasul fetei.
Figure 9: Imaginile sunt m˘ arite cu un factor de trei. De la stˆ anga la dreapta: intrarea,
bicubic interpolation, neighbor embedding, metoda propus˘ a ¸ si originalul.
ˆIn Figura 10 metoda propus˘ a este comparat˘ a cu unele dintre cele mai bune metode exis-
tente, imaginea de intrare fiind cea a Partenonului ce a fost folosit˘ a ¸ si de Dai et al. ˆ ın [20].
Algoritmii cu care este comparat˘ a metoda propus˘ a sunt: back projection [44], neighbor em-
47
Figure 10: Rezultatele unei imagini cu Partenonul, cu un factor de m˘ arire de trei. Rˆ andul
de sus: imaginea de intrare, bicubic interpolation, back projection. Rˆ andul de jos: neighbor
embedding, prior cu margini netede, metoda propus˘ a.
bedding [16] ¸ si metoda propus˘ a recent ce se bazeaz˘ a pe un prior ˆ ınv˘ at ¸at ce impune muchii
netede [20]. Imaginea rezultat˘ a folosind back projection are muchiile zimt ¸ate, iar metoda
neighbor embedding genereaz˘ a muchii mai netede pe alocuri dar estompeaz˘ a textura fat ¸adei
templului. Metoda propus˘ a de Dai et al. [20] ofer˘ a o reconstruct ¸ie mai bun˘ a, dar cauzeaz˘ a
aparit ¸ia ˆ ın imagine a unei neteziri care nu este prezent˘ a ˆ ın imaginea rezultat˘ a din algoritmul
propus.
Super-rezolut ie facial a
ˆIn aceast˘ a sect ¸iune metoda propus˘ a este aplicat˘ a asupra undei imagini frontale ale unei fet ¸e
umane. Imaginile faciale folositeˆ ın experimentele prezentate sunt desc˘ arcate din baza de date
FRGC (Face Recognition Grand Challenge) Versiunea 1.0 [76]. Toate fet ¸ele au fost aliniate
ˆ ın funct ¸ie de pozit ¸ia ochilor folosind un algoritm automat de aliniere ¸ si apoi decupate la
m˘ arimea de 100×100 pixeli. Pentru a afla subspat ¸iul fet ¸elor Ω cuprins de W, sunt selectate
540 de imagini faciale ca ¸ si imagini de antrenament, ce includ ambele sexe, diverse rase, vˆ arste
¸ si expresii faciale (Imaginea 11). Pentru a preg˘ ati perechea de dict ¸ionare ce este necesar˘ a ˆ ın
algoritmul propus sunt de asemenea e¸ santionate 100,000 de perechi de fragmente din acele
imagini ¸ si sunt construite dict ¸ionarele cu o m˘ arime de 1024. Treizeci de imagini faciale (ale
persoanelor care nu sunt ˆ ın setul de antrenament) sunt alese ca ¸ si imagini de test, acestea
sunt estompate ¸ si scalate la m˘ arimea de 25 ×25 de pixeli.
Dup˘ a cum am ment ¸ionat anterior, super-rezolut ¸ia imaginilor faciale poate fi aplicat˘ a
ˆ ın cazuri mai complicate decˆ at cele ale super-rezolut ¸iei generale, datorit˘ a structurii fet ¸ei
48
Figure 11: Exemple de imagini faciale de antrenament pentru algoritmul super-rezolut ¸iei.
Imaginile includ ambele sexe, vˆ arste diferite, rase diferite ¸ si expresii faciale diferite.
umane. ˆIntr-adev˘ ar nu este u¸ sor s˘ a m˘ arim de patru ori imaginea cu rezolut ¸ie sc˘ azut˘ a a
c˘ arei dimensiune este de 25 ×25 folosind metoda general˘ a pentru super-rezolut ¸ie. ˆIn primul
rˆ and, procesul de scalare (mic¸ sorare) duce la pierderea unei cantit˘ at ¸i mare de informat ¸ii,
ceea ce face ca obt ¸inerea unui fragment cu rezolut ¸ie ˆ ınalt˘ a de dimensiune 12 ×12 dintr-un
fragment de dimensiune 3 ×3 s˘ a fie dificil˘ a. ˆIn al doilea rˆ and, rezolut ¸ia imaginii de intrare
este atˆ at de mic˘ a ˆ ıncˆ at structurile fet ¸ei care sunt utile ˆ ın obt ¸inerea super-rezolut ¸iei (cum ar
fi muchiile ¸ si colt ¸urile) sunt restrˆ anse la doar cˆ at ¸iva pixeli. Abordarea ˆ ın doi pa¸ si pentru
super-rezolut ¸ia imaginilor faciale poate totu¸ si s˘ a compenseze informat ¸ia pierdut˘ a ˆ ın primul
pas folosind structura facial˘ a ¸ si c˘ autˆ and o solut ¸ie ˆ ın subspat ¸iul fet ¸elor, impunˆ and anumite
constrˆ angeri ale reconstruct ¸iei. Modelul local din reprezentarea sparse poate fi apoi modificat
pentru a ˆ ımbun˘ at˘ at ¸i muchiile ¸ si texturile pentru a obt ¸ine rezultate mai clare. Metoda pentru
imaginile generale este de asemenea aplicat˘ a asupra acestor imagini ¸ si diferent ¸a dintre cele
dou˘ a metode poate fi observat˘ a ˆ ın Imaginea 12.
Figure 12: Comparat ¸ie a metodei ˆ ın doi pa¸ si pentru super-rezolut ¸ie facial˘ a ¸ si metoda pentru
imagini generale. De la stˆ anga la dreapta: imaginea de intrare, super-rezolut ¸ie facial˘ a ˆ ın
dou˘ a etape ¸ si super-rezolut ¸ie folosind algoritmul pentru imagini generice.
Deoarece rezolut ¸ia imaginii de intrare este una foarte mic˘ a, aplicarea algoritmului pentru
imagini generale asupra acestui tip de imagini nu duce la ni¸ ste rezultate foarte pl˘ acute vizual.
ˆIn experimentele prezentate valoarea lui λeste setat˘ a la λ= 0.01. Metoda prezentat˘ a este
comparat˘ a cu bicubic interpolation [42] ¸ si back projection [44]. Rezultatele pot fi studiate ˆ ın
Figura 13, unde se poate observa c˘ a metoda propus˘ a duce la o calitate mai ridicat˘ a a imaginii
cu super-rezolut ¸ie. Din coloanele patru ¸ si cinci se poate observa c˘ a metoda fragmentelor locale
bazat˘ a pe sparse representation ˆ ımbun˘ at˘ at ¸e¸ ste ¸ si mai mult texturile ¸ si muchiile.
49
Figure 13: Comparat ¸ie a metodei propuse cu alte metode existente. De la stˆ anga la dreapta
pe coloane: imaginea de intrare cu rezolut ¸ie sc˘ azut˘ a, bicubic interpolation, back-projection,
modelul global via NMF combinat cu bilateral filtering, modelul global combinat cu modelul
local via sparse representation, imaginea original˘ a.
In
uent a m arimii dict ionarelor
Rezultatele experimentale ilustrate mai sus arat˘ a c˘ a prior-ul sparsity pentru fragmentele
imaginii este foarte eficient ˆ ın ceea ce prive¸ ste regularizarea problemei subdeterminate a
super-rezolut ¸iei. ˆIn aceste rezultate m˘ arimea dict ¸ionarului este fixat˘ a la 1024. Intuitiv, un
dict ¸ionar mai mare duce la un rezultat mai bun al super-rezolut ¸iei (acest aspect poate fi dus
la extrem, iar dict ¸ionarul s˘ a fie format chiar din fragmentele e¸ santionate, metod˘ a prezentat˘ a
ˆ ın [112]), ˆ ıns˘ a un dict ¸ionar foarte mare implic˘ a ¸ si o putere computat ¸ional˘ a foarte mare.
Aceast˘ a sect ¸iune prezint˘ a efectul m˘ arimii dict ¸ionarului asupra super-rezolut ¸iei imaginilor
generale. Din cele 100,000 de fragmente e¸ santionate sunt create patru dict ¸ionare de m˘ arimi
256, 512, 1024, 2048 ¸ si sunt aplicate asupra aceleia¸ si imagini de intrare. De asemenea se
mai utilizeaz˘ a ¸ si un dict ¸ionar format din toate cele 100,000 de fragmente pentru a putea
compara calitatea imaginii ˆ ın cazul dus la extrem. Rezultatele sunt evaluate atˆ at vizual, cˆ at
¸ si cantitativ folosind RMSE.
Figura 14 ilustreaz˘ a rezultatele aplic˘ arii dict ¸ionarelor de diferite m˘ arimi asupra imaginii
cu Lena. De¸ si nu exist˘ a diferent ¸e foarte mari din punct de vedere vizual ˆ ıntre rezultatele
obt ¸inute folosind dict ¸ionarele de diverse m˘ arimi, de la 256 la 2048 ¸ si chiar ¸ si toate fragmentele
e¸ santionate ca dict ¸ionar, se poate observa o mic¸ sorare a num˘ arului artefactelor vizuale ˆ ın
cazul dict ¸ionarelor mai mari.
Tabelul 1 cont ¸ine rezultatele calculului RMSE-ului imaginilor obt ¸inute folosind dict ¸ionarele
prezentate anterior. Dup˘ a cum se poate observa ¸ si ˆ ın tabel, folosind un dict ¸ionar mai mare se
obt ¸ine o valoare mai mic˘ a a RMSE-ului, iar toate dict ¸ionarele duc la o valoare a RMSE-ului
mai mic˘ a decˆ at cea din cazul metodei bicubic interpolation . Totu¸ si, num˘ arul calculelor este
50
Figure 14: Efectul m˘ arimii dict ¸ionarelor asupra rezultatelor imaginii Lena. De la stˆ anga la
dreapta: m˘ arimea dict ¸ionarului 256, 512, 1024, 2048 ¸ si ˆ ıntregul set de fragmente.
Table 1: Calculele RMSE-ului pentru imaginile reconstruite folosind diverse m˘ arimi ale
dict ¸ionarelor ¸ si folosind direct fragmentele din care au fost antrenate dict ¸ionarele.
Imagine bicubic D256 D512 D1024 D2048 Toate fragmentele
Fata 5.912 5.606 5.603 5.491 5.473 5.483
Floare 3.530 3.266 3.271 3.212 3.164 3.139
Lena 7.360 6.587 6.572 6.359 6.232 6.029
Statuie 9.873 8.826 8.777 8.342 8.237 8.255
direct proport ¸ional cu m˘ arimea dict ¸ionarelor, iar dict ¸ionarele foarte mari vor duce la calcule
numeroase ¸ si un timp de procesare mai mare.
51
Bibliograe
[1]M. Aharon, M. Elad, A. Bruckstein, K-SVD: An algorithm for designing overcomplete
dictionaries for sparse representation , IEEE Transactions on Signal Processing, vol 54,
no. 11 (2006) 4311-4322.
[2]C. Alexandrescu, Contribut ¸ii privind exploatarea imaginilor digitale ˆ ın scopul culegerii de
date pentru sisteme de informat ¸ii spat ¸iale , Tez˘ a de doctorat, Bucure¸ sti (2011).
[3]J.R. Bergen, P. Anandan, K.J. Hanna, R. Hingorani, Hierarchical model-based motion
estimation , Proceedings of 2nd ECCV 1992, lecture notes in computer science (1992),
237-252.
[4]S.D. Babacan, R. Molina, A.K. Katsaggelos, Total Variation super resolution using a
variational approach , 15th IEEE international conference on image processing (2008)
641-644.
[5]Y. Bai, J. Hu, Y. Luo, Self-adaptive blind super-resolution image reconstruction , IEEE
ICSIP (2010) 1208-1212.
[6]S. Baker, T. Kanade, Limits on super-resolution and how to break them , IEEE Trans.
Pattern Anal. Mach Intell 24 (2002) 1168-1173.
[7]S. Belekos, N.P. Galatsanos, A.K. Katsaggelos, Maximum a posteriori video super-
resolution using a new multichannel image prior , IEEE Trans. Image Process. 19 (2010)
1451-1464.
[8]M. Bevilacqua, A. Roumy, C. Guillemot, M.L.A. Morel, Low-complexity single image
super-resolution based on nonnegative neighbor embedding , BMVC (2012) 1-10.
[9]S. Borman, R. Stevenson, Spatial resolution enhancement of low-resolution image
sequences-a comprehensive review with directions for future research , Lab. Image and
SIgnal Analysis, University of Notre Dame, Tech. rep. (1998).
[10]G. Botella, U. Meyer-Baese, A. Garcia, M. Rodriguez, Quantization analysis and en-
hancement of a VLSI gradient-based motion estimation architecture , Digit. Signal Process.
22 (2012), 1174-1187.
[11]B. Burke, P. Jorden, P. Vu, Overview paper-CCD technology , Scientific detectors for
astronomy 2005, Springer (2006) 225-264.
[12]E. Candes, Compressive sensing , Proceedings of the International Congress of Mathe-
maticians, vol. 3 (2006) 1433-1452.
52
[13]D. Capel, A. Zisserman, Computer vision applied to super-resolution , IEEE Signal Pro-
cess Mag. 20 (2003), 75-86.
[14]D.C. Cˆ arstea Prelucrarea digital˘ a a imaginilor , Buletin de teorie militar˘ a, Nr. 2/2009,
Bucuret ¸i, Romˆ ania.
[15]J.C.W. Chan, J. Ma, F. Canters, A comparison of super-resolution reconstruction meth-
ods for multi-angle CHRIS/Proba images , Proc. SPIE (2008) 1-11.
[16]H. Chang, D.Y. Yeung, Y. Xiong, Super-resolution through neighor embedding , IEEE
comput. soc. conf. comput. vis. pattern recogn. (2003) 729-736.
[17]M.B. Chappalli, N.K. Bose, Simultaneous noise-filtering and super-resolution with
second-generation wavelets , IEEE Signal Process. Lett. 12 (2005), 772-775.
[18]P. Cheeseman, B. Kanefksy, R. Kraft, J. Stutz, R. Hanson, Super-resolved surface recon-
struction from multiple images , Heidberg G.R., editor. Maximum entropy and bayesian
methods, Netherlands: Springer (1996) 239-308.
[19]J. Chu, J. Liu, J. Qiao, X. Wang, Y. Li, Gradient based adaptive interpolation in super-
resolution image restoration ,IEEE ICSP (2008), 1027-1030.
[20]S. Dai, M. Han, W. Xu, Y. Wu, Y. Gong, Soft edge smoothness prior for alpha chan-
nel super resolution , IEEE Conference on Computer Vision and Pattern Classification
(CVPR),(2008) 1-8.
[21]W. Dong, G. Shi, L. Zhang, X. Wu, Super-resolution with nonlocal regularized sparse
representation , Proc. SPIE vol. 7744 (2010) 77440H-77440H.
[22]W. Dong, L. Zhang, G. Shi, Centralized sparse representation for image restoration ,
IEEE ICCV (2011) 1259-1266.
[23]W. Dong, L. Zhang, G. Shi,X. Li, Nonlocally centralized sparse representation for image
restoration , IEEE Trans. Image Process 22 (2013) 1620-1630.
[24]W. Dong, L. Zhang, G. Shi, X. Wu, Image deblurring and super-resolution by adap-
tive sparse domain selection and adaptive regularization , IEEE Trans. Image Process. 20
(2011) 1838-1857.
[25]W. Dong, L. Zhang, R. Lukac, G. Shi, Sparse representation based image interpolation
with nonlocal autoregressive modeling , IEEE Trans. Image Process. 22 (2013) 1382-1394.
[26]D.L. Donoho, Compressed sensing , IEEE Transactions on Information Theory, vol. 52,
no. 4 (2006) 1289-1306.
53
[27]D.L. Donoho, For most large underdetermined systems of linear equations the minimal
l1-norm solution is also the sparsest solution , Communications on Pure and Applied
Mathematics, vol. 59, no. 6 (2006) 797-829.
[28]D.L. Donoho, For most large underdetermined systems of linear equations the minimal
l1-norm near-solution approximates the sparsest near-solution , Communications on Pure
and Applied Mathematics, vol. 59, no. 7 (2006) 907-915.
[29]M. Elad, A. Feuer, Restoration of a single superresolution image from several blurred,
noisy and undersampled measured images , IEEE Trans. Image Process. 6 (1997) 1646-
1658.
[30]S.E. El-Khamy, M.M. Hadhoud, M.I. Dessouky, B.M. Salam, F.A. El-Samie, Regularized
super-resolution reconstruction of images using wavelet fusion , Opt. Eng. 44 (2005).
[31]S. Farsiu, M.D. Robinson, M. Elad, P. Milanfar, Fast and robust multiframe super-
resolution , IEEE Trans. Image Process. 13 (2004) 1327-1344.
[32]W.T. Freeman, T.R. Jones, E.C. Pasztor, Example based super-resolution , IEEE Com-
put. Graph. Appl. 22 (2002) 56-65.
[33]W.T. Freeman, E.C. Pasztor, O.T. Carmichael, Learning low-level vision , International
Journal of Computer Vision, vol. 40, no.1 (2000) 25-47.
[34]X. Gao, K. Zhang, D. Tao, X. Li, Image super-resolution with sparse neighbor embedding ,
IEEE Trans. Image Process. 21 (2012) 3194-3205.
[35]D. Glasner, S. Bagon, M. Irani, Super-resolution from a single image , IEEE ICCV (2009)
349-356.
[36]M. Gong, K. He, J. Zhou, J. Zhang, Single color image super-resolution through neighbor
embedding , JCIS 7 (2011) 49-56.
[37]R.C. Gonzales, R.E. Woods, Digital Image Processing , www.prenhall.com /gonza-
leswoods, www.imageprocessingplace.com
[38]H. Greenspan, Super-resolution in medical imaging , Comput. J. 52 (2009) 43-63.
[39]R.C. Hardie, K.J. Barnard, E.E. Armstrong, Joint MAP registration and high-resolution
image estimation using a sequence of undersampled images , IEEE Trans. Image Process.
(1997), 1621-1633.
[40]J.I. Harris, Diffraction and resolving power , J.Opt.Soc.Am. 54 (1964) 931-933.
54
[41]A. Hertzmann, C.E. Jacobs, N. Oliver, B. Curless, D.H. Salesin, Image analogies , Pro-
ceedings of the 28th annual conference on computer graphics and interactive techniques
(2001) 327-340.
[42]H.S. Hou, H.C. Andrews, Cubic spline for image interpolation and digital filtering , IEEE
Transactions on Signal Processing, vol. 26 508-517.
[43]H. Huang, H. He, X. Fan, J. Zhang, Super-resolution of human face image using canon-
ical correlation analysis , Pattern Recogn. 43 (2010) 2532-2543.
[44]M. Irani, S. Peleg, Improving resolution by image registration , CVGIP: Graph. Model.
Image Process. 53 (1991) 231-239.
[45]Dorina Isar, Alexandru Isar, Filtre , Editura Politehnica, Timi¸ soara (2003).
[46]H. Ji, C. Fermuller Wavelet-based super-resolution reconstruction: theory and algorithm ,
ECCV (2006), 295-307.
[47]H. Ji, C. Fermuller Robust wavelet-based super-resolution reconstruction: theory and
algorithm , IEEE Trans. Pattern Anal. Mach Intell 31 (2009), 649-660.
[48]J. Kanakaraj, S. Kathiravan, Super-resolution image reconstruction using sparse param-
eter dictionary framework , Sci. Res. Essays 7 (2012) 586-592.
[49]S.B. Kasturiwala S.A. Ladhake, Super-resolution: a novel application to image restora-
tion, IJCSE 2 (2010) 1659-1664.
[50]D. Keren, S. Peleg, R. Brada, Image sequence enhancement using sub-pixel displace-
ments ,Proceedings of IEEE computer society conference on CVPR, Ann Arbor, MI.
(1988),742-746.
[51]S. Kim, N.K. Bose, H.M. Valenzuela, Recursive re-construction of high-resolution image
from noisy under-sampled multi-frames , IEEE Trans. Acoust. Speech Signal Process. 38
(1990), 1013-1027.
[52]S.P. Kim, W.Y. Su Recursive high-resolution reconstruction of blurred multiframe im-
ages, IEEE Trans. Image Process. 2 (1993), 534-539.
[53]K.I. Kim, Y. Kwon, Example-based learning for single image super-resolution and JPEG
artifact removal , Max Planck Institute Biological Cybernetics Tubingen, Germany, Tech-
nical report no. TR-173 (2008).
[54]K.I. Kim, Y. Kwon, Single-image super-resolution using sparse regression and natural
image prior , IEEE Trans. Pattern Anal. Mach. Intell. 32 (2010) 1127-1133.
55
[55]D. Kong, M. Han, W. Xu, H. Tao, Y. Gong, A conditional random field model for video
super-resolution , IEEE ICPR (2006) 619-622.
[56]C. Latry, B. Rouge, Super resolution: quincunx sampling and fusion processing , Pro-
ceedings of the International Geoscience and Remote Sensing Symposium (IGARSS),
Toulouse, France (2003) 315-317.
[57]H. Lee, A. Battle, R. Raina, A.Y. Ng, Efficient sparse coding algorithms , Advances in
Neural Information Processing Systems (NIPS) (2007) 801-808.
[58]X. Li, M.T. Orchard, New edge-directed interpolation , IEEE Trans. Image Process.
(2001), 1521-1527.
[59]X. Li, K.M. Lam, G. Qiu, L. Shen, S. Wang, Example-based image super-resolution with
class-specific predictors , J. Vis. Commun. Image Represent 20 (2009) 312-322.
[60]C. Liu, D. Sun, A Bayesian approach to adaptive video super-resolution , IEEE conference
on CVPR (2011) 209-221.
[61]C. Liu, H.Y. Shum, W.T. Freeman, Face hallucination: Theory and practice , Interna-
tional Journal of Computer Vision, vol. 75, no. 1 (2007) 115-134.
[62]L. Lucchese, G.M. Cortelazzo, A noise-robust frequency domain technique for estimating
planar roto-translations , IEEE Trans. Signal Process. 48 (2000), 1769-1786.
[63]S.F. Lui, J.Y. Wu, H.S. Mao, J.J. Lien, Learning-based super-resolution system using
single facial image and multi-resolution wavelet synthesis , ACCV (2007) 96-105.
[64]X. Ma, J. Zhang, C. Qi, Hallucinating face by position-patch , Pattern Recogn. 43 (2010)
2224-2236.
[65]J. Mairal, G. Sapiro, M. Elad, Learning multiscale sparse representations for video and
image restoration , Multiscale Modeling and Simulation, vol. 7 (2008) 214-241.
[66]J.F. Murray, K. Kreutz-Delgado, Learning sparse overcomplete codes for images , Journal
of VLSI Signal Processing, vol. 45 (2007) 97-110.
[67]K. Murthy, M. Shearn, B.D. Smiley, et. al., SkySat-1: very high-resolution imagery from
a small satellite , Sens. Syst. General Satell. XVII (2014).
[68]K. Nasrollahi, T.B. Moeslund, Super-resolution: a comprehensive survey , Mach. Vis.
Appl. 25 (2014) 1423-1468.
56
[69]N. Nguyen, P. Milanfar, G. Golub, A computationally efficient superresolution image
reconstruction algorithm , IEEE Trans. Image Process. 10(2001) 573-583.
[70]N. Nguyen, P. Milanfar, A wavelet-based interpolation-restoration method for super-
resolution(wavelet super-resolution) , Circ. Sys. Signal Process.19, (2000), 321-338.
[71]K.S. Ni, S. Kumar, N. Vasconcelos, T.Q. Nguyen, Single image super-resolution based
on support vector regression , IEEE ICASSP (2006).
[72]K.S. Ni, T.Q. Nguyen, Image super-resolution using support vector regression , IEEE
Trans. Image Process. 16 (2007) 1596-1610.
[73]B. Olshausen, D. Field, Sparse coding with an overcomplete basis set: A strategy em-
ployed by V1? , Vision Research, vol. 37, no. 23 3311-3325.
[74]S.C. Park, M.K. Park, M.G. Kang, Super-resolution image reconstruction: a technical
overview , IEEE Signal Process. Mag. 20 (2003) 21-36.
[75]A.J. Patti, M.I. Sezan, A.M. Tekalp, Super-resolution video reconstruction with arbitrary
sampling lattices and nonzero aperture time , IEEE Trans. Image Process. 6 (1997), 1064-
1076.
[76]P. Philips, P. Flynn, T. Scruggs, K. Bowyer, J. Chang, K. Hoffman, J. Marques, J. Min,
W. Worek, Overview of face recognition grand challenge , IEEE Conference on Computer
Vision and Pattern Recognition (CVPR) (2005) 947-954.
[77]M. Pierre, Detection of visible photons in CCD and CMOS: a comparative view , Nucl.
Instrum. Methods Phys. Res. Sect. A: Accel., Spectrom., Detect. Assoc. Equip. 504 (2003)
199-212.
[78]E. Plenge, D.H. Poot, M. Bernsen, G. Kotek, G. Houston, P. Wielopolski, et al. Super-
resolution methods in MRI: can they improve the trade-off between resolution, signal-to-
noise ratio, and acquisition time? , Magn. Reson. Med. 68 (2012), 1983-1993.
[79]Elena Punskaya, Basics of digital filters , material adaptat dup˘ a cursurile profesorilor
Simion Godsill ¸ si Arn˘ aut Doucet.
[80]H. Rauhut, K. Schnass, P. Vandergheynnst, Compressed sensing and redundant dictio-
naries , IEEE Transactions on Information Theory, vol. 54, no. 5 (2008).
[81]S. Rhee, M.G. Kang, Discrete cosine transform based regularized high-resolution image
reconstruction algorithm , Opt. Eng. 38 (1999), 1348-1356.
57
[82]H. Shen, M.K. Ng, E.Y. Lam, et al., A total variation regularization based super-
resolution reconstruction algorithm for digital video , EURASIP J. Adv. Signal Process.
2007 (2007).
[83]H. Shen, X. Li, Q. Cheng, et al., Missing information reconstruction of remote sensing
data: a technical overview , IEEE Geosci. Remote Sens. Mag. 3 (2015).
[84]G. Shi, W. Dong, x. Wu, L. Zhang, Context based adaptive image resolution upconver-
sion, J. Electron. Imag. 19 (2010).
[85]B. Shi, H. Zhao, M. Ben-Ezra, et al., Sub-pixel layout for super-resolution with images
in the octic group , Proceedings of the European Conference on Computer Vision, ECCV,
Springer (2014) 250-264.
[86]F. Sroubek, G. Cristobal, J. Flusser, A unified approach to super-resolution and multi-
channel blind deconvolution , IEEE Trans. Image Process. 16 (2007) 2322-2332.
[87]F. Sroubek, J. Flusser, Resolution enhancement via probabilistic deconvolution of multi-
ple degraded images , Pattern Recogn. Lett. 27 (2006) 287-293.
[88]F. Sroubek, J. Flusser, Multichannel blind deconvolution of spatially misaligned images ,
IEEE Trans. Image Process. 14 (2005) 874-883.
[89]H. Stark, P. Oskoui, High-resolution image recovery from image-plane arrays, using
convex projections , JOSA A (1989), 1715-1726.
[90]C. Su, Y. Zhuang, L. Huang, F. Wu, Steerable pyramid-based face hallucination , Pattern
Recogn. 38 (2005) 813-824.
[91]N. Suetake, M. Sakano, E. Uchino, Image super-resolution based on local self-similarity ,
Opt. Rev. 15 (2008) 26-30.
[92]J. Sun, N.N. Zheng, H. Tao, H.Y. Shum, Image hallucination with primal sketch priors ,
IEEE comput. soc. conf. comput. vis. pattern recogn. (2003) 729-736.
[93]K.V. Suresh, A.N. Rajagopalan, Robust and computationally efficient super-resolution
algorithm , J. Opt. Soc. Am. 24 (2007) 984-992.
[94]A.M. Tekalp, M.K. Ozkan, M.I. Sezan, High-resolution image reconstruction from lower-
resolution image sequences and space-varying image restoration , IEEE ICASSP (1992),
169-172.
[95]D. Thapa, K. Raahemifar, W.R. Bobier, V. Lakshminarayanan, A performance compar-
ison among different super-resolution techniques , IEEE Trans. Image Process. 24 (2015).
58
[96]D. Thapa, K. Raahemifar, V. Lakshminarayanan, Comparison of super-resolution algo-
rithms applied to retinal images , J. Biomed. Opt. 19 (2014).
[97]J. Tian, K.K. Ma, Stochastic super-resolution image reconstruction , J. Vis. Commun.
Image Represent. 21 (200) 232-244.
[98]R. Tibshirani, Regression shrinkage and selection via the lasso , Journal of the Royal
Statistical Society, Seria B, vol. 58, no. 1 (1996) 267-288.
[99]B.C. Tom, A.K. Katsaggelos, Reconstruction of a high resolution image from multiple
degraded mis-registered low resolution images , Proc. SPIE vol. 2308 (1994) 971-81.
[100] R.Y. Tsai, T.S. Huang, Multi-frame image restoration and registration , Adv. Comput.
Vis. Image Process. 1, 1984.
[101] H. Ur, D. Gross, Improved resolution from sub-pixel shifted pictures ,CVGIP Graph.
Models Image Process.54 (1992), 181-186.
[102] P. Vandewalle, S. Su, M. Vetterli, A frequency domain approach to registration of aliased
images with application to super-resolution , EURASIP J Appl. Signal Process. (2006), 1-
14.
[103] C. Vertan, Prelucrarea ¸ si analiza imaginilor , prezentare curs.
[104] C. Vertan, Prelucrarea ¸ si analiza imaginilor , 1999.
[105] S. Villena, M. Vega, R. Molina, A.K. Katsaggelos, Bayesian super-resolution image re-
construction using a l1 prior , 6th International symposium on image and signal processing
and analysis (2009) 152-157.
[106] S. Villena, M. Vega, S.D. Babacan, R. Molina, A.K. Katsaggelos, Bayesian combination
of sparse and non-sparse priors in image super-resolution , Digit. Signal Process. 23 (2013)
530-541.
[107] A. Vlaicu, Prelucrarea digital˘ a a imaginilor , Editura Albastr˘ a, Cluj-Napoca, Romˆ ania
(1997).
[108] X. Wang, X. Tang, Hallucinating face by eigen transformation , IEEE Trans. Sys. Man.
Cyb. Part C: Appl. Rev. 35 (2005) 425-434.
[109] Z. Wang, A.C. Bovik, H.R. Sheikh, E.P. Simoncelli, Image quality assessment: from
error visibility to structural similarity , IEEE Trans. Image Process. 13 (2004) 600-612.
59
[110] Z. Wang, A.C. Bovik, Mean-square error: Love it or leave it? -A new look at signal
fidelity measures , IEEE Signal Processing Magazine, vol. 26 (2009) 98-117.
[111] W. Wu, Z. Liu, W. Gueaieb, X. He, Single-image super-resolution based on Markov
random field and contourlet transform , J. Electron. Imag. 20 (2011).
[112] J. Yang, J. Wright, T. Huang, Y. Ma, Image super-resolution as sparse representation
of raw image patches , IEEE CVPR (2008) 1-8.
[113] J. Yang, J. Wright, T.S. Huang, Y. Ma, Image super-resolution via sparse representa-
tion, IEEE Trans. Image Process. 19 (2010) 2861-2873.
[114] J. Yang, Z. Wang, Z. Lin, S. Cohen, T. Huang, Coupled dictionary training for image
super-resolution , IEEE Trans. Image Process 21 (2012) 3467-3478.
[115] L. Yue, H. Shen, J. Li, Q. Yuan, H. Zhang, L. Zhang, Image super-resolution: The
techniques, applications and future , IEEE Trans. Image Process. 25 (2016).
[116] I. Z˘ avoianu, Fotogrammetrie , Editura tehnic˘ a, Bucure¸ sti, Romˆ ania (1999).
[117] N. Zegheru, M. Albot˘ a, Introducere ˆ ın teledetect ¸ie , Editura S ¸tiint ¸ific˘ a ¸ si Enciclopedic˘ a,
Bucure¸ sti, Romˆ ania.
[118] R. Zeyde, M. Elad, M. Protter, On single image scale-up using sparse-representations ,
Curves and surfaces (2012) 711-730.
[119] X. Zhang, Y. Liu, A computationally efficient super-resolution reconstruction algorithm
based on the hybrid interpolation , J. Comput. (2010), 885-892.
[120] L. Zhang, X. Wu, An edge-guided image interpolation algorithm via directional filtering
and data fusion , IEEE Trans. Image Process. (2006), 2226-2238.
[121] X. Zhang, X. Wu, Image interpolation by adaptive 2-D autoregressive modeling and
soft-decision estimation ,IEEE Trans. Image Process. (2008), 887-896.
[122] J. Zhang, C. Zhao, R. Xiong, S. Ma, D. Zhao, Image super-resolution via dual-dictionary
learning and sparse representation , IEEE ISCAS (2012) 1688-1691.
[123] Y. Zhou, Z. Ye, Y. Xiao, A restoration algorithm for images contaminated by mixed
Gaussian plus random-valued impulse noise , J. Vis. Commun. Image Represent 24 (2013).
[124] Wikipedia – Pixel ,https://en.wikipedia.org/wiki/Pixel
[125] Wikipedia – Super-resolution imaging , https://en.wikipedia.org/wiki/
Super-resolution_imaging
60
[126] Wikipedia – 4K resolution ,https://en.wikipedia.org/wiki/4K_resolution
[127] Wikipedia – Shot noise ,https://en.wikipedia.org/wiki/Shot_noise
[128] INSPIRE – The INSPIRE Directive ,http://inspire.ec.europa.eu/
[129] Ministerul Mediului – Informat ¸ii spat ¸iale – INSPIRE ,http://www.mmediu.ro/
categorie/inspire/70
[130] SSI Bucovina – TerraRisc ,http://www.ssi-bucovina.ro/terrarisc_ro.html
Index
spatial sampling rate, 15
charge-coupled devices, 15
complementary metal oxide semiconductors,
15
artefacte vizuale, 19
bicubic interpolation, 43
CCD, 15
CMOS, 15
constrˆ angere de reconstruct ¸ie, 31
dict ¸ionar al rezolut ¸iei ˆ ınalte, 31, 33, 40, 41
dict ¸ionar al rezolut ¸iei sc˘ azute, 31, 33, 40, 41
filtru high pass, 38
fotodiode, 13
FRGC, 47
imagine, 13
imagine digital˘ a, 13
magnificare, 14
Megapixel, 13
modelul global, 34, 36
modelul local, 33
multi-frame, 14
neighborhood embedding, 46
NMF, 37
PCA, 26
pixel, 13
PSNR, 29
rat ¸ie semnal-zgomot, 15
Rezolut ¸ia, 13
RMSE, 45
senzori de imagine, 15shot noise, 15
single-frame, 14
SNR, 15
sparse, 30, 31
sparsity prior, 31
super rezolut ¸ie facial˘ a, 37, 38
super-rezolut ¸ie, 13
61
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Program de studii: [626085] (ID: 626085)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
