Program de studii: [626086]

UNIVERSITATEA POLITEHNICA DIN BUCURES TI
FACULTATEA DE S TIINT E APLICATE
Program de studii:
Matematic a s i Informatic a Aplicat a^n Inginerie
PROIECT DE DIPLOM A
COORDONATOR
S TIINT IFIC,
Prof. Dr. Vladimir BalanABSOLVENT: [anonimizat] ¸-C˘ at˘ alin Popa
Bucure¸ sti 2017

Aprobat Decan ,
Prof. Univ. Dr. Emil PETRESCU
PROIECT DE DIPLOM A
Aplicat ii ale algoritmilor single-frame ^ n
reconstruct ia imaginilor cu super-rezolut ie
COORDONATOR
S TIINT IFIC,
Prof. Dr. Vladimir BalanABSOLVENT: [anonimizat] ¸-C˘ at˘ alin Popa
Bucure¸ sti 2017

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
Cuprins
1 Introducere 4
Generalit˘ at ¸i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Situat ¸ia actual˘ a a temei de studiu . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Structura lucr˘ arii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 Imaginea digital a 8
Introducere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Ce este imaginea? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Ce fel de valori sunt ˆ ın imagine? . . . . . . . . . . . . . . . . . . . . . . . . . 8
Care este elementul de baz˘ a al unei imagini? . . . . . . . . . . . . . . . . . . 9
Preluarea imaginilor digitale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Platforme satelitare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Platforme aeriene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Platforme terestre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Memorarea, transmisia ¸ si compresia imaginilor digitale . . . . . . . . . . . . . . . 10
Memorarea imaginilor digitale . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Transmisia imaginilor digitale . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Compresia imaginilor digitale . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3 Istoric tehnic 14
4 Tehnologii  si metode pentru obt inerea imaginilor cu super-rezolut ie 16
Modelul observat ¸ional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Algoritmi de super-rezolut ¸ie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Metode bazate pe interpolare . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Metode ˆ ın domeniul frecvent ¸ei . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Metode bazate pe regularizare . . . . . . . . . . . . . . . . . . . . . . . . . . 20
5 Super-rezolut ie single-frame 22
Etapa de extragere a caracteristicilor . . . . . . . . . . . . . . . . . . . . . . . . . 23
Etapa de ˆ ınv˘ at ¸are . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Etapa de reconstruct ¸ie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Principalele obstacole ˆ ın calea reconstruct ¸iei . . . . . . . . . . . . . . . . . . . . . 25
6 Comparat ie a performant ei ^ ntre diferite tehnici de rezolut ie 25
Metode de m˘ asurare ¸ si optimizare a calit˘ at ¸ii imaginii . . . . . . . . . . . . . . . . 25
7 Super-rezolut ie folosind sparse representation 26
Recuperarea semnalului bazat˘ a pe reprezentare sparse . . . . . . . . . . . . . . . . 26
Notat ¸ii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Constrˆ angeri ale super-rezolut ¸iei . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Constrˆ angerea de reconstruct ¸ie . . . . . . . . . . . . . . . . . . . . . . . . . 27
Sparsity prior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Super-rezolut ¸ia imaginilor generale folosind Sparsity . . . . . . . . . . . . . . . . . 28
Modelul local folosind reprezentarea sparse . . . . . . . . . . . . . . . . . . . 28
Aplicarea constrˆ angerii de reconstruct ¸ie global˘ a . . . . . . . . . . . . . . . . 30

3
Interpretarea optimiz˘ arii globale . . . . . . . . . . . . . . . . . . . . . . . . . 31
Super-rezolut ¸ie facial˘ a folosind Sparsity . . . . . . . . . . . . . . . . . . . . . . . . 32
Modelul factoriz˘ arii matricei nenule (NMF) . . . . . . . . . . . . . . . . . . . 32
Super-rezolut ¸ie facial˘ a ˆ ın doi pa¸ si . . . . . . . . . . . . . . . . . . . . . . . . 32
8 Completarea perechii de dict ionare 34
ˆInv˘ at ¸area unui singur dict ¸ionar . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
ˆInv˘ at ¸area dict ¸ionarelor simultan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Reprezentarea caracteristicilor fragmentelor cu rezolut ¸ie sc˘ azut˘ a . . . . . . . . . . 36
9 Aplicarea algoritmului  si analiza rezultatelor 38
Super-rezolut ¸ie single image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Super-rezolut ¸ia imaginilor generale . . . . . . . . . . . . . . . . . . . . . . . 38
Super-rezolut ¸ie facial˘ a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Influent ¸a m˘ arimii dict ¸ionarelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
10 Aplicat ii ale super-rezolut iei 40
ˆImbun˘ at˘ at ¸ire video obi¸ snuit˘ a . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Camere de supraveghere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Diagnoz˘ a medical˘ a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Imagini din satelit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Bibliogra e 41
Index 47

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
1 Introducere
Generalit at i
Prelucrarea imaginilor digitale este un domeniu complex, dinamic, cu numeroase aplicat ¸ii ˆ ın
diverse domenii. Noile tehnologii folosite ˆ ın industria circuitelor integrate au permis apli-
carea a noi algoritmi ¸ si metode pentru extragerea informat ¸iilor utile din imagine: algoritmi
paraleli, clasificatoare bazate pe ret ¸ele neuronale, etc. Exist˘ a acum diverse implement˘ ari
de sisteme ˆ ın timp real, bazate pe prelucrarea de imagini, sisteme utilizate ˆ ın industria
militar˘ a, medicin˘ a, sisteme de control automat a proceselor industriale. S-au adus diverse
ˆ ımbun˘ at˘ at ¸iri pentru sisteme de procesare a amprentelor digitale, recunoa¸ sterea formelor, a
fet ¸ei, a textelor. Pentru zonele aglomerate sau de interes strategic au fost proiectate ¸ si im-
plementate sisteme de securitate ¸ si supraveghere bazate pe vederea artificial˘ a. Prelucrarea
imaginilor digitale reprezint˘ a un domeniu foarte larg, de sine st˘ at˘ ator. Acest domeniu are la
baz˘ a o teorie matematic˘ a riguroas˘ a, bine pus˘ a la punct, care implementat˘ a pe diverse ma¸ sini
de calcul este mare consumatoare de resurse mai ales atunci cˆ and ne referim la utilizarea
ˆ ın timp real a informat ¸iilor extrase din imagini [ ?].ˆIntr-un sens cˆ at mai general, o imagine
este o descriere a variat ¸iei unui parametru pe o suprafat ¸˘ a. Prelucrarea imaginilor poate fi
considerat˘ a ¸ si o ramur˘ a a prelucr˘ arii digitale de semnal. Prelucrarea imaginilor ¸ si ˆ ın general
prelucrarea digital˘ a a semnalelor presupune un consum relativ mare de resurse de calcul ¸ si
memorie. Implementarea algoritmilor specifici se poate face pe sisteme clasice (PC-uri) sau
pe sisteme dedicate de timp real numite procesoare digitale de semnal (DSP = Digital Signal
Processing ) [?].
Prelucrarea imaginilor include mai multe discipline:
•fotogrametria  si teledetect ia – constituie tehnici moderne de investigare a insta-
bilit˘ at ¸ilor incipiente ¸ si a alunec˘ arilor de teren pe arii largi prin intermediul ortofoto-
planului (imaginilor) ¸ si al modelului digital al terenului;
•vederea arti cial a (computer vision, robot vision);
•inteligent a arti cial a ;
•imagini generate de calculator .
Inteligent ¸a artificial˘ a ¸ si prelucrarea imaginilor sunt domenii ce se ˆ ıntrep˘ atrund [ ?]. Un
num˘ ar important din algoritmii folosit ¸i la prelucrarea imaginilor utilizeaz˘ a metode ¸ si tehnici
din domeniul inteligent ¸ei artificiale: ret ¸ele neuronale, logica fuzzy. Pe de alt˘ a parte, inteligent ¸a
artificial˘ a presupune proiectarea ¸ si construirea de sisteme capabile s˘ a realizeze funct ¸ii ale in-
telectului uman:
•ˆ ınv˘ at ¸area prin experient ¸˘ a;
•ˆ ınt ¸elegerea limbajului natural;
•utilizarea unui rat ¸ionament pentru rezolvarea unor probleme sau luarea unor decizii.
Toate acestea presupun ˆ ıns˘ a ¸ si acumularea unei anume cantit˘ at ¸i de informat ¸ie (baza
de cuno¸ stint ¸e, informat ¸ii din mediu etc.) rezultat˘ a ˆ ın urma exploat˘ arii imaginilor digitale.
Aceast˘ a informat ¸ie este preluat˘ a de sistemele inteligente prin intermediul senzorilor ¸ si creaz˘ a

5
o imagine a mediului ˆ ın momentul prelu˘ arii datelor. Din imaginea astfel obt ¸inut˘ a trebuie
extrase informat ¸iile utile. Aceste informat ¸ii sunt stocate ˆ ın cadrul sistemului de informat ¸ii
spat ¸iale sau Sistem Informatic Geografic (GIS). Un GIS este un ansamblu de persoane, echipa-
mente, programe, metode si norme avˆ and ca scop culegerea, validarea, stocarea, analiza ¸ si
vizualizarea datelor geografice [ ?]. Este un instrument implementat pe calculator pentru
realizarea h˘ art ¸ilor ¸ si analiza lucr˘ arilor ce exist˘ a ¸ si a evenimentelor ce se petrec pe p˘ amˆ ant.
Tehnologia GIS combin˘ a operat ¸iile uzuale de baze de date precum integrarea ¸ si analiza statis-
tic˘ a cu avantajele vizualiz˘ arii unice ¸ si analizei geografice oferite de c˘ atre h˘ art ¸i [ ?].
Situat ia actual a a temei de studiu
Tema dezvoltat˘ a poate fi structurat˘ a ˆ ın mai multe componente ¸ si anume:
1.preluarea ¸ si prelucrarea imaginilor digitale;
2.filtrarea neliniar˘ a ˆ ın prelucrarea imaginilor digitale;
3.restabilirea imaginilor.
La o analiz˘ a sumar˘ a a situat ¸iei actuale a temei dezvoltate se observ˘ a diferent ¸e mari ˆ ıntre
situat ¸ia pe plan internat ¸ional ¸ si cea nat ¸ional˘ a. Aceast˘ a diferent ¸˘ a este dat˘ a de:
•o anumit˘ a incoerent ¸˘ a a cadrului legislativ nat ¸ional;
•de faptul c˘ a nu exist˘ a structuri specializate cu sarcini precise ¸ si finant ¸are sustenabil˘ a;
•de inexistent ¸a unui sistem de informat ¸ii spat ¸iale unitar ¸ si eficient, cu o infrastructur˘ a
tehnologic˘ a ¸ si informatic˘ a modern˘ a ¸ si ment ¸inut˘ a.
Pentru a recupera r˘ amˆ anereaˆ ın urm˘ a este necesar˘ a o standardizare a modului de preluare,
procesare ¸ si stocare a datelor. Problema nu este legat˘ a de asigurarea platformei tehnologice
ci de crearea unitar˘ a a bazei de date ¸ si corelarea bazelor de date existente cu cea nou creat˘ a.
Riscul major, ˆ ın cazul ˆ ın care nu este realizat˘ a o proiectare adecvat˘ a este acela c˘ a poate
genera disfunct ¸ionalit˘ at ¸i, ineficient ¸˘ a, suprapuneri, litigii, cheltuieli inutile ¸ si costuri mari
pentru remedierea acestora. Pentru evitarea acestui risc este necesar˘ a realizarea de norme ¸ si
metodologii unitare ¸ si detaliate. ˆIn acest sens:
•ˆ ın luna mai 2007 a intrat ˆ ın vigoare Directiva 2007/2/CE privind stabilirea infras-
tructurii pentru informat ¸iile spat ¸iale ˆ ın cadrul Comunit˘ at ¸ii Europene (INSPIRE). IN-
SPIRE a fost init ¸iat˘ a din cauza lipsei de coordonare, lipsei standardelor, a datelor ¸ si
restrict ¸iilor politice privind geo-informat ¸iile necesare implement˘ arii politicilor comu-
nitare din domeniul mediului ¸ si al politicilor sau activit˘ at ¸ilor care ar putea avea impact
asupra mediului.
•ˆ ın data de 29 ianuarie 2010 a fost publicat˘ a ˆ ın Monitorul Oficial Ordonant ¸a de Guvern
nr. 66/2010 privind instituirea Infrastructurii Nat ¸ionale pentru Informat ¸ii Spat ¸iale ˆ ın
Romˆ ania ˆ ın vederea implement˘ arii Directivei INSPIRE. Transpunerea acestei directive
are un rol major pentru Romˆ ania, deoarece pune bazele cre˘ arii geo-portalului unic la
nivel nat ¸ional, geo-portalul INSPIRE, prin intermediul c˘ aruia se va asigura accesul la
informat ¸ia spat ¸ial˘ a din Romˆ ania. Portalul va fi creat atˆ at de institut ¸iile statului, cˆ at

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
¸ si de creatorii de date privat ¸i. De asemenea, acest geo-portal va reprezenta punctul
unic de acces la geo-portalul INSPIRE creat la nivel european ¸ si va asigura accesul
la informat ¸ia spat ¸ial˘ a pentru a putea lua decizii mult mai bune ˆ ın cadrul politicilor
de dezvoltare sectorial˘ a, politicilor de mediu, ˆ ın cazul intervent ¸iilor pentru situat ¸ii de
urgent ¸˘ a ¸ si pentru planificare urban˘ a.
Din punct de vedere al dezvolt˘ arii de tehnici de monitorizare pe plan nat ¸ional putem spune
c˘ a exist˘ a preocup˘ ari ¸ stiint ¸ifice, una dintre ele fiind chiar premiat˘ a la Salonul Internat ¸ional
de Inventic˘ a de la Hamburg, proiect intitulat TerraRisc. Proiectul TerraRisc (Suport de-
cizional pentru managementul riscului producerii de alunec˘ ari de teren ˆ ıntr-o zon˘ a geografic˘ a
expus˘ a la risc de catastrofe naturale), a fost gˆ andit s˘ a asigure suportul decizional pentru
managementul riscului producerii de alunec˘ ari de teren ˆ ıntr-o zon˘ a geografic˘ a expus˘ a la risc
de catastrofe naturale ¸ si a fost implementat de un consort ¸iu format din:
•Institutul pentru Tehnic˘ a de Calcul (ITC);
•Institutul de Proiectare ˆ ın Automatiz˘ ari (IPA);
•Facultatea de Geologie ¸ si Geofizic˘ a ¸ si Software din cadrul Universit˘ at ¸ii Bucure¸ sti;
•Sisteme Informatice BUCOVINA SA Suceava [ ?].
Structura lucr arii
Lucrarea este structurat˘ a ˆ ın xxxxxx capitole ce abordeaz˘ a din punct de vedere teoretic ¸ si
practic cˆ ateva dintre tehnicile avansate de filtrare neliniar˘ a ˆ ın prelucrarea imaginilor digitale.
Primul capitol, intitulat “Introducere” prezint˘ a concepte fundamentale privind imaginile
digitale ¸ si prelucrarea acestora. Pe lˆ ang˘ a aceasta se prezint˘ a stadiul actual al cunoa¸ sterii atˆ at
pe plan nat ¸ional cˆ at ¸ si internat ¸ional.
Al doilea capitol intitulat “Imaginea digital˘ a” abordeaz˘ a, din punct de vedere teoretic,
pe scurt, not ¸iuni generale legate de imaginea digital˘ a ¸ si anume: definit ¸ii, propriet˘ at ¸i, tipuri
(clase), moduri de reprezentare a imaginilor, modul de achizit ¸ionare a imaginilor analogice
¸ si transformarea acestora ˆ ın imagine digital˘ a. Sunt prezentate apoi cele mai utilizate mod-
uri de preluare a imaginilor digitale (prin exemplificarea celor mai importante echipamente
existente) ¸ si anume cu ajutorul platformelor satelitare, a platformelor aeriene ¸ si a sistemelor
de scanare terestre. ˆ ın continuare este prezentat pe scurt modul de preluare, memorare,
transmisie ¸ si compresie a imaginilor digitale. Urmeaz˘ a expunerea teoretic˘ a a modului de
prelucrare ¸ si transformare a imaginilor. ˆIn cadrul prezent˘ arii prelucr˘ arii imaginilor digi-
tale se abordeaz˘ a prelucrarea radiometric˘ a ¸ si cea geometric˘ a. Prelucr˘ arile radiometrice sunt
prelucr˘ ari pozit ¸ional invariante, se efectueaz˘ a operat ¸ii asupra nivelului de gri sau culoare a
planului imagine. Aceste prelucr˘ ari sunt specifice calibr˘ arii interne sau externe a senzorilor
de preluare (ˆ ın mod relativ sau absolut) ˆ ınt˘ aririi sau sl˘ abirii contrastului imaginii, filtr˘ arii
sau analizei imaginilor de prelucrat [8]. Conform [9] – problema corect ¸iilor radiometrice ˆ ın
teledetect ¸ie prezint˘ a anumite analogii cu cea a fotogramelor aeriene. S ¸i ˆ ın acest caz are loc un
transfer de energie de la suprafat ¸a p˘ amˆ antului, pˆ an˘ a la nivelul mediului magnetic de stocare
a informat ¸iei. Acest transfer este afectat de efectele perturbatoare ale mediilor traversate:
efectele atmosferei, zgomotul instrumental al senzorului ¸ si zgomotulˆ ınregistr˘ arii la sol. Trans-
form˘ arile geometrice sunt utilizate pentru aducerea la scara dorit˘ a a acestor imagini, precum

7
¸ si pentru modificarea rezolut ¸iei geometrice a imaginii de prelucrat. ˆ ın ˆ ıncheierea acestui
capitol sunt prezentate din punct de vedere teoretic urm˘ atoarele categorii de transform˘ ari de
imagine: transform˘ ari unitare ortogonale bidimensionale, sinusoidale, transformarea cosinus
discret˘ a, transformarea sinus discret˘ a, transformarea Hartley ¸ si transform˘ ari rectangulare.
Al treilea capitol intitulat “NNNNNNNNNNNNNN” abordeaz˘ a, din punct de vedere teo-
retic, cˆ ateva metode utilizate frecvent nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn.
Capitolul patru intitulat “NNNNNNNNNNNNNNN” abordeaz˘ a, din punct de vedere
teoretic, filtrele
Capitolul cinci intitulat “Utilizarea pachetului Matlab/Simulink ˆ ın studiul filtrelor uti-
lizate ˆ ın prelucrarea imaginilor digitale cu super rezolut ¸ie” abordeaz˘ a din punct de vedere
practic aplicabilitatea filtrelor neliniare ˆ ın mediul Matlab.

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
2 Imaginea digital a
Introducere
Tehnologia Digilal lmaging (imaginile digitale captate ¸ si prelucrate pe calculator) revolut ¸ioneaz˘ a
continuu arta fotografic˘ a. Majoritatea imaginilor pe care le vedem tip˘ arite au fost create
folosind tehnologii digitale. Prelucrarea digital˘ a se extinde de la un nivel primar al retu¸ s˘ arii
imaginilor noi. pˆ an˘ a la montajele fotografice foarte elaborate ¸ si prelucrate, utilizate curent
ˆ ın industria reclamelor.
Ce este imaginea?
Imaginea este un ansamblu de valori plasate dup˘ a o form˘ a spat ¸ial˘ a de dimenisune suprauni-
tar˘ a (plan, volum, etc, dar nu o dreapta).
Simplist, imaginea poate fi interpretat˘ a ca un tablou sau matrice [ ?].
Figure 1: Reprezentarea unei matrici.
La ˆ ınceput, imaginile sunt semnale, dar nu funct ¸ii temporale, ci funct ¸ii definite pe un
domeniu spat ¸ial. Orice imagine este o structur˘ a bidimensional˘ a (tablou, matrice) de date.
Un element al imagini se nume¸ ste pixel. Aceste date pot fi numere naturale, reale sau
complexe, reprezentate ˆ ıns˘ a pe un num˘ ar finit de bit ¸i [ ?]. Dup˘ a tipul datelor din acest˘ a
structur˘ a bidimensional˘ a, imaginile prelucrate pot fi ˆ ımp˘ art ¸ite ˆ ın mai multe categorii:
•imagini scalare, ˆ ın care fiecare component˘ a este un scalar:
{imaginile monocrome (ˆ ın care punctele au doar dou˘ a valori posibile, ce corespund
unui cont ¸inut binar al imaginii, ˆ ın general alb-negru) ;
{imaginile alb – negru (cu nivele de gri).
•imagini vectoriale, ˆ ın care fiecare component˘ a este un vector de numere. Imaginea
vectorial˘ a este compus˘ a din mai multe straturi de imagini scalare.
{o cazul particular cel mai de interes este acela al imaginilor color, ˆ ın care vectorul
are trei elemente (ce corespund celor trei constituente de baz˘ a ale oric˘ arei culori;
{tot ˆ ın imaginile vectoriale intr˘ a ¸ si imaginile stereo (o pereche de imagini ale
aceleia¸ si scene, luate din unghiuri diferite) ¸ si secvent ¸ele de imagini.

9
Ce fel de valori sunt ^ n imagine?
ˆIntr-o imagine ˆ ıntˆ alnim valori digitale – numere reprezentate cu un num˘ ar finit de bit ¸i, dup˘ a
un format standard pentru un calculator (digital). Este foarte important s˘ a ¸ stim c˘ a Digital
̸=Numeric . Rezultatul oric˘ arui calcul este numeric, dar nu orice num˘ ar este digital.
Care este elementul de baz a al unei imagini?
Elementul de baz˘ a al unei imagini este pixel. Pixelul, sau unitatea de imagine, este cel mai
mic element de pe o suprafat ¸˘ a de afi¸ sare, c˘ aruia i se poate atribui ˆ ın mod independent o
singur˘ a valoare a intensit˘ at ¸ii sau o culoare. Fiec˘ arui pixel i se va atribui un num˘ ar care va fi
asociat cu o culoare. Entit˘ at ¸ile grafice sunt construite din mult ¸imi de pixeli. Prin definit ¸ie
se alege originea imaginii, cu coordonatele (0,0), ˆ ın colt ¸ul stˆ anga sus a imaginii [ ?].
ˆIn analiza imaginilor digitale, un dispozitiv de achizit ¸ie converte¸ ste imaginea ˆ ıntr-un
num˘ ar discret de pixeli. Fiec˘ arui (x,y) i se atribuie o valoare a culorii ¸ si luminozit˘ at ¸ii.
Stocarea datelor se face ˆ ın matrici de tip ˆ ıntreg.
O imagine digital˘ a are urm˘ atoarele propriet˘ at ¸i:
•rezolut ¸ia unei imagini este num˘ arul de linii ¸ si coloane al matricii ˆ ın care este stocat˘ a
imaginea. Definit ¸ia unei imagini (engl. ”pixel depth”) indic˘ a num˘ arul de culori sau
nuant ¸e de gri care pot fi distinse ˆ ıntr-o imagine. Definit ¸ia mai ˆ ınseamn˘ a num˘ arul de
bit ¸i folosit ¸i pentru codificarea intensit˘ at ¸ii fiec˘ arui pixel. Pentru o definit ¸ie n, un pixel
poate lua 2 nvalori diferite. Spre exemplu, pentru n= 8 un pixel poate lua 256 valori
diferite, ˆ ın domeniul [0,255], pentru n=16 un pixel poate lua 65536 valori diferite ˆ ın
domeniul[0,65535] sau [ -32768, 32767].
•num˘ arul de plane ale unei imagini este num˘ arul de matrici care compun imaginea. O
imagine ˆ ın niveluri de gri sau pseudo-color este compus˘ a dintr-un singur plan, pe cˆ and
o imagine color (engl. ” true color ”) este compus˘ a din trei plane (ro¸ su, verde ¸ si albastru,
RGB).
ˆIn imaginile cu nuant ¸e de gri, cele trei valori ale unui pixel, atribuite culorilor ro¸ su, verde,
albastru sunt combinate pentru a conduce la o singur˘ a valoare. Aceast˘ a valoare este recon-
vertit˘ a ˆ ın ro¸ su/verde/albastru la afi¸ sajul pe monitor. Acest˘ a conversie este efectuat˘ a de o
tabel˘ a de echivalare a nuant ¸elor de gri cu culorile, numit˘ a palet˘ a sau, ˆ ın limba englez˘ a, ” Look
Up Table ” (LUT). ˆIn cazul imaginilor ˆ ın culori ( true color ) intensit˘ at ¸ile pentru culorile de
baz˘ a ro¸ su/verde/albastru sunt codificate de trei valori diferite. Imaginea este o combinat ¸ie
a trei matrici de pixeli corespunz˘ atoare celor trei componente.
Exist˘ a patru tipuri (clase) de imagini digitale:
1.alb-negru (b/w), cu un bit per pixel;
2.ˆ ın nuant ¸e de gri, 8 bit ¸i per pixel (256 nivele de gri) sau 16 bit ¸i per pixel (65536 nivele
de gri);
3.color (32 biti, cˆ ate 8 pentru fiecare culoare de baz˘ a plus ˆ ınc˘ a opt pentru a¸ sa numitul
canal alfa);
4.complexe.

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
Pentru toate tipurile de imagini exist˘ a mai multe formate de stocare, dup˘ a firma sau
asociat ¸ia profesional˘ a care le-a definit (TIFF, GIF, JPG, BMP, TGA, DICOM, etc.). Struc-
tura tipic˘ a a unui sistem de prelucrare ¸ si analiz˘ a a imaginilor este prezentat˘ a ˆ ın figura 2.
Figure 2: Reprezentarea unei matrici.
Preluarea imaginilor digitale
Imaginile preluate de la mare ˆ ın˘ alt ¸ime (din avion sau satelit) permit utilizatorului o vedere
de ansamblu, iar atunci cˆ and rezolut ¸ia o permite, asigur˘ a ment ¸inerea nivelului de detaliere
necesar pentru aprecierea modific˘ arilor intervenite ˆ ın natur˘ a.
Platforme satelitare
Satelit ¸ii p˘ amˆ antului, ˆ ın zbor liber, se ment ¸in pe orbite pentru o perioad˘ a de operat ¸ionalitate
de cˆ ateva luni sau ani, ˆ ın funct ¸ie de altitudinea la care opereaz˘ a.
Platforme aeriene
Platformele aeriene sunt platforme aeropurtate (elicopter sau avion) prev˘ azute cu senzori
optico-mecanici sau opto-electronici de mare rezolut ¸ie. Funct ¸ie de pozit ¸ia senzoruluiˆ ın timpul
prelu˘ arii fotogramele pot fi nadirale, ˆ ınclinate sau panoramice. Atunci cˆ and senzorul este un
sistem radar se poate vorbi de radargrametrie iar cˆ and imaginile exploatate sunt holograme,
se vorbe¸ ste de hologrametrie. ˆ ın continuare sunt prezentate cele mai semnificative platforme
aeriene aflate ˆ ın exploatare.
Platforme terestre
Platformele terestre pot fi fixe (laser scanner, stat ¸ii totale cu preluare de imagine ¸ si camere
digitale) sau mobile (sisteme integrate de pozit ¸ionare).
Memorarea, transmisia  si compresia imaginilor digitale
Memorarea imaginilor digitale
Memorarea digital˘ a pentru aplicat ¸ii de prelucrare de imagini poate fi clasificat˘ a ˆ ın trei cate-
gorii principale:
•memorarea pe termen scurt pentru nevoile proces˘ arii propriu-zise;

11
•memorarea on-line pentru accesare relativ rapid˘ a a imaginilor;
•memorarea ˆ ın vederea arhiv˘ arii, caracterizat˘ a prin faptul c˘ a accesul la imagini este mai
put ¸in frecvent.
Transmisia imaginilor digitale
Problema comunicat ¸iei ˆ ın prelucrarea digital˘ a de imagini implic˘ a, pe de o parte, comunicarea
local˘ a ˆ ıntre sisteme de prelucrare ¸ si comunicarea la distant ¸e mari, pe de alt˘ a parte. Hard-ul ¸ si
soft-ul pentru comunicat ¸ii locale este oferit, ˆ ın general, de facilit˘ at ¸ile ret ¸elelor de calculatoare,
cu toate c˘ a rata de transmisie necesar˘ a pentru imagini este mult mai mare decˆ at pentru
alte tipuri de transmisii de date. Pentru comunicat ¸ia cu mediul (inclusiv cu utilizatorul
uman), calculatorul electronic dispune de un sistem de intrare care asigur˘ a transferul de date
din exterior c˘ atre unitatea central˘ a de prelucrare (sau c˘ atre memoria principal˘ a) ¸ si de un
sistem de ie¸ sire care realizeaz˘ a transferul de date de la UCP (sau de la memoria principal˘ a)
spre exterior. Sistemele de intrare ¸ si de ie¸ sire (pe scurt I/E sau I/O: Input/Output) includ
o mare diversitate de aparate ¸ si dispozitive grupate sub numele de echipamente periferice.
Transferul de date dintre echipamentele periferice ¸ si calculatorul propriu-zis se realizeaz˘ a prin
intermediul unor conexiuni care asigur˘ a leg˘ atura cu magistralele (bus-urile) calculatorului.
ˆIn funct ¸ie de sensul ˆ ın care se face transferul de date, comunicarea dintre calculator ¸ si
echipamentul periferic poate fi:
•Half duplex, la care transferul se face la un moment dat numai ˆ ıntr-un singur sens (fie
de la calculator la periferic, fie de la periferic la calculator);
•Full duplex, la care transferul se face simultan ˆ ın ambele sensuri;
ˆIn funct ¸ie de num˘ arul de bit ¸i transportat ¸i simultan printr-o conexiune, exist˘ a:
•transmisie paralel˘ a, prin care, la un moment dat, este transportat simultan un grup de
bit ¸i (de regul˘ a, grupul este format din 8 bit ¸i de date, plus unul sau mai mult ¸i bit ¸i de
control);
•transmisie serial˘ a, prin care, la un moment dat, este transportat un singur bit.
Pentru c˘ a bus-ul calculatorului este, de regul˘ a, paralel, transmisia serial˘ a presupune con-
versia din paralel ˆ ın serial ¸ si invers, ceea ce se realizeaz˘ a prin intermediul unui circuit denumit
prescurtat UART (Universal Asynchronous Receiver/Transmitter).
Compresia imaginilor digitale
Termenul de compresie se refer˘ a la totalitatea metodelor ce au drept scop reducerea cantit˘ at ¸ii
de date necesare pentru reprezentarea unei imagini. Compresia este folosit˘ a ˆ ın special pentru
stocarea sau transmiterea imaginilor. S˘ a consider˘ am cazul unei imagini de dimensiune 512 ×
512 pixeli. Dac˘ a aceasta este o imagine ˆ ın tonuri de gri, iar fiecare pixel este codat cu 8 bit ¸i,
atunci cantitatea de date necesar˘ a pentru a reprezenta aceast˘ a imagine este: 512 ×512×8 =
29×29×23= 221≈2Mb.
Din acest calcul ne putem da seama c˘ a pentru a stoca o imagine avem nevoie de spat ¸iu
considerabil, iar pentru transmiterea ei avem nevoie de un canal de transmisiune de band˘ a
larg˘ a, de care nu dispunem ˆ ıntotdeauna.
Metodele de compresie se pot clasifca astftel:

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
•Metode de compresie la nivel de pixel – aceste metode nu t ¸in cont de corelat ¸ia care
exist˘ a ˆ ıntre pixelii vecini, codˆ and fiecare pixel ca atare. Acest tip de compresie este f˘ ar˘ a
pierdere de informat ¸ie, adic˘ a imaginea init ¸ial˘ a poate fi ref˘ acut˘ a perfect din imaginea
comprimat˘ a. Exemple de astfel de metode:
{codarea Huffman;
{codarea LZW (Lempel-Ziv-Walsh);
{codarea RLE (Run Length Encoding).
•Metode de compresie predictive – aceste metode realizeaz˘ a compresia folosind corelat ¸ia
care exist˘ a ˆ ıntre pixelii vecini, dintr-o imagine. Exemple de astfel de metode:
{codarea cu modulat ¸ie “delta”;
{codarea DPCM (Diferent ¸ial Pulse Code Modulation).
•Metode de compresie cu transformate – aceste metode se bazeaz˘ a pe scrierea imaginii
ˆ ıntr-o alt˘ a baz˘ a, prin aplicarea unei transform˘ ari unitare, a.ˆ ı. energia imaginii s˘ a fie
concentrat˘ a ˆ ıntr-un num˘ ar cˆ at mai mic de coeficient ¸i.
•Alte metode de compresie:
{cuantizarea vectorial˘ a;
{codarea folosind fractali;
{codarea hibrid˘ a.

13
******************************************************
******************************************************
********************************************************
*********************************************************
Pentru a prezenta conceptul de super-rezolut ¸ie trebuie ca mai ˆ ıntˆ ai s˘ a ˆ ınt ¸elegem ce este
rezolut ¸ia unei imagini, respectiv ce este un pixel. Imaginile digitale sunt create cu ajutorul
unui senzor optic format din celule (fotodiode) ce transform˘ a orice impuls luminos receptat
ˆ ıntr-un semnal electric ce este apoi amplificat ¸ si transformat ˆ ın intensitatea luminoas˘ a a unui
pixel [89]. Un pixel poate fi definit ca fiind cea mai mic˘ a unitate component˘ a a unei imagini.
Rezolut ¸ia reprezint˘ a num˘ arul de pixeli dintr-o imagine ¸ si este prezentat˘ a sub forma: num˘ ar
de pixeli pe vertical˘ a ×num˘ ar de pixeli pe orizontal˘ a, de exemplu 600 ×800. Uneori ea
mai apare ¸ si ca produsul dintre cele dou˘ a numere, folosindu-se o supraunitate a pixelului ¸ si
anume Megapixelul, adic˘ a un milion de pixeli [89]. A¸ sadar, cu cˆ at rezolut ¸ia unei imagini este
mai mare, cu atˆ at aceasta reprezint˘ a mai fidel obiectele ce au fost capturate ¸ si cont ¸ine mai
mult˘ a informat ¸ie.
Rezolut ¸ia se refer˘ a de asemenea la capacitatea senzorului optic de a m˘ asura pˆ an˘ a ¸ si cele
mai mici obiecte, lucru care este direct dependent de m˘ arimea pixelului [90]. A¸ sadar prin
super-rezolut ¸ie ne referim la ˆ ımbun˘ at˘ at ¸irea rezolut ¸iei unei imagini prin alte metode decˆ at
celehardware pentru o calitate cˆ at mai bun˘ a a imaginii ¸ si pentru a extrage informat ¸ii cˆ at
mai precise asupra obiectului observat [92].
De¸ si tehnologia care st˘ a la baza captur˘ arii imaginilor digitale se dezvolt˘ a exponent ¸ial, pe
zi ce trece apar noi sisteme optice capabile de a captura o imagine cu o rezolut ¸ie de pˆ an˘ a la
4096×2160 pixeli [93], acestea totu¸ si necesit˘ a o dimensiune mare de spat ¸iu de stocare, lucru
ce face ca problema obt ¸inerii unei imagini cu super-rezolut ¸ie dintr-o imagine cu rezolut ¸ie
normal˘ a sau sc˘ azut˘ a s˘ a fie ˆ ınc˘ a una de actualitate. De asemenea sistemele de supraveghere
tind s˘ a sacrifice rezolut ¸ia ˆ ın favoarea unei perioade de funct ¸ionare mai lung˘ a.
O alt˘ a zon˘ a ˆ ın care se dore¸ ste o imagine cˆ at mai bun˘ a este imagistica satelitar˘ a, dorin-
du-se bineˆ ınt ¸eles o imagine cˆ at mai clar˘ a a zonei studiate [94]. Cˆ and vorbim de astfel de
imagini, puterea de magnificare a satelitului are o limitare, iar cˆ and aceasta este atins˘ a ˆ ınc˘ a
sunt cazuri ˆ ın care se dore¸ ste ˆ ımbun˘ at˘ at ¸irea calit˘ at ¸ii imaginii. Imagistica medical˘ a este de
asemenea un domeniu ˆ ın care se doresc o rezolut ¸ie ¸ si respectiv o calitate a imaginii cˆ at mai
ridicate, pentru a ajunge la un diagnostic corect, iar radiat ¸ia la care este supus pacientul
s˘ a fie minim˘ a [96]. Luˆ and ˆ ın considerare cele de mai sus ˆ ımbun˘ at˘ at ¸irea rezolut ¸iei este ˆ ınc˘ a
dorit˘ a ˆ ın multe domenii, iar prin alte metode decˆ at cele hardware care pot deveni costisitoare
¸ si care pot ˆ ımbun˘ at˘ at ¸i rezolut ¸ia ˆ ıns˘ a pˆ an˘ a la un anumit punct. Pentru a folosi conceptul de
algoritmi single-frame ˆ ın obt ¸inerea super-rezolut ¸iei este nevoie s˘ a elabor˘ am not ¸iunile single-
frame ¸ simulti-frame . Conceptul de multi-frame const˘ a ˆ ın folosirea a mai multor imagini cu
rezolut ¸ie sc˘ azut˘ a ale aceluia¸ si cadru pentru a forma o imagine cu super-rezolut ¸ie. Pentru a
face acest lucru se folose¸ ste de obicei o metod˘ a numit˘ a sub-pixel alignment ce este prezentat˘ a
ˆ ın Figura 3 [90].
Figura 3 ilustreaz˘ a sumar procedeul prin care este obt ¸inut˘ a o imagine ˆ ımbun˘ at˘ at ¸it˘ a ca-
litativ din trei imagini ale aceluia¸ si cadru. ˆIn partea din stˆ anga se afl˘ a cele trei imagini
init ¸iale, iar cu ajutorul unor tehnici de super-rezolut ¸ie ce includ sub-pixel alignment se obt ¸ine
imaginea din dreapta.

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
Figure 3: Metoda multi-frame
3 Istoric tehnic
Ast˘ azi, cei mai folosit ¸i senzori de imagine sunt CCD ( charge-coupled devices ) ¸ si CMOS
(complementary metal oxide semiconductors ) [95, 98], iar pentru a obt ¸ine o imagine cu o
rezolut ¸ie ˆ ınalt˘ a una dintre solut ¸ii ar fi s˘ a dezvolt˘ am dipozitive optice mai avansate. O metod˘ a
ar fi reducerea m˘ arimii unui pixel, ˆ ıns˘ a acest lucru afecteaz˘ a cantitatea de lumin˘ a disponi-
bil˘ a, a¸ sadar ar trebui m˘ arit˘ a senzitivitatea senzorului, iar calitatea imaginii va fi afectat˘ a de
zgomotul de imagine numit shot noise [97].
Figure 4: Zgomot de imagine
Mai mult decˆ at atˆ at, modele de a¸ sezare a pixelilor non-rectangulare, cum ar fi modelul
hexagonal super CCD de la Fijifilm sau modelul transfer-ortogonal CCD au fost folosite
pentru a ˆ ımbun˘ at˘ at ¸i spatial sampling rate [98]. Alte metode includ m˘ arirea chip-ului sau a
lungimii focale, ˆ ıns˘ a aceasta ar cauza o cre¸ stereˆ ın capacitant ¸˘ a, respectiv a m˘ arimii ¸ si greut˘ at ¸ii
camerelor. A¸ sadar aceste metode sunt considerate ineficiente datorit˘ a limit˘ arilor impuse de
industria optic˘ a actual˘ a ¸ si de cea a product ¸iei de senzori [4]. ˆIn comparat ¸ie cu CMOS-
urile, CCD-urile au avantaje ˆ ın ceea ce prive¸ ste minimizarea zgomotului, rezolut ¸ia imaginii,
senzitivitatea senzorilor ¸ si dezvoltarea tehnologic˘ a [95]. Din p˘ acate camerele bazate pe CCD
au pret ¸uri ridicate a¸ sadar tehnologiile bazate pe CMOS sunt din ce in ce mai investigate.
Senzorii CMOS ¸ stiint ¸ifici – sCMOS ofer˘ a o rezolut ¸ie mai mare ¸ si o rat ¸ie semnal-zgomot
(SNR) mare, ˆ ıns˘ a utilizarea practic˘ a r˘ amˆ ane o provocare. Per total, datorit˘ a limit˘ arilor
tehnologiilor hardware , cercetarea ˆ ımbun˘ at˘ at ¸irii rezolut ¸iei prin metode software este ˆ ınc˘ a o
necesitate. Avˆ andˆ ın vedere conceptele super-rezolut ¸iei, prima problem˘ a care trebuie adresat˘ a

15
este cea a obt ¸inerii unei imagini cu super-rezolut ¸ie din mai multe imagini observate a c˘ aror
rezolut ¸ie este sc˘ azut˘ a. ˆIn general, dac˘ a exist˘ a destul˘ a informat ¸ie ˆ ın imaginile cu rezolut ¸ie
sc˘ azut˘ a, obt ¸inerea unei imagini cu super-rezolut ¸ie este fezabil˘ a [96,99]. ˆIns˘ a acest lucru este
posibil doar dac˘ a imaginile observate cu rezolut ¸ie sc˘ azut˘ a nu pot fi obt ¸inute una din cealalt˘ a
prin ree¸ santionare ( resampling ) sau transform˘ ari ca translat ¸ii/rotat ¸ii, altfel nu se pot obt ¸ine
rezultate eficiente. Pentru a implementa ˆ ıntr-o aplicat ¸ie conceptul de super-rezolut ¸ie, s-a
ˆ ıncercat obt ¸inerea unei imagini prin modificarea ¸ si controlarea hardware -ului. Senzorii pot fi
setati ˆ ın a¸ sa fel ˆ ınc˘ at s˘ a extrag˘ a informat ¸ii cu un a¸ sa numit sub-pixel displacement sau mai
multe ”priviri” asupra aceleia¸ si scene. Agent ¸ia spat ¸ial˘ a francez˘ a ne poate oferi una dintre
cele mai de succes cazuri ˆ ın domeniul imaginilor prin satelit, aceasta folosind un senzor CCD
ˆ ın satelitul SPOT-5 ce poate ˆ ıncorpora dou˘ a CCD-uri a cˆ ate 12.000 pixeli fiecare [99]. Cele
dou˘ a CCD-uri sunt desincronizate cu cˆ ate o jum˘ atate de pixel pe vertical˘ a ¸ si orizontal˘ a. Din
moment ce ambii senzori pot captura imagini ˆ ın acela¸ si moment, se poate obt ¸ine un set de
date cu doar o decalare de jum˘ atate de pixel, informat ¸ie ce poate fi procesat˘ a cu ajutorul
unor tehnici de super-rezolut ¸ie pentru a obt ¸ine o imagine cu o rezolut ¸ie ridicat˘ a calitativ mai
bun˘ a. Camerele Leica ADS40 folosesc un mecanism similar celui de pe SPOT-5 [8]. Mai
mult decˆ at atˆ at, folosind pixeli CCD compu¸ si din sub-pixeli cu forme ¸ si organiz˘ ari diferite se
pot obt ¸ine imagini cu super-rezolut ¸ii ˆ ımbun˘ at˘ at ¸ite [100].

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
4 Tehnologii  si metode pentru obt inerea imaginilor cu
super-rezolut ie
Urmeaz˘ a s˘ a discut˘ am metodele principale de obt ¸inere a unei imagini cu super-rezolut ¸ie
din mai multe observat ¸ii cˆ at ¸ si dificult˘ at ¸ile ˆ ıntˆ ampinate ˆ ın folosirea lor. Problema principal˘ a
este modul ˆ ın care este folosit˘ a informat ¸ia suplimentar˘ a din multiplele observat ¸ii. ˆIn anul
1964 J.L. Harris, ˆ ın lucrarea sa: ”Diffraction and resolving power” [3] a stabilit o fundat ¸ie
teoretic˘ a pentru abordarea super-rezolut ¸iei introducˆ and teoreme ce pot fi folosite pentru a
rezolva problema difract ¸iei ˆ ıntr-un sistem optic. Douazeci de ani mai tarziu, R.Y. Tsai ¸ si
T.S. Huang [1] au abordat pentru prima dat˘ a ideea de super-rezolut ¸ie pentru a ˆ ımbun˘ at˘ at ¸i
imaginile provenite de la Landsat TM. De atunci super-rezolut ¸ia a devenit un subiect de
interes pentru mult ¸i cercet˘ atori, atˆ at pe plan teoretic cˆ at ¸ si practic. Tehnicile de super-
rezolut ¸ie au fost dezvoltate ¸ si ˆ ımbun˘ at˘ at ¸ite de mai bine de trei decenii, iar progresele f˘ acute
pot fi rezumate dup˘ a cum urmeaz˘ a.
La ˆ ınceput majoritatea metodelor se bazau pe domeniul de frecvent ¸˘ a [1]. Algoritmii
ce se folosesc de domeniul de frecvent ¸˘ a funct ¸ioneaz˘ a prin a crea o leg˘ atur˘ a ˆ ıntre imaginile
cu rezolut ¸ie ˆ ınalt˘ a (HR) ¸ si cele observate cu rezolut ¸ie sc˘ azut˘ a (LR) bazat˘ a pe cˆ ateva baze
teoretice simple ¸ si avˆ and o eficient ¸˘ a computat ¸ional˘ a ridicat˘ a. ˆIns˘ a chiar ¸ si aceste metode au
limi˘ ari ˆ ın ceea ce prive¸ ste procesarea unor imagini cu mi¸ sc˘ ari complexe.
Datorit˘ a inconvenientelor algoritmilorˆ ın domeniul frecvent ¸ei, metodeleˆ ın domeniul spat ¸ial
(spatial domain ) au devenit principalul subiect [4]. Principalele metode includ iterative back-
projection (IBP) [6], projection onto convex sets (POCS) [5], metodele regularizate ¸ si o mul-
titudine de algoritmi hibrid [2]. Primele lucr˘ ari elaborate ofer˘ a descrieri ¸ si explicat ¸ii ale aces-
tor metode. Printre acestea, metodele regularizate sunt cele mai populare datorit˘ a eficient ¸ei
¸ si flexibilit˘ at ¸ii, de aceea cele mai recente studii in domeniul super-rezolut ¸iei s-au axat pe
framework -uri regularizate [4]. Din aceast˘ a cauz˘ a o s˘ a ne orient˘ am atent ¸ia c˘ atre evolut ¸ia
metodelor regularizate, ˆ ın special ˆ ın ultimii zece ani. De asemenea o s˘ a facem o scurt˘ a
trecere peste progresul algoritmilor de optimizare si set˘ arii parametrilor ( parameter setup ).
Modelul observat ional
Modelul observat ¸ional prezint˘ a modul ˆ ın care au fost obt ¸inute imaginile cu rezolut ¸ie sc˘ azut˘ a
(LR) ¸ si modeleaz˘ a parametrii care transform˘ a imaginea cu rezolut ¸ie ˆ ınalt˘ a (HR) ˆ ın imaginea
LR. Modelul observat ¸ional este esent ¸ial ˆ ın obt ¸inerea super-rezolut ¸iei cˆ and vine vorba de un
cadru regularizat. ˆInainte de a ˆ ıncepe procesul reconstruct ¸iei trebuie s˘ a ne ˆ ındrept˘ am atent ¸ia
c˘ atre procesul prin care este obt ¸inut˘ a imaginea. Acesta poate fi influent ¸at de diver¸ si factori
externi cum ar fi mi¸ scarea, difract ¸ia optic˘ a, zgomotul de imagine sau under-sampling -ul.ˆIn
general lu˘ am ˆ ın considerare ca factori ce influent ¸eaz˘ a imaginea obt ¸inut˘ a zgomotul, efectul de
blur,warping -ul ¸ si down-sampling -ul, ajungˆ and la urm˘ atorul model observat ¸ional:
yk=OkDkBkMkz+nk, (1)
unde sunt folosite kimagini init ¸iale cu rezolut ¸ie sc˘ azut˘ a. Fie N1k×N2km˘ arimea imagi-
nii init ¸iale k, iar L1kN1k×L2kN2km˘ arimea imaginii reconstruite influent ¸at˘ a de factorii de
m˘ arire orizontal˘ a ¸ si vertical˘ a L1k, respectiv L2k.ˆIn (1) z este forma vectorial˘ a a imaginii
reconstruite cu o dimensiune de L1kN1kL2kN2k×1, adic˘ a z= [z1, z2,···, zL1kN1kL2kN2k]T, ¸ si
yk= [yk;1, yk;2,···, yk;N1kN2k]Teste vectorul imaginii kobt ¸inute. Dkeste matricea de down-

17
sampling de m˘ arime N1kN2k×L1kN1kL2kN2k,Bkeste operatorul de blurring de m˘ arime
L1kN1kL2kN2k×L1kN1kL2kN2k, iarMkeste matricea de warp ce descrie informat ¸ia de mi¸ scare
(translat ¸ii, rotat ¸ii,etc.). nk(N1kN2k×1) reprezint˘ a zgomotul de imagine. Okeste operatorul
care exclude pixelii neobservabili din imaginea k[7–9]. ˆIn acest fel putem aborda atˆ at prob-
lema super-rezolut ¸iei cˆ at ¸ si pe cea a reconstruct ¸iei p˘ art ¸ilor lips˘ a dac˘ a imaginile init ¸iale sunt
afectate. Din (1) se poate obt ¸ine modelul observat ¸ional pentru super-rezolut ¸ie single-frame
dac˘ a egal˘ am kcu 1. Dac˘ a MksiDksunt excluse acesta devine un model pentru restau-
rarea imaginilor afectate de zgomot, blurring sau informat ¸ie lips˘ a. Mai jos avem o schem˘ a a
modelului observat ¸ional:
Figure 5: Modelul observat ¸ional
Algoritmi de super-rezolut ie
ˆIn continuare vom prezenta principalii algoritmi de obt ¸inere a super-rezolut ¸iei atˆ at single-
frame cˆ at ¸ si multi-frame .
Metode bazate pe interpolare
Interpolarea este procesul de estimare a unor pixeli noi printre pixelii deja obt ¸inut ¸i ai unei
imagini. Aceste tehnici s-au dovedit a fi eficiente ˆ ın multe cazuri practice, fiind unele dintre
cele mai u¸ soare metode de a m˘ ari rezolut ¸ia unei imagini. Multe dintre software -urile com-
erciale, cum ar fi PhotoZoom Pro ,Qimage ,Genuine Fractals sau chiar Photoshop folosesc
metode de interpolare pentru a modifica m˘ arimea unei imagini. Algoritmii de interpolare in-
clud trei mari pa¸ si in obt ¸inerea super-rezolut ¸iei, dup˘ a cum urmeaz˘ a: ˆ ınregistrare, interpolare
¸ si restaurare. Primul pas este procesul de aliniere a tuturor imaginilor obt ¸inute din punct
de vedere geometric, folosind ca referint ¸˘ a o imagine predefinit˘ a numit˘ a imagine de referint ¸˘ a.
Imaginile obt ¸inute pot suferi de rotat ¸ii, translat ¸ii sau sub-pixel displacement , a¸ sadar trebuie
aliniate, astfel ˆ ıncˆ at parametrii de mi¸ scare s˘ a fie aproximat ¸i corect ˆ ınainte de a ˆ ıncerca s˘ a
le unim pentru a crea o imagine cu super-rezolut ¸ie. Estim˘ ari incorecte ale parametrilor de
mi¸ scare pot conduce la o imagine cu super-rezolut ¸ie ce cont ¸ine diverse artefacte vizuale ce
se pot accentua de la o imagine la alta. ˆInregistrarea are loc fie ˆ ın domeniul spat ¸ial fie ˆ ın
domeniul frecvent ¸ei. Domeniul frecvent ¸ei este descris ˆ ın am˘ anunt ˆ ın sect ¸iunea urm˘ atoare.

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
Domeniul spat ¸ial are de asemenea varii metode de a estima mi¸ scarea, Keren et al. [10] au pro-
pus un algoritm bazat pe seria Taylor ce estimeaz˘ a parametrii de mi¸ scare cu precizie de sub-
pixel. J.R. Bergen ¸ si asociat ¸ii [11] au propus un cadru ierarhic pentru estimarea parametrilor
de mi¸ scare cum ar fi metode planare sau afine. Peleg ¸ si Irani [6] au dezvoltat o modalitate
interactiv˘ a cu multiple rezolut ¸ii pentru estimarea parametrilor de mi¸ scare. Pentru estimarea
acestor parametri unele metode mapeaz˘ a ˆ ıntreaga imagine, iar altele doar anumite caracter-
istici ce sunt comune printre imaginile cu rezolut ¸ie sc˘ azut˘ a [12]. Unele metode estimeaz˘ a
atˆ at imaginea cu super-rezolut ¸ie cˆ at ¸ si parametrii de mi¸ scare folosind metode Bayesiane, una
din aceste metode este explicat˘ a de Hardie et al. [13]. Mai recent, G. Botella ¸ si asociat ¸ii au
prezentat o metod˘ a de aproximare bazat˘ a pe gradient [14].
Pe lˆ ang˘ aˆ ınregistrare, un rol importantˆ ın estimarea unei imagini cu super-rezolut ¸ieˆ ıl joac˘ a
interpolarea. Exist˘ a foarte multe metode de interpolare, iar complexitatea fiec˘ areia const˘ a
ˆ ın num˘ arul de pixeli adiacent ¸i folosit ¸i pentru a estima pixelii nou creat ¸i (intermediari). Cele
mai cunoscute metode de interpolare sunt: cel mai apropiat vecin ( nearest neighbor ), metode
biliniare si bicubice. Cel mai apropiat vecin este cea mai simpl˘ a metod˘ a de interpolare
ce const˘ a ˆ ın folosirea celor mai apropiat ¸i pixeli de pixelul pe care dorim s˘ a ˆ ıl aproxim˘ am.
Aceasta are ˆ ıns˘ a un mare dezavantaj, ¸ si anume tr˘ as˘ aturi liniare sub forma de treapt˘ a vizibile
ˆ ın imaginea cu super-rezolut ¸ie. EXEMPLU POZA URMEAZA IN ANEXA Metoda biliniar˘ a
calculeaz˘ a o medie a celor mai apropiat ¸i 2 ×2 pixeli vecini pentru a estima valoarea pixelului
interpolat. Analog, metoda bicubic˘ a folose¸ ste cei mai apropiat ¸i 4 ×4 pixeli pentru a es-
tima valoarea pixelului interpolat. ˆIn ambele metode pixelii mai apropiat ¸i de pixelul estimat
au un procentaj mai ridicat ˆ ın estimarea acestuia. Deoarece translat ¸iile dintre imaginile cu
rezolut ¸ie sc˘ azut˘ a sunt inegale, este nevoie de metode neuniforme de interpolare pentru a folosi
toate imaginile cu rezolut ¸ie sc˘ azut˘ a ˆ ın cea cu super-rezolut ¸ie. ˆIn 1992 Ur ¸ si Gross [15] au
dezvoltat o metod˘ a de interpolare neuniform˘ a pentru un set de imagini translatate folosind
o teorem˘ a generalizat˘ a de multi-channel sampling . Exist˘ a multe alte metode complexe de
interpolare folosite pentru a redimensiona o singur˘ a imagine, cum ar fi: Cubic B-spline [16],
New Edge-Directed Interpolation (NEDI) [17], ¸ si Edge-Guided Interpolation (EGI) [18]. Pe
scurt, metoda Cubic B-spline cuprinde port ¸iuni ale unei curbe continue ce trece prin an-
umite puncte. Fiecare din acele puncte reprezint˘ a procentaje, iar acele procentaje sunt
coeficient ¸ii unui polinom de gradul trei. Rolul metodei este de a calcula acele procentaje
folosite ulterior pentru a obt ¸ine imaginea cu super-rezolut ¸ie. NEDI [17] este o metod˘ a de
interpolare direct ¸ional adaptiv˘ a bazat˘ a pe covariant ¸˘ a ˆ ın care pixelii interpolat ¸i sunt estimat ¸i
cu coeficient ¸ii locali ai covariant ¸ei imaginii cu rezolut ¸ie sc˘ azut˘ a bazat ¸i pe dualitatea geomet-
ric˘ a dintre covariant ¸a imaginii cu rezolut ¸ie sc˘ azut˘ a ¸ si imaginea cu super-rezolut ¸ie. EGI [18]
divide vecin˘ atatea fiec˘ arui pixel ˆ ın dou˘ a subseturi de observat ¸ie ˆ ın dou˘ a direct ¸ii ortogonale.
Fiecare subset de observat ¸ie aproximeaz˘ a un pixel lips˘ a. Algoritmul apoi contope¸ ste cele
dou˘ a valori aproximate ˆ ıntr-o estimare mai robust˘ a folosind estimarea liniar˘ a MMSE ( min-
imum mean square error ). Alte metode de interpolare cuprind interpolarea Gradient-Based
Adaptive (GBA) [19] ¸ si modelul de interpolare autoregresiv [20]. Aceste metode sunt extrem
de eficiente ¸ si conserv˘ a majoritatea informat ¸iei din imagine, ˆ ıns˘ a timpul de procesare ¸ si costul
computat ¸ional sunt mai mari fat ¸˘ a de metodele clasice.
Pa¸ sii de ˆ ınregistrare, interpolare ¸ si restaurare aferent ¸i metodei de super-rezolut ¸ie pot
fi sust ¸inut ¸i iterativ petru a obt ¸ine o imagine cu super-rezolut ¸ie din mai multe imagini cu
rezolut ¸ie sc˘ azut˘ a prin metoda Iterative Back Projection (IBP) [6]. ˆIn aceast˘ a metod˘ a imag-
inea cu super-rezolut ¸ie este estimat˘ a prin a minimiza iterativ eroarea dintre imaginile cu
rezolut ¸ie sc˘ azut˘ a observate ¸ si cele simulate. Aceast˘ a metod˘ a este foarte simpl˘ a ¸ si u¸ sor de

19
ˆ ınt ¸eles, ˆ ıns˘ a nu ofer˘ a accea¸ si solut ¸ie de fiecare dat˘ a datorit˘ a problemei inverse gre¸ sit formu-
late. Alt˘ a abordare a super-rezolut ¸iei u¸ sor de implementat este Projection Onto Convex Set
(POCS) propus˘ a de Oskoui ¸ si Stark [21]. ˆIn aceast˘ a metod˘ a un set de constrˆ angeri este definit
pentru a restrˆ ange spat ¸iul imaginii cu super-rezolut ¸ie. Seturile de constrˆ angeri sunt convexe
¸ si reprezint˘ a anumite caracteristici ale imaginii cu super-rezolut ¸ie pe care le dorim, cum ar fi
smoothness -ul, pozitivitatea ¸ si reliability -ul. Intersect ¸ia tuturor acestor seturi de caracteristici
reprezint˘ a spat ¸iul de solut ¸ii permisibile. A¸ sadar problema este redus˘ a la a g˘ asi intersect ¸ia
seturilor de constrˆ angeri. Pentru a g˘ asi o astfel de solut ¸ie, un operator de proiect ¸ie este
aflat pentru fiecare set de constrˆ angeri. Acest operator proiecteaz˘ a o estimare a imaginii cu
super-rezolut ¸ie asupra setului de constrˆ angeri asociat. Folosind aceast˘ a modalitate iterativ,
se poate obt ¸ine o solut ¸ie bun˘ a la suprafat ¸a intersect ¸iei celor kseturi de constrˆ angeri convexe.
Algoritmul original nu includea ¸ si zgomotul de observare [21]; a¸ sadar a fost ˆ ımbun˘ at˘ at ¸it de
mult ¸i alt ¸i cercet˘ atori. Tekalp et al. [22] au extins metoda pentru a ˆ ıncorpora zgomotul. Patti
et al. [23] au dus algoritmul ¸ si mai departe ad˘ augˆ and blur-ul, timpul de diafragm˘ a diferit de
zero, zgomot de senzor ¸ si structuri arbitrare de sampling .
Metode ^ n domeniul frecvent ei
O alt˘ a abordare cunoscut˘ a pentru a obt ¸ine o imagine cu super-rezolut ¸ie este domeniul
frecvent ¸ei [1, 25, 26]. Chiar prima tehnic˘ a de super-rezolut ¸ie folosit˘ a de Tsai ¸ si Huang [1]
folosit˘ a pe imaginile obt ¸inute prin satelit a fost bazat˘ a pe domeniul frecvent ¸ei. Mult ¸i alt ¸i
cercet˘ atori au extins aceast˘ a metod˘ a pentru a construi altele. Aceast˘ a metod˘ a presupune
transformarea imaginilor cu rezolut ¸ie sc˘ azut˘ a ˆ ın domeniul Transformatei Fourier Discrete
(DFT), iar imaginea cu super-rezolut ¸ie este estimat˘ a ˆ ın acest domeniu, dup˘ a care este trans-
format˘ a ˆ ınapoi ˆ ın domeniul spat ¸ial.
Tsai ¸ si Huang [1] au presupus c˘ a imaginile de la satelit sunt similare, dar translatate global
¸ si c˘ a pot fi considerate ca fiind imaginile under-sampled ale unei scene statice necunoscut˘ a.
Parametrii de translat ¸ie si aliasing sunt folosit ¸i pentru a determina un set de ecuat ¸ii care leag˘ a
DFT a imaginilor cu rezolut ¸ie sc˘ azut˘ a de transformata Fourier continu˘ a (CFT) a imaginii cu
super-rezolut ¸ie necunoscut˘ a ( Fy=ϕFx;Fyeste DFT a imaginii cu rezolut ¸ie sc˘ azut˘ a y, iar
Fxeste CFT a imaginii cu super-rezolut ¸ie necunoscute x) [24]. Matricea sistemului ϕeste
format˘ a din informat ¸ia de mi¸ scare dintre imaginile cu rezolut ¸ie sc˘ azut˘ a. A¸ sadar problema
super-rezolut ¸iei este redus˘ a la a afla CFT a imaginii cu super-rezolut ¸ie cu ajutorul DFT a
imaginilor cu rezolut ¸ie sc˘ azut˘ a ¸ si a matricei sistemului. Aceast˘ a problem˘ a simplificat˘ a este
rezolvat˘ a de obicei cu ajutorul metodei celor mai mici p˘ atrate [4]. Blur-ul ¸ si zgomotul ˆ ın
timpul obt ¸inerii imaginii au fost ignorate ˆ ın studiul lui Huang si Tsai, ˆ ıns˘ a Kim et al. [27]
¸ si-au extins munca luˆ and in calcul ¸ si aceste efecte. Metoda corel˘ arii este deseori folosit˘ a
pentru a descoperi parametrii de mi¸ scare ˆ ın domeniul frecvent ¸ei. Parametrii de mi¸ scare
sunt determinat ¸i datorit˘ a faptului c˘ a imaginile mutate difer˘ a ˆ ın domeniul frecvent ¸ei doar
printr-o schimbare de faz˘ a [25, 26]. Schimbarea de faz˘ a dintre cele dou˘ a imagini poate fi
obt ¸inut˘ a prin corelarea acestora. Folosind corelarea fazelor atˆ at rotat ¸ia cˆ at ¸ si scalarea imaginii
pot fi transformate ˆ ın mi¸ sc˘ ari verticale sau orizontale. Pentru a minimiza erorile datorit˘ a
aliasing -ului se pot folosi doar anumit ¸i coeficient ¸i Fourier discret ¸i [25]. Dup˘ a ce se estimeaz˘ a
parametrii de ˆ ınregistrare, imaginile cu rezolut ¸ie sc˘ azut˘ a sunt combinate conform relat ¸iei
dintre coeficient ¸ii transformatei Fourier discrete ai imaginilor cu rezolut ¸ie sc˘ azut˘ a ¸ si imaginea
cu super-rezolut ¸ie necunoscut˘ a. Avantajul metodei domeniului de frecvent ¸˘ a este c˘ a aceasta
este u¸ sor de aplicat ¸ si functioneaz˘ a mai bine ˆ ımpotriva aliasing -ului decˆ at metoda domeniului

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
spat ¸ial. Dezavantajul acesteia este c˘ a se limiteaz˘ a la mi¸ scarea global˘ a, a¸ sadar funct ¸ioneaz˘ a
doar pentru translat ¸ii ¸ si rotat ¸ii planare [25]. Mai tˆ arziu transformata Fourier este ˆ ınlocuit˘ a
de Transformata Cosinus Discret˘ a (DCT) [28] ¸ si Transformata Wavelet Discret˘ a (DWT) [29].
Rhee ¸ si Kang [28] au modificat metoda bazat˘ a pe transformata Fourier pentru a folosi
tehnici regularizate de deconvolut ¸ie folosind DCT. Aceast˘ a metod˘ a funct ¸ioneaz˘ a chiar ¸ si
pentru cazurile cu informat ¸ie despre sub-pixeli insuficient˘ a sau cele gre¸ sit formulate. DCT
folose¸ ste doar coeficient ¸i reali, a¸ sadar este mai put ¸in costisitoare din punct de vedere compu-
tat ¸ional decˆ at domeniul Fourier. Nguyen ¸ si Milanfar [29] au folosit interpolare wavelet urmat˘ a
de metoda de restaurare pentru super-rezolut ¸ie. Ace¸ stia au calculat mai ˆ ıntˆ ai coeficient ¸ii de
und˘ a ( wavelet ) ai imaginilor cu rezolut ¸ie sc˘ azut˘ a ¸ si apoi i-au interpolat pentru valorile blu-
rate ˆ ın puncte de pe imaginea cu super-rezolut ¸ie. Prin deconvolut ¸ia valorilor interpolate cu
blur-ul cunoscut se poate estima o imagine cu super-rezolut ¸ie. El-Khamy ¸ si asociat ¸ii [31] au
ˆ ınregistrat toate imaginile cu rezolut ¸ie sc˘ azut˘ a direct ˆ ın domeniul wavelet . Dup˘ a ˆ ınregistrare,
coeficient ¸ii wavelet au fost unit ¸i, iar zgomotul a fost ˆ ınl˘ aturat folosind o metod˘ a de regu-
larizare. Metode de interpolare au fost apoi folosite pentru a obt ¸ine coeficient ¸ii wavelet ai
imaginii cu super-rezolut ¸ie, iar la sfˆ ar¸ sit cu ajutorul unei transformate inverse wavelet s-a
obt ¸inut imaginea cu super-rezolut ¸ie ˆ ın domeniul spat ¸ial. Chappalli ¸ si Bose [32] au imple-
mentat tehnici software de thresholding pentru a ˆ ındep˘ arta zgomotul asociat coeficient ¸ilor
wavelet . Fermuller ¸ si Ji [33, 34] au descompus coeficient ¸ii wavelet ˆ ın dou˘ a p˘ art ¸i folosind o
schem˘ a de rezolut ¸ii multiple. Acei coeficient ¸i au fost apoi interpolat ¸i, filtrat ¸i ¸ si recombinat ¸i
pentru a obt ¸ine imaginea simulat˘ a. Imaginea final˘ a era obt ¸inut˘ a folosind metoda IBP cu
criterii eficiente de regularizare pentru a elimina zgomotul la fiecare pas. Recent, atent ¸ia
cercet˘ atorilor s-a ˆ ındreptat c˘ atre transformarea contourlet , avantajul acesteia fat ¸˘ a de cea
wavelet fiind c˘ a aceasta poate captura muchiile dintr-o imagine ˆ ın orice direct ¸ie, nu doar
orizontal sau vertical [30].
Metode bazate pe regularizare
Problema obt ¸inerii imaginilor cu super-rezolut ¸ie este una al c˘ arei solut ¸ie nu este unic˘ a, dup˘ a
cum s-a putut observa. O alt˘ a metod˘ a de obt ¸inere a acestor imagini este folosind un termen
de regularizare. [35] Aceast˘ a metod˘ a ˆ ıncorporeaz˘ a cuno¸ stint ¸e anterioare asupra imaginilor
cu rezolut ¸ie ˆ ınalt˘ a pentru a rezolva problema super-rezolut ¸iei. Dou˘ a abord˘ ari principale ale
regulariz˘ arii sunt metodele deterministe ¸ si cele stocastice. Metoda determinist˘ a introduce un
termen al regulariz˘ arii care transform˘ a problema subdeterminat˘ a ˆ ın una corect determinat˘ a.
Imaginea cu rezolut ¸ie ˆ ınalt˘ a Xeste estimat˘ a minimizˆ and urm˘ atoarea funct ¸ie de cost:
X= argminN∑
k=1∥yk−HkX∥2+λ∥RX∥2(2)
unde λeste constanta de regularizare, iar Reste termenul de regularizare. Metoda celor mai
mici p˘ atrate folose¸ ste constante de netezime ca a priori .ˆIn acest caz Rdevine filtrul high
pass ce minimizeaz˘ a cantitatea frecvent ¸elor ˆ ınalte din imaginea obt ¸inut˘ a, iar λcontroleaz˘ a
informat ¸ia din frecvent ¸ele ˆ ınalte. O valoare mai mare pentru λpoate netezi imaginea recon-
struit˘ a, lucru ce poate fi benefic dac˘ a sunt disponibile put ¸ine imagini cu rezolut ¸ie sc˘ azut˘ a
sau acestea cont ¸in mult zgomot. Pe de alt˘ a parte, valori mici ale lui λdetermin˘ a obt ¸inerea
unei imagini ce poate cont ¸ine zgomot, lucru ce poate fi trecut cu vederea daca sunt disponi-
bile multe imagini init ¸iale ce au pe deasupra si putin zgomot. [4] Estimatorul celor mai mici

21
p˘ atrate Tikhonov regularizat folose¸ ste norma l2a derivatei de ordin doi a reconstruct ¸iei ima-
ginii cu rezolut ¸ie ˆ ınalt˘ a ca ¸ si termen de regularizare. [36] Norma l2nu asigur˘ a o solut ¸ie unic˘ a.
Farsiu et al. [37] au c˘ autat o alternativ˘ a ˆ ın minimizarea normei l1pentru obt ¸inerea super-
rezolut ¸iei mai rapid. Kim ¸ si Bose [27] propun un algoritm recursiv ponderat bazat pe cele
mai mici p˘ atrate pentru obt ¸inerea super-rezolut ¸iei. Ponderea depinde de cuno¸ stint ¸ele deja
acumulate asupra imaginii, algoritmul oferind o pondere mai mare imaginilor cu rezolut ¸ie
sc˘ azut˘ a ce au SNR mare. Avˆ and ponderi diferite problema devine una general˘ a de estimare
a celor mai mici p˘ atrate. Tot ce mai r˘ amˆ ane de f˘ acut este interpolarea ¸ si restaurarea ˆ ıntr-o
imagine cu super-rezolut ¸ie.
Metoda stocastic˘ a [38–46], mai ales metoda Maximum A-Posteriori (MAP), este cunos-
cut˘ a deoarece ofer˘ a o metod˘ a convenabil˘ a ¸ si flexibil˘ a de a folosi informat ¸ie a priori ¸ si deoarece
creeaz˘ a o leg˘ atur˘ a puternic˘ a ˆ ıntre imaginile observate ¸ si cea cu rezolut ¸ie ˆ ınalt˘ a necunoscut˘ a.
Metoda const˘ a ˆ ın g˘ asirea estim˘ arii MAP a imaginii cu rezolut ¸ie ˆ ınalt˘ a pentru care o proba-
bilitate posteriori P(X|Y) este maxim˘ a [41].
ˆXMAP= argminXP(X|Y) (3)
Folosind teorema lui Bayes, ecuat ¸ia 3 poate fi rescris˘ a dup˘ a cum urmeaz˘ a [41]:
ˆXMAP= argminX[logP(Y|X)] + log P(X) (4)
unde P(Y|X) este funct ¸ia de probabilitate, iar P(X) este prior .Markov Random Field
(MRF) este deseori folosit ca ¸ si model priori , iar funct ¸ia de densitate de probabilitate (PDF)
a zgomotului este folosit˘ a pentru a determina funct ¸ia de probabilitate. Imaginea cu rezolut ¸ie
ˆ ınalt˘ a este obt ¸inut˘ a aflˆ and rezultatul ecuat ¸iei 4.
Printre cele mai folosite modele pentru imaginea priori se num˘ ar˘ a norma TV [38], norma
l1a gradient ¸ilor orizontal ¸ si vertical [39], norma Simultaneous Autoregressive (SAR) [40],
modelul MRF Gaussian [13, 41], modelul MRF Huber [42], modelul MRF ce cont ¸ine o dis-
continuitate adaptiv˘ a [43], modelul non-stat ¸ionar Gaussian pe doua nivele [44] ¸ si modelul
Conditional Random Field (CRF) [45]. Un caz aparte al MAP, ˆ ın care informat ¸ia priori a
imaginii cu rezolut ¸ie ˆ ınalt˘ a nu este dat˘ a se nume¸ ste Maximum Likelihood Estimation (MLE).
Tom ¸ si Katsaggelos [46] au luat ˆ ın considerare folosirea acestei metode pentru obt ¸inerea
super-rezolut ¸iei, ˆ ıns˘ a deoarece este necesar˘ a informat ¸ie a priori datorit˘ a solut ¸iei sistemului
subdeterminat, r˘ amˆ ane o metod˘ a rar folosit˘ a.
ˆIn super-rezolut ¸ia multi-frame , mai multe imagini sunt combinate pentru a obt ¸ine o sin-
gur˘ a imagine cu rezolut ¸ie ˆ ınalt˘ a. ˆIn timpul contopirii acestor imagini cu rezolut ¸ie sc˘ azut˘ a
metode de aproximare a pixelilor sunt folosite, iar acestea pot blura (estompa) imaginea fi-
nal˘ a. A¸ sadar sunt necesare metode de eliminare a blur-ului din imagini [4,41]. Aproximarea
nucleului de blur(blur kernel ) are un rol important ˆ ın obt ¸inerea super-rezolut ¸iei, ˆ ıns˘ a multe
metode folosesc un nucleu deja cunoscut pentru simplitate. Acest nucleu deja ¸ stiut poate
ajuta la estimare unei imagini cu rezolut ¸ie ˆ ınalt˘ a dintr-un set de imagini cu rezolut ¸ie sc˘ azut˘ a,
ˆ ıns˘ a pentru imagini obt ¸inute din practic˘ a, ce au alt blur de mi¸ scare, nucleul de blur poate
fi total diferit [47]. Pentru estimarea nucleului de blurˆ ın cadrul Bayesian sunt propu¸ si nu-
mero¸ si algoritmi. Liu ¸ si Sun [47] au propus recent o metod˘ a Bayesian˘ a ce calculeaz˘ a simultan
nivelul de zgomot, nucleul de blur,blur-ul de mi¸ scare ¸ si imaginea cu rezolut ¸ie ˆ ınalt˘ a. Un al-
goritm de deconvolut ¸ie oarb˘ a poate fi folosit cˆ and nu avem nicio informat ¸ie despre nivelul de
zgomot sau nucleul de blur. Metodele de deconvolut ¸ie oarb˘ a recupereaz˘ a funct ¸ia de blurring
din imaginile cu rezolut ¸ie sc˘ azut˘ a ¸ si aproximeaz˘ a imaginea cu rezolut ¸ie ˆ ınalt˘ a f˘ ar˘ a informat ¸ii

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
init ¸iale asupra imaginii originale sau a blur-ului [48–52]. Sroubek et al. [48] au dezvoltat un
model de deconvolut ¸ie oarb˘ a pe canale multiple pentru super-rezolut ¸ie, unde imaginile cu
rezolut ¸ie sc˘ azut˘ a sunt unite minimizˆ and funct ¸ia de energie E(X, h).
E(X, h) = argminK∑
k=1∥yk−DHkX∥2+αQ(X) +βR(h) (5)
Primul termen din ecuat ¸ie este termenul de fidelitate, iar ceilalt ¸i doi termeni sunt termeni
de regularizare. Q(X) este termenul folosit pentru netezire, iar R(h) este termenul PSF.
A¸ sadar regularizarea este aplicat˘ a atˆ at ˆ ın domeniul de blur, cˆ at ¸ si ˆ ın cel al imaginii. Bai ¸ si
asociat ¸ii [49] au propus o metod˘ a ˆ ın domeniul frecvent ¸ei ce selecteaz˘ a adaptiv parametrul
termenului de regularizare. ˆIn [50–52] metode combinate de deconvolut ¸ie oarb˘ a ¸ si estimator
MAP sunt folosite pentru a estima blur-ul, respectiv imaginea cu rezolut ¸ie ˆ ınalt˘ a.
5 Super-rezolut ie single-frame
Dup˘ a cum am v˘ azut, o multitudine de algoritmi multi-frame pentru obt ¸inerea super-rezolut ¸iei
au fost dezvoltat ¸i, ˆ ıns˘ a ace¸ stia depind foarte mult de precizia aproxim˘ arii parametrilor de
ˆ ınregistrare [53]. Metodele de ˆ ınregistrare au ˆ ın principal constrˆ angeri cauzate de mi¸ scarea
global˘ a, ˆ ıns˘ a componente diferite ale aceleia¸ si scene pot avea mi¸ sc˘ ari total diferite ˆ ın practic˘ a.
ˆIn aceste cazuri metodele de super-rezolut ¸ie multi-frame nu duc la un rezultat favorabil, uneori
imaginile init ¸iale avˆ and o calitate a informat ¸iei mai bun˘ a decˆ at cele cu super-rezolut ¸iei.
Mai mult decˆ at atˆ at informat ¸iile stocate ˆ ın frecvent ¸ele ˆ ınalte ce sunt pierdute ˆ ın timpul
achizit ¸iei imaginilor nu pot fi recuperate folosind tehnici multi-frame . O metod˘ a alternativ˘ a
este folosirea algoritmilor de super-rezolut ¸ie bazat ¸i pe o singur˘ a imagine.
Figure 6: Super-rezolut ¸ie bazat˘ a pe ˆ ınv˘ at ¸areMajoritatea algoritmilor de super-rezolut ¸ie
bazat ¸i pe o singur˘ a imagine folosesc meca-
nisme de ˆ ınv˘ at ¸are ¸ si sunt numit ¸i algoritmi
de super-rezolut ¸ie bazat ¸i pe ˆ ınv˘ at ¸are. Acest
mecanism de ˆ ınv˘ at ¸are extrage informat ¸ia din
frecvent ¸ele ˆ ınalte pierdut˘ a ˆ ın procesul de
capturare a imaginilor folosind surse externe
(training set ) ¸ si une¸ ste aceast˘ a informat ¸ie
cu imaginile cu rezolut ¸ie sc˘ azut˘ a capturate,
obt ¸inˆ andu-se astfel o imagine cu super-
rezolut ¸ie [30]. Acest set de antrenament
(training set ) este format din un num˘ ar mare
de imagini cu rezolut ¸ie ˆ ınalt˘ a ¸ si versiunea
lor simulat˘ a de imagini cu rezolut ¸ie sc˘ azut˘ a.
Eficient ¸a algoritmilor bazat ¸i pe ˆ ınv˘ at ¸are de-
pinde extrem de mult de aceste imagini aflate
ˆ ın setul de antrenament, a¸ sadar acestea tre-
buie alese ˆ ın a¸ sa fel ˆ ıncˆ at s˘ a fie similare
cu imaginile ce urmeaz˘ a a fi capturate ˆ ın
practic˘ a ¸ si s˘ a cont ¸in˘ a informat ¸ii de frecvent ¸˘ a
ˆ ınalt˘ a [30].

23
Figura 6 reprezint˘ a o schem˘ a a algoritmilor de super-rezolut ¸ie bazat ¸i peˆ ınv˘ at ¸are. Metodele
de super-rezolut ¸ie bazate pe ˆ ınv˘ at ¸are cuprind urm˘ atoarele trei etape: extragerea caracteris-
ticilor, ˆ ınv˘ at ¸area ¸ si reconstruct ¸ia.
Etapa de extragere a caracteristicilor
Aceast˘ a etap˘ a presupune extragerea caracteristicilor setului de imagini de antrenament dar ¸ si
ale imaginii de test separat. Init ¸ial imaginile sunt segmentate ˆ ın buc˘ at ¸i mai mici ce sunt apoi
redimensionate ¸ si scalate cu ajutorul unor filtre. Buc˘ at ¸ile din imaginea cu rezolut ¸ie ˆ ınalt˘ a
¸ si corespondentele lor din imaginea cu rezolut ¸ie sc˘ azut˘ a ce a fost obt ¸inut˘ a sunt grupate
ˆ ın perechi. Apoi caracteristicile buc˘ at ¸ilor din setul de antrenament sunt extrase. Analog,
caracteristicile imaginilor de test sunt extrase. ˆIn acest moment exist˘ a cˆ ateva tehnici de
extragere a caracteristicilor ce au fost dezvoltate de diver¸ si cercet˘ atori. De exemplu, ˆ ın
[54–58] un filtru de schimbare a benzii, pe cˆ and ˆ ın [59] sunt folosite atˆ at frecvent ¸ele ˆ ınalte
cˆ at ¸ si cele joase ale imaginilor. Asem˘ an˘ ator, obt ¸inerea derivatelor Gaussiene [60], derivatelor
gradientului [61], piramidei Laplaciene [62] ¸ si piramidei Steerable [63] au fost propuse. Mult ¸i
cercet˘ atori au folosit valorile lumiant ¸ei ca f ¸iind cea mai important˘ a parte a muncii lor [64–71].
Coeficient ¸ii DCT [72], transformarea wavelet [73], transformarea contourlet [30] ¸ si Principle
Component Analysis (PCA) [74] au fost folosite ca ¸ si caracteristici ˆ ın super-rezolut ¸ie bazat˘ a
pe ˆ ınv˘ at ¸are.
Etapa de ^ nv at are
Caracteristicile extrase din setul de antrenament ¸ si cele extrase din imaginile cu rezolut ¸ie
sc˘ azut˘ a capturate sunt egalate (sincronizate) folosind modele de ˆ ınv˘ at ¸are. Asem˘ an˘ ator mod-
elelor de extragere a caracteristicilor, mai multe modele de ˆ ınv˘ at ¸are au fost propuse ˆ ın ultimii
ani. Cele mai cunoscute metode sunt Best Matching [59,61,63,68], MRF [30,54,60,73], Neigh-
bor Embedding [70,75–77] ¸ si Sparse Representation [56–58,64,78–84]. Printre alte metode mai
rar ˆ ıntˆ alnite se num˘ ar˘ a PCA Construction [66], Canonical Correlation Analysis [74], Locally
Linear Embedding Construction [55], Content-based Classification ¸ siClass-specific Predic-
tors [62], Position-patch Construction [67] ¸ si Support Vector Regression [72]. Glasner et
al. [71] au introdus o metod˘ a ce combin˘ a super-rezolut ¸ia bazat˘ a pe ˆ ınv˘ at ¸are cu cea bazat˘ a pe
reconstruct ¸ie. Algoritmul de ˆ ınv˘ at ¸are asociaz˘ a caracteristici ale imaginii cu rezolut ¸ie sc˘ azut˘ a
capturate cu cele ale imaginilor cu rezolut ¸ie sc˘ azut˘ a din setul de antrenament. Deoarece
imaginile cont ¸inute ˆ ın setul de antrenament, respectiv cele cu rezolut ¸ie sc˘ azut˘ a ¸ si cele cu
rezolut ¸ie ˆ ınalt˘ a, sunt organizate ˆ ın perechi, caracteristicile fragmentelor din imaginile cu
rezolut ¸ie ˆ ınalt˘ a ce corespund celor din imaginile cu rezolut ¸ie sc˘ azut˘ a sunt aplicate imaginii
capturate ¸ si sunt alese pentru super-rezolut ¸ie.
Etapa de reconstruct ie
Algoritmii de ˆ ınv˘ at ¸are ¸ si de extragere a caracteristicilor aproximeaz˘ a caracteristicile imag-
inii cu rezolut ¸ie ˆ ınalt˘ a din imaginea capturat˘ a. Aceste caracteristici sunt apoi implemen-
tate asupra fragmentelor din imaginea cu rezolut ¸ie sc˘ azut˘ a pentru a obt ¸ine un fragment cu
rezolut ¸ie ˆ ımbun˘ at˘ at ¸it˘ a. Ultimul pas este de a reuni toate fragmentele ˆ ıntr-o imagine cu super-
rezolut ¸ie [30]. O descriere detaliat˘ a a acestui proces se reg˘ ase¸ ste ˆ ın figura 6. Exist˘ a multe
metode bazate pe ˆ ınv˘ at ¸are dezvoltate pˆ an˘ a acum ˆ ıns˘ a metoda bazat˘ a pe exemple propus˘ a

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
de Kim ¸ si Kwon [85, 86] dep˘ a¸ se¸ ste multe alte metode de ultim˘ a or˘ a. Aceast˘ a metod˘ a se
bazeaz˘ a pe cadrul deja stabilit de Freeman et al. [54] ce stabile¸ ste perechile de fragmente
din imaginile cu rezolut ¸ie ˆ ınalt˘ a, respectiv cele cu rezolut ¸ie sc˘ azut˘ a ˆ ın etapa de antrenament.
ˆIn etapa de ˆ ınv˘ at ¸are fiecare fragment al imaginii cu rezolut ¸ie sc˘ azut˘ a capturat˘ a este com-
parat cu seturile de fragmente ale imaginilor cu rezolut ¸ie sc˘ azut˘ a de antrenament ce erau
deja ˆ ınregistrate ¸ si folosind metoda de c˘ autare al celui mai apropiat vecin se g˘ ase¸ ste cel
mai asem˘ an˘ ator fragment al imaginilor cu rezolut ¸ie sc˘ azut˘ a de antrenament ¸ si se folose¸ ste
imaginea cu rezolut ¸ie ˆ ınalt˘ a asociat˘ a. Totu¸ si, metoda lui Freeman et al. [54] duce deseori
la o imagine cu blurdatorit˘ a algoritmului nearest neighbor . Kim ¸ si Kwon [85] au modificat
aceast˘ a metod˘ a ˆ ınlocuind c˘ autarea celui mai apropiat vecin cu sparse kernel ridge regression .
ˆIn algoritmul lor regresia kernel ridge este folosit˘ a pentru a crea o hart˘ a ˆ ıntre fragmentele
imaginii capturate ¸ si fragmentele perechilor de imagini din setul de antrenament. Aceast˘ a
metod˘ a produce totu¸ si un efect de blur¸ si de rotunjire la frontiere, ˆ ıns˘ a acestea sunt u¸ sor de
eliminat ˆ ın postprocesare [85].
ˆIn ultimii zeci de ani s-au desf˘ a¸ surat studii masive asupra algoritmilor de sparse rep-
resentation .Sparse representation este procedeul de aproximare a unei imagini sau a unui
semnal folosind combin˘ ari liniare a unui set restrˆ ans de semnale elementare numite atomi.
Atomii sunt ale¸ si ori dintr-un set predefinit de funct ¸ii (dict ¸ionar bazat pe analiz˘ a), cum ar fi
Transformarea Discret˘ a Cosinus (DCT), ori ˆ ınv˘ at ¸at ¸i dintr-un set de antrenament (dict ¸ionar
bazat pe ˆ ınv˘ at ¸are). Principalul avantaj al acestor algoritmi este c˘ a coeficient ¸ii reprezent˘ arii
semnalului sunt risipit ¸i, adic˘ a exist˘ a foarte mult ¸i coeficient ¸i ce sunt egali cu zero ¸ si foarte
put ¸ini diferit ¸i de zero. Mai exact, considerˆ and un semnal de timp discret ¸ si finit x∈RN¸ si
un dint ¸ionar complet D∈RNK;N < K . Scopul este s˘ a reprezent˘ am semnalul xfolosind
dict ¸ionarul Dˆ ın a¸ sa fel ˆ ıncˆ at eroarea reprezent˘ arii semnalului ∥Dα−x∥2, unde αeste vec-
torul sparse representation , este minimizat˘ a. Pentru a reprezenta un semnal folosind sparse
representation este necesar s˘ a se rezolve urm˘ atoarea problem˘ a de optimizare [57].
argmin ∥α∥0,unde x=Dα (6)
Sparse representation a devenit un domeniu major de cercetare ˆ ın procesarea semnalelor.
Folosind aceast˘ a metod˘ a cˆ at ¸iva cercet˘ atori au propus algoritmi bazat ¸i pe ˆ ınv˘ at ¸are pentru
obt ¸inerea super-rezolut ¸iei [56–58,64,78–84]. Super-rezolut ¸ia bazat˘ a pe sparse representation
calculeaz˘ a aproximarea sparse a fragmentului din imaginea cu rezolut ¸ie sc˘ azut˘ a capturat˘ a
¸ si folose¸ ste coeficient ¸ii aproxim˘ arii pentru a estima fragmentul cu rezolut ¸ie ˆ ınalt˘ a. Aceast˘ a
metod˘ a folose¸ ste dou˘ a dict ¸ionare Dh¸ siDlcompletate concomitent din fragmente cu rezolut ¸ie
ˆ ınalt˘ a ¸ si sc˘ azut˘ a. Exist˘ a o necesitate de a accentua similaritatea codific˘ arii sparse dintre frag-
mentul cu rezolut ¸ie sc˘ azut˘ a ( j=Dlβ) ¸ si cel cu rezolut ¸ie ˆ ınalt˘ a ( l=Dhα). Dict ¸ionarul extras
din fragmentul cu rezolut ¸ie ˆ ınalt˘ a, Dh, este aplicat cu reprezentarea sparse a fragmentului cu
rezolut ¸ie sc˘ azut˘ a ( Dhβ) pentru a obt ¸ine fragmentul cu super-rezolut ¸ie. Zeyde et al. [58] au
aplicat algoritmul de ˆ ınv˘ at ¸are a dict ¸ionarului K-SVD pentru a afla perechea rezolut ¸ie ˆ ınalt˘ a
– rezolut ¸ie sc˘ azut˘ a din dict ¸ionar, lucru ce a m˘ arit performant ¸a acestei metode.
Folosind metoda sparse representation , fragmentul final cu super-rezolut ¸ie al imaginii este
generat din combinarea coeficient ¸ilor sparse ai fragmentului cu rezolut ¸ie sc˘ azut˘ a ¸ si dict ¸ionarul
rezolut ¸iei ˆ ınalte. Eficacitatea metodei depinde atˆ at de coeficient ¸ii sparse ai imaginii cu
rezolut ¸ie sc˘ azut˘ a cˆ at ¸ si de dict ¸ionarul rezolut ¸iei ˆ ınalte [87]. Mult ¸i cercet˘ atori au propus
noi algoritmi pentru a estima mai bine dict ¸ionarul rezolut ¸iei ˆ ınalte ¸ si coeficient ¸ii sparse ai
imaginii cu rezolut ¸ie sc˘ azut˘ a. Zhang ¸ si asociat ¸ii [78] au propus o metod˘ a a ˆ ınv˘ at ¸˘ arii unui
dict ¸ionar dual ce const˘ aˆ ınˆ ınv˘ at ¸area dict ¸ionarului principal ¸ siˆ ınv˘ at ¸area dict ¸ionarului rezidual

25
pentru a recupera informat ¸ia frecvent ¸elor ˆ ınalte pentru rezolut ¸ia ˆ ınalt˘ a principal˘ a ¸ si rezolut ¸ia
ˆ ınalt˘ a rezidual˘ a. Detalii adit ¸ionale pot fi ad˘ augate imaginii cu rezolut ¸ie sc˘ azut˘ a folosind pro-
cesul de ˆ ınv˘ at ¸are double-channel . Deoarece imaginea cu super-rezolut ¸ie final˘ a este obt ¸inut˘ a
din coeficient ¸ii sparse ai imaginii cu rezolut ¸ie sc˘ azut˘ a ¸ si dict ¸ionarul rezolut ¸iei ˆ ınalte ˆ ınv˘ at ¸at,
randamentul metodei depinde atˆ at de coeficient ¸i cˆ at ¸ si de dict ¸ionar. Yang et al. [81] au redus
timpul de execut ¸ie a super-rezolut ¸iei prin sparse representation folosind un model de ˆ ınv˘ at ¸are
prin ret ¸ea neural˘ a pentru interferent ¸˘ a sparse rapid˘ a ¸ si procesarea selectiv˘ a a caracteristicilor
vizuale proeminente. Folosind metodele analitice, dar ¸ si pe cele bazate peˆ ınv˘ at ¸are, Kanakaraj
¸ si Kathiravan [82] au perfect ¸ionat metoda de ˆ ınv˘ at ¸are a dict ¸ionarului.
Dong et al. [83] au propus o metod˘ a de sparse representation bazat˘ a pe grupare, numit˘ a
Adaptive Sparse Domain Selection (ASDS) pentru a ˆ ımbun˘ at˘ at ¸i dict ¸ionarul. Aceast˘ a metod˘ a
presupune adunarea fragmentelor imaginiiˆ ın mai multe grupuri, iar un sub-dict ¸ionar compact
este ˆ ınv˘ at ¸at din fiecare grup. Pentru fiecare fragment al imaginii, cel mai bun sub-dict ¸ionar
poate fi ales, ce poate reconstrui imaginea mai bine decˆ at un dict ¸ionar global. ˆIntr-un alt
studiu Dong et al. [84] au propus interpolarea imaginilor bazat˘ a pe sparse representation
care ˆ ıncorporeaz˘ a auto-similarit˘ at ¸ile nelocale ale imaginii ˆ ın modelul sparse representation .
Termenul de auto-similaritate se refer˘ a la similaritatea valorilor pixelilor din imagine sau a
structurii acestora ˆ ın diverse locuri din imagine. Algoritmul include un model autoregresiv
nelocal ca un nou termen de fidelitate ˆ ın metoda sparse representation , lucru ce reduce
coerent ¸a dintre dict ¸ionare ¸ si face metoda mult mai eficient˘ a. Dong ¸ si asociat ¸ii nu numai
c˘ a au estimat un dict ¸ionar al rezolut ¸iei ˆ ınalte mai bun pentru fiecare fragment al imaginii,
dar au ¸ si folosit auto-similaritatea nelocal˘ a a imaginii pentru a obt ¸ine o aproximare bun˘ a a
coeficient ¸ilor sparse representation ai imaginii cu rezolut ¸ie sc˘ azut˘ a. Recent, Dong et al. au
propus dou˘ a noi metode pentru extragerea coeficient ¸ilor sparse dintr-o imagine cu rezolut ¸ie
sc˘ azut˘ a cˆ at mai apropiat˘ a posibil de imaginea original˘ a folosind constrˆ angeri de diminuare
(sparsity constraints ) nelocale. Acestea sunt Centralized Sparse Representation (CSR) [79] ¸ si
Nonlocally Centralized Sparse Representation (NCSR) [80].
Principalele obstacole ^ n calea reconstruct iei
PLACEHOLDER
6 Comparat ie a performant ei ^ ntre diferite tehnici de
rezolut ie
Metode de m asurare  si optimizare a calit at ii imaginii
Pentru a compara performant ¸a metodelor de super-rezolut ¸ie, Peak-SNR (PSNR) ¸ si Similari-
tatea Structural˘ a (SSIM) dintre imaginea cu super-rezolut ¸ie aproximat˘ a ¸ si cea original˘ a sunt
calculate. PSNR-ul este calculat folosind Mean Square Error (MSE), ce este eroarea medie
dintre imaginea original˘ a ¸ si cea obt ¸inut˘ a prin super-rezolut ¸ie. Fie o imagine m×ncu super-
rezolut ¸ie notat˘ a ˆX(i, j) ¸ si imaginea original˘ a X(i, j), MSE ¸ si PSNR sunt definite dup˘ a cum
urmeaz˘ a:
MSE =1
mnm1∑
i=0n1∑
j=0[X(i, j)−ˆX(i, j)]2(7)

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
PSNR = 20 log10(L√
MSE)
(8)
Index-ul SSIM calculeaz˘ a similaritatea dintre imaginea original˘ a ¸ si cea cu super-rezolut ¸ie
[88]. Acesta ia ˆ ın considerare lumiant ¸a, contrastul ¸ si schimb˘ arile structurale dintre cele dou˘ a
imagini. Index-ul SSIM este calculat dup˘ a cum urmeaz˘ a:
SSIM (x,ˆx) =(2µxµ^x+c1)(2σx^x+c2)
(µ2
x+µ2
^x+c1)(σ2
x+σ2
^x+c2)(9)
unde µx¸ siµ^xsunt mediile, iar σx¸ siσ^xsunt deviat ¸iile standard ale imaginilor original˘ a ¸ si
cea cu super-rezolut ¸ie, σx^xeste covariant ¸a lui X¸ siˆX, c 1, c2sunt constante. SSIM m˘ asoar˘ a
similaritatea dintre dou˘ a imagini. Cˆ and imaginea cu super-rezolut ¸ie este foarte aproape de
cea original˘ a, valoarea SSIM-ului se apropie de 1.
7 Super-rezolut ie folosind sparse representation
Recuperarea semnalului bazat a pe reprezentare sparse
Problema ˆ ın obt ¸inerea unei imagini cu rezolut ¸ie ˆ ınalt˘ a dintr-o imagine cu rezolut ¸ie sc˘ azut˘ a
este subiectul acestei lucr˘ ari. Similar metodelor bazate pe ˆ ınv˘ at ¸are prezentate anterior,
principalele surse de informat ¸ie sunt fragmentele imaginii capturate, ˆ ıns˘ a ˆ ın loc s˘ a lucr˘ am
cu perechile de fragmente obt ¸inute din imaginile cu rezolut ¸ie sc˘ azut˘ a ¸ si cele cu rezolut ¸ie
ˆ ınalt˘ a [56], abord˘ am o reprezentare compact˘ a a acestor perechi pentru informat ¸ia a priori ,
ˆ ımbun˘ at˘ at ¸ind ˆ ın acest fel timpul de execut ¸ie. Aceast˘ a abordare este propus˘ a datorit˘ a des-
coperirilor f˘ acute ˆ ın cercetarea semnalelor sparse ce dovede¸ ste c˘ a se pot obt ¸ine relat ¸ii de
liniaritare ˆ ıntre semnalele rezolut ¸iei ˆ ınalte folosind proiect ¸iile lor cu rezolut ¸ie sc˘ azut˘ a [ ?,?].
FieD∈RnKun dict ¸ionar complet cu Ksurse ¸ si un semnal x∈Rnce poate fi reprezentat
ca o combinat ¸ie liniar˘ a sparse ce respect˘ a D. Adic˘ a semnalul xpoate fi scris ca x=Dα0,
unde α0∈RKeste un vector cu foarte put ¸ine elemente ( ≪K) nenule. ˆIn practic˘ a se poate
observa un set limitat de m˘ asur˘ atori yale lui x:
y=Lx=LDα0, (10)
unde L∈Rkn, cu k < n , este matricea de proiect ¸ie. ˆIn contextul super-rezolut ¸iei
prezentat, xeste o imagine cu rezolut ¸ie ˆ ınalt˘ a (sau un fragment de imagine), iar yeste
corespondenta sa cu rezolut ¸ie sc˘ azut˘ a. Dac˘ a dict ¸ionarul Deste complet, ecuat ¸ia x=Dα
este subdeterminat˘ a pentru coeficient ¸ii αnecunoscut ¸i. Ecuat ¸ia y=LDαeste cu atˆ at mai
mult subdeterminat˘ a. Totu¸ si, sub condit ¸ii favorabile, solut ¸ia sparse α0a acestei ecuat ¸ii va fi
unic˘ a. Mai mult decˆ at atˆ at, dac˘ a Dsatisface o condit ¸ie de izometrie potrivit˘ a, atunci pentru
o varietate de matrici L, orice reprezentare liniar˘ a a unui fragment cu rezolut ¸ie ˆ ınalt˘ a x, ˆ ın
concordant ¸˘ a cu Dpoate fi recuperat (aproape) perfect din fragmentul cu rezolut ¸ie sc˘ azut˘ a a
imaginii [ ?,?].
Reprezentarea sparse a fost aplicat˘ a cu succes ˆ ın multe alte probleme inverse ˆ ın proce-
sarea imaginilor, cum ar fi eliminarea zgomotului [2] ¸ si restaurarea imaginilor [ ?], deseori
ˆ ımbun˘ at˘ at ¸ind cele mai noi metode. De exemplu, ˆ ın [2], autorii folosesc algoritmul K-SVD [ ?]
pentru a ˆ ınv˘ at ¸a un dict ¸ionar complet din fragmentele unor imagini naturale ¸ si s˘ a ˆ ıl aplice cu
succes ˆ ın problema elimin˘ arii zgomotului din imagini. ˆIn metoda prezentat˘ a ˆ ın aceast˘ a lu-
crare, nu se calculeaz˘ a direct reprezentarea sparse a fragmentului cu rezolut ¸ie ˆ ınalt˘ a. Metoda

27
presupune folosirea a dou˘ a dict ¸ionare cuplate, Dhpentru fragmente cu rezolut ¸ie ˆ ınalt˘ a, iar
Dlpentru fragmente cu rezolut ¸ie sc˘ azut˘ a. Reprezentarea sparse a unui fragment cu rezolut ¸ie
sc˘ azut˘ a, ˆ ın ceea ce prive¸ ste dict ¸ionarul Dlo s˘ a fie folosit˘ a direct pentru a recupera fragmentul
cu rezolut ¸ie ˆ ınalt˘ a corespunz˘ ator din Dh. Se poate obt ¸ine o solut ¸ie local˘ a consistent˘ a dac˘ a
fragmentele imaginii sunt suprapuse ¸ si o condit ¸ie ca zonele ce se suprapun din fragmentele
cu super-rezolut ¸ie s˘ a se potriveasc˘ a este impus˘ a. Spre deosebire de algoritmul K-SVD, se
ˆ ıncearc˘ a ˆ ınv˘ at ¸area celor dou˘ a dict ¸ionare ˆ ıntr-un mod probabilistic similar cu cel prezentat
ˆ ın [?]. Pentru a impune ca perechile de fragmente ale imaginilor sa aib˘ a acelea¸ si reprezent˘ ari
sparse ce respect˘ a Dh¸ siDl, cele dou˘ a dict ¸ionare sunt ˆ ınv˘ at ¸ate simultan, concatenˆ andu-le
folosind normalizarea. Dict ¸ionarele compacteˆ ınv˘ at ¸ate vor fi aplicate atˆ at asupra unor imagini
generale, cˆ at ¸ si asupra imaginilor faciale pentru a demonstra eficient ¸a acestei metode.
Comparativ cu metodele bazate pe fragmente, acest algoritm are nevoie doar de cele
dou˘ a dict ¸ionare compacte ˆ ınv˘ at ¸ate, ˆ ın loc de o baz˘ a de date cu fragmente de antrenament
masiv˘ a. Calculele, bazate ˆ ın mare pe programare liniar˘ a sau optimizare convex˘ a este mult
mai eficient˘ a ¸ si scalabil˘ a, fat ¸˘ a de [54, 55, 60]. Recuperarea reprezent˘ arii sparse este f˘ acut˘ a
folosind dict ¸ionarul rezolut ¸iei sc˘ azute, dict ¸ionarul rezolut ¸ieiˆ ınalte fiind folosit pentru a calcula
imaginea cu rezolut ¸ie ˆ ınalt˘ a final˘ a. Reprezentarea sparse calculat˘ a selecteaz˘ a adaptiv cele
mai relevante baze ale fragmentelor din dict ¸ionar, ce reprezint˘ a cˆ at mai bine fragmentul cu
rezolut ¸ie sc˘ azut˘ a ce trebuie procesat. Aceast˘ a abordare duce la o performant ¸˘ a ridicat˘ a, atˆ at
calitativ cˆ at ¸ si cantitativ ¸ si genereaz˘ a texturi mai clare ¸ si frontiere mai evident ¸iate, comparat
cu metode [55] care folosesc un num˘ ar fix de vecini apropiat ¸i. ˆIn plus, reprezentarea sparse
este eficient˘ a ˆ ımpotriva zgomotului de imagine [2], a¸ sadar acest algoritm elimin˘ a ¸ si zgomotul,
pe cˆ and alte metode nu pot obt ¸ine super-rezolut ¸ia ¸ si elimina zgomotul ˆ ın acela¸ si timp.
Notat ii
Sunt notate cu X¸ siYimaginile cu rezolut ¸ie ˆ ınalt˘ a, respectiv cele cu rezolut ¸ie sc˘ azut˘ a, iar
cux¸ siyfragmentele cu rezolut ¸ie ˆ ınalt˘ a, respectiv cele cu rezolut ¸ie sc˘ azut˘ a. Se folose¸ ste D
pentru a reprezenta dict ¸ionarul pentru codarea sparse , iarDheste dict ¸ionarul fragmentelor
cu rezolut ¸ie ˆ ınalt˘ a ¸ si Dlcel al fragmentelor cu rezolut ¸ie sc˘ azut˘ a. Literele mici ˆ ıngro¸ sate
reprezint˘ a vectori. Literele mici neˆ ıngro¸ sate reprezint˘ a scalari. Literele mari neˆ ıngro¸ sate
reprezint˘ a matrici, de exemplu Deste folosit˘ a ca matrice de scalare.
Constr^ angeri ale super-rezolut iei
Problema super rezolut ¸iei este: dat˘ a fiind o imagine cu rezolut ¸ie sc˘ azut˘ a Y, s˘ a se recupereze
o imagine Xcu o rezolut ¸ie mai ridicat˘ a al aceluia¸ si cadru. Dou˘ a constrˆ angeri sunt formulate
pentru a ajuta la rezolvarea acestei probleme: 1) constrˆ angerea de reconstruct ¸ie, ce impune ca
imaginea Xrecuperat˘ a s˘ a fie ˆ ın concodrant ¸˘ a cu imaginea de intrare Y¸ si s˘ a respecte modelul
observat ¸ional al imaginii; iar 2) sparsity prior , ce presupune ca fragmentele cu rezolut ¸ie ˆ ınalt˘ a
s˘ a fie reprezentate sparse ˆ ıntr-un dict ¸ionar complet ales ¸ si c˘ a reprezent˘ arile lor sparse pot fi
recuperate din imaginea original˘ a a c˘ arei rezolut ¸ie este sc˘ azut˘ a.

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
Constr^ angerea de reconstruct ie
Imaginea cu rezolut ¸ie sc˘ azut˘ a observat˘ a Yeste o versiune scalat˘ a ¸ si estompat˘ a a imaginii cu
rezolut ¸ie ˆ ınalt˘ a X:
Y=SHX. (11)
Aici, Hreprezint˘ a un filtru de estompare ( blur), iar Seste operatorul de scalare.
Problema super-rezolut ¸iei este totu¸ si una subdeterminat˘ a , deoarece pentru o imagine
primit˘ a ca intrare Y, exist˘ a o infinitate de imagini cu reyoluˆ ac tie ˆ ınalt˘ a Xce satisfac
constrˆ angerea de mai sus. Pentru a regulariza problema folosim prior -ul urm˘ ator asupra
fragmentelor xdinX.
Sparsity prior
Fragmentele xale imaginii cu rezolut ¸ie ˆ ınalt˘ a Xpot fi reprezentate ca o combinat ¸ie liniar˘ a
sparse ˆ ıntr-un dict ¸ionar Dhformat din fragmente cu rezolut ¸ie ˆ ınalt˘ a extrase din imagini de
antrenament:
x≈Dhαpentru α∈RKcu∥α∥0≪K. (12)
Reprezentarea sparse αeste obt ¸inut˘ a reprezentˆ and fragmentele yale imaginii de intrare
Y, respectˆ and dict ¸ionarul rezolut ¸iei sc˘ azute Dl, antrenat simultan cu Dh.
Aceast˘ a metod˘ a poate fi aplicat˘ a atˆ at asupra imaginilor generale cˆ at ¸ si asupra celor faciale.
Pentru super-rezolut ¸ia imaginilor generale, problema este ˆ ımp˘ art ¸it˘ a ˆ ın dou˘ a p˘ art ¸i. Prima,
dup˘ a cum este sugerat de c˘ atre sparsity prior -ul din Ecuat ¸ia 12, este g˘ asirea reprezent˘ arii
sparse pentru fiecare fragment local, respectˆ and compatibilitatea dintre vecini. Apoi, folosind
rezultatul obt ¸inut la primul pas, regulariz˘ am ¸ si perfect ¸ion˘ am ˆ ıntreaga imagine folosind con-
strˆ angerea de reconstruct ¸ie prezentat˘ a ˆ ın Eciat ¸ia 11. Aceast˘ a metod˘ a presupune folosirea
unui model local din sparsity prior pentru a recupera frecvent ¸ele ˆ ınalte pierdute ce core-
spund detaliilor locale. Modelul global din constrˆ angerea de reconstruct ¸ie este apoi aplicat
pentru a elimina posibilele artefacte provenite din prima etap˘ a ¸ si pentru a face imaginea mai
natural˘ a ¸ si consistent˘ a.
Imaginile faciale difer˘ a de cele generale deoarece acestea au o anumit˘ a structur˘ a, a¸ sadar
constrˆ angerile de reconstruct ¸ie sunt mai eficiente pe un astfel de spat ¸iu. Pentru super-re-
zolut ¸ie facial˘ a cei doi pa¸ si prezentat ¸i mai sus sunt inversat ¸i pentru a profita de avantajul
oferit de structura fet ¸ei. Mai ˆ ıntˆ ai este g˘ asit un subspat ¸iu potrivit pentru fet ¸ele umane ¸ si
sunt aplicate constrˆ angerile de reconstruct ¸ie pentru a recupera o imagine cu o rezolut ¸ie medie.
Apoi detaliile locale sunt recuperate folosind sparsity prior -ul pentru fragmentele imaginii.
Super-rezolut ia imaginilor generale folosind Sparsity
Modelul local folosind reprezentarea sparse
Asem˘ an˘ ator metodelor bazate pe fragmente, algoritmul propus presupune obt ¸inerea unui
fragment cu rezolut ¸ie ˆ ınalt˘ a dintr-un fragment cu rezolut ¸ie sc˘ azut˘ a ce apart ¸ine imaginii cap-
turate. Pentru aceast˘ a metod˘ a sunt necesare dou˘ a dict ¸ionare Dh¸ siDlce sunt completate
simultan ¸ si au aceea¸ si reprezentare sparse pentru fiecare pereche de fragmente cu rezolut ¸ie
ˆ ınalt˘ a, respectiv sc˘ azut˘ a. Se calculeaz˘ a valoarea medie a pixelilor pentru fiecare fragment,

29
astfel ˆ ıncˆ at dict ¸ionarul s˘ a reprezinte o anumit˘ a textur˘ a ¸ si nu o intensitate absolut˘ a. ˆIn pro-
cesul de reconstruct ¸ie valoarea medie pentru fiecare fragment al imaginii cu rezolut ¸ie ˆ ınalt˘ a
este obt ¸inut˘ a folosind versiunea cu rezolut ¸ie sc˘ azut˘ a a aecstuia.
Pentru fiecare fragment al imaginii capturate yse g˘ ase¸ ste o reprezentare sparse ce este
ˆ ın concordant ¸˘ a cu dict ¸ionarul Dl. Pentru obt ¸inerea fragmentului cu rezolut ¸ie ˆ ınalt˘ a x, cores-
pondentul cu rezolut ¸ie ˆ ınalt˘ a al acestuia, ce poate fi g˘ asit ˆ ın dict ¸ionarul Dheste aflat. Prob-
lema g˘ asirii unei reprezent˘ ari sparse a luiypoate fi formulat˘ a dup˘ a cum urmeaz˘ a:
min∥α∥0a.ˆ ı.∥FDlα−Fy∥2
2≤ϵ, (13)
unde Feste un operator (liniar) de extragere a caracteristicilor. Principalul obiectiv al
luiFeste de a oferi o constant˘ a ce arat˘ a cˆ at de bine este aproximat yde c˘ atre coeficient ¸ii α.
ˆIn mod normal se caut˘ a un αce satisface∥Dlα−y∥2≤ϵ, ˆ ıns˘ a pentru super-rezolut ¸ie este
mai eficient s˘ a ˆ ınlocuim norma 2 cu o norm˘ a p˘ atrat˘ a ∥·∥ FTFce elimin˘ a erorile de frecvent ¸˘ a
ˆ ınalt˘ a proeminente. Alegerea lui Fva fi discutat˘ a ˆ ın una din sect ¸iunile ce urmeaz˘ a. De¸ si
problema optimiz˘ arii prezentat˘ a ˆ ın 13 este ˆ ın general una nedeterminat˘ a, rezultate obt ¸inute
de [?,?] sugereaz˘ a c˘ a, atˆ at timp cˆ at coeficient ¸ii αsunt suficient ¸i de sparse , ace¸ stia pot fi aflat ¸i
minimizˆ and norma l1dup˘ a cum urmeaz˘ a:
min∥α∥1a.ˆ ı.∥FDlα−FY∥2
2≤ϵ. (14)
Multiplicatorii Lagrange ofer˘ a o formul˘ a echivalent˘ a,
min
∥FDlα−Fy∥2
2+λ∥α∥1, (15)
unde λeste termenul ce controleaz˘ a cˆ at de fidel˘ a s˘ a fie aproximarea lui y¸ si cˆ at de sparse
s˘ a fie solut ¸ia. Aceast˘ a metod˘ a de a regulariza regresia liniar˘ a folosind norma l1este cunoscut˘ a
ˆ ın statistic˘ a drept lasoul [?].
Rezolvarea Ecuat ¸iei 15 individual pentru fiecare fragment local al imaginii nu asigur˘ a
compatibilitatea dintre fragmentele vecine. Aceast˘ a compatibilitate este impus˘ a folosind
un algoritm one-pass similar cu cel propus de Freeman [54]. Desigur c˘ a exist˘ a mai multe
metode de a impune aceast˘ a compatibilitate, de exemplu Chang et. al. [55] propun ca
valorile regiunilor ce se suprapun s˘ a fie mediate, ceea ce duce desigur la un efect de estompare
asupra imaginii finale. Un alt algoritm este cel greedy one-pass [54] care ofer˘ a aproximativ
acelea¸ si rezultate ca utilizarea modelului MRF complet [ ?]. Algoritmul propus nu se bazeaz˘ a
pe modelul MRF, dar se aseam˘ an˘ a acestuia datoruit˘ a utiliz˘ arii fragmentelor de imagine cu
rezolut ¸ie ˆ ınalt˘ a reconstruite precedent asupra regiunilor ce se suprapun. Fragmentele sunt
procesate folosind scanarea de tip raster a imaginii, adic˘ a de la stˆ anga la dreapta ¸ si de
sus ˆ ın jos. Ecuat ¸ia 14 este modificat˘ a astfel ˆ ıncˆ at reconstruct ¸ia cu super-rezolut ¸ie Dhαa
fragmentului ys˘ a fie constrˆ ans˘ a pentru a respecta fragmentele cu super-rezolut ¸ie adiacente
obt ¸inute la pasul anterior. Problema optimiz˘ arii ce rezult˘ a din aceste constrˆ angeri este:
min∥α∥1a.ˆ ı.∥FDlα−FY∥2
2≤ϵ1,
∥PDhα−ω∥2
2≤ϵ2, (16)
unde matricea Pextrage regiunea suprapunerii dintre fragmentul curent ¸ si imaginea cu
rezolut ¸ie ˆ ınalt˘ a obt ¸inut˘ a la pasul precedent, iar ωcont ¸ine valorile imaginii cu rezolut ¸ie ˆ ınalt˘ a
reconstruit˘ a anterior ˆ ın zona suprapunerii.

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
Ecuat ¸ia 16 poate fi reformulat˘ a ca
min
∥˜Dα−˜y∥2
2+λ∥α∥1, (17)
unde ˜D=
FDl
βPDh
¸ si˜y=
Fy
βω
.
Parametrul βcontroleaz˘ a compromisul dintre g˘ asirea unui fragment cu rezolut ¸ie ˆ ınalt˘ a
care este compatibil cu vecinii ¸ si respectarea fragmentului cu rezolut ¸ie sc˘ azut˘ a init ¸ial. Pentru
a simplifica problema, alegem β= 1 ˆ ın toate simul˘ arile. Dat˘ a fiind solut ¸ia optimal˘ a pentru
Ecuat ¸ia 17, α, fragmentul cu super-rezolut ¸ie poate fi calculat ca x=Dhα.
Aplicarea constr^ angerii de reconstruct ie global a
Se poate observa c˘ a Ecuat ¸ia 14 ¸ si Ecuat ¸ia 16 nu necesit˘ a o egalitate strict˘ a ˆ ıntre fragmentul
cu rezolut ¸ie sc˘ azut˘ a y¸ ¸ si reconstruct ¸ia acestuia Dlα. Datorit˘ a acestui fapt ¸ si al zgomotului de
imagine, imaginea cu rezolut ¸ie ˆ ınalt˘ a X0obt ¸inut˘ a prin metoda sparse representation poate
s˘ a nu verifice ˆ ın totalitate constrˆ angerea de reconstruct ¸ie din Ecuat ¸ia 11. Aceast˘ a problem˘ a
este eliminat˘ a proiectˆ and X0asupra spat ¸iului solut ¸iilor SHX=Y, adic˘ a
X= arg min
X∥SHX−Y∥2
2+c∥X−X0∥2
2. (18)
Algoritmul 1 : Super-rezolut ¸ie folosind sparse representation
1:Intrare: dict ¸ionarele Dh,Dl¸ si o imagine cu rezolut ¸ie sc˘ azut˘ a Y.
2: Pentru fiecare fragment 3 ×3ydinY, ˆ ıncepˆ and cu colt ¸ul stˆ anga sus, cu o suprapunere
de 1 pixel ˆ ın fiecare direct ¸ie,
◦Se calculeaz˘ a media pixelilor din fragmentul y¸ si o not˘ am cu m.
◦Se rezolv˘ a problema optimiz˘ arii cu ˜D¸ si˜yprezentate ˆ ın Ecuat ¸ia 17:
min ∥˜Dα−˜y∥22+λ∥α∥1.
◦Se genereaz˘ a fragmentul cu rezolut ¸ie ˆ ınalt˘ a x=Dhα.Se pune fragmentul x+m
ˆ ıntr-o imagine cu rezolut ¸ie ˆ ınalt˘ a X0.
3: Sfˆ ar¸ sit.
4: Folosind metoda gradient descent se g˘ ase¸ ste cea mai apropiat˘ a imagine de X0care
satisface constrˆ angerea de reconstruct ¸ie:
X= arg min
X∥SHX−Y∥2
2+c∥X−X0∥2
2.
5:Ie sire: imaginea cu super-rezolut ¸ie X.
Solut ¸ia acestei probleme de optimizare poate fi calculat˘ a folosind metoda gradient descent .
Ecuat ¸ia acestei metode iterative este:
Xt+1=Xt+ν[HTST(Y−SHXt) + (X−X0)], (19)

31
unde Xteste estimarea imaginii cu rezolut ¸ie ˆ ınalt˘ a dup˘ a titerat ¸ii, iar νeste m˘ arimea
pasului metodei gradient descent .
Imaginea rezultat˘ a Xdup˘ a aplicarea optimiz˘ arii de mai sus este considerat˘ a imaginea
cu super-rezolut ¸ie final˘ a. Aceasta este cˆ at de aproape posibil de imaginea X0¸ si ˆ ın acela¸ si
timp respect˘ a constrˆ angerea de reconstruct ¸ie. Tot acest proces de obt ¸inere a super-rezolut ¸iei
este prezentat ˆ ın Algoritmul 1.
Interpretarea optimiz arii globale
Algoritmul prezentat anterior poate fi perceput ca un caz aparte a unei probleme inverse ˆ ın
procesarea imaginilor, ce folose¸ ste ca ¸ si cadru general sparse representation . Idei asem˘ an˘ atoare
au fost implementate ˆ ın compresia imaginilor, eliminarea zgomotului din acestea [2], sau
restaurarea imaginilor [ ?]. Pe lˆ ang˘ a plasarea problemei prezentate ˆ ıntr-un cadru mai amplu,
aceste observat ¸ii sugereaz˘ a posibilitatea ˆ ımbun˘ at˘ at ¸irii performant ¸elor, o dat˘ a cu cre¸ sterea
complexit˘ at ¸ii computat ¸ionale.
Dac˘ a ar fi disponibile destule resurse computat ¸ionale, ar putea fi aproximate simultan
toate fragmentele dintr-o imagine. Mai mult decˆ at atˆ at, ˆ ıntreaga imagine cu rezolut ¸ie ˆ ınalt˘ a
Xpoate fi tratat˘ a ca o variabil˘ a. ˆIn loc de a impune ca Xs˘ a fie reprodus˘ a perfect de
coeficient ¸ii sparse α, putem penaliza diferent ¸a dintre X¸ si imaginea cu rezolut ¸ie ˆ ınalt˘ a dat˘ a de
ace¸ sti coeficient ¸i, acceptˆ and astfel unele solut ¸ii care nu sunt perfect sparse , dar care respect˘ a
mai bine constrˆ angerea de reconstruct ¸ie. Acest lucru conduce la urm˘ atoarea problem˘ a de
optimizare:
X= arg min
X;f ijg{∥SHX−Y∥2
2+λ∑
i;j∥αij∥0
+γ∑
i;j∥Dhαij−PijX∥2
2+τρ(X)}. (20)
Aici, αijreprezint˘ a coeficient ¸ii ce corespund fragmentului ( i, j) din X, iarPijeste o ma-
trice de proiect ¸ie ce selecteaz˘ a fragmentul ( i, j) din X. O funct ¸ie ρ(X) ˆ ınglobeaz˘ a informat ¸ia
prior asupra imaginii cu rezolut ¸ie ˆ ınalt˘ a. Aeast˘ a funct ¸ie poate s˘ a depind˘ a de categoria imag-
inii sau poate avea o form˘ a general˘ a, ca ¸ si termen al regulariz˘ arii (de exemplu: Huber MRF,
variat ¸ia total˘ a, variat ¸ia total˘ a bilateral˘ a).
Algoritmul 1 poate fi interpretat ca o aproximare eficient˘ a din punct de vedere cumputat ¸ional
a Ecuat ¸iei 20. Pasul sparse representation genereaz˘ a coeficient ¸ii αminimizˆ and suma dintre
al doilea ¸ si al treilea termen din Ecuat ¸ia 20. Termenul sparse∥αij∥0este relaxat la∥αij∥1,
iar termenul fidelut˘ at ¸ii rezolut ¸iei ˆ ınalte ∥Dhαij−PijX∥2este aproximat prin versiunea sa
pentru rezolut ¸ie sc˘ azut˘ a ∥FDlαij−Fyij∥2.
Se poate observa c˘ a atunci cˆ and coeficient ¸ii αsunt fixat ¸i, al treilea termen din Ecuat ¸ia 20
penalizeaz˘ a diferent ¸a dintre imaginea cu super-rezolut ¸ie X¸ si reconstruct ¸ia dat˘ a de coeficient ¸ii:∑
i;j∥Dhαij−PijX∥22≈ ∥X0−X∥22. A¸ sadar, pentru valori mici ale lui γ, pasul back-
projection din Algoritmul 1 minimizeaz˘ a suma dintre primul ¸ si al treilea termen al Ecuat ¸iei
20.
Totu¸ si, Algoritmul 1 nu include ¸ si alt˘ a informat ¸ie prior ˆ ın afar˘ a de cˆ at de sparse sunt
coeficient ¸ii reprezent˘ arii, de exemplu, ρ(X) este absent ˆ ın calculul aproxim˘ arii. ˆIn practic˘ a
se poate observa c˘ a, folosind un dict ¸ionar potrivit, informat ¸ia prior poate fi doar cea legat˘ a
desparsity , aceast˘ a informat ¸ie fiind suficient˘ a pentru a obt ¸ine o super-rezolut ¸ie bun˘ a. Dac˘ a

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
totu¸ si mai exist˘ a ¸ si alte informat ¸ii legate de semnalul rezolut ¸iei ˆ ınalte acestea pot fi incluse
ˆ ın pasul reconstruct ¸iei globale al algoritmului.
Super-rezolut ie facial a folosind Sparsity
ˆImbun˘ at˘ at ¸irea calit˘ at ¸ii ¸ si clarit˘ at ¸ii imaginilor ce cont ¸in fet ¸e este deseori dorit˘ a, ˆ ın special
ˆ ın domeniul supravegherii video, unde mereu distant ¸a dintre camer˘ a ¸ si obiectul (persoana)
de interes este mare. Spre deosebire de super-rezolut ¸ia imaginilor generalizat˘ a prezentat˘ a
anterior, imaginile ce cont ¸in fet ¸e au anumite caracteristici ce fac super-rezolut ¸ia s˘ a fie mai
u¸ sor de obt ¸inut. A¸ sadar, pentru super-rezolut ¸ie facial˘ a se poate lucra cu o imagine de intrare
ce are o rezolut ¸ie chiar mai sc˘ azut˘ a dec˘ at cea din cazul general. Ideea de baz˘ a este de a
folosi ˆ ıntˆ ai prior -ul oferit de structura fet ¸ei pentru a aduce imaginea la o rezolut ¸ie medie
rezonabil˘ a, iar apoi implementarea modelului sparse local pentru a recupera detaliile. Mai
exact, solut ¸ia poate fi ˆ ımp˘ art ¸it˘ a ˆ ın dou˘ a etape: 1) modelul global: folosind constrˆ angerea de
reconstruct ¸ie se obt ¸ine o imagine facial˘ a cu o rezolut ¸ie medie, aceast˘ a solut ¸ie este c˘ autat˘ a
doar ˆ ın subspat ¸iul fet ¸elor; iar 2) modelul local: folosind modelul sparse local, se recupereaz˘ a
detaliile imaginii ¸ si se obt ¸ine rezolut ¸ia dorit˘ a.
Modelul factoriz arii matricei nenule (NMF)
Pentru super-rezolut ¸ie, cea mai folosit˘ a metod˘ a pentru modelarea fet ¸ei umane este principal
component analysis (PCA), ce alege un subspat ¸iu de dimensiuni mici ce captureaz˘ a cˆ at mai
mult posibil din valorile variant ¸ei. Totu¸ si, bazele PCA sunt holistice ¸ si tind s˘ a genereze
fet ¸e netede asem˘ an˘ atoare mediei. Mai mult decˆ at atˆ at, deoarece componentele principale ale
reprezent˘ arii pot avea valori negative, reconstruct ¸ia PCA este deseori greu de interpretat.
De¸ si fet ¸ele sunt obiecte cu multe particularit˘ at ¸i, acestea au cˆ ateva p˘ art ¸i comune, cum
ar fi ochii, sprˆ ancenele, nasul, gura ¸ si b˘ arbia. Nonnegative matrix factorization (NMF) [ ?]
propune reprezentarea semnalelor din imagine ca o combinat ¸ie cumulativ˘ a de caracteristici
locale. Pentru a g˘ asi un astfel de subspat ¸iu, NMF poate fi formulat˘ a ca urm˘ atoarea problem˘ a
de optimizare:
arg min
U;V∥X−UV∥22cuU≥0, V≥0, (21)
unde X∈Rnmeste matricea de date, U∈Rnreste matricea baz˘ a ¸ si V∈Rrmeste
matricea coeficient ¸ilor. ˆIn acest context, Xeste construit˘ a dintr-un set de imagini faciale
de antrenament, a c˘ aror rezolut ¸ie este ˆ ınalt˘ a ¸ si care sunt deja aliniate ca ¸ si vectori coloan˘ a.
Num˘ arul de baze rpoate fi ales ca n∗m/(n+m), num˘ ar care este mai mic decˆ at n¸ sim¸ si
duce la o reprezentare mai compact˘ a. Se poate ar˘ ata c˘ a un minim local al Ecuat ¸iei 21 poate
fi obt ¸inut dac˘ a aplic˘ am urm˘ atoarele reguli:
Vij←− Vij(UTX)ij
(UTUV)ij
Uki←− Uki(XVT)ki
(UV VT)ki, (22)
unde 1≤i≤r,1≤j≤m¸ si 1≤k≤n. Matricea baz˘ a Uastfel obt ¸inut˘ a este deseori ¸ si
sparse .

33
Super-rezolut ie facial a ^ n doi pa si
FieX¸ siYreprezent˘ arile cu rezolut ¸ie ˆ ınalt˘ a, respectiv cu rezolut ¸ie sc˘ azut˘ a ale unei fet ¸e. Se
obt ¸ine YdinXnetezind ¸ si scalˆ and conform Ecuat ¸iei 11. Se dore¸ ste recuperarea imaginii
Xdin imaginea Y.ˆIn acest context se poate considera c˘ a Ya fost deja aliniat˘ a conform
bazei de date de antrenament, ori prin selectarea manual˘ a a punctelor cheie din imagine, ori
folosind un algoritm de detect ¸ie a fet ¸ei, cum ar fi cel folosit ˆ ın [ ?]. Se poate obt ¸ine solut ¸ia
optimal˘ a pentru Xfolosind criteriul maximum a posteriori (MAP):
X= arg max
Xp(Y|X)p(X). (23)
Aici, p(Y|X) modeleaz˘ a procesul de observare a imaginii, de obicei presupunˆ and existent ¸a
zgomotului Gaussian ˆ ın observat ¸ia Y,p(Y|X) = 1 /Zexp(−∥SHU c−Y∥22/(2∗σ2)) cu Zca
factor de normalizare ¸ si p(X) un prior al imaginii cu rezolut ¸ie ˆ ınalt˘ a X, de obicei sub forma
exponent ¸ial˘ a p(X) = exp(−cρ(X)). Folosind regulile din Ecuat ¸ia 22 putem obt ¸ine matricea
baz˘ a U, ce este compus˘ a din baze sparse . Fie Ω un subspat ¸iu al imaginilor faciale acoperit
deU.ˆIn acest subspat ¸iu Ω, problema super-rezolut ¸iei prezentat˘ a ˆ ın Ecuat ¸ia 23 poate fi
formulat˘ a folosind constrˆ angerile de reconstruct ¸ie ca:
c= arg min
c∥SHU c−Y∥2
2+ηρ(Uc) cu c≥0, (24)
unde ρ(Uc) este un termen prior ce regularizeaz˘ a solut ¸ia cu rezolut ¸ie ˆ ınalt˘ a, c∈Rr1este
vectorul coeficient folosit pentru estimarea imaginii faciale cu rezolut ¸ie ˆ ınalt˘ a ¸ si care apart ¸ine
subspat ¸iului Ω, iar ηeste un parametru folosit pentru a echilibra fidelitatea reconstruct ¸iei ¸ si
informat ¸ia din prior .ˆIn aceast˘ a lucrare este folosit o imagine prior generic˘ a ce impune ca
solut ¸ia s˘ a fie neted˘ a. Folosind o matrice pentru high pass filtering notat˘ a cu Γ, forma final˘ a
a Ecuat ¸iei 24 este:
c= arg min
c∥SHU c−Y∥2
2+η∥ΓUc∥2cuc≥0. (25)
Imaginea cu rezolut ¸ie medie ˆXeste estimat˘ a de Uc. Termenul prior din Ecuat ¸ia 25 reduce
componentele cu frecvent ¸˘ a ˆ ınalt˘ a, rezultˆ and o imagine final˘ a cu o netezime mai puternic˘ a.
Acest lucru este rectificat folosind modelul fragmentelor locale bazat pe sparse representation
ment ¸ionat anterior. Tot acest algoritm este rezumat ˆ ın Algoritmul 2 prezentat mai jos.

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
Algoritmul 2 : Reconstruct ¸ia imaginilor faciale folosind sparse representation
1:Intrare: matricea baz˘ a sparse U, dict ¸ionarele Dh¸ siDl, o imagine facial˘ a cu rezolut ¸ie
sc˘ azut˘ a ce a fost deja aliniat˘ a Y.
2: G˘ asirea unei imagini faciale netede ˆXdin subspat ¸iul acoperit de Ufolosind urm˘ atorii
pa¸ si:
◦Se rezolv˘ a problema optimiz˘ arii din Ecuat ¸ia 25:
arg min c∥SHU c−Y∥22+η∥ΓUc∥2cuc≥0.
◦ˆX=Uc
3: Pentru fiecare fragment ydinˆX, ˆ ıncepˆ and cu cel din colt ¸ul stˆ anga sus ¸ si
suprapunˆ andu-le cu cˆ ate un pixel ˆ ın fiecare direct ¸ie,
◦Se calculeaz˘ a ¸ si se noteaz˘ a cu mvaloarea medie a pixelilor din y.
◦Se rezolv˘ a problema optimiz˘ arii cu ˜D¸ si˜ydefinite ˆ ın Ecuat ¸ia 17:
min ∥˜Dα−˜y∥22+λ∥α∥1.
◦Se genereaz˘ a fragmentul cu rezolut ¸ieˆ ınalt˘ a x=Dhα+m. Fragmentul xeste introdus
ˆ ın imaginea cu rezolut ¸ie ˆ ınalt˘ a X.
4:Ie sire: imaginea facial˘ a cu super-rezolut ¸ie X.
8 Completarea perechii de dict ionare
ˆIn capitolul precedent a fost prezentat˘ a regularizarea problemei super-rezolut ¸iei folosind
prior -ul sparse conform c˘ aruia fiecare pereche de fragmente cu rezolut ¸ie ˆ ınalt˘ a, respectiv
rezolut ¸ie sc˘ azut˘ a are aceea¸ si reprezentare sparse impus˘ a de dict ¸ionarele Dh¸ siDl. O metod˘ a
simpl˘ a de a obt ¸ine cele dou˘ a dict ¸ionare este de a e¸ santiona perechi de fragmente ale ima-
ginilor direct, p˘ astrˆ and ˆ ın acest fel corespondent ¸a dintre fragmentul cu rezolut ¸ie ˆ ınalt˘ a ¸ si cel
cu rezolut ¸ie sc˘ azut˘ a [56]. Totu¸ si, o astfel de metod˘ a duce la obt ¸inerea unor dict ¸ionare volu-
minoase, a¸ sadar un cost computat ¸ional ridicat. Acest capitol prezint˘ a o metod˘ a mai eficient˘ a
de a obt ¸ine o pereche de dict ¸ionare mai compact˘ a pentru a mic¸ sora volumul de calcule.
^Inv at area unui singur dict ionar
Problema sparse este cea a g˘ asirii unei reprezent˘ ari sparse a semnalelor, ce respect˘ a un
dict ¸ionar complet D. Dict ¸ionarul este de obicei construit folosind un set de exemple de
antrenament X={x1, x2, …, x t}.ˆIn general, un dict ¸ionar compact care s˘ a garanteze c˘ a
reprezentarea sparse din Ecuat ¸ia 13 poate fi obt ¸inut˘ a din minimizarea l1ˆ ın Ecuat ¸ia 14 este
greu de obt ¸inut. Din fericire mult ¸i algoritmi sparse prezentat ¸i anterior sunt eficient ¸i ˆ ın prac-
tic˘ a. Pentru exemplele prezentate ˆ ın aceast˘ a lucrare se folose¸ ste urm˘ atoarea formulare:
D= arg min
D;Z∥X−DZ∥2
2+λ∥Z∥1cu∥Di∥2
2≤1, i= 1,2, …, K, (26)
unde norma l1∥Z∥1este folosit˘ a pentru a impune sparsity -ul, iar constrˆ angerile normei l2
asupra coloanelor lui Delimin˘ a ambiguitatea scal˘ arii. F˘ ar˘ a aceste constrˆ angeri costul poate
fi mereu redus ˆ ımp˘ art ¸ind Zlac > 1 ¸ si ˆ ınmult ¸ind Dcuc > 1. Aceast˘ a formulare a fost

35
studiat˘ a intensiv ˆ ın [ ?,?,?]. Ecuat ¸ia 26 nu este convex˘ a ˆ ın D¸ siZˆ ın acela¸ si timp, dar este
convex˘ a ˆ ın una din ele cˆ and cealalt˘ a este fixat˘ a. Optimizarea este f˘ acut˘ a alternativ asupra
luiD¸ siZ:
1. Se init ¸ializeaz˘ a Dcu o matrice Gaussian˘ a oarecare, ce are fiecare coloan˘ a normalizat˘ a.
2. Se fixeaz˘ a D¸ si se actualizeaz˘ a Zdup˘ a cum urmeaz˘ a:
Z= arg min
Z∥X−DZ∥2
2+λ∥Z∥1, (27)
ce poate fi rezolvat˘ a eficient folosind programarea liniar˘ a.
3. Se fixeaz˘ a Z¸ si se actualizeaz˘ a Ddup˘ a cum urmeaz˘ a:
D= arg min
D∥X−DZ∥2
2cu∥Di∥2
2≤1, i= 1,2, …, K, (28)
ce poate fi rezolvat˘ a folosind multe pachete de optimizare bazate pe programare p˘ atratic˘ a.
4. Se reitereaz˘ a pa¸ sii 2) ¸ si 3) pˆ an˘ a acestea converg. ˆIn aplicat ¸ia Matlab prezentat˘ a s-a
folosit un pachet Matlab dezvoltat ˆ ın [ ?].
^Inv at area dict ionarelor simultan
Date fiind perechile de fragmente ale imaginilor e¸ santionate P={Xh, Yl}, unde Xh=
{x1, x2, …, x n}este setul fragmetelor din imaginea cu rezolut ¸ie ˆ ınalt˘ a, iar Yl={y1, y2, …, y n}
este setul fragmentelor cu rezolut ¸ie sc˘ azut˘ a corespunz˘ atoare. Scopul este de a forma cele
dou˘ a dict ¸ionare pentru fragmentele cu rezolut ¸ie ˆ ınalt˘ a, respectiv cele cu rezolut ¸ie sc˘ azut˘ a,
astfel ˆ ıncˆ at reprezentarea sparse a fragmentului cu rezolut ¸ie ˆ ınalt˘ a s˘ a fie la fel ca cea a
fragmentului cu rezolut ¸ie sc˘ azut˘ a corespunz˘ ator. Aceasta este o problem˘ a dificil˘ a datorit˘ a
modelului subdeterminat al super-rezolut ¸iei. Problemele cod˘ arii sparse individuale pentru
fragmentele cu rezolut ¸ie ˆ ınalt˘ a ¸ si cele cu rezolut ¸ie sc˘ azut˘ a sunt:
Dh= arg min
fDhZg∥Xh−DhZ∥2
2+λ∥Z∥1, (29)
respectiv
Dl= arg min
fDlZg∥Yl−DlZ∥2
2+λ∥Z∥1. (30)
Aceste ecuat ¸ii sunt unite pentru a fort ¸a reprezent˘ arile cu rezolut ¸ieˆ ınalt˘ a ¸ si cele cu rezolut ¸ie
joas˘ a s˘ a aib˘ a acela¸ si cod, astfel obt ¸inˆ and:
min
fDhDlZg1
N∥Xh−DhZ∥2
2+1
M∥Yl−DlZ∥2
2+λ(1
N+1
M)∥Z∥1, (31)

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
unde N¸ siMsunt dimensiunile fragmentelor imaginilor cu rezolut ¸ie ˆ ınalt˘ a, respectiv a
celor cu rezolut ¸ie sc˘ azut˘ a, ˆ ın form˘ a vectorial˘ a. Aici, 1 /N¸ si 1/Mechilibreaz˘ a cei doi termeni
de cost din Ecuat ¸ia 29 ¸ si Ecuat ¸ia 30.
Ecuat ¸ia 31 poate fi rescris˘ a ca:
min
fDhDlZg∥Xc−DcZ∥2
2+λ(1
N+1
M)∥Z∥1, (32)
sau
min
fDhDlZg∥Xc−DcZ∥2
2+ˆλ∥Z∥1. (33)
Unde
Xc=
1√
NXh
1√
MYl
,Dc=
1√
NDh
1√
MDl
. (34)
A¸ sadar, putem folosi aceea¸ si metod˘ a de ˆ ınv˘ at ¸are folosit˘ a ˆ ın cazul unui singur dict ¸ionar ¸ si
pentru a antrena dou˘ a dict ¸ionare ˆ ın scopul super-rezolut ¸iei. A se observa c˘ a, deoarece sunt
folosite caracteristici ale fragmentelor imaginilor cu rezolut ¸ie sc˘ azut˘ a, Dh¸ siDlnu sunt conec-
tate simplu printr-o transformare liniar˘ a; dac˘ a acesta ar fi fost cazul, procesul de antrenare
din Ecuat ¸ia 33 ar depinde doar fragmentele imaginilor cu rezolut ¸ie ˆ ınalt˘ a (detaliile sunt
prezentate ˆ ın sect ¸iunea ce urmeaz˘ a).
Figura 7 ilustreaz˘ a dict ¸ionarul completat folosind Ecuat ¸ia 33 pentru imagini generale.
Vizualizarea dict ¸ionarului este un bun mod de a observa anumite modele ( patterns ) ˆ ın frag-
mentele de imagini, cum ar fi orientarea muchiilor, lucru posibil datorit˘ a compactit˘ at ¸ii aces-
tuia ¸ si care nu ar fi fost la fel de u¸ sor de observat folosind doar fragmentele e¸ santionate.
Figure 7: Dict ¸ionarul fragmentelor cu rezolut ¸ie ˆ ınalt˘ a obt ¸inut din Ecuat ¸ia 33 folosind 100,000
de fragmente cu rezolut ¸ie ˆ ınalt˘ a ¸ si rezolut ¸ie sc˘ azut˘ a extrase din imagini generale. Sunt
obt ¸inut ¸e 512 p˘ art ¸i ale dict ¸ionarului, fiecare parte avˆ and m˘ arimea 9 ×9.

37
Reprezentarea caracteristicilor fragmentelor cu rezolut ie sc azut a
ˆIn ecuat ¸ia 13 este folosit un operator de extragere a caracteristicilor, F, pentru a asigura cal-
culul coeficient ¸ilor ˆ ın a¸ sa fel ˆ ıncˆ at ace¸ stia s˘ a acopere partea cea mai relevant˘ a a semnalului
rezolut ¸iei sc˘ azute, avˆ and a¸ sadar o aproximare mai bun˘ a a fragmentului cu rezolut ¸ie ˆ ınalt˘ a.
ˆIn general Feste un filtru high-pass . Aceast˘ a optiune este aleas˘ a deoarece este cunoscut c˘ a
oamenii sunt mai sensibili la cont ¸inutul cu frecvent ¸e ˆ ınalte ale unei imagini. De asemenea,
cont ¸inutul cu frecvent ¸˘ a ˆ ınalt˘ a al imaginilor cu rezolut ¸ie sc˘ azut˘ a este probabil cea mai im-
portant˘ a parte ˆ ın obt ¸inerea cont ¸inutului cu frecvent ¸e ˆ ınalte pierdut al imaginii cu rezolut ¸ie
ˆ ınalt˘ a.
ˆIn literatura de specialitate cercet˘ atorii au sugerat extragerea anumitor caracteristici ale
fragmentelor cu rezolut ¸ie sc˘ azut˘ a pentru a ˆ ımbun˘ at˘ at ¸i acuratet ¸ea aproxim˘ arii imaginii cu
super-rezolut ¸ie. Freeman et al. [54] au folosit un filtru high-pass pentru a extrage ca ¸ si
caracteristic˘ a a unui fragment informat ¸ia despre muchii din fragmentele cu rezolut ¸ie sc˘ azut˘ a.
Sun et al. [60] au folosit un set de derivate ale filtrului Gaussian pentru a extrage frontierele
din fragmentele cu rezolut ¸ie sc˘ azut˘ a. Chang et al. [55] au folosit gradientul de ordinul ˆ ıntˆ ai
¸ si pe cel de ordin doi ale fragmentelor ca ¸ si reprezentare.
Metoda prezentat˘ a folose¸ ste de asemenea derivate de ordinul ˆ ıntˆ ai ¸ si doi ca ¸ si caracteristici
ale fragmentului cu rezolut ¸ie sc˘ azut˘ a datorit˘ a eficient ¸ei ¸ si simplit˘ at ¸ii lor. Cele patru filtre
1-D folosite pentru a extrage derivatele sunt:
f1= [−1,0,1], f 2=f1T,
f3= [1,0,−2,0,1], f 4=f3T, (35)
unde fTeste transpusa lui f. Aplicˆ and aceste patru filtre duce la obt ¸inerea a patru
vectori de caracteristici pentru fiecare fragment. Ace¸ sti patru vectori sunt concatenat ¸i ˆ ıntr-
un singur vector ce reprezint˘ a caracteristica final˘ a a acelui fragment cu rezolut ¸ie sc˘ azut˘ a.
Totu¸ si ˆ ın metoda prezentat˘ a cele patru filtre nu sunt aplicate direct asupra fragmentelor cu
rezolut ¸ie sc˘ azut˘ a, ci sunt aplicate direct imaginilor de antrenament. ˆIn acest fel, pentru fiecare
imagine cu rezolut ¸ie sc˘ azut˘ a de antrenament se obt ¸in patru h˘ art ¸i ale gradientului ( gradient
maps ). La final se extrag patru fragmente cu aceea¸ si locat ¸ie din acele h˘ art ¸i ale gradientului
¸ si sunt concatenate ˆ ın vectorul caracteristicilor final. A¸ sadar reprezentarea caracteristicilor
pentru fiecare fragment cu rezolut ¸ie sc˘ azut˘ a cont ¸ine ¸ si informat ¸ia legat˘ a de pixelii vecini,
lucru ce duce la o compatibilitate ˆ ıntre vecini mult mai mare, ceea ce este de asemenea dorit
ˆ ın cadrul algoritmului de reconstruct ¸ie.
ˆIn practic˘ a s-a observat c˘ a este mai eficient s˘ a se extrag˘ a caraceristicile din versiunea
m˘ arit˘ a (scalat˘ a) a imaginii cu rezolut ¸ie sc˘ azut˘ a ˆ ın locul celei originale. A¸ sadar, mai ˆ ıntˆ ai
imaginea cu rezolut ¸ie sc˘ azut˘ a este m˘ arit˘ a cu un factor de doi folosind bicubic interpolation
¸ si apoi sunt extrase caracteristicile din aceasta. Este folosit un factor al scal˘ arii de doi
din considerente dimensionale. De exemplu, pentru fragmente 3 ×3 ale imaginii cu rezolut ¸ie
sc˘ azut˘ a, m˘ arind imaginea cu un factor al scal˘ arii de doi, caracteristica final˘ a (vectorul) pentru
acel fragment cu nou˘ a pixeli ar fi de dimensiune 6 ×6×4 = 144. Deoarece ¸ stim dimensiunea
scal˘ arii este u¸ sor s˘ a facem leg˘ atura dintre fragmentele cu rezolut ¸ie ˆ ınalt˘ a ale imaginii ¸ si
fragmentele cu rezolut ¸ie sc˘ azut˘ a scalate. Datorit˘ a modului de extragere a caracteristicilor din
fragmentele cu rezolut ¸ie sc˘ azut˘ a ale imaginii, cele dou˘ a dict ¸ionare Dl¸ siDhnu sunt conectate
liniar, ceea ce face ca procesul de ˆ ınv˘ at ¸are simultan˘ a din Ecuat ¸ia 33 s˘ a fie rezonabil.

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
9 Aplicarea algoritmului  si analiza rezultatelor
ˆIn acest capitol sunt prezentate rezultatele obt ¸inute ˆ ın urma aplic˘ arii algoritmului pentru
obt ¸inerea super-rezolut ¸iei prezentat anterior, atˆ at asupra imaginilor generale cˆ at ¸ si asupra
celor faciale. Sunt prezentat ¸i apoi cˆ ativa factori de influent ¸˘ a asupra algoritmului prezentat,
cum ar fi m˘ arimea dict ¸ionarului, imagini de intrare ce cont ¸in zgomot ¸ si constrˆ angerile de
reconstruct ¸ie global˘ a.
ˆIn experimentele prezentate imaginea cu rezolut ¸ie sc˘ azut˘ a ce este primit˘ a la intrare este
m˘ arit˘ a cu un factor de trei pentru imaginile generale ¸ si un factor de patru pentru cele faciale,
acesta fiind modul obi¸ snuit ˆ ın super-rezolut ¸ia single frame . Pentru super-rezolut ¸ia imaginilor
generale, fragmentele imaginilor cu rezolut ¸ie sc˘ azut˘ a sunt de dimensiune 3 ×3 (ce sunt m˘ arite
la 6×6) ¸ si se suprapun cu un pixel fat ¸˘ a de fiecare fragment vecin, iar corespondentul acestui
fragment este cel cu rezolut ¸ie ˆ ınalt˘ a de dimensiune 9 ×9 cu o suprapunere de trei pixeli.
Pentru super-rezolut ¸ia facial˘ a sunt alese fragmente de dimensiuni 5 ×5 atˆ at pentru imaginile
cu rezolut ¸ie sc˘ azut˘ a, cˆ at ¸ si pentru cele cu rezolut ¸ie ˆ ınalt˘ a. Pentru imaginile color algoritmul
prezentat este aplicat doar asupra canalului iluminant ¸ei, deoarece oamenii sunt mai sensibili
la schimb˘ ari de aceast˘ a natur˘ a. Straturile culorilor (Cb, Cr) sunt apoi interpolate folosind
plain bicubic interpolation . Rezultatele diferitelor metode sunt evaluate atˆ at vizual, cˆ at ¸ si
calitativ folosind root mean square error (RMSE). De¸ si RMSE este des folosit˘ a ˆ ın procesarea
imaginilor, nu este foare eficient˘ a ˆ ın evaluarea calit˘ at ¸ii vizuale a imaginii [ ?]. Deoarece este
modificat canalul iluminant ¸ei, RMSE-ul este de asemenea raportat doar la acest canal.
Super-rezolut ie single image
Super-rezolut ia imaginilor generale
Metodele prezentate sunt aplicate asupra imaginilor generale, cum ar fi cele cu flori, cl˘ adiri ¸ si
fet ¸e umane. Cele dou˘ a dict ¸ionare pentru fragmentele cu rezolut ¸ie ˆ ınalt˘ a, respectiv rezolut ¸ie
sc˘ azut˘ a sunt antrenate folosind 100,000 de perechi de fragmente e¸ santionate din imagini
naturale ce sunt desc˘ arcate de pe Internet. M˘ arimea dict ¸ionarului este fixat˘ a la 1024 ˆ ın toate
experimentele, ce ofer˘ a un echilibru din punct de vedere computat ¸ional ¸ si al calit˘ at ¸ii imaginii.
ˆIn urm˘ atoarea sect ¸iune sunt prezentatele efectele diferitelor m˘ arimi ale dict ¸ionarelor asupra
super-rezolut ¸iei. ˆIn algoritmul super-rezolut ¸iei prezentat ˆ ın Ecuat ¸ia 17, alegerea valorii lui λ
depinde de nivelul de zgomot din imaginea de intrare. Pentru imagini generale cu zgomot
sc˘ azut, este ales λ= 0.01 ˆ ın toate experimentele deoarece ofer˘ a rezultate favorabile.
Imaginea XXXX compar˘ a ie¸ siri ale metodei propuse cu cele ale metodei neighborhood
embedding [55]. Metoda neighborhood embedding este asem˘ an˘ atoare cu cea propus˘ a deoarece
ambele folosesc ponderile combinat ¸iilor liniare obt ¸inute din fragmentul cu rezolut ¸ie sc˘ azut˘ a
pentru a general fragmentul cu rezolut ¸ie ˆ ınalt˘ a dorit. Spre deosebire de metoda propus˘ a,
metoda neighborhood embedding folose¸ ste un num˘ ar fix ( k) de vecini pentru a stabili bazele
reconstruct ¸iei ¸ si nu include o etap˘ a de antrenare a dict ¸ionarului. Pentru o comparat ¸ie corect˘ a
sunt folosite 100,000 de fragmente pentru neighbor embedding ¸ si sunt ˆ ıncercate diverse valori
ale lui kpentru a obt ¸ine cele mai bune rezultate din punct de vedere vizual. Folosind o
pereche de dict ¸ionare compacte, metoda propus˘ a este mai rapid˘ a ¸ si genereaz˘ a rezultate mai
clare din punct de vedere al muchiilor ( sharp edges ). Se poate observa ˆ ın imaginea XXXX
diferent ¸a dintre diverse metode ¸ si cea propus˘ a, cum ar fi textura frunzelor sau pistruii de pe
nasul fetei.

39
ˆIn figura XXXX metoda propus˘ a este comparat˘ a cu unele dintre cele mai bune metode
existente, imaginea de intrare fiind cea a Partenonului ce a fost folosit˘ a ¸ si de Dai et al.
ˆ ın [?]. Algoritmii cu care este comparat˘ a metoda propus˘ a sunt: back projection [6],neighbor
embedding [55] ¸ si metoda propus˘ a recent ce se bazeaz˘ a pe un prior ˆ ınv˘ at ¸at ce impune muchii
netede [ ?]. Imaginea rezultat˘ a folosind back projection are muchiile zimt ¸ate, iar metoda
neighbor embedding genereaz˘ a muchii mai netede pe alocuri dar estompeaz˘ a textura fat ¸adei
templului. Metoda propus˘ a de Dai et al. [ ?] ofer˘ a o reconstruct ¸ie mai bun˘ a, dar cauzeaz˘ a
aparit ¸ia ˆ ın imagine a unei neteziri care nu este prezent˘ a ˆ ın imaginea rezultat˘ a din algoritmul
propus.
Super-rezolut ie facial a
ˆIn aceast˘ a sect ¸iune metoda propus˘ a este aplicat˘ a asupra undei imagini frontale ale unei fet ¸e
umane. Imaginile faciale folositeˆ ın experimentele prezentate sunt desc˘ arcate din baza de date
FRGC (Face Recognition Grand Challenge) Versiunea 1.0 [ ?]. Toate fet ¸ele au fost aliniate
ˆ ın funct ¸ie de pozit ¸ia ochilor folosind un algoritm automat de aliniere ¸ si apoi decupate la
m˘ arimea de 100×100 pixeli. Pentru a afla subspat ¸iul fet ¸elor Ω cuprins de W, sunt selectate
540 de imagini faciale ca ¸ si imagini de antrenament, ce includ ambele sexe, diverse rase, vˆ arste
¸ si expresii faciale (Imaginea ??). Pentru a preg˘ ati perechea de dict ¸ionare ce este necesar˘ a ˆ ın
algoritmul propus sunt de asemenea e¸ santionate 100,000 de perechi de fragmente din acele
imagini ¸ si sunt construite dict ¸ionarele cu o m˘ arime de 1024. Treizeci de imagini faciale (ale
persoanelor care nu sunt ˆ ın setul de antrenament) sunt alese ca ¸ si imagini de test, acestea
sunt estompate ¸ si scalate la m˘ arimea de 25 ×25 de pixeli.
POZAA XXXXXXXXXXXXXXXXXXXXXX
Dup˘ a cum am ment ¸ionat anterior, super-rezolut ¸ia imaginilor faciale poate fi aplicat˘ a
ˆ ın cazuri mai complicate decˆ at cele ale super-rezolut ¸iei generale, datorit˘ a structurii fet ¸ei
umane. ˆIntr-adev˘ ar nu este u¸ sor s˘ a m˘ arim de patru ori imaginea cu rezolut ¸ie sc˘ azut˘ a a
c˘ arei dimensiune este de 25 ×25 folosind metoda general˘ a pentru super-rezolut ¸ie. ˆIn primul
rˆ and, procesul de scalare (mic¸ sorare) duce la pierderea unei cantit˘ at ¸i mare de informat ¸ii,
ceea ce face ca obt ¸inerea unui fragment cu rezolut ¸ie ˆ ınalt˘ a de dimensiune 12 ×12 dintr-un
fragment de dimensiune 3 ×3 s˘ a fie dificil˘ a. ˆIn al doilea rˆ and, rezolut ¸ia imaginii de intrare
este atˆ at de mic˘ a ˆ ıncˆ at structurile fet ¸ei care sunt utile ˆ ın obt ¸inerea super-rezolut ¸iei (cum ar
fi muchiile ¸ si colt ¸urile) sunt restrˆ anse la doar cˆ at ¸iva pixeli. Abordarea ˆ ın doi pa¸ si pentru
super-rezolut ¸ia imaginilor faciale poate totu¸ si s˘ a compenseze informat ¸ia pierdut˘ a ˆ ın primul
pas folosind structura facial˘ a ¸ si c˘ autˆ and o solut ¸ie ˆ ın subspat ¸iul fet ¸elor, impunˆ and anumite
constrˆ angeri ale reconstruct ¸iei. Modelul local din reprezentarea sparse poate fi apoi modificat
pentru a ˆ ımbun˘ at˘ at ¸i muchiile ¸ si texturile pentru a obt ¸ine rezultate mai clare. Metoda pentru
imaginile generale este de asemenea aplicat˘ a asupra acestor imagini ¸ si diferent ¸a dintre cele
dou˘ a metode poate fi observat˘ a ˆ ın Imaginea XXXXXXXXXX
Deoarece rezolut ¸ia imaginii de intrare este una foarte mic˘ a, aplicarea algoritmului pentru
imagini generale asupra acestui tip de imagini nu duce la ni¸ ste rezultate foarte pl˘ acute vizual.
ˆIn experimentele prezentate valoarea lui λeste setat˘ a la λ= 0.01. Metoda prezentat˘ a
este comparat˘ a cu bicubic interpolation [?] ¸ siback projection [6]. Rezultatele pot fi studiate ˆ ın
Figura ??, unde se poate observa c˘ a metoda propus˘ a duce la o calitate mai ridicat˘ a a imaginii
cu super-rezolut ¸ie. Din coloanele patru ¸ si cinci se poate observa c˘ a metoda fragmentelor locale
bazat˘ a pe sparse representation ˆ ımbun˘ at˘ at ¸e¸ ste ¸ si mai mult texturile ¸ si muchiile.
POZA XXXXXXXXXXXXXXXXXX

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
In
uent a m arimii dict ionarelor
Rezultatele experimentale ilustrate mai sus arat˘ a c˘ a prior-ul sparsity pentru fragmentele
imaginii este foarte eficient ˆ ın ceea ce prive¸ ste regularizarea problemei subdeterminate a
super-rezolut ¸iei. ˆIn aceste rezultate m˘ arimea dict ¸ionarului este fixat˘ a la 1024. Intuitiv, un
dict ¸ionar mai mare duce la un rezultat mai bun al super-rezolut ¸iei (acest aspect poate fi dus
la extrem, iar dict ¸ionarul s˘ a fie format chiar din fragmentele e¸ santionate, metod˘ a prezentat˘ a
ˆ ın [56]), ˆ ıns˘ a un dict ¸ionar foarte mare implic˘ a ¸ si o putere computat ¸ional˘ a foarte mare. Aceast˘ a
sect ¸iune prezint˘ a efectul m˘ arimii dict ¸ionarului asupra super-rezolut ¸iei imaginilor generale.
Din cele 100,000 de fragmente e¸ santionate sunt create patru dict ¸ionare de m˘ arimi 256, 512,
1024, 2048 ¸ si sunt aplicate asupra aceleia¸ si imagini de intrare. De asemenea se mai utilizeaz˘ a
¸ si un dict ¸ionar format din toate cele 100,000 de fragmente pentru a putea compara calitatea
imaginiiˆ ın cazul dus la extrem. Rezultatele sunt evaluate atˆ at vizual, cˆ at ¸ si cantitativ folosind
RMSE.
TABEL REZULTATE
POZA LENA
Figura LENA ilustreaz˘ a rezultatele aplic˘ arii dict ¸ionarelor de diferite m˘ arimi asupra imag-
inii cu Lena. De¸ si nu exist˘ a diferent ¸e foarte mari din punct de vedere vizual ˆ ıntre rezultatele
obt ¸inute folosind dict ¸ionarele de diverse m˘ arimi, de la 256 la 2048 ¸ si chiar ¸ si toate fragmentele
e¸ santionate ca dict ¸ionar, se poate observa o mic¸ sorare a num˘ arului artefactelor vizuale ˆ ın
cazul dict ¸ionarelor mai mari. Tabelul XXX cont ¸ine rezultatele calculului RMSE-ului imag-
inilor obt ¸inute folosind dict ¸ionarele prezentate anterior. Dup˘ a cum se poate observa ¸ si ˆ ın
tabel, folosind un dict ¸ionar mai mare se obt ¸ine o valoare mai mic˘ a a RMSE-ului, iar toate
dict ¸ionarele duc la o valoare a RMSE-ului mai mic˘ a decˆ at cea din cazul metodei bicubic
interpolation . Totu¸ si, num˘ arul calculelor este direct proport ¸ional cu m˘ arimea dict ¸ionarelor,
iar dict ¸ionarele foarte mari vor duce la calcule numeroase ¸ si un timp de procesare mai mare.
10 Aplicat ii ale super-rezolut iei
PLACEHOLDER
^Imbun at at ire video obi snuit a
PLACEHOLDER
Camere de supraveghere
PLACEHOLDER
Diagnoz a medical a
PLACEHOLDER
Imagini din satelit
PLACEHOLDER

41
Bibliogra e
[1]R.Y. Tsai, T.S. Huang, Multi-frame image restoration and registration , Adv. Comput.
Vis. Image Process. 1, 1984.
[2]M. Elad, A. Feuer, Restoration of a single superresolution image from several blurred, noisy
and undersampled measured images , IEEE Trans. Image Process. 6 (1997) 1646-1658.
[3]J.I. Harris, Diffraction and resolving power , J.Opt.Soc.Am. 54 (1964) 931-933
[4]S.C. Park, M.K. Park, M.G. Kang, Super-resolution image reconstruction: a technical
overview , IEEE Signal Process. Mag. 20 (2003) 21-36
[5]N. Nguyen, P. Milanfar, G. Golub, A computationally efficient superresolution image
reconstruction algorithm , IEEE Trans. Image Process. 10(2001) 573-583
[6]M. Irani, S. Peleg, Improving resolution by image registration , CVGIP: Graph. Model.
Image Process. 53 (1991) 231-239
[7]M.K. Ng, H. Shen, E.Y. Lam, et al., A total variation regularization based super-resolution
reconstruction algorithm for digital video , EURASIP J. Adv. Signal Process. 2007 (2007)
[8]H. Shen, X. Li, Q. Cheng, et al., Missing information reconstruction of remote sensing
data: a technical overview , IEEE Geosci. Remote Sens. Mag. 3 (2015)
[9]Y. Zhou, Z. Ye, Y. Xiao, A restoration algorithm for images contaminated by mixed Gaus-
sian plus random-valued impulse noise , J. Vis. Commun. Image Represent 24 (2013)
[10]D. Keren, S. Peleg, R. Brada, Image sequence enhancement using sub-pixel displace-
ments ,Proceedings of IEEE computer society conference on CVPR, Ann Arbor, MI.
(1988),742-746
[11]J.R. Bergen, P. Anandan, K.J. Hanna, R. Hingorani, Hierarchical model-based motion
estimation , Proceedings of 2nd ECCV 1992, lecture notes in computer science (1992),
237-252
[12]D. Capel, A. Zisserman, Computer vision applied to super-resolution , IEEE Signal Pro-
cess Mag. 20 (2003), 75-86
[13]R.C. Hardie, K.J. Barnard, E.E. Armstrong, Joint MAP registration and high-resolution
image estimation using a sequence of undersampled images , IEEE Trans. Image Process.
(1997), 1621-1633
[14]G. Botella, U. Meyer-Baese, A. Garcia, M. Rodriguez, Quantization analysis and en-
hancement of a VLSI gradient-based motion estimation architecture , Digit. Signal Process.
22 (2012), 1174-1187
[15]H. Ur, D. Gross, Improved resolution from sub-pixel shifted pictures ,CVGIP Graph.
Models Image Process.54 (1992), 181-186
[16]X. Zhang, Y. Liu, A computationally efficient super-resolution reconstruction algorithm
based on the hybrid interpolation , J. Comput. (2010), 885-892

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
[17]X. Li, M.T. Orchard, New edge-directed interpolation , IEEE Trans. Image Process.
(2001), 1521-1527
[18]L. Zhang, X. Wu, An edge-guided image interpolation algorithm via directional filtering
and data fusion , IEEE Trans. Image Process. (2006), 2226-2238
[19]J. Chu, J. Liu, J. Qiao, X. Wang, Y. Li, Gradient based adaptive interpolation in super-
resolution image restoration ,IEEE ICSP (2008), 1027-1030
[20]X. Zhang, X. Wu, Image interpolation by adaptive 2-D autoregressive modeling and soft-
decision estimation ,IEEE Trans. Image Process. (2008), 887-896
[21]H. Stark, P. Oskoui, High-resolution image recovery from image-plane arrays, using
convex projections , JOSA A (1989), 1715-1726
[22]A.M. Tekalp, M.K. Ozkan, M.I. Sezan, High-resolution image reconstruction from lower-
resolution image sequences and space-varying image restoration , IEEE ICASSP (1992),
169-172
[23]A.J. Patti, M.I. Sezan, A.M. Tekalp, Super-resolution video reconstruction with arbitrary
sampling lattices and nonzero aperture time , IEEE Trans. Image Process. 6 (1997), 1064-
1076
[24]S. Borman, R. Stevenson, Spatial resolution enhancement of low-resolution image
sequences-a comprehensive review with directions for future research , Lab. Image and
SIgnal Analysis, University of Notre Dame, Tech. rep. (1998)
[25]P. Vandewalle, S. Su, M. Vetterli, A frequency domain approach to registration of aliased
images with application to super-resolution , EURASIP J Appl. Signal Process. (2006), 1-
14
[26]L. Lucchese, G.M. Cortelazzo, A noise-robust frequency domain technique for estimating
planar roto-translations , IEEE Trans. Signal Process. 48 (2000), 1769-1786
[27]S. Kim, N.K. Bose, H.M. Valenzuela, Recursive re-construction of high-resolution image
from noisy under-sampled multi-frames , IEEE Trans. Acoust. Speech Signal Process. 38
(1990), 1013-1027
[28]S. Rhee, M.G. Kang, Discrete cosine transform based regularized high-resolution image
reconstruction algorithm , Opt. Eng. 38 (1999), 1348-1356
[29]N. Nguyen, P. Milanfar, A wavelet-based interpolation-restoration method for super-
resolution(wavelet super-resolution) , Circ. Sys. Signal Process.19, (2000), 321-338
[30]W. Wu, Z. Liu, W. Gueaieb, X. He, Single-image super-resolution based on Markov
random field and contourlet transform , J. Electron. Imag. 20 (2011)
[31]S.E. El-Khamy, M.M. Hadhoud, M.I. Dessouky, B.M. Salam, F.A. El-Samie, Regularized
super-resolution reconstruction of images using wavelet fusion , Opt. Eng. 44 (2005)
[32]M.B. Chappalli, N.K. Bose, Simultaneous noise-filtering and super-resolution with
second-generation wavelets , IEEE Signal Process. Lett. 12 (2005), 772-775

43
[33]H. Ji, C. Fermuller Wavelet-based super-resolution reconstruction: theory and algorithm ,
ECCV (2006), 295-307
[34]H. Ji, C. Fermuller Robust wavelet-based super-resolution reconstruction: theory and
algorithm , IEEE Trans. Pattern Anal. Mach Intell 31 (2009), 649-660
[35]S.P. Kim, W.Y. Su Recursive high-resolution reconstruction of blurred multiframe im-
ages, IEEE Trans. Image Process. 2 (1993), 534-539
[36]E. Plenge, D.H. Poot, M. Bernsen, G. Kotek, G. Houston, P. Wielopolski, et al. Super-
resolution methods in MRI: can they improve the trade-off between resolution, signal-to-
noise ratio, and acquisition time? , Magn. Reson. Med. 68 (2012), 1983-1993
[37]S. Farsiu, M.D. Robinson, M. Elad, P. Milanfar, Fast and robust multiframe super-
resolution , IEEE Trans. Image Process. 13 (2004) 1327-1344
[38]S.D. Babacan, R. Molina, A.K. Katsaggelos, Total Variation super resolution using a
variational approach , 15th IEEE international conference on image processing (2008) 641-
644
[39]S. Villena, M. Vega, R. Molina, A.K. Katsaggelos, Bayesian super-resolution image re-
construction using a l1 prior , 6th International symposium on image and signal processing
and analysis (2009) 152-157
[40]S. Villena, M. Vega, S.D. Babacan, R. Molina, A.K. Katsaggelos, Bayesian combination
of sparse and non-sparse priors in image super-resolution , Digit. Signal Process. 23 (2013)
530-541
[41]J. Tian, K.K. Ma, Stochastic super-resolution image reconstruction , J. Vis. Commun.
Image Represent. 21 (200) 232-244
[42]P. Cheeseman, B. Kanefksy, R. Kraft, J. Stutz, R. Hanson, Super-resolved surface recon-
struction from multiple images , Heidberg G.R., editor. Maximum entropy and bayesian
methods, Netherlands: Springer (1996) 239-308
[43]K.V. Suresh, A.N. Rajagopalan, Robust and computationally efficient super-resolution
algorithm , J. Opt. Soc. Am. 24 (2007) 984-992
[44]S. Belekos, N.P. Galatsanos, A.K. Katsaggelos, Maximum a posteriori video super-
resolution using a new multichannel image prior , IEEE Trans. Image Process. 19 (2010)
1451-1464
[45]D. Kong, M. Han, W. Xu, H. Tao, Y. Gong, A conditional random field model for video
super-resolution , IEEE ICPR (2006) 619-622
[46]B.C. Tom, A.K. Katsaggelos, Reconstruction of a high resolution image from multiple
degraded mis-registered low resolution images , Proc. SPIE vol. 2308 (1994) 971-81
[47]C. Liu, D. Sun, A Bayesian approach to adaptive video super-resolution , IEEE conference
on CVPR (2011) 209-221

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
[48]F. Sroubek, G. Cristobal, J. Flusser, A unified approach to super-resolution and multi-
channel blind deconvolution , IEEE Trans. Image Process. 16 (2007) 2322-2332
[49]Y. Bai, J. Hu, Y. Luo, Self-adaptive blind super-resolution image reconstruction , IEEE
ICSIP (2010) 1208-1212
[50]S.B. Kasturiwala S.A. Ladhake, Super-resolution: a novel application to image restora-
tion, IJCSE 2 (2010) 1659-1664
[51]F. Sroubek, J. Flusser, Resolution enhancement via probabilistic deconvolution of multi-
ple degraded images , Pattern Recogn. Lett. 27 (2006) 287-293
[52]F. Sroubek, J. Flusser, Multichannel blind deconvolution of spatially misaligned images ,
IEEE Trans. Image Process. 14 (2005) 874-883
[53]K. Nasrollahi, T.B. Moeslund, Super-resolution: a comprehensive survey , Mach. Vis.
Appl. 25 (2014) 1423-1468
[54]W.T. Freeman, T.R. Jones, E.C. Pasztor, Example based super-resolution , IEEE Com-
put. Graph. Appl. 22 (2002) 56-65
[55]H. Chang, D.Y. Yeung, Y. Xiong, Super-resolution through neighor embedding , IEEE
comput. soc. conf. comput. vis. pattern recogn. (2003) 729-736
[56]J. Yang, J. Wright, T. Huang, Y. Ma, Image super-resolution as sparse representation
of raw image patches , IEEE CVPR (2008) 1-8
[57]J. Yang, J. Wright, T.S. Huang, Y. Ma, Image super-resolution via sparse representation ,
IEEE Trans. Image Process. 19 (2010) 2861-2873
[58]R. Zeyde, M. Elad, M. Protter, On single image scale-up using sparse-representations ,
Curves and surfaces (2012) 711-730
[59]N. Suetake, M. Sakano, E. Uchino, Image super-resolution based on local self-similarity ,
Opt. Rev. 15 (2008) 26-30
[60]J. Sun, N.N. Zheng, H. Tao, H.Y. Shum, Image hallucination with primal sketch priors ,
IEEE comput. soc. conf. comput. vis. pattern recogn. (2003) 729-736
[61]S. Baker, T. Kanade, Limits on super-resolution and how to break them , IEEE Trans.
Pattern Anal. Mach Intell 24 (2002) 1168-1173
[62]X. Li, K.M. Lam, G. Qiu, L. Shen, S. Wang, Example-based image super-resolution with
class-specific predictors , J. Vis. Commun. Image Represent 20 (2009) 312-322
[63]C. Su, Y. Zhuang, L. Huang, F. Wu, Steerable pyramid-based face hallucination , Pattern
Recogn. 38 (2005) 813-824
[64]W. Dong, G. Shi, L. Zhang, X. Wu, Super-resolution with nonlocal regularized sparse
representation , Proc. SPIE vol. 7744 (2010) 77440H-77440H
[65]G. Shi, W. Dong, x. Wu, L. Zhang, Context based adaptive image resolution upconver-
sion, J. Electron. Imag. 19 (2010) 013008-013008

45
[66]X. Wang, X. Tang, Hallucinating face by eigen transformation , IEEE Trans. Sys. Man.
Cyb. Part C: Appl. Rev. 35 (2005) 425-434
[67]X. Ma, J. Zhang, C. Qi, Hallucinating face by position-patch , Pattern Recogn. 43 (2010)
2224-2236
[68]A. Hertzmann, C.E. Jacobs, N. Oliver, B. Curless, D.H. Salesin, Image analogies , Pro-
ceedings of the 28th annual conference on computer graphics and interactive techniques
(2001) 327-340
[69]K.S. Ni, S. Kumar, N. Vasconcelos, T.Q. Nguyen, Single image super-resolution based
on support vector regression , IEEE ICASSP (2006)
[70]M. Bevilacqua, A. Roumy, C. Guillemot, M.L.A. Morel, Low-complexity single image
super-resolution based on nonnegative neighbor embedding , BMVC (2012) 1-10
[71]D. Glasner, S. Bagon, M. Irani, Super-resolution from a single image , IEEE ICCV (2009)
349-356
[72]K.S. Ni, T.Q. Nguyen, Image super-resolution using support vector regression , IEEE
Trans. Image Process. 16 (2007) 1596-1610
[73]S.F. Lui, J.Y. Wu, H.S. Mao, J.J. Lien, Learning-based super-resolution system using
single facial image and multi-resolution wavelet synthesis , ACCV (2007) 96-105
[74]H. Huang, H. He, X. Fan, J. Zhang, Super-resolution of human face image using canon-
ical correlation analysis , Pattern Recogn. 43 (2010) 2532-2543
[75]X. Gao, K. Zhang, D. Tao, X. Li, Image super-resolution with sparse neighbor embedding ,
IEEE Trans. Image Process. 21 (2012) 3194-3205
[76]J.C.W. Chan, J. Ma, F. Canters, A comparison of super-resolution reconstruction meth-
ods for multi-angle CHRIS/Proba images , Proc. SPIE (2008) 1-11
[77]M. Gong, K. He, J. Zhou, J. Zhang, Single color image super-resolution through neighbor
embedding , JCIS 7 (2011) 49-56
[78]J. Zhang, C. Zhao, R. Xiong, S. Ma, D. Zhao, Image super-resolution via dual-dictionary
learning and sparse representation , IEEE ISCAS (2012) 1688-1691
[79]W. Dong, L. Zhang, G. Shi, Centralized sparse representation for image restoration ,
IEEE ICCV (2011) 1259-1266
[80]W. Dong, L. Zhang, G. Shi,X. Li, Nonlocally centralized sparse representation for image
restoration , IEEE Trans. Image Process 22 (2013) 1620-1630
[81]J. Yang, Z. Wang, Z. Lin, S. Cohen, T. Huang, Coupled dictionary training for image
super-resolution , IEEE Trans. Image Process 21 (2012) 3467-3478
[82]J. Kanakaraj, S. Kathiravan, Super-resolution image reconstruction using sparse param-
eter dictionary framework , Sci. Res. Essays 7 (2012) 586-592

Lucrare de diplom˘ a Ionut ¸-C˘ at˘ alin POPA
[83]W. Dong, L. Zhang, G. Shi, X. Wu, Image deblurring and super-resolution by adap-
tive sparse domain selection and adaptive regularization , IEEE Trans. Image Process. 20
(2011) 1838-1857
[84]W. DOng, L. Zhang, R. Lukac, G. Shi, Sparse representation based image interpolation
with nonlocal autoregressive modeling , IEEE Trans. Image Process. 22 (2013) 1382-1394
[85]K.I. Kim, Y. Kwon, Example-based learning for single image super-resolution and JPEG
artifact removal , Max Planck Institute Biological Cybernetics Tubingen, Germany, Tech-
nical report no. TR-173 (2008)
[86]K.I. Kim, Y. Kwon, Single-image super-resolution using sparse regression and natural
image prior , IEEE Trans. Pattern Anal. Mach. Intell. 32 (2010) 1127-1133
[87]D. Thapa, K. Raahemifar, V. Lakshminarayanan, Comparison of super-resolution algo-
rithms applied to retinal images , J. Biomed. Opt. 19 (2014)
[88]Z. Wang, A.C. Bovik, H.R. Sheikh, E.P. Simoncelli, Image quality assessment: from
error visibility to structural similarity , IEEE Trans. Image Process. 13 (2004) 600-612
[89] https://en.wikipedia.org/wiki/Pixel
[90]L. Yue, H. Shen, J. Li, Q. Yuan, H. Zhang, L. Zhang, Image super-resolution: The
techniques, applications and future , IEEE Trans. Image Process. 25 (2016)
[91]D. Thapa, K. Raahemifar, W.R. Bobier, V. Lakshminarayanan, A performance compar-
ison among different super-resolution techniques , IEEE Trans. Image Process. 24 (2015)
[92] https://en.wikipedia.org/wiki/Super-resolution_imaging
[93] https://en.wikipedia.org/wiki/4K_resolution
[94]K. Murthy, M. Shearn, B.D. Smiley, et. al., SkySat-1: very high-resolution imagery from
a small satellite , Sens. Syst. General Satell. XVII (2014)
[95]M. Pierre, Detection of visible photons in CCD and CMOS: a comparative view , Nucl.
Instrum. Methods Phys. Res. Sect. A: Accel., Spectrom., Detect. Assoc. Equip. 504 (2003)
199-212
[96]H. Greenspan, Super-resolution in medical imaging , Comput. J. 52 (2009) 43-63
[97] https://en.wikipedia.org/wiki/Shot_noise
[98]B. Shi, H. Zhao, M. Ben-Ezra, et al., Sub-pixel layout for super-resolution with images
in the octic group , Proceedings of the European Conference on Computer Vision, ECCV,
Springer (2014) 250-264
[99]C. Latry, B. Rouge, Super resolution: quincunx sampling and fusion processing , Pro-
ceedings of the International Geoscience and Remote Sensing Symposium (IGARSS),
Toulouse, France (2003) 315-317
[100] B. Burke, P. Jorden, P. Vu, Overview paper-CCD technology , Scientific detectors for
astronomy 2005, Springer (2006) 225-264

Index
spatial sampling rate, 14
charge-coupled devices, 14
complementary metal oxide semiconductors,
14
artefacte vizuale, 17
CCD, 14
CMOS, 14
fotodiode, 13
imagine, 13
imagine digital˘ a, 13
magnificare, 13
Megapixel, 13
multi-frame, 13
pixel, 13
rat ¸ie semnal-zgomot, 14
Rezolut ¸ia, 13
senzori de imagine, 14
shot noise, 14
single-frame, 13
SNR, 14
super-rezolut ¸ie, 13
47

Similar Posts