Ce este o imagine [307245]

Ce este o imagine ?

O imagine digitala poate fi considerata ca o reprezentare discreta a datelor care poseda atât informații spațiale(aspect) cat si de intensitate(culoare). De asemenea o imagine poate fi considerata ca un semnal multidimensional.

Aspecte ale imaginilor

Imaginea digitala bidimensionala I(m,n) reprezintă răspunsul unor senzori la poziții fixe in coordonatele carteziene 2-D si sunt derivate de la semnalul spațial I(x,y) printr-un proces de eșantionare frecvent denumit discretizare. Discretizarea apare în mod natural cu anumite tipuri de senzori de imagine (cum ar fi camere CCD) și practic determină o mediere locală a semnalului continuu peste unele regiuni mici în domeniul de recepție. Indicii m si n destinați respective rândurilor si coloanelor imaginii. Elementele individuale sau pixelii imaginii sunt astfel menționate prin indecșii lor 2-D (m,n). Ca urmare a convenției Matlab, I(m,n) reprezintă răspunsul pixelului situat la rândul m și coloana n pornind de la o origine din stânga sus a imaginii. In alte sisteme de formare a imaginii, o [anonimizat]. Deseori teoretic este sa tratam o imagine ca un semnal spațial continuu I(x,y). [anonimizat] a le manipula si procesa mult mai efectiv. Analiza matematica a imaginilor discrete conduce în general la o formulare algebrica liniara care este mai buna în unele cazuri.

Valorile pixelilor individuali in majoritatea imaginilor corespund de fapt unor răspunsuri fizice in spațiul 2-D. [anonimizat], [anonimizat] 3 sau mai multe dimensiuni. [anonimizat] 4-D in care 3 coordonate sunt spațiale si cealaltă coordonata corespunde timpului.

Culoarea imaginilor.

O imagine conține unul sau mai multe canale de culoare care definesc intensitatea sau culoarea la o anumita locație a pixelului I(m,n). [anonimizat] a pixelului contine

o singura valoare numerica care reprezintă nivelul semnalului de la acel punct din imagine. Conversia din acest set de numere la o imagine afișata este realizată printr-o hartă de culoare. O hartă de culoare atribuie o nuanță specifică de culoare la fiecare nivel numeric din imagine pentru a da o reprezentare vizuala a datelor. [anonimizat] (zero) la alb (maxim) în funcție de nivelul semnalului. [anonimizat] o singură valoare la fiecare punct din regiune. [anonimizat] a [anonimizat] o hartă în culori false. Unul din principalele motive de a utiliza afișarea in culori false se bazează pe faptul ca sistemul vizual uman este senzitiv la doar aproximativ 40 [anonimizat], in timp ce sensibilitatea la culoare este mult mai fina. Culorile false pot servi de asemenea pentru a [anonimizat]. Aceasta abordare este deseori folosita in imagini astronomice si medicale.

In aceasta imagine este prezentata o imagine de intensitate astronomica afișată folosind atât nuanțe de gri, cat si o harta de culori false. In acest exemplu harta de culori a fost folosita pentru a evidenția detaliat structura si detaliile mai fine ale imaginii pentru ochiul uman, folosind o scala de culoare liniara variind de la albastru închis pana la roșu închis. Definiția harților de culoare , adică atribuirea de culori la valori numerice, pot fi făcute in orice mod pentru a ii fi mai ușor utilizatorului. Deși maparea dintre valoarea numerica a intensității si culoarea sau nuanta de gri este in mod tipic liniara, exista situatii in care o mapare neliniara asociata este mult mai binevenita. In plus fata de imagini in nuante de gri pentru care avem o singura valoare numerica la fiecare locatie a pixelului, de asemenea avem imagini cu culori reale unde intregul spectru de culori poate fi reprezentat ca un vector triplet, in mod tipic (R,G,B) component la fiecare pixel. Aici culoarea este reprezentata ca o combinatie liniara de culori de baza sau valori si imaginea poate fi considerata ca fiind formata din 3 planuri 2-D. Alte reprezentari ale culorilor sunt de asemenea posibile si utilizate destul de larg, cum ar fi (H,S,V) (hue,saturation and intesity[nuanta,saturatie si intensitate]) . In aceasta reprezentare, insitatea V a culorii este decuplata de informatiile cromatice, care este continuta in cadrul componentelor de nuanta si saturatie.

Rezolutia si cuantizarea.

Dimensiunea pixelilor grilei 2-D impreuna cu dimensiunea datelor stocate pentru fiecare pixel individual al imaginii, determina cuantizarea rezolutiei si culorii imaginilor. Dimensiunea unei imagini este definita de rezolutia ei. Rezolutia sursei imaginii poate fi specificata in termen de 3 calitati:

Rezolutia spatiala: coloanele si randurile imaginilor defines numarul de pixeli utilizati pentru a acoperi spatiul visual capturat de imagine. Acestea se refera esantionarea semnalului de imagine si este uneori denumit pixel sau rezolutia digitala a imaginii. Este de obicei citata ca CxR ( de exemplu: 640×480, 800×600, 1024×768,etc.)

Rezolutia temporala: pentru un sistem de capturare continua cum ar fi video, acesta este numarul de imagini capturate intr-o anumita perioada. Este de obicei citata in cadre pe secunda (fps), unde fiecare imagine individuala este referita la un cadru video( de exemplu: canalele TV functioneaza la 25 de cadre pe secunda;25-30 fps este potrivit pentru majoritatea supravegherea video; camerele cu fps mai mare sunt destinate pentru specialistii in stiinta sau inginerie).

Rezolutia de biti: Aceasta defineste numarul valorilor posibile ale intensitatii sau culorii pe care le poate avea un pixel si se refera la cuantizarea informatiilor imaginii. De exemplu o imagine binara are doar 2 culori (alb sau negru), o imagine de nuante gri are de obicei 256 de niveluri diferite de gri de la negru la alb, in timp ce pentru o imagine color depinde de gama de culori in uz. Rezolutia bitilor de obicei este citata ca un numar de biti binari necesari pentru stocare la un nivel de cuantizare dat, de exemplu, binar este de 2 biti, scara de gri este de 8 biti si colorat este de 24 de biti.

Este important de stiut ca rezolutia bitilor unei imagini nu este necesar sa corespunda cu rezolutia sistemului de formare a imaginii. O trasatura comuna a multor camere este un castig automat, in care raspunsurile minime si maxime sunt detectate pe imagine si acest interval este automat impartit intr-un numar convenabil de biti. In aceste cazuri, rezolutia imaginii este de obicei mai mica decat cea realizabila de catre camera.

Formatele de imagine

Din punct de vedere matematic, orice matrice de numere 2-D poate fi considerata o imagine. In viata reala, avem nevoie de a afisa imagini in mod eficient , de a le stoca, de a le transmite prin intermediul retelelor si de a recunoaste datele numerice corespunzatoare imaginilor. Acest lucru a condus la dezvoltarea formatelor standard a imaginilor digitale. In termini simpli, formatele de imagini cuprind un fisier antet care contine informatiile despre cum mai exact imaginea este stocata si valorile reale ale pixelilor. Exista un numar mare de formate de imagine recunoscute existente acum, datand inapoi peste mai mult de 30 de ani de stocare a imaginilor digitale. Unele dintre cele mai utilizate 2-D formate de imagini sunt: GIF (Graphics interchange format); JPEG (Joint Photographic Experts Group) CEL MAI UTILIZAT ; BMP (Bit map picture); PNG (Portable network graphics) ; TIF/ TIFF (Tagged image (file) format) .

Imaginile GIF sunt un format de bază de stocare a imaginilor limitate la numai 256 de niveluri de gri sau de culori, cu acestea din urmă sunt definite printr-o hartă de culoare în antetul fișierului. Prin contrast, formatul obisnuit de JPEG este capabil sa stocheze pana la 24 de biti RGB pentru o imagine color, si pana la 36 de biti pentru aplicatiile de imagistica medicala sau stiintifica, si este utilizat cel mai frecvent pentru imagini la nivel de consum, cum ar fi camerele digitale. Un alt format intalnit care este bine cunoscut este formatul bitmap (BMP) , originar din dezvoltarea sistemului de operare Windows Microsoft, si noul PNG format, conceput pentru inlocuirea mai puternica petru GIF. TIFF, tagged image file format, reprezinta un format major si adaptabil, foarte flexibil, capabil sa stocheze o gama larga de diferite formulare de date ale imaginilor. In general, imaginile de tip fotografic sunt mai potrivite tipului de stocare JPEG sau TIF, in timp ce imaginile cu culori limitate/detalii limitate sunt cele mai potrivite la GIF sau PNG , pentru ca fara pierderi sa fie adaptabile la majoritatea cerintelor stocarii.

Tipurile de imagini

Imaginile binare sunt matrici 2-D care atribuie o valoare numerica din setul {0,1}, fiecarui pixel din imagine. Acestea uneori sunt denumite imagini logice : negru corespunde lui 0 si alb corespunde la 1. Dupa cum nu sunt permise alte valori, aceste imagini pot fi reprezentate ca un simplu flux de biti, dar in practica ele sunt reprezentate ca imagini intregi de 8 biti. O imagine de fax este un exemplu de astfel de imagine binara.

Imaginile de nuante gri sau de intensitate sunt matrici 2-D care atribuie o valoare numerica fiecarui pixel care reprezinta intensitatea in acest punct.

Imaginile color sau RGB sunt matrici 3-D care atribuie trei valori numerice fiecarui pixel, fiecare valoare corespunde componentelor ROSU,VERDE si ALBASTRU (RGB). Conceptual, putem considera trei planuri 2-D distincte de dimensiunea CxRx3 , unde C este numarul coloanelor si R numarul randurilor.

Imaginile cu virgule mobile difera de alte tipuri de imagine discutate mai inainte prin faptul ca nu stocheaza valori intregi de culoare, in schimb stocheaza un numar cu virgula mobila, care intr-un interval de timp dat, definit de precizia virgulei mobile, reprezinta intensitatea. Ele pot reprezenta o valoare masuratoare alta decat intensitatea simpla sau culoare ca parte dintr-o imagine stiintifica sau medicala. Imaginile cu virgule mobila sunt de obicei stocate intr-o imagine de format TIFF sau mult mai specializat, formatul domeniu-specific (ex: DICOM) . Desi utilizarea imaginilor cu virgule mobile este in crestere prin utilizarea domeniului dynamic inalt si fotografierea stereo , formatele de fisiere care sustin stocarea lor nu raman in prezent limitate.

Compresia imaginilor

Un alt lucru important care trebuie luat in consideratie in alegerea unui format de stocare a imaginii este comprimarea. In timp ce comprimarea unei imagini poate insemna ca ocupa mai putin spatiu de stocare pe disk si poate fi transferat in mai putin timp prin retea, mai multe tehnici de compresie folosite pot fi folosite pentru ceea ce numim noi compresie pierduta (lossy compression) . Compresia pierduta opereaza prin stergerea informatiei redundante din imagine. Este posibila eliminarea unei informatii dintr-o imagine fara a afecta foarte mult reprezentarea ei. Aceste eliminari ale informatiei pot fi si uneori nedetectabile de ochiul uman. Unele formate de imagine prezentate mai sus, stocheaza datele intr-o forma comprimata. Memorarea imaginilor in formate comprimate necesita diverse proceduri algoritmice pentru a reduce datele neprelucrate ale imaginii la o imagine care pare identica dar care necesita mai putin spatiu de stocare. Este important sa se faca distinctia intre compresia care permite imaginii originale sa fie reconstruita perfect din datele reduse fara a pierde vre-o informatie importanta a imaginii si asa numitele tehnici lossy compression care reduc volumul stocarii, dar in acest caz se poate ajunge la o reducere semnificativa a calitatii imaginii. Lossy compression este de asemenea des utilizata in stocarea video datorita volumului si mai mare a surselor de date. Aceasta pierdere de informatii, insasi o forma de zgomot introdusa in imagine ca artefacte de compresie, poate limita eficienta imbunatatirii si analizei ulterioare a imaginii. In ceea ce priveste prelucrarea imaginilor practice in Matlab, trebuie remarcat faptul ca o imagine scrisa intr-un fisier din Matlab intr-un format de comprimare a pierderilor (de exemplu JPEG) nu va fi stocata ca imaginea exacta reprezentata in Matlab de la care am inceput. Valorile pixelilor vor fi modificate in procesul de iesire a imaginii ca urmare a compresiei pierdute.

Spatiul de culori

Reprezentarea pe care o folosim pentru a stoca culorile, specificand numarul si natura canalelor de culoare, este in general cunoscuta ca spatiu de culoare. Considerata ca o entitate matematica, o imagine este un set de numere organizate in spatiu , cu fiecare locatie a pixelilor adresata ca I(C,R). Imaginile de natura gri sau cele binare sunt matrici 2D care atribuie o valoare numerica fiecarui pixel care reprezinta intensitatea in acel punct. Ele utilizeaza un spatiu de culoare cu un singur canal care este limitat fie la un spatiu de culoare de 2 biti, fie la scara gri(grey-scale). Prin contrast, imaginile RGB sau cele de culori reale sunt matrici 3D care atribuie 3 valori numerice la fiecare pixel, fiecare valoare corespunde respectiv culorilor rosu,verde si albastru.

RGB

Imaginile RGB (imagini de culori reale) sunt matrici 3D pe care noi putem sa le consideram ca 3 planuri distincte 2D, unul corespunzand fiecarui din cele 3 canale de culori: rosu(R), verde(G) si albastru(B). RGB este cel mai utilizat spatiu de culori utilizat pentru reprezentarea imaginilor digitale pentru ca acestea corespund celor 3 culori primare care sunt mixate pentru reprezentarea pe monitor. Putem usor separa si vedea componentele rosii,verzi si albastre a imaginilor de culoare reala fapt care este demonstrat si in imaginea de mai jos :

Este important sa mentionam ca culorile tipice prezente in imaginea reala sunt aproape totdeauna un amestec de componente de culoare din toate cele 3 canale. O conceptie gresita este ca, de exemplu, elementele percepute ca albastru vor aparea doar in canalul albastru si asa mai departe. In timp ce elementele percepute ca albastru vor aparea sigur mai stralucitoare in canalul albastru, ele de asemenea vor componente mai putin nuantate de rosu si verde. Daca consideram toate culorile care pot fi reprezentate cu reprezentarea RGB, atunci consideram ca spatiul de culoare RGB este un spatiu de culoare essential 3D cu axele R,G si B . Fiecare axa are acelasi interval 0 -> 1 ( scalat de la 0 la 255 pentru bitul comun 1 de canal, in reprezentarea imaginii pe 24 de biti). Culoarea neagra ocupa originea cubului , adica pozitia (0,0,0) care corespunde cu absenta tuturor trei culori, iar culoarea alba ocupa coltul opus, adica pozitia (1,1,1) , indicand valoarea maxima a celor 3 culori. Toate celelalte culori se afla in cadrul acestui cub. Spatiul de culoare RGB este bazat pe partea spectrului electromagnetic vizibil oamenilor.

Ochiul uman are trei tipuri diferite de receptor de culoare pe care are o absorbtie limitata pentru fiecare dintre lungimile de unda rosii,verzi si albastre. Din aceasta cauza transformarea de la culoare la scara gri utilizeaza o combinatie de canale RGB. In procesarea digitala de semnale utilizam modelul simplificat al spatiului RGB care optimizat si standardizat catre reprezentarea grafica insa cu toate acestea este perceptive neliniar. Prin aceasta avem in vedere faptul ca miscarea intr-o directie data in cubul de culoare RGB, nu se produce neaparat o culoare care este perceptiva in concordanta cu schimbarea in fiecare dintre canale. De exemplu, incepand la alb si scazand componenta albastra , se produce galben. Similar, pornind de la rosu si adaugand componente albastre, se produce roz. Din aceasta cauza, spatiul RGB este dificil pentru oameni de a lucra cu el si motivul din care cauza nu este relatat la o cale naturala de a percepe culorile. Ca alternativa putem utiliza perceptarea culorilor ca reprezentare HSV (nuanta,saturatie si intensitate).

Conversia din RGB in imagini de culoare gri

Putem converti dintr-un spatiu RGB intr-o imagine de nuante gri folosind o simpla transformare. Conversia in scara gri este o etapa intiala in majoritatea algoritmilor de analiza a imaginilor deoarece simplifica esential cantitatea informatiei in imagine. Cu toate ca o imagine de tip gri are mai putine informatii decat o imagine color, majoritatea celor mai importante legate de caracteristici, cum ar fi marginile, regiunile, intersectiile si asa mai departe, sunt mentinute. Elementele de detectie si procesare a algoritmilor opereaza mai apoi asupra versiunii convertite la scara gri a imaginii. Dupa o asemenea conversie inca este posibil de a distinge culorile verde si rosu, cum ar fi in urmatorul exemplu:

Merele rosu si verde se pot distinge si dupa conversie.

O imagine de culori RGB, Icolor , este convertita la scara gri, Igri , utilizand urmatoarea transformare : (1.1)

unde (n,m) sunt indecsi ai unui pixel individual in imaginea gri si (n,m,c) este canalul individual al locatiei pixelului (n,m) in imaginea color pentru canalul c in rosu r, albastru b si verde g. Dupa cum putem observa si in ecuatia de mai sus, o imagine gri reprezinta o suma ponderata a canalelor de culoare rosie,verde si albastru. Coeficientii (α,β si γ) sunt setati proportional cu raspunsul perceptual al ochiului uman pentru fiecare din culorile rosu,verde si albastru. Ochiul omului este natural mult mai senzitiv la rosu si verde deschis si prin urmare aceste culori primesc ponderi mai mari pentru a asigura ca echilibrul intensitatii in imaginea gri obtinuta este similar cu cel al imaginii color RGB.

Conversia de la RGB la imaginile de nuante gri este o transformare non inversibila : informatiile pierdute in conversie nu mai pot fi recuperate.

Spatiul de culoare perceptual

Spatiul de culoare perceptual este o cale alternativa de reprezentare a imaginilor color intr-o maniera care este mult mai binevenita perceptiei si intelegerii umane a culorilor decat in reprezentarea RGB. Exista mai multe reprezentari a imaginilor color, insa noi ne vom concentra mai mult pe spatiul de nuanta, saturatie si valoare (HSV) popular in aplicatiile de analiza a imaginii. Din perspectiva analizei imaginilor, aceasta reprezentare permite separarea culorilor dupa gradul de luminozitate. O imagine RGB poate fi transformata in HSV dupa urmatoarea imagine:

unde fiecare din acesti parametric pot fi interpretati astfel:

H (nuanta,HUE) este lungimea de unde dominanta a culorii

S (saturatie) este “puritatea” culorii (ce cantitate de lumina alba este amestecata cu ea)

V (valoare) este luminozitatea culorii

Reprezentarea HSV a unei imagini 2D este de asemenea o matrice 3D care cuprinde 3 canale (h,s,v) si fiecare locatie a pixelilor din imagine I(n,m) contine (h,s,v), care poate fi transformata inapoi intr-o RGB. Implementarea HSV in Matlab, fiecare din canalele h,s,v au valori intre 0 si 1. De exemplu nuanta albastra poate avea valorile h=0.9, saturatia s=0.5 si valoarea v=1 obtinand un albastru deshis vibrant. Prin examinarea individuala a canalelor de culori ale imaginii in HSV, putem observa ca obiectele din imagine sunt mai consistent continute in campul de nuanta rezultat decat in canalele reprezentarii RGB in ciuda prezentei diferitelor conditii de iluminare

13

Ca rezultat, spatiul HSV este de obicei utilizat pentru segmentarea imaginilor pe baza de culoare utilizand o tehnica cunoscuta sub denumirea de colorare.

Imaginile in Matlab

Odata ce am prezentat pana acum bazele reprezentarii imaginilor, putem trece si la aspect practice pentru a investiga stadiile initiale ale manipularii imaginilor utilizand Matlab.

Citirea, scrierea si interogarea imaginilor.

Citirea si scrierea imaginilor este realizata foarte simplu cu comenzile imread si imwrite. Aceste functii pot fi aplicate la majoritatea formatelor de imagine si creeaza sau exporta o matrice de imagini 2D sau 3D corespunzatoare mediului Matlab. Functia imfinfo poate fi utilizata pentru a interoga o imagine si pentru a stabili toate proprietatile sale mai importante, incluzand tipul, formatul, dimensiunea, etc.

Exemplul 1:

Afisarea de baza a imaginilor

Limbajul Matlab foloseste 2 functii de baza pentru afisarea imaginilor : imshow si imagesc. In timp ce imshow

Similar Posts