Segmentare a Imaginilor Multispectrale
Cuprins
1. Descrierea proiectului
2. Considerații teoretice
2.1. Introducere în teledetecție și prelucrarea imaginii
2.2. Definiție
2.3. Considerații fundamentale
2.3.1. Surse de energie
2.3.2. Lungime de undă
2.3.3. Mecanistemele de interacțiune
2.3.4. Model de răspuns spectral
2.3.5. Teledetecție multispectrală
2.3.6. Teledetecție hiperspectrală
2.4. Senzor / Platformă de sistem
2.4.1. Fotografie aeriană
2.4.2. Fotografie cu format mare
2.4.3. Fotografie cu format mic
2.4.4. Fotografii color
2.4.5. Videografie aeriană
2.5. Sisteme de scanare pe satelit
2.5.1. LANDSAT
2.5.2. SPOT
2.5.3. IRS
2.5.4. NOAA-AVHRR
2.5.5. RADARSAT
2.5.6. ERS
2.5.7. JERS
2.5.8. AVIRIS
2.5.9. MODIS
2.6. Procesarea digitală a imaginilor
2.6.1. Prezentare generală
2.6.2. Restaurarea imaginii
2.6.3. Restaurarea radiometrică
2.6.4. Restaurarea geometrică
2.7. Imagini de calitate superioară
2.7.1. Extinderea contrastului
2.7.2. Generator de imagini compozite
2.7.3. Filtrul digital
2.8. Clasificarea imaginilor
2.8.1. Clasificarea supervizată
2.8.2. Clasificarea nesupervizată
2.8.3. Evaluarea preciziei
2.9. Transformarea imaginii
2.9.1. Indicele de vegetație
2.9.2. Analiza componentelor principale
2.9.3. Alte transformări
2.10. Concluzii
2.11 Modelele de culoare RGB și HSV
3. Rezolvarea temei de proiect
3.1. Algoritmul K-Means
3.2. Algoritmul ISODATA
3.3. Algoritmul K-Nearest Neighbors
4. Rezultate
5. Concluzii
6. Bibliografie
Descrierea proiectului
Acest proiect de diplomă prezintă concepte referitoare la metode de segmentare a imaginilor multispectrale și de recunoaștere a acestora. Se încearcă aplicarea a patru algoritmi K-Means, ISODATA și K-Nearest Neighbors, ce conduc la analiza unei imagini procesate. Sunt utilizati pentru partiționarea unei imagini în mai multe segmente, ce schimbă reprezentarea ei în ceva mai semnificativ și mai simplu de analizat.
Se urmărește localizarea obiectelor și limitele lor în imagini, mai exact atribuirea unei etichete pentru fiecare pixel, astfel încât cei cu aceleași acțiuni să aibă anumite caracteristici vizuale. Într-o regiune, fiecare pixeli sunt similari cu unele caracteristici precum textura, intensitatea sau culoarea [1].
Matematic, segmentarea urmarește partiționarea mulțimii pixelilor din imaginea f, în submulțimi fi conținând una sau mai multe componente conexe, disjuncte și uniforme dpdv al unui criteriu C pre-stabilit.
Pot exista și erori ca de exemplu segmentarea imaginii în mai multe elemente decât este necesar, sau în mai puține elemente. Dar rezultatul segmentării unei imagini ar trebui să fie un set de segmente ce împreună acoperă întreaga imagine.
Scopul lucrării este de asemenea si pentru a arăta diferitele rezultate după implementarea celor trei algoritmi.
Cu ajutorul algoritmului K-Means se vor partiționa imaginile în K clustere, iar cu ajutorul algoritmului ISODATA se vor elimina dezavantajele algoritmului K-Means.
Algoritmul K-Nearest Neighbors este o metodă neparametrică ce este folosită pentru clasificare și regresie. Se folosește clasificarea pentru acest proiect de diplomă. Scopul nostru este ca toți pixelii similari să fie segmentați în aceeași regiune, bazându-ne pe vecini [1].
Considerații teoretice
2.1. Introducere în teledetecție și prelucrarea imaginii
Dintre toate sursele de date diferite utilizate în GIS, una dintre cele mai importante este, fără îndoială, cea prevăzută prin teledetecție. Prin utilizarea de sateliți, acum avem un program continuu de achiziție de date pentru întreaga lume, cu intervale de timp variind de la câteva săptămâni la cateva ore. Foarte important, de asemenea, este faptul ca acum avem acces la imagini de teledetecție în format digital, care permit integrarea rapidă a rezultatelor analizei de detectare la distanță într-un GIS.
Dezvoltarea de tehnici digitale pentru restaurarea, consolidarea și interpretarea asistată de calculator a imaginilor de teledetecție inițial a procedat în mod independent și oarecum înainte de GIS. Cu toate acestea, structura de date raster și multe dintre procedurile implicate în aceste sisteme de procesare de imagine (IPS) au fost identice cu cele implicate în raster GIS. Ca urmare, aceasta a devenit comună pentru a vedea pachetele software IPS și a adăugat capacități generale pentru sisteme software GIS și a adăugat cel puțin o suită fundamentală de instrumente IPS. IDRISI este un GIS combinat și un sistem de procesare a imaginii, care oferă capacități avansate în ambele domenii.
Datorită importanței extreme a teledetecție, ca o introducere a datelor pentru GIS, acesta a devenit necesară pentru analiștii GIS (în special cele legate de cererile de resurse naturale) pentru a obține o familiaritate puternică cu IPS. Prin urmare, acest capitol oferă o imagine de ansamblu a acestei tehnologii importante și integrarea acesteia cu GIS [2].
2.2. Definiție
Teledetecția poate fi definită ca orice proces prin care se colectează informații despre un obiect, zonă sau fenomen fără a fi în contact cu ea. Ochii noștri sunt un exemplu excelent de dispozitiv de detectare de la distanța. Suntem capabili să adunăm informații despre împrejurimile noastre prin măsurarea cantității și natura reflectării energiei luminii vizibile de la unele surse externe (cum ar fi soarele sau un bec), așa cum se reflectă pe obiecte în domeniul nostru de vedere. În contrast, un termometru, care trebuie să fie în contact cu fenomenul care il măsoară, nu este un dispozitiv de detectare de la distanță.
Având în vedere această definiție destul de generală, termenul de teledetecție a ajuns să fie asociat în special cu instrumentul de măsurare a interacțiunii dintre materialele de pe suprafața pământului și energia electromagnetică. Totuși orice încercare de a explica o definiție exactă devine dificilă, deoarece nu este întotdeauna mediul natural cel în care este simtit tipul de energie, tipul de energie nu este întotdeauna electromagnetic (de exemplu poate fi sonor) și unele proceduri masoară emisiile de energie naturală (de exemplu „thermal infrared” – raze calorice), în loc de interacțiuni cu energie dintr-o sursă [2].
2.3. Considerații fundamentale
2.3.1. Surse de energie
Senzorii pot fi împărțiti în două mari grupe: pasivi și activi. Senzorii pasivi măsoară nivelul mediu de surse de energie existent, în timp ce, cei activi asigură propria lor sursă de energie. Majoritatea teledetecțiilor se face cu senzorii pasivii, pentru care soarele este sursa de energie majoră. Cel mai vechi exemplu este fotografia. Camerele cu aer au fost mult timp capabile să măsoare și să înregistreze reflexia luminii pe caracteristicile pământului, în timp ce fotografiile aeriene sunt încă o formă majoră de teledetecție. Cele mai noi tehnologii ale condițiilor solide și-au extins capacitățile pentru vizualizarea în vizibil și lungimi de undă în infraroșu, pentru a include, de asemenea, radiația de lungime de undă solară pe un timp îndelungat. Cu toate acestea, nu toți senzorii pasivi folosesc energie solară. Ambii senzori, infrarosu termic și “passive microwave”, masoară emisiile de energie naturală pe pământ. Astfel senzorii pasivi sunt pur și simplu cei care nu furnizează ei înșiși energia detectată.
Prin contrast, senzorii activi furnizează propria lor sursă de energie. Forma cea mai familiară a acesteia este fotografierea cu bliț. Cu toate acestea, în aplicații de mediu și de cartografiere, cel mai bun exemplu este RADAR. Sistemele radar emit energie în câmpul de microunde a spectrului electromagnetic (Figura 1 Spectrul Electromagnetic).
Reflecția de energie a materialelor de pe suprafața pământului este apoi măsurată pentru a produce o imagine a zonei detectată.
Figura 1: Spectrul Electromagnetic [2]
2.3.2. Lungime de undă
După cum s-a arătat, majoritatea dispozitivelor de detecție folosesc energia electromagnetică. Cu toate acestea, spectrul electromagnetic este foarte mare și nu toate lungimile de undă sunt la fel de eficiente în scopuri de teledetecție. Mai mult, nu toate au interacțiuni semnificative cu materialele de pe suprafața pământului ce reprezintă interes pentru noi. Figura 1 ilustrează spectrul electromagnetic. Atmosfera produce o absorbție semnificativă și / sau împrăștierea celor mai scurte lungimi de undă. În plus, lentilele de sticlă a multor senzori provocă, de asemenea, o absorbție semnificativă de lungimi de undă mai scurtă, cum ar fi ultraviolete (UV). Ca urmare, prima fereastră semnificativă (de exemplu, o regiune în care energia poate trece în mod semnificativ prin atmosferă), se deschide lungimilor de undă vizibile. Chiar și aici, lungimile de undă albastre suferă o atenuare semnificativă cauzată de împrăștierea atmosferică, și sunt, astfel, de multe ori lăsate pe dinafară în imagini de teledetectie.
Cu toate acestea, lungimile de undă verde, roșu și cele apropiate de infraroșu (IR) furnizează toate oportunități pentru măsurarea interacțiunilor suprafeței Pământului fără o intervenție semnificativă a atmosferei. În plus, aceste regiuni oferă indicii importante pentru natura multor materiale de pe suprafața pământului.
Clorofila, de exemplu, este un foarte puternic absorbant de lungimi de undă roșii, în timp ce lungimea de undă în apropiere “near – infrared” infraroșu furnizează indicii importante pentru structura frunzelor plantelor. Ca urmare, cea mai mare parte din imaginile prin teledetecție utilizate în aplicații GIS legate sunt facute în aceste regiuni.
Extinderea în regiunile de mijloc și cele termice infraroșii, duc la descoperirea unei varietăți de ferestre (imagini). Cu cât sunt mai lungi undele infraroșii se dovedesc a fi utile într-un număr de aplicații geologice. Regiunile termice s-au dovedit a fi foarte utile pentru monitorizarea nu numai în cazurile evidente de distribuție spațială a căldurii din activitatea industrială, dar și la o gamă largă de aplicații, cum ar fi de la monitorizarea focului la studiul distribuției animalelor și până la condițiile de umiditate a solului. După IR termic, următoarea zonă de importanță majoră în mediu de teledetecție este în regiunea microundelor. Un număr de ferestre importante există în această regiune și au o importanță deosebită pentru utilizarea de imagini radar activ. Textura materialelor de pe suprafața solului provoacă interacțiuni semnificative cu mai multe lungimi de undă din regiunea microundelor. Acest lucru poate fi astfel utilizat ca un supliment la informațiile obținute în alte lungimi de undă, și oferă, de asemenea, un avantaj semnificativ de a fi utilizabile pe timp de noapte (deoarece un sistem activ este independent de radiațiile solare) și în regiunile persistent acoperite cu nori (deoarece lungimile de undă radar nu sunt afectate în mod semnificativ de nori).
2.3.3. Mecanistemele de interacțiune
Când energia electromagnetică lovește un material, trei tipuri de interacțiune pot urma: reflexie, absorbție și / sau transmisie (Figura 2). Preocuparea noastră principală este cu porțiunea reflectată deoarece este, de obicei, cea care este returnată la sistemul de senzori. Exact cât de mult este reflectată va varia și va depinde de natura materialului și unde va fi luată masuratoarea noastră în spectrul electromagnetic.
Ca rezultat, dacă ne uităm la natura acestei componente reflectate peste o gamă de lungimi de undă, putem caracteriza rezultatul ca un model de răspuns spectral.
Figura 2: Sursa de lumină [2]
2.3.4. Model de răspuns spectral
Un model de răspuns spectral este uneori numit o semnătură. Este o descriere (adesea sub forma unui grafic) a gradului în care energia este reflectată în diferite regiuni ale spectrului. Cei mai mulți oameni sunt foarte familiarizați cu tipare (modele) de răspuns spectral deoarece acestea sunt echivalente cu conceptul uman de culoare. De exemplu, Figura 3 prezintă idealizat tipare de răspuns spectral pentru mai multe culori familiare în porțiunea vizibilă a spectrului electromagnetic, precum și penși oferă, de asemenea, un avantaj semnificativ de a fi utilizabile pe timp de noapte (deoarece un sistem activ este independent de radiațiile solare) și în regiunile persistent acoperite cu nori (deoarece lungimile de undă radar nu sunt afectate în mod semnificativ de nori).
2.3.3. Mecanistemele de interacțiune
Când energia electromagnetică lovește un material, trei tipuri de interacțiune pot urma: reflexie, absorbție și / sau transmisie (Figura 2). Preocuparea noastră principală este cu porțiunea reflectată deoarece este, de obicei, cea care este returnată la sistemul de senzori. Exact cât de mult este reflectată va varia și va depinde de natura materialului și unde va fi luată masuratoarea noastră în spectrul electromagnetic.
Ca rezultat, dacă ne uităm la natura acestei componente reflectate peste o gamă de lungimi de undă, putem caracteriza rezultatul ca un model de răspuns spectral.
Figura 2: Sursa de lumină [2]
2.3.4. Model de răspuns spectral
Un model de răspuns spectral este uneori numit o semnătură. Este o descriere (adesea sub forma unui grafic) a gradului în care energia este reflectată în diferite regiuni ale spectrului. Cei mai mulți oameni sunt foarte familiarizați cu tipare (modele) de răspuns spectral deoarece acestea sunt echivalente cu conceptul uman de culoare. De exemplu, Figura 3 prezintă idealizat tipare de răspuns spectral pentru mai multe culori familiare în porțiunea vizibilă a spectrului electromagnetic, precum și pentru alb și gri închis. Modelul de reflexie roșu strălucitor, de exemplu, ar putea fi cel produs de o bucată de hârtie tipărită cu o cerneală roșie. Aici, cerneala este concepută pentru a modifica lumina albă care strălucește pe ea și de a absorbi lungimile de undă albastre și verzi. Ce a mai rămas, atunci, sunt lungimile de undă roșii care reflectă de pe suprafața hârtiei înapoi la sistemul de detectare (ochiul). Marea întoarcerea de lungimi de undă roșii indică un roșu aprins, în timp ce rentabilitatea scăzută de lungimi de undă verde în al doilea de exemplu, sugerează că acesta va apărea destul de întunecată.
Figura 3: Tipare de răspuns spectral [2]
Ochiul este capabil să simtă modele de răspuns spectrale, pentru că este cu adevărat un senzor multispectral (de exemplu, simte în mai mult de un loc în spectrul). Deși funcționarea efectivă a ochiului este destul de complexă, ea are, de fapt, trei tipuri diferite de detectoare, care pot fi considerate utile ca răspuns la regiunile de lungimi de undă roșu, verde și albastru. Acestea sunt aditivul culorii primare, iar ochiul răspunde la amestecurile acestor trei pentru a se obține o senzație de alte nuanțe. De exemplu, culoarea percepută de al treilea model de răspunsul spectral în figura 3 ar fi un galben, rezultatul amestecării unui roșu și verde. Cu toate acestea, este important să se recunoască faptul că acesta este pur și simplu percepția noastră fenomenologică a unui model de răspuns spectral. Să considerăm, de exemplu, a patra curbă. Aici avem reflexie în ambele regiuni, albastru și roșu, ale spectrului vizibil. Aceasta este o distribuție bimodală, și astfel, din punct de vedere tehnic nu o nuanță specifică în spectrul. Cu toate acestea, noi vom percepe acesta să fie violet! “Purple” (o culoare între violet și roșu), nu există în natură (de exemplu, ca o nuanța, o dominantă lungime de undă distinctivă). Cu toate acestea, este foarte real, în percepția noastră. “Purple” este pur și simplu percepția noastră a unui model bimodal implicând o pereche ne-adiacentă de nuanțe primare.
În primele zile de teledetecție, se credea (mai corect sperat), că fiecare material de pe suprafața Pământului ar avea un model de răspuns spectral distinctiv, care i-ar permite să fie detectat în mod fiabil prin mijloace vizuale sau digitale. Cu toate acestea, experiența comună cu culori ar sugera, în realitate, că de multe nu este cazul. De exemplu, două specii de arbori pot avea o colorație diferită la un moment din an și una destul de similară în altul.
Găsirea modelelor distincte de răspuns spectrale este cheia pentru cele mai multe proceduri de interpretare asistată de calculator a imaginilor de teledetecție. Această sarcină este rareori banală. Mai degrabă, analistul trebuie să găsească o combinație de benzi spectrale și perioada din an în care modelele distinctive pot fi găsite pentru fiecare dintre clasele de informații de interes.
De exemplu, Figura 4 prezintă un model idealizat de răspuns spectral pentru vegetație împreună cu cele de apă și sol uscat, gol (sterp / desert). Absorbție puternică de pigmenți din frunze (în special clorofila în scopuri de fotosinteză) în regiuni albastre și roșii din porțiunea vizibilă a spectrului duce la apariția caracteristică verde pentru vegetație sănătosă. Cu toate acestea, în timp ce această semnatură este complet diferită de cele mai multe suprafețe fară vegetație, nu este foarte capabil să distingă între specii de vegetație, cele mai multe vor avea o culoare asemănătoare de verde la maturitatea completă. În infraroșul – apropiat (near-infrared), cu toate acestea, vom găsi un retur mult mai mare de suprafețe cu vegetație din cauza dispersiei (împraștierii) în stratul mezofilic cărnoas al frunzei. Pigmenții plantei nu absorb energie în această regiune, și astfel, împrăștierea, combinată cu efectul multiplicator de o boltă plină de frunze, conduce la reflexie ridicată în această regiune a spectrului. Cu toate acestea, gradul de reflexie va depinde în mare măsură de structura internă a frunzelor (de exemplu, foioase comparativ cu ac). Ca urmare, diferențele semnificative între specii pot fi adesea detectate în această regiune. În mod similar, o dată cu mutarea în regiunea de mijloc a infraroșului vom vedea o semnificativă cufundare în modelul de răspuns spectral, care este asociat cu umiditatea frunzei. Acest lucru este, din nou, un domeniu în care diferențele semnificative pot apărea între specii mature. Aplicațiile ce caută diferențiere optime între specii, vor implica regiunile din apropiere și din mijloc a infraroșului și vor folosi imagistica folosită în ciclul de dezvoltare.
Figura 4: Model idealizat de răspuns spectral [2]
2.3.5. Teledetecție multispectrală
În interpretarea vizuală a imaginilor prin teledetectie, o varietate de caracteristici de imagine sunt aduse în considerare: culoare (sau ton în cazul imaginilor pancromatice), textura, dimensiunea, forma, model, context, și alte asemenea caracteristici. Cu toate acestea, interpretarea asistată pe calculator, este cel mai adesea pur și simplu de culoare (de exemplu, modelul de răspuns spectral), care este utilizat. Din acest motiv un accent puternic este pus pe utilizarea de senzori multispectrali (senzori care, la fel ca ochii, sunt în măsură să evalueze tipare de răspuns spectrale), precum și numărul și amplasarea concretă acestor benzi spectrale.
Figura 5 ilustrează benzi spectrale ale sistemului LANDSAT Cartograful spectral (TM). Satelitul Landsat este un sistem comercial ce furnizează imagini multispectrale în șapte benzi spectrale, la o rezoluție de 30 de metri.
Acesta poate fi indicat prin tehnici analitice, cum ar fi analiza componentelor principale, în multe medii înconjurătoare unde benzile care transportă cea mai mare cantitate de informații despre mediul natural sunt lungimile de undă aproape-infraroșu și roșu.
Apa este puternic absorbită de lungimi de undă în infraroșu și este astfel foarte distinctivă în acea regiune. În plus, speciile de plante arată de obicei cea mai mare diferențiere a lor aici. Zona roșie este de asemenea foarte importantă, deoarece este regiunea primară în care clorofila absoarbe energia pentru fotosinteză. Astfel, aceasta este banda care poate distinge cel mai ușor între suprafețele de vegetație și non-vegetație.
Având în vedere această importanță a benzilor roșii și aproape-infraroșii, nu este surprinzător faptul că sistemele de senzori proiectate pentru monitorizarea resurselor pământului vor include în mod invariabil aceste benzi în orice sistem multispectral particular. Alte benzi vor depinde de o gamă de aplicații vizualizate mental. Multe includ banda vizibilă verde, deoarece acesta poate fi utilizată, împreună cu celelalte două, pentru a produce o compoziție, o culoare tradițională falsă, o imagine color derivată din benzile de verde, roșu și infraroșu (spre deosebire de benzile albastru, verde și roșu de imagini color naturale). Acest format a devenit comun cu apariția de fotografie de culoare infraroșu și este cunoscut pentru mulți specialiști în domeniul de teledetecție.
În plus, o combinație dintre aceste trei benzi funcționează bine în interpretarea peisajului cultural, precum și suprafețele naturale și de vegetație. Cu toate acestea, este din ce în ce mai comun să includă alte benzi care sunt orientate în special pentru diferențierea materialelor de suprafață. De exemplu, LANDSAT TM Band 5 este plasat între două benzi de absorbție de apă și astfel, s-a dovedit foarte util în determinarea diferențelor solului și umiditatea frunzelor.
De asemenea, LANDSAT TM Band 7 vizează detectarea zonelor modificate hidrotermal în suprafețe de roci / stanci goale. Prin contrast, sistemul AVHRR pe sateliți seria NOAA include mai multe canale termice pentru detectarea caracteristicilor de temperatură nor.
Figura 5: Benzi spectrale ale sistemului LANDSAT [2]
2.3.6. Teledetecție hiperspectrală
În afară de imaginile tradiționale multispectrale, unele sisteme noi și experimentale, cum ar fi AVIRIS și MODIS, sunt capabile de a captura date hiperspectrale. Aceste sisteme acoperă o gamă de lungimi de undă asemănătoare cu sistemele multispectrale, dar în benzi mult mai înguste. Acest lucru crește dramatic numărul de benzi (și prin urmare precizia), disponibil pentru clasificarea imaginii (de obicei, zeci și chiar sute de benzi foarte înguste). Mai mult decât atât, au fost create biblioteci sub semnatura hyperspectrală în condiții de laborator și conțin sute de semnături pentru diferite tipuri de landcovers (acoperiri teritoriale), inclusiv multe minerale și alte materiale din pământ. Astfel, ar trebui să fie posibil să se potrivească semnături pentru materiale de suprafață cu mare precizie.
Cu toate acestea, condițiile de mediu și variațiile naturale ale materialelor (care le face diferite de materiale de bibliotecă standard) face acest lucru dificil. În plus, procedurile de clasificare nu au fost dezvoltate pentru datele hiperspectrale, ele au fost pentru imagini multispectrale. Ca o consecință, imaginile multispectrale încă reprezintă un instrument important pentru teledetecția de azi [2].
2.4. Senzor / Platformă de sistem
Având în vedere evoluțiile recente ale senzorilor, o varietate de platforme sunt acum disponibile pentru captare de date prin teledetecție. Aici vom revizui unele dintre combinațiile importante de senzori / platforme, care sunt de obicei disponibile pentru comunitatea utilizatorilor GIS.
2.4.1. Fotografie aeriană
Fotografia aeriană este cea mai veche și cea mai utilizată pe scară largă la metoda de teledetecție. Camere montate în aeronave luminate zburand între 200 și capturează o cantitate mare de informații detaliate. Fotografiile aeriene oferă un inventar vizual instant a unei porțiuni din suprafața pământului și poate fi folosit pentru a crea hărți detaliate. De obicei sunt luate de societăți comerciale de fotografii aeriene care dețin și operează echipate, modificate special de pe aeronave, cu format mare ( x ), camere cu calitate de cartografiere. Fotografiile aeriene pot fi facute, de asemenea, folosind aparate foto de format mic ( și ), de mână sau montate în aeronave ușoare nemodificate.
Aparatul de fotografiat și configurațiile de platformă pot fi clasificate în termeni precum oblic și vertical. Fotografiile aeriene oblice sunt luate în funcție de un unghi la pământ. Imaginile rezultate oferă o vedere ca și cum observatorul privește afară pe o fereastră de avion. Aceste imagini sunt mai ușor de interpretat decât fotografiile verticale, dar sunt dificil de localizat și măsurat caracteristicile utilizate pentru scopuri cartografice.
Fotografiile aeriene verticale sunt făcute cu bătaia camerei drept în jos. Imaginile rezultate descriu caracteristicile de bază în plan, și sunt ușor de comparat cu hărțile. Fotografiile aeriene verticale sunt întotdeauna dorite, dar sunt deosebit de utile pentru anchetele de resurse în zonele în care nu sunt disponibile hărți. Ele descriu caracteristici, cum ar fi modele de teren și vegetație care sunt adesea omise pe hărți. Asemenea fotografii pot captura schimbarile din zonă survenite în timp. Fotografiile aeriene verticale conțin deplasări subtile cauzate de relief, de gradul de înclinare al oglinzilor avionului și de distorsionarea lentilelor acestuia. Imaginile pot fi luate cu suprapunere, deobicei 60 % (procente) de-a lungul liniei de zbor și cel putin 20 % între linii. Imaginile suprapuse pot fi vizualizate cu un stereoscop pentru a crea o vedere tridimensională, numită model stereo.
2.4.2. Fotografie cu format mare
„Commercial aerial survey firms” folosesc aeronave ușoare, cu un motor singur sau dublu, dotate cu camere cu format mare de cartografiere. Aparate foto de format mare, cum ar fi RC-10 Wild, ce folosesc x de film, sunt disponibile în role. Eastman Kodak, Inc, printre altele, produce mai multe soiuri de foi de film destinate special pentru utilizarea în fotografii aeriene. Filmul negativ este utilizat în cazul în care imprimările sunt produsul dorit, în timp ce filmul pozitiv este utilizat în cazul în care foliile transparente sunt dorite. Imprimarea filmului permite mărirea detaliilor. În plus, filmul de imprimare este util atunci când mai multe imprimări vor fi distribuite și utilizate în domeniu.
2.4.3. Fotografie cu format mic
Aparatele foto de format mic transportate în avion sunt o alternativă mai ieftină față de aparatele foto cu format mare. O cameră de 35 mm si 70 mm și lumina sunt cerute împreună cu niște mijloace de a procesa filmul.
Deoarece există laboratoare de procesare comerciale ieftine în cele mai multe părți ale lumii, sistemele de 35 mm sunt deosebit de convenabile. Fotografiile oblice pot fi făcute cu o cameră de mână, în orice aeronavă ușoară; fotografiile verticale necesită o anumită formă de montare specială.
Fotografiile aeriene de format mic au mai multe dezavantaje. Aeronavele presurizate ușor sunt de obicei limitate la altitudini sub 4000 m. Deoarece dimensiunea filmului este scazută, trebuie făcute o serie de sacrificii în ceea ce privește rezoluția sau zona acoperită de cadru. Din cauza distorsiunii în sistemul aparatului de fotografiat, fotografia cu format mic, nu poate fi utilizată în cazul în care este necesară cartografiere precisă.
În plus, prezentarea, calitatea, dimensiunea filmului nu poate fi realizată din negative mici. Cu toate acestea, fotografiile de format mic pot fi foarte folositoare pentru studii de recunoaștere și de asemenea pot fi folosite ca mostre / exemple.
2.4.4. Fotografii color
Fotografiile color normale sunt produse dintr-un compozit de trei straturi de film în care intervin filtre ce acționează pentru a izola, de fapt, lungimi de undă roșii, verzi și albastre separate pentru diferitele straturi de film. Cu film infraroșu color, aceste lungimi de undă sunt deplasate la lungimi de undă mai lungi pentru a produce un compus care a izolat reflecțiile din regiunile de lungimi de undă verzi, roșii si aproape infraroșii. Cu toate acestea, deoarece ochiul uman nu poate vedea în infraroșu, o compoziție de culoare falsă este produsă pentru a face lungimile de undă verzi să pară albastre, lungimile de undă roșii sa pară verzi, iar lungimile de undă în infraroșu să pară roșii.
Ca o alternativă la utilizarea de film color, este de asemenea posibil de a grupa mai multe camere pe o singură aeronavă de montare, fiecare cu film alb, negru și un filtru proiectat pentru a izola un anumit interval de lungimi de undă. Avantajul acestui aranjament este că benzile sunt accesibile în mod independent și poate fi îmbunătățită fotografic. Dacă un compozit de culoare se dorește, este posibil sa fie creat din benzile individuale la un moment ulterior.În mod clar, fotografiile nu sunt într-un format care poate fi utilizat imediat în analiza digitală.
Este posibil sa scanezi fotografii cu un scanner și să creezi, prin urmare, seturi de date multispectrale, fie prin scanarea benzilor individuale ale imaginilor, sau prin scanarea unei imaginei color și separarea benzilor. Cu toate acestea, geometria fotografiilor aeriene (care au o proeminență centrală perspectivă și paralaxa diferențială) este astfel încât acestea sunt dificil de utilizat în mod direct. Mai mult, de obicei, au nevoie de procesare de construcții software fotogrametrice pentru a rectifica imaginile și a elimina efectele paralaxă diferențiale.
2.4.5. Videografie aeriană
Blițuri, aparate portabile, ieftine și reportofoane pot fi luate în avioane „chartered / privilegiate”. În plus, un număr mic de companii aeriene de cartografiere oferă videografia ca o opțiune de ieșire. Prin utilizarea mai multor camere simultan, fiecare cu un filtru proiectat pentru a izola un anumit interval de lungimi de undă, este posibil să se izoleze imagini de bandă multispectrale care pot fi utilizate individual sau în combinație, sub forma unei compoziții de culoare.
Pentru utilizare în analiza digitală, grafică hardware, panouri speciale cunoscute ca „frame grabbers ” pot fi folosite pentru a îngheța orice cadru într-o secvență de film continuu și converti la format digital, de obicei, într-una dintre cele mai populare formate de schimb, cum ar fi TIF sau TARGA. Cum ar fi fotografii de format mic, videografiile aeriene nu pot fi utilizate pentru cartografiere detaliată, dar oferă o imagine de ansamblu utilă pentru anchetele de recunoaștere și poate fi utilizat împreună cu punctul de eșantionare la sol [2].
2.5. Sisteme de scanare pe satelit
Fotografia s-a dovedit a fi o contribuție importantă la interpretarea vizuală și producția de hărți analogice. Cu toate acestea, dezvoltarea platformelor de satelit, nevoia de a avea imagini în format digital au dat naștere la dezvoltarea de scanere în stare solidă cu un format mare pentru capturarea datelor astfel obținute.
Logica de bază a unui senzor de scanare este folosirea unui mecanism de „maturare”, curațare a unei suprafețe mici a imaginii, cunoscută sub numele de câmp instantaneu de vedere de la vest la est, în același timp ce satelitul se mișcă de la nord la sud. Împreună, această mișcare oferă mijloacele de a compune o imagine raster completă a mediului.
O tehnică simplă de scanare este mișcarea unei oglinzi rotative care poate cuprinde câmpul de la vest la est. Câmpul vederii este interceptat cu o prismă care poate descompune energia conținută în cadrul IFOV, în compotentele ei spectrale.
Detectorii fotoelectrici la fel cu cei întâlniți în exponometrii camerelor foto obișnuite sunt dispuși în fața acestui spectru pentru a măsura electric cantitatea de energie detectată în diferite părți ale spectrului electro-magnetic. Daca scanerul este proiectat să se miște de la vest la est, acești detectori sunt făcuți să citească de la est la vest. Acestea formează coloane de-a lungul unui rând de un set de imagini raster, una pentru fiecare detector. Mișcarea satelitului de la nord la sud poziționează sistemul pentru a detecta urmatorul rând, conducând la producerea unui set de imagini raster ca înregistrare a reflexiei într-un interval de benzi spectrale.
Astăzi există multe sisteme prin satelit care colectează imagini ce sunt apoi distribuite utilizatorilor. Câteva din cele mai cunoscute sisteme sunt descrise mai jos. Fiecare tip de satelit oferă caracteristici specifice mai mult sau mai puțin indicate pentru o anumită aplicație.
În general sunt două trăsături ce ar putea ajuta în alegerea datelor prin satelit: rezoluția spațială și rezoluția spectrală. Rezoluția spatială se referă la suprafața de pământ de pe care se colectează date în imagini. Acesta este câmpul instantaneu de vedere (Ifov) descris mai devreme. Rezoluția spectrală se referă la numărul și lățimea benzilor spectrale detectate de senzorii satelitului. În plus, trebuie luate în calcul problemele de cost și de disponibilitate a imaginilor.
2.5.1. LANDSAT
Sistemul de teledetecție LANDSAT este folosit de centrul EROS DATA din SUA pentru studii geologice. Acesta este un nou acord, după o perioadă de distribuție comercială, cu EOSAT, recent achiziționat de corporația Space Imaging. În consecință, costurile au scăzut considerabil, în folosul tuturor. Secvențe întregi sau parțiale sunt valabile într-o varietate de mijloace de distribuție, la fel ca și produse fotografice MSS or TM în culori false sau alb-negru.
Au existat 7 sateliți LANDSAT, primul lansat în 1972. Satelitul 6 s-a pierdut la lansare. Totusi, LANDSAT este încă funcționabil. Landsat 7 a fost lansat în aprilie 1999. LANDSAT se bazează pe doi senzori multispectrali. Primul este scanerul multispectral-MSS ce capturează imagini în patru benzi spectrale: albastru, verde, roșu și infraroșu.
Al doilea este TM, cartograful tematic care colectează 7 benzi: albastru, verde, roșu, infraroșu, jumătate infraroșu și infraroșu termic. MSS are o rezoluție spatială de 80 m, în timp ce cea a TM este de 30 m. Amândoi fotografiază o suprafața de 185 m, trecând în fiecare zi la ora 9.45 ora locală și revenind la fiecare 16 zile. Cu LANDSAT 7, ca suport pentru imagini TM, se continuă cu adăugarea unei co-înregistrări de 15 m bandă pancromatică.
2.5.2. SPOT
Sistemul de observare a Pământului a fost lansat și folosit de un consortium francez din 1985. Sateliții SPOT utilizează două vizibile înalte rezoluții (HRV), senzori pushboom care operează în modul multispectral sau pancromatic. Imaginile multispectrale au o rezoluție spațială de 20 min în timp ce imaginile pancromatice au o rezoluție de 10 m. Sateliții SPOT 1-3 oferă două, trei benzi multispectrale: verde, roșu, infraroșu. SPOT 4, LANSAT în 1998, oferă aceleași benzi multispectrale, în plus o bandă de infraroșu de undă scurtă. Banda pancromatică a lui SPOT 1-3 este de 0.51-0.73 în timp ce cea a lui SPOT 4 este de 0.61-0.68.
Toate imaginile SPOT oferă o panoramă cu o deschidere de 60 km. Senzorul SPOT poate fi fixat să fotografieze căi adiacente. Acest lucru permite instrumentului să obțină imagini repetate din orice zonă de 12 ori în perioada de 26 zile pe orbită. Acest sistem de fixare face din SPOT singurul sistem prin satelit care poate obține informații stereo utile.
SPOT images.inc vinde numeroase produse, inclusiv imagini digitale la alegere pe suport magnetic sau produse fotografice. Imaginile existente pot fi achiziționate sau pot fi comandate altele noi. Clienții pot cere ca satelitul să fie poziționat într-o anumită direcție, în funcție de ce se urmarește să se obțină.
2.5.3. IRS
Cele mai sofisticate capacități sunt oferite de sateliții IRS-1C și IRS-1D care împreună oferă o acoperire globală totală prin senzorii următori:
IRS-Pan: 5.8 m pancromatic
IRS-LISS38: 23.5 m multispectral în benzile urmatoare:
Verde (0.52-0.59)
Roșu (0.62-0.68)
Apropiat de infraroșu (0.77-0.86)
Unde scurte infraroșii (1.55-1.7)
IRS-WiFS9: 180 m multispectral în benzile următoare:
Roșu (0.62-0.68)
Apropiat de infraroșu -(0.77-0.86)
2.5.4. NOAA-AVHRR
Radiometru de foarte mare rezoluție cuprinde o serie de sateliți ai Administrației Naționale Oceanice și Atmosferice. Se obțin date pe o suprafață de 2400 km, în fiecare zi. Adună date pe trei benzi: roșu, aproape infraroșu, trei infraroșii termice. Rezoluția spatială a senzorului este de 1.1 km, acest termen fiind numit arie locală de acoperire. Pentru a studia suprafețe mai mari, o versiune cu o rezoluție superioară este de asemenea valabilă. Aceasta se numește Arie Globală de acoperire.
AVHHRR poate fi o rezoluție spațială mare pentru aplicațiile meteo, dar tablourile de imagine ofera doar modele generale și puține detalii despre studiile terestre. Totuși, ele au o mare rezoluție temporală, arătând suprafețe întinse zilnic și sunt o alegere bună pentru a monitoriza arii mari. Imaginile furnizate de AVHRR sunt folosite de diverse organizații angajate în prevenirea foametei și ca parte integrată a multor alte acțiuni de prevenire.
2.5.5. RADARSAT
Este un saltelit de observare a Pământului lansat în Noiembrie 1995 de Agenția Spatială Canadiană. Datele sunt distribuite de RADARSAT din Richmond, British Columbia, Canada sau de Space Imaging în USA. Rezoluția spatială a imaginii C-BAND SAR ajunge de la 8 la 10 metrii pe pixel și acoperirea solului (fotografierea) se repetă la 24 zile. Senzorii pot fi fixați pe o anumită locație, ceea ce permite colectarea de imagini RADAR stereo.
Semnalele RADAR pătrund de asemenea în stratul de nori, zone de acces care nu sunt disponibile pentru alte sisteme de teledetecție. Spre deosebire de alte imagini transmise prin teledetecție, semnalele transmise de RADAR sunt mai afectate de caracteristici electrice și fizice la destinație, decat de reflecție și modelul spectral. Prin urmare, este nevoie de o interpretare specială și tehnici spațiale de geo-inregistrare. Comparativ cu alte sisteme de teledetecție, folosirea datelor furnizate de RADAR este încă la început, dar are un potențial mare.
2.5.6. ERS
ERS-1 și ERS-2 (Satelit European) de teledetecție a fost creat de agenția spațială europeană. Aceste sisteme identice aduc ceva interesant în plus față de celelalte produse de imagini comerciale, oferind o varietate de formate de ieșire C Band imagini RADAR. În aplicații GIS, principala ieșire de interes este RADAR aer-side în căutarea SAR, ieșire care oferă 100 km brazde largi, cu o rezoluție de 30 de metri. Acest lucru ar trebui să se dovedească a fi de interes considerabil într-o varietate de aplicații, inclusiv studii de vegetație și proiecte de cartografiere în care stratul de nori este o problemă persistentă.
2.5.7. JERS
Oferă o bandă cu o rezoluție de 18m, o lungime de undă mult mai mare decat benzile R folosite în alte aplicații. Banda L poate explora vegetația sau nisipurile instabile, fiind folosită în primul rând în topografie, geologie, în aplicații de cartografiere a zonelor de coastă. Datele furnizate de JERS sunt valabile în USA prin Space Imaging Corporation.
2.5.8. AVIRIS
AVIRIS este un sistem experimental dezvoltat de Propulsion Lab Jet ( JPL ), care produce datele hyperspectrale. Surprinde datele din 224 de benzi în aceeași gamă de lungimi de undă ca și LANDSAT.
2.5.9. MODIS
Senzorul MODIS la bordul EOS AM – 1 platformă (programat pentru lansare în luna iulie, 1999), va oferi o extensie logică a AVHRR prin furnizarea a nu mai puțin de 36 de benzi de imagini cu rezoluție medie având ca și ciclu de repetare 1-2 zile. Benzile 1 și 2 vor oferi 250 m imagini cu o rezoluție în regiunile roșu și infraroșu. Benzile 3-7 vor furniza imagini multispectrale cu o rezoluție de 500 m în regiunile de vizibil și infraroșu. În cele din urmă, benzile 8-36 vor oferi o acoperire hiperspectrală, reflectată în infraroșu și în regiunile termice cu infraroșu, cu o rezoluție de 1 km [2].
2.6. Procesarea digitală a imaginilor
2.6.1. Prezentare generală
Ca urmare a solidelor scanere multispectrale de stat și a altor dispozitive de intrare de tip raster avem acum imagini raster, de date de reflexie spectrale digitale. Principalul avantaj de a avea aceste date în format digital este că acestea ne permit să aplicăm calculatoarelor tehnici de analiză a imaginilor de date, un domeniu de studiu numit Digital Image Processing. Procesarea digitală a imaginilor constă în mare parte în patru operații de bază: restaurarea imaginii, îmbunătățirea imaginii, clasificarea imaginii, transformarea imaginii.
Restaurarea imaginii se ocupă de corectarea și calibrarea imaginilor pentru a realiza o reprezentare fidelă a suprafeței posibile a pământulu, un aspect fundamental pentru toate aplicațiile. Îmbunătățirea imaginii se ocupă în principal de modificarea imaginilor pentru a optimiza aspectul lor față de sistemul vizual. Analiza vizuală este un element cheie, chiar și în prelucrarea digitală a imaginii, iar efectele acestei tehnici pot fi dramatice. Clasificarea imaginii se referă la interpretarea asistată de calculator a imaginilor, o operațiune care este vitală pentru GIS. În ultimul rând transformarea imaginii se referă la derivarea imaginii noi, ca urmare a unor tratamente matematice a imaginii bandei principale.
Pentru a efectua enumerate operațiuni în această secțiune, este necesar accesul la software-ul de procesare a imaginii IDRISI. Deși este cunoscut în primul rând ca un sistem software GIS, acesta oferă, de asemenea, o suită completă de abilități de procesare a imaginii .
2.6.2. Restaurarea imaginii
Imaginile de la distanță detectate de mediu sunt de obicei luate de la o mare distanță față de suprafața pământului. Ca rezultat, există o cale atmosferică substanțială prin care trebuie să treacă energia electromagnetică înainte de a ajunge la senzor. În funcție de lungimile de undă implicate și de condițiile atmosferice (cum ar fi pulberile în suspensie, conținutul de umiditate și turbulență), energia provenită poate fi modificată substanțial. Senzorul poate modifica caracterul datelor deoarece poate combina o varietate de componente mecanice, optice și electrice care servesc la modificarea sau mascarea energiei radiante masurată. În plus, în timpul în care imaginea este scanată, satelitul urmează o traiectorie ce este supusă unor variații minore, timp în care pământul se mișcă. Geometria imaginii este astfel în flux constant.
În cele din urmă, semnalul trebuie să fie transmis înapoi către pământ iar datele finale primite și prelucrate. Prin urmare, o varietate de tulburări sistematice și aparent aleatorii pot fi combinate pentru a degrada calitatea imaginii pe care noi o primim.
Restaurarea imaginii încearcă să elimine aceste efecte de degradare. În linii mari, restaurarea imaginii poate fi defalcată în două sub-domenii de restaurare radiometrică și restaurare geometrică.
2.6.3. Restaurarea radiometrică
Se referă la eliminarea sau diminuarea distorsiunilor în gradul de energie electromagnetică înregistrată de fiecare detector. O varietate de agenți poate provoca distorsiuni în valorile înregistrate pentru celulele imagine.
Unele dintre cele mai des întalnite distorsiuni în procedurile de corectare includ:
Valori uniform crescute din cauza ceței atmosferice, care împraștie mai ales benzi de lungime de undă scurtă, în special lungimi de undă albastre;
Urme din cauza detectoarelor de calibrare;
Zgomot aleatoriu, datorită performanțelor imprevizibile și nesistematice a senzorului sau transmiterea datelor;
Pierderea liniei de scanare, din cauza pierderii semnalului de la detectoare specifice.
De asemenea, este necesar să se includă aici procedurile care sunt utilizate pentru a transforma materiile prime, valorile de reflexie relativă fără unități (cunoscute sub numele de numere digitale sau DN) ale benzilor originale în măsuri reale de putere reflectorizantă (strălucire).
2.6.4. Restaurarea geometrică
În scopul cartografierii, e necesar ca orice imagine furnizată prin teledetecție, să fie înregistrată cu acuratețe. Prin imaginile furnizate prin satelit, altitudinea foarte mare a platformei de detectare, rezultă din deplasările minime de imagine din cauza reliefului.
Ca urmare, înregistrarea trebuie realizată prin folosirea sistematică a „foii de cauciuc”, care deformează, prelucrează ușor imaginea (prin folosirea ecuațiilor polinomiale) bazându-se pe pozițiile cunoscute ale unui set de puncte de control dispersate. Această capacitate este dată în IDRISI prin modulul Resample.
În cazul fotografiilor aeriene, procesul este și mai complex. Nu numai că există distorsiuni sistematice datorate înclinării și altitudinii variabile, dar relieful topografic variabil duce la distorsiuni foarte neregulate ce nu pot fi eliminate prin procedura „foaia de cauciuc”. În acest caz, e necesar să se folosească rectificarea fotogrametică pentru a elimina aceste distorsiuni și a da acuratețe măsurătorilor.
Resample (luarea de probe, mostre) este un modul important și este necesar a fi frecvent utilizat. Acest lucru necesită, de asemenea, o înțelegere aprofundată a sistemelor de referință și parametrii lor asociați, cum ar fi dimensiunile geometrice și proiecțiile [2].
2.7. Imagini de calitate superioară
Îmbunătățirea imaginii se referă la modificarea de imagini pentru a le face mai potrivite pentru capacitățile umane de perceptie. Indiferent de gradul de intervenție digitală, analiza vizuală invariabil joacă un rol foarte important în toate aspectele teledetecției. În timp ce gama de tehnici de îmbunătățire a imaginii este largă, următoarele aspecte fundamentale formează coloana vertebrală a acestui domeniu.
2.7.1. Extinderea contrastului
Senzorii digitali au o gamă largă de valori de ieșire, pentru a se adapta valorilor de reflecție foarte variabile care pot fi găsite în medii diferite. Totusi, în orice mediu, se întamplă des că numai o gamă redusă de valori vor aparea pe cele mai multe zone. Nivelul de distribuție a culorii gri va fi foarte înclinat \ oblic. Procedurile de manipulare prin contrast sunt esențiale pentru majoritatea analizelor vizuale. Figura 6 arată banda TM și histograma sa. De remarcat că valorile imaginii sunt înclinate. Imaginea din dreapta arată aceeași bandă de imagine, după ce o întindere liniară la valorile 12 și 60 a fost aplicată.
În IDRISI, acest tip de îmbunatățire a contrastului se poate realiza interactiv prin Composer’s Layer Properties, în timp ce imaginea este afișată.
Acest lucru este utilizat în mod normal pentru analiză vizuală a datelor, numai valorile originale sunt utilizate în analiză numerică. Imaginile noi, cu valori mărite, sunt produse cu modulul Stretch.
Figura 6: Banda TM si histograma sa [2]
2.7.2. Generator de imagini compozite
Pentru analiza vizuală, amestecul de culori solicită cel mai mult capacitățile ochiului uman. În funcție de sistemul grafic folosit, aceasta variază de la simpla selectare a benzilor utilizate la proceduri mai complicate de combinație de bandă și extinderea contrastului asociat.
Figura 7 prezintă mai multe materiale compozite realizate cu diferite combinații de bandă din același set de imagini TM. Modulul COMPOSITE al lui IDRISI este utilizat pentru a construi imagini compozite cu trei benzi.
Figura 7: Materiale compozite [2]
2.7.3. Filtrul digital
Una dintre cele mai controversate capacități ale analizei digitale este aplicarea filtrelor digitale. Filtrele pot fi utilizate pentru a îmbunătăți aspectul marginilor (uneori numite crispening), pentru eliminarea imaginii estompate și pentru a izola trăsăturile și tendințele direcționale, ca să menționăm doar cateva aspecte. Modulul Filter al lui Idrisi se folosește pentru a aplica filtrele standard sau pentru a aplica și a construi filtrele cerute de utilizator [2].
2.8. Clasificarea imaginilor
Clasificarea imaginii se referă la interpretarea asistată de calculator a imaginilor prin teledetecție. Procedurile implicate sunt tratate în detaliu în Ghidul IDRISI, GIS de procesare a imaginii volumul 2, capitolul Classification of Remotely Sensed Imagery. Această secțiune oferă o scurtă trecere în revistă.
Deși unele proceduri sunt în măsură să includă informații cu privire la astfel de caracteristici de imagine cum ar fi textura și contextul, majoritatea clasificarii imaginilor se bazează doar pe detectarea semnăturilor spectrale (de exemplu, modele de răspuns spectrale) a claselor de acoperire teritorială.
Succesul cu care aceasta se poate face va depinde de două lucruri:
1 ) Prezența semnăturii distinctive pentru clasele de acoperire a teritoriului de interes în setul de bandă utilizată;
2 ) Capacitatea de a distinge în mod fiabil aceste semnături de la alte modele de răspuns spectral care pot fi prezente.
Există două abordări generale de clasificare a imaginii: supravegheate și nesupravegheate. Acestea diferă în funcție de felul în care clasificarea este efectuată. În cazul clasificării supravegheate, sistemul de software delimitează tipurile specifice de acoperire terestră, bazate pe statistica datelor de caracterizare extrase din exemple cunoscute cum ar fi siturile de formare. În cazul clasificarii nesupravegheate, software-ul de clustering (grupare) este folosit pentru a descoperi cele mai des întâlnite tipuri de acoperire terestră analizând furnizarea interpretărilor acestor tipuri de acoperire într-o etapă ulterioară.
2.8.1. Clasificarea supervizată
Primul pas în clasificarea supervizată este de a identifica exemplele claselor de informare (de exemplu, tipuri de acoperire a terenului) de interes în imagine. Acestea sunt numite site-uri de formare. Sistemul software este apoi folosit pentru a dezvolta o caracterizare statistică pentru fiecare clasă de informații. Această etapă este adesea numită analiza amprentei specifice și poate implica dezvoltarea unei caracterizări la fel de simple ca modalitatea de reflecție corespunzatoare fiecărei benzi sau la fel de complexă ca analize detaliate ale diferențelor și covarianților tuturor benzilor.
Odată ce caracterizarea statistică a fost realizată pentru fiecare clasă de informații, imaginea este apoi clasificataă prin examinarea reflecțiilor pentru fiecare pixel și se ia o decizie cu privire la amprentele care se potrivesc cel mai bine. Există mai multe tehnici pentru a lua aceste decizii, numite clasificatoare. Cele mai multe software-uri de procesare a imaginii vor oferi mai multe reguli de decizie. IDRISI oferă o gamă largă de opțiuni încadrându-se în trei grupe în funcție de natura benzilor interne.
Clasificatori puternici:
Caracteristica distinctivă a clasificatorilor puternici este că acestia sunt semnificativi cu privire la clasa de acoperire căreia îi aparține orice pixel. IDRISI oferă trei clasificatoare supervizate în acest grup: Paralelipiped (prin conducte), Distanta minimă către mijloace (MINDIST) și Risc maxim (MAXLIKE). Acestea diferă numai în modul în care dezvolta și utilizează caracterizarea statistică a datelor site-ului de formare. Dintre cele trei, procedura aproximării optime este cea mai sofisticată și este fără îndoială clasificatorul cel mai utilizat pe scară largă în clasificarea de imagini simțit de la distanță.
Clasificatori slabi:
Contrar clasificatorilor puternici, clasificatorii slabi nu reprezintă o decizie definitivă cu privire la clasa de acoperire a terenurilor în care fiecare pixel îi aparține. Mai degrabă, ei dezvoltă declarații ale gradului căruia fiecare pixel aparține, fiecare dintre clasele de acoperire a terenurilor fiind luate în considerare. Astfel, de exemplu, un clasificator slab ar putea indica faptul că un pixel are o probabilitate de 0,72 de a fi pădure, o probabilitate de 0,24 de a fi pășune și o probabilitate de 0,04 de a fi teren gol. Un clasificator puternic ar rezolva această incertitudine concluzionând că pixelul a fost pădure. Cu toate acestea, un clasificator slab creează acestă incertitudine dintr-o varietate de motive.
De exemplu, analistul poate concluziona că incertitudinea apare din cauza faptului că pixel-ul conține mai multe tipuri de acoperire și ar putea folosi probabilitățile cu indicații referitoare la proporții, indicații ce pot fi relative. Acest lucru este cunoscut ca și clasificarea sub-pixel. Alternativ, analistul poate trage concluzia că incertitudinea apare din cauza datelor nereprezentative ale site-ului de formare și prin urmare, poate dori să combine aceste probabilități cu alte probe, înainte de a trage o concluzie.
Clasificatori hiperspectrali
Toți clasificatorii mai sus menționați operează în imagini hiperspectrale, imagini în care mai multe benzi spectrale au fost capturate simultan ca și componente de imagine la fel de accesibile în mod independent. Extinderea acestei logici la multe grupuri produce ceea ce a ajuns să fie cunoscut sub numele de imagini hiperspectrale. Desi nu sunt diferențe esentiale între imaginea hiperspectrală și multispectrala (doar gradul diferă), volumul de date și rezoluția spectrală mare a imaginilor hiperspectrale conduc la diferențe în felul în care sunt tratate.
IDRISI are anumite facilități pentru a crea semnături hiperspectrale de pe site-uri de formare sau de la biblioteci de tipare de răspuns spectrale dezvoltate în condiții de laborator (HYPERSIG) și o semnatură hiperspectrală automată prin extractie de rutină (HYPERAUTOSIG). Aceste semnături pot fi aplicate la oricare clasificatori: cartograful cu unghi spectral (HYPERSAM), Minimum Distance to Means (HYPERMIN), Linear Spectral Unmixing (HYPERUNMIX), proiecția ortogonală subspațială (HYPEROSP), analiza la suprafața de absorbție (HYPERABSORB) clasificatori hiperspectrali. Un clasificator nesupervizat (a se vedea secțiunea următoare) pentru imagini hyperspectrale (HYPERUSP) este de asemenea disponibil.
2.8.2. Clasificarea nesupervizată
Spre deosebire de clasificarea supervizată unde se vorbește despre caracterul (semnatura) categoriilor de informații pe care le căutam, clasificarea nesupervizată nu necesită informații preliminare despre clasele de interes. Examinează datele și le împarte în categoriile spectrale naturale, cele mai prevalente grupuri prezente în date. Analistul identifică apoi aceste grupuri ca clase de acoperire a terenului printr-o combinație de familiaritate cu regiunea și vizite la sol.
Logica după care această clasificare funcționează este cunoscută sub numele de analiza grupurilor, clustere, ce este realizată în IDRISI prin modulul CLUSTER. CLUSTER efectuează clasificarea imaginilor compozite, create cu COMPOSITE care combină benzile de informare cele mai utile. E important sa recunoaștem totuși, că aceste produse nu sunt clase de informații, ci clase spectrale, ce grupează pixeli cu modele de reflexie asemănătoare. Prin urmare, este de obicei cazul în care analistul trebuie să reclasifice clasele spectrale în clase de informare. De exemplu, sistemul ar putea identifica clase de asfalt și ciment pe care analistul ar putea mai târziu să le grupeze, creând o clasă de informații numită trotuar.
Deși atractivă din punct de vedere conceptual, clasificarea nesupervizată a fost în mod tradițional îngreunată de algoritmi foarte lenți. Totuși procedura clusterilor (grupurilor) realizată prin IDRISI este foarte rapidă, fară îndoială cea mai rapidă de pe piața. Astfel, pot fi utilizate în mod iterativ, în combinație cu date de la sol pentru a ajunge la o clasificare foarte puternică.
Cu procedurile de evaluare de pe teren adecvate și precise, acest instrument poate oferi un mijloc extrem de rapid de produceri a unor date de acoperire a terenului, precise pe o bază continuă.
Pe langă tehnicile mai sus menționate, două module leagă clasificările atât controlate și necontrolate. ISOCLUST folosește o procedură numită Analiza Cluster de auto-organizare pentru a clasifica până la 7 benzi prime cu specificarea din partea utilizatorului a numărului de clustere pentru a procesa. Procedura utilizează modulul Cluster ca să ințieze un set de grupuri, ce generează o aplicare iterativa a procedurii MAXLIKE , folosind rezultatele etapei anterioare ca site de instruire pentru această procedură supervizată. Rezultatul este o clasificare nesupervizată, care converge pe un set final de membri stabile folosind o abordare supervizată. Cu toate acestea, în timp ce procedura începe cu site-uri de formare care caracterizează clase individuale, aceasta duce la o clasificare, care include nu numai aceste clase specifice, dar, de asemenea, semnificativ (dar necunoscute) amestecuri care ar putea exista. Astfel, rezultatul final este mai bun ca cel al unei abordări nesupervizate.
2.8.3. Evaluarea preciziei
Un pas important în procesul de clasificare, supervizată sau nu, este evaluarea preciziei imaginilor finale. Acest lucru implică identificarea unui set de locații de eșantionare (ca și în modulul sample) ce sunt vizitate pe teren. Acoperirea terenului găsita în câmp este apoi comparată cu cea care a fost cartografiată în imagine pentru aceeași locație. Evaluările statistice de precizie pot fi derivate pentru întreaga zonă de studiu, precum și pentru clasele individuale. Într-o abordare iterativă, erorile de matrice produse pot fi utilizate pentru a identifica anumite tipuri de acoperire pentru care erorile sunt mult mai multe fața de ceea ce se dorește. Informațiile din matricea la care se referă sunt în mod eronat incluse într-o anumită clasă și acestea sunt excluse din greșeală. Ele pot fi folosite pentru a rafina abordarea clasificării [2].
2.9. Transformarea imaginii
Procesarea digitală a imaginilor oferă o gamă nelimitată de posibile transformări asupra datelor teledetecției. Două sunt menționate aici în mod special, din cauza semnificației lor speciale în aplicații de monitorizare a mediului.
2.9.1. Indicele de vegetație
Există o varietate de indici de vegetație care au fost dezvoltați pentru a ajuta la controlul vegetației. Cei mai mulți sunt bazați pe diferitele interacțiuni dintre vegetație și energie electromagnetică în lungimile de undă roșii și în apropierea-infraroșu. Să revenim la Figura 4, care include un model generalizat de răspuns spectral de vegetație verde cu frunze mari. După cum se poate vedea, reflexia în regiunea roșie (0,6 – 0,7µ) este scăzuta din cauza absorbției de pigmenți de frunze-clorofilă în principal. Regiunea infraroșie (0.8 – 0.9 µ) cu toate acestea, arată o reflexie ridicată din cauza împrăștierii prin structura celulară a frunzelor. Un indice de vegetație foarte simplu poate fi astfel realizat prin compararea măsurătorilor de reflexie în infraroșu cu cel al reflexiei roșu. Cu toate că au fost dezvoltate un număr de variante ale acestei logici de bază, cea care a primit cea mai mare atenție este diferența normalizată a indicelui de vegetație (NDVI).
Se calculează astfel:
NDVI = (NIR – R) / (NIR + R) unde NIR = aproape infrarosu și R = Rosu.
Figura 8 arata NDVI calculat cu benzi 3 si 4 TM pentru aceeași arie aratată în figurile 5, 6 și 7.
Figura 8: NDVI calculat cu benzi 3 si 4 TM [2]
Acest tip de calcul este destul de simplu pentru un raster GIS sau sistem software de procesare a imaginii, iar rezultatul a fost demonstrat că se corelează bine cu măsurătorile de teren de biomasă. Deși NDVI necesită calibrare specifică pentru a fi utilizat drept o măsură reală a biomasei, multe agenții au găsit indicele util ca o măsură relativă în scopuri de monitorizare. De exemplu, Organizația Națiunilor Unite pentru alimentație și agricultura (FAO), Sistemul de Informații Africa Real Time (ARTEMIS) și Sistemul de avertizare timpurie (pentru foamete, FEWS) folosesc imagini NDVI la scară continentală derivate din sistemul NOAA-AVHRR pentru a produce imagini ale indexului de vegetație pentru întregul continent Africa la fiecare zece zile.
În timp ce măsura NDVI s-a dovedit a fi utilă într-o varietate de contexte, un număr mare de indici alternativi au fost propuși pentru medii speciale, cum ar fi terenurile aride. IDRISI oferă o gamă largă a acestor indici (peste 20 la modulele VEGINDEX și TASSCAP combinate). Capitolul asupra vegetației (Indici) în Ghidul IDRISI la GIS și Procesare a Imaginii, volumul 2 oferă o discuție detaliată despre caracteristicile lor și despre potențialul de aplicare.
2.9.2. Analiza componentelor principale
Analiza componentelor principale (PCA) este o tehnică de transformare liniară legată de Analiză a Factorilor. Având în vedere un set de benzi de imagine, APC produce un nou set de imagini, cunoscute sub numele de componente, necorelate cu un altul și ordonate în funcție de cantitatea de variație în care explică de set trupa originală.
APC a fost în mod tradițional utilizat în teledetecție ca un mijloc de compactare a datelor. Pentru o bandă de imagine tipic multispectrală, este normal ca primele două sau trei componente să explice, practic valorile variabile originale de reflexie. Componentele mai târzii astfel tind să fie dominate de efectele zgomotului. Prin respingerea acestor componente târzii, volumul de date este redus fără o pierdere apreciabilă de informații.
Dat fiind că aceste componente târzii sunt dominate de zgomot, este de asemenea posibil să se utlizeze PCA ca o tehnică de eliminare a zgomotului. Trecerea din modulul PCA în IDRISI include coeficienții transformărilor de dinainte și după. Prin reducerea la zero a coeficienților componentelor de zgomot în transformarea inversă, o nouă versiune a benzilor originale poate fi produsă cu aceste elemente de zgomot eliminate.
Recent, APC a dovedit că are aplicație specială în monitorizarea mediului. În cazul în care imaginile multispectrale sunt disponibile pentru două date, benzile de la ambele imagini sunt prezentate ca și în cazul în care toate au venit de la aceeași imagine. În aceste cazuri, modificările dintre cele două date au tendința de a apărea în componentele de mai târziu(târzii). Mai mult, în cazul în care se prezintă o serie de imagini timp NDVI (sau un index de la o singură bandă similară) pentru analiză, o analiză foarte detaliată a schimbărilor de mediu poate fi atinsă.
În acest caz, prima componentă va arăta NDVI tipic pe întreaga serie în timp ce fiecare componentă succesivă ilustrează evenimente de schimbare într-o secvență ordonată de importanță.
Prin examinarea acestor imagini, împreună cu graficele de corelare a lor cu benzile individuale din seria originală, descoperiri importante pot fi obținute în natura schimbărilor și tendințelor în seriile de timp. SA (analiza seriilor de timp) în IDRISI este o versiune special adaptat de APC pentru a facilita acest proces.
2.9.3. Alte transformări
Așa cum am menționat mai devreme, IDRISI oferă o varietate de alte transformări. Acestea includ transformări de culoare în spațiu (COLSPACE), calcule de textură, transformări termice ale corpurilor negre (termică), și o mare varietate de transformări ad-hoc (cum ar fi ratioing), care pot fi realizate cel mai eficient cu calculator de imagine [2].
2.10. Concluzii
Datele obținute prin teledetecție sunt importante pentru o gamă largă de discipline. Acest lucru va continua și va crește probabil cu o mai mare disponibilitate a datelor promise de către un număr tot mai mare de sisteme de operare. Disponibilitatea acestor date, împreună cu software-ul necesar de calculator pentru analiză, oferă oportunități pentru oamenii de știință de mediu și proiectanți, în special în domeniile de cartografiere „landuse” și de detectare a schimbării, care ar fi fost de neconceput în urma cu numai câteva zeci de ani. Structura raster inerentă datelor obținute prin teledetecție îl face ușor compatibil cu rasterul GIS. Astfel, în timp ce IDRISI oferă o suită largă de instrumente de procesare a imaginii, ele sunt complet integrate unui set mai larg de instrumente de raster GIS oferite de sistem [2].
2.11 Modelele de culoare RGB și HSV
Cele două modele de culoare pe care le-am folosit în algoritmii noștrii necesită și ele o descriere suficientă cât să clarifice principiile lor și cum functionează. RGB reprezintă cei trei tipuri de receptori pe care oamenii îi pot distinge.
Codarea trichromatică RGB (roșu-verde-albastru) în sistemele grafice folosește, de obicei, trei bytes sau aproximativ 16 milioane de coduri care să permită culori distincte. Pentru a fi precis spunem 16 de milioane de coduri și nu de 16 milioane de culori, deoarece oamenii nu pot percepe atat de multe culori distincte. Fiecare 3 octeți sau 24 biți RGB pixeli includ câte un octet pentru fiecare: roșu, verde și albastru. Există dispozitive de afișare cu o rezoluție de culoare ce se potrivește cu ochiul uman pentru a utiliza True Color. Sunt necesare cel puțin 16 biți: o codare 15 biți poate folosi 5 biți pentru fiecare dintre R, G, B, în timp ce o codificare de 16 biți ar modela mai bine sensibilitatea relativ mare de verde folosind 6 biți.
Codificarea unei culoari arbitrare este spectrul vizibil care poate fi făcut prin combinarea, codificarea, a trei culori primare (RGB) așa cum se arată în figura 14. Roșu: (255,0,0) și verde: (0,255,0) combinate în cantități egale crează galben: (255,255,0). Cantitatea din fiecare culoare primară dă intensitate. În cazul în care toate componentele sunt de cea mai mare intensitate, culoarea rezultatelor este alb. Proporții egale de o intensitate mai mică a crea nuanțe de gri: (c, c, c) pentru orice 0 <c constante <255 până la negru: (0,0,0). Este de multe ori mult mai convenabil de a scala valorile în intervalul 0-1 mai degrabă decât 0 la 255 atunci când se iau decizii cu privire la culoare în algoritmii noastri (utilizarea unui astfel de interval este independentă de dispozitiv).
Sistemul RGB este un sistem de culoare aditiv deoarece culorile sunt create prin adăugarea de componente la negru: (0,0,0). Aceasta corespunde bine pentru ecrane RGB (monitoare), care au trei tipuri de fosfor pentru a emite lumină. Trei elemente învecinate de fosfor ce corespunzând unui pixel sunt lipite de trei fasciculi de electroni de intensitate C1, C2 și C3, respectiv: uman [3].
Figura 14: Sisteme diferite de codare de culoare tricromatice digitale [3]
Ochi integrează luminanța lor de a percepe "culoarea": (c1, c2, c3). Lumina a 3 lungimi de undă de la o regiune mică a ecracului CRT este astfel adăugată sau mixată fizic. Sursa [3]
Figura 15: Normalizarea Ecuatiei [3]
Valorile normalizate se rezumă întotdeauna la 1. Există o normalizare alternativă; de exemplu am putea folosi max(R,G,B) ca divizor și nu valoarea medie RGB. Prin utilizarea r + g+ b = 1, relația dintre valorile coordonatelor pentru culoare pot fi reprezentate în mod convenabil printr-un grafic 2D [3].
Figura 16: Cub de culoare RGB pentru coordonate normalizate [3]
Figura 17: Reprezentarea hexagonului de culori pentru HSI [3]
În partea stângă este o proiecție a cubului RGB perpendicular pe diagonala de la (0,0,0) la (1,1,1): numele de culori nu apar la nodurile de hexagon. La dreapta este un hexagon reprezentând culori coordonate HSI: intensitatea (I) este axa verticală; nuanță (H) este un unghi la 0 la 2π, cu RED la 0,0; saturația (S) variază de la 0 la 1 în funcție de cât de pură, sau spre deosebire de alb, culoarea este cu S = 0,0 corespunzatore la axa I.
Sistemul HSI este uneori menționat ca sistemul "HSV", folosind termenul "valoare" în loc de "intensitate". HSI este mai convenabil pentru unii designeri grafice, deoarece acesta oferă un control direct al luminozității și nuanța. Pasteluri sunt centrate în apropierea axei I, în timp ce culorile profunde sau bogate sunt de la periferia hexagonului. HSI ar putea oferi, de asemenea, suport mai bun pentru un algoritm de computer vision, deoarece se poate normaliza pentru iluminat și să se concentreze asupra celor doi parametri cromatici, care sunt mai mult asociați cu caracterul intrinsec de o suprafață. Derivarea coordonatelor HSI de la coordonatele RGB este dată în algoritmul din figura 18 [3].
Figura 18: Algoritmul de conversie din RGB in HSI [3]
Rezolvarea temei de proiect
Rezolvarea temei de proiect are la bază segmentarea imaginilor multispectrale. Segmentare imaginii este un pas crucial în teledetecție pentru procesul de regăsire a informațiilor bazate pe obiect. Ca un pas prioritar în clasificarea evaluării calității rezultatului de segmentare este importanță fundamentală pentru procesul de recunoaștere, precum și pentru alegerea, abordarea și parametrii potriviți pentru o sarcină de segmentare dată. Astfel, această cercetare este, de asemenea, legată de subiectul obiectului bazat pe evaluarea preciziei. Segmentarea de imaginii, recent, este utilizată pe scară largă în teledetecție mai ales de cand a crescut disponibilitatea de imagini cu rezoluție foarte înaltă.
Numărul algoritmilor de segmentare este în continuă creștere, astfel evaluarea lor este utilă pentru compararea adecvată în legatură cu nevoile uitilizatorilor și calitatea rezultată [8]. Acest proiect de diplomă constă în implementarea celor trei algoritmi K-Means, ISODATA și K-Nearest Neighbors. Deci, problema generală a fost reprezentată de segmentare, adică modul de a împărți un set de date în K clustere care au valori similare. Scopul folosirii celor trei algoritmi a fost pentru a arăta diferite implementări pentru segmentare. Pentru analiza imaginii datele noastre sunt reprezentate de pixeli. Ei pot conține:
Valori de intensitate;
Valorile RGB și proprietățile de culoare derivate din acestea;
Proprietățile calculate;
Măsurători de textură
Oricare caracteristică din acestea, ce poate fi asociată cu un pixel, poate fi folosită pentru un grup de pixeli, dar în algoritmii utilizați s-a pus accent pe valorile de intensitate și pe modelul de culoare RGB. Un aspect important este acela dacă K este sau nu este cunoscut în avans, însă algoritmii implementați așteaptă parametrul K de la utilizator, s-au stabilizat [3], [4] și [9].
Schema bloc a programului:
Figura 9
Pentru început vom prezenta forma primului bloc, ce reprezintă intrarea din schema aplicației, adică „START Image Segmentation”:
Figura 10
Funcția următoare reprezintă inputul pentru cei trei algoritmi și are ca parametru numărul de clustere pe care îl dăm în interfața. Din imaginea pe care o alegem pentru segmentare, numărul de n clustere va reprezenta cele mai utilizate n culori din ea. Ia fiecare pixel, îi verifică culoarea, pe care o adaugă într-o listă dacă nu există deja, iar dacă există, contorizează apariția ei. Apoi sortează lista și ia primele n culori [9].
private void FindTopXColours(int numColours)
{
Dictionary<string,ColourCount> colours= new Dictionary<string, ColourCount>();
UnsafeBitmap fastBitmap = new UnsafeBitmap(_image);
fastBitmap.LockBitmap();
Point size = fastBitmap.Size;
BGRA* pPixel; //tipe of pixel, BRGA
for (int y = 0; y < size.Y; y++)
{
pPixel = fastBitmap[0, y];
for (int x = 0; x < size.X; x++)
{ // get the bin index
// for the current pixel colour
Color clr = Color.FromArgb(pPixel->red, pPixel->green, pPixel->blue);
if (colours.ContainsKey(clr.Name))
{ //if the color exist, counts
((ColourCount)colours[clr.Name]).Count++;
}
else //add the color in the list
colours.Add(clr.Name, new ColourCount(clr, 1));
//increment the pointer
pPixel++;
}
}
fastBitmap.UnlockBitmap();
//instantiate using actual colours found – which might be less than numColours
if (colours.Count < numColours) numColours = colours.Count;
_topColours = new Color[numColours];
List<KeyValuePair<string, ColourCount>> summaryList =
new List<KeyValuePair<string, ColourCount>>();
summaryList.AddRange(colours);//add the color in the list
//sort the list
summaryList.Sort(delegate(KeyValuePair<string,ColourCount>kvp1,
KeyValuePair<string, ColourCount> kvp2)
{ return Comparer<int>.Default.Compare(kvp2.Value.Count, kvp1.Value.Count); });
for (int i = 0; i < _topColours.Length; i++)
{
_topColours[i]=Color.FromArgb(summaryList[i].Value.Colour.R,
summaryList[i].Value.Colour.G, summaryList[i].Value.Colour.B);
}
}
3.1. Algoritmul K-Means
Al doilea pas este utilizarea algoritmului K-Means din schema bloc, împreună cu pașii acestuia. În principiu este o tehnică de învățare nesupravegheată, învață despre date și se oprește din funcționare, nesupravegheat, pe baza unor criterii. Scopul lui este de a descoperi K grupuri (clustere) de date din cadrul datelor alese. Aceste grupuri se vor formeaza pe baza unor atribute comune a datelor. Trebuie precizate în avans cele K clustere și să dăm algoritmului o estimare a centrelor de greutate a acestor clustere.
Pentru segmentarea imaginilor se pot găsi clustere de culori diferite, datele din imagine reprezentând culorile pixelilor. Trebuie să furnizăm algoritmului numărul de clustere, dar în funcție de acest lucru putem obține, sau nu, segmentarea bine. Imaginea va fi segmentată în K culori distincte. În funcție de K algoritmul va grupa culorile similare împreună până când nu se mai găsesc alte culori înafara clusterelor.
Pașii ce sunt îndepliniți:
Se setează numărul de clustere;
Se setează aleatoriu sau stabilit centrele de greutate ale acestor clustere;
Pentru fiecare pixel se calculează distanța către centrul fiecărui cluster, apoi se atribuie clusterului către care este aflată cea mai mică distanță;
Figura 11 [6]
Se recalculează centrul fiecărui cluster acum ca datele sale s-ar fi putut muta;
Dacă noile centre sunt diferite față de cele vechi se trece iar la pasul 3, daca nu se oprește.
La pasul 2, spre exemplu dacă se doresc două clustere, se aleg primele două culori, adică cele care conțin cei mai mulți pixeli. În acestea se calculează cei doi centroizi de pornire. Pasul 3 este locul unde ne citim fiecare pixel pentru a le găsi distanța către cei 2 centroizi. Aceasta distanța euclidiana, adică distanța obișnuită între două puncte, dată în coordonate carteziene folosind formula lui Pitagora. Practic reprezintă lungimea segmentului de dreaptă ce unește punctele. Pentru acest punct ne ajutăm și de modelele de culoare RGB si HSV.
În continuare se mută pixelii la cele mai apropiate clustere. La pasul 4 se găsesc noii centroizi ai clusterelor, calculând media. Dacă centroizii vechi corespund cu cei noi înseamnă că pixelii din centrele de greutate nu s-au mutat, iar clusterele s-au stabilizat [3],[4],[5] și [9].
Funcția în care se aplică toate regulile de mai sus pentru algoritmului K-Means [9]:
private void AllocateToCluster(PixelData pd)
{
//find distance of this colour from each cluster centroid
Dictionary<string, Distance> distances = new Dictionary<string, Distance>();
//take each cluster
foreach (KeyValuePair<string, Cluster> c in _currentCluster)
{//calculate the distance from pixel to the center of cluster
float d = (float)Math.Sqrt(
(double)Math.Pow((c.Value.CentroidR – pd.Ch1), 2) +
(double)Math.Pow((c.Value.CentroidG – pd.Ch2), 2) +
(double)Math.Pow((c.Value.CentroidB – pd.Ch3), 2));
distances.Add(c.Key, new Distance(d));
}
//allocate this colour to the closest cluster based on distance
List<KeyValuePair<string, Distance>> list = new List<KeyValuePair<string, Distance>>();
list.AddRange(distances); //add in list
list.Sort(delegate(KeyValuePair<string,Distance>kvp1,KeyValuePair<string,Distance>kvp2)
{ return Comparer<float>.Default.Compare(kvp1.Value.Measure, kvp2.Value.Measure); });
//assign to closest cluster
if (_pixelDataClusterAllocation.ContainsKey(list[0].Key))
{//if the cluster exist add pd to him
((List<PixelData>)_pixelDataClusterAllocation[list[0].Key]).Add(pd);
}
else
{ //create now the list of pixel for him
List<PixelData> clrList = new List<PixelData>();
clrList.Add(pd);
_pixelDataClusterAllocation.Add(list[0].Key, clrList);
}
Pașii pentru utilizarea programului:
Se încarcă o imagine folosind butonul: „Load Image”;
Se selectează numărul de clustere;
Se selectează modelul de culoare: RGB sau HSV;
Se apasă butonul „Start” pentru execuția aplicației.
Modificarea numărului de clustere sau modelului de culoare va arata alte efecte ale segmentării.
Aceasta este output-ul algoritmului K-means după ce imaginea multispectrală a fost segmentată cu un numar de 5 clustere sub modelul de culoare RGB, timp de 24 de iterații:
Figura 12
3.2. Algoritmul ISODATA
Algoritmul ISODATA la fel ca și K-Means este o metodă nesupravegheată de clasificare. Denumirea lui vine de la Iterative Self-Organizing Data Analysis Tehnique. Cum a fost specificat și în descrierea proiectului, acest algoritm este folosit pentru eliminarea dezavantajelor în urma aplicării K-Means.
ISODATA funcționează în același mod cu K-Means până într-un punct cand utilizatorul stabilește un prag, reprezentând un anumit număr de pixeli. După ce se determină fiecare cluster cu pixelii ce îi aparțin, în funcție de acel prag se determină care clustere vor fi afișate. Restul de pixeli din clusterele neafișate se atribuie clusterului cel mai apropiat. Acest algoritm nu necesită cunoașterea prea mare despre date în prealabil și este foarte eficient în indentificarea clusterelor spectrale, ca de altfel și K-Means [6].
Partea de cod (ce nu afișează clusterele cu numărul de pixeli mai mic decat pragul stabilit de utilizator) din funcția în care se aplică regulile pentru algoritmul ISODATA, bineînteles după ce au fost repartizați pixelii sub același mod ca în funcția AllocateToCluster din K-Means :
//here is verify if have enough pixels or not
//if haven't, is searching the nearest cluster and is allocated
if (clrList.Count > minimumNumber)
{
if (!_clusterColours.ContainsKey(clr.Name))
{
_clusterColours.Add(clr.Name,Color.FromArgb((int)cluster.Value.CentroidR,
(int)cluster.Value.CentroidG, (int)cluster.Value.CentroidB));
}
}
else
{
Cluster clus = DetermineNearestCluster(cluster.Value);
if(!_clusterColours.ContainsKey(clr.Name))
_clusterColours.Add(clr.Name,Color.FromArgb((int)clus.CentroidR,
(int)clus.CentroidG, (int)clus.CentroidB));
}
Aceasta este funcția DetermineNearestCluster(cluster.Value), care determină cel mai apropiat cluster, pentru a-i atribuii pixelii din clusterele ce nu vor fi afișate:
private Cluster DetermineNearestCluster(Cluster p)
{
var min = float.MaxValue;
Cluster returnCluster = p;
//for each different cluster, verify the distance from cluster p to him
foreach (KeyValuePair<string, Cluster> _cluster in _currentCluster)
{ //check if the cluster is the same with cluster p
if (_cluster.Value.CentroidR == p.CentroidR
&& _cluster.Value.CentroidG == p.CentroidG
&& _cluster.Value.CentroidB == p.CentroidB)
continue;
else
{ //calculate the distance
float d = (float)Math.Sqrt(
(double)Math.Pow((p.CentroidR – _cluster.Value.CentroidR), 2) +
(double)Math.Pow((p.CentroidG – _cluster.Value.CentroidG), 2) +
(double)Math.Pow((p.CentroidB – _cluster.Value.CentroidB), 2));
// verify if is found another smaller distance
if (d < min)
{
min = d;
returnCluster = _cluster.Value;
}
}
}
return returnCluster;
}
Se observă diferența între cei 2 algoritmi. Output-ul algoritmului ISODATA după segmentarea aceeasi imagini multispectrale, ce a fost folosită si pentru K-Means, folosind tot 5 clustere, sub modelul RGB, timp tot de 24 de iterații.
Figura 13
3.3. Algoritmul K-Nearest Neighbors
În implemetarea algoritmului K-Nearest Neighbors am folosit metoda neparametrică pentru clasificare, bazată pe votul majorității vecinilor. În faza de clasificare, K este o constantă definită de utilizator, și un vector nemarcat (o interogare sau punct de încercare). Este clasificată prin atribuirea etichetei, care este cea mai frecventă dintre probele K și este cea mai apropiată de punctul respectiv interogare. De multe ori, precizia de clasificare a KNN poate fi îmbunătățit în mod semnificativ în cazul în care metrica, distanța, este învățată cu algoritmi de specialitate, cum ar fi marjă largă pentru cel mai apropiat vecin sau o analiză a componentelor de vecinătate. Algoritmul are aproximativ același principiu de funcționare ca și cele anterioare.
După alegerea a K clustere de către utilizator, ele se formează cu un număr stabilit de pixeli dupa regula din K-Means, adică atribuirea pixelilor în clustere calculând distanța Euclidiană.
De aici încolo regula atribuirii pixelilor se schimbă astfel:
În primul rând se atribuie fiecărui cluster o etichetă, ce o va prelua bineînteles și pixelii ce fac parte din el;
Se calculează distanța de la pixelul ce vrem sa il alocam, unuia dintre clustere, către toți pixelii din toate clusterele formate;
Pixelul va fi atribuit clusterului care conține cei mai multi pixeli, cu distanțele cele mai mici catre pixelul nostru;
Pasul doi și trei se repetă pentru fiecare pixel nealocat unui cluster;
După ce am terminat alocarea fiecărui pixel într-un cluster, în funcție de eticheta clusterului imaginea va fi segmentată sub forma unui modelul RGB sau HSV.
Îmbunătățirea algoritmului s-ar putea face prin preprocesare, adică uniformizarea datelor de instruire (îndepărtarea punctelor izolate, abernate) sau adaptarea metricii la date [7].
În funcția următoare, ce conține implemetarea algoritmului K-Nearest Neighbors, se compară în funcție de fiecare cluster pixelul curent cu fiecare pixel din clusterul respectiv, apoi se sortează distanțele și se ia pixelul cu numărul setat in interfață. Din cei x pixeli (câte unul pentru fiecare cluster) se alege cel mai apropiat și se asociază pixelul curent clusterului care conține pixelul cel mai apropiat.
private void AllocateToClusterKNN(PixelData pd)
{//find distance of this colour from each cluster centroid
List<KeyValuePair<string, Distance>> distances =
new List<KeyValuePair<string, Distance>>();
List<KeyValuePair<string, Distance>> aux =
new List<KeyValuePair<string, Distance>>();
//take every cluster
foreach (string item in _pixelDataClusterAllocationAux.Keys)
{//list of pixel with the actual key
List<PixelData>clrList=
(List<PixelData>)_pixelDataClusterAllocationAux[item];
//calculate the distance between the pixels;
// each pixel with all the others
foreach (PixelData pixelData in clrList)
{
float d = (float)Math.Sqrt(
(double)Math.Pow((pixelData.Ch1 – pd.Ch1), 2) +
(double)Math.Pow((pixelData.Ch2 – pd.Ch2), 2) +
(double)Math.Pow((pixelData.Ch3 – pd.Ch3), 2)
);
distances.Add(newKeyValuePair<string, Distance>(item, new Distance(d)));
}
//allocate this colour to the closest cluster based on distance
List<KeyValuePair<string, Distance>> list =
new List<KeyValuePair<string, Distance>>();
list.AddRange(distances);
//list of distance between current pixel
//and the rest of current cluster pixel
list.Sort(delegate(KeyValuePair<string,Distance>kvp1,
KeyValuePair<string, Distance> kvp2)
{return Comparer<float>.Default.Compare(kvp1.Value.Measure,
kvp2.Value.Measure); });
aux.Add(list[numNeighbors – 1]);
distances.Clear();
}
aux.Sort(delegate(KeyValuePair<string, Distance> kvp1,
KeyValuePair<string, Distance> kvp2)
{ return Comparer<float>.Default.Compare(kvp1.Value.Measure,
kvp2.Value.Measure); });
//assign to closest cluster
if (_pixelDataClusterAllocation.ContainsKey(aux[0].Key))
{
((List<PixelData>)_pixelDataClusterAllocation[aux[0].Key]).Add(pd);
}
else
{
List<PixelData> clrList = new List<PixelData>();
clrList.Add(pd);
_pixelDataClusterAllocation.Add(aux[0].Key, clrList);
}
}
Output-ul algorimului K-Nearest Neighbors nu este finalizat, deoarece numărul foarte mare de pixeli dintr-o imagine îngreunează ducerea la sfarșit a rulării, numărul de comparații fiind aproximatix egal cu numărul de pixeli la pătrat.
Figura 13
Rezultate
Pentru rezultate am ales 3 imagini multispectrale, descărcate de pe Dundee, pentru a arăta dirențele dintre segmentări.
Prima imagine: Tunisia
Id: 1654
Data achiziției: 06-Jun-2014
Ora: 12:51:00
Senzor de satelit: MODIS
Canalele senzorului: 1, 4, 3
După aplicarea algoritmului K-Means, având 5 clustere, sub modelul RGB:
După aplicarea algoritmului ISODATA, având 5 clustere, sub modelul RGB și cu pragul de 50000 pixeli:
După aplicarea algoritmului K-Nearest, pe o bucată din poza originală, având 5 clustere,sub modelul RGB și 30 vecini (asta fiind tot ce a reușit segmentarea rulând timp de o oră):
A doua imagine: Islanda
Id: 1657
Data achiziției: 05-Jun-2014
Ora: 14:17:00
Senzor de satelit: MODIS
Canalele senzorului: 1, 4, 3
După aplicarea algoritmului K-Means, având 5 clustere, sub modelul RGB:
După aplicarea algoritmului ISODATA, având 5 clustere, sub modelul RGB și cu pragul de 50000 pixeli:
După aplicarea algoritmului K-Nearest, pe o bucată din poza originală, având 5 clustere,sub modelul RGB și 30 vecini(rulând timp de o oră):
A treia imagine: Europa de Sud
Id: 1652
Data achiziției: 22-May-2014
Ora: 12:27:00
Senzor de satelit: MODIS
Canalele senzorului: 1, 4, 3
După aplicarea algoritmului K-Means, având 5 clustere, sub modelul RGB:
După aplicarea algoritmului ISODATA, având 5 clustere, sub modelul RGB și cu pragul de 50000 pixeli:
După aplicarea algoritmului K-Nearest, pe o bucată din poza originală, având 5 clustere,sub modelul RGB și 30 vecini(rulând timp de o oră):
Concluzii
Rezultatul obținut în urma rulării aplicației software, aplicația primind ca date de intrare pixelii dintr-o imagine multispectrală, permite prelucrarea acestor pixeli iar mai apoi vizualizarea rezultatului procesării . După procesare imaginea, informația de baza, este afișată sub modelul de culoare RGB sau HSV, acestea fiind descrise anterior.
Rezultatele cele mai satisfăcătoare s-au obținut în urma prelucrării cu ajutorul algoritmului K-Means, având o funcționalitate mult mai eficientă decat celalalt algoritm. Eficiența acestui algoritm este în principal una mulțumitoarea, însă aceasta poate să scadă cu cat numărul de clustere stabilit va crește sau cu cat dimensiunea imaginii tinde să fie mai mare. La fel ca și algoritmul K-Means și algoritmul ISODATA are rezultate destul de bune, având același principiu de formare a clusterelor, ca și algoritmul menționat anterior, singura diferența fiind afișarea lor într-un număr posibil mai mic.
Deși implementarea algoritmului K-Nearest Neighbors este una corectă, numarul de iteratii este foarte mare iar algoritmul va deveni ineficient, acest lucru se va vedea în momentul în care se va dori să se segmenteze imaginea, segmentarea neputând fi realizată cu succes pentru imaginile care tind să aibă dimensiuni cât mai mari. După cum am menționat algoritmul s-a dovedit a fi unul ineficient așa că și așteptăriile din partea lui s-au dovedit a fi unele nesatisfăcătoare.
Ca și dezvoltări ulterioare ale aplicției o prima fază ar fi căutarea unei metode de creșterea a eficienței algoritmilor, în special a algoritmului K-Nearest Neighbors. Când spun eficiența mă refer în special la segmentare, astfel încat, aceasta să se realizeze cu succes și totodată să fie posibilă rularea iterațiilor până la capăt.
De asemenea o altă îmbunătățire ar consta în aplicarea unui algoritm pentru recunoașterea obiectelor din imaginea segmentată. În cazul imaginilor multispectrale aceasta recunoașterea a obiectelor ar putea funcționa spre exemplu după culori pentru a deosebi apa de munte sau câmpie. Problemele de rezolvat pot impune o complexitate destul de ridicată. Aceste segmentări de imagini pot fi aplicate cu ușurință și în alte domenii diferite de teledetecție, un exemplu ar fi în medicină.
Bibliografie
[1] – http://en.wikipedia.org/wiki/Image_segmentation
Accesat: 03.10.2013
[2] – https://www.mtholyoke.edu/courses/tmillett/course/geog205/files/remote_sensing.pdf
Accesat: 15.11.2013
[3] – Shapiro, L.G. and G.C. Stockman, Computer Vision, Upper Saddle River, NJ: Prentice-Hall, 2001.
[4] – http://en.wikipedia.org/wiki/K-means_clustering
Accesat: 05.12.2013
[5] – http://ro.wikipedia.org/wiki/Distan%C8%9Ba_euclidian%C4%83
Accesat: 22.01.2014
[6] – http://web.pdx.edu/~jduh/courses/Archive/geog481w07/Students/Vassilaros_ISODATA.pdf
Accesat: 13.04.2014
[7] – http://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
Accesat: 26.04.2014
[8] – http://www.isprs.org/proceedings/xxxviii/4-c1/sessions/Session2/6721_Neubert_Proc_pap.pdf
Accesat: 09.03.2014
[9] – https://workspaces.codeproject.com
Accesat: 20.01.2014
Bibliografie
[1] – http://en.wikipedia.org/wiki/Image_segmentation
Accesat: 03.10.2013
[2] – https://www.mtholyoke.edu/courses/tmillett/course/geog205/files/remote_sensing.pdf
Accesat: 15.11.2013
[3] – Shapiro, L.G. and G.C. Stockman, Computer Vision, Upper Saddle River, NJ: Prentice-Hall, 2001.
[4] – http://en.wikipedia.org/wiki/K-means_clustering
Accesat: 05.12.2013
[5] – http://ro.wikipedia.org/wiki/Distan%C8%9Ba_euclidian%C4%83
Accesat: 22.01.2014
[6] – http://web.pdx.edu/~jduh/courses/Archive/geog481w07/Students/Vassilaros_ISODATA.pdf
Accesat: 13.04.2014
[7] – http://en.wikipedia.org/wiki/K-nearest_neighbors_algorithm
Accesat: 26.04.2014
[8] – http://www.isprs.org/proceedings/xxxviii/4-c1/sessions/Session2/6721_Neubert_Proc_pap.pdf
Accesat: 09.03.2014
[9] – https://workspaces.codeproject.com
Accesat: 20.01.2014
Copyright Notice
© Licențiada.org respectă drepturile de proprietate intelectuală și așteaptă ca toți utilizatorii să facă același lucru. Dacă consideri că un conținut de pe site încalcă drepturile tale de autor, te rugăm să trimiți o notificare DMCA.
Acest articol: Segmentare a Imaginilor Multispectrale (ID: 150434)
Dacă considerați că acest conținut vă încalcă drepturile de autor, vă rugăm să depuneți o cerere pe pagina noastră Copyright Takedown.
