Geoinformatika - elektronikus jegyzet © Czimber Kornél, 2001.

[ Tartalom | Bevezetés | Raszter | Képfeldolgozás | Fotogrammetria | Vektor | Összefoglaló ]

III.7. Digitális képfeldolgozás

A digitális képfeldolgozás szorosan összefonódik a raszteres geoinformatikával. Az elemzés tárgyát itt is raszterek képezik. A raszterek viszont minden esetben távérzékelt adatokat tartalmaznak. A képfeldolgozás speciális terület, bizonyos képfeldolgozó rendszerek nem tartalmaznak geoinformatikai funkciókat, ellenben a raszteres GIS alkalmas a képfeldolgozásra is.

A távérzékelt digitális képek feldolgozásának célja, hogy a többsávos, különböző időpontban és különböző felvevőrendszerekkel készített felvételek alapján a földfelszínt térképezzük, a felszínborítási kategóriák minél több ismérvét, minél megbízhatóbban becsüljük. A felszínborítási kategóriák és a jellemzők minden feladatban mások. Sokszor a feladat megoldása során változtatni, összevonni, kiejteni vagyunk kénytelenek őket. A kiértékeléssel szemben támasztott alapvető követelmények a geometriai- és tematikus pontosság, a konzisztens, objektív és megismételhető képosztályozás.

Összevetve a vizuális értelmezéssel (interpretáció), a digitális képfeldolgozásról a következők mondhatók el: az interpretációnál geometriai összefüggések, alakok, textúrák felismerése hatékony, míg a digitális képelemzés a tónusok elkülönítésében, az objektivitásban, megbízhatóságban, feldolgozási sebességben, több adatforrás együttes kiértékelésében múlja felül az analóg módszert. Sokszor a két módszert együttesen alkalmazzák és a feldolgozás során a felhasználó szakembereket is bevonják a munkába.

A kiértékelés folyamata egy előfeldolgozó és egy képosztályozó szakaszra bontható. Az előfeldolgozás lépései az alábbiak:

A képek osztályozása során az így előkészített felvételeken általában a következő műveletsort hajtjuk végre:

III.7.1. Digitális kép tárolása

A digitális képet egy háromdimenziós adathalmazzal tudjuk leírni, amelyet többféleképp értelmezhetünk és ez egyben a digitális kép digitális adathordozón történő tárolását is magyarázza:

1.sor: [1.cella: (1.sáv 2.sáv … ) 2.cella: (1.sáv 2.sáv … ) … ]
2.sor: [1.cella: (1.sáv 2.sáv … ) 2.cella: (1.sáv 2.sáv … ) … ]
… …

1.sáv: [1.sor: (1.cella 2.cella … ) 2.sor: (1.cella 2.cella … ) … ]
2.sáv: [1.sor: (1.cella 2.cella … ) 2.sor: (1.cella 2.cella … ) … ]
… …

1.sor: [1.sáv: (1.cella 2.cella … ) 2.sáv: (1.cella 2.cella … ) … ]
2.sor: [1.sáv: (1.cella 2.cella … ) 2.sáv: (1.cella 2.cella … ) … ]
… …

A digitális kép egyes pixelértékeit a kettes számrendszerben ábrázolt számok írják le. Ezért az intenzitás-tartomány is a kettes számrendszerhez igazodik. A leggyakrabban használt értéktartomány a 0… 255 (8 bites), de előfordulhat 0… 4095 és valós számtartomány is 0.0 … 1.0.

A digitális kép a felhasználóhoz általában mágnesszalagon vagy CD-ROM-on jut el legtöbbször BIL vagy BSQ formátumban. A digitális képek bevitele a rendszerbe ezen eszközökről történő átjátszás, esetleges konvertálás révén valósul meg. A digitális képekhez általában tartozik egy fejrész (header), amely adatokat tartalmaz a kép formátumáról, a sávok, sorok, oszlopok számáról, a felvétel készítésének idejéről stb.

III.7.2. Digitális képek megjelenítése, képi statisztikák

A digitális képek megjelenítésével kapcsolatban alapvetően helytállóak a III.5. fejezet megállapításai. A képek sajátosságánál fogva azonban célszerű néhány dologra kitérni. A digitális képek egyértelmű ábrázolása a sávok számával azonos dimenziójú intenzitástérben, úgynevezett spektrális hipertérben lenne egzakt. A raszteres megjelenítők és az emberi szem azonban az egy, két és három színkomponensből felépülő képet tudja fogadni, feldolgozni. Az RGB megjelenítők egy szín-komponenséhez rendszerint egy sáv intenzitás-értékeit kapcsolják. Ha mind a három színkomponenshez egy sáv értékeit rendeljük, akkor a sáv szürkeárnyalatos képét kapjuk. Ezek alapján egy Landsat TM felvételből 7· 7· 7=343 színkompozit állítható elő.

A digitális képek alternatív megjelenítésére alkalmasak a gyakorisági (histogram) és szóródási (scattergram) diagramok. A hisztogramok egy sáv egyes cellaértékeinek előfordulási gyakoriságát ábrázolják. A hisztogramok felfoghatók a sáv értékeinek tapasztalati sűrűségfüggvényeként is. A szóródási diagram a két sáv összetartozó cellaértékeinek ábrázolására szolgál, amely két, rendszerint nem független valószínűségi változó által leírt eseménytér sűrűségfelülete. A következő ábra egy hisztogramot és egy szóródási diagramot mutat:

A hisztogramok elemzése alapján következtethetünk arra, hogy a diszkrét intenzitás-tartomány mely értékei fordulnak elő az egyes sávokban. A légkör és egyéb, a felvevő eszköz sajátságai miatt rendszerint a tartomány egy kis, sávonként változó részén sűrűsödnek az értékek (a radiometriai felbontás kicsi). Ahhoz, hogy az egyes sávokat azonos módon kontrasztosan, a teljes intenzitás-tartományt kitöltően tudjuk ábrázolni, szükségünk van a hisztogram vagy kontraszt széthúzásra (histogram stretching). A széthúzás általában lineáris, négyzetgyökös, normális eloszlást követő, esetleg lépcsős átviteli függvényekkel történik. A transzformáció történhet a kép egészén és csak bizonyos részein. Az átviteli függvény szintén lehet globális és a kép egy kis körzetén értelmezett lokális függvény. A lineáris kontraszt széthúzás a következő ábrán szemlélhető:

Hisztogram széthúzása az ER-Mapper programmal:

A digitális képi információ számszerű jellemzését szolgálják a képi statisztikák, amelyek sávonként az átlag, szórás, minimum, maximum, medián (középső érték), nódusz (leggyakoribb érték), konfidencia intervallum számértékeit jelentik. A sávok közötti kapcsolat jellemzésére szolgálnak a kovariancia és a korrelációs mátrixok. A kovariancia két sáv között a következőképp írható fel:

, (III.7.2.-1)

ahol:

R, C : a kép sorainak és oszlopainak száma
Pixy : a kép i-dik sávjának, xy pozíciójú pixelének intenzitásértéke
mi, mj : az i, illetve j-dik képsáv intenzitás értékeinek átlaga

A korreláció a kovariancia ismeretében számítható:

, értéke -1…+1 között van, (III.7.2.-2)

ahol: si,sj : az i, illetve j-dik képsáv intenzitás értékeinek szórása

A kovariancia és a korrelációs mátrix a főátlóra szimmetrikus, a kovariancia mátrix főátlójában az egyes sávok szórásnégyzetei vannak. A korrelációs mátrix értékei az egyes sávok közötti lineáris kapcsolat szorosságára utalnak. A korrelációs mátrix alapján eldönthetjük, hogy mely sávokat rendeljük hozzá a színkomponensekhez a legnagyobb képi információ megjelenítése érdekében.

III.7.3. Radiometriai korrekció

A felvételek reflektancia értékei a légkör, a domborzat és a felvevőrendszer sajátosságai miatt bizonyos torzításokkal terheltek. A torzítások csökkentésére radiometriai korrekciókat alkalmaznak, amely során a felvétel fizikai jellemzőit próbálják visszaállítani. A radiometriai korrekciók jelentős részét a földi vevőállomáson korrigálják. A radiometriai korrekciók a képek intenzitás értékeit változtatják meg. A radiometriai korrekciók különböző csoportjai a következők:

- statisztikai-tapasztalati módszer : ennél az eljárásnál lineáris kapcsolatot feltéte-lezünk a visszaverődés és a megvilágítás között:

(III.7.3.-1)

- koszinusz korrekció : trigonometriai alapon történő korrekció. A felszínt Lambert tükrözőnek (reflektornak) tekinti:

(III.7.3.-2)

- Minnaert korrekció (szemi-empirikus): a koszinusz korrekció változata, mely a Föld felszínét nem tekinti Lambert tükrözőnek. k=1 esetén megegyezik a koszinusz korrekcióval.

(III.7.3.-3)

- C-korrekció (szemi-empirikus): A koszinusz korrekció módosítása egy C faktorral, amely az ég diffúz sugárzását modellezi. A C értékét statisztikai-empirikus módszerekkel határozzuk meg:

(III.7.3.-4)

A képletekben használt jelölések a következők:

LN : a normalizált sugárzási érték
LE : az eredeti sugárzási érték
m : a regressziós egyenes meredeksége, y=(mx+b)
b : a regressziós egyenes eltolása, y=(mx+b)
C : konstans, C=b/m
z : a Nap zenitszöge
i : a felületelem vízszintessel bezárt szöge (inklináció)
k : Minnaert konstans, .

III.7.4. Geometriai korrekció

A geometriai korrekció célja, hogy a digitális képek minden egyes celláját egy választott vonatkozási-, vetületi rendszerbe transzformáljuk. Ez egyrészt a geometriai hibák kiküszöböléséből, másrészt a transzformálásból áll. A geometriai torzulások egyik forrása abból adódik, hogy a digitális képek nem egy időpillanatban készülnek, hanem soronkénti letapogatással. A digitális képek perspektivikus leképeződése miatt a Föld görbületével és a domborzat módosító hatásával is számolnunk kell.

A geometriai hibaforrások lehetnek:

A geometriai hibaforrások jelentős részét a földi vevőállomáson a műhold jellemzőinek ismeretében kiküszöbölik. A perspektivikus torzulások, a Föld görbülete okozta elmozdulások csökkentését és a vetületi rendszerbe transzformálást azonban a kiértékelés során kell elvégeznünk. Ezen utóbbi műveletek elvégzése a következő két módon történhet:

, illetve (III.7.4.-1)

ahol:

x,y : a vetületi rendszer koordinátái
u,v : a digitális kép képi koordinátái
aij, bij : az átalakító függvények együtthatói
n : a polinomok fokszáma.

A függvények együtthatóinak meghatározása a digitális képen földi illesztőpontok azonosításából és vetületi koordinátáinak megadásából indul ki. U és V jelölje a pontok képi u, illetve v koordinátáinak vektorát, az M mátrix pedig az egyes átalakító függvények xiyj tagjait. Az aij és bij együtthatók A, illetve B vektorának meghatározása a következő mátrixegyenletekkel történik:

, (III.7.4.-2)

ahol:

p : illesztőpontok száma
t : polinom tagjainak száma t=(n+1)(n+2)/2.

Az ortorektifikáció - képhelyesbítés - során a felvétel perspektivikus torzításait korrigáljuk és ezzel párhuzamosan a képet a kívánt vetületi rendszerbe transzformáljuk. Az eljárás megegyezik III.8.9. fejezetben tárgyalt digitális ortofotó készítéssel, ezért részletesen ott fogjuk ismertetni. Itt csak annyit jegyeznénk meg, hogy egy 30 méteres terepi felbontású Landsat TM felvevőrendszer pásztázási szöge függvényében milyen tengerszint feletti magasságon belül lesz a torzulás egy pixelen belül. A táblázat mutatja, hogy a perspektív torzulásokkal műholdfelvételek esetén igen is számolnunk kell.

Pásztázási szög

0.5°

1.0°

2.0°

3.0°

4.0°

5.0°

6.0°

7.0°

Az eltérés 1 pixelen belül,
ha a magasság kisebb, mint (m):

3000

1500

800

500

400

300

250

200

Az előbbi két típusú geometriai korrekció során egy mintavételezési eljárásra (resampling) is szükség van, mivel a kiszámolt képkoordináták leggyakrabban nem pixel-koordináták. Az általánosan alkalmazott módszerek a következők:

III.7.5. Képi információ növelése (image enhancement)

A kép osztályozása előtt különböző lényegkiemelő, információ sűrítő, vizuális interpretációt segítő, az osztályozás pontosságát növelő eljárást lehet alkalmazni. Ezek röviden:

vegetációs különbség: , (III.7.5.-1)

egyszerű vegetációs index: , (III.7.5.-2)

normalizált vegetációs index: , (III.7.5.-3)

Landsat TM felvételek esetén értelmezhetők a következő indexek:

hidroxil-tartalmú ásványok megoszlása: H = TM5 / TM7

vastartalmú ásványok előfordulása: I = TM3 / TM1

a TM3 / TM1, TM4 / TM3 és a TM5 / TM7 színkompozit együttesen alkalmazható ásvány-lelőhelyek térképezésében.

A hányados képek egyik sajátossága, hogy az egyes sávok intenzitásértékei, bár különböző mértékben, de korrelálnak a terület megvilágításával, ezért a hányados képen a domborzat okozta megvilágítási különbségek kiegyenlítődnek. Erdészeti gyakorlatban hatékonynak bizonyult a Landsat felvételek esetén a 4. és az 5. sáv hányadosa, mely kifejezetten az erdőt és ezen belül is a fenyőt, mint felszínborítási kategóriát emeli ki.

Egy Landsat TM (1-5,7) felvétel főkomponens transzformációjának eredménye:

Főkomponens

C 1

C 2

C 3

C 4

C 5

C 6

Variancia% 70.60 22.32 4.37 1.44 0.73 0.53
Sajátérték 4.24 1.34 0.26 0.09 0.04 0.03
1. sajátvektor 0.451079 -0.138443 -0.506675 -0.720566 -0.035022 0.014128
2. sajátvektor 0.466520 -0.047352 -0.352703 0.578799 -0.514886 0.235799
3. sajátvektor 0.467328 -0.170950 -0.065272 0.330988 0.631958 -0.489076
4. sajátvektor -0.113857 0.811816 -0.468393 0.089940 0.296064 0.113384
5. sajátvektor 0.368898 0.519901 0.414142 -0.150751 -0.393271 -0.494688
6. sajátvektor 0.459828 0.141509 0.472985 -0.073544 0.303280 0.668903

A Tasseled Cap transzformáció együtthatói:

Jellemző

TM 1

TM 2

TM 3

TM 4

TM 5

TM 7

Fényesség

0.304

0.279

0.434

0.559

0.508

0.186

Zölderősség

-0.285

-0.244

-0.544

0.724

0.840

-0.180

Nedvesség

0.151

0.179

0.330

0.341

-0.711

-0.457

és inverze: , (III.7.5.-4)

ahol:

N: pixelek száma a vektorokban (N = 2x, ahol x pozitív egész szám)
h, H: forrás és eredmény vektor
i: imaginárius szám.

Néhány transzformáció eredményének bemutatása:

Eredeti Landsat TM felvétel (Bükk-Ény)

Első főkomponens - PCA

Zölderősség - Tasseled Cap

Színárnyalat - IHS

III.7.6. Nem felügyelt osztályozás

A felvétel osztályozásakor kép pixeleit tematikus kategóriákba soroljuk. Az intenzitástérben a tematikus kategóriák pixelei csoportosulnak. Ezeket az adatcsoportokat klasztereknek (cluster) nevezzük. A nem felügyelt osztályozásnál (unsupervised classification) a digitális képet spektrális adatosztályokra bontjuk. Az egyes spektrális csoportokat, klasztereket elkülönítjük, majd ezeket megfeleltetjük a tematikus kategóriáknak. A nem felügyelt osztályozást szokás klaszter kereső vagy klaszterező eljárásnak is nevezni. A gyakorlatban használt klaszterező eljárások a klaszter középpontját keresik meg és a pixeleket a legközelebbi klaszter-középponthoz sorolják (általában Euklideszi távolság alapján).

A klaszterezésnél kiindulhatunk fix számú adatosztályból, de megadhatunk az intenzitástérben egy távolságot, amelynek túllépése esetén egy újabb klaszter jön létre. Az adatosztályok kezdeti elhelyezése az intenzitástérben történhet véletlenszerűen, az intenzitás minimum- és maximumvektorok között egyenletesen, és manuálisan. A klaszterezést egymás után többször is lefuttathatjuk, ezzel finomítva a klaszter középpontjainak helyzetét. A klaszterezés leggyakrabban használt eljárásai:

ISODATA eljárás

Az eljárás a klaszter középpontjainak felkeresését, azok iteratív javítását valósítja meg. Képfeldolgozó rendszerekben ez az algoritmus a leggyakoribb. A klaszterezés menete:

  1. Kiválasztunk megfelelő számú középpontot az intenzitástérben egyenletesen vagy más módszerrel.
  2. Minden pixelt a hozzá legközelebbi középponthoz sorolunk.
  3. Kiszámítjuk az új középpontokat (a besorolt pixelek átlagvektora).
  4. Megvizsgáljuk a középpontok mozgását, ha ez nagy, akkor folytatjuk a 2. lépéssel.
  5. Kialakultak a klaszterek.

Az eljárás finomítható a klaszter méretének - elemszámának korlátozásával, a közeli klaszterek összevonásával, a nagy klaszterek darabolásával, egy meghatározott távolságon túl egy új klaszter bevonásával és a középponttól való távolság számításának módosításával.

Az eljárás nagy mértékben javítható, ha a középpontoktól való távolság helyett bevezetjük a valószínűség fogalmát. Egy x pixel besorolását az w i adatosztályok valamelyikébe nem a i x-w ii távolság minimumának, hanem a p(xi w i) osztályba- kerülési valószínűség maximumának meghatározása alapján döntjük el.

Szekvenciális klaszterezés

Az eljárás lényege, hogy a klaszterezés egy menetben kerül végrehajtásra. Az algoritmus menete:

  1. A pixeleket egymás után olvassuk.
  2. Az aktuális pixelt a legközelebbi klaszterhez soroljuk, ha a pixel klasztertől való távolsága egy megadott, az intenzitástérben értelmezett távolságnál kisebb. Majd a klaszter középpontját a besorolás után újraszámítjuk (az összes besorolt pixel átlagvektora).
  3. Ha az aktuális pixelt a 2. pontban nem tudtuk besorolni egyik klaszterhez sem, akkor a pixelből létrehozunk egy új klasztert.
  4. Ha két klaszter középpontjának távolsága a megadott távolságon belül van, akkor a klasztereket összefűzzük. Az új klaszter közepét a két klaszter középpontjának pixelek számával súlyozott átlagaként határozzuk meg.
  5. Vissza az 1. lépéshez, ameddig van feldolgozatlan pixel.

Ezen gyors algoritmus hátránya, hogy az új klaszterek definiálását befolyásoló távolság megadása körülményes, valamint a klaszterek némiképp az első pixelek tulajdonságait hordozzák, ugyanis ezek a pixelek az elején nagyobb súllyal szerepeltek a középpont kialakításában. Az eljárás szintén javítható, ha nem a középponttól való távolság, hanem a klaszterhez tartozás valószínűsége alapján dolgozunk.

Többdimenziós hisztogram elemzése

Az eljárás során először a pixelek előfordulási gyakoriságát kell meghatározni. A gyakoriságok meghatározása után a többdimenziós hisztogram minden egyes csúcsa (lokális maximuma) egy különálló spektrális adatosztályt jelent. A többdimenziós hisztogram kezelése körülményes, ezért az eljárás 1-4 dimenzió esetén működik hatékonyan. További hátrányként mondható el, hogy az egymással átfedő osztályok elkülönítése nem mindig sikeres.

A nem felügyelt osztályozás után kialakult adatosztályokat értelmeznünk kell. A spektrális adatosztályok és a tematikus kategóriák közötti viszony a következő lehet:

A megfeleltetés második és harmadik típusa a leggyakoribb. A második esetben a kategóriát felépítő klaszterek összevonhatók. A harmadik típushoz tartozó pixelekre azonban oda kell figyelnünk. Ezek okozzák az osztályozási hibákat, hiszen spektrálisan nem különülnek el, a tematikus kategóriák átfednek.

A következő kép Sopron környékéről készült űrfelvételt, majd annak nem felügyelt osztályozással kapott eredményét mutatja be:

III.7.7. Felügyelt osztályozás

A felügyelt osztályozás célja, hogy a kép minden egyes pixelét a tematikus kategóriák valamelyikéhez soroljuk be a tematikus kategóriák mintáiból kigyűjtött adatok felhasználásával. A kategóriák mintaterületeinek kijelölése történhet terepi bejárás alapján, vizuális interpretációval vagy korábbi információk felhasználásával. A mintaterületek egyik részét az osztályozó tanítására használjuk, a másik részét pedig tesztelés céljából elkülönítjük. A felügyelt osztályozásnál tehát a tematikus kategóriák meghatározása után osztályozzuk a képet, míg a nem felügyelt osztályozásnál a klaszterezés után az egyes klasztereket feleltetjük meg a tematikus kategóriák valamelyikének.

A tematikus osztályozástól megkívánjuk, hogy az:

Ha egy képrészletet alaposabban megvizsgálunk, az egyes tematikus osztályok pixelei az intenzitástérben jellegzetesen csoportosulva helyezkednek el. A tematikus kategóriák reflektancia értékeinek előfordulását az intenzitástérben valószínűségi függvényekkel jellemezhetjük. A valószínűségi függvények rendszerint Gauss-féle normális eloszlást követnek. A spektrálisan határozott kategóriák (homok, víz) szűkebb intervallumban verik vissza az elektromágneses sugárzást, mint a spektrálisan kiterjedt, szétszórt település osztály. Ez érthető, hiszen utóbbiban jóval több, különböző visszaverő elem van. Az egyes kategóriák reflektancia értékeinek eloszlását jól mutatja a következő valószínűségi sűrűségfelület:

A felügyelt osztályozás előtt a tematikus kategóriák átfedését meg kell vizsgálnunk, néha bizonyos kategóriákat össze kell vonnunk. Az is előfordulhat, hogy bizonyos kategóriákat további osztályokra bonthatunk. A tematikus osztályok átfedésének meghatározása különböző módszerekkel történhet:

(III.7.8.-1)

(III.7.8.-2)

A fenti távolságokból a várható osztályozási hiba becsülhető. A tematikus osztályok átfedése vizuálisan is vizsgálható, mely történhet eloszlási-, szóródási diagrammokkal és az osztályok pixelei köré rajzolt ellipszisekkel:

A képpontok osztályozását, az egyes osztályozási hibákat négy általánosan használt osztályozón mutatjuk be:

  • 1. A legközelebbi középpontú osztályozás (minimum distance to mean classifier) során az ábrán látható pixel az egyes célkategóriák átlagvektorainak és a pixel intenzitás-vektorának különbségeként a homok célkategóriához sorolódik, holott intuitíve a településhez rendelnénk.

    2. Ha a pixelt nem a középponthoz, hanem a legközelebbi szomszéd (nearest neighbour classifier) osztályába soroljuk, akkor is léphetnek fel hibák: vékony osztályok, átfedések és hiányok esetén. Jobb eredményt ad, ha a legközelebbi adott számú szomszéd alapján történik a besorolás.

    Az előbbi két eljárás hibája, hogy sem a középpontok, sem a kategóriák egyes pixelei önmagukban nem reprezentálják a tematikus osztályt az intenzitástérben.

    3. Ezt mérlegelve eljutunk a (hiper) tégla osztályozáshoz (parallelepiped classifier), ahol a burkoló, koordináta-tengelyekkel párhuzamos oldalú téglalapot tekintjük az osztály intenzitásterének. A felvételek sávjai között viszont többé-kevésbé szoros korreláció van és ezért a tematikus osztályok eloszlásai ferdék, elnyúltak. Az átfedő régiókban, a régiókon kívüli területeken a döntés feloldására kiegészítéseket kell tenni.

    Az osztályozás pontosságához szükséges tehát, hogy az egyes tematikus osztályok valószínűségi eloszlását is figyelembe vegyük:

    4. Ha megrajzoljuk az egyes osztályokban az azonos valószínűségek szintvonalait, és a pixelt abba az osztályba soroljuk, ahol magasabb értékű szintvonalon belül van, akkor a legnagyobb valószínűség (maximum-likelihood classifier) osztályozóhoz jutunk.

    Többsávos felvételek osztályozása során a kiindulás:

    Ezek után a legnagyobb valószínűség osztályozót a következőképpen fogalmaz-hatjuk meg:

    ha P(k)· p(xi w k) > P(i)· p(xi w i),
    minden i=1,… ,k-1,k+1, … ,M értékre,
    akkor x pixelt az w k osztályba soroljuk.

    Belátható, hogy az osztályozó optimális a hibák valószínűsége szempontjából. Ha azt kívánjuk, hogy az osztályozási hibákból álló összes veszteség a lehető legkisebb legyen, akkor eljutunk a Bayes-osztályozáshoz:

    , i=1… M, (III.7.8.-3)

    Egy osztályozó akkor Bayes optimális, ha egy adott x pixelt abba az osztályba sorol, ahol Lx(i) a legkisebb.

    A gyakorlatban a p(xi w i) valószínűségi függvények esetében bizonyos egyszerű-sítésekkel kell élnünk. Egy Landsat TM felvételnél egy adott osztály gyakoriságát az intenzitástérben 2567» 1018 sugárzási vektor gyakoriságával kellene megadnunk, amelyre nem igazán lehet számítógépes reprezentációt találni. Mivel a felvétel egy homogén területének pixelei közel normális intenzitásvektor eloszlást mutatnak, célszerű ezt a tulajdonságot a gyakorlatban is alkalmazni.

    A normális eloszlású osztályok valószínűségi sűrűségfüggvénye:

    , (III.7.8.-4)

    ahol:

    n : sávok száma
    x : pixel intenzitásvektora
    mi : az i-dik osztály átlagvektora
    COVi : az i-dik osztály kovariancia mátrixa
    |COVi| : a kovariancia mátrix determinánsa.

    Az osztályozás során a:

    , (III.7.8.-5)

    kifejezés maximumát keressük. A P(i) osztály-előfordulási (a'priori) valószínűségekre az osztályozó nem nagyon érzékeny, ezért akár el is hagyhatjuk és ez esetben a maradék változó kifejezés minimumát kell keresnünk:

    , (III.7.8.-6)

    Amikor egy pixel esetében a valószínűség nagyon kicsi, egy megadott küszöbértéknél is kisebb, akkor a pixelt egyik osztályba sem soroljuk (refused). A legnagyobb valószínűség osztályozó a normálistól eltérő eloszlás esetében is jól működik, ezért széles körben alkalmazható eljárás.

    A Bayes-osztályozást a legnagyobb valószínűség osztályozó után, a tévesztési eredmények elemzése után célszerű alkalmazni. A veszteségi mátrixban a legnagyobb valószínűség osztályozó gyakori vagy nem kívánatos osztályozási hibáit - a megfelelő helyre nagyobb veszteségi értékeket megadva - visszaszoríthatjuk.

    III.7.8. További osztályozási eljárások

    kimeneti vektor=átviteli függvény(súlymátrix· bemeneti vektor+küszöbvektor).

    A súly- és küszöbértékek meghatározása a tanulási folyamat során történik, ahol a szükséges kell és a kapott van értékek közötti eltérés minimalizálása a cél. Az osztályozó rendkívül könnyen alakítható (rétegek száma, neuronok száma az egyes rétegekben, átviteli függvény megválasztása). Számos hatékony tanulási eljárást dolgoztak ki. Az osztályozás eredménye vetekszik a legnagyobb valószínűség osztályozóval kapott eredményekkel.

    III.7.9. Az osztályozás pontossági vizsgálata

    Az osztályozási hibákat, mint az előzőekben megismertük, a földfelszíni objektumok azonos spektrális tulajdonsága okozza. A kvantitatív osztályozás során elengedhetetlen, hogy az osztályozás pontosságáról ismereteink legyenek. Az osztályozót a tanulóterületek pixelei, a tananyag alapján készítettük fel az osztályozásra. Az osztályozás pontosságának meghatározását a tesztterületek pixelei, a tesztanyag osztályozása alapján számítjuk. A pontosságvizsgálat egyik eszköze lehet a tévesztési mátrix, a másik pedig a tévesztési térkép.

    A tematikus kategóriák tesztanyagának osztályozás utáni megoszlását a tévesztési mátrix (hibamátrix) soraiban helyezzük el. A mátrix azt mutatja, hogy egy adott osztály tesztanyaga (felül) milyen százalékban sorolódik be az egyes tematikus osztályokba (bal oldal):

    A Kiskunságról készült Landsat TM felvétel osztályozásának hibamátrixa:

    %

    akác

    fekete fenyő

    fiatal erdő

    tölgy, nyár

    rét

    talaj

    vágásterület

    település

    víz-felszín

    akác

    64.78

    1.74

    11.40

    16.65

    0.00

    0.00

    0.27

    0.08

    0.00

    fekete fenyő

    1.73

    79.97

    0.00

    10.73

    0.00

    0.00

    0.27

    0.00

    0.15

    fiatal erdő

    19.64

    0.53

    77.84

    3.89

    3.65

    0.01

    1.90

    0.64

    0.06

    tölgy

    11.72

    16.06

    0.29

    67.85

    0.00

    0.00

    0.18

    0.09

    0.00

    rét

    0.00

    0.39

    10.26

    0.04

    90.48

    0.13

    0.00

    0.83

    0.00

    talaj

    0.00

    0.00

    0.00

    0.00

    2.94

    87.68

    4.71

    10.83

    0.00

    vágásterület

    1.95

    1.18

    0.11

    0.83

    2.09

    0.01

    85.86

    10.74

    0.06

    település

    0.18

    0.13

    0.11

    0.02

    0.85

    12.17

    6.80

    76.80

    0.00

    vízfelszín

    0.00

    0.00

    0.00

    0.00

    0.00

    0.00

    0.00

    0.00

    99.73

    Az erdőterületek átlagos osztályozási pontossága: 75.26%, a teljes pontosság: 81.22%

    A hibamátrix rámutat, hogy az akác, a fiatal erdők, a tölgy és a nyár spektrális tulajdonságai közel vannak egymáshoz, valamint arra is, hogy a területen tölgy-nyár-feketefenyő elegyes állományok találhatók.

    A Bükk-hegység ÉNy részéről készült Landsat TM felvétel osztályozásának hibamátrixa:

    %

    akác

    bükk1

    bükk2

    bükk3

    cser

    fekete fenyő

    fiatal bükk

    tölgy

    lucfenyő

    magas kőris

    ritka

    akác

    82.80

    0.12

    0.42

    0.51

    4.82

    10.65

    1.02

    11.15

    1.57

    1.74

    0.55

    bükk1

    1.08

    79.16

    12.03

    0.85

    16.24

    0.00

    4.68

    0.09

    0.00

    9.93

    2.19

    bükk2

    0.00

    8.92

    62.30

    3.41

    2.54

    0.32

    0.00

    0.99

    0.63

    1.54

    3.28

    bükk3

    0.00

    0.52

    6.97

    61.16

    0.00

    5.81

    0.00

    13.49

    8.50

    9.07

    0.00

    cser

    1.08

    2.07

    9.11

    0.85

    63.45

    7.42

    0.81

    6.30

    0.94

    2.22

    2.73

    fekete fenyő

    0.00

    0.00

    0.24

    0.00

    0.51

    64.52

    0.00

    1.35

    12.08

    0.00

    0.00

    fiatal bükk

    0.00

    4.49

    0.83

    0.00

    1.02

    0.00

    88.82

    0.00

    0.00

    0.96

    0.55

    tölgy

    7.53

    0.17

    1.37

    19.25

    3.81

    2.58

    0.00

    62.32

    0.57

    3.28

    0.00

    lucfenyő

    0.00

    0.00

    0.42

    5.45

    0.00

    6.13

    0.00

    0.00

    75.14

    0.00

    0.00

    magas kőris

    4.30

    3.69

    1.55

    8.52

    1.78

    0.00

    0.00

    3.33

    0.06

    70.59

    0.00

    ritka

    3.23

    0.86

    4.77

    0.00

    5.84

    2.58

    4.68

    0.99

    0.50

    0.68

    90.71

    Az erdőterületek átlagos osztályozási pontossága: 72.81%

    A bükk1 középkorú, a bükk2 idős, a bükk3 pedig árnyékban lévő bükkösöket takar. Látható, hogy az árnyékban lévő bükk spektrális tulajdonságát tekintve közelebb áll a tölgyhöz. A fiatal bükk és az akác viszont nagyon jól elkülönül. A lucfenyő a feketefenyővel és az árnyékban lévő bükkel fed át. Meglepő módon viszonylag jól elkülöníthető űrfelvételek alapján a magaskőris.

    Látható, hogy a tévesztési mátrix nem csak a pontosságot, hanem a tévesztések tendenciáit is megmutatja. A tévesztési mátrix alapján többször szükség lehet a mintaterületek (tanuló+tesztterület) ellenőrzésére, a tematikus kategóriák felül-bírálására, összevonására. A két mátrix arra is rávilágít, hogy a távérzékelt felvételek alapján történő térképezés teljesen más kategóriák felállítását követeli meg, mint a terepi felmérések (fiatal, idős, ritka, árnyékban lévő, vegyes kategóriák stb.)

    A pontosság vizsgálatának másik eszköze a tévesztési térkép, mely a találatok, illetve hibák területi megoszlásáról ad felvilágosítást. A területen csoportosan jelentkező hibák általában a mintaterületek hibáit tükrözik.

    Az osztályozási pontosság: a mezőgazdaság részére készített képosztályozásoknál (növényfelmérés, termésbecslés) 80-95% körül alakul, az erdőgazdaságnál erdő - nem erdő térképezés 90% fölötti, de az állományok közel azonos spektrális viselkedése miatt a fafaj-csoportok (tölgyek, fenyő, fiatalos) térképezése viszont csak 60-75%-os érték.

    Megjegyezzük, hogy az osztályozási pontosság nem növekszik lineárisan a tananyag pixeleinek növelésével, vagyis a pontosságnak a pixelszám függvényében optimuma van.

    Az ER-Mapper programmal űrfelvétel alapján készített osztályozott erdőtérképet mutat be a következő ábra:

    [ Tartalom | Bevezetés | Raszter | Képfeldolgozás | Fotogrammetria | Vektor | Összefoglaló ]

    Geoinformatika - elektronikus jegyzet © Czimber Kornél, 2001.