Hierarchical Image Segmentation

(1)

VYSOKÉ U

Č

ENÍ TECHNICKÉ V BRN

Ě

BRNO UNIVERSITY OF TECHNOLOGY

FAKULTA INFORMA

Č

NÍCH TECHNOLOGIÍ

ÚSTAV PO

Č

ÍTA

Č

OVÉ GRAFIKY A MULTIMÉDIÍ

FACULTY OF INFORMATION TECHNOLOGY

DEPARTMENT OF COMPUTER GRAPHICS AND MULTIMEDIA

HIERARCHICKÉ METODY SEGMENTACE OBRAZU

HIERARCHICAL IMAGE SEGMENTATION

BAKALÁ

Ř

SKÁ PRÁCE

BACHELOR´S THESIS

(2)

VYSOKÉ U

Č

ENÍ TECHNICKÉ V BRN

Ě

BRNO UNIVERSITY OF TECHNOLOGY

FAKULTA INFORMA

Č

NÍCH TECHNOLOGIÍ

ÚSTAV PO

Č

ÍTA

Č

OVÉ GRAFIKY A MULTIMÉDIÍ

FACULTY OF INFORMATION TECHNOLOGY

DEPARTMENT OF COMPUTER GRAPHICS AND MULTIMEDIA

HIERARCHICKÉ METODY SEGMENTACE OBRAZU

HIERARCHICAL IMAGE SEGMENTATION

BAKALÁ

Ř

SKÁ PRÁCE

BACHELOR´S THESIS

AUTOR PRÁCE

STANISLAV STAN

Ě

K

AUTHOR

VEDOUCÍ PRÁCE

ING. MICHAL ŠPAN

Ě

L

SUPERVISOR

(3)

(4)

(5)

(6)

Abstrakt

V mnoha aplikacích poč_ítač_{ového vid}ě_{ní je segmentace obrazu jedním z nekriti}č_tě_{jších krok}ů_jeho

analýzy. V této práci je prezentována segmentač_{ní metoda založená na shlukovacích algoritmech}

fuzzy c-means a k-means. Je použita hierarchická datová struktura společ_ně_{se shlukovacími}

algoritmy pro segmentaci na každém stupni pyramidy. Výsledky ukazují, že výpoč_etníč_{as je mnohem}

menší, než v př_ípadě_{klasického shlukování.}

Klí

č

ová slova

Zpracování obrazu, segmentace, shlukování, k-means, fuzzy c-means, Gausova pyramida.

Abstract

In many vision applications image segmentation is one of the most critical steps of analysis,which has the objective of extracting information from an image. In this work a segmentation method based upon fuzzy c-means and k-means clustering is presented. A hierarchical data structure together with clustering algorithms for the segmentation in each level of the pyramid is used.The results show that the computation time is much less then that of a classical clustering.

Keywords

Image processing, segmentation, clustering, k-means, fuzzy c-means, Gaussian pyramid.

Citace

Staně_{k Stanislav: Hierarchické metody segmentace obrazu. Brno, 2008, bakalá}ř_{ská práce, FIT VUT}

(7)

Hierarchické metody segmentace obrazu

Prohlášení

Prohlašuji, že jsem tuto bakalář_{skou práci vypracoval samostatn}ě_{pod vedením...}

Další informace mi poskytli...

Uvedl jsem všechny literární prameny a publikace, ze kterých jsem č_erpal.

……… Jméno Př_íjmení

Datum

Pod

ě

kování

Dě_{kuji vedoucímu své bakalá}ř_{ské práce za cenné rady, uvedení do problematiky a odborné vedení p}ř_i

(8)

Obsah

Obsah ... 1 Úvod ... 2 1 Zpracování obrazu ... 3 1.1 Základní pojmy ... 4 1.1.1 Konvoluce ... 4 1.1.2 Šum a filtrace ... 4 1.2 Reprezentace obrazu ... 5 1.2.1 Prostorová oblast ... 5

1.2.2 Popis barev v obraze (barevné prostory) ... 5

2 Segmentace obrazu ... 7 2.1 Definice segmentace ... 7 2.2 Segmentač_{ní metody ... 8} 2.2.1 Prahování a shlukování ... 8 2.2.2 Detekce hran ... 8 2.2.3 Detekce oblastí ... 9 2.3 Hierarchická segmentace ... 9

2.3.1 Hierarchická reprezentace dat ... 10

2.3.2 Hierarchické metody ... 11

3 Shlukování ... 13

3.1 K-means (metoda nejbližších stř_edů_{) ... 13}

3.2 Fuzzy c –means... 14 4 Návrh algoritmu ... 16 5 Implementace ... 18 5.1 OpenCv ... 18 5.2 Vlastní implementace ... 18 6 Výsledky testování ... 20

6.1 Testování algoritmu k-means ... 20

6.2 Testování algoritmu fuzzy c-means ... 21

6.3 Testování v prostoru CILAB ... 21

6.4 Porovnání algoritmů_{... 22}

7 Závě_{r ... 23}

(9)

Úvod

Obraz, ve svém všeobecném smyslu mů_{že zahrnovat vše, co si dokážeme p}ř_{edstavit. Od obrázk}ů_,

videa, animací, grafů_{, kreseb , až po samotný text. Z obrazu p}ř_{ijímáme nejv}ě_{tší množství informace}

z okolí, které nás obklopuje. Básník Ezra Pound jej kdysi definoval jako „vyjádř_{ení intelektuálního a}

emocionálního komplexu v č_{asovém okamžiku”. Ve snaze lépe pochopit data spole}č_ně_{s tím, co}

př_{edstavují, byly proto vyvinuty rozdílné techniky. Ty nabyly na významu v mnoha oblastech jako je}

biometrie, komprese, rozpoznávání vzorů_{, nebo biomedické inženýrství. Všechny tyto techniky dnes}

mů_{žeme zahrnout do t}ř_{í oblastí: zpracování obrazu, obrazová analýza a rozpoznávání obrazu.}

Smyslem této práce je př_{edstavit jednu z nejkriti}č_tě_jšíchč_{ástí analýzy obrazu, jíž je segmentace}

obrazu a př_{edevším její hierarchický p}ř_ístup.

V úvodu této práce se seznámíme s problematikou zpracování obrazu a jeho reprezentací. Popíšeme si reprezentaci obrazu v prostorové oblasti a následně_{se seznámíme s barevnými prostory}

použitými v této práci. Ve druhé kapitole se budeme hloubě_{ji zabývat segmentací obrazu. Uvedeme}

si formální definici segmentace a možnou klasifikaci jednotlivých segmentač_{ních metod. Krom}ě

klasických segmentač_{ních algoritm}ů_{nutných k pochopení jednotlivých segmenta}č_{ních p}ř_ístupů_si

př_{edstavíme i n}ě_{které hierarchické metody segmentace obrazu.Ve t}ř_{etí kapitole se pono}ř_{íme do}

problematiky shlukové analýzy. Popíšeme si shlukovací algoritmy k-means a fuzzy c-means. U posledně_{jmenovaného si navíc uvedeme metodu pro ur}č_{ení optimálního po}č_{tu shluk}ů_.Č_{tvrtá kapitola}

se bude zabývat návrhem algoritmu použitého v této práci. V další č_{ásti práce se dostaneme}

k implementaci výsledného programu. Uvedeme si knihovnu OpenCv a popíšeme si jednotlivé tř_{ídy a}

způ_{sob jakým byly navrženy.V p}ř_{edposlední, šesté kapitole si v p}ř_{ehledné form}ě_{uvedeme výsledky}

testování. Zaměř_{íme se p}ř_{edevším na celkovou}č_{asovou náro}č_{nost a rozdíly v segmentacích mezi}

klasickým a hierarchickým př_{ístupem. Srovnáme taky výsledky mezi jednotlivými shlukovacími}

algoritmy. Zaměř_{íme se i na výsledky segmentace v jednotlivých barevných prostorech. Na záv}ě_r

(10)

1

Zpracování obrazu

Cílem zpracování a rozpoznávání obrazu je porozumě_{ní obsahu obrazové informace reálného sv}ě_ta,

která do poč_ítač_{e vstupuje nej}č_astě_{ji prost}ř_{ednictvím kamery nebo skeneru. Postup zpracování}

obrazu mů_{žeme obvykle rozd}ě_{lit do n}ě_{kolika základních krok}ů_.

1. Snímání a digitalizace 2. Př_{edzpracování}

3. Segmentace obrazu 4. Popis objektů

5. Klasifikace

Prvním krokem ve zpracování obrazu je snímání obrazu pomocí senzorů_např_{. optických.}

Dvou-dimenzionální signál získaný tě_{mito senzory je p}ř_{eveden na elektrický signál spojitý v}č_{ase i}

úrovni. Vstupní informací mů_{že být nap}ř_{íklad jas, intenzita}č_{ervené barvy. Nej}č_astě_{ji je to ale více}

hodnot (č_{ervená, zelená a modrá složka) p}ř_{i barevném snímání, nebo dokonce celé spektrum barev}

(např_{. data z po}č_ítač_{ového tomografu,}č_{i spektrální m}ěř_{ení svitu hv}ě_zd).

Dalším krokem je př_{evod spojitého analogovaného signálu na signál diskrétní. Tento proces}

se nazývá digitalizace a odehrává se ve dvou nezávislých krocích, jimiž jsou kvantování a vzorkování.

Vzorkování (sampling) spojité funkce je zaznamenání hodnot – vzorků_{v p}ř_{edem daných intervalech.}

S kratším vzorkovacím intervalem zaznamenáme více detailů_{z p}ů_{vodní spojité funkce a získáme}

obraz ve vyšším rozlišení. S delším vzorkovacím intervalem naopak informace o detailech v obraze ztrácíme. Kvantování probíhá v oboru hodnot obrazové funkce, který se rozdě_{lí na intervaly, jimž je}

pak př_idě_{lena jediná zástupná hodnota.Výsledkem digitalizace je obraz v digitální podob}ě

reprezentovaný maticí obrazových bodů_{– pixel}ů_.

Po digitalizaci následuje př_{edzpracování obrazu. N}ě_{kdy je obraz zašum}ě_{lý a degradovaný}

vlivem optického systému, špatného zaostř_{ení, nebo mlhy. Cílem p}ř_{edzpracování je filtrací, ost}ř_ením,

jasovými a geometrickými transformacemi vylepšit obraz.

Tř_{etím, nejt}ě_{žším krokem zpracování obrazu je segmentace. Jedná se o analýzu obrazu}

vedoucí k nalezení objektů_{zájmu v obraze. Ty jsou p}ř_{edány k dalšímu zpracování, jako je popis}

(11)

Popis objektů_{má dva zp}ů_{soby. Na základ}ě_souboruč_{íselných charakteristik – kvantitativn}ě_,

nebo relacemi mezi objekty a jejich tvarovými vlastnostmi – kvalitativně_{.Ve v}ě_tšině_př_ípadů_je

vstupní informací pro následnou klasifikaci.

Klasifikace je zař_{azení objekt}ů_{nalezených v obraze do skupiny p}ř_{edem známých t}ř_{íd. Jedná}

se o finální krok zpracování a rozpoznávání obrazu.

1.1

Základní pojmy

K nezbytnému pochopení celé problematiky segmentace si nyní uvedeme ně_{které pojmy o které se}

tento proces opírá.

1.1.1

Konvoluce

Konvoluce je matematický operátor zpracovávající dvě_{funkce, který se}č_{asto používá v algoritmech}

pro zpracování dvourozmě_{rného diskrétního obrazu. Vzorec diskrétní konvoluce má tvar:}

, , , · ,

Funkci h(i,j) se ř_{íká konvolu}č_{ní jádro, které lze chápat jako tabulku (konvolu}č_{ní masku)}

položenou na př_{íslušné místo v obraze. Koeficienty uvnit}ř_konvoluč_{ní masky udávají vliv hodnoty}

pixelu pod nimi. Každý pixel př_{ekrytý tabulkou vynásobíme koeficientem v p}ř_{íslušné bu}ň_{ce a}

provedeme souč_{et všech hodnot. Výsledkem je pak nová hodnota pro pixel pod st}ř_{edem konvolu}č_ní

masky.

1.1.2

Šum a filtrace

Šum mů_{žeme obvykle definovat jako nežádoucí informaci, která byla do obrazu p}ř_{idána v pr}ů_bě_hu

jeho zpracování. Č_{asto je znatelný jako r}ů_{znobarevné zrn}ě_{ní p}ř_{edstavované vysokými frekvencemi,}

které mouhou znač_ně_{ovlivnit celý proces segmentace. K jeho odstran}ě_{ní proto používáme filtraci. Ta}

kromě_potlač_{ení šumu a vyhlazování m}ů_{že být využita i pro zvýrazn}ě_{ní kontrastu, nebo detekci hran.}

Filtrace pracuje s intenzitou bodu vázaného na své okolí. K jejímu provedení je tak č_{asto používána}

(12)

1.2

Reprezentace obrazu

Informace obsažené v obraze mů_{žeme reprezentovat zcela rozdílnými zp}ů_{soby. Záleží p}ř_{edevším na}

způ_{sobu jakým na výsledný obraz nahlížíme a charakteristikách, které nás zajímají. My se zde}

zaměř_{íme na reprezentaci obrazu v prostorové oblasti a zp}ů_{sobu vyjád}ř_{ení hodnot, jichž nabývá.}

1.2.1

Prostorová oblast

Př_{i práci s obrazem v po}č_ítač_{ové grafice máme jen z}ř_{ídka k dispozici spojitý obraz. D}ů_{vodem, který}

tomu zabraň_{uje je pam}ěť_{ové omezení dnešních po}č_ítačů_{. Protože po}č_ítač_{e nedokážou obsloužit}

spojitý signál, ale jen data v podobě_{sekvence digitálních hodnot, vznikla pot}ř_{eba vyjád}ř_{it obraz jako}

dvou-dimenzionální pole bodů_{. Nebo-li, jako diskrétní matici pixel}ů_{. Pixel pak p}ř_{edstavuje jeden}

svítící bod na př_{íslušné pozici matice. V nejjednodušším p}ř_ípadě_{je pixel umíst}ě_{n na}č_{tvercové m}ř_ížce

bodů_{zvané “rastr”. Pozice pixelu je dána b}ě_{žnou notací pro matice. První index, m, ur}č_{uje pozici} ř_{ádku. Druhý index, n, ur}č_{uje pozici sloupce.}

Pokud se tedy obraz skládá z matice typu M x N, pak M je poč_etř_ádků_{a N je po}č_{et sloupc}ů_matice.

Kromě_{reprezentace v podob}ěč_{tvercové m}ř_{ížky, m}ů_{žeme ve dvou-rozm}ě_{rném prostoru}

použít další geometrická uspoř_{ádání a tvary v podob}ě_{hexagonální a trojúhelníkové m}ř_ížky.

S rostoucím výkonem poč_ítačů_{se však p}ř_edmě_{tem zájmu staly i obrazy v dimenzích daleko vyšších}

např_{. v prostoru 3D je pixel p}ř_emě_ně_{n na objemový element s názvem voxel.}

1.2.2

Popis barev v obraze (barevné prostory)

Existuje velké množství rů_{zných barevných prostor}ů_{. My si zde uvedeme prostory RGB a CIELAB}

použité v této práci.

1.2.2.1 RGB barevný prostor

Rů_{zné barvy, které se používají p}ř_{i vytvá}ř_{ení obrazu, jsou tvo}ř_{eny kombinací n}ě_{kolika základních}

složek. Barevný prostor urč_{uje ze kterých složek a jakým zp}ů_{sobem se výsledný obraz skládá. Na}

barevné obrazovce např_{íklad vidíme barvu jako výsledek složení t}ř_{í složek –}č_{ervené (R, red), zelené}

(G,green), modré (B,blue). Každá výsledná barva je tvoř_{ena vektorem t}ř_{í hodnot udávajících intenzitu}

jednotlivýh složek. Ty mohou nabývat hodnot z intervalu <0,1>. Bývají však uvádě_{ny i}

v celoč_{íselném rozsahu 0 – 255, což odpovídá kódování každé ze složek RGB v jednom bytu.}

Hodnota 0 znamená, že složka není zastoupena. Maximální hodnota 255 indikuje, že složka nabývá své nejvě_{tší intenzity. Barva je tak ur}č_{ena t}ř_{emi bajty a po}č_{et zobrazitelných barev je 256}3 ₌

(13)

Složíme-li č_{ervenou, zelenou a modrou barvu ze složek o maximální intenzit}ě_{, získáme barvu}

bílou. Složením nulových intenzit, pak barvu č_{ernou. Podobn}ě_{ze složek o stejné intenzit}ě_získáme

stupně_{šedi. Kdybychom však z r}ů_{zných d}ů_vodů_chtě_{li p}ř_{evést barevný obraz na} č_ernobílý,

nemů_{žeme jeho barvy nahradit odstíny šedi získanými prostým pr}ů_mě_{rem ze t}ř_{í základních barev.}

Lidské oko vnímá rů_{zným zp}ů_{sobem intenzitu jednotlivých barevných složek. Pro výpo}č_{et jasu}

v č_{ernobílém obraze se proto používá následující empirický vztah.}

I = 0.299 * R + 0.587 * G + 0.114 * B (1.1)

Barevný rozsah prostoru RGB mů_{žeme prostorov}ě_{zobrazit jako jednotkovou krychli}

umístě_{nou v osách ozna}č_{ených postupn}ě_{r, g, b (obr. 1.1). Po}č_{átek sou}ř_{adnic odpovídá}č_{erné barv}ě_,

zatímco vrchol o souř_{adnicích [1, 1, 1] odpovídá bílé. Vrcholy krychle, které leží na osách,}

př_{edstavují základní barvy a zbývající vrcholy reprezentují dopl}ň_{kové barvy ke každé ze základních}

barev.

Prostor RGB je jednoduchý na implementaci, ale je nelineární se smyslovým vnímáním barev č_lově_{kem. P}ř_{esto je velmi b}ě_{žný a používaný skoro ve všech za}ř_{ízeních jako je po}č_ítač_{, televize}

a video.

1.2.2.2 CIELAB barevný prostor

Prostor CIELAB je tř_{í dimenzionální prostor, který je charakterizován t}ř_{emi navzájem kolmými}

osami L*, a*, b*. Osa L* vyjadř_{uje jak je barva sv}ě_{tlá. Sou}ř_{adnice a*, b* definují barevný odstín. Osa}

a* reprezentuje č_{erveno-zelené odstíny, osa b* žluto-modré. Charakterizace barev je tak podobná}

způ_{sobu zpracování barevné informace okem. A}č_{koliv jsou v oku t}ř_{i druhy}č_ípků_{citlivé ke krátkým,}

stř_{edním a dlouhým vlnovým délkám, nejsou do mozku p}ř_{enášeny p}ř_{ímo signály R, G, B.}

V gangliových buň_{kách dochází k jejich zakódování do signálu}č_{erveno-zeleného, žluto-modrého a}

achromatického (jasového).

Č_{asto je ozna}č_{ován p}ř_{ívlastkem uniformní, který vyjad}ř_{uje, že vzdálenost mezi dv}ě_{ma body}

v prostoru CIELAB lépe odpovídá rozdílu intenzit mezi barevnými odstíny tak, jak je vnímá lidský vizuální systém. Rozdíly barev, které jsou č_lově_{kem vnímány jako stejn}ě_{velké, jsou tak i p}ř_i č_{íselném vyjád}ř_{ení stejn}ě_{velké. Tato vlastnost prostoru CIELAB ho tak}č_{iní obzvlášte atraktivním v}

(14)

2

Segmentace obrazu

Rostoucí potř_{eba po automatické analýze obrazu a jeho interpretaci v širokém spektru aplikací si}

vynutila vzniku ř_adě_segmentač_{ních algoritm}ů_{. Segmentace obrazu je}č_{asto popisována jako proces,}

který podle vybraných vlastností rozdě_{lí obraz do homogenních a smysluplných}č_{ástí odpovídajících}

př_edmě_tů_mč_{i oblastem reálného sv}ě_{ta. Jestliže tyto}č_{ásti odpovídají objekt}ů_{m ve vstupním obraze,}

pak hovoř_{íme o tzv. kompletní segmentaci. Pokud ale oblasti neodpovídají p}ř_esně_objektů_{m ve}

vstupním obraze, pak tuto segmentaci nazýváme č_ásteč_{nou. Kompletní segmentace obecn}ě_využívá

vyšší úrovně_{zpracování, která je založena na znalostech}ř_{ešeného problému.}Č_ásteč_{ná segmentace je}

založena na principu homogenity obrazových vlastností ( např_{. jas, barva, textura) uvnit}ř_segmentu.

2.1

Definice segmentace

Aby nedocházelo k zámě_ně_mezič_ásteč_{nou a kompletní segmentací, uvedeme formální pravidla}

kompletní segmentace:

Kompletní segmentace obrazu R v sobě_{zahrnuje identifikaci kone}č_{ného po}č_{tu neprázdných region}ů

Ri, i = 1, 2,…, N takových, že:

1. … .

2. , .

3. !"#, .

4. $ % &'()#, .

Kde P( Ri ) je predikát uniformity a homogenity pro všechny elementy Ri a kde Ø značí prázdnou

množinu. Z výše uvedených podmínek tedy popoř_adě_vyplývá:

1. Každý pixel obrazu by mě_{l pat}ř_{it do n}ě_{jakého regionu.}

2. Regiony by se nemě_{ly p}ř_ekrývat.

3. Pixely by mě_{ly být ve svém regionu p}ř_iř_{azeny podle ur}č_{itých spole}č_{ných vlastností.}

4. Pixely, které patř_{í do r}ů_{zných region}ů_{by m}ě_{ly mít rozdílné vlastnosti.}

V ně_{kterých textech zabývajících se segmentací obrazu se dále uvádí, aby hranice a vnit}ř_{ek segment}ů

(15)

2.2

Segmenta

č

ní metody

S existencí velkého množství segmentač_{ních metod vznikly r}ů_{zné typy klasifikací segmenta}č_ních

algoritmů_{podle zp}ů_{sobu, jakým dosahují výsledné segmentace. Pohled na po}č_{et a typy jednotlivých}

skupin se v literatuř_{e r}ů_zně_{liší. Obecn}ě_{však m}ů_{žeme segmenta}č_{ní algoritmy rozd}ě_{lit do t}ř_í

základních skupin:

1. Prahování a shlukování. 2. Detekce hran

3. Detekce oblastí.

2.2.1

Prahování a shlukování

Prahování je jedna z nejjednodušších segmentač_{ních metod, zahrnujících identifikaci skupiny}

hodnot, kterým ř_{íkáme práh. V nekomplikované podob}ě_{prahování spo}č_{ívá v rozd}ě_{lení jasové škály}

obrazu na dvě č_{ásti a nahrazení každé z nich zástupnou hodnotou, kde hodnota 1 ur}č_{uje nalezené}

objekty a hodnota 0 urč_{uje pozadí obrazu. Výsledkem prahování je pak binární forma obrazu. Tato}

technika je však zastaralá a selhává i u velmi jednoduchých obrazů_{z d}ů_vodů_nestejnomě_rného

osvě_{tlení vstupního obrazu. Proto se nej}č_astě_{ji používá prahování adaptivní s prom}ě_{nným po}č_tem

prahů_{, ve kterém je obraz rozd}ě_{len na n}ě_kolikč_{ástí, kde v každé}č_{ásti se hodnota prahu ur}č_{í nezávisle}

na ostatních č_{ástech obrazu. Pokud v n}ě_kteréč_{ásti obrazu hodnotu prahu nelze ur}č_{it, m}ů_{žeme práh v}

této č_{ásti p}ř_ibližně_vyjádř_{it z hodnot prah}ů_{v jejím okolí. Dalším z možných p}ř_ístupů_{je prahování na}

základě_{intervalu hodnot, kdy hodnoty z intervalu ur}č_{ují objekty a hodnoty mimo interval pozadí}

obrazu. Dů_{ležitým faktorem je také volba správného prahu.Ve složit}ě_{jších metodách se nej}č_astě_ji

detekuje vhodný práh z histogramu analýzou jeho tvaru, kde práh je urč_{en jako minimum mezi dv}ě_ma

maximy v histogramu.

Clustering (shluková analýza) patř_{í mezi metody u}č_{ení bez u}č_{itele. Jejím cílem je v dané}

množině_objektů_{nalézt její podmnožiny, nebo-li shluky objekt}ů_{tak, aby si}č_{lenové shluku byli}

navzájem podobní a nebyli si př_{íliš podobní od objekt}ů_{mimo tento shluk. Shlukovou analýzou se}

budeme podrobně_{ji zabývat v kapitole 3.}

(16)

Alternativním př_{ístupem pro výpo}č_{et hranových gradient}ů_{je konvoluce obrazu se skupinou vzor}ů

hran, kde každý vzor odpovídá hranám v urč_{itém sm}ě_{ru. Nej}č_astě_{ji je aplikován p}ř_{i použití hranových}

operátorů_(Robertsů_{v, Sobel}ů_{v, Cannyho, Laplace}ů_{v atd). Ideální obrazový detektor by m}ě_{l správn}ě

označ_{it body, které pat}ř_{í hranám a m}ě_{l by p}ř_{edcházet chybnému ozna}č_{ení bod}ů_{v místech, kde hrany}

neexistují. Kritériem, které rozhodne o existenci hrany v obraze je tak prahová hodnota. Př_{i velikosti}

gradientu vě_{tším než prahová hodnota pak odvodíme, že v daném bod}ě_{se vyskytuje bod hrany, jinak}

se v daném bodě_{hrana nevyskytuje.}

Výstupní obraz detekce hran však č_{asto nem}ů_{žeme použít jako kone}č_{ný výsledek segmentace. Musí}

následovat doplň_{kové kroky, které spojí jednotlivé hrany do}ř_etě_zců_{tak, aby v obraze z}ů_{staly jen}

hrany korespondující s existujícími objekty v obraze.

Proto se vě_{tšinou p}ř_{edzpracovává obraz filtrací, ve které se odstra}ň_{ují vysoké frekvence obsahující}

šum.

2.2.3

Detekce oblastí

Detekce oblastí se zaměř_{uje na vyhledávání celých oblastí v obraze na základ}ě_{zvoleného kriteria}

homogenity oblasti, jako je konstantní jas, barva, pokrytí stejnou texturou atd. Obecně_{je tato}

technika oproti detekci hran výhodná u zašumě_{lých obraz}ů_{, ve kterých je obtížné detekovat hranici}

objektu.

Nevýhodou však mů_{že být stav, kdy v ur}č_{itých p}ř_{ípadech m}ů_{že být obraz rozd}ě_{len do více region}ů_a

dojde tak k př_{esegmentování obrazu. N}ě_{kdy však m}ů_{že nastat i situace opa}č_{ná, kdy je naopak ve}

výsledném obraze malý poč_{et region}ů_{a obraz je tak podsegmentován.V}ě_{tšinou je detekce oblastí}

založena na postupném spojování č_{i d}ě_{lení jednotlivých region}ů_{a kombinaci obou t}ě_{chto p}ř_ístupů_.

Jeden z tě_{chto p}ř_ístupů_{nazvaný split and merge si popíšeme v následující kapitole.}

2.3

Hierarchická segmentace

Rozdílné postupy segmentace obrazu vyžadují rů_{zný stupe}ň_{detailu segmentace. P}ř_{ítomnost šumu}

v obraze mů_{že totiž výslednou segmentaci zna}č_ně_{ovlivnit. Krom}ě_způ_{sobu, jakým segmentaci}

provádíme, navíc záleží i na rozlišení zpracovávaného obrazu a poč_{tu sledovaných vlastností, nap}ř_.

započ_{tených barevných kanál}ů_{. S jejich v}ě_{tším množstvím totiž roste celková doba výsledného}

zpracování dat. Do segmentace obrazu tak byly zavedeny prvky hierarchie, které se snaží tyto záporné vlastnosti potlač_it.

(17)

2.3.1

Hierarchická reprezentace dat

Je mnoho způ_sobů_{jakými lze dosáhnout hierarchie v reprezentaci dat. My si zde p}ř_{edstavíme dva}

z nich: obrazové pyramidy a stromy.

Obrazové pyramidy:

Pyramidou rozumíme hierarchii po sobě_{následujících obraz}ů_{o nižším rozlišení postavenou na}

originálním obraze. Základnou I0 pyramidy je obraz v původním nejvyšším rozlišení. Obraz na dalším

stupni Ii+1 je vytvořen z obrazu Ii pomocí následujících dvou kroků:

1. Rozmazání obrazu pomocí filtru s dolní propustí.

2. Podvzorkování obrazu, které zmenší velikost obrazu na polovinu

Vrchol pyramidy pak tvoř_{í obraz s nejnižším rozlišením. Protože pyramida roste sm}ě_{rem dol}ů_od

nejvyššího po nejnižší rozlišení, je výsledná pyramida př_{evrácená. Pokud p}ř_{i vytvá}ř_{ení pyramidy}

použijeme jako filtr gaussovo jádro *₊,

,+-./ 0$1 -₂₃-_%

+- 4 , 5 6789:8;:9í =::>?@8

nazýváme pyramidu Gaussovou. Jádro Gaussova filtru hodnotí pixely v jeho centru mnohem silně_ji

než v jeho okolí. Ohodnocení však závisí na velikosti standardní odchylky. Př_{i její velmi nízké}

hodnotě_{bude mít filtr nepatrný vliv na celkový obraz, protože váhy pro všechny pixely mimo jádro}

jsou nízké. Naopak s nepř_iměř_eně_{velkou standardní odchylkou m}ů_{žeme v obraze krom}ě_{šumu navíc}

př_{ijít o n}ě_{které detaily. Gaussova pyramida tak tvo}ř_{í obrazy v n}ě_{kolika stupních rozlišení, které jsou}

na jednotlivých vrstvách pyramidy rozmazané. Díky jeho vlastnostem jsou obrazy postupně_na

nižších vrstvách jeho opě_{tovnou aplikací rovnom}ě_rně_{rozmazány, kdy množství detail}ů_{v obraze klesá}

(18)

Quadtree:

Quadtree využívá model „rozdě_{l a panuj“ tak, že d}ě_{lí obraz do}č_tyř_stejně_{velkých kvadrant}ů_.

Heterogenní kvadranty jsou opě_{t d}ě_{leny do}č_tyř_kvadrantů_{až do doby, kdy kvadrantu odpovídá}

homogenní oblast. Výsledný strom je tak stupeň_{4, kde ko}ř_{enem stromu je celý obraz. Uzly}

reprezentují heterogenní oblasti a listy oblasti homogenní.

Struktura Quadtree je používána pro kompresy dat, efektivní vyhledávání a jiné aplikace ve kterých je užiteč_{né p}ř_{erušit zpracování homogenních region}ů_.

Obrázek 2.2. Ukázka struktury Quadtree a její výsledné stromové reprezentace

2.3.2

Hierarchické metody

Pro lepší pochopení využití hierarchické reprezentace dat si popíšeme možné způ_{soby jejího použití v}

jednotlivých typech segmentač_{ních metod tak, jak byly klasifikovány v kapitole 2.}

Prahování

Prahování v hierarchické struktuř_{e dat je vetšinou založeno na lokálních metodách. Namísto jedné}

pevné prahové hodnoty pro celý obraz tak dovolíme, aby se tato hodnota v prů_bě_{hu zpracováni lišila.}

Cílem je najít v obraze o nižším rozlišení regiony, které budou následně_doladě_{ny segmentací obrazu}

ve vyšším rozlišení. Algoritmus zač_{íná na vrcholu pyramidy, kde se nachází obraz s nejnižším}

rozlišením, na který je aplikována segmentace. Na dalším stupni je pak segmentace upř_esně_na.

Pixely, které jsou blízko hranicím objektů_{jsou rozsegmentovány a ozna}č_{eny jako body objekt}ů_{, nebo}

pozadí.Toto upř_esně_{ní je pak opakováno na každém stupni pyramidy až k obrazu v originální}

rozlišení. Velkou výhodou tohoto postupu je menší dopad šumu v obraze na výslednou segmentaci. Segmentace v nižším rozlišení je totiž provádě_{na na rozmazaném obrazu, ve kterém je šum potla}č_en.

Nepř_{esné hranice objekt}ů_{, vzniklé rozmazáním obrazu jsou pak op}ě_{tovnou segmentací obrazu na}

dalším stupni pyramidy opraveny.

Detekce oblastí

Mezi nejjednodušší algoritmy hierarchické detekce oblastí mů_{žeme zahrnout algoritmus Split and}

Merge. V tomto algoritmu jsou regiony na základě_př_{edem daného kritéria homogenity postupn}ě

(19)

homogenní, tak je obraz rozdě_{len na}č_tyř_{i podregiony. Pokud se na n}ě_{kterém stupni pyramidy nachází} č_tyř_{i regiony s podobnými vlastnostmi, jsou následn}ě_{spojeny do jednoho celistvého regionu v}

nadř_{azeném stupni pyramidy. Algoritmus pokra}č_{uje až do doby, kdy již není co spojit, nebo rozd}ě_lit.

Segmentaci tak mů_{žeme chápat jako konstrukci struktury Quadtree, kde každý list reprezentuje}

homogenní region.

Detekce hran

Vě_{tšina detektor}ů_{hran vymezuje prostor, na kterém jsou jednotlivé hrany detekovány. Ten je omezen}

velikostí konvoluč_{ního jádra a poskytuje tak jen lokální informace v obraze. S v}ě_{tším konvolu}č_ním

jádrem navíc roste výpoč_{etní náro}č_{nost jednotlivých algoritm}ů_{. Detekce hran pomocí obrazu v}

rů_{zných stupních rozlišení je tak} č_{asto používaným procesem zp}ř_esně_{ní výsledku hranových}

detektorů_{. Jedním z možných p}ř_ístupů_{je nalezení správného stupn}ě_{pyramidy, na kterém je úsp}ě_šně

potlač_{en šum, ale hlavní hrany obrazu jsou zachovány. U každého pixelu je pomocí prahové hodnoty}

detekováno s jak velkou mírou vyjadř_{uje hranu na p}ř_{íslušném stupni pyramidy. Pokud je pixel}

označ_{en jako hranový, opakujeme stejný postup na jeho}č_tyř_{i následníky. Algoritmus je ukon}č_{en p}ř_i

nalezení detailních hran bez př_{ítomnosti šumu.}

(20)

3

Shlukování

Shlukování, nebo-li shluková analýza je společ_{ný název pro celou}ř_{adu metod, jejichž cílem je využití}

analýzy vícerozmě_{rných dat k rozt}ř_ídě_{ní množiny objekt}ů_{do t}ř_{íd (shluk}ů_{). Tyto metody jsou úsp}ě_šné

př_{edevším v situacích, kdy objekty mají tendenci se p}ř_irozeně_{seskupovat. Obecn}ě_{jsou známé dva}

př_{ístupy shlukování dat. První je založen na principu d}ě_{lení, kdy data v obraze p}ř_{edstavují jeden}

velký shluk. Ten je rekurzivně_dě_{len tak, aby se dosáhlo dobrého shlukování. Ve druhém p}ř_ípadě_je

naopak každý datový prvek vyjádř_{en jedním shlukem, které jsou postupn}ě_{spojovány. Kvalita s jakou}

jsou jednotlivé shluky vytvoř_{eny závisí ve zna}č_{né mí}ř_{e na vstupních datech.}Č_{asto se ve shlukovacích}

algoritmech musí zadat množství cílových segmentač_{ních region}ů_{. To ale v}ě_{tšinou neznáme p}ř_edem.

Proto byly vytvoř_{eny r}ů_{zné algoritmy, které se snaží ur}č_{it množství výsledných shluk}ů_{, jako nap}ř_.

adaptivní shlukování. Vě_{tšinou je však stále v t}ě_{chto metodách dána ur}č_{itá prahová hodnota, podle}

které se nakonec obraz rozsegmentuje. Analýza optimálního množství shluku se tak v procesu shlukování stala velmi komplexní záležitostí, kde výsledné množství shluků_{nakonec s velkou mírou}

závisí na vstupních datech a vlastnostech obrazu, které pozorujeme. My si zde př_{edstavíme dva}

shlukovací algoritmy k-means a fuzzy c-means, které jsou př_{edstaviteli skupiny t}ě_{chto shlukovacích}

algoritmů_.

3.1

K-means (metoda nejbližších st

ř

ed

ů

)

Princip metody K-means spoč_{ívá v rozd}ě_{lení n objekt}ů_{o m prom}ě_{ných do k shluk}ů_{tak, že}

mezishluková suma č_tverců_{je p}ř_{itom minimalizována. Metoda se jeví užite}č_{nou p}ř_{edevším p}ř_i

vytvář_{ení malého po}č_{tu shluk}ů_{z velkého po}č_{tu objekt}ů_{. Vyžaduje spojité prom}ě_{nné, a p}ř_{edevším bez}

odlehlých hodnot. Diskrétní data mohou být rově_{ž analyzována, ale mohou zp}ů_{sobit problémy.}

Algoritmus nalezne spíše optimum lokální než globální. Je to takové uspoř_{ádání shluk}ů_{, kdy již}

př_emístě_{ní objektu z jednoho shluku do druhého nezp}ů_{sobí snížení sumy}č_tverců_{. Algoritmus pracuje}

opakovaně_{, startuje vždy u jiného po}č_áteč_{ního uspo}ř_{ádání. Nakonec vybere optimální}ř_{ešení ze všech}

možných dosažených uspoř_{ádání shluk}ů_.

Uživatel zadává poč_{et shluk}ů_{, jež mají být nalezeny. Pak jsou vytvo}ř_{eny prostorové shluky}

nalezením souboru stř_edů_shluků_{tak, že každý objekt je p}ř_iř_{azen do jednoho shluku, na}č_{ež jsou}

(21)

V této práci jsem použil verzi algoritmu, která zač_{íná inicializací center. Celý algoritmus}

mů_{žeme popsat následovn}ě_:

1. Inicializuj matici stř_edů_shluků_{V použitím generátoru náhodných}č_{ísel. Nastav itera}č_{ní krok}

k = 0.

2. Vypoč_{ítej matici p}ř_{íslušnosti U}

3. Aktualizuj matici center V

4. Pokud AB BA C D , ukonč_{i algoritmus. Jinak nastav k = k+1 a pokra}č_{uj od bodu 2.}

za podmínek:

|| * || urč_{uje normu. V algoritmu je normou max{(j}₁_-j₂₎2 _{+ (k}₁_-k₂₎2_{} bod}ů_(j,k).

3.2

Fuzzy c –means

Základní a patrně_{nejpoužívan}ě_{jší shlukovací metodou je fuzzy c-means. Tato metoda umož}ň_uje

shlukování do více než jednoho shluku, zatímco v bě_{žném shlukování je každý objekt}č_{lenem pouze}

jednoho shluku. Tím je lépe charakterizováno rozložení objektů_{a snadno se dají ur}č_{it objekty ležící}

na hranicích rů_{zných shluk}ů_{. V p}ř_ípadě_{, že u každého objektu je jedna z hodnot ú}č_{asti do shluku}

rovna jedné a ostatní jsou nulové, př_{echází výsledek na pevné shlukování. Naopak, pokud u všech}

objektů_{je hodnota p}ř_{íslušnosti k libovolnému shluku rovna p}ř_{evrácené hodnot}ě_poč_{tu shluk}ů_{, jsou}

jednotlivé shluky neurč_{ené. Tento algoritmus m}ů_{že být formulován následovn}ě_:

E9F8?GH IJ", B HJ K L : , M za platnosti podmínek: uOP Q 1, i HT U0,1W /;= , a 1 X X >.

kde n je poč_{et vstupních dat a c je po}č_{et center shluk}ů_.Y Z, , … , _L[ \ ]_{je matice vstupních}

(22)

Váhový exponent (F ^ 0) urč_{uje míru p}ř_{ekrývání jednotlivých shluk}ů_.:, M _{udává vzdálenost}

mezi objektem a centrem shluku M, kterou mů_{žeme získat pomocí vzorce:}

M_ ∑ 0H_4 J L ∑L 0H_4J

Matici př_{íslušnosti U vypo}č_{ítáme následovn}ě_:

H_2 1 ∑ a: :b J K

Dále musí platit : c Mc ^ 0, , @. Nechť: 0_{, potom}H 1_aH 0,

Kostra algoritmu použitého v této práci:

1. Inicializuj matici stř_edů_shluků_{V použitím generátoru náhodných}č_{ísel. Nastav itera}č_{ní krok}

b = 0 a fuzzy koeficient m na hodnotu 2;

2. Vypoč_{ítej matici p}ř_{íslušnosti U podle vzorce (3.3).}

3. Aktualizuj matici center V podle vzorce (3.2) s využitím aktuální matice U.

4. Pokud AB_ B_A C D , ukonč_{i algoritmus. Jinak nastav k = k+1 a pokra}č_{uj od bodu 2.}

Kde cc je euclidovská vzdálenost vektorů_.

Míra věrohodnosti:

Jedním z nejobtížně_{jších úkol}ů_{ve shlukové analýze je nalezení vhodného po}č_{tu shluk}ů_{. Velikost}

“fuzzifikace” v ř_{ešení se dá zm}ěř_{it Dunnovým rozd}ě_{lovacím koeficientem, který p}ř_{edstavuje míru,}

jak tě_sně_{padne fuzzy}ř_{ešení na odpovídající pevné shluky. Za pevné shluky budeme považovat}

klasifikaci každého objektu do shluku, který má nejvě_{tší ú}č_{ast. Dunn}ů_{v rozd}ě_{lovací koeficent se dá}

vyjádř_{it vzorcem :} &" _{d F}1 L K

Koeficient leží v intervalu od 1/c do 1. Tento koeficient nabývá hodnoty 1/c pro maximálně_nejasný

(23)

4

Návrh algoritmu

Shlukovací algoritmy jsou široce využívány k segmentaci barevného obrazu v aplikacích jako je rozpoznání tvář_{e a otisku prst}ů_{, rozpoznání rakovinových bun}ě_{k od zdravých a pr}ů_myslová

automatizace. Pro obrazy ve vyšším rozlišením však rostou nároky na jejich výpoč_etní

výkon.Využijeme proto strategie, kdy vytvoř_{íme pyramidální reprezentaci obrazu, na kterou}

aplikujeme vybraný shlukovací algoritmus. Zač_{neme postupn}ě_{od dna pyramidy, kde se nachází}

obraz v nejnižším rozlišení. Ten rozsegmentujeme a výsledek stř_edů_{center shluk}ů_{uschováme a}

použijeme jako nová poč_áteč_{ní centra pro obraz s vyšším rozlišením na následujícím stupni}

pyramidy. Takto pokrač_{ujeme až k vrcholu pyramidy, kde se nachází p}ů_{vodní obraz s nejvyšším}

rozlišením. Př_{itom p}ř_{edpokládáme rychlejší konvergenci algoritmu, kdy s pr}ů_{chodem jednotlivými}

stupni pyramidy by mě_{l klesat po}č_{et iterací. Zrychlení se tak dosáhne výpo}č_{tem center na nižších}

stupních pyramidy, pro které procházíme méně_{obrazových bod}ů_.

Algoritmus tedy mů_{žeme popsat následovn}ě_.

1. Nastavíme poč_{et center shluk}ů_{K, kde 2} _K _{N = M}₁(b)_{x M}₂(b)_{, b odpovídá nejnižšímu}

stupni pyramidy.

2. Nastavíme iterač_{ní krok na k = 0.}

3. Nastav centra shluků_V(k)_.

4. Vypoč_{ítáme novou matici U}(k)_př_{íslušnosti ke shluk}ů_m.

5. Vypoč_{ítáme nová centra V}(k+1)

. 6. Pokud || Vi

(k+1)

– Vi (k)

|| ε_{pro všechna i, jdi na krok 7, jinak nastav k = k+1 a jdi na krok 3.}

7. Jestliže je b = 0, ukonč_{i algoritmus, jinak pokra}č_uj.

8. M1(b-1) x M2(b-1) je obraz na dalším stupni. Nastav iterační krok na k = 0.

9. Jestliže k = 0, použij centra V(k+1) z př_{edchozího stupn}ě_{, jinak použij centra V}(k)_.

10. Vypoč_{ítáme novou matici U}(k)_př_{íslušnosti ke shluk}ů_m.

11. Vypoč_{ítáme nová centra V}(k+1) _.

12. || Vi(k+1) – Vi(k) || ε pro všechna i, jdi na krok 7, jinak nastav k = k+1 a jdi na krok 8.

|| * || urč_{uje normu. Pro algoritmus fuzzy c-means je normou Euclidova vzdálenost vektor}ů_.

(24)

Celý návrh postupu si vyjádř_{íme v následujícím diagramu:}

NE ANO

Ukonč_i?

Obrázek 4.1. Postup př_{i hierarchické segmentaci obrazu}

Kroky algoritmu si tedy dají shrnout ně_{kolika body:}

1. Nač_{tení obrazu}

2. Urč_{ení po}č_{tu jeho barevných kanál}ů_.

3. V př_ípadě_započ_{ítání sou}ř_{adnic vytvo}ř_{ení nového obrazu.}

4. Použití Gassova filtru a vytvoř_{ení pyramidy}

5. Opě_{tovná aplikace shlukování}

6. Zobrazení výsledku segmentace.

Nač_{ti obraz} _Urč_{i po}č_{et barevných složek}

Aplikuj Gaussů_{v filtr}

Vytvoř_pyramidu _Vytvoř_{obraz float}

Aplikuj shlukování Výsledek segmentace Zobrazit

(25)

5

Implementace

Celý program byl implementován v jazyce C++, který nabízí jak možnost objektového, tak procedurálního programování. Stejně_{, jako v použité knihovn}ě_{OpenCv bylo pro výslednou aplikaci}

zvoleno programování procedurální. Jednotlivé typy segmentač_{ních algoritm}ů_{jsou tak roz}č_leně_{ny do}

celků_{, které obsahují všechny pot}ř_{ebné funkce pro b}ě_{h daného algoritmu. Tyto celky však netvo}ř_í

objekty ale statické tř_{ídy. Nabízejí tak pouze operace, ale nikoliv instance}č_{i vlastnosti, které jsou}

typické u objektového př_{ístupu. Celý projekt byl vyvíjen v prost}ř_{edí Microsoft Visual Studio 2008.}

5.1

OpenCv

Pro implementaci algoritmů_{jsem se rozhodl pro knihovnu OpenCV (Open Source Computer Vision}

Library), dostupnou zdarma na adrese http://sourceforge.net/projects/opencvlibrary). Tato knihovna obsahuje ř_{adu struktur a optimalizovaných algoritm}ů_{z oblasti zpracování obrazu a po}č_ítač_ového

vidě_ní.

V této práci jsem použil funkce z knihovny OpenCv pro nač_{ítání a ukládání obrazu. Ty}

podporují vě_{tšinu obrazových formát}ů_{. Mohl jsem tak pracovat na již p}ř_{ipravených datech a odpadla}

tak režije nutná pro implementaci tě_{chto algoritm}ů_{. K vytvo}ř_{ení obrazové pyramidy využívám již}

zabudovanou funkci pro rozmazání obrazu pomocí Gaussového filtru a jeho následné podvzorkování. Pro reprezentaci dat v pamě_{ti jsem použil p}ř_{ipravené struktury CvMat pro uchování matic a IplImage}

pro uchování nač_{teného obrazu.}

5.2

Vlastní implementace

Funkce pro segmentaci obrazu jsou dvojího druhu: klasické a hierarchické. Oba druhy oč_{ekávají jako vstup obrázek typu IplImage v 8.bitovém uchar formátu. Formát uchar byl zvolen pro}

zminimalizování paměť_{ových nárok}ů_{obou segmenta}č_{ních algoritm}ů_{. Navíc je implicitním formátem}

funkce pro nač_{tení obrazu, dostupné v knihovn}ě_{OpenCV. Pro reprezentaci obrazu s pozicemi pixel}ů

byl zvolen typ float. Př_{i rozlišení obrazu v}ě_{tším než 256 pixel}ů_{je totiž rozsah datových hodnot typu}

(26)

Segmentace probíhá následujícím způ_{sobem. Na za}č_{átku každého algoritmu získáme po}č_et

barevných kanalů_{. U algoritm}ů_{se zapo}č_{ítáním sou}ř_{adnic je tento po}č_{et navýšen o sou}ř_{adnice x a y.}

Pokud byl zvolen pyramidální algoritmus, zavoláme funkci createPyramid pro vytvoř_ení

pyramidy. V př_ípadě_{volby pyramidálního algoritmu se zapo}č_{tenými sou}ř_{adnicemi vytvo}ř_íme

zavoláním funkce createFloatXYimg , obraz o jedné barevné složce vynásobený poč_{tem sledovaných}

vlastností (poč_{et barevných složek + po}č_{et sou}ř_adnic).

Poté zavoláme funkci refreshUV(xy) pro výpoč_{et nových st}ř_edů_{a matice p}ř_{íslušnosti vektoru}

ke shluku (hodnota xy znač_{í funkce pro práci s obrazem se zapo}č_{tenými sou}ř_{adnicemi). Tato funkce}

využívá informace o poč_{tu barevných kanál}ů_{k segmentaci barevných složek vstupního obrazu v}

jednom prů_{chodu. Algoritmy by tak m}ě_{ly podporovat segmentaci barevných i}č_{ernobílých obraz}ů_{. Po}

ukonč_{ení algoritmu je vrácena matice p}ř_{íslušnosti. U algoritmu k-means p}ř_{edstavuje jeden bod matice}

vítě_{zný shluk. Naopak v algoritmu fuzzy c-means p}ř_{edstavuje bod matice vektor p}ř_{íslušností ke}

shluků_{m. Pokud dojde podle stanovených kritérií k ukon}č_{ení segmenta}č_{ního algoritmu, zavoláme}

(27)

6

Výsledky testování

Naimplementované algoritmy prošly ně_{kolika základními testy, ve kterých byla sledována}č_{asová a}

paměť_{ová náro}č_{nost a po}č_{et iterací nad jednotlivými stupni pyramidy.}

Zdrojem dat z dů_{vodu snadného porovnání s výsledky jiných segmenta}č_{ních algoritm}ů_je

barevná standardizač_{ní fotografie peppers.jpg o rozlišení 512 x 512 pixel}ů_{. Testovací po}č_ítač_má

následující konfiguraci:

1. Model: Notebook HP compaq nx9020 2. CPU: Celeron M 1400MHz.

3. RAM: 736MB , OS: Microsoft Windows XP Professional version 2002, SP2.

6.1

Testování algoritmu k-means

Č_{as [s]} _Poč_{et shluk}ů 2 3 4 5 6 7 8 9 k-means 0.200 1.474 1.843 1.733 2.904 7.631 7.771 7.230 Pyr. k-means _{0.190 0.270 0.480 2.103 0.751} _1.282 _0.771 _0.841 k-means XY 0.801 1.071 2.553 3.505 3.905 11.567 10.215 19.017 Pyr. k-means XY_{1.202 1.162 2.594 7.951 7.151 11.206 10.455 23.975}

Tabulka 6.1: maximum iteraci: 100. Prostor: RGB

Z výsledků_testů_{vidíme zkrácení doby nutné pro výpo}č_{et zejména u pyramidálního k-means,}

kdy se algoritmus chová podle oč_{ekávání. Došlo ke zkrácení doby trvání segmentace p}ř_{i zachování}

stejných vizuálních výsledků_{, jako u algoritmu bez použití pyramidy.}

V postupu se započ_{tením sou}ř_{adnic došlo ke zpomalení výpo}č_{tu. To je oproti klasickému}

k-means dáno př_{edevším nutností zpracovávat v}ě_{tší objem dat.Výsledné shluky jsou souvislejší bez}

př_{ítomnosti d}ě_{r v jednotlivých regionech. Segmenta}č_{ní hranice však p}ř_esně_{neodpovídají hranicím}

objektů_{ve vstupním obraze. U pyramidálního algoritmu se zapo}č_{tením sou}ř_{adnic nedopadly výsledky}

podle oč_{ekávání. Rychlost segmentace zde byla snížena díky aplikaci Gaussova filtru. Pozice pixel}ů_u

(28)

6.2

Testování algoritmu fuzzy c-means

Č_{as [s]} _Poč_{et shluk}ů

2 3 4 5 6 7 8 9

Fuzzyc - means 6.22 27.47 39.15 40.39 86.22 113.13 142.55 230.68

Pyr. fuzzy c - means 3.64 17.7 15.85 26.98 29.37 35.27 37.74 47.308

Fuzzy c - means XY 18.54 270.5 70.4 79.30 158.07 665.08 294.35 870.96

Pyr. fuzzy c - means XY 55.84 157.06 119.01 392.44 175.06 370.08 725.69 1019.5

Tabulka 6.2: maximum iteraci: 100. Prostor: RGB

Segmentace pomocí algoritmu fuzzy-c means se zachovala obdobně_{, jako tomu bylo u k-means.}

I zde pyramidální reprezentace snížila č_{asovou náro}č_{nost algoritmu se zachováním vizuálních}

výsledků_{. Doba celkové segmentace je oproti p}ř_{edchozímu algoritmu vyšší z d}ů_vodů_rozdílného

zpracování dat.

6.3

Testování v prostoru CILAB

Č_{asová náro}č_{nost v prostoru CILAB byla obdobná}č_{asové náro}č_{nosti v prostoru RGB. Algoritmy}

tedy projdou v prů_mě_{ru podobným po}č_{tem iterací. Segmentace v prostoru L*a*b však podává lepší}

výsledky, kdy regiony jsou celistvě_{jší s menším po}č_{tem d}ě_{r. Potvrdily se vlastnosti toho prostoru, kdy}

jednotlivé segmentač_{ní regiony jsou souvislejší (viz. obrázek 6.2).}

(29)

6.4

Porovnání algoritm

ů

V algoritmu fuzzy c-means jsme př_{i použití pyramidální struktury dosáhli podobného zrychlení jako}

tomu bylo u k-means. Výsledky na testovaných obrázcích jsou u obou algoritmů_{velmi podobné. U}

fuzzy c-means jsou ně_{kdy výsledky celistv}ě_{jší s menším po}č_{tem d}ě_{r. Záleží hlavn}ě_{na nastavení}

kritéria ukonč_{ení a na velikosti fuzzy koeficientu. Jako optimální hodnota fuzzy koeficientu se}

osvě_dč_{ila doporu}č_{ená hodnota 2. V obou testovaných algoritmech p}ř_{i použití pyramidy záleží}

rychlost výsledku na jejím stupni. S př_{iliš velkým stupn}ě_{m pyramidy ztrácíme n}ě_{které detaily v}

obraze a výsledné shluky na nižších stupních pyramidy pak nemusí být optimální. Nadmě_rným

rozmazáním obrazu na nižších stupních pyramidy mů_{že docházet k p}ř_{esegmentování obrazu. Takto}

př_{esegmentovaný obraz pak má vliv na celkový po}č_{et iterací mezi stupni pyramidy. Ve výsledku se}

tak celý proces segmentace zpomalí. Na celkový výsledek segmentace má taky vliv poč_áteč_ní

inicializace center shluků_{. Optimální po}č_{et center jsem se snažil zjistit pomocí Dunnova koeficientu.}

V mnoha př_{ípadech však tato hodnota neodpovídala reálným výstup}ů_{m segmentace, a proto nebyla k}

(30)

7

Záv

ě

r

Cílem této práce bylo prostudovat vybrané hierarchické metody segmentace obrazu. V souč_{asné dob}ě

je k dispozici jen málo materiálů_vč_{eském jazyce zabývajících se touto problematikou. Proto jsem se}

snažil vytvoř_{it ucelený p}ř_{ehled použití základních hierarchických segmenta}č_{ních princip}ů_spolu

s popisem, jakým způ_{sobem využívají hierarchických datových struktur k segmentaci obrazu.}

V implementač_ní č_{ásti jsem se zam}ěř_{il na použití obrazových pyramid spole}č_ně_se

shlukovacími algoritmy fuzzy c-means a k-means. Podle výsledků_testů_mů_žemeř_{íci, že za}č_leně_ní

pyramidy do tě_{chto algoritm}ů_{bylo úsp}ě_{šné a došlo k nár}ů_{stu výkonu segmentace. Oba algoritmy}

však stále potř_{ebují zadat optimální po}č_{et shluk}ů_{. Tento problém jsem se snažil vy}ř_{ešit pomocí}

Dunnova rozdě_{lovacího indexu. V pr}ů_bě_{hu testování jsem sledoval jeho hodnoty, které by však na}

výsledek segmentace nemě_{ly žádný vliv, a tak bylo od jeho za}č_leně_{ní do segmenta}č_{ního procesu a}

získání optimálního poč_{tu shluk}ů_upuště_{no. Výsledek segmentace jsem se dál snažil vylepšit použitím}

barevného prostoru CIELAB. Mů_žemeř_{íct, že oproti prostoru RGB podává zpravidla lepší výsledky.}

V naimplementovaných algoritmech urč_itě_ještě_{existuje prostor k optimalizaci. Proto bych u}

shlukovacích segmentač_{ních algoritm}ů_doporuč_{il se dále zabývat problémem ur}č_{ení optimálního}

poč_{tu shluk}ů_{a ukon}č_{ovacího kritéria. Jako další nám}ě_{t k pozorování doporu}č_{uji zkoumat vliv po}č_tu

stupňů_{v pyramidální struktu}ř_{e a jeho optimální ur}č_{ení. Dalším krokem by mohlo být vytvo}ř_ení

uživatelsky př_ívě_{tivého prost}ř_{edí, které by uživatelovi umožnilo intuitativn}ě_{ovládat jednotlivé}

(31)

8

Literatura

[1] Fiř_{t, J., Holota, L.: Digitalizace a zpracování obrazu}

Dokument dostupný na URL:

http://home.zcu.cz/~holota5/publ/DigZprO.pdf (kvě_{ten 2008)}

[2] Yu-Jin Zhang. Advances in Image and Video Segmentation, IGI 2006, s 3-4, 6. Dokument dostupný na URL:

http://books.google.cz/books?id=VMWrAh2Di2QC (kvě_{ten 2008)}

[3] Sonka, M., Hlavac, V., Boyle, R.: Image Processing, Analysis and Machine Vision, PWS, Boston, 1999. Dokument dostupný na URL:

http://cmp.felk.cvut.cz/~hlavac/Public/Pu/33PVRleto2003/ch05d.pdf (kvě_{ten 2008)}

[4] Žára, J., Beneš, B., Sochor, J.: Moderní poč_ítač_{ová grafika, Computer Press, Brno, 2004}

[5] Vyhlazování (filtrace) [online], Plzeň_{: Z}Č_{U v Plzni, fakulta aplikovaných v}ě_{d, katedra}

kybernetiky. Dokument dostupný na URL:

http://www.kky.zcu.cz/cs/courses/zdo/lesson3 (kvě_{ten 2008)}

[6] Popis barev a základy barvových prostorů_{[online],AZ reprodukce barev.}

Dokument dostupný na URL:

http://www.reprodukce-barev.org/?menu=3 (kvě_{ten 2008)}

[7] Kebel, J., Šilhán, D., Shluková analýza. Dokument dostupný na URL:

http://gerstner.felk.cvut.cz/biolab/X33BMI/slides/KMeans.pdf (kvě_{ten 2008)}

[8] Bryan S.Morse: Data Structures for Image Analysis, Brigham Young University, 1998 – 2000

(32)

[11] Tinka Acharya, Ajoy K. Ray.:Image processing principles and applications, Wiley- Interscience, New Jersey 2005.

(33)

P

ř

íloha:

V koř_{enovém adresá}ř_{i se nachází text práce ve formátu pdf. V adresá}ř_{i source se nachází zdrojové}

kódy programu. V adresář_{i input je používaný testovací obrázek. V adresá}ř_{i output jsou výsledky}

(34)