• No results found

Ancient Maps Digitizing

N/A
N/A
Protected

Academic year: 2021

Share "Ancient Maps Digitizing"

Copied!
69
0
0

Loading.... (view fulltext now)

Full text

(1)

VYSOK ´

E U ˇ

CEN´I TECHNICK ´

E V BRN ˇ

E

BRNO UNIVERSITY OF TECHNOLOGY

FAKULTA INFORMA ˇ

CN´ICH TECHNOLOGI´I

´

USTAV PO ˇ

C´ITA ˇ

COV ´

E GRAFIKY A MULTIM ´

EDI´I

FACULTY OF INFORMATION TECHNOLOGY

DEPARTMENT OF COMPUTER GRAPHICS AND MULTIMEDIA

DIGITALIZACE HISTORICK ´

YCH MAP

DIPLOMOV ´

A PR ´

ACE

MASTER’S THESIS

AUTOR PR ´

ACE

Bc. JOSEF POSP´I ˇ

SIL

AUTHOR

(2)

VYSOK ´

E U ˇ

CEN´I TECHNICK ´

E V BRN ˇ

E

BRNO UNIVERSITY OF TECHNOLOGY

FAKULTA INFORMA ˇ

CN´ICH TECHNOLOGI´I

´

USTAV PO ˇ

C´ITA ˇ

COV ´

E GRAFIKY A MULTIM ´

EDI´I

FACULTY OF INFORMATION TECHNOLOGY

DEPARTMENT OF COMPUTER GRAPHICS AND MULTIMEDIA

DIGITALIZACE HISTORICK ´

YCH MAP

ANCIENT MAPS DIGITIZING

DIPLOMOV ´

A PR ´

ACE

MASTER’S THESIS

AUTOR PR ´

ACE

Bc. JOSEF POSP´I ˇ

SIL

AUTHOR

VEDOUC´I PR ´

ACE

Ing. MICHAL ˇ

SPAN ˇ

EL

SUPERVISOR

(3)

Abstrakt

Tato pr´ace se zab´yv´a zpracov´an´ım historick´ych map, konkr´etnˇe jejich digitalizac´ı a vekto-rizac´ı. Zamˇeˇruje se na mapy z druh´eho vojensk´eho mapov´an´ı a pokouˇs´ı se naj´ıt metody, kter´e by mohli b´yt uˇziteˇcn´e pro odstranˇen´ı textu z tˇechto map.

Kl´ıˇ

cov´

a slova

historick´e mapy, druh´e vojensk´e mapov´an´ı, digitalizace, AdaBoost

Abstract

This work is about processing of historical maps, especially their digitizing and vecto-rization. The main focuses of this project are maps from the second historical military mapping and finding methods useful for removing texts from these maps.

Keywords

historical maps, the second historical military mapping, digitize, AdaBoost

Citace

Josef Posp´ıˇsil: Digitalizace historick´ych map, diplomov´a pr´ace, Brno, FIT VUT v Brnˇe, 2008

(4)

Digitalizace historick´

ych map

Prohl´

sen´ı

Prohlaˇsuji, ˇze jsem tuto diplomovou pr´aci vypracoval samostatnˇe pod veden´ım Ing. Mi-chala ˇSpanˇela. Uvedl jsem vˇsechny liter´arn´ı prameny a publikace, ze kter´ych jsem ˇcerpal, v seznamu literatury.

. . . . Josef Posp´ıˇsil 18. kvˇetna 2008

Podˇ

ekov´

an´ı

R´ad bych podˇekoval Ing. Michalovi ˇSpanˇelovi za ˇcas, kter´y mi vˇenoval. D´ale bych r´ad podˇekoval veden´ı t´eto fakulty za pruˇznost a ochotu reagovat na n´amˇety student˚u. Za pomoc tak´e dˇekuji Doc. Dr. Ing. Pavlovi Zemˇc´ıkovi, nebot’ z jeho pˇredmˇet˚u o zpracov´an´ı obrazu vych´az´ı tato pr´ace a v neposledn´ı ˇradˇe Ing. Petrovi Pˇridalovi za pomoc pˇri n´avrhu t´eto pr´ace.

c

Josef Posp´ıˇsil, 2008.

Tato pr´ace vznikla jako ˇskoln´ı d´ılo na Vysok´em uˇcen´ı technick´em v Brnˇe, Fakultˇe in-formaˇcn´ıch technologi´ı. Pr´ace je chr´anˇena autorsk´ym z´akonem a jej´ı uˇzit´ı bez udˇelen´ı opr´avnˇen´ı autorem je nez´akonn´e, s v´yjimkou z´akonem definovan´ych pˇr´ıpad˚u.

(5)

Obsah

1 Uvod´ 7

2 Druh´e vojensk´e mapov´an´ı 9

3 Digitalizace a vektorizace map 11

3.1 Sn´ım´an´ı map . . . 11

3.1.1 Ruˇcn´ı digitalizace . . . 11

3.1.2 Skenov´an´ı . . . 13

3.1.3 Shrnut´ı . . . 14

3.2 Georeferencov´an´ı . . . 14

4 Zpracov´an´ı obrazu 16 4.1 Obecn´y postup pˇri zpracov´an´ı obrazu . . . 16

4.1.1 Sn´ım´an´ı . . . 16

4.1.2 Digitalizace . . . 16

4.1.3 Pˇredzpracov´an´ı obrazu . . . 17

4.1.4 Segmentace . . . 17

4.1.5 Popis obrazu . . . 18

4.1.6 Klasifikace. . . 18

4.2 Form´aty pro uloˇzen´ı map . . . 18

4.2.1 Bezztr´atov´e form´aty . . . 18

4.2.2 Ztr´atov´e form´aty . . . 19

4.3 Upravy obrazu´ . . . 20 4.3.1 Prahov´an´ı. . . 20 4.3.2 Dilatace a eroze. . . 20 4.3.3 Metody ”zamalov´an´ı“ . . . 23 4.4 Detekce v obraze . . . 24

4.4.1 Metody zaloˇzen´e na hled´an´ı podle barvy . . . 24

4.4.2 Metody na detekci hran . . . 24

4.4.3 Detektory objekt˚u . . . 25

5 N´avrh 36 5.1 N´avrh pouˇzit´ı metod na nalezen´ı n´apis˚u na mapˇe . . . 36

5.1.1 Vyuˇzit´ı metody zaloˇzen´e na hled´an´ı podle barvy n´apisu . . . 37

5.1.2 N´avrh pouˇzit´ı metod na detekci hran. . . 37

5.1.3 N´avrh na pouˇzit´ı detektoru objekt˚u . . . 41

5.2 N´avrh metod pouˇziteln´ych pro odstranˇen´ı vyhledan´ych n´apis˚u . . . 45

(6)

6 Implementace 48

6.1 N´astroje pouˇzit´e pˇri implementaci . . . 48

6.1.1 Knihovna OpenCV . . . 48

6.1.2 Implementaˇcn´ı prostˇred´ı . . . 49

6.2 Hled´an´ı n´apis˚u . . . 49

6.2.1 Vytvoˇren´ı detektoru . . . 49

6.2.2 Detekce . . . 51

6.3 Odstranˇen´ı n´apis˚u . . . 53

6.3.1 Prahov´an´ı. . . 54

6.3.2 Optimalizace v´ysledk˚u . . . 54

6.4 Zaplnˇen´ı m´ısta po n´apisech . . . 54

7 Meziv´ysledky, testy, moˇznosti rozˇs´ıˇren´ı 55 7.1 Postupn´e v´ysledky . . . 55

7.1.1 Detekce textu . . . 55

7.1.2 Odstranˇen´ı textu z detekovan´ych oblast´ı . . . 59

7.1.3 Zaplnˇen´ı m´ısta po n´apisu . . . 61

7.2 Testy. . . 61

7.2.1 Test mnoˇzstv´ı zpracovan´ych n´apis˚u . . . 61

7.2.2 Test jin´eho typu p´ısma, na svˇetl´em pozad´ı. . . 61

7.2.3 Z´avˇer testov´an´ı - zhodnocen´ı v´ysledk˚u . . . 62

7.3 Moˇznosti rozˇs´ıˇren´ı . . . 64

8 Z´avˇer 66

Literatura 68

(7)

Kapitola 1

´

Uvod

´

Ukolem vˇedy a vˇedˇen´ı nen´ı jen usnadˇnovat lidem ˇzivot, ale tak´e rozˇsiˇrovat jejich z´ajem o okoln´ı svˇet. S rostouc´ım mnoˇzstv´ım informac´ı o tomto svˇetˇe a s rostouc´ı hloubkou, do jak´e ve vˇedˇe pronik´ame, jiˇz nen´ı moˇzn´e uchov´avat informace pouze ´ustnˇe. Je potˇreba nach´azet st´ale nov´a m´edia, kde lze vˇedˇen´ı zaznamen´avat a uchov´avat. Jiˇz od poˇc´atku byla v lidech touha nˇeco po sobˇe zanechat, nˇeco zaznamenat, nˇeco pˇredat dalˇs´ım generac´ım, aby se pouˇcili a ve v´yzkumu zaˇcali tam, kde minul´a generace skonˇcila.

Prvotn´ı formu pˇred´av´an´ı informac´ı by se dalo spatˇrit v obr´azc´ıch na zdech jeskyn´ı,(k rozvoji ˇreˇci a komunikace mezi lidmi uˇz zab´ıhat nebudu) pˇres vˇsechny napodobeniny a sochy z r˚uzn´ych materi´al˚u aˇz k rozvoji p´ısma a matematiky. P´ısmo pak mˇelo za n´asledek rozvoj p´ısemn´eho uchov´av´an´ı informac´ı. O p´ısmu by se vlastnˇe dalo ˇr´ıci, ˇze jde o prvn´ı z´aznam s digit´aln´ımi parametry. Oproti obraz˚um bylo moˇzn´e knihy reprodukovat (opisovat) bez ztr´aty obsahu a tedy kvality, naopak pˇri replikaci obrazu mohlo a st´ale doch´azelo ke zmˇen´am. D´a se to naznaˇcit na pˇr´ıkladˇe. Pˇredstavme si, ˇze nezn´am´y mal´ıˇr vytvoˇr´ı mapu starovˇek´eho ˇR´ıma. Vojev˚udce Maximus by r´ad ˇR´ım dobyl a proto si nech´a tajnˇe mapu pˇremalovat, pˇri tom vznikne v replikaci nˇekolik, moˇzn´a bezv´yznamn´ych chyb. Jeˇstˇe dˇr´ıvˇe, neˇz stihne Maximus ˇR´ım dob´yt, nechaj´ı se z jeho repliky mapy vytvoˇrit dalˇs´ı kopie pro jeho velitele a na jejich map´ach uˇz budou jednak chyby vznikl´e pˇri prvn´ı replikaci plus chyby vznikl´e pˇri dalˇs´ıch replikac´ıch. Z map tak´e st´aˇr´ım zmiz´ı spousta detail˚u a koneˇcnˇe t´ım dojde k neopraviteln´e degeneraci informac´ı na tˇechto map´ach. Neopraviteln´e jsou i proto, ˇze ˇR´ım pˇred nˇekolika lety, kdy se tato mapa vytv´aˇrela, vypadal jinak. ˇCasem vˇzdy pˇrestanou u historick´ych materi´al˚u existovat zdroje tˇechto materi´al˚u.

Pˇribliˇz´ım se v´ıce t´ematu historick´ych map. Nab´ız´ı se ot´azka jak uchov´avat star´e mapy. Prakticky na kaˇzd´em m´ediu, at’ uˇz jde o pap´ır, pl´atno, zed’ jeskynˇe ˇci cokoli jin´eho, doch´az´ı ˇ

casem k degradaci. Zat´ım nebylo nalezeno m´edium s

”nekoneˇcnou“ trvanlivost´ı. Existuje moˇznost data bez ztr´aty replikovat a uchovat na m´ediu, kter´e nem´a nekoneˇcnou trvanlivost, ale s moˇznost´ı data beze ztr´aty replikovat tak aby i replika repliky byla shodn´a se vzorem. Pot´e by bylo moˇzn´e data uchov´avat tak, ˇze by se vˇzdy pˇrekop´ırovala na novˇejˇs´ı m´edium.

Proˇc ale uchov´avat star´e mapy, kdyˇz novˇejˇs´ı jsou pˇresnˇejˇs´ı a o to pˇrece u map jde? D˚uvod˚u je nˇekolik, jedn´ım z nich je i to, ˇze historick´a mapa je vˇetˇsinou malovan´a a stejnˇe tak jako obrazy a jin´a d´ıla z minulosti, m´a historickou a umˇeleckou hodnotu. Dalˇs´ım d˚uvodem proˇc spravovat historick´e mapy je moˇznost ˇcerpat z nich informace. Napˇr´ıklad srovn´an´ı rozlohy les˚u, pol´ı vod a dalˇs´ıch pˇred 500 lety b´yv´a zaj´ımav´ym ´udajem o tendenci vzestupu nebo sestupu tˇechto rozloh. Star´e mapy obsahuj´ı cesty, kter´e mohly vej´ıt v zapomnˇen´ı a pˇritom pr´avˇe tyto cesty mohou pomoci napl´anovat kudy v´est novou silnici nebo turistickou trasu. Pr´avˇe mnoho cest je zaloˇzeno na historick´ych podkladech. Vˇsechny tyto informace

(8)

je zaj´ımav´e z map z´ıskavat, coˇz lze nejl´epe po digit´aln´ım zpracov´an´ım.

C´ılem diplomov´e pr´ace je hled´an´ı zp˚usob˚u jak zpracov´avat digit´aln´ı mapy z druh´eho vojensk´eho mapov´an´ı. Zamˇeˇruji se na nalezen´ı metod k identifikaci a odstranˇen´ı n´apis˚u na map´ach. Je to krok, kter´y se dˇel´a skoro pˇri kaˇzd´e digitalizaci historick´ych map. Samotn´e n´apisy totiˇz na mapˇe zab´ıraj´ı hodnˇe m´ısta a pˇri rozkonponov´an´ı na urˇcit´e oblasti (lesy, louky, z´astavba) by negativnˇe ovlivˇnovaly v´ysledky. Takt´eˇz n´apisy br´an´ı pˇri hled´an´ı cest na historick´ych map´ach. C´ılem moj´ı diplomov´e pr´ace tedy je text rozliˇsit od ostatn´ıch prvk˚u mapy, zvl´aˇstˇe pak od cest, kter´e se ˇcasto mohou s textem spl´est. Po proveden´ı nalezen´ı a od-stranˇen´ı textu se budu snaˇzit vhodn´ymi metodami nahradit vznikl´a m´ısta po odstranˇen´ych n´apisech.

Dalˇs´ım c´ılem t´eto pr´ace je l´epe se sezn´amit s knihovnou OpenCV pro zpracov´an´ı obrazu, se zp˚usoby digitalizace historick´ych map a s metodami na hled´an´ı vzor˚u v obraze.

V´ysledkem by mˇela b´yt pˇrenositeln´a knihovna funkc´ı pro detekci a odstranˇen´ı n´apis˚u z map z druh´eho vojensk´eho mapov´an´ı a s funkcemi, kter´e by mˇeli odhadnout p˚uvodn´ı povrch mapy, pˇred t´ım, neˇz na ni byl natisknut n´apis.

Text je rozdˇelen do nˇekolika ˇc´ast´ı, prvn´ı se zab´yv´a historick´ymi mapami, kter´ym se tato pr´ace vˇenuje, pot´e se zamˇeˇruji na z´akladn´ı seznamen´ı se zp˚usoby jak´ym se mapy digitalizuj´ı a vektorizuj´ı. Postupnˇe se pr´ace dostane pˇres teorii zpracov´an´ı obrazu k n´avrhu moˇznost´ı, jak odstranit text ze star´ych map. V n´avrhu je pops´ana vˇetˇsina n´apad˚u, kter´a doprov´azela tento projekt. Nakonec se tato pr´ace bude vˇenovat metod´am, kter´e byly aplikov´any a posl´eze tak´e zhodnocen´ım cel´e pr´ace a diskuzi nad moˇzn´ym rozˇs´ıˇren´ım.

Tato diplomov´a pr´ace vych´az´ı ze semestr´aln´ıho projektu, kter´y rozˇsiˇruje o celou teorii detektor˚u a nˇekter´ych ´uprav obrazu, o cel´y n´avrh vˇsech pouˇzit´ych metod, kromˇe detekce hran. D´ale pˇribyla implementace a zhodnocen´ı v´ysledk˚u.

(9)

Kapitola 2

Druh´

e vojensk´

e mapov´

an´ı

Kapitola n´as seznamuje se z´akladn´ımi informacemi o druh´em vojensk´em mapov´an´ı. Mapy z nˇej jsou v´ychoz´ımi body pro tuto pr´aci. Pr´avˇe na nich se budu pokouˇset odstranit n´apisy a pˇrekr´yt je odhadnut´ym povrchem, kter´y zast´ıraj´ı.

Obr´azek 2.1: Uk´azka mapy z druh´eho vojensk´eho mapov´an´ı z let 1842–1852

Historick´a mapa 2.1 zobrazuje ˇc´ast dneˇsn´ıho ´uzem´ı ˇCesk´e republiky (okol´ı Havl´ıˇckova Brodu) pˇred v´ıce jak 150-ti lety. Druh´e vojensk´e mapov´an´ı t´eˇz naz´yvan´e Frantiˇskovo podle c´ısaˇre Frantiˇska II., na jehoˇz popud bylo provedeno, probˇehlo v letech 1806 aˇz 1866 na ´

uzem´ı Rakouska-Uherska.

Jeho vzniku pˇredch´azela vojensk´a triangulace, kter´a slouˇzila jako geodetick´y z´aklad tohoto d´ıla, oproti I. vojensk´emu mapov´an´ı m˚uˇzeme tedy sledovat zv´yˇsenou m´ıru pˇresnosti. Podkladem byly mapy Stabiln´ıho katastru v mˇeˇr´ıtku 1 : 2 880, coˇz mˇelo tak´e pozitivn´ı vliv na pˇresnost map. Z v´ysledk˚u tohoto mapov´an´ı byly odvozeny mapy gener´aln´ı (1: 28 800) a speci´aln´ı (1: 144 000).

(10)

Mapov´an´ı ˇCech probˇehlo v letech 1842–1852. Morava a Slezsko byly mapov´any v letech 1836–1840.

Mˇeˇr´ıtko mapov´an´ı bylo 1:28 800.

Obsahem map jsou cesty, zdˇen´e budovy a kamenn´e mosty. Z pˇr´ırodn´ıch prvk˚un to jsou pole, louky, pastviny, lesy, rybn´ıky a toky. Pro zn´azornˇen´ı ter´enu byly vyuˇzity Lehmannovy ˇsrafy, kter´e zn´azorˇnovaly smˇer nejvˇetˇs´ıho sp´adu ter´enu a jeho velikost. Pomoc´ı grafick´eho prot´ın´an´ı byla zjiˇst’ov´ana poloha vrcholov´ych tvar˚u a pr˚ubˇeh ˇcar ter´enn´ı kostry. Mˇeˇren´ım nebo odhadov´an´ım ´uhl˚u sklonu byly z´ısk´av´any potˇrebn´e ´udaje k p˚udorysn´emu vyj´adˇren´ı ter´enn´ıch ˇsraf. Z [3].

Lehmannovo ˇsrafov´an´ı vytv´aˇr´ı obraz reli´efu vypov´ıdaj´ıc´ı o smˇeru jeho nejvˇetˇs´ıho sp´adu i o jeho velikosti. Se vzr˚ustem sklonu se ˇsrafy zkracovaly. Kreslily se ve smˇeru sp´adnic a jejich s´ıla rostla v tomto odstupˇnov´an´ı: pˇri nulov´em sklonu byl pomˇer st´ınu (ˇsrafy) ke svˇetlu (b´ıl´e mezeˇre) 0:9, pˇri pˇetistupˇnov´em 1:8 a pˇri sklonu svahu 45◦ 9:0. Vodorovn´e a m´ırnˇe sklonˇen´e plochy z˚ustaly v mapˇe b´ıl´e, naopak strm´e svahy byly zobrazeny siln´ymi a kr´atk´ymi ˇsrafami s ´uzk´ymi b´ıl´ymi mezerami. Z [12].

Obsah mapy je v podstatˇe totoˇzn´y s I. vojensk´ym mapov´an´ım, pˇrid´any byly pouze v´yˇsky trigonometrick´ych bod˚u, avˇsak zobrazovan´a situace se velmi liˇs´ı. Mapy II. vojensk´eho ma-pov´an´ı vznikaly v dobˇe n´astupu pr˚umyslov´e revoluce a rozvoje intenzivn´ıch forem zemˇedˇelstv´ı, kdy vzrostla v´ymˇera orn´e p˚udy za 100 let o 50% a lesn´ı plochy dos´ahly u n´as historicky nejmenˇs´ıho rozsahu. Pˇrevzato z [9] a z [7].

Jednotliv´e ˇc´asti cel´e mapy maj´ı jemn´e odliˇsnosti jasu v obraze, ale drˇz´ı jednotn´y styl, proto by aplikace mˇela m´ıt urˇcit´y interval automatick´eho nastaven´ı, aby byla schopna zpra-cov´avat vˇsechny mapy z tohoto mapovan´ı.

(11)

Kapitola 3

Digitalizace a vektorizace map

Kapitola o digitalizaci okrajovˇe popisuje proces pˇrev´adˇen´ı existuj´ıc´ıch map do digit´aln´ı podoby. Jelikoˇz se v diplomov´e pr´aci zab´yv´am sp´ıˇse aˇz samotn´ymi ´upravami digitaln´ıch map, nen´ı potˇreba do t´eto ˇc´asti hloubˇeji pronikat. Nˇekter´e z informac´ı jsem z´ıskal z [8].

Zde lze nal´ezt odpovˇed na ot´azky proˇc digitalizaci map prov´adˇet, jak ji prov´adˇet a jak v´ysledn´a digit´aln´ı data ukl´adat.

3.1

Sn´ım´

an´ı map

Tato kapitola se vˇenuje pˇrenosu map do digit´aln´ı podoby, jejich vektorizac´ı a nˇekolika z´akladn´ımi ´upravami, aby mapy odpov´ıdali skuteˇcnosti a zachov´avaly pomˇery vzd´alenost´ı mezi jednotliv´ymi objekty.

Na zaˇc´atek bych poloˇzil ot´azku proˇc v˚ubec mapy digitalizovat? Je pravdou ˇze pˇri kaˇzd´e digitalizaci z mapov´ych podklad˚u jako je pap´ır, pl´atno nebo nˇeco podobn´eho, doch´az´ı ke ztr´atˇe dat. Je to souˇc´ast´ı pˇrevodu ze spojit´eho sign´alu, za kter´y lze obraz povaˇzovat, do diskr´etn´ıch hodnot, jenˇz potˇrebujeme pro uloˇzen´ı v poˇc´ıtaˇci. Toto je ovˇsem posledn´ı ztr´ata, kter´a historick´y materi´al potk´a. Pot´e lze tyto data libovolnˇe kop´ırovat bez n´arustu chyb. Takt´eˇz je lze mnohem l´epe distribuovat ˇsirˇs´ı veˇrejnosti. Paradoxnˇe se pak moˇzn´a origin´al zachov´a v lepˇs´ım stavu, jelikoˇz b´ad´an´ı historik˚u bude prob´ıhat vˇetˇsinou na digit´aln´ı kopii tohoto dokumentu.

Existuje v´ıce metod pˇrenosu dat do poˇc´ıtaˇce, nyn´ı sezn´am´ıme se s tˇemi z´akladn´ımi.

3.1.1 Ruˇcn´ı digitalizace

Z´akladn´ı metoda digitalizace klasick´ych map na pap´ıˇre prob´ıh´a tak, ˇze se star´a mapa poloˇz´ı na digitalizaˇcn´ı zaˇr´ızen´ı a ruˇcnˇe se oznaˇcuj´ı vˇsechny v´yznamn´e body na mapˇe. Digitalizaˇcn´ı zaˇr´ızen´ı v tomto pˇr´ıpadˇe funguje podobnˇe jako touchpad. Pˇri digitalizaci se pouze dotekem pˇres pap´ır mapy zad´avaj´ı v´yznamn´e body v mapˇe. Existuje nˇekolik z´akladn´ıch typ˚u bod˚u jenˇz se zad´avaj´ı. Bod m˚uˇze b´yt jenom bod nebo je souˇc´ast´ı vetˇs´ıch objekt˚u tˇreba lomen´e ˇ

c´ary nebo polygonu. Tyto objekty jsou pot´e definov´any sadou bod˚u jenˇz se ruˇcnˇe zadaj´ı a pot´e se spoj´ı vektory. Pochopitelnˇe ˇc´ım v´ıce bod˚u se zad´a, t´ım v´ıce se v´ysledek podob´a origin´alu a lze dos´ahnout m´enˇe hranatˇejˇs´ıch tvar˚u. (viz. obr´azek3.1).

Vˇetˇsinou lze body zad´avat s velkou pˇresnost´ı, coˇz samozˇrejmˇe z´avis´ı take na obsluze tohoto zaˇr´ızen´ı, kter´a body zad´av´a. Pˇresto je obvykle nutn´e po zad´an´ı vˇsech bod˚u mapy opˇet vˇsechny body proj´ıt a odstranit nˇekolik chyb v jejich zad´an´ı. Existuj´ı dva z´akladn´ı typy chyb - tzv. undershoots a overshoots coˇz by se dalo pˇreloˇzit jako nedostˇrelen´ı a pˇrestˇrelen´ı.

(12)

Obr´azek 3.1: Typy jednotliv´ych bod˚u pˇri digitalizaci

Tyto chyby jsou vˇetˇsinou d´any t´ım, ˇze cesty na mapˇe jsou obvykle zaznaˇceny vˇetˇs´ı ˇs´ıˇrkou ˇ

c´ary neˇz v mapˇe ve vektorov´e podobˇe, takˇze pˇri z´ad´av´an´ı leˇz´ı nˇekter´e body na okraji cesty a jin´e na stˇredu cesty. L´epe to popisuje obr´azek 3.2.

Obr´azek 3.2: Obvykl´e chyby pˇri ruˇcn´ı digitalizaci

V´ysledek tohoto zp˚usobu digitalizace je tak´e z´avisl´y na pˇresnosti star´e mapy. Vˇetˇsinou je nutn´e tyto mapy pot´e tzv. georeferencovat tedy upravit je tak aby spr´avnˇe vystihovaly pomˇery vzd´alenost´ı mezi jednotliv´ymi body. K t´eto problematice se vr´at´ım pozdˇeji.

V´yhody t´eto metody:

• Moˇznost okamˇzitˇe opravovat chyby a poˇskozen´e ˇc´asti star´e mapy

• ˇClovˇek jenˇz zaˇr´ızen´ı obsluhuje vˇetˇsinou velmi spolehlivˇe rozpozn´av´a objekty mapy. • Vˇeci, kter´e na star´ych map´ach chyb´ı, lze okamˇzitˇe doplnit napˇr. z r˚uzn´ych jin´ych

zdroj˚u. Zde z´aleˇz´ı na zkuˇsenosti obsluhy.

• Na konci t´eto metody vznikne vektorizovan´a mapa. Nev´yhody t´eto metody:

• Tento zp˚usob digitalizace je pracn´y a velmi ˇcasovˇe n´aroˇcn´y, coˇz je pˇr´ıˇcinou jeho vysok´e ceny.

(13)

• V´ysledek ˇcasto velmi z´aleˇz´ı na zkuˇsenosti obsluhy.

• I od stejn´eho ˇclovˇeka, kter´y zaˇr´ızen´ı obsluhuje, mohou vyj´ıt r˚uzn´e v´ysledeky ovlivnˇen´e jeho moment´aln´ım stavem (´unava, stres, ospalost).

3.1.2 Skenov´an´ı

Druhou moˇznost´ı jak digitalizovat star´e mapy je jejich skenov´an´ı. Zaˇr´ızen´ı pro tuto ˇcinnost je nˇekolik. Od tˇech nejjednoduˇs´ıch skener˚u pˇres fotoapar´aty ke sloˇzitˇejˇs´ım zaˇr´ızen´ım. Vˇzdy vˇsak z´avis´ı na stavu dan´eho skenovan´eho dokumentu, podle nˇeho se kupˇr´ıkladu m˚uˇzeme rozhodnout pro focen´ı, jelikoˇz je k nˇemu nejˇsetrnˇejˇs´ı.

Obrazy (mapy) kter´e se maj´ı skenovat by mˇeli b´yt v co nejlepˇs´ım stavu s minim´aln´ım poˇctem n´apis˚u. Skener pak pouze rozliˇsuje intenzitu a barvu jednotliv´ych pixel˚u a ukl´ad´a jejich hodnoty do rastru, coˇz je tabulka o velikosti obrazu, kde se jedna buˇnka naz´yva pixel.

Tento rastr zat´ım neumoˇzˇnuje ˇsikovnˇe mapu vyuˇz´ıvat, jde totiˇz o pouh´y obr´azek v poˇc´ıtaˇci. Abychom mohli z map l´epe z´ısk´avat informace, je lepˇs´ı pˇrev´est tuto rastrovou podobu mapy do podoby vektorov´e, kde vˇsechny objekty mapy jsou pops´any matematicky pˇres oriento-van´e ´useˇcky a dalˇs´ı analytick´a primitiva. Vektorizace se prov´ad´ı dvˇema metodami - au-tomatick´a vektorizace a manu´aln´ı vektorizace. V z´avislosti na pouˇzit´e metodˇe vektorizace se vybere odpov´ıdaj´ıc´ı rozliˇsen´ı pˇri skenov´an´ı. Mnoho program˚u pro vektorizaci potˇrebuje aby veˇsker´e ˇc´ary na mapˇe byli minim´alnˇe 3 pixely ˇsirok´e aby se daly pˇrev´est na vektory. V d˚usledku to pak znamen´a, ˇze by se mˇeli mapy skenovat alespoˇn s rozliˇsen´ım 200 dpi – 300 dpi. Toto rozliˇsen´ı se t´yk´a automatick´e vektorizace, pˇri pouˇzit´ı manu´aln´ı vektorizaci postaˇc´ı rozliˇsen´ı od 75 dpi do 150 dpi

Automatick´a vektorizace

Tuto metodu je vhodn´e pouˇz´ıt pokud skenujeme velk´e mnoˇzstv´ı map v dobr´em stavu. Tak´e je dobr´e aby se na cel´e skenovan´e mapˇe pouˇz´ıvala shodn´a oznaˇcen´ı pro stejn´e objekty, aby kaˇzd´y typ cesty v mapˇe byl oznaˇcen ˇc´arou urˇcit´e ˇs´ıˇrky a tato ˇs´ıˇrka se drˇzela v cel´e mapˇe. D´ale je uˇziteˇcn´e m´ıt vˇsechny pr˚useˇc´ıky cest a jin´ych hraniˇcn´ıch oblast´ı vyznaˇceny velmi zˇretelnˇe a pro poˇc´ıtaˇc rozpoznatelnˇe. Cestou jsem v tomto popisu myslel i napˇr´ıklad hranici mezi lesem, loukou apod. Pˇri tomto automatick´em zpracov´an´ı je takt´eˇz potˇreba, aby mapy obsahovaly minimum popisk˚u a jin´ych podobn´ych objekt˚u. V pˇr´ıpadˇe, ˇze budou vˇsechny objekty na mapˇe od sebe rozeznateln´e, oddˇeliteln´e a aplikce pro vektorizaci spr´avnˇe rozpozn´a vˇsechny typy cest, m´ısta odkud a kam vedou a kde se prot´ınaj´ı, bude nutn´y pouze mal´y poˇcet oprav po vektorizaci. Naopak pˇri nekvalitn´ım vstupu bude potˇreba hodnˇe mapu doopravovat. V´yhody t´eto metody:

• M˚uˇze b´yt velmi rychl´a.

• V porovn´an´ı s ruˇcn´ı vektorizac´ı je levn´a. • Jej´ı v´ysledky jsou velmi pˇresn´e a spr´avn´e. Nev´yhody t´eto metody:

• ˇSpatnˇe rozezn´av´a text a m´alo obvykl´e znaˇcky v mapˇe.

• Vyˇzaduje dobrou vstupn´ı mapu, kter´a spr´avnˇe a konzistentnˇe popisuje objekty v kra-jinˇe.

(14)

• Pˇri ˇspatn´em v´ysledku je potˇreba hodnˇe oprav, kter´e jsou ˇcasovˇe a tedy i finanˇcnˇe n´aroˇcn´e.

Manu´aln´ı vektorizace

Tato metoda se pouˇz´ıv´a ve dvou z´akladn´ıch pˇr´ıpadech. V prvn´ım pˇr´ıpadˇe nelze vstupn´ı mapu vektorizovat automaticky a to kv˚uli kvalitˇe nevhodn´e pro automatickou digitalizaci. Ve druh´em pˇr´ıpadˇe, pokud nem´ame zaˇr´ızen´ı pro ruˇcn´ı digitalizaci, tak tuto digitalizaci, jejiˇz v´ystupem je vektorov´y obraz, prov´ad´ıme na poˇc´ıtaˇci. Jde vlastnˇe o tu samou metodu ruˇcn´ı digitalizace, ovˇsem nyn´ı je vytv´aˇrena na poˇc´ıtaˇci. I zde doch´az´ı ke stejn´ym chyb´am, jak bylo pops´ano v podkapitole o ruˇcn´ı digitalizaci.

V´yhodou t´eto metody je to, ˇze s n´ı m˚uˇze z´aroveˇn pracovat v´ıce lid´ı. Kaˇzd´y z nich zpracov´av´a na poˇc´ıtaˇci urˇcitou ˇc´ast mapy. Takt´eˇz je tato vektorizace snaˇzˇs´ı neˇz ruˇcn´ı di-gitalizace, protoˇze pr´ace za poˇc´ıtaˇcem je m´enˇe nam´ahavˇejˇs´ı neˇz pr´ace u digitalizaˇcn´ıho zaˇr´ızen´ı pro ruˇcn´ı digitalizaci.

Nev´yhodou t´eto metody je opˇet jako u ostatn´ıch manu´aln´ıch metod ˇcasov´a n´aroˇcnost a pracnost.

3.1.3 Shrnut´ı

Jelikoˇz nem´am k dispozici zaˇr´ızen´ı pro ruˇcn´ı digitalizaci ani origin´aln´ı mapy, pouze jejich uˇz naskenovan´e podoby, budu postupovat jako bych mapy z´ıskal skenov´an´ım. Ruˇcn´ı digitalizaci jsem zde uvedl pro ´uplnost metod pro digitalizaci map. V dalˇs´ıch kapitol´ach se nebudu zab´yvat form´aty pro uloˇzen´ı vektorov´ych dat. Moj´ı snahou je zat´ım pˇredpˇr´ıprava map pro automatickou vektorizaci. Tedy zamˇeˇren´ı se na odstranˇen´ı nˇekter´ych specifick´ych objekt˚u z mapy. Pravdˇepodobnˇe tedy v˚ubec nebudu s vektorov´ymi form´aty pracovat.

3.2

Georeferencov´

an´ı

Georeferencov´an´ı map je transformace, pˇri kter´e jsou mapy upravov´any tak, aby v urˇcit´em mˇeˇr´ıtku odpov´ıdaly pˇresnˇe skuteˇcnosti. U georeferencov´an´ı nynˇejˇs´ıch map je potˇreba vypoˇr´adat se se zakˇriven´ım zemˇe. Je prakticky nemoˇzn´e pˇren´est na mapu skuteˇcn´y obraz krajiny z podstaty toho, ˇze jde o funkci z trojrozmˇern´eho prostoru do prostoru mapy, tedy prostoru dvojrozmˇern´eho. Pak tedy ˇc´ım je mapa vˇetˇs´ı t´ım v´ıce tam doch´az´ı k nepomˇer˚um.

Pˇri georeferenci se obecnˇe postupuje takto: nejdˇr´ıve se vybere nˇekolik skuteˇcn´ych a zn´am´ych referenˇcn´ıch bodu (nejm´enˇe tˇri) o kter´ych v´ıme, kde pˇresnˇe leˇz´ı a jak jsou od sebe vzd´aleny, takt´eˇz tyto body zn´ame na mapˇe. Tyto body um´ıst´ıme v mˇeˇr´ıtku mapy pod tuto mapu a podle nich mapu morfujeme tak, aby tyto referenˇcn´ı body odpov´ıdaly bod˚um na mapˇe. ˇC´ım v´ıce bod˚u pouˇzijeme t´ım by mˇela b´yti mapa pˇresnˇejˇs´ı.

Pro zjiˇst’ovan´ı referenˇcn´ıch bod˚u se pouˇz´ıv´a v´ıce metod, dnes je velmi obl´ıben´e GPS. Nˇekdy je potˇreba i vyˇsˇs´ı pˇresnost neˇz m´a GPS (odchylka aˇz 7 metr˚u), pak je potˇreba pouˇz´ıvat hodnoty z pˇresnˇejˇs´ıch mˇeˇren´ı.

Georeferencov´an´ı u historick´ych map je nutn´e proto, aby data zjiˇstˇen´e z historick´ych map, napˇr. rozloha les˚u v roce 1850, odpov´ıdala skuteˇcnosti. Pˇri georeferenciaci historick´ych map se vˇetˇsinou pouˇz´ıv´a nov´a, uˇz georeferencovan´a mapa, na kterou se historick´a mapa pasuje. Nejl´epe tak, aby co nejv´ıce bod˚u v historick´e mapˇe odpov´ıdalo spr´avn´ym bod˚um v mapˇe nov´e. To, jak se ˇcasto historick´e mapy liˇs´ı od map nynˇejˇs´ıch- pˇresnˇejˇs´ıch, je vidˇet na obr´azku 3.3, kde je pˇres sebe poloˇzen´a historick´a a nynˇejˇs´ı mapa Kypru. Zde se prakticky

(15)

bez sloˇzitˇejˇs´ı georeference nelze obej´ıt, nebot’ se mapy hodnˇe liˇs´ı a to nejenom v line´arn´ım mˇeˇr´ıtku.

(16)

Kapitola 4

Zpracov´

an´ı obrazu

Kapitola popisuje pomˇernˇe obecnˇe zpracov´an´ı obrazu, vˇenuje se z´akladn´ımu postupu pˇri zpracov´an´ı obrazu. Popisuje moˇznosti jak obraz uloˇzit a jak lze kter´y form´at vhodnˇe pouˇz´ıt pro historick´e mapy. Takt´eˇz jsou zde pops´any barevn´e modely pro reprezentaci barev v ob-raze. Pˇrestoˇze se to t´yk´a t´eto pr´ace pouze okrajovˇe, mohou b´yt pr´avˇe barvy a tedy pouˇzit´ı barev nˇekter´eho barevn´eho modelu d˚uleˇzitou souˇc´ast´ıˇreˇsen´ı nˇekter´eho probl´emu pˇri anal´yze obrazu.

4.1

Obecn´

y postup pˇ

ri zpracov´

an´ı obrazu

Zde je velmi zkr´acenˇe popsan´y postup zpracov´an´ı obrazu. Tyto informace jsem ˇcerpal pˇredevˇs´ım ze zdroj˚u [18], [15] a [11].

4.1.1 Sn´ım´an´ı

Sn´ım´an´ı obrazu je obecnˇe pˇrevod optick´e veliˇciny na elektrick´y sign´al, pˇriˇcemˇz optick´e veliˇcin´y nemus´ı b´yt jen jas z kamery, ale mohou zde b´yt i jin´e veliˇciny napˇr. ultrazvuk nebo elektromagnetick´e z´aˇren´ı. V pˇr´ıpadˇe t´eto pr´ace n´as vˇsak bude ze vˇseho nejv´ıce zaj´ımat jasov´a sloˇzka obrazu.

4.1.2 Digitalizace

Jak jsem jiˇz uvedl v´yˇse, u zpracov´an´ı map se jedn´a o pˇrevod analogov´eho sign´alu do sign´alu digit´aln´ıho. Digit´aln´ı obraz, jak uˇz bylo ˇreˇceno, lze popsat funkc´ı f (x, y) kde x a y jsou souˇradnice v prostoru obrazu. Samotn´y obraz je pak z´ısk´an vzorkov´an´ım obrazu do matice s M xN body a kvantov´an´ım do K ´urovn´ı (urˇcujuj´ıc´ı jas a barevn´y odst´ın).

Velikost obrazu se obvykle ud´av´a v pixelech a rozliˇsen´ı odpov´ıd´a pomˇeru poˇctu pixel˚u na palec. Pˇri n´ızk´em rozliˇsen´ı doch´az´ı k velk´ym ztr´at´am informac´ı a naopak pˇri vysok´em rozliˇsen´ı stoup´a v´ypoˇcetn´ı n´aroˇcnost ´uprav na obraze. Vzorkov´an´ı by se mˇelo zvolit podle Shanonovy vˇety, kter´a v tomto pˇr´ıpadˇe ˇr´ık´a, ˇze vzorkovac´ı interval (vzd´alenost mezi dvˇema nejbliˇzˇs´ımi vzorky) by mˇela b´yt maxim´alnˇe polovina vzd´alenosti dvou bod˚u, jenˇz chceme v obraze od sebe rozpoznat.

Jednotliv´e vzorky lze ukl´adat do mˇr´ıˇzky, kter´a m˚uˇze b´yt napˇr. ˇctvercov´a nebo hexa-gon´aln´ı. Kaˇzd´a m´a sv´e v´yhody, hexagon´aln´ı nen´ı vhodn´a pro Fouri´erovu transformaci, ale naopak pˇri ˇreˇsen´ı spojitosti objekt˚u v obraze je v´yhodnˇejˇs´ı neˇz mˇr´ıˇzka ˇctvercov´a.

(17)

Popis barev v obraze

Jak pˇresnˇe vypad´a kaˇzd´y pixel urˇcuje jeho odst´ın. Ten se d´a zaznamenat pomoc´ı barevn´ych model˚u. Nejpouˇz´ıvanˇejˇs´ı je model RGB.

Model RGB Popis barvy v tomto modelu je velmi bˇeˇzn´y, popisuje pixel pomoc´ı tˇr´ı barevn´ych sloˇzek, kter´e se aditivnˇe skl´adaj´ı. Barva se sloˇzkami 0, 0, 0 odpov´ıd´a barvˇe ˇcern´e, naopak barvˇe b´ıl´e odpov´ıd´a barva se sloˇzkami 1, 1, 1. Jednotliv´e sloˇzky oznaˇcuj´ı barvy red - ˇcerven´a, green - zelen´a a blue - modr´a, kter´e se skl´adaj´ı. V poˇc´ıtaˇcov´e grafice se sp´ıˇse pouˇz´ıvaj´ı hodnoty cel´ych ˇc´ısel v rozmez´ı 0–255, coˇz je moˇzn´e zapsat na 8 bitech ˇcili na bajtu. Jelikoˇz m´a tento model tˇri sloˇzky pouˇz´ıv´a se tzv. 24-bitov´a hloubka, odpov´ıd´aj´ıc´ı tˇrem sloˇzk´am po osmi bitech. Samozˇrejmˇe je moˇzn´e pouˇz´ıt vˇetˇs´ı ˇci menˇs´ı rozsah barev. Pˇri vytv´aˇren´ı odst´ınu mluv´ıme o kvantov´an´ı pr´avˇe do sloˇzek mezi 0–255 na jedn´e sloˇzce. K popisu jedn´e barvy i v ´urovni ˇsedi by mˇelo b´yt pouˇzito minim´alnˇe 50 ´urovn´ı jasu. Model CMY, CMYK Jde o opaˇcn´y model modelu RGB. Barvy se nepˇriˇc´ıtaj´ı, ale odeˇc´ıtaj´ı od b´ıl´e. Rozd´ıl mezi CMYK a CMY je v tom, ˇze CMYK obsahuje nav´ıc ˇcernou barvu. Je sice pravda, ˇze ˇcern´a by se mˇela d´at sloˇzit ze sloˇzek CMY, ale v praxi, napˇr. v tisku, se pouˇz´ıv´a ˇcern´a zvl´aˇst’. Modelu CMYK odpov´ıdaj´ı sloˇzky cyan-azurov´a, magenta-purpurov´a, yellow-ˇzlut´a a black ˇcern´a.

Model HSI Tento model se liˇs´ı oproti pˇredchoz´ım model˚um v tom, ˇze jeho sloˇzky ne-odpov´ıdaj´ı z´akladn´ım barv´am, ale popisuj´ı tˇri vlastnosti jednotliv´ych barev hue-odst´ın, saturation-sytost, intensity-jas. Odst´ın urˇcuje barvu pixelu, sytost urˇcuje mnoˇzstv´ı b´ıl´e sloˇzky v barvˇe a jas urˇcuje kolik svˇetla dan´a barva odraz´ı, tedy jej´ı z´aˇrivost. paragra-phModel YUV Tento model se v poˇc´ıtaˇcov´e grafice pˇr´ıliˇs nepouˇz´ıv´a. paragraphStupnˇe ˇsedi

ˇ

Casto se obraz zpracov´av´a pouze ve stupn´ıch ˇsedi, jelikoˇz se takto daj´ı barvy mezi se-bou porovn´avat. Stupeˇn ˇsedi se vypoˇc´ıt´a z barevn´ych sloˇzek modelu RGB, podle vzorce: I = 0, 299 ∗ R + 0, 587 ∗ G + 0, 144 ∗ B.

4.1.3 Pˇredzpracov´an´ı obrazu

Po digitalizaci obrazu je nˇekdy nutn´e obraz pˇredzpracovat. Z´amˇerem pˇredzpracov´an´ı je odstranˇen´ı zn´am´ych chyb z digitalizace a jeho pˇr´ıprava pro snaˇzˇs´ı identifikaci objekt˚u v ob-raze. Existuje velmi mnoho metod na pˇredzpracov´an´ı obrazu, vˇetˇsinou z´aleˇz´ı na tom, jak d´ale se m´a obraz zpracov´avat. Obecnˇe lze tyto metody rozdˇelit do tˇr´ı skupin:

• Jasov´e transformace • Geometrick´e transformace • Filtrace a ostˇren´ı obrazu

4.1.4 Segmentace

Jedn´ım z nejtˇeˇzˇs´ıch krok˚u zpracov´an´ı obsahu obrazu je jeho segmentace. Jde o anal´yzu ob-razu, kter´a m´a v´est k nalezen´ı objekt˚u v obraze. Za objekty se zde povaˇzuj´ı ˇc´asti obrazu, jeˇz jsou d´ale bodem z´ajmu v dalˇs´ım zpracov´an´ı. V´ysledkem segmentace by mˇel b´yt soubor ob-last´ı odpov´ıdaj´ıc´ı objekt˚um ve vstupn´ım obraze. Jedn´a se pak o tzv. kompletn´ı segmentaci. Pokud ale oblasti neodpov´ıdaj´ı pˇresnˇe objekt˚um, pak tuto segmentaci naz´yv´ame ˇc´asteˇcnou.

(18)

4.1.5 Popis obrazu

ˇ

Ctvrt´ym krokem je popis obrazu nebo t´eˇz popis nalezen´ych objekt˚u z pˇredeˇsl´e segmentace. Existuj´ı dva z´akladn´ı zp˚usoby popisu. Jeden je zaloˇzen´y na kvantitativn´ım pˇr´ıstupu, coˇz znamen´a popis objekt˚u pomoc´ı souboru ˇc´ıseln´ych charakteristik. Mohou jimi b´yt napˇr. velikost objektu, kompaktnost apod. Druhou moˇznost´ı je kvalitativn´ı pˇr´ıstup, ve kter´em jsou popisov´any vztahy mezi objekty a jejich tvarov´e vlastnosti. Zp˚usob popisu je zvolen podle zp˚usobu dalˇs´ıho vyuˇzit´ı. Ve vˇetˇsinˇe pˇr´ıpad˚u je tento popis vstupn´ı informac´ı pro rozpozn´av´an´ı objekt˚u. V´ybˇer popisu je pak z´avisl´y na pouˇzit´em rozpozn´avac´ım algoritmu.

4.1.6 Klasifikace

Posledn´ım krokem pˇri zpracov´av´an´ı obrazu je klasifikace objekt˚u. Ve vˇetˇsinˇe pˇr´ıpad˚u se jedn´a o zaˇrazen´ı objekt˚u nalezen´ych v obraze do skupin pˇredem zn´am´ych tˇr´ıd. Metody klasifikace objekt˚u se dˇel´ı do dvou z´akladn´ıch skupin, kter´e jsou ´uzce spjaty se zp˚usobem popisu objekt˚u. Jedn´a se o pˇr´ıznakov´e (statistick´e) rozpozn´an´ı a struktur´aln´ı rozpozn´an´ı. Pˇr´ıznakov´e metody jsou zaloˇzeny na principu vyuˇzit´ı pˇr´ıznak˚u, coˇz je skupina ˇc´ıseln´ych charakteristik objektu. Tr´enov´an´ı vlastn´ıho klasifik´atoru zde m˚uˇze b´yt s tr´enovac´ı sadou i bez n´ı na principu shlukov´e anal´yzy. Struktur´aln´ı rozpozn´av´an´ı vyuˇz´ıv´a jako vstupu kvalita-tivn´ı popis objekt˚u. Objekty jsou zde pops´any primitivy. D´ale je definov´ana abeceda, jazyk popisu a gramatika jednotliv´ych tˇr´ıd. Vlastn´ı rozpozn´av´an´ı je pak zaloˇzeno na principu rozboru slova a kontroly spr´avnosti syntaxe pro vˇsechny tˇr´ıdy. Cel´a podkapitola ˇc´asteˇcnˇe citov´ana z [1]. Klasifikace prob´ıh´a, jak uˇz bylo ˇc´asteˇcnˇe ˇreˇceno, pomoc´ı detektor˚u a detekce, v´ıce o ni pojedn´av´am v ˇc´asti o detekci.

4.2

Form´

aty pro uloˇ

zen´ı map

Jak uˇz jsem ve shrnut´ı v podkapitole o sn´ım´an´ı map naznaˇcil, nebudu se zab´yvat vekto-rov´ymi form´aty pro ukl´ad´an´ı obrazu. Tato pr´ace se sp´ıˇse zamˇeˇruje na pr´aci s rastry a tedy hlavnˇe rastrov´ymi form´aty.

Soupis form´at˚u urˇcitˇe nebude kompletn´ı, sp´ıˇs bych jenom r´ad pˇredstavil nˇekter´e ze z´akladn´ıch a nejbˇeˇznˇejˇs´ıch form´at˚u pro uloˇzen´ı obrazu map a form´aty se kter´ymi budu v r´amci t´eto pr´ace spolupracovat.

Na zaˇc´atek bych rozdˇelil form´aty do dvou skupin na ztr´atov´e a bezztr´atov´e. Kaˇzd´a skupina m´a sv˚uj v´yznam. Po naskenov´an´ı je vˇzdy vhodn´e uloˇzit naskenovanou mapu bez-ztr´atovˇe, vyˇzaduje to sice vˇetˇs´ı prostorov´e n´aroky na uloˇzen´ı, ale jedn´a se o nejkvalitnˇejˇs´ı di-gitalizovanou podobu dokumentu. Ostatn´ı kopie tohoto dokumentu uˇz mohou b´yt v r˚uzn´ych form´atech s r˚uzn´ym rozliˇsen´ım, ale tento z´aklad se vˇzdy uchov´av´a.

4.2.1 Bezztr´atov´e form´aty

TIFF

Prvn´ı verze form´atu TIFF (Tagged Image File Format) byla uvedena v roce 1987, ˇsest´a a zat´ım posledn´ı specifikace pak v roce 1992. Vlastn´ıkem form´atu TIFF je nyn´ı firma Adobe, kter´a umoˇzˇnuje vyuˇzit´ı TIFFu zdarma.

TIFF je typick´ym pˇredstavitelem bitmapov´eho form´atu, tj. grafick´a informace je v nˇem vyj´adˇrena formou matice obrazov´ych bod˚u - pixel˚u, pˇriˇcemˇz u kaˇzd´eho pixelu je ud´ana in-formace o jeho barvˇe. Nejvˇetˇs´ı v´yhodou uveden´eho typu form´at˚u je schopnost vˇern´e

(19)

repre-zentace ”pˇrirozen´eho” obrazu (sejmut´eho napˇr´ıklad skenerem ˇci digit´aln´ım fotoapar´atem). Dalˇs´ımi v´yhodami jsou robustnost (nehroz´ı ztr´ata informac´ı pˇri pˇrenosu do jin´eho prostˇred´ı) a pomˇernˇe snadn´e zpracov´an´ı pˇri v´ystupu. Jednou z hlavn´ıch nev´yhod je velk´y objem sou-bor˚u, rostouc´ı ´umˇernˇe s rozmˇery a rozliˇsen´ım (redukci objemu nicm´enˇe napom´ahaj´ı r˚uzn´e kompresn´ı bezztr´atov´e algoritmy).

Na rozd´ıl od vˇetˇsiny ostatn´ıch bitmapov´ych form´at˚u mohou b´yt dokumenty v TIFFu i v´ıcestr´ankov´e a d´ıky tomu v nich lze uloˇzit i pomˇernˇe velk´e bitmapy. Jak jiˇz oznaˇcen´ı ”tag-ged” naznaˇcuje, v TIFF souborech je moˇzno pouˇz´ıt r˚uzn´e tagy, tedy kl´ıˇcov´a slova popisuj´ıc´ı vlastnosti obr´azku - toho je vyuˇzito k tvorbˇe r˚uzn´ych rozˇs´ıˇren´ı a modifikac´ı. Obr´azky ve form´atu TIFF jsou schopny n´est nejˇsirˇs´ı spektrum barevn´ych informac´ı (ˇcernob´ıl´a grafika, odst´ıny ˇsedi, RGB, CMYK, CIELab, indexovan´e barvy aj.). TIFF tak´e podporuje vyuˇzit´ı ˇrady bezztr´atov´ych kompresn´ıch algoritm˚u (PackBits, LZW, Huffman RLE)a barevn´e pro-fily ICC. Ofici´alnˇe je v TIFFu tak´e moˇzno vyuˇz´ıt i ztr´atovou JPEG kompresi, specifikace je vˇsak v tomto ohledu nepˇr´ıliˇs poveden´a.

Form´at TIFF je zat´ım nejˇcastˇejˇs´ı zp˚usob ukl´ad´an´ı prvn´ıch naskenovan´ych map. ˇCasem moˇzn´a bude vytlaˇcen progresivnˇejˇs´ımi form´aty, jako jsou PNG, PDF ˇci JPEG2000. Z ˇc´asti citov´ano z [2].

BMP

BMP je dalˇs´ı bitmapov´y form´at, kter´y je ovˇsem kompatibiln´ı hlavnˇe v prostˇred´ı Windows. To ho odsunuje aˇz za form´at TIFF ˇci PNG. Jelikoˇz vˇsak lze bez ztr´aty kvality tyto form´aty pˇrev´adˇet mezi tiffem a bmp, budu v pˇredpokl´adan´e knihovnˇe, kterou bych chtˇel vyv´ıjet ve Windows, tento form´at pouˇz´ıvat pro testov´an´ı.

4.2.2 Ztr´atov´e form´aty

Ztr´atov´e form´aty dosahuj´ı obrovsk´eho zmenˇsen´ı velikosti souboru s digitalizovanou mapou. Mapy, kter´e jsou takto zkomprimov´any se hod´ı pro lepˇs´ı pˇrenositelnost napˇr. pro pouˇzit´ı na webu nebo pˇri prezentac´ıch. Pˇri vhodnˇe zvolen´e m´ıˇre komprese doch´az´ı, jak uˇz bylo ˇreˇceno, k obrovsk´emu sn´ıˇzen´ı velikosti dat obrazu pˇri minim´aln´ı, lidsky rozeznateln´e ztr´atˇe kvality. Monopost v tˇechto form´atech nyn´ı drˇz´ı form´at jpeg, kter´y tak´e v t´eto pr´aci pouˇz´ıv´am k prezentaci v´ysledk˚u.

JPEG

Form´at jpeg je zaloˇzen na Fourierovˇe transformaci (diskr´etn´ı kosinov´a transformace) -vyuˇz´ıvaj´ıc´ı pˇri komprimaci obr´azku sinusov´ych funkc´ı - avˇsak bere obr´azek po mal´ych ˇ

ctvercov´ych bloc´ıch. Popisy tˇechto blok˚u jsou pak v komprimovan´em souboru uloˇzeny v poˇrad´ı, odpov´ıdaj´ıc´ım rozkladu obr´azku smˇerem shora dol˚u. To vede k riziku naruˇsen´ı vizu´aln´ı vˇernosti po dekomprimaci. Pˇrechody jednotliv´ych blok˚u mohou b´yt vˇsak viditeln´e. Jeho hlavn´ı pl´anovan´e pouˇzit´ı je na webu pro komprimov´an´ı fotografi´ı. Pˇri komprimaci obr´azku s textem doch´az´ı k dosti v´yrazn´e ztr´atˇe kvality na vysoce kontrastn´ıch hran´ach. Pro pouˇzit´ı s mapov´ym materi´alem se nehod´ı, vyuˇziteln´y je pravdˇepodobnˇe pouze pˇri pre-zentaci map nebo pˇri jejich pˇrenosu jako takov´em, kde je tˇreba pˇren´est co nejvˇetˇs´ı mnoˇzstv´ı map na omezen´em datov´em prostoru.

Tento form´at je volnˇe ˇs´ıˇriteln´y a velice rozˇs´ıˇrenˇe pouˇz´ıvan´y. Je snaha nahradit form´at JFIF form´atem JPEG 2000 zaloˇzen´em na vlnkov´e transformaci s lepˇs´ımi kompresn´ımi v´ysledky. Nahrazen´ı vˇsak bude jeˇstˇe trvat a to d´ıky popularitˇe, kterou JPEG m´a.

(20)

4.3

Upravy obrazu

´

4.3.1 Prahov´an´ı

Prahov´an´ı je nejjednoduˇsˇs´ı a nejstarˇs´ı metoda segmentace. Patˇr´ı mezi nejpouˇz´ıvanˇejˇs´ı me-tody d´ıky sv´e jednoduchosti a rychlosti. Pracuje obvykle s jasovou sloˇzkou obrazu tedy s ˇsedot´onov´ym obrazem. U kaˇzd´eho pixelu obrazu porovn´av´a jas pixelu a dan´y pr´ah a podle nastaven´ı funkce zmˇen´ı hodnotu jasu pixelu. Lze pouˇz´ıt v´ıce prah˚u a rozdˇelit pixely do urˇcit´ych skupin (segmentace) podle velikosti jejich jasu. Obvykl´e pouˇzit´ı je ovˇsem pouze s jedn´ım pevnˇe dan´ym prahem, kter´e popisuje n´asleduj´ıc´ı rovnice.

g(x, y) = 

1 f (x, y) ≥ T

0 f (x, y) < T (4.1)

Kde funkce g(x, y) je v´ysledn´y obraz odpov´ıdaj´ıc´ı masce po prahovan´ı podle hodnot jeho pixel˚u. Funkce f (x, y) obsahuje hodnotu jasu dan´eho pixelu. Hodnota T odpov´ıd´a hodnotˇe prahu.

Jsou dalˇs´ı moˇznosti jak upravit prahov´an´ı hodnoty masky. V´ysledkem nemus´ı b´yt pouze 1 nebo 0, ale v pˇr´ıpadˇe prvn´ı moˇznosti m˚uˇze obr´azek pouˇz´ıt p˚uvodn´ı hodnoty pixelu m´ısto jedniˇcky nebo obr´acenˇe. Variant je zde opravdu mnoho, ale kterou jsem jeˇstˇe nezm´ınil je adaptivn´ı prahov´an´ı. Zat´ım zvaˇzuji pouˇzit´ı jednoho stejn´eho prahu pro cel´y obraz. Lze ovˇsem pr´ah interaktivnˇe upravovat podle pr˚umˇern´e velikosti jasu pouze v urˇcit´e oblasti. Takto lze obs´ahnout m´ısta obrazu, kter´a jsou napˇr´ıklad r˚uznˇe osvˇetlen´a.

Uk´azka v´ysledku po prahov´an´ı je na obr´azku4.1.

Obr´azek 4.1: V´ysledek po prahov´an´ı s pevnˇe dan´ym prahem. Odfiltrovala se vˇsechna m´ısta s jasem vyˇsˇs´ım neˇz pr´ah

4.3.2 Dilatace a eroze

Dilatace a eroze patˇr´ı do oblast´ı matematick´e morfologie op´ıraj´ıc´ı se o teorii bodov´ych mnoˇzin. Kaˇzd´y obraz lze totiˇz povaˇzovat za mnoˇzinu bod˚u - pixel˚u. Pro n´azornost cel´e ˇc´asti a v r´amci pˇredpokl´adan´eho pouˇzit´ı tˇechto operac´ı budu zvaˇzovat pouze bin´arn´ı (dvousloˇzkov´y

(21)

- ˇcern´a/b´ıl´a) obraz. kapitola je inspirov´ana ˇc´ast´ı matematick´a morfologie z ˇcl´anku [17], odkud jsou i doprovodn´e obr´azky.

Pˇredpokl´ad´am bin´arn´ı obraz takov´y, ˇze ˇcern´y pixel je oznaˇcen hodnotou jedna a b´ıl´y hodnotou nula. Vezmˇem si napˇr. objekt, kter´y je pops´an mnoˇzinou ˇcern´ych pixel˚u. Ve stˇredu pozornosti dilatace a eroze je pˇredevˇs´ım tvar takov´eho objektu. Pomoc´ı tˇechto dvou operac´ı je moˇzno rekonstrovat poruˇsen´y tvar objektu nebo obraz postiˇzen´y drobn´ym ˇsumem. Takt´eˇz lze tyto operace pouˇz´ıt na zpracov´an´ı objektu napˇr. pro zjednoduˇsen´ı tvaru objektu a tak´e jejich pomoc´ı zd˚uraznit strukturu objektu - ztenˇcov´an´ı, zesilov´an´ı apod.

Bin´arn´ı obraz

Necht’ mnoˇzina X je mnoˇzina objekt˚u a odpov´ıd´a ˇcern´ym bod˚um na mnoˇzinˇe bod˚u obrazu. Kaˇzd´y prvek mnoˇziny X je pops´an dvojic´ı (x, y) oznaˇcuj´ıc´ı polohu prvku - bodu. Zbyl´e prvky obrazu, jeˇz nepovaˇzujeme za objekty, naz´yv´ame pozad´ı. Bin´arn´ı obraz znaˇc´ım E2 a lze si ho pˇredstavit jako n´asleduj´ıc´ı obr´azek 4.2.

Obr´azek 4.2: Vlevo je bin´arn´ı obraz a vpravo mnoˇzina X obsahuj´ıc´ı objekty bin´arn´ıho obrazu.

Pixel obrazu oznaˇcen´y kˇr´ıˇzkem z rohu do rohu je myˇslen´y poˇc´atek. Na obr´azku je na-staven na bod s oznaˇcen´ım (0, 0), coˇz jsou jeho souˇradnice v poˇc´atku obrazu.

Realizace morfologick´e operace

Touto realizac´ı je myˇslena relace mezi mnoˇzinou objekt˚u z obrazu a menˇs´ı bodovou mnoˇzinou B, kter´a se naz´yv´a strukturn´ı element. Strukturn´ı element m´a definovan´y stˇred, kter´y ovˇsem nemus´ı leˇzet uprostˇred. Takt´eˇz nemus´ı b´yt na tomto stˇredu elementu ˇcern´y bod - objekt. Pˇr´ıklady takov´ych element˚u jsou na obr.4.3.

Obr´azek 4.3: Typick´e strukturn´ı elementy. Kˇr´ıˇzkem je oznaˇcen´y myˇslen´y stˇred elementu

Morfologickou operaci si pˇredstav´ıme, jako bychom pohybovali strukturn´ım elementem B systematicky po cel´em obraze. Bod obrazu, kter´y se shoduje s poˇc´atkem souˇradnic

(22)

struk-turn´ıho elementu, naz´yv´ame okamˇzit´y bod. V´ysledek relace mezi obrazem a strukturn´ım elementem zap´ıˇseme do okamˇzit´eho bodu obrazu.

Dilatace

Operaci dilatace oznaˇc´ım znakem ⊕. Tato operace skl´ad´a body dvou mnoˇzin pomoc´ı souˇctu souˇradnic jejich prvk˚u.

X ⊕ B = {d ∈ E2, d = x + b, x ∈ X, b ∈ B} (4.2) Pˇr´ıklad dilatace:

X = {(0, 1), (1, 1), (2, 1), (2, 2), (3, 0)} (4.3)

B = {(0, 0), (0, 1)} (4.4)

X ⊕ B = {(0, 1), (0, 2), (1, 1), (1, 2), (2, 1), (2, 2), (2, 3), (3, 0), (3, 1)} (4.5) Pˇr´ıklad popisuje obr´azek 4.4.

Obr´azek 4.4: Pˇr´ıklad dilatace

Pˇri dilataci se neˇcastˇeji pouˇz´ıvaj´ı strukturn´ı elementy s rozmˇery 3x3, obsahuj´ıc´ı vˇsech 9 bod˚u osmiokol´ı. Pˇri takov´e dilataci se okraje objekt˚u zvˇetˇs´ı o jeden bod. D´ıry a z´alivy do maxim´aln´ı velikosti 2 bod˚u se zapln´ı.

Eroze

Operaci eroze oznaˇc´ım znakem . Tato operace skl´ad´a body dvou mnoˇzin pomoc´ı rozd´ıl˚u souˇradnic jejich prvk˚u.

X B = {d ∈ E2, d + b ∈ X, ∀b ∈ B} (4.6) Pˇr´ıklad eroze:

X = {(0, 1), (0, 2), (1, 0), (1, 1), (1, 3), (2, 0), (2, 1), (2, 2), (3, 1), (3, 2), (4, 2)}(4.7)

B = {(0, 0), (0, 1)} (4.8)

X B = {(0, 1), (1, 0), (2, 0), (2, 1), (3, 1)} (4.9) Pˇr´ıklad popisuje obr´azek 4.5.

Pˇri erozi se nejˇcastˇeji pouˇz´ıvaj´ı strukturn´ı elementy s rozmˇery 3x3, obsahuj´ıc´ı vˇsech 9 bod˚u osmiokol´ı. Pˇri takov´e erozi se okraje objekt˚u zmenˇs´ı o jeden bod. Osamˇel´e body do maxim´aln´ı velikosti 2 bod˚u nebo ˇc´ary o tlouˇst’ce 2 body zmiz´ı. Moˇzno pouˇz´ıt na odstranˇen´ı ˇsumu.

(23)

Obr´azek 4.5: Pˇr´ıklad eroze

4.3.3 Metody

”zamalov´an´ı“

Metody zamalov´an´ı je m˚uj voln´y pˇreklad z angliˇctiny tzv.

”Inpaint Methods“. Tyto metody slouˇz´ı obecnˇe k restauraci obrazu. Jejich ´ukolem je odstranit d´ıry, ˇskr´abance a podobn´e vady z obrazu odhadnut´ım pixel˚u, kter´e byli poˇskozeny. V pˇr´ıpadˇe m´eho pouˇzit´ı se pouˇzij´ı na odhad pixel˚u mapy, kter´e byly pˇreps´any textem.

Metoda zamalov´an´ı od A. Telea

V´ıce o t´eto metodˇe je v [13]. Pro ´uplnost zde uv´ad´ım princip t´eto metody. Jedn´a se o pomˇernˇe rychlou metodu, kter´a sv´ymi v´ysledky dosahuje kvalit podobn´ych metod za-malov´an´ı, kter´e jsou ovˇsem pomalejˇs´ı. Pracuje na z´akladˇe t´eto funkce:

Iq(p) = I(q) + ∆I(q)(p − q) (4.10)

Kde I(p) je hodnota jasu pixelu na bodˇe p, ∆I(q) je hodnota urˇcuj´ıc´ı postup zmˇeny jasu v okol´ı bodu q. Bod p v rovnici je bod na okraji oblasti, kterou zamalov´av´am a bod q bodem v oblasti bl´ızk´e bodu p ovˇsem takov´e, kde zn´ame hodnoty pixel˚u.

Jelikoˇz takov´ych bod˚u je v´ıce, spoˇc´ıt´a se hodnota v´ysledn´eho pixelu na bodˇe p takto: I(p) =

P

q∈O(p)w(p, q)[I(q) + ∆I(q)(p − q)

P

q∈O(p)w(p, q)]

(4.11) Kde O(p) je zn´am´a oblast bodu p a w(p, q) je v´aha vztahu mezi p a q. Je pochopiteln´e, ˇ

ze vˇetˇs´ı v´ahu budou m´ıt body bl´ıˇze bodu p. Postupnˇe se smˇerem od hranic cel´e oblasti zapln´ı. Pˇri tom doch´az´ı k propagaci jasov´ych zmˇen ve zn´am´em okol´ı do zaplˇnovan´e oblasti. Filtrace medi´anem

Tato filtrace nen´ı pˇr´ımo metodou pro zamalov´av´an´ı oblast´ı, nicm´enˇe na jednotliv´e pixely pouˇziteln´a je. Takt´eˇz je pouˇziteln´a pro pˇredzpracov´an´ı, coˇz vysvˇetl´ım v n´avrhu. Medi´an se ˇ

casto pouˇz´ıv´a k odstranˇen´ı ˇsumu a obl´ıben´y je pˇredevˇs´ım d´ıky sv´e jednoduchosti. Algorit-mus v´ypoˇctu medi´anu je pops´an n´asleduj´ıc´ımi tˇremi kroky jeˇz se aplikuj´ı na vˇsechny pixeli [i, j] obrazu A:

1. Naˇcti body (pixely) z intervalu [i − k, j − k][i + k, j + k] do pole M d´elky l = (2k + 1)2 2. Seˇrad’ pole M

3. V´ystupn´ı obraz B[i, j] = M [(l − 1)/2] tedy vznik´a tak, ˇze se pro kaˇzd´y jeho pixel pouˇzije stˇredn´ı hodnota z oblasti o polomˇeru k okolo pixelu.

(24)

Oblasti okolo pixelu mohou m´ıt r˚uzn´e tvary. Obecnˇe medi´an niˇc´ı ostr´y obraz, napˇr. na-prost´ym odstranˇen´ım tenk´ych kontrastn´ıch lini´ı.

4.4

Detekce v obraze

Tato ˇc´ast je teoretick´a a obsahuje vybran´e metody detekce objekt˚u v obraze. Rozdˇeluji ji na tˇri hlavn´ı ˇc´asti:

• Metody zaloˇzen´e na hled´an´ı podle barvy n´apisu. • Metody na detekci hran.

• Detektory objekt˚u.

Postupnˇe popisuji vˇsechny tyto zp˚usoby detekce, vyb´ır´am metody, jejichˇz moˇzn´e pouˇzit´ı popisuji v n´avrhu.

4.4.1 Metody zaloˇzen´e na hled´an´ı podle barvy

Na dan´em obraze se najdou vˇsechny pixely jejichˇz barevn´y odst´ın leˇz´ı v urˇcit´em rozmez´ı. V grafick´em programu Photoshop se d´a tato metoda simulovat vˇsem zn´amou kouzelnou h˚ulkou. Pˇresnˇeji by ˇsla tato metoda popsat n´asleduj´ıc´ım postupem:

1. Zad´a se referenˇcn´ı odst´ın pomoc´ı diskretizovan´eho barevn´eho modelu RGB.

2. Pixel po pixelu se proch´az´ı cel´y obraz a hledaj´ı se podobnˇe barevn´e pixely. Podoba m˚uˇze b´yt upraviteln´a pomoc´ı vˇetˇs´ı ˇci menˇs´ı tolerance barevn´eho odst´ınu. Hled´an´ı lze omezit napˇr. hled´an´ım pouze sousedn´ıch pixel˚u.

3. Pomoc´ı vˇsech oznaˇcen´ych a nalezen´ych pixel˚u lze detekovat objekt barevnˇe odliˇsn´y od okol´ı.

V´ıce podobn´ych metod lze z´ıskat odvozen´ım z pˇredeˇsl´eho postupu. Varianty se mohou liˇsit napˇr. jin´ym zp˚usobem pouˇzit´ı tolerance. (tolerance pro kaˇzd´y barevn´y odst´ın, pevn´a tolerance pro vˇsechny odst´ıny atd.)

4.4.2 Metody na detekci hran

V t´eto podkapitole se po popisu konvoluce budu zab´yvat nejzn´amˇejˇs´ımy hranov´ymi de-tektory. Konvoluc´ı se zab´yv´am, protoˇze je z´akladem dalˇs´ıch popsan´ych filtr˚u na detekci hran.

Konvoluce

Jelikoˇz lze obraz povaˇzovat za dvou-rozmˇern´y sign´al, je moˇzn´e na nˇej pouˇz´ıt skl´ad´an´ı sign´al˚u neboli konvoluce. V praxi se toho vyuˇz´ıv´a napˇr. k filtraci obrazu. Necht’ sign´al Ii,j

od-pov´ıd´a sign´alu vstupn´ıho obrazu, hi,j odpov´ıd´a sign´alu filtru, coˇz je vˇetˇsinou matice ˇc´ısel

o rozmˇerech 2k + 1 a Vi,j popisuje v´ystupn´ı obraz po filtrov´an´ı pomoc´ı konvoluce. Znak •

odpov´ıd´a operaci konvoluce. Pak plat´ı:

Vi,j= Ii,j• hi,j = k X x=−k k X y=−k Ii−x,j−yhi,j (4.12)

(25)

Je-li konvoluce uplatnˇena pouze jednou, lze mluvit o line´arn´ı transformaci obrazu. ˇCasto se vˇsak konvoluce pouˇzije dvakr´at po sobˇe, napˇr. pˇri hled´an´ı hran. Existuje v´ıce moˇznost´ı jak´y druh konvoluˇcn´ıch j´ader pro hled´an´ı hran v obraze pouˇz´ıt.

Sobel˚uv filtr - konvoluˇcn´ı j´adra

Sobel˚uv filtr je jeden z nejzn´amˇejˇs´ıch detektor˚u hran. Pouˇz´ıv´a dvou po sobˇe jdouc´ıch kon-voluc´ı s j´adry: h1=   −1 0 1 −2 0 2 −1 0 1   h2=   −1 −2 −1 0 0 0 1 2 1  

Roberts˚uv filtr - konvoluˇcn´ı j´adra

Zde je filtr podobn´y tomu Sobelovu. Vyuˇz´ıv´a tyto konvuluˇcn´ı j´adra:

h1=   0 0 −1 0 1 0 0 0 0   h2 =   −1 0 0 0 1 0 0 0 0  

Prewittov´e filtr - konvoluˇcn´ı j´adra

Prewitt˚uv filtr pouˇz´ıv´a dvou po sobˇe jdouc´ıch konvoluc´ı s j´adry:

h1 =   1 1 1 0 0 0 −1 −1 −1   h2=   0 1 1 −1 0 1 −1 −1 0  

Kirsch˚uv filtr - konvoluˇcn´ı j´adra

Kirsh˚uv filtr pouˇz´ıv´a dvou po sobˇe jdouc´ıch konvoluc´ı s j´adry:

h1 =   3 3 3 3 0 3 −5 −5 −5   h2=   3 3 3 −5 0 3 −5 −5 3  

Laplaci´an˚uv filtr - konvoluˇcn´ı j´adro

Laplaci´an vyuˇz´ıv´a pouze jedno konvoluˇcn´ı j´adro, toto j´adro se liˇs´ı podle toho, jak´e okol´ı vyhodnocovan´eho bodu budeme br´at v potaz. Jedno z tˇechto jader pro 4-okol´ı m´a tvar:

h1 =   0 −1 0 −1 4 −1 0 −1 0   4.4.3 Detektory objekt˚u

Tato ˇc´ast obsahuje teoretick´y ´uvod k detekci, vysvˇetlen´ı z´akladn´ıch pouˇz´ıvan´ych pojm˚u a vztah˚u. Popisuje pˇredevˇs´ım detektor navrhnut´y Paulem Violem a Michaelem Jonesem.

Detektory objekt˚u lze pouˇz´ıt na rozpozn´an´ı objekt˚u, maj´ıc´ıch urˇcit´e vlastnosti nebo pˇr´ıznaky. Existuje v´ıce z´akladn´ıch typ˚u metod na rozpozn´an´ı objekt˚u v obraze napˇr.:

(26)

• Struktur´aln´ı rozpozn´av´an´ı

• Pˇr´ıznakov´e (statistick´e) rozpozn´av´an´ı Detekce objekt˚u - z´akladn´ı pojmy

V detekci objekt˚u se pouˇz´ıvaj´ı pro detektory tyto pojmy:

• M´ıra spr´avnˇe detekovan´ych objekt˚u (DR)- ud´av´a se v procentech a popisuje, kolik procent z hledan´ych objekt˚u na obraze detektor nalezl podle n´asleduj´ıc´ıho vzorce:

DR = n

p (4.13)

Kde n je poˇcet spr´avnˇe detekovan´ych objekt˚u na obraze, p je celkov´y poˇcet hledan´ych objekt˚u na obraze.

• M´ıra chybn´eho pˇrijet´ı (F AR)- Pouˇz´ıv´a se pro popis detektor˚u a popisuje kolik z na-lezen´ych objekt˚u, nebylo hledan´ymi objekty. Podle vzorce:

F AR = f n

n (4.14)

Kde n je poˇcet nalezen´ych objekt˚u a f n je poˇcet chybn´ych n´alez˚u. V t´eto pr´aci pouˇz´ıv´am tento pojem tak´e k obecn´emu oznaˇcen´ı detekc´ı, na kter´e nebyl detektor urˇcen.

• Chybn´e nepˇrijet´ı (F RR)- popisuje kolik objekt˚u mˇelo b´yt detekov´ano, ale nebylo. Ud´av´a se v procentech a poˇc´ıt´a podle vzorce:

F RR = p − n

p (4.15)

Kde n je poˇcet nalezen´ych a spr´avnˇe detekovan´ych objekt˚u a p je celkov´y poˇcet hledan´ych objekt˚u na obraze.

Struktur´aln´ı rozpozn´av´an´ı - obecn´y popis

Struktur´aln´ı metody pracuj´ı na z´akladˇe pˇresnˇe definovan´eho klasifikaˇcn´ıho stromu. Objekty lze popsat ˇretˇezcemi z abecedy a pomoc´ı gramatiky je zpracov´avat. Laicky pops´ano obraz se pˇresnˇe nasegmentuje a podle pˇresnˇe dan´ych pravidel se jednotliv´e objekty zaˇrad´ı do spr´avn´e tˇr´ıdy. ˇCasto se tato metoda pouˇz´ıv´a pro rozpozn´an´ı dvou-rozmˇern´ych zn´am´ych ´utvar˚u. Viz tak´e [10].

Kromˇe parametr˚u jednotliv´ych objekt˚u v obraze se pracuje i s relacemi mezi objekty. Takov´a relace m˚uˇze b´yt napˇr. dotek, pˇrekryt´ı, ohraniˇcen´ı atd.. Tyto relace je pak moˇzno hiearchicky uspoˇr´ad´avat do rozhodovac´ıch graf˚u popsateln´ych gramatikami.

Mezi struktur´aln´ı metody patˇr´ı napˇr. Houghova transformace, kter´a kromˇe jin´eho hled´a a rozpozn´av´a geometrick´a primitiva v obraze. Viz d´ale.

Houghova transformce Houghova transformace je metoda pro nalezen´ı parametrick´eho popisu objekt˚u v obraze. Pˇri implementaci je tˇreba zn´at analytick´y popis tvaru hledan´eho objektu. Proto je tato metoda pouˇz´ıv´ana pro detekci jednoduch´ych objekt˚u v obraze jakou jsou pˇr´ımky, kruˇznice, elipsy, atd. Houghova transformace je pouˇz´ıv´ana pˇredevˇs´ım pro seg-mentaci objekt˚u, jejichˇz hranice lze popsat jednoduch´ymi kˇrivkami. Hlavn´ı v´yhodou t´eto metody je robustnost v˚uˇci nepravidelnostem a poruˇsen´ı hledan´e kˇrivky. Citov´ano z [4].

(27)

Pˇr´ıznakov´e (statistick´e) rozpozn´av´an´ı - obecn´y popis

V tˇechto metod´ach je objekt pops´an pˇr´ıznaky a podle pravdˇepodobnosti, jak´y pˇr´ıznak maj´ı objekty v urˇcit´e tˇr´ıdˇe (skupinˇe shodn´ych objekt˚u) se tyto objekty klasifikuj´ı a rozdˇeluj´ı do tˇr´ıd. Klasifikaci prov´ad´ı klasifik´ator, kter´y by mˇel spr´avnˇe detekovat a rozpoznat hledan´y objekt.

Pro spr´avnˇejˇs´ı extrakci pˇr´ıznak˚u lze uˇz´ıt uˇcen´ı. Detektor Paula Viola a Michaela Jonese

Tento detektor objekt˚u patˇr´ı do skupiny pˇr´ıznakov´ych metod. P˚uvodnˇe byl vytvoˇren pro detekci obliˇcej˚u v re´aln´em ˇcase. Text je inspirov´an ˇcl´ankem [14], odkud poch´az´ı i nˇekter´e obr´azky.

Tento detektor pracuje pouze s obrazem v ˇsed´ych odst´ınech, tedy pouze na z´akladˇe jasu jednotliv´ych pixel˚u. Barevn´y pixel se na pˇrevede na tzv.

”stupnˇe ˇsedi“. Pˇrevod je pops´an v kapitole o ´uprav´ach obrazu.

Jelikoˇz tento detektor patˇr´ı do tzv.

”pˇr´ıznakov´ych“ metod, pracuje s pˇr´ıznaky. P˚uvodn´ı anglick´y n´azev pˇr´ıznaku je

”Feature“, coˇz by se dalo pˇreloˇzit i jako ”rys“ ve v´yznamu vlastnosti (napˇr. povahov´y rys). V´ıc se tˇemto pˇr´ıznak˚um budu vˇenovat pozdˇeji. Takt´eˇz tento detektor pracuje na speci´alnˇe pˇredpˇripraven´ych obrazech, ˇcemuˇz se vˇenuje n´asleduj´ıc´ı ˇ

c´ast.

Pˇredpˇr´ıprava obr´azku mapy V anglick´em ˇcl´anku ([14]) tento pˇredpˇripraven´y obraz naz´yvaj´ı

”Integral Image“. Do ˇceˇstiny n´azev nepˇrekl´ad´am. Pˇred pouˇzit´ım tohoto detek-toru je potˇreba ˇsedotonov´y obraz(pˇrevod z RGB pops´an v´yˇse) pˇrev´est pr´avˇe na tento pˇredpˇripraven´y obraz.

Jelikoˇz pˇr´ıznaky, kter´ym bych se vˇenoval pozdˇeji, jsou urˇcov´any z obdeln´ıkov´ych v´yˇrez˚u p˚uvodn´ıho obrazu, je tato n´asleduj´ıc´ı reprezentace pro jejich urˇcov´an´ı velmi v´yhodn´a.

Kaˇzd´a buˇnka v um´ıstˇen´ı odpov´ıdaj´ıc´ı um´ıstˇen´ı pixelu obrazu na souˇradnic´ıch x, y ob-sahuje souˇcet hodnot jasu pixel˚u z´aroveˇn nad n´ı a nalevo od n´ı. Matematicky to lze popsat takto:

b(x, y) = X

u<=x,v<=y

p(u, v) (4.16)

Funkce b(x, y) odpov´ıd´a hodnotˇe v pˇredpˇripraven´em obraze na souˇradnici [x, y], funkce p(u, v) odpov´ıd´a hodnotˇe pixelu na souˇradnici [u, v].

Pˇri v´ypoˇctu v poˇc´ıtaˇci je pouˇzit rekurentn´ı vzorec, kter´y umoˇzˇnuje spoˇc´ıtat poˇzadovan´y obraz jedn´ım pr˚uchodem.

s(x, y) = s(x, y − 1) + p(x, y) (4.17) b(x, y) = b(x − 1, y) + s(x, y) (4.18) Funkce s(x, y) odpov´ıd´a souˇctu pixel˚u v ˇradˇe. Cel´y vzorec ˇr´ık´a, ˇze dalˇs´ı buˇnku spoˇc´ıt´ame, kdyˇz vezmeme pixel odpov´ıdaj´ıc´ı buˇnce a k nˇemu pˇriˇcteme hodnotu buˇnky nad n´ım a vlevo od nˇeho. T´ımto zp˚usobem se vytvoˇr´ı cel´y pˇredpˇripraven´y obraz.

Pˇr´ıznaky Detekce prob´ıh´a na z´akladˇe pomˇernˇe jednoduch´ych rys˚u - pˇr´ıznak˚u. Pouˇzit´ı tˇechto rys˚u m´a oproti porovn´av´an´ı v r´amci jednotliv´ych pixel˚u dvˇe v´yhody. Prvn´ı a d˚uleˇzitˇejˇs´ı je, moˇznost lepˇs´ıho vytvoˇren´ı obecn´eho klasifik´atoru. Jin´ymi slovy lze mnohem l´epe po-stihnout poˇzadovanou podobnost, narozd´ıl od porovn´av´an´ı pixel˚u, kde se sp´ıˇse pracuje

(28)

Obr´azek 4.6: Hodnota buˇnky v pˇredpˇripraven´em obraze na souˇradnic´ıch [x, y] je souˇcet vˇsech hodnot pixel˚u nalevo a nad touto souˇradnic´ı

se shodnost´ı. Klasifik´ator pak v koneˇcn´e f´azi dok´aˇze l´epe rozpozn´avat objekty, kter´e jsou pouze podobn´e objekt˚um, na kter´e byl natr´enov´an (tr´enov´an´ı klasifik´atoru se budu vˇenovat pozdˇeji). Druhou v´yhodou je, rychlost testov´an´ı. Pokud by se mˇeli objekty se vzory po-rovn´avat pixel po pixelu zabralo by to mnohem v´ıce ˇcasu. Takto leze pomˇernˇe velk´e plochy obrazu vylouˇcit z vyhled´av´an´ı mnohem dˇr´ıve. V pˇr´ıznac´ıch se vyuˇz´ıv´a rozd´ılu v souˇctech jas˚u v urˇcit´ych oblastech. Existuje v´ıce z´akladn´ıch rozloˇzen´ı oblast´ı, podle nichˇz se poˇc´ıtaj´ı rozd´ıly. Na obr´azku4.7je nˇekolik typ˚u pˇr´ıznak˚u. Ve vylepˇsen´e verzi existuje i v´ıce pˇr´ıznak˚u napˇr. natoˇcen´ych nejen do svisl´ych a vodorovn´ych poloh.

Vezmeme-li v potaz vzorov´e objekty, kter´e jsou zpravidla 24x24 coˇz je rozliˇsen´ı detek-toru, pot´e nˇekolik typ˚u pˇr´ıznak˚u a spoustu variant jejich um´ıstˇen´ı je moˇzn´ych pˇr´ıznak˚u velmi mnoho (pˇres 45 tis´ıc).

Pr´avˇe zde v poˇc´ıt´an´ı pˇr´ıznak˚u se vyplat´ı naˇse pokroˇcil´a reprezentace obrazu, kter´e jsme dos´ahli v pˇredpˇr´ıpravˇe. Pˇredpokl´adejme, ˇze chceme vypoˇc´ıtat hodnotu pole D na obr´azku

4.8. Popis v´ypoˇctu je pod obr´azkem a je vidˇet, ˇze ho bylo dosaˇzeno pouze ˇctyˇrmi operacemi. Tedy s velmi malou v´ypoˇcetn´ı sloˇzitost´ı.

Pr˚ubˇeh skenov´an´ı V´ybˇerem spr´avn´ych rys˚u urˇcuj´ıc´ı objekt se budu zab´yvat v ˇc´asti o uˇcen´ı. Pˇredpokl´adejme, ˇze m´ame nˇekolik pˇr´ıznak˚u - rys˚u, kter´e popisuj´ı objekt. Vy-hled´avac´ım ok´ynkem se prohled´a cel´y obraz a zjiˇst’uje se podobnost pˇr´ıznak˚u popisuj´ıc´ıch hledan´y objekt s odpov´ıdaj´ıc´ımi pˇr´ıznaky zjiˇstˇen´ych z vyhled´avaj´ıc´ıho okna.

Hledan´e objekty se na obraze vyskytuj´ı v r˚uzn´em mˇeˇr´ıtku tedy v r˚uzn´ych velikostech. Vˇetˇsina klasick´ych vyhled´avaˇc˚u toto ˇreˇs´ı tak, ˇze postupnˇe mˇen´ı velikost obrazu, na kter´em se objekty hledaj´ı. Vypoˇc´ıtat ovˇsem nˇekolik des´ıtek zmenˇsenin obrazu je dosti v´ypoˇcetnˇe n´aroˇcn´a operace, jedn´a se o podvzorkov´an´ı, kter´e lze poˇc´ıtat velmi dlouho. Pˇr´ıstup po-pisovan´eho vyhled´avaˇce je jin´y. Nevytv´aˇr´ı celou piramidu velikost´ı obrazu, ale zvˇetˇsuje vyhled´avac´ı ok´enko a mˇen´ı pouze velikosti pˇr´ıznak˚u a jejich rozd´ılov´ych hodnot. Tento v´ypoˇcet je pak uˇz docela rychl´y oproti zmenˇsov´an´ı skuteˇcn´eho obrazu.

(29)

Obr´azek 4.7: Pˇr´ıklad obd´eln´ıkov´ych pˇr´ıznak˚u zobrazen´ych na tzv. vyhled´avaj´ıc´ım ok´enku. Souˇcet pixel˚u leˇz´ıc´ıch uvnitˇr b´ıl´ych obd´eln´ıkov´ych ˇc´ast´ı v r´amci pˇr´ıznaku ve v´yhled´avac´ım ok´enku, je odeˇcten od souˇctu pixel˚u v ˇsed´ych obd´eln´ıc´ıch. Zde jsou 4 typy pˇr´ıznak˚u. Na obr´azc´ıch (A) a (B) jsou tzv. dvou-obd´eln´ıkov´e pˇr´ıznaky, zamˇeˇruj´ıc´ı se na hrany, na obr´azku (C) je troj-obd´eln´ıkov´y pˇr´ıznak zamˇeˇruj´ıc´ı se na ˇc´ary a na obr´azku (D) je ˇctyˇr-obd´eln´ıkov´y pˇr´ıznak sleduj´ıc´ı diagon´aln´ı zmˇeny souˇctu.

AdaBoost Jeˇstˇe neˇz se zaˇcnu vˇenovat uˇcen´ı tohoto detektoru, je potˇreba vysvˇetlit pojem AdaBoost. Citov´ano z [16]. AdaBoost pˇri klasifikaci line´arnˇe kombinuje rozhodnut´ı nˇekolika ”jednoduˇsˇs´ıch“ klasifik´ator˚u a potencion´alnˇe tak dosahuje lepˇs´ıch v´ysledku, neˇz by bylo moˇzno dos´ahnout pouˇzit´ım pouze jednoho klasifik´atoru samostatnˇe.

V tomto popisovan´em detektoru se k natr´enov´an´ı klasifik´atoru vyuˇz´ıv´a tr´enov´an´ı. Uˇcen´ı klasifik´atoru Jelikoˇz moˇzn´ych pˇr´ıznak˚u lze z´ıskat mnohem v´ıce neˇz pixel˚u v ob-raze (pˇr´ıznaky se t´ykaj´ı vztah˚u mezi pixely a tedy jich m˚uˇze b´yt mnoho n´asobnˇe v´ıc), je potˇreba vybrat nˇekolik d˚uleˇzit´ych pˇr´ıznak˚u, kter´e co nejl´epe postihuj´ı hledan´y objekt. Z tˇechto nˇekolika pˇr´ıznak˚u se vytvoˇr´ı klasifik´ator. Podle pˇredpokladu ve ˇcl´anku [14] opravdu staˇc´ı popsat objekt nˇekolika m´alo pˇr´ıznaky, probl´emem je, jak vybrat ty spr´avn´e. V´ybˇer nejlepˇs´ıch pˇr´ıznak˚u se prov´ad´ı dohromady s vytv´aˇren´ım klasifik´atoru pomoc´ı metody Ada-Boost.

Na zaˇc´atku tr´enov´an´ı klasifik´atoru je potˇreba m´ıt pomˇernˇe velkou sadu pozitivn´ıch obr´azk˚u, jsou to ty, na kter´ych se vyskytuje hledan´y objekt, a sadu negativn´ıch obr´azk˚u, kde se objekt nevyskytuje. Pˇri tr´enov´an´ı se zkoumaj´ı jednotliv´e moˇzn´e pˇr´ıznaky a hled´a se ten, kter´y nejl´epe rozdˇeluje pozitivn´ı obr´azky od negativn´ıch. Pouˇzit´ım jednoho pˇr´ıznaku vytv´aˇr´ıme tzv. slab´y klasifik´ator, line´arn´ı kombinac´ı tˇechto slab´ych klasifik´ator˚u vznik´a v´ysledn´y klasifik´ator. Necht’ hj(x) je funkce popisuj´ıc´ı slab´y klasifik´ator. M´a pouze dvˇe

moˇzn´e hodnoty 0 a 1, kter´e bud’ znamenaj´ı, ˇze slab´y klasifik´ator objekt na obr´azku x zam´ıtl (v pˇr´ıpadˇe hodnoty 0) nebo pˇrijal (v pˇr´ıpadˇe hodnoty 1). Pro upˇresnˇen´ı, pˇrijet´ım mysl´ım tu variantu, kdy se posuzovan´y objekt porovn´av´a s hled´an´ym objektem a je urˇcen jako podobn´y.

hj(x) =



1 if pjfj(x) < pjtj

0 jinak (4.19)

(30)

Obr´azek 4.8: Pˇr´ıklad poˇc´ıt´an´ı souˇctu pixel˚u v poli D. Hodnota v m´ıstˇe oznaˇcen´em 1 na pˇredpˇripraven´em obraze je souˇcet pixel˚u v poli A, hodnota s oznaˇcen´ım 2 je souˇcet pixel˚u v pol´ıch A a B, hodnota 3 je obdobnˇe souˇctem pol´ı A a C a hodnota 4 souˇctem A, B, C a D. Souˇcet pixel˚u v poli D lze vypoˇc´ıtat z hodnot na souˇradnic´ıch oznaˇcen´ych 1, 2, 3 a 4 pomoc´ı vzorce (4)+(1)-((2)+(3)), kde hodnota (x) je hodnotou na souˇradnici oznaˇcenou x

pˇr´ıpadˇe se jedn´a pr´avˇe o rozd´ıl souˇctu jasu pixel˚u mezi dvˇema ˇci v´ıce oblastmi, tak jak jsem to jiˇz dˇr´ıve popisoval. Index j oznaˇcuje o kter´y klasifik´ator a pˇr´ıznak - o kter´y rys se jedn´a. Hodnota tj je tzv.

”prahov´a hodnota“. Tato hodnota se takt´eˇz z´ısk´a uˇcen´ım. Jde o to ji spr´avnˇe nastavit tak, aby klasifik´ator co nejl´epe oddˇeloval pozitivn´ı vzory od negativn´ıch. Pˇr´ıznak (fj) se porovn´av´a s prahem (tj) a podle toho, jak je to pro ´uspˇeˇsnost klasifik´atoru

v´yhodn´e mus´ı b´yt bud’ vˇetˇs´ı ˇci menˇs´ı. Hodnoat pj oznaˇcuje paritu, nab´yv´a hodnot −1 a 1 a

rozhoduje o smˇeru porovn´avac´ıho oper´atoru. V pˇr´ıpadˇe, ˇze klasifik´ator pˇrij´ım´a objekt pokud jeho pˇr´ıznak je vˇetˇs´ı neˇz dan´y pr´ah a pokud pouˇzijeme vzorec4.19, je parita pochopitelnˇe z´aporn´a a v d˚usledku jen ot´aˇc´ı znam´enko nerovnosti.

(31)

Algoritmus Ada-boost

• Vstupem algoritmu jsou dvˇe sady obr´azk˚u, jedna pozitivn´ı a druh´a negativn´ı. Kaˇzd´y obr´azek je pops´an dvoj´ıc´ı (x, y). Vˇsechny obr´azky pak posloupnost´ı (x1, y1), . . . , (xn, yn), kde n je celkov´y poˇcet obr´azk˚u pouˇzit´ych k uˇcen´ı, x je dan´y

obr´azek a y je bud’ 1 resp. 0 pokud se na obr´azku hled´an´y objekt vyskytuje a je tedy pozitivn´ı, resp. pokud je negativn´ı.

• Kaˇzd´y obr´azek z testovac´ı sady m´a tzv.

”v´ahu“ w1,i, kde prvn´ı index znaˇc´ı poˇrad´ı t popisuj´ıc´ı, kolik´at´y slab´y klasifik´ator se pouˇz´ıv´a.

• Inicializace vah - kaˇzd´a v´aha se nastav´ı na hodnotu w1,i = 2m1 ,2l1, kde m resp. l je

poˇcet negativn´ıch obr´azk˚u resp. pozitivn´ıch obr´azk˚u. • For t = 1, . . . , T :

1. Normalizace velikosti vah:

wt,i ←

wt,i

Pn

j=1wt,j

2. Kaˇzd´emu pˇr´ıznaku j, se natr´enuje klasifik´ator hj, kter´y pouˇz´ıv´a pouze tento

pˇr´ıznak a vypoˇc´ıt´a se jeho chyba j v z´avislostech na vah´ach wt podle vzorce:

j = n

X

i=1

wi|hj(xi) − yi|

3. Vybere se klasifik´ator ht s nejniˇzˇs´ı chybou t.

4. Pˇrepoˇc´ıtaj´ı se v´ahy jednotliv´ych obr´azk˚u podle vzorce: wt+1,i= wt,iβt1−ei

Kde ei= 0 pokud je obr´azek xi pozitivn´ı a ei = 1 pokud je obr´azek negativn´ı.

Hodnota β je podle vzorce:

βt=

t

1 − t

• Koneˇcn´y siln´y klasifik´ator H(x) je z´ısk´an ze slab´ych klasifik´ator˚u: H(x) =



1 PT

t=1αtht(x) ≥ 12PTt=1αt

0 jinak

Cel´y popsan´y algoritmus m˚uˇze b´yt nejasn´y, proto ho zde jeˇstˇe popisuji. V podstatˇe postu-puje tak, ˇze najde pokud moˇzno co nejlepˇs´ı klasifik´ator pro ohodnocen´e obr´azky. Potom vyhodnot´ı celou testovac´ı sadu a zmˇen´ı v´ahy obr´azk˚u tak, aby se dalˇs´ı klasifik´ator pˇredevˇs´ım vybral podle toho, jak um´ı klasifikovat obr´azky nespr´avnˇe klasifikovan´e pˇredeˇsl´ymi klasi-fik´atory.

Vytv´aˇren´ı rozhodovac´ıho stromu Anglick´y origin´al ˇcl´anku [14] popisuje tzv. ” Cas-cade“, kterou jsem pˇreloˇzil jako rozhodovac´ı strom. Rozhodovac´ı strom pouˇzit´y v tomto pˇr´ıpadˇe, je struktura, kter´a vezme urˇcit´y objekt a postupnˇe ho hodnot´ı a klasifikuje.

(32)

na obr´azku, kde je potˇreba vyhledat urˇcit´e objekty, jsou tyto objekty v menˇsinˇe. Tedy existuj´ı obrovsk´e plochy obrazu, kde se hledan´y objekt nevyskytuje, ˇcili je moˇzn´e pomˇernˇe velk´e oblasti vyˇradit z testov´an´ı dˇr´ıv a uˇsetˇrit t´ım v´ypoˇcetn´ı v´ykon. Druh´a ´uvaha se t´yk´a pouˇzit´eho prahu v algoritmu AdaBoost. V´ysledn´y prah siln´eho v´ysledn´eho klasifik´atoru je P

(t = 1)Tαt, pokud by byl prah o nˇeco niˇzˇs´ı zv´yˇsil by se v´yraznˇe poˇcet spr´avnˇe

dete-kovan´ych objekt˚u (DR), naopak by se ale tak´e zv´yˇsil poˇcet chybnˇe detekovan´ych objekt˚u (FAR). Posledn´ı ´uvaha se vˇenuje slab´ym klasifik´ator˚um. S vyuˇzit´ım jiˇz popsan´eho sn´ıˇzen´ı prahu, lze u prvn´ıch nalezen´ych klasifik´ator˚u dos´ahnout velmi vysok´e DR bl´ızk´e 100% za cenu pomˇernˇe vysok´e F AR napˇr. kolem 40% coˇz v d˚usledku znamen´a, ˇze se zam´ıtne ko-lem 60% klasifikovan´ych obr´azk˚u (v tomto pˇr´ıpadˇe klasifikovan´ym obr´azkem mysl´ım v´yˇrez v hlavn´ım obraze, kde pr´avˇe prob´ıh´a detekce objektu). Strom popisuje obr´azek 4.9.

Obr´azek 4.9: Obr´azek popisuje rozhodovac´ı strom pˇri zpracov´av´an´ı obr´azku. Posuzovan´ym obr´azkem se mysl´ı oblast - vyhled´avac´ı ok´enko na hlavn´ım obrazu, kde pr´avˇe prob´ıh´a de-tekce, stavy 1, 2 a 3 odpov´ıdaj´ı skupin´am slab´ych klasifik´ator˚u.

Princip stromu je n´asleduj´ıc´ı. Vezme se ok´enko, ve kter´em prob´ıh´a detekce, a minim´aln´ı skupina slab´ych klasifik´ator˚u, kter´e vˇsak dohromady dosahuj´ı velmi velk´e DR i za cenu velk´e F AR. Pokud ok´enko - obr´azek projde, na obr´azku 4.9 tomu odpov´ıd´a hrana T, je posuzov´an dalˇs´ı skupinou slab´ych klasifik´ator˚u, ovˇsem niˇzˇs´ı F AR a bohuˇzel i DR. Takto se detekce zpˇresˇnuje aˇz po posledn´ı, nejpˇr´ısnˇejˇs´ı skupinu klasifik´ator˚u, kter´a rozhodne, zda se jedn´a o hled´an´y objekt. Pokud nˇekter´y stav (ˇcili jeho skupina klasifik´ator˚u) dan´y obr´azek zam´ıtne odch´az´ı se ze stromu hranou oznaˇcenou F a posuzovan´y obr´azek se zavrhne a d´ale nezpracov´av´a. Zde je pr´avˇe princip zrychlen´ı pomoc´ı stromu, protoˇze vˇetˇsina obr´azku hledan´y objekt neobsahuje.

Nalezen´e pozitivn´ı objekty, kter´e byly detekov´any tak museli proj´ıt cel´y strom. Pokud by vˇetˇsinu obrazu tvoˇrily hledan´e objekty, rozhodovac´ı strom by se nemusel ˇcasovˇe vyplatit, protoˇze kaˇzd´y nalezen´y objekt by byl testov´an cel´ym stromem, tedy pradˇepodobnˇe i v´ıcekr´at stejn´ym klasifik´atorem ovˇsem s jin´ym prahem, coˇz by mohlo v´ysledek zpomalit.

Dle m´eho n´azoru by zaj´ımav´ym testem tohoto detektoru bylo, hledat urˇcit´y frakt´al v jeho frakt´alov´e grafice. Toto je ovˇsem mimo obor t´eto pr´ace, takˇze tuto myˇslenku nebudu d´ale rozv´ıjet.

Aˇz do ted’ jsem povaˇzoval slab´y klasifik´ator za klasifik´ator, kter´y pouˇz´ıv´a pouze jeden pˇr´ıznak, coˇz tak nemus´ı b´yt. Slab´y klasifik´ator m´a pouze horˇs´ı v´ysledky neˇz koneˇcn´y siln´y klasifik´ator a pˇr´ıznak˚u m˚uˇze obsahovat v´ıce.

Jak uˇz jsem naznaˇcil cel´y strom se skl´ad´a z takzvan´ych

References

Related documents

antioxidant enzyme assay indicated that there was marked increase in the level of lipid peroxidation and decrease in the level of antioxidant enzyme in hypothyroid and

Pervious pavement systems consist of a permeable pavement surface layer and one or more underlying aggregate layers designed to temporarily store stormwater.. Most pervious

─ is low (similar to concrete); HOWEVER a rock mass can have even less tensile strength..

or information about their expertise, which is repeated mainly with Negation feedback. Social: we mean context information related to a user’s role at work, and

21st Century Learning 22 Mobile Learning 26 Seamless Learning 26 Collaboration 27 Learner Autonomy 28 Presence 29 Critical Literacies 31 Transactional Distance 32

The long- term goal of this project is to introduce the notion of learning space and explore the role of the design of learning space context-aware ontologies with the ultimate aim

Relatively few outsiders had direct contact with these remote and closed societies, and little real knowledge needed obstruct the creative fantasy of elite ideologues, but

(2001) considers both the elderly population and welfare participants in Quebec, Canada and find that demand for essential drugs reacts less to the introduction of prescription