Ancient Maps Digitizing

(1)

VYSOK ´

E U ˇ

CEN´I TECHNICK ´

E V BRN ˇ

E

BRNO UNIVERSITY OF TECHNOLOGY

FAKULTA INFORMA ˇ

CN´ICH TECHNOLOGI´I

´

USTAV PO ˇ

C´ITA ˇ

COV ´

E GRAFIKY A MULTIM ´

EDI´I

FACULTY OF INFORMATION TECHNOLOGY

DEPARTMENT OF COMPUTER GRAPHICS AND MULTIMEDIA

DIGITALIZACE HISTORICK ´

YCH MAP

DIPLOMOV ´

A PR ´

ACE

MASTER’S THESIS

AUTOR PR ´

ACE

Bc. JOSEF POSP´I ˇ

SIL

AUTHOR

(2)

VYSOK ´

E U ˇ

CEN´I TECHNICK ´

E V BRN ˇ

E

BRNO UNIVERSITY OF TECHNOLOGY

FAKULTA INFORMA ˇ

CN´ICH TECHNOLOGI´I

´

USTAV PO ˇ

C´ITA ˇ

COV ´

E GRAFIKY A MULTIM ´

EDI´I

FACULTY OF INFORMATION TECHNOLOGY

DEPARTMENT OF COMPUTER GRAPHICS AND MULTIMEDIA

DIGITALIZACE HISTORICK ´

YCH MAP

ANCIENT MAPS DIGITIZING

DIPLOMOV ´

A PR ´

ACE

MASTER’S THESIS

AUTOR PR ´

ACE

Bc. JOSEF POSP´I ˇ

SIL

AUTHOR

VEDOUC´I PR ´

ACE

Ing. MICHAL ˇ

SPAN ˇ

EL

SUPERVISOR

(3)

Abstrakt

Tato práce se zabývá zpracován´ım historických map, konkrétnˇe jejich digitalizac´ı a vekto-rizac´ı. Zamˇeˇruje se na mapy z druhého vojenského mapován´ı a pokouˇs´ı se naj´ıt metody, které by mohli být uˇziteˇcné pro odstranˇen´ı textu z tˇechto map.

Kl´ıˇ

cov´

a slova

historické mapy, druhé vojenské mapován´ı, digitalizace, AdaBoost

Abstract

This work is about processing of historical maps, especially their digitizing and vecto-rization. The main focuses of this project are maps from the second historical military mapping and finding methods useful for removing texts from these maps.

Keywords

historical maps, the second historical military mapping, digitize, AdaBoost

Citace

Josef Posp´ıˇsil: Digitalizace historických map, diplomová práce, Brno, FIT VUT v Brnˇe, 2008

(4)

Digitalizace historick´

ych map

Prohl´

aˇ

sen´ı

Prohlaˇsuji, ˇze jsem tuto diplomovou práci vypracoval samostatnˇe pod veden´ım Ing. Mi-chala ˇSpanˇela. Uvedl jsem vˇsechny literárn´ı prameny a publikace, ze kterých jsem ˇcerpal, v seznamu literatury.

. . . . Josef Posp´ıˇsil 18. kvˇetna 2008

Podˇ

ekov´

an´ı

Rád bych podˇekoval Ing. Michalovi ˇSpanˇelovi za ˇcas, který mi vˇenoval. Dále bych rád podˇekoval veden´ı této fakulty za pruˇznost a ochotu reagovat na námˇety student˚u. Za pomoc také dˇekuji Doc. Dr. Ing. Pavlovi Zemˇc´ıkovi, nebot’ z jeho pˇredmˇet˚u o zpracován´ı obrazu vycház´ı tato práce a v neposledn´ı ˇradˇe Ing. Petrovi Pˇridalovi za pomoc pˇri návrhu této práce.

c

Josef Posp´ıˇsil, 2008.

Tato práce vznikla jako ˇskoln´ı d´ılo na Vysokém uˇcen´ı technickém v Brnˇe, Fakultˇe in-formaˇcn´ıch technologi´ı. Práce je chránˇena autorským zákonem a jej´ı uˇzit´ı bez udˇelen´ı oprávnˇen´ı autorem je nezákonné, s výjimkou zákonem definovaných pˇr´ıpad˚u.

(5)

Obsah

1 Uvod´ 7

2 Druhé vojenské mapován´ı 9

3 Digitalizace a vektorizace map 11

3.1 Sn´ım´an´ı map . . . 11

3.1.1 Ruˇcn´ı digitalizace . . . 11

3.1.2 Skenov´an´ı . . . 13

3.1.3 Shrnut´ı . . . 14

3.2 Georeferencov´an´ı . . . 14

4 Zpracován´ı obrazu 16 4.1 Obecný postup pˇri zpracován´ı obrazu . . . 16

4.1.1 Sn´ım´an´ı . . . 16

4.1.2 Digitalizace . . . 16

4.1.3 Pˇredzpracov´an´ı obrazu . . . 17

4.1.4 Segmentace . . . 17

4.1.5 Popis obrazu . . . 18

4.1.6 Klasifikace. . . 18

4.2 Form´aty pro uloˇzen´ı map . . . 18

4.2.1 Bezztrátové formáty . . . 18

4.2.2 Ztrátové formáty . . . 19

4.3 Upravy obrazu´ . . . 20 4.3.1 Prahov´an´ı. . . 20 4.3.2 Dilatace a eroze. . . 20 4.3.3 Metody ”zamalov´an´ı“ . . . 23 4.4 Detekce v obraze . . . 24

4.4.1 Metody zaloˇzen´e na hled´an´ı podle barvy . . . 24

4.4.2 Metody na detekci hran . . . 24

4.4.3 Detektory objekt˚u . . . 25

5 Návrh 36 5.1 Návrh pouˇzit´ı metod na nalezen´ı nápis˚u na mapˇe . . . 36

5.1.1 Vyuˇzit´ı metody zaloˇzené na hledán´ı podle barvy nápisu . . . 37

5.1.2 N´avrh pouˇzit´ı metod na detekci hran. . . 37

5.1.3 N´avrh na pouˇzit´ı detektoru objekt˚u . . . 41

5.2 Návrh metod pouˇzitelných pro odstranˇen´ı vyhledaných nápis˚u . . . 45

(6)

6 Implementace 48

6.1 N´astroje pouˇzit´e pˇri implementaci . . . 48

6.1.1 Knihovna OpenCV . . . 48

6.1.2 Implementaˇcn´ı prostˇred´ı . . . 49

6.2 Hled´an´ı n´apis˚u . . . 49

6.2.1 Vytvoˇren´ı detektoru . . . 49

6.2.2 Detekce . . . 51

6.3 Odstranˇen´ı n´apis˚u . . . 53

6.3.1 Prahov´an´ı. . . 54

6.3.2 Optimalizace v´ysledk˚u . . . 54

6.4 Zaplnˇen´ı m´ısta po n´apisech . . . 54

7 Mezivýsledky, testy, moˇznosti rozˇs´ıˇren´ı 55 7.1 Postupné výsledky . . . 55

7.1.1 Detekce textu . . . 55

7.1.2 Odstranˇen´ı textu z detekovan´ych oblast´ı . . . 59

7.1.3 Zaplnˇen´ı m´ısta po n´apisu . . . 61

7.2 Testy. . . 61

7.2.1 Test mnoˇzstv´ı zpracovan´ych n´apis˚u . . . 61

7.2.2 Test jin´eho typu p´ısma, na svˇetl´em pozad´ı. . . 61

7.2.3 Závˇer testován´ı - zhodnocen´ı výsledk˚u . . . 62

7.3 Moˇznosti rozˇs´ıˇren´ı . . . 64

8 Z´avˇer 66

Literatura 68

(7)

Kapitola 1

´

Uvod

´

Ukolem vˇedy a vˇedˇen´ı nen´ı jen usnadˇnovat lidem ˇzivot, ale také rozˇsiˇrovat jejich zájem o okoln´ı svˇet. S rostouc´ım mnoˇzstv´ım informac´ı o tomto svˇetˇe a s rostouc´ı hloubkou, do jaké ve vˇedˇe pronikáme, jiˇz nen´ı moˇzné uchovávat informace pouze ústnˇe. Je potˇreba nacházet stále nová média, kde lze vˇedˇen´ı zaznamenávat a uchovávat. Jiˇz od poˇcátku byla v lidech touha nˇeco po sobˇe zanechat, nˇeco zaznamenat, nˇeco pˇredat dalˇs´ım generac´ım, aby se pouˇcili a ve výzkumu zaˇcali tam, kde minulá generace skonˇcila.

Prvotn´ı formu pˇredáván´ı informac´ı by se dalo spatˇrit v obrázc´ıch na zdech jeskyn´ı,(k rozvoji ˇreˇci a komunikace mezi lidmi uˇz zab´ıhat nebudu) pˇres vˇsechny napodobeniny a sochy z r˚uzných materiál˚u aˇz k rozvoji p´ısma a matematiky. P´ısmo pak mˇelo za následek rozvoj p´ısemného uchováván´ı informac´ı. O p´ısmu by se vlastnˇe dalo ˇr´ıci, ˇze jde o prvn´ı záznam s digitáln´ımi parametry. Oproti obraz˚um bylo moˇzné knihy reprodukovat (opisovat) bez ztráty obsahu a tedy kvality, naopak pˇri replikaci obrazu mohlo a stále docházelo ke zmˇenám. Dá se to naznaˇcit na pˇr´ıkladˇe. Pˇredstavme si, ˇze neznámý mal´ıˇr vytvoˇr´ı mapu starovˇekého ˇR´ıma. Vojev˚udce Maximus by rád ˇR´ım dobyl a proto si nechá tajnˇe mapu pˇremalovat, pˇri tom vznikne v replikaci nˇekolik, moˇzná bezvýznamných chyb. Jeˇstˇe dˇr´ıvˇe, neˇz stihne Maximus ˇR´ım dobýt, nechaj´ı se z jeho repliky mapy vytvoˇrit dalˇs´ı kopie pro jeho velitele a na jejich mapách uˇz budou jednak chyby vzniklé pˇri prvn´ı replikaci plus chyby vzniklé pˇri dalˇs´ıch replikac´ıch. Z map také stáˇr´ım zmiz´ı spousta detail˚u a koneˇcnˇe t´ım dojde k neopravitelné degeneraci informac´ı na tˇechto mapách. Neopravitelné jsou i proto, ˇze ˇR´ım pˇred nˇekolika lety, kdy se tato mapa vytváˇrela, vypadal jinak. ˇCasem vˇzdy pˇrestanou u historických materiál˚u existovat zdroje tˇechto materiál˚u.

Pˇribliˇz´ım se v´ıce tématu historických map. Nab´ız´ı se otázka jak uchovávat staré mapy. Prakticky na kaˇzdém médiu, at’ uˇz jde o pap´ır, plátno, zed’ jeskynˇe ˇci cokoli jiného, docház´ı ˇ

casem k degradaci. Zat´ım nebylo nalezeno m´edium s

”nekoneˇcnou“ trvanlivost´ı. Existuje moˇznost data bez ztráty replikovat a uchovat na médiu, které nemá nekoneˇcnou trvanlivost, ale s moˇznost´ı data beze ztráty replikovat tak aby i replika repliky byla shodná se vzorem. Poté by bylo moˇzné data uchovávat tak, ˇze by se vˇzdy pˇrekop´ırovala na novˇejˇs´ı médium.

Proˇc ale uchovávat staré mapy, kdyˇz novˇejˇs´ı jsou pˇresnˇejˇs´ı a o to pˇrece u map jde? D˚uvod˚u je nˇekolik, jedn´ım z nich je i to, ˇze historická mapa je vˇetˇsinou malovaná a stejnˇe tak jako obrazy a jiná d´ıla z minulosti, má historickou a umˇeleckou hodnotu. Dalˇs´ım d˚uvodem proˇc spravovat historické mapy je moˇznost ˇcerpat z nich informace. Napˇr´ıklad srovnán´ı rozlohy les˚u, pol´ı vod a dalˇs´ıch pˇred 500 lety bývá zaj´ımavým údajem o tendenci vzestupu nebo sestupu tˇechto rozloh. Staré mapy obsahuj´ı cesty, které mohly vej´ıt v zapomnˇen´ı a pˇritom právˇe tyto cesty mohou pomoci naplánovat kudy vést novou silnici nebo turistickou trasu. Právˇe mnoho cest je zaloˇzeno na historických podkladech. Vˇsechny tyto informace

(8)

je zaj´ımavé z map z´ıskavat, coˇz lze nejlépe po digitáln´ım zpracován´ım.

C´ılem diplomové práce je hledán´ı zp˚usob˚u jak zpracovávat digitáln´ı mapy z druhého vojenského mapován´ı. Zamˇeˇruji se na nalezen´ı metod k identifikaci a odstranˇen´ı nápis˚u na mapách. Je to krok, který se dˇelá skoro pˇri kaˇzdé digitalizaci historických map. Samotné nápisy totiˇz na mapˇe zab´ıraj´ı hodnˇe m´ısta a pˇri rozkonponován´ı na urˇcité oblasti (lesy, louky, zástavba) by negativnˇe ovlivˇnovaly výsledky. Taktéˇz nápisy brán´ı pˇri hledán´ı cest na historických mapách. C´ılem moj´ı diplomové práce tedy je text rozliˇsit od ostatn´ıch prvk˚u mapy, zvláˇstˇe pak od cest, které se ˇcasto mohou s textem splést. Po proveden´ı nalezen´ı a od-stranˇen´ı textu se budu snaˇzit vhodnými metodami nahradit vzniklá m´ısta po odstranˇených nápisech.

Dalˇs´ım c´ılem této práce je lépe se seznámit s knihovnou OpenCV pro zpracován´ı obrazu, se zp˚usoby digitalizace historických map a s metodami na hledán´ı vzor˚u v obraze.

Výsledkem by mˇela být pˇrenositelná knihovna funkc´ı pro detekci a odstranˇen´ı nápis˚u z map z druhého vojenského mapován´ı a s funkcemi, které by mˇeli odhadnout p˚uvodn´ı povrch mapy, pˇred t´ım, neˇz na ni byl natisknut nápis.

Text je rozdˇelen do nˇekolika ˇcást´ı, prvn´ı se zabývá historickými mapami, kterým se tato práce vˇenuje, poté se zamˇeˇruji na základn´ı seznamen´ı se zp˚usoby jakým se mapy digitalizuj´ı a vektorizuj´ı. Postupnˇe se práce dostane pˇres teorii zpracován´ı obrazu k návrhu moˇznost´ı, jak odstranit text ze starých map. V návrhu je popsána vˇetˇsina nápad˚u, která doprovázela tento projekt. Nakonec se tato práce bude vˇenovat metodám, které byly aplikovány a posléze také zhodnocen´ım celé práce a diskuzi nad moˇzným rozˇs´ıˇren´ım.

Tato diplomová práce vycház´ı ze semestráln´ıho projektu, který rozˇsiˇruje o celou teorii detektor˚u a nˇekterých úprav obrazu, o celý návrh vˇsech pouˇzitých metod, kromˇe detekce hran. Dále pˇribyla implementace a zhodnocen´ı výsledk˚u.

(9)

Kapitola 2

Druh´

e vojensk´

e mapov´

an´ı

Kapitola nás seznamuje se základn´ımi informacemi o druhém vojenském mapován´ı. Mapy z nˇej jsou výchoz´ımi body pro tuto práci. Právˇe na nich se budu pokouˇset odstranit nápisy a pˇrekrýt je odhadnutým povrchem, který zast´ıraj´ı.

Obrázek 2.1: Ukázka mapy z druhého vojenského mapován´ı z let 1842–1852

Historická mapa 2.1 zobrazuje ˇcást dneˇsn´ıho územ´ı ˇCeské republiky (okol´ı Havl´ıˇckova Brodu) pˇred v´ıce jak 150-ti lety. Druhé vojenské mapován´ı téˇz nazývané Frantiˇskovo podle c´ısaˇre Frantiˇska II., na jehoˇz popud bylo provedeno, probˇehlo v letech 1806 aˇz 1866 na ´

uzem´ı Rakouska-Uherska.

Jeho vzniku pˇredcházela vojenská triangulace, která slouˇzila jako geodetický základ tohoto d´ıla, oproti I. vojenskému mapován´ı m˚uˇzeme tedy sledovat zvýˇsenou m´ıru pˇresnosti. Podkladem byly mapy Stabiln´ıho katastru v mˇeˇr´ıtku 1 : 2 880, coˇz mˇelo také pozitivn´ı vliv na pˇresnost map. Z výsledk˚u tohoto mapován´ı byly odvozeny mapy generáln´ı (1: 28 800) a speciáln´ı (1: 144 000).

(10)

Mapov´an´ı ˇCech probˇehlo v letech 1842–1852. Morava a Slezsko byly mapov´any v letech 1836–1840.

Mˇeˇr´ıtko mapov´an´ı bylo 1:28 800.

Obsahem map jsou cesty, zdˇené budovy a kamenné mosty. Z pˇr´ırodn´ıch prvk˚un to jsou pole, louky, pastviny, lesy, rybn´ıky a toky. Pro znázornˇen´ı terénu byly vyuˇzity Lehmannovy ˇsrafy, které znázorˇnovaly smˇer nejvˇetˇs´ıho spádu terénu a jeho velikost. Pomoc´ı grafického prot´ınán´ı byla zjiˇst’ována poloha vrcholových tvar˚u a pr˚ubˇeh ˇcar terénn´ı kostry. Mˇeˇren´ım nebo odhadován´ım úhl˚u sklonu byly z´ıskávány potˇrebné údaje k p˚udorysnému vyjádˇren´ı terénn´ıch ˇsraf. Z [3].

Lehmannovo ˇsrafován´ı vytváˇr´ı obraz reliéfu vypov´ıdaj´ıc´ı o smˇeru jeho nejvˇetˇs´ıho spádu i o jeho velikosti. Se vzr˚ustem sklonu se ˇsrafy zkracovaly. Kreslily se ve smˇeru spádnic a jejich s´ıla rostla v tomto odstupˇnován´ı: pˇri nulovém sklonu byl pomˇer st´ınu (ˇsrafy) ke svˇetlu (b´ılé mezeˇre) 0:9, pˇri pˇetistupˇnovém 1:8 a pˇri sklonu svahu 45◦ 9:0. Vodorovné a m´ırnˇe sklonˇené plochy z˚ustaly v mapˇe b´ılé, naopak strmé svahy byly zobrazeny silnými a krátkými ˇsrafami s úzkými b´ılými mezerami. Z [12].

Obsah mapy je v podstatˇe totoˇzný s I. vojenským mapován´ım, pˇridány byly pouze výˇsky trigonometrických bod˚u, avˇsak zobrazovaná situace se velmi liˇs´ı. Mapy II. vojenského ma-pován´ı vznikaly v dobˇe nástupu pr˚umyslové revoluce a rozvoje intenzivn´ıch forem zemˇedˇelstv´ı, kdy vzrostla výmˇera orné p˚udy za 100 let o 50% a lesn´ı plochy dosáhly u nás historicky nejmenˇs´ıho rozsahu. Pˇrevzato z [9] a z [7].

Jednotlivé ˇcásti celé mapy maj´ı jemné odliˇsnosti jasu v obraze, ale drˇz´ı jednotný styl, proto by aplikace mˇela m´ıt urˇcitý interval automatického nastaven´ı, aby byla schopna zpra-covávat vˇsechny mapy z tohoto mapovan´ı.

(11)

Kapitola 3

Digitalizace a vektorizace map

Kapitola o digitalizaci okrajovˇe popisuje proces pˇrevádˇen´ı existuj´ıc´ıch map do digitáln´ı podoby. Jelikoˇz se v diplomové práci zabývám sp´ıˇse aˇz samotnými úpravami digitaln´ıch map, nen´ı potˇreba do této ˇcásti hloubˇeji pronikat. Nˇekteré z informac´ı jsem z´ıskal z [8].

Zde lze nalézt odpovˇed na otázky proˇc digitalizaci map provádˇet, jak ji provádˇet a jak výsledná digitáln´ı data ukládat.

3.1 Sn´ım´

an´ı map

Tato kapitola se vˇenuje pˇrenosu map do digitáln´ı podoby, jejich vektorizac´ı a nˇekolika základn´ımi úpravami, aby mapy odpov´ıdali skuteˇcnosti a zachovávaly pomˇery vzdálenost´ı mezi jednotlivými objekty.

Na zaˇcátek bych poloˇzil otázku proˇc v˚ubec mapy digitalizovat? Je pravdou ˇze pˇri kaˇzdé digitalizaci z mapových podklad˚u jako je pap´ır, plátno nebo nˇeco podobného, docház´ı ke ztrátˇe dat. Je to souˇcást´ı pˇrevodu ze spojitého signálu, za který lze obraz povaˇzovat, do diskrétn´ıch hodnot, jenˇz potˇrebujeme pro uloˇzen´ı v poˇc´ıtaˇci. Toto je ovˇsem posledn´ı ztráta, která historický materiál potká. Poté lze tyto data libovolnˇe kop´ırovat bez nárustu chyb. Taktéˇz je lze mnohem lépe distribuovat ˇsirˇs´ı veˇrejnosti. Paradoxnˇe se pak moˇzná originál zachová v lepˇs´ım stavu, jelikoˇz bádán´ı historik˚u bude prob´ıhat vˇetˇsinou na digitáln´ı kopii tohoto dokumentu.

Existuje v´ıce metod pˇrenosu dat do poˇc´ıtaˇce, nyn´ı sezn´am´ıme se s tˇemi z´akladn´ımi.

3.1.1 Ruˇcn´ı digitalizace

Základn´ı metoda digitalizace klasických map na pap´ıˇre prob´ıhá tak, ˇze se stará mapa poloˇz´ı na digitalizaˇcn´ı zaˇr´ızen´ı a ruˇcnˇe se oznaˇcuj´ı vˇsechny významné body na mapˇe. Digitalizaˇcn´ı zaˇr´ızen´ı v tomto pˇr´ıpadˇe funguje podobnˇe jako touchpad. Pˇri digitalizaci se pouze dotekem pˇres pap´ır mapy zadávaj´ı významné body v mapˇe. Existuje nˇekolik základn´ıch typ˚u bod˚u jenˇz se zadávaj´ı. Bod m˚uˇze být jenom bod nebo je souˇcást´ı vetˇs´ıch objekt˚u tˇreba lomené ˇ

cáry nebo polygonu. Tyto objekty jsou poté definovány sadou bod˚u jenˇz se ruˇcnˇe zadaj´ı a poté se spoj´ı vektory. Pochopitelnˇe ˇc´ım v´ıce bod˚u se zadá, t´ım v´ıce se výsledek podobá originálu a lze dosáhnout ménˇe hranatˇejˇs´ıch tvar˚u. (viz. obrázek3.1).

Vˇetˇsinou lze body zadávat s velkou pˇresnost´ı, coˇz samozˇrejmˇe závis´ı take na obsluze tohoto zaˇr´ızen´ı, která body zadává. Pˇresto je obvykle nutné po zadán´ı vˇsech bod˚u mapy opˇet vˇsechny body proj´ıt a odstranit nˇekolik chyb v jejich zadán´ı. Existuj´ı dva základn´ı typy chyb - tzv. undershoots a overshoots coˇz by se dalo pˇreloˇzit jako nedostˇrelen´ı a pˇrestˇrelen´ı.

(12)

Obr´azek 3.1: Typy jednotliv´ych bod˚u pˇri digitalizaci

Tyto chyby jsou vˇetˇsinou d´any t´ım, ˇze cesty na mapˇe jsou obvykle zaznaˇceny vˇetˇs´ı ˇs´ıˇrkou ˇ

cáry neˇz v mapˇe ve vektorové podobˇe, takˇze pˇri zádáván´ı leˇz´ı nˇekteré body na okraji cesty a jiné na stˇredu cesty. Lépe to popisuje obrázek 3.2.

Obr´azek 3.2: Obvykl´e chyby pˇri ruˇcn´ı digitalizaci

Výsledek tohoto zp˚usobu digitalizace je také závislý na pˇresnosti staré mapy. Vˇetˇsinou je nutné tyto mapy poté tzv. georeferencovat tedy upravit je tak aby správnˇe vystihovaly pomˇery vzdálenost´ı mezi jednotlivými body. K této problematice se vrát´ım pozdˇeji.

V´yhody t´eto metody:

• Moˇznost okamˇzitˇe opravovat chyby a poˇskozené ˇcásti staré mapy

• ˇClovˇek jenˇz zaˇr´ızen´ı obsluhuje vˇetˇsinou velmi spolehlivˇe rozpoznává objekty mapy. • Vˇeci, které na starých mapách chyb´ı, lze okamˇzitˇe doplnit napˇr. z r˚uzných jiných

zdroj˚u. Zde z´aleˇz´ı na zkuˇsenosti obsluhy.

• Na konci této metody vznikne vektorizovaná mapa. Nevýhody této metody:

• Tento zp˚usob digitalizace je pracný a velmi ˇcasovˇe nároˇcný, coˇz je pˇr´ıˇcinou jeho vysoké ceny.

(13)

• V´ysledek ˇcasto velmi z´aleˇz´ı na zkuˇsenosti obsluhy.

• I od stejného ˇclovˇeka, který zaˇr´ızen´ı obsluhuje, mohou vyj´ıt r˚uzné výsledeky ovlivnˇené jeho momentáln´ım stavem (únava, stres, ospalost).

3.1.2 Skenov´an´ı

Druhou moˇznost´ı jak digitalizovat staré mapy je jejich skenován´ı. Zaˇr´ızen´ı pro tuto ˇcinnost je nˇekolik. Od tˇech nejjednoduˇs´ıch skener˚u pˇres fotoaparáty ke sloˇzitˇejˇs´ım zaˇr´ızen´ım. Vˇzdy vˇsak závis´ı na stavu daného skenovaného dokumentu, podle nˇeho se kupˇr´ıkladu m˚uˇzeme rozhodnout pro focen´ı, jelikoˇz je k nˇemu nejˇsetrnˇejˇs´ı.

Obrazy (mapy) které se maj´ı skenovat by mˇeli být v co nejlepˇs´ım stavu s minimáln´ım poˇctem nápis˚u. Skener pak pouze rozliˇsuje intenzitu a barvu jednotlivých pixel˚u a ukládá jejich hodnoty do rastru, coˇz je tabulka o velikosti obrazu, kde se jedna buˇnka nazýva pixel.

Tento rastr zat´ım neumoˇzˇnuje ˇsikovnˇe mapu vyuˇz´ıvat, jde totiˇz o pouhý obrázek v poˇc´ıtaˇci. Abychom mohli z map lépe z´ıskávat informace, je lepˇs´ı pˇrevést tuto rastrovou podobu mapy do podoby vektorové, kde vˇsechny objekty mapy jsou popsány matematicky pˇres oriento-vané úseˇcky a dalˇs´ı analytická primitiva. Vektorizace se provád´ı dvˇema metodami - au-tomatická vektorizace a manuáln´ı vektorizace. V závislosti na pouˇzité metodˇe vektorizace se vybere odpov´ıdaj´ıc´ı rozliˇsen´ı pˇri skenován´ı. Mnoho program˚u pro vektorizaci potˇrebuje aby veˇskeré ˇcáry na mapˇe byli minimálnˇe 3 pixely ˇsiroké aby se daly pˇrevést na vektory. V d˚usledku to pak znamená, ˇze by se mˇeli mapy skenovat alespoˇn s rozliˇsen´ım 200 dpi – 300 dpi. Toto rozliˇsen´ı se týká automatické vektorizace, pˇri pouˇzit´ı manuáln´ı vektorizaci postaˇc´ı rozliˇsen´ı od 75 dpi do 150 dpi

Automatick´a vektorizace

Tuto metodu je vhodné pouˇz´ıt pokud skenujeme velké mnoˇzstv´ı map v dobrém stavu. Také je dobré aby se na celé skenované mapˇe pouˇz´ıvala shodná oznaˇcen´ı pro stejné objekty, aby kaˇzdý typ cesty v mapˇe byl oznaˇcen ˇcárou urˇcité ˇs´ıˇrky a tato ˇs´ıˇrka se drˇzela v celé mapˇe. Dále je uˇziteˇcné m´ıt vˇsechny pr˚useˇc´ıky cest a jiných hraniˇcn´ıch oblast´ı vyznaˇceny velmi zˇretelnˇe a pro poˇc´ıtaˇc rozpoznatelnˇe. Cestou jsem v tomto popisu myslel i napˇr´ıklad hranici mezi lesem, loukou apod. Pˇri tomto automatickém zpracován´ı je taktéˇz potˇreba, aby mapy obsahovaly minimum popisk˚u a jiných podobných objekt˚u. V pˇr´ıpadˇe, ˇze budou vˇsechny objekty na mapˇe od sebe rozeznatelné, oddˇelitelné a aplikce pro vektorizaci správnˇe rozpozná vˇsechny typy cest, m´ısta odkud a kam vedou a kde se prot´ınaj´ı, bude nutný pouze malý poˇcet oprav po vektorizaci. Naopak pˇri nekvalitn´ım vstupu bude potˇreba hodnˇe mapu doopravovat. Výhody této metody:

• M˚uˇze b´yt velmi rychl´a.

• V porovnán´ı s ruˇcn´ı vektorizac´ı je levná. • Jej´ı výsledky jsou velmi pˇresné a správné. Nevýhody této metody:

• ˇSpatnˇe rozeznává text a málo obvyklé znaˇcky v mapˇe.

• Vyˇzaduje dobrou vstupn´ı mapu, kter´a spr´avnˇe a konzistentnˇe popisuje objekty v kra-jinˇe.

(14)

• Pˇri ˇspatném výsledku je potˇreba hodnˇe oprav, které jsou ˇcasovˇe a tedy i finanˇcnˇe nároˇcné.

Manu´aln´ı vektorizace

Tato metoda se pouˇz´ıvá ve dvou základn´ıch pˇr´ıpadech. V prvn´ım pˇr´ıpadˇe nelze vstupn´ı mapu vektorizovat automaticky a to kv˚uli kvalitˇe nevhodné pro automatickou digitalizaci. Ve druhém pˇr´ıpadˇe, pokud nemáme zaˇr´ızen´ı pro ruˇcn´ı digitalizaci, tak tuto digitalizaci, jejiˇz výstupem je vektorový obraz, provád´ıme na poˇc´ıtaˇci. Jde vlastnˇe o tu samou metodu ruˇcn´ı digitalizace, ovˇsem nyn´ı je vytváˇrena na poˇc´ıtaˇci. I zde docház´ı ke stejným chybám, jak bylo popsáno v podkapitole o ruˇcn´ı digitalizaci.

Výhodou této metody je to, ˇze s n´ı m˚uˇze zároveˇn pracovat v´ıce lid´ı. Kaˇzdý z nich zpracovává na poˇc´ıtaˇci urˇcitou ˇcást mapy. Taktéˇz je tato vektorizace snaˇzˇs´ı neˇz ruˇcn´ı di-gitalizace, protoˇze práce za poˇc´ıtaˇcem je ménˇe namáhavˇejˇs´ı neˇz práce u digitalizaˇcn´ıho zaˇr´ızen´ı pro ruˇcn´ı digitalizaci.

Nevýhodou této metody je opˇet jako u ostatn´ıch manuáln´ıch metod ˇcasová nároˇcnost a pracnost.

3.1.3 Shrnut´ı

Jelikoˇz nemám k dispozici zaˇr´ızen´ı pro ruˇcn´ı digitalizaci ani origináln´ı mapy, pouze jejich uˇz naskenované podoby, budu postupovat jako bych mapy z´ıskal skenován´ım. Ruˇcn´ı digitalizaci jsem zde uvedl pro úplnost metod pro digitalizaci map. V dalˇs´ıch kapitolách se nebudu zabývat formáty pro uloˇzen´ı vektorových dat. Moj´ı snahou je zat´ım pˇredpˇr´ıprava map pro automatickou vektorizaci. Tedy zamˇeˇren´ı se na odstranˇen´ı nˇekterých specifických objekt˚u z mapy. Pravdˇepodobnˇe tedy v˚ubec nebudu s vektorovými formáty pracovat.

3.2 Georeferencov´

an´ı

Georeferencován´ı map je transformace, pˇri které jsou mapy upravovány tak, aby v urˇcitém mˇeˇr´ıtku odpov´ıdaly pˇresnˇe skuteˇcnosti. U georeferencován´ı nynˇejˇs´ıch map je potˇreba vypoˇrádat se se zakˇriven´ım zemˇe. Je prakticky nemoˇzné pˇrenést na mapu skuteˇcný obraz krajiny z podstaty toho, ˇze jde o funkci z trojrozmˇerného prostoru do prostoru mapy, tedy prostoru dvojrozmˇerného. Pak tedy ˇc´ım je mapa vˇetˇs´ı t´ım v´ıce tam docház´ı k nepomˇer˚um.

Pˇri georeferenci se obecnˇe postupuje takto: nejdˇr´ıve se vybere nˇekolik skuteˇcných a známých referenˇcn´ıch bodu (nejménˇe tˇri) o kterých v´ıme, kde pˇresnˇe leˇz´ı a jak jsou od sebe vzdáleny, taktéˇz tyto body známe na mapˇe. Tyto body um´ıst´ıme v mˇeˇr´ıtku mapy pod tuto mapu a podle nich mapu morfujeme tak, aby tyto referenˇcn´ı body odpov´ıdaly bod˚um na mapˇe. ˇC´ım v´ıce bod˚u pouˇzijeme t´ım by mˇela býti mapa pˇresnˇejˇs´ı.

Pro zjiˇst’ovan´ı referenˇcn´ıch bod˚u se pouˇz´ıvá v´ıce metod, dnes je velmi obl´ıbené GPS. Nˇekdy je potˇreba i vyˇsˇs´ı pˇresnost neˇz má GPS (odchylka aˇz 7 metr˚u), pak je potˇreba pouˇz´ıvat hodnoty z pˇresnˇejˇs´ıch mˇeˇren´ı.

Georeferencován´ı u historických map je nutné proto, aby data zjiˇstˇené z historických map, napˇr. rozloha les˚u v roce 1850, odpov´ıdala skuteˇcnosti. Pˇri georeferenciaci historických map se vˇetˇsinou pouˇz´ıvá nová, uˇz georeferencovaná mapa, na kterou se historická mapa pasuje. Nejlépe tak, aby co nejv´ıce bod˚u v historické mapˇe odpov´ıdalo správným bod˚um v mapˇe nové. To, jak se ˇcasto historické mapy liˇs´ı od map nynˇejˇs´ıch- pˇresnˇejˇs´ıch, je vidˇet na obrázku 3.3, kde je pˇres sebe poloˇzená historická a nynˇejˇs´ı mapa Kypru. Zde se prakticky

(15)

bez sloˇzitˇejˇs´ı georeference nelze obej´ıt, nebot’ se mapy hodnˇe liˇs´ı a to nejenom v line´arn´ım mˇeˇr´ıtku.

(16)

Kapitola 4

Zpracov´

an´ı obrazu

Kapitola popisuje pomˇernˇe obecnˇe zpracován´ı obrazu, vˇenuje se základn´ımu postupu pˇri zpracován´ı obrazu. Popisuje moˇznosti jak obraz uloˇzit a jak lze který formát vhodnˇe pouˇz´ıt pro historické mapy. Taktéˇz jsou zde popsány barevné modely pro reprezentaci barev v ob-raze. Pˇrestoˇze se to týká této práce pouze okrajovˇe, mohou být právˇe barvy a tedy pouˇzit´ı barev nˇekterého barevného modelu d˚uleˇzitou souˇcást´ıˇreˇsen´ı nˇekterého problému pˇri analýze obrazu.

4.1 Obecn´

y postup pˇ

ri zpracov´

an´ı obrazu

Zde je velmi zkrácenˇe popsaný postup zpracován´ı obrazu. Tyto informace jsem ˇcerpal pˇredevˇs´ım ze zdroj˚u [18], [15] a [11].

4.1.1 Sn´ım´an´ı

Sn´ımán´ı obrazu je obecnˇe pˇrevod optické veliˇciny na elektrický signál, pˇriˇcemˇz optické veliˇciný nemus´ı být jen jas z kamery, ale mohou zde být i jiné veliˇciny napˇr. ultrazvuk nebo elektromagnetické záˇren´ı. V pˇr´ıpadˇe této práce nás vˇsak bude ze vˇseho nejv´ıce zaj´ımat jasová sloˇzka obrazu.

4.1.2 Digitalizace

Jak jsem jiˇz uvedl výˇse, u zpracován´ı map se jedná o pˇrevod analogového signálu do signálu digitáln´ıho. Digitáln´ı obraz, jak uˇz bylo ˇreˇceno, lze popsat funkc´ı f (x, y) kde x a y jsou souˇradnice v prostoru obrazu. Samotný obraz je pak z´ıskán vzorkován´ım obrazu do matice s M xN body a kvantován´ım do K úrovn´ı (urˇcujuj´ıc´ı jas a barevný odst´ın).

Velikost obrazu se obvykle udává v pixelech a rozliˇsen´ı odpov´ıdá pomˇeru poˇctu pixel˚u na palec. Pˇri n´ızkém rozliˇsen´ı docház´ı k velkým ztrátám informac´ı a naopak pˇri vysokém rozliˇsen´ı stoupá výpoˇcetn´ı nároˇcnost úprav na obraze. Vzorkován´ı by se mˇelo zvolit podle Shanonovy vˇety, která v tomto pˇr´ıpadˇe ˇr´ıká, ˇze vzorkovac´ı interval (vzdálenost mezi dvˇema nejbliˇzˇs´ımi vzorky) by mˇela být maximálnˇe polovina vzdálenosti dvou bod˚u, jenˇz chceme v obraze od sebe rozpoznat.

Jednotlivé vzorky lze ukládat do mˇr´ıˇzky, která m˚uˇze být napˇr. ˇctvercová nebo hexa-gonáln´ı. Kaˇzdá má své výhody, hexagonáln´ı nen´ı vhodná pro Fouriérovu transformaci, ale naopak pˇri ˇreˇsen´ı spojitosti objekt˚u v obraze je výhodnˇejˇs´ı neˇz mˇr´ıˇzka ˇctvercová.

(17)

Popis barev v obraze

Jak pˇresnˇe vypadá kaˇzdý pixel urˇcuje jeho odst´ın. Ten se dá zaznamenat pomoc´ı barevných model˚u. Nejpouˇz´ıvanˇejˇs´ı je model RGB.

Model RGB Popis barvy v tomto modelu je velmi bˇeˇzný, popisuje pixel pomoc´ı tˇr´ı barevných sloˇzek, které se aditivnˇe skládaj´ı. Barva se sloˇzkami 0, 0, 0 odpov´ıdá barvˇe ˇcerné, naopak barvˇe b´ılé odpov´ıdá barva se sloˇzkami 1, 1, 1. Jednotlivé sloˇzky oznaˇcuj´ı barvy red - ˇcervená, green - zelená a blue - modrá, které se skládaj´ı. V poˇc´ıtaˇcové grafice se sp´ıˇse pouˇz´ıvaj´ı hodnoty celých ˇc´ısel v rozmez´ı 0–255, coˇz je moˇzné zapsat na 8 bitech ˇcili na bajtu. Jelikoˇz má tento model tˇri sloˇzky pouˇz´ıvá se tzv. 24-bitová hloubka, odpov´ıdáj´ıc´ı tˇrem sloˇzkám po osmi bitech. Samozˇrejmˇe je moˇzné pouˇz´ıt vˇetˇs´ı ˇci menˇs´ı rozsah barev. Pˇri vytváˇren´ı odst´ınu mluv´ıme o kvantován´ı právˇe do sloˇzek mezi 0–255 na jedné sloˇzce. K popisu jedné barvy i v úrovni ˇsedi by mˇelo být pouˇzito minimálnˇe 50 úrovn´ı jasu. Model CMY, CMYK Jde o opaˇcný model modelu RGB. Barvy se nepˇriˇc´ıtaj´ı, ale odeˇc´ıtaj´ı od b´ılé. Rozd´ıl mezi CMYK a CMY je v tom, ˇze CMYK obsahuje nav´ıc ˇcernou barvu. Je sice pravda, ˇze ˇcerná by se mˇela dát sloˇzit ze sloˇzek CMY, ale v praxi, napˇr. v tisku, se pouˇz´ıvá ˇcerná zvláˇst’. Modelu CMYK odpov´ıdaj´ı sloˇzky cyan-azurová, magenta-purpurová, yellow-ˇzlutá a black ˇcerná.

Model HSI Tento model se liˇs´ı oproti pˇredchoz´ım model˚um v tom, ˇze jeho sloˇzky ne-odpov´ıdaj´ı základn´ım barvám, ale popisuj´ı tˇri vlastnosti jednotlivých barev hue-odst´ın, saturation-sytost, intensity-jas. Odst´ın urˇcuje barvu pixelu, sytost urˇcuje mnoˇzstv´ı b´ılé sloˇzky v barvˇe a jas urˇcuje kolik svˇetla daná barva odraz´ı, tedy jej´ı záˇrivost. paragra-phModel YUV Tento model se v poˇc´ıtaˇcové grafice pˇr´ıliˇs nepouˇz´ıvá. paragraphStupnˇe ˇsedi

ˇ

Casto se obraz zpracovává pouze ve stupn´ıch ˇsedi, jelikoˇz se takto daj´ı barvy mezi se-bou porovnávat. Stupeˇn ˇsedi se vypoˇc´ıtá z barevných sloˇzek modelu RGB, podle vzorce: I = 0, 299 ∗ R + 0, 587 ∗ G + 0, 144 ∗ B.

4.1.3 Pˇredzpracov´an´ı obrazu

Po digitalizaci obrazu je nˇekdy nutné obraz pˇredzpracovat. Zámˇerem pˇredzpracován´ı je odstranˇen´ı známých chyb z digitalizace a jeho pˇr´ıprava pro snaˇzˇs´ı identifikaci objekt˚u v ob-raze. Existuje velmi mnoho metod na pˇredzpracován´ı obrazu, vˇetˇsinou záleˇz´ı na tom, jak dále se má obraz zpracovávat. Obecnˇe lze tyto metody rozdˇelit do tˇr´ı skupin:

• Jasov´e transformace • Geometrick´e transformace • Filtrace a ostˇren´ı obrazu

4.1.4 Segmentace

Jedn´ım z nejtˇeˇzˇs´ıch krok˚u zpracován´ı obsahu obrazu je jeho segmentace. Jde o analýzu ob-razu, která má vést k nalezen´ı objekt˚u v obraze. Za objekty se zde povaˇzuj´ı ˇcásti obrazu, jeˇz jsou dále bodem zájmu v dalˇs´ım zpracován´ı. Výsledkem segmentace by mˇel být soubor ob-last´ı odpov´ıdaj´ıc´ı objekt˚um ve vstupn´ım obraze. Jedná se pak o tzv. kompletn´ı segmentaci. Pokud ale oblasti neodpov´ıdaj´ı pˇresnˇe objekt˚um, pak tuto segmentaci nazýváme ˇcásteˇcnou.

(18)

4.1.5 Popis obrazu

ˇ

Ctvrtým krokem je popis obrazu nebo téˇz popis nalezených objekt˚u z pˇredeˇslé segmentace. Existuj´ı dva základn´ı zp˚usoby popisu. Jeden je zaloˇzený na kvantitativn´ım pˇr´ıstupu, coˇz znamená popis objekt˚u pomoc´ı souboru ˇc´ıselných charakteristik. Mohou jimi být napˇr. velikost objektu, kompaktnost apod. Druhou moˇznost´ı je kvalitativn´ı pˇr´ıstup, ve kterém jsou popisovány vztahy mezi objekty a jejich tvarové vlastnosti. Zp˚usob popisu je zvolen podle zp˚usobu dalˇs´ıho vyuˇzit´ı. Ve vˇetˇsinˇe pˇr´ıpad˚u je tento popis vstupn´ı informac´ı pro rozpoznáván´ı objekt˚u. Výbˇer popisu je pak závislý na pouˇzitém rozpoznávac´ım algoritmu.

4.1.6 Klasifikace

Posledn´ım krokem pˇri zpracováván´ı obrazu je klasifikace objekt˚u. Ve vˇetˇsinˇe pˇr´ıpad˚u se jedná o zaˇrazen´ı objekt˚u nalezených v obraze do skupin pˇredem známých tˇr´ıd. Metody klasifikace objekt˚u se dˇel´ı do dvou základn´ıch skupin, které jsou úzce spjaty se zp˚usobem popisu objekt˚u. Jedná se o pˇr´ıznakové (statistické) rozpoznán´ı a strukturáln´ı rozpoznán´ı. Pˇr´ıznakové metody jsou zaloˇzeny na principu vyuˇzit´ı pˇr´ıznak˚u, coˇz je skupina ˇc´ıselných charakteristik objektu. Trénován´ı vlastn´ıho klasifikátoru zde m˚uˇze být s trénovac´ı sadou i bez n´ı na principu shlukové analýzy. Strukturáln´ı rozpoznáván´ı vyuˇz´ıvá jako vstupu kvalita-tivn´ı popis objekt˚u. Objekty jsou zde popsány primitivy. Dále je definována abeceda, jazyk popisu a gramatika jednotlivých tˇr´ıd. Vlastn´ı rozpoznáván´ı je pak zaloˇzeno na principu rozboru slova a kontroly správnosti syntaxe pro vˇsechny tˇr´ıdy. Celá podkapitola ˇcásteˇcnˇe citována z [1]. Klasifikace prob´ıhá, jak uˇz bylo ˇcásteˇcnˇe ˇreˇceno, pomoc´ı detektor˚u a detekce, v´ıce o ni pojednávám v ˇcásti o detekci.

4.2 Form´

aty pro uloˇ

zen´ı map

Jak uˇz jsem ve shrnut´ı v podkapitole o sn´ımán´ı map naznaˇcil, nebudu se zabývat vekto-rovými formáty pro ukládán´ı obrazu. Tato práce se sp´ıˇse zamˇeˇruje na práci s rastry a tedy hlavnˇe rastrovými formáty.

Soupis formát˚u urˇcitˇe nebude kompletn´ı, sp´ıˇs bych jenom rád pˇredstavil nˇekteré ze základn´ıch a nejbˇeˇznˇejˇs´ıch formát˚u pro uloˇzen´ı obrazu map a formáty se kterými budu v rámci této práce spolupracovat.

Na zaˇcátek bych rozdˇelil formáty do dvou skupin na ztrátové a bezztrátové. Kaˇzdá skupina má sv˚uj význam. Po naskenován´ı je vˇzdy vhodné uloˇzit naskenovanou mapu bez-ztrátovˇe, vyˇzaduje to sice vˇetˇs´ı prostorové nároky na uloˇzen´ı, ale jedná se o nejkvalitnˇejˇs´ı di-gitalizovanou podobu dokumentu. Ostatn´ı kopie tohoto dokumentu uˇz mohou být v r˚uzných formátech s r˚uzným rozliˇsen´ım, ale tento základ se vˇzdy uchovává.

4.2.1 Bezztrátové formáty

TIFF

Prvn´ı verze formátu TIFF (Tagged Image File Format) byla uvedena v roce 1987, ˇsestá a zat´ım posledn´ı specifikace pak v roce 1992. Vlastn´ıkem formátu TIFF je nyn´ı firma Adobe, která umoˇzˇnuje vyuˇzit´ı TIFFu zdarma.

TIFF je typickým pˇredstavitelem bitmapového formátu, tj. grafická informace je v nˇem vyjádˇrena formou matice obrazových bod˚u - pixel˚u, pˇriˇcemˇz u kaˇzdého pixelu je udána in-formace o jeho barvˇe. Nejvˇetˇs´ı výhodou uvedeného typu formát˚u je schopnost vˇerné

(19)

repre-zentace ”pˇrirozeného” obrazu (sejmutého napˇr´ıklad skenerem ˇci digitáln´ım fotoaparátem). Dalˇs´ımi výhodami jsou robustnost (nehroz´ı ztráta informac´ı pˇri pˇrenosu do jiného prostˇred´ı) a pomˇernˇe snadné zpracován´ı pˇri výstupu. Jednou z hlavn´ıch nevýhod je velký objem sou-bor˚u, rostouc´ı úmˇernˇe s rozmˇery a rozliˇsen´ım (redukci objemu nicménˇe napomáhaj´ı r˚uzné kompresn´ı bezztrátové algoritmy).

Na rozd´ıl od vˇetˇsiny ostatn´ıch bitmapových formát˚u mohou být dokumenty v TIFFu i v´ıcestránkové a d´ıky tomu v nich lze uloˇzit i pomˇernˇe velké bitmapy. Jak jiˇz oznaˇcen´ı ”tag-ged” naznaˇcuje, v TIFF souborech je moˇzno pouˇz´ıt r˚uzné tagy, tedy kl´ıˇcová slova popisuj´ıc´ı vlastnosti obrázku - toho je vyuˇzito k tvorbˇe r˚uzných rozˇs´ıˇren´ı a modifikac´ı. Obrázky ve formátu TIFF jsou schopny nést nejˇsirˇs´ı spektrum barevných informac´ı (ˇcernob´ılá grafika, odst´ıny ˇsedi, RGB, CMYK, CIELab, indexované barvy aj.). TIFF také podporuje vyuˇzit´ı ˇrady bezztrátových kompresn´ıch algoritm˚u (PackBits, LZW, Huffman RLE)a barevné pro-fily ICC. Oficiálnˇe je v TIFFu také moˇzno vyuˇz´ıt i ztrátovou JPEG kompresi, specifikace je vˇsak v tomto ohledu nepˇr´ıliˇs povedená.

Formát TIFF je zat´ım nejˇcastˇejˇs´ı zp˚usob ukládán´ı prvn´ıch naskenovaných map. ˇCasem moˇzná bude vytlaˇcen progresivnˇejˇs´ımi formáty, jako jsou PNG, PDF ˇci JPEG2000. Z ˇcásti citováno z [2].

BMP

BMP je dalˇs´ı bitmapový formát, který je ovˇsem kompatibiln´ı hlavnˇe v prostˇred´ı Windows. To ho odsunuje aˇz za formát TIFF ˇci PNG. Jelikoˇz vˇsak lze bez ztráty kvality tyto formáty pˇrevádˇet mezi tiffem a bmp, budu v pˇredpokládané knihovnˇe, kterou bych chtˇel vyv´ıjet ve Windows, tento formát pouˇz´ıvat pro testován´ı.

4.2.2 Ztrátové formáty

Ztrátové formáty dosahuj´ı obrovského zmenˇsen´ı velikosti souboru s digitalizovanou mapou. Mapy, které jsou takto zkomprimovány se hod´ı pro lepˇs´ı pˇrenositelnost napˇr. pro pouˇzit´ı na webu nebo pˇri prezentac´ıch. Pˇri vhodnˇe zvolené m´ıˇre komprese docház´ı, jak uˇz bylo ˇreˇceno, k obrovskému sn´ıˇzen´ı velikosti dat obrazu pˇri minimáln´ı, lidsky rozeznatelné ztrátˇe kvality. Monopost v tˇechto formátech nyn´ı drˇz´ı formát jpeg, který také v této práci pouˇz´ıvám k prezentaci výsledk˚u.

JPEG

Formát jpeg je zaloˇzen na Fourierovˇe transformaci (diskrétn´ı kosinová transformace) -vyuˇz´ıvaj´ıc´ı pˇri komprimaci obrázku sinusových funkc´ı - avˇsak bere obrázek po malých ˇ

ctvercových bloc´ıch. Popisy tˇechto blok˚u jsou pak v komprimovaném souboru uloˇzeny v poˇrad´ı, odpov´ıdaj´ıc´ım rozkladu obrázku smˇerem shora dol˚u. To vede k riziku naruˇsen´ı vizuáln´ı vˇernosti po dekomprimaci. Pˇrechody jednotlivých blok˚u mohou být vˇsak viditelné. Jeho hlavn´ı plánované pouˇzit´ı je na webu pro komprimován´ı fotografi´ı. Pˇri komprimaci obrázku s textem docház´ı k dosti výrazné ztrátˇe kvality na vysoce kontrastn´ıch hranách. Pro pouˇzit´ı s mapovým materiálem se nehod´ı, vyuˇzitelný je pravdˇepodobnˇe pouze pˇri pre-zentaci map nebo pˇri jejich pˇrenosu jako takovém, kde je tˇreba pˇrenést co nejvˇetˇs´ı mnoˇzstv´ı map na omezeném datovém prostoru.

Tento formát je volnˇe ˇs´ıˇritelný a velice rozˇs´ıˇrenˇe pouˇz´ıvaný. Je snaha nahradit formát JFIF formátem JPEG 2000 zaloˇzeném na vlnkové transformaci s lepˇs´ımi kompresn´ımi výsledky. Nahrazen´ı vˇsak bude jeˇstˇe trvat a to d´ıky popularitˇe, kterou JPEG má.

(20)

4.3 Upravy obrazu

´

4.3.1 Prahov´an´ı

Prahován´ı je nejjednoduˇsˇs´ı a nejstarˇs´ı metoda segmentace. Patˇr´ı mezi nejpouˇz´ıvanˇejˇs´ı me-tody d´ıky své jednoduchosti a rychlosti. Pracuje obvykle s jasovou sloˇzkou obrazu tedy s ˇsedotónovým obrazem. U kaˇzdého pixelu obrazu porovnává jas pixelu a daný práh a podle nastaven´ı funkce zmˇen´ı hodnotu jasu pixelu. Lze pouˇz´ıt v´ıce prah˚u a rozdˇelit pixely do urˇcitých skupin (segmentace) podle velikosti jejich jasu. Obvyklé pouˇzit´ı je ovˇsem pouze s jedn´ım pevnˇe daným prahem, které popisuje následuj´ıc´ı rovnice.

g(x, y) =

1 f (x, y) ≥ T

0 f (x, y) < T (4.1)

Kde funkce g(x, y) je výsledný obraz odpov´ıdaj´ıc´ı masce po prahovan´ı podle hodnot jeho pixel˚u. Funkce f (x, y) obsahuje hodnotu jasu daného pixelu. Hodnota T odpov´ıdá hodnotˇe prahu.

Jsou dalˇs´ı moˇznosti jak upravit prahován´ı hodnoty masky. Výsledkem nemus´ı být pouze 1 nebo 0, ale v pˇr´ıpadˇe prvn´ı moˇznosti m˚uˇze obrázek pouˇz´ıt p˚uvodn´ı hodnoty pixelu m´ısto jedniˇcky nebo obrácenˇe. Variant je zde opravdu mnoho, ale kterou jsem jeˇstˇe nezm´ınil je adaptivn´ı prahován´ı. Zat´ım zvaˇzuji pouˇzit´ı jednoho stejného prahu pro celý obraz. Lze ovˇsem práh interaktivnˇe upravovat podle pr˚umˇerné velikosti jasu pouze v urˇcité oblasti. Takto lze obsáhnout m´ısta obrazu, která jsou napˇr´ıklad r˚uznˇe osvˇetlená.

Ukázka výsledku po prahován´ı je na obrázku4.1.

Obrázek 4.1: Výsledek po prahován´ı s pevnˇe daným prahem. Odfiltrovala se vˇsechna m´ısta s jasem vyˇsˇs´ım neˇz práh

4.3.2 Dilatace a eroze

Dilatace a eroze patˇr´ı do oblast´ı matematické morfologie op´ıraj´ıc´ı se o teorii bodových mnoˇzin. Kaˇzdý obraz lze totiˇz povaˇzovat za mnoˇzinu bod˚u - pixel˚u. Pro názornost celé ˇcásti a v rámci pˇredpokládaného pouˇzit´ı tˇechto operac´ı budu zvaˇzovat pouze binárn´ı (dvousloˇzkový

(21)

- ˇcerná/b´ılá) obraz. kapitola je inspirována ˇcást´ı matematická morfologie z ˇclánku [17], odkud jsou i doprovodné obrázky.

Pˇredpokládám binárn´ı obraz takový, ˇze ˇcerný pixel je oznaˇcen hodnotou jedna a b´ılý hodnotou nula. Vezmˇem si napˇr. objekt, který je popsán mnoˇzinou ˇcerných pixel˚u. Ve stˇredu pozornosti dilatace a eroze je pˇredevˇs´ım tvar takového objektu. Pomoc´ı tˇechto dvou operac´ı je moˇzno rekonstrovat poruˇsený tvar objektu nebo obraz postiˇzený drobným ˇsumem. Taktéˇz lze tyto operace pouˇz´ıt na zpracován´ı objektu napˇr. pro zjednoduˇsen´ı tvaru objektu a také jejich pomoc´ı zd˚uraznit strukturu objektu - ztenˇcován´ı, zesilován´ı apod.

Bin´arn´ı obraz

Necht’ mnoˇzina X je mnoˇzina objekt˚u a odpov´ıdá ˇcerným bod˚um na mnoˇzinˇe bod˚u obrazu. Kaˇzdý prvek mnoˇziny X je popsán dvojic´ı (x, y) oznaˇcuj´ıc´ı polohu prvku - bodu. Zbylé prvky obrazu, jeˇz nepovaˇzujeme za objekty, nazýváme pozad´ı. Binárn´ı obraz znaˇc´ım E2 a lze si ho pˇredstavit jako následuj´ıc´ı obrázek 4.2.

Obrázek 4.2: Vlevo je binárn´ı obraz a vpravo mnoˇzina X obsahuj´ıc´ı objekty binárn´ıho obrazu.

Pixel obrazu oznaˇcený kˇr´ıˇzkem z rohu do rohu je myˇslený poˇcátek. Na obrázku je na-staven na bod s oznaˇcen´ım (0, 0), coˇz jsou jeho souˇradnice v poˇcátku obrazu.

Realizace morfologick´e operace

Touto realizac´ı je myˇslena relace mezi mnoˇzinou objekt˚u z obrazu a menˇs´ı bodovou mnoˇzinou B, která se nazývá strukturn´ı element. Strukturn´ı element má definovaný stˇred, který ovˇsem nemus´ı leˇzet uprostˇred. Taktéˇz nemus´ı být na tomto stˇredu elementu ˇcerný bod - objekt. Pˇr´ıklady takových element˚u jsou na obr.4.3.

Obrázek 4.3: Typické strukturn´ı elementy. Kˇr´ıˇzkem je oznaˇcený myˇslený stˇred elementu

Morfologickou operaci si pˇredstav´ıme, jako bychom pohybovali strukturn´ım elementem B systematicky po celém obraze. Bod obrazu, který se shoduje s poˇcátkem souˇradnic

(22)

struk-turn´ıho elementu, nazýváme okamˇzitý bod. Výsledek relace mezi obrazem a strukturn´ım elementem zap´ıˇseme do okamˇzitého bodu obrazu.

Dilatace

Operaci dilatace oznaˇc´ım znakem ⊕. Tato operace skl´ad´a body dvou mnoˇzin pomoc´ı souˇctu souˇradnic jejich prvk˚u.

X ⊕ B = {d ∈ E2, d = x + b, x ∈ X, b ∈ B} (4.2) Pˇr´ıklad dilatace:

X = {(0, 1), (1, 1), (2, 1), (2, 2), (3, 0)} (4.3)

B = {(0, 0), (0, 1)} (4.4)

X ⊕ B = {(0, 1), (0, 2), (1, 1), (1, 2), (2, 1), (2, 2), (2, 3), (3, 0), (3, 1)} (4.5) Pˇr´ıklad popisuje obr´azek 4.4.

Obr´azek 4.4: Pˇr´ıklad dilatace

Pˇri dilataci se neˇcastˇeji pouˇz´ıvaj´ı strukturn´ı elementy s rozmˇery 3x3, obsahuj´ıc´ı vˇsech 9 bod˚u osmiokol´ı. Pˇri takové dilataci se okraje objekt˚u zvˇetˇs´ı o jeden bod. D´ıry a zálivy do maximáln´ı velikosti 2 bod˚u se zapln´ı.

Eroze

Operaci eroze oznaˇc´ım znakem . Tato operace skl´ad´a body dvou mnoˇzin pomoc´ı rozd´ıl˚u souˇradnic jejich prvk˚u.

X B = {d ∈ E2, d + b ∈ X, ∀b ∈ B} (4.6) Pˇr´ıklad eroze:

X = {(0, 1), (0, 2), (1, 0), (1, 1), (1, 3), (2, 0), (2, 1), (2, 2), (3, 1), (3, 2), (4, 2)}(4.7)

B = {(0, 0), (0, 1)} (4.8)

X B = {(0, 1), (1, 0), (2, 0), (2, 1), (3, 1)} (4.9) Pˇr´ıklad popisuje obr´azek 4.5.

Pˇri erozi se nejˇcastˇeji pouˇz´ıvaj´ı strukturn´ı elementy s rozmˇery 3x3, obsahuj´ıc´ı vˇsech 9 bod˚u osmiokol´ı. Pˇri takové erozi se okraje objekt˚u zmenˇs´ı o jeden bod. Osamˇelé body do maximáln´ı velikosti 2 bod˚u nebo ˇcáry o tlouˇst’ce 2 body zmiz´ı. Moˇzno pouˇz´ıt na odstranˇen´ı ˇsumu.

(23)

Obr´azek 4.5: Pˇr´ıklad eroze

4.3.3 Metody

”zamalov´an´ı“

Metody zamalov´an´ı je m˚uj voln´y pˇreklad z angliˇctiny tzv.

”Inpaint Methods“. Tyto metody slouˇz´ı obecnˇe k restauraci obrazu. Jejich úkolem je odstranit d´ıry, ˇskrábance a podobné vady z obrazu odhadnut´ım pixel˚u, které byli poˇskozeny. V pˇr´ıpadˇe mého pouˇzit´ı se pouˇzij´ı na odhad pixel˚u mapy, které byly pˇrepsány textem.

Metoda zamalov´an´ı od A. Telea

V´ıce o této metodˇe je v [13]. Pro úplnost zde uvád´ım princip této metody. Jedná se o pomˇernˇe rychlou metodu, která svými výsledky dosahuje kvalit podobných metod za-malován´ı, které jsou ovˇsem pomalejˇs´ı. Pracuje na základˇe této funkce:

Iq(p) = I(q) + ∆I(q)(p − q) (4.10)

Kde I(p) je hodnota jasu pixelu na bodˇe p, ∆I(q) je hodnota urˇcuj´ıc´ı postup zmˇeny jasu v okol´ı bodu q. Bod p v rovnici je bod na okraji oblasti, kterou zamalovávám a bod q bodem v oblasti bl´ızké bodu p ovˇsem takové, kde známe hodnoty pixel˚u.

Jelikoˇz takových bod˚u je v´ıce, spoˇc´ıtá se hodnota výsledného pixelu na bodˇe p takto: I(p) =

P

q∈O(p)w(p, q)[I(q) + ∆I(q)(p − q)

P

q∈O(p)w(p, q)]

(4.11) Kde O(p) je známá oblast bodu p a w(p, q) je váha vztahu mezi p a q. Je pochopitelné, ˇ

ze vˇetˇs´ı váhu budou m´ıt body bl´ıˇze bodu p. Postupnˇe se smˇerem od hranic celé oblasti zapln´ı. Pˇri tom docház´ı k propagaci jasových zmˇen ve známém okol´ı do zaplˇnované oblasti. Filtrace mediánem

Tato filtrace nen´ı pˇr´ımo metodou pro zamalováván´ı oblast´ı, nicménˇe na jednotlivé pixely pouˇzitelná je. Taktéˇz je pouˇzitelná pro pˇredzpracován´ı, coˇz vysvˇetl´ım v návrhu. Medián se ˇ

casto pouˇz´ıvá k odstranˇen´ı ˇsumu a obl´ıbený je pˇredevˇs´ım d´ıky své jednoduchosti. Algorit-mus výpoˇctu mediánu je popsán následuj´ıc´ımi tˇremi kroky jeˇz se aplikuj´ı na vˇsechny pixeli [i, j] obrazu A:

1. Naˇcti body (pixely) z intervalu [i − k, j − k][i + k, j + k] do pole M d´elky l = (2k + 1)2 2. Seˇrad’ pole M

3. Výstupn´ı obraz B[i, j] = M [(l − 1)/2] tedy vzniká tak, ˇze se pro kaˇzdý jeho pixel pouˇzije stˇredn´ı hodnota z oblasti o polomˇeru k okolo pixelu.

(24)

Oblasti okolo pixelu mohou m´ıt r˚uzné tvary. Obecnˇe medián niˇc´ı ostrý obraz, napˇr. na-prostým odstranˇen´ım tenkých kontrastn´ıch lini´ı.

4.4 Detekce v obraze

Tato ˇcást je teoretická a obsahuje vybrané metody detekce objekt˚u v obraze. Rozdˇeluji ji na tˇri hlavn´ı ˇcásti:

• Metody zaloˇzené na hledán´ı podle barvy nápisu. • Metody na detekci hran.

• Detektory objekt˚u.

Postupnˇe popisuji vˇsechny tyto zp˚usoby detekce, vyb´ırám metody, jejichˇz moˇzné pouˇzit´ı popisuji v návrhu.

4.4.1 Metody zaloˇzen´e na hled´an´ı podle barvy

Na daném obraze se najdou vˇsechny pixely jejichˇz barevný odst´ın leˇz´ı v urˇcitém rozmez´ı. V grafickém programu Photoshop se dá tato metoda simulovat vˇsem známou kouzelnou h˚ulkou. Pˇresnˇeji by ˇsla tato metoda popsat následuj´ıc´ım postupem:

1. Zadá se referenˇcn´ı odst´ın pomoc´ı diskretizovaného barevného modelu RGB.

2. Pixel po pixelu se procház´ı celý obraz a hledaj´ı se podobnˇe barevné pixely. Podoba m˚uˇze být upravitelná pomoc´ı vˇetˇs´ı ˇci menˇs´ı tolerance barevného odst´ınu. Hledán´ı lze omezit napˇr. hledán´ım pouze sousedn´ıch pixel˚u.

3. Pomoc´ı vˇsech oznaˇcených a nalezených pixel˚u lze detekovat objekt barevnˇe odliˇsný od okol´ı.

V´ıce podobných metod lze z´ıskat odvozen´ım z pˇredeˇslého postupu. Varianty se mohou liˇsit napˇr. jiným zp˚usobem pouˇzit´ı tolerance. (tolerance pro kaˇzdý barevný odst´ın, pevná tolerance pro vˇsechny odst´ıny atd.)

4.4.2 Metody na detekci hran

V této podkapitole se po popisu konvoluce budu zabývat nejznámˇejˇs´ımy hranovými de-tektory. Konvoluc´ı se zabývám, protoˇze je základem dalˇs´ıch popsaných filtr˚u na detekci hran.

Konvoluce

Jelikoˇz lze obraz povaˇzovat za dvou-rozmˇerný signál, je moˇzné na nˇej pouˇz´ıt skládán´ı signál˚u neboli konvoluce. V praxi se toho vyuˇz´ıvá napˇr. k filtraci obrazu. Necht’ signál Ii,j

od-pov´ıdá signálu vstupn´ıho obrazu, hi,j odpov´ıdá signálu filtru, coˇz je vˇetˇsinou matice ˇc´ısel

o rozmˇerech 2k + 1 a Vi,j popisuje v´ystupn´ı obraz po filtrov´an´ı pomoc´ı konvoluce. Znak •

odpov´ıd´a operaci konvoluce. Pak plat´ı:

Vi,j= Ii,j• hi,j = k X x=−k k X y=−k Ii−x,j−yhi,j (4.12)

(25)

Je-li konvoluce uplatnˇena pouze jednou, lze mluvit o lineárn´ı transformaci obrazu. ˇCasto se vˇsak konvoluce pouˇzije dvakrát po sobˇe, napˇr. pˇri hledán´ı hran. Existuje v´ıce moˇznost´ı jaký druh konvoluˇcn´ıch jáder pro hledán´ı hran v obraze pouˇz´ıt.

Sobel˚uv filtr - konvoluˇcn´ı j´adra

Sobel˚uv filtr je jeden z nejznámˇejˇs´ıch detektor˚u hran. Pouˇz´ıvá dvou po sobˇe jdouc´ıch kon-voluc´ı s jádry: h1=   −1 0 1 −2 0 2 −1 0 1   h2=   −1 −2 −1 0 0 0 1 2 1  

Roberts˚uv filtr - konvoluˇcn´ı j´adra

Zde je filtr podobný tomu Sobelovu. Vyuˇz´ıvá tyto konvuluˇcn´ı jádra:

h1=   0 0 −1 0 1 0 0 0 0   h2 =   −1 0 0 0 1 0 0 0 0  

Prewittov´e filtr - konvoluˇcn´ı j´adra

Prewitt˚uv filtr pouˇz´ıv´a dvou po sobˇe jdouc´ıch konvoluc´ı s j´adry:

h1 =   1 1 1 0 0 0 −1 −1 −1   h2=   0 1 1 −1 0 1 −1 −1 0  

Kirsch˚uv filtr - konvoluˇcn´ı j´adra

Kirsh˚uv filtr pouˇz´ıv´a dvou po sobˇe jdouc´ıch konvoluc´ı s j´adry:

h1 =   3 3 3 3 0 3 −5 −5 −5   h₂=   3 3 3 −5 0 3 −5 −5 3  

Laplaci´an˚uv filtr - konvoluˇcn´ı j´adro

Laplacián vyuˇz´ıvá pouze jedno konvoluˇcn´ı jádro, toto jádro se liˇs´ı podle toho, jaké okol´ı vyhodnocovaného bodu budeme brát v potaz. Jedno z tˇechto jader pro 4-okol´ı má tvar:

h1 =   0 −1 0 −1 4 −1 0 −1 0   4.4.3 Detektory objekt˚u

Tato ˇcást obsahuje teoretický úvod k detekci, vysvˇetlen´ı základn´ıch pouˇz´ıvaných pojm˚u a vztah˚u. Popisuje pˇredevˇs´ım detektor navrhnutý Paulem Violem a Michaelem Jonesem.

Detektory objekt˚u lze pouˇz´ıt na rozpoznán´ı objekt˚u, maj´ıc´ıch urˇcité vlastnosti nebo pˇr´ıznaky. Existuje v´ıce základn´ıch typ˚u metod na rozpoznán´ı objekt˚u v obraze napˇr.:

(26)

• Strukturáln´ı rozpoznáván´ı

• Pˇr´ıznakové (statistické) rozpoznáván´ı Detekce objekt˚u - základn´ı pojmy

V detekci objekt˚u se pouˇz´ıvaj´ı pro detektory tyto pojmy:

• M´ıra správnˇe detekovaných objekt˚u (DR)- udává se v procentech a popisuje, kolik procent z hledaných objekt˚u na obraze detektor nalezl podle následuj´ıc´ıho vzorce:

DR = n

p (4.13)

Kde n je poˇcet správnˇe detekovaných objekt˚u na obraze, p je celkový poˇcet hledaných objekt˚u na obraze.

• M´ıra chybného pˇrijet´ı (F AR)- Pouˇz´ıvá se pro popis detektor˚u a popisuje kolik z na-lezených objekt˚u, nebylo hledanými objekty. Podle vzorce:

F AR = f n

n (4.14)

Kde n je poˇcet nalezených objekt˚u a f n je poˇcet chybných nález˚u. V této práci pouˇz´ıvám tento pojem také k obecnému oznaˇcen´ı detekc´ı, na které nebyl detektor urˇcen.

• Chybné nepˇrijet´ı (F RR)- popisuje kolik objekt˚u mˇelo být detekováno, ale nebylo. Udává se v procentech a poˇc´ıtá podle vzorce:

F RR = p − n

p (4.15)

Kde n je poˇcet nalezených a správnˇe detekovaných objekt˚u a p je celkový poˇcet hledaných objekt˚u na obraze.

Strukturáln´ı rozpoznáván´ı - obecný popis

Strukturáln´ı metody pracuj´ı na základˇe pˇresnˇe definovaného klasifikaˇcn´ıho stromu. Objekty lze popsat ˇretˇezcemi z abecedy a pomoc´ı gramatiky je zpracovávat. Laicky popsáno obraz se pˇresnˇe nasegmentuje a podle pˇresnˇe daných pravidel se jednotlivé objekty zaˇrad´ı do správné tˇr´ıdy. ˇCasto se tato metoda pouˇz´ıvá pro rozpoznán´ı dvou-rozmˇerných známých útvar˚u. Viz také [10].

Kromˇe parametr˚u jednotlivých objekt˚u v obraze se pracuje i s relacemi mezi objekty. Taková relace m˚uˇze být napˇr. dotek, pˇrekryt´ı, ohraniˇcen´ı atd.. Tyto relace je pak moˇzno hiearchicky uspoˇrádávat do rozhodovac´ıch graf˚u popsatelných gramatikami.

Mezi strukturáln´ı metody patˇr´ı napˇr. Houghova transformace, která kromˇe jiného hledá a rozpoznává geometrická primitiva v obraze. Viz dále.

Houghova transformce Houghova transformace je metoda pro nalezen´ı parametrického popisu objekt˚u v obraze. Pˇri implementaci je tˇreba znát analytický popis tvaru hledaného objektu. Proto je tato metoda pouˇz´ıvána pro detekci jednoduchých objekt˚u v obraze jakou jsou pˇr´ımky, kruˇznice, elipsy, atd. Houghova transformace je pouˇz´ıvána pˇredevˇs´ım pro seg-mentaci objekt˚u, jejichˇz hranice lze popsat jednoduchými kˇrivkami. Hlavn´ı výhodou této metody je robustnost v˚uˇci nepravidelnostem a poruˇsen´ı hledané kˇrivky. Citováno z [4].

(27)

Pˇr´ıznakové (statistické) rozpoznáván´ı - obecný popis

V tˇechto metodách je objekt popsán pˇr´ıznaky a podle pravdˇepodobnosti, jaký pˇr´ıznak maj´ı objekty v urˇcité tˇr´ıdˇe (skupinˇe shodných objekt˚u) se tyto objekty klasifikuj´ı a rozdˇeluj´ı do tˇr´ıd. Klasifikaci provád´ı klasifikátor, který by mˇel správnˇe detekovat a rozpoznat hledaný objekt.

Pro spr´avnˇejˇs´ı extrakci pˇr´ıznak˚u lze uˇz´ıt uˇcen´ı. Detektor Paula Viola a Michaela Jonese

Tento detektor objekt˚u patˇr´ı do skupiny pˇr´ıznakových metod. P˚uvodnˇe byl vytvoˇren pro detekci obliˇcej˚u v reálném ˇcase. Text je inspirován ˇclánkem [14], odkud pocház´ı i nˇekteré obrázky.

Tento detektor pracuje pouze s obrazem v ˇsedých odst´ınech, tedy pouze na základˇe jasu jednotlivých pixel˚u. Barevný pixel se na pˇrevede na tzv.

”stupnˇe ˇsedi“. Pˇrevod je popsán v kapitole o úpravách obrazu.

Jelikoˇz tento detektor patˇr´ı do tzv.

”pˇr´ıznakových“ metod, pracuje s pˇr´ıznaky. P˚uvodn´ı anglický název pˇr´ıznaku je

”Feature“, coˇz by se dalo pˇreloˇzit i jako ”rys“ ve významu vlastnosti (napˇr. povahový rys). V´ıc se tˇemto pˇr´ıznak˚um budu vˇenovat pozdˇeji. Taktéˇz tento detektor pracuje na speciálnˇe pˇredpˇripravených obrazech, ˇcemuˇz se vˇenuje následuj´ıc´ı ˇ

c´ast.

Pˇredpˇr´ıprava obrázku mapy V anglickém ˇclánku ([14]) tento pˇredpˇripravený obraz nazývaj´ı

”Integral Image“. Do ˇceˇstiny název nepˇrekládám. Pˇred pouˇzit´ım tohoto detek-toru je potˇreba ˇsedotonový obraz(pˇrevod z RGB popsán výˇse) pˇrevést právˇe na tento pˇredpˇripravený obraz.

Jelikoˇz pˇr´ıznaky, kterým bych se vˇenoval pozdˇeji, jsou urˇcovány z obdeln´ıkových výˇrez˚u p˚uvodn´ıho obrazu, je tato následuj´ıc´ı reprezentace pro jejich urˇcován´ı velmi výhodná.

Kaˇzd´a buˇnka v um´ıstˇen´ı odpov´ıdaj´ıc´ı um´ıstˇen´ı pixelu obrazu na souˇradnic´ıch x, y ob-sahuje souˇcet hodnot jasu pixel˚u z´aroveˇn nad n´ı a nalevo od n´ı. Matematicky to lze popsat takto:

b(x, y) = X

u<=x,v<=y

p(u, v) (4.16)

Funkce b(x, y) odpov´ıdá hodnotˇe v pˇredpˇripraveném obraze na souˇradnici [x, y], funkce p(u, v) odpov´ıdá hodnotˇe pixelu na souˇradnici [u, v].

Pˇri výpoˇctu v poˇc´ıtaˇci je pouˇzit rekurentn´ı vzorec, který umoˇzˇnuje spoˇc´ıtat poˇzadovaný obraz jedn´ım pr˚uchodem.

s(x, y) = s(x, y − 1) + p(x, y) (4.17) b(x, y) = b(x − 1, y) + s(x, y) (4.18) Funkce s(x, y) odpov´ıdá souˇctu pixel˚u v ˇradˇe. Celý vzorec ˇr´ıká, ˇze dalˇs´ı buˇnku spoˇc´ıtáme, kdyˇz vezmeme pixel odpov´ıdaj´ıc´ı buˇnce a k nˇemu pˇriˇcteme hodnotu buˇnky nad n´ım a vlevo od nˇeho. T´ımto zp˚usobem se vytvoˇr´ı celý pˇredpˇripravený obraz.

Pˇr´ıznaky Detekce prob´ıhá na základˇe pomˇernˇe jednoduchých rys˚u - pˇr´ıznak˚u. Pouˇzit´ı tˇechto rys˚u má oproti porovnáván´ı v rámci jednotlivých pixel˚u dvˇe výhody. Prvn´ı a d˚uleˇzitˇejˇs´ı je, moˇznost lepˇs´ıho vytvoˇren´ı obecného klasifikátoru. Jinými slovy lze mnohem lépe po-stihnout poˇzadovanou podobnost, narozd´ıl od porovnáván´ı pixel˚u, kde se sp´ıˇse pracuje

(28)

Obr´azek 4.6: Hodnota buˇnky v pˇredpˇripraven´em obraze na souˇradnic´ıch [x, y] je souˇcet vˇsech hodnot pixel˚u nalevo a nad touto souˇradnic´ı

se shodnost´ı. Klasifikátor pak v koneˇcné fázi dokáˇze lépe rozpoznávat objekty, které jsou pouze podobné objekt˚um, na které byl natrénován (trénován´ı klasifikátoru se budu vˇenovat pozdˇeji). Druhou výhodou je, rychlost testován´ı. Pokud by se mˇeli objekty se vzory po-rovnávat pixel po pixelu zabralo by to mnohem v´ıce ˇcasu. Takto leze pomˇernˇe velké plochy obrazu vylouˇcit z vyhledáván´ı mnohem dˇr´ıve. V pˇr´ıznac´ıch se vyuˇz´ıvá rozd´ılu v souˇctech jas˚u v urˇcitých oblastech. Existuje v´ıce základn´ıch rozloˇzen´ı oblast´ı, podle nichˇz se poˇc´ıtaj´ı rozd´ıly. Na obrázku4.7je nˇekolik typ˚u pˇr´ıznak˚u. Ve vylepˇsené verzi existuje i v´ıce pˇr´ıznak˚u napˇr. natoˇcených nejen do svislých a vodorovných poloh.

Vezmeme-li v potaz vzorové objekty, které jsou zpravidla 24x24 coˇz je rozliˇsen´ı detek-toru, poté nˇekolik typ˚u pˇr´ıznak˚u a spoustu variant jejich um´ıstˇen´ı je moˇzných pˇr´ıznak˚u velmi mnoho (pˇres 45 tis´ıc).

Právˇe zde v poˇc´ıtán´ı pˇr´ıznak˚u se vyplat´ı naˇse pokroˇcilá reprezentace obrazu, které jsme dosáhli v pˇredpˇr´ıpravˇe. Pˇredpokládejme, ˇze chceme vypoˇc´ıtat hodnotu pole D na obrázku

4.8. Popis výpoˇctu je pod obrázkem a je vidˇet, ˇze ho bylo dosaˇzeno pouze ˇctyˇrmi operacemi. Tedy s velmi malou výpoˇcetn´ı sloˇzitost´ı.

Pr˚ubˇeh skenován´ı Výbˇerem správných rys˚u urˇcuj´ıc´ı objekt se budu zabývat v ˇcásti o uˇcen´ı. Pˇredpokládejme, ˇze máme nˇekolik pˇr´ıznak˚u - rys˚u, které popisuj´ı objekt. Vy-hledávac´ım okýnkem se prohledá celý obraz a zjiˇst’uje se podobnost pˇr´ıznak˚u popisuj´ıc´ıch hledaný objekt s odpov´ıdaj´ıc´ımi pˇr´ıznaky zjiˇstˇených z vyhledávaj´ıc´ıho okna.

Hledané objekty se na obraze vyskytuj´ı v r˚uzném mˇeˇr´ıtku tedy v r˚uzných velikostech. Vˇetˇsina klasických vyhledávaˇc˚u toto ˇreˇs´ı tak, ˇze postupnˇe mˇen´ı velikost obrazu, na kterém se objekty hledaj´ı. Vypoˇc´ıtat ovˇsem nˇekolik des´ıtek zmenˇsenin obrazu je dosti výpoˇcetnˇe nároˇcná operace, jedná se o podvzorkován´ı, které lze poˇc´ıtat velmi dlouho. Pˇr´ıstup po-pisovaného vyhledávaˇce je jiný. Nevytváˇr´ı celou piramidu velikost´ı obrazu, ale zvˇetˇsuje vyhledávac´ı okénko a mˇen´ı pouze velikosti pˇr´ıznak˚u a jejich rozd´ılových hodnot. Tento výpoˇcet je pak uˇz docela rychlý oproti zmenˇsován´ı skuteˇcného obrazu.

(29)

Obrázek 4.7: Pˇr´ıklad obdéln´ıkových pˇr´ıznak˚u zobrazených na tzv. vyhledávaj´ıc´ım okénku. Souˇcet pixel˚u leˇz´ıc´ıch uvnitˇr b´ılých obdéln´ıkových ˇcást´ı v rámci pˇr´ıznaku ve výhledávac´ım okénku, je odeˇcten od souˇctu pixel˚u v ˇsedých obdéln´ıc´ıch. Zde jsou 4 typy pˇr´ıznak˚u. Na obrázc´ıch (A) a (B) jsou tzv. dvou-obdéln´ıkové pˇr´ıznaky, zamˇeˇruj´ıc´ı se na hrany, na obrázku (C) je troj-obdéln´ıkový pˇr´ıznak zamˇeˇruj´ıc´ı se na ˇcáry a na obrázku (D) je ˇctyˇr-obdéln´ıkový pˇr´ıznak sleduj´ıc´ı diagonáln´ı zmˇeny souˇctu.

AdaBoost Jeˇstˇe neˇz se zaˇcnu vˇenovat uˇcen´ı tohoto detektoru, je potˇreba vysvˇetlit pojem AdaBoost. Citováno z [16]. AdaBoost pˇri klasifikaci lineárnˇe kombinuje rozhodnut´ı nˇekolika ”jednoduˇsˇs´ıch“ klasifikátor˚u a potencionálnˇe tak dosahuje lepˇs´ıch výsledku, neˇz by bylo moˇzno dosáhnout pouˇzit´ım pouze jednoho klasifikátoru samostatnˇe.

V tomto popisovaném detektoru se k natrénován´ı klasifikátoru vyuˇz´ıvá trénován´ı. Uˇcen´ı klasifikátoru Jelikoˇz moˇzných pˇr´ıznak˚u lze z´ıskat mnohem v´ıce neˇz pixel˚u v ob-raze (pˇr´ıznaky se týkaj´ı vztah˚u mezi pixely a tedy jich m˚uˇze být mnoho násobnˇe v´ıc), je potˇreba vybrat nˇekolik d˚uleˇzitých pˇr´ıznak˚u, které co nejlépe postihuj´ı hledaný objekt. Z tˇechto nˇekolika pˇr´ıznak˚u se vytvoˇr´ı klasifikátor. Podle pˇredpokladu ve ˇclánku [14] opravdu staˇc´ı popsat objekt nˇekolika málo pˇr´ıznaky, problémem je, jak vybrat ty správné. Výbˇer nejlepˇs´ıch pˇr´ıznak˚u se provád´ı dohromady s vytváˇren´ım klasifikátoru pomoc´ı metody Ada-Boost.

Na zaˇcátku trénován´ı klasifikátoru je potˇreba m´ıt pomˇernˇe velkou sadu pozitivn´ıch obrázk˚u, jsou to ty, na kterých se vyskytuje hledaný objekt, a sadu negativn´ıch obrázk˚u, kde se objekt nevyskytuje. Pˇri trénován´ı se zkoumaj´ı jednotlivé moˇzné pˇr´ıznaky a hledá se ten, který nejlépe rozdˇeluje pozitivn´ı obrázky od negativn´ıch. Pouˇzit´ım jednoho pˇr´ıznaku vytváˇr´ıme tzv. slabý klasifikátor, lineárn´ı kombinac´ı tˇechto slabých klasifikátor˚u vzniká výsledný klasifikátor. Necht’ hj(x) je funkce popisuj´ıc´ı slabý klasifikátor. Má pouze dvˇe

moˇzné hodnoty 0 a 1, které bud’ znamenaj´ı, ˇze slabý klasifikátor objekt na obrázku x zam´ıtl (v pˇr´ıpadˇe hodnoty 0) nebo pˇrijal (v pˇr´ıpadˇe hodnoty 1). Pro upˇresnˇen´ı, pˇrijet´ım mysl´ım tu variantu, kdy se posuzovaný objekt porovnává s hledáným objektem a je urˇcen jako podobný.

hj(x) =

1 if pjfj(x) < pjtj

0 jinak (4.19)

(30)

Obrázek 4.8: Pˇr´ıklad poˇc´ıtán´ı souˇctu pixel˚u v poli D. Hodnota v m´ıstˇe oznaˇceném 1 na pˇredpˇripraveném obraze je souˇcet pixel˚u v poli A, hodnota s oznaˇcen´ım 2 je souˇcet pixel˚u v pol´ıch A a B, hodnota 3 je obdobnˇe souˇctem pol´ı A a C a hodnota 4 souˇctem A, B, C a D. Souˇcet pixel˚u v poli D lze vypoˇc´ıtat z hodnot na souˇradnic´ıch oznaˇcených 1, 2, 3 a 4 pomoc´ı vzorce (4)+(1)-((2)+(3)), kde hodnota (x) je hodnotou na souˇradnici oznaˇcenou x

pˇr´ıpadˇe se jedná právˇe o rozd´ıl souˇctu jasu pixel˚u mezi dvˇema ˇci v´ıce oblastmi, tak jak jsem to jiˇz dˇr´ıve popisoval. Index j oznaˇcuje o který klasifikátor a pˇr´ıznak - o který rys se jedná. Hodnota tj je tzv.

”prahová hodnota“. Tato hodnota se taktéˇz z´ıská uˇcen´ım. Jde o to ji správnˇe nastavit tak, aby klasifikátor co nejlépe oddˇeloval pozitivn´ı vzory od negativn´ıch. Pˇr´ıznak (fj) se porovnává s prahem (tj) a podle toho, jak je to pro úspˇeˇsnost klasifikátoru

výhodné mus´ı být bud’ vˇetˇs´ı ˇci menˇs´ı. Hodnoat pj oznaˇcuje paritu, nabývá hodnot −1 a 1 a

rozhoduje o smˇeru porovnávac´ıho operátoru. V pˇr´ıpadˇe, ˇze klasifikátor pˇrij´ımá objekt pokud jeho pˇr´ıznak je vˇetˇs´ı neˇz daný práh a pokud pouˇzijeme vzorec4.19, je parita pochopitelnˇe záporná a v d˚usledku jen otáˇc´ı znaménko nerovnosti.

(31)

Algoritmus Ada-boost

• Vstupem algoritmu jsou dvˇe sady obrázk˚u, jedna pozitivn´ı a druhá negativn´ı. Kaˇzdý obrázek je popsán dvoj´ıc´ı (x, y). Vˇsechny obrázky pak posloupnost´ı (x1, y1), . . . , (xn, yn), kde n je celkový poˇcet obrázk˚u pouˇzitých k uˇcen´ı, x je daný

obrázek a y je bud’ 1 resp. 0 pokud se na obrázku hledáný objekt vyskytuje a je tedy pozitivn´ı, resp. pokud je negativn´ı.

• Kaˇzdý obrázek z testovac´ı sady má tzv.

”váhu“ w1,i, kde prvn´ı index znaˇc´ı poˇrad´ı t popisuj´ıc´ı, kolikátý slabý klasifikátor se pouˇz´ıvá.

• Inicializace vah - kaˇzd´a v´aha se nastav´ı na hodnotu w1,i = _2m1 ,_2l1, kde m resp. l je

poˇcet negativn´ıch obr´azk˚u resp. pozitivn´ıch obr´azk˚u. • For t = 1, . . . , T :

1. Normalizace velikosti vah:

wt,i ←

wt,i

Pn

j=1wt,j

2. Kaˇzdému pˇr´ıznaku j, se natrénuje klasifikátor hj, který pouˇz´ıvá pouze tento

pˇr´ıznak a vypoˇc´ıtá se jeho chyba j v závislostech na vahách wt podle vzorce:

j = n

X

i=1

wi|hj(xi) − yi|

3. Vybere se klasifik´ator ht s nejniˇzˇs´ı chybou t.

4. Pˇrepoˇc´ıtaj´ı se váhy jednotlivých obrázk˚u podle vzorce: wt+1,i= wt,iβt1−ei

Kde ei= 0 pokud je obr´azek xi pozitivn´ı a ei = 1 pokud je obr´azek negativn´ı.

Hodnota β je podle vzorce:

βt=

t

1 − t

• Koneˇcný silný klasifikátor H(x) je z´ıskán ze slabých klasifikátor˚u: H(x) =

1 PT

t=1αtht(x) ≥ 1₂PTt=1αt

0 jinak

Celý popsaný algoritmus m˚uˇze být nejasný, proto ho zde jeˇstˇe popisuji. V podstatˇe postu-puje tak, ˇze najde pokud moˇzno co nejlepˇs´ı klasifikátor pro ohodnocené obrázky. Potom vyhodnot´ı celou testovac´ı sadu a zmˇen´ı váhy obrázk˚u tak, aby se dalˇs´ı klasifikátor pˇredevˇs´ım vybral podle toho, jak um´ı klasifikovat obrázky nesprávnˇe klasifikované pˇredeˇslými klasi-fikátory.

Vytváˇren´ı rozhodovac´ıho stromu Anglický originál ˇclánku [14] popisuje tzv. ” Cas-cade“, kterou jsem pˇreloˇzil jako rozhodovac´ı strom. Rozhodovac´ı strom pouˇzitý v tomto pˇr´ıpadˇe, je struktura, která vezme urˇcitý objekt a postupnˇe ho hodnot´ı a klasifikuje.

(32)

na obrázku, kde je potˇreba vyhledat urˇcité objekty, jsou tyto objekty v menˇsinˇe. Tedy existuj´ı obrovské plochy obrazu, kde se hledaný objekt nevyskytuje, ˇcili je moˇzné pomˇernˇe velké oblasti vyˇradit z testován´ı dˇr´ıv a uˇsetˇrit t´ım výpoˇcetn´ı výkon. Druhá úvaha se týká pouˇzitého prahu v algoritmu AdaBoost. Výsledný prah silného výsledného klasifikátoru je P

(t = 1)Tαt, pokud by byl prah o nˇeco niˇzˇs´ı zvýˇsil by se výraznˇe poˇcet správnˇe

dete-kovaných objekt˚u (DR), naopak by se ale také zvýˇsil poˇcet chybnˇe detekovaných objekt˚u (FAR). Posledn´ı úvaha se vˇenuje slabým klasifikátor˚um. S vyuˇzit´ım jiˇz popsaného sn´ıˇzen´ı prahu, lze u prvn´ıch nalezených klasifikátor˚u dosáhnout velmi vysoké DR bl´ızké 100% za cenu pomˇernˇe vysoké F AR napˇr. kolem 40% coˇz v d˚usledku znamená, ˇze se zam´ıtne ko-lem 60% klasifikovaných obrázk˚u (v tomto pˇr´ıpadˇe klasifikovaným obrázkem mysl´ım výˇrez v hlavn´ım obraze, kde právˇe prob´ıhá detekce objektu). Strom popisuje obrázek 4.9.

Obrázek 4.9: Obrázek popisuje rozhodovac´ı strom pˇri zpracováván´ı obrázku. Posuzovaným obrázkem se mysl´ı oblast - vyhledávac´ı okénko na hlavn´ım obrazu, kde právˇe prob´ıhá de-tekce, stavy 1, 2 a 3 odpov´ıdaj´ı skupinám slabých klasifikátor˚u.

Princip stromu je následuj´ıc´ı. Vezme se okénko, ve kterém prob´ıhá detekce, a minimáln´ı skupina slabých klasifikátor˚u, které vˇsak dohromady dosahuj´ı velmi velké DR i za cenu velké F AR. Pokud okénko - obrázek projde, na obrázku 4.9 tomu odpov´ıdá hrana T, je posuzován dalˇs´ı skupinou slabých klasifikátor˚u, ovˇsem niˇzˇs´ı F AR a bohuˇzel i DR. Takto se detekce zpˇresˇnuje aˇz po posledn´ı, nejpˇr´ısnˇejˇs´ı skupinu klasifikátor˚u, která rozhodne, zda se jedná o hledáný objekt. Pokud nˇekterý stav (ˇcili jeho skupina klasifikátor˚u) daný obrázek zam´ıtne odcház´ı se ze stromu hranou oznaˇcenou F a posuzovaný obrázek se zavrhne a dále nezpracovává. Zde je právˇe princip zrychlen´ı pomoc´ı stromu, protoˇze vˇetˇsina obrázku hledaný objekt neobsahuje.

Nalezené pozitivn´ı objekty, které byly detekovány tak museli proj´ıt celý strom. Pokud by vˇetˇsinu obrazu tvoˇrily hledané objekty, rozhodovac´ı strom by se nemusel ˇcasovˇe vyplatit, protoˇze kaˇzdý nalezený objekt by byl testován celým stromem, tedy pradˇepodobnˇe i v´ıcekrát stejným klasifikátorem ovˇsem s jiným prahem, coˇz by mohlo výsledek zpomalit.

Dle mého názoru by zaj´ımavým testem tohoto detektoru bylo, hledat urˇcitý fraktál v jeho fraktálové grafice. Toto je ovˇsem mimo obor této práce, takˇze tuto myˇslenku nebudu dále rozv´ıjet.

Aˇz do ted’ jsem povaˇzoval slabý klasifikátor za klasifikátor, který pouˇz´ıvá pouze jeden pˇr´ıznak, coˇz tak nemus´ı být. Slabý klasifikátor má pouze horˇs´ı výsledky neˇz koneˇcný silný klasifikátor a pˇr´ıznak˚u m˚uˇze obsahovat v´ıce.

Jak uˇz jsem naznaˇcil celý strom se skládá z takzvaných