Boosting and Evolution

(1)

VYSOK ´

E U ˇ

CEN´I TECHNICK ´

E V BRN ˇ

E

BRNO UNIVERSITY OF TECHNOLOGY

FAKULTA INFORMA ˇ

CN´ICH TECHNOLOGI´I

´

USTAV PO ˇ

C´ITA ˇ

COV ´

E GRAFIKY A MULTIM ´

EDI´I

FACULTY OF INFORMATION TECHNOLOGY

DEPARTMENT OF COMPUTER GRAPHICS AND MULTIMEDIA

BOOSTING A EVOLU ˇ

CN´I ALGORITMY

BAKAL ´

A ˇ

RSK ´

A PR ´

ACE

BACHELOR’S THESIS

AUTOR PR ´

ACE

MICHAL MRNU ˇ

ST´IK

AUTHOR

(2)

VYSOK ´

E U ˇ

CEN´I TECHNICK ´

E V BRN ˇ

E

BRNO UNIVERSITY OF TECHNOLOGY

FAKULTA INFORMA ˇ

CN´ICH TECHNOLOGI´I

´

USTAV PO ˇ

C´ITA ˇ

COV ´

E GRAFIKY A MULTIM ´

EDI´I

FACULTY OF INFORMATION TECHNOLOGY

DEPARTMENT OF COMPUTER GRAPHICS AND MULTIMEDIA

BOOSTING A EVOLU ˇ

CN´I ALGORITMY

BOOSTING AND EVOLUTION

BAKAL ´

A ˇ

RSK ´

A PR ´

ACE

BACHELOR’S THESIS

AUTOR PR ´

ACE

MICHAL MRNU ˇ

ST´IK

AUTHOR

VEDOUC´I PR ´

ACE

Ing. MICHAL HRADI ˇ

S

SUPERVISOR

(3)

Abstrakt

Tato práce pˇredstavuje kombinaci AdaBoostu a evoluˇcn´ıho algoritmu. Evoluˇcn´ı algoritmus je pouˇzit pro hledán´ı lineárn´ı kombinace Haarových pˇr´ıznak˚u. Z té je vytvoˇren slabý klasi-fikátor pro AdaBoost. Jsou zde popsány základy klasifikace, Haarovy pˇr´ıznaky a Adaboost. Uvedeny jsou také základn´ı informace o evoluˇcn´ıch algoritmech. Dále obsahuje teoretický popis spojen´ı AdaBoostu a evoluˇcn´ıho algoritmu, doplnˇený o nˇekteré implementaˇcn´ı de-taily. Implementace je testována na obrazových datech jako souˇcást systému pro detekci obliˇceje. Výsledky jsou porovnány se samostatnými Haarovými pˇr´ıznaky.

Kl´ıˇ

cov´

a slova

boosting, adaboost, evoluˇcn´ı algoritmy, rozpozn´av´an´ı vzor˚u, haarovy pˇr´ıznaky

Abstract

This thesis introduces combination of the AdaBoost and the evolutionary algorithm. The evolutionary algorithm is used to find linear combination of Haar features. This linear combination creates the feature to train weak classifier for AdaBoost. There are described basics of classification, Haar features and the AdaBoost. Next there are basic information about evolutionary algorithms. Theoretical description of combination of the AdaBoost and the evolutionary algorithm is included too. Some implementation details are added too. Implementation is tested on the images as part of the system for face recognition. Results are compared with Haar features.

Keywords

boosting, adaboost, evolutionary algorithms, pattern recognition, haar features

Citace

Michal Mrnuˇst´ık: Boosting a evoluˇcn´ı algoritmy, bakaláˇrská práce, Brno, FIT VUT v Brnˇe, 2008

(4)

Boosting a evoluˇ

cn´ı algoritmy

Prohl´

aˇ

sen´ı

Prohlaˇsuji, ˇze jsem tuto bakal´aˇrskou pr´aci vypracoval samostatnˇe pod veden´ım pana Ing. Michala Hradiˇse.

. . . . Michal Mrnuˇst´ık

12. kvˇetna 2008

Podˇ

ekov´

an´ı

Pˇredevˇs´ım bych chtˇel podˇekovat vedouc´ımu pr´ace Ing. Michalu Hradiˇsovi za kvalitn´ı veden´ı a podporu.

c

Michal Mrnuˇst´ık, 2008.

Tato práce vznikla jako ˇskoln´ı d´ılo na Vysokém uˇcen´ı technickém v Brnˇe, Fakultˇe in-formaˇcn´ıch technologi´ı. Práce je chránˇena autorským zákonem a jej´ı uˇzit´ı bez udˇelen´ı oprávnˇen´ı autorem je nezákonné, s výjimkou zákonem definovaných pˇr´ıpad˚u.

(5)

Obsah

1 Uvod´ 2

2 Klasifikace, rozpoznáván´ı vzor˚u a strojové uˇcen´ı 3

2.1 Klasifikace . . . 3

2.2 Uˇcen´ı klasifik´ator˚u . . . 3

2.3 AdaBoost . . . 4

2.4 Haarovy pˇr´ıznaky . . . 4

2.5 Kask´ada klasifik´ator˚u . . . 6

3 Evoluˇcn´ı algoritmy 8 3.1 Kˇr´ıˇzen´ı . . . 9

3.2 Mutace . . . 10

3.3 V´ybˇer . . . 10

4 Spojen´ı AdaBoostu a evoluˇcn´ıch algoritm˚u 12 4.1 Genom a pˇr´ıznaky . . . 12

4.2 Fitness funkce . . . 13

4.3 Pr˚ubˇeh evoluˇcn´ıho algoritmu . . . 13

5 Implementace 15 5.1 Tˇr´ıda TGAHaarFeatures . . . 15

5.2 Evoluˇcn´ı algoritmus . . . 15

5.3 Vyrovn´avac´ı pamˇet’ . . . 16

6 Testy 17 6.1 Parametry evoluˇcn´ıho algoritmu . . . 17

6.2 Tr´enovac´ı a testovac´ı data . . . 20

6.3 ROC kˇrivka . . . 20

6.4 Rychlost klasifik´atoru . . . 21

6.5 V´ysledky . . . 21

7 Z´avˇer 23 7.1 Genom, mutace a kˇr´ıˇzen´ı . . . 23

7.2 Fitness . . . 24

(6)

Kapitola 1

´

Uvod

ˇ

Clovˇek se odmaliˇcka uˇc´ı rozeznávat vˇeci okolo sebe pomoc´ı vˇsech svých smysl˚u. S rozvojem umˇelé inteligence se také stroje stávaj´ı schopnými uˇcit se a poznávat své okol´ı. T´ımto se zabývá strojové uˇcen´ı a rozpoznáván´ı vzor˚u. Pˇri z´ıskáván´ı informac´ı a komunikaci s okol´ım jsou nejd˚uleˇzitˇejˇs´ımi smysly zrak a sluch. Bylo vymyˇsleno mnoho metod jak zaˇr´ıdit, aby stroj slyˇsel nebo vidˇel a byl schopen tuto informaci dále zpracovat. Ty bývaj´ı vˇetˇsinou specializované na jeden konkrétn´ı problém. Existuj´ı tak systémy pro rozpoznáván´ı obliˇcej˚u, automobil˚u ˇci dalˇs´ıch objekt˚u v obraze.

Základn´ı informace o rozpoznáván´ı vzor˚u a strojovém uˇcen´ı jsou uvedeny v kapitole 2. Dále tato kapitola popisuje algoritmus pro strojové uˇcen´ı AdaBoost, z´ıskáván´ı informace z obrazu pomoc´ı Haarových pˇr´ıznak˚u a spojen´ı v´ıce klasifikátor˚u pomoc´ı tzv. kaskády.

U strojového uˇcen´ı je ˇcasto potˇreba vybrat vhodné ˇreˇsen´ı z velkého poˇctu moˇznost´ı. Pokud nen´ı k dispozici vhodný matematický postup, lze pouˇz´ıt evoluˇcn´ı algoritmy. Ty jsou zaloˇzeny na simulaci pˇrirozeného výbˇeru, který prob´ıhá v pˇr´ırodˇe. Schopnost pˇreˇz´ıt je vyjádˇrena schopnost´ı ˇreˇsit urˇcitý problém. Evoluˇcn´ım algoritm˚um se vˇenuje kapitola 3. Problematika evoluˇcn´ıch algoritm˚u je velmi rozsáhlá, proto jsou popsány jen principy a informace nutné k pochopen´ı dalˇs´ıch kapitol.

C´ılem této práce je vytvoˇrit funkˇcn´ı spojen´ı AdaBoostu a evoluˇcn´ıho algoritmu. V ideáln´ım pˇr´ıpadˇe bychom tak chtˇeli dosáhnout lepˇs´ıch výsledk˚u, neˇz poskytuj´ı stávaj´ıc´ı metody. Tato fáze byla ˇreˇsena v rámci semestráln´ıho projektu. Prezentované ˇreˇsen´ı bylo rozˇs´ıˇreno o pouˇzit´ı Haarových pˇr´ıznak˚u, proto je ve stávaj´ıc´ı podobˇe pouˇzitelná jen pro zpracován´ı obrazu. Teoretické ˇreˇsen´ı je popsáno v kapitole 4.

Toto spojen´ı bylo implementováno a pˇridáno do jiˇz existuj´ıc´ıho projektu, který je vyv´ıjen na Fakultˇe informaˇcn´ıch technologi´ı Vysokého uˇcen´ı technického v Brnˇe. Jedná se o systém slouˇz´ıc´ı k výzkumu klasifikátor˚u pro detekci objekt˚u v obraze. Podrobnˇe je popsán v ˇclánku [3]. Vybrané implementaˇcn´ı detaily jsou uvedeny v kapitole 5. Zdrojové kódy se nacházej´ı na pˇriloˇzeném CD.

Výsledný systém byl trénován a testován na obrazových datech pro detekci obliˇceje. Kapitola 6 pojednává o konfiguraci, jenˇz byla pouˇzita, a provedených testech. Obsahuje informace o trénovac´ıch a testovac´ıch datech. Výsledky test˚u jsou zhodnoceny a porovnány s výsledky, které byly z´ıskány za pouˇzit´ı samostatných Haarových pˇr´ıznak˚u.

Pˇri vytváˇren´ı této práce bylo odhaleno mnoho nedostatk˚u v evoluˇcn´ım algoritmu i cel-kovém návrhu metody. V závˇereˇcné kapitole 7 jsou uvedeny jak moˇznosti ˇreˇsen´ı tˇechto nedostatk˚u, tak i jiná vylepˇsen´ı, jenˇz by byla realizovatelná pˇri dalˇs´ım vývoji.

(7)

Kapitola 2

Klasifikace, rozpozn´

av´

an´ı vzor˚

u

a strojov´

e uˇ

cen´ı

V této kapitole se dozv´ıte o rozpoznáván´ı vzor˚u (viz [1]) a dalˇs´ı informace s t´ım spojené. Systémy pro rozpoznáván´ı vzor˚u se skládaj´ı z v´ıce ˇcást´ı. Nejdˇr´ıve je nutno naˇc´ıst vstupn´ı data a pokud nebudeme pracovat pˇr´ımo s nimi, tak z nich spoˇc´ıtat pˇr´ıznaky. Potom pˇrijde na ˇradu klasifikátor, který urˇc´ı tˇr´ıdu dat. Na té závis´ı výstup systému.

2.1

Klasifikace

Klasifikace je pˇriˇrazován´ı vzork˚u dat do tˇr´ıd. Vzorkem dat m˚uˇze být cokoli s ˇc´ım pracujeme, ale vˇetˇsinou se jedná o vektor ˇc´ısel. Tˇr´ıdou je oblast, do které m˚uˇze vzorek dat patˇrit. Klasifikátor je pravidlo, které pˇriˇrad´ı vzorek dat do tˇr´ıdy. Pokud se napˇr´ıklad snaˇz´ıme o rozpoznán´ı ˇreˇci, tak vzorek dat je zvukový signál. Tˇr´ıdami jsou jednotlivá slova nebo znaky. Pˇri detekci obliˇceje je vzorkem dat oblast obrazu. Jednou tˇr´ıdou jsou obliˇceje, druhou vˇse ostatn´ı (tzv. pozad´ı).

Vstupem klasifikátoru mohou být pˇr´ımo data, která ale bývaj´ı mnohorozmˇerná (napˇr. obraz má tolik rozmˇer˚u kolik pixel˚u), a tak se z nich ˇcastˇeji extrahuj´ı tzv. pˇr´ıznaky (fea-tures). T´ım sn´ıˇz´ıme poˇcet rozmˇer˚u dat, nejlépe na jeden. Bylo vypracováno mnoho metod jak toho dosáhnout. Pro obecná data lze pouˇz´ıt napˇr´ıklad PCA (Principal components analysis) nebo LDA (Linear discriminant analysis). Ty jsou zaloˇzeny na linárn´ı kombinaci a statistických metodách. Pro obrazová data se velmi osvˇedˇcily Haarovy pˇr´ıznaky (viz 2.4). Nejjednoduˇsˇs´ım pˇr´ıkladem klasifikátoru je mezn´ı hodnota (tzv. treshold), ta tvoˇr´ı hranici mezi tˇr´ıdami. Vˇsechny vzorky menˇs´ı neˇz mez jsou pˇriˇrazeny do jedné tˇr´ıdy, vˇetˇs´ı do druhé. Pokud je tˇreba rozliˇsovat v´ıce tˇr´ıd, pouˇzijeme v´ıce mezn´ıch hodnot a tˇr´ıdy budou ohraniˇceny ze dvou stran.

U klasifikátoru sledujeme nˇekolik hodnot. Celková chyba je pomˇer ˇspatnˇe urˇcených vzork˚u k celkovému poˇctu. Dále ve vztahu k jedné tˇr´ıdˇe sledujeme poˇcet prvk˚u, které byly do tˇr´ıdy chybnˇe pˇriˇrazeny (false positive) a tˇech, co do tˇr´ıdy patˇr´ı, ale byly pˇriˇrazeny jinam (false negative).

2.2

Uˇ

cen´ı klasifik´

ator˚

u

Pokud má klasifikátor dobˇre urˇcovat pˇr´ısluˇsnost k tˇr´ıdˇe, mus´ı se to nauˇcit. K tomu potˇrebujeme trénovac´ı mnoˇzinu dat. Jestli chceme zjistit nakolik bylo trénován´ı úspˇeˇsné, je

(8)

tˇreba m´ıt nav´ıc testovac´ı mnoˇzinu dat. Data v obou mnoˇzinách se mus´ı liˇsit, ale mus´ı být podobná reálnému nasazen´ı klasifikátoru. To znamená, ˇze pokud bude systém pouˇz´ıván v urˇcitém prostoru (laboratoˇr, továrn´ı hala), mˇely by data pocházet odtud. V podstatˇe staˇc´ı, pokud z daného prostoru budou pocházet vzorky pozad´ı (obraz haly, rachot stroj˚u). Vzorky detekované tˇr´ıdy (lidský hlas, obrazy obliˇceje) mohou být poˇr´ızeny jinde.

Klasifikátor se snaˇz´ı dosáhnout co nejlepˇs´ı úspˇeˇsnosti na trénovac´ıch datech. Na testo-vac´ı mnoˇzinˇe zkouˇs´ıme, jak je klasifikátor pouˇzitelný i pro jiná data neˇz ta, na kterých byl trénován. Se zvyˇsován´ım pˇresnosti na trénovac´ıch datech m˚uˇze zaˇc´ıt r˚ust chyba na tetso-vac´ıch datech. Docház´ı k tzv. pˇretrénován´ı. Pˇr´ıˇcinou je pˇr´ıliˇsné pˇrizp˚usoben´ı trénovac´ım dat˚um, které nenechává ˇzádný prostor pro odliˇsnosti testovac´ıch dat. Proto je nutné trénován´ı vˇcas ukonˇcit.

Existuj´ı dva zp˚usoby uˇcen´ı. Uˇcen´ı s uˇcitelem (supervised learning) a uˇcen´ı bez uˇcitele (unsupervised learning). Pˇri uˇcen´ı s uˇcitelem trénovac´ı data obsahuj´ı informaci o tˇr´ıdˇe, do které patˇr´ı. D´ıky tomu m˚uˇze klasifikátor sledovat, jak moc se mu daˇr´ı urˇcit správnou tˇr´ıdu a podle toho se pˇrizp˚usobovat. U uˇcen´ı bez uˇcitele klasifikátor ˇzádnou informaci o tˇr´ıdˇe nedostává. Snaˇz´ı se v datech naj´ıt podobnost a podle toho je rozdˇelit do pˇredem daného poˇctu shluk˚u (ten odpov´ıdá poˇctu tˇr´ıd). Svou úspˇeˇsnost hodnot´ı podle toho, jak se mu to podaˇrilo. Nevýhodné je, ˇze algoritmus nepozná, zda tˇr´ıdy rozdˇelil dobˇre, ani která tˇr´ıda je která. Proto se pˇri uˇcen´ı klasifikátor˚u vˇetˇsinou vyuˇz´ıvá uˇcen´ı s uˇcitelem.

2.3

AdaBoost

AdaBoost je algoritmus, který vyuˇz´ıvá lineárn´ı kombinace slabých klasifikátor˚u k dosaˇzen´ı lepˇs´ıho výsledku. U slabého klasifikátoru nám staˇc´ı, kdyˇz má chybu menˇs´ı neˇz 50 %. Na zaˇcátku je kaˇzdému vzorku pˇriˇrazena váha, která se ˇcasem mˇen´ı. Pokud je tˇr´ıda vzorku urˇcena ˇspatnˇe, jeho váha stoupá, pokud dobˇre, tak klesá. To znamená, ˇze se klade vˇetˇs´ı d˚uraz na ˇspatnˇe klasifikované vzorky. To zaruˇcuje, ˇze chyba postupnˇe klesá a ve vˇetˇsinˇe pˇr´ıpad˚u nedocház´ı k pˇretrénován´ı. Na druhou stranu je t´ım zp˚usobna citlivost v˚uˇci ˇsumu. V´ıce o AdaBoostu lze naj´ıt v [2] a [8], z kterých vycház´ı algoritmus 2.1.

2.4

Haarovy pˇ

r´ıznaky

Haarovy pˇr´ıznaky dobˇre uchovávaj´ı informace o obrazu, a proto se pouˇz´ıvaj´ı pro obrazová data. Lze je rychle spoˇc´ıtat a pokud je dobˇre vybereme (viz n´ıˇze), závis´ı jen na té ˇcásti obrazu, která je pro klasifikaci podstatná. D´ıky tomu je lze úspˇeˇsnˇe pouˇz´ıt pro tvorbu klasifikátor˚u.

Na obrázku 2.2 jsou dvojbarevné obdéln´ıky. To jsou pˇr´ıklady tvar˚u, kterých mohou Haarovy pˇr´ıznaky nabývat. Jejich velikost se m˚uˇze libovolnˇe mˇenit, ale pomˇer b´ılé a ˇcerné ˇ

cásti mus´ı být zachován. Pro obraz 24×24 pixel˚u je pˇr´ıznak˚u v´ıce neˇz 180 000. Z tohoto poˇctu je nutno vybrat ty, kterými jednotlivé tˇr´ıdy nejlépe rozliˇs´ıme. Klasifikátoru vˇetˇsinou nestaˇc´ı jeden pˇr´ıznak, ale je nutno pouˇz´ıt jejich kombinaci. V [7] je pro slabý klasifikátor pouˇzit pouze jeden pˇr´ıznak, coˇz je kompenzováno pouˇzit´ım v´ıce slabých klasifikátor˚u (viz 2.3).

Obraz, který vstupuje do systému, mus´ı být pˇreveden do stupˇn˚u ˇsedi. Hodnotou bodu je intenzita barvy v tomto bodˇe. Pˇr´ıznak spoˇc´ıtáme tak, ˇze pˇriloˇz´ıme obdéln´ık na obraz, seˇcteme hodnoty pixel˚u v b´ılé oblasti a odeˇcteme od souˇctu pixel˚u v ˇcerné oblasti. Pokud bychom mˇeli pˇri výpoˇctu procházet vˇsechny pixely dané oblasti, trval by pˇr´ıliˇs dlouho.

(9)

1. Na vstupu jsou tr´enovac´ı data (x1, y1). . .(xm, ym), kdexi∈X,yi∈Y ={−1,+1}.

X je mnoˇzina vstupn´ıch dat. Y je mnoˇzina tˇr´ıd.

2. Kaˇzdému vzorku dat ipˇriˇrad’ poˇcáteˇcn´ı váhuD1(i) = 1/m.

3. T je poˇcet prvk˚u (slabých klasifikátor˚u) výsledného silného klasifikátoru. Prot= 1, . . . T:

• Pomoc´ı vahDt, vyber slabý klasifikátor kt:X→ {−1,+1} s nejmenˇs´ı chybou (souˇctem vah vzork˚u, které slabý klasifikátor ˇspatnˇe urˇcil)t=

m

P

i:kt6=yi Dt(i).

• αt= 1₂ln1−_tt

• Pˇrepoˇc´ıtej v´ahy vzork˚u:

Dt+1(i) = Dt(i) Zt × ( e−αt _kdyˇ_z _k t(xi) =yi eαt _kdyˇ_z _k t(xi)6=yi Dt+1(i) = Dt(i) exp (−αtyikt(xi)) Zt

Zt je normalizaˇcn´ı faktor, zajiˇst’uj´ıc´ı, ˇze Dt má vlastnosti distribuˇcn´ı funkce (integrál je roven jedné) a spoˇc´ıtáme jej:

Zt= m

X

i=1

Dt(i) exp (−αtyikt(xi))

4. Výsledný silný klasifikátor je:

K(x) =        +1 kdyˇz T P t=1 αtkt(x)≥0 −1 kdyˇz T P t=1 αtkt(x)<0

Algoritmus 2.1: AdaBoost podle [2] a [8]

Obr´azek 2.2: Pˇr´ıklady haarov´ych pˇr´ıznak˚u

Tento problém ˇreˇs´ı tzv. integráln´ı obraz. U integráln´ıho obrazu je hodnota v jednom bodu souˇctem intenzit ve vˇsech bodech od tohoto bodu nahoru a doleva. Z toho lze jiˇz jednoduˇse spoˇc´ıtat souˇcet intenzit v obdéln´ıkové oblasti.

(10)

obrázek 2.3. Je na nˇem znázornˇen integráln´ı obraz, body a oblasti v nˇem. Naˇs´ım c´ılem je zjistit hodnotu oblasti D. Body w, x, y, z mus´ı být voleny jako na obrázku 2.3.A, B, C, D

jsou souˇcty intenzit v jednotliv´ych oblastech. Z rovnic

w = A

x = A +B

y = A +B+C+D

z = A +C

potˇrebujeme vyjádˇritDpomoc´ıw, x, y, z. Abychom toho dosáhli, vynásob´ıme nˇekteré rov-nice −1: w = A −x = −A−B y = A +B+C+D −z = −A−C Z toho z´ıskámeD=w−x+y−z.

Obrázek 2.3: Výpoˇcet obdéln´ıkové oblasti pomoc´ı integráln´ıho obrazu

2.5

Kask´

ada klasifik´

ator˚

u

V [7] je kromˇe AdaBoostu a Haarových pˇr´ıznak˚u uveden i postup jak výraznˇe urychlit klasifikaci. Je zobrazen na obrázku 2.4 a spoˇc´ıvá ve zˇretˇezen´ı klasifikátor˚u. Ty postupnˇe zpracovávaj´ı vzorky dat a rozhoduj´ı, zda patˇr´ı do detekované tˇr´ıdy. Pokud kterýkoli klasi-fikátor rozhodne, ˇze tam vzorek nepatˇr´ı, je zahozen a k dalˇs´ımu zpracován´ı uˇz nedocház´ı. Klasifikátor je nutno trénovat tak, aby zahodil co nejménˇe prvk˚u, které do tˇr´ıdy patˇr´ı (co nejmenˇs´ı false negative). Na konci z˚ustanou vzorky, co do tˇr´ıdy patˇr´ı. M˚uˇze to být i za cenu v´ıce vzork˚u do tˇr´ıdy chybnˇe zaˇrazených (vyˇsˇs´ı false positive).

(11)

klasifikátor

1

klasifikátor

2

klasifikátor

3

data zahozené vzorky další zpracování

(12)

Kapitola 3

Evoluˇ

cn´ı algoritmy

Pˇr´ıroda a jej´ı zákony se ukázaly jako dobrá inspirace pˇri vývoji výpoˇcetn´ıch metod. Základy pro evoluˇcn´ı algoritmy poloˇzil Charles Darwin svou teori´ı pˇrirozeného výbˇeru. Druhy obývaj´ıc´ı naˇsi planetu se jiˇz po miliony let vyv´ıjely z jednobunˇeˇcných organism˚u. Pˇreˇz´ıvaj´ı ty, které se dokázaly pˇrizp˚usobit okoln´ım podm´ınkám lépe neˇz ostatn´ı.

Evoluˇcn´ı algoritmy se pouˇz´ıvaj´ı k ˇreˇsen´ı sloˇzitých optimalizaˇcn´ıch problém˚u, kde neexis-tuje jiný postup, nebo je ˇcasovˇe pˇr´ıliˇs nároˇcný. Pracuj´ı na podobném principu jako evoluce v pˇr´ırodˇe. M´ısto jednotlivých organism˚u máme jedince pˇredstavuj´ıc´ı ˇreˇsen´ı problému. Je-dinec bývá definován svou vnitˇrn´ı reprezentac´ı (tzv. genomem) a hodnotou fitness, která pˇredstavuje ˇc´ıselnˇe vyjádˇrenou kvalitu ˇreˇsen´ı, které jedinec poskytuje. Genom m´ıvá r˚uznou reprezentaci. Nejˇcastˇejˇs´ı je binárn´ı nebo reálná, ale lze pouˇz´ıt cokoli, co bude vhodné (znaky, stromy, atd.). Fitness funkce je kl´ıˇcovým bodem pˇri návrhu evoluˇcn´ıho algoritmu. Mˇela by být výpoˇcetnˇe co nejménˇe nároˇcná. Poˇcet vyhodnocen´ı se pohybuje v ˇrádech tis´ıc˚u, aˇz milión˚u. Dále mus´ı platit, ˇze ˇc´ım vyˇsˇs´ı (nebo niˇzˇs´ı, pokud hledáme minimum) je hodnota fitness, t´ım kvalitnˇejˇs´ı ˇreˇsen´ı jedinec poskytuje.

Podle [4] rozliˇsujeme evoluˇcn´ı algoritmy pˇredevˇs´ım na genetické algoritmy, evoluˇcn´ı strategie a genetické programován´ı.

• Genetické algoritmy maj´ı binárnˇe kódované jedince. Mutace i kˇr´ıˇzen´ı se projevuje na ´

urovni jednotliv´ych bit˚u.

• Evoluˇcn´ı strategie reprezentuje jedince jako vektor reálných ˇc´ısel. Pro kˇr´ıˇzen´ı a mutaci lze pouˇz´ıt jak metod pouˇz´ıvaných pro genetické algoritmy, tak r˚uzných vektorových operac´ı.

• Genetické programován´ı je vytváˇren´ı algoritm˚u pomoc´ı evoluˇcn´ıho procesu.

Na obrázku 3.1 jsou jednotlivé fáze evoluˇcn´ıho algoritmu. Schéma odpov´ıdá implemen-taci popisované v kapitole 5 i pr˚ubˇehu popisovanému v kapitole 4.3. Na zaˇcátku je náhodnˇe vygenerována populace jedinc˚u. Je vyhodnocena jejich fitness. Následnˇe se kontroluje, zda nebyla splnˇena nˇekterá ukonˇcovac´ı podm´ınka (napˇr. dosaˇzen´ı urˇcité hodnoty fitness, ma-ximáln´ıho poˇctu generac´ı atd.). Pak jsou vybráni rodiˇce následuj´ıc´ı populace (viz 3.3). Kˇr´ıˇzen´ım a mutac´ı z nich z´ıskáme potomky a vyhodnot´ıme jejich fitness. Výbˇerem z rodiˇc˚u a potomk˚u nahrad´ıme stávaj´ıc´ı populaci. Tak algoritmus pokraˇcuje, dokud nen´ı splnˇena ukonˇcovac´ı podm´ınka.

Ve zbytku této kapitoly jsou pˇr´ıklady postup˚u pro jednotlivé kroky evoluˇcn´ıho algoritmu. Kterýkoli z nich lze nahradit jiným (vhodnˇejˇs´ım) postupem pro konkrétn´ı problém.

(13)

Obr´azek 3.1: Sch´ema evoluˇcn´ıho algoritmu podle [5]

3.1

Kˇ

r´ıˇ

zen´ı

Kˇr´ıˇzen´ım se kombinuj´ı vlastnosti dvou jedinc˚u (v nˇekterých pˇr´ıpadech lze pouˇz´ıt jedinc˚u i v´ıce, ale vˇetˇsinou k tomu nen´ı d˚uvod). C´ılem je vznik jedince lepˇs´ıho neˇz kterýkoli z rodiˇc˚u. Postupy mohou být velmi rozmanité a lze je r˚uznˇe kombinovat. Mezi nejpouˇz´ıvanˇejˇs´ı patˇr´ı segmentové kˇr´ıˇzen´ı, které je znázornˇeno na obrázku 3.2 a popsáno v algoritmu 3.3.

Obr´azek 3.2: Segmentov´e kˇr´ıˇzen´ı

Existuj´ı i varianty, kde se generuje v´ıce bod˚u kˇr´ıˇzen´ı. Napˇr´ıklad u dvou bod˚u vzniknou tˇri ˇcástiA,B aC. Potomci vzniknou výmˇenou ˇcást´ıB.

Toto kˇr´ıˇzen´ı lze pouˇz´ıt i na genom reprezentovaný vektorem reálných ˇc´ısel, jen m´ısto bit˚u jsou sloˇzky vektoru. Dalˇs´ı pouˇzitelnou metodou je kˇr´ıˇzen´ı pr˚umˇerem. Ze sloˇzek rodiˇcovských vektor˚u r1 ar2 vznikne jediný potomek s odpov´ıdaj´ıc´ı sloˇzkoup= r1+r2

2 .

(14)

• Vyber dva rodiˇceA, B.

• N´ahodnˇe zvol bod kˇr´ıˇzen´ı.

• A0 vznikne z té ˇcásti A, která leˇz´ı pˇred bodem kˇr´ıˇzen´ı a z ˇcásti B leˇz´ıc´ı za bodem kˇr´ıˇzen´ı.

• B0 vznikne z té ˇcásti B, která leˇz´ı pˇred bodem kˇr´ıˇzen´ı a z ˇcásti A leˇz´ıc´ı za bodem kˇr´ıˇzen´ı.

Algoritmus 3.3: Segmentov´e kˇr´ıˇzen´ı

rodiˇcovsk´ych vektor˚u a ˇc´ıslox v intervaluh0,1i jsou vypoˇc´ıt´any sloˇzky potomk˚u:

p1 = xr1+ (1−x)r2 p2 = (x−1)r1+xr2

3.2

Mutace

V pr˚ubˇehu evoluˇcn´ıho algoritmu je vhodné, kdyˇz se v populaci objev´ı prvky, kterých nelze dosáhnout kˇr´ıˇzen´ım. To zajiˇst’uje právˇe mutace. Algoritmus 3.4 popisuje základn´ı postup mutace pro binárn´ı genom. U reálných genom˚u se neprovád´ı negace, ale napˇr´ıklad souˇcet s náhodnˇe generovaným ˇc´ıslem v pˇredem daném rozsahu.

• Je d´ana pravdˇepodobnost mutacepm ∈ h0,1i.

• Pro kaˇzd´y bit bv genomu:

– N´ahodnˇe generuj x∈ h0,1i. – Pokudx≤pm negujb.

Algoritmus 3.4: Mutace bin´arn´ıho genomu

3.3

V´

ybˇ

er

Existuj´ı r˚uzné postupy jak vybrat jedince, kteˇr´ı se stanou rodiˇci následuj´ıc´ı populace. Vˇetˇsinou jsou zaloˇzeny na náhodném výbˇeru, kde jedinci s vyˇsˇs´ı fitness maj´ı vˇetˇs´ı ˇsanci stát se rodiˇci. Takovým je i ruleta (roulete wheel, fitness proportionate selection).

Princip je velmi jednoduchý. Na obrázku 3.5 vid´ıte kruh rozdˇelený na ˇcásti. P´ısmeny jsou oznaˇceny jedinci. Velikost pol´ıˇcka je urˇcena hodnotou fitness. Výbˇer se provád´ı tak, ˇze se

”roztoˇc´ı ruˇciˇcka“ a prvek, na který ukáˇze, je zaˇrazen mezi rodiˇce. Pravdˇepodobnost, ˇze bude jedinec i vybrán je: pi = PNfi

j=1fj

, kde N je velikost populace a f je hodnota fitness. Výbˇer prob´ıhá tolikrát, kolik potˇrebujeme rodiˇc˚u (jedinec m˚uˇze být vybrán i v´ıckrát).

(15)

(16)

Kapitola 4

Spojen´ı AdaBoostu a evoluˇ

cn´ıch

algoritm˚

u

Adaboost i evoluˇcn´ı algoritmy jsou samy o sobˇe pouˇzitelné pro uˇcen´ı klasifikátor˚u. Kaˇzdý pˇr´ıstup má své výhody a mohou se vzájemnˇe doplˇnovat. To je dobˇre ukázáno v [6], kde je evoluˇcn´ıho algoritmu pouˇzito k prohledáván´ı prostoru Haarových pˇr´ıznak˚u. Nejlepˇs´ı pˇr´ıznak slouˇz´ı k vytvoˇren´ı slabého klasifikátoru pro AdaBoost.

Jak uˇz bylo uvedeno v kapitole 2.4, Haarovy pˇr´ıznaky jsou vhodné pro zpracován´ı ob-razu. Jejich spojen´ı s AdaBoostem má vˇsak jeden malý nedostatek. V pozdˇejˇs´ıch fáz´ıch AdaBoostu uˇz je velmi obt´ıˇzné nalézt Haar˚uv pˇr´ıznak, který by pˇrináˇsel nˇejakou novou in-formaci. To lze ˇreˇsit v´ıce zp˚usoby. Jednou z moˇznost´ı, jak se s t´ım vyrovnat, je pouˇz´ıt v´ıce Haarových pˇr´ıznak˚u pro jeden slabý klasifikátor. Spojen´ı m˚uˇze tvoˇrit napˇr´ıklad lineárn´ı kombinace (viz 4.1). Evoluˇcn´ı algoritmus je pak moˇzno vyuˇz´ıt k hledán´ı vhodné linárn´ı kombinace pˇr´ıznak˚u pro slabý klasifikátor, jako se v [6] hledaj´ı jen pˇr´ıznaky.

4.1

Genom a pˇ

r´ıznaky

Genom je tvoˇren vektorem re´aln´ych ˇc´ısel −→v = a1, b1, a2, b2, . . . , am, bm, kde am, bm ∈

h−1,1i. Reálné ˇc´ıslobmse pˇri vyhodnocen´ı mus´ı pˇrevést na celé ˇc´ıslo, které je identifikaˇcn´ım ˇ

c´ıslem konkrétn´ıho Haarova pˇr´ıznaku. Pˇri pˇrevodu je nejdˇr´ıve nutno spoˇc´ıtatim=|bm| ·N, kde N je celkový poˇcet Haarových pˇr´ıznak˚u sn´ıˇzený o jedna, a zaokrouhlit i. Potom pro vzorek datxz´ıskáme hodnotu pˇr´ıznakuH(x) =a1hi1(x) +a2hi2+· · ·+amhim, kdehim(x)

je hodnota Haarova pˇr´ıznaku s identifikaˇcn´ım ˇc´ıslemim.

Výsledná hodnota pˇr´ıznaku, který je pouˇzit v slabém klasifikátoru, je:

H(x) =a1h1(x) +a2h2(x) +· · ·+anhn(x)

Kde an∈ R,hn(x) je hodnota Haarova pˇr´ıznaku hn pro vzorek datx.

Aby se daly pˇr´ıznaky dále zpracovávat, je tˇreba omezit jejich hodnotu. V naˇsem pˇr´ıpadˇe se hodnota pˇr´ıznaku H(x) nacház´ı v intervaluh−4,4i. Toho je dosaˇzeno normalizac´ı sloˇzek

a1, a2, . . . , anvektoru−→v tak, aby d´elka byla 1. Hodnoty Haarov´ych pˇr´ıznak˚u jsou v intervalu

h−2,2i. Abychom nepˇrekroˇcili rozsahh−4,4i, je nutné hodnotu kaˇzdého Haarova pˇr´ıznaku vydˇelit 2. Hodnota pˇr´ıznaku z´ıskaného pomoc´ı evoluˇcn´ıho algoritmu vˇcetnˇe normalizace je:

H(x) = Pma1 j=1aj ·hi1(x) 2 +· · ·+ am Pm j=1aj ·him(x) 2

(17)

4.2

Fitness funkce

Fitness funkce se snaˇz´ı vyjádˇrit kvalitu slabého klasifikátoru, který lze s daným pˇr´ıznakem vytvoˇrit. To lze jednoduˇse vyjádˇrit vzdálenost´ı pr˚umˇerných hodnot obou tˇr´ıd. Ta je poˇc´ıtána z trénovac´ıch vzork˚u. Pˇri výpoˇctu je nutno vz´ıt v úvahu váhy trénovac´ıch vzork˚u, které urˇcuje AdaBoost. Hodnota pˇr´ıznaku H(x) je pakWH(x) =H(x)·w(x), kde w(x) je váha vzorku x. Celková hodnota fitness pˇri poˇctech trénovac´ıch vzork˚u v jednotlivých tˇr´ıdách

XAa XB se pak spoˇc´ıt´a: F = XA X xA=1 H(xA) WH(xA) − XB X xB=1 H(xB) WH(xB)

Vyˇsˇs´ı fitness tak maj´ı pˇr´ıznaky, které vytváˇrej´ı rozloˇzen´ı hodnot podobná obrázku 4.1. Váˇzené pr˚umˇery obou tˇr´ıd jsou dost rozd´ılné a fitness takovýchto pˇr´ıznak˚u bude vy-soká. Dobrý klasifikátor lze vˇsak vytvoˇrit i z rozloˇzen´ı na obrázku 4.2, ale pr˚umˇerné hod-noty se pˇr´ıliˇs neliˇs´ı. Pˇr´ıznaky vytváˇrej´ıc´ı taková rozloˇzen´ı maj´ı n´ızkou fitness a s nejvˇetˇs´ı pravdˇepodobnost´ı zaniknou.

Obrázek 4.1: Znázornˇen´ı vhodného rozloˇzen´ı hodnot pro fitness

Obrázek 4.2: Znázornˇen´ı nevhodného rozloˇzen´ı hodnot pro fitness

4.3

Pr˚

ubˇ

eh evoluˇ

cn´ıho algoritmu

Poˇcáteˇcn´ı generace je generována náhodnˇe. Je vhodné sloˇzit poˇcáteˇcn´ı populaci z v´ıce ˇ

(18)

vektory jen s kladnými sloˇzkami a druhá se zápornými. D´ıky tomuto postupu je vˇetˇs´ı pravdˇepodobnost, ˇze se vyuˇzij´ı dobré vlastnosti z obou rozsah˚u.

Výbˇer rodiˇc˚u zajiˇst’uje ruleta. Ta je posána v kapitole 3.3. Poˇcet rodiˇc˚u je stejný jako velikost populace. D´ıky ruletˇe se vˇsak nˇekteˇr´ı mohou zaˇradit mezi rodiˇce v´ıckrát a jin´ı v˚ubec. Záleˇz´ı na jejich fitness.

Kˇr´ıˇzen´ı se úˇcastn´ı rodiˇce po dvou podle toho, jak byli vybráni ruletou. Na pravdˇepodobnosti kˇr´ıˇzen´ı záv´ıs´ı, jestli se rodiˇce budou kˇr´ıˇzit. V tom pˇr´ıpadˇe se náhodnˇe vy-bere ze zp˚usob˚u uvedených v seznamu n´ıˇze . Pokud ke kˇr´ıˇzen´ı nedojde, rodiˇce se beze zmˇeny zaˇrad´ı mezi potomky a mohou mutovat. Pouˇzity jsou následuj´ıc´ı typy kˇr´ıˇzen´ı z kapitoly 3.1:

• Jednobodov´a varianta segmentov´eho kˇr´ıˇzen´ı.

• Kˇr´ıˇzen´ı line´arn´ı kombinac´ı rodiˇc˚u. Pro kaˇzdou sloˇzku rodiˇcovsk´ych vektor˚u r1 a r2

je generováno náhodné ˇc´ıslox s rovnomˇerným rozloˇzen´ım v intervaluh0,1i. Potomci pak maj´ı odpov´ıdaj´ıc´ı sloˇzkyp1=xr1+ (1−x)r2 ap2 = (x−1)r1+xr2.

• Také se jedná o kˇr´ıˇzen´ı lineárn´ı kombinac´ı. Jediný rozd´ıl je, ˇze x je generováno jen jednou a pouˇzito pro vˇsechny sloˇzky rodiˇcovských vektor˚u.

Mutace m˚uˇze prob´ıhat dvˇema zp˚usoby. Jeden vyuˇz´ıvá ˇc´ısel v rovnomˇerném a druhý v normáln´ım rozloˇzen´ı. Kaˇzdý pokrývá jiný rozsah. To zajiˇst’uje výbˇer z ˇsirokého mnoˇzstv´ı pˇr´ıznak˚u a zároveˇn zabraˇnuje vynechán´ı tˇech nejbliˇzˇs´ıch, zvláˇst’ pokud má jedinec vysokou fitness, vydrˇz´ı v´ıce generac´ı a jeho potomci podstoup´ı mutaci v´ıckrát. Pravdˇepodonost mutace urˇcuje, zda potomek bude mutovat. Pokud k mutaci dojde, tak se náhodnˇe urˇc´ı, který zp˚usob se pouˇzije.

• Uniformn´ı mutace uprav´ı kaˇzdou sloˇzku vektoru o hodnotu generovanou s rov-nomˇerným rozloˇzen´ım v urˇcitém rozsahu. Mˇela by slouˇzit k výbˇeru nejbliˇzˇs´ıch pˇr´ıznak˚u.

• Normáln´ı mutace uprav´ı kaˇzdou sloˇzku vektoru o hodnotu generovanou s gaussovým rozloˇzen´ım a urˇcitou standardn´ı odchylkou. Rozsah mutace by mˇel být výraznˇe vˇetˇs´ı neˇz u pˇredchoz´ıho zp˚usobu. D´ıky vˇetˇs´ımu rozsahu vznikaj´ı jedinci, ke kterým bychom se pomoc´ı prvn´ıho zp˚usobu nedostali.

Následuj´ıc´ı generace se skládá z potomk˚u a pˇredchoz´ı generace. Pˇreˇzije lepˇs´ı polovina z rodiˇc˚u a lepˇs´ı polovina z potomk˚u. Ostatn´ı zanikaj´ı.

Ukonˇcovac´ı podm´ınky jsou vyhodnocovány pˇred výbˇerem rodiˇc˚u. Základn´ı moˇznost´ı je ukonˇcen´ı po dosaˇzen´ı urˇcitého poˇctu generac´ı. Dále je moˇzno kontrolovat poˇcet vyhodnocen´ı fitness funkce. Algoritmus se ukonˇc´ı pouze v m´ıstˇe, kde se podm´ınka kontroluje. To znamená, ˇ

(19)

Kapitola 5

Implementace

Evoluˇcn´ı algoritmus popsaný v kapitole 4 je pˇridán jako dalˇs´ı zp˚usob generován´ı pˇr´ıznak˚u pro AdaBoost do systému pro výzkum klasifikátor˚u popsaného v [3]. Tento K imple-mentaci je vyuˇzita knihovna Evolving Objects (ke staˇzen´ı na adrese http://eodev. sourceforge.net/), která je dostupná pod licenc´ı GLPL 1. Zdrojové kódy jsou na pˇriloˇzeném CD. Jedná se o souboryGAHaarFeatures.cppa GAHaarFeatures.h v adresáˇri

program/src/features/.

Tˇr´ıda TGAHaarFeatures je stˇeˇzejn´ım bodem celé implementace. Jej´ı instance slouˇz´ı k trénován´ı klasifikátoru. Ten spust´ı evoluˇcn´ı algoritmus a z výsledné populace si vybere nejvhodnˇejˇs´ıho jedince. Jedinec vybraný klasifikátorem je uloˇzen pomoc´ı instance tˇr´ıdy

TGAHaarFeature do xml, aby odtud mohl b´yt naˇcten a pouˇzit jinou instanc´ı tˇr´ıdy pˇri vlastn´ı klasifikaci.

5.1

Tˇ

r´ıda

TGAHaarFeatures

Konstruktor naˇcte konfiguraci z xml souboru a vytvoˇr´ı Haarovy pˇr´ıznaky.

Metoda initialize je volána jednou pro kaˇzdou iteraci AdaBoostu. Vytvoˇr´ı vy-rovnávac´ı pamˇet’ pro pˇr´ıznaky (viz 5.3). Vygeneruje poˇcáteˇcn´ı populaci, normalizuje vˇsechny jedince (viz 4.1), spust´ı evoluˇcn´ı algoritmus (zavolá metodu run). Potom znovu normali-zuje vˇsechny jedince. To je nutné z toho d˚uvodu, ˇze v pr˚ubˇehu evoluce se normalizace sice provád´ı pˇri výpoˇctu fitness, ale jedinci si zachovávaj´ı hodnotu. Na konci jsou k dispozici pˇr´ıznaky pro AdaBoost.

Metoda evaluate vrac´ı hodnotu urˇcitého pˇr´ıznaku. Je vyuˇz´ıvána, kdyˇz AdaBoost vy-hledává vhodný pˇr´ıznak.

Metoda getFeature vytvoˇr´ı instanci tˇr´ıdy TGAHaarFeature a vr´at´ı ukazatel na tuto instanci.

5.2

Evoluˇ

cn´ı algoritmus

Implementace evoluˇcn´ıho algoritmu se nacház´ı v metodˇe run tˇr´ıdy TGAHaarFeatures. Kv˚uli struktuˇre knihovny Evolving Objects je fitness funkce nezávislá na tˇr´ıdˇe

1

(20)

TGAHaarFeatures a vyuˇz´ıvá globáln´ıho ukazatele na vyrovnávac´ı pamˇet’ (viz 5.3). To by mohlo zp˚usobit problémy pˇri vytvoˇren´ı v´ıce instanc´ı tˇr´ıdy TGAHaarFeatures.

Poˇcáteˇcn´ı generace je generována v rámci metody initialize. Prvn´ı polovina popu-lace obsahuje vektory sloˇzené z ˇc´ısel v intervaluh0,1i a druhá v intervaluh−1,0i. Hodnoty jsou generovány náhodnˇe s rovnomˇerným rozloˇzen´ım. Velikost populace se nemˇen´ı. Nasta-vuje se pomoc´ı xml atributu populationSize.

Kˇr´ıˇzen´ı je reprezentováno tˇremi r˚uznými zp˚usoby, které jsou popsány v 4.3. Pravdˇepodobnost kˇr´ıˇzen´ı se nastavuje xml atributem crossoverProbability. Kˇr´ıˇzeni lineárn´ı kombinac´ı pˇredstavuj´ı tˇr´ıdy eoSegmentCrossover a eoHypercubeCrossover

z knihovny Evolving Objects. Kaˇzdý z tˇechto zp˚usob˚u má pravdˇepodobnost, ˇze bude zvolen 40 %. Zbylých 20 % zbývá na segmentové kˇr´ıˇzen´ı. V Evolving Objects nen´ı obsaˇzena reálná varianta tohoto kˇr´ıˇzen´ı a bylo nutno ji vytvoˇrit. Jedná se o tˇr´ıdu

eo1PtRealSegmentCrossover.

Mutace je pˇredstavována tˇr´ıdami eoUniformMutation a eoNormalMutation. Pravdˇepodobnost mutace je nastavována xml atributem mutationProbability. Po-kud k mutaci dojde, vybere se náhodnˇe z tˇechto moˇznost´ı:

• eoUniformMutation zmˇen´ı kaˇzdou sloˇzku jedince o ˇc´ıslo generované s rovnomˇerným rozloˇzen´ım v rozsahu h−0.00005,0.00005i, coˇz pˇri poˇctu Haarových pˇr´ıznak˚u asi 180 000 odpov´ıdá výbˇeru z pˇribliˇznˇe 20 pˇr´ıznak˚u.

• eoNormalMutation mˇen´ı sloˇzky jedince o hodnotu generovanou s norm´aln´ım rozloˇzen´ım. Stˇred je dan´a sloˇzka vektoru a standardn´ı odchylka je 0.01.

Ukonˇcovac´ı podm´ınky jsou nastaviteln´e v konfiguraˇcn´ım xml souboru pomoc´ı atribut˚u:

• maximalGenerationsurˇcuje maxim´aln´ı poˇcet generac´ı. Pokud nen´ı definov´an, je im-plicitnˇe nastaven na 1 000.

• maximalEvaluatedFitness zastav´ı evoluˇcn´ı algoritmus po urˇcitém poˇctu vyhodno-cen´ı fitness funkce. V okamˇziku, kdy je dosaˇzeno stanoveného poˇctu, se algoritmus neukonˇc´ı, ale pokraˇcuje aˇz do kontroly podm´ınek (viz obrázek 3.1).

Pokud se m´a kontrolovat jen poˇcet vyhodnocen´ı fitness funkce, je tˇreba nastavit poˇcet generac´ı na 0. Jinak se pouˇzije implicitn´ı hodnota a algoritmus skonˇc´ı po jej´ım dosaˇzen´ı.

5.3

Vyrovn´

avac´ı pamˇ

et’

Výpoˇcet fitness funkce je zrychlen pouˇzit´ım vyrovnávac´ı pamˇeti. Ta uchovává hodnoty naposledy pouˇzitých Haarových pˇr´ıznak˚u pro vˇsechny trénovac´ı vzorky. Poˇcet uchovávaných pˇr´ıznak˚u se nastavuje v xml souboru volboucacheSize. Pamˇet’ová nároˇcnost je dána:

poˇcet trénovac´ıch vzork˚u×cacheSize×sizeof(double)+konstantn´ı reˇzie Do vyrovnávac´ı pamˇeti se pˇristupuje pomoc´ı dvou index˚u. Jeden index urˇcuje pˇr´ıznak a druhý hodnotu tohoto pˇr´ıznaku pro konkrétn´ı trénovac´ı vzorek. Pokud hodnoty pro poˇzadovaný pˇr´ıznak ve vyrovnávac´ı pamˇeti nejsou, tak se porovná poˇcet uloˇzených pˇr´ıznak˚u scacheSize. Pokud by dalˇs´ı pˇr´ıznak tuto hodnotu pˇrekroˇcil, smaˇze se ten nejstarˇs´ı. Potom jsou spoˇc´ıtány a uloˇzeny do pamˇeti hodnoty pˇr´ıznaku pro vˇsechny trénovac´ı vzorky.

(21)

Kapitola 6

Testy

Po dokonˇcen´ı implementace a odladˇen´ı zdrojového kódu byly provedeny testy. Jejich c´ılem bylo zjistit vlastnosti lineárn´ı kombinace Haarových pˇr´ıznak˚u a porovnat je se samostatnými Haarovými pˇr´ıznaky. Pro kaˇzdý z tˇechto pˇr´ıstup˚u je natrénován klasifikátor. Poté jsou ovˇeˇreny jeho vlastnosti na testovac´ıch datech. Jsou pouˇzita stejná trénovac´ı a testovac´ı data pro oba klasifikátory. Prostˇredky pro trénován´ı a testován´ı jiˇz byly zahrnuty v projektu zmiˇnovaném v kapitolách 1 a 5.

6.1

Parametry evoluˇ

cn´ıho algoritmu

Metrikou evoluˇcn´ıch algoritm˚u je poˇcet vyhodnocen´ı fitness funkce. R˚ust hodnoty fitness vˇsak nen´ı tomuto poˇctu úmˇerný. Kdyˇz máme dostatek ˇcasu a výpoˇcetn´ıch prostˇredk˚u, m˚uˇzeme nechat fitness funkci vyhodnotit v´ıckrát. Nevad´ı nám pomalejˇs´ı r˚ust, pokud je na konci dosaˇzeno lepˇs´ı hodnoty. Pokud chceme m´ıt výsledek rychle, potˇrebujeme zpoˇcátku strmˇejˇs´ı r˚ust, i kdyˇz by se fitness ustálila na niˇzˇs´ı hodnotˇe neˇz v pˇredchoz´ım pˇr´ıpadˇe.

počet vyhodnocení fitness n e jv yš ši f it n e ss v p o p ul ac i _F F2 1 A B C

Obr´azek 6.1: Pˇr´ıklad pr˚ubˇehu fitness

Na obrázku 6.1 vid´ıme pˇr´ıklad takovýchto dvou pr˚ubˇeh˚u. V bodˇe A má vyˇsˇs´ı hodnotu pr˚ubˇehF2 a v bodˇe Cpr˚ubˇehF1. Pokud potˇrebujeme výpoˇcet ukonˇcit dˇr´ıve neˇz v bodˇeB, pouˇzijeme pr˚ubˇehF2. Kdyˇz je moˇzno ho ukonˇcit aˇz za bodemB, zvol´ımeF1. Poˇzadovanému

chov´an´ı je pak nutno pˇrizp˚usobit konfiguraci.

Obrázek 6.1 je jen ilustraˇcn´ı. Reálný pr˚ubˇeh fitness funkce vypadá vˇetˇsinou jako na obrázku 6.2, který byl z´ıskán pˇri ladˇen´ı programu. Abychom z´ıskali takovéto pr˚ubˇehy, je

(22)

0.2 0.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0 50 100 150 200 250 300 350 400 450 500 fitness number of generations

Obr´azek 6.2: Pˇr´ıklad pr˚ubˇehu fitness

tˇreba sledovat chován´ı fitness pro r˚uzné hodnoty parametr˚u. V konfiguraˇcn´ım xml souboru lze nastavit následuj´ıc´ı:

• mutationProbability – pravdˇepodobnost mutace

• crossoverProbability– pravdˇepodobnost kˇr´ıˇzen´ı

• populationSize – velikost populace

• haarFeaturesCount– poˇcet Haarov´ych pˇr´ıznak˚u v line´arn´ı kombinaci

Moˇzných kombinac´ı tˇechto parametr˚u je pˇr´ıliˇs mnoho. Bˇehem ladˇen´ı algoritmu se ukázala jako nejvhodnˇejˇs´ı lineárn´ı kombinace dvou Haarových pˇr´ıznak˚u a pravdˇepodobnost kˇr´ıˇzen´ı m˚uˇzeme zvolit 0.8. Ukázalo se, ˇze nejv´ıce je r˚ust fitness funkce ovlivnˇen pravdˇepodobnost´ı mutace a velikost´ı populace.

Proto jsme sledovali vývoj fitness funkce pro velikosti populace 1, 5, 25, 125, 625, 3 125, 15 625 a pravdˇepodobnosti mutace 0.05, 0.1, 0.2, 0.4, 0.8. Hodnotu fitness jsme zjiˇst’ovali pˇri poˇctu vyhodnocen´ı fitness funkce 100, 200, 400, 800, 1 600, 3 200, 6 400, 12 800, 25 600, 51 200, 102 400, 204 800, 404 800 a 600 000. Pro kaˇzdou kombinaci tˇechto hodnot probˇehla evoluce dvanáctkrát, vˇzdy pro prvn´ı iteraci AdaBoostu. Na obrázku 6.3 je rozloˇzen´ı fitness pˇri poˇctu vyhodnocen´ı 404 800. Je tam vidˇet, ˇze se fitness v´ıceménˇe zvyˇsuje s vˇetˇs´ı populac´ı a vyˇsˇs´ı pravdˇepodobnost´ı mutace.

Nejvyˇsˇs´ı dosaˇzená hodnota fitness byla 0.9141. Z hodnot z´ıskaných ze vˇsech dvanácti bˇeh˚u byly spoˇc´ıtány aritmetické pr˚umˇery. Nejvyˇsˇs´ı pr˚umˇerné hodnoty fitness pro vˇsechny

(23)

0.68 0.7 0.72 0.74 0.76 0.78 0.8 0.82 0.84 1 10 100 1000 10000 population size 0.1 mutation probability 0.7 0.72 0.74 0.76 0.78 0.8 0.82 fitness

Obr´azek 6.3: Hodnoty fitness funkce po 404 800 vyhodnocen´ıch fitness funkce

zaznamenané poˇcty vyhodnocen´ı jsou v tabulce 6.1. Interval spolehlivosti (confidence in-terval) byl spoˇc´ıtán podle [9]. Byla zvolena úroveˇn vˇerohodnosti 95 %.

Poˇcet vyhodnocen´ı Velikost Pravdˇepodobnost Fitness Interval fitness funkce populace mutace spolehlivosti

100 1 0.2 0.4182 ± 0.0554 200 1 0.1 0.4737 ± 0.0440 400 1 0.2 0.5160 ± 0.0577 800 1 0.2 0.5924 ± 0.0245 1 600 1 0.2 0.5968 ± 0.0226 3 200 125 0.4 0.6283 ± 0.0385 6 400 125 0.4 0.6804 ± 0.0430 12 800 125 0.4 0.7021 ± 0.0379 25 600 625 0.1 0.7076 ± 0.0353 51 200 625 0.4 0.7298 ± 0.0336 102 400 3 125 0.05 0.7601 ± 0.0261 204 800 3 125 0.2 0.8115 ± 0.0273 404 800 3 125 0.2 0.8269 ± 0.0271 600 000 3 125 0.2 0.8275 ± 0.0271

Tabulka 6.1: Nejlepˇs´ı hodnoty fitness pro dan´y poˇcet vyhodnocen´ı fitness funkce

Pˇri testech budeme cht´ıt dosáhnout 90 % maximáln´ı dosaˇzené hodnoty fitness funkce:

0.9141·0.9 = 0.8227

Z tabulky 6.1 vybereme nejbliˇzˇs´ı vyˇsˇs´ı hodnotu, coˇz odpov´ıd´a poˇctu vyhodnocen´ı fitness funkce 404 800, pravdˇepodobnosti mutace 0.2 a velikosti populace 3 125. Tyto hodnoty

(24)

nastav´ıme v konfiguraˇcn´ım xml souboru, který bude pouˇzit pro testován´ı klasifikátoru

6.2

Tr´

enovac´ı a testovac´ı data

K trénován´ı byly pouˇzity obrázky obliˇcej˚u v rozliˇsen´ı 24 × 24 pixel˚u a stupn´ıch ˇsedi. Tyto obrázky byly sesb´ırány z webových stránek a ruˇcnˇe anotovány. V trénovac´ı sadˇe se jich nacház´ı 10 000. Obrázky pozad´ı byly vytvoˇreny jako náhodné výˇrezy (také velikosti 24×24 pixel˚u) z 4 000 obrázk˚u, které neobsahuj´ı obliˇceje. Celkový poˇcet tˇechto výˇrez˚u je 250 000 000.

K testován´ı byla pouˇzita sada dat vytvoˇrená na Carnegie Mellon University a Massa-chusetts Institute of Technology (MIT+CMU dataset). Tato sada obsahuje 114 obrázk˚u, na kterých je pˇribliˇznˇe 500 obliˇcej˚u. Tyto obrázku jsou skenovány po výˇrezech o velikosti 24×24 pixel˚u, kterých je celkem 17 000 000.

6.3

ROC kˇ

rivka

Jak jiˇz bylo uvedeno v kapitole 2.1, jednou ze sledovaných vlastnost´ı klasifikátoru je poˇcet vzork˚u, které byly do tˇr´ıdy chybnˇe pˇriˇrazeny. ROC (receiver operating characteristic) kˇrivka znázorˇnuje pomˇer vzork˚u správnˇe pˇriˇrazených do tˇr´ıdy (true positive) v˚uˇci vˇsem vzork˚um, které byly do tˇr´ıdy pˇriˇrazeny (true positive i false positive).

Na obrázku 6.4 jsou ROC kˇrivky pro klasifikátor, který pouˇz´ıvá lineárn´ı kombinaci Haarových pˇr´ıznak˚u. Na obrázku 6.5 pro samostané Haarovy pˇr´ıznaky. Kˇrivky jsou vˇzdy pro silný klasifikátor sloˇzený z 50, 100 a 500 slabých klasifikátor˚u.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0 50 100 150 200 250 300 350 400 450 500

correct detection rate

false positives

stage 50 stage 100 stage 500

(25)

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 50 100 150 200 250 300 350 400 450 500

correct detection rate

false positives

stage 50 stage 100 stage 500

Obrázek 6.5: ROC kˇrivka samostatných Haarových pˇr´ıznak˚u

6.4

Rychlost klasifik´

atoru

Rychlost´ı klasifikátoru je myˇslen poˇcet prvk˚u kaskády klasifikátor˚u (viz kapitola 2.5), který je vyuˇzit pˇri klasifikaci. Celou kaskádou jsou zpracovány jen ˇcásti obrazu, které patˇr´ı do de-tekované tˇr´ıdy. Na obrázc´ıch 6.6 a 6.7 je znázornˇen pr˚umˇerný poˇcet vyuˇzitých klasifikátor˚u ve vztahu k celkovému poˇctu klasifikátor˚u v kaskádˇe. Opˇet je vidˇet rozd´ıl mezi lineárn´ı kombinac´ı a samostatnými Haarovými pˇr´ıznaky.

6.5

V´

ysledky

Z graf˚u popsaných v 6.3 a 6.4 je zˇrejmé, ˇze lineárn´ı kombinace nedosahuje kvalit Haarových pˇr´ıznak˚u. Pˇr´ıliˇs mnoho vzork˚u je chybnˇe zaˇrazeno mezi obliˇceje. S t´ım je spojená i niˇzˇs´ı pr˚umˇerná rychlost, protoˇze celou kaskádou proˇslo v´ıce vzork˚u, neˇz mˇelo.

(26)

0 5 10 15 20 25 0 50 100 150 200 250 300 350 400 450 500

Obrázek 6.6: Pr˚umˇerná rychlost lineárn´ı kombinace Haarových pˇr´ıznak˚u

1 1.5 2 2.5 3 3.5 4 4.5 5 0 100 200 300 400 500 600 700 800 900 1000

(27)

Kapitola 7

Z´

avˇ

er

Z kapitoly 6 vyplývá, ˇze lineárn´ı kombinace Haarových pˇr´ıznak˚u nesplnila oˇcekáván´ı, která do n´ı byla vloˇzena, pˇresto výsledky vypadaj´ı docela slibnˇe. Nesm´ıme zapom´ınat, ˇze se jedná o rané stádium vývoje. Tento postup má urˇcitý potenciál a pokud se na nˇem bude dále pracovat, tak snad dosáhneme lepˇs´ıch výsledk˚u. Nyn´ı se postupnˇe pod´ıváme na nedostatky zjiˇstˇené pˇri vývoji a testován´ı.

7.1

Genom, mutace a kˇ

r´ıˇ

zen´ı

V souˇcasné implementaci jsou Haarovy pˇr´ıznaky generovány a ˇc´ıslovány postupnˇe. Zaˇcne se v levém horn´ım rohu obrazu a po ˇrádc´ıch se postupuje aˇz do pravého doln´ıho. Sousedn´ı indexy pak maj´ı Haarovy pˇr´ıznaky, které jsou vedle sebe na ˇrádku. Dále soused´ı ty, co jsou na konci jednoho ˇrádku s tˇemi, které jsou na zaˇcátku ˇrádku následuj´ıc´ıho. Pokud je pouˇzito v´ıce typ˚u Haarových pˇr´ıznak˚u (viz obrázek 2.2), docház´ı k dalˇs´ımu problému, protoˇze potom soused´ı nejvˇetˇs´ı pˇr´ıznak pˇredchoz´ıho typu s nejmenˇs´ım pˇr´ıznakem typu následuj´ıc´ıho.

Aby kˇr´ıˇzen´ı a mutace lépe plnily sv˚uj úˇcel, mˇely by m´ıt sousedn´ı indexy Haarovy pˇr´ıznaky, jenˇz obsahuj´ı podobnou informaci. T´ım jsou myˇsleny ty, které soused´ı v ˇrádku nebo sloupci a ty, které jsou o nˇeco vˇetˇs´ı ˇci menˇs´ı. Nav´ıc by mˇely sousedit pˇr´ıznaky stejného typu.

Tyto problémy by bylo moˇzno ˇreˇsit zmˇenou mechanism˚u kˇr´ıˇzen´ı a mutace. Sloˇzky ge-nomu, které pˇredstavuj´ı Haarovy pˇr´ıznaky, by byly upravovány odliˇsným zp˚usobem neˇz zbytek. Také by mohly být reprezentovány celými ˇc´ısly.

Dalˇs´ı nedostatek je zp˚usoben koeficienty a1. . . am (viz kapitola 4.1). Pokud maj´ı ne-vhodné hodnoty, mohou zp˚usobit, ˇze i kvalitn´ı kombinace Haarových pˇr´ıznak˚u zahyne. Tomu by se dalo zabránit úplným vyˇrazen´ım tˇechto koeficient˚u z genomu. Jejich hodnoty pro konkrétn´ı kombinaci Haarových pˇr´ıznak˚u by pak mohly být vypoˇc´ıtány nˇejakou statis-tickou metodou (PCA, LDA).

Existuje mnoho metod pro generován´ı pˇr´ıznak˚u. Vˇsechny maj´ı své výhody i nevýhody. Nemuselo by se vyb´ırat jen z Haarových pˇr´ıznak˚u, ale pouˇz´ıt i jiné (LDA, NLDA atd.). Kaˇzdá z tˇechto metod by vˇsak musela m´ıt vlastn´ı postupy pro mutaci. Takovýto systém by pak byl pouˇzitelný i pro jiné úˇcely neˇz zpracován´ı obrazu.

(28)

7.2

Fitness

Z výsledk˚u test˚u vyplývá, ˇze pˇr´ıliˇs mnoho vzork˚u, které do detekované tˇr´ıdy nepatˇr´ı, je do této tˇr´ıdy zaˇrazeno. To je pravdˇepodobnˇe zp˚usobeno t´ım, ˇze hodnota fitness funkce odpov´ıdá kvalitˇe slabého klasifikátoru, který je z jedince natrénován jen do urˇcité m´ıry. ˇReˇsen´ım by byla fitness funkce, jenˇz by této kvalitˇe odpov´ıdala lépe. Nejlépe nahradit stávaj´ıc´ı fitness funkci úspˇeˇsnost´ı slabého klasifikátoru (viz kapitola 2.3).

7.3

Shrnut´ı

Pˇredchoz´ı postˇrehy se daj´ı shrnout do urˇcitého plánu pro dalˇs´ı vývoj. Za vyzkouˇsen´ı by stály následuj´ıc´ı úpravy:

• Genom bude tvoˇren pouze indexy pˇr´ıznak˚u r˚uzn´ych typ˚u.

• Kaˇzdý typ pˇr´ıznak˚u bude m´ıt vlastn´ı postup mutace a bude moci mutovat jen v rámci svého typu.

• Poˇc´ateˇcn´ı populace bude sloˇzena z jedinc˚u, kteˇr´ı budou obsahovat jen jeden typ pˇr´ıznak˚u.

• Bude pouˇzito jen segmentov´e kˇr´ıˇzen´ı. To spolu se sloˇzen´ım poˇc´ateˇcn´ı populace zaj´ıst´ı kombinaci toho nejlepˇs´ıho ze vˇsech typ˚u pˇr´ıznak˚u.

• Koeficienty pro lineárn´ı kombinaci budou z´ıskávány pomoc´ı PCA nebo LDA.

• Jako fitness funkce bude pouˇzita úspˇeˇsnost slabého klasifikátoru.

Pˇredpokládám, ˇze po zahrnut´ı tˇechto úprav bychom mohli dosáhnout lepˇs´ıch výsledk˚u neˇz pomoc´ı souˇcasného postupu. Moˇzná i lepˇs´ıch neˇz za pouˇzit´ı Haarových pˇr´ıznak˚u. Pokud by tato oˇcekáván´ı byla splnˇena, z´ıskali bychom univerzáln´ı a rozˇsiˇritelný systém, jenˇz by byl pouˇzitelný pro r˚uzné typy dat.

(29)

Literatura

[1] Duda, R. O.; Hart, P. E.; Stork, D. G.: Pattern Classification (2nd Edition). Wiley-Interscience, 2000, ISBN 0471056693.

[2] Freund, Y.; Schapire, R.: A short introduction to boosting. 1999, [Online].

URLhttp://citeseer.ist.psu.edu/freund99short.html

[3] Hradiˇs, M.: Framework for Research on Detection Classifiers. In Proceedings of Spring Conference on Computer Graphics, 2008, s. 171–177.

URLhttp://www.fit.vutbr.cz/research/view_pub.php?id=8608

[4] Kvasniˇcka, V.; Posp´ıchal, J.; Tiˇno, P.: Evoluˇcn´e algoritmy. STU Bratislava, 2000, ISBN 8022713775.

[5] Schoenauer, M.: Evolving Objects Tutorial. 2002, [Online].

URLhttp://eodev.sourceforge.net/eo/tutorial/html/eoTutorial.html

[6] Treptow, A.; Zell, A.: Combining Adaboost Learning and Evolutionary Search to Select Features for Real-Time Object Detection. 2004.

URLhttp://citeseer.ist.psu.edu/646131.html

[7] Viola, P.; Jones, M.: Rapid object detection using a boosted cascade of simple features. 2001, [Online].

URLhttp://citeseer.ist.psu.edu/viola01rapid.html

[8] Wikipedia: AdaBoost — Wikipedia, The Free Encyclopedia. 2007, [Online].

URLhttp://en.wikipedia.org/w/index.php?title=AdaBoost&oldid=176678328

[9] Wikipedia: Student’s t-distribution — Wikipedia, The Free Encyclopedia. 2008, [Online].

URLhttp://en.wikipedia.org/w/index.php?title=Student%27s_

http://eodev.sourceforge.net/

http://www.gnu.org/licenses/lgpl.html

http://citeseer.ist.psu.edu/freund99short.html

http://www.fit.vutbr.cz/research/view_pub.php?id=8608

http://eodev.sourceforge.net/eo/tutorial/html/eoTutorial.html

http://citeseer.ist.psu.edu/646131.html

http://citeseer.ist.psu.edu/viola01rapid.html

http://en.wikipedia.org/w/index.php?title=AdaBoost&oldid=176678328

http://en.wikipedia.org/w/index.php?title=Student%27s_t-distribution&oldid=210886302