diploma thesis zimm text

Download Diploma Thesis Zimm Text

Post on 21-Apr-2015

71 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

CESKE VYSOKE UCENI TECHNICKE V PRAZEFAKULTA ELEKTROTECHNICKAKATEDRA KYBERNETIKYDETEKCE A ROZPOZNAVANI ZNAKU V OBRAZE A VIDEOSEKVENCICHDIPLOMOVA PRACEKarel Zimmermann23. leden 2004vedouc prace: Dr. Ing. Jir Matasii.iiiProhlasenProhlasuji, ze jsem svou diplomovou praci vypracoval samostatne a pouzil jsem pouze podklady(literaturu, projekty, SW, atd.) uvedene v prilozenem seznamu.Nemam zavazn y duvod proti uzit tohoto skolnho dla ve smyslu 60 Zakona c.121/2000 Sb., opravu autorskem, o pravech souvisejcch s pravem autorsk ym a o zmene nekter ych zakonu (autorsk yzakon).V Praze dne 23. leden 2004 Karel ZimmermannivPodekovanMe podekovan patr panu Dr. Ing. Jirmu Matasovi za jeho drahocenn y cas, cenne pripomnky aza veden prace.vAbstractIn this work, we present a robust method to learn and recognize object category in arbitraryscenes in an ane invariant manner. Objects are modeled as exible constellations of parts (calledcharacteristic extremal regions). Proposed detector could be trained by machine learning methodsfor arbitrary object category. The method is demonstrated on the problem of text detection andlocalization in images and videosequences.Keywordscategorization, text detection and locazation, character detection, segmentation, character recogni-tion, support vector machine, neural network, image processingviAbstraktV teto praci prinasme nov y pohled na problematiku detekce a lokalizace kategorie objektu v obraze.Navrhujeme robustn anne invariantn algoritmus detekce a lokalizace libovolne kategorie objektu,ktere jsou modelovany jako prostorove kongurace jejich cast (naz yvan ych charakteristick ymihextremalnmi oblastmi). Takto navrzen y detektor muze b yt metodami strojoveho ucen preucen najakoukoliv kategorii objektu. Metoda je demonstrovana na problemu detekce a lokalizace textu vobrazech a videosekvencch.Keywordsdetekce a lokalizace kategorie objektu, segmentace, detekce znaku, support vector machine, neu-ronove ste, zpracovan obrazuObsah1 Uvod 11.1 Denice problemu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Struktura dokumentu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.3 Prnos teto prace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.4 Stav poznan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.4.1 Detekce obecne kategorie objektu . . . . . . . . . . . . . . . . . . . . . . . . . 51.4.2 Detekce textu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.4.3 Detekce SPZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Detekce a lokalizace CER 102.1 Extremaln oblasti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.2 Algoritmus detekce a selekce CER . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.3 Inkrementalne vypocitatelne prznaky . . . . . . . . . . . . . . . . . . . . . . . . . . 142.3.1 Uvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.3.2 Momenty . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.3.3 Kompaktnost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.3.4 Entropie a stabilita kumulativnho histogramu . . . . . . . . . . . . . . . . . 192.3.5 Pocet der v oblasti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.3.6 Dals inkrementalne vypocitatelne veliciny . . . . . . . . . . . . . . . . . . . . 212.4 Selektor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 Nalezen a normalizace linearn kongurace oblast 233.1 Nalezen linearn kongurace oblast . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.2 Normalizace LRC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.2.1 Nalezen zkosen linearn sekvence CER . . . . . . . . . . . . . . . . . . . . . 263.2.2 Nalezen matice zpetne ann transformace . . . . . . . . . . . . . . . . . . . 283.3 Shrnut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 Experimenty 314.1 Pouzit metody na problem detekce SPZ . . . . . . . . . . . . . . . . . . . . . . . . . 314.2 Optimaln nastaven selektoru . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334.3 Meren chyby detekce znaku v zavislosti na jejich poloze . . . . . . . . . . . . . . . . 344.4 Zpracovan v realnem case . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35viiOBSAH viii4.5 Segmentace znaku z normalizovane SPZ . . . . . . . . . . . . . . . . . . . . . . . . . 374.6 Meren chyby v zavislosti na jasov ych podmnkach . . . . . . . . . . . . . . . . . . . 384.7 Meren chyby v zavislosti na maximaln povolene entropii znaku . . . . . . . . . . . 395 Implementace a Interface 416 Zaver 436.1 Shrnut v ysledku . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436.2 Mozne rozsren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45Kapitola 1Uvod1.1 Denice problemuV teto praci se zab yvame problemem detekce a lokalizace kategorie objektu v obraze. Objektybudeme modelovat jako prostorovou konguraci nejak ych pro ne chrakteristick ych cast (oblast,CER - Characteristic Extremal Regions), kde oblast chapeme libovolnou souvislou mnozinu boduv obraze. V teto praci jsme se soustredili na volbu CER z lokalne prahove oddeliteln ych oblast(ER [5]). To jsou takove nejvets souvisle oblasti ve kter ych je jasova hodnota kazdeho bodu mensnez nejak y zvolen y prah T. Volme takove ER, ktere dobre charakterizuj hledan y objekt (CER ER).Zpusob detekce a lokalizace objektu na zaklade CER je uveden na Obr. 1.1. Ze vstupnhoobrazu jsou vycsleny vsechny ER z nichz jsou ulozeny jen ty, ktere jsou selektorem vybranyjako CER. Mnozina detekovan ych CER je rozdelena na skupiny prvku v prpustn ych konguracchodpovdajcch hledanemu objektu.Protoze tato prace byla motivovana hledanm oblast textu ve videosekvencch jsou CER volenyjako znaky a cslice. Ty jsou temer vzdy lokalne prahove oddelitelne a nachazej se v linearnkonguraci (radce). Hledana kategorie objektu je mnozina planarnch napisu. Soustredme se pouzena linearn kongurace CER, ktere jsou hledany uzitm Houghovy transformace jejich konvexnhoobalu. Prklady takov ych detekovan ych objektu jsou na Obr. 1.2. Prvn ctyri obrazky ukazuj detekcinapisu na skriptech v ruzn ych polohach vuci kamere (ane, projektivne zkreslen ych), castecnezakryt ych a za ruzn ych sveteln ych podmnek. Dals obrazky demonstruj aplikaci na detekci SPZ(Statn Poznavac Znacka). Jak je videt navrzena metoda je invariantn k poloze objektu vuci kamerei k sveteln ym podmnkam a je dostatecne robustn i v pro prpad castecneho zakryt.Navrhli jsme obecn y algoritmus detekce a lokalizace libovolne kategorie objektu na zaklade de-tekovan ych charakteristick ych oblast v prspustn ych prostorov ych konguracch. Popisujeme rychl yzpusob enumerace ER oblast a jejich selekce na zaklade rychle (tzv. inkrementalne) vypocitateln ychprznaku. Jako prznaky pro selekci CER jsou prevazne pouzity statisticke centraln normalizovanemomenty.1KAPITOLA 1. UVOD 2Obrazek 1.1: Navrzen y algoritmus detekce a lokalizace kategorie objektu1.2 Struktura dokumentu1. Uvod. Prvn kapitola obsahuje mimo motivace a popisu zakladnho principu take shrnutstavu poznan v problematice detekce objektu se specialnm zamerenm na detekci textu aSPZ.2. Detekce a lokalizace CER. V druhe kapitole je nejdrve uvedena denice extremaln oblasti(ER). Dale je popsan algoritmus na rychlou enumeraci vsech ER. Dals cast je venovanaselekci CER ER. V n se venujeme popisu rych