university of groningen bio-inspired algorithms for ...€¦ · university of groningen johann...

20
University of Groningen Bio-inspired algorithms for pattern recognition in audio and image processing Strisciuglio, Nicola IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from it. Please check the document version below. Document Version Publisher's PDF, also known as Version of record Publication date: 2016 Link to publication in University of Groningen/UMCG research database Citation for published version (APA): Strisciuglio, N. (2016). Bio-inspired algorithms for pattern recognition in audio and image processing. [Groningen]: University of Groningen. Copyright Other than for strictly personal use, it is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s), unless the work is under an open content license (like Creative Commons). Take-down policy If you believe that this document breaches copyright please contact us providing details, and we will remove access to the work immediately and investigate your claim. Downloaded from the University of Groningen/UMCG research database (Pure): http://www.rug.nl/research/portal. For technical reasons the number of authors shown on this cover page is limited to 10 maximum. Download date: 18-04-2020

Upload: others

Post on 16-Apr-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

University of Groningen

Bio-inspired algorithms for pattern recognition in audio and image processingStrisciuglio, Nicola

IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite fromit. Please check the document version below.

Document VersionPublisher's PDF, also known as Version of record

Publication date:2016

Link to publication in University of Groningen/UMCG research database

Citation for published version (APA):Strisciuglio, N. (2016). Bio-inspired algorithms for pattern recognition in audio and image processing.[Groningen]: University of Groningen.

CopyrightOther than for strictly personal use, it is not permitted to download or to forward/distribute the text or part of it without the consent of theauthor(s) and/or copyright holder(s), unless the work is under an open content license (like Creative Commons).

Take-down policyIf you believe that this document breaches copyright please contact us providing details, and we will remove access to the work immediatelyand investigate your claim.

Downloaded from the University of Groningen/UMCG research database (Pure): http://www.rug.nl/research/portal. For technical reasons thenumber of authors shown on this cover page is limited to 10 maximum.

Download date: 18-04-2020

Page 2: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

UNIVERSITY OF GRONINGENJOHANN BERNOULLI INSTITUTE FOR MATHEMATICS AND

COMPUTER SCIENCE

UNIVERSITY OF SALERNODEPARTMENT OF INFORMATION AND ELECTRICAL ENGINEERING

AND APPLIED MATHEMATICS

BIO-INSPIRED ALGORITHMS FORPATTERN RECOGNITION IN

AUDIO AND IMAGE PROCESSING

A dissertation supervised by promotors

PROF. DR. SC. TECHN. NICOLAI PETKOV

PROF. DR. MARIO VENTO

and submitted by

NICOLA STRISCIUGLIO

in fulfillment of the requirements for the Degree of

PHILOSOPHIÆDOCTOR (PH.D.)

May 2016

ISBN: 978-90-367-8931-8 (ISBN ebook: 978-90-367-8932-5)

Page 3: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department
Page 4: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

Bio-inspired algorithms forpattern recognition in audio and

image processing

PhD thesis

to obtain the degree of PhD at theUniversity of Groningenon the authority of the

Rector Magnificus Prof. E. Sterkenand in accordance with

the decision by the College of Deans.

This thesis will be defended in public on

Friday 10 June 2016 at 09.00 hours

by

Nicola Strisciuglio

born on 16 November 1987in Nocera Inferiore, Salerno, Italy

Page 5: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

SupervisorsProf. N. PetkovProf. M. Vento

Co-supervisorDr. G. Azzopardi

Assessment committeeProf. A.C. TeleaProf. C.N. SchizasProf. V. LoiaProf. X. Jiang

Page 6: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

This research has been conducted at the Intelligent Systems group of JohannBernoulli Institute for Mathematics and Computer Science (Onderzoeksinstituut:JBI) of University of Groningen and at the MIVIA research group of the Depart-ment of Information and Electrical Engineering and Applied Mathematics (DIEM)of University of Salerno.

This research has been supported by the University of Groningen through an”Ubbo Emmius” scholarship for international sandwich PhD programs and by theDepartment of Information and Electrical Engineering and Applied Mathematics ofUniversity of Salerno through a research grant on the project ”Embedded systemsin critical domains” (cod. 4-17-12, P.O.R. Campania FSE 2007-2013).

Bio-inspired algorithms for pattern recognition in audio and image processingNicola StrisciuglioISBN: 978-90-367-8931-8 (printed version)ISBN: 978-90-367-8932-5 (electronic version)

Page 7: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department
Page 8: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

To my lovely family

Page 9: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department
Page 10: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

Abstract

This thesis investigates the construction of pattern recognition systems that arebased on the computation of features inspired by the characteristics of human au-ditory and visual systems. The thesis addresses two important applications in thefields of intelligent audio surveillance and medical image analysis. In particular, wepropose two algorithms for the detection of audio events that can occur with vari-ous levels of signal-to-noise ratio (SNR) and two algorithms for the delineation ofblood vessels in retinal fundus images.

Audio analysis for detection of events of interest has recently raised large inter-est in the pattern recognition community due to increasing demand for safety inpublic and private environments and the consequent demand for improved surveil-lance systems. Traditional applications of audio analysis concern speech recogni-tion, speaker identification and music classification. They usually require that thesound source is close to the microphone. This implies a low influence of noise onthe functioning of the overall system. In applications like event detection for au-dio surveillance, the source of the sound of interest can be at any distance fromthe microphone. Thus, the detection system has to be able to detect events at vari-ous levels of SNR, sometimes also negative. Another key requirement for an audiosurveillance system is the ability to detect events of interest when they are mixedwith different kinds of background noise. Such constraints make the problem athand very different from traditional applications of audio analysis. Intelligent au-dio surveillance is a recent research field and at the time of this work no public datasets were available for testing event detection algorithms. Thus, we constructed andpublicly released two new data sets of abnormal events that can occur in everydaylife, which we called MIVIA audio event and MIVIA road event data sets.

We start from the consideration that an audio stream is composed of small,atomic units of sound, similarly to a piece of text that is composed of a number

Page 11: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

of words. We propose a system for the detection of audio events based on the bagof features approach. Since the events of interest can be mixed with various types ofbackground noise, we tailored the training phase of the proposed method in orderto build a system robust to such variability. We tested the system for the detection ofglass breaking, gun shot and scream events in public and private environments byusing the audio clips in the MIVIA audio event data set. We achieved a high recog-nition rate (up to 86.7%) with a very low false positive rate (2.1% on the whole testset). Successively, we extended the system in order to be employed for monitoringand surveillance of roads, with the aim of detecting anomalous situations such ascar crash and tire skidding events. We designed a deployment strategy for differ-ent kinds of road (from very calm country roads to very busy cities or motorways),based on an internationally accepted road noise model. We carried out experimentson the MIVIA road event data set and achieved a recognition rate (82%) and a falsepositive rate (2.85%) that confirm the performance achieved on the MIVIA audioevent data set.

In a further study, we take inspiration from some characteristics of the humanauditory system to propose trainable filters, which we call CoPE filters, that auto-matically determine the important features from training audio samples. One ofthe critical steps for the construction of a pattern recognition system is, indeed, thechoice of the most appropriate set of features to face the particular problem at hand,i.e. a feature engineering step. The CoPE filters are trainable as their structure isnot fixed in the implementation but it is instead learned during a configurationprocess from training samples. This eliminates the needs of a features engineeringstep. The important features are learned directly from the events of interest, mak-ing the system easily adaptable to different sound recognition tasks and requiringless knowledge about the specific domain of application. We employ the responsesof a bank of CoPE filters to build feature vectors that we use to describe the inputaudio stream. We train a classifier with such feature vectors in order to performthe detection task. We carried out experiments on the MIVIA audio event and theMIVIA road event data set, achieving a recognition rate (higher than 94%) and falsepositive rate (less than 4%) that are considerably better than the results achieved bythe approach based on the bag of features architecture.

In the second part of the thesis we address an important application in the fieldof medical image analysis, i.e. the segmentation of blood vessels in retinal fundusimages. Retinal fundus imaging is a non-invasive tool that is widely employed bymedical experts to diagnose various pathologies such as glaucoma, age-related mac-ular degeneration, diabetic retinopathy and atherosclerosis. There is also evidencethat such images may contain signs of non-eye-related pathologies, including car-diovascular and systemic diseases. In the last years, particular attention by medical

Page 12: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

communities has been given to early diagnosis and monitoring of diabetic retinopa-thy, since it is one of the principal causes of blindness in the world. The manualinspection of retinal fundus images requires highly skilled people, which results inan expensive and time-consuming process. Thus, the mass screening of a popu-lation is not feasible without the use of computer aided diagnosis systems. Suchsystems could be used to refer to medical experts only the patients with suspicioussigns of diseases.

We introduce a novel method for the automatic segmentation of vessel trees inretinal fundus images. We propose a filter that selectively responds to vessels andthat we call B-COSFIRE with B standing for bar which is an abstraction of a ves-sel. It is based on the existing COSFIRE (Combination Of Shifted Filter Responses)approach. A B-COSFIRE filter achieves orientation selectivity by computing theweighted geometric mean of the output of a pool of Difference-of-Gaussians filters,whose supports are aligned in a collinear manner. It achieves rotation invarianceefficiently by simple shifting operations. The proposed filter is versatile as its selec-tivity is determined from any given vessel-like prototype pattern in an automaticconfiguration process. The results that we achieve on three publicly available datasets (DRIVE: Se = 0.7655, Sp = 0.9704; STARE: Se = 0.7716, Sp = 0.9701; CHASE DB1:Se = 0.7585, Sp = 0.9587) are higher than many of the state-of-the-art methods.

In the last part of the thesis, we further investigate the flexibility and adaptabil-ity of the proposed B-COSFIRE filters and propose to employ them within a clas-sification pipeline. The framework that we propose automatically determines themost appropriate sub-set of filters for the application at hand. Initially, we config-ure a bank of B-COSFIRE filters and use the responses obtained on training retinalimages to form pixel-wise feature vectors, which describe vessel and non-vessel pix-els. Then, we employ various techniques based on information theory and machinelearning to select an optimal subset of B-COSFIRE filters. We finally train a classi-fier by using feature vectors constructed with the responses of the selected filtersand employ it to classify every pixel in the testing image. The improvement of theresults that we achieve on the DRIVE and STARE data sets with respect the unsu-pervised B-COSFIRE filters is statistically significant.

We studied the computational requirements of the proposed algorithms in orderto evaluate their applicability in real-world applications and the fulfillment of real-time constraints given by the considered problems.

This thesis contributes to the development of bio-inspired algorithms for audioand image processing and promotes their use in higher-level pattern recognitionsystems.

Page 13: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department
Page 14: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

Samenvatting

Dit proefschrift onderzoekt de constructie van patroonherkenningssystemen diegebaseerd zijn op kenmerken geınspireerd door de eigenschappen van het menselijkvisueel en auditief systeem. Het proefschrift behandelt twee belangrijke toepassin-gen op het gebied van intelligente audio surveillance en medische beeldanalyse. Inhet bijzonder leggen we twee algoritmes voor de detectie van audio “gebeurtenis-sen” die voor kunnen komen met verschillende niveaus van signaal-ruis verhoud-ing, en twee algoritmes voor de segmentatie van bloedvaten in retinale fundusbeelden.

Audioanalyse voor detectie van “gebeurtenissen van belang” heeft recentelijkaan interesse gewonnen in het vakgebied van patroonherkenning, dankzij de toen-emende behoefte aan veiligheid in het publieke en private domein en het daaruitvoortkomende verzoek voor betere surveillancesystemen / beveiligingssystemen.Typische toepassingen van audioanalyse zijn onder andere spraakherkenning,spreker identificatie en muziek classificatie. Normaliter vereisen deze toepassin-gen dat de geluidsbron nabij de microfoon is, om de invloed van ruis op het func-tioneren van het gehele systeem te beperken. In toepassingen zoals “gebeurtenis”detectie voor audiosurveillance kan de bron van het geluid op elke afstand van demicrofoon zijn. Zodoende dient het detectiesysteem in staat te zijn om gebeurtenis-sen op verschillende SNR niveaus te detecteren. Een andere vereiste voor een au-dio surveillancesysteem is de mogelijkheid om “gebeurtenissen van belang” te de-tecteren wanneer deze vermengd zijn met verschillende soorten achtergrondgeluid.Dergelijke beperkingen maken het probleem in kwestie zeer afwijkend van klassieketoepassingen van audioanalyse. Intelligente audiosurveillance is een recent onder-zoeksveld en ten tijde van dit onderzoek waren er geen openbare datasets beschik-baar voor het testen van algoritmes voor “gebeurtenisdetectie”. Derhalve hebbenwe twee nieuwe datasets van abnormale gebeurtenissen ontworpen en vrijgegeven.

Page 15: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

De datasets, genaamd MIVIA audio event en MIVIA road event, bevatten abnor-male gebeurtenissen die zich in het alledaagse leven voor kunnen doen.

Ons uitgangspunt is de overweging dat een geluidsstroom bestaat uit kleine,atomische geluidseenheden, zoals een stuk tekst bestaat uit een aantal woorden. Wedragen een systeem voor de detectie van audio gebeurtenissen aan dat gebaseerdis op de bag of features benadering. Aangezien de gebeurtenissen van belanggemengd kunnen zijn met verschillende soorten achtergrondgeluid, hebben we detrainingsfase van de voorgedragen methode afgesteld, om een systeem te ontwer-pen dat dergelijke variabiliteit kan weerstaan. Het systeem is getest op detectie vanbrekend glas, geweerschoten en schreeuwen in publieke en prive omgevingen metgebruik van de audiofragmenten in de MIVIA audio event dataset. We behaaldeneen hoog herkenningspercentage (tot 86.7%) met een zeer laag fout-positief percent-age (2.1% op de hele test set). Vervolgens hebben we het systeem uitgebreid voor in-gebruikstelling bij het toezicht van wegen, met het doel om anomale situaties zoalsbotsingen of bandenslippingen te detecteren. We hebben een invoeringsstrategieontworpen voor verschillende type wegen (van zeer rustige landwegen tot drukkesteden of snelwegen), gebaseerd op een internationaal erkend weggeluidsmodel.De experimenten met de MIVIA road event dataset behaalden een herkenningsper-centage (82%) en een fout-positief percentage (2.85%) die de behaalde resultaten metde MIVIA audio event dataset onderschrijven.

In een vervolgonderzoek geınspireerd op enkele eigenschappen van hetmenselijk auditief systeem dragen we trainbare filters voor, genaamd CoPE filters,die automatisch de belangrijke onderdelen van training audio samples bepalen. Eencruciale stap in de constructie van een patroonherkenningssysteem is de keuze vande meest geschikte set van kenmerken voor de ophanden taak, oftewel de featureengineering stap. De CoPE filters zijn te trainen, aangezien hun structuur niet vastligt in de implementatie; het wordt in plaats daarvan aangeleerd tijdens een con-figuratieproces van traningsmonsters. Hierdoor is een “features egineering” stapoverbodig. De belangrijke kenmerken worden direct verworven uit de gebeurtenis-sen van belang, wat de systemen adaptief maakt voor verschillende geluidherken-ningstaken en de vereiste kennis van het specifieke toepassingsdomein vermindert.We hanteren de resultaten van een bank van CoPE filters om feature-vectoren tebouwen die we gebruiken om de geluidsstroom van de input te beschrijven. Eenclassifier wordt getraind met dergelijke kenmerkvectoren om de detectietaak uit tevoeren. We hebben de experimenten op de MIVIA audio event en de MIVIA roadevent datasets uitgevoerd, en deze behaalden een herkenningspercentage (hogerdan 94%) en een fout-positief percentage (minder dan 4%) die de resultaten behaaldmet de benadering gebaseerd op het bag of features ontwerp aanzienlijk verbeteren.

In het tweede deel van dit proefschrift stellen we een belangrijke toepassing op

Page 16: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

het gebied van medische beeldanalyse aan de orde, nl. de segmentatie van bloed-vaten in retinale fundus beelden. Retinale fundus beeldvorming is een niet-invasiefmiddel dat veel gebruikt wordt door medisch specialisten om verscheidene ziektente diagnosticeren, waaronder glaucoom, leeftijdsgebonden maculadegeneratie, dia-betische retinopathie en atherosclerose. Er is ook bewijs dat dergelijke beelden sig-nalen van niet-oog gerelateerde ziektebeelden kunnen bevatten, waaronder cardio-vasculaire en systemische ziekten. In de afgelopen jaren hebben medische gemeen-schappen bijzondere aandacht geschonken aan vroegtijdige diagnostisering en con-trole van diabetische retinopathie, aangezien het een van de voornaamste oorzakenvan blindheid is ter wereld. De handmatige inspectie van retinale fundus beeldenvereist zeer vakkundig personeel, wat het een zeer duur en tijdrovend proces maakt.Zodoende is massale screening van een populatie niet haalbaar zonder de aanwend-ing van computerondersteunde diagnosesystemen. Dergelijke systemen zouden ge-bruikt kunnen worden om enkel de patienten met verdachte symptomen van ziektedoor te verwijzen naar medisch specialisten.

Wij introduceren een nieuwe methode voor de automatische segmentatie vanbloedvatenbomen in retinale fundus beelden. We leggen een filter voor dat selec-tief reageert op bloedvaten, genaamd B-COSFIRE noemen, de B refererend naarbar; een abstractie van een bloedvat. Het is gebaseerd op de bestaande COSFIRE(Combination of Shifted Filter Responses) benadering. Een B-COSFIRE filter behaaltorientatieselectiviteit door het gewogen geometrisch gemiddelde te berekenen vande output van een poel van Difference-of-Gaussians filters waarvan de steunen opcollineaire wijze zijn uitgelijnd. Het bereikt op effectieve wijze rotatie-invariantiemiddels simpele shift operaties. Het voorgelegde filter is veelzijdig, aangezien deselectiviteit van het filter bepaald wordt door elk gegeven bloedvatachtige proto-type patroon in een automatisch configuratieproces. De resultaten die we behaaldhebben op drie publiekelijk beschikbare datasets (DRIVE: Se = 0.7655, Sp = 0.9704;STARE: Se = 0.7716, Sp = 0.9701; CHASE DB1: Se = 0.7585, Sp = 0.9587) zijnhoger dan vele state of the art methoden.

In het laatste gedeelte van het proefschrift wordt er een vervolgonderzoek om-schreven omtrent de flexibiliteit en het aanpassingsvermogen van de voorgedra-gen B-COSFIRE filters en stellen we voor ze in gebruik te stellen binnen een clas-sificatiekanaal. Het raamwerk dat we voordragen, bepaalt automatisch de meestgeschikte subset van filters voor de toepassing ophanden. In eerste instantie con-figureren we een bank van B-COSFIRE filters en gebruiken de verkregen responsiesom retinale beelden te trainen in het vormen van pixelmatige kenmerkvectoren diebloedvaten- en non-bloedvatenpixels beschrijven. Daarna hanteren we verschei-dene technieken gebaseerd op information theory en machine learning om een op-timale subset van B-COSFIRE filters te selecteren. De verbetering van de resultaten

Page 17: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

die we bereiken met de DRIVE en STARE datasets ten opzichte van de B-COSFIREfilters zonder supervisie is statistisch significant.

We bestudeerden de computationele eisen van de voorgedragen algoritmes omzowel hun toepasbaarheid in werkelijke toepassingen, als de uitvoering van echtijdbeperkingen, ingegeven door de overwogen problemen, te evalueren.

Dit proefschrift draagt bij aan de ontwikkeling van bio-geınspireerde algoritmesvoor audio- en beeldverwerking en bevordert hun toepassing in hogere niveaus vanpatroonherkenningssystemen.

Page 18: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

Contents

List of Figures iv

List of Tables vi

Acknowledgements ix

1 Introduction 11.1 Scope . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2 Thesis Organization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Audio events detection in noisy environments 72.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2 The proposed method . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2.1 Short-time and long-time descriptors . . . . . . . . . . . . . . 102.2.2 The classifier . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.3 Experimental results . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.3.1 Performance evaluation . . . . . . . . . . . . . . . . . . . . . . 172.3.2 Performance comparison . . . . . . . . . . . . . . . . . . . . . 202.3.3 Sensitivity analysis . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.4 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3 Design of a practical system for audio surveillance of roads 253.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.2 Method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.2.1 Low-level features extraction . . . . . . . . . . . . . . . . . . . 283.2.2 Dictionary learning . . . . . . . . . . . . . . . . . . . . . . . . . 293.2.3 High-level representation . . . . . . . . . . . . . . . . . . . . . 29

i

Page 19: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

Contents

3.2.4 Classification architecture . . . . . . . . . . . . . . . . . . . . . 303.3 Deployment Architecture . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.3.1 Intensity level of the event of interest . . . . . . . . . . . . . . 323.3.2 Intensity level of the traffic noise . . . . . . . . . . . . . . . . . 343.3.3 Architecture discussion . . . . . . . . . . . . . . . . . . . . . . 35

3.4 Experimental results . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.4.1 The data set . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.4.2 Experimental setup . . . . . . . . . . . . . . . . . . . . . . . . . 393.4.3 Performance evaluation . . . . . . . . . . . . . . . . . . . . . . 393.4.4 Sensitivity analysis . . . . . . . . . . . . . . . . . . . . . . . . . 423.4.5 Real-time performance . . . . . . . . . . . . . . . . . . . . . . . 45

3.5 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4 Trainable CoPE filters for audio events detection 474.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484.2 Rationale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.3 Method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.3.1 Gammatone filterbank . . . . . . . . . . . . . . . . . . . . . . . 524.3.2 CoPE filter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.3.3 A bank of CoPE filters . . . . . . . . . . . . . . . . . . . . . . . 564.3.4 Classifier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.4 Data sets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574.4.1 MIVIA audio events . . . . . . . . . . . . . . . . . . . . . . . . 574.4.2 MIVIA road events . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.5 Experiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584.5.1 Performance and results . . . . . . . . . . . . . . . . . . . . . . 604.5.2 Sensitivity analysis . . . . . . . . . . . . . . . . . . . . . . . . . 614.5.3 Results comparison . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 664.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5 Retinal vessel delineation using trainable B-COSFIRE filters 695.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705.2 Proposed method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.2.1 Overview . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 725.2.2 Detection of Changes in Intensity . . . . . . . . . . . . . . . . . 735.2.3 Configuration of a B-COSFIRE Filter . . . . . . . . . . . . . . . 755.2.4 Blurring and Shifting DoG Responses . . . . . . . . . . . . . . 755.2.5 Response of a B-COSFIRE Filter . . . . . . . . . . . . . . . . . 76

ii

Page 20: University of Groningen Bio-inspired algorithms for ...€¦ · university of groningen johann bernoulli institute for mathematics and computer science university of salerno department

Contents

5.2.6 Achieving Rotation Invariance . . . . . . . . . . . . . . . . . . 775.2.7 Detection of Bar Endings . . . . . . . . . . . . . . . . . . . . . 77

5.3 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 795.3.1 Data Sets and Ground Truth . . . . . . . . . . . . . . . . . . . . 795.3.2 Pre-processing . . . . . . . . . . . . . . . . . . . . . . . . . . . 805.3.3 Performance Measurements . . . . . . . . . . . . . . . . . . . . 815.3.4 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

5.4 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 875.5 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

6 Automatic selection of an optimal set of B-COSFIRE filters 976.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 976.2 Method . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

6.2.1 B-COSFIRE filters . . . . . . . . . . . . . . . . . . . . . . . . . . 1016.2.2 A bank of B-COSFIRE filters . . . . . . . . . . . . . . . . . . . 1036.2.3 Feature transformation and rescaling . . . . . . . . . . . . . . 1056.2.4 Automatic subset selection of B-COSFIRE filters . . . . . . . . 1056.2.5 Classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1076.2.6 Application phase . . . . . . . . . . . . . . . . . . . . . . . . . 107

6.3 Materials . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1096.3.1 Data sets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1096.3.2 B-COSFIRE implementation . . . . . . . . . . . . . . . . . . . . 109

6.4 Experiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1096.4.1 Pre-processing . . . . . . . . . . . . . . . . . . . . . . . . . . . 1096.4.2 Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1106.4.3 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1116.4.4 Statistical analysis . . . . . . . . . . . . . . . . . . . . . . . . . 1156.4.5 Comparison with existing methods . . . . . . . . . . . . . . . 115

6.5 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1176.6 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

7 Summary and Outlook 1217.1 Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1217.2 Outlook . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

Bibliography 127

Research Activities 139

iii