razpoznavanje notnega zapisa z raČunalniŠkim vidom

28
RAZPOZNAVANJE RAZPOZNAVANJE NOTNEGA ZAPISA NOTNEGA ZAPISA Z RAČUNALNIŠKIM VIDOM Z RAČUNALNIŠKIM VIDOM Diplomska naloga Avtor: Matej HROVAT Mentor: prof. dr. Aleš LEONARDIS

Upload: fulton-gibbs

Post on 03-Jan-2016

61 views

Category:

Documents


2 download

DESCRIPTION

RAZPOZNAVANJE NOTNEGA ZAPISA Z RAČUNALNIŠKIM VIDOM. Diplomska naloga. Avtor: Matej HROVAT. Mentor: prof. dr. Aleš LEONARDIS. Cilj razpoznavanja not ali OMR ( Optical Music Recognition ). Eine_kleine_Nachtmusik.mid. Analiza TISKANIH KLAVIRSKIH NOT. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

RAZPOZNAVANJE RAZPOZNAVANJE NOTNEGA ZAPISANOTNEGA ZAPISA

Z RAČUNALNIŠKIM VIDOMZ RAČUNALNIŠKIM VIDOMDiplomska naloga

Avtor: Matej HROVAT

Mentor: prof. dr. Aleš LEONARDIS

Page 2: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Cilj razpoznavanja not ali OMR Cilj razpoznavanja not ali OMR ((Optical Music RecognitionOptical Music Recognition))

Eine_kleine_Nachtmusik.mid

Page 3: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Analiza TISKANIH KLAVIRSKIH NOTAnaliza TISKANIH KLAVIRSKIH NOT

Segmentacija slike poteka v treh programskih modulih:

Sedem

korakov

analize:

1. Izločanje vrstic

2. Izločanje črtovja

3. Iskanje povezanih črnih področij

4. Iskanje notnih primitivov

5. Sestavljanje fragmentiranih objektov

6. Sestavljanje objektov iz primitivov

7. Prevajanje podatkov v računalniški format

Page 4: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Analiza TISKANIH KLAVIRSKIH NOTAnaliza TISKANIH KLAVIRSKIH NOT

Segmentacija slike poteka v treh programskih modulih:

Sedem

korakov

analize:

1. Izločanje vrstic

2. Izločanje črtovja

3. Iskanje povezanih črnih področij

4. Iskanje notnih primitivov

5. Sestavljanje fragmentiranih objektov

6. Sestavljanje objektov iz primitivov

7. Prevajanje podatkov v računalniški format

Page 5: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Analiza TISKANIH KLAVIRSKIH NOTAnaliza TISKANIH KLAVIRSKIH NOT

Segmentacija slike poteka v treh programskih modulih:

Sedem

korakov

analize:

1. Izločanje vrstic

2. Izločanje črtovja

3. Iskanje povezanih črnih področij

4. Iskanje notnih primitivov

5. Sestavljanje fragmentiranih objektov

6. Sestavljanje objektov iz primitivov

7. Prevajanje podatkov v računalniški format

Page 6: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:11

Iskanje premic črtovja s Houghovo transformacijoIskanje premic črtovja s Houghovo transformacijo

r = x cos() + y sin() za vsak [00, 3600]

IZLOČANJE VRSTICIZLOČANJE VRSTIC

Page 7: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Iskanje premic črtovja s Houghovo transformacijoIskanje premic črtovja s Houghovo transformacijo

Korak / 7:Korak / 7:11 IZLOČANJE VRSTICIZLOČANJE VRSTIC

Lokalni maksimumi Houghovega transforma klavirske skladbe:

a) Enak kot (rotacija strani) =0

b) Nastopajo v gručah po 5

Page 8: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Izločanje najdene vrsticeIzločanje najdene vrstice

Korak / 7:Korak / 7:11 IZLOČANJE VRSTICIZLOČANJE VRSTIC

≤ 900 > 900

Page 9: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:22 IZLOČANJE ČRTOVJAIZLOČANJE ČRTOVJA

IZ VRSTICEIZ VRSTICE Iskanje črt s horizontalno projekcijoIskanje črt s horizontalno projekcijo

Mera za Mera za velikost velikost objektovobjektov

Page 10: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:22 IZLOČANJE ČRTOVJAIZLOČANJE ČRTOVJA

IZ VRSTICEIZ VRSTICE Označevanje črte s kvadratnim oknomOznačevanje črte s kvadratnim oknom

Slika v oknu, ki pomeni delček črte

Page 11: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:22 IZLOČANJE ČRTOVJAIZLOČANJE ČRTOVJA

IZ VRSTICEIZ VRSTICE Označevanje črte - interpolacija med dvema oknomaOznačevanje črte - interpolacija med dvema oknoma

Page 12: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:22 IZLOČANJE ČRTOVJAIZLOČANJE ČRTOVJA

IZ VRSTICEIZ VRSTICE Označevanje črte - interpolacija med dvema oknomaOznačevanje črte - interpolacija med dvema oknoma

Page 13: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:33 ISKANJE POVEZANIH ISKANJE POVEZANIH ČRNIH OBMOČIJČRNIH OBMOČIJ

Območja poiščemo s polnilnim algoritmom 4-FloodFillObmočja poiščemo s polnilnim algoritmom 4-FloodFill

Page 14: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:44 ISKANJE PRIMITIVOV ISKANJE PRIMITIVOV

Primitivi - elementarni objektiPrimitivi - elementarni objekti

• Neposredno ujemanje

• Ujemanje vzorcev• Procesiranje kombiniranih

Možnosti iskanja:

Page 15: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:44 ISKANJE PRIMITIVOV ISKANJE PRIMITIVOV

Način iskanja 1/3: Neposredno prepoznavanjeNačin iskanja 1/3: Neposredno prepoznavanje

Primitivi, prepoznavni po globalnih značilkah

Page 16: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:44 ISKANJE PRIMITIVOV ISKANJE PRIMITIVOV

Način iskanja 2/3: Ujemanje vzorcevNačin iskanja 2/3: Ujemanje vzorcev

• Znak razdelimo na m x n regij

• Sivinske nivoje pretvorimo v vektor značilk

• Vzorci so shranjeni v podatkovni bazi

Page 17: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:44 ISKANJE PRIMITIVOV ISKANJE PRIMITIVOV

Način iskanja 2/3: Ujemanje vzorcevNačin iskanja 2/3: Ujemanje vzorcev

2

1

)),(),(( ii

M

iii yxTyxZD

1,02

HWL

DDNORM

Razlika vektorjev:

Page 18: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:44 ISKANJE PRIMITIVOV ISKANJE PRIMITIVOV

Način iskanja 2/3: Ujemanje vzorcevNačin iskanja 2/3: Ujemanje vzorcev

• Ujemanje potrjeno, ko je DNORM < Treshold

• Primer na sliki: DNORM = 0,061

Page 19: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:44 ISKANJE PRIMITIVOV ISKANJE PRIMITIVOV

Način iskanja 3/3: Procesiranje kombiniranih simbolovNačin iskanja 3/3: Procesiranje kombiniranih simbolov

• Odstranimo vertikalne linearne segmente

• Preostale objekte pošljemo v ponovno obdelavo

Page 20: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:55 SESTAVLJANJE SESTAVLJANJE FRAGMENTIRANIH SIMBOLOV FRAGMENTIRANIH SIMBOLOV

Fragmentacija - razpad nekega simbola zaradi odstranitve drugega

Rešitev - iskanje simbola v izvirni sliki

Page 21: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:66 SESTAVLJANJE PRIMITIVOV SESTAVLJANJE PRIMITIVOV in SEMANTIKA in SEMANTIKA

a) Primitivi, ki se ne dotikajo drugih

b) Sestavljanje primitivov not

Page 22: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

Korak / 7:Korak / 7:77 PREVAJANJE V PREVAJANJE V RAČUNALNIŠKI FORMAT RAČUNALNIŠKI FORMAT

• MIDI ali NIFF datoteka

• OCR aplikacija - kodiranje informacij o izvajanju skladbe

Page 23: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

R E Z U L T A T IR E Z U L T A T ITestni primer 1: J. S. Bach, Das Wohltemperierte Klavier I:Praeludium II, vrstica 1

Page 24: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

R E Z U L T A T IR E Z U L T A T ITestni primer 2: Scott Joplin, The Entertainer, vrstica 1

Page 25: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

R E Z U L T A T IR E Z U L T A T ITestni primer 3: W. A. Mozart, Eine kleine Nachtmusik -Romanze: Andante, vrstica 7

Page 26: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

R E Z U L T A T IR E Z U L T A T ITestni primer 4: J. S. Bach, Das Wohltemperierte Klavier I:Fuga VII, vrstica 5

Page 27: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM

PRIHODNJI RAZVOJPRIHODNJI RAZVOJ

Cilj:Cilj: učinkovit komercialen OMR program učinkovit komercialen OMR program

• Število in tip črtovij v vrsticah

• Dotikajoči in prekrivajoči se simboli

• Optimizacija baze podatkov

• Izboljšano semantično preverjanje

• Prevajanje v računalniški format

Page 28: RAZPOZNAVANJE  NOTNEGA ZAPISA  Z RAČUNALNIŠKIM VIDOM