digitalizacija zvuka od 6 str
DESCRIPTION
zvukTRANSCRIPT
Karakteristike zvuka• priroda zvuka
– mehaničko kretanje vazduha u prostoru tj. promena vazdušnog pritiska
Karakteristike zvuka• Konverzija fizičkih signala
– Promena vazdušnog pritiska → električni signal
Izvor zvuka (mehaničke vibracije)
Talasanje vazduha (promene vazdušnog pritiska)
Senzor promene pritiska (mikrofon)
Električni signal (promenljivi napon)
Karakteristike zvuka• Konverzija fizičkih signala
– električni signal → promena vazdušnog pritiska
Skladištenje zvuka• analogno
– zvučni signal → električni signal → magnetni medijum / gramofonska ploča
• digitalno– zvučni signal → električni signal → digitalizacija → podaci → fajl
Digitalizacija zvuka• Digitalizacija predstavlja konverziju analognog signala...
• ...u digitalnu reprezentaciju1551841361221261031651471131387613516016185124
Digitalizacija zvuka• Dve vrste aproksimacije
– kontinualno vreme → diskretno vreme– kontinualne vrednosti → diskretne vrednosti
kontinualno vreme diskretno vreme
kont
inua
lne
vred
nost
idi
skre
tne
vred
nost
i
t t
t t
Digitalizacija• Dve operacije
1. uzorkovanje (diskretizacija vremena)
Merenje vrednosti signala u tačno određenimvremenskim trenucima
2. kvantizacija (diskretizacija vrednosti)
Aproksimacija izmerenih vrednosti najbližim vrednostima iz konačnog skupa
Digitalizacija• Rezultat digitalizacije
– niz kvantizovanih veličina izmerenih u pojedinim vremenskim trenucima1551841361221261031651471131387613516016185124
• Rekonstrukcija polaznog signala na osnovu digitalne reprezentacije– rezultat se razlikuje od originala
Digitalizacija• PCM modulacija (pulse code modulation)
1. uzorkovanje2. kvantizacija3. kodovanje: reprezentacija pojedinih kvantizacionih nivoa binarnim brojevima
011100101110111
t000001010
001010101110110110101100100100100101110111
Digitalizacija• DPCM modulacija (differential PCM)
– kodira vrednost kao razliku u odnosu na prethodnu
signal
PCM
DPCM
Digitalizacija• Kada je rekonstruisani signal dovoljno dobar?
– Nyquist-Shannon teorema odabiranja:• frekvencija uzorkovanja mora biti najmanje dva puta veća od najviše frekvencije
koju je potrebno očuvati
– primer 1: telefonska linija• namenjena za prenos ljudskog glasa• ljudski glas: 300 – 3400 Hz• minimalna frekvencija bi bila: 6800 Hz• u praksi se koristi: 8000 Hz
– primer 2: CD audio• namenjen za skladištenje muzike• opseg koji ljudsko uho čuje: 20 – 20000 Hz• minimalna frekvencija bi bila: 40000 Hz• u praksi se koristi: 44100 Hz
Digitalizacija• Kada je rekonstruisani signal dovoljno dobar?
– gustina kvantizacionih nivoa• maksimalna greška kvantizacije za nivo kvantizacije širine a iznosi a/2
a/2
a/2
a
Digitalizacija• Kada je rekonstruisani signal dovoljno dobar?
– gustina kvantizacionih nivoa• u praksi se ukupan broj kvantizacionih nivoa najčešće predstavlja kao stepen
dvojke, tipično 28 ili 216
• 28 = 256 nivoa– za skladištenje jednog uzorka potrebno je 8 bita
• 216 = 65536 nivoa– za skladištenje jednog uzorka potrebno je 16 bita
– primer 1: telefonska linija• frekvencija uzorkovanja: 8 kHz• 256 kvantizacionih nivoa → 8 bita po uzorku• za kodiranje jedne sekunde signala potrebno je: 8000 (Hz) x 8 bita• brzina prenosa: 64 kbit/s
– primer 2: CD audio• frekvencija uzorkovanja: 44.1 kHz• 65536 kvantizacionih nivoa → 16 bita po uzorku• za kodiranje jedne sekunde signala potrebno je: 44100 x 16 bita• brzina prenosa: 705.6 kbit/s (CD audio je stereo – ima dva kanala, dakle sve ovo x2)
Obrada signala• Izvođenje operacija nad signalom u cilju poboljšanja njegovih
karakteristika– npr. editovanje zvučnih zapisa, uklanjanje šuma
• Obrada signala u vremenskom domenu– koristi se “sirovim” PCM podacima
• Obrada signala u frekventnom domenu– koristi se reprezentacijom signala u frekventnom domenu
Obrada signala u vremenskom domenu• zvučni zapis se posmatra kao niz brojeva
– svaki broj u nizu predstavlja kvantizovanu vrednost
[ ] 1551841361221261031651471131387613516016185124=ix
• sabiranje signala (miksovanje)
[ ] [ ] [ ]iyixiz +=
• množenje signala konstantom (utišavanje / pojačavanje)
[ ] [ ]ixAiy ⋅=
• množenje signala signalom – modulacija (izdvajanje fragmenata)
[ ] [ ] [ ]iyixiz ⋅=
• pomeranje signala u vremenu (montaža)
[ ] [ ]Nixiy −=
Obrada signala u vremenskom domenu• Kombinacije osnovnih operacija
– crossfade– echo– replicate– fade in/out
Obrada signala u vremenskom domenu• upsampling: dodavanje novih uzoraka
– interpolacija
originalni uzorci
dodati uzorci
• downsampling: uklanjanje uzoraka
Frekventni domen• Furijeova transformacija
– za dati signal u vremenskom domenu izračunava njegovu reprezentaciju u frekventnom domenu
FT)(tf )(sF
∫∞
∞−
−⋅= dtetfsF tsi π2)()(
s
Frekventni domen• Inverzna Furijeova transformacija
– za datu reprezentaciju u frekventnom domenu izračunava odgovarajući signal u vremenskom domenu
IFT)(sF )(tf
∫∞
∞−
⋅= dsesFtf tsi π2)()(
Frekventni domen• Furijeova transformacija
– značenje parametara:• t – vreme• s – frekvencija
signal f(t) se može predstaviti kao zbir sinusnih signala čije su amplitude date sa F(s)
Frekventni domen• Furijeova transformacija: primer
– sledeći signal:
predstavlja se kao suma sinusnih signala:
što se u frekventnom domenu predstavlja kao:amplituda prvog sinusa
amplituda drugog sinusaamplituda trećeg sinusa
Frekventni domen• Furijeova transformacija
– rezultat Furijeove transformacije za dati signal može biti i beskonačno mnogo sinusnih komponenti
– ako zanemarimo neke sabirke, rezultat IFT će se razlikovati od originala
restaurirani signal
originalni signal
sinusne komponente
Frekventni domen• boja zvuka – karakteristika muzičkih instrumenata
– određena oblikom funkcije u frekventnom domenu
Obrada signala u frekventnom domenu• Filteri
– pojačavanje / utišavanje pojedinih frekvencija (equalizer)• množenje signala u frekventnom domenu sa funkcijom koja definiše pojačavanje
Kompresija• Lossless kompresija – bez gubitaka
– iste metode kompresije kao i za rasterske slike
• Lossy kompresija – sa gubicima– mp3– Ogg Vorbis
Kompresija• mp3
– mogućnosti za uvođenje “nečujnih” gubitaka: karakteristike ljudskog čula sluha
• zvukovi koje čovek ne čuje• zvukovi koje čovek čuje bolje nego druge• ako se dva zvuka čuju istovremeno, glasniji se čuje a tiši se ne čuje
– delovi zvučnog zapisa se mogu eliminisati bez čujnih razlika
– faktor kompresije ~ 12
MIDI• Musical Instrument Digital Interface
– protokol za digitalnu komunikaciju muzičkih uređaja
• putem MIDI protokola ne prenosi se snimljeni zvuk, nego note koje će instrument odsvirati
• instrumenti imaju karakteristične boje zvuka• izuzetno mali fajlovi ~ 50 KB za 5 minuta muzike