hangkódolás az mpeg rendszerben

Upload: libero70

Post on 19-Feb-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    1/20

    24

    3 Hangjelek forrskdolsa az MPEG-rendszerben

    A digitlis televzihoz termszetesen hozztartozik a digitlis ksrhang tvitele is,amely jobb minsget biztost, mint az analg tv FM-hangtviteli rendszere. Hogy a

    digitlis tv svszlessge elfogadhat rtk legyen, megfelelen kialaktottadatcskkentsi mdszer alkalmazsra van szksg a hangjel vonatkozsban is. Adigitlis ksrhang tvitelnek tovbb olyannak kell lennie, hogy a programszolgltatszabadon vlaszthasson a klnfle adatsebessgek s ezzel egytt a hangjel klnfleminsgi fokozatai kztt. A hangcsatornnak biztostani kell kt ksrhangos, sztereo-,ill. surround-zemmdokat is. Emellett mindezeket a kvetelmnyeket kompatibilisen kellteljesteni; gy minden vev kpes a hangjelet dekdolni, fggetlenl a vlasztottzemmdtl s a kdols adatsebessgtl.

    A felsorolt kvetelmnyeket az ISO/IEC 11172-3 (MPEG-Audio) s az ISO/IEC13813-3 (MPEG-2 Audio) nemzetkzi MPEG-szabvnyok rgztik. A DVB-Projektbenhozott dntsek nyomn a digitlis tv ksrhangjnak kdolsa is ezen eljrsok szerintvalsul meg.

    3.1 Az adatcskkents alapjai

    A 3.1. bra az adatcskkentses informcitviteli csatorna tmbvzlatt mutatja. Ahrforrsbl szrmaz analg jelet mintavtelezzk, kvantljuk, majd kdoljuk. Ezzel azanalg jel digitlis jelfolyamm alakul. Ha a stditechnikban szoksos 48 kHz-esmintavtelezsi frekvencit alkalmazzuk 16 bites kvantlssal, akkor egy monocsatornra768 kbit/s-os adatsebessg addik. Ahhoz, hogy ezt a jelet lehetsg szerint kis

    rfordtssal tovbbthassuk, az adatsebessget egy un. forrskdolban kisebb rtkrekell cskkentennk. A vevoldali dekdol a cskkentett adatsebessg jelet ismtvisszaalaktja PCM-jell, amit digitl-analg talakts kvet. Az analg jel ezutn mr ahangszrhoz vezethet.

    A forrskdols mvszete abban van, hogy az adatcskkents gy valsuljon meg,hogy az az informci rzkelsekor hangkdols esetn a hang hallgatsa sorn nelegyen szrevehet, ill. a hangminsgnek az adatsebessg cskkentse miatti csorbulsalehetleg kevss legyen zavar.

    3.1. bra

    Adatcskkents elve hangtvitelnl

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    2/20

    25

    A hradstechnikai irodalomban e tren kt alapvet lehetsget klnbztetnek meg: aredundancia-, ill. az irrelevanciacskkentst.

    Redundancia alatt bizonyos jelrszeknek az elre jsolhatsgt rtjk. Aredundanciacskkents a jelforrs statisztikai tulajdonsgairl kvn meg ismereteket. Aredundns jelrszek a kdernl elhagyhatk, ill. a dekdernl a jel azokkal kiegszthet.

    gy az eredeti jelalakot maradktalanul visszakapjuk. Hangjelek esetben, ameddig nemmestersgesen ellltott hangjelekrl van sz (generic audio), ilyen statisztikai felttelekalig vannak a jelben, gyhogy tisztn redundanciaredukci segtsgvel nagy kompresszisarnyok nem rhetk el.

    Az irrelevanciacskkents ezzel szemben az informcit befogad szemly vgesrzkelkpessgt hasznlja ki az adatok cskkentsre. Hangjelek esetben a kderbenazokat a jelrszeket elhagyjuk, amelyeket az emberi fl korltozott amplitd-, id- sspektrlis felbontkpessge folytn gysem tud szlelni. Az irrelevanciacskkents,ellenttben a redundanciacskkentssel, megfordthatatlan folyamat. Mgis, mivel ez acskkents az rzkelszmra nem szrevehet, szubjektve az irrelevanciaredukci nemokoz romlst a jel minsgben. Mivel az irrelevanciaredukci az informcit befogad

    korltozott rzkelkpessgt hasznlja ki, ezrt a hangadatok ilyetn komprimlsa azemberi hallsrzkels trvnyszersgeinek alapos ismerett kveteli meg.

    3.2 Pszichoakusztikai alapok

    Elszr az lland vagy hosszabb ideig tart hangok rzkelsvel foglalkozunk,amelyeknl az idbeni felpts hatsa az szrevehetsgben nem llapthat meg. Ezekazok a hangesemnyek (hangjelensgek), amelyek hossza nem rvidebb, mint 200 ms. Aklnll szinuszhangok szlelst rja le az un. nyugalmi hallskszb s a hangfellet.

    Ha a hangesemny nem csak egy szinuszjelbl ll, gy elfordulhat, hogy az egyik hang amsikat elfedi. Hangok szlelse ers hanghatsok utn idt vesz ignybe, ez a jelensgadatcskkentsnl szintn felhasznlhat.

    3.2.1 Nyugalmi hallskszb s hangfellet

    Adott frekvencij szinuszhang nyugalmi hallskszbe alatt azt a hangnyomsszintetrtjk, amelyiket mg ppen rzkelni tudunk. A hallskszb frekvenciafgg. Az Lhangnyomsszintet a kvetkezsszefggssel definiljuk:

    0

    lg20p

    pL = , (3.1)

    ahol p a hangnyoms, s 0p a vonatkoztatsi rtk:5

    0 102

    =p N/m2 = 20 Pa.

    A nyugalmi kszb meghatrozsakor a vizsglatban rsztvevknek gy kellett egyszinuszos jelforrs hangszintjt belltani, hogy a hangot mr ppen ne rzkeljk. Ezeket ahangnyomsrtkeket azutn klnbz frekvencikra is meghatroztk. Nagyszmksrleti szemllyel elvgezve a mrst, s az eredmnyeket tlagolva, kaptk meg az un.hallskszbt (3.2. bra). Mivel a hangjelensg hossz idn t vltozatlan, ezrt szoktuknyugalmi hallskszbnek is hvni.

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    3/20

    26

    3.2. braHallsgrbk

    A hallskszbtl 120 dB tvolsgra helyezkedik el a fjdalomkszb. A (nyugalmi)hallskszb s a fjdalomkszb kztti terletet hvjuk hallsfelletnek is. A 3.2. brnezenkvl mg az azonos hangerrzet grbi vannak bejellve. Ezeken a grbken lthat,hogy a hangerrzet, valamint a hallskszb is ersen frekvenciafgg, ami mr arra utal,

    hogy a hangjelek kdolsakor a spektrum klnbzrszeit ms-ms mdon kell kezelni.Azonban a termszetben elfordul hangok legtbbje nem egyedli szinuszrezgs.Ezrt meg kell vizsglni, hogy milyen hatsok jelentkeznek, ha egyszerre tbb hangbl llhangesemnyt hallunk.

    3.2.2 Elfeds

    Az elfeds a mindennapi letbl jl ismert jelensg. gy az a hangesemny, pl. zene, amelynyugodt csendes krnyezetben jl hallhat, zavar hanghatsok mellett, pl. lgkalapcsmkdse kzben nem rzkelhet. Ezt a jelensget hvjuk elfedsnek. Ahhoz, hogy a hasznoshang mgis rzkelhetlegyen a hangszintjt jelentsen meg kell nvelni. Az elfedsi jelensgmennyisgi lerst szolglja az un. egyttes hallskszb, amelyik azt adja meg, hogy adottzavar hang mellett mekkora a vizsgl hang szintje akkor, amikor az mg ppen hallhat.

    3.2.2.1 Folytonos hangok okozta elfeds

    Keskenysv zaj jelenltben a hallskszb szinuszos hangokra gy hatrozhat meg,hogy a vizsglatban rsztvev szemlyeknek a szinuszos hang szintjt addig kellcskkentenik, hogy az ppen ne legyen hallhat. Ezt a vizsglatot tbb szemllyel 20 Hz

    s 20 KHz kztt minden frekvencira elvgeztk. A kitlagolt szintrtkek adjk azutnaz un. egyttes hallskszbt. A 3.3. bra az egyttes hallskszbt tnteti fel 60 dB

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    4/20

    27

    szint keskenysv maszkol zajokkal felvve, melyek kzepes frekvencija 250 Hz, 1kHz s 4 kHz volt. A zajok svszlessge pedig: 100 Hz, 160 Hz, ill. 700 Hz. Az sszeshangot, amelyeknek a szintje az egyttes hallskszb alatt van, a keskenysv zaj elfedi,s gy azok az emberi halls szmra rzkelhetetlenn vlnak. Lthat, hogy az egytteshallskszb grbinek alakja ersen frekvenciafgg, tovbb hogy a maximumoktvolsga a 60 dB-es vonaltl nvekvfrekvencik irnyban n.

    3.3. braKlnbzkzepes frekvencij 60 dB-es szintkeskenysv zajokhoz tartoz

    hallskszbgrbk

    A maszkolgrbe alakjt nem csak a frekvencia hatrozza meg egyedl, hanem a szint is.A 3.4. bra ezt rzkelteti. Ez esetben a maszkol keskenysv zaj kzepes frekvencija 1kHz, svszlessge 160 Hz, azonban a szintje, LGms-ms. A maszkol frekvencija sszintje mellett egy harmadik jellemznek is szerepe van, ez pedig a maszkol tonalitsa.Egy tonlis (a hangnemben meghatroz) maszkolhang a 3.4. brtl eltr grbketeredmnyez.

    3.4. braKlnbzszintkeskenysv maszkolzajok hallskszbgrbi

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    5/20

    28

    3.2.2.2 Idfggelfedsi jelensgek

    A nagyon rvid ideig tart hanghatsok is okoznak elfedst. A hats vizsglata ez esetbenis ksrleti szemlyek bevonsval trtnt. A maszkolimpulzus 0,5 s idtartam, Lfszint,Gauss-eloszls, fehrzaj volt. Ezt a maszkolimpulzust tvidutn egy 20 s idtartamGauss-impulzus kvette (3.5. bra). A ksrleti szemlyeknek most az volt a feladata, hogy

    a Gauss-impulzus LTszintjt gy lltsk be, hogy az mr ppen ne legyen hallhat.

    3.5. braKlnbzszintmaszkolimpulzusok utelfedsnek

    hatsa a hallskszbre (LT).

    A maszkolzaj megsznse utn az elfedsi hats mg mintegy 10 ms-ig ugyangyrvnyesl, mint kzvetlenl a megszns pillanatban. Csak ezutn kezd az egytteshallskszb cskkenni, s kb. 200 ms mlva ri el a nyugalmi llapotnak megfelelrtket. rdekes, hogy az elfeds nem csak a maszkolhang alatt vagy utn lp fel, hanemakkor is, amikor a Gauss-impulzus azt megelzi. Ezt a hatst az irodalomban elelfedsnekhvjk, amely azonban csak akkor lp fel, ha Gauss-impulzus s a maszkolimpulzuskztt 20 ms-nl nincs hosszabb id. A 3.6. bra az sszes elfedsi hatst egytt

    rzkelteti.

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    6/20

    29

    3.6. bra

    Elfedsi hatsok sszefoglal brzolsa

    A maszkolhanggal idben egybeeselfedsi jelensgeket szimultn elfedsnek hvjuk. Azelelfedsi hats sokkal rvidebb az utelfedsnl, 5 ms-mal a maszkolhang eltt mrcskkenni kezd, ahogyan az a 3.6. brn is lthat.

    3.3 Hangjelek forrskdolsa az elfedsi jelensgek

    hasznostsval

    A 3.3 szakaszban a hangjelek forrskdolsnak az ISO 11172 s az ISO 13818 MPEG-szabvnyok szerinti megvalstst ismerhetjk meg. Az MPEG-hangkdol alapfelptsnek

    bemutatsa utn az gynevezett 1-es rteg (Layer 1) komprimlsi md rszletezsekvetkezik, amit azzal a cllal fejlesztettek ki, hogy a kder megvalstsa minl egyszerbblegyen. Ezt kveti a 2-es rteg (Layer 2) ismertetse, amely a Layer 1-nl sszetettebbfelptsazrt, hogy a hangminsg romlsa nlkl nagyobb adattmrts legyen elrhet. Ateljessg kedvrt rviden az MPEG-szabvny harmadik rtegvel is foglalkozunk, amely aLayer 2-nl is nagyobb tmrtst tesz lehetv. A Layer 3-at azonban a digitlis tv-msorszrsban nem szndkozzk alkalmazni, hasznlata sokkal inkbb az interneteshangtvitelben (MP-3) van elterjedben. Az MPEG-szabvny kifejlesztsnl gondoltak arrais, hogy a hangjelek dekdolsa sokkal kisebb rfordtst ignyeljen, mint a kdols, ami amsorszr rendszereknl igen nagy jelentsg, mert a vgberendezseknek gazdasgiszempontok miatt egyszerbbeknek kell lenni, hiszen ezekbl nagyon sokat ksztenek.

    Ezen a helyen kell rmutatni arra, hogy a szabvnyban csak a dekdols s azadatfolyam lersa rgztett, mert gy biztosthat a klnbz gyrtk ltal ellltottkszlkek kztti kompatibilits. A kder lersa csupn informatv jelleg, amitl azMPEG-kderek gyrti el is trhetnek.

    3.3.1 Az MPEG-rendszerkdolsi eljrs alapfelptse

    Az MPEG-rendszerhangkder alapstruktrja a 3.7. bra szerinti.

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    7/20

    30

    3.7. braAdatcskkentses hangkdols elve az MPEG-szabvnyban;

    a) kdol, b) dekdol

    A kdoland digitalizlt PCM-hangjel elszr egy szrkszletbe jut, amely azt 32egyforma svszlessg svra bontja. Egyidejleg mind a 32 csatornban a jeletalulmintavtelezik, azaz a mintavtelezsi frekvencia a digitalizlshoz alkalmazottmintavteli frekvencia 32-ed rsze. A szrkszletet a kvantl kveti, amely mindegyikrszsvban a jelet gy kvantlja, hogy a lpcsk szma lehetleg kevs legyen, de akvantlsi zaj mg mindig a maszkolsi kszb alatt maradjon, hogy az emberi hallsszmra szrevehetetlen legyen. A megengedhet kvantls meghatrozsakortermszetesen a pszichoakusztikai trvnyszersgekbl kell kiindulni. Ezrt a kapcsolsmegfelel rsze, amely a 3.7. brn mint pszichoakusztikai modell van feltntetve,kirtkeli a bemenjelet, utna kiszmtja minden egyes rszsvra az elfedsi jelensgfigyelembevtelvel a megengedhet kvantlst. Ezutn a kdol a kvantlt mintkat snhny ms segdadatot, amelyek a dekder szmra a hangjel visszalltshozszksgesek, szabvnyos bitfolyamm alaktja, s hibavdelemmel ltja el.

    A dekderben elszr az tviteli hibk korrekcija valsul meg, ezt kveti a jrulkosadatok s a hangjel mintinak helyrelltsa. A rekonstrult 32 rszsv egy inverzszrkszletbe jut, amely ezeket jra egy egysges frekvenciasvv rendezi. Ezt a fajtaadattmrtsi eljrst hvjuk rszsv (subband) kdolsnak.

    Az egyes rtegek fbb jellemzinek ttekintse eltt vizsgljuk meg, hogy a 3.8. a) braszerinti ff fa =fB svszlessg jelbl,fa 0esetn, mekkora mintavteli frekvencivalkell mintkat venni ahhoz, hogy a mintkbl az eredeti fB svszlessgjel (esetnkben a

    rszsv jele) visszanyerhet

    legyen. Termszetesen a felvzolt spektrumot tekinthetnnkegy 0ff frekvenciatartomny jel spektrumnak is, ahol a 0fa tartomnyban nincsspektrumsszetev. Ebben a jelben a legnagyobb frekvenciaff,s gy az un. alapsvi, azaza 0ff frekvenciatartomny jelekre vonatkoz, jl ismert mintavteli ttel rtelmben amintavteli frekvencinak legalbb 2ff -nek kellene lennie. Ltni fogjuk, hogy ennl kisebbmintavteli frekvencia is alkalmazhat, amit mr abbl is gyantani lehet, hogy a spektrumegy 0fB frekvenciatartomny alapsvi jelnek a frekvenciatengely mentn fa-val valeltolsval is ltrehozhat. A 0fB frekvenciatartomny jelre pedig Bmv ff 2 , ami

    kisebb ff2 -nl.

    Ezek utn vizsgljuk rszletesebben annak a rszsv jelnek a mintavtelezst,

    amelyre teljesl, hogy mff Bf =

    / egsz szm, s a svhatrokon nincsenek diszkrtspektrumvonalak. Legyen Bmv ff 2= .

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    8/20

    31

    3.8. braSvszrjelnek mintavtelezse

    A 3.8. b) brn a mintavevjel spektruma lthat, ahol mindegyik spektrumvonalnak azidtartomnyban egy szinuszos rezgs felel meg. Mivel a mintavtelezs a szrjelnek sa mintavevjelnek a szorzst jelenti, ezrt mindegyik szinuszjel szorzdik a szrjelvel,azaz kt oldalsvos amplitdmodulci jn ltre, ahol az egyes vivfrekvencik amintavteli frekvencia egszszm tbbszrsei, a szr jele pedig a modull jel. A c)brn az mvf -hez tartoz AM-DSB jelet vastag vonal jelli, a mvf2 -hez tartoz szaggatott.

    A c) brn jl lthat, hogy egy faff frekvenciasv szrvel az eredeti spektrumkiszrhet, azaz a szr kimenetn a jel visszanyerhet. Ha a szksges felttelek nemteljeslnek, akkor a mintavett jel spektrumban tlapoldsok jnnek ltre, amely

    lehetetlenn teszi az eredeti spektrum kiszrst, ill. a jel rekonstrulst.Az MPEG-szabvnyban a rszsv kdols valamennyi szrje 750 Hz svszlessg,

    gy valamennyi rszsvra teljesl az mff Bf =/ felttel, a mintavtelezs valamennyi

    svban 1,5 kHz-es mintavteli frekvencival megvalsthat. A szaknyelvben ezt hvjkalulmintavtelezsnek (subsampling).

    Termszetesen a rszsvok szrse s alulmintavtelezse is digitlisan valsul meg. Azels rszsv jelt egy 0750 Hz frekvenciasv alultereszt szr kimenetn kapjukmeg. Jelljk a 3.9. a) bra szerinti idelis, egyelre mg analg alulteresztszrfelshatrfrekvencijtfH-val.

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    9/20

    32

    3.9. braDigitlis alulteresztszrslyfggvnye s struktravzlata

    A szrt )(t -val gerjesztve, a kimenetn a sinx/x fggvny alak vlaszjel, a szrslyfggvnye jelenik meg. A kimenjelfH -nl nagyobb frekvencij komponenseket nemtartalmaz, ezrt ha a mintavteli frekvencia 2fH -nl nagyobb, akkor a mintavteli ttelrtelmben a jel a mintkbl rekonstrulhat. Legyen Hmv ff 4= . Ebben az esetben a

    mintavtelezett kimenjel a 3.9. b) bra szerinti. Annak rdekben, hogy ne kelljenvgtelen sok mintt figyelembe venni, a kis rtkeket hagyjuk el. Ez a jel kis torzulstokozza csak, hatsban olyan, mintha az amplitdkarakterisztikt vltoztattuk volna megkismrtkben, hogy a szrvlaszjele ppen a csonktott impulzus legyen. Az a) s a b)brn is ltjuk, hogy a szr nem kauzlis, mert a kimenjel mr ltezik, amikor a

    bemeneten a gerjeszts mg 0. A gyakorlati megvalstsnl ezrt be kell vezetni egy

    ksleltetsi idt, amely fele a megcsonktott sinx/x impulzus Timp. idejnek. gy a mrkauzlis vlaszfggvnyt a 3.9. c) bra szerinti elrendezs szolgltatja. Az MPEG-

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    10/20

    33

    szabvny szrinl a 3.9. c) bra szrjvel ellenttben az gynevezett szregytthatkszma nem 7, hanem 512, ami biztostja az amplitdkarakterisztika oldalleinek nagymeredeksgt, ill. a j svsztvlasztst.

    A rszsv kdols svszrinek tviteli karakterisztikja szrmaztathat az un.prototpus- vagy vonatkozsi alultereszt tviteli karakterisztikjbl a 3.10. a) braszerint a frekvenciatengelyen val eltolssal.

    3.10. braSvszrtviteli karakterisztikja s slyfggvnye

    gy a svszrtviteli karakterisztikja:

    ),(2

    1)(

    2

    1)( 00 jjHjjHjH aa ++= (3.2)

    ahol )(jHa a prototpus-alultereszttviteli karakterisztikja, amelynek svszlessge

    csak 375 Hz. Inverz Fourier-transzformcival megkapjuk a szr slyfggvnyt. Acsillaptsi ttel alkalmazsval:

    ,cos)()(2

    1)(2

    1)( 0

    00

    tthethethth atj

    a

    tj

    a

    =+=

    (3.3)

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    11/20

    34

    azaz a svszr slyfggvnye a prototpus-alulteresztszr ha(t) slyfggvnyvelamplitdban modullt szinuszrezgs (3.10. b) bra).

    Miutn ismerjk a slyfggvnyeket, amelyek csak 0-ban klnbznek, azalulteresztmintjra meghatrozhatk a szregytthatk.

    3.11. bra32 rszsvos polifzis szrfelptse

    A multiplexerrel s demultiplexerrel kiegsztett szrelrendezs az un. polifzis szr

    (3.11. bra), amely termszetesen az els, az alulteresztrszsv jelt is meghatrozza.A szrteht 32 fzisban szmtja ki a rszsvok mintit. Az els512 szregytthat

    az els rszsv szrjt realizlja. Az 512 szorzs eredmnynek sszege adja az elsrszsv els mintjt. A 2. rszsv egytthatit megkapjuk, ha az un. prototpusszregytthatit megszorozzuk mvnT02cos -vel. A 2. fzisban ezek szorzdnak meg az 512

    mintval, hogy sszegezs utn a 2. rszsv elsmintjt adjk. Valamennyi rszsv elsmintjnak hasonl kiszmtsa utn a regiszter tartalma 32 j mintval eltoldik, hogykezddhessen a rszsvok msodik mintjnak kiszmtsa. Tulajdonkppen egy 32egyenletbl ll lineris egyenletrendszerbe helyettestettk be a PCM-mintknakmegfelel fggetlen vltozkat, hogy meghatrozzuk a szrk jeleit. A dekderben a

    feladat fordtott: ott a sz

    r

    k jelb

    l kell, az egyenletrendszert megoldva, a PCM-mintkatkiszmtani. Mivel az ismeretlenek szma 32, megegyezik az egyenletek szmval, feladatelvgezhet. A mveleti blokk neve inverz szrkszlet.

    Ezek utn vizsgljuk a kdols tovbbi rszleteit. A rszsv kdolssal elrhetkompresszis arny lnyegben az egyes rszsvokban alkalmazott kvantlsi lpcsfggvnye. Ennek meghatrozsa a kvetkezk szerint trtnik. Ttelezzk fel, hogy amaszkol egy 1 kHz-es szinuszos hang (3.12. bra). A legkritikusabb helyzet akkor ll el,ha ez a hang a rszsv felssvhatrn van, mivel a maszkolgrbe a kisebb frekvencikfell meredekebben vltozik. Ez esetben a legkisebb az adott rszsvban az elfedsi hats.A maszkolgrbe s az als svhatr metszspontja hatrozza meg azt a szintet, amely alattebben a rszsvban az sszes hang szrevehetetlen, gyhogy ezeket a dekderoldalon nem

    szksges visszaadni,

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    12/20

    35

    3.12. bra

    Maszkolsi kszb meghatrozsa

    ill. a kvantls ebben a rszsvban olyan durva lehet, hogy a kvantlsi zaj szintje ezt azrtket (szaggatott vonal) elrheti.

    Tbbnyire azonban nem csak egyetlen maszkolhang ltezik, hiszen pl. a beszd vagyzene sokkal sszetettebb hangjelensg. A 3.13. bra hrom szinuszos hanghoz tartozhrom maszkolt tntet fel.

    3.13. bra

    Amplitdspektrum az elfedsi grbkkel s a megengedhet

    kvantlsi zajjal

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    13/20

    36

    Vannak olyan rszsvok, amelyekben kt maszkolhang is elfedst okozhat.A 3.13. brn jl lthat, hogy a maszkolsi kszbk rtke nagymrtkben fgg a

    elfedst okoz jel amplitdjtl s spektrlis megoszlstl. A megengedhetkvantlsizaj azonban kzvetett mdon meghatrozza a jel tvitelhez szksges adatsebessget,ezrt az az elfeds mrtknek fggvnyben ingadozni fog (3.14. bra).

    3.14. braDinamikus adatsebessgtartalk

    A 3.14. brn v a szksges adatsebessget jelli. A jrulkos informcik a rszsvokrekonstrulst s a dekder vezrlst biztostjk. A jrulkos informcik adatsebessgekzel lland, ellenttben a kvantlt mintavteli rtkek tvitelhez szksgesadatsebessggel. Mivel a legtbb tviteli csatornt lland adatsebessgre tervezik,idfgg adatsebessg esetn a kapacits egy rsze kihasznlatlan maradna. Ezrt akvantlsi szintek szmt llandan olyan mrtkben meg kell nvelni, hogy a csatorna

    kapacitsa teljes mrtkben ki legyen hasznlva. Ezzel elrhet, hogy a 3.13. bra szerintimaximlis rtkkvantlsi zaj al kerlhet a pillanatnyi kvantlsi zaj.Ha a jelben a kvantlsi zaj elri a maszkolsi grbt, gy mint a 3.13. brn, akkor

    ezzel a jellel mr semmilyen tovbbi jelfeldolgozs nem vgezhet el anlkl, hogy akvantlsi zaj hallhatv ne vlna. Ez mr egy egyszerkorrektorramkrre is rvnyes.Ha pl. 5 kHz-nl a frekvenciamenetben kiemelst vgeznnk, akkor a kvantlsi zajtllpn a maszkolsi grbt. Ugyanez rvnyes akkor is, ha az egyszer mr kdolt jeletjra kdolnnk. Hogy a jel mgis korltozottan ismt feldolgozhat legyen, a maszkolsigrbe s a kvantlsi zaj kztt a 3.15. brn lthat mdon bizonyos tvolsgot kellhagyni.

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    14/20

    37

    3.15. braAdatsebessgtartalk kihasznlsa a maszkolsi kszb s a kvantlsi zaj

    kztti tvolsg maximalizlsra

    Egy iteratv folyamat sorn a maszkolsi grbe s a kvantlsi zaj kztti tvolsg addignvekszik, amg a rendelkezsre ll csatorna maximlis adatsebessge teljesen ki nemlesz hasznlva. Kvetkezskppen a jelen vgezhet utfeldolgozs lehetsge annlnagyobb, minl nagyobb az adatsebessg.

    3.3.2 1-es rtegkdols

    Az alapelvek utn vizsgljuk meg rszletesebben az MPEG-kdolt s -dekdolt. A 3.16.bra az MPEG 1-es rteghangkdols tmbvzlatt tnteti fel. A szrkszlet a jelet 32

    egyenl svszlessg rszsvra osztja. A rszsvokban a jel mintavtelezse ismegvalsul 1,5 kHz-es mintavteli frekvencival.

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    15/20

    38

    3.16. braMPEG-szabvny 1-es rtegkdol tmbvzlata monojelre

    Ezutn a kder minden rszsvban folyamatosan 12 mintbl ll blokkokat kpez,amelyekben a legnagyobb minta a lptktnyez. Ezeket 6 bites felbontssal szintnkvantlja, ill. kdolja, ami ltal 26, azaz 64 hangerfokozat klnbztethetmeg. Mindenhangerfokozat 2 dB-es szintnek felel meg, gy az ereddinamikatartomny kb. 120 dB.A lineris kvantl s kdol elvgzi a 12 mintnak a lptktnyezvel val osztst,az un. normlst, a mintk lineris kvantlst s kdolst. A pszichoakusztikaimodell meghatrozza a maszkolsi kszbt s ezltal a szksges kvantlsi lpcskszmt. Mind a 12 minta egyformn kvantldik, ami megengedhet, mivel a maszkolshatsa az el- s utelfeds miatt az egsz, a mintavteli frekvencitl fggen 8-tl 12ms-ig tart blokkra kiterjed. (A blokk idtartama 48 kHz-es mintavteli frekvencinl srszsvonknt 32-szeres alulmintavtelezsnl: 1232/(48103) = 8 ms.)A rszsvokra trtn felbontssal prhuzamosan megvalsul a jelnek 512 mintavtelirtkkel szmtott Fourier-transzformcija is, hogy a jel spektruma mg nagyobbfelbontssal lljon rendelkezsre az alacsony frekvencik tartomnyban, ahol a rszsvfelbonts alapjn vgzett analzis nem ad optimlis eredmnyt. A spektrum vizsglatakiterjed a helyi maximumok meghatrozsra s annak eldntsre, hogy ezek a jelnek

    tonlis vagy atonlis komponensei. Erre azrt van szksg, mert egy adott jelnl a tonalits ahogyan errl mr sz volt erteljesen befolysolja a maszkolsi grbe alakjt. Teht arszsvok maximlis hangszintjbl meghatrozhatk a maszkolsi grbk, ill. kvantlsilpcsk. Az elre megadott adatsebessg s a maszkolsi grbe alapjn a kvantlsi szintekszma annyi lesz, hogy a tvolsg a maszkolsi grbe s a kvantlsi zaj kztt maximlislegyen.

    Az tviendmultiplex jel a rszsvok kvantlt mintinak kdjai mellett tartalmazza adekdolshoz szksges informcikat, azaz a lptktnyezt s a dinamikus

    bitkiosztst, amely minden minthoz megadja a felhasznlt bitek szmt. Mindezeket azadatokat a fejlc elzi meg, amely a dekder vezrlshez szksges informcikattartalmazza. A 3.17. brn az adatfolyam felptst lthatjuk az 1-es rteg MPEG-

    kder kimenetn, monojel kdolsakor.

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    16/20

    39

    3.17. bra

    1-es rtegadatfolyam egy keretnek felptse

    A kiegszt adatok az adatkeret vgn lehetv teszik pl. surround-sound (trbelihangzs) megvalstst.

    3.3.3 2-es rtegkdols

    Az 1-es rtegkdolssal ellenttben a 2-es rtegkdolnl (3.18. bra) a blokkok 36PCM-mintbl llnak, ami 48 kHz-es mintavteli frekvencinl a hangjel 24 ms-osszakasznak felel meg. Ebben az esetben elfordulhat, hogy egyetlen lptktnyeznemelg rszsvonknt, mivel az elfeds hatsa maximlisan csak 20 ms-ig tart.

    3.18. braMPEG-szabvny 2-es rtegkdoljnak tmbvzlata monojelre

    Ha a jelben sok vltozs van, rszsvonknt s blokkonknt kettvagy hrom lptktnye-zre is szksg lehet. Ha ellenben kevs a vltozs, egy is elegend.

    A kdolban kln egysg vizsglja, hogy hny lptktnyezre van szksg. Eztkveten megtrtnik a blokk maximumainak, azaz a lptktnyezknek a meghatrozsa.A lptktnyezk mellett a dekder szmra kzlni kell azok szmt is. A maszkoltonalitsnak meghatrozsa a 2-es rtegben 1024 rtkbl trtnik a nagyobb spektrlisfelbonts rdekben.

    A kvantlsi lpcsmeghatrozsa s az adatfolyam formlsa az 1-es rtegnek megfelel,

    viszont a 2-es rtegben csak az alsbb rszsvokban valsul meg a mintknak 2-tl 15-igterjed bitszmmal val megadsa. A felsbb rszsvokban a jel energija kisebb, ezrt a

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    17/20

    40

    mintk brzolsi lehetsge korltozott. gy 50 kbit/s adatsebessg felett s 48 kHz-esmintavteli frekvencinl a 23-tl 26-ig terjed rszsvokban csak 0, 3, 5 vagy 65535kvantlsi szint lehetsges, ami hozzjrul az adatsebessg cskkenshez. Mivel csak 4klnbzkvantls megengedett, ezrt a bitkijellshez elegendmindssze kt bit. A 27-tl 31-ig terjedrszsvokat 48 kHz-es mintavteli frekvencia esetn egyltaln nem visszk t, mivelaz e svokba esfrekvencik 20 kHz felettiek, teht egybknt sem hallhatak. A 3.19. brn a 2-

    es rteg adatfolyam egy kerett lthatjuk. Annyiban klnbzik az 1-es rtegtl, hogy 1152PCM mintbl pl fel, valamint tartalmazza az alkalmazott lptktnyezk szmt is.

    3.19. bra2-es rtegadatfolyam egy keretnek felptse

    3.3.4 3-as rtegkdols

    A teljessg kedvrt rviden tekintsk t a 3-as rteg kdolst, amit azzal a cllalfejlesztettek ki, hogy a 2-es rtegnl is nagyobb adattmrtst valstsanak meg vele egy

    bonyolultabb jelfeldolgozsi folyamat eredmnyeknt.A kdol tmbvzlata a 3.20. brn lthat. A 3-as rtegben a jel spektruma az un.

    mdostott diszkrt koszinusztranszformcival (MDCT) a jel tulajdonsgaitl fggenklnbz, de 576-nl nem nagyobb szm rszsvra bonthat fel, ami sokkal pontosabbmaszkolsi grbe, ill. kvantlsi lpcsmeghatrozst teszi lehetv.

    3.20. bra3-as rtegkdol tmbvzlata (monocsatorna)

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    18/20

    41

    A kvantls nemlineris, ami tovbbi adattmrtst biztost. A jelben mg meglvredundancia az un. Hoffman-kdolssal cskkenthet, ami a hangminsg romlsa nlklaz tviendadatmennyisg jabb cskkenst eredmnyezi.

    3.3.5 Dekdols

    A dekderoldalon a hibajavts utn vgbemegy az adatfolyam sztvlasztsa a normlt skvantlt hangmintkra s a dekdolshoz szksges jrulkos informcikra. A

    bithozzrendels s a lptktnyez kirtkelst kveten a 32 rszsv mintirekonstrulhatk.

    3.21. bra

    MPEG-szabvny, 1-es s 2-es rteg

    dekder tmbvzlatamonohang dekdolsra

    Az inverz szrkszlet a rszsvokat ismt teljes svv egyesti. Mivel a dekderoldalonnem kell pszichoakusztikai modellt kirtkelni, ezrt a jelfeldolgozs itt jval egyszerbb,aminek klnsen a msorszrsban van nagy jelentsge.

    3.3.6 MPEG-hangkdols paramterei

    Ebben a szakaszban az MPEG-hangkdols legfontosabb paramtereit foglaljuk ssze. ADVB-projekt szerint minden vevnek rendelkezni kell egy MPEG-kompatbilis

    hangdekderrel, amely a szabvnyban elirnyzott sszes zemmdot tmogatja. Tudniakell monojelet, sztereojelet s kt teljesen fggetlen hangjelet dekdolni. Egy tovbbizemmd az un. joint-sztere. Az eljrs azt a tnyt hasznostja, hogy 2 kHz frekvencikfelett a jel finom rszletei nem jrulnak hozz a sztereohats kialakulshoz, hanem csak a

    burkolja. Ezrt 2 kHz felett elg csak az sszegjelet kdolni s a kt csatornasklatnyezjt kln-kln tvinni.

    Az alkalmazhat mintavteli frekvencik 32 kHz, 44,1 kHz s 48 kHz. A teljesadatsebessg az 1-es rtegnl 32 kbit/s s 384 kbit/s kztti, a 2-es rtegnl 32 kbit/s s448 kbit/s kztti rtk. Ezen hatrok kztt a szabvnyban 14 adatsebessg vanmeghatrozva, amelyeket minden dekdernek tudni kell fogadni.

    Tovbb a 2-es rtegre fejlesztett dekdernek az 1-es rteg szerint kdolt jeleket is

    dekdolni kell. gyszintn a hrmas rtegdekdernek tudni kell dekdolni az 1-es s 2-

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    19/20

    42

    es rteg szerint kdolt jeleket, azaz kompatbilisnek kell lennie az 1-es s 2-es rteggel.Ilyenkor azt mondjuk, hogy a rendszer fellrl kompatbilis.

    Az MPEG-kompatbilis dekdernek s gy a digitlis tv-vevnek (Integrated ReceiverDecoder) a szabvnyban rgztett sszes adatsebessget s zemmdot tmogatnia kell. A

    programszolgltatk teht tg lehetsgekkel rendelkeznek az alkalmazott hangkdols sezen keresztl a hangminsg megvlasztsban. A 3.1. tblzat a hangminsg s az

    adatsebessg kapcsolatt adja meg a 2-es rtegkdols esetben.

    3.1. tblzat2-es rtegkdolssal tvitt monojel minsge az adatsebessg fggvnyben

    Kdolt monojeladatsebessge [kbit/s]

    Tmrtsi arny Minsg

    192 4 kivl128 6 nagyon j96 8 j (CD)64 12 kb. FM-hangtvitel

    48 16 kb. AM-hangtvitel32 24 beszdminsg

    Az MPEG-hangkdols az eddigiek mellett lehetv teszi az 1994-ben nemzetkzi szab-vnyknt elfogadott surround-hangtvitelt is, amit a kvetkezszakaszban tekintnk t.

    3.3.7 MPEG-2 szerinti hangkdols

    A surround-hangtvitel az un. MPEG-2 szerinti hangkdolssal valsthat meg.

    Jellegzetessge, hogy 5 hangszrval hozza ltre a trhats hangzst a 3.22. brn lthatelrendezsben. A hagyomnyos sztereotvitel jobb- s baloldali hangszri mellett vanmg egy kzponti (center) s kt oldal-(surround) hangszr is. Szoks ezrt az eljrst3/2-es szterenak is nevezni.

    3.2 2. bra3/2-es sztere hangszr-elrendezse

  • 7/23/2019 Hangkdols Az MPEG Rendszerben

    20/20

    43

    A rendszer kifejlesztsnl nagy hangslyt fektettek a kompatibilitsra, azaz egy MPEG-dekdernek tudni kell dekdolni a surround-hangot is. Ez az un. fellrl kompatbilismegolds lehetv teszi, hogy a surround-hanggal kisugrzott programot azok a nzk isdekdolhassk, termszetesen csak mint sztereojelet, akiknek nincsen surround-dekdere.A rendszer alulrl is kompatbilis, azaz egy MPEG-2 dekder (surround-dekder) azMPEG-adatfolyamot is dekdolja. A fellrl val kompatibilits biztosthat, ha az 5

    csatornbl (Lf, Rf, Lh, Rh s C)lineris mtrixolssal hozzuk ltre a kt sztereojelet:

    hf LCLL 71,071,0 ++= (3.4)

    hf RCRR 71,071,0 ++= (3.5)

    A kompatibilits miatt az is szksges, hogy a surround-jel a 2-es rteg multiplexlsnakmegfeleljen, azaz az adatkeret elsrszben L s R , a kompatbilis sztereocsatorna jelei, mg a

    tovbbi 3 csatorna informcitartalma a keret kiegsztadatok rszben kerljenek tvitelre.

    3.4 sszefoglals

    A digitlis tv hangjnak adatcskkentse az MPEG-szabvny szerint valsul meg. Azeljrs a spektrum 32 rszsvra bontsn s egy 12 vagy 36 mintbl ll blokk kpzsnalapul. A blokkok mintinak kvantlsa az emberi halls elfedsi sajtsgait figyelembevevakusztikus modell alapjn valsul meg. A ltrejvkvantlsi zajt a jel spektrlisans idben elfedi, aminek kvetkeztben azt nem lehet meghallani. A multiplexltadatfolyambl a dekder az eredeti hangmintkat rekonstrulja.

    A 2-es rteg kdolssal kb. 100 kbit/s adatsebessg mellett a hangminsgben

    kdolsbl szrmaz romls nem rzkelhet. Ilyenkor azt mondjuk, hogy az tviteltranszparens. Az MPEG-hangdekder valamennyi zemmd s adatsebessghangjeletdekdolni tudja, ami a felhasznl mindenkori ignynek kielgtst teszi lehetv.

    A 3-as rtegMPEG-hangkdolst azzal a cllal fejlesztettk ki, hogy egy sszetettebbkdolsi folyamat rvn a 2-es rtegnl nagyobb tmrtst rjenek el. A Joint Stereo akt sztereocsatorna kztt meglvredundancit hasznostja, mg a Surround Sound aszabvny kompatbilis bvtse.