transformation et codage du son numérique (2)
TRANSCRIPT
![Page 1: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/1.jpg)
Transformation et codage du son numérique (2)
S. NatkinMai 2003
![Page 2: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/2.jpg)
Les effets de retards
• Court <10 ms modification du spectre (un ou deux échantillons passe bas FIR, plus long filtre en peigne)
• Moyen >10ms et <50 ms effet d’ambiance, rehausse un signal mince
• Long > 50 ms effet d’échoUtiliser aussi pour donner un effet de localisation dans l’espace
∆
+x
x
Amplitude du signal originel
Amplitude du signal retardéSchéma d’une ligne à retard simple
![Page 3: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/3.jpg)
Flanger
∆=d+q.f(t)
++
f(t) est une fonctionpériodique ou une fonctionaléatoire de moyenne nulleet comprise ente -1 et +1
Rolling Stone
Rolling Stone Flangé
Version plus élaborée le phasing
![Page 4: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/4.jpg)
Effet Chorus
Fl
x
a0
x(n)
Fl
x
a1
Fl
x
ak
+
Une technique
Sans
Avec
![Page 5: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/5.jpg)
Spatialisation
Spectre du signal réverbéré (JMJ)
Effet de réverbérationEffet de localisation
Localisé
![Page 6: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/6.jpg)
Détermination de la position d’un son dans l’espace
Détermination de l’azimut et zenith• Différence de temps entre les deux oreilles• Différence d’amplitude avant arrière (ombre de la tête)• Différence spectrale liées aux réflexions asymétriques (pavillons, épaules, torses)Détermination de la distance• Rapport entre le signal direct et le signal réverbéré• Pertes des composantes hautes fréquences• Pertes des détails
![Page 7: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/7.jpg)
Restitution
• Mono (distance)• Stéréo (distance et localisation sur un
plan)• Spatial avec deux hauts parleurs
(transaural)• Spatial avec un casque (binaural)• Spatial avec N haut parleurs
![Page 8: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/8.jpg)
Modèles complexes de réverbération: Composants de base
Réseau passe tout du premier ordre
g
+
x
-g
+ d
x
1-g2
x
Filtre en peigne IIRg
x
+ d
Ligne à retard multibascule
∆1
+x
x
a0
a1
∆2 x
a2
![Page 9: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/9.jpg)
Modèle global
∆1
+x
x
a0
a1
∆n x
an
Peigne PeignePeignePeigne
Passe tout
Passe tout
Réflexions précoces
Réflexions tardives
…..
![Page 10: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/10.jpg)
HRTF
Détermination expérimentale des filtresdéfinissant la différences de perceptionentre les deux oreilles pour une positiond’un objet sonore.Dépend de la tête…
![Page 11: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/11.jpg)
Exemple de processus de spatialisation binaural
HRTF D
HRTF G
Son direct
position
Réflexions précoces
Filtre de réverbération
Réflexions tardives
Modèle de salle
![Page 12: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/12.jpg)
Pan Pot d’intensité (2D)
G D
θmax
θ
[ ]
[ ]θθ
θθ
sincos22
).(.
sincos22
).(.
−=
+=
rfAA
rfAA
D
G
f(r) décroît avec la distance. Peut être différentepour le son direct, les réflexions précoces et tardives
r
![Page 13: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/13.jpg)
Codage du son numérique
![Page 14: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/14.jpg)
Pulse Code ModulationReprésentation temporelle du signal échatillonnéFréquences d’échantillonnagede 4Khz à 44KhzQuantification linéaire sur 8 ou 16 bitsReprésentation en complément à 2
![Page 15: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/15.jpg)
PCM différentiel
DCMP codage différentiel: on code x(0) etdn =x(n)-x(n-1) Efficace si le signal varie lentement.
Par exemple si x(n) est sur 16 bits on code la longueur de d(n) sur 3 bits puis dn
Efficace si dn tient sur moins de 13 bits
![Page 16: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/16.jpg)
Adaptative PCM : ADPCM
Principe: coder la variation des différences. Par exemple (schéma IMA)
x(n-1)=x(n-2)+dn-1 avec dn-1 =D(k)Notons in-1 =kx(n)=x(n-1)+dn avec dn =D(t)in =tOn codex(0) sur 16 bitsi1 sur 8 bitsdin = in- in-1 sur 4 bits
Table des différences D
D(0)D(1)D(2)
.D(k)
.D(t)
.
![Page 17: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/17.jpg)
Compression psycho perceptive
• La perception du son est logarithmiqueUtiliser une quantification logarithmique• L’oreille distingue mieux les sons dans la
bande 300 – 6000 HzEchantillonner différemment selon les
bandes de fréquence• Certains sons en masque d’autreSupprimer les informations non perçues
![Page 18: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/18.jpg)
Quantification perceptive:lois de quantification mu et A
SegmentA
SegmentB
SegmentC
Mu: 8 segments de 16 Valeurs, incréments de 2 de à 256A : 7 segments le premier de 32 valeurs et les autres de 16 valeurs
![Page 19: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/19.jpg)
Notion de bande critique
• Dans un intervalle de fréquence autour d’une fréquence centrale, l’oreille ne distingue pas nettement deux sons.
• Si un son a une intensité forte il masque, pendanr une courte période les sons d’intensité plus faible dans sa bande critique
• La notion de bande critique est lié à un effet de filtrage en peigne à Q contant effectué par l’oreille
• En première approximation il est possible de décomposer un son audible sur une vingtaine de bande de fréquences (pendant du RVB visuel)
![Page 20: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/20.jpg)
Compression fréquentielle perceptive (ex MP3)
MPEG 1 est une norme de transmission de vidéo numérique(Image animée+ son) intégrant différentes qualités selon les typesD'application (visiophonie...Video a la demande)
Le son est échantillonne a 32, 44,1 kHz ou 48 kHz
MPEG 1 Layer 3 (MP3) est un codage du son , il s’agit d’unecompression non conservative basée sur le masquage
3 niveaux avec des codeurs de plus en plus complexes enFonction de la qualité de son visée
![Page 21: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/21.jpg)
Utilisation des effets de masquage
![Page 22: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/22.jpg)
Utilisation des effets de masquage (2)
![Page 23: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/23.jpg)
Codeur MP3
![Page 24: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/24.jpg)
Compression MPEG1
![Page 25: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/25.jpg)
Compression dynamique de la voix
Mode de compression utilisé pour un traitement en temps réel de la voix sur un canal à faible débit (GSM, RealAudio…)
Basé sur un modèle acoustique de la gorge qui permet de caractérise le son initial et l ’effet de résonance (formants)
![Page 26: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/26.jpg)
LPC: Linear Predictive coding
Les formants sont prédits par un filtre linéaire adaptatif qui induit le formant courant par rapport aux précédents.
Une fois le formant calculé il est soustrait du signal initial ce qui donne le résidu qui doit en théorie contenir le son direct
En pratique il faut transmettre une partie du formant ou une référence à un formant voisin
Amélioration le CELP
![Page 27: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/27.jpg)
Filtre formantique
![Page 28: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/28.jpg)
Processus de codage
![Page 29: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/29.jpg)
Processus de décodage
![Page 30: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/30.jpg)
MPEG Audio
![Page 31: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/31.jpg)
CodecMPEG 4
![Page 32: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/32.jpg)
Débits MPEG 4
![Page 33: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/33.jpg)
Formats Audio en général
![Page 34: Transformation et codage du son numérique (2)](https://reader030.vdocuments.mx/reader030/viewer/2022012418/6172fff1bd44f272401cb5db/html5/thumbnails/34.jpg)
Bibliographie
• L’audionumérique, Curtis Raod, Dunod1998
• The technology of video and audio streaming, David Auterberry, Focal Press, 2002
• Le son musical, John Pierce, Pour la Science, Belin 1984