introducción a la voz humanamzanartu/elo313/docs/... · elo-313: procesamiento digital de señales...
TRANSCRIPT
![Page 1: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/1.jpg)
ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM
Profesor: Dr. Matías Zañartu.
Introducción a la Voz Humana
Presentado por: Víctor Espinoza.
![Page 2: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/2.jpg)
Generación Voz
![Page 3: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/3.jpg)
Anatomía
![Page 4: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/4.jpg)
Fuente – Cuerdas Vocales
Modelo Mecánico
Ciclo Cuerdas Vocales
![Page 5: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/5.jpg)
Fuente – Cuerdas Vocales
![Page 6: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/6.jpg)
Fuente – Cuerdas Vocales
Impulso Glotal (tiempo)
Impulso Glotal (frecuencia)
![Page 7: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/7.jpg)
Sistema – Tracto Vocal
● Modelo en base a tubos.
● Articulación determina diámetro sección en modelo. Ej: /a/ <> /e/.
● Articulación depende apertura bucal y posición lengua.
● No considera cavidad nasal.
![Page 8: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/8.jpg)
Sistema – Tracto Vocal
● Tubos → Infinitas resonancias.
● Resonancias → Polos
● “Polos” en Voz → Formantes.
● Formantes → Muy importante para la codificación del lenguaje!!!
● Frecuencias de resonancia dependen de la articulación.
![Page 9: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/9.jpg)
Sistema – Tracto Vocal
Carta de Formantes Vocales
![Page 10: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/10.jpg)
Sistema Completo Fonación
![Page 11: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/11.jpg)
Sonidos Fuente
![Page 12: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/12.jpg)
Fonética
![Page 13: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/13.jpg)
DSP en Voz
l Herramientas de Análisis:
● Time Signal – Waveform● FFT – Fast Fourier Transform● Spectrogram – Short Time Fourier Transform● LPC – Linear Predictive Code● Cepstrum – Homomorphic Signal Processing
![Page 14: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/14.jpg)
DSP en Voz
![Page 15: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/15.jpg)
DSP en Voz
l FFT● Parameters:
● Smoothing Window (Hann, Hamming, etc)● Buffer size (128, 256, etc)● Decimate(*)● Overlap(*)● Padding(*)
![Page 16: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/16.jpg)
DSP en Voz
l Spectrogram:● Parameters:
● Same as FFT
![Page 17: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/17.jpg)
DSP en Voz
![Page 18: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/18.jpg)
DSP en Voz
![Page 19: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/19.jpg)
DSP en Voz
![Page 20: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/20.jpg)
DSP en Voz
![Page 21: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/21.jpg)
DSP en Voz
![Page 22: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/22.jpg)
DSP en Voz
![Page 23: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/23.jpg)
Aplicaciones STFT
● Audio Digital– MPEG 2 – layer III (MP3)
– AAC – Advanced Audio Coding (iTunes)
– Dolby Digital AC-3● Audio 5.1 (Audio Cinema, DVD, Bluray, Netflix)
– DTS (Digital Theater Sound)● Audio 5.1 (Audio Cinema, DVD, Bluray).
![Page 24: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/24.jpg)
Cepstrum
● Superposición● Sistema Homomórfico por Convolución● Cepstrum (Definición basada en DTFT)● Separación fuente-sistema – Ejemplo 1● Remoción de “Eco” - Ejemplo 02● Codificación – Ejemplo 03
![Page 25: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/25.jpg)
Cepstrum
● Superposición
![Page 26: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/26.jpg)
Cepstrum
● Separación
![Page 27: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/27.jpg)
Cepstrum
● Sistema Homomórfico
: Characteristic system for convolution
![Page 28: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/28.jpg)
Cepstrum
![Page 29: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/29.jpg)
Cepstrum (DTFT)
![Page 30: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/30.jpg)
Cepstrum (DTFT)
![Page 31: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/31.jpg)
Cepstrum
![Page 32: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/32.jpg)
Cepstrum
![Page 33: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/33.jpg)
Cepstrum
● Liftering (Cepstrum real)
![Page 34: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/34.jpg)
Cepstrum
Terminología
Spectrum → Cepstrum
Analysis → Alanysis
Filtering → Liftering
Frequency → Quefrency
Harmonic → Rahmonic
![Page 35: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/35.jpg)
Cepstrum: Ejemplos
● Pitch● System
![Page 36: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/36.jpg)
Cepstrum: Ejemplos
● Remoción de Eco: Ver Matlab...
![Page 37: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/37.jpg)
Cepstrum: Ejemplos
● Perceptual Coding
Frecuencia v/s Variación BW Frecuencia v/s Escala Mel
![Page 38: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/38.jpg)
Cepstrum: Ejemplos
● MFCC: Mel Frequency Cepstral Coefficients
Típicamente, mfcc con DCT, Nmfcc=13 y R= 24 bandas para fs=8000 Hz.Gran reducción (compresión) de datos!!!
![Page 39: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/39.jpg)
Cepstrum: Ejemplos
![Page 40: Introducción a la Voz Humanamzanartu/ELO313/Docs/... · ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM Profesor: Dr. Matías Zañartu](https://reader033.vdocuments.mx/reader033/viewer/2022052408/5f0587437e708231d4136924/html5/thumbnails/40.jpg)
ELO-313: Procesamiento Digital de Señales con Aplicaciones. Primer Semestre 2013 - UTFSM
Profesor: Dr. Matías Zañartu.
Introducción a la Voz Humana
Presentado por: Víctor Espinoza.