codificador de voz

210
UNIVERSIDAD DE PAMPLONA FACULTAD DE INGENIERÍAS Y ARQUITECTURA DEPARTAMENTO DE INGENIERÍA ELÉCTRICA ELECTRÓNICA SISTEMAS Y TELECOMUNICACIONES INGENIERÍA ELECTRÓNICA TRABAJO DE GRADO PARA OPTAR AL TITULO DE INGENIERO EN ELECTRÓNICA TITULO: DISEÑO E IMPLEMENTACIÓN SOFTWARE DE UN CODIFICADOR DE VOZ CELP UTILIZANDO LA HERRAMIENTA COMPUTACIONAL MATLAB: CALCULO DE LA EXCITACIÓN AUTOR: REYNALDO CÁRDENAS JORGE PAMPLONA-COLOMBIA NOVIEMBRE DE 2006

Upload: daniel-munoz-melendez

Post on 12-Nov-2015

58 views

Category:

Documents


0 download

DESCRIPTION

asasasasas

TRANSCRIPT

  • 1UNIVERSIDAD DE PAMPLONAFACULTAD DE INGENIERAS Y ARQUITECTURA

    DEPARTAMENTO DE INGENIERA ELCTRICA ELECTRNICASISTEMAS Y TELECOMUNICACIONES

    INGENIERA ELECTRNICA

    TRABAJO DE GRADO PARAOPTAR AL TITULO DE INGENIERO EN ELECTRNICA

    TITULO: DISEO E IMPLEMENTACIN SOFTWARE DE UN

    CODIFICADOR DE VOZ CELP UTILIZANDO LA HERRAMIENTACOMPUTACIONAL MATLAB: CALCULO DE LA EXCITACIN

    AUTOR: REYNALDO CRDENAS JORGE

    PAMPLONA-COLOMBIANOVIEMBRE DE 2006

  • 2UNIVERSIDAD DE PAMPLONAFACULTAD DE INGENIERAS Y ARQUITECTURA

    DEPARTAMENTO DE INGENIERA ELCTRICA ELECTRNICASISTEMAS Y TELECOMUNICACIONES

    INGENIERA ELECTRNICA

    TRABAJO DE GRADO PARAOPTAR AL TITULO DE INGENIERO EN ELECTRNICA

    TITULO: DISEO E IMPLEMENTACIN SOFTWARE DE UNCODIFICADOR DE VOZ CELP UTILIZANDO LA HERRAMIENTA

    COMPUTACIONAL MATLAB: CALCULO DE LA EXCITACIN

    AUTOR: REYNALDO CRDENAS JORGE

    DIRECTOR: PhD. (c) DIEGO FERNEY GMEZ CAJAS

    DIRECTOR DE PROGRAMA: Ing. CESAR AUGUSTO RANGEL

    PAMPLONA-COLOMBIANOVIEMBRE DE 2006

  • 3UNIVERSIDAD DE PAMPLONAFACULTAD DE INGENIERAS Y ARQUITECTURA

    DEPARTAMENTO DE INGENIERA ELCTRICA ELECTRNICASISTEMAS Y TELECOMUNICACIONES

    INGENIERA ELECTRNICA

    TRABAJO DE GRADO PARAOPTAR AL TITULO DE INGENIERO EN ELECTRNICA

    TITULO: DISEO E IMPLEMENTACIN SOFTWARE DE UNCODIFICADOR DE VOZ CELP UTILIZANDO LA HERRAMIENTA

    COMPUTACIONAL MATLAB: CALCULO DE LA EXCITACIN

    NOMBRES Y FIRMAS DE AUTORIZACIN PARA SUSTENTAR:

    ---------------------------------------------- --------------------------------------------------REYNALDO CRDENAS PhD. (c) DIEGO FERNEY GMEZ

    JORGE CAJAS Autor del trabajo de grado Director del trabajo de grado

    --------------------------------------------------------------

    Ing. CESAR AUGUSTO RANGEL VERA

    Director de programaJURADO CALIFICADOR

    ---------------------------------------------- -- ---------------------------------------------

    Ing. ADRIN CARVAJAL MSc.(c) WALTER GASTELBONDO FERRER BARRAGAN

    Presidente Oponente

    ---------------------------------------------MSc. (c) JOS DEL CARMEN PEA

    Secretario

    PAMPLONA-COLOMBIANOVIEMBRE DE 2006

  • 4DEDICATORIA

    Este proyecto va dedicado a Dios, a mi papa Cristbal Crdenas Mendoza, a

    mi madre Emilse del Socorro Jorge Arrieta; a mis hermanos, Mauricio Jos,

    Mara Anglica; a mi sobrino Reyden Daniel Crdenas Jorge y a todas

    aquellas personas que ayudaron a crear en mi un espritu de lucha y

    fortaleza, a mis amigos que me colaboraron a que este proyecto se

    efectuara.

  • 5PENSAMIENTO

    El seor es mi pastor, nada me falta:

    En verdes praderas me hace reposar, me conduce hacia las aguas del

    remanso y me conforta mi alma; me gua por los sendero de justicia, por

    amor a su nombre; aunque vaya por un valle tenebroso, no tengo miedo a

    nada, porque tu ests conmigo, tu voz y tu callado me sostienen.

    Me preparas una mesa ante mis enemigos, perfumas con ungento mi

    cabeza y me llenas la copa a rebozar.

    Lealtad y dicha me acompaan todos los das de mi vida; habitar la casa del

    seor por siempre jams.

    Salmo

  • 6AGRADECIMIENTOS

    En primer lugar, agradezco a Dios por las bendiciones que me ha dado y por

    permitirme culminar esta etapa importante de mi vida, a mi pap Cristbal

    Crdenas Mendoza, a mi madre Emilse del Socorro Jorge Arrieta, a mis

    hermanos Mauricio Jos, Anglica Mara, a mi sobrino Reyden Daniel

    Crdenas, y a todos mis amigos.

    Agradezco a mi director Diego Ferney Gmez Cajas por la colaboracin en

    el desarrollo y finalizacin de este proyecto.

    Agradezco a mis compaeros que contribuyeron de alguna u otra forma a la

    realizacin de este trabajo.

  • 7NDICE GENERAL

    DEDICATORIAPENSAMIENTOAGRADECIMIENTOS

    Pag.

    RESUMEN Y ABSTRACT ???????????????????. 13INTRODUCCIN ??????????????????????.. 16JUSTIFICACIN???????????????????????? 17

    DELIMITACIONES???????????????????????? 19

    CAPITULO I.EL SONIDO Y SUS CARACTERSTICAS?????????????. 20

    El sonido???????????????????????????.. 20

    Antecedentes histricos?????????????????????. 21

    Naturaleza del sonido??????????????????????. 25

    CUALIDADES DEL SONIDO??????????????????? 26

    Intensidad???????????????????????????. 27

    Tono?????????????????????????????? 28

    Presin sonora ?????????????????????????. 29

    Potencia ???????????????????????????? 30

    Fenmenos fsicos del sonido??????????????????? 30

    Reflexin???????????????????????????? 31

    Refraccin???????????????????????????. 31

    Difraccin ???????????????????????????. 33

    Efecto doppler ?????????????????????????. 34

  • 8LA VOZ Y SUS CARACTERISTICAS??????????????? 37

    Fonologa y fontica ??????????????????????. 40

    Fontica experimental?????????????????????? 41

    Fontica articulatoria ??????????????????????. 41

    ANATOMIA DEL APARATO FONADOR?????????????? 43

    Formantes ??????????????????????????? 45

    Clasificacin de los sonidos???????????????????.. 49

    Oralidad y nasalidad??????????????????????? 50

    Tonalidad ???????????????????????????. 50

    Lugar y modo de articulacin??????????????????? 51

    Posicin de los rganos articulatorios???????????????. 53

    Duracin???????????????????????????? 54

    Unidades fonticas ??????????????????????? 57

    CARACTERISTICAS DE LA VOZ????????????????? 58

    Modelo del tracto voclico ???????????????????? 58

    ANATOMIA DEL SISTEMA AUDITIVO HUMANO??????????. 61

    El odo????????????????????????????? 61

    El odo externo ????????????????????????? 62

    El odo medio ?????????????????????????.. 63

    El odo interno?????????????????????????.. 65

    Fenmenos asociados al odo??????????????????.. 68

    Efecto de enmascaramiento???????????????????. 69

    Capacidad auditiva???????????????????????. 69

    RUIDO Y SUS CARACTERISTICAS ???????????????. 72

    Ruido externo?????????????????????????.. 73

    Ruido industrial????????????????????????? 74

    Ruido atmosfrico???????????????????????? 74

  • 9Ruido extraterrestre??????????????????????? 75

    Ruido interno?????????????????????????... 75

    Ruido trmico?????????????????????????.. 76

    Ruido de los semiconductores ??????????????????. 78

    Ruido de intermodulacion????????????????????.. 78

    Ruido blanco o gaussiano????????????????????. 79

    Ruido de impulso de aguja???????????????????? 80

    CAPITULO II.CODIFICACION DE VOZ ????????????????????. 81

    Definicin de codificacin de voz ????????????????? 81

    Historia de los codificadores ??????????????????... 81

    Muestreo y cuantificacin ???????????????????? 83

    Cuantificacin uniformes ????????????????????.. 85

    Cuantificacin logartmica ???????????????????? 89

    Cuantificacin no uniforme ???????????????????. 89

    Cuantificacin vectorial ????????????????????? 91

    Medida subjetiva de la voz???????????????????? 92.

    CLASIFICACION DE LOS CODIFICADORES???????????.. 91

    Codificadores de forma de onda ?????????????????. 95

    Codificadores en el dominio del tiempo??????????????.. 95

    Modulacin por codificacin de impulsos?????????????? 96

    Modulacin por codificacin de impulsos diferencial????????? 96

    Modulacin delta???????????????????????? 98

    Modulacin por codificacin de impulsos diferencial adaptativa???? 99

    Codificacin el dominio de la frecuencia ?????????????.. 100

    Codificacin perceptual????????????????????.. 101

    Codificacin en subbandas ?????????????????? 102

    Codificacin por transformada ?????????????????. 102

  • 10

    Vocoders ??????????????????????????. 105

    Vocoder por prediccin lineal?????????????????? 107

    Codificadores hbridos ????????????????????? 111

    Codificacin relp???????????????????????? 112

    Codificacin mpc ???????????????????????. 112

    Codificacin celp???????????????????????. 114

    Codificacin vselp??????????????????????? 116

    Anlisis de predicion lineal???????????????????. 120

    Filtro de prediccin de retardo largo???????????????. 121

    Codificadores celp??????????????????????? 124

    Orgenes del celp???????????????????????.. 127

    Estndares??????????????????????????. 127

    Predictor corto????????????????????????? 128

    Predictor largo????????????????????????? 128

    Excitacin por cdigo?????????????????????? 128

    Filtros????????????????????????????? 129

    Filtro FIR???????????????????????????... 130

    Fundamentos de diseo????????????????????? 133

    Especificaciones de diseo???????????????????? 134

    Fundamentos de mtodos de ventaneo??????????????.. 134

    Propiedades de las ventanas??????????????????? 135

    Filtro IIR????????????????????????????. 140

    Capitulo IIICODIFICACIN DE LA VOZ MEDIANTE PREDICCIN LINEAL CON

    EXCITACIN POR CDIGO ALGEBRAICO DE ESTRUCTURA

    CONJUGADA ESTANDAR G.729????????????????. 146

    PRINCIPIOS BSICOS????????????????????? 146

  • 11

    Prediccin lineal ???????????????????????? 146

    Modelo fuente filtro de la voz??????????????????? 150

    Anlisis de prediccin lineal???????????????????? 150

    Clculo de la excitacin?????????????????????.. 152

    Predictor de largo plazo????????????????????? 152

    Implementacin del codificador CELP??????????????? 153

    Descripcin general del codificador/decodificador?????????. 154

    Codificador??????????????????????????.. 155

    Decodificador?????????????????????????.. 157

    Retardo???????????????????????????? 157

    Preprocesamiento??????????????????????. 158

    Anlisis de la frecuencia fundamental en lazo abierto????????. 158

    Clculo de la respuesta impulso?????????????????. 160

    Clculo de la seal objetivo?????????????????? 160

    Bsqueda de la tabla de cdigos adaptativos????????????.. 161

    Generacin del vector de tabla de cdigos adaptativos???????.. 164

    Clculo de palabras de cdigo para retardos de tabla de cdigos???

    adaptativos??????????????????????????. 164

    Clculo de la ganancia de tabla de cdigos adaptativos???????.. 165

    Tabla de cdigos fijos: estructura y bsqueda????????????.. 165

    Procedimiento de bsqueda de la tabla de cdigos fijos???????.. 168

    Clculo de palabra de cdigo de la tabla de cdigos fijos???????. 168

    Cuantificacin de las ganancias?????????????????? 168

    Bsqueda de la tabla de cdigos para cuantificacin de la

    ganancia ??????????????????????????? 169

    Descripcin de las funciones del decodificador?????????? 170

    Procedimiento de decodificacin de los parmetros????????? 170

    Decodificacin de los parmetros de filtro LP??????????? 170

    Decodificacin del vector de tabla de cdigos adaptativos????? 171

    Decodificacin del vector de tabla de cdigos fijo????????? 172

  • 12

    Decodificacin de las ganancias de las tablas de cdigos adaptativos y

    Fijos?????????????????????????????? 172

    Cdigo en matlab?????????????????????? 175

    ANALISIS DE CONFIABILIDAD ????????????????? 180MARCO ECONOMICO????????????????????? 181ANALISIS DE LEGALIDAD???????????????????. 183INFLUENCIA AMBIENTAL DEL TRABAJO????????????. 184RESULTADOS????????????????????????.. 185CONCLUSIONES ???????????????????????. 187RECOMENDACIONES?????????????????????. 188REFERENCIAS BIBLIOGRAFICAS???????????????? 189ANALISIS BIBLIOGRAFICO??????????????????? 193GLOSARIO DE TERMINOS NO CONVENCIONALES ???????.. 194SIMBOLOS NO CONVENCIONALES ??????????????? 196ABREVIATURAS UTILIZADAS????????????..................... 198ANEXOS ???????????????????????????. 199

  • 13

    ndice de Figuras

    Nombre Pg.FIGURA 1 Intensidad de varios elementos................................................................... 31FIGURA 2 Reflexin del sonido ..................................................................................... 35FIGURA 3 Refraccin del sonido................................................................................... 36FIGURA 4 Difraccin del sonido .................................................................................... 38FIGURA 5 El efecto Doppler .......................................................................................... 39FIGURA 6 Corte esquematico del aparato fonador humano ...................................... 48FIGURA 7 La glotis ......................................................................................................... 48FIGURA 8 Funcin de rea ............................................................................................ 50FIGURA 9 Formantes de un sonido sonoro.................................................................. 50FIGURA 10 Formantes de un sonido sordo.................................................................. 51FIGURA 11 Corte esquematizo de la laringe segn un plano horizontal................... 51FIGURA 12 Diagrama funcional del aparato fonador .................................................. 52FIGURA 13 Diagrama funcional del aparato fonador .................................................. 53FIGURA 14 Zonas del aparato fonador......................................................................... 63FIGURA 15 El odo.......................................................................................................... 65FIGURA 16 El Odo externo ........................................................................................... 66FIGURA 17 El Odo medio ............................................................................................. 68FIGURA 18 El Odo interno ............................................................................................ 69FIGURA 19 Funcionamiento del odo............................................................................ 71FIGURA 20 Enmascaramiento simultaneo ................................................................... 73FIGURA 21 Capacidad auditiva de varios animales .................................................... 74FIGURA 22 Seal continua ............................................................................................ 87FIGURA 23 Seal discreta ............................................................................................. 88FIGURA 24 Cuantificacin uniforme.............................................................................. 90FIGURA 25 Cuantificacin no uniforme ........................................................................ 92FIGURA 26 Ejemplo de comprensin ........................................................................... 94FIGURA 27 Ejemplo de comprensin( b)...................................................................... 94FIGURA 28 Grfico de la ley- para distintos valores de ......................................... 95FIGURA 29 Calidad de voz vs Velocidad.................................................................... 98FIGURA 30 Sistema DPCM (a) codificador (b) decodificador....................................101FIGURA 31Modulacin delta codificador y decodificador ...........................................102FIGURA 32. Error de sobrependiente ..........................................................................102FIGURA 33. Codificador/decodificador ADPCM .......................................................103FIGURA 34. Codificador en sub-bandas....................................................................106FIGURA 35.Codificador ITU G722 Sub -band.............................................................107FIGURA 36 .Decodificador ITU G722 Sub ?band.......................................................108FIGURA 37.Codificacin por transformada .................................................................109FIGURA 38.Modelo de produccin de voz.................................................................110FIGURA 39. Esquema de funcionamiento de Vocoder LPC-10. .............................112FIGURA 40. Diagrama de bloques del emisor. .........................................................113FIGURA 41 Diagrama de bloques del Receptor .......................................................114

  • 14

    FIGURA 42 Salida del predictor..................................................................................116FIGURA 43 (a) Seal original. (b) Residuo del filtro LPC (aumentado en 10dB). (c)Residuo de los filtros LPC y de pitch en cascada (aumentado en 10dB) .............117FIGURA 44 Etapa de anlisis de un transmisor CELP.............................................119FIGURA 45 Detalle de la figura 44..............................................................................119FIGURA 46. Decodificador (sintetizador) CELP ........................................................120FIGURA 47 Decodificador VSELP. .............................................................................121FIGURA 48 Diagrama del Speech coder ...................................................................122FIGURA 49. Codificador RPE-LTP..............................................................................123FIGURA 50. Seal filtrada submuestreada y sus correspondientes secuencias.126FIGURA 51.Decodificador RPE-LTP ............................................................................127FIGURA 52. Esquema de un analizador CELP en la prctica ...................................130FIGURA 53. Especificaciones de diseo de un filtro paso-bajo normalizado...........135FIGURA 54. Prototipo de filtros pasa-bajo y pasa-alto ...............................................136FIGURA 55 Prototipo de filtros pasa-banda y banda de rechazo..............................137FIGURA 56 Filtro FIR pasa-bajo usando ventana de hamming................................140FIGURA 57 Filtro FIR paso bajo usando ventana de Kaiser......................................141FIGURA 58 Filtro FIR pasa banda usando ventana de Blackman ............................141FIGURA 59 Esquema bsico de un filtro IIR ...............................................................142FIGURA 60 Estrategias de diseo de filtros IIR ..........................................................144FIGURA 61 Modelo de un sistema digital bsico ........................................................146FIGURA 62 Curva a modelar ........................................................................................147FIGURA 67 Diagrama general de un Sistema digital de produccin de voz ............148FIGURA 68.a)seal sorda b) Seal sonora c) excitacin completa ..........................152FIGURA 69. Diagrama de bloques del predictor corto y largo plazo.........................152FIGURA 70 Diagrama del filtro de largo plazo ............................................................153FIGURA 71 Diagrama funcional del modelo conceptual de sntesis (CELP). ..........154FIGURA 72. Principio de codificacin del codificador CS-ACELP.............................156FIGURA 73 Principio del decodificador CS-ACELP....................................................157FIGURA 74 Diagrama de vector de cdigos fijos........................................................167FIGURA 75 Diagrama de bloques del codificador celp ..............................................174FIGURA 765 Codificador y Decodificador CELP.........................................................174

  • 15

    ndice de Tablas

    Nombre Pg.TABLA 1 Ejemplo de monemas, grafemas y fonemas ................................................ 43TABLA 2 Clasificacin de las consonantes de la lengua castellana segn el lugar yel modo de articulacin y la sonoridad .......................................................................... 57TABLA 3 Clasificacin de las vocales castellanas segn la posicin de la lengua... 58TABLA 4 Ortografas alternativas de George Bernard Shaw para dos palabrasinglesas ............................................................................................................................ 59TABLA 5 Los fonemas del alfabeto fontico internacional utilizados en la lenguacastellana ......................................................................................................................... 60TABLA 6 Medida subjetiva de la calidad de voz .......................................................... 97TABLA 7 Respuesta del filtro FIR de largo plazo........................................................125TABLA 8 Estructura da la tabla de cdigos fijos .........................................................166

  • 16

    RESUMEN

    Esta investigacin esta orientada al diseo de un codificador de voz CELP

    (Code Excited Linear Prediction) utilizando la herramienta computacional

    MATLAB calculando la excitacin, tomando como gua el estndar G.729 de

    la UIT-T (Unin Internacional de Telecomunicaciones) con el fin de reducir el

    numero de bits en la transmisin de voz .

    Para el modelado de la seal de voz, se utilizan dos predictores, un predictor

    a largo plazo, y uno de corto plazo, el primero intenta modelar la excitacin

    peridica de la seal, y el segundo, imita el comportamiento del tracto vocal.

    Por otro lado, un vector de cdigos fijos modela la excitacin no peridica de

    la seal de voz.

    La herramienta computacional MATLAB nos ayuda al diseo del codificador

    de voz CS-CELP (Conjugated Structure - Code Excited Linear Prediction)

    definido por el estndar G729, pues contiene diferentes funciones que nos

    facilitan el clculo de los parmetros del codificador, tales como, los

    coeficientes de prediccin lineal, la correlacin de la seales, la

    ventanizacin, conversin de LPC a LSP (line espectrum pairs), etc.

    Para conseguir nuestro objetivo, primero generamos la excitacin sin pitch

    (frecuencia fundamental), es decir, solo la componente sorda de la excitacin

    (vector de cdigos fijos), posteriormente le sumamos la excitacin peridica

    (seal sonora, que se modela con un vector de cdigos adaptativos)

    completando la excitacin.

  • 17

    La funcin de este diseo es la de proporcionar informacin del error,

    transmitiendo a bajas tasas de bits reduciendo el ancho de banda sin

    sacrificar calidad en la voz y tambin, para aprovechar de una forma ms

    eficiente los diferentes servicios prestados a travs de las redes que

    transportan voz, como Internet, redes de telefona fija, celular, etc.

  • 18

    ABSTRACT

    This investigation its oriented to design an voice coder CELP (Code Excited

    Linear Prediction) using computacional tool MATLAB, calculating the

    excitation, taking as guide the G.729 standard from the ITU-T (International

    Telecommunications Union - Telecommunications) with the purpose of

    reducing the number of bits in the voice transmission.

    By obtain the model of voice signal, two predictors are used, an long term

    predictor, and other short term predictor, first tries to model the periodic

    excitation of the signal, and the second, imitates the behavior of vocal tract.

    On the other hand, a vector of fixed codes models the nonperiodic excitation

    of the voice signal.

    Computacional tool MATLAB helps us to the design of voice coder CS-CELP

    (Conjugated Structure - Code Excited Linear Prediction) defined by the G729

    standard, because it contains different functions that facilitate the calculation

    of the coder parameters, such as, the coefficients of linear lead, the signals

    correlation, the windowed, conversion of LPC to LSP (Line Spectrum Pairs),

    between others.

    First the excitation without pitch is generated (base frequency), that is to say,

    single the deaf component of the excitation (vector of fixed codes), later adds

    the periodic excitation to him (sonorous signal, that it is modeled with a vector

    of adaptive codes) completing the excitation.

  • 19

    The task of this design is the one to also provide information of the error,

    transmitting to low rates of bits reducing the bandwidth for the improvement of

    the voice quality and taking advantage of one more efficient form different

    served through the networks that transport voice, like Internet, networks of

    fixed, cellular telephony, between others.

  • 20

    INTRODUCCION

    La voz es la forma ms natural y eficiente de comunicacin entre los seres

    humanos. Sin embargo, cada vez son ms frecuentes las situaciones en las

    que la comunicacin se establece con una mquina, o aquellas en las que

    una mquina puede ayudar a la comunicacin entre dos seres humanos. Por

    esta razn hay herramientas que nos permiten el procesamiento de la voz,

    tales como los mtodos de codificacin diseados para almacenar y

    transmitir la informacin de la voz en forma digital eficientemente, incluso sin

    perder calidad.

    La codificacin de voz nos ayuda a optimizar la utilizacin del canal de

    comunicacin transmitiendo informacin a un ancho de banda menor y una

    mayor inteligibilidad y naturalidad. Por ejemplo, cuando se desea transmitir

    varias comunicaciones por un solo canal con la mnima perdida de calidad,

    optimizando la relacin entre velocidad de transmisin (bits/segundo) e

    inteligibilidad del mensaje. Teniendo en cuenta el almacenamiento de

    informacin en forma digital la codificacin de voz permite utilizar menos bits

    necesarios para el almacenamiento, manteniendo un nivel de calidad de voz

    adecuado. Tambin nos permite incorporar algoritmos de cifrado para

    establecer comunicaciones privadas y seguras, o realizar grabaciones

    indescifrables para otras personas.

  • 21

    JUSTIFICACION

    OBJETO

    Diseo e implementacin software de un modelo para la excitacin de un

    codificador CELP para el anlisis de la seal de voz en diferentes entornos,

    tales como telefona digital tanto en la red telefnica pblica conmutada,

    como en la red celular mvil, utilizando el algoritmo genrico de codificacin

    CELP.

    PROBLEMA

    La comunicacin eficiente de las seales de voz ha sido una necesidad

    creciente desde hace ya muchos aos, en particular, la telefona en sus

    distintas manifestaciones satelital, mvil, convencional y ms recientemente

    con la comunicacin de voz a travs de Internet.

    En todos estos sistemas de comunicacin modernos el tratamiento de la

    seal de voz para su adecuada transmisin con un mnimo uso de los

    recursos del sistema, tales como canales telefnicos, ancho de banda de

    radio frecuencia, ranuras (slots) de tiempo, etctera, representa uno de los

    intereses ms grandes de la investigacin actual debido a la creciente

    demanda de servicios con un nivel de calidad especfico.

    La seal de voz en las aplicaciones ms modernas se transmite en forma

    digital. sta es la preferida actualmente para los servicios de comunicacin

    punto a punto debido a la versatilidad que ofrece para su manipulacin por

  • 22

    algoritmos que permitan realizar tareas como compresin, redistribucin de la

    energa en el espectro mediante transformaciones, extraccin de parmetros

    caractersticos, proteccin contra errores del canal y criptografa.

    Las tcnicas de codificacin de voz son usadas tanto para la transmisin

    cuanto para el almacenamiento compacto de seales de voz. Ellas son

    demandadas para la transmisin compartida por diferentes canales de voz

    en comunicaciones telefnicas digitales tanto por la red telefnica pblica

    como por la red celular mvil, adems de permitir mayor seguridad y sigilo

    mediante la criptografa. Por otro lado, los canales compartidos pueden

    transportar vdeo o datos en entornos multimedia, que se estn tornando

    cada vez mas frecuentes y en los cuales la versatilidad de disponer de

    codificadores que operen a varias tasas de compresin permite establecer

    compromisos entre calidad de servicio y cantidad de canales, necesarios

    para atender a la demanda de la telefona por paquetes como la telefona va

    Internet.

  • 23

    DELIMITACIONES

    Objetivo general:

    En el presente trabajo se busca estudiar el desarrollo que tienen en la

    actualidad las diferentes formas de codificacin de voz, puntualizando la

    investigacin en el funcionamiento e implementacin de la excitacin de un

    codificador tipo CELP.

    Objetivos especficos:

    1. Desarrollo conceptual sobre las diferentes tcnicas y dispositivos

    utilizados en la codificacin de voz.

    2. Estudio del software MATLAB para las diferentes aplicaciones

    como elaboracin de filtros, clculos, anlisis de seales.

    3. Anlisis de la seal de voz por medio de varios tipos de excitacin.

    4. Experimentacin con el codificador CELP, trabajando con una

    base de datos de voz.

    5. Modelado de la excitacin para un codificador de voz CELP.

  • 24

    CAPITULO I. EL SONIDO Y SUS CARACTERSTICAS FSICAS

    El Sonido

    Fsicamente, el fenmeno sonoro se puede describir como la percepcin de

    oscilaciones rtmicas estimuladas por algn objeto fsico vibrante que acta

    como fuente emisora, este proceso requiere de una fuente que lo emita, un

    canal que lo distribuya y otro que lo reciba. Como formas del lenguaje sonoro

    encontramos la voz, la msica, el ruido o efecto sonoro y el silencio. El

    fenmeno sonoro se divide en tres [38].

    Forma sonora:

    Toda configuracin acstica que tiende a ser percibida como un bloque

    sonoro unitario y coherente.

    Ruido o efecto sonoro:

    Conjunto de formas sonoras representadas por sonidos inarticulados o de

    estructura musical, de fuentes sonoras naturales y/o artificiales, que

    restituyen objetiva y subjetivamente la realidad, construyendo una imagen.

    Silencio:

    Conjunto continuo de sucesos sonoros poco definidos, configurados por una

    disminucin sbita de la intensidad en la evolucin temporal del sonido.

  • 25

    Por lo tanto, el sonido es la vibracin de un medio elstico, bien sea

    gaseoso, liquido o slido. Cuando nos referimos al sonido audible por el odo

    humano, estamos hablando de la sensacin detectada por nuestro odo, y

    que se produce por las rpidas variaciones de presin en el aire por encima y

    por debajo de un valor esttico. Este valor esttico nos lo da la presin

    atmosfrica (alrededor de 100.000 Pascals) el cual tiene unas variaciones

    pequeas y de forma muy lenta, tal y como se puede comprobar en un

    barmetro.

    Cmo son de pequeas y de rpidas las variaciones de presin que causan

    el sonido?:

    Cuando las rpidas variaciones de presin se centran entre 20 y 20.000

    veces por segundo (igual a una frecuencia de 20 Hz a 20 kHz) el sonido es

    potencialmente audible aunque las variaciones de presin puedan ser a

    veces tan pequeas como la millonsima parte de un pascal. Los sonidos

    muy fuertes son causados por grandes variaciones de presin, por ejemplo

    una variacin de 1 pascal se oira como un sonido muy fuerte, siempre y

    cuando la mayora de la energa de dicho sonido estuviera contenida en las

    frecuencias medias (1kHz - 4 kHz) que es donde el odo humano es ms

    sensitivo. El sonido puede ser producido por diferentes fuentes, desde una

    persona hablando hasta un altavoz vibrando y puede viajar a travs de

    distintos medios de propagacin.

    ANTECEDENTES HISTORICOS

    Antigedad

    Los pueblos antiguos efectuaron numerosas especulaciones sobre los

    fenmenos elementales del sonido; sin embargo, con la excepcin de unas

  • 26

    pocas suposiciones que resultaron ser ciertas, la ciencia del sonido no

    empez a desarrollarse hasta aproximadamente 1600 d.C. A partir de

    aquella poca, el conocimiento del sonido avanz con ms rapidez que el

    conocimiento de los fenmenos luminosos correspondientes, ya que estos

    ltimos son ms difciles de observar y medir. A los antiguos griegos no les

    preocupaba demasiado el estudio cientfico del sonido, pero estaban muy

    interesados por la msica, y consideraban que representaba los ?nmeros

    aplicados?, frente a la aritmtica, que representaba los ?nmeros puros?. El

    filsofo Pitgoras descubri que una octava corresponde a una relacin de

    frecuencias de dos a uno, y enunci la ley que vincula la consonancia a las

    relaciones numricas; posteriormente construy todo un edificio de

    especulaciones msticas en torno a esa ley. Aristteles, en unas breves

    observaciones sobre el sonido, realiz una suposicin bastante acertada

    sobre la naturaleza de su generacin y transmisin. Sin embargo, no se

    efectuaron estudios experimentales vlidos hasta 1600, cuando Galileo llev

    a cabo un estudio cientfico del sonido y enunci muchas de sus leyes

    fundamentales. Galileo determin la relacin entre tono y frecuencia, y unas

    leyes musicales de armona y disonancia. Tambin explic de forma terica

    cmo la frecuencia natural de vibracin de una cuerda tensa, y por tanto la

    frecuencia de los sonidos producidos por un instrumento de cuerda, depende

    de la longitud, peso y tensin de la cuerda.

    Siglos XVII Y XVIII

    El matemtico francs Marin Mersenne realiz medidas cuantitativas en

    relacin con el sonido al hallar el tiempo de retorno de un eco y calcular un

    valor de la velocidad del sonido que difera del valor real en menos del 10%.

    Mersenne tambin fue el primero en medir de forma aproximada la

    frecuencia de una nota de tono determinado. Midi la frecuencia de vibracin

    de un cable largo y pesado cuyo movimiento era tan lento que poda seguirse

  • 27

    a simple vista; despus, a partir de consideraciones tericas, calcul la

    frecuencia de un cable corto y ligero que produca un sonido audible.

    En 1660, el cientfico ingls de origen Irlands Robert Boyle demostr que el

    sonido necesitaba un medio gaseoso, lquido o slido para su transmisin.

    Boyle colg una campana de una cuerda en el vaco y mostr que, aunque

    poda verse cmo el badajo golpeaba la campana, no se oa ningn sonido.

    El matemtico y fsico britnico Isaac Newton fue el primero en realizar un

    tratamiento matemtico del sonido en sus principios matemticos de la

    filosofa natural (1687). Una vez demostrado que la propagacin del sonido a

    travs de cualquier fluido slo dependa de propiedades fsicas medibles del

    fluido, como la elasticidad o la densidad, Newton calcul a partir de

    consideraciones tericas la velocidad del sonido en el aire.

    El siglo XVIII fue sobre todo un periodo de desarrollo terico. El clculo

    supuso una potente herramienta nueva para cientficos de muchos campos.

    Los matemticos franceses Jean le Rond d'Alembert y Joseph Louis

    Lagrange y los matemticos suizos Johann Bernoulli y Leonhard Euler

    contribuyeron al conocimiento de cuestiones como el tono y el timbre del

    sonido producido por un instrumento musical determinado, o la velocidad y

    naturaleza de la transmisin del sonido en diferentes medios. Sin embargo,

    el tratamiento matemtico completo del sonido requiere el anlisis armnico,

    desarrollado por el matemtico francs Joseph Fourier en 1822 y aplicado al

    sonido por el fsico alemn Georg Simon Ohm.

    Las variaciones de sonido denominadas ?batidos?, una consecuencia de la

    naturaleza ondulatoria del sonido, fueron descubiertas en torno a 1740 por el

    violinista italiano Giuseppe Tartini y el organista alemn Georg Sorge. El

    fsico alemn Ernst Chladni realiz numerosos descubrimientos sobre el

  • 28

    sonido a finales del siglo XVIII, sobre todo en relacin con la vibracin de

    cuerdas y varillas.

    Siglos XIX Y XX

    El siglo XIX supuso, sobre todo, una era de desarrollo experimental. Las

    primeras medidas precisas de la velocidad del sonido en el agua fueron

    llevadas a cabo en 1826 por el matemtico francs Jacques Charles

    Franois Sturm, y a lo largo del siglo se realizaron numerosos experimentos

    para determinar con extremada precisin la velocidad de sonidos de

    diferentes frecuencias en distintos medios. La ley fundamental que dice que

    la velocidad es la misma para sonidos de cualquier frecuencia y depende de

    la densidad y elasticidad del medio qued establecida en dichos

    experimentos.

    Durante el siglo XIX se emplearon en el estudio del sonido aparatos como el

    estroboscopio, el fonendoscopio o la sirena. En este siglo se dedic tambin

    mucho inters al establecimiento de un patrn de tono. La primera

    sugerencia de un patrn la realiz el fsico francs Joseph Sauveur alrededor

    de 1700. Sauveur propuso que el do equivaliera a 256 Hz, un patrn cmodo

    desde el punto de vista matemtico (al ser una potencia de dos). El fsico

    alemn Johann Heinrich Scheibler llev a cabo la primera determinacin

    precisa de la frecuencia de un tono, y en 1834 propuso como patrn que el la

    equivaliera a 440 Hz. En 1859, el gobierno francs decret que el patrn

    para el la fuera de 435 Hz, segn las investigaciones del fsico francs Jules

    Antoine Lissajous. Este patrn se acept en muchas regiones del mundo

    hasta bien entrado el siglo XX.

    En el siglo XIX se inventaron el telfono, el micrfono y diversos tipos de

    gramfono, todos ellos muy tiles para el estudio del sonido. En el siglo XX,

    los fsicos dispusieron por primera vez de instrumentos que hacan posible

  • 29

    un estudio sencillo, preciso y cuantitativo del sonido. Mediante osciladores

    electrnicos pueden producirse ondas electromagnticas de cualquier tipo y

    convertirlas en sonido mediante sistemas electromagnticos o piezoelctricos.

    En sentido inverso, es posible convertir los sonidos en corrientes elctricas

    mediante un micrfono, amplificarlas electrnicamente sin distorsin y

    analizarlas mediante un osciloscopio de rayos catdicos. Las tcnicas

    modernas permiten grabar y reproducir el sonido con una fidelidad

    extremadamente elevada.

    En la primera Guerra Mundial, las necesidades militares llevaron a emplear

    por primera vez el sonar para la deteccin de submarinos, que hoy tambin

    se emplea para estudiar las corrientes y capas ocenicas y para realizar

    mapas de los fondos marinos. En la actualidad, las ondas de sonido de

    frecuencias muy elevadas (ultrasonidos) se emplean en numerosas

    aplicaciones tcnicas y mdicas.

    Naturaleza del sonido

    Las ondas sonoras constituyen un tipo de ondas mecnicas que tienen la

    virtud de estimular el odo humano y generar la sensacin sonora. En el

    estudio del sonido se deben distinguir los aspectos fsicos de los aspectos

    fisiolgicos relacionados con la audicin. Desde un punto de vista fsico el

    sonido comparte todas las propiedades caractersticas del comportamiento

    ondulatorio, por lo que puede ser descrito utilizando los conceptos sobre

    ondas. A su vez el estudio del sonido sirve para mejorar la comprensin de

    algunos fenmenos tpicos de las ondas. Desde un punto de vista fisiolgico

    slo existe sonido cuando un odo es capaz de percibirlo. El sonido La

    sensacin producida en el odo por la vibracin de las partculas que se

  • 30

    desplazan a travs de un medio elstico (slido, lquido o gaseoso) que las

    propaga.

    Para que exista el sonido se tienen en cuenta los siguientes factores.

    Una fuente de vibracin mecnica.

    Un medio elstico por el cual se propague la perturbacin.

    Cuando hay variaciones y perturbaciones est claro que debe haber un valor

    esttico, a partir del cual se producen estas variaciones. En el caso del aire,

    el valor esttico no los da la presin atmosfrica.

    CUALIDADES DEL SONIDO

    Intensidad

    La intensidad del sonido percibido, o propiedad que hace que ste se capte

    como fuerte o como dbil, est relacionada con la intensidad de la onda

    sonora correspondiente, tambin llamada intensidad acstica. La intensidad

    acstica es una magnitud que da idea de la cantidad de energa que est

    fluyendo por el medio como consecuencia de la propagacin de la onda.

    Se define como la energa que atraviesa por segundo una superficie unidad

    dispuesta perpendicularmente a la direccin de propagacin. Equivale a una

    potencia por unidad de superficie y se expresa en W/m2. La intensidad de

    una onda sonora es proporcional al cuadrado de su frecuencia y al cuadrado

    de su amplitud y disminuye con la distancia al foco.

    La magnitud de la sensacin sonora depende de la intensidad acstica, pero

    tambin depende de la sensibilidad del odo. El intervalo de intensidades

    acsticas que va desde el umbral de audibilidad, o valor mnimo perceptible,

  • 31

    hasta el umbral del dolor es muy amplio, estando ambos valores lmite en

    una relacin del orden de 1014.

    Debido a la extensin de este intervalo de audibilidad, para expresar

    intensidades sonoras se emplea una escala cuyas divisiones son potencias

    de diez y cuya unidad de medida es el decibelio (dB). Ello significa que una

    intensidad acstica de 10 decibelios corresponde a una energa diez veces

    mayor que una intensidad de cero decibelios; una intensidad de 20 dB

    representa una energa 100 veces mayor que la que corresponde a 0

    decibelios y as sucesivamente.

    Otro de los factores de los que depende la intensidad del sonido percibido es

    la frecuencia. Ello significa que para una frecuencia dada un aumento de

    intensidad acstica da lugar a un aumento del nivel de sensacin sonora,

    pero intensidades acsticas iguales a diferentes frecuencias pueden dar

    lugar a sensaciones distintas.

    Los sonidos que percibimos deben superar el umbral auditivo (0 dB) y no

    llegar al umbral de dolor (140 dB).

    FIGURA 1 Intensidad de varios elementos

  • 32

    Tono

    El tono es la cualidad del sonido mediante la cual el odo le asigna un lugar

    en la escala musical, permitiendo, por tanto, distinguir entre los graves y los

    agudos. La magnitud fsica que est asociada al tono es la frecuencia. Los

    sonidos percibidos como graves corresponden a frecuencias bajas, mientras

    que los agudos son debidos a frecuencias altas. As el sonido ms grave de

    una guitarra corresponde a una frecuencia de 82,4 Hz y el ms agudo a

    698,5 hertzs. Para que los humanos podamos percibir un sonido este debe

    estar comprendido en la franja de 20 a 20.000 Hz. Por debajo tenemos los

    infrasonidos y por encima los ultrasonidos. A esto se le denomina rango de

    frecuencia audible. Junto con la frecuencia, en la percepcin sonora del tono

    intervienen otros factores de carcter psicolgico. As sucede por lo general

    que al elevar la intensidad se eleva el tono percibido para frecuencias altas y

    se baja para las frecuencias bajas. Entre frecuencias comprendidas entre 1

    000 y 3 000 Hz el tono es relativamente independiente de la intensidad.

    Timbre

    El timbre es la cualidad del sonido que permite distinguir sonidos

    procedentes de diferentes instrumentos, aun cuando posean igual tono e

    intensidad. Debido a esta misma cualidad es posible reconocer a una

    persona por su voz, que resulta caracterstica de cada individuo.

    El timbre est relacionado con la complejidad de las ondas sonoras que

    llegan al odo. Pocas veces las ondas sonoras corresponden a sonidos

  • 33

    puros, slo los diapasones generan este tipo de sonidos, que son debidos a

    una sola frecuencia y representados por una onda armnica. Los

    instrumentos musicales, por el contrario, dan lugar a un sonido ms rico que

    resulta de vibraciones complejas. Cada vibracin compleja puede

    considerarse compuesta por una serie de vibraciones armnico simples de

    una frecuencia y de una amplitud determinadas, cada una de las cuales, si

    se considerara separadamente, dara lugar a un sonido puro. Esta mezcla de

    tonos parciales es caracterstica de cada instrumento y define su timbre.

    Debido a la analoga existente entre el mundo de la luz y el del sonido, al

    timbre se le denomina tambin color del tono.

    Presin Sonora

    En primer lugar tenemos la presin atmosfrica, es decir la presin del aire

    ambiental en ausencia de sonido. Se mide en una unidad SI (Sistema

    Internacional) denominada Pascal (1 Pascal es igual a una fuerza de 1

    newton actuando sobre una superficie de 1 metro cuadrado, y se abrevia 1

    Pa). Esta presin es de alrededor de 100.000 Pa (el valor normalizado es de

    101.325 Pa). Podemos luego definir la presin sonora como la diferencia

    entre la presin instantnea debida al sonido y la presin atmosfrica, y,

    naturalmente, tambin se mide en Pa. Sin embargo, la presin sonora tiene

    en general valores muchsimo menores que el correspondiente a la presin

    atmosfrica. Por ejemplo, los sonidos ms intensos que pueden soportarse

    sin experimentar un dolor auditivo agudo corresponden a unos 20 Pa,

    mientras que los apenas audibles estn cerca de 20 mPa (mPa es la

    abreviatura de micropascal, es decir una millonsima parte de un pascal).

    Esta situacin es muy similar a las pequeas ondulaciones que se forman

    sobre la superficie de una profunda piscina. Otra diferencia importante es

    que la presin atmosfrica cambia muy lentamente, mientras que la presin

    sonora lo hace muy rpido, alternando entre valores positivos (presin

  • 34

    instantnea mayor que la atmosfrica) y negativos (presin instantnea

    menor que la atmosfrica) a razn de entre 20 y 20.000 veces por segundo.

    Potencia (W)

    La potencia acstica es la cantidad de energa radiada por una fuente

    determinada. El nivel de potencia Acstica es la cantidad de energa total

    radiada en un segundo y se mide en w. La referencia es 1pw = 1E-12 w.

    Para determinar la potencia acstica que radia una fuente se utiliza un

    sistema de medicin alrededor de la fuente sonora a fin de poder determinar

    la energa total irradiada.

    La potencia acstica es un valor intrnseco de la fuente y no depende del

    local donde se halle. Es como una bombilla, puede tener 100 w y siempre

    tendr 100 w la pongamos en nuestra habitacin o la pongamos dentro de

    una nave enorme su potencia siempre Serra la misma. Con la potencia

    acstica ocurre lo mismo el valor no varia por estar en un local reverberante

    o en uno seco. Al contrario de la Presin Acstica que si que varia segn

    vare las caractersticas del local donde se halle la fuente, la distancia etc.

    Fenmenos fsicos del sonido

    Reflexin

    Una onda se refleja (rebota al medio del cual proviene) cuando topa con un

    obstculo que no puede traspasar ni rodear.

  • 35

    FIGURA 2 Reflexin del sonido

    El tamao del obstculo y la longitud de onda determinan si una onda rodea

    el obstculo o se refleja en la direccin de la que provena. Si el obstculo es

    pequeo en relacin con la longitud de onda, el sonido lo rodeara (difraccin),

    en cambio, si sucede lo contrario, el sonido se refleja (reflexin). Si la onda

    se refleja, el ngulo de la onda reflejada es igual al ngulo de la onda

    incidente, de modo que si una onda sonora incide perpendicularmente sobre

    la superficie reflejante, vuelve sobre s misma. La reflexin no acta igual

    sobre las altas frecuencias que sobre las bajas. Lo que se debe a que la

    longitud de onda de las bajas frecuencias es muy grande (pueden alcanzar

    los 18 metros), por lo que son capaces de rodear la mayora de obstculos.

    En acstica esta propiedad de las ondas es sobradamente conocida y

    aprovechada. No slo para aislar, sino tambin para dirigir el sonido hacia el

    auditorio mediante placas reflectoras (reflectores y tornavoces).

    Refraccin

    Es la desviacin que sufren las ondas en la direccin de su propagacin,

    cuando el sonido pasa de un medio a otro diferente.

  • 36

    A diferencia de lo que ocurre en el fenmeno de la reflexin, en la refraccin,

    el ngulo de refraccin ya no es igual al de incidencia.

    La refraccin se debe a que al cambiar de medio, cambia la velocidad de

    propagacin del sonido. Posteriormente puede producirse dentro de un

    mismo medio, cuando las caractersticas de este no son homogneas, por

    ejemplo, cuando de un punto a otro de un medio aumenta o disminuye la

    temperatura.

    Ejemplo: Sobre una superficie nevada, el sonido es capaz de desplazarse

    atravesando grandes distancias. Esto es posible gracias a las refracciones

    producidas bajo la nieve, que no es medio uniforme. Cada capa de nieve

    tiene una temperatura diferente. Las ms profundas, donde no llega el sol,

    estn ms fras que las superficiales. En estas capas ms fras prximas al

    suelo, el sonido se propaga con menor velocidad.

    FIGURA 3 Refraccin del sonido

  • 37

    Difraccin

    La difraccin es un fenmeno que afecta a la propagacin del sonido.

    Hablamos de difraccin cuando el sonido en lugar de seguir en la direccin

    normal, se dispersa.

    La explicacin la encontramos en el Principio de Huygens que establece que

    cualquier punto de un frente de ondas es susceptible de convertirse en un

    nuevo foco emisor de ondas idnticas a la que lo origin. De acuerdo con

    este principio, cuando la onda incide sobre una abertura o un obstculo que

    impide su propagacin, todos los puntos de su plano se convierten en

    fuentes secundarias de ondas, emitiendo nuevas ondas, denominadas ondas

    difractadas.

    La difraccin se puede producir por dos motivos diferentes:

    Por que una onda sonora encuentra a su paso un pequeo obstculo y lo

    rodea. Las bajas frecuencias son ms capaces de rodear los obstculos que

    las altas. Esto es posible porque las longitudes de onda en el espectro

    audible estn entre 3 cm y 12 m, por lo que son lo suficientemente grandes

    para superar la mayor parte de los obstculos que encuentran.

    Por que una onda sonora topa con un pequeo agujero y lo atraviesa.

    La cantidad de difraccin estar dada en funcin del tamao de la propia

    abertura y de la longitud de onda.

    Si una abertura es grande en comparacin con la longitud de onda, el efecto

    de la difraccin es pequeo. La onda se propaga en lneas rectas o rayos,

    como la luz.

  • 38

    Cuando el tamao de la abertura es considerable en comparacin con la

    longitud de onda, los efectos de la difraccin son grandes y el sonido se

    comporta como si fuese una luz que procede de una fuente puntual

    localizada en la abertura.

    FIGURA 4 Difraccin del sonido

    Efecto Doppler

    El fenmeno fue descrito por primera vez por el matemtico y fsico austriaco

    Christian Doppler (1803-1853). Consiste en que el sonido emitido por una

    fuente es percibido por nuestro odo con distintas frecuencias dependiendo si

    dicha fuente est en reposo, acercndose o alejndose. En efecto, la

    frecuencia aumenta si la fuente se aproxima (sonido ms agudo) y disminuye

    si se aleja (sonido ms grave).

  • 39

    FIGURA 5 El efecto Doppler

    Una fuente emisora de ondas sonoras que se aproxima, se acerca al

    observador durante el periodo de la onda. Y, dado la longitud de la onda se

    acorta y la velocidad de propagacin de la onda permanece sin cambios, el

    sonido se percibe ms alto. Por esta misma razn, la altura (desplazamiento

    de la frecuencia de las ondas sonoras) de una fuente que se aleja, se reduce.

    El efecto Doppler se observa siempre que la fuente de ondas se mueve con

    respecto al observador. Es el efecto producido por una fuente de ondas mvil

    por el cual hay un aparente desplazamiento de la frecuencia hacia arriba

    para los observadores hacia los cuales se dirige la fuente y un aparente

    desplazamiento hacia debajo de la frecuencia para los observadores de los

    cuales la fuente se aleja.

    El efecto Doppler se origina cuando hay un movimiento relativo entre la

    fuente sonora y el oyente cuando cualquiera de los dos se mueven con

    respecto al medio en el que las ondas se propagan. El resultado es la

    aparente variacin de la altura del sonido. Existe una variacin en la

    frecuencia que percibimos con la frecuencia que la fuente origina.

  • 40

    El fenmeno no se restringe al movimiento de la fuente. Si la fuente de

    sonido est fija, un oyente que se mueva hacia la fuente observar un

    aumento similar en el tono. Un oyente que se aleja de la fuente de sonido

    escuchar un sonido de menor tono. El cambio en la frecuencia del sonido

    que resulta del movimiento relativo entre una fuente y un oyente se

    denomina efecto Doppler.

    El efecto Doppler se refiere al cambio aparente en la frecuencia de una

    fuente de sonido cuando hay un movimiento relativo de la fuente y del oyente.

    Efecto clsico: Mientras la onda avanza, el cuerpo se aleja del observador. El

    receptor capta tarde el prximo mximo y dir que el periodo es mas largo, la

    frecuencia es menor y la longitud de onda mayor.

  • 41

    LA VOZ Y SUS CARACTERISTICAS

    Los sistemas de comunicacin transportan informacin. A continuacin se

    estudiar un sistema de comunicacin especfico, el de la comunicacin a

    travs de seales de voz, es decir seales acsticas tradicionalmente

    emitidas y recibidas por seres humanos en forma oral.

    Histricamente, desde la Antigua Grecia se han realizado intentos por

    generar voces artificiales. En muchos casos eran simplemente juegos de

    tuberas conectadas a un locutor humano, en otros autnticos ingenios

    acsticos capaces de producir sonoridades voclicas.

    El desarrollo de la telefona a principios del siglo XX motiv intensas

    investigaciones sobre las propiedades de la voz y la audicin con el fin de

    mejorar la calidad de la comunicacin telefnica. El proceso continu y hoy

    en da las tecnologas existentes permiten, por ejemplo, disponer de

    sistemas de comunicacin oral hombre mquina.

    En todo sistema de comunicacin hay varios componentes: emisor, receptor,

    mensaje, cdigo, canal y contexto .Se debe conocer algunos aspectos de

    cada uno de ellos para poder integrar sistemas que funcionen de manera

    eficaz y eficiente. En l a s p e r s o n a s el emisor es el conjunto integrado por

    el cerebro que ?piensa? el mensaje y el aparato fonatorio que lo ?traduce? a

    una emisin acstica. El receptor es el aparato auditivo que recibe la onda

    sonora y la transforma en impulsos nerviosos que luego son interpretados por

    el cerebro. El mensaje es la idea a comunicar. El cdigo es el lenguaje

    hablado. La combinacin del mensaje y el cdigo constituyen la seal. El

    canal puede ser el medio en el cual se propaga la onda sonora (en general el

  • 42

    aire) o un medio de transmisin electrnico que constituye en s mismo otro

    subsistema de comunicacin cuyas propiedades son bien conocidas y que

    se aproxima en muchos casos (aunque no siempre) a la idealidad. El

    contexto puede tener un sinnmero de componentes, que van desde factores

    puramente subjetivos o psicolgicos, como el inters, la atencin, la

    motivacin hasta factores fsicos tales como respuesta en frecuencia,

    interferencias, distorsiones, ruido. De acuerdo con investigaciones realizadas,

    existen evidencias suficientes como para establecer que empleamos ms o

    menos el 70% de nuestras horas de actividad comunicndonos verbalmente,

    es decir, que cada uno de nosotros emplea alrededor de 10 a 11 horas

    diarias para comunicarse.

    Conceptos sobre lenguaje

    La lengua es un sistema de signos lingsticos que permiten la

    comunicacin en una comunidad. Es un sistema, cada uno de sus

    elementos tiene entidad propia y entidad relativa a su posicin o relacin

    con los otros elementos. Es un cdigo de signos. Tiene carcter social, ya

    que es comn a una sociedad. El habla es el acto de seleccionar los signos

    de entre los disponibles y organizarlos a travs de ciertas reglas. Materializa

    el cdigo, es individual, vale decir que cambia de un individuo a otro.

    Los signos pueden corresponder al lenguaje escrito o al oral. El lenguaje es

    un sistema articulado ya que los sonidos y otros componentes se integran

    entre s. Est formado por signos lingsticos, nombre que recibe la seal en

    el lenguaje. El lenguaje tiene modalidades regionales llamadas dialectos. Un

    signo es algo que reemplaza a otra cosa para comunicarla en un mensaje.

    Los signos lingsticos se clasifican en dos tipos: significado y significante.

    El significado es el concepto mental, idea o contenido a comunicar. El

    significante es la imagen, ya sea grfica o acstica que se le asigna. La

  • 43

    relacin entre significado y significante es arbitraria o convencional, aunque

    no necesariamente discrecional: involucra acuerdos tcitos, explcitos o

    normativos en una comunidad lingstica. En el lenguaje escrito, el

    significante es la grafa escrita, formada por combinaciones de letras, en

    tanto que en el lenguaje hablado es su realizacin acstica mediante la

    palabra hablada. Las palabras son los elementos libres mnimos del

    lenguaje. La sintaxis es el conjunto de reglas para la coordinacin de las

    palabras en frases u oraciones. En su versin escrita las palabras estn

    formadas por letras o grafemas, es decir unidades grficas mnimas, y, en el

    caso oral, por fonemas. Los fonemas son la unidad fnica ideal mnima del

    lenguaje. Se materializan a travs de los sonidos, pero de una manera no

    unvoca. Las variantes de los fonemas se denominan alfonos. Los

    monemas son unidades mnimas con significado, que puede ser gramatical,

    dando origen a los morfemas, o lxico, representado por los lexemas. Los

    morfemas tienen relacin con la gramtica, o la forma de organizar o dar

    estructura a las categoras bsicas del lenguaje (gnero, nmero, tiempo o

    persona de los verbos, etc.), mientras que los lexemas se refieren a

    significados externos al lenguaje mismo. Las palabras constan de al menos

    un monema, siendo las ms comunes bimonemticas, que incluyen un

    lexema y un morfema.

    En la tabla siguiente se dan dos ejemplos en los que se identifican los

    componentes de la palabra

    TABLA 1 Ejemplo de monemas, grafemas y fonemas

  • 44

    Fonologa y fontica

    La Fonologa estudia los fonemas, es decir el modelo fnico convencional e

    ideal del lenguaje. La Fontica, en tanto, se refiere a los sonidos en el

    habla, incluyendo su produccin acstica y los procesos fsicos y

    fisiolgicos de emisin y articulacin involucrados. As, la Fonologa es el

    estudio de los sonidos de la lengua en cuanto a su carcter simblico o de

    representacin mental. Procede detectando regularidades o recurrencias en

    los sonidos del lenguaje hablado y sus combinaciones, y haciendo

    abstraccin de las pequeas diferencias debidas a la individualidad de cada

    hablante y de caractersticas suprasegmentales como la entonacin, el

    acento (tnico, es decir por aumento de la intensidad y aggico, por

    aumento de la duracin). Cada uno de los sonidos abstractos as

    identificados es un fonema. Uno de los objetivos de la fonologa es acotar al

    mximo la cantidad de fonemas requeridos para representar cada idioma de

    una manera suficientemente precisa.

    La Fontica estudia experimentalmente los mecanismos de produccin y

    percepcin de los sonidos utilizados en el habla a travs del anlisis

    acstico, articulatorio y perceptivo. Se ocupa, por consiguiente, de las

    realizaciones de los fonemas.

    Fontica experimental

    Es la que estudia los sonidos orales desde el punto de vista fsico, reuniendo

    los datos y cuantificando los datos sobre la emisin y la produccin de las

    ondas sonoras que configuran el sonido articulado. Utiliza instrumentos como

    los rayos X y el quimgrafo, que traza las curvas de intensidad. El conjunto

    de los datos analizados al medir los sonidos depende nicamente de la

  • 45

    precisin del instrumental as como de otros conocimientos conexos. Adems

    se han descubierto diferencias importantes en cada sonido oral.

    Fontica articulatoria

    Es la que estudia los sonidos de una lengua desde el punto de vista

    fisiolgico, es decir, describe qu rganos orales intervienen en su

    produccin, en qu posicin se encuentran y cmo esas posiciones varan

    los distintos caminos que puede seguir el aire cuando sale por la boca, nariz,

    o garganta, para que se produzcan sonidos diferentes. No se ocupa de todas

    las actividades que intervienen en la produccin de un sonido, sino que

    selecciona slo las que tienen que ver con el lugar y la forma de articulacin.

    Los smbolos fonticos y sus definiciones articulatorias son las descripciones

    abreviadas de tales actividades. Los smbolos fonticos que se usan ms

    frecuentemente son los adoptados por la Asociacin Fontica Internacional

    en el alfabeto fontico internacional (A.F.I.) que se escriben entre corchetes.

    Los rganos que intervienen en la articulacin del sonido son mviles o fijos.

    Son mviles los labios, la mandbula, la lengua y las cuerdas vocales, que a

    veces reciben el nombre de rganos articulatorios. Con su ayuda, el hablante

    modifica la salida del aire que procede de los pulmones. Son fijos los dientes,

    los alvolos, el paladar duro y el paladar blando. Los sonidos se producen

    cuando se ponen en contacto dos rganos articulatorios por ejemplo el

    bilabial (p), que exige el contacto entre los dos labios; tambin cuando se

    ponen en contacto un rgano fijo y otro articulatorio, y el sonido se nombra

    con los rganos que producen la juntura, o punto de articulacin, como por

    ejemplo el sonido labiodental (f) que exige el contacto entre el labio inferior y

    los incisivos superiores. Cuando es la lengua el rgano mvil no se hace

    referencia a ella en la denominacin del sonido, as el sonido (t) que se

  • 46

    produce cuando la lengua toca la parte posterior de los incisivos superiores

    se llama dental.

    El modo de articulacin se determina por la disposicin de los rganos

    mviles en la cavidad bucal y cmo impiden o dejan libre el paso del aire.

    Esta accin puede consistir en la interrupcin instantnea y completa del

    paso del aire para las implosivas; en dejar abierto el paso nasal pero

    interrumpido el oral para las nasales; en producir un contacto con la lengua

    pero dejar libre el paso del aire a uno y otro lado para las laterales; en

    producir una leve interrupcin primero y dejar el paso libre despus para las

    africadas; en permitir el paso del aire por un paso estrecho por el que el aire

    pasa rozando para las fricativas, y en permitir el paso libre del aire por el

    centro de la lengua sin friccin alguna para las vocales.

    Se emiten diferentes clases de vocales segn vare la posicin de la lengua,

    tanto a partir de su eje vertical (alta, media y baja), como a partir de su eje

    horizontal (anterior, central y posterior). Por ejemplo, en espaol son vocales

    altas las vocales de la palabra huir, es decir, la [i] y la [u]. Son vocales

    medias la [e] y la [o], es decir las vocales de la palabra pero y es vocal baja

    la [a] de la palabra va. As, la lengua va de abajo arriba para pronunciar las

    dos vocales seguidas de la palabra aire, pero desciende a una posicin

    media para pronunciar su ltima vocal. Hace el camino contrario de arriba

    abajo para pronunciar puerta. Son vocales anteriores del espaol la [i] y la [e],

    es decir las vocales seguidas de la palabra piel; las vocales posteriores son

    la [o] y la [u], es decir las vocales de la palabra puro; la [a] es la vocal central.

    La lengua se mueve de atrs hacia adelante para emitir las vocales de la

    palabra totales, hace el camino contrario para emitir las vocales de la palabra

    pilago. Las posiciones que mantiene la lengua para emitir las vocales u, i y

    a constituyen los vrtices del llamado esquema voclico uai.

  • 47

    Anatoma del aparato Fonador[34]

    La voz humana se produce voluntariamente por medio del aparato fonatorio.

    ste est formado por los pulmones como fuente de energa en la forma de

    un flujo de aire, la laringe, que contiene las cuerdas vocales, la faringe, las

    cavidades oral (o bucal) y nasal y una serie de elementos articulatorios: los

    labios, los dientes, el alvolo, el paladar, el velo del paladar y la lengua

    (Figura 6). Las cuerdas vocales son, en realidad, dos membranas dentro de la

    laringe orientadas de adelante hacia atrs (Figura 8). Por adelante se unen

    en el cartlago tiroides (que puede palparse sobre el cuello, inmediatamente

    por debajo de la unin con la cabeza; en los varones suele apreciarse como

    una protuberancia conocida como nuez de Adn). Por detrs, cada una est

    sujeta a uno de los dos cartlagos aritenoides, los cuales pueden separarse

    voluntariamente por medio de msculos. La abertura entre ambas cuerdas

    se denomina glotis. Cuando las cuerdas vocales se encuentran separadas,

    la glotis adopta una forma triangular. El aire pasa libremente y prcticamente

    no se produce sonido. Es el caso de la respiracin. Cuando la glotis

    comienza a cerrarse, el aire que la atraviesa proveniente de los pulmones

    experimenta una turbulencia, emitindose un ruido de origen aerodinmico

    conocido como aspiracin (aunque en realidad acompaa a una espiracin

    o exhalacin). Esto sucede en los sonidos denominados ?aspirados? (como la

    h inglesa). Al cerrarse ms, las cuerdas vocales comienzan a vibrar a

    modo de lenguetas, producindose un sonido tonal, es decir peridico. La

    frecuencia de este sonido depende de varios factores, entre otros del tamao

    y la masa de las cuerdas vocales, de la tensin que se les aplique y de la

    velocidad del flujo del aire proveniente de los pulmones. A mayor tamao,

    menor frecuencia de vibracin, lo cual explica por qu en los varones, cuya

  • 48

    glotis es en promedio mayor que la de las mujeres, la voz es en general ms

    grave. A mayor tensin la frecuencia aumenta, siendo los sonidos ms

    agudos. As, para lograr emitir sonidos en el registro extremo de la voz es

    necesario un mayor esfuerzo vocal. Tambin aumenta la frecuencia (a

    igualdad de las otras condiciones) al crecer la velocidad del flujo de aire,

    razn por la cual al aumentar la intensidad de emisin se tiende a elevar

    espontneamente el tono de voz.

    FIGURA 6 Corte esquematico del aparato fonador humano

    FIGURA 7 La glotis

  • 49

    Finalmente, es posible obturar la glotis completamente. En ese caso no se

    produce sonido. Sobre la glotis se encuentra la epiglotis, un cartlago en la

    faringe que permite tapar la glotis durante la deglucin para evitar que el

    alimento ingerido se introduzca en el tracto respiratorio. Durante la respiracin

    y la fonacin (emisin de sonido) la epiglotis est separada de la glotis

    permitiendo la circulacin del flujo de aire. Durante la deglucin, en cambio,

    la laringe ejecuta un movimiento ascendente de modo que la glotis apoya

    sobre la epiglotis. La porcin que incluye las cavidades farngea, oral y nasal

    junto con los elementos articulatorios se denomina genricamente cavidad

    supragltica, en tanto que los espacios por debajo de la laringe, es decir la

    trquea, los bronquios y los pulmones, se denominan cavidades infraglticas.

    Varios de los elementos de la cavidad supragltica se controlan a voluntad,

    permitiendo modificar dentro de mrgenes muy amplios los sonidos

    producidos por las cuerdas vocales o agregar partes distintivas a los

    mismos, e inclusive producir sonidos propios. Todo esto se efecta por dos

    mecanismos principales: el filtrado y la articulacin.

    El filtrado acta modificando el espectro del sonido. Tiene lugar en las cuatro

    cavidades supraglticas principales: la faringe, la cavidad nasal, la cavidad

    oral y la cavidad labial. Las mismas constituyen resonadores acsticos que

    enfatizan determinadas bandas frecuenciales del espectro generado por

    las cuerdas vocales, conduciendo al concepto de formantes.

    Formantes

    Son una serie de picos de resonancia ubicados en frecuencias o bandas de

    frecuencia que, segn veremos, son bastante especficas para cada tipo de

    sonido.

  • 50

    FIGURA 8 Funcin de rea

    FIGURA 9 Formantes de un sonido sonoro

  • 51

    FIGURA 10 Formantes de un sonido sordo

    FIGURA 11 Corte esquematizo de la laringe segn un plano horizontal

    La articulacin es una modificacin principalmente a nivel temporal de los

    sonidos, y est directamente relacionada con la emisin de los mismos y con

    los fenmenos transitorios que los acompaan. Est caracterizada por el

  • 52

    lugar del tracto vocal en que tiene lugar, por los elementos que intervienen y

    por el modo en que se produce, factores que dan origen a una clasificacin

    fontica de los sonidos que veremos luego.

    FIGURA 12 Diagrama funcional del aparato fonador

    Pulmones Laringe Faringe TractoVocal

    TractoNasal

    Funcin

    Pulmones Laringe Faringe TractoVocal

    TractoNasal

    rganos

  • 53

    FIGURA 13 Diagrama funcional del aparato fonador

    Clasificacin de los sonidos

    Los sonidos emitidos por el aparato fonatorio pueden clasificarse de acuerdo

    con diversos criterios que tienen en cuenta los diferentes aspectos del

    fenmeno de emisin. Estos criterios son:

    Segn su carcter voclico o consonntico.

    Segn su oralidad o nasalidad

    Segn su carcter tonal (sonoro) o no tonal (sordo)

    Segn el lugar de articulacin e) Segn el modo de

    articulacin

    Segn la posicin de los rganos articulatorios

    Intensidad Tono fundamental

    Efectos Resultantes

    Pulso GlotalPresin Subglotal

    Modulacin

    Modulacin

    Modulacin

    Traza deVoz

    FonacinArticulacin

  • 54

    Segn la duracin

    Vocales y consonantes

    Desde un punto de vista mecanoacstico, las vocales son los sonidos

    emitidos por la sola vibracin de las cuerdas vocales sin ningn obstculo o

    constriccin entre la laringe y las aberturas oral y nasal. Dicha vibracin se

    genera por el principio del oscilador de relajacin, donde interviene una

    fuente de energa constante en la forma de un flujo de aire proveniente de

    los pulmones. Son siempre sonidos de carcter tonal (cuasiperidicos), y por

    consiguiente de espectro discreto. Las consonantes, por el contrario, se

    emiten interponiendo algn obstculo formado por los elementos

    articulatorios. Los sonidos correspondientes a las consonantes pueden ser

    tonales o no dependiendo de si las cuerdas vocales estn vibrando o no.

    Funcionalmente, en el castellano las vocales pueden constituir palabras

    completas, no as las consonantes.

    Oralidad y nasalidad

    Los fonemas en los que el aire pasa por la cavidad nasal se denominan

    nasales, en tanto que aqullos en los que sale por la boca se denominan

    orales. La diferencia principal est en el tipo de resonador principal por

    encima de la laringe (cavidad nasal y oral, respectivamente). En castellano

    son nasales slo las consonantes ???, ???, ???

    Tonalidad

    Los fonemas en los que participa la vibracin de las cuerdas vocales se

  • 55

    denominan tonales o tambin, sonoros. La tonalidad lleva implcito un

    espectro cuasi peridico.

    Como se puntualiz anteriormente, todas las vocales son tonales, pero

    existen varias consonantes que tambin lo son: ???, ???, ???, etc. Aquellos

    fonemas producidos sin vibraciones glotales se denominan sordos. Varios de

    ellos son el resultado de la turbulencia causada por el aire pasando a gran

    velocidad por un espacio reducido, como las consonantes ???, ???, ???, ???.

    Lugar y modo de articulacin (consonantes)

    La articulacin es el proceso mediante el cual alguna parte del aparato

    fonatorio interpone un obstculo para la circulacin del flujo de aire. Las

    caractersticas de la articulacin permitirn clasificar las consonantes. Los

    rganos articulatorios son los labios, los dientes, las diferentes partes del

    paladar (alvolo, paladar duro, paladar blando o velo), la lengua y la glotis.

    Salvo la glotis, que puede articular por s misma, el resto de los rganos

    articula por oposicin con otro. Segn el lugar o punto de articulacin se

    tienen fonemas:

    Bilabiales: oposicin de ambos labios

    Labiodentales: oposicin de los dientes superiores con el labio inferior

    Linguodentales: oposicin de la punta de la lengua con los dientes superiores

    Alveolares: oposicin de la punta de la lengua con la regin alveolar

    Palatales: oposicin de la lengua con el paladar duro

    Velares: oposicin de la parte posterior de la lengua con el paladar blando

    Glotales: articulacin en la propia glotis

  • 56

    A su vez, para cada punto de articulacin sta puede efectuarse de

    diferentes modos, dando lugar a fonemas:

    Oclusivos: la salida del aire se cierra momentneamente por completo

    Fricativos: el aire sale atravesando un espacio estrecho

    Africados: oclusin seguida por fricacin

    Laterales: la lengua obstruye el centro de la boca y el aire sale por los lados

    Vibrantes: la lengua vibra cerrando el paso del aire intermitentemente

    Aproximante : La obstruccin muy estrecha que no llega a producir

    turbulencia

    Los fonemas oclusivos (correspondientes a las consonantes ??? inicial o

    postnasal, ???, ???, ???, ??? inicial, postnasal o postlateral,???, ???) tambin se

    denominan a veces explosivos, debido a la liberacin repentina de la presin

    presente inmediatamente antes de su emisin. Pueden ser sordos o sonoros,

    al igual que los fricativos (??? postvoclica, postlateral y postvibrante, ???

    postvoclica y post vibrante, ???, ???, ??? aspirada, ???, ???, ???). Slo existe un

    fonema africado en castellano, correspondiente a la ?ch?. Los laterales (???, ?ll?)

    a veces se denominan lquidos, y son siempre sonoros. Los dos fonemas

    vibrantes del castellano (consonantes ???, ?rr?) difieren en que en uno de

    ellos (???) se ejecuta una sola vibracin y es intervoclico, mientras que en el

    otro (?rr?) es una sucesin de dos o tres vibraciones de la lengua. Finalmente,

    los fonemas aproximantes (la ??? y la ??? cerradas que aparecen en algunos

    diptongos) son a veces denominados semivocales, pues en realidad suenan

    como vocales. Pero exhiben una diferencia muy importante: son de corta

    duracin y no son prolongables.

    En la tabla 2 se indican las consonantes clasificadas segn el lugar y el

    modo de articulacin, la sonoridad y la oronasalidad. En algunos casos una

  • 57

    misma consonante aparece en dos categoras diferentes, correspondiente a

    las diferencias observadas.

    TABLA 2 Clasificacin de las consonantes de la lengua castellana segn ellugar y el modo de articulacin y la sonoridad

    Posicin de los rganos articulatorios (vocales)

    En el caso de las vocales, la articulacin consiste en la modificacin de la

    accin filtrante de los diversos resonadores, lo cual depende de las

    posiciones de la lengua (tanto en elevacin como en profundidad o

    avance), de la mandbula inferior, de los labios y del paladar blando. Estos

    rganos influyen sobre los formantes, permitiendo su control.

    Podemos clasificar las vocales segn la posicin de la lengua como se

    muestra en la tabla 3.

  • 58

    TABLA 3 Clasificacin de las vocales castellanas segn la posicin de lalengua.

    Otra cualidad controlable es la labializacin, es decir el hecho de que se haga

    participar activamente los labios. Las vocales labializadas, tambin definidas

    como redondeadas, son las que redondean los labios hacia adelante,

    incrementando la longitud efectiva del tracto vocal. La nica vocal labializada

    en el castellano es la ???.

    En otros idiomas, como el francs, el portugus, el cataln y el polaco, as

    como en lenguas no europeas como el guaran o el hindi, existe tambin el

    matiz de oralidad o nasalidad. En las vocales orales el velo (paladar blando)

    sube, obturando la nasofaringe, lo cual impide que el aire fluya parcialmente

    por la cavidad nasal. En las vocales nasalizadas (u oronasales) el velo baja,

    liberando el paso del aire a travs de la nasofaringe. Se incorpora as la

    resonancia nasal

    Duracin

    La duracin de los sonidos, especialmente de las vocales, no tiene

    importancia a nivel semntico en el castellano, pero s en el plano expresivo,

    a travs de la agogia, es decir el nfasis o acentuacin a travs de la

    duracin. En ingls, en cambio, la duracin de una vocal puede cambiar

    completamente el significado de la palabra que la contiene

  • 59

    El alfabeto fontico internacional

    El castellano es un idioma cuya escritura es eminentemente fontica, ya que

    salvo pocos casos, hay correspondencia entre grafema y fonema. No todos

    los idiomas tienen esta caracterstica. El ingls es un caso quizs extremo, a

    tal punto que George Bernard Shaw ha creado posibles ortografas

    alternativas para algunas palabras basndose en la forma en que sus

    fonemas aparecen escritos en otras palabras. Estas extraas ortografas y el

    anlisis correspondiente se muestran en la tabla 4.

    TABLA 4 Ortografas alternativas de George Bernard Shaw para dospalabras inglesas

    Se ha compilado un extenso conjunto de smbolos fonticos conocido

    como el Alfabeto Fontico Internacional (International Phonetic Alphabet,

    IPA) que contiene una gran cantidad de fonemas de los diversos idiomas, y

    que permite representar de una manera inequvoca los fonemas

    independientemente del idioma. El subconjunto correspondiente al idioma

    castellano se indica en la tabla 5.

  • 60

    TABLA 5 Los fonemas del alfabeto fontico internacional utilizados en lalengua castellana

    Fontica Acstica[39]

    Es la que estudia la onda sonora como la salida de un resonador cualquiera;

    esto es, equipara el sistema de fonacin con cualquier otro sistema de

    emisin y reproduccin de sonidos. En la comunicacin , las ondas sonoras

    tienen un inters mayor que la articulacin o produccin de los sonidos, para

    un determinado auditorio recibe y descodifica la impresin a pesar de que

    haya sido emitida por medio de una articulacin oral, o por medio de un

    determinado aparato emisor de sonidos o incluso por medio de una cotorra.

    Para grabar las caractersticas ms significativas de las ondas sonoras y

    para determinar el resultado de las distintas actividades articulatorias se

    puede emplear el espectrgrafo. De forma experimental, para poder llegar a

    saber cules son los rasgos necesarios y suficientes que identifican los

    sonidos de la lengua, se suprimieron partes de la grabacin de la onda

    sonora y se reprodujeron otras.

  • 61

    Unidades fonticas

    Los alfonos

    Los alfonos son cada uno de los sonidos propios de una lengua. Alfonos

    son las realizaciones concretas, fonticas, de los fonemas, de acuerdo con

    los elementos fnicos que entren en contacto. Son sonidos del habla,

    variantes fonticas de un sonido real. Por ejemplo, en castellano la e inicial

    de la palabra ejes es ms abierta que la segunda; sin embargo, si

    pronunciamos la e ms o menos abierta no cambiamos nunca el

    significado de las palabras. Estas dos realizaciones concretas son variantes

    fonticas, alfonos, del fonema /e/.

    Los fonemas

    Se definen como el conjunto de alfonos con el mismo valor fonolgico en

    una lengua. Cada lengua tiene un nmero limitado de fonemas, que son

    iguales a todos los hablantes en un momento dado (sincrnicamente) y que,

    segn la eleccin y combinacin que se haga con ellos, constituyen los

    diferentes significantes de los signos lingsticos. Por ejemplo:

    /s/, /z/ casa, mismo

    /n/, /N/ cana, tango

  • 62

    Caractersticas de la voz[46]

    Los sonidos se clasifican en sonoros y no sonoros. En los primeros se abren

    y cierran las cuerdas vocales, cambiando el rea de la traquea y originando

    un tren de impulsos cuasi peridicos. El periodo o frecuencia fundamental de

    este tren de impulsos se conoce con el nombre de pitch, y su valor esta

    comprendido entre 50 y 400 Hz para los hombres y es superior en mujeres y

    nios. En los sonidos no sonoros el aire fluye libremente hasta alcanzar el

    tracto vocal al permanecer las cuerdas vocales. Posteriormente, la variacin

    voluntaria del tracto vocal, junto con el estado variante de las cuerdas,

    produce la voz.

    El tracto vocal acta como una cavidad resonante para los sonidos sonoros,

    estando centradas las frecuencias de resonancia para la mayora de la gente

    en 500 Hz y sus armnicos pares. Esta resonancia causa grandes picos en

    el espectro resultante, a los cuales se les llama formantes. Tambin la seal

    tiene una naturaleza paso baja y a partir de unos 4KHz comienza a

    predominar el ruido.

    En cambio, el segmento de voz no sonoro muestra una estructura ruidosa

    tanto en el dominio del tiempo como en el de la frecuencia, no tenindose

    formantes. Adems la energa de la seal es mucho menor que la de los

    sonidos sonoros.

    Modelo del tracto voclico[36]

    La voz se produce a partir de sonidos formados por la vibracin de las

    cuerdas vocales y posterior resonancia en la pared del tracto voclico de la

    seal producida. En los adultos, el tracto voclico es un tubo de

  • 63

    aproximadamente 17cm de largo con un rea transversal que vara de 0 a 20

    cm2.La figura 9 muestra un diagrama del tracto voclico. Los pulmones

    actan solamente como emisores de aire. Son las cuerdas vocales las

    encargadas de introducir una perturbacin cuasi peridica en el flujo de aire.

    FIGURA 14 Zonas del aparato fonadora) Tracto voclico. a) articulaciones del habla: (1) cuerdas vocales; (2)faringe; (3) velo; (4) paladar blando; (5) paladar duro; (6) alveolos; (7) dientes;(8)labios; (9) punta de la lengua; (10) cuerpo lingual; (11) dorso; (12) raz; (13)mandbula; (14) cavidad nasal; (15) cavidad oral; (16) ventanas nasales; (17)traquea; (18) epglotis. b) tipos de articulacin de voz: (1) labial; (2) dental; (3)alveolar; (4) palatal; (5) velar; (6) uvular; (7) faringeal; (8) glotal.

    Los sonidos que conforman la voz se pueden clasificar en vocalizados

    (sonoros, originados en las cuerdas vocales) y no vocalizados (sordos,

    originados por una friccin en el tracto voclico), en la prctica la voz est

    formada por una mezcla de ambos. Durante el proceso de generacin de

    sonidos vocalizados, las cuerdas vocales estn cerradas, pero la presin

    ejercida por el aire contenido en los pulmones fuerza su apertura y su

    posterior relajacin ocasionando la vibracin de las cuerdas a una frecuencia

    entre los 50 y 400 [Hz]. A esta frecuencia se le conoce como pitch. La forma

  • 64

    de la seal que se produce en la vibracin con las cuerdas vocales es

    aproximadamente triangular. sta atraviesa el resto del tracto voclico donde

    la amplitud se ve alterada por el choque de la seal con las paredes del

    tracto. Durante el proceso de generacin de sonidos no vocalizados, las

    cuerdas vocales estn completamente abiertas, posibilitando la circulacin

    del aire por el tracto voclico, la que se ve ligeramente obstaculizada por el

    roce con las paredes del tracto, lo que produce un ruido fricativo. Adems del

    movimiento de las cuerdas vocales y del tracto voclico, para modelar el

    proceso de generacin de voz se debe considerar tambin los movimientos

    de la boca, la lengua, los labios y vibraciones nasales. Por tanto, un modelo

    bsico de este proceso debe considerar lo siguiente:

    La voz es una seal que emerge de una fuente definida: los pulmones

    actan como emisores de aire y la seal se produce por la vibracin

    de las cuerdas vocales y la posterior resonancia con las paredes del

    tracto voclico.

    La voz est formada por la mezcla de seales de excitacin peridica

    y ruido.

    La variacin temporal de la seal en el tracto voclico produce el

    timbre caracterstico que diferencia los fonemas, ciertos fonemas son

    articulados sin la presencia de las cuerdas vocales (fonemas sordos).

    Antes de pasar por el tracto voclico, la onda sonora tiene un espectro

    relativamente plano (sin formantes).

    La fuente emisora posee dos estados: generacin de sonidos

    vocalizados y no vocalizados.

    Si se toman intervalos de tiempos pequeos se puede modelar el

    rgano generador de voz a travs de la bsqueda de su funcin de

    transferencia, que define relacin entre la entrada (excitacin gltica) y

    la salida (voz generada) por medio de filtros.

  • 65

    ANATOMIA DEL SISTEMA AUDITIVO HUMANO[48]

    EL OIDO

    El odo se encarga de recoger los sonidos, procesarlos y mandar seales

    sonoras al cerebro mediante el proceso de transduccin .Otra funcin muy

    importante del odo es la de mantener el sentido del equilibrio.

    FIGURA 15 El odo

    El odo se divide entre partes que describiremos a continuacin:

    Odo externo

    Odo medio

    Odo interno

  • 66

    ELOIDO EXTERNO

    La nica parte visible del odo es el pabelln auditivo (la aurcula) que, debido

    a su especial forma helicoidal, es la primera parte del odo en reaccionar ante

    el sonido. El pabelln auditivo funciona como una especie de embudo que

    ayuda a dirigir el sonido hacia el interior del odo. Sin la presencia de este

    embudo las ondas sonoras tomaran una ruta directa hacia el conducto

    auditivo. Esto hara que el proceso de audicin fuera difcil e ineficaz ya que

    gran parte del sonido se perdera y seria ms difcil escuchar y comprender los

    sonidos.

    FIGURA 16 El Odo externo

    El pabelln auditivo es imprescindible debido a la diferencia de presin que

    existe en interior y exterior del odo. La resistencia del aire es mayor en el

    interior que en el exterior del odo porque el aire en el interior se encuentra

    comprimido, y por ello, a mayor presin. Para que las ondas sonoras penetren

    en el odo de la mejor forma posible, la resistencia del aire no debe ser

    demasiado alta. El pabelln auditivo es esencial para ayudar a vencer la

  • 67

    diferencia de presin en el interior y exterior del odo. El pabelln auditivo

    funciona como un vnculo intermedio que hace que esta transicin sea ms

    suave y menos brutal, permitiendo que penetren mayor numero de sonidos en

    el conducto auditivo (meatus).

    Una vez que las ondas sonoras han superado el pabelln auditivo, se

    desplazan de dos a tres centmetros dentro del conducto auditivo antes de

    golpear el tmpano, tambin conocido como membrana timpnica.

    El tmpano

    El tmpano (membrana timpnica), el cual seala el inicio del odo medio, es

    extremadamente sensible. Para proteger al tmpano, el conducto auditivo se

    curva ligeramente haciendo ms difcil que por ejemplo, los insectos puedan

    alcanzarlo. Al mismo tiempo la cera del odo (cerumen) del conducto auditivo

    ayuda a mantener fuera