dispositivo de asistencia auditiva dspic

8
 Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones Dispositivo de asistencia auditiva portátil implementado en un dsPIC Francisco Denk; Pablo Agüero; Alejandro Uriz; Juan Carlos Tulli; Esteban González Facultad de Ingeniería - Universidad Nacional de Mar del Plata Laboratorio de Comunicaciones Argentina Correo-e: franciscodenk,pdagu ero,jctulli@.mdp.e du.ar; ajuriz@conicet. gov.ar Resumen Las p ér did as de audición son una dol enc ia que afecta a un gran porc ent aje de la So cie dad . Si bien exi ste n dis p osi tivos que p ermite n mej orar la c ali dad de vid a de las pers ona s con est e tipo de dolencias, estos dispositivos suelen ser costosos y además muchas veces no se ajustan por completo a los requerimientos del usuario. Este trabajo se enfoca en el desarrollo de un dispositivo portátil de asistencia a personas con algún tipo de impedimento auditivo utilizando un dsPIC producido por Microchip. Con el n de validar los resultados, se utiliza un modelo capaz de simular pérdidas de audición mediante un banco de ltros polifásicos, lo que permite analizar el desempeño de dos algoritmos de compresión: el lineal y el SPINC. Resultados subjetivos experimentales demuestran las ventajas de la utilización de la  función SPINC, la cual es implementada en un disp ositivo dsPIC33FJ1 28GP802-E /SP de Micro chip, sobre otras como por ejemplo funciones lineales. 1. Introducción Las pérdidas de audición son una dolencia que aqueja, según datos del censo del 2001, a 300.000 personas en Argen tina. Existe n diversos tipos de problemas, pudiendo clasicarse por su origen en: congénito, debido a envejecimiento ó debido a un trauma, entre otros. Sin embargo, una forma más útil de clasicarlas es a través del  umbr al abso- luto de audición  ó  ATH  por sus siglas en inglés el cual es presentado en [1, 2, 3, 4, 5] . La función ATH representa la energía mínima que debe poseer un tono en un ambiente sin ruido para que pueda ser percibido por una persona joven con el oído en buen estado de salud. De este modo, todas las com- ponentes que estén por debajo de dicho umbral no serán percibidas por el mismo. Se puede clasicar una deciencia auditiva en función de dicha curva. Así, por ejemplo, para un oído con una  decien- cia auditiva grave, la curva presentará un rechazo adicional de al menos 60dB en las frecuencias supe- riores. Otro tipo de dolencias que padece un gran número de personas es una  deciencia auditiva traumática  donde, a raíz de un trauma, el oído de la persona deja de responder a un cierto rango de frecuencias. Esto puede deberse a que el individ- uo es expuesto de manera constante a un sonido de gran intensidad, como suele ocurrir en ambientes in- dustriales. Esta dolencia se puede representar como un rechazo de al menos 50dB sobre la curva ATH en un cierto rango de frecuencias. Para tratar estos y otros tipos de discapacidad auditiv a se han desarrollado un conjunto de téc nicas aplicables a diversos dispositivos que son colocados en distintas partes del oído, tales como audífonos e implantes cocleares. Ejemplos de estos dispositivos son ofrecidos por compañías como Widex ó Sam- sung. Estas ofrecen gran variedad de productos, los cuales van desde audífonos analógicos (que pueden poseer sólo un circuito amplicador), hasta equipos digitales con tecnología de punta [6, 7]. Estos úl- timos , permiten realiz ar tareas tales como compre- sión de voz, ltra do dinámico de ruido, opciones de funcionamiento congurables y acoplamiento para conversaciones telefónicas, entre otras. Otro aspecto que es considerado en estos diseños es la ergonomía, ya que estos productos están dis- eñados para su uso permanente en el cuerpo del usuario. Por ello, las compañías mencionadas tienen en cuenta que el equipo no provoque reacciones alér- gicas a la piel del usuario, que la forma del dispositi- vo no afecte al oído y que el dispositivo sea inmune a la humedad debida a la transpiración ó la lluvia. Una de las principales ventajas de los dispositivos digitales es que permiten obtener soluciones a la medida del usuario. En especial, pueden ser usados en dolencias que estén relacionadas con el envejec- imiento del oído o con la pérdida de audición en un rango de frecuencias en particular. Este tipo de casos pueden ser abordados utilizando técnicas de compresión de voz, las cuales permiten acondicionar la señal que ingresa al oído del oyente con el n de llevar el rango de frecuencias donde exista una zona muerta  del oído, como por ejemplo una discapaci- Congreso 2010, Página 1

Upload: josbaney-jose-pereira-calles

Post on 04-Nov-2015

213 views

Category:

Documents


0 download

DESCRIPTION

Dispositivo de Asistencia Auditiva DsPic

TRANSCRIPT

  • Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones

    Dispositivo de asistencia auditiva porttil implementado en un

    dsPIC

    Francisco Denk; Pablo Agero; Alejandro Uriz; Juan Carlos Tulli; Esteban Gonzlez

    Facultad de Ingeniera - Universidad Nacional de Mar del Plata

    Laboratorio de Comunicaciones

    Argentina

    Correo-e: franciscodenk,pdaguero,[email protected]; [email protected]

    Resumen

    Las prdidas de audicin son una dolencia que afecta a un gran porcentaje de la Sociedad. Sibien existen dispositivos que permiten mejorar la calidad de vida de las personas con este tipo dedolencias, estos dispositivos suelen ser costosos y adems muchas veces no se ajustan por completo a losrequerimientos del usuario. Este trabajo se enfoca en el desarrollo de un dispositivo porttil de asistenciaa personas con algn tipo de impedimento auditivo utilizando un dsPIC producido por Microchip. Conel fin de validar los resultados, se utiliza un modelo capaz de simular prdidas de audicin mediante unbanco de filtros polifsicos, lo que permite analizar el desempeo de dos algoritmos de compresin: ellineal y el SPINC. Resultados subjetivos experimentales demuestran las ventajas de la utilizacin de lafuncin SPINC, la cual es implementada en un dispositivo dsPIC33FJ128GP802-E/SP de Microchip,sobre otras como por ejemplo funciones lineales.

    1. Introduccin

    Las prdidas de audicin son una dolencia queaqueja, segn datos del censo del 2001, a 300.000personas en Argentina. Existen diversos tipos deproblemas, pudiendo clasificarse por su origen en:congnito, debido a envejecimiento debido a untrauma, entre otros. Sin embargo, una forma mstil de clasificarlas es a travs del umbral abso-luto de audicin ATH por sus siglas en inglsel cual es presentado en [1, 2, 3, 4, 5] . La funcinATH representa la energa mnima que debe poseerun tono en un ambiente sin ruido para que puedaser percibido por una persona joven con el odo enbuen estado de salud. De este modo, todas las com-ponentes que estn por debajo de dicho umbral nosern percibidas por el mismo. Se puede clasificaruna deficiencia auditiva en funcin de dicha curva.As, por ejemplo, para un odo con una deficien-cia auditiva grave, la curva presentar un rechazoadicional de al menos 60dB en las frecuencias supe-riores. Otro tipo de dolencias que padece un grannmero de personas es una deficiencia auditivatraumtica donde, a raz de un trauma, el odode la persona deja de responder a un cierto rangode frecuencias. Esto puede deberse a que el individ-uo es expuesto de manera constante a un sonido degran intensidad, como suele ocurrir en ambientes in-dustriales. Esta dolencia se puede representar comoun rechazo de al menos 50dB sobre la curva ATHen un cierto rango de frecuencias.

    Para tratar estos y otros tipos de discapacidad

    auditiva se han desarrollado un conjunto de tcnicasaplicables a diversos dispositivos que son colocadosen distintas partes del odo, tales como audfonos eimplantes cocleares. Ejemplos de estos dispositivosson ofrecidos por compaas como Widex Sam-sung. Estas ofrecen gran variedad de productos, loscuales van desde audfonos analgicos (que puedenposeer slo un circuito amplificador), hasta equiposdigitales con tecnologa de punta [6, 7]. Estos l-timos, permiten realizar tareas tales como compre-sin de voz, filtrado dinmico de ruido, opciones defuncionamiento configurables y acoplamiento paraconversaciones telefnicas, entre otras.

    Otro aspecto que es considerado en estos diseoses la ergonoma, ya que estos productos estn dis-eados para su uso permanente en el cuerpo delusuario. Por ello, las compaas mencionadas tienenen cuenta que el equipo no provoque reacciones alr-gicas a la piel del usuario, que la forma del dispositi-vo no afecte al odo y que el dispositivo sea inmunea la humedad debida a la transpiracin la lluvia.

    Una de las principales ventajas de los dispositivosdigitales es que permiten obtener soluciones a lamedida del usuario. En especial, pueden ser usadosen dolencias que estn relacionadas con el envejec-imiento del odo o con la prdida de audicin enun rango de frecuencias en particular. Este tipo decasos pueden ser abordados utilizando tcnicas decompresin de voz, las cuales permiten acondicionarla seal que ingresa al odo del oyente con el fin dellevar el rango de frecuencias donde exista una zonamuerta del odo, como por ejemplo una discapaci-

    Congreso 2010, Pgina 1

  • Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones

    dad traumtica, hacia zonas donde la informacinpueda ser percibida. La compresin se lleva a cabomediante una funcin que mapea de una maneraadecuada las frecuencias de la zona afectada haciala nueva regin. Debido a ello, pueden encontrarseversiones lineales basadas en la Transformada Rp-ida de Fourier (FFT) [8, 9, 10]; versiones basadasen modelos sinusoidales [11, 12]; e incluso usandoaproximaciones basadas en bancos de filtros [13, 14].Este trabajo apunta a desarrollar un sistema ca-

    paz de simular distintos grados de prdidas audi-tivas y perfeccionar tcnicas que logren mitigar di-chos problemas. El objetivo final del mismo consisteen desarrollar un dispositivo que sea capaz de inte-grar las tcnicas utilizadas en un dispositivo DSPporttil, del tipo dsPIC. En particular se utiliza undsPIC33FJ128GP802-E/SP [15]. De este modo, esposible comparar el producto desarrollado con losexistentes, apuntando a mejorar las especificacionesde los mismos y a reducir su costo.El artculo se organiza de la siguiente manera: en

    la Seccin 2 se hace referencia a las dolencias a estu-diar. La Seccin 3 presenta los mtodos del estadode la cuestin a desarrollar y se implementa el al-goritmo de compresin utilizado. En la Seccin 4 serealizan experimentos para validar los mtodos im-plementados. En la Seccin 5 se hace un anlisis defactibilidad sobre la implementacin del algoritmodesarrollado en un microcontrolador dsPIC, con elfin de obtener un dispositivo porttil. Por ltimo,en la Seccin 5.1 se desarrollan las conclusiones deltrabajo.

    2. Descripcin de las dolencias

    a estudiar

    En esta seccin se presenta un breve resumen delas dolencias que se van a estudiar a lo largo deltrabajo. Este trabajo est enfocado en resolver do-lencias similares a un envejecimiento del rgano au-ditivo, las cuales se caracterizan por un aumentoen el umbral de audicin y la aparicin de zonasmuertas, especialmente en las frecuencias altas ymedias. Estas representaciones son desarrolladas en[4, 16, 17]. Por este motivo algunos fonemas, en es-pecial los fricativos [18], no puedan ser correcta-mente odos, ya que una parte de su informacin es-pectral ha sido eliminada por la reduccin de la au-dicin del rgano. Como consecuencia de esto, dosfonemas como la /s/ y la /r/ pueden ser percibidosde forma similar, lo que produce un deterioro en lainteligibilidad de los sonidos que percibe el oyente.De los estudios realizados en [19, 20] se desprendela Fig. 1, que muestra la curva de audicin de unodo correspondiente a una persona joven en buenestado de salud.Por otro lado, en la Fig. 2 se representa la curva

    ATH para un odo de una persona con una sorderagrave y la Fig. 3 corresponde a la curva ATH deuna persona afectada por una discapacidad audi-

    0 1000 2000 3000 4000 5000 6000 7000 800010

    0

    10

    20

    30

    40

    50

    60

    dB S

    PL

    Frecuencia [Hz]

    Figura 1: Respuesta en frecuencia del odo de unapersona en buenas condiciones de salud auditiva, enun ambiente sin ruido.

    tiva traumtica. Como se mencion en el prrafoanterior, los problemas auditivos se deben a que eloyente percibe menos formantes (u otra informa-cin frecuencial) que los necesarios para poder dis-tinguir entre los distintos fonemas entre s. Estudiosprevios indican que slo son necesarios los primerosformantes para poder distinguir entre algunos fone-mas sonoros, no as en los no sonoros (como losfonemas fricativos [18]). Incluso, algunos estudiosdemuestran que la energa se concentra en un al-to porcentaje para fonemas sonoros entre 0 y 1KHzpara una persona con voz grave [10]. A su vez, parafonemas fricativos, dichos formantes se encuentranen frecuencias ms elevadas. Cabe destacar adems,que la informacin necesaria para reconocer al locu-tor se halla ubicada en el rango de frecuencias entrelos 1000Hz y los 2000Hz [21]. En consecuencia, re-sulta factible intentar trasladar estos formantes ha-cia el rango de frecuencia donde el oyente percibael mensaje de una manera correcta. Dicha tarea esrealizada por el sistema de compresin de voz quese presenta en la siguiente seccin.

    0 1000 2000 3000 4000 5000 6000 7000 80000

    10

    20

    30

    40

    50

    60

    70

    dB S

    PL

    Frecuencia [Hz]

    Figura 2: Curva ATH correspondiente a una per-sona afectada por una sordera aguda.

    Congreso 2010, Pgina 2

  • Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones

    0 1000 2000 3000 4000 5000 6000 7000 800010

    0

    10

    20

    30

    40

    50

    60

    70

    dB S

    PL

    Frecuencia [Hz]

    Figura 3: Curva ATH correspondiente a una per-sona con una deficiencia auditiva de carctertraumtico.

    3. Mtodos implementados

    Esta seccin se divide en dos partes. En laprimera se introduce un modelo que implementaherramientas capaces de simular las deficiencias au-ditivas planteadas en la Sec. 2. La segunda partese enfoca en la presentacin de un algoritmo queimplementa un mtodo de compresin de voz conel fin de mejorar la inteligibilidad de la seal quepercibe el oyente.

    3.1. Modelado de la discapacidad au-

    ditiva

    Para comenzar es necesario analizar el problemade la prdida auditiva. A travs del estudio de estadeficiencia es posible construir un modelo del odocomo un banco de filtros con diferentes umbralesde audicin [19],[4], [16], [22], [23]. De esta forma,toda aquella seal con potencia inferior al umbralresulta eliminada. Esto nos permite obtener la sealque esta siendo oda por una persona con un ciertogrado de discapacidad. La Fig. 4 presenta el sistemamodelado:Para implementar el modelo, se hace uso de difer-

    entes herramientas de modelado psicoacstico quese complementan con estudios realizados por diver-sos cientficos acerca de la forma de la respuestaen frecuencia del sistema auditorio para personas

    Figura 4: Esquema del sistema de simulacin de dis-capacidades auditivas propuesto.

    con distintos tipos de sordera [24]. Los resulta-dos de este desarrollo nos permiten conocer comopercibe los sonidos una persona con una determi-nada discapacidad auditiva, y de esta manera sepodrn construir herramientas ms efectivas paramejorar la audicin. Este modelo consiste en unarepresentacin las prdidas auditivas mediante unconjunto de filtros pasabanda, diseados con el finde modelar las las caractersticas de un sistema deaudicin con una discapacidad especfica. Un ejem-plo de esto, es modelar el odo mediante un filtropasabajos, el cual atena las componentes de altafrecuencia, de modo de percibir los sonidos de lamisma forma que un odo envejecido, el cual no escapaz de percibir dicha informacin.

    3.2. Algoritmo de compresin de voz

    Los algoritmos de compresin espectral se basanen escalamientos y traslaciones en frecuencia. Paracada una de las frecuencias de entrada se estableceuna correspondencia con una frecuencia de salida atravs de un factor de escala y un desplazamiento enfrecuencia. Tanto el factor como el desplazamientopueden obedecer a una ley lineal, logartmica, u otrams compleja, con respecto a la frecuencia de entra-da. En la literatura se pueden encontrar diferentesfunciones que relacionan la frecuencia de entradacon la frecuencia de salida [7, 10, 25]. En general,la compresin en las bajas frecuencias es mnimay la compresin en altas frecuencias obedece unaley cercana a la logartmica, lo que se realiza conel fin de no modificar las componentes de ms ba-ja frecuencia (las cuales aportan la mayor parte dela informacin fontica). En este caso se utiliza lafuncin de mapeo frecuencial que responde al arcotangente: la funcin SPINC [25], mediante la cuallas frecuencias de entrada (f) y de salida (f) serelacionan segn la Ec. 1.

    (f) = 1414arctg(f/1414Hz) SPINC. (1)

    En la Fig. 5 se representa la funcin SPINC juntoa dos variaciones de una funcin de compresin lin-eal. En la misma se aprecia en trazo grueso rayadouna curva de referencia con pendiente unitaria, entrazo continuo grueso la funcin SPINC y con lin-eas rayadas finas con y sin puntos, las funciones decompresin lineal con factores de compresin 1.7 y1.3 respectivamente.Esta funcin presenta diversas ventajas en su

    comportamiento tanto en bajas como altas frecuen-cias. Diversos estudios, entre los cuales podemosmencionar el realizado por Simpson [26], indicanque los formantes de ms baja frecuencia, inferioresa 300 Hz, no presentan variaciones significativas en-tre locutores con respecto a lo que ocurre con losformantes de frecuencias superiores. En consecuen-cia, resulta deseable el comportamiento de la fun-cin SPINC, la cual preserva la ubicacin de dichosformantes. Por otro lado, es posible comprimir todo

    Congreso 2010, Pgina 3

  • Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones

    0 1000 2000 3000 4000 50000

    500

    1000

    1500

    2000

    2500

    3000

    3500

    4000

    4500

    5000

    FRECUENCIA DE ENTRADA [HZ]

    FREC

    UENC

    IA D

    E SA

    LIDA

    [HZ]

    Sin CompresionComp. SPINC Factor 1Comp. Lineal Factor 1.3Comp. Lineal Factor 1.7

    Figura 5: Funciones de compresin lineal y SPINC.

    el espectro de voz en un ancho de banda de 2200Hz.Mientras que si se utiliza compresin lineal con unfactor de compresin de 1.3, por un lado los for-mantes inferiores se ven desplazados, lo cual afectala inteligibilidad del audio resintetizado y por otro,para transmitir 20KHz se necesita un ancho de ban-da de aproximadamente 15KHz. Esta ventaja delalgoritmo SPINC trae aparejada una prdida de se-lectividad para las altas frecuencias, ya que la fun-cin SPINC comprime por un factor unitario entre0 y 1414Hz y luego comprime el resto del espectroentre 1414Hz y 2,2Khz. Esto no afecta la inteligibil-idad del audio resintetizado, ya que la informacinrelevante para definir esta caracterstica se encuen-tra en los primeros formantes de cada fonema. Estadistorsin se traduce en una leve prdida de identi-dad al procesar una seal de voz. En este trabajo seimplementa el algoritmo de compresin utilizandoel modelo propuesto por Timms et al. [27]. El mismoconsiste en un anlisis solapado de la seal usandola transformada rpida de Fourier (FFT). La com-presin espectral se realiza trasladando los picos fre-cuenciales usando la funcin SPINC. Finalmente, seaplica un filtrado pasabajos y se realiza un espejadodel espectro para recuperar la simetra hermitiana.Este ltimo paso es importante para obtener unaseal puramente real a travs de la transformadainversa de Fourier (IFFT), para la reconstruccinposterior usando el algoritmo de suma solapada. Eneste caso se utilizan los siguientes parmetros:

    Filtrado de entrada antialiasing [28] [18].

    Transformacin al dominio de la frecuencia us-ando una FFT de 256 puntos. De esta for-ma, se obtiene una resolucin en frecuencia de62.50Hz para una frecuencia de muestreo de16KHz.

    Se utilizan segmentos de seal (frames) de 256puntos sin solapamiento.

    Se procesa la seal de entrada con el algoritmode compresin SPINC

    Transformacin al dominio del tiempo medi-ante una IFFT.

    Resintetizado de la seal de audio, se utiliza elmtodo de la suma solapada TD-OLA [18].

    De esta forma se obtiene un sistema capaz decomprimir los sonidos de un determinado ran-go donde el oyente presente problemas hacia otrodonde sea capaz de percibirlos. Este sistema tieneuna carga computacional que depende fundamen-talmente de la funcin FFT implementada, espor ello que se busca un compromiso entre esteparmetro, y la resolucin en frecuencia del sistema.

    4. Experimentos

    Con el fin de cuantificar la mejora introducidapor el mtodo, se realiza una serie de simulacionesutilizando MATLAB, con el propsito de estudiarcomparativamente los algoritmos propuestos, tantoen inteligibilidad como en calidad. Para ello, se uti-liz el modelo presentado en la Sec. 3.2 para proce-sar los audios de 4 locutores. 2 mujeres y 2 hombres.Por otro lado, se utiliza una serie de sonidos que eldiscapacitado debe escuchar en su vida cotidiana(bocinas de autos, advertencias ferroviarias, etc.).El comportamiento del sistema se estudia en unacondicin de sordera simulada mediante un filtropasobajos con una frecuencia de corte de 870Hz. Deeste modo, el sonido sin compresin carece de la in-formacin necesaria para que algunos sonidos seaninteligibles, como es el caso de los fonemas frica-tivos. El experimento consta de un grupo de eval-uadores sin discapacidades auditivas que calificande 1 a 5 en inteligibilidad (5: perfectamente intel-igible, 1: ininteligible) y calidad (5: calidad exce-lente, 1: calidad psima, deteriorada por la manip-ulacin de los datos) una serie de archivos de audiolos cuales corresponden a los siguientes casos:

    Filtrado pasabajos, con reconstruccin uti-lizando compresin lineal y factores de com-presin 1,3 y 1,7.

    Filtrado pasabajos, con reconstruccin uti-lizando compresin SPINC y factores de com-presin de 1,3 y 1,0.

    Inteligibilidad CalidadSPINC, k= 1.0 2.4 2.2SPINC, k= 1.3 2,1 1,9Lineal, k= 1.7 1,7 1,8Lineal, k= 1.3 1,7 1,7

    Cuadro 1: Resultados del experimento comparativo.

    La Tabla 1 presenta los resultados obtenidos, loscuales muestran una clara ventaja tanto en la in-teligibilidad como en la calidad para el algoritmo

    Congreso 2010, Pgina 4

  • Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones

    de compresin SPINC por sobre el uso de compre-sin LINEAL. Adems, el SPINC con un factor decompresin unitario es el que presenta mejores re-sultados. Esto se debe a que los restantes algoritmoscomprimen los formantes ms bajos de la seal devoz y por ello resulta distorsionada. Esto hace queen algunos casos la seal oida sea ininteligible.Del mismo modo, para sonidos de advertencia

    se observ que sin aplicar compresin era imposi-ble percibirlos. El caso ms relevante fue el de unaseal de advertencia de un paso a nivel ferroviario,la cual se pudo escuchar perfectamente usando com-presin SPINC, mientras que sin compresin o uti-lizando compresin lineal, la advertencia no pudoser percibida.

    5. Implementacin en un DSP

    Dado que las simulaciones realizadas utilizandoMATLAB y MPLAB arrojaron resultados prom-etedores, se implement el algoritmo utilizando undispositivo dsPIC 33FJ128GP802-E/SP de Mi-crochip [15, 29]. Con el cual es posible implementarprestaciones similares a las que poseen otros dispos-itivos comerciales como BRAVO [6] el SENSO [7],ambos de la empresa WIDEX como control de rui-do, compresin de voz y ecualizacin, entre otras.Otra gran ventaja de estos dispositivos digitales, esque permiten ajustar el equipo a las necesidadesdel oyente con solo reprogramarlo, evitando cali-braciones extensas. Por lo comentado, estos dispos-itivos de asistencia son muy verstiles. Sin embargo,la versatilidad impacta en el costo, ya que para undispositivo como los citados su valor oscila entrelos 1000 y los 5000 Euros. Por otro lado, estos dis-positivos se basan en Procesadores Digitales deSeales (DSP), que por su naturaleza requierencircuitera externa, lo que a la hora de tratar deimplementar uno de ellos se traduce en un aumen-to de las dimensiones del equipo. Por el contrario,el dsPIC propuesto tiene una gran integracin decomponentes, reduciendo as el volumen del equipoa construir. Esto lo hace ideal para la construccindel dispositivo de asistencia.Las caractersticas ms relevantes de este dispos-

    itivo son:

    128KB de memoria de programa. Lo cuallo hace apropiado para el uso de compiladorescruzados.

    16KB de memoria RAM. De los cuales 2KBson utilizados como memoria compartida paraAcceso Directo a Memoria DMA.

    Velocidad de procesamiento de 40MHz.

    Bajo costo. Su valor es de 4 US$, amplia-mente menor al de un DSP tradicional. Estaes una gran ventaja comparado con los dispos-itivos DSP comerciales.

    Bus de datos de 16 bits.

    Conversor analgico a digital (ADC) in-tegrado de 12 bits@500ksps.

    Conversor digital a analgico (DAC) in-tegrado de 16 bits@100ksps.

    Registros de entrada y salida duplicados.Esto permite realizar operaciones de lectura yescritura a mayor velocidad adems otorga unamayor flexibilidad al manejo de los pines deentrada y salida del dsPIC.

    Programacin y depuracin en circuito.Es posible calibrar y reprogramar el dispositivosin necesidad de desmontar el dsPIC.

    Disponible en encapsulado SOIC de 28pines. Permite lograr grandes niveles de inte-gracin.

    Adems, debe tenerse en cuenta que la doc-umentacin acerca de los dispositivos Microchipy sus libreras estn disponible en internetsin costo alguno. Quizs la mayor ventaja deldsPIC33FJ128GP802 es que permite realizar en si-multneo dos tareas, que en este caso resultan serel procesamiento en paralelo de los datos de un seg-mento y la resntesis de la seal de audio correspon-diente al segmento anterior. Esto se realiza utilizan-do el mdulo de DMA del dispositivo [15], el cualtrabaja de forma independiente al procesador prin-cipal. Por este motivo se reduce casi a la mitad eltiempo de procesamiento de cada uno de los seg-mentos, lo cual es un factor crtico a la hora deobtener un dispositivo que funcione en tiempo real.Otro aspecto a tener en cuenta, es que la utilizacinde tcnicas de DMA aumenta el rendimiento del sis-tema, ya que reduce al mnimo las fuentes de inter-rupcin del programa principal. Es decir, los dispos-itivos realizan la transferencia de datos utilizandoel mdulo DMA, y por ello no agrega retardos deejecucin al programa principal. En particular lostiempos que se reducen son:

    Tiempo de procesamiento de la rutina de inter-rupcin.

    Tiempo de acceso, almacenamiento y lecturade la pila stack del sistema.

    Tiempo de acceso a los perifricos.

    El algoritmo de compresin de voz implementadoes el descripto en la Sec.3.2. Este dispositivo es posi-ble adaptarlo a cada usuario en particular, con soloafectar el valor del factor de compresin y del de-splazamiento a realizar de acuerdo a las necesidadesdel mismo. A la hora de implementar el algoritmoFFT en el dsPIC se debi optar por una variacinal algoritmo ya que el mismo esta diseado en basea aritmtica de punto flotante, lo cual no es sopor-tado por la arquitectura del dsPIC utilizado. Por

    Congreso 2010, Pgina 5

  • Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones

    Figura 6: Esquema del dispositivo propuesto.

    este motivo, las operaciones de punto flotante de-ban ser emuladas en software, aumentando consid-erablemente los tiempos de procesamiento. Por di-cho motivo se implemento el algoritmo de FFT enaritmtica de punto fijo de 16 bits [30], trabajan-do en base a escalamientos de magnitud. El sistemaobtenido se aprecia en la Fig.6. Y los tiempos in-volucrados en el bloque de procesamiento de datosse aprecian en la Tabla 2

    FFT BRO IFFT965s 95s 1ms

    Cuadro 2: Tiempos de procesamiento para segmen-tos de 256 muestras.

    Se puede apreciar que el tiempo de procesamientodel algoritmo de compresin (BRO) es significativa-mente menor que el de procesamiento de los algorit-mos de FFT y de IFFT. Una vez implementado elsistema, se registraron los tiempos totales de proce-samiento, los cuales se presentan en la Tabla 3.

    Proc. Adq. RAM DMA2,06ms 15,72ms 34% 100%

    Cuadro 3: Tiempos de procesamiento , adqusiciny usos de memoria para dos implementaciones delalgoritmo de compresin, para 256 muestras

    Los valores registrados en la Tabla 3 fueron me-didos utilizando una fsampling = 16,288KHz, y sepresentan por separado los tiempos de procesamien-to y de adquisicin. Esto se debe a que estas tareasse procesan en paralelo, por lo que el tiempo deprocesamiento total del sistema se considera comoel mayor de ambos, que para el caso de segmentosde 256 muestras es de ttotal = 15,72ms. Otro as-pecto a considerar es que si bien los niveles de usode memoria RAM y de programa permanecen ba-jos, aparece una limitacin debida a la cantidadde memoria DMA disponible ,(en este caso es de2KB), la cual impide obtener un desempeo mayoral sistema.

    5.1. Conclusiones

    A lo largo de este trabajo se desarroll un dis-positivo capaz de realizar compresin de voz parapersonas con diversos grados de deficiencias audi-tivas. Se pudo demostrar que mediante algoritmosms potentes como es el SPINC y dispositivos conmayor capacidad de cmputo es posible implemen-tar un dispositivo similar a los que se encuentranen el mercado. Esto se debe a que por un lado, losexperimentos realizados mostraron una mejora delalgoritmo SPINC frente al de compresin lineal, elcual es utilizado en muchos dispositivos comerciales.Otro aspecto relevante es que el desarrol-

    lo se realiz utilizando un dsPIC comercialdsPIC33FJ128GP802/E-SP, para el cual se pudodemostrar que los tiempos de procesamiento sonacordes a una implementacin en tiempo real.La nica limitacin que present este desarrol-

    lo fue la cantidad de memoria disponible para uti-lizar con acceso directo (DMA), motivo por el cualen trabajos futuros se utilizar un Microcontroladorque tenga especificaciones superiores al utilizado eneste trabajo. Siguiendo la misma lnea de trabajo,se pretende incorporar mayores prestaciones al dis-positivo de asistencia auditiva.Este Trabajo fue desarrollado en el marco del

    Proyecto Desarrollos Tecnolgicos destinados amejorar la calidad de vida de personas con capaci-

    dades diferentes de la Facultad de Ingeniera, Uni-versidad Nacional de Mar del Plata.

    Referencias

    [1] ISO/IEC JTC1/SC29/WG111 MPEGIS13813(1994): Generic Coding of MovingPictures and Associated Audio, (1994).

    [2] Painter, T. and Spanias, A.: Perceptual Cod-ing of Digital Audio, Proceedings of the IEEE.Vol.88(4) pp. 451513 (2000).

    [3] Vilchur, E.: Signal processing to improve speechintelligibility in perceptive deafness, Journal ofthe Acoustical Society of America. Vol.53(6),pp. 16461657 (1973).

    [4] Zwicker, E., Flottorp, G. and Stevens, S. S.,Critical Band Width in Loudness Simmation,

    Congreso 2010, Pgina 6

  • Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones

    Journal of the Acoustical Society of America.Vol.29(3), pp. 548557 (1957).

    [5] Arelhi, R. and Campbell, D.R.: A MATLABSimulink Implementation of Speech MaskingBased on the MPEG Psychoacustic Model I,Proceedings of the 3rd International Symposiumon Image and Signal Processing and Analysis.pp. 543548 (2003).

    [6] Widex Inc.: Manual Tcnico del dispositivoBRAVO B32. (2003).

    [7] Widex Inc.: Manual Tcnico del dispositivoSENSO PLUS SIC. (2004).

    [8] Oppenheim, A.V., Schafer, R.W. and Buck,J.R.: Discrete-time signal processing. (1999).

    [9] Yasu, K., Kobasayi, K., Shinohara, K., Hishi-tani, M., Arai, T. and Murahara, Y.: Frequen-cy compression of critical band for digital hear-ing aids, Proceedingsof China-Japan oint Con-ference on Acoustics. pp. 159162 (2002).

    [10] Paarmann, L.D. y Wynne, M.K.: Bimodal per-ception of spectrum compressed speech, Journalof the Acoustic of America. Vol.95(5) pp. 29752976 (1994).

    [11] Aguilera Muoz, C.M., Nelson, P.B., Rutledge,J.C. and Gago A.: Frequency Lowering process-ing for listeners with sensorineural Hearing loss,IEEE Trans. On Speech and Audio Processing.Vol.34(4) pp. 744754 (1986).

    [12] Qualtiery, T.F. and McAulay, R.J.: SpeechAnalysis/Synthesis based on a Sinusoidal Rep-resentation, IEEE Trans. On Speech and AudioProceeding. Vol.34(4) pp.744754 (1986).

    [13] Chaudari, D.S. and Pandey, P.C.: CriticalBand splitting of speech signal for reducing theeffect of spectral masking in bilateral hearingloss, Proceedings of the 5th International Sym-posium on Signal Proceesing and its Applica-tions. Vol.1 pp. 119122 (1998).

    [14] Yasu, K., Kobasayi, K., Shinohara, K., Koshi,M., Arai, T. and Murahara, Y.: Crtical-Bandcompression method for digital hearing aids,Journal of the Acoustic Society of Japan.Vol.25(1) pp. 6163 (2004).

    [15] Microchip Inc.: dsPIC33FJ32GP302/304,dsPIC33FJ64GPX02/X04,dsPIC33FJ128GPX02/X04 Data Sheet, HighPerformance 16-bit Digital Signal Controllers.(2009).

    [16] Glasberg, B.R., Moore, B.C.J.: Auditory fil-ter shapes in subjects with unilateral and bi-lateral cochlear impairments, JASA. Vol.74(4)pp.11201133 (1986).

    [17] Calupper, J. and Fastl, H.: Simulation of hear-ing impairment based on the Fourier TimeTransform, Proceedings of the IEEE Interna-tional Conference on Acoustics, Speech and Sig-nal Processing. pp. 857860 (2000).

    [18] Huang, X., Acero, A. and Hon, H.W.: SpokenLanguage Processing. A Guide of Theory, Algo-rithm, and System Development. (2001).

    [19] Fletcher, H.: Auditory patterns, Rev. Mod.Phys. pp. 4765 (1940).

    [20] Baer, T., Moore, B.C.J. and Kluk, K.: Ef-fects of low pass filtering on the intelligibility ofspeech in noise for people with and without deadregions at high frequencies, JASA. Vol.112(3)pp. 11331144 (2002).

    [21] Turk, O. and Arlsan, L.M.: Subband basedvoice conversion, Proceedings of ISCLP 2002.pp. 289292 (2002).

    [22] Hackstein, B. and Schwartz, M.: Implemen-tation and Visualization of MP3-Algorithm inMATLAB. (2006)

    [23] Kim, D.W.,Park, Y.C., Kim, W.K., Park, S.J.,Doh, W., Shin, S.W. and Youn, D.H.: Simula-tion of hearing impairment with sensorineuralhearing loss, Proceedings of the 19th Interna-tional Conference IEEE/EMBS. pp. 19861989(1997).

    [24] Slaney, M.: Auditory toolbox, Technical Re-port 010, (1998).

    [25] Terhardt, E.: The SPINC Functionm for scal-ing of frequency in Auditory Models, Journal ofAcoustic. Vol.77 pp.40-42 (1992).

    [26] Simpson, A.P.: Dynamic Consequenses of dif-ferences in male and female vocal tract dimen-sions, JASA. Vol.109(5) pp.21532164 (2001).

    [27] Timms, O.: Speech Processing strategies basedon the sinusoidal speech model for the profound-ly Hearing Impaired, Ph.D. Thesis. (2003).

    [28] Proakis, J.G. and Manolakis, D.G.: Digital Sig-nal Processing: Principles, algorithms and appli-cations. (1996).

    [29] Microchip Inc.: dsPIC30F Family overview,dsPIC High Performance 16-bit Digital SignalControllers. (2004).

    [30] Microchip Inc.: dsPIC30F Math Library.(2004).

    Congreso 2010, Pgina 7

  • Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones

    Copyright c2010. Francisco Denk: El autor delega a la Organizacin del Segundo Congreso Virtual deMicrocontroladores la licencia para reproducir este documento para los fines del Congreso ya sea que esteartculo se publique en el sitio web del congreso, en un CD o en un documento impreso de las ponenciasdel Segundo Congreso Virtual de Microcontroladores.

    Congreso 2010, Pgina 8