dispositivo de asistencia auditiva dspic
DESCRIPTION
Dispositivo de Asistencia Auditiva DsPicTRANSCRIPT
-
Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones
Dispositivo de asistencia auditiva porttil implementado en un
dsPIC
Francisco Denk; Pablo Agero; Alejandro Uriz; Juan Carlos Tulli; Esteban Gonzlez
Facultad de Ingeniera - Universidad Nacional de Mar del Plata
Laboratorio de Comunicaciones
Argentina
Correo-e: franciscodenk,pdaguero,[email protected]; [email protected]
Resumen
Las prdidas de audicin son una dolencia que afecta a un gran porcentaje de la Sociedad. Sibien existen dispositivos que permiten mejorar la calidad de vida de las personas con este tipo dedolencias, estos dispositivos suelen ser costosos y adems muchas veces no se ajustan por completo a losrequerimientos del usuario. Este trabajo se enfoca en el desarrollo de un dispositivo porttil de asistenciaa personas con algn tipo de impedimento auditivo utilizando un dsPIC producido por Microchip. Conel fin de validar los resultados, se utiliza un modelo capaz de simular prdidas de audicin mediante unbanco de filtros polifsicos, lo que permite analizar el desempeo de dos algoritmos de compresin: ellineal y el SPINC. Resultados subjetivos experimentales demuestran las ventajas de la utilizacin de lafuncin SPINC, la cual es implementada en un dispositivo dsPIC33FJ128GP802-E/SP de Microchip,sobre otras como por ejemplo funciones lineales.
1. Introduccin
Las prdidas de audicin son una dolencia queaqueja, segn datos del censo del 2001, a 300.000personas en Argentina. Existen diversos tipos deproblemas, pudiendo clasificarse por su origen en:congnito, debido a envejecimiento debido a untrauma, entre otros. Sin embargo, una forma mstil de clasificarlas es a travs del umbral abso-luto de audicin ATH por sus siglas en inglsel cual es presentado en [1, 2, 3, 4, 5] . La funcinATH representa la energa mnima que debe poseerun tono en un ambiente sin ruido para que puedaser percibido por una persona joven con el odo enbuen estado de salud. De este modo, todas las com-ponentes que estn por debajo de dicho umbral nosern percibidas por el mismo. Se puede clasificaruna deficiencia auditiva en funcin de dicha curva.As, por ejemplo, para un odo con una deficien-cia auditiva grave, la curva presentar un rechazoadicional de al menos 60dB en las frecuencias supe-riores. Otro tipo de dolencias que padece un grannmero de personas es una deficiencia auditivatraumtica donde, a raz de un trauma, el odode la persona deja de responder a un cierto rangode frecuencias. Esto puede deberse a que el individ-uo es expuesto de manera constante a un sonido degran intensidad, como suele ocurrir en ambientes in-dustriales. Esta dolencia se puede representar comoun rechazo de al menos 50dB sobre la curva ATHen un cierto rango de frecuencias.
Para tratar estos y otros tipos de discapacidad
auditiva se han desarrollado un conjunto de tcnicasaplicables a diversos dispositivos que son colocadosen distintas partes del odo, tales como audfonos eimplantes cocleares. Ejemplos de estos dispositivosson ofrecidos por compaas como Widex Sam-sung. Estas ofrecen gran variedad de productos, loscuales van desde audfonos analgicos (que puedenposeer slo un circuito amplificador), hasta equiposdigitales con tecnologa de punta [6, 7]. Estos l-timos, permiten realizar tareas tales como compre-sin de voz, filtrado dinmico de ruido, opciones defuncionamiento configurables y acoplamiento paraconversaciones telefnicas, entre otras.
Otro aspecto que es considerado en estos diseoses la ergonoma, ya que estos productos estn dis-eados para su uso permanente en el cuerpo delusuario. Por ello, las compaas mencionadas tienenen cuenta que el equipo no provoque reacciones alr-gicas a la piel del usuario, que la forma del dispositi-vo no afecte al odo y que el dispositivo sea inmunea la humedad debida a la transpiracin la lluvia.
Una de las principales ventajas de los dispositivosdigitales es que permiten obtener soluciones a lamedida del usuario. En especial, pueden ser usadosen dolencias que estn relacionadas con el envejec-imiento del odo o con la prdida de audicin enun rango de frecuencias en particular. Este tipo decasos pueden ser abordados utilizando tcnicas decompresin de voz, las cuales permiten acondicionarla seal que ingresa al odo del oyente con el fin dellevar el rango de frecuencias donde exista una zonamuerta del odo, como por ejemplo una discapaci-
Congreso 2010, Pgina 1
-
Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones
dad traumtica, hacia zonas donde la informacinpueda ser percibida. La compresin se lleva a cabomediante una funcin que mapea de una maneraadecuada las frecuencias de la zona afectada haciala nueva regin. Debido a ello, pueden encontrarseversiones lineales basadas en la Transformada Rp-ida de Fourier (FFT) [8, 9, 10]; versiones basadasen modelos sinusoidales [11, 12]; e incluso usandoaproximaciones basadas en bancos de filtros [13, 14].Este trabajo apunta a desarrollar un sistema ca-
paz de simular distintos grados de prdidas audi-tivas y perfeccionar tcnicas que logren mitigar di-chos problemas. El objetivo final del mismo consisteen desarrollar un dispositivo que sea capaz de inte-grar las tcnicas utilizadas en un dispositivo DSPporttil, del tipo dsPIC. En particular se utiliza undsPIC33FJ128GP802-E/SP [15]. De este modo, esposible comparar el producto desarrollado con losexistentes, apuntando a mejorar las especificacionesde los mismos y a reducir su costo.El artculo se organiza de la siguiente manera: en
la Seccin 2 se hace referencia a las dolencias a estu-diar. La Seccin 3 presenta los mtodos del estadode la cuestin a desarrollar y se implementa el al-goritmo de compresin utilizado. En la Seccin 4 serealizan experimentos para validar los mtodos im-plementados. En la Seccin 5 se hace un anlisis defactibilidad sobre la implementacin del algoritmodesarrollado en un microcontrolador dsPIC, con elfin de obtener un dispositivo porttil. Por ltimo,en la Seccin 5.1 se desarrollan las conclusiones deltrabajo.
2. Descripcin de las dolencias
a estudiar
En esta seccin se presenta un breve resumen delas dolencias que se van a estudiar a lo largo deltrabajo. Este trabajo est enfocado en resolver do-lencias similares a un envejecimiento del rgano au-ditivo, las cuales se caracterizan por un aumentoen el umbral de audicin y la aparicin de zonasmuertas, especialmente en las frecuencias altas ymedias. Estas representaciones son desarrolladas en[4, 16, 17]. Por este motivo algunos fonemas, en es-pecial los fricativos [18], no puedan ser correcta-mente odos, ya que una parte de su informacin es-pectral ha sido eliminada por la reduccin de la au-dicin del rgano. Como consecuencia de esto, dosfonemas como la /s/ y la /r/ pueden ser percibidosde forma similar, lo que produce un deterioro en lainteligibilidad de los sonidos que percibe el oyente.De los estudios realizados en [19, 20] se desprendela Fig. 1, que muestra la curva de audicin de unodo correspondiente a una persona joven en buenestado de salud.Por otro lado, en la Fig. 2 se representa la curva
ATH para un odo de una persona con una sorderagrave y la Fig. 3 corresponde a la curva ATH deuna persona afectada por una discapacidad audi-
0 1000 2000 3000 4000 5000 6000 7000 800010
0
10
20
30
40
50
60
dB S
PL
Frecuencia [Hz]
Figura 1: Respuesta en frecuencia del odo de unapersona en buenas condiciones de salud auditiva, enun ambiente sin ruido.
tiva traumtica. Como se mencion en el prrafoanterior, los problemas auditivos se deben a que eloyente percibe menos formantes (u otra informa-cin frecuencial) que los necesarios para poder dis-tinguir entre los distintos fonemas entre s. Estudiosprevios indican que slo son necesarios los primerosformantes para poder distinguir entre algunos fone-mas sonoros, no as en los no sonoros (como losfonemas fricativos [18]). Incluso, algunos estudiosdemuestran que la energa se concentra en un al-to porcentaje para fonemas sonoros entre 0 y 1KHzpara una persona con voz grave [10]. A su vez, parafonemas fricativos, dichos formantes se encuentranen frecuencias ms elevadas. Cabe destacar adems,que la informacin necesaria para reconocer al locu-tor se halla ubicada en el rango de frecuencias entrelos 1000Hz y los 2000Hz [21]. En consecuencia, re-sulta factible intentar trasladar estos formantes ha-cia el rango de frecuencia donde el oyente percibael mensaje de una manera correcta. Dicha tarea esrealizada por el sistema de compresin de voz quese presenta en la siguiente seccin.
0 1000 2000 3000 4000 5000 6000 7000 80000
10
20
30
40
50
60
70
dB S
PL
Frecuencia [Hz]
Figura 2: Curva ATH correspondiente a una per-sona afectada por una sordera aguda.
Congreso 2010, Pgina 2
-
Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones
0 1000 2000 3000 4000 5000 6000 7000 800010
0
10
20
30
40
50
60
70
dB S
PL
Frecuencia [Hz]
Figura 3: Curva ATH correspondiente a una per-sona con una deficiencia auditiva de carctertraumtico.
3. Mtodos implementados
Esta seccin se divide en dos partes. En laprimera se introduce un modelo que implementaherramientas capaces de simular las deficiencias au-ditivas planteadas en la Sec. 2. La segunda partese enfoca en la presentacin de un algoritmo queimplementa un mtodo de compresin de voz conel fin de mejorar la inteligibilidad de la seal quepercibe el oyente.
3.1. Modelado de la discapacidad au-
ditiva
Para comenzar es necesario analizar el problemade la prdida auditiva. A travs del estudio de estadeficiencia es posible construir un modelo del odocomo un banco de filtros con diferentes umbralesde audicin [19],[4], [16], [22], [23]. De esta forma,toda aquella seal con potencia inferior al umbralresulta eliminada. Esto nos permite obtener la sealque esta siendo oda por una persona con un ciertogrado de discapacidad. La Fig. 4 presenta el sistemamodelado:Para implementar el modelo, se hace uso de difer-
entes herramientas de modelado psicoacstico quese complementan con estudios realizados por diver-sos cientficos acerca de la forma de la respuestaen frecuencia del sistema auditorio para personas
Figura 4: Esquema del sistema de simulacin de dis-capacidades auditivas propuesto.
con distintos tipos de sordera [24]. Los resulta-dos de este desarrollo nos permiten conocer comopercibe los sonidos una persona con una determi-nada discapacidad auditiva, y de esta manera sepodrn construir herramientas ms efectivas paramejorar la audicin. Este modelo consiste en unarepresentacin las prdidas auditivas mediante unconjunto de filtros pasabanda, diseados con el finde modelar las las caractersticas de un sistema deaudicin con una discapacidad especfica. Un ejem-plo de esto, es modelar el odo mediante un filtropasabajos, el cual atena las componentes de altafrecuencia, de modo de percibir los sonidos de lamisma forma que un odo envejecido, el cual no escapaz de percibir dicha informacin.
3.2. Algoritmo de compresin de voz
Los algoritmos de compresin espectral se basanen escalamientos y traslaciones en frecuencia. Paracada una de las frecuencias de entrada se estableceuna correspondencia con una frecuencia de salida atravs de un factor de escala y un desplazamiento enfrecuencia. Tanto el factor como el desplazamientopueden obedecer a una ley lineal, logartmica, u otrams compleja, con respecto a la frecuencia de entra-da. En la literatura se pueden encontrar diferentesfunciones que relacionan la frecuencia de entradacon la frecuencia de salida [7, 10, 25]. En general,la compresin en las bajas frecuencias es mnimay la compresin en altas frecuencias obedece unaley cercana a la logartmica, lo que se realiza conel fin de no modificar las componentes de ms ba-ja frecuencia (las cuales aportan la mayor parte dela informacin fontica). En este caso se utiliza lafuncin de mapeo frecuencial que responde al arcotangente: la funcin SPINC [25], mediante la cuallas frecuencias de entrada (f) y de salida (f) serelacionan segn la Ec. 1.
(f) = 1414arctg(f/1414Hz) SPINC. (1)
En la Fig. 5 se representa la funcin SPINC juntoa dos variaciones de una funcin de compresin lin-eal. En la misma se aprecia en trazo grueso rayadouna curva de referencia con pendiente unitaria, entrazo continuo grueso la funcin SPINC y con lin-eas rayadas finas con y sin puntos, las funciones decompresin lineal con factores de compresin 1.7 y1.3 respectivamente.Esta funcin presenta diversas ventajas en su
comportamiento tanto en bajas como altas frecuen-cias. Diversos estudios, entre los cuales podemosmencionar el realizado por Simpson [26], indicanque los formantes de ms baja frecuencia, inferioresa 300 Hz, no presentan variaciones significativas en-tre locutores con respecto a lo que ocurre con losformantes de frecuencias superiores. En consecuen-cia, resulta deseable el comportamiento de la fun-cin SPINC, la cual preserva la ubicacin de dichosformantes. Por otro lado, es posible comprimir todo
Congreso 2010, Pgina 3
-
Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones
0 1000 2000 3000 4000 50000
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
FRECUENCIA DE ENTRADA [HZ]
FREC
UENC
IA D
E SA
LIDA
[HZ]
Sin CompresionComp. SPINC Factor 1Comp. Lineal Factor 1.3Comp. Lineal Factor 1.7
Figura 5: Funciones de compresin lineal y SPINC.
el espectro de voz en un ancho de banda de 2200Hz.Mientras que si se utiliza compresin lineal con unfactor de compresin de 1.3, por un lado los for-mantes inferiores se ven desplazados, lo cual afectala inteligibilidad del audio resintetizado y por otro,para transmitir 20KHz se necesita un ancho de ban-da de aproximadamente 15KHz. Esta ventaja delalgoritmo SPINC trae aparejada una prdida de se-lectividad para las altas frecuencias, ya que la fun-cin SPINC comprime por un factor unitario entre0 y 1414Hz y luego comprime el resto del espectroentre 1414Hz y 2,2Khz. Esto no afecta la inteligibil-idad del audio resintetizado, ya que la informacinrelevante para definir esta caracterstica se encuen-tra en los primeros formantes de cada fonema. Estadistorsin se traduce en una leve prdida de identi-dad al procesar una seal de voz. En este trabajo seimplementa el algoritmo de compresin utilizandoel modelo propuesto por Timms et al. [27]. El mismoconsiste en un anlisis solapado de la seal usandola transformada rpida de Fourier (FFT). La com-presin espectral se realiza trasladando los picos fre-cuenciales usando la funcin SPINC. Finalmente, seaplica un filtrado pasabajos y se realiza un espejadodel espectro para recuperar la simetra hermitiana.Este ltimo paso es importante para obtener unaseal puramente real a travs de la transformadainversa de Fourier (IFFT), para la reconstruccinposterior usando el algoritmo de suma solapada. Eneste caso se utilizan los siguientes parmetros:
Filtrado de entrada antialiasing [28] [18].
Transformacin al dominio de la frecuencia us-ando una FFT de 256 puntos. De esta for-ma, se obtiene una resolucin en frecuencia de62.50Hz para una frecuencia de muestreo de16KHz.
Se utilizan segmentos de seal (frames) de 256puntos sin solapamiento.
Se procesa la seal de entrada con el algoritmode compresin SPINC
Transformacin al dominio del tiempo medi-ante una IFFT.
Resintetizado de la seal de audio, se utiliza elmtodo de la suma solapada TD-OLA [18].
De esta forma se obtiene un sistema capaz decomprimir los sonidos de un determinado ran-go donde el oyente presente problemas hacia otrodonde sea capaz de percibirlos. Este sistema tieneuna carga computacional que depende fundamen-talmente de la funcin FFT implementada, espor ello que se busca un compromiso entre esteparmetro, y la resolucin en frecuencia del sistema.
4. Experimentos
Con el fin de cuantificar la mejora introducidapor el mtodo, se realiza una serie de simulacionesutilizando MATLAB, con el propsito de estudiarcomparativamente los algoritmos propuestos, tantoen inteligibilidad como en calidad. Para ello, se uti-liz el modelo presentado en la Sec. 3.2 para proce-sar los audios de 4 locutores. 2 mujeres y 2 hombres.Por otro lado, se utiliza una serie de sonidos que eldiscapacitado debe escuchar en su vida cotidiana(bocinas de autos, advertencias ferroviarias, etc.).El comportamiento del sistema se estudia en unacondicin de sordera simulada mediante un filtropasobajos con una frecuencia de corte de 870Hz. Deeste modo, el sonido sin compresin carece de la in-formacin necesaria para que algunos sonidos seaninteligibles, como es el caso de los fonemas frica-tivos. El experimento consta de un grupo de eval-uadores sin discapacidades auditivas que calificande 1 a 5 en inteligibilidad (5: perfectamente intel-igible, 1: ininteligible) y calidad (5: calidad exce-lente, 1: calidad psima, deteriorada por la manip-ulacin de los datos) una serie de archivos de audiolos cuales corresponden a los siguientes casos:
Filtrado pasabajos, con reconstruccin uti-lizando compresin lineal y factores de com-presin 1,3 y 1,7.
Filtrado pasabajos, con reconstruccin uti-lizando compresin SPINC y factores de com-presin de 1,3 y 1,0.
Inteligibilidad CalidadSPINC, k= 1.0 2.4 2.2SPINC, k= 1.3 2,1 1,9Lineal, k= 1.7 1,7 1,8Lineal, k= 1.3 1,7 1,7
Cuadro 1: Resultados del experimento comparativo.
La Tabla 1 presenta los resultados obtenidos, loscuales muestran una clara ventaja tanto en la in-teligibilidad como en la calidad para el algoritmo
Congreso 2010, Pgina 4
-
Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones
de compresin SPINC por sobre el uso de compre-sin LINEAL. Adems, el SPINC con un factor decompresin unitario es el que presenta mejores re-sultados. Esto se debe a que los restantes algoritmoscomprimen los formantes ms bajos de la seal devoz y por ello resulta distorsionada. Esto hace queen algunos casos la seal oida sea ininteligible.Del mismo modo, para sonidos de advertencia
se observ que sin aplicar compresin era imposi-ble percibirlos. El caso ms relevante fue el de unaseal de advertencia de un paso a nivel ferroviario,la cual se pudo escuchar perfectamente usando com-presin SPINC, mientras que sin compresin o uti-lizando compresin lineal, la advertencia no pudoser percibida.
5. Implementacin en un DSP
Dado que las simulaciones realizadas utilizandoMATLAB y MPLAB arrojaron resultados prom-etedores, se implement el algoritmo utilizando undispositivo dsPIC 33FJ128GP802-E/SP de Mi-crochip [15, 29]. Con el cual es posible implementarprestaciones similares a las que poseen otros dispos-itivos comerciales como BRAVO [6] el SENSO [7],ambos de la empresa WIDEX como control de rui-do, compresin de voz y ecualizacin, entre otras.Otra gran ventaja de estos dispositivos digitales, esque permiten ajustar el equipo a las necesidadesdel oyente con solo reprogramarlo, evitando cali-braciones extensas. Por lo comentado, estos dispos-itivos de asistencia son muy verstiles. Sin embargo,la versatilidad impacta en el costo, ya que para undispositivo como los citados su valor oscila entrelos 1000 y los 5000 Euros. Por otro lado, estos dis-positivos se basan en Procesadores Digitales deSeales (DSP), que por su naturaleza requierencircuitera externa, lo que a la hora de tratar deimplementar uno de ellos se traduce en un aumen-to de las dimensiones del equipo. Por el contrario,el dsPIC propuesto tiene una gran integracin decomponentes, reduciendo as el volumen del equipoa construir. Esto lo hace ideal para la construccindel dispositivo de asistencia.Las caractersticas ms relevantes de este dispos-
itivo son:
128KB de memoria de programa. Lo cuallo hace apropiado para el uso de compiladorescruzados.
16KB de memoria RAM. De los cuales 2KBson utilizados como memoria compartida paraAcceso Directo a Memoria DMA.
Velocidad de procesamiento de 40MHz.
Bajo costo. Su valor es de 4 US$, amplia-mente menor al de un DSP tradicional. Estaes una gran ventaja comparado con los dispos-itivos DSP comerciales.
Bus de datos de 16 bits.
Conversor analgico a digital (ADC) in-tegrado de 12 bits@500ksps.
Conversor digital a analgico (DAC) in-tegrado de 16 bits@100ksps.
Registros de entrada y salida duplicados.Esto permite realizar operaciones de lectura yescritura a mayor velocidad adems otorga unamayor flexibilidad al manejo de los pines deentrada y salida del dsPIC.
Programacin y depuracin en circuito.Es posible calibrar y reprogramar el dispositivosin necesidad de desmontar el dsPIC.
Disponible en encapsulado SOIC de 28pines. Permite lograr grandes niveles de inte-gracin.
Adems, debe tenerse en cuenta que la doc-umentacin acerca de los dispositivos Microchipy sus libreras estn disponible en internetsin costo alguno. Quizs la mayor ventaja deldsPIC33FJ128GP802 es que permite realizar en si-multneo dos tareas, que en este caso resultan serel procesamiento en paralelo de los datos de un seg-mento y la resntesis de la seal de audio correspon-diente al segmento anterior. Esto se realiza utilizan-do el mdulo de DMA del dispositivo [15], el cualtrabaja de forma independiente al procesador prin-cipal. Por este motivo se reduce casi a la mitad eltiempo de procesamiento de cada uno de los seg-mentos, lo cual es un factor crtico a la hora deobtener un dispositivo que funcione en tiempo real.Otro aspecto a tener en cuenta, es que la utilizacinde tcnicas de DMA aumenta el rendimiento del sis-tema, ya que reduce al mnimo las fuentes de inter-rupcin del programa principal. Es decir, los dispos-itivos realizan la transferencia de datos utilizandoel mdulo DMA, y por ello no agrega retardos deejecucin al programa principal. En particular lostiempos que se reducen son:
Tiempo de procesamiento de la rutina de inter-rupcin.
Tiempo de acceso, almacenamiento y lecturade la pila stack del sistema.
Tiempo de acceso a los perifricos.
El algoritmo de compresin de voz implementadoes el descripto en la Sec.3.2. Este dispositivo es posi-ble adaptarlo a cada usuario en particular, con soloafectar el valor del factor de compresin y del de-splazamiento a realizar de acuerdo a las necesidadesdel mismo. A la hora de implementar el algoritmoFFT en el dsPIC se debi optar por una variacinal algoritmo ya que el mismo esta diseado en basea aritmtica de punto flotante, lo cual no es sopor-tado por la arquitectura del dsPIC utilizado. Por
Congreso 2010, Pgina 5
-
Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones
Figura 6: Esquema del dispositivo propuesto.
este motivo, las operaciones de punto flotante de-ban ser emuladas en software, aumentando consid-erablemente los tiempos de procesamiento. Por di-cho motivo se implemento el algoritmo de FFT enaritmtica de punto fijo de 16 bits [30], trabajan-do en base a escalamientos de magnitud. El sistemaobtenido se aprecia en la Fig.6. Y los tiempos in-volucrados en el bloque de procesamiento de datosse aprecian en la Tabla 2
FFT BRO IFFT965s 95s 1ms
Cuadro 2: Tiempos de procesamiento para segmen-tos de 256 muestras.
Se puede apreciar que el tiempo de procesamientodel algoritmo de compresin (BRO) es significativa-mente menor que el de procesamiento de los algorit-mos de FFT y de IFFT. Una vez implementado elsistema, se registraron los tiempos totales de proce-samiento, los cuales se presentan en la Tabla 3.
Proc. Adq. RAM DMA2,06ms 15,72ms 34% 100%
Cuadro 3: Tiempos de procesamiento , adqusiciny usos de memoria para dos implementaciones delalgoritmo de compresin, para 256 muestras
Los valores registrados en la Tabla 3 fueron me-didos utilizando una fsampling = 16,288KHz, y sepresentan por separado los tiempos de procesamien-to y de adquisicin. Esto se debe a que estas tareasse procesan en paralelo, por lo que el tiempo deprocesamiento total del sistema se considera comoel mayor de ambos, que para el caso de segmentosde 256 muestras es de ttotal = 15,72ms. Otro as-pecto a considerar es que si bien los niveles de usode memoria RAM y de programa permanecen ba-jos, aparece una limitacin debida a la cantidadde memoria DMA disponible ,(en este caso es de2KB), la cual impide obtener un desempeo mayoral sistema.
5.1. Conclusiones
A lo largo de este trabajo se desarroll un dis-positivo capaz de realizar compresin de voz parapersonas con diversos grados de deficiencias audi-tivas. Se pudo demostrar que mediante algoritmosms potentes como es el SPINC y dispositivos conmayor capacidad de cmputo es posible implemen-tar un dispositivo similar a los que se encuentranen el mercado. Esto se debe a que por un lado, losexperimentos realizados mostraron una mejora delalgoritmo SPINC frente al de compresin lineal, elcual es utilizado en muchos dispositivos comerciales.Otro aspecto relevante es que el desarrol-
lo se realiz utilizando un dsPIC comercialdsPIC33FJ128GP802/E-SP, para el cual se pudodemostrar que los tiempos de procesamiento sonacordes a una implementacin en tiempo real.La nica limitacin que present este desarrol-
lo fue la cantidad de memoria disponible para uti-lizar con acceso directo (DMA), motivo por el cualen trabajos futuros se utilizar un Microcontroladorque tenga especificaciones superiores al utilizado eneste trabajo. Siguiendo la misma lnea de trabajo,se pretende incorporar mayores prestaciones al dis-positivo de asistencia auditiva.Este Trabajo fue desarrollado en el marco del
Proyecto Desarrollos Tecnolgicos destinados amejorar la calidad de vida de personas con capaci-
dades diferentes de la Facultad de Ingeniera, Uni-versidad Nacional de Mar del Plata.
Referencias
[1] ISO/IEC JTC1/SC29/WG111 MPEGIS13813(1994): Generic Coding of MovingPictures and Associated Audio, (1994).
[2] Painter, T. and Spanias, A.: Perceptual Cod-ing of Digital Audio, Proceedings of the IEEE.Vol.88(4) pp. 451513 (2000).
[3] Vilchur, E.: Signal processing to improve speechintelligibility in perceptive deafness, Journal ofthe Acoustical Society of America. Vol.53(6),pp. 16461657 (1973).
[4] Zwicker, E., Flottorp, G. and Stevens, S. S.,Critical Band Width in Loudness Simmation,
Congreso 2010, Pgina 6
-
Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones
Journal of the Acoustical Society of America.Vol.29(3), pp. 548557 (1957).
[5] Arelhi, R. and Campbell, D.R.: A MATLABSimulink Implementation of Speech MaskingBased on the MPEG Psychoacustic Model I,Proceedings of the 3rd International Symposiumon Image and Signal Processing and Analysis.pp. 543548 (2003).
[6] Widex Inc.: Manual Tcnico del dispositivoBRAVO B32. (2003).
[7] Widex Inc.: Manual Tcnico del dispositivoSENSO PLUS SIC. (2004).
[8] Oppenheim, A.V., Schafer, R.W. and Buck,J.R.: Discrete-time signal processing. (1999).
[9] Yasu, K., Kobasayi, K., Shinohara, K., Hishi-tani, M., Arai, T. and Murahara, Y.: Frequen-cy compression of critical band for digital hear-ing aids, Proceedingsof China-Japan oint Con-ference on Acoustics. pp. 159162 (2002).
[10] Paarmann, L.D. y Wynne, M.K.: Bimodal per-ception of spectrum compressed speech, Journalof the Acoustic of America. Vol.95(5) pp. 29752976 (1994).
[11] Aguilera Muoz, C.M., Nelson, P.B., Rutledge,J.C. and Gago A.: Frequency Lowering process-ing for listeners with sensorineural Hearing loss,IEEE Trans. On Speech and Audio Processing.Vol.34(4) pp. 744754 (1986).
[12] Qualtiery, T.F. and McAulay, R.J.: SpeechAnalysis/Synthesis based on a Sinusoidal Rep-resentation, IEEE Trans. On Speech and AudioProceeding. Vol.34(4) pp.744754 (1986).
[13] Chaudari, D.S. and Pandey, P.C.: CriticalBand splitting of speech signal for reducing theeffect of spectral masking in bilateral hearingloss, Proceedings of the 5th International Sym-posium on Signal Proceesing and its Applica-tions. Vol.1 pp. 119122 (1998).
[14] Yasu, K., Kobasayi, K., Shinohara, K., Koshi,M., Arai, T. and Murahara, Y.: Crtical-Bandcompression method for digital hearing aids,Journal of the Acoustic Society of Japan.Vol.25(1) pp. 6163 (2004).
[15] Microchip Inc.: dsPIC33FJ32GP302/304,dsPIC33FJ64GPX02/X04,dsPIC33FJ128GPX02/X04 Data Sheet, HighPerformance 16-bit Digital Signal Controllers.(2009).
[16] Glasberg, B.R., Moore, B.C.J.: Auditory fil-ter shapes in subjects with unilateral and bi-lateral cochlear impairments, JASA. Vol.74(4)pp.11201133 (1986).
[17] Calupper, J. and Fastl, H.: Simulation of hear-ing impairment based on the Fourier TimeTransform, Proceedings of the IEEE Interna-tional Conference on Acoustics, Speech and Sig-nal Processing. pp. 857860 (2000).
[18] Huang, X., Acero, A. and Hon, H.W.: SpokenLanguage Processing. A Guide of Theory, Algo-rithm, and System Development. (2001).
[19] Fletcher, H.: Auditory patterns, Rev. Mod.Phys. pp. 4765 (1940).
[20] Baer, T., Moore, B.C.J. and Kluk, K.: Ef-fects of low pass filtering on the intelligibility ofspeech in noise for people with and without deadregions at high frequencies, JASA. Vol.112(3)pp. 11331144 (2002).
[21] Turk, O. and Arlsan, L.M.: Subband basedvoice conversion, Proceedings of ISCLP 2002.pp. 289292 (2002).
[22] Hackstein, B. and Schwartz, M.: Implemen-tation and Visualization of MP3-Algorithm inMATLAB. (2006)
[23] Kim, D.W.,Park, Y.C., Kim, W.K., Park, S.J.,Doh, W., Shin, S.W. and Youn, D.H.: Simula-tion of hearing impairment with sensorineuralhearing loss, Proceedings of the 19th Interna-tional Conference IEEE/EMBS. pp. 19861989(1997).
[24] Slaney, M.: Auditory toolbox, Technical Re-port 010, (1998).
[25] Terhardt, E.: The SPINC Functionm for scal-ing of frequency in Auditory Models, Journal ofAcoustic. Vol.77 pp.40-42 (1992).
[26] Simpson, A.P.: Dynamic Consequenses of dif-ferences in male and female vocal tract dimen-sions, JASA. Vol.109(5) pp.21532164 (2001).
[27] Timms, O.: Speech Processing strategies basedon the sinusoidal speech model for the profound-ly Hearing Impaired, Ph.D. Thesis. (2003).
[28] Proakis, J.G. and Manolakis, D.G.: Digital Sig-nal Processing: Principles, algorithms and appli-cations. (1996).
[29] Microchip Inc.: dsPIC30F Family overview,dsPIC High Performance 16-bit Digital SignalControllers. (2004).
[30] Microchip Inc.: dsPIC30F Math Library.(2004).
Congreso 2010, Pgina 7
-
Segundo Congreso Virtual, Microcontroladores y sus Aplicaciones
Copyright c2010. Francisco Denk: El autor delega a la Organizacin del Segundo Congreso Virtual deMicrocontroladores la licencia para reproducir este documento para los fines del Congreso ya sea que esteartculo se publique en el sitio web del congreso, en un CD o en un documento impreso de las ponenciasdel Segundo Congreso Virtual de Microcontroladores.
Congreso 2010, Pgina 8