libro faustino nuÑez batalla

Upload: mary-diaz-jimenez

Post on 15-Jul-2015

577 views

Category:

Documents


0 download

TRANSCRIPT

Estimada Nora Cristina, te mando el libro en formato word con el ruego de que lo uses libremente y lo

ESPECTROGRAFIA CLINICA DE LA VOZAutores: Dr FAUSTINO NUEZ BATALLA Profesor Asociado del rea de Otorrinolaringologa. Universidad de Oviedo. Prof. Dr. CARLOS SUAREZ NIETO Catedrtico de Otorrinolaringologa. Universidad de Oviedo.

divulgues segn tu necesidad haciendo mencin a la siguiente referencia: Nez Batalla F, Surez Nieto C. Espectrografa Clnica de la Voz. Universidad de Oviedo, Servicio de Publicaciones, 1999. ISBN: 9788483171776. Un fuerte abrazo, Faustino Nez Barcelona, Espaa

SERVICIO DE PUBLICACIONES DE LA UNIVERSIDAD DE OVIEDO, 1999.

2011

1

ESPECTROGRAFIA CLINICA DE LA VOZAutores: Dr FAUSTINO NUEZ BATALLA Profesor Asociado del rea de Otorrinolaringologa. Universidad de Oviedo. Prof. Dr. CARLOS SUAREZ NIETO Catedrtico de Otorrinolaringologa. Universidad de Oviedo.

SERVICIO DE PUBLICACIONES DE LA UNIVERSIDAD DE OVIEDO, 1999.

INDICE:

Introduccin. I. Fisiologa vocal. II. Principios de la espectrografa de la voz. III. Clasificacin fisiopatolgica de los trastornos de la voz. IV.Espectrografa de las voces areas. V. Espectrografa de las voces tensas o speras de forma contnua. VI. Espectrografa de las voces tensas o speras con interrupciones intermitentes arrtmicas. VII. Espectrografa de las voces tensas o speras con interrupciones rtmicas y del temblor vocal. VIII. Espectrografa de las voces areas o cuchicheadas de forma intermitente. IX. Espectrografa de las voces de tono bajo. X. Espectrografa de las voces de tono elevado. XI. Espectrogramas de casos clnicos. XII. Bibliografa.

2

INTRODUCCION En los ltimos aos, de la mano del desarrollo de la informtica, han salido al mercado diferentes programas de anlisis de la voz. Estos paquetes por lo comn integran herramientas para poder realizar el anlisis acstico de la voz y la espectrografa. El anlisis acstico se basa principalmente en la cuantificacin de las perturbaciones de la amplitud (Shimmer) y el tono (Jitter) y de la relacin armnico/ruido. El uso de esta herramienta presenta dos problemas: el primero de ellos es que no podemos comparar los resultados obtenidos entre distintos programas debido a que los algoritmos de clculo que emplean suelen ser diferentes, el segundo es que los resultados que se expresan numricamente son difciles de interpretar si no se comparan con una base de datos de voces normales y patolgicas que incluye el programa y que pertenecen a sujetos que hablan otro idioma. Por el contrario, la espectrografa carece de estos dos problemas: Por una parte crea un grfico en el que se representan los armnicos y formantes en el espectro y en el que el ruido aadido por la patologa vocal se observar de forma ntida, sin que tengamos que ayudarnos de bases de datos para su interpretacin, y por otra parte es absolutamente comparable entre los distintos programas disponibles. En nuestra experiencia, creemos de mucha mayor utilidad para la evaluacin de los resultados teraputicos el empleo del espectrograma de banda estrecha que la clasificacin de la voz que hace el programa basndose en su base de datos de voces normales y patolgicas. La espectrografa se ha convertido en una tcnica fcil, barata y potencialmente ms til gracias a la sustitucin de los antiguos mtodos analgicos por los nuevos mtodos basados en la digitalizacin del sonido en ordenadores personales. Esto ha hecho que podamos realizar un anlisis en tiempo real en un entorno metodolgico sencillo, sin embargo, la utilidad clnica descansa principalmente en las modernas bases tericas que correlacionan el producto acstico con el comportamiento fisiolgico, cuyo conocimiento garantiza la correcta interpretacin del espectrograma. En este trabajo se pretende estudiar la utilidad clnica de la espectrografa basndose en la fisiopatologa de las disfonas.

3

I. FISIOLOGIA VOCAL Para entender adecuadamente la espectrografa de la voz, se debe conocer la fisiologa de la produccin vocal al nivel de la glotis. Esta produccin fisiolgica del sonido se relaciona entonces con el grfico del espectrograma que aparece en la pantalla. Si asumimos, para simplificar, que la glotis se abre y cierra como un obturador en un tubo uniformemente circular, cuando se abre y permite el paso del aire a travs de la laringe hacia arriba se produce una presin positiva justo encima de las cuerdas. Esta presin positiva se comunica a la glotis y ayuda a separar lateralmente las cuerdas, este movimiento lateral asistido de la cuerda vocal es equivalente a una transmisin de energa desde el aire a las cuerdas. Cuando las cuerdas se estn cerrando, su tejido se mueve medialmente, no obstante todava sigue pasando aire hacia arriba. Dado que pasa menor cantidad de aire a travs de la glotis, la presin justo por encima de las cuerdas desciende y llega incluso a hacerse negativa debido a que sus molculas se separan ms y ms creando una rarefaccin del medio areo. En efecto, cuando la glotis se cierra, se crea una clara presin negativa por la falta de flujo areo que sale de la laringe, pero el aire contina fluyendo hacia arriba en el tracto vocal. Durante el movimiento medial de las cuerdas, la presin subgltica desciende y se comunica a la glotis. Esta presin negativa (que succiona) ayuda o asiste al movimiento que cierra las cuerdas en su misma direccin y velocidad (Figura 1). El concepto a resaltar es que el movimiento diferido de la masa area en el tracto vocal (debido a su inercia) crea presiones supraglticas que se comunican a la glotis para asistir tanto al movimiento lateral como al medial de las cuerdas vocales. Es importante destacar que las presiones en la glotis son asimtricas dado que son ms positivas durante el movimiento lateral que en el movimiento medial. Los requerimientos bsicos son que la fuerza dinmica sea menos positiva durante el cierre de las cuerdas que durante su apertura y que la fuerza dinmica neta a lo largo del ciclo entero sea suficiente para superar las fuerzas friccionales. La fuerza dinmica producida por las presiones debe ser suficiente para vencer toda la propiedad amortiguadora tisular, de otro modo la vibracin no podra ser mantenida o quiz ni siquiera iniciada. La presin subgltica mnima capaz de iniciar el movimiento vibratorio de las cuerdas vocales se relaciona con varios factores como son el grosor de las cuerdas vocales, friccin de las mismas y velocidad de la onda mucosa. As, unas cuerdas con un grosor adecuado expondrn una mayor superficie de su borde libre a interaccionar con las presiones que acompaan a la columna area, con lo que requerirn una menor presin4

subgltica para comenzar a vibrar que unas cuerdas con un grosor reducido. Una menor friccin o viscosidad de las cuerdas permitir una mayor facilidad de los tejidos en iniciar el movimiento con presiones bajas. La velocidad con que la onda mucosa viaja desde la parte inferior del borde libre de la cuerda al superior se relaciona con una mayor rigidez de la mucosa, situacin que se observa en la fonacin con tonos altos, con lo que la emisin de sonidos con frecuencia fundamental alta se acompaa de presiones subglticas elevadas. El tono vocal es una funcin controlada por la longitud, tensin y amplitud del movimiento de las cuerdas vocales y por la actividad del msculo tiroaritenoideo. Las cuerdas vocales pueden modificar el tono de forma pasiva o de forma activa. De forma pasiva lo consigue al aumentar la tensin por medio de dos factores que producen una elongacin dinmica de las mismas. El primero es la accin de los msculos cricotiroideos, el epitelio que cubre las cuerdas presenta la mayor tensin cuando las mismas se hallan elongadas por su accin, a semejanza de lo que ocurre con una cuerda de un instrumento musical que a mayor tensin ejercida sobre ella producir sonidos ms agudos. El segundo se consigue al incrementar la presin subgltica, las cuerdas alcanzan su mxima separacin con lo que aumenta su tensin. La contraccin del msculo tiroaritenoideo controla de forma activa el tono vocal de forma compleja segn sea la actividad simultnea de los msculos cricotiroideos. La calidad de la voz depende del grado de adduccin de las cuerdas vocales, si es dbil, la voz tendr una calidad espirada, si es exagerado la tendr spera y si es normal ser una voz brillante, al ser armnicamente rica. La intensidad de la voz se incrementa con los incrementos de la presin subgltica, de la frecuencia fundamental y de la velocidad del flujo areo a travs de la glotis. Al doblar la presin subgltica se obtiene un aumento de 10 dB en el nivel de presin sonora de la fonacin. El grado de adduccin vocal tambin afecta a la intensidad, demasiado dbil o demasiado fuerte producen una fonacin inadecuada, en circunstancias normales el grado ptimo de adduccin que maximiza la intensidad resultante es cuando se observa que las apfisis vocales de los aritenoides casi se tocan o lo hacen con suavidad.

5

Figura 1.- Representacin esquemtica y simplificada de la vibracin vocal en un corte frontal de las cuerdas, donde se ven tanto la mucosa como el msculo (Hirano, 1981)

6

II. PRINCIPIOS DE LA ESPECTROGRAFIA DE LA VOZ Analizar la calidad o el timbre de la voz no es fcil. El anlisis propiamente dicho se realiza primero en el odo, en la mayora de los centros fonitricos es lo que ms se utiliza, pero este mtodo es cualitativo y subjetivo, por lo que se presta a errores y su documentacin no es posible ms all de la realizacin de una grabacin de la voz. Por ello es importante disponer de anlisis objetivos que permitan una cuantificacin y una representacin grfica del timbre vocal.

ANALISIS SUBJETIVO DEL TIMBRE VOCAL

Se utilizan calificativos para definir la calidad de la voz tales como ESCAPE, ASPEREZA O TENSION, RONQUERA y VOCAL FRY. A) El trmino escape describe al aire audible durante la fonacin causado por un cierre gltico insuficiente (vibracin asincrnica de las cuerdas, parlisis de una de ellas o por disponerse en parntesis). B) La aspereza o tensin describe a la voz emitida con hipertensin de las cuerdas, acsticamente corresponde a un sonido aperidico en el transcurso del espectro y resulta desagradable al odo. Puede estar causada por problemas neurolgicos, alteracin de la masa o elasticidad de las cuerdas o bien por malos hbitos de la voz como el ataque gltico duro. C) La ronquera se utiliza cuando hay una disfona bien marcada al combinarse los dos componentes antes descritos, se suele ver en cuadros neurolgicos, alteraciones de la masa, configuracin y elasticidad de las cuerdas y en los edemas larngeos. D) El vocal fry describe a un sonido semejante a la fritura, chasquido o crujido, escuchado en la frecuencia ms baja de la voz. En la voz normal se puede escuchar cuando la entonacin decae demasiado al final de las frases. Solamente se considera un problema si aparece de forma frecuente. La etiologa es diversa y con frecuencia desaparece al elevar la altura e intensidad de la voz.

7

ANALISIS OBJETIVO DEL TIMBRE. ESPECTROGRAMA.

La presencia de lesiones en las cuerdas vocales altera la calidad de la voz al impedir un buen cierre gltico y al alterar el equilibrio biomecnico de las cuerdas vocales. La turbulencia area generada por un cierre gltico incompleto se manifiesta en la voz por la aparicin de un ruido blanco, que es ms evidente en la regin de las altas frecuencias, pero que penetra igualmente en la regin de las frecuencias formnticas. El sonido se define como un disturbio causado en el aire. Es una vibracin, entendiendo como tal el movimiento de vaivn de un cuerpo. La fuente de sonido vibra y transmite el sonido al aire que es un medio elstico donde se propaga. En este medio se origina un patrn de compresiones y rarefacciones de las partculas que lo componen. Lo que el humano oye es la respuesta del odo a las vibraciones del medio, pudiendo detectar excursiones de partculas tan pequeas como de 0.0001 cm. Conocido esto, el sonido se describe como una onda o un movimiento ondulatorio. El sonido se mueve como una onda longitudinal, o sea, que las partculas se mueven hacia atrs y hacia delante en el sentido de la propagacin del sonido. Si atamos un lpiz a una de las ramas de un diapasn (Figura 2) y lo hacemos vibrar se registra sobre un papel en movimiento una vibracin sinusoidal. Como el diapasn vibra a una nica frecuencia, el patrn registrado en el papel es un SINUSOIDE.

DIAPASON PAPEL

Figura 2.- Lpiz fijado a una de las ramas de un diapasn. Su vibracin hace que se registre una onda sinusoidal sobre un papel en movimiento.

8

El grfico que se origin se denomina ONDA y es la representacin grfica del sonido en dos dimensiones: AMPLITUD Y TIEMPO (Figura 3). La onda as representada es especialmente importante puesto que el sinusoide es la onda bsica que puede ser usada como una especie de unidad en el anlisis acstico. Esta onda representa un sonido puro, armnicamente simple, pero en la naturaleza es raro encontrar sonidos de estas caractersticas, lo ms frecuente es encontrar sonidos complejos que se forman por la suma de mltiples sonidos simples, incluyendo en esta categora a la voz humana. La espectrografa lo que aporta es la descomposicin de los sonidos complejos en una serie de componentes sinusoidales unitarios. Para ver cmo es posible esto necesitamos examinar algunos hechos relacionados con las ondas sonoras.

A

tiempoFiguras 3 y 4.- Curva de amplitud versus tiempo de un periodo vocal.

PERIODO

Un ciclo completo de la vibracin del diapasn est representado grficamente por la secuencia del movimiento hacia arriba y luego hacia abajo (Figura 4). El tiempo que emplea en completar este ciclo es el denominado PERIODO. El nmero de ciclos que se observan en un segundo de tiempo es la FRECUENCIA:

Si un diapasn vibra a 256 ciclos/seg tiene una frecuencia de 265 Hz. El periodo o duracin de un ciclo es su recproco, P = 1/Hz.

9

La frecuencia se correlaciona estrechamente con el fenmeno perceptivo del tono, el sonido tambin vara en volumen cuya correlacin fsica es la amplitud, a mayor amplitud, mayor volumen. El sonido puede ser representado en el espacio puesto que se propaga de forma longitudinal y cada ciclo cubre una distancia en el espacio. Esta distancia se llama longitud de onda, que viene determinada por el cociente entre la velocidad del sonido y su frecuencia:

L.O. = Vsonido/Frecuencia = m/ciclo

Un sonido con una alta frecuencia tiene una longitud de onda corta y un sonido de baja frecuencia tiene una longitud de onda larga. El sinusoide es la onda elemental bsica para el anlisis acstico puesto que distintos sonidos pueden ser analizados descomponindolos en los sinusoides que los componen de frecuencia, amplitud y fase determinadas. La frecuencia y la amplitud miden la vibracin tanto en nmero como en magnitud, los sonidos de distinta frecuencia pero de la misma amplitud se presentan en la figura 5, los sonidos de distinta amplitud pero igual frecuencia se presentan en la figura 6.

A

t

A Figura 5.- Sonidos de misma amplitud y distinta frecuencia. t

10

A

t

A

Figura 6.- Sonidos de distinta amplitud y misma frecuencia.

t

Una onda compleja es un tono que puede ser descompuesto en dos o ms sinusoides o ARMONICOS. Cada armnico es un sinusoide y los distintos armnicos de una onda compleja estn relacionados entre si como ENTEROS MULTIPLOS. Por ejemplo el tercer armnico de un tono de 100 Hz es 300Hz:

F3 = F0 X 3 ;

F3 = 100 X 3 = 300 Hz

Hasta ahora hemos representado el sonido en un grfico de amplitud versus tiempo que refleja el desplazamiento de una molcula del aire durante la propagacin del sonido. Otro mtodo de representar el sonido es el ESPECTRO que es un grfico de amplitud versus frecuencia. El espectro nos indica la amplitud de cada componente sinusoidal de un sonido complejo. En la figura 7 vemos varias ondas y su espectro. Debemos notar que cada sinusoide solo viene representado por una lnea en el espectro dado que la energa sonora se concentra en una sola frecuencia. Cuantos ms sinusoides se aadan al sonido complejo ms lneas aparecern en el espectro.

11

A

ARMONICO SIMPLE t

A

F

ARMONICO COMPLEJO

A F1 DESCOMPOSICION EN ARMONICOS F2

F3 F1 F2 F3 F4 F

F4

Figura 7.-

La voz humana es un sonido complejo armnicamente rico y sus armnicos se hayan espaciados por intervalos que corresponden a la frecuencia fundamental. Los armnicos son mltiplos enteros de la fundamental, si el primero es de 100 Hz, el segundo es de 200 y el tercero de 300. No todos los sonidos son complejos armnicos, incluso en el habla podemos identificar RUIDOS, o sea, sonidos que no presentan un patrn vibratorio peridico. El ruido tiene una naturaleza ms desordenada y su energa no se concentra en puntos concretos del espectro sino que se extiende a muchas frecuencias distintas. Este espectro (Figura 8) se denomina espectro contnuo.

12

A

F

Figura 8.- Espectro de un ruido friccional. Ejemplo de un espectro continuo.

El sonido se puede representan tanto en forma de onda (amplitud vs tiempo) como en forma de espectro (amplitud vs frecuencia). Las dos representaciones estn matemticamente relacionadas por una operacin denominada la TRANSFORMACION DE FOURIER. El anlisis espectral de Fourier tiene como objetivo bsico convertir un patrn amplitud versus tiempo (onda) en un patrn que muestre la cantidad de energa en los distintos componentes sinusoidales del sonido. As un sonido complejo se puede desintegrar en sus distintos componentes (armnicos) para su estudio. Un ESPECTRO estar formado por la frecuencia en el eje horizontal y la intensidad en el eje vertical. Las vocales son sonidos producidos por la vibracin larngea y por el efecto de filtrado que produce patrones de resonancia particulares a nivel del tracto vocal (faringe, boca y cavidad nasosinusal)(figuras 9 y 9-A). El efecto de filtrado se refiere a la capacidad de transmisin selectiva de frecuencias.

13

A

Primer formante

Segundo formante

F 500 2500

Figura 9.- Curva de resonancia del tracto vocal para la /i/

a i iG L G

aL

uG

uL

aeG

aeL

Figura 9-A.- Distintas configuraciones del tracto vocal. G = glotis. L = Labios.

Para producir el HABLA, a las vocales se aaden ruidos como las consonantes fricativas producidas por un estrechamiento en el tracto vocal donde se forma una turbulencia que da lugar al ruido que las caracteriza, como las consonantes nasales que necesitan de la energa de la voz como las vocales pero difieren de ellas en que la energa sonora se filtra tanto en la boca como en la cavidad nasal. La produccin de las vocales se explica mediante la teora de la FUENTE-FILTRO que dice que la energa resultante (tambin llamada seal radiada del habla) es el producto

14

de la energa de la fuente (laringe) y del resonador o filtro (tracto vocal). Cuando las cuerdas vocales vibran se produce un espectro con una frecuencia fundamental que puede variar y unos armnicos que son mltiplos enteros de la misma. Los cambios en la F0 y en la intensidad no afectan al resonador, esta relativa independencia de la fuente y el filtro nos permite producir una habla inteligible con una gran variedad de fuentes de energa que pueden incluir vocales agudas o graves, susurro, etc. El espectro larngeo presenta una serie de armnicos cuya energa o amplitud declina cuanto ms agudo es el armnico en unos 12 dB por octava (12 dB cada vez que se doblan los Hz), el espectro se representa en la figura 10.

A

F

Figura 10.- Espectro a nivel de la laringe. Se produce una prdida de 12 dB por cada octava que aumenta la frecuencia.

Una vez producido el sonido en la laringe, viaja a lo largo del tracto vocal donde sufrir un filtrado. El espectro glotal se combina con la curva de resonancia correspondiente al gesto articulatorio para emitir una vocal concreta dando lugar a mximos relativos de intensidad en determinados armnicos, reas que se denominan FORMANTES. El tracto vocal presenta puntos de resonancia a lo largo del mismo que se denominan FORMANTES y que van a modificar la energa sonora de la fuente gltica. Existe un nmero infinito de formantes pero los ms importantes son los tres o cuatro primeros. Los valores de los formantes no son rgidos y pueden variar de locutor a locutor con ciertos lmites. El rango de variacin del primer formante es el ms limitado por el

15

riesgo de deteriorar la inteligibilidad del habla. Las frecuencias de los dos primeros formantes determinan la identidad de la mayor parte de las vocales. La frecuencia de los formantes que le siguen y la frecuencia fundamental son ms bien caractersticas del locutor, mientras que la frecuencia formntica no se aparte ms del 10% de los valores correctos no se alterar la inteligibilidad de la palabra. Cada formante se describe por dos caractersticas, la frecuencia formntica o frecuencia central y el ancho de banda que es la medida de distribucin de la energa alrededor de la frecuencia formntica (Figura 11).

A

S dB

ANCHO DE BANDA f1 fn

FFRECUENCIA FORMANTICA

Figura 11.- Curva de resonancia que modifica el espectro segn su forma, creando un mximo relativo de intensidad o formante. El ancho de banda se refiere a las frecuencias que se amplifican (S dB). Frecuancias Graves = f1. Frecuencias Agudas = fn. Las frecuencias que estn fuera del ancho de banda se les reduce su amplitud.

El conjunto de formantes constituyen la FUNCION DE TRANSFERENCIA del tracto vocal que modifica la seal larngea para dar como resultado la RADIACION CARACTERISTICA que no es ms que la vocal segn la omos (Figura 12).

16

AESPECTRO A NIVEL DE LA GLOTIS

A

(FUNCION DE TRANSFERENCIA) CURVA DE RESONANCIA

F

F1

F2

F

A

F1 F2

Figura 12.- Efecto de la curva de resonancia particular del tracto vocal sobre el espectro formado a nivel de la glotis, dando lugar a la radiacin caracterstica, o vocal que se oye a nivel de los labios. Cada vocal tiene su propia curva de resonancia. F

RADIACION CARACTERISTICA (VOCAL)

Cada vocal se caracteriza por sus formantes, cuya posicin en el espectro y su ancho de banda distingue una vocal de las dems. Por tanto, para modificar la estructura formntica del tracto vocal se debe modificar la forma del mismo, adaptndose a lo que se quiera pronunciar. Por ejemplo, la configuracin del tracto vocal para pronunciar la /i/ consiste en una estrechez cerca de los labios y un ensanchamiento cerca de la laringe. En la figura 9 A se representa esquemticamente las configuraciones del tracto vocal en las distintas vocales, que aportan sus formantes para filtrar la energa sonora gltica. El anlisis acstico de la voz por medio de la espectrografa permite delinear las concentraciones de energa del habla. Al estar definida la vibracin sonora por tres dimensiones: Amplitud, frecuencia y tiempo, puede representarse grficamente como si fuera un objeto real en un espacio de tres dimensiones.

17

AZ Z Y Z Y

X X

Y

X

Amplitud frecuencia f3 f2 f1

A

B

A ESPECTROGRAMA

f SONOGRAMA f3 f2 f1

OSCILOGRAMA

t tiempo f1

f2

f3

f

t

Figura 13.- A.-Representacin tridimensional de un objeto. B.- Representacin tridimensional (A, f y t) de un sonido peridico complejo, que da lugar a tres mtodos grficos de documentarlo. (Modificado de Bonavida, 1996).

En la figura 13 A y B (Bonavida, 1996) se representan tres sinusoides que representan la vibracin de tres diapasones al mismo tiempo dando lugar a un sonido complejo formado por tres armnicos. La frecuencia ms baja es considerada como el armnico fundamental (frecuencia fundamental) y las otras dos el segundo y el tercer armnicos. Segn el plano de proyeccin se obtendrn del mismo objeto tres formas distintas de representacin bidimensional: A) OSCILOGRAMA (Wave form).- El plano de proyeccin es el AMPLITUD versus TIEMPO. La altura en cada instante de cada punto en la figura proyectada es la suma de las elongaciones de cada una de las tres sinusoides que la componen en este mismo instante (no la superposicin). Esto da lugar a una forma de onda peridica modificada de forma, pero con el mismo periodo que la frecuencia fundamental. El periodo puede apreciarse por la separacin temporal de los mximos. Esta grfica permite observar, por ejemplo, en el caso de una vocal el periodo glotal y por tanto el tono o pitch (frecuencia de la vibracin glotal) y la amplitud de la seal (valor mximo), entre otras caractersticas. B) ESPECTROGRAMA (Power spectrum).- El plano de proyeccin es el de AMPLITUD versus FRECUENCIA. Las tres sinusoides proyectadas sobre este plano aparecen como un conjunto de tres rayas verticales con sus correspondientes amplitudes en su correcta posicin y equidistantes en la escala de frecuencias. Una

18

vez elegido el instante de la proyeccin, el espectro de rayas obtenido corresponde solamente a la seal promediada, que est incluida dentro de un entorno de tiempo alrededor de ese instante, no de todo el tiempo transcurrido. Por tanto, el espectrograma solo tiene sentido para intervalos reducidos de tiempo o ventanas de anlisis de la seal. Esto explica el porqu en seales peridicas de rgimen estacionario como es una vocal sostenida puede elegirse cualquier ventana de tiempo para el anlisis sin alteracin del espectro de la seal. El espectrograma se puede comparar a una fotografa tomada con flash. Este tipo de representacin permite una visin solo dentro de un corto espacio de tiempo del nmero y paridad de los armnicos, del perfil espectral y, por tanto, del nmero y posicin de las zonas del espectro de mayor amplitud de los armnicos, zonas que definen a los formantes. C) SONOGRAMA (Sound Spectrogram).- El plano de proyeccin es el de FRECUENCIA versus TIEMPO. Las tres sinusoides representativas de la frecuencia fundamental y del segundo y tercer armnico al ser proyectadas sobre este plano se convierten en lneas paralelas al eje de tiempos. La intensidad de negro de cada raya en el presente ejemplo es mayor al principio porque las senoides son de mayor amplitud y se va debilitando a medida que la sinusoide proyectada se va amortiguando en el transcurso del tiempo. La figura de las tres rayas paralelas es el sonograma y cada una de ellas representa un armnico que mantiene la frecuencia a lo largo del tiempo. Si las frecuencias fueran variables en el transcurso del tiempo se perdera el paralelismo respecto al eje de tiempos. El timbre como caracterstica diferencial de una fuente de seal es un concepto muy complejo que se puede simplificar por el carcter invariable de sus sonogramas puesto que depende principalmente del contenido armnico de la seal y de su perfil espectral y dinmico. La intensidad (en negro de cada lnea) en cada instante depende del promedio de la amplitud de la sinusoide proyectada dentro de un pequeo intervalo de tiempo en el entorno del instante del anlisis. Se ha convenido representar en los sonogramas las lneas con mayor densidad de negro cuando la amplitud del armnico que les corresponde es mayor. El sonograma es la representacin ms completa de cualquier tipo de vibracin, permite explorar el contenido espectral de una seal en cada intervalo de tiempo y la presencia y evolucin temporal de las zonas de los formantes. Si el espectrograma se puede comparar a una fotografa con flash, el sonograma se puede comparar a una grabacin con vdeo. El sonograma19

puede definirse como un espectrograma evolutivo en el tiempo, en las figuras 14 y 15 se representan los espectrogramas y sus correspondientes sonogramas a nivel de la glotis y tras producirse la funcin de transferencia del tracto vocal.

20

A

A

SONIDO GRAVE

SONIDO AGUDO

F ESPECTROGRAMAS A NIVEL DE LA GLOTIS F1000

F

F

1000

500

500

100 100

SONOGRAMAS A NIVEL DE LA GLOTIS

Figura 14.- Espectrograma y sonograma a nivel de la glotis. No existen formantes hasta no pasar por los rganos resonadores del tracto vocal (funcin de transferencia).

A F1

SONIDO GRAVE

A

F1

SONIDO AGUDO F2

F2

F CURVAS DE RESONANCIA PARTICULARES F1000

F

F F2

1000

F2

500

500

F1100 100

F1

SONOGRAMAS A NIVEL DE LOS LABIOS

Figura 15.- Espectrograma y sonograma a nivel de la glotis. Existen formantes tras exponerse por los rganos resonadores del tracto vocal (funcin de transferencia). La intensidad de negro en el sonograma ha cambiado, la mxima se sita a nivel de los formantes.

Los sonogramas o espectrogramas (tiende a usarse el trmino espectrograma) utilizan el filtrado de la seal sonora mediante filtros de diferente anchura de banda. Un filtro de una determinada banda permite tan solo el paso de frecuencias para las que est diseado, eliminando las frecuencias que estn por encima y por debajo de los lmites21

que posee. Los lmites superior e inferior al de un filtro se definen por aquellas frecuencias donde la atenuacin es de aproximadamente -3dB comparados con el centro de la banda. Los filtros con un paso de banda estrecha (45 Hz) permiten la discriminacin de frecuencias muy prximas, pero su respuesta es lenta. Los filtros de banda ancha (300 Hz) son rpidos, su resolucin en el tiempo es buena, aunque su resolucin frecuencial es pobre. Tendremos siempre una mejor resolucin frecuencial si usamos los de banda estrecha (permite ver cada uno de los armnicos) o una mejor resolucin temporal si usamos los de banda ancha (permite ver la evolucin de los formantes). En este trabajo se estudiar el sonograma (sound spectrogram) y utilizar el trmino espectrograma, por ser el ms extendido, para referirnos a l (representacin frecuencia versus tiempo de la voz). En el trazado del espectrograma se debe tener en cuenta que en el eje de las X se encuentra representado todo el espectro, desde 0 a 5000 Hz y en el eje de las Y se encuentra representado el tiempo, por lo comn, desde 0 a 3 segundos. En un espectrograma de banda estrecha se observarn unas lneas horizontales paralelas al eje de las Y, separadas siempre por una distancia constante e igual a la frecuencia fundamental de la voz (que es la primera lnea que observamos), por ello todas las dems lneas o armnicos sern mltiplos de la primera. Se ha convenido en representar la intensidad que acompaa a cada armnico como la intensidad en negro de su trazado, as, las lneas con una intensidad de negro ms fuerte son las que portan mayor intensidad. Entre un armnico y otro debe existir un vaco de trazado o espacio en blanco, el ruido aadido a la vibracin armnica se detecta por un trazado anrquico y difuminado, tanto ms intenso cuanto ms negro sea su dibujo. En este grfico seremos capaces de identificar la frecuencia fundamental de la voz, la situacin aproximada de los formantes, el ruido aadido a la voz y la existencia de segmentos no fonados en la muestra (Figura 16). En un espectrograma de banda ancha se observan con mayor precisin los formantes y no es posible ver los armnicos que los componen. Los formantes son unas barras horizontales que se relacionan con la forma y el tamao de las cavidades de resonancia del tracto vocal. Estas barras pueden cambiar de posicin durante el habla segn sea producida cada vocal. Una estructura formntica clara y adecuada se relaciona con un buen sistema resonador, con la ausencia de escape areo y con la periodicidad normal del movimiento de las cuerdas vocales. La periodicidad de la fonacin, o la regularidad22

con la que se abren y cierran las cuerdas en los sucesivos ciclos se puede valorar por la existencia de unas estriaciones verticales en el espectrograma. La regularidad en estas estriaciones se relaciona con la sincrona con la que se produce la apertura y cierre peridico de las cuerdas. Tambin se pueden detectar ciertas caractersticas del tono con el que se fona por la mayor proximidad entre dichas estriaciones en los tonos agudos y la mayor separacin en los tonos graves, se dice que cada una de estas estriaciones verticales coincide con cada pulso gltico (Figura 17).

Figura 16.

23

Figura 17

24

III. CLASIFICACION FISIOPATOLOGICA DE LOS TRASTORNOS DE LA VOZ.

La calidad de una voz es la percepcin de la complejidad fsica del tono larngeo modificado por las cavidades de resonancia. La definicin de normalidad es dificil de establecer dado que la variedad de las voces es infinita. Ms adecuado es definir cuando nos encontramos ante un trastorno de la fonacin. Se puede afirmar que existe un trastorno de la voz cuando la calidad, tono, intensidad o flexibilidad difiere significativamente de las voces de otros de similar edad, sexo y cultura. La primera herramienta de la que dispone el clnico para evaluar una voz anormal es su sistema de percepcin auditiva. Aaronson observ que los trastornos vocales se pueden agrupar en ocho categoras distintas basndose nicamente en la percepcin de la voz. Cada una de ellas se relaciona con un probable comportamiento fisiopatolgico distinto de la laringe y puede servir como base para sospechar las distintas etiologas que pueden generar las alteraciones vocales concretas. Este modelo prctico de clasificacin de las disfonas se basa en el hecho de que stas tienden a agruparse espontneamente en categoras perceptualmente distintas (Voice clusters). Dichas categoras son una abstraccin o prototipo en el cual se pueden incluir las voces de similar calidad acstica. A cada categora corresponde un mecanismo fisiopatolgico concreto, que es el responsable de la calidad vocal, aunque sea generado por muy distintas causas. As, cuando omos una voz area o cuchicheada, sabemos que el comportamiento fisiopatolgico de la laringe que lo crea es una insuficiente adduccin de las cuerdas vocales. La causa anatmica o funcional especfica que la genera puede ser muy variada, desde una parlisis vagal alta hasta un simple plipo o unos ndulos vocales. La ventaja de categorizar el sonido en un grupo concreto es la de organizar nuestro pensamiento lgico acerca de su causa, permitiendonos construir un diagnstico diferencial. Existen ocho categoras distintas: 1. Voces areas o cuchicheadas de forma contnua. 2. Voces tensas o speras de forma contnua. 3. Voces tensas o speras con interrupciones arrtmicas. 4. Voces tensas o speras con interrupciones rtmicas. 5. Temblor vocal. 6. Voces areas o cuchicheadas de forma intermitente. 7. Voces de tono bajo.25

8. Voces de tono elevado. 1. Voces areas o cuchicheadas de forma contnua. El comportamiento fisiopatolgico que subyace en esta categora es el cierre gltico incompleto o ineficaz. La causa ms frecuente de un cierre gltico incompleto es la existencia de una masa en la superficie de una o ambas cuerdas vocales que impide su completo contacto en la lnea media. Las lesiones ms comunes son los ndulos vocales, los plipos y los carcinomas. Si no se comprueba la existencia de una masa en las cuerdas vocales, la siguiente causa en frecuencia es una enfermedad neurolgica que afecte al nervio vago (X par). Una laringoscopia indirecta es suficiente para descartar ambas posibilidades, y si es as se tendr que pensar en una enfermedad de la unin mioneuronal como la miastenia gravis, un parkinsonismo temprano o bien lesiones cerebrales que puedan crear una apraxia de fonacin o una enfermedad de lbulo frontal. Descartadas todas las causas orgnicas expuestas se puede pensar en la existencia de un origen psicgeno de esta disfona. 2. Voces tensas o speras de forma contnua. El mecanismo fisiopatolgico comn en esta categora es la hiperadduccin completa y contnua de las cuerdas vocales. Este comportamiento larngeo se puede observar en los casos en los que una masa impide el cierre completo de las cuerdas, el sujeto es consciente de la ineficacia de su voz y genera un gran esfuerzo vocal en forma de hiperadduccin como mecanismo compensador. Es frecuente escuchar una voz area al nivel conversacional que con el canto o el grito desaparece. Otras causas de hiperaduccin vocal hay que buscarlas en enfermedades neurolgicas como la parlisis pseudobulbar o la esclerosis lateral amiotrfica, en la que domine la espasticidad sobre la flacidez al nivel de la laringe. Si se demuestra que no existe una causa orgnica, nuevamente tendremos que pensar en un origen psicgeno de esta disfona. 3. Voces tensas o speras con interrupciones arrtmicas. En esta categora se agrupan aquellas voces cuyo mecanismo fisiopatolgico comn consiste en una hiperadduccin intermitente y arrtmica de las cuerdas vocales. Las dos causas que destacan en este grupo son las distonas como la disfona espstica adductora de origen neurolgico y la corea. En caso de no poder demostrar ninguna de las mismas, se tendr que pensar en una disfona espstica adductora de origen psicgeno.

26

4. Voces tensas o speras con interrupciones rtmicas. La diferencia con la anterior categora es que las interrupciones se suceden con un patrn bien definido por la existencia de repetidas hiperadducciones vocales regulares en el tiempo. Los ejemplos ms caractersticos son el temblor heredofamiliar benigno o temblor esencial y la ms infrecuente mioclonia velofaringolarngea. 5. Temblor vocal. Se observa una adduccin-abduccin parcial y rtmica de las cuerdas vocales. La causa ms frecuente es el estado de ansiedad. En cuanto a las causas orgnicas que la pueden producir estn el sndrome cerebeloso y el temblor esencial de intensidad moderada. La fisiopatologa de estas voces comprende la existencia de fluctuaciones rtmicas en la contraccin de los msculos torcicos espiratorios y de los msculos larngeos. 6. Voces areas o cuchicheadas de forma intermitente. El mecanismo que las crea es una hiperabduccin intermitente de las cuerdas vocales. Las causas orgnicas se centran en el temblor esencial en el que predomine la abduccin vocal, lo que se denomina una disfona espstica abductora neurolgica. 7. Voces de tono bajo. El mecanismo comn es una reduccin de la frecuencia fundamental de la vibracin vocal. Entre las causas orgnicas se pueden encontrar las de origen traumtico (lceras de contacto, hiperplasia epitelial) o bien endocrinolgicas (hipotiroidismo, virilizacin o acromegalia). Las causas

psicgenas son derivadas de una estrs crnico o por un tono de voz bajo electivo. 8. Voces de tono alto. Existe un aumento en la frecuencia fundamental de la vibracin vocal. Las causas orgnicas son la existencia de una laringe anormalmente pequea en casos de trastornos endocrinolgicos en el sexo masculino o la existencia de una sinequia congnita o adquirida en la comisura anterior de la laringe, que acorta la porcin vibrtil de las cuerdas, y por tanto, elevan su frecuencia fundamental. Entre las causas psicgenas se encuentran la puberofona, como cuadro destacado.

27

IV. ESPECTROGRAFIA DE LAS VOCES AEREAS . En este tipo de disfonas se crea un flujo areo turbulento debido al cierre gltico incompleto durante el ciclo vocal o por un comportamiento vibratorio irregular. Se crean dos perturbaciones en la seal acstica: la primera consiste en la aparicin de componentes de ruido (seal no peridica o de espectro contnuo) relacionados a dicho flujo areo turbulento y la segunda es una prdida de los armnicos de alta frecuencia debido a que la fase de cierre gltico del ciclo vocal se encuentra acortada o es incompleta. Segn Yanagihara, las caractersticas acsticas de la disfona se determinan por las interacciones entre tres factores: 1. Componentes de ruido en el formante principal de cada vocal. 2. Componentes de ruido de alta frecuencia encima de los 3 kHz. 3. Prdida de componentes armnicos de alta frecuencia. Con la progresin de la severidad de la disfona, estos tres parmetros se hacen ms prominentes de una forma gradual, con lo que es posible generar una clasificacin en cuatro grados de severidad de una disfona basndose en los trazados de un espectrograma de banda estrecha: Grado I. Los componentes armnicos se mezclan con componentes de ruido principalmente en la regin de los formantes de las vocales. Figura 18. Clip 66 Grado II. Los componentes de ruido predominan sobre los armnicos del segundo formante. Adems existen ligeros componentes de ruido de alta frecuencia por encima de los 3 kHz. Figura 19. Clip 67 Grado III. El segundo formante se reemplaza en su totalidad por ruido. El componente de ruido de alta frecuencia intensifica su energa y expande su rango. Figura 20. Clip 68 Grado IV. El primer formante pierde sus componentes peridicos y se observan componentes de ruido. En las altas frecuencias se intensifica an ms el ruido. Figura 21. Clip 69 Esta clasificacin es de utilidad en la clnica por dos motivos principales: Por permitir expresar numricamente una cualidad multidimiensional de la voz, tradicionalmente difcil de calificar de otra manera y porque el grado acstico objetivo de la disfona se ha visto que se relaciona con la gravedad subjetiva que se percibe al oido.

28

Figura 18 Disfona tipo I de Yanagihara

Figura 19. Disfona tipo II de Yanagihara.

29

Figura 20. Disfona tipo III de Yanagihara.

Figura 21. Disfona tipo IV de Yanagihara.

30

V. ESPECTROGRAFIA DE LAS VOCES TENSAS O ASPERAS DE FORMA CONTINUA. Mientras que en la voz espirada predomina la presencia de un flujo areo turbulento generado por un insuficiente cierre gltico, en la voz spera predominan las irregularidades en la vibracin vocal causadas por un desequilibrio en la masa o tensin entre ambas cuerdas. Omori et al. Describieron la presencia de una anormalidad acstica diferente que afecta principalmente a los casos de disfona generada por plipos o edema de Reinke. Esta anormalidad acstica est representada en el sonograma por trazados diferenciados de pequea magnitud que se sitan entre dos armnicos consecutivos en el sonograma de banda estrecha que se denominan subarmnicos. Se considera que se hallan presentes cuando se observa la existencia de trazados horizontales diferenciados entre dos armnicos mltiplos de la frecuencia fundamental, definida como el primer trazado que aparece en el espectro. Para saber que dichos trazados no son mltiplos de la frecuencia fundamental se obtiene su valor en Hz mediante el cursor de pantalla que nos permite conocer el punto del espectro en que nos encontramos. Pueden ocupar la totalidad de la muestra (Figura 22, no clip) o bien estar presentes en puntos concretos de la misma, que coinciden con breves fragmentos de voz cualitativamente distintos del resto, en forma de voz spera (Figura 23, no clip). Los parmetros ms extendidos para el anlisis de la disfona son las medidas de las perturbaciones en la frecuencia y en la amplitud de la voz, a las que se viene denominando Jitter y Shimmer, respectivamente, que reflejan la extensin de los ciclos vibratorios errticos que genera la patologa vocal. Por otra parte, tambin se puede medir el grado de ruido turbulento que produce una glotis incompletamente cerrada por una lesin que se interponga entre las cuerdas en su cierre, lo que se denomina NNE (energa de ruido normalizada) o razn armnico/ruido. No obstante, el estudio de la voz quedara incompleto si no se realiza un espectrograma o un sonograma de la misma, de hecho, Omori encuentra que se puede hallar una voz con caractersticas psicoacsticas que corresponden a una voz spera con los parmetros arriba mencionados normales y con la presencia de alteraciones objetivas en el espectrograma en forma de subarmnicos, que pueden explicar tales caractersticas psicoacsticas en algunas voces. La base fsica de este fenmeno acstico hay que buscarla en la asimetra de las caractersticas mecnicas de las cuerdas vocales como resultado de una patologa de las mismas. La insuficiencia del cierre gltico unida a un desequilibrio de la tensin de las31

cuerdas causa un patrn vibratorio complejo dicrtico o tricrtico. Los patrones vibratorios en estas condiciones son muy inestables y sensibles a la presin subgltica. La voz generada es spera en calidad o en ocasiones puede sonar diplofnica. En nuestra experiencia encontramos tambin, como lo hizo con anterioridad Omori, casos de disfona que presentaban los parmetros jitter, shimmer o incluso el NNE normales y sin embargo presentaban subarmnicos en el espectrograma. La observacin ms importante que queremos resaltar es la presencia de subarmnicos en los casos de disfona ventricular y las disfonias hiperfuncionales que presentan otra fisiopatologa distinta a la de las lesiones tipo masa que se interponen entre las cuerdas. Este tipo de alteraciones de la voz est determinada por una hipercontraccin de los msculos adductores de la laringe con cierres exageradamente firmes de la glotis y con participacin de las estructuras supraglticas en los fenmenos vibratorios que generan sonido vocal. En estos casos, a nuestro juicio, ms que crearse una distorsin de las caractersticas mecnicas y vibratorias de las cuerdas vocales, lo que se crea es un punto de vibracin adicional al de las cuerdas vocales verdaderas en la supraglotis, en concreto en las bandas ventriculares. Este punto de vibracin suma su sonido al generado en las cuerdas vocales con lo que se detectan dos patrones de armnicos, que en el caso del generado por las bandas interpretamos como subarmnicos. El caso ms llamativo, y que se reproduce en la figura 24 (Clip 611) es el de un prolapso de ventrculo, en el que observamos dos subarmnicos cuya frecuencia es el tercio de la fundamental. Las caractersticas psicoacsticas de esta muestra fueron catalogadas como las de una franca diplofona. Por medio del estroboscopio se pudo comprobar la hiptesis de que se crea un punto vibratorio adicional en el tracto vocal al ver el patrn vibratorio de las cuerdas vocales y adems una vibracin peridica del prolapso del tercio anterior del ventrculo izquierdo con la banda contralateral. Este fenmeno fue publicado por primera vez en relacin con la estroboscopia de un caso de disfona plicae ventricularis o disfona ventricular en el que se observ una onda mucosa que viajaba en la superficie de las bandas. De esta observacin pudimos concluir que la presencia de subarmnicos en el espectro puede relacionarse tambin con el establecimiento, por parte de la alteracin vocal de que se trate, de un punto de vibracin adicional al de las cuerdas vocales en la supraglotis, lo que puede ser considerado como la objetivacin del fenmeno psicoacstico de la diplofona (Figura 25). Clip 610

32

Figura 22.

Figura 23.33

Figura 24.

Figura 25.

34

VI. ESPECTROGRAFIA DE LAS VOCES TENSAS O ASPERAS CON INTERRUPCIONES INTERMITENTES ARRITMICAS.

Lo primero que llama la atencin es el hecho de que su presencia no es constante en toda la muestra en la mayora de los casos, sino que est determinada por fragmentos de voz cualitativamente distintos del resto, que perceptivamente corresponden a las roturas de voz o a fragmentos de fonacin especialmente esforzados, el caso ms caracterstico es el de una disfona espstica adductora en la que los subarmnicos se encuentran en las fases del espasmo vocal (Figura 26, Clip 613), aunque tambin se pueden encontrar trazados que detectan los espasmos sin que tengan que existir subarmnicos necesariamente (Figuras 27 Clip 614).

Figura 26.

35

Figura 27.

36

VII. ESPECTROGRAFIA DE LAS VOCES TENSAS O ASPERAS CON INTERRUPCIONES RITMICAS Y DEL TEMBLOR VOCAL.

Se presentan en conjunto estos dos tipos de voces por presentar similares caractersticas espectrogrficas. El temblor vocal consiste en una fluctuacin de la intensidad y tono de la fonacin de forma regular (figura 28) que en su forma ms severa pueden causar roturas de voz con descenso sbito del tono o interrupciones bruscas en la produccin vocal, que se corresponden con una disfona espstica, tanto adductora como abductora. En estos pacientes se ha observado la existencia de un movimiento irregular y entrecortado de los msculos intercostales interno y externo que muy probablemente es el responsable de las fluctuaciones en intensidad y en tono. Las interrupciones en la fonacin se han atribuido a la existencia de cierres espasmdicos de la glotis, pero tambin puede ser cierto que ocurra el fenmeno opuesto, una sbita distensin de las cuerdas vocales.

Figura 28. Temblor esencial

37

VIII. VOCES AEREAS O CUCHICHEADAS DE FORMA INTERMITENTE Este tipo de voces es poco frecuente, se originan por la existencia de espasmos que producen una hiperabduccin sbita de las cuerdas, con lo que se genera un flujo de aire turbulento intermitente coincidiendo con dicha separacin de las cuerdas. En estas voces se escucha una calidad area intermitente y en el trazado del espectrograma se observar una prdida de armnicos en los segmentos no fonados y una ausencia de armnicos en las altas frecuencias, fruto de la falta de aproximacin de las cuerdas (Figura 29, clip 217). Existe una propensin a ocurrir con mayor intensidad durante la produccin de consonantes, especialmente si se encuentran al inicio de una palabra. Los procesos que generan este tipo de voces son de dos tipos. El primero se observa en el seno de un temblor heredofamiliar benigno en el que domine la fase de separacin de las cuerdas sobre la de la aproximacin, se dice entonces que estamos ante una disfona espstica abductora del temblor esencial. El segundo proceso es el que se observa en las reacciones de conversin que causan espasmos en abduccin de las cuerdas, o lo que es lo mismo, una disfona espstica abductora de causa psicgena.

Figura 29.

38

IX. ESPECTROGRAFIA DE LAS VOCES DE TONO BAJO. En el sexo masculino es tolerable socialmente el tener una voz ms grave de lo normal y puede no constituir un problema para el paciente. Sin embargo, en el sexo femenino puede causar un serio problema. El proceso que ms frecuentemente hace que la voz femenina pierda su caracterstico tono agudo es el edema de Reinke. Su base fisiopatolgica consiste en el aumento de la masa de las cuerdas vocales, suficiente motivo para impedir fonaciones con tonos agudos, a ello se puede aadir, segn la severidad o la forma que adquiera el borde libre de las cuerdas vocales un flujo areo turbulento y el ruido que ello conlleva. Por tanto, en el espectrograma de estos trastornos observaremos que: 1. Los armnicos se encuentran ms prximos unos de otros por el descenso en la frecuencia fundamental. 2. Existe ruido aadido o sustituyendo a los armnicos que sigue la disposicin segn los grados de severidad de Yanagihara. En la figura 30 se representa una voz severamente afectada por el descenso en la frecuencia fundamental y por una gran cantidad de ruido que sustituye por completo a los armnicos del segundo formante. 3. Tambin se pueden presentar subarmnicos en el trazado de forma contnua o intermitente, segn sea el grado de hiperadduccin que el individuo ejerza para compensar su percepcin de falta de eficacia de su fonacin (Figura 31 clip 218).

39

Figura 30.

40

Figura 31.

X. ESPECTROGRAFIA DE LAS VOCES CON TONO ELEVADO. En esta categora se agrupan las voces que presentan una tonalidad inadecuadamente aguda como resultado de defectos anatmicos en la laringe o por causas psicgenas. Son trastornos de baja incidencia y son ms problemticos cuando afectan al sexo masculino. En el espectrograma observaremos nicamente una mayor separacin entre los armnicos, fruto de la elevada frecuencia fundamental, aunque se pueden asociar componentes de ruido como en las sinequias de comisura anterior, en las que la frecuencia fundamental aumenta por efecto del acortamiento que se produce en la porcin vibrtil de las cuerdas y el ruido o la ausencia de armnicos de alta frecuencia que aparece por defectos de cierre gltico, frecuentemente observados en este trastorno (Figura 32, clip 219).

41

Figura 32.

42

XI. ESPECTROGRAMAS DE CASOS CLINICOS.

1. Alteraciones funcionales y neurolgicas. 1.1. Enfermedad de Parkinson. Esta enfermedad se origina por una lesin en la substantia nigra en los ganglios de la base que libera la inhibicin de la motoneurona, lo que causa rigidez y lentitud de los movimientos. La disfona parkinsoniana consiste en una voz de reducida intensidad y monotonal, con calidad area y en ocasiones temblorosa. La monotona de la voz se origina de la rigidez y del reducido movimiento de los msculos larngeos intrnsecos y extrnsecos. Se puede considerar como un signo temprano de parkinsonismo una voz poco intensa y monotonal, aunque estn an ausentes los signos disrtricos que se suelen aadir. En la figura 33 (clip cmpfa) se representa el trazado del espectrograma de un paciente con sndrome de Parkinson

avanzado, en el que podemos observar una ausencia total de armnicos (solo se observa el primero) que estn sustitudos por ruido y un tiempo mximo de fonacin muy reducido.

43

Figura 33.

1.2. Disfona espstica adductora. En este ejemplo se muestra la efectividad del tratamiento con inyeccin de toxina botulnica en estos casos. En el espectrograma de la figura 34 (clip 21803a) se observa la existencia de claros espasmos adductores de forma intermitente que originan fluctuaciones del tono. Una vez efectuado el tratamiento con toxina botulnica inyectada en el msculo tiroaritenoideo mediante un fibroscopio, se obtiene el espectrograma de la figura 35 (clip 21803c), en el que se constata la reduccin en intensidad y frecuencia de los espasmos, representados por las fluctuaciones en el tono.

44

Figura 34.

45

Figura 35.

1.3. Hiperfuncin vocal. Una de las manifestaciones ms frecuentes de la hiperfuncin vocal, en el contexto de un aumento de la tensin musculoesqueltica de los estados de stress crnico, es la disfona ventricular, fonacin con bandas o Disfona Plicae Ventricularis. Es un trastorno de origen psicgeno en la mayor parte de los casos, aunque tambin se observa como mecanismo de compensacin de una insuficiencia del cierre gltico. En el espectrograma que se muestra en la figura 36 (clip 21045a) se puede observar la existencia de una diplofona (por los trazados subarmnicos) y un tono muy bajo, corresponde a un varn con disfona ventricular por hiperfuncin larngea.

46

Figura 36.

.

1.4. Hipofuncin vocal. En este trastorno se observa una escasa fuerza de adduccin de las cuerdas vocales, que en algn caso pueden aparecer arqueadas, dejando incluso un ojal gltico fusiforme. Este signo puede ser reflejo de la existencia de enfermedades neurolgicas, neuromusculares o de enfermedades psicgenas como la depresin. En el espectrograma de la figura 37 (clip 533954a) se observa que los armnicos de alta frecuencia estn ausentes, fruto de una dbil adduccin de las cuerdas vocales. Llama la atencin el hecho de que no exista ruido en este caso, que en otro ms severo si que estara presente.

47

Figura 37.

48

1.5.Parlisis del X par craneal. Las parlisis vagales altas daan al nervio antes de su divisin en los nervios farngeo, larngeo superior y recurrente. De esta forma todos los msculos inervados por esas ramas se paralizarn. Los msculos afectos, por tanto, sern de tres tipos: 1. Los inervados por la rama farngea, elevador del velo del paladar y los constrictores farngeos. 2. Parlisis del msculo cricofarngeo. 3. Parlisis del resto de los msculos intrnsecos de la laringe del mismo lado. Las cuerdas vocales se paralizan y se fijan en la posicin de abduccin de forma uni o bilateral. El velo del paladar en reposo o durante la fonacin se situar en una posicin ms baja que en el lado sano. En la fonacin el lado sano se elevar traccionando de la vula y la lnea media hacia el lado normal. En lesiones bilaterales el paladar blando se situar en una posicin ms baja de lo normal y en fonacin no se elevar o lo har mnimamente. Se crear una severa disfona espirada o cuchicheada por la gran cantidad de aire que se pierde al nivel de la glotis insuficientemente cerrada y en ocasiones se oir un flutter o vibracin al prolongar las vocales. Existirn una intensidad y tono reducidos as como roturas del tono en falsetto. En los casos bilaterales la voz ser virtualmente cuchicheada por el mayor ojal gltico que se crea. En el caso que se representa en la figura 38 (clip868888a) se observa una ausencia de armnicos casi total, los que se observan son escasos, en la regin de frecuencias bajas del espectro y se acompaan por una gran cantidad de ruido por el aire que se escapa, as mismo, el tiempo mximo de fonacin no supera los 1.5 segundos. En estos casos se puede corregir la insuficiencia gltica mediante una laringoplastia de medializacin o tiroplastia I de Isshiki, en la figura 39 (clip868888c) se expone el espectrograma realizado 24 horas despus de dicha intervencin en el que se observa cmo aparecen los armnicos y el tiempo mximo de fonacin se alarga hasta la normalidad, se aprecia an ruido en el espectro.

49

Figura 38.

50

Figura 39.1.6. Lesiones extracraneales del nervio recurrente sin afectar a los nervios farngeo ni larngeo superior. Se paralizan todos los msculos intrnsecos de la laringe a excepcin del cricotiroideo. Las cuerdas vocales se paralizan y quedan fijas en la posicin paramediana uni o bilateral. La causa de que no se paralicen en la posicin de abduccin, como en los casos anteriores, es que el msculo cricotiroideo mantiene su capacidad de estirar la cuerda anteroposteriormente, lo que acta como un adductor, llevando la cuerda a una posicin ms cercana a la lnea media. En las lesiones bilaterales las cuerdas estn fijas en una posicin tan cercana a la lnea media que hacen que la fonacin sea virtualmente normal (Figura 40-clip 22610a). La parlisis de los abductores impiden que la glotis se ensanche durante la inspiracin dando lugar a un estridor inspiratorio y compromiso de la va area, que en muchas ocasiones obliga a realizar una traqueotoma. En los casos unilaterales se observa una moderada disfona espirada con una intensidad reducida, diplofona y roturas en falsetto. Como signos asociados se encuentran una tos dbil, un ataque gltico ausente y una va area marginal. Las causas que originan estas lesiones son las lesiones traumticas de la ciruga, neoplasias, enfermedad vascular, infeccin, enfermedades metablicas e idiopticas. En la figura 41 (clip 00909a) se51

representa una parlisis recurrencial unilateral reciente, en la que observamos ausencia de armnicos y sustitucin por ruido del segundo formante. Una vez realizada la rehabilitacin logopdica se observa cmo en la figura 42 (clip 00909b) el espectrograma es casi normal, con una riqueza de armnicos aceptable y sin ruido significativo.

Figura 40.

52

Figura 41.

Figura 42.

53

2. Alteraciones anatmicas de la glotis. El objetivo de la fonociruga es la restauracin de la anatoma de la glotis para recuperar las caractersticas que definen a una voz normal: una intensidad adecuada, un tono apropiado y una calidad o timbre agradable. De ellas, la ms frecuentemente alterada en la patologa vocal es la ltima, por lo que el mejor o peor resultado de una intervencin vendr dado por las modificaciones de la misma. Llama la atencin que este parmetro no sea cuantificado ni registrado previamente a las intervenciones de fonociruga que se llevan a cabo por muchos otorrinolaringlogos, justo en una poca en la que la medicina tiende a objetivar los resultados de los procedimientos teraputicos de forma generalizada con fines investigadores, de control de calidad o mdico-legales. La mayora de las intervenciones de fonociruga tienen por objeto restaurar una glotis incompetente que sufre una prdida de aire entre las cuerdas para lograr el mejor contacto posible entre ellas con el fin de conseguir una mayor riqueza de armnicos y una ausencia de ruido en el espectro. Las distintas lesiones tipo masa generan una disfona area o espirada muy similar, que no permite distinguir la causa concreta que las produce. De igual manera, el espectrograma tampoco nos permitir aventurar la causa concreta de la disfona, por lo que este hecho nos sirve para resaltar que el estudio del espectro de una voz no puede sustituir al examen laringoscpico ni estroboscpico de la laringe. En las figuras 43 a 46 (clips 17447a, 575312a, 19292) podemos ver el espectrograma de distintas lesiones de las cuerdas vocales, independientemente del grado de afectacin de Yanagihara al que pertenezcan se puede observar lo que tienen en comn: La prdida de armnicos y la sustitucin de los mismos por ruido.

54

Figura 43. Carcinoma de Cuerda vocal derecha.

Figura 44. Tuberculosis larngea .

55

Figura 45. Sulcus vocalis. .

56

Figura 46. Carcinoma de cuerda vocal derecha.

57

Si para el diagnstico exacto de la causa de la disfona el espectrograma se muestra ineficaz, para documentar y estudiar los resultados de los tratamientos (quirrgicos o n) es una herramienta de primer orden. En las figuras 47 a 54 (47:18757a, 48:18757c, 49: 20405a, 50: 20405b, 51: 20972a, 52: 20972b, 53: 22957a, 54: 22957b) se presentan casos clnicos de distintas patologas antes y despus de los distintos tratamientos, existe una recuperacin en la riqueza de los armnicos, y el ruido se atena.

Figura 47. Disfona infantil (ndulos).

58

Figura 48. Disfona infantil tras logopedia.

Figura 49. Quiste submucoso. Preoperatorio.

59

Figura 50. Quiste submucoso. Postoperatorio.

Figura 51. Edema de Reinke. Preoperatorio.

.

60

Figura 51. Edema de Reinke. Preoperatorio.

Figura 52. Edema de Reinke. Postoperatorio.

.

Figura 53. Edema de Reinke.

61

Figura 54. Edema de Reinke. Tras dejar de fumar.

Pero el espectrograma en fonociruga no solo sirve para documentar las modificaciones de la fonacin con respecto al tratamiento, sino que tambin nos sirve para control de calidad de los procedimientos teraputicos aplicados. Un problema serio es el estudio de la disfona postoperatoria en la que tenemos que averiguar con exactitud el estado funcional tras la ciruga. Era frecuente observar en el pasado disfonas tras la ciruga del edema de Reinke en la que se practicaba una decorticacin de las cuerdas vocales, estas aparecan en el postoperatorio lisas, rectilneas y sin edema, pero la funcin era catastrfica. Se achacaba a una causa funcional el fracaso. En la actualidad se sabe que un principio bsico de la fonociruga es evitar la cicatrizacin por segunda intenci n del borde libre de las cuerdas para evitar fibrosis de las mismas, desaparicin del espacio de Reinke y abolicin de la onda mucosa, generadora de la riqueza armnica de la voz. En las figuras 55 y 56 (clips 841303a y 404994a) se muestran dos ejemplos de disfona postoperatoria. Se observa que los armnicos estn ausentes y la fonacin se limita al ruido que se amplifica en las cavidades de resonancia. La solucin de este problema es una de los frentes ms activos en la investigacin en fonociruga.

62

Figura 55. Disfona postoperatoria. Cicatriz vocal.

Figura 56. Fibrosis de ambas cuerdas vocales.

63

XII. BIBLIOGRAFIA. -Aaronson A.E. Clinical Voice Disorders: An Interdisciplinary Approach. Third Edition. Thieme Inc., New York. 1990. -Kent R.D. The Speech Sciences. Singular Publishing Group, Inc. San Diego. 1997. -Orlikoff R.F., Baken R.J. Clinical Speech and Voice Measurement. Singular Publishing Group, Inc. San Diego. 1993. -Garca-Tapia Urrutia R, Cobeta Marco I. Diagnstico y Tratamiento de los Trastornos de la Voz. Ponencia Oficial del XVI Congreso Nacional de la Sociedad Espaola de Otorrinolaringologa y Patologa Crvico-Facial. Editorial Garsi, S.A. Madrid. 1996. -Dworkin JP, Meleca RJ. Vocal Pathologies. Diagnosis, Treatment, and Case Studies. Singular Publishing Group, Inc. San Diego. 1997. -Ford C.N, Bless D.M. Phonosurgery. Assessment and Surgical Management of Voice Disorders. Raven Press. New York. 1991. -Kent R.D, Read C. The Acoustic Analysis of Speech. Singular Publishing Group, Inc. San Diego. 1992. -Menaldi J. La voz Normal. Editorial Mdica Panamericana. Buenos Aires. 1992. -Fujimura O, Hirano M. Vocal Fold Physiology. Voice Quality Control. Singular Publishing Group, Inc. San Diego. 1995. -Hirano M, Bless D.M. Videostroboscopic Examination of the Larynx. Singular Publishing Group, Inc. San Diego. 1993. -Casiano RR, et al. Efficacy of videostroboscopy in the diagnosis of voice disorders. Otolaryngol Head Neck Surg 1992; 107: 95. -Gould W. J. The clinical voice laboratory. Clinical application of voice reseach. Ann Otol Rhinol Laryngol 1984; 93: 346. -Harries M. L. Morrison M. The role of stroboscopy in the management of a patient with a unilateral vocal fold paralysis. The Journal of Laryngology and Otology 1996; 110: 141. -Shohet J.A, Courey M.S, Scott M.A, Ossoff R.H. Value of videostroboscopic parameters in differentiating true vocal fold cysts from polyps. Laryngoscope 1996; 106: 19. -Sercarz J.A, et al. Videostroboscopy of human vocal fold paralysis. Ann Otol Rhinol Laringol 1992; 101: 567. -Alberti P.W. The diagnostic role of laryngeal stroboscopy. Otolaryngol Clin North Am 1978; 11: 347. -Woo P. Clinical applications of videostroboscopy in voice disorders. Current Opinion in Otolaryngology & Head and Neck Surgery 1997; 5: 133. -Woo P. Quantification of videostroboscopic findings- Measurement of the normal glottal cycle. Laryngoscope 1996; 106 (Suppl 79). -Yanagihara N. Significance of Harmonic Changes and Noise Components in Hoarseness. Journal of Speech and Hearing Research 1967; 10: 531-541. -Omori K, Kojima H, Fujita S, Nonomura M. Maximum entropy spectral analysis of hoarse voice. Jpn J Logop Phoniatr 1991; 32: 255-260. -Omori K, Kojima H, Kakani R, Slavit DH, Blaugrund SM. Acoustic Characteristics of Rough Voice: Subharmonics. J Voice 1997; 11: 40-47. -Hirano M, Kakita Y, Matsusshita H. Correlation between parameters related to vocal cord vibration and acoustical parameters in voice disorders. Practical Otolaryngology (Kyoto) 1977; 70: 393-403. -Tanabe M. Effect of asymmetrical tension on the voice and vibratory pattern of the vocal cords. Practica Otologica (Kyoto) 1976; 69: 67-88.

64

-Wong D, Ito MR, Cox NB, Titze IR. Observation of perturbations in a lumped-element model of the vocal folds with application to some pathological cases. J Acoust Soc Am 1991; 89: 383-394. -Nasri S, Jasleen J, Gerratt BR, Sercarz JA, Wenokur R, Berke G. Ventricular Dysphonia: A Case of False Vocal Fold Mucosal Traveling Wave. American Journal of otolaryngology 1996; 17: 427-431. -Nez Batalla F, Surez Nieto C, Moro Meln M, Manrique Estrada C, Maseda Alvarez E, Carreo Villarreal M. Evaluacin Objetiva de la Patologa Vocal en la Infancia. Acta Otorrinolaringolgica Espaola. (En prensa). -Nez Batalla F, Surez Nieto C, Muoz Pinto C, Baragao Rio L, Alvarez Zapico MJ. Estudio sonogrfico de la disfona: Subarmnicos. Acta Otorrinolaringolgica Espaola. (En prensa). -Nez Batalla Faustino, Surez Nieto Carlos, Maldonado Fernndez Miguel, Baragao Rio Luca, Muoz Pinto Cristina. Aplicacin del espectrograma de banda estrecha en fonociruga. Acta Otorrinolaringolgica Espaola. (En prensa). -F. Nez, C. Surez. Manual de evaluacin y diagnstico de la Voz. Servicio de Publicaciones de la Universidad de Oviedo. 1998. ISBN: 84-8317-088-4.

65