energía sonora por fuera del rango audible - … · actas de eccom. vol. 2 nº 1, “la...

9
Actas de ECCoM. Vol. 2 Nº 1, “La Experiencia Musical: Cuerpo, Tiempo y Sonido en el Escenario de Nuestra Mente. 12º ECCoM”. Isabel C. Martínez, Alejandro Pereira Ghiena, Mónica Valles y Matías Tanco (Editores). Buenos Aires: SACCoM. pp. 208-215 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom Registro de instrumentos musicales en alta resolución Energía sonora por fuera del rango audible Jorge Petrosino e Ianina Canalis Universidad Nacional de Lanús Resumen Según el conocimiento establecido en los libros de percepción y acústica, el límite máximo en frecuencia que el ser humano es capaz de percibir es cercano a los 20 kHz. El análisis espectral de los distintos instrumentos musicales se realiza en dicho rango de frecuencias, asumiendo de forma implícita que allí se concentra la totalidad de su energía sonora. En las últimas décadas se han publicado diversos trabajos que sugieren que en determinadas condiciones es posible percibir frecuencias superiores a los 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Por otra parte la existencia de formatos digitales de alta resolución de audio permite el registro de sonidos superando ampliamente dicho umbral. A pesar de estos resultados es difícil hallar trabajos con información sobre componentes de frecuencia de instrumentos musicales que exceden el rango audible tradicional. En este trabajo se presentan mediciones espectrales realizadas entre 20 Hz y 40 kHz de diferentes instrumentos musicales, enfocándonos en el análisis de aquellos que son utilizados en nuestra región. Nuestros resultados confirman la existencia de niveles significativos de energía en la zona de altas frecuencias. Resumo De acordo com o conhecimento estabelecido nos livros relacionados à percepção e acústica, a frequência máxima que os seres humanos podem perceber é perto de 20 kHz. As medidas de análise espectral dos diferentes instrumentos musicais são feitas nessa faixa de freqüências, implicitamente assumindo que toda a energia do som é concentrada lá. Nas últimas décadas, vários estudos sugerindo que, sob certas condições, é possível perceber frequências acima de 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Além disso, os formatos digitais alta resolução permitem a gravação de sons amplamente ultrapassando esse limiar. Apesar destes resultados, é difícil encontrar informações sobre os componentes de instrumentos musicais que vão além da área tradicional de distribuição de freqüências audíveis. Neste estudo medidas espectrais entre 20 Hz e 40 kHz de diferentes instrumentos musicais são apresentados. Enfatizando a análise daqueles que são usados em nossa região. Nossos resultados confirmam a existência de níveis significativos de energia nas altas freqüências. Abstract According to the established knowledge in books about perception and acoustics, the maximum frequency that humans can perceive is close to 20 kHz. The spectral analysis of musical instruments is made in this range, implicitly assuming that their entire sound energy is concentrated in those frequencies. In recent decades, several studies have been published suggesting that under certain conditions it is possible to perceive frequencies above 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Moreover, the existence of high-resolution digital audio formats allow recording of sounds surpassing this threshold. Despite these results, it is difficult to find information on the frequency components of musical instruments that exceed the traditional audible range. In this paper we present spectral measurements of different musical instruments between 20 Hz and 40 kHz, focusing on the analysis of those instruments that are widely used in our region. Our results confirm the existence of significant levels of energy in the high frequencies.

Upload: hadan

Post on 03-Oct-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Actas de ECCoM. Vol. 2 Nº 1, “La Experiencia Musical: Cuerpo, Tiempo y Sonido en el Escenario de Nuestra Mente. 12º ECCoM”. Isabel C. Martínez, Alejandro Pereira Ghiena, Mónica Valles y Matías Tanco (Editores). Buenos Aires: SACCoM. pp. 208-215 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom

Registro de instrumentos musicales en alta resolución

Energía sonora por fuera del rango audible

Jorge Petrosino e Ianina Canalis

Universidad Nacional de Lanús

Resumen Según el conocimiento establecido en los libros de percepción y acústica, el límite máximo en frecuencia que el ser humano es capaz de percibir es cercano a los 20 kHz. El análisis espectral de los distintos instrumentos musicales se realiza en dicho rango de frecuencias, asumiendo de forma implícita que allí se concentra la totalidad de su energía sonora. En las últimas décadas se han publicado diversos trabajos que sugieren que en determinadas condiciones es posible percibir frecuencias superiores a los 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Por otra parte la existencia de formatos digitales de alta resolución de audio permite el registro de sonidos superando ampliamente dicho umbral. A pesar de estos resultados es difícil hallar trabajos con información sobre componentes de frecuencia de instrumentos musicales que exceden el rango audible tradicional. En este trabajo se presentan mediciones espectrales realizadas entre 20 Hz y 40 kHz de diferentes instrumentos musicales, enfocándonos en el análisis de aquellos que son utilizados en nuestra región. Nuestros resultados confirman la existencia de niveles significativos de energía en la zona de altas frecuencias.

Resumo De acordo com o conhecimento estabelecido nos livros relacionados à percepção e acústica, a frequência máxima que os seres humanos podem perceber é perto de 20 kHz. As medidas de análise espectral dos diferentes instrumentos musicais são feitas nessa faixa de freqüências, implicitamente assumindo que toda a energia do som é concentrada lá. Nas últimas décadas, vários estudos sugerindo que, sob certas condições, é possível perceber frequências acima de 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Além disso, os

formatos digitais alta resolução permitem a gravação de sons amplamente ultrapassando esse limiar. Apesar destes resultados, é difícil encontrar informações sobre os componentes de instrumentos musicais que vão além da área tradicional de distribuição de freqüências audíveis. Neste estudo medidas espectrais entre 20 Hz e 40 kHz de diferentes instrumentos musicais são apresentados. Enfatizando a análise daqueles que são usados em nossa região. Nossos resultados confirmam a existência de níveis significativos de energia nas altas freqüências.

Abstract According to the established knowledge in books about perception and acoustics, the maximum frequency that humans can perceive is close to 20 kHz. The spectral analysis of musical instruments is made in this range, implicitly assuming that their entire sound energy is concentrated in those frequencies. In recent decades, several studies have been published suggesting that under certain conditions it is possible to perceive frequencies above 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Moreover, the existence of high-resolution digital audio formats allow recording of sounds surpassing this threshold. Despite these results, it is difficult to find information on the frequency components of musical instruments that exceed the traditional audible range. In this paper we present spectral measurements of different musical instruments between 20 Hz and 40 kHz, focusing on the analysis of those instruments that are widely used in our region. Our results confirm the existence of significant levels of energy in the high frequencies.

Petrosino y Canalis p. 208 | 2015 | ISSN 2346-8874

Fundamentación

Los estudios sobre el análisis espectral de

instrumentos musicales que se encuentran

disponibles en libros y artículos académicos

cubren el rango de frecuencias que alcanza los

20 kHz. Prácticamente no hay datos dispo-

nibles sobre las características de los compo-

nentes de frecuencia que superen dicho

umbral. La única información que hemos

hallado al respecto ha sido generada por James

Boyk (1997) en un artículo con un sugestivo

título que afirma que existe vida por encima de

los 20 kHz. Boyk sostiene que en cada familia

de instrumentos musicales existe al menos un

miembro que produce energía hasta los 40 kHz

o más.

Resulta posible comprender esta falta de inte-

rés basándose en dos cuestiones principales.

Una referida a los límites de percepción respec-

to de esas altas frecuencias y la otra a las

características técnicas de la mayoría de los

sistemas de registro y reproducción del sonido

generado por los instrumentos musicales.

En las últimas décadas han sido publicados

algunos estudios que vuelven a poner en

cuestión los límites máximos de frecuencias

audibles.

Por una parte, se han llevado a cabo

experimentos utilizando tonos puros que

sugieren que es posible percibir frecuencias de

hasta 25 kHz con intensidades del orden de los

110 dB SPL (Ashihara, 2007; Canalis y

Petrosino, 2014).

En forma complementaria, los trabajos de

Oohashi (2000) y Nishiguchi (2007) sugieren

que las componentes ultrasónicas de determi-

nados sonidos compuestos pueden provocar

efectos perceptivos dando lugar a cierta acti-

vidad en la corteza cerebral diferente a la que

se produce cuando dichos componentes se

encuentran ausentes. Tanto Oohashi como

Nishiguchi han afirmado en sus trabajos que

ciertas personas que no son capaces de

percibir tonos puros de frecuencias elevadas

por encima del umbral de audición pueden sin

embargo detectar las diferencias al comparar la

presencia o ausencia de componentes ultra-

sónicos cuando estos están asociados a otros

componentes que se encuentran dentro del

rango audible.

Oohashi utilizó en sus primeros estudios

grabaciones de alta resolución de música

game-lán, argumentando que esa clase de

instrumentos musicales contienen una impor-

tante proporción de energía de alta frecuencia.

En dichos estudios publica diagramas espec-

trales de este tipo de instrumentos.

La posibilidad de distinguir entre registros de

sonido con frecuencias de muestreo elevadas

(Super Audio CD o DVD-Audio) comparadas

con muestreos de 48 kHz fue estudiada por

Meyer y Moran (2007). Sus conclusiones sugie-

ren que no es posible detectar entre la

reproducción de una muestra en 24 bits y 96

kHz y una versión de la misma muestra en 18

bits y 48 kHz. Sin embargo, el equipamiento

reportado en sus pruebas no permitía repro-

ducir frecuencias por encima del rango audible,

por lo que sus conclusiones no resultan nece-

sariamente incompatibles con los trabajos de

Oohashi.

Teniendo en cuenta la ausencia de información

completa y accesible sobre la energía sonora

en el rango ultrasónico de diferentes instru-

mentos musicales, los indicios de que en cier-

tos casos podrían percibirse componentes que

superan el rango audible tradiciones, sumado a

la disponibilidad actual de sistemas de registro

y reproducción del sonido en alta resolución

otorga sentido y fundamento a la realización de

un análisis comparativo de distintos instru-

mentos, incorporando algunos de uso típico en

nuestra región.

Objetivos

1. Obtener información que permita comparar

los espectros de emisión sonora de distintos

instrumentos musicales en un rango que se

extieenda hasta los 40 kHz, incluyendo

instrumentos de amplio uso en nuestra

región sobre los que no se poseen registros

espectrales ampliados

2. Determinar para cada instrumento analizado

la proporción de energía por encima de 20

kHz, comparada con el nivel de energía

sonora total.

Método

Registro de los instrumentos

seleccionados

Se realizaron registros de sonidos de charango,

bandoneón, acordeón, violín, saxo, piano,

bombo legüero y platillo. Las grabaciones fue-

p. 209 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom

ron realizadas con una placa de audio externa

con capacidad de registrar sonidos de hasta 45

kHz, teniendo especial cuidado en verificar que

esta capacidad incluyera todas las etapas

analógicas previas a la digitalización de las

muestras. La captura del sonido fue realizada

con un micrófono de medición Earthworks M-30

cuya respuesta es prácticamente plana hasta

los 30 kHz, llegando hasta los 40 kHz con una

caída de 3 dB.

En todos los casos se procedió al registro de

varios minutos con el micrófono ubicado a una

distancia de un metro del instrumento. Los

registros digitales se realizaron con una

frecuencia de muestreo de 96 kHz y una reso-

lución de 24 bits.

Cada grabación fue posteriormente analizada

utilizando software de edición de audio que

permitiese observar el espectro de las

grabaciones para detectar aquellos fragmentos

que pudieran tener mayor energía en alta

frecuencia. Se seleccionaron una o dos

muestras breves (menores a un segundo de

duración) de cada instrumento para la

comparación de espectros.

Análisis espectral

Con el fin de obtener resultados comparables a

las mediciones realizadas por Boyk (1997) se

decidió que las representaciones espectrales

fueran realizadas sobre secciones de 30

milisegundos, seleccionando para cada muestra

tres secciones consecutivas. En los instru-

mentos con un ataque impulsivo la primera de

estas secciones comienza con el ataque.

Los diagramas espectrales fueron obtenidos

con el analizador de espectro del software de

edición seleccionando la zona de interés

(secciones de 30 ms), utilizando una FFT de

1024 puntos y ventana de Blackman-Harris. La

Figura 1 corresponde al análisis espectral de

una muestra de sonido del charango.

Comparación de niveles de energía de

las secciones

Para obtener información sobre el nivel de

energía sonora total y poder comparalo con el

que corresponde solo a las altas frecuencias se

procesaron las muestras mediante el software

OCTAVE. Se utilizó una versión de cada

muestra conteniendo todas las frecuencias

(variable muestrasonora en el código de

OCTAVE), y se generó una nueva muestra

aplicando un filtro pasa altos con frecuencia de

corte de 24 kHz (variable muestrafiltrada en el

código). Se aplicaron las siguientes líneas de

código para realizar el cálculo de la proporción

entre energías:

>s30ms=0.03*fs; % número de muestras

corrrespondientes a 30 ms

>rms=sqrt(sum(muestrasonora(1:s30ms).^2)

/length(muestrasonora(1:s30ms)));

>rms_altafrec=sqrt(sum(muestrafiltrada(1:s30

ms).^2)/length(muestrafiltrada(1:s30ms)));

>proporcion= rms_altafrec/rms;

>dB=20*log10(proporcion);

Las medidas de proporción de energía se

realizaron en cuatro intervalos de tiempo: a)

entre 0 y 30 ms, b) entre 30 y 60 ms, c) entre

60 y 90 ms, y d) entre 0 y 100 ms. El instante

t=0 fue elegido variando los momentos de

inicio de la muestra hasta obtener la máxima

riqueza de altas frecuencias dentro de su desa-

rrollo. En varios casos este instante coincidió

con el ataque de la muestra.

Comparación del desarrollo temporal

de los niveles de energía

Con el fin de analizar la evolución de los

niveles de energía se procesaron las señales

mediante el OCTAVE para obtener un perfil de

niveles SPL equivalentes (asumiento una

referencia arbitraria). Se utilizó una función

disponible que realiza un diagrama temporal

del nivel SPL equivalente y se aplicó en forma

separada a la muestra de rango completo y a

la que sólo contenía alta frecuencia (Figura 3).

Petrosino y Canalis p. 210 | 2015 | ISSN 2346-8874

Figura 1. Espectro de una muestra de charango de 30 ms de duración a partir del ataque. La flecha indica el límite de audibilidad de 20 kHz.

Figura 2. Espectro de una muestra de charango con todas las frecuencias y de la misma muestra filtrada

p. 211 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom

Figura 3. Evolución temporal de energía de una muestra de charango conteniendo todas las frecuencias y de una versión de la misma muestra conteniendo solamente altas frecuencias

Instrumento Intervalo

0-30 ms

Intervalo

30-60ms

Intervalo

60-90 ms

Intervalo

0-100 ms

%

0- 100 ms

Platillo - 17.73 dB - 35.16 dB - 45.18 dB - 21.91 dB 8.2

Platillo y cadena - 25.34 dB - 36.65 dB - 40.75 dB - 28.98 dB 3.56

Charango a - 27.67 dB - 56.55 dB - 59.73 dB - 32.10 dB 2.48

Charango b - 31.62 dB - 59.33 dB - 64.32 dB - 35.21 dB 1.74

Acordeón a - 32.94 dB - 51.04 dB - 59.33 dB - 36.73 dB 1.46

Violin a -38.65 dB - 40.15 dB - 40.44 dB - 39.80 dB 1.02

Aro bombo legüero - 42.68 dB - 56.88 dB - 52.72 dB - 42.83 dB 0.72

Bandoneon a - 45.85 dB - 47.14 dB - 47.21 dB - 46.61 dB 0.47

Violin b - 48.62 dB - 49.25 dB - 48.36 dB - 48.99 dB 0.36

Acordeón b - 51.87 dB - 58.07 dB - 53.65 dB - 53.30 dB 0.22

Bandoneon b - 58.63 dB - 55.50 dB - 52.36 dB - 55.58 dB 0.17

Parche bombo legüero - 55.67 dB - 58.70 dB - 58.57 dB - 55.84 dB 0.16

Saxo - 63.74 dB - 64.25 dB - 65.78 dB - 64.67 dB 0.06

Bandoneon c - 65.99 dB - 66.18 dB - 66.66 dB - 65.71 dB 0.05

Piano - 70.24 dB - 76.12 dB - 73.04 dB - 72.47 dB 0.02

Tabla 1. Comparación de niveles de energía en alta frecuencia respecto de energía total

Petrosino y Canalis p. 212 | 2015 | ISSN 2346-8874

Resultados

Del análisis de la información espectral de

amplio rango de instrumentos musicales se ha

podido determinar que en gran parte de las

muestras existen proporciones significativas de

energía de alta frecuencias. Estos resultados

son consistentes con los estudios realizados

previamente por James Boyk (1997) en el

CalTech.

Nuestro aporte al análisis de Boyk ha sido la

incorporación de ciertos instrumentos de uso

local, como el charango, el acordeón, el

bandoneón y el bombo legüero. Por otra parte,

hemos ampliado las experiencias de Boyk

realizando diagramas de la evolución temporal

de la energía de altas frecuencias.

Proporción de energía en altas frecuencias

La Tabla 1 contiene los resultados de la

relación entre energía en altas frecuencias y

energía total de la muestra en los intervalos

temporales seleccionados: 0 a 30 ms, 30 a 60

ms, 60 a 90 ms y 0 a 100 ms. Las muestras se

han ordenado por valor decreciente de la

proporción de energía en altas frecuencias

respecto de la energía total.

Diagramas espectrales

Se incluyen los diagramas espectrales de

algunas muestras con gran proporción de

energía en altas frecuencias. Los espectros

mostrados corresponden a una sección de 30

ms de duración en la que se detecta gran

cantidad de armónicos de alta frecuencia.

En el diagrama espectral de los primeros 100

milisegundos del platillo (Figura 4) puede

observarse que el nivel promedio de energía en

el rango de frecuencia que se extiende de los

10 kHz a los 18 kHz es apenas unos 6 dB

superior al nivel promedio entre 22 kHz y 32

kHz.

En el diagrama espectral de la muestra de

charango (Figura 5), también de 100 ms, se

observan claramente picos equiespaciados en

frecuencia representando los armónicos. La

aparición de dichos picos se extiende a lo largo

de todo el rango de frecuencias analizado.

Existe una caída de nivel al superar al rango

audible, pero parte de esta caída se debe a que

las altas frecuencias del charango se producen

en el momento del ataque mientras que este

análisis espectral se realiza sobre 100 ms,

como puede observarse en el diagrama de la

evolución temporal del nivel de energía de la

Figura 9.

En el espectro representado del acordeón

(Figura 6) no se observa tan claramente la

presencia de picos correspondientes a los

armónicos cuando se compara esta figura con

la del charango o la del violín. De todas

maneras resulta interesante notar que la

pendiente de caída de nivel entre los 10 kHz y

los 38 kHz es suficientemente lenta.

El espectro del violín (Figura 7) muestra

claramente los armónicos. La pendiente de

caída de nivel entre los 16 kHz y los 34 kHz es

lenta.

Niveles de presión sonora comparados

Los siguientes diagramas muestran la

evolución temporal de los niveles de energía

total y de alta frecuencia presentados como

niveles de presión sonora comparados. El

análisis se realizó sobre secciones de 100 ms

de duración.

Puede notarse en la Figura 8 que el nivel de

energía de altas frecuencias del platillo en los

primeros milisegundos del ataque es

comparable al de la energía total y que decae a

un ritmo de unos 0.5 dB por milisegundo.

La energía de alta frecuencia de la muestra de

charango que se observa en la Figura 9 alcanza

en su máximo valor un nivel 15 dB por debajo

del nivel de energía total y registra un ritmo de

caída bastante abrupto cercano a 1.5 dB por

milisegundo.

La energía de alta frecuencia de la muestra de

acordeón llega a estar a unos 20 dB por debajo

del nivel de energía sonora total de la muestra

al momento del ataque, decayendo luego a un

ritmo de unos 0.6 dB por milisegundo.

En la muestra de violín el nivel de energía de

altas frecuencias muestra una diferencia que se

mantiene constante en el tiempo de alrededor

de 40 dB, lo que resulta consistente con el

mecanismo de generación de sonido por cuerda

frotada.

p. 213 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom

Figura 4. Espectro del ataque de un platillo de 100 ms de duración

Figura 5. Espectro del ataque de una muestra sonora de charango de 100 ms de duración

Figura 6. Espectro del ataque de una muestra sonora de acordeón de 100 ms de duración

Figura 7. Espectro del ataque de una muestra sonora de violín en una muestra de 100 ms.

Petrosino y Canalis p. 214 | 2015 | ISSN 2346-8874

Figura 8. Evolulción temporal de la energía del sonido de un platillo

Figura 9. Evolución temporal de la energía de una muestra sonora de charango

Figura 10. Evolución temporal de la energía de una muestra sonora de acordeón

Figura 11. Evolución temporal de una muestra sonora de violín

p. 215 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom

Conclusiones

Existen indicios de que en determinadas

situaciones es posible percibir componentes de

frecuencias que superan el rango audible. Los

sistemas de grabación digitales actuales

permiten registrar dichos componentes. El

verdadero impacto que podría tener el registro

de estos componentes es aún objeto de

debate, pero resulta importante para ello

conocer con exactitud qué magnitud tiene

aquello que queda fuera de los registros.

Dado que se han detectado niveles de

información relevante por encima de los 20

kHz en instrumentos musicales, nuestro

trabajo podría brindar un aporte a la discusión

sobre el rango de frecuencias recomendable

para un registro sonoro fidedigno de

instrumentos musicales.

Agradecimientos

El presente trabajo se realizó en el marco del

proyecto 33A200 de la convocatoria Amílcar

Herrera 2014 de la Universidad Nacional de

Lanús.

Debemos agradecer a los instrumentistas que

nos permitieron realizar los registros utilizados

en este trabajo: Javier Acevedo (acordeón),

Leonel Gasso (bandoneón), Cristhian Faiad

(percusión), César Rago (violín), Federico

Jaureguiberry (saxo), Pablo Marconi (charango)

y Matías Pagliocca (piano).

Referencias

Ashihara, K. (2007). Hearing thresholds for pure tones above 16 kHz. Journal of the Acoustic Society of America, Vol. 122 N° 3, EL52-EL52

Boyk, J. (1997). There’s life above 20 kilohertz! A survey of musical instrument spectra to 102.4

kHz. En California Institute of Technology

(Caltech). Consultado el 24 de mayo de 2015 en <http://www. cco. caltech. edu/~ boyk/spectra/spectra. htm>

Canalis, I. y Petrosino, J. (2014). ¿Es posible percibir tonos puros por encima de los 20 kHz?

En P. Arenas (ed.) IX Congreso Iberoamericano de Acústica FIA2014. Valvidia: Universidad Austral de Chile, pp. 810-818

Meyer, E. y Moran, D. (2007). Audibility of a CD-Standard A/D/A Loop Inserted into High-Resolution Audio Playback. Journal of Audio Engineering Society, Vol. 55 N° 9, 775-779.

Nishiguchi, T. et al. (2009). Perceptual discrimi-

nation of very high frequency components in

wide frequency range musical sound. Applied Acoustics, Vol. 70 N° 7, 921-934.

Oohashi T. el al. (2000) Inaudible High-Frequency Sounds Affect Brain Activity: Hypersonic Effect. Journal of Neurophysiology. Vol. 83 N° 6, 3548-

3558.