empleo de tÉcnicas de grabaciÓn para emulaciÓn de

183
EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE TRIDIMENSIONALIDAD EN UNA APLICACIÓN ESTEREOFÓNICA MAYRA ALEJANDRA CARDOZO PÉREZ UNIVERSIDAD DE SAN BUENAVENTURA FACULTAD DE INGENIERÍA INGENIERÍA DE SONIDO BOGOTA, 2009

Upload: others

Post on 19-Jul-2022

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE TRIDIMENSIONALIDAD

EN UNA APLICACIÓN ESTEREOFÓNICA

MAYRA ALEJANDRA CARDOZO PÉREZ

UNIVERSIDAD DE SAN BUENAVENTURA

FACULTAD DE INGENIERÍA

INGENIERÍA DE SONIDO

BOGOTA, 2009

Page 2: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE TRIDIMENSIONALIDAD

EN UNA APLICACIÓN ESTEREOFÓNICA

MAYRA ALEJANDRA CARDOZO PÉREZ

PROYECTO DE GRADO

Asesores

William Romo Martinez

Luis Fernando Hermida

UNIVERSIDAD DE SAN BUENAVENTURA

FACULTAD DE INGENIERÍA

INGENIERÍA DE SONIDO

BOGOTA, 2009

Page 3: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

AGRADECIMIENTOS

En el corto camino del proceso de aprendizaje hay etapas de la vida que, de manera

significativa, nos ayudan a ser mas humanos y mejores profesionales. Esta fue una de

ellas, por eso quiero agradecer a las personas que directa o indirectamente hicieron

parte de este proceso. Gracias a Dios y a mi familia por el amor y apoyo, a los

profesores William Romo, Luis Hermida y al Director Luis Jorge Herrera por su

confianza en el proyecto y en mí. Al profesor Raúl Rincón, a quién le debo el nombre

del proyecto; Ismael Ortega por sus aportes para las mediciones, a todos los auxiliares

de los laboratorios por su paciencia y colaboración incondicional y por último a mis

amigos quienes no sólo estuvieron allí ayudándome en todas las mediciones, sino

también impulsándome seguir adelante.

Page 4: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

CONTENIDO

pág.

INTRODUCCIÓN 15

1. PLANTEAMIENTO DEL PROBLEMA 17

1.1 ANTECEDENTES 17

1.2 DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA 19

1.3 JUSTIFICACIÓN 19

1.4 OBJETIVOS DE LA INVESTIGACIÓN 21

1.4.1 Objetivo general 21

1.4.2 Objetivos Específicos 21

1.5 ALCANCES Y LIMITACIONES DEL PROYECTO 22

1.5.1 Alcances 22

1.5.2 Limitaciones 22

2. MARCO TEÓRICO-CONCEPTUAL 23

2.1 SISTEMA AUDITIVO-FISIOLOGÍA 23

2.1.1 Partes del oído 24

2.1.1.1 Estructura y función del oído externo 24

2.1.1.2 Estructura y función del oído medio 25

2.1.1.3 Estructura del oído interno y su función 26

2.1.1.4 Vías auditivas 27

2.1.1.5 Corteza Cerebral 27

2.1.2 Localización de la fuente sonora 27 2.1.2.1 Localización de la fuente sonora desde el punto de vista fisiológico 27

2.2 AUDICIÓN ESPACIAL 30

2.2.1 Localización sonora 31

2.2.1.1 Introducción a la localización sonora 31

Page 5: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

2.2.1.2 Historia 32

2.2.1.3 Localización de una fuente sonora real mediante Diferencias Interaurales de Tiempo, DIT 32

2.2.1.4 Difracción del sonido 37

2.2.1.5 Localización de una fuente sonora real mediante Diferencias Interaurales de Intensidad, DII 37

2.2.1.6 Localización en el plano medio, filtraje ocasionado por la pinna y otros efectos 40

� Pistas ambiguas de DIT y DII 40 � Pistas para localización en el plano vertical 42 � Otras pistas: movimiento de la cabeza, reflexiones del torso y de los

hombros 47

2.2.1.7 Percepción de la distancia 48

2.3 AUDICION ESPACIAL NATURAL VERSUS VIRTUAL 49

2.3.1 Lateralización 50

2.3.2 Función de transferencia relativa a la cabeza 53

2.3.3 Grabación binaural y la Cabeza artificial 54

2.3.4 Simulación de fuentes externas a través de audífonos 55

2.4 LOCALIZACIÓN DE FUENTES SONORAS VIRTUALES EN PARLANTES

Y AUDIFONOS 56

2.5 CONCEPTOS ACÚSTICOS BÁSICOS 57

2.5.1 Tiempo de reverberación y distancia crítica 57

2.5.2 Respuesta al impulso 58

2.6 VISIÓN GENERAL DE TÉCNICAS DE MICROFONERÍA ESTÉREO 58

2.6.1 Tipos de técnicas de microfonería estéreo 59

2.6.1.1 Par coincidente 59

2.6.1.2 Par espaciado 60

2.6.1.3 Par coincidente cercano 61

� Técnica de Microfonería estéreo ORTF 62

Page 6: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

� Características principales de la técnica ORTF 63

� Estéreo Apantallado ("Jecklin Disk") 63

� Características principales de la técnica OSS (Optimal Stéreo Signal) 64

2.6.2 Comparación de técnicas estereofónicas de microfonería 65

2.6.2.1 Michael Williams, “teoría unificada de sistemas de micrófono para grabación de sonido estereofónico” (1987) 65

2.6.2.2 Carl Ceoen, “Pruebas auditivas estereofónicas comparativas” (1972) 67

2.6.2.3 Benjamin Bernfeld y Bennet Smith, “Modelo de sistemas estereofónicos con ayuda computacional” (1978) 67

2.6.2.4 C. Huggonet y J. Jouhaneau, “”comparación de la funciones de transferencia espacial de seis sistemas estereofónicos” (1987) 68

2.6.2.5 Wieslaw woszcyk, “un nuevo método para realzamiento espacial en grabaciones estéreo y surround” (1990) 69

3. METODOLOGÍA 71

3.1 ENFOQUE DE LA INVESTIGACIÓN 71

3.2 LÍNEA DE INVESTIGACIÓN DE USB/ SUB-LÍNEA DE FACULTAD/CAMPO TEMÁTICO DEL PROGRAMA 71

3.3 TÉCNICAS DE RECOLECCIÓN DE INFORMACIÓN 72

3.4 POBLACIÓN Y MUESTRA 73

3.5 HIPÓTESIS 73

3.6 VARIABLES 74

3.6.1 Variables Independientes 74

3.6.2 variables Dependientes 74

4. DESARROLLO INGENIERÍL 75

4.1 DIFERENCIAS INTERTRANSDUCTORES DE INTENSIDAD Y TIEMPO DE LAS TÉCNICAS ORTF Y JECKLIN DISK, MEDIANTE LA VARIACIÓN DE ÁNGULOS AZIMUTH 75

4.1.1 Medición del tiempo de reverberación y distancia crítica, estudio híbrido Universidad de San Buenaventura, Bogotá 75

4.1.2 Medición diferencia intertransductores 80

Page 7: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

4.2 MEDICIÓN RESPUESTA AL IMPULSO DE UNA PINNA ARTIFICIAL 95

4.3 GRABACIÓN CON TÉCNICAS ESTEREOFÓNICAS ORTF, JECKLIN DISK Y BINAURAL Y APLICACIÓN DE ALGORITMO A ÉSTAS CAPTURAS 116

5. PRESENTACIÓN Y ANÁLISIS DE RESULTADOS 126

5.1 VALIDACIÓN DE RESULTADOS 126

6. CONCLUSIONES 144

7. RECOMENDACIONES 147

ERRORES SISTEMÁTICOS 148

BIBLIOGRAFÍA 149

ANEXOS 152

Page 8: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

LISTA DE FIGURAS

pág.

Figura 1. Partes de la pinna 25

Figura 2. Sistema de coordenadas esféricas, con sus respectivos planos, en donde:

�=distancia, �=Azimuth y �= elevación 31

Figura 3. Trayectoria recorrida por el sonido desde la fuente sonora, al oído izquierdo y al

derecho 34

Figura 4 Sonido de frecuencia baja que sobrepasa la cabeza debido

a su gran longitud de onda 34

Figura 5. Diferencias interaurales de tiempo para diferentes ángulos azimuth (posición

horizontal) medidos. Adaptación realizada por Feddersen, et al 35

Figura 6. Efecto sombreado ocasionado por la cabeza, difracción

en frecuencias altas y bajas 38

Figura 7. Diferencias interaurales de intensidad para varias posiciones azimuth (plano

horizontal) y distintas frecuencias. Adaptación por Feddersen, et al 39

Figura 8 Cono de confusión. ( aquí, a y b muestran una ambigüedad frente-atrás, y, x y y

muestran una ambigüedad en elevación) 41

Figura 9. Tiempo de retardo contra la orientación, a (Azimuth) b(Elevación) 44

Figura 10. Respuesta en frecuencia de la pinna, con respecto

a dos posiciones: Arriba y frontal 45

Figura 11. Descripción de Gierlich de componentes direccionales y no direccionales de la HRTF,

mostrando el rango de frecuencias mayormente afectado 48

Figura 12. Representación configuración par coincidente 60

Figura13. Representación configuración par espaciado 61

Figura14. Representación configuración par coincidente cercano 62

Figura 15. Configuración técnica de microfonería ORTF 63

Figura 16. Configuración técnica de microfonería Jecklin Disk 65

Figura 17. Posiciones de fuente y micrófono en medición de RT y distancia crítica 77

Figura 18. Diagrama de conexión, medición de RT y obtención de distancia crítica 78

Figura 19. Diagrama de conexión, medición diferencias intertransductores 83

Figura 20. Configuración Jecklin Disk, medición diferencia intertransductores 86

Figura 21. Configuración ORTF, medición diferencia intertransductores 87

Figura 22. Datos graficados de las diferencias intertransductores de intensidad para Jecklin Disk

y ORTF, con sus respectivas diferencias interaurales de intensidad para comparación 90

Page 9: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Figura 23. Datos graficados de las diferencias intertransductores de tiempo para Jecklin Disk y

ORTF, con sus respectivas diferencias interaurales de tiempo para comparación 93

Figura 24. Diagrama de conexión medición respuesta al impulso pinna artificial 102

Figura 25. Calibración con Pistófono, imagen tomada desde EASERA (versión demo) 103

Figura 26. Configuración inicial para emisión de barrido , imagen tomada desde EASERA

(versión demo) 104

Figura 27. Posicionamiento de los angulos de medición para RI de la pinna articial. (a) vista

planta, (b) vista lateral izquierda 106

Figura 28. Respuesta en frecuencia posición azimutal 90° en elevaciones 0°, 30°, 60°, 90°,aire

libre 111

Figura 29. Respuesta en frecuencia posición azimutal 90° en elevaciones 0°, 30°, 60°, 90°,

recinto 113

Figura 30. Comparación con medición en cámara anecóica 115

Figura 31. Respuesta en frecuencia de guitarra: sin filtrar y con convolución. Respuesta en

frecuencia azimuth 90° elevación 30° 121

Figura 32. Respuesta en frecuencia de guitarra: sin filtrar y con convolución. Respuesta en

frecuencia azimuth 90° elevación 30° 122

Figura 33. Producto final que contiene todas las convoluciones realizadas para todos los

ángulos tanto horizontales y verticales, además de la grabación binaural 125

Figura 34. Aciertos técnica estéreo ORTF y Jecklin Disk en presentación de la muestra en la

posición horizontal, para audífonos Sony MDR V-6 129

Figura 35. Aciertos técnica estéreo ORTF y Jecklin Disk en presentación de la muestra en la

posición horizontal, para audífonos In-Ear 130

Figura 36. Aciertos técnica Binaural en presentación de la muestra en la posición horizontal,

para audífonos Sony MDR V-6 131

Figura 37. Aciertos técnica Binaural en presentación de la muestra en la posición horizontal,

para audífonos In-Ear 132

Figura 38. Aciertos técnica estéreo ORTF y Jecklin Disk en presentación de la muestra en la

posición horizontal 0° y 90° con elevaciones de 0°, 30°, 60°, 90°,

para audífonos Sony MDR V-6 132

Figura 39. Aciertos técnica estéreo ORTF y Jecklin Disk en presentación de la muestra en la

posición horizontal 0° y 90° con elevaciones de 0°, 30°, 60°, 90°, para audífonos In-Ear 134

Figura 40. Aciertos técnica Binaural en presentación de la muestra en la posición horizontal 0°

y 90° con elevaciones de 0°, 30°, 60°, 90°, para audífonos Sony MDR V-6 135

Figura 41. Aciertos técnica Binaural en presentación de la muestra en la posición horizontal 0°

y 90° con elevaciones de 0°, 30°, 60°, 90°, para audífonos In-Ear 135

Figura 42. Indicación de porcentajes para posición horizontal.

Audífonos Sony MDR V-6,InEar 136

Page 10: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Figura 43. Indicación de porcentajes para posición horizontal técnica binaural. Audífonos Sony

MDR V-6,InEar 137

Figura 44. Indicación de porcentajes para elevación 137

Figura 45. Indicación de porcentajes para elevación, Técnica binaural 140

Page 11: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

LISTA DE IMÁGENES

pág.

Imagen 1. Pantalla acústica finalizada 85

Imagen 2. Fotografías de la medición en la que se obtienen las diferencias intertransductores

de tiempo y de intensidad ORTF y Jecklin Disk 94

Imagen 3. Procedimiento pinna artificial 96

Imagen 4. Soporte de pinna artificial y parlante 99

Imagen 5. Posiciones de medición en estudio híbrido y aire libre 107

Imagen 6. Grabación Con técnicas estereofónicas y grabación binaural 118

Page 12: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

LISTA DE TABLAS

pág.

Tabla 1. Dimensiones del estudio híbrido 76

Tabla 2. Absorción del Jecklin Disk por banda de octava 84

Tabla 3. Diferencia intertransductores de intensidad, técnica Jecklin disk y ORTF 88

Tabla 4. Diferencias intertransductores de tiempo, técnica Jecklin disk y ORTF 91

Tabla 5. Orden de reproducción de muestras 128

Page 13: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

LISTA DE ANEXOS

pág.

Anexo A. Partes del oído, vías auditivas ipsilateral y contralateral y corteza auditiva;

camino que sigue el sonido hasta llegar a la Corteza Cerebral 152

Anexo B. Posicionamiento del micrófono de medición en estudio híbrido 153

Anexo C. Realización de la pantalla acústica 154

Anexo D. Construcción soporte pinna y parlante 155

Anexo E. montaje de medición respuesta al impulso de pinna artificial 158

Anexo F. Respuesta en frecuencia de todos los ángulos medidos tanto para aire libre como

para las mediciones en estudio híbrido 161

Anexo G. Formato comprobación de resultados del proyecto 165

Anexo H. Respuestas de los individuos en comprobación de resultados 169

Page 14: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

GLOSARIO

ALGORITMO: conjunto de operaciones ordenadas y finitas que permiten la realización

de una tarea o proceso para solución de un problema.

BINAURAL: característica de percepción del sonido por los seres humanos literalmente

significa tener dos oídos, la escucha binaural, le permite a los seres humanos

identificar la dirección de la fuente sonora, en base a la intensidad relativa de los oídos

y al tiempo de llegada a los dos oídos.

CAMPO DIRECTO: sonido proveniente directamente de la fuente, el cual no tiene

contenido de reflexiones.

CAMPO REVERBERANTE: sonido procedente de la fuente pero que han sido reflejados

con las superficies del recinto.

EMULACIÓN: Intento de imitar el diseño interno de un dispositivo.

ESTÉREO: generalmente se le llama al sonido estereofónico o estéreo al grabado

en dos canales.

OÍDO: órgano del sistema sensorial capaz de recibir el sonido, nos permite percibir los

sonidos, su volumen, tono, timbre y la dirección de la cual provienen.

PERCEPCIÓN: es la función psíquica que permite al organismo, a través de los

sentidos, recibir, elaborar e interpretar la información proveniente de su entorno.

TRIDIMENSIONAL: imagen que representa tres planos profundidad, ancho y altura.

Page 15: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

15

INTRODUCCIÓN

Por mucho tiempo varias investigaciones han sido dirigidas a la explicación de cómo los

seres humanos ubican una fuente sonora en un ambiente de audición natural. Nuestro

sistema auditivo modifica el sonido mediante un proceso de filtrado dependiente de su

dirección. Este sonido modificado, involucra un serie propiedades espaciales las cuales

son usadas por el cerebro para detectar su dirección.

La forma en que el ser humano percibe el sonido depende físicamente de sus oídos;

esto es llamado audición binaural. La escucha binaural es la responsable de la

detección del sonido así como de su dirección. Modelos binaurales han atraído la

atención de muchos investigadores desde 1900, cuando Lord Rayleigh postuló la teoría

Dúplex y se ha venido intensificando desde 1948 con Jeffress, quién propuso el

término binaural por primera vez.

El uso de modelos binaurales son usados para crear indicios de localización de fuentes

sonoras virtuales, que gracias a la ingeniería y a las ciencias que la soportan, se han

podido realizar aciertos y simulaciones muy reales, posibilitando la aplicación de éstas

en otras áreas. El sonido binaural produce la sensación de tridimensionalidad, que está

directamente relacionada, con la diferencia de intensidad y de tiempo recibida por

cada oído desde una fuente. Estas diferencias son de importancia para la ubicación del

sonido en el plano horizontal. Otras características tales como, el filtrado ocasionado

por el pabellón auditivo, “pinna”, contribuyen a la ubicación de fuentes sonoras en el

plano vertical. En este punto empieza el desarrollo de esta investigación, cuyo

propósito es crear sensaciones auditivas como aquellas de la escucha natural, por

medio de tres factores: el primero mediante la información en el plano vertical, el

segundo en el horizontal (azimuth), sin dejar de lado los juicios de distancia como

tercer elemento.

Para el primero, es de consideración el estudio y la emulación de las propiedades

inherentes a la pinna. Para el segundo factor, plano horizontal, es de importancia el

análisis e interpretación de las técnicas estereofónicas, ORTF y estéreo apantallado

(Jecklin disk), para así aprovechar al máximo sus cualidades al momento de la capturas.

Page 16: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

16

El presente proyecto está basado principalmente en la emulación de las propiedades

de la pinna y, mediante un modelado artificial de la misma, obtener su respuesta al

impulso que permita, por convolución, aplicar estas características a una señal

estereofónica previamente capturada.

Page 17: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

17

1. PLANTEAMIENTO DEL PROBLEMA

1.1 ANTECEDENTES

Estudio de sonidos reproducidos por medio de audífonos no han sido objeto de

numerosos estudios a lo largo de la historia; solo hace unos pocos años se han

efectuado investigaciones que intentan dar una explicación de las características que

representa la reproducción por medio de estos sistemas. Un ejemplo de esos estudios

son aquellos realizados por Durand Begault en su publicación 3-D sound for virtual

reality and multimedia.

De modo similar, Frederic L. Wightman y Doris J. Kistler del Department of Psychology

and Waisman center, de la universidad de Wisconsin, investigaron con respecto a la

creación de nuevas técnicas para sintetizar estímulos mediante audífonos, a través de

la duplicación de la onda acústica en el canal del oído del oyente por fuentes en campo

libre, las cuales proporcionaron nuevas herramientas que permiten extraer las

características más significativas de las funciones de transferencia del oído, para que

estas mismas sean escuchadas por medio de audífonos. Sin embargo, el método de

grabación utilizado para realizar este tipo de estudios es, en su mayoría, mediante

grabaciones binaurales; bien sea con cabezas artificiales o reales. Estas grabaciones

binaurales implican la ubicación de micrófonos de pequeñas dimensiones en el canal

auditivo, tan cerca como sea posible del tímpano del oyente, el resultado es una

reproducción, por medio de audífonos, muy cercana a la grabada. En cierta medida

este tipo de reproducciones tienen falencias, que son las que Frederic Wightman y

Doris Kistler trataron de mejorar en sus investigaciones.

Otras investigaciones han intentado explorar las ventajas de los estímulos presentados

a través de audífonos, mediante la simulación electrónica de la pinna, como los

realizados por Bloom en 19771 y las realizadas por Watkins en 19782, o mediante la

grabación y reproducción de las pistas reales de la pinna por Jens Blauert en 1983,

Plenge en 1974 entre otros investigadores. Desafortunadamente estas técnicas son de

1 BLOOM, P. Jeffrey Creating Source Elevation Illusions by Spectral Manipulation. J. Audio Eng. Soc. September 1977. Vol 25. p.

560-565.

2 WATKINS, Anthony J. Psychoacoustical aspects of synthesized vertical locale cues. J. Acoust. Soc. Am. Vol 63. p. 1152-1165.

Page 18: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

18

limitada utilidad debido a que el grado de la simulación combinada con las condiciones

de escucha dadas en campo libre no fueron nunca cuantificadas.

Si bien es cierto que se han realizado análisis y mediciones tratando de extraer las

características de la audición humana, de la pinna, entre otros, a lo largo de la

realización de este proyecto, no se encontraron publicaciones extranjeras en las cuales

se realicen grabaciones estereofónicas distintas a las binaurales qué por medio de

emulaciones pretendieran imitar las características de la pinna, para mejorar la calidad

en la reproducción mediante audífonos y la ubicación de la fuente virtual, y así obtener

más realismo, como el presentado en la escucha natural.

Para la emulación de espacios tridimensionales que utilicen pocos canales, se

encuentra la técnica de Holofonía, aparentemente desarrollada en 1980 por Hugo

Zuccarelli, la cual se basa en la escucha binaural. La Holofonía, en su forma más

general, graba respuestas al impulso con pequeños micrófonos ubicados en el tímpano

de una cabeza artificial y su reproducción es muy parecida a la escucha cotidiana. Sin

embargo, el funcionamiento de esta técnica no ha sido explicada del todo.

En Colombia no se han realizado estudios, conocidos a lo largo de presente proyecto,

relacionados con grabaciones estereofónicas, y que incorporen además, la emulación

de las características de la pinna, para crear sonidos virtuales más cercanos a la

escucha normal.

En síntesis, las mayores investigaciones acerca de las propiedades de la pinna, han sido

hechas por investigadores extranjeros, sin embargo no se han encontrado estudios de

la aplicación de estas características a señales capturadas por técnicas de microfonería

estereofónicas.

Page 19: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

19

1.2 DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA

No obstante la existencia de grabaciones que proporcionen razonamientos

explicativos, referidos a la audición inherente en los humanos, creando además,

espacialidad como las grabaciones binaurales, otros métodos no han sido empleados;

como los creados a partir de las grabaciones estereofónicas, no aisladas de una

herramienta que permita complementar el plano horizontal, a partir de una simulación

del plano vertical, y que a su vez generen costos mínimos. Por lo tanto, aprovechando

estos métodos de captura es importante establecer :

¿Cómo se emplearán técnicas de grabación para emular tridimensionalidad en una

aplicación estereofónica?.

1.3 JUSTIFICACIÓN

La manipulación de señales estereofónicas mediante algoritmos es un tema nuevo y de

múltiples funciones, ya que permiten sensaciones auditivas como aquellas del sonido

tridimensional. El hecho de permitir reducir costos para obtener un mismo resultado

es una ventaja significativa para el usuario.

A partir de la creación en 1987 del formato comprimido de música, comenzaron a

surgir sistemas de reproducción, a través de auriculares, para estos tipos de formatos y

de otros más, como Windows Media Audio y Ogg Vorbis. Estos sistemas se han venido

utilizando desde su aparición en el 2001, de manera tal que su masificación ha sido

total; haciendo que toda la sociedad en la actualidad los utilice. Dado que esta

investigación se encuentra enfocada a la utilización de audífonos, no sería una

restricción el uso de ellos, como lo era en el pasado, en la reproducción de audio a

través de sistemas portátiles.

Por muchas décadas la localización binaural del sonido ha sido explicada

primariamente en términos de las diferencias interaurales de tiempo de llegada del

estimulo y las diferencias de nivel. Sin lugar a dudas, estas dos características nos

orientan en un ambiente acústico surround, pero se dejó a un lado, a pesar de sus

múltiples estudios en la literatura, las funciones del pabellón auditivo externo,

Page 20: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

20

comúnmente llamado Pinna, la cual proporciona información importante acerca de la

ubicación de la fuente sonora. La Pinna ha tomado interés relativo solo en años

recientes y su importancia se ha confinado a la percepción de la elevación del sonido,

sin dejar a un lado otras funciones como por ejemplo, resolver problemas de

localización en el plano medio.

El hecho de conocer las características de la pinna y su función en la audición humana,

permite ser aplicada a sonidos grabados mediante su emulación, creando de esta

forma sonidos más cercanos a los de la escucha natural, y así emplearlos no solo a las

áreas competentes a la ingeniería de sonido en sus distintas facetas (producciones

musicales, sonido para videos reproducidos a través de sistemas personales “Ipods”,

sonido para videojuegos), sino también en la medicina aplicado a personas con

deficiencias auditivas y visuales.

Page 21: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

21

1.4 OBJETIVOS DE LA INVESTIGACIÓN

1.4.1 Objetivo general

Implementar las técnicas de grabación estéreo apantallado (Jecklin Disk) y/o ORTF

(Oficina de radiodifusión y televisión francesa), para emulación de tridimensionalidad

en una aplicación estereofónica.

1.4.2 Objetivos Específicos

� Emplear las técnicas de grabación estereofónicas estéreo apantallado (Jecklin Disk)

y/o ORTF (Oficina de radiodifusión y televisión francesa), para realizar las capturas.

� Aplicar un algoritmo para la simulación del plano vertical, complemento del

horizontal dado por las técnicas estereofónicas.

� Realizar una valoración subjetiva para evaluación y comprobación de resultados.

� Comparar a través de la realización de una grabación binaural los resultados

obtenidos mediante ésta, con la hecha aplicando las técnicas de grabación estéreo,

basado en la valoración subjetiva realizada.

Page 22: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

22

1.5 ALCANCES Y LIMITACIONES DEL PROYECTO

1.5.1 Alcances

� Desarrollar un sistema de fácil manejo, interfaz gráfica, que a partir del empleo de

cualquier técnica de captura estéreo se pueda aplicar la emulación del plano vertical,

de tal manera que se pueda hacer una representación casi real de lo que lo que se

percibe a través del oído, y esto ser empleado por ejemplo en un audiovisual o en

nuevas producciones musicales.

� Cuantificar los datos obtenidos en la medición de la pinna ya que mediante cálculos

matemáticos se pueden tener bases más sólidas y verídicas con las que

posteriormente se puedan trabajar en futuras investigaciones.

1.5.2 Limitaciones

� La dificultad para encontrar una base de datos amplia en la creación de espacios

tridimensionales teniendo en cuenta técnicas de microfonería estéreo que además

permitan ser cuantificados.

Page 23: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

23

2. MARCO TEÓRICO-CONCEPTUAL

2.1 SISTEMA AUDITIVO-FISIOLOGÍA

Existen varias formas de conocer como el ser humano efectúa el análisis de un evento

sonoro, una de ellas es conocer el sistema auditivo y el recorrido que el sonido realiza

hasta llegar a la corteza cerebral (fisiológicamente), que es la que finalmente le da una

significación real al evento sonoro, sin excluir el trabajo que realizan los órganos que

los anteceden, y otra, por medio por medio de la percepción subjetiva de las

características y/o cualidades del sonido (psicoacústicamente). No obstante, uno no va

separado del otro.

El oído es un órgano que ha sido difícil de estudiar y no se ha interpretado aun del

todo, es solo una parte del complejo aparato auditivo; en su parte anatómica se

conoce desde el siglo XIX, y su fisiológica en los años 60. Existe una explicación que ha

sido demostrada en la cual, se determina que el aparato auditivo tiene una

constitución circular o cíclica las cuales tienen el siguiente orden:

� Órgano periférico o receptor (el oído). � Vía aferente la cual conduce la sensación sonora. � La corteza cerebral auditiva que procesa esas aferencias

convirtiéndolas en mensajes con significado. � Vía eferente a través de la cual la corteza regula

permanentemente el funcionamiento del órgano periférico.3

El órgano periférico (oído) se encuentra clasificado en tres partes básicas:

1. Oído externo.

2. Oído medio.

3. Oído interno.

3 VERGARA, Ramiro. Generalidades. Fisiología auditiva, visión actualizada. BogotáD.C.: Imprenta y Publicaciones de las Fuerzas Militares,1990, p. 23.

Page 24: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

24

Y el aparato auditivo además del órgano periférico se encuentra constituido por:

4. Vías auditivas.

5. Corteza cerebral.

A continuación se efectúa una breve explicación cada una de ellas.

2.1.1 Partes del oído

2.1.1.1 Estructura y función del oído externo.

Los constituye la pinna (el pabellón u oreja) y el canal auditivo externo. La pinna, constituido por el cartílago elástico y la piel, presenta relieves por su cara externa: el más externo, llamado Hélix, forma el borde posterior y superior; paralelo a este encontramos el Antihélix, el cual se bifurca en su parte anterosuperior conformando las llamadas Cruras, que delimitan la Fosa Triangular. En el extremo inferior el antihélix presenta una prominencia denominada Antitrago. Por delante del antihélix, y delimitado por éste, se encuentra la Concha, una estructura en forma de embudo que se continúa con el Canal Auditivo Externo. Delante del canal se encuentra una prominencia triangular, denominada Trago. El polo inferior del pabellón carece de cartílago, y se denomina Lóbulo de la oreja4.

La figura 1 muestra de forma detallada las partes previamente mencionadas. Ahora

bien, la función de la pinna es la de recibir las ondas sonoras y conducirlas hacia el

canal mediante reflexiones y difracciones; además, es ampliamente conocido que

ayuda a la localización en el plano vertical dependiendo de la dirección de la fuente

sonora, y puede causar caídas e incrementos de la señal. Estas características de la

pinna serán ampliamente detalladas más adelante por su relación con este proyecto

de investigación.

Por otro lado está el canal auditivo externo, su función, entre otras, es la de dirigir el sonido hacia la membrana timpánica, tiene una longitud de 25-28 mm, actúa como un resonador que por sus dimensiones físicas y su forma, favorece

4 Ángel, Francisco, et al. Bases de anatomía y fisiología. Audiología básica. Bogotá D.C.: Universidad Nacional de Colombia, Olga Gómez Gómez, 2006, p.32-33

Page 25: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

las frecuencias que se encuentran cuando el sonido quealguno de sus sobretonosen un extremo, el cual responde mejor a una frecuencia que longitud del tubo; esto fue demostrado por Békésy

Además de las características anteriormente mencionadas, el oído externo no permite

el paso de cuerpos extraño

cuando sonidos de gran intensidad son presentados.

Figura 1. Partes de la pinna

2.1.1.2 Estructura y función del oído medio: S

y lo conforman el tímpano, los huesecillos u osículos y la trompa de Eustaquio. El

tímpano es una membrana elástica y de forma cónica y su función es comunicar al

canal auditivo externo con la caja timpánica

y estribo comunican al oído interno las vibraciones sonoras y la trompa de Eustaquio

es una acoplador de impedancias.

La característica más significativaoído medio, es la de hacer cual viaja la onda sonora en el exteriorse transmite el sonido en el oído interno, senergía sonora medio líquido. 1837 por J. Muller, y 1863 por H. Von Helmholtz, quie

5 VERGARA, op. cit., p.58

25

las frecuencias que se encuentran entre 3-5 KHz; incrementándola hasta10 dBcuando el sonido que llega a este, coincide con la frecuencia fundamentaalguno de sus sobretonos, es decir, el canal auditivo actúa como un tubo cerrado

el cual responde mejor a una frecuencia que es cuatro veces la longitud del tubo; esto fue demostrado por Békésy5.

Además de las características anteriormente mencionadas, el oído externo no permite

el paso de cuerpos extraños al interior del oído, además de su capacidad protectora

gran intensidad son presentados.

ra 1. Partes de la pinna

y función del oído medio: Se encuentra ubicado en la caja timpánica

lo conforman el tímpano, los huesecillos u osículos y la trompa de Eustaquio. El

una membrana elástica y de forma cónica y su función es comunicar al

canal auditivo externo con la caja timpánica. Los huesecillos llamados: martillo, yunque

y estribo comunican al oído interno las vibraciones sonoras y la trompa de Eustaquio

es una acoplador de impedancias.

La característica más significativa que se tiene en cuenta de la función del oído medio, es la de hacer compatible acústicamente el medio aéreo en el

a la onda sonora en el exterior y el medio líquido a través del cual e el sonido en el oído interno, si no interviniera el oído medio, la

energía sonora se perdería en un 99.9 % al pasar del medio gaseoso al . La fisiología del oído medio viene siendo estudiada des

1837 por J. Muller, y 1863 por H. Von Helmholtz, quienes propusieron que

; incrementándola hasta10 dB coincide con la frecuencia fundamental o

, es decir, el canal auditivo actúa como un tubo cerrado cuatro veces la

Además de las características anteriormente mencionadas, el oído externo no permite

de su capacidad protectora

e encuentra ubicado en la caja timpánica

lo conforman el tímpano, los huesecillos u osículos y la trompa de Eustaquio. El

una membrana elástica y de forma cónica y su función es comunicar al

llamados: martillo, yunque

y estribo comunican al oído interno las vibraciones sonoras y la trompa de Eustaquio

que se tiene en cuenta de la función del compatible acústicamente el medio aéreo en el

y el medio líquido a través del cual ra el oído medio, la l medio gaseoso al

La fisiología del oído medio viene siendo estudiada desde nes propusieron que

Page 26: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

26

el oído medio lleva a cabo su función de adaptación de impedancias, así llamaron ellos la compatibilidad de medios, a través de tres mecanismos diferentes: una ampliación mecánica de la energía sonora realizada por la membrana timpánica por sí misma; un efecto de palanca ejecutado por la cadena osicular, y finalmente una acción hidráulica debida a la diferencia de tamaño entre la membrana timpánica mayor y la platina del estribo menor6.

Es decir, que convierte vibraciones de gran amplitud y poca presión, como las hay

en el tímpano, en vibraciones de pequeña amplitud y mayor presión como las que

se requieren en el oído interno por la densidad del liquido que la contiene.

Cabe resaltar con respecto al oído medio, su acción refleja, es decir, la contracción de

los músculos cuando sonidos de intensidad mayores a 90 dB son presentados. Al

contraerse estos músculos, la característica de transferencia del oído medio es

modificada, por consiguiente, la cantidad de energía entregada al oído interno es

menor. Este reflejo no es instantáneo si no que tardan en suceder entre 40-160 ms.

2.1.1.3 Estructura del oído interno y su función. Está constituido por el laberinto,

cavidad ósea que contiene a los canales semicirculares, el vestíbulo y el caracol. El

vestíbulo conecta a los canales semicirculares con el caracol, y al mismo tiempo al

caracol con la caja timpánica, por medio de la ventana oval y la ventana redonda. El

caracol está compuesto por el órgano llamado cóclea, que es un tubo enrollado dos

vueltas y media en espiral en forma de caracol.

La cóclea tiene dos membranas llamadas membrana de Reissner y Basilar, que dividen

a la cóclea en tres secciones: la rampa vestibular, la media o coclear y la timpánica. La

rampa vestibular y la rampa coclear se encuentran separadas por la membrana de

Reissner, mientras que la coclear está separada de la timpánica por medio de la

membrana basilar.

La rampa vestibular y timpánica contiene liquido perilinfático, rico en sodio (Na) y

pobre en potasio (K), mientras que la rampa coclear contiene liquido endolinfático,

cuyas características químicas están dadas por su alto contenido en potasio (K) y

menor cantidad de sodio(Na). La rampa timpánica y la vestibular están interconectadas

por medio de un orificio que se llama helicotrema, ubicado en el Vértice (ápex) del

caracol. Por otro lado, la rampa vestibular se comunica con el oído medio a través de la

ventana oval, y la rampa timpánica lo hace a través de la ventana redonda.

6 Ibíd., p. 59-60

Page 27: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

27

En la rampa coclear esta la membrana basilar (M.B.), en la que se encuentra el órgano

de Corti y este a su vez a las células ciliadas.

Ahora bien, en las células ciliadas es donde se realiza parte de transducción

mecano-eléctrica del sonido, la cual será transmitida a la corteza cerebral, teniendo

en cuenta múltiples caminos, ya que ellas, tanto las células ciliadas externas como

las internas, emiten un pulso eléctrico causado por el movimiento de ellas debido a

la diferencia de ejes entre la membrana basilar y la tectoria. Estos pulsos son

enviados al cerebro a través de neuronas reunidas en el Nervio Auditivo, de ahí a los

Núcleos Cocleares, Complejo Olivar Superior, Núcleos del Lemnisco Lateral, Colículo

Inferior, Cuerpo Geniculado ipsi y contralateralmente y finalmente a la Corteza

Cerebral que es la que finalmente recopila toda la información que se revelan desde

el oído interno.

2.1.1.4 Vías auditivas. La cual tiene distintas estaciones, tronco cerebral (Núcleos

cocleares, Colículo inferior, Cuerpo Geniculado medio), como se planteaba

anteriormente en el oído interno. Estas estaciones tienen distintas funciones;

generación del reflejo estapeidal, estimulación eferente de las células ciliadas

internas y localización del sonido.

2.1.1.5 Corteza Cerebral. Aquí se lleva a cabo el procesamiento de la información, y se

establece una conexión con otras áreas como por ejemplo el lenguaje.

En el anexo A se muestra el esquema del oído con sus partes constitutivas, incluyendo

su camino hacia la Corteza Cerebral.

2.1.2 Localización de la fuente sonora

2.1.2.1 Localización de la fuente sonora desde el punto de vista fisiológico.

La localización de la fuente sonora se realiza por la vía aferente. El procesamiento de la información auditiva comienza con la codificación de frecuencia, amplitud y fase en el oído interno. La representación de estímulos auditivos complejos es sintetizada en sucesivos centros neurales que obtienen la información necesaria de los datos ya codificados por la cóclea. La primera neurona está situada en el ganglio espiral o de Corti; su axón constituye el nervio auditivo, la información es trasmitida por los axones de estas neuronas primarias a los núcleos cocleares ipsilaterales, en la región bulbo-pontina, dando una rama para el Núcleo Coclear Ventral y otra para el Núcleo Coclear Dorsal. El Núcleo Coclear Ventral recibe en su porción más ventral fibras provenientes del vértice de la cóclea (transmiten sonidos de frecuencias bajas) y en su porción más dorsal

Page 28: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

28

recibe fibras de la espira basal de la cóclea (transmiten sonidos de alta frecuencia) 7.

Otra característica fisiológica importante de la vía auditiva es su organización

tonotópica (representación de toda la extensión de la membrana basilar); El margen

de frecuencias de resonancia disponible en la membrana basilar determina la

respuesta en frecuencia del oído humano, las frecuencias que van desde los 20 Hz

hasta los 20 KHz. Dentro de este rango de frecuencias, la región en la cual el oído es

más sensible se encuentra entre 1-5 KHz (lo cual explica porque el oído humano tiene

mayor sensibilidad cuando sonidos de frecuencia alta son presentados).

Desde los Núcleos Cocleares, los impulsos nerviosos van por las vías auditivas: al

Complejo Olivar Superior (que constituye el principal sitio de convergencia binaural en

el sistema nervioso central). En la Oliva Superior es donde se produce la localización

del sonido en el espacio, es decir, se determina la dirección de la que proviene el

sonido. Las frecuencias altas se dirigen a la parte lateral de la Oliva Superior, y las

frecuencias bajas hacia la parte medial de la misma.

Los sonidos agudos se localizan comparando las intensidades recibidas en los dos oídos. Los sonidos agudos se propagan en línea recta, por eso un sonido agudo que viene del lado derecho estimula más el oído derecho que el izquierdo; porque el obstáculo de la cabeza amortigua el sonido en el lado izquierdo. El núcleo coclear tiene conexiones excitatorias con la parte lateral de la Oliva superior ipsilateral y conexiones inhibitorias con la parte lateral de la Oliva superior contralateral a través del Núcleo Trapezoide. Por ese motivo, cuando el sonido viene del lado derecho, el Núcleo Coclear derecho activa a la Oliva superior lateral derecha, e inhibe a la Oliva superior lateral izquierda. De modo que, los sonidos agudos que provienen de un lado activan a la Oliva superior lateral de ese mismo lado, e inhiben a la contralateral.

La Oliva superior lateral derecha envía señales ascendentes por el lemnisco lateral izquierdo, porque las fibras pasan al lado contralateral, de manera que el lemnisco lateral izquierdo lleva información sobre los sonidos que provienen del lado derecho. Este sistema de localización comparando intensidades no funciona para los sonidos graves, porque las frecuencia bajas pueden rodear los obstáculos (este fenómeno se denomina refracción, y por este motivo podemos oír un sonido detrás de una esquina). A causa de la refracción los sonidos rodean la cabeza, y llegan con parecida intensidad a los dos oídos. Los sonidos graves

7 CARRILLO, Vicente. Fisiología de la audición, Página docente medicina Universidad del Mar. Actualizado el 20 de diciembre de 2008. disponible desde: http://otorrino.homestead.com/files/Fisiolog_a_de_la_Audici_n.doc

Page 29: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

29

entonces se localizan comparando el tiempo de llegada a los dos oídos. Si el sonido viene del lado derecho, llega un poco antes al oído derecho que al izquierdo, porque la distancia que tiene que recorrer es mayor en este caso.

Las señales de los sonidos graves se dirigen desde el núcleo coclear hacia la parte medial de la oliva superior ipsilateral y contralateral. En este caso, las conexiones que van a ambos lados son excitatorias. Cuando un sonido proviene del lado derecho, la oliva superior medial izquierda recibe conexiones excitadoras de ambos lados y al mismo tiempo. Si el sonido viene del lado derecho llega al oído izquierdo más tarde, pero luego los potenciales de acción tienen que recorrer una distancia corta desde el oído izquierdo a la Oliva superior izquierda. Al oído derecho, el sonido llega antes, pero luego los potenciales de acción tienen que recorrer una distancia mayor, desde el Núcleo coclear derecho hasta la Oliva superior izquierda. Ambos retrasos se compensan y a la Oliva izquierda llegan los impulsos procedentes del lado derecho y del izquierdo al mismo tiempo, estos impulsos se suman espacialmente en las neuronas produciendo activación de la Oliva izquierda. En la oliva superior medial derecha no se produce esta sumación, porque cuando el sonido procede del lado derecho los impulsos que proceden del oído izquierdo llegan mucho más tarde que los que provienen del oído derecho, ya que el sonido tiene que recorrer más espacio para llegar al oído izquierdo, y además los potenciales de acción tienen que recorrer más espacio desde el oído izquierdo hasta la Oliva derecha.

Por tanto, los sonidos graves que provienen del lado derecho producen activación de la Oliva superior medial izquierda. La Oliva superior medial izquierda envía los impulsos ascendentes por el lemnisco lateral del mismo lado, de manera que el lemnisco lateral de un lado lleva información sobre los sonidos que vienen del lado contralateral, tanto graves como agudos8.

Como fue citado antes, luego de realizar este recorrido, este va a los Núcleos del

Lemnisco Lateral Desde los núcleos y de ahí hacia el Colículo Inferior, importante

estación de relevo de la vía auditiva que recibe información de ambos oídos, desde

este lugar la información, codificada tonotópicamente, se proyecta ipsi y

contralateralmente al Cuerpo Geniculado, desde donde a través de las radiaciones

auditivas pasa el estímulo a la Corteza Cerebral.

8 GARCÍA, Luis. Universidad Autónoma de Madrid, página de docencia de fisiología disponible desde: http://www.uam.es/personal_pdi/medicina/algvilla/audicion/ audicion.htm.

Page 30: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

30

2.2 AUDICIÓN ESPACIAL

Previamente se mencionó sobre las propiedades fisiológico-anatómicas del oído, así

como también una breve explicación de cómo el aparato auditivo, desde el punto de

vista fisiológico percibe e interpreta una fuente sonora real que proviene de una

posición específica, derecha-izquierda, dada una frecuencia. En cierto modo, debido a

la complejidad del sistema auditivo, aun no se ha podido dar un razonamiento total y

verídico de cómo, a través de los distintos mecanismos del sistema auditivo, este

interpreta todos los factores que involucra la percepción de la ubicación de la fuente

sonora. Hay varios mecanismos que el ser humano utiliza para localizar una fuente son

como lo son: Las DIT(Diferencias interaurales de tiempo/fase), Las DII(Diferencias

interaurales de intensidad), Distancia, filtrado realizado por la pinna y algunas

características del medio en el cual se emite la fuente sonora; tales como la

reverberación. pero todas estas variables juntas son difíciles de representar como un

todo, dado que cada una de ellas se analiza en alguna parte del sistema auditivo, y es

finalmente la corteza cerebral la que da el juicio final.

A continuación, desde una perspectiva psicoacústica se manifiesta como estas

propiedades de percepción le proporcionan a los humanos pistas verídicas acerca de la

ubicación de la fuente sonora real.

Una, dos o más fuentes sonoras pueden ser localizadas, teniendo las herramientas

auténticas y necesarias. Por lo pronto, solo se realiza el estudio de localización de una

fuente sonora real y aunque ulteriormente se generalice en la descripción de ubicación

de fuentes sonoras, cabe resaltar que el objetivo principal es detectar una fuente

sonora previamente grabada, y su real ubicación será la dada por el sistema de

reproducción, los audífonos (fuentes sonoras virtuales).

El sistema auditivo es un procesador espacial muy eficaz, que le permite al organismo

monitorear las posiciones de eventos auditivos desde varios planos; horizontal, vertical

y en distancia, que son las tres dimensiones en la cuales se extiende el sistema

auditivo. El aparato auditivo a diferencia del visual puede extenderse en todas las

direcciones, el visual solo al frontal.

Page 31: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

31

2.2.1 Localización sonora

2.2.1.1 Introducción a la localización sonora. Nuestra habilidad para localizar fuentes

sonora alude a la percepción de la misma en el plano horizontal (Azimuth), en el plano

vertical (Elevación) y a una distancia específica; teniendo en cuenta el sistema de

coordenadas esféricos, es decir, asumiendo que la cabeza es una esfera. La figura 2

representa el sistema de coordenadas, planos.

Figura 2. Sistema de coordenadas esféricas, con sus respectivos planos, en donde:

�=distancia, �=Azimuth y �= elevación

ARIAS Claudia y RAMOS Oscar. Audición espacial en espacios reverberantes: Aspectos teóricos relevantes. EN: Revista

Interamericana de Psicologia/Interamerican Journal of Psychology. Cordoba.Vol.37, Num 2, p. 375

El hombre tiene una extraordinaria capacidad para localizar fuentes que se encuentran

en el plano horizontal, pero presenta deficiencias cuando del plano vertical se habla y

aun menos para la distancia. Como se fue nombrado anteriormente la información que

utilizamos para localizar fuentes sonoras son las diferencias de llegada de la onda

sonora a los dos oídos DIT (diferencia de fase o comúnmente llamada Diferencias

interaurales de tiempo), las DII ( diferencias de intensidad o nivel sonoro); estas

ayudan a la localización en el plano horizontal. Las características de filtraje

proporcionada por los pliegues de la pinna, la cabeza, el torso y los hombros, que de

Page 32: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

32

acuerdo con la posición de la fuente sonora, modificará ciertas características de esta,

proporcionan información relevante para la localización en el plano vertical. La

distancia esta en relación cercana con la intensidad, reverberación y contenido

espectral de la fuente sonora. Sin embargo, hay muchas estudios como los realizados

por Blauert, que indican que la familiaridad con el evento sonoro, experiencia, así

como ayudas visuales, pueden incrementar la posibilidad de la percepción de

ubicación de un sonido.

La forma de reproducción de sonidos, se puede realizar por medio de un arreglo de

altavoces o por audífonos, cada uno tiene características especiales en la percepción

del evento sonoro. A medida que se avance se irán abordando cada uno de estos, pero

ahora la concentración estará en las tres características de localización que arriba

fueron nombradas.

2.2.1.2 Historia. Uno de los precursores en el estudio de audición espacial fue Lord

Rayleigh, aproximadamente en 1907, quien asemejando la cabeza a una esfera, explicó

cómo es el comportamiento de una onda plana cuando una esfera rígida se encuentra

como obstáculo. Esta teoría fue denominada Teoría Dúplex, las cuales dan explicación

de la localización en el plano horizontal teniendo en cuenta las DIT y DII. Esta teoría no

da interpretación de fuentes localizadas en el plano horizontal.

Es importante saber que tanto las diferencias interaurales de tiempo como de

intensidad, son realizadas bajo condiciones de campo libre o en cámaras anecóicas, en

donde el sonido viaja en línea recta desde la fuente hasta el oyente, en nuestra

escucha cotidiana las cosas son un poco diferentes puesto que se anexan las

condiciones de reflexiones, difracciones y otros factores ocasionados por el contacto

del sonido con paredes, pisos, techos, entre otros. Para efectos del proyecto se ha

mencionado como percibe el ser humano en condiciones naturales, el cual es llamado

localización del sonido. El término cambia cuando ya no se trata de fuentes sonoras

reales si no de fuentes virtuales, en este caso el termino es denominado lateralización.

2.2.1.3 Localización de una fuente sonora real mediante Diferencias Interaurales de

Tiempo, DIT. Desde el punto de vista de la Teoría Dúplex, las DIT (Diferencias

interaurales de tiempo), son los retardos en arribo de la fuente sonora a uno u otro

oído cuando la fuente cambia de angulación, el sonido por lo tanto, llegará mucho más

temprano al oído que se encuentre más cercano a la fuente sonora, “de tal forma que

cuando el sonido esta hacia la izquierda el oído izquierdo recibirá el sonido y cuando

Page 33: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

33

esta hacia la derecha el oído derecho lo escuchara primero”9. estas DIT son cero

cuando la fuente esta directamente frente al individuo y es máxima cuando la fuente

está direccionada exactamente a un oído, es decir 90°. Esto se da asumiendo que los

oídos están simétricamente ubicados a un lado y otro de la cabeza y con una

separación entre ellos de 15-18 cm.

Basado en tonos puros las diferencias de tiempo, son semejantes a las diferencias de

fase que hay entre las ondas sonoras que llegan a uno de los dos oídos. Esto se puede

representar mediante la siguiente ecuación:

∆� �� � � � ��

Ecuación 110

Donde: ∆� � � Distancia viajada por la fuente sonora alrededor de la cabeza,

expresado en ángulo.

∆�= es el camino extra de la cabeza para un angulo de incidencia dado (en metros)

r= la mitad de la distancia entre los oídos( en metros).

La diferencia de fase es tan representativa, que es función tanto de la distancia y la

orientación de la cabeza, como también de la longitud de onda de los sonidos. Por

consiguiente, para tonos puros de frecuencia baja y por lo tanto con una longitud de

onda grande, la diferencia de fase es tan pequeña que no es detectada por el oído la

figura 3 y 4 muestran este fenómeno.

9 HOWARD, David and ANGUS, James. Falta título del capítulo. EN: Acoustics and Psychoacosutics. Second edition. Oxford: Francis Rumsey, 2001, p. 97 10 Ibíd., p. 98

Page 34: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Figura 3. Trayectoria recorrida por el sonido desde la fuente sonora, al oí

derecho.

Figura 4. Sonido de frecuencia baja que sobrepasa la cabeza debido a su gran longitud de

onda

Con tonos puros de frecuencias altas sucede a

longitud de onda es pequeña

onda es pequeña con respec

fenómeno ocurre, el cual será explicado posterior a este ítem.

Como ya se ha mencionado las DIT se llevan a cabo para frecuencia baja en un rango de 200ocurrir en la frecuencia cercana a los 800 Hz, ya que la mitad de su longitud de onda es comparable con las dimensiones de la cabezahumano es incapaz de saber

34

Trayectoria recorrida por el sonido desde la fuente sonora, al oí

Sonido de frecuencia baja que sobrepasa la cabeza debido a su gran longitud de

Con tonos puros de frecuencias altas sucede algo distinto, la razón es que

longitud de onda es pequeña, aumenta la diferencia de fase, es decir, la longitud de

onda es pequeña con respecto a la dimensión de la cabeza, por lo tanto otro

el cual será explicado posterior a este ítem.

Como ya se ha mencionado las DIT se llevan a cabo para tonos puros de en un rango de 200-800 Hz, pero una ambigüedad comienza a

ocurrir en la frecuencia cercana a los 800 Hz, ya que la mitad de su longitud de onda es comparable con las dimensiones de la cabeza por tal razónhumano es incapaz de saber cual ciclo corresponde a cual en uno y otro oído;

Trayectoria recorrida por el sonido desde la fuente sonora, al oído izquierdo y al

Sonido de frecuencia baja que sobrepasa la cabeza debido a su gran longitud de

lgo distinto, la razón es que como la

aumenta la diferencia de fase, es decir, la longitud de

por lo tanto otro

tonos puros de , pero una ambigüedad comienza a

ocurrir en la frecuencia cercana a los 800 Hz, ya que la mitad de su longitud de por tal razón el ser

ponde a cual en uno y otro oído;

Page 35: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

dada su diferencia de fase de 180°Howard y James Angusque radianes (180

posibles ángulos; uno a la derecha y otro a la izquierda que pueden causar tales

desplazamientos de fase

ubicación de la fuente sonoramovimientos de cabeza.

Como se anticipó, la correcta localización, basados en las DIT, son dependientes de la

frecuencia y de la ubicación de la fue

del ángulo en el cual la fuente

a medida que la fuente sonora

que como se había predicho las DIT

el plano horizontal.

Figura 5. Diferencias interaurales de tiempo para diferentes ángulos azimuth (posición

horizontal) medidos. Adaptació

GRANTHAM, Wesley. Spatial hearing and related phenomena

edition London, UK: edited by B. C. J. Moore.

11 Ibíd., p. 100

35

su diferencia de fase de 180°. Esto significa, como lo establece David Howard y James Angus11, que “cuando el desplazamiento de fase es más grande

radianes (180°), habrá una ambigüedad en la dirección porque hay dos

posibles ángulos; uno a la derecha y otro a la izquierda que pueden causar tales

desplazamientos de fase”. Esto le dificulta de manera relevante al ser humano la ubicación de la fuente sonora; que puede ser arreglado con pequeños movimientos de cabeza.

Como se anticipó, la correcta localización, basados en las DIT, son dependientes de la

frecuencia y de la ubicación de la fuente sonora, cuyo tiempo cambiará

fuente sea emitida, la figura 5 muestra como son estos cambios

que la fuente sonora cambia de posición; cambios de ángulos azimuth

que como se había predicho las DIT es información importante para la localización en

. Diferencias interaurales de tiempo para diferentes ángulos azimuth (posición

Adaptación realizada por Feddersen, et al.

GRANTHAM, Wesley. Spatial hearing and related phenomena En: Handbook of Perception and Cognition, Second

edited by B. C. J. Moore. Academic, 1995, p. 312

, como lo establece David cuando el desplazamiento de fase es más grande

porque hay dos

posibles ángulos; uno a la derecha y otro a la izquierda que pueden causar tales

. Esto le dificulta de manera relevante al ser humano la que puede ser arreglado con pequeños

Como se anticipó, la correcta localización, basados en las DIT, son dependientes de la

nte sonora, cuyo tiempo cambiará dependiendo

son estos cambios

de posición; cambios de ángulos azimuth, ya

para la localización en

. Diferencias interaurales de tiempo para diferentes ángulos azimuth (posición

Handbook of Perception and Cognition, Second Edition. Second

Page 36: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

36

Como lo indica la gráfica las diferencias interaurales de tiempo son mínimas, cuando la

fuente sonora está a 0° azimuth, pero se va incrementando hasta llegar a su punto

máximo, cuando la fuente sonora esta exactamente a un lado de la cabeza, mirando a

un oído en un ángulo azimuth de 90°. Este valor también puede ser calculado con base

en la ecuación 1, dando el siguiente resultado:

��� ��� ��.���/���� �/���

!""#�$% � 6.73�10+"� 673,��

Ecuación 212

Pero otro dato relevante se puede obtener teniendo en cuenta algunos datos de la

ecuación pasada, ya que para ese mismo ángulo azimuth, 90°, se puede obtener la

máxima frecuencia que puede ser obtenida por medio de diferencias de fase:

-./0 � 1/2� �1

2�0.09��12 � � �1/2��

� 743 56

Ecuación 313

Valor cercano al que ya se había anticipado, el cual era 800Hz. Ahora bien, siguiendo

con la interpretación de la gráfica 5, a partir del valor de 90° azimuth, disminuye otra

vez su valor hasta 0 mseg, cuando la fuente sonora se encuentra exactamente detrás

del sujeto, 180° azimuth.

Esto quiere decir, que cuando una fuente sonora esta directamente enfrente, detrás o

en algún lugar del plano medio, la onda sonora llegara simultáneamente a los dos

oídos, como no hay diferencia entre sonidos delanteros y traseros, los seres humanos

debemos usar distintos mecanismos para localizar la fuente sonora frente-atrás.

nuestra localización frente-atrás es muy pobre y cae en errores.

12 Ibíd., p. 99 13 Ibíd., p. 101

Page 37: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

37

2.2.1.4 Difracción del sonido. Como es mencionado por Carrión14, “este fenómeno se

da cuando la fuente sonora rodea obstáculos, creando de esta forma sombras

acústicas que variarán en función de la longitud de onda de la onda incidente”. Como

se dijo, el grado de difracción depende de la longitud de onda, porque efectivamente

toma un cierto número de longitudes de onda para que el borde de la onda haga la

transición a sombra. “De esta manera la cantidad de difracción alrededor del borde, tal

como un edificio o una pared, serán más grandes en bajas y menos en frecuencias

altas”15

.

En este caso el obstáculo será la cabeza, la cual representa un cambio en las

características de llegada de las frecuencias altas, que son las que presentan poca

difracción y por lo tanto una sombra acústica mayor. Debido a que las frecuencias

bajas por su gran longitud de onda pueden rodear la cabeza perfectamente, estas no

tendrán cambios relevantes porque su sombra acústica es menor, por no decir nula,

dada su gran difracción. “El tamaño del objeto se vuelve significativo con respecto a la

longitud de onda cuando su tamaño esta alrededor de dos tercios de una longitud de

onda (2 37 λ)”16.

2.2.1.5 Localización de una fuente sonora real mediante Diferencias Interaurales de

Intensidad, DII. La difracción fue explicada por su relación con las diferencias

interaurales de intensidad. Como las diferencias interaurales de tiempo se vuelven

totalmente ambiguas para tonos puros de frecuencia alta de 1.5 KHz en adelante,

resulta complicado la localización de fuentes sonoras teniendo en cuentas estas pistas.

En este punto entran las diferencias interaurales de intensidad, DII, las cuales

proporcionan información más verídica para la ubicación de fuentes sonoras de

frecuencia alta.

Las Diferencias interaurales de nivel o intensidad son el resultado del efecto

sombreado de la cabeza, este efecto es mostrado en la figura 6. Los niveles en cada

oído son iguales cuando la fuente sonora están sobre el plano medio pero el nivel en

un oído se reduce progresivamente y se incrementa en otro a medida que la fuente

sonora se mueve fuera del plano medio; El nivel se reduce en el oído que está más

lejos de la fuente sonora.

14 CARRION ISBERT, Antoni. Estudio de las primeras reflexiones, acústica geométrica. En: Diseño acústico de espacios arquitectónicos. Barcelona: Editions UPC,1998, p. 52. 15 HOWARD, David and ANGUS, James. op. cit., p.49. 16 Ibíd., p. 50

Page 38: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

El efecto de sombreado de la cabeza es

parecen indicar que la relación entre la intensidad de los oídos varia sinusoidalmente

desde 0 dB hasta 20 dB

sonoro. Las frecuencias bajas presentan poca difracción porque pueden rodear la

cabeza fácilmente mientras que las altas presentan una sombra acústica mayor, lo cual

se ve reflejado en la disminu

Figura 6. Efecto sombreado ocasionado por

sin embargo, un objeto no es un dispersor o un sombreador de sonido hasta que su

tamaño esta alrededor de dos tercios de la longitud de onda, aunque se podría partir

por dispersar en una octava por debajo de esa frecuencia. Estos significa que

una frecuencia mínima por debajo en la cual el efecto de intensidad es menos útil para

la localización; cuando

tamaño.

38

l efecto de sombreado de la cabeza es más difícil de calcular, pero experimentos

parecen indicar que la relación entre la intensidad de los oídos varia sinusoidalmente

dB hasta 20 dB , dependiendo de la frecuencia, con respecto a la

Las frecuencias bajas presentan poca difracción porque pueden rodear la

cabeza fácilmente mientras que las altas presentan una sombra acústica mayor, lo cual

disminución de su intensidad.

Figura 6. Efecto sombreado ocasionado por la cabeza, difracción en frecuencias altas y bajas.

sin embargo, un objeto no es un dispersor o un sombreador de sonido hasta que su

tamaño esta alrededor de dos tercios de la longitud de onda, aunque se podría partir

por dispersar en una octava por debajo de esa frecuencia. Estos significa que

por debajo en la cual el efecto de intensidad es menos útil para

la cabeza este alrededor de un tercio de longitud de onda

pero experimentos

parecen indicar que la relación entre la intensidad de los oídos varia sinusoidalmente

, con respecto a la ángulo

Las frecuencias bajas presentan poca difracción porque pueden rodear la

cabeza fácilmente mientras que las altas presentan una sombra acústica mayor, lo cual

la cabeza, difracción en frecuencias altas y bajas.

sin embargo, un objeto no es un dispersor o un sombreador de sonido hasta que su

tamaño esta alrededor de dos tercios de la longitud de onda, aunque se podría partir

por dispersar en una octava por debajo de esa frecuencia. Estos significa que habrá

por debajo en la cual el efecto de intensidad es menos útil para

alrededor de un tercio de longitud de onda en

Page 39: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Para una cabeza que tiene un diámetro de 18

frecuencia de :

De esta manera las diferencia i

la ubicación de frecuencias altas

son para frecuencias bajas. Note que el

alrededor de 700 Hz y es

KHz. Teniendo en cuenta esta

dependiendo de la frecuencia

cercano a la fuente oye unos 8

los 30 dB o más. La grá

función del ángulo y de la frecuencia.

Figura 7. Diferencias interaurales de intensidad para varias posiciones azimuth (plano

horizontal) y distintas frecuencias.

GRANTHAM, Wesley. Spatial hearing and related phenomena

edition London, UK: edited by B. C. J. Moore.

17 Ibíd., p. 102

39

Para una cabeza que tiene un diámetro de 18 cm, esto corresponde a un

Ecuación 417

De esta manera las diferencia interaurales de intensidad es información relevante

frecuencias altas, mientras que las diferencias de tiempo interaural

para frecuencias bajas. Note que el crossover entre las dos técnicas empieza

es completado a cuatro veces esta frecuencia; alrededor de 2.8

Teniendo en cuenta estas diferencias se pueden dar aproximaciones de estas

dependiendo de la frecuencia. En el caso de una frecuencia de 1 KHz

cercano a la fuente oye unos 8 dB más, mientras que para 10 KHz la cantidad se eleva a

gráfica 7 muestra estas diferencias de intensidad, como una

función del ángulo y de la frecuencia.

. Diferencias interaurales de intensidad para varias posiciones azimuth (plano

horizontal) y distintas frecuencias. Adaptación por Feddersen, et al.

GRANTHAM, Wesley. Spatial hearing and related phenomena En: Handbook of Perception and Cognition, Second E

edition London, UK: edited by B. C. J. Moore. Academic, 1995, p. 312.

cm, esto corresponde a un mínimo en

es información relevante para

mientras que las diferencias de tiempo interaural lo

entre las dos técnicas empieza

alrededor de 2.8

diferencias se pueden dar aproximaciones de estas

frecuencia de 1 KHz, el oído más

Hz la cantidad se eleva a

diferencias de intensidad, como una

. Diferencias interaurales de intensidad para varias posiciones azimuth (plano

Handbook of Perception and Cognition, Second Edition. Second

Page 40: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

40

Esta información para localización ulteriormente mencionada es válida para fuentes

sonoras reales, las que escuchamos en la vida diaria. No obstante, el enfoque de este

proyecto es para fuentes sonoras virtuales, es decir, aquellas que son reproducidas por

medio audífonos.

2.2.1.6 Localización en el plano medio, filtraje ocasionado por la pinna y otros efectos.

La pinna está compuesta por una estructura de cartílagos, cubiertos por piel como se ha mencionado previamente. Tiene una característica en forma de relieve que difieren de un individuo a otro. Anteriormente, muchos libros indicaron que la pinna no tenía una importancia relevante para la audición, solo mencionaban sus funciones protectoras, pero hoy en día es conocido que la pinna representa una función esencial en la audición espacial y que también sirve para disipar los ruidos del viento.

La audición direccional en el plano medio es fundamentalmente diferente que la del plano horizontal. Cuando la fuente sonora esta en el plano medio, las señales en ambos oídos son idénticas; las diferencias interaurales de señal son por lo tanto raramente validas como para ayudar a una interpretación de la señal18.

� Pistas ambiguas de DIT y DII.

Los modelos direccionales, las pistas interaurales tanto de intensidad como de tiempo, no proporcionan información sobre la ubicación de la fuente sonora en el plano vertical (o para localización monoaural), ni ayudan a resolver la dificultad natural de los seres humanos para ubicaciones frente-atrás, entonces ahí entra la función de la pinna. De acuerdo a la grafica 8, se nota que una fuente sonora en la posición a podría producir teóricamente una idéntica DIT y DII a la fuente en la posición b, de la misma manera para las fuentes en posiciones x y y. Esta afirmación es únicamente teórica ya que con una persona real, las DIT y las DII nunca podrían ser completamente iguales, a menos que se asuma una cabeza esférica, y con todas sus partes perfectamente simétricas.

18 BLAUERT, Jens. Spatial hearing with one sound source. Spatial Hearing, The psychophysics of human sound localization. Revised edition. London: Cambrigge, Massachusetts, 1997, p. 52

Page 41: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Pero cuando las DIT y DIIeste ejemplo, existe una gran posibilidad de generarse confusión entre las posiciones en ausencia de un puede calcular valores idénticos de DIT y DIIpunto del espacio, en una superficie cónica extendié8), esto se llama cono de confusión en literatura. El cono de coinfluenciado el análisis y diseño de muchos estudios de localización a pesar del modelamiento simple de la cabeza. La habilidad de desambiguar fuentes del frente y por debajo, en los casos donde las hecho que surja la hipótesislocalización. Sucesivamente, el efecto una fuente sonora, pinna19.

Figura 8. Cono de confusión. (aquí,

muestran una ambigüedad en elevación).

BEGAULT, Durant. Spectral cues provided by the pinna.

Center, 2000, p.41

Acústicamente la pinna funciona como un filtro

transferencia depende de la dirección de la fuente sonora.

atributos espaciales del campo sonoro en atributos e

esto es importante en audición espacial. Los efectos acústicos de la pinna

19 BEGAULT, Durant. Spectral cues provided by the pinna. 3Center, 2000, p. 40-41.

41

DIT y DII son muy similares entre dos ubicacioneseste ejemplo, existe una gran posibilidad de generarse confusión entre las posiciones en ausencia de un punto espacial aparte de las DIT y DII.

alcular valores idénticos de DIT y DII de una fuente sonora en cualquier en una superficie cónica extendiéndose desde el oído (Figura

sto se llama cono de confusión en literatura. El cono de coinfluenciado el análisis y diseño de muchos estudios de localización a pesar del modelamiento simple de la cabeza.

La habilidad de desambiguar fuentes del frente y de la parte traseralos casos donde las DIT y DII no proveen esta información

hipótesis con respecto al rol de los puntos espectrales y la . Sucesivamente, el efecto dependiente más significativo

a medida que ésta llega a los tímpanos, es a

Cono de confusión. (aquí, a y b muestran una ambigüedad frente-atrás, y,

muestran una ambigüedad en elevación).

BEGAULT, Durant. Spectral cues provided by the pinna. En: 3-D sound for virtual reality and multimedia. California: Ames Research

Acústicamente la pinna funciona como un filtro lineal cuya función de

depende de la dirección de la fuente sonora. La pinna codifica

espaciales del campo sonoro en atributos espectrales y temporales.

en audición espacial. Los efectos acústicos de la pinna

BEGAULT, Durant. Spectral cues provided by the pinna. 3-D sound for virtual reality and multimedia. California: Ames Research

son muy similares entre dos ubicaciones, así como en este ejemplo, existe una gran posibilidad de generarse confusión entre las

. De hecho, se de una fuente sonora en cualquier

ndose desde el oído (Figura sto se llama cono de confusión en literatura. El cono de confusión ha

influenciado el análisis y diseño de muchos estudios de localización a pesar del

de la parte trasera por encima y información, ha

rol de los puntos espectrales y la más significativo para ubicar

es atribuida a la

atrás, y, x y y

California: Ames Research

cuya función de

a pinna codifica

spectrales y temporales. Por

en audición espacial. Los efectos acústicos de la pinna están

eality and multimedia. California: Ames Research

Page 42: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

42

basados en varios fenómenos acústicos tales como la reflexión,

ensombramiento, dispersión, difracción, interferencia y resonancia20.

Estas reflexiones, por ejemplo, tendrán pequeños retrasos, que cambian las

características de la señal que le llega. Pero no solo produce un cambio en el

dominio del tiempo, si no también en el de la frecuencia, dando origen a picos y

valles (notch) en el rango de frecuencias medias altas, “aproximadamente entre

4Khz y 12 Khz”21.

Pero este cambio en los dos dominios no es el mismo en todas las posiciones, por lo

tanto, estas características serán función de:

o La posición de la fuente sonora, la angulación.

o La distancia.

o del espectro de la fuente sonora emitida. Especialmente si contiene mayor

contenido en frecuencias altas.

� Pistas para localización en el plano vertical.

La pista más importante para la localización en el plano vertical son las pistas espectrales basadas en la pinna (ejemplo Batteau, 1967; Kuhn, 1987). Gardner y Gardner en 1973 demostraron que las convoluciones de la pinna son cruciales para hacer juicios de localización. Ellos mostraron que la tasa de error es incrementada sistemáticamente más y más a medida que las cavidades de las pinnas eran rellenadas (dejando la entrada al meato auditivo abierto), además , la localización declina a medida que las altas frecuencias son removidas del estimulo. También encontraron en sus estudios que la localización mejora notablemente con ruidos de banda ancha, y disminuye para ruidos de banda angosta (Roffler &Butler, 1968; Hebrank & wrighht, 1974) 22.

20 BLAUERT, Jens. Op.cit. p 63 21 RAMOS, Oscar, et al. Modelo acústico de cabeza y torso mediante análisis de componentes principales. Córdoba, Argentina: Asociación Argentina de mecánica computacional, 2007, vol. XXVI, p. 48.

22 GARDNER, Mark and GARDNER ,Robert. Problem of localization in the median plane: effect of pinna cavity occlusion. J. Acoust.

Soc. Am. February 1973. Vol 53. Received 21 June 1972, p. 400-408 .

Page 43: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

43

“Por causa de sus pequeñas dimensiones, los pliegues de la pinna proporcionan

filtrados específicos solo para altas, de modo que, cuando estas frecuencias son

removidas, la base primaria para la localización vertical es eliminada”23

, es decir,

la localización vertical precisa es observada solo cuando el estimulo tiene un amplio ancho de banda y contiene energía en frecuencias altas, por encima de 7KHz. Estos son los principales factores, puesto que hay otros relacionados con el aprendizaje que desde niños es llevado a cabo.

Batteau realizó un riguroso estudio en el cual midió los retardos ocasionados por

la pinna en diferentes ángulos azimuth y verticales, realmente R. Plante y W. Lyle

fueron los que lo midieron pero Batteau y Plante lo reprodujeron en 1962. La

figura 9 muestra estos retardos24. Batteau le dio importancia a la interferencia

entre el sonido directo y el sonido reflejado desde la pinna. Esto explica, que la

dependencia de la función de transferencia con la distancia y la dirección de la

fuente sonora es por causa de las diferencias en la trayectoria del sonido directo

y el sonido reflejado. Pero según estudios de Blauert25, no solo ocurren efectos

de reflexión, si no también dispersión, con esto se comprueba que retardos

adicionales a los descritos por Batteau son presentados.

La pinna, como se nota en el gráfico, es capaz de reflejar y retrasar sonidos durante 0 y

80 microsegundos haciendo posible la localización trasera del sonido. La otra gráfica

muestra retrasos entre 100 y 330 microsegundos, lo cual ayuda a localizar las fuentes

en el plano vertical. Para no trabajar con cifras tan pequeñas, dominio del tiempo,

siempre se opta por simular las características desde el punto de vista del dominio

frecuencial, como lo hicieron Shaw y Teranishi en 1968 al estudiar este dominio con

oídos naturales y modelados.

23 GRANTHAM, D. W. Spatial hearing and related phenomena En: Handbook of Perception and Cognition, Second Edition. Second edition London, UK: edited by B. C. J. Moore. Academic, 1995, p. 298. 24 Batteau, D. W. The role of the pinna in human localization. The Royal Society of London. Series B, Biological Sciences. Vol. 168, No. 1011. Received 2 July 1965, Revised 20 December 1966. pp. 158-180.Valido desde internet en: http://www.jstor.org/stable/75711. 25 BLAUERT, Jens. Spatial hearing with one sound source. En: Spatial Hearing, The psychophysics of human sound localization. Revised edition. London: Cambrigge, Massachusetts, 1997, p. 64.

Page 44: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Figura 9. Tiempo de retardo contra la orientación, a (Azimuth) b(Elevación).

Batteau, D. W. The role of the pinna in human localization. The Royal Society of London. Series B, Biological Sciences. Vol.

1011. Received 2 July 1965, Revised 20 December 1966.

44

. Tiempo de retardo contra la orientación, a (Azimuth) b(Elevación).

Batteau, D. W. The role of the pinna in human localization. The Royal Society of London. Series B, Biological Sciences. Vol.

1011. Received 2 July 1965, Revised 20 December 1966. pp. 158-180.Valido desde internet en: http://www.jstor.org/stable/7

Batteau, D. W. The role of the pinna in human localization. The Royal Society of London. Series B, Biological Sciences. Vol. 168, No.

180.Valido desde internet en: http://www.jstor.org/stable/75711.

Page 45: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Ahora bien, los efectos proporcionados por la pinna variaran de persona a persona puesto que los seres humanos, desde el punto de vista fisiológico, no tienen el pabellón estructuraltransferencia relativas a la cabeza (HRTF) en muchas ocasiones informaciones coherentesauditivos parecidos a

La figura 10 muestra dos respuestas en frecuencia, dependiente de la dirección, mostrando un efecto delantera, ya que la pinna es un excelente reflector cuando los emitidos desde el frente Cuesta, a frecuencias elevadas llega más tarde. la mayor interferencia ocurre, cuando la diferencia de recorrido, d, es la mitad de la longitud de onda.un rango entre 6 y 16 kHz, y

Figura 10. Respuesta en frecuencia de la pinna, con respecto a dos posiciones: Arriba y

frontal.

PÉREZ, José y DE LA CUESTA, Mariana. Sonido 3D, apartado 4.2, las coordenadas (

http://www.lpi.tel.uva.es/~nacho/docencia/ing_ond_1/traba

Experimentos muestran que la ausencia de la pinna hace que disminuya la capacidad

de localización y externalización

bien sean reproducidos con parlantes o

de la pinna y otras como la cabeza y el torso puede crear características increíbles en

una señal, por esto si se emulan correctamente estas características

26 PÉREZ, José y DE LA CUESTA, Mariana. Sonido 3D, apartado 4http://www.lpi.tel.uva.es/~nacho/docencia/ing_ond_1/trabajos_03_04/Csound/42.htm

45

os efectos proporcionados por la pinna variaran de persona a persona puesto que los seres humanos, desde el punto de vista fisiológico, no tienen el pabellón estructuralmente igual, es por esto, que las funciones de

tivas a la cabeza (HRTF) en muchas ocasiones no proporcionacoherentes, sino a aquellas personas que tengan sus aparatos

auditivos parecidos a los utilizados en la grabación, bien sean artificiales o reales.

muestra dos respuestas en frecuencia, dependiente de la dirección, mostrando un efecto más pronunciado cuando el sonido viene de la parte

ya que la pinna es un excelente reflector cuando los emitidos desde el frente más que desde arriba. Según José Pérez y Mariana de la Cuesta, a frecuencias elevadas la señal directa esta en desfase con la señal que llega más tarde. la mayor interferencia ocurre, cuando la diferencia de recorrido, d, es la mitad de la longitud de onda. la frecuencia de la muesca (Notch) está un rango entre 6 y 16 kHz, y es diferente para distintos ángulos de elevación

. Respuesta en frecuencia de la pinna, con respecto a dos posiciones: Arriba y

DE LA CUESTA, Mariana. Sonido 3D, apartado 4.2, las coordenadas (Elevación). Válido desde internet en:

http://www.lpi.tel.uva.es/~nacho/docencia/ing_ond_1/trabajos_03_04/Csound/42.htm

Experimentos muestran que la ausencia de la pinna hace que disminuya la capacidad

de localización y externalización (percepción sonora fuera de la cabeza)

bien sean reproducidos con parlantes o audífonos. De tal forma que las características

de la pinna y otras como la cabeza y el torso puede crear características increíbles en

si se emulan correctamente estas características

PÉREZ, José y DE LA CUESTA, Mariana. Sonido 3D, apartado 4.2, las coordenadas (Elevación). Válido desde internet en:

http://www.lpi.tel.uva.es/~nacho/docencia/ing_ond_1/trabajos_03_04/Csound/42.htm

os efectos proporcionados por la pinna variaran de persona a persona puesto que los seres humanos, desde el punto de vista fisiológico, no

que las funciones de no proporcionan

sino a aquellas personas que tengan sus aparatos utilizados en la grabación, bien sean artificiales o reales.

muestra dos respuestas en frecuencia, dependiente de la dirección, el sonido viene de la parte

ya que la pinna es un excelente reflector cuando los sonidos son egún José Pérez y Mariana de la

la señal directa esta en desfase con la señal que llega más tarde. la mayor interferencia ocurre, cuando la diferencia de recorrido,

de la muesca (Notch) está en de elevación26.

. Respuesta en frecuencia de la pinna, con respecto a dos posiciones: Arriba y

). Válido desde internet en:

Experimentos muestran que la ausencia de la pinna hace que disminuya la capacidad

(percepción sonora fuera de la cabeza) del sonido,

que las características

de la pinna y otras como la cabeza y el torso puede crear características increíbles en

si se emulan correctamente estas características, como lo es el

.2, las coordenadas (Elevación). Válido desde internet en:

Page 46: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

46

objetivo de este proyecto y se aplican a una señal previamente grabada, se pueden

lograr efectos de espacialización muy reales.

Se ha mencionado con mucha seguridad que la función de la pinna es básicamente en

el plano vertical, para resolver problemas frontales-traseros o para localización

monoaural, Pero se han realizado investigaciones las cuales afirman que la pinna

también ayuda a la localización horizontal y que el efecto filtrado dependiente de la

dirección por la pinna puede influenciar la localización azimutal también. Cómo por

ejemplo, los estudios de Musicant y Butler en 1984.

Lo anteriormente explicado de la pinna se hizo con referencia a los cambios

dependientes de la dirección y distancia, pero hay un punto importante y se

refiere al sonido emitido, es decir, en qué posición, dependiendo del sonido

emitido, es percibida la fuente sonora, sin importar las características de la

pinna. La frecuencia de ocurrencia del error Front/back tiende a incrementar a

medida que el ancho de banda del estimulo decrece (Butler 1986). Por ejemplo,

Makous & Middlebrooks (1990) encontraron confusiones de localización

front/back de 2-10%, para estimulo de banda ancha, dependiendo del individuo,

mientras que los sujetos tuvieron confusiones Front/Back, en más de un 20 % de

las pruebas, cuando localizan ruidos de bandas de una octava (Burger 1958).

La elevación aparente de la fuente sonora puede ser influenciada mediante la

modificación del espectro de la fuente. En un experimento Blauert (1969/1970)

grabó de los canales del oído del individuo, mientras presentaba un ruido desde

dos ubicaciones de fuente, directamente detrás o directamente enfrente del

oyente. El entonces modificó electrónicamente ambas fuentes, de modo que

cada uno imitará el espectro asociado con la posición de la fuente opuesta. Los

juicios de los oyentes acerca del lugar de la fuente fueron únicamente

determinadas por el espectro de la fuente y no influenciada por su real

ubicación. De esta manera, el oyente localizó la fuente como detrás si tenía el

espectro trasero, aun si fue reproducido por el parlante frontal. En un

experimento separado, Blauert presentó bandas de sonido por tercio de octava

desde el plano medio, y mostró que la probabilidad de las respuestas de los

sujetos a una fuente sonora ubicada al frente, arriba de la cabeza, o detrás, fue

determinada mas por la frecuencia central del estimulo que por la ubicación real

de la fuente. Un resultado similar fue reportado por Butler & Helwig (1983).

Page 47: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

47

Hebrank & Wright (1974b) encontraron que ciertas características de los filtros

rechaza banda, pasa banda y pasa alta tienden a correlacionar con elevaciones

particulares percibidas en el plano medio. Watkins (1978) procesó ruido con un

sistema de aumento y retraso que intentó imitar las reflexiones dentro de oído

externo. Estas señales fueron presentadas a los oyentes por medio de audífonos

y los oyentes ajustaron un apuntador mecánico para indicar la elevación de la

fuente sonora percibida. Las elevaciones reportadas corresponden bien a

aquellas predichas por el mecanismo propuesto por Batteau (1967)27.

� Otras pistas: movimiento de la cabeza, reflexiones del torso y de los hombros.

En la escucha diaria los seres humanos usan el movimiento de la cabeza con

sensaciones aurales y visuales en un intento por adquirir las fuentes sonoras

visualmente. por lo tanto, una fuente importante de información para la

localización es obtenida por medio del movimiento de la cabeza. Cuando los

humanos escuchan un sonido desean localizarlo, moviendo la cabeza con el fin de

minimizar las diferencias interaurales de tiempo.

Muchos estudios han mostrado que permitiéndole al oyente mover su cabeza se

puede mejorar la habilidad de localización y el numero de inversiones frente-atrás

(Wallach, 1940; Thurlow y Runge, 1967; Thurlow, Mangels y runge, 1967). Los

oyentes aparentemente integran alguna combinación de cambios de DIT y DII, así

como picos y caídas espectrales los cuales pueden ocurrir con el movimiento de la

cabeza en el tiempo.

Por otro lado basado en mediciones de HRTF, se pueden obtener resultados

relevantes con respecto a la influencia que tienen otras partes del cuerpo, como lo

son los hombros y el torso; los cuales también ayudan, aunque en menor cantidad,

a las características de filtrado y por lo tanto a la ubicación de la fuente sonora,

sobre todo en el plano medio.

27 MIDDLEBROOKS, John and GREEN, David. Annual Review of Psychology . Sound Localization by Human Listeners. January 1991, Vol. 42, Pages 135-159

Page 48: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Se indica en la figura

menos importante en la superior

correspondientes frecuencias características.

Figura 11. Descripción de Gierlich de componentes direccionales y no direccionales de la HRTF,

mostrando el rango de frecuencias mayormente afectado

GIERLICH, H. W. The application of

California: Ames Research Center, 2000, p. 40

2.2.1.7 Percepción de la distancia.

Comparados a los estudios en los planos horizontal y vertical,sido dedicada a loshabilidad de los individuosde vista evolucionarioalerta temprana” sugiere que la percepción de distancia auditiva debe ser una capacidad bien desarrollada. Muinvestigaciones previas sobre percproporcionado una discusión rigurosa dy la discriminación de la distancia por los humanos.

48

Se indica en la figura 11, desde el más importante en la parte inferior hasta el

menos importante en la superior, las pistas anteriormente mencionadas

correspondientes frecuencias características.

. Descripción de Gierlich de componentes direccionales y no direccionales de la HRTF,

mostrando el rango de frecuencias mayormente afectado.

GIERLICH, H. W. The application of binaural technology. En: Begault, Durant. 3-D sound for virtual reality and multimedia.

California: Ames Research Center, 2000, p. 40-41.

2.2.1.7 Percepción de la distancia.

Comparados a los estudios en los planos horizontal y vertical, poca atención ha os estudios de la percepción de distancia. Claramente, la

individuos para juzgar distancias es importante desde un punto de vista evolucionario y la función del sistema auditivo como un “sistema de

a temprana” sugiere que la percepción de distancia auditiva debe ser una capacidad bien desarrollada. Muchos autores han revisado algunainvestigaciones previas sobre percepción de la distancia auditivaproporcionado una discusión rigurosa de los factores que subyacen en los juicios y la discriminación de la distancia por los humanos.

, desde el más importante en la parte inferior hasta el

las pistas anteriormente mencionadas con sus

. Descripción de Gierlich de componentes direccionales y no direccionales de la HRTF,

D sound for virtual reality and multimedia.

poca atención ha estudios de la percepción de distancia. Claramente, la

para juzgar distancias es importante desde un punto y la función del sistema auditivo como un “sistema de

a temprana” sugiere que la percepción de distancia auditiva debe ser una chos autores han revisado algunas de las

epción de la distancia auditiva, y han e los factores que subyacen en los juicios

Page 49: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

49

Estas revisiones han identificado 4 puntos para el juicios de la distancia aditiva:

� Nivel de presión sonora (entre más grande el SPL más pequeño es el juicio de la distancia).

� La cantidad de reverberación (entre más grande la relación de la energía directa a la reverberante en la señal recibida más pequeño es el juicio de la distancia).

� La forma espectral de la señal recibida (entre más grande el contenido de frecuencia alta en el estimulo, más pequeño es el juicio de la distancia, al menos para fuentes mas lejos de 1m).

� Pistas binaurales (entre más grande las DIT ó DII, más corto es el juicio de la distancia), sin embargo, la evidencia sobre este último punto es inconclusa28.

La percepción de la fuentes sonoras de frecuencia alta y baja, con respecto a la

distancia, variarán dependiendo de la humedad del aire y de la temperatura. A medida

que aumenta la distancia, las frecuencias altas serán más afectadas que las bajas,

dados estos factores. Esto es fácilmente notado para distancias grandes; mayores a 10

metros.

2.3 AUDICION ESPACIAL NATURAL VERSUS VIRTUAL

Una distinción debe ser hecha entre la experiencias escuchadas en la mayoría de las actividades cotidianas del ser humano y aquellas experiencias escuchadas a través de audífonos usando un sistema de reproducción de audio. Escucha espacial natural, se refiere a cómo nosotros escuchamos los sonidos espacialmente en nuestra audición diaria, con nuestros oídos destapados, nuestra cabeza moviéndose y en interacción con otras entradas sensoriales. la imagen auditiva espacial no son confinadas a los dos oídos o a la audición espacial; la audición de un oído puede proporcionar señales espaciales, como el probado mediante la experiencia con las conversaciones telefónicas. Un caso especial de la audición binaural es la audición virtual espacial; esta se refiere a la formación de imágenes acústicas espaciales sintéticas usando un sistema sonoro 3D y audífonos estéreo.

La audición espacial natural raras veces involucra una única fuente sonora, mientras que la audición espacial virtual, con un sistema sonoro 3D involucra el posicionamiento de cada una de las fuentes sonoras individuales. El medio involucra el camino que recorre la fuente al oyente. En audición espacial natural esto involucra el contexto del ambiente (la reverberación y los efecto de los

28 GRANTHAM, D. W. Spatial hearing and related phenomena. Second edition edited by B. C. J. Moore. London, UK: Academic, 1995, p. 323

Page 50: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

50

objetos físicos en la propagación del sonido); en un sistema de sonido 3D la reproducción del sonido, procesamiento de señal, y audífonos se convierten en los mayores componentes. finalmente el receptor involucra la fisiología del oyente: el sistema auditivo desde el oído hacia la escena final, la percepción por el cerebro.

Si la fuente sonora esta dentro de un contexto ambiental sin reflexiones, por ejemplo una cámara anecóica, entonces mas allá de cierta distancia, las ondas sonoras llegan al frente del oyente como un campo plano, lo cual significa que la presión sonora será constante en cualquier plano perpendicular a la dirección de propagación. Pero dentro de contextos de ambiente no anecóicos, el sonido llega al oyente por el camino directo y el camino indirecto. El contexto del ambiente, es por consiguiente el principal componente del medio en el caso de la escucha espacial natural .

La cadena de comunicación fuente-medio-receptor para un sistema sonoro 3D hipotético (imaginado de esta manera el paso del sonido hasta el receptor) dos canales de audífonos (estéreo) son usados para reproducir una fuente sonora. dado que el ambiente real está ausente debe ser simulado en la mayoría de los casos, el ambiente es el lugar donde la fuente sonora se propaga; que en el caso reproducción por medio de audífonos no se tiene, como en la escucha natural. La fuente debe ser convertida de energía acústica a eléctrica por medio de un micrófono (en el caso de reproducción por audífonos, el receptor ya no está moviendo su cabeza en el mismo ambiente). En vez de esto, una pareja de transductores, en la forma de audífonos ubicados contra los oídos externos, se convierten en la real fuente y el medio. Este tipo de interacción afectará el campo sonoro de llegada de modo diferente que con la audición espacial natural29.

2.3.1 Lateralización. Una grabación estéreo escuchada a través de audífonos

generalmente da la impresión que:

� El sonido parece provenir dentro de la cabeza, Inside-the-head-localization

� Hay una cierta sensación de espacio, al menos a lo largo de dimensión extendida

entre los oídos.

29 BEGAULT, Durant. Virtual auditory space: context, acoustics and psychoacoustics.3-D sound for virtual reality and multimedia. California: Ames Research Center, 2000, p. 4-6

Page 51: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

51

De esta manera, un violín podría aparecer en el oído izquierdo, mientras simultáneamente la voz de un cantante podría aparecer entre el centro de la cabeza y el oído derecho. La percepción dentro de la cabeza de tales sonidos presentados por audífonos es referido a como internalización de la imagen (imágenes) sonora; la ubicación diferencial de la imagen sonora a lo largo de la línea imaginaria entre los oídos es referida como una lateralización de la imagen. En contraste, cuando un sonido es presentado desde un parlante, el sonido percibido es generalmente descrito como externalizado (afuera de la cabeza) y la descripción de su posición subjetiva es una tarea de localización. Aunque con parlantes también se pueden tener problemas de internalización, cuando son reproducidos en ambientes anecóicos.

Un sonido presentado idénticamente a los dos oídos a través de audífonos (un estimulo diótico) es usualmente lateralizado en el centro de la cabeza. La imagen puede ser movida hacia el oído derecho de dos formas diferentes: introduciendo un tiempo de retardo a la entrada del oído izquierdo, o haciendo la señal del oído derecho más intensa que la del oído izquierdo30.

los estudios de lateralización dan como resultado localización dentro de la cabeza (IHL,

inside-the-head-localization). IHL ocurre con las técnicas de sonido 3-D, especialmente

sin reverberación. Plenge en 1972, concluyó “que una situación en la cual la IHL

siempre ocurre es cuando el individuo tiene información o información deficiente

acerca de la fuente sonora y el entorno espacial, aunque no hay que descartar las

funciones de la pinna”31

. Como lo indican Reichardt Y Haustein cuando sugieren que

“la eliminación o alteración de los efectos acústicos de la pinna pueden llevar a las

IHL”32

.

“Esto es particularmente importante, ya que la reproducción de audífonos es superior

a la de los parlantes por la trasmisión de la imagen acústica virtual en tres

dimensiones; usualmente las fuentes sonora en parlantes son escuchadas afuera de la

cabeza, pero algunas veces fuentes sonoras reales externas producen IHL, y algunos

sonidos pueden ser ubicados afuera y luego adentro de la cabeza a voluntad. Hanson y

30 GRANTHAM, Wesley. Spatial hearing and related phenomena .Handbook of Perception and Cognition, Second Edition. Second

edition London, UK: edited by B. C. J. Moore. Academic, 1995, p. 298

31 BLAUERT, Jens. Spatial hearing with one sound source. En: Spatial Hearing, The psychophysics of human sound localization. Revised edition. London: Cambrigge, Massachusetts, 1997, p. 133. 32 BLAUERT, Jens. Spatial hearing with one sound source. En: Spatial Hearing, The psychophysics of human sound localization. Revised edition. London: Cambrigge, Massachusetts, 1997, p. 137.

Page 52: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

52

Kock en 1957 obtuvieron IHL con dos parlantes en una cámara anecóica; se reprodujo

la misma señal pero 180 grados fuera de fase”33.

“Durlach y Colburn, han mencionado que la externalización de una fuente sonora es

difícil de predecir con precisión, pero “claramente se incrementa a medida que la

estimulación se aproxima más y más a la estimulación natural”; incluyendo atributos

interaurales naturales cómo las HRTF binaural, movimientos de cabeza y

reverberación. Muchos investigadores han descartado teorías la cuales mencionan que

la IHL es una consecuencia natural de la escucha por medio de audífonos (debido a la

conducción ósea o la presión sobre la cabeza), simplemente porque sonidos

externalizados son escuchados a través de audífonos en muchos casos”34.

La meta de eliminar el efecto IHL se incrementó en 1970 con el deseo de hacer grabaciones binaurales mejoradas (Cabeza dummy). Muchos quienes escuchan estas grabaciones son trastornados por el hecho de que el sonido queda dentro de la cabeza como con la lateralización. Realizando el mismo filtrado de la pinna y haciendo replicas tanto de ella como de la cabeza fueron encontradas por ser de importante consideración. Plenge en 1974 comparó grabaciones hechas con un único micrófono a aquellos hechos con cabezas dummy con pinnas artificiales. La IHL que ocurrieron con un único micrófono, desaparecieron con el arreglo de cabeza dummy. Interesantemente, este estudio también mostró que las IHL y la externalización pueden ocurrir simultáneamente35.

Usando ruidos de banda ancha tales como estallidos de ruido blanco mejora la externalización, esto sugiere por lo tanto que la externalización puede depender de la fuente sonora por sí misma y la manera en la cual interactúa con la HRTF; el ruido blanco contiene un espectro de frecuencia de banda ancha afectada por el rango de frecuencias completo de la HRTF, mientras que la voz es de banda limitada en frecuencias altas. Pero por otro lado fuentes sonoras familiares (por ejemplo el habla) han sido citadas porque producen distancias más precisas. La reverberación, bien sea natural o artificial, realza la externalización del sonido 3-D mediante audífonos. De esta manera parece que en un ambiente acústico virtual, la inclusión no solo del camino directo si no del reflejado, es necesario para la simulación realista36.

33HANSON, R.L., AND KOCK, W.E. Intereting effect produced by two loudspeakers under free space condición. BEGAULT. Citado en: 3-D sound for virtual reality and multimedia. California: Ames Research Center, 2000, p. 79-80 34 DURLACH, N. I., and COLBURN, H. S. Binaural phenomena. En: Begault, Durant. 3-D sound for virtual reality and multimedia. California: Ames Research Center, 2000, p. 80. 35 PLENGE, G. On the difference between localization and lateralization. Citado en: Begault, Durant. 3-D sound for virtual reality and multimedia. California: Ames Research Center, 2000, p. 80. 36 BEGAULT, Durant.Overview of spatial hearing: 3-D sound for virtual reality and multimedia. California: Ames Research Center, 2000, p. 79-80

Page 53: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

53

2.3.2 Función de transferencia relativa a la cabeza.

El filtrado especial de una fuente sonora antes que este llegue al tímpano, causado principalmente por el oído externo, es llamado función de transferencia relativa a la cabeza (HRTF). La HRTF binaural (terminología referida a la HRTF de ambos oídos, tanto el izquierdo como el derecho) pueden ser pensados como unas diferencias de retardo y de amplitud dependientes de la frecuencia, que resultan de la compleja configuración de la pinna.

Los pliegues de la pinna causan diminutos retardos de tiempo en un rango de 0-300 µsec modifcando significativamente el contenido espectral que llega al tímpano respecto a la fuente sonora si fuera medida, por ejemplo, por un micrófono omnidireccional. La asimetría de la forma de la pinna causa modificación al espectro, afectándolo como función de la posición de la fuente sonora. Tanto la asimétria, cómo la compleja construcción de los oídos externos, causan una única configuración de retrasos de microtiempos, resonancias y difracción; como fue explicado anteriormente, cuando se realizó la descripción de la pinna.

Hay diferencias de amplitud y tiempo dependientes de la frecuencia, los cuales son impuestos para una señal que proviene de una posición de fuente dada. Como una "huella acústica", el HRTF altera el espectro y el tiempo de la señal de entrada en función de la ubicación. El uso de la HRTF de la configuración de la pinna es típicamente caracterizado como el componente principal del sistema de sonido 3-D, tanto para mediciones directas como para modelado. Esto es basado sobre la teoría que dice que el medio más preciso para producir informacion para sonido espacial, es transformar el espectro de la fuente sonora en el tímpano tanto como sea posible a como sería transformado bajo condiciones de audición espacial normal37.

37 BEGAULT. Op cit., p.41

Page 54: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

54

2.3.3 Grabación binaural y la Cabeza artificial.

Grabaciones binaurales (dos oídos) empiezan con una cabeza artificial o dummy head, aunque muchas mediciones se han realizado con personas reales. Este es un modelo de una cabeza humana con dos micrófonos montados en cada oído. Estos micrófonos capturan el sonido proveniente de cada oído. Cuando esta grabación es reproducida por medio de audífonos, los oídos escuchan las señales que originalmente aparecieron en los oídos de la cabeza dummy; esto quiere decir, que el sonido original en cada oído es reproducido.

Las grabaciones binaurales, trabajan sobre la siguiente premisa: cuando los humanos escuchan un sonido natural en cualquier dirección, la entrada a los oídos son solo señales unidimensionales; la presión sonora en los tímpanos. Si nosotros podemos recrear la misma presión en los tímpanos del oyente como la que ocurre en la realidad, se puede reproducir la experiencia original, incluyendo información direccional y reverberación.

Grabaciones binaurales con reproducción por medio de audífonos es el método espacial más conocido. La recreación de la ubicación de la fuente sonora y el ambiente del cuarto es sorprendente. Es frecuente que los sonidos sean reproducidos todos alrededor de la cabeza; en frente, abajo, arriba y así sucesivamente. El inconveniente para realizar estas grabaciones es el alto costo de las cabezas artificiales y más si ellas incluyen torso (que ayudan en localización frente-atrás). La técnica utilizada para estas grabaciones, son las ulteriormente mencionadas funciones de transferencia relativa a la cabeza HRTF, pero como en algún momento fue mencionado estas funciones de transferencia variaran de sujeto a sujeto y por lo tanto al momento de la reproducción se van a tener errores de localización para aquellas personas que tengan los pabellones auditivos muy lejanos a los de la cabeza dummy.

Físicamente, una cabeza artificial es una arreglo coincidente cercano, usando micrófonos en un límite: la cabeza es el límite y el arreglo está montado en él. Los micrófonos, en una arreglo coincidente cercano, son direccionales en todas las frecuencias y no usan pantallas acústicas entre ellos. En contraste, los micrófonos en una cabeza artificial son omnidireccionales a bajas frecuencias y unidireccionales en frecuencias altas (debido al efecto de pantalla acústica de la cabeza).

Idealmente, la cabeza artificial es tan solida como la cabeza humana, por ejemplo la cabeza de Aachen es hecha de un moldeado de alta densidad de fiberglass. Se puede sustituir la cabeza artificial por la cabeza de un humano real,

Page 55: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

55

mediante la ubicación de micrófonos miniaturas de condensador en los oídos, y grabar con ellos. De esta manera la experiencia será mucho más realista con personas reales que con cabezas artificiales, cabe resaltar que a medida que el modelado de la cabeza sea más real a la cabeza de un humano real, se tendrá más eficacia en la reproducción de estas señales38.

2.3.4 Simulación de fuentes externas a través de audífonos.

Si se ha realmente entendió todas las caracteristicas auditivas responsables para la localización de fuentes sonoras externas, entonces se debería simular las mismas configuraciones usando audífonos. Este simple, pero sorprendentemente desalentador reto es una premisa esencial del programa de investigación iniciado por Wightman & Kistler en la Universidad de Wisconsin. En sus papers (Wightman & Kistler 1989a,b), ellos resumen un programa de investigaciones, para comparar localización del sonido en campo libre y bajo audición mediante audífonos. El primer paso en este proceso es medir la función de transferencia direccional para múltiples ubicaciones de fuente sonora alrededor del oyente, seis parlantes miran al oyente sobre un arco circular que es rotado alrededor del sujeto en pasos de 15° azimuth. Los parlantes están espaciados desde -36° a +54° en elevación, en pasos de 18°. Un estimulo de banda ancha (200 Hz-14 KHz) es presentado desde cada uno de las 144 diferentes ubicaciones del sonido y las grabaciones se hacen con micrófonos miniatura ubicados en posiciones fíjas cerca a la membrana timpánica.

Una división de los espectros direccionales grabados por el espectro de la fuente produce la función de transferencia direccional del oído. Los espectros direccionales pueden ser reproducidos mediante audífonos, después de compensar la función de transferencia de los audífonos ubicados en la cabeza del oyente. Como ellos muestran en su primer artículo (Wightman& Kistler 1989,a), estos espectros simulados, medidos en la membrana timpánica, son los mismos a aquellos producidos por la fuente en campo libre dentro de unos pocos decibeles en magnitud, y unos pocos grados en fase sobre el rango de frecuencia medida. Dada la organización de una función de transferencia direccional establecida para cada oyente, Wightman & Kistler después compararon los juicios dados por los mismos individuos, en campo libre y bajo audición por audífonos. Los individuos indicaron la ubicación aparente del parlante simplemente indicando su ubicación en grados de elevación y azimuth. La conclusión general es que “los datos desde las condiciones de los audífonos son cercanamente idénticos a los datos bajos las condiciones de campo libre” (Wightman& Kistler 1989b). de esta manera, con el error de medición con estos experimentos, la función de

38 BARLETT, Bruce and BARTLETT, Jenny. Binaural and transaural techniques. On-location recording techniques. Boston: Focal Press, 1999, p. 159-162

Page 56: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

56

transferencia contiene toda la información necesitada para simular la ubicación de la fuente sonora en campo libre39.

A parte del estudio previamente mencionado, se han realizado otros estudios con

respecto a la simulación de las características de la pinna, pero sin éxito, dado que no

se cuantificaron sus valores. Con respecto a reproducción con audífonos poca atención

se ha prestado, solo cuando grabaciones binaurales son hechas, pero con otras

grabaciones estéreo convencionales no se han realizado estudios conocidos a lo largo

del desarrollo de la presente investigación.

Finalmente se llega a la descripción de la forma de captura a aplicar en ésta

investigación; las técnicas de grabación estereofónicas y sus principales propiedades,

obviamente sin dejar a un lado los conceptos anteriormente planteados, ya que

conforma un todo.

2.4 LOCALIZACIÓN DE FUENTES SONORAS VIRTUALES EN PARLANTES Y AUDIFONOS

Cuando una señal es presentada por medio de parlantes, cada oído escucha ambos parlantes. Por ejemplo, el oído izquierdo escucha la señal del parlante izquierdo, entonces, después de un corto retardo debido al camino más largo viajado, escucha la señal del parlante derecho. En cada oído, la señal de ambos parlantes se suma o se agregan vectorialmente para producir una señal resultante.

Si la señal de un canal es más fuerte en uno de los parlantes, esto es, la creación de diferencias de nivel entre los dos parlantes; sorprendentemente, esto causa unas diferencias de tiempo de llegada a los oídos. Esto es un resultado de la adición de la fase de ambas señales de los parlantes a los oídos. Hay que distinguir diferencias intercanal (entre los canales de los parlantes) de las diferencias interaurales (entre los oídos). Una diferencia intercanal de nivel no aparece como una diferencia interaural de nivel, más bien como una diferencia interaural de tiempo.

Se pueden usar estas diferencias interaurales generadas por los parlantes para ubicar imágenes, de la siguiente manera: para ubicar una imagen a 15° a un lado

39 WIGHTMAN, Frederic and KISTLER Doris. Headphone simulation of free-field listening I and II(a,b). J. Acoust. Soc. Am. February 1989. Vol 85. Received 14 May 1988, p. 858-867. Citado en: MIDDLEBROOKS, John and GREEN, David. Annual Review of Psychology . Sound Localization by Human Listeners. January 1991, Vol. 42, Pages 135-159

Page 57: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

57

por ejemplo, una fuente sonora real 15° a un lado produce diferencias interaurales de tiempo de 0.13 mseg. Si se logra que los parlantes produzcan unas diferencias de tiempo de 0.13 mseg, se escuchará la imagen 15° a un lado. Se puede engañar al sistema auditivo a creer que hay una verdadera fuente a ese ángulo y esto ocurre cuando los parlantes difieren en nivel por una cierta cantidad40.

Por lo que se refiere a localización de fuentes sonoras por medio de audífonos, se

puede utilizar el mismo principio que el de los parlantes, si se desea desplazar una

fuente sonora que esta por ejemplo en una posición 0° azimuth. Pero este

desplazamiento sería ficticio ya que se manipularía por medio de algún procesador.

Pero en el caso de reproducción tal como las de grabaciones binaurales, la imagen

percibida en una posición distinta a 0° azimuth se dan por diferencias interaurales, es

decir, se percibirán en la reproducción las diferencias interaurales tal y como se

presentaron en la grabación.

2.5 CONCEPTOS ACÚSTICOS BÁSICOS

2.5.1 Tiempo de reverberación y distancia crítica. En un recinto cerrado, cuando una

fuente sonora radia energía el sonido recorre diferentes trayectorias, el camino

directamente hacia la fuente sin ningún desvío es llamado sonido directo y los

múltiples recorridos del sonido producto de las reflexiones con las superficies del

recinto, es llamado sonido reflejado. Esta permanencia energética dadas por estas

reflexiones después que la fuente sonora es apagada, es llamada Reverberación. El

cálculo de la reverberación se realiza por medio de un parámetro llamado tiempo de

reverberación, y de define como el tiempo que toma un sonido emitido en caer 60 dB

del valor inicial.

Ahora bien, existe un término ampliamente utilizado para determinar qué valor es el

apropiado para realizar mediciones en campo difuso, de tal forma que solo se capture

el sonido directo; este término es llamado distancia crítica, y se refiere al punto en el

recinto en donde el sonido directo y el sonido reflejado tienen el mismo valor en nivel

de presión sonora, de ahí que, a distancias mayores a la distancia crítica predomina el

campo directo, y para distancias mayores, sobresale el campo reverberante.

40 BARTLETT, Bruce. Stereo Imaging theory. Stereo microphone techniques. Boston: Focal Press, 1991, p. 32-33

Page 58: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

58

2.5.2 Respuesta al impulso. La respuesta al impulso es definida como la respuesta de

un sistema frente a una señal de entrada muy breve o impulsiva. El sistema debe tener

ciertas propiedades, una de ellas es que éste debe ser Lineal e invariante en el tiempo,

LTI. Por medio de la respuesta al impulso, se pueden obtener datos como el

comportamiento de cualquier sistema, por ejemplo un recinto.

2.6 VISIÓN GENERAL DE TÉCNICAS DE MICROFONERÍA ESTÉREO

Estos métodos capturan un evento sonoro como un todo, generalmente usando solo dos o tres micrófonos. Durante la reproducción de una grabación estéreo, la imagen de instrumentos musicales por ejemplo, son escuchados en varias ubicaciones entre los altavoces estéreo. Estas imágenes están en el mismo lugar, izquierda a derecha, en la cual estuvieron los instrumentos en la sesión de grabación. Además, la verdadera microfonería estéreo expresa:

� La profundidad y distancia de cada instrumento.

� La distancia del conjunto desde el oyente (perspectiva).

� La sensación espacial del ambiente acústico, el ambiente o la reverberación de la sala.

Las grabaciones en estéreo son importantes porque conservan las características de la fuente original y de la sala tales como: Profundidad de la sala, timbre, balance de lo que se graba, sonoridad (percepción subjetiva de intensidad) entre otros factores41.

Estas características en término de reproducción por medio de audífonos y basados en

los conceptos pasados su analogía respectiva sería: la distancia de la fuente al

receptor, patrones de reverberación ocasionada por la características de la sala y la

distancia entre uno y otro instrumento en el caso de que sean varias fuentes sonoras.

41 BARTLETT, Bruce. Overview of stereo microphone techniques. Stereo microphone techniques. Boston: Focal Press, 1991, p. 20

Page 59: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

59

2.6.1 Tipos de técnicas de microfonería estéreo. Hay tres técnicas generales de

microfonería estéreo comúnmente usadas para grabaciones estereofónicas: técnicas

par coincidente, par espaciado y par coincidente cercano. Una cuarta técnica usa

apantallamientos omnidireccionales o una cabeza artificial.

2.6.1.1 Par coincidente. Con el método par coincidente (XY o método estéreo de

intensidad), dos micrófonos direccionales, con sus diafragmas uno encima del otro.

Entre más grande sea la angulación entre los micrófono y el patrón polar sea angosto,

la difusión estéreo será más amplia

Dependiendo de la ubicación de la señal sonora, se tendrá mucho mas nivel en la señal

del micrófono que esté más cerca a éste. Es decir, trabaja bajo el principio de

diferencias de nivel o amplitud entre canales.

Los métodos de par coincidente entre otros son: Blumlein (micrófonos bidireccionales

angulados 90°), cardiodes XY, hipercardioides XY, micrófonos Shotgun XY, MS (mid-

side).

“Una grabación hecha con técnicas coincidentes son monocompatibles, esto quiere

decir, que la respuesta en frecuencia es la misma en mono o en estéreo. Debido a la

ubicación coincidente, no hay diferencias de tiempo o fase entre los canales”42

. La

configuración par coincidente es mostrada en la figura 12.

42

BARTLETT, Bruce. Overview of stereo microphone techniques. En: Stereo microphone techniques. Boston: Focal Press, 1991, p.

14

Page 60: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Figura12. Representación configuración par coincidente

2.6.1.2 Par espaciado. Esta técnica también llamada A

amplia de un par de micrófonos

omnidireccionales. A medida que es incrementado

se tendrá una mayor difusión.

principio de retardos, ya que si una fuente sonora se encuentra

micrófono que a otro, el micrófono

ahora bien, si una fuente sonora esta en el centr

con iguales retardos a los dos micrófonos.

Si se requiere desplazar la imagen totalmente hacia un lado, el retardo es de 1.5

milisegundos entre un canal y otro; no se debe confundir con diferencias interaurales,

el término adecuado en este caso es

Una ventaja en este tipo de técnica es la sensación de ambiente, es decir, dado su

espaciamiento se pueden percibir significativamente las propiedades del lugar de

grabación como por ejemplo la reverberación. Pero

y ésta se puede mirar como su principal desventaja.

60

Representación configuración par coincidente

. Esta técnica también llamada A-B, se basa en una separación

amplia de un par de micrófonos, generalmente con patrones po

A medida que es incrementado el espaciamiento entre micrófonos

se tendrá una mayor difusión. Las configuraciones par espaciado trabajan bajo el

principio de retardos, ya que si una fuente sonora se encuentra más

que a otro, el micrófono más cercano a la fuente sonora llegará primero,

ahora bien, si una fuente sonora esta en el centro del par de micrófonos, ésta llegará

con iguales retardos a los dos micrófonos.

Si se requiere desplazar la imagen totalmente hacia un lado, el retardo es de 1.5

milisegundos entre un canal y otro; no se debe confundir con diferencias interaurales,

o adecuado en este caso es diferencias intercanales.

Una ventaja en este tipo de técnica es la sensación de ambiente, es decir, dado su

espaciamiento se pueden percibir significativamente las propiedades del lugar de

grabación como por ejemplo la reverberación. Pero la localización de fuentes es difícil

ta se puede mirar como su principal desventaja.

B, se basa en una separación

, generalmente con patrones polares

el espaciamiento entre micrófonos

espaciado trabajan bajo el

más cerca a un

cercano a la fuente sonora llegará primero,

par de micrófonos, ésta llegará

Si se requiere desplazar la imagen totalmente hacia un lado, el retardo es de 1.5

milisegundos entre un canal y otro; no se debe confundir con diferencias interaurales,

Una ventaja en este tipo de técnica es la sensación de ambiente, es decir, dado su

espaciamiento se pueden percibir significativamente las propiedades del lugar de

la localización de fuentes es difícil

Page 61: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Las técnicas de microfonería

micrófonos omnidireccionales

espaciados 304.8 cm, Tres

figura 13 ilustra esta técnica.

Figura13. Representación configuración par espaciado

2.6.1.3 Par coincidente cercano

micrófonos direccionales con un

específica, horizontalmente

diferencias de nivel como de fase: las diferencias de tiempo por el espaciamiento entre

micrófonos y las diferencias de nivel inter

Se puede manipular el espaciamiento para lograr ciertos cambios en la percepción de

la imagen sonora. si se incrementa un poco la separación entre los micrófonos la

difusión estéreo se incrementa, así como también la

Los ejemplos más comunes del método coincidente cercano es el sistema ORTF, el cual

usa dos micrófonos cardioide

(ORTF son las siglas de oficina de radi

61

Las técnicas de microfonería mayormente utilizadas con esta estructura son:

direccionales espaciados 91.44 cm, micrófonos omnidireccionales

espaciados 304.8 cm, Tres micrófonos omnidireccionales espaciados 152.4 cm.

ilustra esta técnica.

Representación configuración par espaciado

Par coincidente cercano. Esta distribución se basa en la ubicación de dos

micrófonos direccionales con un ángulo de separación entre ellos, a una distancia

horizontalmente. Esto micrófonos dada su disposición, presenta tanto

diferencias de nivel como de fase: las diferencias de tiempo por el espaciamiento entre

micrófonos y las diferencias de nivel intercanal por la angulación de los mismos.

Se puede manipular el espaciamiento para lograr ciertos cambios en la percepción de

la imagen sonora. si se incrementa un poco la separación entre los micrófonos la

difusión estéreo se incrementa, así como también la profundidad de la grabación.

Los ejemplos más comunes del método coincidente cercano es el sistema ORTF, el cual

usa dos micrófonos cardioides angulados 110° y espaciados 17 cm horizontalmente

(ORTF son las siglas de oficina de radiodifusión y televisión francesa;

mayormente utilizadas con esta estructura son:

micrófonos omnidireccionales

ciados 152.4 cm. La

ubicación de dos

de separación entre ellos, a una distancia

dada su disposición, presenta tanto

diferencias de nivel como de fase: las diferencias de tiempo por el espaciamiento entre

canal por la angulación de los mismos.

Se puede manipular el espaciamiento para lograr ciertos cambios en la percepción de

la imagen sonora. si se incrementa un poco la separación entre los micrófonos la

profundidad de la grabación.

Los ejemplos más comunes del método coincidente cercano es el sistema ORTF, el cual

y espaciados 17 cm horizontalmente

francesa; organización

Page 62: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

francesa de televisión

Broadcasting Foundation, se trata de micrófonos cardiodes s

30 cm. Otra técnica es

micrófonos omnidireccionales

configuración. Tanto la ORTF como la Jecklin Disk serán explicadas con mayor detalle

porque son las técnicas a aplicar en este proyecto.

Figura14. Representación configuración par coincidente cercano

� Técnica de Microfonería estéreo ORTF

cardioides de primer orden, con una separación entre sus diafragmas de 17 cm

ángulo entre los ejes de sus cápsulas de 110°.

ser ideada en la oficina de radio y televisión francesa) es muy apropiada para

reproducir señales estéreo muy similares a aquellas que usa el oído humano para

percibir información en el plano horizontal, y el ángul

direccionales emula el efecto sombra de la cabeza humana. Es una de las técnicas de

grabación estéreo más usada en comparación con las otras técnicas de grabación

estéreo.

62

francesa de televisión). También el sistema NOS, propuesto por The Dutch

Broadcasting Foundation, se trata de micrófonos cardiodes separados 90°

técnica es la OSS (Optimal Stereo Signal o Jecklin disk), la

micrófonos omnidireccionales espaciados 16.5 cm. En figura 14 se presenta esta

Tanto la ORTF como la Jecklin Disk serán explicadas con mayor detalle

porque son las técnicas a aplicar en este proyecto.

ción configuración par coincidente cercano

Técnica de Microfonería estéreo ORTF. Esta técnica usa dos pequeños micrófonos

de primer orden, con una separación entre sus diafragmas de 17 cm

os ejes de sus cápsulas de 110°. La técnica estéreo ORTF (llamada así por

ser ideada en la oficina de radio y televisión francesa) es muy apropiada para

reproducir señales estéreo muy similares a aquellas que usa el oído humano para

percibir información en el plano horizontal, y el ángulo entre los dos micrófonos

direccionales emula el efecto sombra de la cabeza humana. Es una de las técnicas de

grabación estéreo más usada en comparación con las otras técnicas de grabación

ambién el sistema NOS, propuesto por The Dutch

eparados 90° espaciados

la cual utiliza dos

se presenta esta

Tanto la ORTF como la Jecklin Disk serán explicadas con mayor detalle

Esta técnica usa dos pequeños micrófonos

de primer orden, con una separación entre sus diafragmas de 17 cm y un

ORTF (llamada así por

ser ideada en la oficina de radio y televisión francesa) es muy apropiada para

reproducir señales estéreo muy similares a aquellas que usa el oído humano para

o entre los dos micrófonos

direccionales emula el efecto sombra de la cabeza humana. Es una de las técnicas de

grabación estéreo más usada en comparación con las otras técnicas de grabación

Page 63: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

� Características principales de la técnica ORTF:

Esta técnica provee imagen. El origen del sistema ORTF fue descriespaciamiento de 17 cm fue escogido porque provee de mejor estabilidad de imagen con el movimiento imagen sobre todo cuando es usado con el espaciamiento de 17cm. entre micrófonos es menor que 110°entre los altavoces; si el ángulo es mayor que 110°débil. La posición de la imagen ORTF varía con la frecuenciamuestra el arreglo.

Figura 15. Configuración técnica de microfonería ORTF

� Estéreo Apantallado ("Jecklin Disk").

Estéreo apantallado se refiere a técnicas estereofónicas que utilizan una

aislante para realzar la separación entre los canales de la señal estéreo. Cuando

esta pantalla es colocada en la mitad de los dos micrófonos

espaciado como A-B, DIN o NOS, el efecto sombra provocado por la pantalla

provocará cierto grado de realce en la separación de canales

construida con un material acústicam

cambien las características del sonido.

43 BARTLETT, Bruce. Op.cit,. p. 62

63

Características principales de la técnica ORTF:

Esta técnica provee una localización exacta del sonido así como l origen del sistema ORTF fue descrito por R. Contamines y e

espaciamiento de 17 cm fue escogido porque provee de mejor estabilidad de imagen con el movimiento de la cabeza. El ángulo de 110° da una precisión en la

cuando es usado con el espaciamiento de 17cm. tre micrófonos es menor que 110° el sonido no se extiende del igual forma

; si el ángulo es mayor que 110° la imagen central se débil. La posición de la imagen ORTF varía con la frecuencia43. La

. Configuración técnica de microfonería ORTF

eo Apantallado ("Jecklin Disk").

Estéreo apantallado se refiere a técnicas estereofónicas que utilizan una

aislante para realzar la separación entre los canales de la señal estéreo. Cuando

esta pantalla es colocada en la mitad de los dos micrófonos de un

B, DIN o NOS, el efecto sombra provocado por la pantalla

provocará cierto grado de realce en la separación de canales. La pantalla

con un material acústicamente absorbente con el fin de evitar que

cambien las características del sonido.

nitidez de la to por R. Contamines y el

espaciamiento de 17 cm fue escogido porque provee de mejor estabilidad de da una precisión en la

cuando es usado con el espaciamiento de 17cm. Si el ángulo el sonido no se extiende del igual forma

imagen central se vuelve . La figura 15

Estéreo apantallado se refiere a técnicas estereofónicas que utilizan una pantalla

aislante para realzar la separación entre los canales de la señal estéreo. Cuando

de un sistema

B, DIN o NOS, el efecto sombra provocado por la pantalla

La pantalla debe ser

ente absorbente con el fin de evitar que

Page 64: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

64

Un caso particular de esta técnica es el denominado señal estéreo óptima

(Optimal Stereo Signal) o Jecklin Disk " esta técnica fue creada por Josephson

Electronics, consta de dos micros omnidireccionales separados 16.5cm con una

pantalla de unos 30 cm situada entre ellos. La pantalla es un disco rígido

recubierto de material absorbente y el ángulo desde el eje central a cada

micrófono es de unos 20°. La pantalla también puede ser una esfera rígida con los

micrófonos empotrados, formando el mismo ángulo y distancias opuestas.

Otra variante es usar micrófonos de gradiente de presión separados la distancia de

los oídos con la pantalla absorbente entre ellos, etc. El sistema OSS es también

llamado cuasi-binaural, porque el sistema de audición humana usa también dos

“micrófonos” omnidireccionales separados por una pantalla (la cabeza).

� Características principales de la técnica OSS (Optimal Stéreo Signal):

Por debajo de 200Hz, ambos micrófonos reciben la misma amplitud, y el arreglo actúa como dos micrófonos omnidireccionales con poco espaciamiento entre ellos, cuando la frecuencia es incrementada la pantalla se convierte en una barrera para el sonido, haciendo al arreglo progresivamente direccional. A altas frecuencias, el arreglo actúa como el par casi coincidente subcardioide angulado 180°. Dado que ambos canales reciben el mismo nivel de señal en frecuencias bajas, la localización estéreo se debe al espaciamiento de las cápsulas, el cual causa un retardo dependiente de la dirección44. Esta configuración es mostrada en la figura 16.

44 BARTLETT, Bruce. Op.cit,. p. 63

Page 65: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Figura 16. Configuración técnica de microfonería Jecklin Disk

Para establecer cierto tipo de validación se ha recurrido a la indagación de estudios

realizados que determinen el

especialmente aquellas destinadas para esta investigación. Ya

aprovecharlas de mejor forma.

2.6.2 Comparación de técnicas estereofónicas de microfonería.

2.6.2.1 Michael Williams

sonido estereofónico” (1987).

Michael Williams calculó el ángulo de grabación y la desviación estándar de varias técnicas microfónicas. Se define ángulo de grabación (recording angle) como el ángulo que estéreo desde el parlante izquierdo hasta el parlante derecho. Es el ancho angular del ensamble ejecutor visto por el arreglo de micrófonos que causa una apertura estéreo total.

La Desviación Estándar es la distorsión geométrica del escenario sonoro. Cuanto mayor sea el desvío en grados mayor es la separación de los instrumentos de la

65

. Configuración técnica de microfonería Jecklin Disk

Para establecer cierto tipo de validación se ha recurrido a la indagación de estudios

realizados que determinen el comportamiento de las técnicas estereofónicas,

especialmente aquellas destinadas para esta investigación. Ya

e mejor forma.

.2 Comparación de técnicas estereofónicas de microfonería.

Michael Williams, “teoría unificada de sistemas de micrófono para grabación de

” (1987).

calculó el ángulo de grabación y la desviación estándar de varias técnicas microfónicas. Se define ángulo de grabación (recording angle)

incorpore a la fuente sonora requerido para una apertura estéreo desde el parlante izquierdo hasta el parlante derecho. Es el ancho angular del ensamble ejecutor visto por el arreglo de micrófonos que causa una apertura estéreo total.

ándar es la distorsión geométrica del escenario sonoro. Cuanto mayor sea el desvío en grados mayor es la separación de los instrumentos de la

Para establecer cierto tipo de validación se ha recurrido a la indagación de estudios

e las técnicas estereofónicas,

especialmente aquellas destinadas para esta investigación. Ya que permite

unificada de sistemas de micrófono para grabación de

calculó el ángulo de grabación y la desviación estándar de varias técnicas microfónicas. Se define ángulo de grabación (recording angle)

incorpore a la fuente sonora requerido para una apertura estéreo desde el parlante izquierdo hasta el parlante derecho. Es el ancho angular del ensamble ejecutor visto por el arreglo de micrófonos que causa una

ándar es la distorsión geométrica del escenario sonoro. Cuanto mayor sea el desvío en grados mayor es la separación de los instrumentos de la

Page 66: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

66

imagen, tanto de su mitad izquierda como de su mitad derecha. Si el desvío estándar es 0°, lo instrumentos que están en el centro de la parte izquierda de la orquesta son reproducidos en el centro de la parte izquierda entre parlantes (esto es a 15° del centro para el par de gabinetes espaciados a 30°). Si el desvío estándar es muy grande generará un efecto de separación exagerada entre instrumentos.

Las siguientes comparaciones no toman en cuenta la diferencia de nivel que se genera entre un instrumento captado frente a los micrófonos y uno posicionado a extrema izquierda o a extrema derecha.

� Micrófonos Cardioides Coincidentes angulados a 90° entre sí:

o Ángulo de grabación = 180°. Esto significa que la orquesta debe formar un

semicírculo alrededor del par de micrófonos para ser reproducida desde un parlante hasta el otro.

o Desvío estándar ≈ 6°. Esto significa que un instrumento que está al centro de la mitad izquierda de la orquesta, será reproducido aproximadamente 6° más hacia la izquierda de dicha posición.

� Blumlein: o Ángulo de grabación ±45° (90° en total).

o Desvío estándar ≈ 5°.

� ORTF:

o Ángulo de grabación ±50° (100° en total).

o Desvío estándar ≈ 5°.

� NOS: o Ángulo de grabación ±40° (80° en total).

o Desvío estándar ≈ 4°.

� Micrófonos omnidireccionales espaciados 50 cm (uno del otro):

Page 67: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

67

o Ángulo de grabación ±50° (100° en total).

o Desvío estándar ≈ 8°.

2.6.2.2 Carl Ceoen, “Pruebas auditivas estereofónicas comparativas” (1972)

Carl Ceoen realizó test de audición para comparar diversas técnicas estereofónicas típicas. En su trabajo se reportan los siguientes promedios de distorsión en la resolución de cada método (foco de la imagen o agudeza)

� XY (cardioides coincidentes angulados 135°): 3°.

� MS: (equivalentes a hipercardioides coincidentes angulados 90°): 5.5°.

� Blumlein: 4°.

� ORTF: 3°.

� NOS: 4º.

Según la investigación de Ceoen, la audiencia coincidió en que el sistema ORTF ofrecía los mejores resultados y que el sistema MS carecía de intimidad.

2.6.2.3 Benjamin Bernfeld y Bennet Smith, “Modelo de sistemas estereofónicos con

ayuda computacional” (1978).

Bernfeld & Smith computaron la ubicación de la imagen en función de la frecuencia para varias técnicas de captación estéreo. Cuanto mejor sea la coincidencia con la ubicación de la imagen a varias frecuencias, se dice que la imagen tiene mayor agudeza. A continuación se presentan los resultados sintetizados:

� Blumlein: el foco de la imagen es bueno excepto cerca de los parlantes; allí las altas frecuencias son reproducidas más ensanchadas que las bajas frecuencias.

Page 68: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

68

� Cardioides Coincidentes angulados a 90°: el foco de la imagen es muy bueno pero la amplitud estéreo es muy angosta.

� Cardioides Coincidentes angulados a 120°: el foco de la imagen es ligeramente bueno, pero la amplitud estéreo es angosta.

� Hipercardioides Coincidentes angulados a 120°: el foco de la imagen es bueno pero no excelente, debido a que frecuencias alrededor de los 3 Khz son reproducidas con mayor ensanchamiento que las bajas frecuencias.

� Blumlein compensados con un circuito Shuffler (Ecualización Espacial): muy buen foco de imagen y amplitud estéreo.

� ORTF con micrófonos cardioides: buen foco de imagen; las bajas frecuencias

tienen una apertura más angosta respecto de las altas frecuencias. � ORTF con micrófonos hipercardioides: buen foco de imagen; las bajas frecuencias

tienen una apertura más angosta respecto de las altas frecuencias, pero presentan mayor separación estéreo que la anterior.

� Dos micrófonos omnidireccionales espaciados 3m uno de otro: pobre foco de

imagen; las altas frecuencias tienen una mayor amplitud angular respecto de las bajas frecuencias. Presenta un efecto de separación exagerado.

� Tres micrófonos cardioides espaciados 1.5m uno de otro: pobre foco de imagen

con una exagerada separación en las altas frecuencias.

2.6.2.4 C. Huggonet y J. Jouhaneau, “”comparación de la funciones de transferencia

espacial de seis sistemas estereofónicos” (1987).

Huggonet y jouhaneau usaron tono estallido modulado en varias frecuencias, más un violín como pruebas de escucha, para comparar la función de transferencia espacial de seis sistemas estereofónicos diferentes, cada sistema tiene una dispersión angular (difusión de la imagen) que depende de la frecuencia. En general, la dispersión angular de sistema coincidente fue poca. El arreglo blumlein tiene la imagen más aguda, la cabeza dummy y el sistema NOS la peor, la cabeza dummy presento la mejor percepción de profundidad, seguida de la ORTF. La MS dió la peor percepción de profundidad.

Page 69: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

69

2.6.2.5 Wieslaw woszcyk, “un nuevo método para realzamiento espacial en

grabaciones estéreo y surround” (1990).

Usando como fuente sonora una voz femenina y un grabador soprano, se toma la fuente con muchos arreglos estéreo en un campo difuso se realiza un test de escucha con los ojos tapados, usando un par estéreo de micrófonos y un sistema Dolby Surround. El último sistema usó parlantes derecho e izquierdo, un parlante central frontal, un parlante central trasero y unos parlantes surround izquierdo y derecho.Los resultados son brevemente resumidos.

En general, la escucha por medio de Dolby surround reduce la separación estéreo (el ancho del escenario) por causa del parlante central. Las técnicas de microfonería para Dolby surround deberían ser optimizadas para contrarrestar este efecto.

En estas descripciones, el ancho del escenario significa la percepción del ancho del escenario (alrededor de 865° enfrente del par de micrófono) los efectos espaciales, significan la percepción de espacialidad del salón de conciertos.

� XY angula 90º: un ancho del escenario angosta y un efecto espacial angosto.

� XY angulados 180º extremadamente ancho el ancho del escenario y una imagen central débil en estéreo, pero bastante precisa en surround. Este método trajo el mejor efecto espacial de la prueba de auditivas: amplia intensa y natural.

� ORTF con cardioides: bastante preciso el ancho del escenario en estéreo pero mucho más angosta en surround, efecto espacial angosto.

� ORTF con hipercardioides: amplio el ancho del escenario y un efecto espacial separado.

� Blumlein: ancho del escenario preciso por encima de 845° en estéreo, ligeramente mas angosta en Dolby surround. Efecto espacial ancho y suave.

� Parejas de omnis espaciados 14”: un tanto angosto el ancho del escenario , aun menos en surround. Efecto espacial suave y natural.

� Cabezas dummy: amplio el ancho del escenario, más angosto en surround. Efecto espacial superior: amplio y suave.

Page 70: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

70

� PZM ( dos bafles rígidos de 18” x29” angulados 45°): demasiado amplio el ancho del escenario en estéreo pero precisa en surround. Efecto espacial natural y superior. Algo así como coloración de raza blanca45.

Como se planteo previamente, la técnica ORTF en su mayoría, presento resultados

favorables, buena profundidad y precisión. Aunque cabe resaltar que presenta

deficiencias en bajas frecuencias de acuerdo a estos estudios.

45 BARLETT, Bruce. BARTLETT, Jenny. Specific free-field stereo microphone techniques. On-location recording techniques. Boston: Focal Press, 1999, p. 136-141

Page 71: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

71

3. METODOLOGÍA

3.1 ENFOQUE DE LA INVESTIGACIÓN

El método empírico analítico es un modelo de investigación científica cuyo principal

enfoque es la experimentación, el cual está abierto a la incorporación de novedosos

conocimientos y procedimientos para explicar un fenómeno en particular.

en la presente investigación se busca explorar e implementar nuevas herramientas

tecnológicas para la creación de espacios tridimensionales, así como herramientas

acústicas para crear resultados satisfactorios. El enfoque de la investigación es

considerado como empírico-analítico ya que está basado en la explicación de un

fenómeno y la aplicación de modelos acústico-matemáticos para su emulación,

comprobándolo auditivamente por medio de valoraciones subjetivas.

3.2 LÍNEA DE INVESTIGACIÓN DE USB/ SUB-LÍNEA DE FACULTAD/CAMPO TEMÁTICO

DEL PROGRAMA

La línea de investigación se enuncia por medio de las tecnologías actuales y sociedad,

con el fin de proporcionar conocimientos y mecanismos que sean útiles a la

comunidad, como la obtención de componentes que permitan anexarle características

excepcionales a los métodos de captura existentes.

Esta línea de investigación en particular hace énfasis en la implementación de nuevos

herramientas, permitiéndole así a la sociedad contar con un mayor número de

posibilidades para trabajar un mismo tema. Es por esto que el objetivo primario de

esta investigación es buscar esas posibilidades.

La sublínea de facultad competente para esta investigación es procesamiento de

señales digitales y/o analógicas, ya que el registro, la manipulación, la reproducción

de la señal en el dominio del tiempo y la frecuencia son propios de este segmento y se

encuentran relacionados con el proyecto.

Page 72: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

72

En la emulación de espacios tridimensionales se necesita, para el caso en particular de

este proyecto, la aplicación de técnicas de microfonería estéreo, para lo cual, se deben

tener conocimientos previos tales como, técnicas de grabación y manipulación del

sonido, de tal forma que se logren mejores efectos con herramientas existentes o con

la creación de nuevas, dando pie a la innovación tecnológica. Por tal motivo el campo

de diseño de sistemas de sonido es el adecuado.

3.3 TÉCNICAS DE RECOLECCIÓN DE INFORMACIÓN

Los datos que se utilizan para validar este estudio, se obtienen mediante libros,

revistas e internet en lo que se refiere a teoría. Ahora bien, para cuantificar la

investigación se realizan una sucesión de mediciones que serán verificadas por medio

de una evaluación subjetiva, cuyo fin es la comprobación de resultados. Ésta es

aplicada profesores con experiencia en sonido y estudiantes de ingeniería de sonido.

En primer lugar, un procedimiento en particular fue realizado para reunir datos que, de

forma directa, complementan los objetivos de la investigación. La obtención del

tiempo de reverberación de un recinto (estudio híbrido) es efectuada, por medio de la

respuesta al impulso, esto con el objeto de entender las condiciones del lugar y su

comportamiento en un amplio rango de frecuencias, y así, dar un juicio más objetivo

cuando las grabaciones a las que se hará alusión posteriormente fueran llevadas a

cabo. Es decir, al conocer cómo funciona el entorno de captura, se puede establecer

con certeza que características corresponden a la grabaciones realizadas y cuales

pertenecen al recinto como tal. También, se pudo obtener la distancia crítica del

recinto, dato relevante para poder realizar las mediciones en campo directo y no en

reverberado en caso de que la medición lo ameritara.

Por lo que se refiere a Medidas recopiladas para la finalidad del presente proyecto se

encuentran las siguientes:

Grabación de técnicas Estereofónicas, ORTF y Jecklin Disk, Para determinar qué

diferencias de tiempo y de nivel intertransductores son producidas en estas

configuraciones, a partir, de la emisión de distintas fuentes sonoras.

Medición de respuesta al impulso de una pinna artificial diseñada previamente, de

manera que se obtengan datos relevantes para localización en el plano vertical, sin

Page 73: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

73

descartar aquella información que pueda ser proporcionada en otras posiciones

(azimuth).

Grabación de instrumentos, voces y sonidos cotidianos para el ser humano

mediante el uso de técnicas estereofónicas ORTF y Jecklin Disk.

Grabación binaural, en múltiples posiciones de fuente, con pequeños micrófonos

ubicados en el canal auditivo de un oyente real. Esta grabación será comparada

con las técnicas estereofónicas ORTF y Jecklin Disk, éstas últimas con el filtrado de

la pinna artificial.

3.4 POBLACIÓN Y MUESTRA

Un grupo pequeño de personas es requerido para certificar la coherencia

correspondiente a los resultados obtenidos. La evaluación de 15 individuos se

considera adecuada y suficiente para esta comprobación, ya que cada prueba requiere

de un periodo de 50 minutos, para un total de 12.5 horas. Éste tiempo se encuentra

sujeto a la disponibilidad de los laboratorios de sonido de la Universidad, debido a que

es el lugar adecuado para realizar esta prueba; por su aislamiento sonoro, factor

importante para la concentración de la personas a evaluar.

La población básicamente son personas con cierto grado de entrenamiento auditivo,

como lo son, estudiantes de ingeniería de sonido, profesores y auxiliares de

laboratorio de sonido.

3.5 HIPÓTESIS

Cada una de las configuraciones estéreo utilizadas, la ORTF y la estéreo apantallado

(Jecklin Disk), pretenden simular la distancia que hay entre los dos oídos, por lo tanto,

las capturas hechas mediante estas técnicas serán semejantes a las del oído humano,

es decir, como las percibiría normalmente en el plano horizontal. ahora bien, para

crear la impresión de desplazamiento vertical se puede realizar algún tipo de

manipulación natural o artificial de la señal.

Todo esto da como resultado la percepción del campo sonoro, como los obtenidos

mediante las capturas binaurales pero a bajo costo.

Page 74: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

74

3.6 VARIABLES

3.6.1 Variables Independientes

Ruido eléctrico y relación señal/ruido en el micrófono.

Respuesta al impulso de la pinna en condiciones no ideales.

3.6.2 variables Dependientes

Fidelidad de la información capturada por causa del comportamiento del micrófono y

de las condiciones de medición de la pinna.

Page 75: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

75

4. DESARROLLO INGENIERÍL

4.1 DIFERENCIAS INTERTRANSDUCTORES DE INTENSIDAD Y TIEMPO DE LAS TÉCNICAS

ORTF Y JECKLIN DISK, MEDIANTE LA VARIACIÓN DE ÁNGULOS AZIMUTH

La investigación tiene como finalidad la aplicación de técnicas estereofónicas para la

creación de percepción de espacialidad sonora. Para esto se realiza una emulación del

plano vertical mediante la extracción y aplicación de las característica de filtrado de

una pinna artificial (diseñada especialmente en esta investigación); las cuales,

mediante el proceso de convolución, serán aplicadas a las capturas realizadas. Para

lograrlo fue necesario establecer una serie de mediciones, en primer lugar determinar

las diferencias existentes entre las capsulas de los micrófonos, tanto de tiempo como

de intensidad, y con esto conocer cómo estas técnicas estereofónicas capturan el

campo sonoro con respecto, a las que el ser humano realiza en la escucha cotidiana. Ya

que la universidad no cuenta con una cámara anecóica para realizar este tipo de

medidas, se prosigue a realizarla en el laboratorio de sonido (estudio híbrido) de la

misma; pero para poderlas llevar a cabo es necesario obtener la distancia crítica del

recinto, con el propósito de realizar la captura en campo directo y así lograr datos con

mayor precisión.

Ahora bien, para obtener la distancia crítica, es necesario conocer el tiempo de

reverberación del recinto y este se consigue por medio de la respuesta al impulso. A

continuación se expone el procedimiento para adquirir estos datos:

4.1.1 Medición del tiempo de reverberación y distancia crítica, estudio híbrido

Universidad de San Buenaventura, Bogotá.

Descripción General:

Lugar: sala de grabación estudio híbrido Universidad de San Buenaventura, Sede

Bogotá.

Fecha de medición: 19 de junio de 2008.

Hora de medición: 12:00 p.m.

Ruido de fondo: 28.5 dB.

Page 76: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

76

Equipamiento y herramientas necesarias para llevar a cabo la medición:

Soporte lógico (Software)

Adobe® Audición® 1.5 ( versión demo).

Aurora® Plugin ( versión demo).

Equipos

Amplificador de potencia marca Yamaha®, serie XS250.

Interfaz de audio USB marca M-audio® referencia Mobile pre, 16bits/48KHz.

Computadora Portátil.

Dodecaedro.

Sonómetro Svantek® tipo 2, referencia 943 A

Micrófono de medición marca Crown®, referencia TEF 05

Accesorios

Flexómetro.

Base para sonómetro.

Base para Dodecaedro.

Base para Micrófono de medición.

Extensión eléctrica.

Multitoma eléctrica.

Cable XLR a plug de ¼.

Cable de micrófono.

Cable USB.

La siguiente tabla (1), muestra las dimensiones del lugar cuyos datos serán de utilidad

posteriormente:

Tabla 1. Dimensiones del estudio híbrido.

Dimensiones del lugar

de medición

Ancho 5m

Largo 6,33m

Alto 3,6m

Superficie total 144,876m²

Volumen 113,94m³

Page 77: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

77

Se aplica el método de medición propuesto por la norma ISO 3382 de 1997. Se debe

asegurar, que la fuente sonora radie la cantidad suficiente de energía, de tal forma que

la relación señal/ruido sea la adecuada para realizar la medición, es decir, para excitar

todos los lugares del recinto sin que la fuente llegue al punto de saturación, alterando

la señal en su emisión. Dos posiciones de fuente y seis de micrófono son escogidas

para cubrir en su totalidad todas las áreas del recinto. En la figura 17 se muestra el

posicionamiento. La distancia de fuente a micrófono es de 1.62m, calculada con la

ecuación recomendada por ISO, y se asegura que la distancia desde el micrófono hacia

cualquier superficie reflejante sea de 1m aproximadamente, además, que la altura del

micrófono sea la de los oídos, 1.20m por encima del nivel del piso.

Figura 17. Posiciones de fuente y micrófono en medición de RT y distancia crítica.

Page 78: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

78

Ahora sí, luego de haber seguido las recomendaciones dadas por la norma ISO 3382

para medición de tiempo de reverberación, se muestra paso a paso el procedimiento

que se sigue:

La interfaz de audio (m-audio), una vez conectada al computador, envía la señal

(barrido sinusoidal-LSS) hacia el dodecaedro a través del amplificador.

El micrófono de medición Crown® es conectado a la entrada 1 de la interfaz, el

cual captura la señal emitida por el dodecaedro.

El Software Adobe® Audition® es el encargado de reproducir el barrido y capturar

la señal del micrófono de medición, las cuales se utilizan para el proceso de

convolución. Es importante aclarar que las señales deben tener la misma duración

para este procesamiento. Ver figura 18 diagrama de conexión.

Figura 18. Diagrama de conexión, medición de RT y obtención de distancia crítica.

Detalles de la medición:

Inicialmente, se mide el nivel de ruido de fondo con el sonómetro Svantek® tipo 2

(aunque la ISO 3382 recomienda tipo 1, sin embargo para este proyecto no se requiere

la precisión dada por éste tipo), el cual ha sido previamente calibrado con un filtro de

ponderación A, detector slow y buffer rms, dando un valor de 52.6 dB. Este ruido de

fondo es realmente elevado por el tráfico de estudiantes a esa hora. Colocando el

Page 79: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

79

sonómetro en la posición del micrófono crown®, se emite desde el software Adobe®

Audition® ruido rosa, para calibrar el nivel de salida del dodecaedro, de tal forma que

la señal que indique el sonómetro, ubicado en la misma posición del micrófono de

medición, sea de 74 dB (para recintos), tomando como base las indicaciones de Don

Davis. La ubicación de calibración se hace en los puntos: fuente 1-micrófono 1.

Acto seguido, se reproduce desde Adobe® Audition® una señal LSS (125Hz-4KHz, con

una duración de 15s), señal capturada por el micrófono Crown® y posteriormente

almacenada en un canal del software. El proceso se realiza en cada una de la seis

posiciones de fuente. Este método es llamado Ruido Interrumpido, según la norma ISO

3382. Luego mediante el plugin Aurora® (versión demo), se obtienen los datos que

serán utilizados para hallar DC tomando como base también los datos de la tabla 1.

Mediante la siguiente ecuación de halla la distancia crítica:

Donde:

Q= factor de directividad de la fuente. (1 para el dodecaedro de patrón polar

omnidireccional)

R=constante del recinto. /1- .

=superficie de total del recinto.

=absorción promedio de la sala.

Dando como resultado:

Distancia crítica del estudio Híbrido = 0,977m 1m.

La distancia crítica es muy útil, ya que todas las mediciones a excepción de las

realizadas en campo libre, son hechas en el estudio híbrido y dada la necesidad de

obtener datos en campo directo para cuantificar valores mucho más cercanos a los de

cámaras anecóicas, estas se deben realizar a una distancia igual o menor a la distancia

Page 80: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

80

crítica. Más adelante se muestra como todas las mediciones se hacen a esta distancia

aproximadamente.

Es importante destacar, que hacer mediciones a distancias iguales o inferiores a la

distancia crítica, producen valores más cercanos de sonido directo, pero en la realidad

estas reflexiones también son incluidas. Posteriormente se tratará con más detalle.

En el anexo B se presenta una fotografía del lugar de medición del procedimiento

explicado arriba.

Teniendo el valor de DC se procede, ahora sí, a determinar las diferencias entre

cápsulas (intertransductores).

4.1.2 Medición diferencia intertransductores.

El objetivo principal de esta medición es establecer las diferencias de arribo y de nivel

de presión sonora de la señal hacia las cápsulas, ocasionada por una fuente sonora

desplazándose en el eje horizontal (diferencias intertransductores), y así compararlas

con las diferencias interaurales de intensidad y de tiempo (las del ser humano), a esas

mismas posiciones. También es de importancia saber cómo se comportan los arreglos

estereofónicos y como capturan el campo sonoro.

Ésta medición se realiza en el estudio hibrido de la Universidad de San Buenaventura,

Sede Bogotá. Se pretende hacerla al aire libre, pero se presentan inconvenientes de

diversa índole (factores climáticos, ruido ambiente), debido a esto se opta por llevarlas

a cabo en estos laboratorios, basada en el parámetro de distancia crítica mencionado

arriba.

Page 81: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

81

Equipos y materiales empleados para la medición:

Soporte lógico

Pro-tools®LE- versión 7.0.

Equipos

Reproductor de CD MASH, Referencia SL PD667.

Micrófonos cardioides marca Rode®, referencia NT5.

Micrófonos omnidireccionales marca Behringer®, referencia ECM8000.

Cabina JBL®, referencia EON 10”.

Computador portátil

Caja directa DOD 260

Interfaz de audio Digidesign®, Mbox™.

Sonómetro marca Svantek® tipo2, referencia 943 A.

Pistófono Marca Rion, Modelo NC-74

Accesorios

Un soporte para arreglos estéreo de micrófono.

3 Cables XLR .

1 Cable USB.

1 Cable de línea.

Trípode para parlante.

2 bases para micrófono

1 base para sonómetro

Paneles absorbentes (ver figura 20 y 21).

Base para sonómetro.

Extensión eléctrica.

Multitoma eléctrica.

Material absorbente(Jecklin Disk).

Flexómetro.

Medidor de ángulos láser.

Page 82: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

82

Descripción general:

Lugar de medición: sala de grabación estudio híbrido Universidad de San

Buenaventura, sede Bogotá.

Fecha de medición: 20 junio de 2008.

Hora de medición: 8:00 a.m.

Ruido de fondo: 40 dB.

Procedimiento y calibración:

Inicialmente se mide el ruido de fondo con el sonómetro.

La interfaz de audio M-box™ es conectada al computador, para captura de la señal

proveniente del arreglo estereofónico, a través del software Pro tools®.

Por medio de la caja directa DOD 260 se conecta el reproductor de CD con el

altavoz JBL®, para emitir la señal de audio. El diagrama de conexión es mostrado en

la figura 19.

En este caso, se efectúa una calibración eléctrica, asegurando que el nivel de la

señal proveniente desde los micrófonos (Rode® NT5 y Behringer® ECM8000) hacia

los preamplificadores (M-box™) 1 y 2 sea el mismo. Para esto se utiliza el calibrador

sonoro Rion NC-74, el cual genera un nivel SPL estándar de 94 dB.

Ahora, para asegurar que el nivel de presión sonora de salida del altavoz sea de 74

dB (recomendación de Don Davis para lugares cerrados), se mide el SPL con un

sonómetro previamente calibrado (filtro de ponderación A, detector slow y buffer

rms), en la misma posición en donde se ubican los micrófonos para la medición,

reproduciendo un ruido rosa (250Hz-5Khz).

Los micrófonos se encuentran ubicados a 1m de distancia del centro acústico del

altavoz y ambos (parlante y micrófono) se sitúan a 1.20m del piso.

Page 83: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

83

Figura 19. Diagrama de conexión, medición diferencias intertransductores.

Las técnicas de microfonería estereofónicas seleccionados para la medición y para el

proyecto, como ya se había nombrado, son ORTF (the Office de Radiodiffusion

Télévision Française) y Jecklin Disk. Ésta última, necesita una barrera acústica para

lograr una buena separación entre transductores, tal como la cabeza humana. La

pantalla debe tener características absorbentes.

La universidad de San Buenaventura no cuenta con estos accesorios, por lo tanto, se

procede a la elaboración de la misma. A continuación se muestra como:

Page 84: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

84

Construcción de Barrera acústica

Materiales requeridos para el diseño:

o Fibra de vidrio

o Acrílico

o Cierre eclair

o Tela gruesa

o 1 Tornillos largo y 2 tuercas.

Diseño de la pantalla acústica:

o Dos circunferencias de fibra de vidrio y una de acrílico cortadas a un diámetro

de 28 cm aproximadamente.

o Con un taladro se realizan los agujeros donde se ubican los tornillos y

posteriormente los soportes de los micrófonos.

o La tela y la cremallera son adaptados, para que se puedan introducir las tres

circunferencias.

En general, el panel completo tiene un espesor 6 cm.

Según los materiales utilizados, la absorción del disco por banda de octava es:

Tabla 2. Absorción del Jecklin Disk por banda de octava.

ABSORCIÓN

Frecuencia

Materiales

Superficie

m² 125 250 500 1000 2000 4000

Fibra de vidrio espesor 2,5 por fibra 0,123 0,007 0,025 0,080 0,111 0,117 0,121

Tela 0,1225 0,005 0,028 0,049 0,070 0,065 0,049

Acrilico 0,123 0,005 0,005 0,004 0,004 0,002 0,002

ΣSα 0,006 0,019 0,044 0,061 0,061 0,057

Page 85: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

85

La imagen 1 muestra el producto final y el anexo C muestra, con más detalle, el

procedimiento de construcción llevado a cabo.

Imagen 1. Pantalla acústica finalizada.

Seguidamente de la breve explicación de la realización de la pantalla acústica, se

continúa con la exposición de la medición de las diferencias intertransductores.

Detalles de la medición:

Teniendo en cuenta el diagrama de conexión mostrado en la figura 20, a través del

reproductor MASH, son enviados tres tonos puros 500Hz, 1KHz y 4KHz con una

separación de 3 segundos. Las posiciones elegidas para realizar las capturas son los

ángulos 0°, 30°, 45°, 60°, 90°, 120°, 135°, 150° y 180°, asumiendo que los arreglos son

totalmente simétricos y que por lo tanto produce las mismas diferencias en el lado

izquierdo y en el derecho. El montaje estaba rodeado con paneles, aparentemente

absorbentes, con el fin de evitar al máximo reflexiones. La distancia entre cada panel y

el arreglo estereofónico es de 1.62 cm, cumpliendo con la distancia calculada en 4.1.1

de acuerdo a ISO 3382. La distancia fuente-receptor era de 1m (ver figura 20 y 21).

Page 86: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

86

Figura 20. Configuración Jecklin Disk, medición diferencia intertransductores.

Page 87: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

87

Figura 21. Configuración ORTF, medición diferencia intertransductores.

Page 88: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

88

Resultados obtenidos

La tabla 3 manifiesta las diferencias intertransductores de intensidad.

Tabla 3. Diferencia intertransductores de intensidad, técnica Jecklin disk y ORTF.

DIFERENCIAS INTERTRANSDUCTORES DE INTENSIDAD VALORES EN dB, JECKLIN DISK

Frecuencia 500 Hz 1 kHz 4 KHz

Ángulo (grados)

0 15,1 18,5 14,8

30 18,6 20,1 21,8

45 17,8 29,4 20,8

60 20,5 22,3 26,7

90 17,1 18 20,2

120 37,8 21,2 29,6

135 19 23,6 21,7

150 19 23,6 21,7

180 20,5 16,5 14,7

DIFERENCIAS INTERTRANSDUCTORES DE INTENSIDAD VALORES EN dB, ORTF.

Frecuencia 500 Hz 1KHz 4KHz

Ángulo (grados)

0 9,2 8,1 6,4

30 7,2 2,2 7,9

45 3,8 3,9 4,9

60 1,4 -0,1 -2,4

90 4,6 -0,8 -4,7

120 -0,2 4 -0,8

135 8,2 9,4 8,1

150 7,2 3,2 8,1

180 9,6 8,8 3

Page 89: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

89

Análisis de las tablas:

Tabla 3

Jecklin Disk. Como principio básico, la diferencia de intensidad entre cápsulas, con

la fuente ubicada a 0 grados respecto al eje del arreglo, no debe presentar

variaciones; pero según la tabla, la diferencia no es coherente con lo dicho

anteriormente. Se nota que en la banda de 500Hz hay una variación aleatoria de

valores, por lo tanto, no se logra predecir su comportamiento, esto puede ser

ocasionado principalmente por el comportamiento del lugar y de los paneles

acústicos utilizados en la medición, los cuales parecen presentar características

reflectivas mas no absorbentes. La banda de 1KHz presenta un comportamiento

similar.

La teoría de la diferencias interaurales de nivel establece claramente que funciona

para frecuencias altas por encima de 2 Khz, y a medida que se varia de angulación

se tiene un incremento, logrando su más alto nivel en 90 grados azimuth. De

acuerdo a la teoría del arreglo, éste se convierte en direccional cuando la

frecuencia se incrementa, muy similar a la teoría interaural.

En la banda de 4Khz de la tabla, obtenida en la medición, no se logra del todo ese

valor, ya que presenta una caída en 90 grados lo cual no es coherente con la teoría.

ORTF. En ésta técnica no se logran obtener datos coherentes con la teoría

interaural, ni con la de micrófonos. La diferencia entre uno y otro transductor en 0

grados debería tener un mínimo valor, presentando variaciones a medida que se

desplaza en el eje horizontal, sujeto al patrón polar de los transductores.

Es importante recordar, que esta técnica trabaja bajo el fundamento de diferencias

de nivel y de tiempo, por su configuración coincidente-cercano, de ahí que es poco

probable que los datos mostrados en la tabla 8 sean correctos. Además por su

patrón polar cardioide debería tener menos energía fuera del eje del arreglo (off-

axis) y esto no se evidencia en la tabla.

Las figuras 22 grafican los datos de las tablas 3, con su análoga interaural de nivel

como punto de comparación. Visualizando las gráficas en comparación a las

interaurales se puede corroborar el análisis planteado arriba.

Page 90: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

90

Figura 22. Datos graficados de las diferencias intertransductores de intensidad para Jecklin Disk

y ORTF, con su respectiva diferencias interaurales de intensidad para comparación.

GRANTHAM, Wesley. Spatial hearing and related phenomena En: Handbook of Perception and Cognition, Second Edition. Second

edition London, UK: edited by B. C. J. Moore. Academic, 1995, p. 312.

0

10

20

30

40

0 30 45 60 90 120 135 150 180

Dif

ere

nci

as d

e in

ten

sid

ad (d

B)

Ángulo

Diferencias intertransductores de intensidad, Jecklin Disk

500 Hz

1 Khz

4 KHz

-10

0

10

20

30

0 30 45 60 90 120 135 150 180

Dif

ere

nci

as d

e in

ten

sid

ad (d

B)

Ángulo

Diferencias intertransductores de intensidad, ORTF

500Hz

1kHz

4kHz

Page 91: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

91

la tabla 4 expone las diferencias intertransductores de tiempo.

Tabla 4. Diferencias intertransductores de tiempo, técnica Jecklin disk y ORTF.

DIFERENCIAS INTERTRANSDUCTORES DE TIEMPO VALORES EN mseg, Jecklin Disk

Frecuencia 500 Hz 1 Hz 4 KHz

Ángulo (grados)

0 0 0 0

30 0,25 0,27 0,25

45 0,5 0,437 0,437

60 0,583 0,604 0,583

90 0,77 0,77 0,77

120 0,604 0,541 0,562

135 0,437 0,416 0,354

150 0,2 0,29 0,25

180 0,02 0 0

DIFERENCIAS INTERTRANSDUCTORES DE TIEMPO VALORES en mseg, ORTF

Frecuencia 500 Hz 1 Hz 4 KHz

Ángulo (grados)

0 0 0 0

30 0,29 0,29 0,29

45 0,43 0,43 0,39

60 0,58 0,58 0,54

90 0,645 0,604 0,625

120 0,604 0,583 0,604

135 0,416 0,458 0,437

150 0,29 0,29 0,29

180 0 0,02 0,02

Page 92: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

92

Análisis de las tablas:

Tabla 4

Jecklin Disk. Como esta técnica funciona justamente con los retardos de llegada de

la señal, los valores son muy cercano a los interaurales de tiempo, sin importar la

frecuencia. Aunque para esta técnica en particular los micrófonos cumplen su función

de patrón polar omnidireccional para frecuencias bajas, para frecuencias altas el

mecanismo es diferente, puesto que éste patrón cambia desde omnidireccional a

supercardioide, angulados 180°, conforme la frecuencia incrementa.

De acuerdo a estos datos no se presentan diferencias de llegada en 0 grados (0mseg)

ya que las señales a los transductores llegan al mismo tiempo. El valor se incrementa a

medida que aumenta la posición angular, consiguiendo su límite en 90 grados, punto

en el cual, comienza a disminuir hasta volver a 0 mseg en 180 grados. Por esto existen

confusiones entre las posiciones frente-atrás, porque los valores sobre el plano medio

son los mismos; por ejemplo entre 0°-180° y 45°-135°. En la tabla se puede ver una

aproximación a estos valores.

Aunque las condiciones del lugar y los paneles no eran óptimos para simular una

cámara anecóica, el empleo de una distancia menor a la distancia crítica ayuda a

obtener datos bastante cercanos a las interaurales.

ORTF. Esta técnica también trabaja con diferencias de tiempo, por lo tanto presenta

características similares a Jecklin Disk; es decir, que es 0 mseg en 0 grados y va en

incremento hasta llegar a 90 grados, punto en el cual se tiene el mayor valor (0.645

mseg) , y disminuye a 0 mseg cuando este llega a 180 grados.

Se nota que a pesar que la medición se realiza en campo directo, “aparentemente”, las

reflexiones están presenten y de forma significativa, comprobado en los resultados de

esta medición, especialmente en las diferencia intertransductores de nivel.

Con la figura 23 se representan de forma esquemática las cifras de la tabla 4 para

Jecklin Disk y para ORTF, también con su respectiva figura de comparación de

diferencias de tiempo interaural.

Page 93: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

93

Figura 23. Datos graficados de las diferencias intertransductores de tiempo para Jecklin Disk y

ORTF, con sus respectivas diferencias interaurales de tiempo para comparación.

GRANTHAM, Wesley. Spatial hearing and related phenomena En: Handbook of Perception and Cognition, Second Edition. Second

edition London, UK: edited by B. C. J. Moore. Academic, 1995, p. 312

00,10,20,30,40,50,60,70,80,9

0 30 45 60 90 120 135 150 180

Dif

ere

nci

as d

e ti

emp

o (m

seg)

Ángulo

Diferencias instertransductores de tiempo, Jecklin Disk

500 Hz

1Khz

4Khz

00,10,20,30,40,50,60,70,80,9

0 30 45 60 90 120 135 150 180Dif

ere

nci

as d

e ti

emp

o (

mse

g)

Ángulo

Diferencias intertransductores de tiempo, ORTF

500 Hz

1Khz

4Khz

Page 94: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

94

Ahora bien, una serie de mediciones y datos no son relevantes si no se sabe la

importancia de estas para el objetivo de este proyecto, por lo tanto, ¿ para qué son

importantes las diferencias intertransductores en esta investigación?. Las diferencias

intertransductores son importantes porque dependiendo del funcionamiento del

arreglo estereofónico, se puede conocer cómo capturan el campo sonoro en el plano

horizontal; ya que no funcionan para el plano vertical. Entre más parecidas sean estas

técnicas con la percepción humana, más realismo se puede tener al momento de la

reproducción y menores errores de localización en la misma. Éste principio se aplica

para la reproducción en audífonos; la desventaja es que con este sistema de

reproducción no se tiene información espacial. Más adelante se muestra el

procedimiento para agregar esta información a la señal capturada por medio de estos

arreglos, así como cual método de captura presenta menores errores de localización

(5.1). Sin embargo, no se puede saber con certeza como es el funcionamiento real por

los problemas de reflexiones anteriormente mencionados.

La imagen 2 expone unas fotografías de la medición a la cual se acaba de hacer alusión

Imagen 2. Fotografías de la medición en la que se obtienen las diferencias intertransductores

de tiempo y de intensidad ORTF y Jecklin Disk.

Después de obtener las diferencias intertransductores para plano horizontal, sigue

ordenadamente lo referido al plano vertical, como previamente se mencionó, el cual

Page 95: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

95

será el complemento ideal para las capturas que se realizan con las técnicas

anteriormente planteadas.

4.2 MEDICIÓN RESPUESTA AL IMPULSO DE UNA PINNA ARTIFICIAL

Se ha comprobado que la pinna es un elemento muy importante para la localización en

el plano vertical, así como también para dar otros datos de la señal sonora (ver

2.2.1.6). Se ha querido, por tal motivo, realizar la medición de ella y así realizar un

estudio riguroso de la misma.

¿ Cómo y para qué realizar la medición de una pinna artificial?

La medición de una pinna artificial para esta investigación, es primordial ya que al

conocer el comportamiento de ésta a diferentes ángulos azimuth y de elevación,

permitirá posteriores aplicaciones de sus características de filtrado en cada ángulo

(mediante convolución), para una señal capturada con técnicas estéreo, entre otras

aplicaciones más.

Este estudio se logra, no con pinnas reales como seria lo esperado y lo ideal, para

obtener datos más certeros, sino, con pinnas artificiales. Seguidamente se expone el

proceso de construcción y más adelante su medición con detalle.

Para este proyecto solo se realiza el modelo del pabellón auditivo izquierdo,

asumiendo que la cabeza es esférica y es totalmente simétrica, lo cual no es cierto, ya

que no hay una similitud exacta entre el lado izquierdo y el derecho.

Construcción de la pinna artificial y su soporte

Para la realización de la pinna artificial se tomo como modelo el pabellón auditivo

izquierdo de una persona real. Los materiales utilizados son los siguientes:

Alginato.

Silicona para moldeo.

Catalizador.

Agua.

Dos recipientes.

Page 96: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

96

Procedimiento:

Protegiendo el canal auditivo del modelo, de tal manera que no pase el liquido y

ocasione daños en el tímpano, se mezcla una cantidad considerable de alginato (129 gr

aproximadamente) con agua fría y se disuelve hasta tener una composición

consistente. Inmediatamente es aplicado en la pinna real, de tal forma que cubra todas

las áreas de ésta; luego se espera hasta que la mezcla seque. Una vez esto suceda se

extrae con cuidado este molde, el cual es el negativo.

Enseguida se combina en otro recipiente la silicona para moldeo con su catalizador, en

la misma cantidad utilizada para el alginato (la proporción del catalizador debe ser el

5% de la medida correspondiente a la silicona).

luego lentamente se aplica la combinación silicona-catalizador a este negativo, de tal

manera que todas sus partes sean cubiertas en su totalidad. Por último se esperan 24

horas hasta que la silicona seque y se pueda extraer el positivo que es el resultado

final. Ahora se exponen unas fotografías que evidencia mejor el procedimiento

ulteriormente planteado.

Imagen 3. Procedimiento pinna artificial

Page 97: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

97

Page 98: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

98

Es importante mencionar, que el material es escogido porque su textura es muy

parecida a la humana, además presenta buena estabilidad ya que materiales como el

látex cuando están expuestos al calor pierden su forma.

Para el soporte que sostiene la pinna y el parlante se utilizaron las siguientes

herramientas:

Tubo cuadrado CL 18.

Base cuadrada de madera.

Base circular metálica

Cauchos.

Silicona para moldeo.

Catalizador.

Procedimiento

La base que soporta la pinna es realizada con la finalidad de permitir el cambio de

angulación tanto azimuth como de posición vertical. Inmediatamente se explica cómo

es el mecanismo.

A la base de material metálico, se le coloca un eje rotativo que permita variar con

respecto a la pinna artificial, el ángulo de la fuente (altavoz) en la posición vertical.

Ahora bien, para la variación de la posición azimuth, se toma como eje de rotación la

base cuadrada de madera lugar donde la pinna es colocada.

Por otro lado, la pinna es sujetada con un disco metálico cubierto de silicona, para

evitar reflexiones y vibraciones procedentes de la base de madera. El disco ésta sujeto

a la base de madera, por medio de un sistema de suspensión (material elástico).

La construcción del soporte fue realizado, casi en su totalidad, en el Hangar de la

Universidad de San Buenaventura con la colaboración de los auxiliares de laboratorio

de esta dependencia.

En la imagen 4 se ilustra el producto final, mientras que en el anexo D se encuentran

detalles más específicos del proceso.

Page 99: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

99

Imagen 4. Soporte de pinna artificial y parlante

Page 100: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

100

Medición de la pinna

Este ítem se centra en la obtención inherente de filtrado de la pinna dependiente de su

ubicación y ésta se realiza por medio de la obtención de su respuesta al impulso. Aquí

se ilustra cómo:

Se realizan dos mediciones para tener dos alternativas: una en campo reverberante

(ambiente real de escucha de los humanos); realizada en el estudio hibrido de la

Universidad de San Buenaventura, y otra al aíre libre, para simular “condiciones

anecóicas” (análisis preciso).

Como ya se ha indicado en la medición de las diferencias intertransductores (ver

4.1.2), no importa si la medición se hace o no a una distancia menor a la distancia

crítica porque las reflexiones existen de igual forma; por esto, la medición en estudio

híbrido se realiza a 1m (distancia altavoz-micrófono), ya que en este punto se obtendrá

igualmente las condiciones reverberantes del lugar, que es lo buscando en este caso.

Se toma como referencia, para la medición, el pabellón del lado izquierdo, asumiendo

simetría en izquierdo-derecho. Por lo tanto, de aquí en adelante todo estará referido a

este lado.

Para las dos mediciones se tiene en cuenta el mismo procedimiento y las mismas

angulaciones que se explican seguidamente:

Equipamiento requerido para la medición:

Soporte lógico (Software)

Easera 1.0.50© (versión Demo).

Equipos

Computador portátil.

Interfaz audio marca Yamaha©, referencia GO46, Compatible con 24 bits/192 kHz.

Sonómetro marca Svantek® tipo2, referencia 943 A.

Page 101: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

101

Pistófono Marca Rion, Modelo NC-74.

Amplificador marca Alesis©, referencia RA 300.

Micrófono de medición marca DBX®, Omnidireccional.

Altavoz marca Bose®, serie 101 music monitor.

Accesorios

Multitomas.

Cables XLR.

Cable Dúplex para altavoz.

Convertidor 1/4-XLR.

Cable Firewire™.

Cable de poder.

Soporte Pinna-Parlante y pinna.

Descripción general:

Lugar de medición: sala de grabación estudio híbrido Universidad de San

Buenaventura, sede Bogotá y Cancha de fútbol de la misma.

Fecha de medición en estudio híbrido: 28 de marzo 2009.

Hora de medición: 8:00 a.m.

Ruido de fondo en estudio híbrido: 28.2 dB

Número de personas en estudio: 2 personas.

Fecha de medición en cancha de fútbol: 3 de abril 2009.

Hora de medición: 6:00 p.m.

Ruido de fondo en cancha de fútbol: 46 dB

Predicción atmosférica del día: cielo parcialmente nublado, con lluvias intermitentes.

Procedimiento de conexión:

EL computador es conectado vía firewire™ a la interfaz de audio Yamaha, cuya salida

envía la señal al parlante Bose a través del amplificador Alesis© RA300.

Mediante el micrófono DBX® es capturada la señal emitida por el altavoz por medio

de la interfaz de audio Yamaha©, que está conectada al computador. La plataforma de

Page 102: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

102

medición EASERA© (versión demo) recibe la señal. La ilustración 24 presenta el

diagrama de conexión.

La distancia entre altavoz-micrófono para las dos mediciones (estudio y aire libre), es

de 1m.

Figura 24. Diagrama de conexión medición respuesta al impulso pinna artificial.

Calibración

Medición de ruido de fondo, basado en la ISO 3382, para determinar del nivel de

señal final para la misma.

Configuración del programa EASERA© (versión demo), para emisión y captura.

Page 103: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

103

Calibración eléctrica del micrófono de medición DBX®, por medio del Pistófono RION

Modelo NC-74, para asegurar que el nivel de presión sonora, que reciba el transductor,

sea el mismo que indique el software de medición en su escala de SPL. Ver figura 25.

Emitiendo un ruido rosa y teniendo en cuenta las sugerencias de la ISO 3382, se

mide con el sonómetro que la señal que emita el parlante este 35 dB por encima del

ruido de fondo. El sonómetro ha sido previamente calibrado con un filtro de

ponderación A, detector slow y buffer rms.

Figura 25. Calibración con Pistófono, imagen tomada desde EASERA (versión demo).

Detalles de la medición:

Se decide hacer la medición al aire libre por la carencia de una cámara anecóica en la

Universidad para llevar a cabo medidas de este tipo; pero realizar la medición al aire

libre implica una serie de inconvenientes enfocados básicamente a las condiciones

atmosféricas. Éstas imposibilitaron la medición en múltiples ocasiones

(aproximadamente 7 intentos). Sin embargo, la medición que se muestra fue la que

finalmente se pudo realizar con buenas condiciones, aunque no excelentes, ya que

había mucho ruido de fondo, sonido de animales nocturnos y aviones que pasaban con

frecuencia; sin mencionar la influencia del viento nocturno en la cuidad de Bogotá. Por

esta razón, los resultados que finalmente se obtengan a partir de las mediciones en

campo abierto no serán del todo correctas e ideales como aquellos proporcionados

por una cámara anecóica.

Page 104: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

104

Un barrido senoidal “sweep” (Ver figura 26 para configuración inicial), es emitido por

el parlante y basado en la calibración planteada, se asegura que el ruido de fondo este

35 dB por encima del ruido de fondo, norma ISO 3382, los cuales medidos con el

sonómetro arrojaron los siguientes valores:

SPL final de la señal para medición en estudio híbrido: 66,4 dB.

SPL final de la señal para medición en Cancha de fútbol: 81,2 dB.

Figura 26. Configuración inicial para emisión de barrido , imagen tomada desde EASERA

(versión demo).

Page 105: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

105

Con el micrófono DBX® ubicado a la entrada del meato auditivo de la pinna artificial, se

captura el barrido emitido por el altavoz Bose®, recibiendo todas las características de

la pinna, que implica el cambio de angulación de la fuente.

El software EASERA genera la respuesta al impulso partiendo de la señal capturada por

el micrófono.

Para cada posición azimuth se toma como referencia una captura sin pinna, para

posteriores comparaciones de respuesta en frecuencia (otro dato que el programa

EASERA© versión demo brinda, a parte de la respuesta al impulso).

Las posiciones de medición fueron elegidas de tal forma que se cubriera un amplio

rango de ángulos en posición, tanto horizontal (azimuth) como vertical (elevación).

Éstas posiciones fueron las siguientes:

Azimuth: 0°, 45°, 90°, 135°, 180°.

A cada posición azimutal le corresponde sus ángulos de elevación de la siguiente

forma:

Azimuth 0 grados, Elevaciones: 0°, 30° ,60°, 90°, 120°, 150°, 180°.

Azimuth 45 grados, Elevaciones: 0°, 30° ,60°, 90°.

Azimuth 90 grados, Elevaciones: 0°, 30° ,60°, 90°.

Azimuth 135 grados, Elevaciones: 0°, 30° ,60°, 90°.

Ha sido demostrado que las características de la pinna varían, al modificar la distancia,

pero en el caso en particular de este proyecto no se pudo determinar debido a que la

forma del soporte no lo permitió.

La figura 27 esquematiza todas las posiciones de medición al igual que las fotografías

de la imagen 5, otras más son encontradas en el anexo E.

Page 106: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

106

Figura27. Posicionamiento de los ángulos de medición para RI de la pinna articial. (a) vista

planta, (b) vista lateral izquierda.

Page 107: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

107

Imagen 5. Posiciones de medición en estudio híbrido y aire libre.

0º 0º

Page 108: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

108

45º

90º

Page 109: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

109

90º

135º

Page 110: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

110

NOTA: las fotografías anteriores fueron seleccionadas aleatoriamente de las mediciones, los ángulos

encerrados en el cuadro corresponden a cambios en azimuth y para ese ángulo se muestra en la

fotografía un desplazamiento vertical, solo para indicar como era el traslado del altavoz con respecto a

la pinna. El movimiento del soporte de madera que contiene la pinna es en azimuth y el giro del altavoz

indica un cambio en la posición vertical.

Resultados obtenidos

En síntesis, de esta medición, como se ha mencionado, se toman dos resultados de

importancia:

1. Respuesta en frecuencia de la pinna dependiente de la ubicación de la fuente

sonora (dominio de la frecuencia).

2. Respuesta al impulso que tendrá como fin filtrar una señal estéreo grabada,

mediante una convolución (dominio del tiempo). este ítem se trata en 4.3

Con respecto al primer punto, se exponen a continuación, unas gráficas con fines

explicativos y de análisis, para conocer cómo funciona la pinna de acuerdo a ángulos

específicos de fuente sonora. En el anexo F, se muestran las gráficas restantes.

180º

Page 111: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

111

Para datos obtenidos al aire libre. Gráficas proporcionados por el programa

EASERA© (versión demo).

Nota: se muestra sólo el análisis del ángulo azimuth 90 grados con sus distintas elevaciones (30°, 60°,

90°), tomado de la medición al aire libre y en recinto (estudio híbrido).

1. Comparación respuesta en frecuencia: Azimuth 90° con elevación 0°, 30°, 60°, 90°.

Nota: AZ=azimuth, EL=elevación.

Figura 28. Respuesta en frecuencia posición azimutal 90° en elevaciones 0°, 30°, 60°, 90°,aire

libre.

Page 112: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

112

Análisis de gráfico:

La pinna para azimuth 90° elevación 0°, presenta las características mostradas por la

curva marcada con color verde, presentando una caída (notch) alrededor de 8KHz, un

incremento a partir de 10KHz y una caída otra vez en 11.47 kHz y 16 kHz

aproximadamente. con respecto a las elevaciones se tiene la siguiente interpretación:

decrece el nivel alrededor de 5KHz con respecto la curva AZ90EL0 para todas las curvas

de elevación y hay un notch común para todas las elevaciones en 11.47 KHz pero con

distinto nivel a medida que el ángulo de elevación aumenta. Para elevación 30° se

encuentra una caída en 9 KHz.

De esta gráfica se puede deducir que a medida que aumenta el posicionamiento

vertical, aumenta la frecuencia central del filtrado tipo notch (entre 7KHz y 10KHz). La

curva naranja muestra el comportamiento si no existiera la pinna, notando que sí

existe una variación cuando la pinna es incluida. Se piensa en esta curva como ideal, al

no detenerse en los errores sistemáticos ocasionados por las reflexiones que se

pudieron ocasionar con el soporte mismo, ruido de fondo, las condiciones

atmosféricas (factores de viento, humedad relativa, entre otros).

Se puede inducir que cada ángulo específico de elevación tiene una estructura de

filtrado diferente, por lo tanto para la frecuencia común de 11.47 Khz, para sentir un

desplazamiento de 30 grados es necesario tener ese nivel, el cual es distinto del de los

demás ángulos.

Como es visto en el anexo F, si se establece una comparación entre este ángulo (90°

azimuth) y las demás posiciones azimuth (0°, 45°, 135°, 180°), la diferencia entre uno y

otro se debe al desplazamiento de la frecuencia notch y al nivel de sus respectivas

elevaciones.

Page 113: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

113

Para datos obtenidos en estudio híbrido. Datos proporcionados por el programa

EASERA© (versión demo).

1. Comparación respuesta en frecuencia: Azimuth 90° con elevación 0°, 30°, 60°, 90°.

Nota: AZ=azimuth, EL=elevación.

Figura 29. Respuesta en frecuencia posición azimutal 90° en elevaciones 0°, 30°, 60°, 90°,

recinto.

Page 114: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

114

Análisis de gráfico:

De esta representación se pueden extraer algunos datos de importancia; en la

elevación de 60 grados se presenta una caída en la frecuencia 7,49 KHz, pero no existe

una comparación relevante con respecto a las otras curvas, por lo tanto, ésta puede

ser ocasionada por reflexiones del lugar o del soporte. Como en el gráfico presentado

para aire libre, surge una caída en la frecuencia de 11.47 KHz y 16 Khz, para todas las

elevaciones, obteniendo el mismo análisis planteado para esa gráfica, así como

atenuaciones. A pesar que la pinna esta soportada por una placa cubierta con el

mismo material de las orejas artificiales, no ésta exenta de reflexiones ocasionadas por

la base de madera y por el soporte metálico; sin excluir aquellas dadas por el recinto.

Otros errores sistemáticos como la manipulación del sistema, precisión en la

angulación, ruido de fondo durante la mediciones (ejemplo movimiento de sillas en el

piso superior), también son tenidos en cuenta.

Pero en esta medición, específicamente, se busca establecer el comportamiento en

condiciones naturales de escucha humana, por tal razón estos errores sistemáticos

ayudan a crear un ambiente más natural y pueden ser de cierta forma útiles.

Ahora bien, Conocer estas respuestas en frecuencia es de capital interés, ya que como

se verá en el punto 4.3, se puede saber cómo funciona frecuencialmente una señal

estereofónicamente grabada ante la aplicación de la respuesta al impulso de la oreja

artificial en una posición específica. Seguidamente se expone como funciona lo que en

síntesis se acaba de mencionar.

Comparación de respuesta en frecuencia obtenida en esta investigación, con una

medida en condiciones ideales de escucha.

En este punto, se toma como referencia, para comparación, el ángulo de 135 azimuth,

y así determinar qué diferencias y/o similitudes existen entre la respuesta en

frecuencia medida en esta investigación al aire libre, con aquellas medidas en

condiciones ideales (cámara anecóica).

Page 115: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

115

Las gráficas son las siguientes:

Figura 30. Comparación con medición en cámara anecóica.

BEGAULT, Durant. Spectral cues provided by the pinna. En: 3-D sound for virtual reality and multimedia, California: Ames Research Center, 2000, p.46 datos medidos por Fred Wightman and Doris Kistler, University of Wisconsin—Madison

Tomando el ángulo de 30 grados elevación, el más cercano al mostrado como

referencia (36 grados elevación), se aprecia una caída alrededor de 10KHz

aproximadamente, y una disminución a partir de 14 KHz; muy cercanas a la medida en

cámara anecóica. Esto comprueba que los datos medidos están muy próximos a los

grabados en mejores condiciones, sin embargo no son del todo certeros.

Page 116: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

116

4.3 GRABACIÓN CON TÉCNICAS ESTEREOFÓNICAS ORTF, JECKLIN DISK Y BINAURAL Y

APLICACIÓN DE ALGORTIMO A ÉSTAS CAPTURAS.

Se puede resumir el objetivo de este apartado de la siguiente forma:

1. Capturas con dos técnicas de grabación.

2. Captura con técnica binaural para comparación.

3. Aplicación del algoritmo, con las características de la pinna mencionadas arriba, a

las grabaciones realizadas con las técnica utilizadas para esta investigación (ORTF y

Jecklin Disk).

4. Producto final, presentación multimedia para muestra de todo los filtrados.

Teniendo en cuenta lo dicho, se ejecuta en un principio el registro teniendo en cuenta

tres modos de grabación: ORTF, Jecklin Disk y binaural. Los instrumentos grabados

fueron los siguientes

Guitarra acústica.

Voz masculina.

Shaker.

Descripción general:

Lugar: Sala de grabación estudio híbrido Universidad de San Buenaventura Sede

Bogotá.

Fecha: 16 abril de 2009

Hora: 5:00 p.m.

Ruido de fondo: 32 dB

Intérprete de guitarra acústica: Salomón Díaz, estudiante semestre 7 Ingeniería de

sonido

Voz masculina: Salomón Díaz, estudiante semestre 7 Ingeniería de sonido

Intérprete Shaker: Mayra Cardozo

Modelo para grabaciones binaurales: William Romo, Docente

Page 117: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

117

Equipos utilizados

Soporte lógico (Software)

Protools versión 7.4

Matlab™ versión R2007a

Equipos

Caja de audífonos.

Micrófonos cardioides marca Rode®, referencia NT5.

Micrófonos omnidireccionales marca AKG©, referencia CK 62-ULS.

Micrófonos binaurales marca Sound professionals™, referencia SP-TFB-2

Sonómetro marca Svantek® tipo2, referencia 943 A.

Pistófono Marca Rion, Modelo NC-74.

Accesorios

Un adaptador estéreo para micrófonos.

Soporte para micrófonos.

Material absorbente (Jecklin Disk).

Cables XLR

Detalles de la grabación:

Calibración eléctrica de los micrófonos de tal forma que el nivel de entrada de los

micrófonos sea el mismo en los preamplificadores (se calibra por par de

micrófonos), usando para tal proceso el calibrador sonoro Rion NC-74.

Los ángulos de grabación son: azimuth 0°, 45°, 90°, 135°, 180° (lado izquierdo del

arreglo), es decir, las mismas posiciones horizontales utilizadas para la medición de

la pinna artificial.

La altura de los micrófonos se establece de forma que sea aproximada a la de una

persona de estatura promedio sentada. Para Jecklin Disk fue de 1.30m y para ORTF

1.10m; la altura de fuente-receptor fue 1m. Los dos arreglos reciben la misma

señal, para evitar diferencias en la captura de la interpretación. Algunas

representaciones de esta grabación son expuestas en la imagen 6.

Page 118: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

118

Se decide utilizar los micrófonos AKG© CK 62-ULS en el arreglo Jecklin, porque

presenta mejor relación señal/ruido que los utilizados para la medición de las

diferencias intertransductores, Behringer® ECM 8000.

La captura binaural no se pudo grabar al tiempo que las estéreo, por dificultades

de espacio, por consiguiente, se realiza otra asegurando que las condiciones fueran

las mismas en cuanto a interpretación.

Para efectos de comparación, la grabación binaural se realiza a distintas

elevaciones. (0°, 30°, 60°, 90°, para los ángulos azimuth que se han mencionado a

lo largo de este proyecto).

En síntesis, los instrumentos grabados quedaron distribuidos de la siguiente

forma según su método de captura:

-Guitarra ORTF.

-Guitarra Jecklin Disk.

-Guitarra Binaural.

-Shaker ORTF.

-Shaker Jecklin Disk.

-Shaker binaural.

-Voz ORTF.

-Voz Jecklin Disk.

-Voz Binaural.

Imagen 6. Grabación Con técnicas estereofónicas y grabación binaural.

Page 119: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

119

Ahora bien, la idea de grabar con estas técnicas es porque capturan un evento sonoro

con información de importancia en el plano horizontal. Para crear una sensación mas

real en la reproducción por medio de los audífonos, no solo se debe tener en cuenta

este plano, sino agregar también información que proporcione mas detalles respecto

al ambiente acústico, específicamente en el plano vertical; que es la finalidad de esta

investigación. Este complemento del que se habla, es el dado por la pinna (tomando

como base las mediciones de 4.2), aquí se detalla cómo:

Ya que las capturas estéreo se realizan en las mismas posiciones azimuth, utilizadas

para la extracción de las características de filtrado de la pinna artificial, se aplica la

respuesta al impulso de la pinna a esa señal en la misma posición; por ejemplo, para la

guitarra grabada con la técnica ORTF a 90 grados, se aplica la respuesta al impulso de

Page 120: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

120

la pinna artificial en esa misma posición, pero con sus distintas elevaciones; por lo

tanto, se obtendrá una guitarra filtrada, la cual produce ciertas sensaciones a

diferentes alturas, tomando como referencia la misma grabada a 90° horizontal. Las

alturas tienen diferentes características, las cuales permiten sentir ese

desplazamiento, que como se vio en los resultados de 4.2 tiene que ver con caídas en

frecuencias altas.

La forma de aplicar las características de filtrado a la señal estéreo capturada, es

mediante un operador matemático llamado Convolución; ésta se realiza mediante la

aplicación de un algoritmo en un software, Matlab™ versión R2007a. Es importante

decir que solo se toman, para filtrado, las técnicas elegidas para esta investigación, la

grabación con la técnica binaural es solo para una comparación, posteriormente se

trata.

Las sentencias aplicadas en este algoritmo para realizar tal proceso fue la siguiente:

>> [y,fs]= wavread ('Arreglo ORTF guitarra 90 grados az 1m.wav'); % archivo de audio

>> left=y(:,1); % Canal izquierdo

>> right=y(:,2); % Canal derecho

>> [x,fs]= wavread ('AZ90EL30.wav');% Respuesta al impulso azimuth 90 elevación 30

>> left=y(:,1); % Canal izquierdo

>> right=y(:,2); % Canal derecho

>> convo(:,1)=conv(left,x); % Convolución

>> convo(:,2)=conv(right,x); % Convolución

>> wavwrite(convo,fs,24,'convolución guitarra AZ90EL30 1m');

Este algoritmo aplicado es tedioso, ya que cada convolución toma aproximadamente

25 minutos en realizar; teniendo en cuenta que los archivos de audio tienen una

duración de 15 segundos. Se realizan aproximadamente 160 convoluciones, de tal

forma que el tiempo aproximado para llevarlas a cabo fue de 66 horas.

Para explicar los resultados de esta convolución se toma como referencia el mismo

ángulo que se ha tomado para todos los análisis anteriores, 90 grados, la elevación

también se toma aleatoriamente. La figura 31 expone para aire libre y la 32 para

recinto.

Page 121: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

121

Figura 31. Respuesta en frecuencia de guitarra: sin filtrar y con convolución. Respuesta en

frecuencia azimuth 90° elevación 30°.

Técnica de microfonería estéreo ORTF con respuesta al impulso al aire libre

Nota: la respuesta en frecuencia es tomada de la respuesta al impulso de la pinna obtenida por la

medición. Datos proporcionados por EASERA (versión demo)

Técnica de microfonería estéreo JECKLIN DISK con respuesta al impulso al aire libre

RI

Page 122: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

122

Interpretación de ilustración:

En la imagen se distinguen las tres curvas, la guitarra tal y como se captura (Color

verde), la respuesta en frecuencia de azimuth 90 con 30 de elevación(Color azul), y el

resultado de la convolución (Color violeta), que como ya se ha mencionado fue hecha

con la respuesta al impulso obtenida. Tanto en ORTF cómo para Jecklin Disk,

claramente se observa que la caída correspondiente a 9KHz, 12KHz y 16Khz

aproximadamente (marcado en circulo), es aplicada a la señal (guitarra) cuando la

convolución es hecha; notando, de esta forma, que el filtrado se está realizando con

éxito.

Figura 32. Respuesta en frecuencia de guitarra: sin filtrar y con convolución. Respuesta en

frecuencia azimuth 90° elevación 30°.

Técnica de microfonería estéreo ORTF con respuesta al impulso en estudio híbrido

Page 123: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

123

Técnica de microfonería estéreo JECKLIN DISK con respuesta al impulso en estudio híbrido

Interpretación de ilustración:

La curva de respuesta en frecuencia de azimuth 90° elevación 30° presenta caídas en

9KHZ, 12KHz y 16 kHz las cuales son aplicadas a la señal de la guitarra. Podría pensarse

de esas caídas como producto de las condiciones del lugar; pero estas presentan

coherencia con las gráficas de aire libre; por lo tanto estas son características de la

oreja para esa posición en específico.

La idea inicial era realizar una grabación de instrumentos para aire libre y la misma

para estudio híbrido, para que al aplicar las convoluciones se hicieran con sus

correspondientes lugares de medición; pero las condiciones atmosféricas no lo

permitieron. Es bien conocido, que se realizan dos grabaciones para saber cómo es el

comportamiento en condiciones ideales (sonido directo), y en presencia de reflexiones

que es como en la realidad los seres humanos escuchan.

En síntesis, la metodología fue la siguiente: se diseña una pinna artificial y su soporte

con el fin de extraer sus características significativas, que son diferentes para cada

Page 124: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

124

posición tanto horizontal como vertical. Ahora bien, estas características son aplicadas

a una señal grabada en estéreo, por lo tanto, la señal grabada tendrá esa característica

especial de la pinna, en esa posición en específico. Éste filtrado se realiza por medio de

una convolución (la señal estéreo + respuesta al impulso de la pinna, guardando que

las posiciones sean las mismas). Es importante decir, que para validar la eficacia tanto

de las técnicas estereofónicas, como los resultados obtenidos de la pinna, se realiza

una comprobación de resultados, presentando sonidos ya convolucionados a un

sujeto, el cual debe indicar su real ubicación. En el ítem número 5 se describe con

detalle.

Una manera de evidenciar los resultados obtenidos en todo este proceso, muy válido

en este caso, es por medio de la escucha de las mismas; por esta razón, se entrega

como producto una presentación multimedia.

¿Que contiene el producto final (presentación multimedia)?

Las grabaciones de guitarra con los métodos de captura ORTF y Jecklin Disk con sus

respectivas convoluciones para todas las elevaciones medidas, tanto para

respuesta al impulso al aire libre como para las de recinto (estudio híbrido).

Grabaciones de voz masculina con las técnicas mencionadas, con respuesta al

impulso al aire libre.

Las grabaciones realizadas con los micrófonos binaurales Sound professionals™,

referencia SP-TFB-2, para comparación con las técnicas aplicadas en el proyecto

como se cita en los objetivos.

La ventaja de esta presentación es permitir al usuario escuchar cada posición y

comparar unas con otras, es de fácil interacción y visualmente agradable. La figura 33

presenta la pantalla inicial y una de sus derivaciones.

Page 125: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

125

Figura 33. Producto final que contiene todas las convoluciones realizadas para todos los

ángulos tanto horizontales y verticales, además de la grabación binaural.

Page 126: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

126

5. PRESENTACIÓN Y ANÁLISIS DE RESULTADOS

5.1 VALIDACIÓN DE RESULTADOS

Básicamente este espacio es para comprobar y/o verificar que tan adecuadas son las

técnicas estereofónicas en proporcionar información para la localización precisa en el

plano horizontal, así como también determinar si se percibe un cambio de elevación y

que tan preciso es, en cuanto a capacidad de ubicación. Recordar que en el apartado

4.3 se realizaron una serie de grabaciones, entre ellas una voz y un shaker; estos

instrumentos fueron escogidos premeditadamente, ya que la percepción de elevación

es mejorada cuando frecuencias altas se encuentran dentro del estimulo, y con la

convolución realizada sería el complemento perfecto para una localización en el plano

vertical exitosa. ¿Qué técnica junto con las características de altura dada por la

convolución presenta menos errores de localización? y ¿Cómo se comportan éstas con

respecto a la técnica binaural?, será mostrado a continuación.

Cabe resaltar que la textura y la forma de esta pinna diseñada para realizar las

respuesta al impulso, con información en el plano vertical, es muy parecida a la del ser

humano; razón por lo que probablemente los resultados serán muy cercanos a la

percepción real; no obstante, la forma y el tamaño de este pabellón es de un sujeto en

específico por lo tanto, su función de transferencia será diferente a la de los demás

seres humanos, por tal motivo errores de localización en las pruebas pueden ocurrir.

La comprobación como ya se dijo, es aplicada con dos fuentes sonoras (una voz

masculina y un shaker) y con dos tipos de audífonos (Sony MDR V-6 e In-Ear); porque

dependiendo del tipo de auriculares se tendrán ciertos resultados que pueden o no ser

satisfactorios, referidos a la ubicación de la fuente sonora y a la percepción de

espacialidad. las convoluciones presentadas a los sujetos, 15 en total, son las

delimitadas a continuación. Para esta prueba se aplica la convolución con la RI al aire

libre porque representa condiciones más ideales, más cercanas a las cámaras

anecóicas con respecto a las del estudio híbrido.

Solo para evaluación del plano horizontal sin convolución:

Voz grabada en AZ0.

Voz grabada en AZ45.

Page 127: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

127

Voz grabada en AZ90.

Voz grabada en AZ135.

Voz grabada en AZ180.

Nota: tanto para ORTF como para Jecklin Disk se aplica esta misma configuración. Ésta presentación es

sin convolución porque finalmente se requiere complementar el plano vertical. La técnica binaural

presenta ésta disposición también.

Solo para evaluación en el plano vertical:

Convolución de shaker grabado en AZ0 EL0 CON RI AZ0 EL0.

Convolución de shaker grabado en AZ0 EL0 CON RI AZ0 EL30.

Convolución de shaker grabado en AZ0 EL0 CON RI AZ0 EL60.

Convolución de shaker grabado en AZ0 EL0 CON RI AZ0 EL90.

Convolución de shaker grabado en AZ90 EL0 CON RI AZ90 EL0.

Convolución de shaker grabado en AZ90 EL0 CON RI AZ90 EL30.

Convolución de shaker grabado en AZ90 EL0 CON RI AZ90 EL60.

Convolución de shaker grabado en AZ90 EL0 CON RI AZ90 EL90.

Nota: tanto para ORTF, Jecklin Disk y binaural, se aplica esta misma configuración.

La presentación de las muestras se realiza de acuerdo a lo establecido para este tipo

de valoraciones subjetivas1. De acuerdo con esto, se tiene en cuenta una variable muy

importante: presentar los datos aleatoriamente, pero no tantas veces, de forma que el

sujeto no sienta expectativa con respecto a la aparición de la señal, ya que esto puede

causar errores en las respuestas. En los análisis de los resultados obtenidos en esta

valoración subjetiva, se menciona cuales factores pudieron de alguna forma u otra

afectar o beneficiar las respuestas. por último un lenguaje de fácil entendimiento es

fundamental. El formato utilizado para esta validación es mostrado en el anexo G.

El orden de emisión de señal aplicado es el siguiente:

1 SCHIFFMAN, Harvey Richard. Psicofísica. En: La percepción sensorial. Segunda edición. Mexico:limusa,1997. P. 35-44

Page 128: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

128

Tabla 5. Orden de reproducción de muestras.

AZIMUTH Técnica de microfonería estéreo

Jecklin disk Técnica de microfonería estéreo

ORTF Técnica Binaural

Sonido 1 - 0 grados Sonido 1 - 0 grados Sonido 1 - 0 grados

Sonido 2 - 90 grados Sonido 2 - 45 grados Sonido 2 - 45 grados

Sonido 3 - 90grados Sonido 3 - 45 grados Sonido 3 - 135 grados

Sonido 4 - 45 grados Sonido 4 - 135 grados Sonido 4 - 180 grados

Sonido 5 - 0 grados Sonido 5 - 0 grados Sonido 5 - 135 grados

Sonido 6 - 45grados Sonido 6 - 180grados Sonido 6 - 180grados

Sonido 7 - 180grados Sonido 7 - 90grados Sonido 7 - 90grados

Sonido 8 - 135 grados Sonido 8 - 90 grados Sonido 8 - 45 grados

Sonido 9 - 135 grados Sonido 9 - 135 grados Sonido 9 - 90 grados

Sonido10 - 180 grados Sonido10 - 180 grados Sonido10 - 0 grados

ELEVACIÓN Técnica de microfonería estéreo

Jecklin disk Técnica de microfonería estéreo

ORTF Técnica Binaural

Sonido 1 AZ0EL0 Sonido 1 AZ0EL0 Sonido 1 AZ0EL0

Sonido 2 EZ0EL60 Sonido 2 AZ0EL60 Sonido 2 AZ0EL60

Sonido 3 AZ0EL90 Sonido 3 AZOEL90 Sonido 3 AZOEL90

Sonido 4 AZ0EL30 Sonido 4 AZ0EL30 Sonido 4 AZ0EL30

Sonido 1 AZ90EL0 Sonido 1 AZ90EL30 Sonido 1 AZ90EL0

Sonido 2 AZ90EL30 Sonido 2 AZ90EL0 Sonido 2 AZ90EL90

Sonido 3 AZ90EL90 Sonido 3 AZ90EL90 Sonido 3 AZ90EL30

Sonido 4 AZ90EL60 Sonido 4 AZ90EL60 Sonido 4 AZ90EL60

Se enseñan por medio de gráficas los resultados obtenidos mediante la comprobación;

dos formas son presentadas: una mostrando los aciertos de localización que tuvieron

los sujetos y otra mostrando porcentualmente cómo se comportan las técnicas con sus

respectivos aparatos de reproducción (Sony MDR V-6, In-Ear).

Page 129: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

129

Figura 34. Aciertos técnica estéreo ORTF y Jecklin Disk en presentación de la muestra en la

posición horizontal, para audífonos Sony MDR V-6.

Análisis de gráficos:

En ninguna de las dos técnicas reproducidas con el sistema Sony MDR V-6 se presenta

un acierto total, existe un gran número de personas que presentan errores de

localización ante la muestra presentada, pero los mayores errores se encuentran en la

segunda, es decir, en la repetición del sonido. Esto pudo ser ocasionado uno, a la

expectativa del individuo ante la presencia de la señal, ya que las personas

posiblemente no esperaban que el sonido volviera a aparecer, en algunos casos

consecutivamente, y dos a la motivación del mismo a detectar la muestra en una

posición específica. Hay buen acierto en el ángulo azimuth de 90°, obteniendo el

mayor número de personas con coincidencia la técnica Jecklin Disk, pero ésta misma

02468

10121416

0 45 90 135 180

mer

o d

e p

erso

nas

Ángulo Azimuth

Aciertos en azimuth arreglo ORTF (audífonos Sony MDR V-6)

Primera muestra

Repetición del sonido

02468

10121416

0 45 90 135 180

me

ro d

e p

ers

on

as

Ángulo Azimuth

Aciertos en azimuth arreglo Jecklin Disk (audífonos Sony MDR V-6)

Primera muestra

repetición del sonido

Page 130: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

130

presenta muchos errores en azimuth 180°. Otros posibles factores que afectaron la

localización precisa, fue el ruido de fondo que pudo llevar a problemas en la

concentración, el criterio de decisión del individuo, cierta intimidación por la presencia

de la persona que presenta la muestra, tiempo total de la prueba, así como también la

fatiga por la presentación de tantos sonidos (54 en total). Eso por el lado de

percepción psicoacústica, otros errores son los de las mediciones mismas, ya que como

no fueron hechas en condiciones ideales los resultados finales esta sujetos a esos

errores.

Figura 35. Aciertos técnica estéreo ORTF y Jecklin Disk en presentación de la muestra en la

posición horizontal, para audífonos In-Ear.

02468

10121416

0 45 90 135 180

mer

o d

e p

ers

on

as

Ángulos Azimuth

Aciertos en azimuth arreglo ORTF (audifonos In-Ear)

Primera muestra

Repetición del sonido

02468

10121416

0 45 90 135 180

mer

o d

e p

erso

nas

Ángulos Azimuth

Aciertos en azimuth arreglo Jecklin Disk (audífonos In-Ear)

Primera muestra

Repetición del sonido

Page 131: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

131

Análisis de gráficos:

Para este tipo de audífonos, es notado que el mayor equilibrio y por tanto el mayor

número de coherencias con las muestras reales presentadas, se debe a la técnica

ORTF. Mientras que la técnica Jecklin aparte de presentar los mayores errores de

localización no solo los tiene para la repetición del sonido sino también para la primera

muestra presentada; como por ejemplo en los ángulos de 45°, 135° y 180°. Es notado,

tanto para este tipo de auriculares como para los Sony MDR V-6, que los individuos

presentan errores de importancia en la técnica Jecklin Disk para el ángulo de 180°;

probablemente las personas tendieron a dirigir sus respuestas a 0°, por la dificultad

innata de los seres humanos para identificar sonidos delanteros y trasero, más aún,

cuando son presentados mediante un sistema de reproducción (audífonos); exentos de

cualquier tipo de movimiento de cabeza que pueda minimizar estos errores de

localización. Más adelante se muestran ejemplos de error frontal-trasero de esta

prueba. La pinna, como se ha mencionado, ayuda a mejorar este problema de

localización; para Jecklin en particular no funciona del todo, caso contrario para la

ORTF en los dos tipos de auriculares.

Figura 36. Aciertos técnica Binaural en presentación de la muestra en la posición horizontal,

para audífonos Sony MDR V-6.

02468

10121416

0 45 90 135 180

mer

o d

e p

erso

nas

Ángulos azimuth

Aciertos en azimuth, técnica binaural (audífonos Sony MDR V-6)

Primer sonido

Repetición del sonido

Page 132: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

132

Figura 37. Aciertos técnica Binaural en presentación de la muestra en la posición horizontal,

para audífonos In-Ear.

Análisis de gráfica 36 y 37

Para la técnica binaural, los errores más pronunciados son los de 45° y 90° para los dos

tipos de audífonos; mientras que 135° y 180° presentan los mejores aciertos. Estos

resultados están sujetos, a la función de transferencia de la oreja del individuo

utilizado para la grabación, ya que es diferente a la de cada persona de la prueba

realizada. Se esperaban mejores resultados, puesto que en este caso, a diferencia del

uso del modelo de la pinna artificial, se usa una oreja real y se aprovecha la

información de las reflexiones de la cabeza y del torso, los cuales no fueron tenidos en

cuenta para el filtrado de las técnicas estereofónicas.

Figura 38. Aciertos técnica estéreo ORTF y Jecklin Disk en presentación de la muestra en la

posición horizontal 0° y 90° con elevaciones de 0°, 30°, 60°, 90°, para audífonos Sony MDR V-6.

02468

10121416

0 30 60 90

mer

o d

e p

erso

nas

Ángulos de Elevación

Aciertos en elevación arreglo Jecklin Disk (audífonos Sony MDR V-6)

Azimuth 0º

Azimuth 90º

02468

10121416

0 45 90 135 180

me

ro d

e p

ers

on

as

Ángulo azimuth

Aciertos en azimuth, técnica binaural (audífonos In-Ear)

Primera muestra

Repetición del sonido

Page 133: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

133

Análisis de gráficos:

ORTF presenta buenos aciertos, pero no excelentes, para las elevaciones en azimuth 0°

de 0°, 60°, 90° y localización prácticamente nula para elevación 30°; caso contrario

para AZ 90° elevación 30°, donde presenta su más alto nivel con un total de 8 personas

con aciertos.

Jecklin Disk presenta pobre localización de elevación; azimuth 90°- elevación 0°

presenta un alto número de personas con respuestas coherentes. De aquí se puede

deducir, basado en los resultados de las 7 gráficas de arriba, que los seres humanos

tienen una gran capacidad para identificar sonidos que se encuentran solo a un lado,

90 grados.

Con audífonos cerrados como los Sony MDR V-6, la concordancia en resultados es

buena para ORTF, mientras que para Jecklin deficiente; sin embargo, los resultados no

son excelentes por los factores mencionados anteriormente; aunque cabe resaltar

aquí, que independientemente de los factores que pudieron afectar los resultados, la

técnica Jecklin Disk siempre presenta efectos pobres mientras que la ORTF excelente

definición y eso es comprobado por múltiples estudios2.

22 CEOEN, Carl. Comparative Stereophonic Listening Test. J. Acoust. Soc. Am. January/February 1972. Vol 20. p. 19-27

CASTRO, Francisco. Análisis comparativo de 4 configuraciones de microfonía estereofónicas.Trabajo de grado Ingeniero de sonido.

Bogotá D.C.: Universidad de San Buenaventura. Facultad de Ingeniería,2005.

02468

10121416

0 30 60 90

me

ro d

e p

ers

on

as

Ángulos de Elevación

Aciertos en elevación Arreglo ORTF (audífonos Sony MDR V-6)

Azimuth 0º

Azimuth 90º

Page 134: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

134

Figura 39. Aciertos técnica estéreo ORTF y Jecklin Disk en presentación de la muestra en la

posición horizontal 0° y 90° con elevaciones de 0°, 30°, 60°, 90°, para audífonos In-Ear.

Análisis de gráficos: ORTF presentan coherencias de gran valor para Azimuth 0°-

elevación 0°, al igual que Jecklin Disk. Ésta última además muestra buenos resultados

para azimuth 90°-elevacion 30° y para azimuth 0°-elevación 60°. Sin embargo, para la

percepción de elevación con ambos audífonos (Sony MDR V-6 In-Ear), el rendimiento

está equilibrado.

02468

10121416

0 30 60 90

me

ro d

e p

ers

on

as

Ángulos de elevación

Aciertos en elevación arreglo ORTF (audifonos In-Ear)

Azimuth 0º

Azimuth 90º

02468

10121416

0 30 60 90

mer

o d

e p

erso

nas

Ángulos de elevación

Aciertos en elevación arreglo Jecklin Disk (audífonos In-Ear).

Azimuth 0º

Azimuth 90º

Page 135: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

135

Figura 40. Aciertos técnica Binaural en presentación de la muestra en la posición horizontal 0°

y 90° con elevaciones de 0°, 30°, 60°, 90°, para audífonos Sony MDR V-6.

Figura 41. Aciertos técnica Binaural en presentación de la muestra en la posición horizontal 0°

y 90° con elevaciones de 0°, 30°, 60°, 90°, para audífonos In-Ear.

Análisis de gráfico 40 y 41:

Presenta buen número de aciertos para azimuth 90 grados, especialmente en 60° y 90°

de elevación, para audífonos Sony; In Ear presenta sus mayores aciertos en 0° y 90°

para azimuth 90° también, pero datos mínimos para azimuth 0. Con esto se

comprueba lo que se ha venido analizando; las mayores coherencias son presentadas

en 90 grados azimuth.

02468

10121416

0 30 60 90

me

ro d

e p

ers

on

as

Ángulos de elevación

Aciertos en elevación, Binaural ( audífonos Sony MDR V-6)

AZ0

AZ90

02468

10121416

0 30 60 90

me

ro d

e p

erso

nas

Ángulos de elevación

Aciertos en elevación, Binaural ( audífonos In-Ear)

AZ0

AZ90

Page 136: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

136

Figura 42. Indicación de porcentajes para posición horizontal. Audífonos Sony MDR V-6, InEar

52,00%

10,00%

8,67%

10,67%

8,00%

10,67%

Comportamiento promedio arreglo ORTF ángulos azimuth (audífonos Sony MDR V-6)

Error

0

45

90

135

180

60,67%

6,67%

6,00%

14,00%

8,00%4,67%

Comportamiento promedio arreglo Jecklin Disk ángulos azimuth (audífonos Sony MDR V-6)

Error

0

45

90

135

180

50,67%

10,00%

10,67%

11,33%

7,33%

10,00%

Comportamiento promedio arreglo ORTF ángulos azimuth (audífonos In-Ear)

Error

0

45

90

135

180

68,67%

8,00%

6,00%

8,67%

5,33% 3,33%

Comportamiento promedio arreglo Jecklin Disk ángulos azimuth (audífonos In-Ear)

Error

0

45

90

135

180

Page 137: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

137

Figura 43. Indicación de porcentajes para posición horizontal técnica binaural. Audífonos Sony

MDR V-6 ,InEar

Figura 44. Indicación de porcentajes para elevación

68,33%8,33%

6,67%

8,33%

8,33%

Comportamiento promedio arreglo Jecklin Disk con elevación en azimuth 0° (audífonos

Sony MDR V-6)

Error

0

30

60

90

70,67%

9,33%

4,67%

6,67%

7,33%

10,67%

Comportamiento promedio técnica binaural ángulos azimuth (audífonos Sony

MDR V-6) Error

0

45

90

135

180

56,00%

10,00%

6,00%

10,67%

8,67%

8,67%

Comportamiento promedio Ténica binaural ángulos azimuth (audífonos In-Ear)

Error

0

45

90

135

180

Page 138: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

138

55,00%

15,00%

3,33%

15,00%

11,67%

Comportamiento promedio arreglo ORTF con elevación en azimuth 0° (audífonos MDR

V-6)

Error

0

30

60

90

55,00%

11,67%

13,33%

8,33%

11,67%

Comportamiento promedio arreglo ORTF con elevación en azimuth 90° (audífonos Sony

MDR V-6)

Error

0

30

60

90

61,67%

16,67%

11,67%

5,00%5,00%

Comportamiento promedio técnica Jecklin Disk con elevación en azimuth 90° (audífonos

Sony MDR V-6)

Error

0

30

60

90

Page 139: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

139

53,33%

18,33%

8,33%

10,00%

10,00%

Comportamiento promedio arreglo ORTF con elevación en azimuth 0° (audífonos In-Ear)

Error

0

30

60

90

60,00%

16,67%

5,00%

13,33%

5,00%

Comportamiento promedio arreglo Jecklin Disk con elevación en azimuth 0° (audífonos

In-Ear)

Error

0

30

60

90

60,00%

15,00%

13,33%

5,00%6,67%

Comportamiento promedio arreglo Jecklin Disk con elevación en azimuth 90°

(audífonos In-Ear)

Error

0

30

60

90

Page 140: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

140

Figura 45. Indicación de porcentajes para elevación, Técnica binaural

75,00%3,33%

10,00%

3,33%8,33%

Comportamiento promedio Arreglo ORTF con elevación en azimuth 90° (audífonos In-

Ear)

Error

0

30

60

90

55,00%

18,33%

5,00%

10,00%

11,67%

Comportamiento promedio técnica Binaural con elevación en azimuth 0°

( audífonos Sony MDR V-6)

Error

0

30

60

90

70,00%

13,33%

3,33%

8,33%5,00%

Comportamiento promedio técnica Binaural con elevación en azimuth 0°

(audífonos In-Ear)

Error

0

30

60

90

Page 141: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

141

Análisis y conclusiones generales:

Con respecto a los audífonos Sony MDR V-6 el mayor porcentaje lo obtuvo la

técnica ORTF con un 48 % de aciertos en el plano horizontal, mientras que para

elevación los mejores fueron para la técnica Jecklin Disk con un porcentaje de 45%.

Para los audífonos In-Ear, sigue prevaleciendo la técnica ORTF para el plano

horizontal con un porcentaje de 49.33%. Para la percepción de alturas, la ORTF

exhibe resultados buenos, 40% para los dos tipos de azimuth, pero Jecklin supero a

ORTF en azimuth 0° en sus distintas elevaciones con una proporción de 46.67%.

90 grados azimuth fundamentado en audífono In-Ear presenta resultados pobres

en comparación con los Sony MDR V-6.

48,33%

16,67%

10,00%

10,00%

15,00%

Comportamiento promedio técnica Binaural con elevación en azimuth 90°

(audífonos In-Ear)

Error

0

30

60

90

38,33%

11,67%11,67%

18,33%

20,00%

Comportamiento promedio técnica Binaural con elevación en azimuth 90°

(audífonos Sony MDR V-6)

Error

0

30

60

90

Page 142: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

142

En general la ORTF, como era esperado, presenta los mayores aciertos en el eje

horizontal, mientras que para elevación contrario a todas las predicciones, Jecklin

Disk es la mejor. Se puede hacer una deducción de este fenómeno y es debido a

que la pantalla acústica que puede generar cierto tipo de característica que ayuda

a la percepción de elevación.

El tipo de audífonos afecta la percepción. Los individuos se sintieron más cómodos

con los Sony y objetaron sentir más percepción de profundidad con ellos, pero los

resultados graficados están un poco equilibrados al respecto.

Errores frontal-trasero son muy frecuentes, razón por la cual, los errores de

localización aumentaron. A continuación se muestra un ejemplo presentado en

esta comprobación.

Ésta gráfica representan las respuestas dadas por las personas ante un sonido

emitido en la posición 135 grados azimuth, y como se nota en el gráfico los juicios

de las personas eran confusos; ya que tendían sus respuestas al ángulo de 45

grados también. Es normal que las personas presente cierta dificultad en identificar

sonidos dentro del plano medio. Hay muchos Ejemplos como este dentro de ésta

prueba; mostrados en el anexo H (de las 3 técnicas de grabación) . Problemas de

ubicación también se deben a disparidad en la función de transferencia de la pinna

artificial, con aquella de la persona que finalmente escucha la grabación.

A pesar de la dificultad presentada para indicar la verdadera ubicación de la

imagen sonora, por lo menos en elevación, objetivo primario de la investigación, lo

importante es que las personas lograron percibir un desplazamiento en el plano

01234567

0 45 90 135 180 225

mer

o d

e p

erso

nas

Ángulo azimuth

135 grados azimuth. Jecklin Disk

135 grados

135 grados repetición

Page 143: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

143

vertical. Correcciones de las mediciones, como por ejemplo, las hechas en

condiciones ideales mejorarían esta percepción.

El hecho de tener información de reverberación es un punto a favor para no sentir

la imagen sonora como dentro de la cabeza, ya que la imagen se siente de esta

forma cuando la distancia del evento auditivo es más pequeña que el radio de la

cabeza.

Para la técnica de grabación binaural los resultados están alejados de lo esperado,

ya que se presenta un error del 70.66% y 56 % para audífonos Sony MDR V-6 e In-

Ear respectivamente. Sin embargo presenta buenas respuestas para azimuth 90, en

sus distintas elevaciones, con un porcentaje de 61.67 para Sony y 51.67 para In-Ear.

Comparando esta técnica con aquellas aplicadas para esta investigación, se puede

concluir que, éstas últimas, funcionan mejor para el plano horizontal, mientras que

para elevación prevalece la binaural.

Se tiene una explicación coherente para estos resultados y es que la técnica

binaural fue la última técnica presentada a los sujetos; por lo tanto, ya tenían

cierto grado de cansancio auditivo en la presentación de las señales binaurales. Por

otro lado, en los laboratorios de sonido generalmente hay flujo constante de

estudiante, debido a esto la concentración era dispersa en las personas a las cuales

se le presentaron los sonidos.

Page 144: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

144

6. CONCLUSIONES

Mediante la obtención de los atributos de la pinna artificial, se pudieron realizar

filtrados a una señal estereofónicamente grabada, con distintas técnicas de captura. Se

logra obtener, en cierta medida y con un porcentaje promedio, la percepción de un

desplazamiento en el eje vertical (altura) de la señal filtrada.

Efectuar mediciones en cámaras anecóicas permite obtener la información correcta

de la fuente sonora, su ubicación y sus características espectrales; por lo tanto, si las

mediciones de la pinna se hubieran realizando en tal recinto, la sensación lograda sería

mejor en el plano vertical principalmente, y los errores de localización de la fuente

sonora serian mínimas, por no decir que nulas; ya que el hecho de obtener lo que

verdaderamente la pinna realiza, permite su emulación con mayor exactitud.

La variación de datos es adjudicada principalmente a las condiciones de medición;

factores climáticos, ruido de fondo, humedad relativa, reflexiones con el soporte de la

pinna y errores mecánicos en la angulación de la fuente (altavoz) y el soporte que

permite la angulación de la pinna artificial.

Se consigue comprobar lo que múltiples investigadores han manifestado, con

respecto al filtrado de la pinna, que cuando la fuente sonora varia de ubicación

presenta caídas (notch), principalmente en el rango de frecuencias entre 4 KHz-16Khz.

Los errores de localización son menores en la técnica estereofónica ORTF, para

fuentes ubicadas en el plano horizontal, mientras que la técnica Jecklin Disk entrega el

mejor rendimiento en la impresión de elevación. A pesar de esto, el comportamiento

en general de las técnicas para esta investigación, no fue el más óptimo.

En los resultados de la prueba se presentan errores de localización frontal-trasero,

dejando entrever que la pinna ayuda a mejorarlo; pero otros factores asociados con el

movimiento de la cabeza, reflexiones del torso y la cabeza también son importantes,

sin embargo, no fueron objeto de investigación para este proyecto.

En los datos obtenidos en la comprobación de resultados, el ángulo de 90 grados

visto en las gráficas (34 en adelante), presentan mayor porcentaje de aciertos tanto en

azimuth como en elevación. Esto puede ser ocasionado por la incidencia directa de una

señal acústica al canal auditivo en este ángulo, ya que sus retardos, dadas por las

Page 145: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

145

reflexiones, son pequeños en comparación a los otros ángulos (según estudios

realizados.3)

A pesar de la proporción derivada de las pruebas con distintos audífonos, el modelo

Sony MDR-V6 ofrece más confort y percepción de profundidad, según lo expresado por

las personas, punto clave para la impresión de tridimensionalidad, no obstante los

resultados están equilibrados con respecto a los audífonos In-Ear.

Las variaciones y/o errores en los resultados estuvieron sujetos al hecho de que el

filtrado se realizó solo con el lado izquierdo de la oreja artificial, por lo tanto, la

aplicación de los dos filtrados (izquierdo-derecho) puede mejorar las respuestas.

Esta comprobado que la reverberación es importante para crear una sensación de

ambiente parecida a la audición cotidiana; por tal razón, los instrumentos musicales

grabados en campo reverberante, permiten el incremento de la sensación de

espacialidad, al contener ésta información del entorno real de captura; aunque la

convolución se haya realizado con la respuesta al impulso de la pinna al aire libre.

También el hecho de tener este tipo de información ayuda a sentir las fuentes

externalizadas (fuera de la cabeza); este punto es reforzado con la distancia, pero dada

las dificultades de medición presentadas a lo largo de la investigación, no se pudo

determinar la importancia de la distancia para este tipo de representaciones.

Para la comprobación de resultados se aplica la grabación hecha en recinto con la

respuesta al impulso de la pinna artificial al aire libre. Como los instrumentos tienen

información del entorno de captura, por esta razón los errores fueron minimizados.

Basado en los porcentajes obtenidos en la valoración subjetiva, se puede deducir,

que las técnicas aplicadas para el estudio de esta investigación funcionan mejor en

comparación con la binaural. No obstante, es importante mencionar que estos efectos

son ocasionados por factores ajenos a la grabación en sí, como el ruido externo, la

concentración de los sujetos y la fatiga ocasionada por la presentación de un gran

número de sonidos. El mejoramiento de este tipo de valoraciones, como por ejemplo,

dividir la prueba en varios segmentos, podrían mejorar los resultados.

3 Batteau, D. W. The role of the pinna in human localization. The Royal Society of London. Series B, Biological Sciences. Vol. 168,

No. 1011. Received 2 July 1965, Revised 20 December 1966. pp. 158-180.Valido desde internet en: http://www.jstor.org/stable/75711.

Page 146: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

146

Delimitar un tamaño y forma del pabellón auditivo es realmente complejo, ya que

existe una cantidad tan amplia de pabellones auditivos como de personas. Los

resultados obtenidos están sujetos a un tipo en particular de pabellón, razón por la

cual los datos obtenidos de su función de transferencia presentan cierto grado de

variabilidad de una persona a otra.

Los audífonos han sido usados típicamente para investigar solo los efectos de las

diferencias interaurales, sin embargo, información espectral como los proporcionados

por la pinna han sido de poco estudio. En esta investigación se agrega esta

información, desde el punto de vista objetivo (respuesta al impulso). Investigaciones

futuras pueden cuantificar mejor estos datos y complementar lo que por medio de

esta investigación se ha iniciado; ya que es un tema muy complejo y que involucra

numerosas variables, muchas de ellas no se tuvieron en cuenta para esta exploración.

La aplicación del método utilizado en esta investigación (convolución de señal

estéreo a través de una pinna artificial) para obtener sensaciones auditivas, similares a

las del sonido tridimensional, fue importante en el desarrollo de herramientas

análogas a las ya existentes, las cuales permiten ser usadas en distintas aplicaciones y

fue un avance significativo para el entendimiento de la percepción humana.

Page 147: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

147

7. RECOMENDACIONES

Obtener las respuesta al impulso bajo mejores condiciones, a diferentes posiciones

y distancias puede recrear mejor la forma de escucha humana, y de esta forma se

podrían utilizar en producciones audiovisuales y multimedia, grabaciones como

eventos y paisajes sonoros (Foleys, sonido ambiente), por medio de la aplicación

del principio de realidad virtual.

Crear algoritmos más eficientes de convolución que disminuya considerablemente

el tiempo requerido para realizarla.

La creación de un grupo de investigación para seguir indagado el comportamiento

de la pinna o para la obtención de otras características que proporcionen, de igual

forma, métodos para la creación de sonido tridimensional. Una opción podría ser

mediante la HRIR (respuesta al impulso relativa a la cabeza).

Tomando como base lo investigado en este proyecto, crear una interfaz gráfica que

permita a partir de la inserción de una señal estéreo de entrada, cambiar su

posición (tanto horizontal como vertical) a voluntad del usuario, creando eventos

de tridimensionalidad. Abriendo así un posible mercado que pueda ser de utilidad

para la universidad.

Explorar otros campos en los que se puedan aplicar los datos obtenidos mediante

la repuesta al impulso de la pinna, por ejemplo:

- En medicina para simulación de eventos tridimensionales a personas con

deficiencias visuales y/o auditivas.

- Sonido para videojuegos.

- Grabaciones musicales para la ampliación del campo estéreo y así obtener una

grabación mas real con respecto al entorno de escucha.

- Aplicación de principios de reverberación por convolución para que se puedan

obtener distintos tipos de recintos al usado en la grabación y complementar así

lo que se obtiene por medio de la pinna artificial.

Realizar una comprobación de resultados con una población mucho mayor y que

incluyan personas sin ningún tipo de entrenamiento auditivo.

Page 148: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

148

ERRORES SISTEMÁTICOS

Reflexiones ocasionadas en las superficies del soporte de la pinna, que pueden ser

significativos en los resultados logrados.

Fallas humanas en la ubicación precisa de la fuente en el ángulo correcto.

Incapacidad de ejecución idéntica en la grabación de instrumentos.

Condiciones no ideales de medición, como las de aire libre y otras relacionadas a

las del recinto, por su diseño.

Ruido de fondo al momento de la medición.

Ruido eléctrico y relación señal/ruido de los micrófonos utilizados.

Page 149: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

149

BIBLIOGRAFÍA

Ángel, Francisco, et al. Audiología básica. Bogotá D.C.: Universidad Nacional de

Colombia, Olga Gómez Gómez, 2006.

ARIAS Claudia y RAMOS Oscar. Audición espacial en espacios reverberantes: Aspectos

teóricos relevantes. EN: Revista Interamericana de Psicología/Interamerican Journal of

Psychology. Cordoba.Vol.37, Núm. 2, p. 375

BARTLETT, Bruce. Stereo microphone techniques. Boston: Focal Press, 1991.

BARLETT, Bruce and BARTLETT, Jenny. On-location recording techniques. Boston: Focal

Press, 1999.

Batteau, D. W. The role of the pinna in human localization. The Royal Society of

London. Series B, Biological Sciences. Vol. 168, No. 1011. Received 2 July 1965, Revised

20 December 1966. pp. 158-180. Válido desde internet en:

http://www.jstor.org/stable/75711.

BLAUERT, Jens. Spatial Hearing, The psychophysics of human sound localization.

Revised edition. London: Cambridge, Massachusetts, 1997.

BLOOM, P. Jeffrey Creating Source Elevation Illusions by Spectral Manipulation. J. Audio Eng. Soc. September 1977. Vol 25. p. 560-565.

BEGAULT, Durant. 3-D sound for virtual reality and multimedia. California: Ames

Research Center, 2000.

CARRION ISBERT, Antoni. Diseño acústico de espacios arquitectónicos. Barcelona:

Editions UPC,1998.

CARRILLO, Vicente. Fisiología de la audición, Página docente medicina Universidad del

Mar. Actualizado el 20 de diciembre de 2008. disponible desde:

http://otorrino.homestead.com/files/Fisiolog_a_de_la_Audici_n.doc

Page 150: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

150

CASTRO, Francisco. Análisis comparativo de 4 configuraciones de microfonía

estereofónicas. Trabajo de grado Ingeniero de sonido. Bogotá D.C.: Universidad de

San Buenaventura. Facultad de Ingeniería,2005.

CEOEN, Carl. Comparative Stereophonic Listening Test. J. Acoust. Soc. Am.

January/February 1972. Vol 20. p. 19-27

FLYNN, William E. Role of the Pinna in Hearing. J. Acoust. Soc. Am. April 1965. Vol 38.

Received 2 april 1965, p. 104.

GARCÍA, Luis. Universidad Autónoma de Madrid, página de docencia de fisiología

disponible desde: http://www.uam.es/personal_pdi/medicina/algvilla/audicion/

audicion.htm.

GARDNER, Mark and GARDNER, Robert. Problem of localization in the median plane:

effect of pinna cavity occlusion. J. Acoust. Soc. Am. February 1973. Vol 53. Received

21 June 1972, p. 400-408 .

GRANTHAM, Wesley. Spatial hearing and related phenomena: Handbook of Perception

and Cognition, Second Edition. Second edition London, UK: edited by B. C. J. Moore.

Academic, 1995.

HOWARD, David and ANGUS, James. Acoustics and Psychoacosutics. Second edition.

Oxford: Francis Rumsey, 2001.

International organization for Standardization. Acoustics, measurement of the

reverberation time of rooms with reference to other acoustical parameters. ISO3382.

Segunda edición. Switzerland,1997.

MIDDLEBROOKS, John and GREEN, David. Annual Review of Psychology. Sound

Localization by Human Listeners. January 1991, Vol. 42, Pages 135-159.

Page 151: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

151

PÉREZ, José y DE LA CUESTA, Mariana. Sonido 3D, apartado 4.2, las coordenadas

(Elevación). Válido desde internet en:

http://www.lpi.tel.uva.es/~nacho/docencia/ing_ond_1/trabajos_03_04/Csound/42.ht

m

RAYKAR, Vikas c, et al. Extracting the frequencies of the pinna spectral notches in

measured head related impulse responses J. Acoust. Soc. am. April 2005. Vol 118.

Received 13 July 2004, p. 364–374.

RAMOS, Oscar, et al. Modelo acústico de cabeza y torso mediante análisis de

componentes principales. Córdoba, Argentina: Asociación Argentina de mecánica

computacional, 2007, vol. XXVI.

SCHIFFMAN, Harvey Richard. Psicofísica. En: La percepción sensorial. Segunda edición.

Mexico:limusa,1997. P. 35-44

VERGARA, Ramiro. Fisiología auditiva, visión actualizada. Bogotá D.C.: Imprenta y

Publicaciones de las Fuerzas Militares,1990.

XXXII Congreso nacional de acústica, Tecniacústica y encuentro Ibérico de acústica

logroño (OCTUBRE, 2001: Barcelona, España). BARTI Robert; ORDOYO, Fabiola.

Comparación entre las técnicas binaural y estéreo para la localización de fuentes en el

espacio 3d. Departamento de acústica Ingeniería y Arquitectura la salle. Universidad

Ramon Ilull. Válido en internet desde: http://www.sea-

acustica.es/publicaciones/4366pn004.pdf

WATKINS, Anthony J. Psychoacoustical aspects of synthesized vertical locale cues. J. Acoust. Soc. Am. Vol 63. p. 1152-1165.

WIGHTMAN, Frederic and KISTLER Doris. Headphone simulation of free-field listening I and II(a,b). J. Acoust. Soc. Am. February 1989. Vol 85. Received 14 May 1988, p. 858-867.

Page 152: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Anexo A. Partes del oído, vías auditivas ipsilateral y contralateral y corteza auditiva; camino que sigue el sonido hasta llegar a la

152

Partes del oído, vías auditivas ipsilateral y contralateral y corteza auditiva; camino que sigue el sonido hasta llegar a la

Cerebral.

Partes del oído, vías auditivas ipsilateral y contralateral y corteza auditiva; camino que sigue el sonido hasta llegar a la Corteza

Page 153: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

153

Anexo B. Posicionamiento del micrófono de medición en estudio híbrido.

Page 154: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

154

Anexo C. Realización de la pantalla acústica.

Page 155: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

155

Anexo D. Construcción soporte pinna y parlante.

Disco metálico

Page 156: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

156

Base de madera

Page 157: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

157

Soporte metálico

Page 158: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

158

Anexo E. montaje de medición respuesta al impulso de pinna artificial.

Page 159: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

159

Page 160: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

160

Page 161: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

161

Anexo F. Respuesta en frecuencia de todos los ángulos medidos tanto para aire libre

como para las mediciones en estudio híbrido.

Aire libre

1. Azimuth 0°, elevaciones 0°, 30°, 60°, 90°, 120°, 150°, 180°. Con su respectiva

referencia (sin pinna)

Page 162: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

162

2. Azimuth 45°, elevaciones 0°, 30°, 60°, 90°. Con su respectiva referencia (sin

pinna)

3. Azimuth 135°, elevaciones 0°, 30°, 60°, 90°. Con su respectiva referencia (sin

pinna)

Page 163: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

163

Recinto (estudio híbrido).

1. Azimuth 0°, elevaciones 0°, 30°, 60,° 90°, 120°, 150°, 180°. Con su respectiva

referencia (sin pinna)

2. Azimuth 45°, elevaciones 0°, 30°, 60°, 90°. Con su respectiva referencia (sin

pinna)

Page 164: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

164

3. Azimuth 135°, elevaciones 0°, 30°, 60°, 90°. Con su respectiva referencia (sin

pinna)

Page 165: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

Anexo G. Formato comprobación

Evaluación posición de la imagen sonora

Nombre: ____________________________ Profesión: ________________

Fecha: ______________

1. A continuación se muestra un gráfico con varias posiciones horizo

lo que escucha, indicar con una número en los pequeños círculos, a su juicio cual es la posición

del sonido.

Nota: la reproducción se realizará con dos técnicas de grabación, ORTF y Jecklin Disk. Si siente

una repetición del sonido marca

las posiciones marcadas indicar con una flecha el lugar.

Jecklin Disk

165

comprobación de resultados del proyecto.

Evaluación posición de la imagen sonora

Nombre: ____________________________ Profesión: ________________

A continuación se muestra un gráfico con varias posiciones horizontalmente, de acuerdo a

lo que escucha, indicar con una número en los pequeños círculos, a su juicio cual es la posición

Nota: la reproducción se realizará con dos técnicas de grabación, ORTF y Jecklin Disk. Si siente

o marcarlo en la ilustración siguiente. Si el sonido lo percibe fuera de

las posiciones marcadas indicar con una flecha el lugar.

Disk

ntalmente, de acuerdo a

lo que escucha, indicar con una número en los pequeños círculos, a su juicio cual es la posición

Nota: la reproducción se realizará con dos técnicas de grabación, ORTF y Jecklin Disk. Si siente

rlo en la ilustración siguiente. Si el sonido lo percibe fuera de

Page 166: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

ORTF

Binaural

166

Page 167: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

2. Ahora se presentan dos gráficos con posiciones verticalmente, una frontal y otra del lado

izquierdo. Como en el anterior ítem, indicar la ubicación que percibe marcando con una

número en el círculo.

Jecklin

Frontal

ORTF

Frontal Lado izquierdo

167

Ahora se presentan dos gráficos con posiciones verticalmente, una frontal y otra del lado

izquierdo. Como en el anterior ítem, indicar la ubicación que percibe marcando con una

Lado izquierdo

Frontal Lado izquierdo

Ahora se presentan dos gráficos con posiciones verticalmente, una frontal y otra del lado

izquierdo. Como en el anterior ítem, indicar la ubicación que percibe marcando con una

Page 168: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

BINAURAL

Frontal

168

Frontal Lado izquierdo

Page 169: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

169

Anexo H. Respuestas de los individuos en comprobación de resultados.

1. Respuestas de los oyentes ante una señal azimuth presentada con arreglo Jecklin

Disk, audífonos Sony MDR V-6

02468

10121416

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulo

0° azimuth Jecklin Disk

Primera

muestra

Repetición

del sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulo

45° azimuth Jecklin Disk

Primera

muestra

Repetición del

sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulo

90° azimuth Jecklin Disk

Primera

muestra

Repetición

del sonido

Page 170: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

170

2. Respuestas de los oyentes ante una señal azimuth presentada con arreglo ORTF,

audífonos Sony MDR V-6

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulo

135° azimuth Jecklin Disk

Primera

muestra

Repetición del

sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulo

180° azimuth Jecklin Disk

Primera

muestraRepetición del

sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

mer

o d

e p

erso

nas

Ángulo

0°azimuth ORTF

Primera

muestra

Repetición

del sonido

Page 171: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

171

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulo

45° azimuth ORTF

Primera

muestra

Repetición

del sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

mer

o d

e p

erso

nas

Ángulo

90° azimuth ORTF

Primera

muestra

Repetición

del sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulos

135° azimuth ORTF

Primera

muestra

Repetición del

sonido

Page 172: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

172

3. Respuestas de los oyentes ante una señal azimuth presentada con Técnica binaural

audífonos Sony MDR V-6

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulo

180° azimuth ORTF

Primera

muestra

Repetición del

sonido

02468

10121416

0 45 90 135 180

mer

o d

e p

erso

nas

Ángulo

0° azimuth binaural

Primera muestra

Repetición del

sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180

mer

o d

e p

erso

nas

Ángulo

45° azimuth binaural

Primera muestra

Repetición del

sonido

Page 173: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

173

02468

10121416

0 45 90 135 180

me

ro d

e p

ers

on

as

Ángulo

90° azimuth binaural

Primera muestra

Repetición del

sonido

02468

10121416

0 45 90 135 180

me

ro d

e p

ers

on

as

Ángulos

135° azimuth binaural

Primera muestra

Repetición del

sonido

02468

10121416

0 45 90 135 180

mer

o d

e p

erso

nas

Ángulo

180° azimuth binaural

Primera muestra

Repetición del

sonido

Page 174: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

174

4. Respuestas de los oyentes ante la variación de elevación presentada con arreglo

Jecklin Disk, audífonos Sony MDR V-6

5. Respuestas de los oyentes ante la variación de elevación presentada con arreglo

ORTF, audífonos Sony MDR V-6

02468

10121416

0 30 60 90

mer

o d

e p

erso

nas

Ángulos de elevación 0°azimuth

Azimuth 0°- Elevaciones 0°,30°,60°y 90°, Jecklin Disk

AZ0 EL0

AZ0 EL30

AZ0 EL60

AZ0 EL90

02468

10121416

0 30 60 90

mer

o d

e p

erso

nas

Ángulos de elevación 90° azimuth

Azimuth 90°- Elevaciónes 0°,30°,60° y 90°, Jecklin Disk

AZ90 EL0

AZ90 EL30

AZ90 EL60

AZ90 EL90

02468

10121416

0 30 60 90

me

ro d

e p

ers

on

as

Ángulos de elevación 0° azimuth

Azimuth 0°- Elevaciones 0°,30°,60° y 90°,ORTF

AZ0 EL0

AZ0 EL30

AZ0 EL60

AZ0 EL90

Page 175: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

175

6. Respuestas de los oyentes ante la variación de elevación presentada con técnica

binaural, audífonos Sony MDR V-6

02468

10121416

0 30 60 90

mer

o d

e p

erso

nas

Ángulos de elevacion 90° azimuth

Azimuth 90°- Elevaciones 0°,30°, 60°, y 90°, ORTF

AZ90 EL0

AZ90 EL30

AZ90 EL60

AZ90 EL90

02468

10121416

0 30 60 90

mer

o d

e p

erso

nas

Ángulos de elevación 90° azimuth

Azimuth 90°- Elevaciones 0°,30°, 60°, y 90°,binaural

AZ90 EL0

AZ90 EL30

AZ90 EL60

AZ90 EL90

02468

10121416

0 30 60 90

mer

o d

e p

erso

nas

Ángulos de elevación 0° azimuth

Azimuth 0°- Elevaciones 0°,30°, 60°, y 90°, binaural

AZ0 EL0

AZ0 EL30

AZ0 EL 60

AZ0 EL 90

Page 176: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

176

7. Respuestas de los oyentes ante una señal azimuth presentada con arreglo Jecklin

Disk, audífonos In-Ear

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

mer

o d

e p

erso

nas

Ángulos Azimuth

0° azimuth Jecklin Disk

Primera muestra

Repetición del sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

mer

o d

e p

erso

nas

Ángulos Azimuth

45° azimuth Jecklin Disk

Primera muestra

Repetición del sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

mer

o d

e p

erso

nas

Ángulos Azimuth

90° azimuth Jecklin Disk

Primera muestra

Repetición del sonido

Page 177: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

177

8. Respuestas de los oyentes ante una señal azimuth presentada con arreglo ORTF,

audífonos In-Ear

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

mer

o d

e p

erso

nas

Ángulos Azimuth

135° azimuth Jecklin Disk

Primera muestra

Repetición del sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulos Azimuth

180° azimuth Jecklin Disk, audífonos In-Ear

Primera muestra

Repetición del sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

mer

o d

e p

erso

nas

Ángulos Azimuth

0° azimuth ORTF

Primera muestra

Repetición del sonido

Page 178: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

178

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

mer

o d

e p

erso

nas

Ángulos Azimuth

45° azimuth ORTF

Primera muestra

Repetición del sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

mer

o d

e p

erso

nas

Ángulos Azimuth

90° azimuth ORTF

Primera muestra

Repetición del

sonido

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulos Azimuth

135° azimuth ORTF

Primera muestra

Repetición del

sonido

Page 179: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

179

9. Respuestas de los oyentes ante una señal azimuth presentada con Técnica binaural,

audífonos In-Ear

0

2

4

6

8

10

12

14

16

0 45 90 135 180 225

me

ro d

e p

ers

on

as

Ángulos Azimuth

180° azimuth ORTF

Primera muestra

Repetición del

sonido

02468

10121416

0 45 90 135 180

mer

o d

e p

ers

on

as

Ángulo

0° azimuth binaural

Primera muestra

Repetición del

sonido

02468

10121416

0 45 90 135 180

mer

o d

e p

erso

nsa

Ángulo

45° Azimuth binaural

Primera muestra

Repetición del

sonido

Page 180: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

180

02468

10121416

0 45 90 135 180

mer

o d

e p

erso

nas

Ángulo

90° azimuth binaural

Primera muestra

Repetición del

sonido

02468

10121416

0 45 90 135 180

me

ro d

e p

ers

on

as

Ángulo

135° azimuth binaural

Primera muestra

Repetición del

sonido

02468

10121416

0 45 90 135 180

mer

o d

e p

erso

nas

Ángulo

180° azimuth binaural

Primera muestra

Repetición del

sonido

Page 181: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

181

10. Respuestas de los oyentes ante la variación de elevación presentada con arreglo

Jecklin Disk, audífonos In-Ear

11. Respuestas de los oyentes ante la variación de elevación presentada con arreglo

ORTF, audífonos In-Ear

02468

10121416

0 30 60 90

me

ro d

e p

ers

on

as

Ángulos de elevación 0° azimuth

Azimuth 0°- Elevaciones 0°,30°60° y 90°, Jecklin Disk

AZ0 EL0

AZ0 EL 30

AZ0 EL 60

AZ0 EL 90

02468

10121416

0 30 60 90

me

ro d

e p

ers

on

as

Ángulos de elevación 90° azimuth

Azimuth 90°- Elevaciones 0°, 30°, 60°, 90°, Jecklin Disk

AZ90 EL0

AZ90 EL30

AZ90 EL60

AZ90 EL90

02468

10121416

0 30 60 90

me

ro d

e p

ers

on

as

Ángulos de elevación 0° azimuth

Azimuth 0°- Elevaciones 0°, 30°, 60° y 90°, ORTF

AZ0 EL0

AZ0 EL30

AZ0 EL60

AZ0 EL90

Page 182: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

182

12. Respuestas de los oyentes ante la variación de elevación presentada con técnica

binaural, audífonos In-Ear

02468

10121416

0 30 60 90

me

ro d

e p

ers

on

as

Ángulos de Elevación 90° azimuth

Azimuth 90°-Elevaciones 0°, 30°, 60° y 90°, ORTF

AZ90 EL0

AZ90 EL30

AZ90 EL60

AZ90 EL90

02468

10121416

0 30 60 90

me

ro d

e p

ers

on

as

Ángulos de elevación 0° azimuth

Azimuth 0°-Elevaciones 0°, 30°, 60° y 90°, binaural

AZ0 EL0

AZ0 EL30

AZ0 EL60

AZ0 EL90

Page 183: EMPLEO DE TÉCNICAS DE GRABACIÓN PARA EMULACIÓN DE

183

02468

10121416

0 30 60 90

me

ro d

e p

ers

on

as

Ángulos de elevación 90° azimuth

Azimuth 90°-Elevaciones 0°, 30°, 60° y 90°, binaural

AZ90 EL0

AZ90 EL30

AZ90 EL60

AZ90 EL90