General discussion and future perspectives

HRTF

Figura 10. Señales biaurales obtenidas a partir de la señal de la fuente sonora y las HRTF.

∫

τ τ − τ = τ τ − τ = d ) t ( x ) ( h ) t ( x d ) t ( x ) ( h ) t ( x R R L L Ec. 3

Según la Figura 10, para hallar la presión sonora que una fuente arbitraria x(t) produce en cada oído (xL y xR), sólo se necesita conocer la respuesta impulsiva h(t) desde la fuente hasta el oído respectivo (Ec. 3). Esto se llama respuesta impulsiva referida a la cabeza (hrir, head related impulse response), y su transformada de Fourier, H(f), es la HRTF. Estas funciones contienen todos los parámetros físicos de la localización del sonido. Una vez se conoce la HRTF del oído izquierdo y del oído derecho (y por lo tanto la hrir de cada oído), se pueden sintetizar con precisión señales biaurales a partir de una fuente sonora. Se asume que la HRTF se mide en un entorno anecoico, y por lo tanto no incluye los efectos de las reflexiones del sonido en el entorno, las cuales también proporcionan información de localización.

La HRTF es una función sorprendentemente complicada de cuatro variables: tres coordenadas de espacio y una de frecuencia. En coordenadas esféricas, para distancias más grandes que un metro, se suele decir que la fuente está en campo lejano, y la amplitud de la HRTF cae inversamente con la distancia, según la Ley de Divergencia Esférica. La mayoría de las mediciones de las HRTF se hacen en campo lejano, lo cual reduce esencialmente las HRTF a una función de acimut, elevación y frecuencia.

Para tener una idea de cómo las respuestas varían con el acimut y la elevación, se van a comentar las siguientes gráficas de las hrir y de las HRTF del maniquí KEMAR.

hR(t) y x hL(t) xR(t) xL(t) x(t)

2.3.1 LA HRIR EN EL PLANO HORIZONTAL

Figura 11. Hrir en el plano horizontal de KEMAR para el oído derecho.

La Figura 11 muestra la respuesta del oído derecho a una fuente impulsiva en el plano horizontal. La intensidad de la respuesta se representa en variaciones del brillo. Por lo tanto, se puede observar que el sonido es más fuerte y llega más pronto cuando procede del lado derecho (acimut θ = 90º). Análogamente, es más débil y llega más tarde cuando procede del lado izquierdo (acimut θ = -90º). Se aprecia que el tiempo de llegada varía con el acimut más o menos de forma sinusoidal. De hecho, el tiempo de llegada coincide bastante bien con la ecuación de la ITD (Ec. 1). En concreto, se aprecia que la diferencia entre el tiempo de llegada más grande y el más pequeño es de unos 0.7 ms, justo lo que se supone teóricamente. Este comportamiento se ha corroborado en medidas subjetivas como las mostradas en la Figura 12.

Figura 12. 630 μs es el máximo retardo detectado para impulsos y señales impulsivas (Toole 1965). [Blauert 97].

También es posible explicar algunas de las formas vistas en la imagen pensado en el comportamiento físico. Por ejemplo, la secuencia inicial de cambios rápidos (bandas claras y oscuras) se debe a las reflexiones en la oreja. El pico de llegada a 0.4 ms después del pico inicial es debido a la reflexión del hombro.

2.3.2 LA HRTF EN EL PLANO HORIZONTAL

Figura 13. HRTF en el plano horizontal de KEMAR para el oído derecho.

Este gráfico de malla (Figura 13) muestra la respuesta en frecuencia para el oído derecho de KEMAR según se mueve la fuente en el plano horizontal. Aunque la superficie es más bien desigual, si se mira una frecuencia se puede ver un cambio aproximadamente sinusoidal con el acimut θ. Como se esperaba, la respuesta es normalmente mayor cuando la fuente está a θ = 90º (dirigida al oído derecho) y menor cuando la fuente está a θ = -90º (en el lado opuesto de la cabeza) para frecuencias altas (> 1.6 kHz).

El pico alrededor de 4 kHz se debe a la resonancia del canal auditivo. El mínimo a 10 kHz es el famoso “mínimo de oreja”, cuya frecuencia cambia con la elevación ϕ [Blauert 97]. En las HRTF están implícitos los parámetros primarios de información de la localización que es lo que se va a estudiar y analizar para poder estimar el ángulo del evento sonoro.

2.3.3 LA HRTF EN EL PLANO MEDIO

Como se ha explicado anteriormente, en resumen se puede decir que la localización en el plano medio se basa en la información espectral del sonido recibido. Los estudios han demostrado que las distorsiones espectrales causadas por la oreja a las frecuencias altas, por encima de 5 kHz, se comportan como parámetros de localización en el plano medio. El espectro varía sistemáticamente a frecuencias mayores que 5 kHz según varía la elevación de la fuente. Existe un nodo que varía de 6 a 10 kHz cuando la elevación del sonido cambia de -45º a 45º como se puede apreciar en la representación del módulo de la HRTF para diferente ángulo de elevación del maniquí KEMAR (Figura 14).

Figura 14. HRTF para ángulos de elevación desde – 45º a 90º, se destaca la posición del primer nodo.

Los parámetros espectrales según los estudios [Blauert 97] existen entre 4 y 16 kHz y se pueden dividir entre parámetros frontales, traseros y superiores. Los parámetros frontales son: un nodo de una octava con frecuencia de corte inferior entre 4 y 8 kHz y un realce de energía para frecuencias superiores a 13 kHz. Los parámetros superiores son: un pico de ¼ de octava entre 7 y 9 kHz. Y por último los parámetros traseros son: un pequeño pico entre 10 y 12 kHz y un decrecimiento de energía por encima y debajo de este pico.

2.3.4 INTERPOLACIÓN DE LA HRTF

Ya se ha comentado la necesidad de interpolar para conseguir las HRTF de los ángulos intermedios, no proporcionadas en las bases de datos medidas. Existe una amplia bibliografía sobre métodos de interpolación [Nishino 96] [Freeland 04] e incluso existe la posibilidad de sintetizar las HRTF en función de características antropométricas de las personas [Rodríguez 05] [Sobreira 01]. El estudio realizado por [Hartung 99] es muy interesante porque compara el método de interpolación de la distancia inversa ponderada y el método de interpolación de los “splines” esféricos; aunque existen otros métodos de interpolación basados en una representación de coeficientes PCA (Principle-Component- Analysis) o transformaciones Karhunen-Loëve o modelos de polos-ceros.

Por lo tanto, la señal biaural será la suma de las contribuciones de cada señal de altavoz o fuente sonora, filtrada por las HRTF interpolada que corresponda al ángulo relativo que forman el altavoz y la cabeza para cada uno de los oídos.

In document Targeting renal cell carcinoma with radiolabeled antibodies (Page 156-180)