The decrease of Central government budgetary revenue among the total

4.5 The Decrease of two ratios between 1978 and 1993

4.5.2 The decrease of Central government budgetary revenue among the total

Tal y como se vio en el Cap´ıtulo 1, una de las etapas para la producción de voz es laFuente Glótica, la cual se puede definir según el modelo clásico de Fant, reproducido en la Figura 3.5, como “la onda de presión que se genera en el borde supraglótico de los pliegues vocales durante la emisión de una fonación, en que los pliegues vocales modulan el flujo de aire expulsado por los pulmones a través de la laringe”. La fuente y el flujo glótico son dos señales que están ´ıntimamente relacio- nadas, porque en ciertas ocasiones pueden comprenderse como derivada e integral, aunque desde una orientación de estimulación del tracto oro-naso-far´ıngeo (TONF) es preferible la primera definición, es decir, la presión supraglótica, dado que la cima o cúspide negativa aguda presente en la misma (MFDR: Maximum Flow Declination Rate) se considera el elemento relevante para explicar el despliegue armónico según el modelo de Fant [50]. Estas y otras cuestiones se debatieron en el International Voi- ce Symposium que se celebró en la Universidad de Nueva York en enero de 2014 [61]. El modelo presenta el proceso de producción del habla en forma de un sistema combinado por varias etapas o subsistemas: excitación glótica, excitación turbulenta, combinación de estas dos últimas señales, tracto oro-naso-far´ıngeo y radiación. Este modelo se puede definir como in-out, es decir, desde dentro hacia el exterior. Este concepto obtendrá más relevancia cuando se defina la hipótesis inicial (véase Sección 3.3.3) de la parametrización de emociones en este trabajo, la cual está ex- plicada como un modelo inverso y que se definirá comoout-in.

3.3. RASGOS PROPUESTOS

Figura 3.5: Modelo de Fuente-Filtro de Gunnar Fant.

El modelo de excitaci´on gl´otica denotado porFg(z), representa la fuente fonada

obtenida a través de la vibración de los pliegues vocales, mientras que el modelo de excitación turbulenta definido por Ft(z) presenta aquellas excitaciones sonoras

producidas a causa de las turbulencias ocasionadas en los estrechamientos por los que trascurre el flujo de aire: pliegues vocales, falsos pliegues vocales, zona palato- far´ıngea, puntos de articulación (labiales, palatales, dento-alveolares), e incluso por las fosas nasales. La señal de excitación e(n) también denominada como “fuente”, es la suma de ambas componentes de excitación, la glótica o fonada y la turbulenta sin fonación. Hay que tener en cuenta que la fuente incluirá mayor o menor cantidad de esta última componente dependiendo del tipo de voz asociada, es decir, las voces conocidas como aéreas poseen una mayor cantidad de componente turbulenta que otro tipo de voces. Por consiguiente, este hecho se deberá de tener en cuenta en etapas posteriores. Cuando este fenómeno tiene lugar, el sonido presenta un patrón espectral caracter´ıstico de los sonidos definidos como “sonoros”. La tupla armónico-turbulencia es una caracter´ıstica fundamental que se puede ver alterada en voces disfónicas. Éstas se pueden dar en pacientes con enfermedades orgánicas neurodegenerativas tales como Esclerosis Lateral Amiotrófica (ELA) y Parkinson. Hay que destacar que la segunda componente, la turbulenta, siempre se encuentra presente en mayor o menor medida, mientras que la armónica puede que se reduzca o no dependiendo de la función de los pliegues vocales.

Partiendo de los conceptos deresonancia yantirresonancia, la cual se denomina como la amplitud de vibración igual a cero de un sistema mecánico, se puede explicar el comportamiento de la siguiente etapa, el modelo tracto oro-naso-far´ıngeo. El tracto oro-naso-far´ıngeo esta dividido en cavidad supráglótica, faringe baja, zona velofar´ıngea, cavidad nasal y oral. Dichas cavidades presentan unas peculiaridades acústicas, basadas en resonancias que dependiendo de la conexión entre ellas, gober- nadas por el “cierre” velofar´ıngeo, pueden configurarse como resonancias orales y antirresonancias nasales, o como resonancias nasales y antirresonancias orales. Para resumir este modelo, cabe decir que las resonancias y antirresonancias resultantes modifican espectralmente la señal sa(n) que entra a la siguiente etapa que es el mo-

delo de radiaci´on.

El modelo de radiaci´on (denotado por Fl(z)) es un elemento a tener en cuenta

cuando se realizan grabaciones de voz. Tal y como se describió en la sección Obje- tivos, uno de ellos era realizar una base de datos fiable y de calidad. El sistema o metodolog´ıa de grabación es cr´ıtico para obtener grabaciones con un alto estándar de calidad. El punto de emisión, la distancia de captura y el canal son las condiciones a controlar para una buena grabación. A continuación se explica cada una de las condiciones:

Elpunto de emisión se refiere a los puntos donde se está emitiendo o radiando sonido. Los puntos clave de emisión son por orden de importancia los labios, las fosas nasales y su entorno facial, la caja torácica y la zona frontal y temporal del cráneo. Cada una de estas partes influye en la función de transmisión de radiación y en su direccionalidad. Los labios se caracterizan por aportar la mayor propagación de energ´ıa, además de un máximo ancho de banda. Las fosas nasales y su entorno facial presentan un aspecto clave en cuanto se habla de canto. La caja torácica constituye un radiador muy eficaz en bajas frecuencias.

La distancia modifica la intensidad sonora. Otro aspecto interesante de la distancia es que suele influir en la presencia de efectos sonoros indeseados tales como el ruido de ambiente o la reverberación del habitáculo donde se esté realizando la grabación.

Elcanal se refiere al medio utilizado para captar la voz. Por lo tanto, aspectos como la placa de audio, la frecuencia de muestreo y el número de bits son caracter´ısticas a tener en cuenta. Sin olvidar factores como la sensibilidad del micrófono en amplitud, frecuencia y dirección.

Finalmente, otro aspecto importante a tener en cuenta para la reconstrucción de una buena fuente glótica es la interacción de la fuente y el filtro. Esta interacción se basa en la reverberación de la onda por su paso por los pliegues vocales hasta llegar a la zona de radiación. Las vocales cerradas como son la /i/ y /u/, además de algu- nas consonantes nasales, ofrecen una mayor alteración en el patrón de fonación de la fuente glótica. Teniendo en cuenta que los procesos de inversión del TONF suelen basarse en filtrado inverso, el cual suele ser más robusto con funciones de transferen- cia dominadas por resonancias que cuando existen antirresonancias, es conveniente descartar vocales cerradas, como la /i/ o la /u/, o excesivamente nasalizadas. Por este motivo, en el Cap´ıtulo 2, conjunto de datos por caso práctico, la selección de vocales utilizadas para extraer los parámetros caracter´ısticos han sido las vocales /a/ y /e/, dada su mejor predisposición a la hora de reconstruir la fuente glótica.

El procedimiento de inversión del TONF y la reconstrucción de la Fuente Glótica pueden verse en la Figura 3.6 y se explicarán a continuación.

El proceso de inversión iterativo tiene como parámetro de entrada la señal de voz emitida por el locutor y como parámetro de salida se obtiene el residual glótico.

3.3. RASGOS PROPUESTOS

Figura 3.6: Proceso de inversi´on iterativo basado en filtros inversos y sus filtros espejo, implementados en la aplicaci´on BioMetRPhon.

Dicho proceso se compone de 5 etapas, 4 de ellas iterativas y que se pueden repetirn

veces hasta lograr obtener el residuo glótico óptimo. Seguidamente se detallará cada etapa de este proceso.

1. El modelo inverso de radiaci´on denotado porHr(z) tiene como entrada la se˜nal

de vozs(n), la cual se obtiene a partir de la señal microfónica. En el proceso de modelado inverso del efecto de radiación se han tenido en cuenta los posibles efectos adversos producidos por los puntos de radiación (oral, nasal), el canal utilizado y la distancia utilizada en el momento de la grabación. Todos ellos son nivelados devolviendo como resultado la señal compensada sl(n).

2. sl(n) posee una gran influencia de la fuente gl´otica, por consiguiente es necesa-

rio realizar un proceso de “desglotalizaci´on” utilizando un modelo de hip´otesis inicial, definido como Hg0(z), por medio de un filtro de espejo que neutrali-

za en la medida de lo posible el efecto de la fuente glótica sobre la señal de entrada, sl(n), obteniendo como resultado la señal sv0(n).

3. Esta nueva se˜nal es modelada mediante filtrado inverso, para producir un modelo inverso del Tracto Oro-Naso-Far´ıngeo, el cual llamaremos, Hv0(z).

4. El primer residual gl´otico denominado sr0(n), se consigue a partir de la apli-

cación de otro filtro espejo sobre el modelo inverso del TONF y la señal compensada en radiación sl(n).

5. Una vez obtenido residual gl´otico sr0(n) se requiere la actualizaci´on de la

hip´otesis inicial Hg0(z) mediante un sistema inverso para generar una funci´on

del pulso gl´otico Hg1(z), momento en el cual las etapas 2 a 5 se repetir´an

tantas veces como sean necesarias hasta obtener un residual gl´otico denotado por sri(n).

Una vez que se ha obtenido el residual glótico, este se utiliza para obtener la fuente glótica y el flujo glótico. En la Figura 3.7 se representan las diferentes etapas desde la señal de voz radiada s(n) hasta la obtención del flujo glótico. En la Figura 3.7a) se muestra la señal de voz de entrada. Una vez realizado todo el proceso de inversión iterativo explicado anteriormente se obtienesri(n), el cual queda represen-

tado en la Figura 3.7b). Dicho resultado se basa en todo el proceso ilustrado en la Figura 3.6. A continuación si se realiza un proceso de compensación o nivelado de los efectos de la fuente y el filtro, da como resultado la onda de presión supraglótica, la cual es conocida comunmente como fuente glótica. Esta onda queda ilustrada en la Figura 3.7c). Nuevamente, esta última señal se vuelve a procesar mediante el sistema equivalente de pliegues vocales y tracto oro-naso-far´ıngeo, dando como resultado el

flujo glótico, el cual queda representado en la Figura 3.7d). Las caracter´ısticas más importantes de esta onda o patrón son la pendiente inicial, la cual se puede rela- cionar con la presencia de pérdidas por cierre defectuoso (gap permanente), y la pendiente final, relacionada con el Maximum Flow Declination Rate. El flujo glótico se puede definir como el escape de gas a través de los pliegues vocales, el cual posee forma de pulso triangular. Dicho pulso presenta un arranque desde un m´ınimo con pendiente moderada, para crecer abruptamente, y disminuir aún más rápido hacia un nuevo m´ınimo.

Figura 3.7: Reconstrucción de la Fuente Glótica (c) y el Flujo Glótico (d) a partir de la voz (a).

Dada la relevancia de la fuente glótica, se ha decidido explicar con un poco más de detalle dicho patrón, el cual se ha representado en la Figura 3.8.

3.3. RASGOS PROPUESTOS

Figura 3.8: Fuente Glótica t´ıpica. Parte superior: Reproducción de un ciclo glótico entre dos puntos MFDR (m´ınimos de presión). Parte inferior: tren de pulsos glóticos consecutivos, uno de los cuales (el central) se presenta en detalle en la parte superior. En su parte superior se puede observar el patrón normativo de un pulso glótico (patrón L-F o de Liljencrants-Fant [50]), caracterizado por los siguientes segmentos: 1. Tramo de recuperación, el cual corresponde con el intervalo 0−tR1 que se basa en que la presión sonora dinámica en la zona supraglótica vuelve a su valor nulo (presión atmosférica) tras una fuerte ca´ıda debido al cierre del tracto vocal.

2. Tramo de contacto en reposo, el cual corresponde al intervalo tR1 −tO2

que se sustenta en que la presión sonora dinámica deber´ıa ser prácticamente nula, por estar la glotis supuestamente cerrada.

3. Tramo de fuerte inyecci´on de flujo, el cual corresponde con el intervalo

tO2−tM que se corresponde con el aumento de la presi´on sonora din´amica hasta

un máximo por efecto de la apertura de los pliegues vocales (abducción). 4. Tramo de ca´ıda de la presión sonora dinámica, debido a la menor tasa de

inyección de flujo aéreo por unidad de tiempo, considerando que los pliegues vocales alcanzan un máximo en su separación, a partir del cual vuelven a aproximarse (aducción). Este efecto limita el crecimiento del flujo y condiciona

su posterior ca´ıda. Es importante resaltar que según Titze [180], cuando el flujo desciende a su máximo ritmo se produce el punto MFDR, momento en el cual la presión dinámica alcanza un m´ınimo, a partir del cual se repite el ciclo glótico. Por otro lado, según la teor´ıa de Fant, la amplitud y agudeza del MFDR son los elementos de referencia para generar un buen despliegue armónico en la voz (número y calidad de los armónicos en el espectro de potencia de la fuente glótica).

In document An Empirical Study on China’s Regional Tax Revenue Performance (Page 120-124)