Ibid 350 “Theological commitments are embodied in ritual acts.”

3.a What are rituals and why do they exist?

6 Ibid 350 “Theological commitments are embodied in ritual acts.”

La idea inicial fue construir un reconocedor que no dependiese del mapa to- pológico. Con el ánimo de encontrar un umbral de confianza para cada landmark, se realizaron los procedimientos explicados a continuación.

Para cada v´ıdeo, se apuntaron de forma manual los frames en los que aparec´ıa un landmark para, posteriormente, compararlos con la salida del clasiﬁcador.

Gracias a esto, se pudo definir la medida de rendimiento en dinámico, _η, para calcular la efectividad de las técnicas en cada v´ıdeo:

η= n

o_{de frames clasif icados correctamente}

node f rames en los que sale un landmark (21)

Para interpretar correctamente las gráficas incluidas en las siguientes páginas, es necesario aclarar algunos conceptos.

Se realizará el análisis en dinámico con cuatro v´ıdeos; por lo tanto, las figuras que estén descritas a pie de imagen como “análisis en dinámico”estarán com- puestas de cuatro sub-ejes de coordenadas, cada uno representando el resultado del clasificador sobre un v´ıdeo distinto.

En estos análisis se grafican los labels reales sobre el eje horizontal, que representa los frames del v´ıdeo. El eje vertical, por su parte, representa las distancias al vecino más cercano, ya sea Eucl´ıdea o Mahalanobis.

Cada punto de la gráfica tiene el color de la clase predicha por el clasificador K-NN para un frame concreto.

En las figuras que muestran rendimientos para distintos valores del número de componentes principales también aparecen los resultados para los cuatro v´ıdeos.

El rendimiento oaccuracy mostrado en estas gráficas se calcula según la Ecua- ción 21, y aparece en porcentaje.

Se referirá a los v´ıdeos enumerándolos del 1 al 4 empezando por el que está en el sub-eje de cada figura de arriba a la izquierda (V´ıdeo 1), siguiendo por el de arriba a la derecha (V´ıdeo 2), abajo a la izquierda (V´ıdeo 3) y terminando por el de abajo a la derecha (V´ıdeo 4).

Es importante tener en cuenta tanto el análisis en dinámico como la búsqueda del número de componentes principales más efectivo (que mejor rendimiento medio tenga entre los cuatro v´ıdeos) para el caso de Eigenlandmarks, ya que el primero puede ser clave para determinar la distancia umbral de confianza, mientras que el segundo dicta con qué frecuencia se detecta correctamente un landmark cuando se

est´a delante de ´el.

La Figura 16 muestra los rendimientos en dinámico para distintos valores del número de componentes principales usando el método Eigenlandmarks. El rendimiento empeora considerablemente con la métrica Mahalanobis a medida que aumenta el número de componentes, lo que podr´ıa ser un indicio de que el K-NN Mahalanobis funcione mal cuando los individuos tienen muchas dimensiones.

Fig. 16: Rendimientos _η para distintos n´umeros de componentes principales en la t´ecnica Eigenlandmarks

El mejor rendimiento medio entre los cuatro v´ıdeos con la técnica Eigenland- marks se obtiene con 110 componentes principales y métrica Eucl´ıdea: 81.07 %. El rendimiento máximo obtenido se da en el V´ıdeo 3 con 50 componentes principales y métrica Mahalanobis: 89.55 %. Sin embargo, estos mismos parámetros dan malos resultados en el segundo v´ıdeo. Se decidió por tanto analizar estas dos combinacio- nes de parámetros: Figuras 17a y 17b respectivamente.

Como se puede observar, la detección de landmarks no es muy precisa. Es cierto que algunos landmarks son identificados correctamente en todos los v´ıdeos como el Corridor (en morado) o el HallFront (en verde). Pese a esto, ninguno de los clasificadores es fiable para el resto de landmarks.

(a)110 componentes principales y m´etrica Eucl´ıdea

(b) 50 componentes principales y m´etrica Mahalanobis

Fig. 17: An´alisis en din´amico de Eigenlandmarks

Con la técnica Fisherlandmarks no hace falta realizar una búsqueda del núme- ro más efectivo de componentes principales ya que este valor se queda fijado en 6 (_no_{de clases} − 1). Para esta técnica, tanto el mejor rendimiento medio entre los cuatro v´ıdeos como el rendimiento más alto se obtuvo con métrica Mahalanobis: 72.99 % y 82.60 % respectivamente. Este último se alcanzó en el análisis del V´ıdeo 2.

La Figura 18 muestra el reconocimiento en dinámico de los cuatro v´ıdeos usando la técnica Fisherlandmarks, que ofrece unos resultados más inestables.

Fig. 18: Análisis en dinámico de Fisherlandmarks con métrica Mahalanobis Aunque los resultados nos son malos, ninguna de las dos técnicas (Eigenland- marks y Fisherlandmarks) parecen ser suficientemente buenas como para implemen- tar un reconocedor de landmarks fiable. Es por ello que se decidió probar una serie de técnicas de preprocesado de imagen cuyos procedimientos y resultados se deta- llarán y analizarán a continuación.

La primera alternativa que se probó fue convertir las imágenes del dataset a isolum´ınicas [14], [15]. Esto consiste básicamente en pasar de un color con tres grados de libertad a uno con dos grados de libertad, asignando una intensidad fija e idéntica para todos los p´ıxeles de la imagen. En la Figura 19 se muestran un par de ejemplos de esta conversión.

Fig. 19: Transformaci´on de un par de im´agenes en isolum´ınicas

La mayor ventaja de esta técnica consiste en que se reducen las variaciones origi- nadas por la iluminación. Además, únicamente se necesitan dos capas de colores de luz primarios de la imagen RGB para extraer toda la información de la imagen. Es decir, que si se conocen las capas R (red) y G (green) de la imagen, se puede deducir

la capa B (blue) ya que la suma de los tres valores RGB es idéntica para cada p´ıxel de la imagen. Por lo tanto, el vector rasterizado de una imagen isolum´ınica tendrá el doble de longitud que el de una en escala de grises. El método de transforma- ción de imagen isolum´ınica en vector rasterizado utilizado en este proyecto viene representado visualmente en la Figura 20.

Fig. 20: Conversi´on de imagen isolum´ınica en vector rasterizado

En la Figura 21 se muestra el rendimiento de la técnica Eigenlandmarks con el preprocesado isolum´ınico. En general, se observa un deterioro en los resultados con respecto a la técnica Eigenlandmarks sin preprocesado. El rendimiento máximo medio entre los cuatro v´ıdeos fue de 72.88 %, con 90 componentes principales y métrica Eucl´ıdea. La métrica Mahalanobis ofrece resultados bastante peores en general, salvo en el V´ıdeo 4, donde mejora ligeramente los rendimientos de la Eucl´ıdea.

Fig. 21: Rendimientos _η para distintos números de componentes principales en la técnica Eigenlandmarks con imágenes isolum´ınicas

El análisis en dinámico del clasificador con los parámetros más eficaces (90 componentes principales y métrica Eucl´ıdea) viene representado en la Figura 22. En comparación con la técnica Eigenlandmarks sin preprocesado (Figura 17), la preci- sión del clasificador baja. Sin embargo, con esta técnica las distancias al vecino más cercano tienen mayor desviación t´ıpica, como se puede apreciar visualmente compa- rando los resultados de las dos técnicas. Esto es un punto a favor del preprocesado isolum´ınico, ya que facilitar´ıa la obtención de un umbral de confianza.

Fig. 22: Análisis en dinámico de Eigenlandmarks con imágenes isolum´ınicas, 90 componentes principales y métrica Eucl´ıdea

Respecto a la técnica Fisherlandmarks con preprocesado isolum´ınico, el mejor rendimiento medio se obtuvo con métrica Mahalanobis: 65.54 %. El rendimiento máximo, sin embargo, se dio con métrica Eucl´ıdea en el V´ıdeo 1: 73.91 %. Ambos rendimientos dejan mucho que desear. El análisis en dinámico de esta técnica se incluye en la Figura 23.

(a)M´etrica Eucl´ıdea

(b) M´etrica Mahalanobis

Fig. 23: Análisis en dinámico de Fisherlandmarks con preprocesado isolum´ınico Dado que algunos landmarks todav´ıa no se detectan correctamente, se decidió experimentar con otro preprocesado de imagen: Spatial Kernel Filtering, SKF (Al- goritmo 4).

Se ha incluido la Figura 24 como muestra ejemplar de lo que ser´ıa un preprocesado SKF de dos im´agenes en blanco y negro.

Puesto que el preprocesado SKF tiene un par de parámetros cuyo valor óptimo es desconocido (el lado del kernel_ny el umbral predefinido_λ), se analizaron los resultados combinando valores de_n en el rango [5,17] con valores de_λ en el rango [10,100]. La Figura 25 recoge algunos de los mejores resultados obtenidos para cada caso. Se muestran únicamente las gráficas de los clasificadores K-NN con métrica Eucl´ıdea,

Algoritmo 4 Spatial Kernel Filtering

Dada una imagen, una vecindad espacial_N(_{x, y}) (e.g. un kernel de _n×_n) y umbral predeﬁnido _λ:

for cada p´ıxel _I(_{i, j}) de la imagen:

Calcular la media_I_m y el rango de intensidades (_I_max−_I_min) de los p´ıxeles per- tenecientes a la vecindad N.

if (_I_max−_I_min _{< λ}) then

I(_{i, j}) = _I_m

else then

I(_{i, j}) = _I_max−_I_min

end if end for

Devolver la imagen con los p´ıxeles actualizados, la cual ser´a proyectada a un subespacio.

NOTA 1: El primer caso es una transformación de filtro paso bajo y el segundo una transformación de filtro paso alto.

NOTA 2: El tamaño del kernel espacial _N(_{x, y}) y el umbral predefinido _λ son parámetros arbitrarios con los que hay que experimentar.

Fig. 24: Filtrado SKF de un par de im´agenes en escala de grises

ya que con métrica Mahalanobis los resultados fueron muy imprecisos. Además, se muestran únicamente los resultados de un v´ıdeo (el V´ıdeo 3) como ejemplo, ya que los resultados en general fueron bastante malos.

Se puede apreciar en las Figuras 25b y 25c que loslandmarks Elevator (amarillo), HallBack (cian), HallFront (verde) y DoorClose (rojo) se detectan correctamente con la técnica Eigenlandmarks. Sin embargo, fallan en la detección deCorridor (vio- leta). Además, las distancias al vecino más cercano son bastante grandes, por lo que ser´ıa muy dif´ıcil establecer un umbral de confianza en el que se pudiera afirmar que hay un landmark en el frame actual del v´ıdeo.

(a)n= 5,λ= 50

(b)n= 11,λ= 40

Fig. 25: Análisis en dinámico de Eigenlandmarks y Fisherlandmarks con métrica Eucl´ıdea y preprocesado SKF

Si se observa la Figura 24, se puede ver cómo se amplifica el efecto causado por la iluminación. En el par de imágenes de la derecha, por ejemplo, se puede apreciar cómo el reflejo de una bombilla en el suelo aumenta el área tras la conversión SKF. Este efecto es claramente desfavorable para el reconocimiento de landmarks por lo que puede ser uno de los motivos por los que ofrece tan malos resultados.

Por lo tanto, al ser evidente que el preprocesado SKF no es un buen método para el propósito del proyecto, se descartó incluirlo en el reconocedor dinámico y se procedió a experimentar con otra técnica.

El siguiente método que se probó fue utilizar como vector a proyectar en un subespacio la concatenación de los histogramas de cada canal de la imagen (rojo, verde y azul). Es decir, el vector que representa a cada imagen tiene una longitud de 768 (256×3).

La Figura 26 muestra la búsqueda para Eigenlandmarks de un número de componentes óptimo en función del rendimiento (en porcentaje) y con métricas Eucl´ıdea y Mahalanobis. . Lo mismo se aplica a la Figura 27, que muestra el análisis en dinámi- co de los cuatro v´ıdeos con métrica Eucl´ıdea (ya que los resultados con distancia Mahalanobis son bastante peores y se decidió omitirlos).

Fig. 26: Búsqueda del número óptimo de componentes con el método de concatena- ción de los 3 histogramas

Si uno se fija detenidamente, la única diferencia entre las Figuras 27a y 27b es que la distancia al vecino más cercano aumenta ligeramente como tónica general cuando el número de componentes asciende de 10 a 150. Exceptuando este cambio, la forma de la gráfica para cada v´ıdeo apenas cambia, dato que cuadra con lo ob- servado en la Figura 26, donde se aprecia que el rendimiento con métrica Eucl´ıdea no var´ıa independientemente del número de componentes principales.

(a)10 componentes principales

(b)150 componentes principales

Fig. 27: Análisis en dinámico de Eigenlandmarks con el método de concatenación de los 3 histogramas y métrica Eucl´ıdea

En el caso de Fisherlandmarks (Figura 28), los resultados son muy parecidos al Eigenlandmarks. Los rendimientos obtenidos para cada uno de los cuatro v´ıdeos con métrica Eucl´ıdea han sido: 87.68 %, 68.55 %, 62.44 % y 70.29 %. Aunque puedan parecer resultados aceptables, se puede observar que el clasificador falla sistemática- mente en la detección de ciertoslandmarks, comoDoorClose (en rojo), por ejemplo. Sabiendo esto, no se puede considerar como admisible la efectividad del clasificador.

Fig. 28: Análisis en dinámico de Fisherlandmarks con el método de concatenación de los 3 histogramas y métrica Eucl´ıdea

In document Human Embodiment and Christian Worship: God\u27s Revelation Through the Human Body ih Scripture, Theology, and Liturgy (Page 50-56)