2.3 Feature Extraction Techniques for Face Recognition
2.3.1 Spectral Category
2.3.1.4 Gabor Transform
En esta sección vamos a hablar de una selección de algoritmos de generación automática de expresiones referenciales del área que son particularmente relevantes para la tesis. Para un estado del arte del área más detallado ver [Krahmer and van Deemter, 2012].
Full brevity: El algoritmo Full Brevity [Dale, 1989] genera la descripción más corta que identifica al target. Es decir, genera ERs minimales. Para hacerlo, busca si hay una propiedad del target que no sea propiedad de ningún distractor. Si no hay chequea todas las posibles combinaciones de 2 propiedades, si no la hay, busca de a 3 y así sucesivamente. Por ejemplo para la Figura 2.1 se fijaría en las propiedades del target red, ball, large, como ninguna de ellas aisladamente identifica sólo al target, probaría con combinaciones de 2 propiedades red ball si identifica al target, devuelve red ball y finaliza.
Heurística Greedy: El algoritmo deHeurística Greedy [Dale, 2002] iterativamente selec- ciona la propiedad que elimina más distractores, y argumentan que la propiedad seleccionada
tiene el más alto poder discriminativo en esa etapa. Como resultado no siempre genera ex- presiones referenciales mínimas. Por ejemplo para la Figura 2.1 se fijará que ball elimina 2 distractores e1, e3, red elimina 3 distractores e2, e4, e7 y large elimina 1 distractor e4, en- tonces elegirá red, pero como no alcanza para ser ER, seguirá con ball que es la que elimina más distractores luego de red, finalizará porque red ball identifica al target. Supongamos que hubiera otro objeto con propiedad large, entonces large eliminaría también 2 distractores, en- tonces el algoritmo devolveríalarge red ball, y esa ER no es minimal, es sobreespecificada. Este algoritmo es más eficiente que el Full Brevity porque encontrar la descripción más corta es com- putacionalmente caro. Aunque el algoritmo de heurística Greedy es más eficiente que el Full Brevity, pronto fue superado por el algoritmoIncrementaly sus sucesores [Reiter and Dale, 1992; Dale and Reiter, 1995]. El algoritmo Incremental fue y sigue siendo uno de los algoritmos más importantes del área, lo explicamos a continuación.
Incremental: El input delAlgoritmo Incremental, es el targetr, que queremos identificar, D es el contexto, y Pref una lista de propiedades ordenada según la preferencia. El algoritmo se muestra en la Figura 2.7.
Figura 2.7: Algoritmo Incremental, Figura 2 de [Krahmer and van Deemter, 2012]. Vamos a ejemplificar la corrida del algoritmo con el ejemplo de la Figura 2.1, supongamos que el target ese5y la lista ordenada de propiedades es ésta [tipo, color, tamaño]. D inicialmente es el conjunto de todos los objetos del contexto: {e1,e2,e3,e4,e5,e6,e7}. EnPaso 2 se asigna a L la descripción vacía, al finalizar la ejecución, Ltendrá el conjunto de propiedades con los cuales identificaremos ae5, es decir la ER. En elPaso 3se inicializa C con el conjunto de distractores del target r, y e5 en nuestro ejemplo {e1,e2,e3,e4,e6,e7}. La idea del algoritmo es ir eliminando distractores usando las propiedades Ai del target en el orden de preferencia Pref, por eso, en el
Paso 4 recorre las propiedades Ai. En Paso 5 le asigna a V el valor que tiene la propiedad Ai para el target r, en nuestro ejemplo e5. RulesOut(Ai, V) es el conjunto de objetos que tienen diferente valor para la propiedad Ai que el que tiene el target, la función se fija si el valor de esa propiedad elimina distractores. La primer propiedad del target e5 a considerar según el orden de preferencias Pref es el tipo, el valor del target para tipo es esfera. En el Paso 6, identifica los objetos en C que tengan tipo con valor distinto de esfera, ellos son {e2,e4,e6,e7}, y los elimina de C, el cual queda sólo con {e1,e3}. EnPaso 10 pregunta si C es vacío, es decir si ya se eliminaron todos los distractores, pero no lo es, por lo tanto continúa con la siguiente propiedad, en este caso con el color, el valor de color para el target es rojo, agrega rojo a L, y actualiza C con ∅porque tantoe1 como e3 son amarillos, es decir no comparten el color con el
target, en Paso 10 pregunta si C es vacío, y si lo es, por lo tanto devuelve {esfera, rojo}. Lo cual se podría realizar como La esfera roja, y sería una ER para el target considerado.
Luego se propusieron extensiones del algoritmo Incremental, por ejemplo, una extensión que permite la generación de referencia teniendo en cuenta la prominencia discurso del target se muestran en [Krahmer and Theune, 2010; Krahmer and Theune, 2002].
Algoritmos relacionales: Los algoritmos que describimos hasta ahora son proposicionales. Varios investigadores han intentado ampliar el algoritmo incremental permitiendo descripciones relacionales [Horacek, 1997; Krahmer and Theune, 2002; Kelleher and Kruijff, 2006], se basan a menudo en el supuesto de que las propiedades relacionales (como “x está en y”) son menos preferidas que las no relacionales (como “xes blanca”), o sea que los algoritmos sólo las generan como última opción. Si se requiere una relación para distinguir al target x, en el cual se deba nombrar al objetoy, se aplica el algoritmo básico iterativamente ay, pero como dijimos antes, esto no siempre es lo que las personas hacen, muchas veces la descripción del landmark no es una ER. Además, no está claro que las propiedades proposicionales sean siempre preferidas antes que las relacionales. En [Viethen, 2011] se sugieren que, incluso en escenas simples, donde los objetos pueden fácilmente ser distinguidos sin relaciones, las personas también utilizan con frecuencia las relaciones (en aproximadamente un tercio de las ERs que dan).
En caso de generar ERs relacionales con esta estrategia hay que asegurarse que el algoritmo termina, es decir que no entra en ciclos infinitos tratando de identificar objetos. En [Dale and Haddock, 1991b] se estudia cómo abordar el problema de regresión infinita, en el cual el algoritmo trata de describir al landmark haciendo referencia al target, y al target haciendo referencia al landmark infinitamente, como en el libro en la mesa la cual soporta un libro en la mesa...