• No results found

Triangulation Method for Sensor Performance Measurement

Es un algoritmo patentado, diseñado por David G. Lowe [2] de la universidad de Columbia, publicado en el año 2004. Es sin duda uno de los algoritmos estrella para el análisis de imáge- nes.

La secuencia de procesamiento es la siguiente:

1. Scale-space Extrema Detection:En este primer paso se realiza una búsqueda sobre to- das las escalas y localizaciones que pueden ser asignadas repetidamente en diferentes vistas del mismo objeto. La detección de las localizaciones que son invariantes a los cambios de es- cala de la imagen pueden ser encontrados buscando características estables en todas las posi- bles escalas, para ello se usa la función espacio-escala.

Se utilizará la función Gaussiana. Por ello el espacio-escala de una imagen queda definido por L(x,y, σ), obtenida a partir de la convolución de un Gaussiano G(x, y, σ) con la imagen de en- trada I(x, y):

donde G es:

Para hacer este proceso más eficiente se utiliza el “scale-space extrema” en la función dife- rencia de Gaussiano convolucionada con la imagen:

k es un factor que indica la separación entre las dos escalas a utilizar. El modo de proceder es el siguiente:

variando de manera creciente hasta que σ'= 2σ. Para obtener s intervalos enteros el valor de k en cada diferencia Gaussiana debe ser k = 21/s.

– Una vez calculada una octava (σ'= 2σ), la imagen se submuestrea tomando 1 de cada 2 pixeles y se vuelve a calcular otra octava de forma análoga. El número de veces a realizar este proceso es un parámetro a decidir.

Representación gráfica del proceso:

Obtenidas todas las diferencias Gaussianas de este sistema piramidal se procede a buscar para cada nivel de la misma los extremos locales que pasarán a ser puntos clave.

Se considerará un extremo cuando para una determinada diferencia Gaussiana D(x, y, σ) y a una escala determinada, un punto (x0, y0) es mayor a sus 8 puntos vecinos dentro de su nivel y a sus 9 puntos vecinos de cada uno de los niveles inferior y superior.

2. Keypoint localization: Una vez que se tienen los puntos candidatos se procede a proce- sarlos para obtener un resultado más preciso eliminando puntos con poco contraste, los cuales son inestables a cambios de iluminación y al ruido. Para ello se utiliza un desarrollo en serie de Taylor de grado 2 de la función diferencia Gaussiana entorno a un punto (x0, y0, σ0).

D y sus derivadas son evaluadas siempre en el punto en cuestión χ = (x, y, σ)T. Se toma la de- rivada de esta expresión igualándola a 0, obteniendo la localización del mínimo o máximo lo- cal:

Sustituimos en la expresión anterior para obtener el valor del máximo local:

El valor mínimo del máximo local del punto en valor absoluto debe ser mayor a 0,03 para ser

Por otra parte se deberá eliminar también los puntos candidatos que proceden de una línea y no de una esquina. Esto se realiza procediendo de manera similar a la seguida en el algoritmo para la detección de esquinas de Harris.

Se parte de una matriz Hessiana para D(x, y, σ) evaluada en un punto del espacio-escala deter- minado (x0, y0, σ0). Ésta es una matriz que contiene las segundas derivadas de la función a estudiar. Tendremos una matriz 2x2 donde si sus valores propios α y β son uno grande y el otro pequeño significará que existe un borde.

Los valores propios de H son proporcionales a las curvaturas principales de D. Consideramos α el valor propio de mayor magnitud y β el menor. Podemos calcular la suma de los valores propios y su producto a partir de la traza y el determinante de la matriz:

Si el determinante es negativo, las curvaturas tienen diferentes signos y el punto queda des- cartado.

Consideramos el radio r como la relación entre α y β . De esta forma obtenemos que α= rβ.

Se considera que el punto es válido cuando se cumple que:

3. Asignación de la orientación: Mediante la asignación de la orientación conseguimos que los puntos claves sean invariantes a la rotación. Para cada punto de la imagen L(x, y, σ) es posible determinar el módulo de su gradiente m(x,y) y la fase del mismo Θ(x; y):

La orientación de un punto clave queda determinada considerando las direcciones de todos los puntos de la imagen dentro de cierto entorno. Se produce entonces un histograma de direccio- nes ponderado por una ventana Gaussiana circular centrada en el punto clave. Cada máximo en el histograma corresponde a la dirección dominante en el gradiente local y será asignada al punto clave. Si en el histograma existiesen otros máximos secundarios de valor mayor o igual al 80% del máximo principal, estos se utilizarían para generar nuevos puntos claves con esa dirección.

4.Creación del descriptor SIFT: En este último paso buscamos asignar para cada punto cla- ve un descriptor relativamente invariante o estable a cambios de iluminación y distorsiones. A partir de los valores de la magnitud y fase del gradiente del entorno del punto clave calculados en el punto anterior, con ventana Gaussiana centrada en el punto clave, se pondera los valores de módulo y fase de 4x4 subregiones en la vecindad del mismo con 8 orientaciones distintas para cada subregión. Se obtiene, por tanto, para cada punto clave un descriptor de 4 x 4 x 8 = 128 valores.

**Ésta es una simplificación del paso. Se ha dividido en 2x2 subregiones en lugar de las 4x4 subregiones del algoritmo original. **

Las ventajas del algoritmo residen en el alto número de características encontradas, ya que se- gún su autor, para una imagen de 500x500 pixeles se obtienen cerca de 2000 características estables, siempre dependiendo de la imagen a tratar. Por otro lado, se comporta muy bien en imágenes muy texturizadas con gran cantidad de detalles.

Sus inconvientes son como se ha podido deducir, una incapacidad notoria a la hora de proce- sar imágenes con pocos detalles o discriminando entre objetos con una apariencia similar o que se diferencien por el color debido a que el algoritmo SIFT solo trabaja en la escala de gri- ses. Y el más importante de todos es el tiempo de procesado, siendo inviable en la mayoría de los casos para aplicaciones en tiempo real.

Related documents