Adecco’s Recruitment Process

3. CASE STUDIES

3.2. Adecco Group

3.2.2. Adecco’s Recruitment Process

Uno de los tipos de aceleradores que se utilizan para la estimación de movimiento son las FPGAs. Es por ello por lo que en la literatura se encuentran múltiples trabajos que relacionan ambos conceptos. La tabla 3 expone algunos de los realizados en los últimos años, mostrando además a qué familia pertenecen los algoritmos implementados, el rendimiento obtenido y el tipo de FPGA utilizado.

Autor Familia Algoritmo fps (resolución) FPGA Año Niitsuma [79] Block Matching FST 30 (640×480) Virtex-II XC2V6000 [80] 2004 Babionitakis [81] Block Matching varios 30 (1024×768) Virtex-II Pro 40 2008 Asano [82] Block Matching FST 30 (1920×1080) Virtex-5 [83] 2010 Akin [84] Block Matching OBT [85] 83 (1920×1080) - 2010 Ho [86] Block Matching MFHME [87] 30 (1920×1080) - 2011 Núñez-Yáñez [88] Block Matching FME [89] 62 (1920×1080) Virtex-5 2012 Wei [90] Gradiente Tensores [91, 92] 64 (640×480) Virtex-II Pro XC2VP30 [80] 2007 D´ıaz [93] Gradiente Lucas-Kanade 170 (800×600) Virtex-II XC2V6000-4 2008 Botella [94] Gradiente McGM 177 (128×96) Virtex-E 2000eBG560 [95] 2010 Bahar [96] Gradiente Horn&Schunck 1029.9 (240×320) Cyclone II [97] 2012 Barranco [98] Gradiente Lucas-Kanade 270 (640×480) Virtex-4 XC4vfx100 [99] 2012 Norouznezhad [100] Energ´ıa Gabor filter [101] 30 (40×480) Xilinx Virtex-5 XC5VSX50T 2010 Tomasi [102] Energ´ıa Phase-Based [103] 36 (512×512) Virtex-4 XC4vfx100 2010 Tomasi [104] Energ´ıa Phase-Based [105] 22.8 (512×512) Virtex-4 XC4vfx100 2012

Tabla 3: Estado del arte para algoritmos de estimaci´on de movimiento en FPGAs.

Niitsuma y Maruyama [79] implementan el algoritmo de búsqueda exhaustiva en una FPGA con el objetivo de calcular el movimiento de objetos y la distancia a la que estos se encuentran combinando el flujo óptico con la visión en estéreo. El rendimiento obtenido por este sistema es de 30 frames por segundo (fps) para una resolución, o tamaño de fotograma, de 640×480. Otro trabajo relacionado con la estimación de movimiento mediante Block Matching haciendo uso de FPGAs es el expuesto por Babionitakis et al. en [81], donde se propone una arquitectura que soporta de forma eficiente un conjunto de algoritmos de Block Matching que se utilizan en la actualidad. Además, el diseño propuesto ejecuta los diferentes algoritmos proporcionando un conjunto de instrucciones comunes a todos estos algoritmos y sólo unas pocas instrucciones espec´ıficas a cada uno de ellos. Los resultados que obtienen en una FPGA son de 30 fotogramas por segundo con un tamaño de fotograma de 1024×768.

En la estimación de movimiento mediante Block Matching, el fotograma actual se divide en macrobloques, y se busca la mejor correspondencia de bloque para cada macrobloque en la zona de búsqueda del fotograma de referencia. Sin embargo, Asano et al. [82] proponen un método por el cual la dirección de exploración del macrobloque en el fotograma actual, y la dirección de exploración de coincidencia en el área de búsqueda, se optimicen con el fin de reducir el acceso a los bancos de memoria externa que almacenan el marco de referencia, y a los cacheados en la memoria interna que representan la zona de búsqueda. Mediante la reduc- ción de ambos accesos a memoria, es posible obtener un alto rendimiento en una FPGA de tamaño pequeño consiguiendo obtener 30 fps para una resolución de 1920×1080, consiguiendo, además, reducir el número de bancos de memoria requeridos para procesar estos datos en tiempo real. Para ello, muestran una aproximación para la estimación de movimiento mediante una búsqueda completa con tamaño de bloque variable (VSBME) en dicho dispositivo.

Teniendo en cuenta las implementaciones en FPGA de modelos de emparejamiento podemos hablar también del trabajo realizado por Akin et al. [84], referente a arquitecturas hardware de alto rendimiento para algoritmos de estimación basados en la transformada de un bit (1BT), donde se exponen varios modelos de arquitecturas que consiguen obtener resultados de forma más rápida y haciendo uso de menos memoria. Además, proponen por primera vez

un hardware reconfigurable para la estimación de movimiento con fotograma de referencia múltiple basado en 1BT mediante el cual el número y la selección de fotogramas de referencia se puede configurar de manera estática basándose en los requisitos de la aplicación, con el fin de estimar el rendimiento y la complejidad computacional de la estimación de movimiento. El rendimiento alcanzado en este trabajo es de 83 fps (con una resolución igual a 1920×1080). Por su parte, Ho et al. [86] presentan una implementación en FPGA del algoritmo MFHME (multi-frame hierarchical motion estimation) con la que se consiguen alcanzar los 62 fps para conversiones de v´ıdeo de alta definición (1920×1080). El sistema diseñado es escalable y obtiene alto rendimiento para v´ıdeo en tiempo real con una alta precisión.

Para terminar con los algoritmos referentes a los modelos de emparejamiento, Núñez-Yáñez et al. [88] presentan una implementación flexible y escalable para la estimación de movimiento que es capaz de soportar los requerimientos para procesar v´ıdeo en alta definición haciendo uso del codec H.264 AVC30. Para ello, optimizan el algoritmo de fast block matching obteniendo un rendimiento de 62 fps para resoluciones de 1920×1080.

Con respecto a los trabajos relacionados con los modelos de gradiente, merece la pena des- tacar el realizado por Wei et al. [90], en el que se explica como se ha implementado y modificado un algoritmo de flujo óptico basado en tensores para adaptarlo a una FPGA con el objetivo de evitar pequeños obstáculos y posibilitar la navegación de veh´ıculos no tripu- lados. El rendimiento obtenido es de 64 fps, para un tamaño de fotogramas de 640×480, y con un error angular medio de 12,9o.

Con respecto al algoritmo de Lucas & Kanade, haciendo uso de FPGAs, el trabajo llevado a cabo por D´ıaz et al. [93] consiste en la implementación del algoritmo de Lucas & Kanade en FPGA con la capacidad de procesar hasta 170 fps a una resolución de 800×600 pixels en una arquitectura escalable, modular y versátil. Por otro lado, Barranco et al. [98] proponen una arquitectura paralela para la estimación de movimiento que es capaz de alcanzar 270 fps para una resolución de 640×480 en el mejor de los casos en una implementación mono- escala [106] y 32 fps para una implementación multi-escala [107, 108], obteniendo un error angular medio de 4,55o en el mejor de los casos.

Con respecto a la implementación del modelo McGM, Botella et al. exponen en su trabajo [94] una arquitectura personalizable basada en hardware reconfigurable con las propiedades de la secuencia del movimiento cortical. El rendimiento obtenido es de 177 fps con una resolución igual a 128×96 y con un error angular medio de 7,2o. El enfoque mostrado en este trabajo es apropiado en situaciones en las que la luminosidad es muy variable, en entornos ruidosos o en la investigación sobre el sistema perceptivo de los seres humanos.

Otro algoritmo implementado en FPGAs, perteneciente a los modelos de gradiente, se presenta en el trabajo realizado por Bahar y Karimian [96], donde exponen la utilización de la FPGA Cyclone II para acelerar los cálculos relativos al algoritmo de flujo óptico de Horn

& Schunck. La implementación que proponen utiliza unidades paralelas de almacenamiento para facilitar el acceso a memoria y los cálculos, mejorando la eficiencia del algoritmo y reduciendo significativamente de esta forma los ciclos de reloj necesarios, llegando a ser de tan sólo un ciclo. De esta manera llegan a alcanzar un rendimiento máximo de 1029,9 fps para una resolución de 240×320, adecuado para la detección de movimiento en tiempo real, con un error angular medio de 6,96o.

Para terminar con esta subsección, se presentan algunos de los trabajos realizados sobre FPGAs en los que se implementan modelos de energ´ıa. En [100] se presenta un sistema, implementado en FPGA, para el seguimiento de objetos haciendo uso de filtros de Gabor a través de varios canales de la imagen de entrada. El sistema es capaz de obtener un rendimiento de 30 fps para una resolución de entrada de 640×480.

Otro ejemplo es el expuesto por Tomasi et al. [102, 104] que, por partida doble, presentan dos trabajos en los que se implementan algoritmos basados en fase en FPGA. En [102] se presenta una arquitectura en la que se implementa un modelo basado en fase multi-escala que es capaz de procesar imágenes con una resolución de 512×512 de manera precisa a 36 fps. El algoritmo calcula la fase para ocho orientaciones diferentes en un modelo piramidal y propaga la información a través de un número adecuado de escalas en función del tamaño de la imagen de entrada y el tamaño del filtro. En [104] se presenta una arquitectura para la extracción de caracter´ısticas de visión de bajo nivel que incluyen el flujo óptico multi-escala, la disparidad, la energ´ıa, la orientación y la fase. De las soluciones que se presentan, la de alto rendimiento es capaz de computar 165 GOPS31_{con un consumo de energ´ıa de 30 GOPS/W}

con una frecuencia de reloj de 50 MHz. El sistema consigue un rendimiento de 22,8 fps con fotogramas de tama˜no 512×512.

In document e-recruitment Practices and Emerging Trends: New Opportunities for Employment Agencies? (Page 139-148)