Methods - Aims and objectives - The energy costs of commuting: a spatial microsimulation approa

1.5 Aims and objectives

1.5.3 Methods

Como se puede observar en el procedimiento, la automatizaci ón no es completa. A ún existen fases en las que el humano debe realizar acciones. Sin embargo, se propone la automatizaci ón de actividades que suelen consumir una gran cantidad de tiempo, estas son: hacer una imagen de entrenamiento, construir una base de im ágenes, y utilizar s ólo una imagen por ciclo de entrenamiento.

necesario utilizar alg ún programa de edici ón de im ágenes para crear una figura de color blanco sobre un fondo negro, y que esta figura cubra todos los pixeles que pertenecen al objeto de inter és. El procedimiento presentado en este trabajo permite automatizar este proceso; sin embargo, tambi én tiene su limitante: la calidad de la figura. La figura que cubre al objeto, de hecho, es suficientemente exacta. El problema radica en otros dos puntos: el ruido en la imagen, y las sombras.

El ruido en una imagen se representa como peque ños cambios aleatorios en las inten- sidades de color en cada uno de los componentes del RGB. Dependiendo de la calidad de la c ámara, la intensidad y el tipo de iluminaci ón, este ruido puede tener la fuerza suficiente como para que un programa de sustracci ón de fondo llegue a clasificarlo como un objeto nuevo en la escena. Por supuesto, con el debido cuidado en la iluminaci ón de la escena y una serie de filtros, el ruido puede ser minimizado lo suficiente como para que no genere pixeles blancos sobre otra cosa que no sea el objeto.

El otro problema son las sombras generadas por el nuevo objeto. Una sombra representa un cambio de intensidad mucho m ás fuerte que el ruido ambiental. Sortear este problema ya no es tan evidente. Sin embargo, ya existen varios algoritmos dise ñados para detectar sombras. Para este trabajo de investigaci ón, el algoritmo de sustracci ón de fondo implementado es muy sencillo, y por tanto, las sombras s´ı representan un problema, pues son detectadas como objetos nuevos. Sin embargo, es s ólo un problema temporal, pues no hay mas que implementar alguno de los algoritmos que ya resuelven este tipo de situaciones. A ún en el estado actual del programa, con la debida iluminaci ón, una sombra representa una parte muy peque ña de la figura, y dada la naturaleza de la GP, las solu- ciones generadas buscar án cubrir el objeto como prioridad, ya que su aptitud depende de ello.

La automatizaci ón de la construcci ón de una base de im ágenes es una mejora directa de automatizar la creaci ón de una imagen de entrenamiento. Este tipo de bases no son mas que un grupo organizado de im ágenes con su respectiva imagen de entrenamiento. Editar cientos o miles de im ágenes para crear estas bases es una actividad que requiere de mucho tiempo y esfuerzo, y puede resultar una tarea abrumadora para aquellos que no tienen experiencia en la edici ón de im ágenes. Entonces, un algoritmo que ayude a

editar y organizar de forma autom ´atica estos archivos resulta de gran ayuda, y agiliza el proceso para implementar nuevas bases de im ´agenes.

Por supuesto, el m étodo tambi én tiene sus limitantes. Todas las bases de im ágenes creadas as´ı necesitan una imagen de fondo. Esto implica que si se requiere hacer un cambio de ángulo, de acercamiento, de iluminaci ón, etc., es necesario tomar una nueva imagen de fondo. A pesar de ello, la velocidad con la que se pueden crear nuevas bases de im ágenes permite incluir todos estos cambios de manera r ápida y sencilla. Tambi én, probar nuevas ideas que necesiten objetos locales, o que no se encuentren en las bases de im ágenes p úblicas, es mucho m ás r ápido. Esto es una ventaja considerable, a ún si las im ágenes autom áticas tienen algunos defectos.

Finalmente, con el aprendizaje en vivo se explora la capacidad y el comportamiento de algoritmos que simulan una parte del funcionamiento de la corteza visual. Sus ventajas y limitaciones son exploradas en los cap´ıtulos restantes.

En el presente cap´ıtulo se detallan los algoritmos que se siguieron para automatizar casi por completo el proceso de aprendizaje. A ún existen muchas otras formas e ideas para lograr la automatizaci ón completa de esta etapa, lo cual es un objetivo importante a seguir, debido a la inclusi ón de los sistemas inteligentes y de rob ótica en la vida diaria del ser humano. Se expone como mayor ventaja, la velocidad de implementaci ón de nuevas bases de im ágenes para entrenamiento, mientras que sus limitaciones pueden ser sorteadas con la implementaci ón de algoritmos m ás robustos de sustracci ón de fondo.

En el Cap´ıtulo 8 se presentan los resultados obtenidos para las propuestas de este trabajo de tesis, compar ´andose con los resultados del sistema predecesor bajo las mismas condiciones de uso.

Cap´ıtulo 8.

Experimentos y resultados

8.1. Experimentos realizados

En el trabajo de tesis se produjeron dos algoritmos: FOA-LDA y FOA-HDA. Para poder tener un punto de comparaci ón y observar los cambios en los resultados de los nuevos sistemas, tambi én se realizaron ejecuciones con la versi ón original: ADS/FOA. Los tres algoritmos se corrieron en dos formas de entrenamiento: con bases de im ágenes, y en vivo. As´ı pues, se realizaron las siguientes ejecuciones:

Tabla 1: Lista de Experimentos.

Experimento Aprendizaje Ejecuciones RGB D KFold

En vivo 5 30 0 No FOA Base de Im ágenes 30 84 0 70/14 En vivo 5 30 30 No FOA-LDA Base de Im ágenes 30 84 84 70/14 En vivo 5 30 30 No FOA-HDA Base de Im ágenes 30 84 84 70/14

Para los experimentos en vivo, se decidi ó realizar 5 ejecuciones para cada algoritmo. Esto se debe a que, a diferencia de un experimento con bases de im ágenes, el aprendizaje en vivo necesita una c ámara en el momento de ejecuci ón. Por ello, no es posible correr m ás de una ejecuci ón a la vez. Si se quisieran correr m ás ejecuciones, se necesitar´ıa m ás c ámaras, y otras computadores en donde correr estas ejecuciones.

Para los experimentos con bases de im ágenes, se decidi ó correr una validaci ón cruza- da, o K-Fold (Ver Ap éndice C). Para esto se usaron 84 pares de im ágenes (Color/Profundidad), repartidas en seis grupos, construyendo finalmente seis combinaciones distintas de 70 pares de im ágenes de entrenamiento y 14 pares de im ágenes de prueba. Se realizaron cinco ejecuciones por combinaci ón. Se debe notar que para los experimentos de FOA, no se usaron las im ágenes de profundidad.

Los experimentos fueron realizados en dos modelos de computadoras:

Una laptop LenovoR _{G40-70 de arquitectura x86-64, procesador Intel} R _CoreTM _i3-

4005U 1.70 GHz, 4 GB de RAM, tarjeta gr ´afica IntelR _{HD Graphics 4400. Sistema}

Cuatro estaciones de trabajo de modelo Dell Precision T7600 de arquitectura x86- 64, procesador IntelR _Xeon R _{E5-2609 2.40 GHz de 8 n ´ucleos, 8 GB de memoria}

RAM, tarjeta gr ´afica NVIDIAR _{GF100GL Quadro}R _{4000. Sistema operativo Linux}

openSUSE 13.1

Todas las computadoras trabajaron con MATLABR _R2011b.

In document The energy costs of commuting: a spatial microsimulation approach (Page 41-47)