Experiments on GMLSVD - Theoretical Analysis

7.4 Theoretical Analysis

7.5.1 Experiments on GMLSVD

2.3 Fundamentos del Área Biológica ...31 2.4 Fundamentos de Visión Artificial ...32 2.4.1 Perspectiva del Diseño ... 34 2.5 Visión por singularidades. ...37 2.5.1 Visión por singularidades e inteligencia artificial. ... 39 2.6 Aplicación de las Singularidades...41 2.7 Conclusiones...42

En este capítulo se plantean los aspectos básicos de la Visión Artificial, las etapas principales que constituyen a un sistema de visión y su funcionamiento, se establece el concepto de visión por singularidades con el enfoque de la Gesttal, y el soporte teórico del área cognitiva de la percepción.

Capítulo 2

.. “lo esencial es invisible para los ojos” Antoine de Saint Exupéry

2. Visión Artificial

La visión artificial, o visión computacional, es una disciplina que tiene como finalidad extraer información a partir de imágenes del mundo físico, [EMPS94],[EMSA97], utilizando para ello dispositivos y sistemas electrónicos así

como sistemas de procesamiento,[ TLV+04],[ ADDM96].

Un sistema de visión artificial actúa sobre una imagen que le proporciona

información sobre brillo, luminancia4_{, crominancia}5_{, contrastes, texturas, formas,}

etc. [EMSA97]. Las imágenes pueden ser estáticas (en un plano), o dinámicas

(imágenes en movimiento), [MLS06], [ASML06].

Un sistema de visión artificial esta constituido por lo general, de cuatro etapas principales:

• La primera etapa, (etapa de entrada), consiste en la captura o adquisición de

las imágenes digitales mediante un sistema que incluye algún tipo de sensor.

• La segunda etapa, (etapa de preprocesamiento), consiste en el tratamiento

digital de las imágenes, mediante filtros y transformaciones geométricas. Se eliminan las partes inservibles de la imagen y se realzan aquellas que resultan interesantes de la misma, con el objeto de facilitar el manejo de la información en las etapas posteriores.

4_{Luminancia, es la componente de la señal de video que contiene la información de}

intensidad luminosa.

5_{Crominancia, es la componente de la señal de video que contiene la información de} color.

• La tercera etapa (etapa de segmentación). En ella se aíslan los elementos de la imagen que son relevantes para su procesamiento.

• La etapa final (etapa de reconocimiento). Procesa los objetos segmentados

mediante el análisis de ciertas características establecidas previamente. Estas cuatro etapas no se siguen necesariamente de forma secuencial, en ocasiones es necesario retroalimentar a una de las etapas anteriores; por ejemplo de la etapa de reconocimiento volver a la etapa de segmentación, o a la etapa de preprocesamiento, e incluso regresar a la etapa de entrada, si falla el sistema.

La visión artificial permite imitar el comportamiento visual humano, establecer mediciones de parámetros característicos y clasificar imágenes de su entorno sin tener contacto físico con mucha exactitud.

La visión humana es altamente eficiente en los procesos de reconocimiento y clasificación de objetos, a pesar de las diferentes condiciones de visualización del mismo. Los porcentajes que se obtienen en el reconocimiento sobrepasan el 95% en tareas que involucran el reconocimiento y clasificación de diferentes cuerpos o imágenes, con un alto grado de familiarización de los mismos (previamente

aprendido) [Her96]; por esta razón, los modelos empleados en el diseño de sistemas

de visión artificial, buscan reproducir las mismas condiciones funcionales.

Los investigadores en áreas como la neurobiología, psicología, matemáticas e ingeniería se han asociado para realizar desarrollos tecnológicos, en el campo de la inteligencia artificial, particularmente en las teorías conexionistas (redes neuronales artificiales). Estos aspectos representan la motivación de esta Tesis Doctoral donde de forma concreta, se pretende utilizar la visión artificial para el reconocimiento y clasificación de formas.

Desde el punto de vista de la concepción y diseño arquitectural se planteó, desde un inicio, que el sistema debería tener en cuenta, las siguientes condiciones:

1) Adecuar la entrada de datos y la adquisición mediante un proceso robusto.

2) Utilizar métodos y técnicas robustas para el análisis y extracción de

características de la imagen. Determinar y cuantificar los parámetros; como

imagen tales como, número de vértices, ángulos acotados, formas preestablecidas, etc.

3) Lograr un sistema invariante a la rotación, traslación y escalamiento dentro

de un rango de iluminación.

4) Crear un sistema modular, escalable y reconfigurable, teniendo en cuenta que

será integrado a un sistema embebido.

2.1 Comportamiento Visual

El estudio del conocimiento no puede explicar adecuadamente aún, el porqué asociamos significados particulares con imágenes y comportamientos específicos. La interpretación del comportamiento visual se puede ver como simples mapeos entre patrones reconocidos de movimiento y su semántica. Pero la actividad humana es más compleja, el mismo comportamiento puede tener diferentes significados dependiendo de la escena y el contexto de la tarea. La interpretación del comportamiento en ocasiones, requiere de un procesamiento en tiempo-real, si es que se quiere que sea correcta, en un contexto dinámico. Tiempo-real, no necesariamente implica que todos los cálculos computacionales sean realizados a las velocidades máximas de un cuadro de imagen, pues existe una dependencia de la aplicación de la que se trate. Mientras la interpretación del comportamiento se realice dentro de ciertos requerimientos en el tiempo, se considera válida [GB02].

Se estima que el 60% de la información que recibimos de nuestro entorno llega a

través de los ojos [PLR+05], [KZ85]. El sistema de visión humana, en lo que se

refiere a su trayectoria visual, es una arquitectura masivamente paralela [PLR+05],

[Uhr87]. Retomando este criterio, resulta lógico pensar en una estrategia alternativa, considerando recursos de capacidad de cálculo menos complejos, pero más eficientes para una mejor emulación del sistema visual humano. Esta alternativa puede ser obtenida por los modelos conexionistas del proceso del conocimiento humano; idea que se consideró para establecer el objetivo principal de esta Tesis Doctoral.

Diseñar un sistema basado en pequeñas redes neuronales, especializadas en el reconocimiento de formas, para ser implantado en plataformas móviles.

En este trabajo se describe la arquitectura de un sistema de visión; sin embargo, el diseño de arquitecturas basadas en redes neuronales es enfatizado, por ser el tema central de esta Tesis Doctoral, así como su ejecución en dispositivos electrónicos reconfigurables.

In document Scalable Low-rank Matrix and Tensor Decomposition on Graphs (Page 176-179)