• No results found

3. RANKING COMMENTS: A COMMUNITY-PREFERENCE APPROACH

3.5 Comment Representation

3.5.3 Content-Based Features

2.1.3.1. Definición

Visión es la ventana al mundo de muchos organismos. Su función principal es reconocer y localizar objetos en el ambiente mediante el procesamiento de las imágenes (Figura 2.7). Visión computacional es el estudio de estos procesos, para entenderlos y construir máquinas con capaci- dades similares.

Como resaltan Sucar and Gómez (2011): “La visión computacional está muy ligada al proce- samiento digital de imágenes, aunque su objetivo final es diferente". El campo del procesamiento digital de imágenes, según Gonzales and Woods (2009) se refiere al procesamiento de imágenes digitales por medio de un computador digital; esto significa que cada imagen está compuesta de un número finito de elementos con posiciones y valores determinados.

El objetivo del procesamiento de imágenes es mejorar la calidad de las imágenes para su pos- terior utilización o interpretación (Figura 2.8), por ejemplo: remover defectos, remover problemas de movimiento o desenfoque, mejorar propiedades como color, contraste, estructura, cómo agregar colores falsos a imágenes monocromáticas; por otro lado el objetivo de la visión computacional es extraer características de una imagen para su descripción e interpretación por la computadora, por ejemplo: determinar la localización de tipo de objetos en la imagen, analizar un objeto para determinar su calidad, descomponer una imagen objeto en diferentes partes.

DE

CIENCIAS

FÍSICAS

Figura 2.7: Esquema general del procesamiento de imágenes

Fuente: Sucar and Gómez (2011)

Figura 2.8: Esquema general de visión por computadora.

Fuente: Sucar and Gómez (2011)

2.1.3.2. Arquitectura de un sistema de visión computacional

Un sistema típico de visión por computadora, además de un dispositivo de captura cuenta con al menos otros 4 elementos: un dispositivo de conversión de analógico a digital (A/D), una memoria de video, un elemento de procesamiento y un monitor, como se muestra en la Figura 2.9.

Para Sucar and Gómez (2011) la arquitectura de un SVC se compone de lo siguiente:

a) Dispositivo de captura. Dispositivo físico que es sensible a una determinada banda del espectro electromagnético. El dispositivo produce una señal eléctrica proporcional al nivel de energía detectado.

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

Y MATEMÁTICAS

Figura 2.9: Arquitectura de un sistema de visión

Fuente: Sucar and Gómez (2011)

b) Conversión A/D. Convierte la señal obtenida del dispositivo de captura en una señal digital. c) Memoria de video. Memoria semiconductora (RAM) en la que se almacena la imagen di- gitalizada. Normalmente la conversión A/D y la memoria de video se agrupan en un módulo conocido como frame grabber (captura de imágenes).

d) Procesador. La memoria de video se acopla a un procesador de propósito general que per- mite operar sobre la imagen. Opcionalmente pueden existir otro procesador dedicado para captura y procesamiento de imágenes.

e) Monitor. Generalmente se tiene un monitor que permita visualizar las imágenes adquiridas. El procesador y monitor pueden ser parte de una computadora de propósito general a la que se ha acoplado el frame grabber.

DE

CIENCIAS

FÍSICAS

2.1.3.3. Etapas del procesamiento digital de imágenes

El desarrollo de un sistema de visión computacional se compone de típicamente de las siguien- tes etapas como lo menciona García Santillán (2008):

Tabla 2.3: Niveles de visión y procesos del PDI. Etapas del PDI Nivel de Visión 1. Captura/adquisición Bajo 2. Preprocesamiento 3. Segmentación Media 4. Descripción 5. Reconocimiento 6. Interpretación Alto

Fuente: García Santillán (2008)

La captura o adquisición.

“Proceso a través del cual se obtiene una imagen digital utilizando un dispositivo de captura como una cámara digital, video cámara, escáner, satélite, etc” García Santillán (2008).

Características:

1) Resolución: Número de píxeles que contienen las imágenes. La mayoría de las cámaras comerciales generan imágenes de 640x480 píxeles que son adecuadas para muchas aplica- ciones.

2) Profundidad de tono: Se refiere a la cantidad de bits de información necesarios para repre- sentar el color de un píxel en una imagen digital o en un framebuffer. Debido a la naturaleza

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

del sistema binario de numeración, una profundidad de bits de n implica que cada píxel de la imagen puede tener 2nposibles valores y por lo tanto, representar 2ncolores distintos. 3) Memoria: Las cámaras pueden incluir memoria interna fija, así como tarjetas de memoria

intercambiables.

4) Velocidad de captura: También llamada velocidad de obturación es el tiempo que el obtura- dor permanece abierto cuando pasar la luz al sensor, o el tiempo que el sensor ve la escena que está tratando de capturar.

5) Sistema de transferencia: Es importante conocer la calidad de operación del sistema de trans- ferencia de una cámara para el traspaso de imágenes a la PC. La mayoría cuentan con cone- xión USB.

Tabla 2.4: Cuadro comparativo entre dispositivos de captura de imágenes

XX XX XX XX XXX Criterio Dispositivo

Motorola G7 Samsung S5 Samsung J2 Profundidad de tono 8 bit 8 bit 8 bit

Costo 740 900 399 Resolución 4000 x 3000 px (12 MP) 4640 x 3480 px (16 MP) 2448 x 3264 px (8 MP)

Transferencia micro USB 2.0 micro USB 2.0 USB Memoria 8 GB 16 GB 8GB Velocidad de captura 1080 a 30 fps 1080 a 60 fps 30 fps

Fuente: Elaboración propia

DE

CIENCIAS

FÍSICAS

El Preprocesamiento.

En esta etapa se prepara la imagen obtenida con anterioridad, como esta aún se encuentra en bruto sin ningún tipo de tratamiento es normal que cuente con algunos ruidos que se deberán borrar para evitar errores en el análisis de estas, de ahí radica la importancia de esta etapa. Incluye técnicas tales como la reducción del ruido, realce del contraste, realce de ciertos detalles, o características de la imagen (García Santillán, 2008).

Podemos encontrar algunas técnicas como: 1) Filtros

2) Transformaciones geométricas. 3) Transformaciones del histograma 4) Conversión de los niveles de grises. Técnicas

Reducción de ruidos mediante filtros.

Sirve para suavizar una imagen al eliminar o reducir significativamente el ruido que esta pueda tener, así como lograr resaltar alguna característica.

Filtro de Mediana.

Tiene la ventaja de que el valor final del píxel es un valor real presente en la imagen y no un promedio, de este modo se reduce el efecto borroso que tienen las imágenes que han sufrido un

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

filtro de media. Además, el filtro de la mediana es menos sensible a valores extremos. El inconve- niente es que resulta más complejo de calcular ya que hay que ordenar los diferentes valores que aparecen en los pixeles incluidos en la ventana y determinar cuál es el valor central.

Figura 2.10: Aplicación filtro de la mediana

Fuente: Pratt (2001)

Filtro Gaussiano.

El filtro gaussiano se usa para emborronar imágenes y eliminar ruido.

Son una manera de obtener filtros de tipo genérico. Pueden ser útiles, por ejemplo, cuando se asume que la respuesta espectral de un pixel es función de la reflectividad de los pixeles vecinos atenuada en función de la distancia (Del Castillo Huaccha, 2017).

La Segmentación.

“Proceso que divide una imagen en objetos que sean de nuestro interés de estudio” García San- tillán (2008). “Segmentar no está referido en lo absoluto a clasificar cada segmento, no intenta reconocer los segmentos individuales o sus relaciones con otro” Pratt (2001).

Dentro de algunas técnicas utilizadas para la segmentación podemos incluir:

DE

CIENCIAS

FÍSICAS

mayores al umbral serán blancos y los que no serán negros. La tarea más difícil es encontrar el umbral correcto que corresponda a los fines de la investigación a realizar.

Figura 2.11: Aplicación de un umbral de 128.

Fuente: García Santillán (2008)

2) Detección de bordes: “En una imagen, los contornos corresponden a los límites de los ob- jetos presentes en la imagen. Para hallar los contornos se buscan los lugares en la imagen en los que hay un significativo cambio de atributo” Pratt (2001), a la vez que identifica elementos sobre los cuales se trabajará. Sirve a su vez para poder separar un elemento del fondo,ayudando a trabajar fuera de un entorno controlado.

Figura 2.12: Detección de bordes.

Fuente: García Santillán (2008)

BIBLIOTECA

DE

CIENCIAS

FÍSICAS

La Descripción.

“Proceso que obtiene características convenientes para diferenciar un tipo de objeto de otro, como: la forma, el tamaño, área, etc” García Santillán (2008).

El Reconocimiento.

Proceso que identifica los objetos, como, por ejemplo: una llave, un tornillo, moneda, coche, etc.

La Interpretación.

Es el proceso que asocia un significado a un conjunto de objetos reconocidos (llaves, tornillos, herramientas, etc.) y trata de emular la cognición (García Santillán, 2008).