La operación división toma dos imágenes de igual tamaño (A y B) arrojando como resultado una tercera imagen(C) del mismo tamaño que las primeras, cada pixel de la imagen resultante es la división de los valores de los pixeles correspondientes de cada una de las dos imágenes de entrada. En este caso se debe considerar que la división puede producir valores por debajo de los permitidos por el valor de pixel, para lo cual se hacen algunas consideraciones que permite visualizarlos.
Una de las consideraciones es mediante la siguiente ecuación:
La división de 2 imágenes suele utilizarse para:
Fotomontajes.
Realzar ciertos colores.
En la Fig. 3.6 se muestra el ejemplo la division de dos imágenes mediantes el metodo mencionados anteriormente.
3.1.-
Imagen en escala de grises
Una imagen digital cuando se convierte o se toma en escala de grises muestra un conjunto de colores representados mediante tonos grises, o inclusive poner cada color en una intensidad. La escala de grises utiliza 8 bits para representar cada pixel lo cual solo permite 256 tonos de gris que van desde el negro hasta el blanco como se puede ver en la Fig. 3.7.
Fig. 3.7Tonos de la escala de grises.
Para pasar una imagen en RGB a escala de grises se emplea la siguiente función:
Donde
R (i,j) es el valor del pixel de la capa roja de la imagen.
G (i,j) es el valor del pixel de la capa verde de la imagen.
B (i,j) es el valor del pixel de la capa azul de la imagen.
En la Fig. 3.8 se muestra el ejemplo de como es convertida una imagen RGB a escala de grises. imagen original 200 400 600 800 1000 1200 1400 1600 200 400 600 800 1000 1200
3.2.-
Histograma de una imagen
El histograma es la representación gráfica de la frecuencia de los valores que puede tomar una variable. En el eje y (vertical) se representan las frecuencias y en el eje x (horizontal) los valores de las variables.
El histograma de una imagen representa estadísticamente la frecuencia relativa de los niveles de gris o de los colores de una imagen.
En la Fig. 3.9 se muestra el ejemplo del histograma de una figura en escala de grises.
Fig. 3.9Histograma de la imagen A.
3.3.-
3.2 Binarización de una imagen
La binarización es una técnica del procesamiento de imágenes en el cual la imagen es representada solo en dos tonos de color, el blanco y el negro. Para lograr la binarización primero se debe pasar la imagen a escala de grises, despues establecer un valor umbral (límite) y finalmente elegir un criterio, esto es; valores arriba de ese umbral se le dará uno de los colores y a valores por debajo del umbral se les dará el otro color.
A 0 500 1000 1500 2000 2500 Histograma 0 50 100 150 200 250
Para binarizar una imagen se utiliza la siguente funcion:
{
Los resultados de la binarización varían dependiendo del umbral usado y es aconsejable consultar el histograma de la imagen en escala de grises para establecer el criterio adecuado y obtener los resultados buscados, esto es observando el histograma y seleccionar un umbral que logre concentrar un porcentaje adecuado del color.
En la siguiente figura se ejemplifica la binarización con una imagen a la que se le aplicaron distintos umbrales y criterios de binarización.
a
3.4.-
Convolución
Una convolución es un operador matemático que obtiene una función a partir de dos funciones f y g, que en cierto modo representa la magnitud en la que se superponen f y una versión trasladada e invertida de g.
El teorema de la convolución es uno de los instrumentos más eficaces en el análisis de señales, con su empleo se obtienen muchos resultados importantes. Su aplicación es notable en campos de ingeniería como la electrónica, la física, óptica, probabilidad, acústica, óptica entre otras.
Definición.
Dadas dos funciones v(t) y w(t), podemos formar la siguiente integral:
∫
A esta integral, llamada integral de convolución se le representa simbólicamente como v(f)*w(t) y nos define la convolución entre las funciones v(t) y w(t).
Interpretación gráfica.
En la figura 3.11 se ilustra la interpretación gráfica de la convolución. Supongamos que las funciones f1(t) y f2(t) son los pulsos rectangular y triangular de la figura 3.11a. Encontraremos gráficamente la convolución f1(t)* f2(t) por definición:
∫
En la integral de convolución es la variable independiente, en la figura 3.11b se muestran las funciones f1 ( ) y f2 (- ). Después en la imagen 3.11c se observa la función f2 (t1- ) que representa a la función f2 (- ). Desplazada t segundos a lo largo del eje . El valor de la integral de convolución en t =t1está dado por la integral y representa el área bajo la curva del producto de f1 ( ) y f2 (t1- ). Esta es la región sombreada de la figura 3.11d.
Para encontrar los valores de la función f1(t)* f2(t), se seleccionan diferentes valores de t, se desplaza la función f2(- ) según esos valores y se calcula el área bajo las curvas producto correspondientes. Al final estas áreas representan el valor de f1(t)* f2(t) en los valores respectivos de t.
Matriz de convolución.
Algunas veces es útil ver a la convolución como un producto matricial. Esta operación hace una media entre las dos matrices mientras una de las matrices se arrastra por encima de la otra. Comúnmente esta operación se lleva a cabo para el filtrado de imágenes Fig.3.12.
Fig. 3.12Convolución en matrices para el tratamiento de imágenes.
El procedimiento es desplazar la matriz kernel o la matriz del filtro sobre la imagen a tratar, esta al tratarse de una colección bidimensional de pixeles en coordenadas rectangulares (para el caso de imágenes de una capa) se recorre pixel a pixel. Se centra el filtro en el pixel y se calcula la suma promediada de todos los pixeles cubiertos, la suma ponderada reemplaza el valor del pixel central. La Fig. 3.13 ilustra el procedimiento de la convolución para el tratamiento de imágenes.
Fig. 3.13Ejemplo de convolución
La convolución entonces, es usada para aplicar filtros a imágenes y el resultado obtenido depende de la matriz de filtrado que se emplee, estos diversos filtros tienen fines tan variados como la detección de bordes, desenfoque, resaltado de detalles entre otros.
3.5.-
Filtrado Espacial
El filtrado espacial es la operación aplicada a imágenes para mejorar o suprimir detalles espaciales con el fin de mejorar la interpretación visual. El filtrado espacial constituye una operación local en el sentido de que modifica el valor de cada pixel respecto a su vecindad (pixeles que rodean al pixel en cuestión).
La frecuencia espacial define la magnitud de cambios de los datos por unidad de distancia en una determinada zona de la imagen. Áreas de la imagen con pequeñas transiciones en los valores de datos se denomina áreas de bajas frecuencias mientras que áreas de grandes cambios se conocen como áreas de altas frecuencias.
Los filtros espaciales se dividen en tres categorías:
Los filtros pasa bajos enfatizan bajas frecuencias lo cual suaviza las imágenes y suprime ruidos, con lo cual se trata de asemejar cada pixel a su vecindad reduciendo la variabilidad espacial de la imagen.
Los filtros paso altos enfatizan altas frecuencias lo cual mejora características lineales eliminado así las bajas frecuencias.
Los filtros detectores de bordes se encargan de enfatizar los bordes que rodean a un objeto en la imagen para hacerlo más fácil de analizar. Existenuna gran cantidad de filtros detectores de bordes, por ejemplo: Roberts, Sobel, Laplaciano, Kirsch, entre otros.
Máscaras de Kirsch
Detectar un borde consiste en encontrar una función escalón más o menos ideal en cualquier dirección dentro de una imagen. Para ello Kirsch propuso una serie de 8 máscaras que detectan los bordes en 8 direcciones distintas. Las máscaras propuestas por Kirsch son las siguientes:
La imagen final se obtiene alconvolucionarla imagen inicial con cada una de las máscaras. Este valor permite obtener la magnitud del borde, mientras que la máscara empleada representará la orientación del borde.
Aplicando algunas máscaras de Kirsch a una imagen A se obtuvieron los siguientes resultados Fig.3.15
Fig. 3.15Resultados al aplicar las máscaras de kirsch de a)0 b) 135 y c) 270
Mascaras de Robinson
Utilizan el mismo principio que las máscaras de Kirsch, las cuales son simétricas con respecto a una línea central de ceros en la horizontal, vertical y diagonales Fig. 3.16.
Aplicando algunas máscaras de Roberts a una imagen A se obtuvieron los siguientes resultados Fig.3.17
Fig. 3.17Resultados al aplicar las máscaras de Robinson de a)0 b) 135 y c) 270
Canny
El algoritmo de Canny es usado para detectar todos los bordes existentes en una imagen. Este algoritmo está considerado como uno de los mejores métodos de detección de contornos mediante el empleo de máscaras de convolución y basado en la primera derivada.
El algoritmo de Canny consiste en tres grandes pasos:
Obtención del gradiente: en este paso se calcula la magnitud y orientación del vector gradiente en cada píxel.
Supresión no máxima: en este paso se logra el adelgazamiento del ancho de los bordes, obtenidos con el gradiente, hasta lograr bordes de un píxel de ancho.
Histéresis de umbral: en este paso se aplica una función de histéresis basada en dos umbrales; con este proceso se pretende reducir la posibilidad de aparición de contornos falsos.
Aplicando el algoritmo de Canny a una imagen A se obtuvo el siguiente resultado Fig.3.18.
Fig. 3.18Resultado al aplicar el algoritmo de Canny
3.6.-
Morfología Matemática
La morfología es una rama de la Biología que se encarga de la forma y estructura de animales y plantas. En el campo de la visión por computadora la morfología se usa para denotar una herramienta que extrae los componentes de la imagen para y describirla mediante regiones, por lo cual el lenguaje utilizado es el de la teoría de conjuntos, donde los conjuntos representan la forma de los objetos en una imagen.
Una imagen binaria puede representarse en el espacio de los enteros Z2 donde cada elemento son las coordenadas de un pixel en la imagen. Por lo tanto, una imagen binaria se puede representar en el plano por dos conjuntos; X, la imagen y Xc su complemento Fig.3.19.
Fig. 3.19Imagen binaria representada como conjunto en el plano.
La morfología matemática permite transformar una imagen en otra más apropiada, resaltando algún rasgo de la imagen original que permitirá medirlo más fácil.
Existen dos transformaciones básicas, erosión y dilatación, con las cuales mediante su combinación dan lugar a transformaciones más complejas.
3.6.1 Elemento estructural
Un elemento estructural es un elemento de geometría conocida el cual se desplaza a lo largo de la imagen de modo que su origen pasa por todas las posiciones del espacio de la imagen. Para cada posición de plantea la cuestión de unión, intersección o inclusión del elemento estructural en la imagen; la respuesta puede ser positiva o negativa, con lo cual las respuestas positivas forman un nuevo conjunto el cual se llamará imagen trasformada. El elemento estructural es sumamente relevante en la transformación ya que destacara características morfológicas diferentes dependiendo de la geometría utilizada.
3.6.2 Erosión
Ta ié es o o ido o o e ogi ie to , o t a ió o edu ió , su o jetivo es eliminar pequeñas islas menores al tamaño del elemento estructural.
Por ejemplo al someter una figura X a una erosión con un elemento estructural B (un circulo de radio 1), en cada desplazamiento se responde si la intersección de B y el complemento de X es igual a cero, dando como resultado los conjuntos mostrados en la Fig. 3.20.
Fig. 3.20Erosión mediante un círculo.
En cambio si la misma figura X se transforma (T(x)) con un segmento de longitud igual a la unidad tendremos como resultado Fig. 3.21:
Una imagen erosionada quedaría de la siguiente forma Fig.3.22:
a b
Fig. 3.22a) imagen con ruido b) imagen erosionada
3.6.3 Dilatación
Ta ié es o o ido o o elle o , e pa sió o e i ie to , su o jetivo es elle a hue os de tamaño igual o menor al elemento estructural.
Por ejemplo al someter una figura X a una dilatación con un elemento estructural B (un circulo de radio 1), en cada desplazamiento se responde si la intersección de B y el complemento de X es igual a uno, dando como resultado los conjuntos mostrados en la Fig.3.23.
Fig. 3.23Dilatación mediante un círculo.
Una imagen dilatada quedaría de la siguiente forma Fig. 3.24:
Fig. 3.24a) imagen con ruido b) imagen dilatada
3.7.-
RS-232
La norma RS-232 es una de las más popula es o u i a io es se iales utilizadas e las PC’s. Los parámetros que determinan este tipo de comunicación son: Velocidad, paridad, bits de datos y bits de parada; estos parámetros se relacionan con la forma como se transmite la información serial, los cuales van incluidos en el frame, generalmente al comienzo de un bit de inicio (siempre un 1); siguiendo del dato el cual puede ser de 5 a 8 bits de longitud; después de un bit de control de paridad y para finalizar un bit final (siempre un 1) de longitud variable (igual a 1, 1.5 o 2 bits)[12].
3.7.1 Velocidad de transmisión
Es la cantidad de datos trasmitidos por unida de tiempo. Es expresada den bits por segundo (bps) au ue ta ié suele usa se la edida de velo idad Baudio Baudrate que es el número de veces que cambia la portadora en un segundo.
La velocidad que se emplea para un dispositivo depende en gran medida de la calidad del medio por el cual se va a transmitir así como de la distancia que se va a emplear.
La velocidad está estandarizada según la norma RS 232C en baudios puede ser cualquiera de las siguientes: 75, 110, 150, 300, 600, 1200, 2400, 4800, 9600 y 19200.