Intelligent Artificial Composer - Artificial Intelligence and Composition

3.4 Artificial Intelligence Applications in Music

3.4.3 Artificial Intelligence and Composition

3.4.3.2 Intelligent Artificial Composer

En muchos casos, en que la interpretación de la imagen se vuelve compleja, se hace necesario el empleo de un proceso de segmentación que emplee cierta información de más alto nivel que la empleada en las técnicas anteriores. Generalmente, este tipo de información de alto nivel hace referencia a estructuras. Frecuentemente, estas estructuras son las superficies de los objetos que interaccionan en la escena. Así, uno de los requisitos fundamentales para la detección de objetos es un proceso de segmentación lo más preciso posible, capaz de preservar las formas de los objetos y la localización de sus contornos.

Además de esas dos, existen otras restricciones que según Boulanger [Boulanger-2005] se deben cumplir en un proceso de segmentación de imágenes de rango:

• La información producida por un proceso de segmentación de imágenes de rango tiene que ser accesible a alto nivel.

• El proceso tiene que ser estable y repetible.

• El proceso de segmentación tiene que ser capaz de mostrar la mejor representación del conjunto de datos, de acuerdo a un nivel de tolerancia.

• La segmentación tiene que ser robusta.

• Los modelos geométricos complejos deben estar estadísticamente justificados.

Cuando se procesan imágenes digitales buscando segmentar una serie de objetos, el proceso de segmentación no es nada trivial, y se hace aun más complejo. Puede haber diferentes objetos, con distintas formas y tamaños, y disponerse en distintas posiciones. Y además hay que añadir los ruidos de capturar y los errores de digitalización.

En los últimos años han proliferado mucho los estudios e investigaciones para obtener imágenes de rango, y como consecuencia se han desarrollado muchas técnicas de segmentación que trabajan con este tipo de imágenes. De ahí, que se pueda extraer con estas técnicas información tridimensional y geométrica de la escena que puede ayudar a detectar regiones y objetos. Ya a finales de los años 80, Besl [Besl-1988] introdujo el contexto de utilización de las imágenes de rango.

Las técnicas de segmentación basadas en imágenes de rango según Hoover [Hoover-1996] emplean una de estas aproximaciones básicas o una combinación de ambas: basadas en regiones, basadas en contornos o técnicas híbridas que usan tanto regiones como contornos. Hoover en un estudio de análisis de técnicas de segmentación realizado a mediados de los 90, llegó a la conclusión que ni siquiera la segmentación de objetos poliédricos en escenas simples era un problema que tuviera una solución buena hasta la fecha. Más tarde, las investigaciones de Jiang [Jiang-2000] y Min [Min- 2004] confirmaron las conclusiones a las que había llegado Hoover años atrás. Estos afirmaron que el principal problema radicaba en que la mayoría de los algoritmos empleados es difícil que detecten bien, al mismo tiempo, superficies geométricas y localización exacta de contornos.

3.2.6.1. Segmentación basada en regiones

Los algoritmos de segmentación de imágenes de rango basados en regiones son todos aquellos que agrupan píxeles formando regiones conectadas cuya principal característica es que disponen de cierta medida de homogeneidad (Figura 3-11). A este tipo pertenecen las técnicas basadas en crecimiento de regiones y en métodos basados en ‘clustering’, comentados anteriormente, pero ahora con la salvedad que la fuente de entrada de aplicación serán imágenes de rango y no imágenes de luminancias o color. Estas técnicas tienen una serie de problemas, principalmente referentes al control

Capítulo 3. Estado del arte en los procesos de segmentación

- 57 -

de los algoritmos empleados. Así, el crecimiento de regiones tiene una gran dependencia del número inicial de regiones que se selecciona para empezar la búsqueda. En los algoritmos de ‘clustering’ es difícil determinar el número de clusters en la imagen de rango, y en muchos casos se producen problemas de sobresegmentación, es decir se divide la imagen en más regiones de las deseadas. De ahí, que a posteriori sea obligatorio procesos de post-segmentación para eliminar las últimas iteraciones de segmentación y reagrupar de nuevo ciertas regiones sobresegmentadas. Todos estos problemas fueron comentados por Hoover [Hoover-1996] en sus trabajos comparativos sobre segmentación en imágenes de rango.

Si además las superficies son complejas y se alejan de las formas poliédricas, los problemas que surgen son mayores, y los resultados de segmentación obtenidos mucho más pobres, como comenta Powel [Powel-1998].

Figura 3-11: Ejemplo de segmentación a partir de imagen de rango.

3.2.6.2. Segmentación basada en contornos

Los algoritmos de segmentación de imágenes de rango basados en contornos son todos aquellos que buscan localizar los contornos entre regiones homogéneas (Figura 3-13). Estas técnicas de segmentación son más criticadas en la literatura por tender a producir contornos no-conectados, y en muchos casos requieren de un post-procesamiento para conectar los contornos detectados. Sin embargo, también tienen sus ventajas. Los algoritmos empleados para implementar la detección de contornos tienen estructuras de control más sencillas, además de emplear operadores como la convolución que hacen que este tipo de algoritmos sean más fáciles y adecuados de implementar en tarjetas de procesamiento, arquitecturas paralelas, etc. Además, debido a la propia naturaleza de los contornos, cuando estos son localizados generalmente son localizados con mayor exactitud que los límites de región en los métodos basados en regiones.

En la mayoría de los casos, los estudios y algoritmos de segmentación basados en bordes que se han desarrollado sufren de algunas carencias [Jiang-1998a][Jiang-1998b]:

• No suelen clasificar tipos de borde que detectan de acuerdo a alguna particularidad o característica.

• No suelen comparar con otros detectores de borde óptimos o a modo teórico.

• Emplean pocas veces tests de imágenes reales, y cuando lo hacen lo llevan a cabo con un número muy limitado de imágenes.

Para evitar las dos de esas primeras carencias, se podría partir de la siguiente clasificación de contornos: contornos de salto, contornos de pliegue, y contornos suaves.

Los llamados contornos de salto que son definidos como discontinuidades en valores de profundidad. Este tipo de contornos suele aparecer cuando un objeto es ocluido por otro o por si mismo. Los contornos de pliegue son aquellos que se forman cuando dos superficies se encuentran. Este tipo de contornos se caracteriza por las discontinuidades en superficies normales. Y finalmente, los contornos suaves son aquellos con superficies normales continuas pero con curvaturas de discontinuidad. El cálculo de la curvatura de discontinuidad es extremadamente costoso en imágenes de rango debido al ruido de captura. Por este motivo, es difícil ver en la literatura desarrollos que consigan una segmentación precisa y funcionen bien en la detección de éste tipo de contornos [Jiang- 1998a].

Según Krishnapuram [Krishnapuram-1992], los contornos de pliegue pueden clasificarse en contornos de ‘roof’ o contornos de ‘no-roof’. Los contornos ‘roof’ corresponden a extremos locales y tienen el más alto o más bajo valor de profundidad en cada cara, y dónde se encuentran o un máximo o un mínimo, respectivamente. Mientras que los contornos ‘no-roof’ están caracterizados por discontinuidades en superficies normales con valores más bajos en una cara y valores más altos en la otra. (Figura 3-12). En la práctica la distinción entre ‘roof’ y ‘n-roof’ sólo depende del punto de vista del observador.

Figura 3-12: Tipos de contornos.

Por otro lado los contornos de pliegue pueden ser cóncavos o convexos. Son cóncavos cuando el punto de encuentro de ambas caras corresponde con un mínimo local, y es convexo cuando corresponde con un máximo local. La convexidad o concavidad es invariante al punto de vista de observación y representa una propiedad intrínseca del objeto. De ahí, que es más adecuado clasificar los contornos pliegue únicamente como cóncavos o convexos.

z x z x z x z x ‘roof’ ‘no-roof’

Capítulo 3. Estado del arte en los procesos de segmentación

- 59 -

Anteriormente, se había definido los contornos de salto como discontinuidades en los valores de profundidad. Jiang [Jiang-1998a] llegó a la conclusión que los contornos de salto no se podían definir adecuadamente de este modo. Comentó que dos píxeles adyacentes pertenecientes a la superficie muy inclinada de un objeto, frecuentemente, tiene valores de profundidad muy distintos. Por lo tanto una simple umbralización de discontinuidades no siempre trabaja bien para la detección de contornos de salto. De ahí, que con sus averiguaciones redefinió los tipos de contorno que se podían segmentar

Figura 3-13: Segmentación mediante un algoritmo basado en la técnica de contornos.

Alternativamente, y en muchos casos, se tiende a combinar ambas técnicas. Generalmente, se suele emplear primero una segmentación basada en contornos. De este modo, se parte de un mapa de contornos que permite proporcionar una presegmentación que posteriormente es refinada mediante técnicas de segmentación de contornos. Posteriormente, la información de contornos puede ser además incorporada al algoritmo de segmentación de regiones, para obtener una extracción de regiones más robusta [Jiang-1998b].

3.3. Los espacios de color en los procesos de

In document An Investigation into the Use of Artificial Intelligence Techniques for the Analysis and Control of Instrumental Timbre and Timbral Combinations (Page 94-114)