Part 3 Methodological framework 24
3.2 Methodology 30
En las secciones anteriores la arquitectura estándar de las redes CNN ha sido presentada mostrando sus principales características y posibilidades de configu- ración, fundamentalmente en función de su topología, conexionado y plantillas. A continuación se introducen las principales variantes al modelo original de la red CNN que ofrecen diferentes mejoras en cuanto a eficiencia, adaptación a nue- vas aplicaciones y simplificación en su implementación. Todas estas variantes, resultantes de la adaptación del modelo tradicional al ámbito de la ingeniería electrónica, siguen manteniendo el espíritu de las redes CNN tradicionales:
1.2 Variantes al modelo original de las redes CNN 11 Cada celda cuenta con una dinámica interna propia.
La conexión entre celdas es de carácter local y recurrente.
Se utiliza un conjunto reducido de operaciones para controlar el comporta- miento global de la red.
1.2.1.
Redes CNN continuas en el tiempo
El modelo original de las redes CNN, conocido también como modelo de Chua y Yang, modelo estándar o modelo continuo de la red CNN (CT-CNN, Continuous-Time CNN), se caracteriza por tener un comportamiento continuo en el tiempo y una alta capacidad de procesamiento paralelo. Esta combinación de características permite que dicho modelo pueda ser utilizado en problemas es- pecíficos, que difícilmente pueden ser resueltos mediante otros modelos. Concre- tamente, las redes CT-CNN son utilizadas, por ejemplo, para estudiar los efectos caóticos que se producen en determinados sistemas no lineales complejos, como algunos tipos de circuitos resonantes (Arena P., 1998).
Las celdas de las redes CT-CNN son definidas mediante una ecuación dife- rencial lineal de primer orden (ecuación 1.3) y una función de activación, que habitualmente coincide la función estándar (ecuación 1.4, figura 1.6-a). Estas ex- presiones son tomadas como referencia para desarrollar las variantes del modelo más utilizadas (Cimagalli V., 1993). d dtxij(t) = −xij(t) + X k,l∈N r(ij) Aklykl(t) + X k,l∈N r(ij) Bklukl(t) + Iij (1.3) yij(t) = f (xij(t)) = 1 2(|xij(t) + 1| − |xij(t) − 1|) (1.4)
1.2.2.
Redes CNN con plantillas clonadas
El modelo estándar de las redes CNN deja abierta la posibilidad de utilizar plantillas diferentes en cada una de las celdas que constituyen la red. Dicha po- sibilidad, sin embargo, resulta difícil de considerar en una realización hardware
completa debido a los inconvenientes que supone el diseño y la implementación individual de cada una de las celdas. En general, para evitar este tipo de pro- blemas, las redes CNN suelen utilizar la misma plantilla en todas sus celdas. El término empleado para denominar a este tipo de red, y que enfatiza la propie- dad de invarianza de las plantillas, es el de redes CNN de plantillas clonadas (LCN-CNN, Linear Cloning Template Celluar Neural Nerworks).
En estas redes, la dinámica del sistema queda definida completamente por un conjunto de parámetros reducido, cuyo número depende únicamente del radio de vecindad de la celda. Si el radio de vecindad es 1 (ventana 3 × 3), la evolución del sistema vendrá determinada por una plantilla de tan sólo 19 parámetros, 9 por cada operador (A y B) y el correspondiente al bias (I ). En general, para un radio de vecindad r, el número de parámetros requeridos por una red clonada será igual
a 2(2r + 1)2+ 1.
Este tipo de redes es utilizado en aplicaciones que requieren el mismo compor- tamiento de la red en todas las zonas del espacio. Este es el caso, por ejemplo, de las aplicaciones de procesamiento de imágenes que demandan el mismo efecto en toda la imagen (detección de contornos, umbralización, difusión, etc.). La gran versatilidad y sencillez de este tipo de redes hace que sean las más utilizadas y sencillas de implementar. Su amplio desarrollo ha dado lugar a una gran cantidad de librerías con multitud de plantillas diferentes.
1.2.3.
Redes CNN de rango completo acotado
Un inconveniente que dificulta la realización hardware de las redes CNN es el alto valor que pueden alcanzar algunas de sus señales internas, en particular la
variable de estado del sistema (xij). Esta señal, generalmente asociada a un ni-
vel de tensión, puede alcanzar valores perjudiciales para el circuito o difícilmente suministrables por la fuente de alimentación. Para evitarlo, Rodríguez-Vázquez et al. (Rodriguez-Vazquez A., 1993) propusieron una modificación al modelo es- tándar de la red CNN, consistente en trasladar los límites de la función no lineal de salida a la variable de estado de la celda (figura 1.7). De esta forma, el rango de la variable de estado queda confinado en límites seguros, idénticos a los de las entradas y salidas, lo que supone un beneficio para la realización hardware sin perjuicio significativo para el comportamiento del modelo.
1.2 Variantes al modelo original de las redes CNN 13 Las ecuaciones de estado de este tipo de redes, denominadas FSR-CNN (Full Signal Range Celluar Neural Nerworks), vienen representadas por las expresio- nes 1.5, 1.6 y 1.7, donde m representa una constante de diseño.
d dtxij(t) = −g(xij(t)) + X k,l∈N r(ij) Aklykl(t) + X k,l∈N r(ij) Bklukl(t) + Iij (1.5) yij = f (xij) = 1 2(|xij + 1| − |xij − 1|) (1.6) g (xij(t)) = m (xij(t) − 1) + 1 si xij(t) < −1 xij(t) si |xij(t)| ≤ 1 m (xij(t) + 1) − 1 si xij(t) > 1 (1.7) g(xij) 1 -1 xij
Figura 1.7: Función g(xij) utilizada por el modelo FSR-CNN.
1.2.4.
Redes CNN no lineales
El modelo original de las redes CNN es considerado, generalmente, un sistema no lineal debido fundamentalmente a la utilización de una función de salida no lineal (ecuación 1.4). Sin embargo, dado que la ley dinámica que rige el com- portamiento de la variable de estado (ecuación 1.3) si es lineal, algunos autores mantienen que el modelo en su conjunto debe ser considerado como un sistema lineal.
De modo indiscutible, una red CNN es no-lineal (NL-CNN, Non-Lineal Ce- llular Neural Networks) cuando el efecto de las entradas sobre las variables de estado responda de forma no lineal frente a estímulos que sí lo son, es decir,
cuando los elementos de las plantillas no son lineales. Las redes CNN con este comportamiento ofrecen una mejor aproximación a las redes neuronales biológicas y proporcionan una manera más eficiente y sofisticada de procesar la información (Chua L., 1993; Roska T., 1992). En general, este tipo de redes son necesarias para resolver problemas de clasificación cuya solución no es separable linealmente. Se puede decir que las redes CNN no lineales han existido desde el princi- pio (Roska T., 1992), ya que los componentes electrónicos utilizados en las pri- meras implementaciones analógicas (fuentes de corriente, resistencias, etc.) no ofrecían un comportamiento realmente lineal sino más bien una aproximación en torno a un punto de trabajo.
La no linealidad de las redes CNN puede darse tanto en estructuras simples como en estructuras formadas por múltiples capas. La forma más habitual de incorporar este comportamiento al modelo de la red CNN es añadir los términos
de la expresión 1.8 a la ecuación de estado general del modelo estándar. Donde bA
y bB son los operadores no lineales que se incorporan a la plantilla de las celdas.
X k,l∈N r(ij) b Aklykl(t) + X k,l∈N r(ij) b Bklukl(t) (1.8)
1.2.5.
Redes CNN retrasadas en el tiempo
Es sabido que los estímulos aferentes que recorren las redes neuronales biológi- cas pueden seguir diferentes trayectorias antes de llegar a su destino. Durante este recorrido, la información atraviesa diferentes elementos (interneuronas) que re- trasan la información e impiden que los estímulos sensoriales alcancen su destino al mismo tiempo.
Este comportamiento temporal, patente en las redes neuronales biológicas, es el origen de las redes CNN retrasadas en el tiempo (D-CNN, Delayed Cellular Neural Nerworks). El principal objetivo que se persigue con este tipo de redes es que las celdas puedan trabajar con los mismos valores de las entradas en diferentes instantes de tiempo, lo que permite que puedan ser utilizadas en aplicaciones de análisis temporal como, por ejemplo, la detección de movimiento (Cimagalli V., 1990; Roska T., 1990).
1.3 Redes CNN discretas en el tiempo 15