Conjugate Gradient - Polyhedral+Dataflow Graphs

En el campo de la IA, la aplicación del concepto de auto-conciencia a sistemas artificiales es de bastante difícil definición. De todas formas algunos han considerado que “auto-conciencia consiste en un programa que contiene cierto tipo de hechos acerca de sus ‘propios procesos mentales y ‘estado mental’ ” [Mc95]. Esto en sí mismo es bastante polémico, porque implicaría definir con mayor precisión a que se refieren los términos “procesos mentales” y “estado mental”. De todas formas es interesante que implica auto-conocimiento de los procesos y una auto-representación (estado). Cabe agregar que, para que esta auto-representación sea válida, debe ser una percepción de su propio estado y no el estado en sí.

Se argumenta que algunas funciones cognitivas de auto-conciencia en seres humanos deberían estar presentes en sistemas de AI, otras no, y otras no presentes en seres humanos serían necesarias o deseables [Mc95]. Algunos lo aplican como “dar sentencias respecto a las sentencias generadas por el propio proceso” [Mc95], pero esto parece una deformación del problema desde la perspectiva informática. Desde un mayor nivel de abstracción, se hará referencia a la auto-representación y al uso de la misma por un holón virtual. Por otra parte, es importante que la auto-conciencia no puede ser en un sistema informática un output de un proceso, sino un proceso que mantenga una actividad persistente [Mc97].

¿Cómo puede implementarse la auto-representación en los holones? En primer lugar, uno puede pensar que es bastante fácil para un sistema de software conocer su propio estado, y cualquier sistema podría leer sus propias variables en cualquier momento, pero eso no sería realmente auto-conciencia. Si se aplicase auto- conocimiento directo lo que se tendría sería una simple lectura de su propio estado, sin relación con la auto-conciencia. Como ejemplo, en el caso de los humanos, la idea que cada individuo tiene de sí mismo, es decir, sus virtudes, limitaciones y defectos, no es el resultado directo de información provista por su propio cuerpo, pero se construye a través de un proceso de aprendizaje. Cuando un individuo es demasiado joven, probablemente no se ha formado aún una idea realista de cómo realmente es, pero a medida que se desarrolla – si el proceso de aprendizaje funciona adecuadamente – su auto-representación se va ajustando más a la realidad.

En ese sentido, desde el punto de vista de la ciencia cognitiva, las variables del sistema deben estar separadas de la auto-representación. Esto significa que, por un lado, se tendrían variables vinculadas a las características de los holones (esto quiere decir, su personalidad, si se piensa en ello como un vector de características con diferentes niveles de desarrollo en cada variable) y, por otro lado, la percepción que tienen los holones de sí mismos. Como se ha mencionado, es necesario tener una representación abstracta de su personalidad, y un proceso para modificarla a lo largo del proceso de aprendizaje. Además, no se puede hablar de auto-conciencia sin la capacidad de censar de forma continua el entorno y la auto-representación y luego adaptar las acciones en consecuencia. De acuerdo con esto, también es necesario implementar un proceso para utilizar esta información de sí mismo en conexión con otras capacidades cognitivas, tales como la inferencia, anticipación y optimización a lo largo del proceso de aprendizaje. Como estableció el psicólogo Phillip Jhonson-Laird, “La planificación y

control de la acción requieren un modelo de sí mismo, incluyendo objetivos, habilidades, opciones y un estado actual” [St03]. Este proceso de aprendizaje no puede ser posible si la entidad consciente se encuentra aislada. Numerosos trabajos de investigación en Psicología han probado que la interacción es esencial para el desarrollo de la conciencia, y por este motivo se modeló la auto-conciencia como algo dinámico. Debido a esto, se han considerado las RNAM como una buena elección para la implementación de auto-conciencia y auto-representación. En efecto, los procesos mentales del cerebro son sumamente diferentes a la computación tradicional en muchos casos.

En el caso de los seres humanos, la auto-representación no sólo significa que el individuo tiene una representación interna de sí mismo, como ser humano, diferente de otras especies (sense of belonging), pero además necesita incluir una representación abstracta de sí mismo con su única personalidad. Según esto, en el simulador, se han equipado los holones con determinadas características que, determinan a su vez, su comportamiento. Cada uno de ellos tiene un estado, un nivel de crecimiento y un cierto grado de auto-confianza. Estas características no son conocidas a priori por el holón, si no aprendidas a través de un proceso de desarrollo de su auto-representación y auto- conciencia. La figura 4.38 muestra como interactúan los holones entre sí.

Desde este punto de vista, se considera en este experimento, la auto- representación como un resultado de la interacción social a través de un proceso de aprendizaje. Para ello se implementaron los siguientes componentes:

A) Función de Representación. Es decir, la contribución que cada característica hace a su valor global. Esta función inicialmente no es conocida por el holón, sino aprendida.

B) Valores globales de otros holones: Estos valores son desconocidos en el estado inicial. Se inicializan con aproximaciones (se considera que existe una percepción imperfecta) que se va perfeccionando con el aprendizaje.

C) Valor Global propio: Desconocido en el comienzo, se aprende posteriormente, incluso los valores de cada característica.

El esquema en la figura 4.39, muestra las estructuras participantes en el proceso.

Figura 4.39. Estructuras de RNAM.

Como puede verse en la figura 4.39, cada holón tiene una auto-representación (la RNA a la izquierda) que contiene las características del holón siendo su valor global, la salida de esta RNA. Nótese que los valores de cada característica y la función de evaluación (la cual está basada en los pesos) están representados en este módulo de auto-representación. La importancia relativa de cada característica está representada por los pesos para s, g y w, en la expresión polinómica:

sws + gwg + gwc

Como puede verse en esta expresión, las tres características: estado (s), crecimiento (g) y confianza (c), componen la agregación de la salida.

Cuando el valor global cambia, los pesos son ajustados mediante el conocido algoritmo del gradiente descendente. Este proceso de convergencia, sigue la dirección del gradiente negativo, en este caso:

∂E /∂s , ∂E /∂g, ∂E /∂c

[ 6]

Lo cual luego de unas cuantas transformaciones [Hy94], se obtiene la siguiente fórmula iterativa:

w

=w

– µ .e. f’(net). x

[ 7] Aquí, ƒ representa la función de transformación. Se utiliza para esto una sigmoide, para que la función sea diferenciable (una condición para el algoritmo del gradiente descendente). Esta fórmula se aplica en cada iteración, y como resultado, los pesos relativos (ws, wg wc) convergen en la dirección del gradiente negativo.

En lo que tiene que ver con la representación de otros, como puede verse en la parte derecha del esquema en la figura 41, la representación es más simple. En efecto, como se ha asumido que la función de evaluación es la misma para todos los holones, sólo se representan los valores de cada característica en el caso de los otros holones. El valor global de estos holones es calculado mediante la suma ponderada de estos valores. Como resultado de esta arquitectura RNAM, cada holón podrá reconocer las características de otros individuos, así como las suyas propias, a través de la auto- representación.

Una vez implementado, el sistema fue testado con diferentes configuraciones iniciales, variando principalmente el número de holones. Como resultado, se pudo observar la evolución de la auto-representación en cada holón, y su influencia en su posterior comportamiento. En primer lugar, se analizará la evolución de la ponderación relativa de cada holón sobre sus cualidades. La auto-representación en este caso converge, primeramente en la relativa contribución de cada característica a su valor global. Esto significa que, en una segunda fase del proceso de entrenamiento, el holón no sólo aprende más acerca de sí mismo globalmente, sino incluso aprende más acerca de la relativa importancia de cada una de sus características. Esto puede verse en la figura 4.40.

Figura 4.40. Evolución de la ponderación relativa de cualidades.

En la figura 4.40, se puede ver para las tres características implementadas, la convergencia de la resultante función, y como consecuencia de esto, la convergencia del auto-conocimiento de cada una de las características en cada holón. En esta figura, se puede observar como el nivel de error relativo decrece en unas pocas iteraciones hasta un valor aceptable de aproximadamente 0,05 y, en una segunda fase, converge casi a una exacta percepción de sus características.

En la figura 4.41, puede verse el error en la percepción relativa en tres holones, después de sucesivas confrontaciones entre sí. Debido a que el primero (en azul) evita las confrontaciones después de la sexta iteración, ningún progreso en su aprendizaje tiene lugar de allí en más. De todos modos, todos los holones tienden a minimizar su error en la percepción e incluso su precisión en el pronóstico.

En la figura 4.42, puede verse como la auto-representación evoluciona a lo largo del proceso. Nuevamente, puede verse un caso de tres holones, y sus valores globales (desde su propio punto de vista). En estos casos, se observa que luego de un período inicial de oscilaciones, el error, como resultado de la interacción con holones de diferentes características se minimiza.

Figura 4.42. Evolución de representaciones.

En cada uno de los casos que se han podido ver, se destaca la capacidad de aprendizaje inherente a la arquitectura cognitiva definida, mediante el uso de RNAM, haciendo posible el aprendizaje de las diversas representaciones que integran la fuente de información de la auto-conciencia [Ml08a] [Ml08b].

In document Polyhedral+Dataflow Graphs (Page 126-156)