• No results found

Orígenes de las ideas de auto organización

Durante la década formativa, ya se habían propuesto y discutido alternativas a la preponderancia del dominio de la lógica como principal enfoque para la ciencia cognitiva. En las conferencias Macy, por ejemplo, se alegó que en los cerebros mismos no existen normas ni un procesador de lógica central ni su información se encuentra almacenada en direcciones precisas. En lugar de eso, los cerebros parecen operar sobre la base de interconexiones masivas, de una manera distribuida, de modo que su misma conectividad cambie como resultado de la experiencia. En síntesis, presentan una capacidad de autoorganización que no se encuentra en la lógica.

En 1958, E Rosenblatt construyó el 'Perceptron', un dispositivo simple con cierta capacidad de reconocimiento, basándose úni- camente en los cambios de conectividad que se producen entre com- ponentes parecidos a las neuronas14. Asimismo, W.R. Ashby realizó

el primer estudio de la dinámica de sistemas de gran tamaño con interconexiones al azar, demostrando que exhiben comportamientos globales coherentes'3.

Históricamente, estos puntos de vista alternativos fueron marginados de la escena intelectual en favor de las ideas compu- tacionales discutidas arriba. Fue solamente a fines de los setenta que hubo un explosivo renacer de estas ideas, luego de 30 años de preeminencia de la ortodoxia cognitivista; lo que D. Dennet16 ha

llamado computacionismo de raíz ortodoxa. Ciertamente uno de los factores que contribuyen a este interés renovado fue el redescubrimiento paralelo de ideas autoorganizativas en la física y las matemáticas no lineales.

Motivación para buscar una alternativa

La motivación para dar una segunda mirada a la autoorganización se basó en dos deficiencias del cognitivismo, ampliamente reconocidas. La primera es que el procesamiento de información simbólica se basa en normas secuenciales, aplicadas una a la vez. Este famoso cuello de botella de von Neumann es una limitación dramática cuando la tarea en cuestión requiere grandes cantidades de operaciones secuenciales (tales como el análisis de imágenes naturales o la predicción del clima). Una búsqueda permanente de algoritmos de procesamiento paralelo en las arquitecturas clásicas no ha tenido mucho éxito debido a que la filosofía computacional entera evoluciona precisamente en sentido contrario.

14 F. Rosenblatt, Principies ofNeurodynamics: Perceptrons and The Theory ofBrain Mechanisms, Spartan Book, 1962.

" Para mayores informaciones acerca de los complejos orígenes iniciales de las ideas de la auto-organización ver I. Stengers, Cahier du CREA N°8, páginas 7-105.

La segunda limitación importante es que el procesamiento simbólico es localizado: la pérdida de cualquier parte de los símbolos o normas del sistema implica una falla importante en el funciona- miento. Por el contrario, una operación distribuida es altamente deseable, de manera que haya al menos una equipotencialidad rela- tiva y una inmunidad a las mutilaciones.

Estas dos desviaciones del cogcitivismo pueden expresarse de la misma manera: las arquitecturas y los mecanismos están a una gran distancia de la biología. Las tareas visuales más ordinarias, rea- lizadas aún por pequeños insectos, se realizan más rápidamente de lo que es físicamente posible cuando se las simula de una manera secuencial, la elasticidad de la mente frente al daño sin comprometer la totalidad de su competencia ha sido conocida por los neurobió- logos desde hace mucho tiempo.

¿ Qué es la emergencia?

Lo anterior sugiere que en lugar de enfocarse en los símbolos como punto de partida, uno podría comenzar con componentes simples (no cognitivos) que se conectarían unos con otros de maneras densas. De acuerdo con este enfoque, cada componente opera solamente en su entorno local, pero debido a la estructura de red del sistema completo, existe una cooperación global que emerge espontáneamente cuando los estados de todos los componentes participantes alcanzan un estado mutuamente satisfactorio, sin necesidad de una unidad de procesamiento central que guíe la operación completa17. Este paso desde normas locales a una cohe-

rencia global es el corazón de lo que solía llamarse autoorganización durante los años fundacionales18. Hoy en día, se prefiere hablar ya

sea de propiedades emergentes o globales, de dinámicas de redes o incluso de sinergia. Si bien no existe una teoría formal unificada acerca de las propiedades emergentes, la teoría regional más evidente

17 Para una extensa discusión sobre este punto, ver P. Dumouchet y J-P Dupuy (Editores)

L'Auto-organizacián: De la physique au politique, Eds. du Seuii, Paris, 1983.

es aquella de los atractores en la teoría de los sistemas dinámicos19.

Estos no son propiedad de componentes individuales, sino del sistema completo y sin embargo, cada componente contribuye a su emergencia y características.

Un cambio de perspectiva respecto al cerebro

Investigaciones recientes han producido evidencia detallada acerca de como las propiedades emergentes están en el núcleo del funcionamiento del cerebro. Esto no resulta tan sorprendente si uno examina los detalles de la anatomía del cerebro. Por ejemplo, si bien es cierto que las neuronas en el córtex visual responden claramente a 'características' específicas de los estímulos visuales, como se mencionó arriba, esto es válido en un animal anestesiado en un ambiente altamente simplificado (interno y externo). Cuando se permite un entorno sensorial normal donde el animal es estudiado mientras se encuentra despierto, en su comporta- miento habitual, se ha visto que las respuestas neuronales estereo- tipadas descritas antes se vuelven altamente sensibles al contexto. Por ejemplo, existen distintos efectos derivados de la inclinación del cuerpo 20 o estímulo auditivo21. Más aún, las características de

las respuestas neuronales dependen directamente de neuronas localizadas a gran distancia de sus campos receptivos22.

Así, se ha vuelto cada vez más necesario estudiar las neuronas como miembros de grandes conjuntos que constantemente desaparecen y surgen a través de interacciones cooperativas en donde cada neurona tiene múltiples y cambiantes grados de respuesta a los estímulos visuales, dependiendo del contexto. Aun en el extremo

" Una introducción accesible a la teoría moderna de los sistemas dinámicos es: R. Abraham y C. Shaw, Dynamics: The Geometry of Behavior, Aerial Press, Santa Cruz, 3 Volúmenes, 1985.

20 G. Horn y R. Hill, Nature 221, 185-187(1974).

21 M. Fishman y C. Michael, Vision Res., 13, 1415 (1973) y F. Morell, nature, 238, 44-46 (1972).

más periférico del sistema visual, las influencias que el cerebro recibe del ojo se encuentran con una mayor actividad que desciende del córtex. Es como resultado del encuentro de estos dos conjuntos de actividad neuronal que emerge una nueva y coherente configuración, dependiendo de la coincidencia o falta de coincidencia entre la acti- vidad sensorial y el ambiente 'interno' en el cortex23. En general,

una neurona individual participa en muchos de estos patrones globales y muestra una muy escasa significación cuando se la considera individualmente.

Aun cuando estos ejemplos se toman del dominio de la visión para enfartizar el contraste con el ejemplo de la sección anterior, existen muchos otros análisis detallados24. No es necesario que

insistamos más sobre este punto.

La estrategia (neo)conexionista

Bajo esta orientación alternativa, el cerebro, una vez más, ha sido fuente principal de metáforas e ideas para otros campos de la ciencia cognitivista. En lugar de partir de descripciones simbólicas abstractas, uno parte por toda una gama de componentes absurdos, los cuales, apropiadamente interconectados, pueden tener interesantes propiedades a nivel global. Estas propiedades globales son las que encarnan/expresan las capacidades cognitivas que se buscan.

Por tanto, todo este enfoque depende de la introducción de las conexiones apropiadas y esto por lo general se hace a través de una norma para el cambio gradual de las conexiones, partiendo de un estado inicial bastante arbitrario. En la actualidad disponemos de varias de estas normas, pero la más explorada es la Norma de Hebb, según la cual los cambios de conectividad en el cerebro podrían surgir a partir del grado de actividad coordinada entre las neuronas: si dos

23 F. Varela y W. Singer, Exp. Brain Res. 66, 10-20 (1987).

24 Una interesante colección de ejemplos es: G. Palm y A. Aersten (Editores) Brain Theory, Springer Verlag, 1986.

neuronas tienden a ser activas juntas, su conexión se refuerza, de lo contrario se disminuye. Por lo tanto, la conectividad del sistema se vuelve inseparable de la historia de su transformación, relacionada a su vez con el tipo de tarea definida para el sistema. Dado que la acción real ocurre al nivel de las conexiones, se ha propuesto el nombre de (neo)conexionismo para esta corriente de investigación2'.

Uno de los factores importantes para el explosivo interés que ha habido en este enfoque fue la introducción de algunos métodos efectivos para hacer un seguimiento de los cambios en las redes, y sobre todo las medidas estadísticas que dotan al sistema de una función de energía global que asegura su convergencia26. Por

ejemplo, tome N elementos simples, semejantes a neuronas, conéctelos recíprocamente y déles una norma tipo Hebb. Luego dé a este sistema una sucesión de patrones (no-correlativos) en algunos de sus nodos y en cada entrega permita que el sistema se reorganice, reordenando sus conexiones siguiendo su gradiente de energía. Luego de la fase de aprendizaje, cuando se presenta una vez más al sistema uno de estos patrones, lo reconoce, en el sentido de que recae en un atractor único y una configuración interna que se dice representa al ítem aprendido. El reconocimiento es posible siempre y cuando el número de patrones presentado no sea mayor de alrededor de 0.15 N. Además, el sistema ejecuta un reconocimiento correcto, incluso si al patrón se le da un ruido adicional o el sistema es parcialmente mutilado27.

Otra técnica importante preferida por algunos investigadores es la propagación retrógrada: cambios en las conexiones neuronales

2' El nombre se propone en: J. Feldman y D. Ballard 'Connectionist Models and their properties', Cognitive Science 6 205-254 (1982). Para una discusión extensa del trabajo actual en esta dirección ver: D. Rumelhart y J. McClelland (Editores) Parallel

Distributed Processing: Studies on the Microstructure of Cognition, MIT Press, 1986, 2

volúmenes.

26 La idea principal se debe a J. Hopfieid, Proc. Natl. Acad. Sci. (USA), 79, 2554-2556 (1982).

2' Existen muchas variantes asociadas a estas ideas. Ver en particular: G. Hinton, T. Sejnowsky y D. Ackley, Cognitive Science 9, 147-163(1984) y G. Toulouse, S. Dehaene y J. Changeaux, Proc. Natl.. Acad. Sci. (USA), 83, 1965-1968 (1986).

al interior de la red (unidades ocultas) con el fin de minimizar la diferencia entre la respuesta de la red y lo que se espera de ella, de manera muy parecida a alguien tratando de imitar a un instructor28.

NetTalk, un famoso ejemplo reciente de este método, es una máquina de conversión grafema-fonema que trabaja frente a algunas páginas de texto en inglés sencillo. Como resultado, NetTalk puede leer en voz alta un nuevo texto en lo que muchos oyentes consideran un inglés deficiente pero comprensible29.

Los modelos conexionistas proporcionan con impresionante gracia, un modelo operativo para una variedad de capacidades cognitivas básicas. El actual trabajo con esta orientación se justifica por varias razones. En primer lugar, la Inteligencia Artificial cognitivista y la neurociencia tuvieron algunos resultados convincentes en la justificación o reconstrucción de algunos de los comportamientos cognitivos que acabo de describir. En segundo lugar, estos modelos son bastante cercanos a los sistemas biológicos, lo que significa que uno puede trabajar con un grado de integración entre Inteligencia Artificial y neurociencia que hasta ahora era impensable. Finalmente, los modelos son lo suficientemente generales como para aplicarse, con muy pocas modificaciones a una variedad de áreas.

Resumen de la doctrina

Esta orientación alternativa —conexionista, emergente, auto- organizativa, asociativa y basada en la dinámica de redes— es reciente y variada. La mayoría de quienes se identificarían con ella tienen puntos de vista muy distintos acerca de lo que constituye la ciencia cognitiva y también acerca de su futuro. Con esta salvedad en mente, las siguientes son las respuestas de la postura alternativa a las preguntas anteriores:

28 La idea se debe a D. Rumelhart, G. Hinton y R. Williams, en: Rumelhart and McClelland,

op cit., Cap. 8.

25 T. Sejnowski y C. Rosenbaum, 'Nettalk: A parallel network that learns to read aloud' TR JHU/EEC-86/01, John Hopkins University.

Pregunta 1: ¿Que es cognición?

Respuesta: La emergencia de estados globales en una red de

componentes simples.

Pregunta 2: ¿Cómo funciona?

Respuesta: A través de normas locales para el funcionamiento

individual y normas para los cambios en la conectividad entre los elementos.

Pregunta 3: ¿Cómo se sabe cuándo un sistema cognitivo está

funcionando adecuadamente?

Respuesta: Cuando puede verse que las propiedades emer-

gentes (y la estructura resultante), pueden corres- ponder a una capacidad cognitiva específica: el éxito en la solución para una tarea requerida.

Abandono de los símbolos

Uno de los aspectos más interesantes de este enfoque alternativo de la ciencia cognitiva es que los símbolos, en su sentido más con- vencional, no cumplen ninguna función. Esto implica un distan- ciamiento radical del principio cognitivo básico: la estructura física de los símbolos, su forma, está separada para siempre de lo que representan, su significado. Esta separación entre forma y significado fue el golpe maestro que creó el enfoque computacional, pero también implica una debilidad cuando se abordan los fenómenos cognitivos a un nivel más profundo. ¿Cómo adquieren los símbolos su significado? ¿De dónde viene esta actividad adicional que, por interpretación, no está en el sistema cognitivo?

En situaciones en las que el universo de ítemes susceptibles de ser representados es finito y está claramente definido (como por ejemplo cuando una computadora está siendo programada o cuando se está realizando un experimento con un conjunto de estímulos vi- suales predefinidos), la asignación de significados es clara. Cada ítem físico discreto dentro del sistema cognitivo es asignado a un ítem

externo (su significado referencial), una operación cartográfica que el observador proporciona fácilmente. Si se eliminan estas restric- ciones, todo lo que queda es la forma del símbolo y el significado pasa a ser un fantasma, como si contempláramos patrones de bits en un computador cuyo manual de operaciones se hubiera perdido.

En el enfoque conexionista, el significado está vinculado al desempeño general (ya sea en el reconocimiento o el aprendizaje). Por ende, el significado se relaciona con el estado global del sistema y no se radica en un símbolo o símbolos particulares. La distinción forma/significado a nivel simbólico desaparece, y reaparece con una vestimenta diferente: el observador proporciona la correspondencia entre el estado global del sistema y el mundo al que se supone maneja. Esta es, entonces, una manera radicalmente diferente de trabajar con las representaciones. Volveremos a este tema más adelante.