The Consistency Property - Sequence queries on temporal graphs

El objetivo de un modelo funcional es caracterizar las propiedades de las respuestas neuronales usando para ello un algoritmo de tratamiento de la información visual. Una vez observadas, analizadas y cuantificadas las tendencias de los datos, es posible empezar a especular acerca de las funciones que pueden ajustar un cierto conjunto de medidas.

Originalmente, muchos de los intentos por explicar los datos fisiológicos se redujeron a un filtrado lineal y un modelado estadístico de segundo orden (Linsker, 1988; Foldiak, 1990; Atick, 1992; van Hateren, 1992). Más recientemente, algunos autores han relacionado el filtrado lineal con las propiedades estadísticas de más alto orden (Olshausen y Field, 1996; Bell y Sejnowski, 1997). Otros han usado varias formas de tratamiento no-lineal, como, por ejemplo, un control divisivo de ganancia (Simoncelli y Schwartz, 1999; Schwartz y Simoncelli, 2001; van Hateren y Snippe, 2001; Zetzsche y Röhrbein, 2001).

La medida sistemática de las respuestas de las células simples en función del contraste y de la posición espacial, permite observar las siguientes características:

• La función de respuesta al contraste presenta una no-linealidad exponencial y se satura a partir de un cierto contraste. Además, las respuestas comienzan a crecer exponencialmente y se saturan a partir de los mismos contrastes, tanto para posiciones espaciales óptimas como subóptimas, si bien la magnitud de la respuesta es muy diferente para estos dos tipos de posiciones.

• Las células simples responden diferentemente según el sentido del movimiento del estímulo. Las respuestas se saturan a partir del mismo contraste para los dos sentidos del movimiento, si bien la amplitud de la respuesta es muy diferente según se trate del sentido óptimo o no.

• El grado de dependencia de las respuestas con el sentido del movimiento es función de la fase espacial y es mucho mayor de lo que se esperaría.

• La función de respuesta a la fase es aproximadamente sinusoidal, siendo más estrecha y “picuda” que la función seno.

• Aunque las respuestas dependen del sentido del movimiento, hay “posiciones de fase nula” en las que las respuestas se acercan a cero.

Estas características aparentemente dispares, pueden reunirse en un modelo funcional sencillo: un filtro espacial lineal, cuya ganancia depende de la magnitud global del contraste, seguido por un exponente expansivo sobre la respuesta (p.ej., Heeger, 1991, 1992a, 1992b; Albrecht y Geisler, 1991; Carandini y Heeger, 1994; Ferster, 1994; y pueden verse revisiones en Carandini et al., 1999; Geisler y Albrecht, 2000). En Albrecht et al. (2002), se muestran varios ejemplos de modelos funcionales.

Como ya hemos visto en el Apartado 3.2.1, mientras que los campos receptivos de las células simples se componen de una región excitadora y otra inhibidora, los de las células complejas no, caracterizándose únicamente por la forma en la que la respuesta depende de ciertos parámetros (orientación, frecuencia espacial, dirección de

movimiento, etc.). Como consecuencia de esto, las células complejas son localmente invariantes a la posición o fase. El comportamiento no-lineal de las células complejas puede explicarse utilizando un modelo multietapa de codificación dispersa adaptado a las imágenes naturales (Hyvärinen y Hoyer, 2000b). Es importante señalar que nada se ganaría poniendo varios modelos lineales uno detrás de otro, ya que al final tendríamos sólo otro modelo lineal. Para aumentar la capacidad descriptiva con un modelo jerárquico multietapa, es imprescindible algún tipo de no-linealidad. Hoyer y Hyvärinen (2002) construyeron un modelo jerárquico de dos etapas usando una no-linealidad semejante a la de las células complejas. Este modelo agrupa en “unidades de contorno” elementos orientados que recuerdan a funciones de Gabor.

La HCE (ver Apartado 3.3.2) ha llevado a numerosos investigadores a proponer modelos del procesamiento sensorial basados directamente en las propiedades estadísticas de las señales naturales. En la mayoría de estos modelos, se optimiza una base lineal de modo que las respuestas a imágenes naturales sean lo más estadísticamente independientes posible. Las funciones base que resultan de este tipo de descomposiciones de imágenes naturales, presentan propiedades similares a las de los campos receptivos de las células simples del córtex visual (Olshausen y Field, 1996, 1997; Bell y Sejnowski, 1997; van Hateren y van der Schaaf, 1998; Lewicki y Olshausen, 1999). Sin embargo, no hay que olvidar que las neuronas sensoriales son fuertemente no-lineales, incluso en las primeras etapas de procesamiento. En las últimas décadas, los experimentos fisiológicos han mostrado muchos comportamientos no- lineales de estas neuronas, entre los que están la rectificación y saturación de las repuestas, la supresión mediante máscaras no-óptimas y los cambios en la curva de respuesta según el valor de la señal. Los modelos lineales establecen un primer nexo entre la estadística de las imágenes naturales y el procesamiento neuronal. Sin embargo, las propiedades estadísticas de las imágenes naturales son demasiado complejas como para que una transformación lineal permita obtener un conjunto de componentes independientes. No obstante, las matemáticas asociadas a los modelos lineales son abordables, por lo que son un buen punto de partida para construir modelos probabilísticos de imágenes naturales. Es por esto que los modelos suelen partir de una etapa lineal.

Aunque los modelos lineales buscan conseguir independencia estadística, las respuestas resultantes en general no son completamente independientes, sino que presentan dependencias estadísticas no-lineales. Estas dependencias pueden reducirse significativamente usando un modelo no-lineal del procesamiento neuronal basado en la codificación eficiente de imágenes naturales, al mismo tiempo que se modelan algunos

de los comportamientos fisiológicos no-lineales observados en las neuronas visuales. Simoncelli y Schwartz (1999) mostraron que las dependencias estadísticas pueden eliminarse prácticamente, utilizando una forma de tratamiento no-lineal en la que las respuestas ci de la etapa lineal se elevan al cuadrado y después se dividen por una suma

ponderada de respuestas vecinas (en espacio, orientación y escala) elevadas al cuadrado, más una constante regularizadora 2:

i d

∑

+ = j j ij i i i c e d c r ₂ ₂ 2 (3.1)

Numerosos autores (Reichhardt y Poggio, 1979; Bonds, 1989; Geisler y Albrecht, 1992; Heeger, 1992a, 1992b; Carandini et al., 1997) han utilizado modelos basados en una “normalización divisiva” similar para explicar comportamientos no-lineales de las neuronas corticales. Este tipo de no-linealidad que encontramos en el procesamiento cortical, se ajusta bien a la estadística no-gaussiana de las imágenes naturales. Además, los parámetros de la normalización divisiva (la constante y los pesos eij) pueden

elegirse de forma que la independencia estadística entre las respuestas normalizadas ri

sea máxima. El modelo resultante es capaz de explicar sorprendentemente bien numerosas observaciones neurofisiológicas en las que las respuestas se atenúan en presencia de estímulos subóptimos tanto dentro como fuera del campo receptivo clásico (Simoncelli y Schwartz, 1999; Schwartz y Simoncelli, 2001; Wainwright et al., 2002). Schwartz y Simoncelli (2001) sostuvieron que el córtex utiliza sus conexiones laterales para eliminar dependencias mediante la normalización divisiva. Una hipótesis alternativa es considerar que las conexiones horizontales modelan directamente las dependencias que existen, en lugar de eliminarlas. Hay bastantes modelos computacionales para hacer segmentación de contornos basados en esta idea. Geisler et al. (2001) y Sigman et al. (2001) midieron la probabilidad de co-ocurrencia de filtros orientados sobre imágenes naturales y mostraron que estos siguen una estructura co- circular, esto es, que las unidades orientadas sobre una misma circunferencia están más correladas. Este tipo de dependencias podrían incorporarse a un modelo disperso y sobrecompleto, suponiendo una probabilidad a priori no-factorial para los coeficientes y adaptando el modelo a imágenes naturales (Olshausen, 1997).

In document Sequence queries on temporal graphs (Page 94-97)