5 Chapter : Conclusion and recommendations
5.4 Limitations of the study and recommendations for future research
Una Red Neuronal Artificial (RNA, o ANN por sus siglas en ingl´es) es un modelo matem´atico inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexi´on de neuronas en una red que colabora para producir un est´ımulo de salida.
Las redes neuronales consisten en una simulaci´on de las propiedades observadas en los sistemas neuronales biol´ogicos a trav´es de modelos matem´aticos.
El cerebro puede considerarse un sistema altamente complejo. Su unidad b´asica, la neurona, est´a masivamente distribuida con conexiones entre ellas. En la figura 2.1 se muestra un esquema simplificado de una neurona biol´ogica. Como muestra la figura, ´esta est´a compuesta por:
• un cuerpo central o n´ucleo, llamado soma • una prolongaci´on del soma, el ax´on • una ramificaci´on terminal, las dendritas
Figura 2.1: Modelo simplificado de una neurona biol´ogica
La funci´on principal de las neuronas es la transmici´on de los impulsos nerviosos. Estos viajan por toda la neurona comenzando por las dendritas hasta llegar a las ter- minaciones del ax´on, donde pasan a otra neurona por medio de la conexi´on sin´aptica. La manera en que respondemos ante los est´ımulos del mundo exterior y nuestro apren- dizaje del mismo est´a directamente relacionado con las conexiones neuronales del cerebro, y las ANN son un intento de emular este hecho.
Entonces, una red neuronal artificial es un sistema de procesamiento de informaci´on que tiene ciertas aptitudes en com´un con las redes neuronales biol´ogicas:
(i) El procesamiento de informaci´on ocurre en muchos elementos simples, llamados neuronas.
(ii) Las se˜nales son transferidas entre neuronas a trav´es de enlaces de conexi´on. (iii) Cada conexi´on tiene un peso asociado, el cual, normalmente, multiplica a la se˜nal transmitida.
(iv) Cada neurona aplica una funci´on de activaci´on (usualmente no lineal) a su en- trada de red (suma de entradas pesadas) para determinar su salida.
Los c´odigos de redes neuronales artificiales son los m´as actuales en la determi- naci´on de los redshifts fotom´etricos. El m´etodo de ANN para estimar los redshift de las galaxias es una clasificaci´on general y una herramienta de interpolaci´on utilizado
Figura 2.2: Diagrama esquem´atico del funcionamiento de una red neuronal artificial para el c´omputo de loszphot. pi representa a los par´ametros fotom´etricos de entrada,
zphot par´ametros de salida.
con ´exito en una variedad de campos.
Estas t´ecnicas necesitan un conjunto de galaxias con redshift espectrosc´opico, el cual es llamado “conjunto de entrenamiento” y es utilizado para entrenar la red. Es- tas t´ecnicas son utilizadas cuando un conjunto de entrenamiento representativo est´a disponible, entonces los m´etodos de entrenamiento se vuelven una opci´on viable para usar en lugar de los m´etodos de ajustes de espectros sint´eticos (templates).
El principio b´asico de los m´etodos de entrenamiento es la derivaci´on de una parametrizaci´on del redshift a trav´es de las magnitudes de las galaxias en un conjunto de entre- namiento. Esta parametrizaci´on se aplica a las galaxias que no tienen informaci´on espectrosc´opica disponible, dando una estimaci´on del redshift fotom´etrico. Estas t´ecnicas fueron utilizadas por Collister & Lahav (2004), Collister et al. (2007), Banerji et al. (2008), Oyaizu et al. (2008) , Abdalla et al. (2008) y O’Mill et al. (2010).
Las redes neuronales artificiales se componen de varias capas, cada una compuesta por diferentes nodos, figura 2.2. La primera capa recibe las entradas (magnitudes de
galaxias por ejemplo), mientras que la ´ultima capa, la salida, arroja las determina- ciones de los redshift fotom´etricos. Las capas en el medio, llamadas capas ocultas, no tienen un n´umero fijo, es decir, pueden consistir en cualquier n´umero de nodos. Los nodos est´an interconectados de manera que un nodo en una capa dada est´a conectado a todos los nodos de las capas adyacentes. Cada conexi´on lleva un peso wij, donde
i y j describen los dos nodos. Cada nodo i se le asigna un valor ui y una funci´on
llamada de activaci´on, usualmente una funci´on sigmoide: gi(ui):
gi(ui) =
1 1 +exp(−ui)
esta funci´on de activaci´on es evaluada.
El valor de un nodo subsecuente j es luego calculado como la suma de los valores pesados valuados en la funci´on activaci´on de todos los nodos i que van a ´el:
ui =
X
i
wijgi(ui)
.
Cuando la red es entrenada, los pesos para todos los nodos conectados son deter- minados por una minimizaci´on de la funci´on costo E evaluada en el conjunto de entrenamiento de las galaxias donde:
E =X
k
(zphot(w, mk)−zspec,k)2,
mk es la entrada fotom´etrica para la galaxia k, w los pesos, zspec,k el redshift espec-
trosc´opico de la galaxiaky zphot(w, mk) es la salida para una entrada dada y un dado
peso. La suma es sobre todas las galaxias en el conjunto de entrenamiento.
Las ANN tienen la propiedad que con 1 capa oculta se puede ajustar de manera exacta una funci´on continua, y con 2 capas ocultas se puede ajustar cualquier funci´on. Para evitar un exceso de ajuste, cada red es testeada en un conjunto de validaci´on de galaxias, cuyos redshift espectrosc´opicos son conocidos. La red con el menor valor deE, calculado en el conjunto de validaci´on, es seleccionada y la muestra fotom´etrica se corre a trav´es de ´el para la estimaci´on de los redshifts (Collister & Lahav 2004).