Limitations of the study and recommendations for future research

5 Chapter : Conclusion and recommendations

5.4 Limitations of the study and recommendations for future research

Una Red Neuronal Artificial (RNA, o ANN por sus siglas en inglés) es un modelo matemático inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un est´ımulo de salida.

Las redes neuronales consisten en una simulación de las propiedades observadas en los sistemas neuronales biológicos a través de modelos matemáticos.

El cerebro puede considerarse un sistema altamente complejo. Su unidad básica, la neurona, está masivamente distribuida con conexiones entre ellas. En la figura 2.1 se muestra un esquema simplificado de una neurona biológica. Como muestra la figura, ésta está compuesta por:

• un cuerpo central o núcleo, llamado soma • una prolongación del soma, el axón • una ramificación terminal, las dendritas

Figura 2.1: Modelo simplificado de una neurona biol´ogica

La función principal de las neuronas es la transmición de los impulsos nerviosos. Estos viajan por toda la neurona comenzando por las dendritas hasta llegar a las ter- minaciones del axón, donde pasan a otra neurona por medio de la conexión sináptica. La manera en que respondemos ante los est´ımulos del mundo exterior y nuestro apren- dizaje del mismo está directamente relacionado con las conexiones neuronales del cerebro, y las ANN son un intento de emular este hecho.

Entonces, una red neuronal artificial es un sistema de procesamiento de información que tiene ciertas aptitudes en común con las redes neuronales biológicas:

(i) El procesamiento de informaci´on ocurre en muchos elementos simples, llamados neuronas.

(ii) Las señales son transferidas entre neuronas a través de enlaces de conexión. (iii) Cada conexión tiene un peso asociado, el cual, normalmente, multiplica a la señal transmitida.

(iv) Cada neurona aplica una funci´on de activaci´on (usualmente no lineal) a su entrada de red (suma de entradas pesadas) para determinar su salida.

Los códigos de redes neuronales artificiales son los más actuales en la determi- nación de los redshifts fotométricos. El método de ANN para estimar los redshift de las galaxias es una clasificación general y una herramienta de interpolación utilizado

Figura 2.2: Diagrama esquemático del funcionamiento de una red neuronal artificial para el cómputo de loszphot. pi representa a los parámetros fotométricos de entrada,

zphot par´ametros de salida.

con ´exito en una variedad de campos.

Estas técnicas necesitan un conjunto de galaxias con redshift espectroscópico, el cual es llamado “conjunto de entrenamiento” y es utilizado para entrenar la red. Es- tas técnicas son utilizadas cuando un conjunto de entrenamiento representativo está disponible, entonces los métodos de entrenamiento se vuelven una opción viable para usar en lugar de los métodos de ajustes de espectros sintéticos (templates).

El principio básico de los métodos de entrenamiento es la derivación de una parametrización del redshift a través de las magnitudes de las galaxias en un conjunto de entrenamiento. Esta parametrización se aplica a las galaxias que no tienen información espectroscópica disponible, dando una estimación del redshift fotométrico. Estas técnicas fueron utilizadas por Collister & Lahav (2004), Collister et al. (2007), Banerji et al. (2008), Oyaizu et al. (2008) , Abdalla et al. (2008) y O’Mill et al. (2010).

Las redes neuronales artificiales se componen de varias capas, cada una compuesta por diferentes nodos, figura 2.2. La primera capa recibe las entradas (magnitudes de

galaxias por ejemplo), mientras que la última capa, la salida, arroja las determina- ciones de los redshift fotométricos. Las capas en el medio, llamadas capas ocultas, no tienen un número fijo, es decir, pueden consistir en cualquier número de nodos. Los nodos están interconectados de manera que un nodo en una capa dada está conectado a todos los nodos de las capas adyacentes. Cada conexión lleva un peso wij, donde

i y j describen los dos nodos. Cada nodo i se le asigna un valor ui y una funci´on

llamada de activaci´on, usualmente una funci´on sigmoide: gi(ui):

gi(ui) =

1 1 +exp(−ui)

esta funci´on de activaci´on es evaluada.

El valor de un nodo subsecuente j es luego calculado como la suma de los valores pesados valuados en la función activación de todos los nodos i que van a él:

ui =

wijgi(ui)

Cuando la red es entrenada, los pesos para todos los nodos conectados son deter- minados por una minimizaci´on de la funci´on costo E evaluada en el conjunto de entrenamiento de las galaxias donde:

E =X

(zphot(w, mk)−zspec,k)2,

mk es la entrada fotom´etrica para la galaxia k, w los pesos, zspec,k el redshift espec-

trosc´opico de la galaxiaky zphot(w, mk) es la salida para una entrada dada y un dado

peso. La suma es sobre todas las galaxias en el conjunto de entrenamiento.

Las ANN tienen la propiedad que con 1 capa oculta se puede ajustar de manera exacta una función continua, y con 2 capas ocultas se puede ajustar cualquier función. Para evitar un exceso de ajuste, cada red es testeada en un conjunto de validación de galaxias, cuyos redshift espectroscópicos son conocidos. La red con el menor valor deE, calculado en el conjunto de validación, es seleccionada y la muestra fotométrica se corre a través de él para la estimación de los redshifts (Collister & Lahav 2004).

In document The impact of job demands and job resources on work engagement and turnover intentions within the information technology division of a South African bank (Page 159-200)