• No results found

3. Background: Vehicle Design Process

3.3 Components & Integration

3.3.1 A123 Systems Battery Pack

Para la construcción de la red neuronal se utilizó el programa Easy-NN-Plus V.10 (Easy Neural Network Plus, Versión 10), desarrollado por la firma Neural Planner Software.

ƒ Selección de las variables

Con el objetivo de eliminar el mayor ruido de fondo, y así conseguir una función óptima de aprendizaje, es conveniente hacer una selección de variables a incluir en la red neuronal. Asimismo, un uso indiscriminado de neuronas puede llevar a que la red memorice los datos de entrenamiento y pueda generalizar, es decir, no pueda dar respuesta adecuada cuando se le presentan nuevos datos (Pérez y Martín, 2003).

Teniendo en cuenta estos aspectos, se hizo una selección de las medidas del Test Barcelona, basándonos en las variables predictoras que presentan mayor

Método

discriminación entre los tres grupos diagnósticos estudiados. Así, diez subtest fueron escogidos como variables predictoras: orientación en tiempo, dígitos inversos, la memoria de textos tanto inmediata como diferida en evocación libre y preguntas, memoria visual, evocación categorial, abstracción verbal y clave de números. Además se incluyeron las variables sociodemográficas que evidenciaron una mayor influencia en el rendimiento cognitivo, la edad y los años de escolaridad.

ƒ Creación de distintas redes

Se crearon tres tipos de redes, a partir de la combinación de los tres grupos diagnósticos. En primer lugar, se diseñó una red con el objetivo de clasificar entre las tres categorías diagnósticas (controles, DCL y EA). En segundo lugar, con el objetivo de simplificar el problema de la categorización diagnóstica, se creó una red con la finalidad de clasificar entre sujetos controles y con deterioro cognitivo leve. En tercer lugar, el objetivo de la red era clasificar entre controles y pacientes con enfermedad de Alzheimer. No se incluyó la combinación de DCL y EA, debido a que se asume que son categorías diagnósticas con ciertas similitudes.

ƒ Validación del protocolo

La validación del protocolo es un procedimiento fundamental para verificar la habilidad del modelo de generalizar los resultados en la fase de test (Di Luca et al., 2005). Por tanto, además de la fase de entrenamiento de la red y se realizó una fase de validación.

En la fase de entrenamiento, la red neuronal “aprende” a asociar mediante ejemplos reales, los datos de entrada y salida ajustando los pesos de forma iterativa hasta llegar a una matriz de pesos óptima (Buscema et al., 2004). Por otro lado, la fase de validación se utiliza para evaluar la capacidad predictiva o de generalización de la red.

En este estudio en la fase de entrenamiento se incluyeron todos los sujetos de cada categoría diagnóstica. En la primera red, 522 sujetos (controles, DCL y EA), en la segunda 425 sujetos (controles y DCL) y en la tercera 443 sujetos (controles y EA). Para la fase de validación, se seleccionaron según criterio clínico 30 sujetos de cada grupo diagnóstico.

Método

ƒ Arquitectura de la red neuronal

En este trabajo se utilizó una arquitectura de Perceptrón Multicapa (MLP) entrenado con el algoritmo de retropropagación del error (Rumelhart y McClelland, 1986), que es el modelo de red más empleado en la clasificación de patrones y predicción de funciones (Sargent, 2001).

El MLP es un tipo de red con aprendizaje supervisado, es decir, recibe pares de patrones de entrada y salida que debe aprender, empleando un ciclo de retropropagación del error que consta de dos fases, la fase hacia delante y hacia atrás (Palmer et al., 2000). En este trabajo, la red debe aprender a relacionar los valores de las variables predictoras (de entrada) con el diagnóstico (variable de salida).

El aprendizaje de la neurona consiste en la modificación del vector de pesos, w, de modo que la salida sea la adecuada para la tarea considerada, en este caso el grupo diagnóstico. El algoritmo es iterativo, no calcula los pesos de una vez, sino que hay que aplicarlo repetidamente. La regla de modificación de pesos tiene la siguiente expresión matemática: j i ij p

w

=γδ

O

Δ

Donde:

wij = peso entre la neurona i y la neurona j δi = error de la neurona i

Oj = patrón de salida

Una vez presentados los patrones de entrenamiento, se actualizan los pesos, completándose un ciclo de aprendizaje o iteración (Palmer et al., 2000). Con este proceso se pretende minimizar la siguiente función de error:

2

)

(

2

/

1

k p k p k p

d

x

E=

Donde:

dpk = salida deseada de la neurona de salida k para el patrón p xpk = salida real de la neurona de salida k para el patrón p

Método

El modelo de cada neurona presenta una función de activación no lineal, logística (sigmoidal), expresada matemáticamente por:

)

exp(

1

1

)

(

bx

s

f

+

=

Se asignaron los valores de iniciales a los pesos de umbral y de conexión entre neuronas entre -0.5 y 0.5, procedimiento comúnmente utilizado (Palmer et al., 2000). Los parámetros de entrenamiento utilizados fueron los siguientes: momento (η) = 0.8 y el coeficiente de aprendizaje (ε) = 0.6. A priori, no se fijaron el número de ciclos de aprendizaje o iteraciones en la fase de entrenamiento de la red.

La arquitectura de la red neuronal de este trabajo estaba compuesta por tres capas: entrada, oculta y salida. La capa de entrada la formaban doce neuronas, diez correspondientes a los subtest seleccionados del test Barcelona, la edad y los años de escolaridad.

En cuanto a la capa oculta, en este estudio se decidió incluir una única capa. Ya que, debido al problema del sobreajuste se debe usar el mínimo número de neuronas ocultas con las cuales la red rinda de manera adecuada (Palmer et al., 2000). Así, evaluando el rendimiento de diferentes arquitecturas, se seleccionó una capa oculta compuesta por cuatro neuronas.

Por último, la capa de salida estaba formada por una única neurona, el grupo diagnóstico. En la primera red, esta variable de salida tenía tres posibles valores: 1) controles, 2) deterioro cognitivo leve y 3) enfermedad de Alzheimer. En la segunda, dos posibles valores: 1) controles y 2) DCL. Por último, en la tercera red 1) controles y 2) EA.

En este capítulo se presentan los resultados obtenidos. Se exponen en tres bloques, primero los resultados desde la Teoría Clásica de los Test, a continuación desde la perspectiva de Teoría de Respuesta al Ítem, y por último, la aproximación desde las redes neuronales artificiales. Debido a la cantidad de resultados obtenidos, gran parte de los mismos se presentan en los apéndices.

Nuevos datos normativos del Test

Related documents