Case Study - Soft Systems Methodology (SSM)

Chapter 2: Soft Systems Methodology (SSM)

2.6 Case Study

Sea unperceptr´onmulticapa conC capas (C-2 capas ocultas) yncneuronas en la capac, para

c= 1,2, ...C.Sea adem´asWc=w_i,jc la matriz de pesos asociada a las conexiones de la capa

c a la capa c+ 1 para c = 1,2, ..., C−1, donde wc_i,j representa el peso de la conexi´on de la neuronaide la capac a la neuronaj de la capac+ 1; y seaUc= (uc_i) el vector de umbrales de las neuronas de la capacparac= 2, ..., C. Se denota ac

i a la activaci´on de la neuronaide la capac, estas activaciones se calculan del siguiente modo:

• Para la activaci´on de las neuronas de la capa de entrada a1_i:

a1_i =xi (2.5)

para i= 1,2, ..., n1

donde X = (x1, x2, ..., xn1) representa el vector o patr´on de entrada a la red. Las

neuronas de la capa de entrada se encargan de transmitir hacia la red las se˜nales recibidas

DE CIENCIAS

FISICAS

• Para la activaci´on de las neuronas de la capa oculta c(ac_i): ac_i =f   nc−1 X j=1 w_jic−1ac_j−1+uc_i   (2.6) para i= 1,2, ..., nc yc= 2,3..., C−1

donde ac_j−1 son las activaciones de las neuronas de la capa c−1. Las neuronas ocultas de la red procesan la información recibida aplicando la función de activaciónf a la suma de los productos de las activaciones que reciben por sus correspondientes pesos.

• Para la activaci´on de las neuronas de la capa de salida aC i : yi=aCi =f   nC−1 X j=1 w_jiC−1aC_j−1+uC_i   (2.7) para i= 1,2, ..., nC

dondeY = (y1, y2, ..., ynC) es el vector salida de la red. Al igual que en el caso anterior, la activación de estos elementos de neuronas viene dada por la función de activación f

aplicada a la suma de los productos de las entradas que recibe, multiplicadas por sus pesos asociados:

La funciónf es la llamadafunción de activación. Para el perceptrón multicapa, las funciones de activación más utilizadas son la función sigmoidal y la función tangente hiperbólica como se muestra en la imagen 2.25. Dichas funciones poseen como imagen un rango continuo de valores dentro de los intervalos [0,1] y [-1,1], respectivamente, y vienen dadas por las siguientes expresiones:

• Funci´on sigmoidal:

f1(x) =

1 +e−x (2.8)

• Funci´on tangente hiperb´olica:

f2(x) = 1−e−x 1 +e−x (2.9)

DE CIENCIAS

FISICAS

Y MATEMATICAS

Figura 2.25: Funciones de activaci´on del perceptron multicapa.

Ambas son funciones crecientes con dos niveles de saturación: el máximo,que proporciona salida 1, y el m´ınimo que proporciona salida 0, para la función sigmoidal, y -1, para la tangente hiperbólica. Generalmente la función de activación del perceptrón multicapa es común a todos los elementos de procesado de la red. Su elección se realiza únicamente basándose en los valores de activación que se desea alcancen los elementos de procesado (neuronas). Ambas funciones están relacionadas mediante la expresiónf2(x) = 2f1(x)−1.

En ocasiones y dependiendo de la naturaleza del problema la función de activación de las neuronas de la capa de salida podr´ıa ser una función distinta de las que acabamos de discutir, utilizando otro tipo de función de activación. En este caso, las más usadas son la función identidad y la función escalón.

De las ecuaciones 2.5, 2.6, 2.7, se observa que el patrón multicapa define, a través de sus conexiones y neuronas, una función continua no lineal del espacio<nl _{espacio de patrones de}

entrada al espacio<nc _{espacio de patrones de salida}_{. Se puede escribir, por tanto que:}

Y =F(X, W)

DondeY es el vector formado por las salidas de la red, Xes el vector de entrada a la red.

W es el conjunto de todos los par´ametros de la red (pesos y umbrales) y F es una funci´on continua no lineal.

2.5.3.3 Dise˜no de la red neuronal para el reconocimiento

Una red neuronal de tipo back propagation permite aprender mediante un conjunto de ejemplo (entrada – salida) com´unmente denominadotraining set. Al haber aprendido mediante este conjunto, se puede obtener una salida coherente para una entrada dada. En la Figura 2.26 es posible observar como se obtiene una salida a partir de la entrada. La red neuronal en este caso la vemos como una caja negra. En la Figura 2.28 se observa como es internamente una red neuronal, en este caso solo se observan dos capas, una de entrada y otra de salida, m´as

DE CIENCIAS

FISICAS

Figura 2.26: Vista de caja negra de una red neuronal. (Fuente:[Cal08b])

Como podemos apreciar, cada neurona de entrada, que posee un valor en el rango [0; 1], pasa ese valor a todas las neuronas de salida. Ese valor es multiplicado por el peso Wi,j representado por las aristas. El valor de Oj es igual al de una funci´on (denominada de transferencia) aplicada a la sumatoria de todos los productos definidos como Yj = Wi,jXj para elj de esa neurona de salida [Cal08b].

Figura 2.27: Vista interna de una red neuronal sin capas ocultas. (Fuente:[Cal08b])

En la Figura 2.28 podemos observar el proceso de entrenamiento tomando la red en forma de caja negra. Vemos que existe dos salidas: la que obtenemos mediante la red y la deseada. Al comparar ambas podemos observar cuan buena fue la predicción. El objetivo del proceso de entrenamiento es minimizar el error de la predicción y para ello, como se mencionó anteriormente, solo es posible modificar los pesos de la red.

Figura 2.28: Esquema de entrenamiento de una red neuronal. (Fuente:[Cal08b])

DE CIENCIAS

FISICAS

arbitraria como configuración inicial y luego se tiende a modificarlos de la mejor forma posible y luego se tiende a modificarlos de la mejor forma posible. Para ellos se utiliza la propagación del error hacia atrás mediante sus derivadas y es por ello que la red toma el nombre de back- propagation. Para el error obtenido se encuentra un vector ∆wque sumado al vector de pesos

W se obtiene una red que arroja un error más pequeño para esa entrada. Como es de esperar, si se corre para la misma entrada este proceso varias veces, el resultado final ser´ıa, siempre y cuando la configuración de la red lo permita, una red con error nulo para ese valor. Ese no es el objetivo, sino lo que se desea es entrenar la red con varias entradas y luego ver que sucede cuando ingresamos alguna que no estaba en el set de datos de entrenamiento.

In document Innovation of a design method (MoIST) that incorporates non traditional 'soft' systems science into traditional 'hard' information systems design (Page 38-42)