ANFIS (de sus sigl´as en ingl´es de Adaptative Neuro Fuzzy Inference System) es un m´etodo que permite sintonizar o crear la base de las reglas de un sistema difuso, utilizan- do el algoritmo de entrenamiento de retro-propagaci ´on a partir de la recopilaci ´on de datos de un proceso. Su arquitectura es funcionalmente equivalente a una base de reglas de tipo Sugeno.
En 1993 J. R. Jang desarroll ´o un nuevo modelo para combinar reglas de razonamiento difuso. Esta nueva combinaci ´on se puede simular con base en redes neuronales. Un sis- tema de razonamiento difuso planteado como una red de tipo neuronal y dise ˜nado con la capacidad de aprendizaje de dicha red recibe el nombre de ANFIS [35].
Un modelo ANFIS es un modelo h´ıbrido donde las reglas se aplican siguiendo una estructura de red tipo neuronal que puede ser interpretada como una red neuronal con par´ametros difusos o como un sistema difuso con par´ametros o funcionamiento distribui- do.
Las capacidades adaptivas de las redes ANFIS las hacen directamente aplicables a una gran cantidad de ´areas como la sintonizaci ´on automatizada de los controladores difu- sos, en el modelado donde se necesita explicar datos pasados y predecir datos futuros, en control adaptativo, en procesamiento y filtrado de se ˜nales, en clasificaci ´on de datos y extracci ´on de caracter´ısticas a partir de ejemplos, entre otros.
ANFIS es una red adaptiva. Este tipo de red es aquella direccionada hacia adelante (feedforward) que consiste en nodos y enlaces direccionales. Los nodos son adaptivos si sus salidas dependen, no s ´olo de sus entradas, sino tambi´en de par´ametros modificables de la funci ´on interna del nodo. Una red adaptiva tiene alguno o todos sus nodos adap- tivos, es decir, que la salida de los mismos depende de los par´ametros que pertenecen a ´este y la regla de aprendizaje espec´ıfica que debe cambiar en los par´ametros para mini- mizar la medida de error. El conjunto de par´ametros de una red adaptiva es la uni ´on de los conjuntos de par´ametros de cada nodo adaptivo. Para conseguir una relaci ´on entrada– salida, los par´ametros de la red se determinan con base en datos de entrada que se de- nominan datos de entrenamiento dentro de un proceso de aprendizaje.
La regla b´asica de aprendizaje de las redes adaptivas se basa en un proceso de op- timizaci ´on generalmente del tipo de gradiente descendente y la regla de la cadena para propagar el error hacia las capas internas de la red.
Un sistema ANFIS engloba las mejores caracter´ısticas de los sistemas difusos y de las redes neuronales. De los primeros utiliza la representaci ´on d el conocimiento previo en un conjunto de restricciones (que se representan en la topolog´ıa de la red) para reducir el espacio de b ´usqueda de optimizaci ´on, mientras que de las redes neuronales emplean la adaptaci ´on de propagaci ´on inversa a la red estructurada para automatizar el ajuste de los
2. Sistemas Neurodifusos 24 par´ametros.
La parte de la premisa de una regla define un subespacio difuso, mientras que el con- secuente especifica la salida dentro de ese subespacio.
La estructura de los sistemas ANFIS permite utilizar m´etodos cualitativos y cuantita- tivos en la construcci ´on de modelos. Adem´as permite integrar, a la informaci ´on inclui- da dentro de un conjunto de datos, el conocimiento de expertos expresados en forma ling ¨u´ıstica y a trav´es de la teor´ıa de conjuntos difusos, expresados con base en funciones de pertenencia. Con esto se involucra todo el conocimiento disponible.
2.3.1.
Arquitectura de un modelo ANFIS
Este sistema h´ıbrido neurodifuso es funcionalmente equivalente al mecanismo de in- ferencia TS. Para este sistema de inferencia de primer orden hay un conjunto de reglas difusas SI–ENTONCES en las que los niveles de activaci ´on se calculan utilizando el o- perador AND que puede modelarse por una t-norma continua (producto). Las salidas individuales de cada regla se obtienen como una combinaci ´on lineal entre los par´ametros del antecedente de cada regla. La salida de control del modelo se obtiene por la normali- zaci ´on de los grados de activaci ´on de las reglas multiplicado por la salida individual de cada regla [31].
Este tipo de inferencia se representa por medio de una red neuronal h´ıbrida adapta- ble con 5 capas. Cada capa representa una operaci ´on del mecanismo de inferencia difusa. Todos los nodos de una misma capa tienen la misma funci ´on (los nodos que est´an repre- sentados como cuadrados en la figura son los adaptables, sus par´ametros son ajustables), como se muestra en la Figura 2.5.
Figura 2.5: Arquitectura ANFIS [87].
Partimos de la suposici ´on de que el sistema de inferencia difusa tiene dos entradas (x
2. Sistemas Neurodifusos 25 tipo Takagi–Sugeno:
Regla 1: SixesA1 yyesB1, entoncesz1 =p1x+q1y+r1 Regla 2: SixesA2 yyesB2,
entoncesz2 =p2x+q2y+r2
Las cinco capas de la estructura de la red ANFIS son las siguientes:
Capa 1:Las entradas se corresponden con las entradas al sistema (xey) y la salida es el grado de pertenencia para el cual la variable de entrada satisface el t´ermino ling ¨u´ıstico
Aiasociado al nodo.
´esta es una de las dos capas que tienen par´ametros ajustables, como se ha dicho antes, en este caso, los par´ametros son los que representan las particiones difusas usadas en las reglas, es decir, se corresponden con los par´ametros de las funciones de pertenencia de las entradas.
Como funci ´on de pertenencia se suele elegir una de las que tienen forma de campana con valor m´aximo en 1 y m´ınimo en 0.
O1i =Ai(x) (2.5)
Capa 2:Cada nodo calcula el grado de activaci ´on de la regla asociada al mismo. Ambos nodos est´an representados por T en el dibujo porque pueden representar cualquier T– norma para modelar la operaci ´on l ´ogica AND. Se suelen conocer como nodos de reglas.
El grado de activaci ´on de la regla se obtiene multiplicando las se ˜nales de entrada (sali- da de los nodos de la capa 1), aunque puede utilizarse un operador T- norma para calcu- larlo.
Oi2 =wi =Ai(x)·Bi(y), i= 1,2, . . . (2.6)
Capa 3:Cada nodo de la capa 3 est´a representado porN en el dibujo de forma que se indica la normalizaci ´on de los grados de activaci ´on. Su salida es el grado de activaci ´on normalizado (respecto a la suma de los grados de activaci ´on) de la reglai. Cada nodo se corresponde con una de las reglas que se han introducido en el sistema.
O3
i = ¯wi =
wi
w1+w2
, i= 1,2, . . . (2.7)
Capa 4: La salida de los nodos se corresponde con el producto entre el grado de acti- vaci ´on normalizado (salida de la capa 3) por la salida individual de cada regla (calculada por los nodos de esta capa).
O4
2. Sistemas Neurodifusos 26
pi, qi, ri forman el conjunto de par´ametros. Los par´ametros de esta capa se conocen
como par´ametros del consecuente. Esos par´ametros, son los coeficientes de las funciones lineales que forman el consecuente de las reglas. Son par´ametros ajustables, como los de la capa 1 [31].
Capa 5:Tiene un ´unico nodo que calcula la salida total del sistema (agregaci ´on) como la suma de todas sus se ˜nales de entradas individuales.
O5 =z0 = ¯wiz1+ ¯w2z2 (2.9)
En resumen, cada una de las capas tiene una misi ´on concreta dentro del sistema:
La primera capa representa la capa de pertenencia.
La segunda capa se usa para generar el grado de disparo de la regla (T- norma). La tercera capa act ´ua de normalizador.
La cuarta capa calcula la salida
La ´ultima capa combina todas las salidas en una en su ´unico nodo.
2.3.2.
Aprendizaje ANFIS
En un modelo ANFIS hay que entrenar los par´ametros de los del antecedente (cons- tantes que caracterizan las funciones de pertenencia) y par´ametros del consecuente (coe- ficientes de las funciones lineales del consecuente de las reglas). Los enlaces entre nodos s ´olo indican la direcci ´on en la que fluyen las se ˜nales, no tienen pesos asociados. Los algo- ritmos de aprendizaje que suelen emplearse son de gradiente descendente para optimizar los par´ametros del antecedente y el algoritmo de m´ınimos cuadrados para determinar los par´ametros lineales del consecuente, debido a esta combinaci ´on, la regla de aprendizaje se conoce como “regla de aprendizaje h´ıbrido”.
El proceso de aprendizaje del ANFIS intenta desplazar los valores de los par´ametros de las funciones de pertenencia de forma proporcional a la derivada del error respecto a ese par´ametro (gradiente descendente). Esto lo hace calculando la suma de los erro- res cuadr´aticos medios (diferencia entre la salida deseada y la salida de la red). Utiliza el gradiente de ese error (indica hacia donde se produce el mayor incremento del error), en negativo, para minimizar el error. Para conseguirlo, multiplica cada par´ametro del an- tecedente por un valor proporcional al gradiente respecto de ese par´ametro de entrada (en negativo). Ese valor proporcional es lo que se conoce como factor de aprendizaje. Con eso se van ajustando los par´ametros del antecedente de forma que se va reduciendo el error producido por el sistema ANFIS. El problema principal es que cuando el gradiente del error es muy peque ˜no hacen falta muchas iteraciones para disminuir el error [31].
Cap´ıtulo 3
Desarrollo del Sistema Neurodifuso
En el presente cap´ıtulo se describir´an las caracter´ısticas principales del sistema neuro- difuso que se propone para la conformaci ´on de portafolios de inversi ´on. Para seleccionar un portafolio de inversi ´on, se realizar´a un an´alisis del comportamiento pasado de las co- tizaciones de las acciones, para predecir los precios futuros y en base a esto, obtener los pesos del portafolio. A continuaci ´on se presenta una descripci ´on general del sistema.
3.1.
Selecci ´on de activos
Para este estudio los activos que se considerar´an para conformar el portafolio de in- versi ´on ser´an acciones que cotizan en la Bolsa Mexicana de Valores.
La selecci ´on de las acciones se har´a considerando la bursatilidad1de las mismas (bur- satilidad alta) y de aquellas que presenten el mejor rendimiento. El rendimiento de un activo estar´a dado por:
ri =
Pf −Pi
Pi
(3.1)
dondePi y Pf son los precios al cierre inicial y final, respectivamente, de la j-´esima ac-
ci ´on. Del medio ambiente (Mercado Accionario) se obtendr´an los precios hist ´oricos de las acciones que conformar´an el portafolio. Al seleccionar los activos de esta forma, estamos optimizando el rendimiento del portafolio de manera indirecta.
1La bursatilidad es un indicador que considera el desempe ˜no, durante los ´ultimos 6 meses, de una acci ´on
determinada en el mercado accionario, y nos sirve para identificar el grado de liquidez que tienen dichas acciones. Por su grado de Bursatilidad, las acciones se pueden clasificar como de Alta, Media, Baja y M´ınima.