PROGRAM ACTIVITY REPORT
AL, SUSPENSION, AND REDUCTION: ORDER IN
En las secciones anteriores, se han introducido importantes modificaciones sobre los modelos conexionistas considerados; ello implica, que las aproximaciones tradicionales para la especificación de cada tipo de modelo ya no son válidas. En esta sección, se presentan una propuesta de especificación para cada uno de los sistemas conexionistas considerados.
La propuesta presentada se basa en una adaptación de las metodologías desarrolladas por Teräsvirta (1994), Terasvirta et al. (1993) y Anders y Korn (1999). El proceso de comparación entre modelos se realiza mediante la prueba del radio de verosimilitud.
2.6.1 Prueba del radio de verosimilitud
En la literatura propia del área de la inteligencia computacional, la comparación entre modelos suele ser realizada a través del uso de medidas del error de ajuste, tal como el error cuadrático medio. Esto es impropio, ya que el simple hecho de agregar parámetros a un modelo hace que el error de ajuste disminuya así sea infinitesimalmente; y a que no se tiene en cuenta el error de varianza introducido al aumentar el número total de parámetros del modelo considerado.
En el caso particular de las redes neuronales artificiales del tipo perceptrón multicapa, Anders y Korn (1999) sugieren que estrategias más apropiadas deben estar basadas en pruebas de hipótesis sobre los parámetros del modelo, tal como se suele realizar en los modelos estadísticos. En este sentido, los contrastes de:
• Wald
• Multiplicador de Lagrange • Radio de verosimilitud
aplican para los modelos considerados en este capítulo, ya que sus parámetros son estimados a partir del principio de máxima verosimilitud. Es sabido que estos resultados son válidos cuando el modelo en cuestión no tiene parámetros redundantes. Este aspecto es discutido por Fukumizu (2003) para el caso de los modelos de redes neuronales. También es sabido que los tres contrastes anteriores son equivalentes asintóticamente cuando la muestra tiende a infinito; no obstante, es poco lo que se sabe cuando la muestra de datos es pequeña, por lo que los resultados obtenidos usando cada contraste podrían variar significativamente para un mismo caso.
Las estrategias de especificación utilizadas en esta tesis se basan profundamente en el uso del contraste del radio de verosimilitud. Ello se debe a que:
• Todas las estrategias se basan en un algoritmo constructivo donde se parte de un modelo simple cuya complejidad va aumentando. Ello evita a que se consideren modelos con parámetros irrelevantes.
• El contraste parte de considerar un modelo libre y un modelo restringido – que se obtiene al imponer algunas restricciones sobre los parámetros del modelo libre–, los cuales deben ser estimados antes de realizar la prueba. Por lo tanto, no se parte de una aproximación a uno de los modelos, tal como ocurre en el contraste de Wald o el Multiplicador de Lagrange.
2.6.2 ANFIS
La estrategia de especificación de ANFIS para el caso univariado es la siguiente:
1. Se obtiene el orden óptimo P de un modelo AR, usando un criterio de información como el de Akaike (1973), Hannan y Quinn (1979) o Schwarz (1978).
2. Se realiza una prueba de contraste para determinar si un modelo STR (Teräsvirta, 1994) puede representar mejor la dinámica de la serie versus el modelo lineal obtenido en el paso anterior. Si se acepta la hipótesis nula favoreciendo la alternativa lineal se detiene el proceso, de lo contrario se continua con el próximo paso. Aquí se realiza una prueba formal para demostrar la no linealidad de la serie de precios analizada.
3. Se determina el tipo de función de transición (logística o exponencial), y la variable de decisión tal como es descrito por Teräsvirta (1994). Se procede a estimar el modelo especificado.
4. A partir del modelo STR obtenido en el paso anterior, se estima un modelo ANFIS homocedástico. 5. Se determina si ANFIS (modelo libre) tiene un ajuste estadísticamente significativo a la serie en comparación con el modelo STR (restringido) usando el contraste del radio de verosimilitud. Si se acepta la hipótesis nula, ambos modelos no son significativamente diferentes, por lo que se selecciona el modelo STR; en caso contrario, se selecciona ANFIS.
6. Se realizan las pruebas de bondad del ajuste para determinar si los residuales normalizados del modelo seleccionado en el paso anterior son normales, incorrelacionados y homocedásticos. La presencia de ARCH es determinada usando el contraste de Engle (1982).
7. Si se comprueba la presencia de ARCH se continua con el paso 8; en caso contrario se va al paso 9.
8. Se especifica un proceso ARCH para representar la estructura en la dinámica de los residuales, y se estima nuevamente el modelo obtenido. Se retorna al paso 6.
9. Se verifica la existencia de observaciones atípicas y cambios estructurales en los residuales normalizados del modelo. Si estos existen se procede a su modelado según se indicó anteriormente; en caso contrario, el modelo está completamente especificado.
2.6.3 Modelos de redes neuronales artificiales
El algoritmo usado para la especificación del modelo de redes neuronales está conformado por los siguientes pasos:
1. Se obtiene el orden óptimo P de un modelo AR, usando un criterio de información como el de Akaike (1973), Hannan y Quinn (1979) o Schwarz (1978); se estima el modelo AR(P).
2. Se agrega la primera neurona al modelo, y se estima el modelo AR-MLP (H =1) obtenido. Se aplica el contraste del radio de verosimilitud; si los modelos no son significativamente diferentes –en el sentido estadístico–, se favorece el modelo AR y se procede al paso 4; en caso contrario, se continua con el paso siguiente.
3. Se agrega una nueva neurona tentativa (H + 1) al modelo actual (H) y se estima el modelo así obtenido. Si ambos modelos son significativamente diferentes, se repite este paso nuevamente; en caso contrario, el modelo seleccionado tiene H neuronas en la capa oculta.
4. Se realizan las pruebas de bondad del ajuste para determinar si los residuales normalizados del modelo seleccionado en el paso anterior son normales, incorrelacionados y homocedásticos. La presencia de ARCH es determinada usando el contraste de Engle (1982).
5. Si se comprueba la presencia de ARCH se continua con el paso 6; en caso contrario se va al paso 7.
6. Se especifica un proceso ARCH para representar la estructura en la dinámica de los residuales, y se estima nuevamente el modelo obtenido. Se retorna al paso 4.
7. Se verifica la existencia de observaciones atípicas y cambios estructurales en los residuales normalizados del modelo. Si estos existen se procede a su modelado según se indicó anteriormente; en caso contrario, el modelo está completamente especificado.
Como una consideración final, los parámetros βh deben ser diferentes de cero ya que todas las
neuronas ocultas son requeridas; no obstante, el parámetro β∗puede ser cero, situación que puede ser
verificada usando nuevamente el contraste LR o el criterio de información utilizado.