• No results found

El modelo de Marais, Patell y Wolfson (1984) es uno de los pioneros en la utilización del “Algoritmo de Participaciones Iterativas o Recursivas (APR)”, que no está sujeto a algunas de las restricciones del análisis discriminante, como la normalidad de la distribución de probabilidad y la homocedasticidad. Frydman, Altman y Kao (1985) presentan a través de esta técnica un nivel de clasificación correcta de empresas fracasadas y sanas superior al del análisis discriminante.

Este método, basado en el desarrollo de un árbol de clasificaciones binarias (empresas sanas y fracasadas), que en cada nudo clasifica en dos grupos mediante una función univariante, con un ratio como variable independiente. Uno de los inconvenientes que presenta esta técnica es que no permite establecer comparaciones entre empresas que estén dentro del mismo grupo porque todas tienen la misma clasificación.

Marais et al. (1984) modeliza las calificaciones crediticias otorgadas por la sección de análisis de riesgos de un banco comercial a una serie de empresas utilizando el sistema de inducción CART y Probit. Frydman et al (1985) aplican análisis discriminante lineal y sistema CART para la predicción de quiebra, utilizando una muestra de empresas sanas y quebradas. El sistema CART les permite construir un árbol clasificador relativamente sencillo que supera a las funciones discriminantes.

Messier y Hansen (1988) emplean el algoritmo ID3 (Iterative Dichotomizer version 3; Quinlan, 1979) como sistema de inducción y el análisis discriminante para construir un árbol de decisión que pronostica situaciones de quiebra y de incapacidad de las empresas para devolver los préstamos bancarios. También, McKee (1995) en su trabajo sobre predicción del fracaso empresarial, para una muestra formada por sociedades que cotizan en Bolsa, arma árboles de clasificación que logran clasificar correctamente la mayor parte de las compañías. Delen et al (2013b) presentan un enfoque de árboles de decisión utilizando ratios económico financieros (CHAID, C5.0, QUEST y CART) para medir el desempeño de empresas. Los resultados de CHAID y C5.0 generan la mejor predicción.

En la figura 2.2 se presenta el árbol, extraído de Frydman, Altman y Kao (1985), que muestra cómo se clasifican las 200 empresas de la muestra, utilizando el análisis univariante como variable de corte:

Figura 2.2

200 firmas Flujo de fondos/Deuda Total

 0.1309  0.1309

68 firmas 132 firmas

Beneficios Retenidos/Activos Totales Deuda Total/ Activos Totales

 0.1453  0.1453  0.6975  0.6975 23 firmas 40 : 5 Flujo de Fondos/Ventas 5 : 117 4 : 6 B1 NB4 B3  0.025  0.025 9 : 4 0 : 10 B2 NB5

Fuente: Frydman, Altman y Kao (1985)

En el árbol de clasificación, presentado en la figura 2.2 se puede observar que en el mismo aparecen cinco nodos terminales, cuando en la parte inferior del nodo se encuentra la letra B,

significa una clasificación final de empresas quebradas y cuando aparece NB, una clasificación final de empresas sanas. Por ejemplo, el nodo terminal B1 clasificó 45 empresas como quebradas, cuando en realidad del grupo fueron 40 las fracasadas. En NB4, se clasifican 122 empresas sanas, cuando las mismas fueron 117. Siguiendo este razonamiento se encuentra que se clasifican mal 5 empresas quebradas y 5 sanas. Este árbol fue construido utilizando un conjunto de probabilidades a priori: probabilidad de quiebra

1=0.02 y probabilidad de no quiebra 2=0.98. Y asumiendo el coste de error de clasificación de empresas quebradas en sanas, c12= 50; y el costo de error de clasificación de empresas sanas en quebradas, c21= 1. Finalmente, si se suman la totalidad de empresas clasificadas en cada nodo final, se obtiene el total de la muestra que es de 200 empresas.

Los nodos terminales del árbol de clasificación están asignados a los grupos de tal forma que minimicen el coste esperado total de error de clasificación, el cual se expresa a partir del riesgo de restitución11. Si se considera un nodo terminal t, el cual tiene ni (t) objetos desde el grupo i y Ni es el tamaño de la muestra original para los i grupos que se encuentran en t, con i = 1, 2. Entonces, el riesgo de asignar el grupo 1, en el nodo t, es decir, R1(t)=c21.P(2,t)= c21.2.P(t/2)= c21.2. n2 (t)/N2; donde: P(2,t) es la probabilidad de que un objeto que pertenezca al grupo 2 se asigne en el grupo t y P(t/2) es la probabilidad condicional de t dado 2.Y, P(2,t) = P(2)* P(t/2), como P(2) = 2, resta determinar P(t/2). Con lo cual P(t/2) representa la cantidad de empresas del tipo 2 que fueron bien clasificadas en el nodo t. Con un procedimiento similar, R2(t)= c12.1. n1 (t)/N1.

El nodo terminal t es asignado a aquel grupo que minimiza el riesgo correspondiente, con lo cual la regla de asignación es del tipo bayesiana. Por lo tanto el riesgo bayesiano resultante en el nodo t es el Rt =min [R1(t), R2(t)]. El riesgo total del árbol, denotado R(T), es la suma de los riesgos de cada nodo terminal.12

En términos comparativos la mayoría de los autores reconoce la superioridad de los modelos APR respecto al análisis discriminante múltiple, tanto en términos de estimación de probabilidades y como de errores de clasificación de empresas. La principal desventaja está

11

El término "restitución" se utiliza dado que el error es estimado a partir de la muestra original.

12 Nótese que si c

12=c21=1 y que

i = Ni/N, i=1,2; las probabilidades a priori son iguales a la

proporción en la muestra original de los objetos de los grupos 1 y 2, es decir, Ri (t)= ni (t)/N, que es la

proporción muestral de los objetos del grupo i que se asignan al nodo terminal t. En este caso la regla de asignación es simple, cada nodo terminal es asignado al grupo que tiene representación mayoritaria en ese nodo y el riesgo del árbol es simplemente la tasa de error de clasificación global del mismo.

relacionada con la necesidad de utilizar una gran cantidad de datos cuando se trabaja con estructuras complejas.

Related documents