CASE STUDY 5: Palfinger AG - Financial Reporting: The Application of Professional Development a

Aprobación de Crédito Australiana (ACAS). La ACAS contiene 690 casos, divididos en dos clases, 307 solicitantes “aceptados” y 383 solicitantes “rechazados”. Cada solicitante contiene 15 caracter´ısticas, incluyendo 6 nominales, 8 atributos numéricos y la última que es la etiqueta de cada clase (aceptados o rechazados). Este conjunto de datos es interesante porque hay una buena mezcla de atributos: continuos y

6.2 Experimento 2

nominales, nominales con valores peque˜nos y nominales con valores grandes (ver Tabla 6.9). Otra caracter´ıstica importante de esta base de datos, es que faltan pocos valores.

Para proteger la confidencialidad de estos datos, los nombres de los atributos y sus valores se han cambiado a datos simb´olicos. El conjunto de datos contiene una mezcla de atributos, donde seis atributos son continuos y ocho son de categor´ıas variables.

Base de Total Caracter´ısticas Caracter´ısticas Total N´umero Datos Instancias Nominal Num´ericas Caracter´ısticas de Clases

Australia 307/383 6 8 14 2

Tabla 6.9: Descripción de los atributos de la base de datos Aprobación de Crédito de Aus- tralia.

6.2.2. Selecci´on de la Estructura de Red

La sección de la estructura de red se realizó como se indicó en la Subsección 5.5 del Cap´ıtulo 5. El primer experimento se realizó con la finalidad de seleccionar la mejor estructura de red y parámetros de metaplasticidad a utilizar la base de datos ACAS. En la Tabla 6.10 se muestran los resultados obtenidos para diferentes estructuras de red y diferentes parámetros de metaplasticidad.

Estructura Par´ametros Error Nro. Nro. Tiempo Exactitud de de Red Metaplasticidad MSE Epocas PUE1 _de _{la Clasificaci´}_{on ( %)}

I HL O A B Entrena2 _Entrena2 _Prueba

9 8 1 38 0.5 0.01 2000 210 63.9815 seg. 97.78 98.07 9 8 1 39 0.5 0.01 2000 253 71.2589 seg. 94.56 93.71 9 6 1 37 0.5 0.01 2000 319 90.3624 seg. 93.89 94.20

Tabla 6.10: Resultados obtenidos por el AMMLP al aplicarlo a la base de datos ACAS, usando diferentes estructuras de red y diferentes par´ametros de metaplasticidad.

Para este caso, la función de activación fue tipo sigmoidal con un rango de (0,1) y será el misma para todas las neuronas. Para evaluar comparativamente el rendimiento de los clasificadores, todos los clasificadores que se presentan es este caso fueron entrenados, con el 70 % de los datos, es decir, 483 muestras, de las cuales 215 eran registros aceptados y 268 registros rechazados. El conjunto de

prueba estaba conformado con el restante 30 % de los datos, 207 muestras, dividido de la siguiente manera 92 eran registros aceptados y 115 rechazados.

En la tabla 6.11 se muestra la estructura de red, los parámetros de metaplasticidad, las épocas, MSE y el número de patrones que se utilizaron para el entrenamiento y prueba de los clasificadores usados.

Clasificadores Estructura Error Nro. Par´ametros N´umeros de Neuronales de Red MSE Epocas Metaplasticidad Patrones

I HL O A B Entrena2 _Prueba

AMMLP 9 8 1 0.01 2000 38 0.5 483 207 BPNNs 9 8 1 0.01 2000 NA3 _NA3 ₄₈₃ ₂₀₇

Tabla 6.11: Par´ametros de red aplicados a la ACAS.

Una vez conseguida la mejor estructura de red para esta base de datos se procedió a realizar dos experimentos: uno para obtener la mejor exactitud en la clasificación para cada clasificador en una simulación y el otro para obtener el promedio de 50 simulaciones. Para el segundo caso, 50 AMMLP se generaron con pesos iniciales diferentes y cuyos valores eran aleatorios con distribución normal (media 0 y varianza 1). En cada experimento 50 redes fueron entrenadas para alcanzar un promedio que sea independiente del valor aleatorio inicial de los pesos de la RNA. Dos diferentes criterios fueron aplicados para detener el entrenamiento de la red: en un caso el entrenamiento fue detenido cuando el error alcanzó el valor de 0.01 (el error se reduce, pero no puede converger a 0), y en el otro caso el entrenamiento se deten´ıa cuando la red alcanzaba las 2.000 épocas.

6.2.3. Evaluaci´on del M´etodo

En esta sección se presentan los experimentos realizados para medir el com- portamiento del método propuesto AMMLP usando la base de datos ACAS. Los resultados obtenidos por el AMMLP fueron comparados con el Algoritmo de Retropropagación estándar.

2_{Entrena: Entrenamiento} 3_{NA: No aplica}

6.2 Experimento 2

6.2.3.1. Exactitud de los resultados

Exactitud general: es la medida más común de evaluación de los clasificadores.

Exactitud= V P+V N

T P +T N+F P +F N (6.4)

donde VP, VN, FP y FN denotan verdaderos positivos, verdaderos negativos, falsos positivos y falsos negativos, respectivamente.

Verdadero Positivo (VP): es un registro de cr´edito correctamente aceptado .

Verdadero Negativos (VN): es un registro de cr´edito correctamente rechazada.

Falsos Positivos (FP): es un registro de cr´edito rechazado clasificado como aceptado.

Falsos Negativos (FN): es un registro de cr´edito aceptado clasificado como rechazado.

Aprobación de crédito, AC: es una función de los ejemplos clasificados correctamente (verdaderos positivos) y los ejemplos mal clasificados (falsos positivos).

AC = V P

V P+F P (6.5)

Negación de crédito. NC: es una función de positivo verdaderos y negativos falsos.

N C= F P

Matriz de confusión: al igual que en el Experimento 1, se usará la matriz de confusión para representar el rendimiento de los clasificadores.

La tabla 6.12 muestra el mejor resultado de la clasificaci´on obtenida por cada uno los clasificadores en una matriz de confusi´on.

Clasificadores Resultado Deseado

Resultados de la Salida Neuronales Aceptado Rechazado

Aceptados 92 0 AMMLPs Rechazados 4 111 Aceptados 76 16 BPNNs Rechazados 12 103

Tabla 6.12: Matrices de confusión de la mejor clasificación obtenida por los clasificadores en una simulación usando la base de datos ACAS.

En la tabla 6.13 se presenta el mejor resultado obtenido pro cada clasificador usando la base de datos ACAS. El promedio obtenido por los clasificadores en 50 simulaciones de muestra en la tabla 6.14.

Clasificadores Exactitud de la Clasificación ( %) Neuronales Aprobación de Crédito Negación de Crédito Total Exactitud de la Clasificación AMMLPs 100 96.52 98.07 BPNNs 82.63 89.56 86.47

Tabla 6.13: Exactitud de la clasificaci´on obtenida por los clasificadores en la mejor simulaci´on.

Clasificadores Exactitud de la Clasificación ( %) Neuronales Aprobación de Crédito Negación de Crédito Total Exactitud de la Clasificación AMMLPs 90.41±_2.9 _95.08±_2.1 _92.86±_1.6 BPNNs 82.67±_3.6 _90.43±_3.9 _84.98±_2.3

Tabla 6.14: Promedio en la exactitud de la clasificaci´on obtenida en 50 simulaciones para cada clasificador.

Como se puede observar, AMMLP es superior al Algoritmo de Retropropagaci´on est´andar en todos los casos.

6.2 Experimento 2

6.2.3.2. Comparaci´on con el Estado-del-Arte

Los resultados obtenidos con el AMMLP se compar´o con los resultados de otros algoritmos de dos maneras: Primero se comparo estos resultados con algoritmos propuestos recientemente aplicados a la base de datos de ACAS. En segundo lugar, los resultados se compararon tambi´en con otros buenos algoritmos que han sido desarrollados por otros investigadores y que han utilizando la misma base de datos.

Los resultados obtenidos por el AMMLP fueron comparados con diferentes algoritmos propuestos recientemente por otros investigadores. En 2008 Penget al., [136] obtuvieron una exactitud de 86,36 %, Tsai & Wu [137] alcanzaron un 87.25 % de exactitud en la clasificación. En 2009 Khasman [15] presentó una exactitud de 89,28 %, en [138] Nanni & Lumini obtuvieron un 87.05 % de exactitud, Xuet al., [139] informaron de una exactitud de 89.28 %, Luoet al., [140] alcanzaron un 86.52 % de exactitud, mientras que Tsai [141] obtuvo un 89.93 % , Ping presentó un 87.52 % [142]. En 2010 Chen & Li obtuvieron una exactitud de 88.52 % [143].

En este estudio el mejor resultado obtenido en una simulaci´on fue de 98.07 % de exactitud y se obtuvo un average de 92.86 % en 50 simulaciones.

Los resultados obtenidos en la clasificación por el AMMLP fueron comparados también con los mejores resultados obtenidos por otros investigadores que utilizaron la misma base de datos en sus estudios. En la Tabla 6.15 se presenta los nombres de los investigadores, los algoritmos usados en sus estudios y la exactitud en la clasificación obtenida.

Autor(s) (Año) Método Exactitud de la Clasificación ( %) West, 2.000 [144] MEO 87.14 Onget al.,2005 [145] GP 88.27 Huanget al.,2006 [146] 2SGP 89.17 Martenset al.,2007 [147] SVM 85.70 Hoffmanet al.,2007 [148] Bayes 86.70 Huanget al.,2007 [149] GA-SVM 86.90

Penget al.,2008 [136] MCQP 86.36

Tsai and Wu, 2008 [137] Multiples Clasificadores 87.25 Khasman, 2009 [15] LS3 89.28 Nanni and Lumini, 2009 [138] LMNC 87.05

Xu et al.,2009 [139] HARA 89.28

Luoet al.,2009 [140] CLC 86.52

Tsai, 2009 [141] MLP 89.93 Ping, 2009 [142] SVM-H´ıbrido 87.52 Chen and Li, 2010 [143] LDA + SVM 88.52

En este estudio AMMLP 98.074

En este estudio AMMLP 92.865

Tabla 6.15: Exactitud de la clasificación usando la base de datos Aprobación de Crédito Aus- traliana obtenida por el método propuesto AMMLP y por otros clasificadores consultados en la literatura.

6.2.4. Conclusiones

La puntuación de crédito se ha convertido en una tarea muy importante para los bancos, especialmente en los últimos años con el aumento de las situaciones impago y de morosidad. Mientras los bancos requiere de técnicas cada vez más sofisticadas para basar sus decisiones de préstamos de crédito, cada vez más investigadores están buscando mejores estrategias para mejorar los modelos de puntuación de crédito. En esta investigación se presentó un modelo de evaluación del riesgo de crédito utilizando el algoritmo AMMLP, para mejorar las decisiones en el momento de otorgar o no el crédito. El método propuesto fue aplicado a la la base de datos Aprobación de Crédito Australiana (ACAS). Los resultados obtenidos demuestran la superioridad del AMMLP con respecto al Algoritmo de Retropropagación estándar y con respecto a otros algoritmos desarrollados por diferentes investigadores y aplicados a la misma base de datos. Por lo tanto, se puede concluir que el algoritmo propuesto AMMLP se deber´ıa considerar para tomar como una segunda opción para apoyar las decisiones de préstamo de crédito.

4_{El mejor resultado obtenido en una simulaci´}_on. 5_{Average obtenido en 50 simulaciones.}

In document Financial Reporting: The Application of Professional Development and Research (Page 45-52)