analysis of items in the primary statements 1 Segmental analysis
8. Intangible assets Software
Para la comparación de los distintos modelos se calcularon las métricas recall y AUC. Para seleccionar el modelo con el mejor desempeño se calculó el promedio ponderado de ambas métricas, dando un peso del 60% a recall y del 40% al AUC.
La asignación de los pesos se hizo teniendo en cuenta que, por la naturaleza del problema, era importante revisar que el modelo lograra clasificar correctamente la mayor
38 cantidad de veces a los clientes con mayor probabilidad de adquirir el producto financiero del banco.
Los resultados de las métricas, así como el cálculo del promedio ponderado se muestran a continuación en la tabla 16:
Tabla 16.Resumen de Métricas para los distintos modelos de clasificación.
Modelo Recall AUC Promedio ponderado Red Neuronal 0.8135 0.8026 0.80914
Logit 0.7458 0.7854 0.76164 Boosting Tree 0.6949 0.7787 0.72842 Random Forest 0.678 0.7911 0.72324
LDA 0.53 0.7487 0.61748
Fuente: Elaboración propia
39 6 Conclusiones y Recomendaciones
Se realizó un análisis de los clientes del segmento pyme para entender su comportamiento y se aplicaron 5 tipos de modelamiento diferentes que permitieron responder la pregunta clave de este proyecto.
El modelo que mejor desempeño obtuvo para determinar los clientes que tienen la mayor probabilidad de adquirir los productos del banco BBVA, fue la Red neuronal profunda de 3 capas, el cual obtuvo un promedio ponderado del recall y el AUC del 80.91%. Por tal motivo se recomienda implementar este modelo y hacerle un seguimiento periódico, incluyendo nuevos registros que permitan alimentar el modelo y mejorar las métricas de desempeño.
Las variables que influyeron de manera significativa en la probabilidad de adquisición de los productos que ofrece el banco BBVA, para la mayoría de los modelos se presentan en la tabla 17:
Tabla 17. Variables más significativas en la mayoría de los modelos.
Variables Meses_Ult_Apertura
Dif_Saldo_Prom_Activo_mes Dif_Saldo_Prom_ Activo _trim Dif_Saldo_Prom_ Activo _anual Dif_Saldo_Prom_Pasivo_sem Dif_Saldo_Prom_Pasivo_anual Var_Saldo_Prom_Activo_mes Var_cantidad_Transacc_anual Saldo_prom_Cred_Comex Saldo_prom_Cred_Empr Saldo_prom_Sobregiro Saldo_prom_Libre_Inversion Saldo_prom_Cta_Cte Saldo_prom_Leasing Endeuda_BBVA Endeuda_Total
40 Lograr identificar estas variables que impactan el comportamiento de las pyme es un gran avance para el banco ya que no se contaban con estudios previos para este segmento y dan un punto de partida para seguir explorando el grupo.
El modelo seleccionado constituye una potente herramienta de priorización de leads para la fuerza de ventas y le servirá al banco en el incremento de la productividad de los ejecutivos de ventas al ayudar a concentrar los esfuerzos en aquellos clientes que cuentan con una mayor probabilidad de compra, este hecho puede llegar a tener un impacto significativo en la optimización de la agenda visitas de la fuerza de ventas.
Los clientes que han tenido una actividad reciente con el banco son los que tienen la mayor probabilidad de aceptar la oferta comercial, esto evidencia que el banco cuenta con clientes recurrentes en sus compras los cuales constituyen la base de su actividad comercial, así mismo existen clientes que están inscritos en sus bases de datos, pero que no han aperturado un crédito en muchos meses y su actividad es mínima, este tipo de clientes al estar alejados del banco, tienen menores posibilidades de tomar una oferta pues su relación con el banco no está fortalecida , por lo cual se recomienda realizar una oferta más atractiva y diferenciadora para este grupo de clientes de forma tal que aumente la efectividad de las campañas.
41 7 Bibliografía
Agresti, A. (1996) Introduction to categorical data analysis. Jhon Wiley & Sons, INC.
Amat, J. (2016, Septiembre) Análisis discriminante lineal (LDA) y Análisis discriminante cuadrático (QDA). Recuperado de
https://github.com/JoaquinAmatRodrigo/Estadistica-con-
R/blob/master/PDF_format/28_Linear_Discriminant_Analysis_LDA_y_Quadratic_Discrimin ant_Analysis_QDA.pdf
Chawla, N. Bowyer, K. Hall, L. Kegelmeyer, W. (2002) SMOTE: Synthetic Minority Over- sampling Technique. Journal of Intelligence Research. Vol. 16. Pag. 321-357.
Choong, A. (2017) Predictive Analytics in marketing. A practical example from retail banking. SAS big data committee. Research Note 1. Singapore.
Clavijo, S. (2018, Agosto 10) Indicador Pyme Anif (IPA): resultados del primer semestre. Recuperado de
https://www.larepublica.co/analisis/sergio-clavijo-500041/indicador-pyme-anif-ipa- resultados-del-primer-semestre
Conoce todo sobre las pymes. (2018, Julio 12). Recuperado de
https://www.grupobancolombia.com/wps/portal/negocios-pymes/actualizate/legal-y- tributario/todo-sobre-las-pymes-en-colombia
Elsalamony, H. (2014) Bank direct marketing analysis of data mining techniques. International Journal of Computer Applications. Vol. 85 No. 7.
Garet, J. Witten, D. Hastie, T. & Tibshirani, R. (2013). An Introduction to statistical learning with applications in R. Springer. New York.
Greenwell, B. Boehmke, B. Cunningham, J. and GBM Developers (2018). gbm: Generalized Boosted Regression Models. R package version 2.1.4. https://CRAN.R- project.org/package=gbm
Karim, M. and Rahman, R. (2013) Decision tree and nave bayes algorithm for classification and generation of actionable knowledge for direct marketing. Journal of software engineering and applications. Vol 6, pag. 196-206.
Kuhn, M. (2016). caret: Classification and Regression Training. R package version 6.0-71. https://CRAN.R-project.org/package=caret
Liaw, A. and Wiener, M. (2002). Classification and Regression by randomForest. R News. Vol. 2. (Num. 3), pág. 18--22.
42 Mason, Llew & Baxter, Jonathan & Bartlett, Peter & Frean, Marcus. (1999). Boosting Algorithms as Gradient Descent in Function Space. Consultado el 14 de noviembre en: http://papers.nips.cc/paper/1766-boosting-algorithms-as-gradient-descent.pdf
Meyer, D. Dimitriadou, E. Hornik, K. Weingessel, A. and Leisch, F (2017). e1071: Misc Functions of the Department of Statistics, Probability Theory Group (Formerly: E1071), TU Wien. R package version 1.6-8. https://CRAN.R- project.org/package=e1071
Moro, S. Cortez, P. and Rita, P. A Data-Driven Approach to Predict the Success of Bank Telemarketing. Decision Support Systems, Elsevier, 62:22-31, June 2014
¿Qué crédito es más conveniente para su empresa el crecimiento de su empresa?. (s.f). Recuperado de
http://www.finanzaspersonales.co/credito/articulo/credito-empresarial-que-es-el-credito- empresarial-y-como-se-pide
Ranking de las mejores pymes de Colombia de 2017. (2017, Septiembre 14). Recuperado de https://www.dinero.com/edicion-impresa/caratula/articulo/ranking-de-las-mejores-pymes-de- colombia-en-2017
Valencia, C. (2018) Notas de clase. Maestría en inteligencia analítica para la toma de decisiones. Universidad de los Andes.
Venables, W. N. & Ripley, B. D. (2002) Modern Applied Statistics with S. Fourth Edition. Springer, New York.
43 8 Anexos
Anexo 1
Nombre Variable Descripción Tipo Variable
Acepta Determina si el cliente aceptó o no la oferta comercial. Para el caso estudio es la variable respuesta Y. Categórica-Dicotómica Antigüedad_Cliente Meses de antigüedad del cliente desde el momento de su vinculación hasta marzo de 2018 continua
Calif_Riesgo Identifica si la empresa presenta una calificación de riesgo determinada Categórica-Dicotómica
Cliente_con _CDT Indica si el cliente cuenta con un CDT Categórica-Dicotómica
Cliente_con _Cred_Comex Indica si el cliente cuenta con crédito de comercio exterior Categórica-Dicotómica
Cliente_con _Cred_Empr Indica si el cliente cuenta con crédito Empresarial Categórica-Dicotómica
Cliente_con _Cta_Aho Indica si el cliente cuenta con un Cuentas ahorros Categórica-Dicotómica
Cliente_con _Cta_Cte Indica si el cliente cuenta con un Cuentas corriente Categórica-Dicotómica
Cliente_con _Factoring Indica si el cliente cuenta con un factoring Categórica-Dicotómica
Cliente_con _Fondo_Inversion Indica si el cliente cuenta con un fondo de inversión Categórica-Dicotómica
Cliente_con _Leasing Indica si el cliente cuenta con un leasing Categórica-Dicotómica
Cliente_con _Libre_Inversion Indica si el cliente cuenta con un crédito comercial Categórica-Dicotómica
Cliente_con _Otros_Prod Indica si el cliente cuenta con otros productos Categórica-Dicotómica
Cliente_con _Sobregiro Indica si el cliente cuenta con descubierto(sobregiro) Categórica-Dicotómica
Corte_Contable Corte contable de la última información financiera del cliente Categórica-Dicotómica
Cuota_Banquero Razón entre el endeudamiento del cliente con el BBVA con respecto a las otras entidades Continua Dif_cantidad_Transacc_anual Diferencia de la cantidad de transacciones realizadas en el mes i respecto al último mes del año anterior Continua Dif_cantidad_Transacc_mes Diferencia de la cantidad de transacciones realizadas en el mes i respecto al mes inmediatamente anterior Continua Dif_cantidad_Transacc_sem Diferencia de la cantidad de transacciones realizadas en el mes i respecto al último mes del semestre anterior Continua Dif_cantidad_Transacc_trim Diferencia de la cantidad de transacciones realizadas en el mes i respecto al último mes del trimestre anterior Continua Dif_Monto_Transado_anual Diferencia del monto transado en el mes i con respecto al último mes del año anterior Continua Dif_Monto_Transado_mes Diferencia del monto transado en el mes i con respecto al mes inmediatamente anterior Continua Dif_Monto_Transado_sem Diferencia del monto transado en el mes i con respecto al último mes del semestre anterior Continua
44
Dif_Monto_Transado_trim Diferencia del monto transado en el mes i con respecto al último mes del trimestre anterior Continua Dif_Saldo_Prom_Pasivo_anual Diferencia del saldo promedio de los productos de préstamo del mes i con respecto al último mes del año anterior Continua Dif_Saldo_Prom_Pasivo_mes Diferencia del saldo promedio de los productos de préstamo del mes i con respecto al mes inmediatamente
anterior
Continua
Dif_Saldo_Prom_Pasivo_sem Diferencia del saldo promedio de los productos de préstamo del mes i con respecto al último mes del semestre anterior
Continua
Dif_Saldo_Prom_Pasivo_trim Diferencia del saldo promedio de los productos de préstamo del mes i con respecto al último mes del trimestre anterior
Continua
Dif_Saldo_Prom_Activo_anual Diferencia del saldo promedio de los productos de inversión del mes i con respecto al último mes del año anterior Continua Dif_Saldo_Prom_Activo_mes Diferencia del saldo promedio de los productos de inversión del mes i con respecto al mes inmediatamente
anterior
Continua
Dif_Saldo_Prom_Activo_sem Diferencia del saldo promedio de los productos de inversión del mes i con respecto al último mes del semestre anterior
Continua
Dif_Saldo_Prom_Activo_trim Diferencia del saldo promedio de los productos de inversión del mes i con respecto al último mes del trimestre anterior
Continua
Endeuda_BBVA Saldo de la deuda con BBVA Continua
Endeuda_Otros_Bancos Saldo de la deuda con otras entidades financieras Continua
Endeuda_Total Saldo total con todas las entidades Continua
Macro_Sector Corresponde a la agrupación sectorial de la actividad económica Categórica
Meses_Ult_Apertura Tiempo transcurrido en meses entre la fecha del último producto contratado y marzo de 2018 Continua
Peor_Calificacion Identifica la peor calificación histórica en el sector Categórica
Rango_de_Ventas Identifica el rango de ventas Categórica
Saldo_prom_CDT Saldo promedio en el mes del producto CDT Continua
Saldo_prom_Cred_Comex Saldo promedio en el mes del producto Crédito de comercio exterior Continua
Saldo_prom_Cred_Empr Saldo promedio en el mes del producto Crédito Empresarial Continua
Saldo_prom_Cta_Aho Saldo promedio en el mes del producto Cuenta de Ahorros Continua
Saldo_prom_Cta_Cte Saldo promedio en el mes del producto Cuenta Corriente Continua
Saldo_prom_Factoring Saldo promedio en el mes del producto Factoring Continua
Saldo_prom_Fondo_Inversion Saldo promedio en el mes del producto Fondo de Inversión Continua
Saldo_prom_Leasing Saldo promedio en el mes del producto Leasing Continua
45
Saldo_prom_Otros_Prod Saldo promedio en el mes de otros Productos Continua
Saldo_prom_Sobregiro Saldo promedio en el mes de Sobregiro Continua
Segmento_Cliente Corresponde a la clasificación que usa el banco para identificar el tipo de empresa, ya sea Pyme(1) o Emprendedor (2)
Categórica-Dicotómica
Tipo_Producto Tipo de producto de la última contratación, la cual puede ser de tipo activo o pasivo Categórica-Dicotómica Var_cantidad_Transacc_anual Variación porcentual de la cantidad de transacciones en el último mes con respecto al último mes del año anterior Continua
Var_cantidad_Transacc_mes Variación porcentual de la cantidad de transacciones en el mes i con respecto al mes inmediatamente anterior Continua Var_cantidad_Transacc_sem Variación porcentual de la cantidad de transacciones en el mes i con respecto al último mes de semestre anterior Continua Var_cantidad_Transacc_trim Variación porcentual de la cantidad de transacciones en el mes i con respecto al último mes del trimestre anterior Continua Var_Monto_Transado_anual Variación porcentual del monto transado en el mes i con respecto al último mes del año inmediatamente anterior Continua Var_Monto_Transado_mes Variación porcentual del monto transado en el mes i con respecto al mes inmediatamente anterior Continua Var_Monto_Transado_sem Variación porcentual del monto transado en el mes i con respecto al último mes del semestre inmediatamente
anterior
Continua
Var_Monto_Transado_trim Variación porcentual del monto transado en el mes i con respecto al último mes del trimestre inmediatamente anterior
Continua
Var_Saldo_Prom_Pasivo_anual Variación porcentual del saldo promedio de los productos de préstamo en el mes i con respecto al último mes del año anterior
Continua
Var_Saldo_Prom_Pasivo_mes Variación porcentual del saldo promedio de los productos de préstamo en el mes i con respecto al mes inmediatamente anterior
Continua
Var_Saldo_Prom_Pasivo_sem Variación porcentual del saldo promedio de los productos de préstamo en el mes i con respecto al último mes del semestre anterior
Continua
Var_Saldo_Prom_Pasivo_trim Variación porcentual del saldo promedio de los productos de préstamo en el mes i con respecto al último mes del trimestre anterior
Continua
Var_Saldo_Prom_Activo_anual Variación porcentual del saldo promedio de los productos de inversión en el mes i con respecto al último mes del año anterior
Continua
Var_Saldo_Prom_Activo_mes Variación porcentual del saldo promedio de los productos de inversión en el mes i con respecto al mes inmediatamente anterior
Continua
Var_Saldo_Prom_Activo_sem Variación porcentual del saldo promedio de los productos de inversión en el mes i con respecto al último mes del semestre anterior
Continua
Var_Saldo_Prom_Activo_trim Variación porcentual del saldo promedio de los productos de inversión en el mes i con respecto al último mes del trimestre anterior
Continua