Development of a Predictive Credit Risk Model Using Machine Learning Techniques on Simulated Financial Data El Desarrollo de un modelo predictivo de riesgo crediticio mediante técnicas de aprendizaje automático sobre datos financieros simulados
Contenido principal del artículo
Resumen
La evaluación del riesgo crediticio sigue siendo un desafío crítico para las instituciones financieras, ya que una clasificación deficiente de los prestatarios puede generar pérdidas financieras significativas. Este estudio presenta el desarrollo de un modelo predictivo de riesgo crediticio mediante algoritmos de aprendizaje automático aplicados a datos financieros simulados. El uso de un conjunto de datos sintéticos permite la creación de perfiles realistas de clientes, preservando al mismo tiempo la privacidad de los datos.
La investigación compara el rendimiento de varios algoritmos (regresión logística, árboles de decisión, bosque aleatorio, XGBoost y perceptrón multicapa) utilizando métricas como la precisión, la recuperación, la puntuación F1 y el AUC-ROC. Los modelos se entrenaron con una división de datos 80/20 y se validaron mediante una validación cruzada de 5 pasos. XGBoost superó a los demás modelos, alcanzando una precisión del 92 % y una alta recuperación, lo que indica su idoneidad para identificar individuos de alto riesgo.
Los hallazgos demuestran que los modelos de aprendizaje automático, en particular los enfoques de conjunto y neuronales, pueden mejorar significativamente la predicción del riesgo crediticio en comparación con los métodos tradicionales. Esto tiene implicaciones para los procesos de toma de decisiones financieras, especialmente en instituciones que buscan reducir las tasas de impago y optimizar las estrategias de asignación de crédito. El estudio también destaca desafíos como la interpretabilidad de los modelos y la necesidad de validación con conjuntos de datos reales. El trabajo futuro se centrará en la integración de herramientas de IA explicables y en la prueba de los modelos con datos de instituciones financieras.
Detalles del artículo

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
Citas
Aniceto, M. C., Barboza, F., & Kimura, H. (2020). Machine Learning Predictivity Applied to Consumer Creditworthiness. Future Business Journal, 6, 37. DOI: 10.1186/s43093-020-00041-w
Bhatore, S., Mohan, L., & Reddy, Y. R. (2020). Machine Learning Techniques for Credit Risk Evaluation: A Systematic Literature Review. Journal of Banking and Financial Technology, 4(1), 111–138. DOI: 10.1007/s42786-020-00020-3
Bitetto, A., Cerchiello, P., Filomeni, S., Tanda, A., & Tarantino, B. (2024). Can We Trust Machine Learning to Predict the Credit Risk of Small Businesses? Review of Quantitative Finance and Accounting, 63(3), 925–954. DOI: 10.1007/s11156-024-01278-0
Bussmann, N., Giudici, P., Marinelli, D., & Papenbrock, J. (2020). Explainable Machine Learning in Credit Risk Management. Computational Economics, 57(1), 203–216. DOI: 10.1007/s10614-020-10042-0
Chang, V., Sivakulasingam, S., Wang, H., Wong, S. T., & Ganatra, M. A. (2024). Credit Risk Prediction Using Machine Learning and Deep Learning: A Study on Credit Card Customers. Risks, 12(11), 174. DOI: 10.3390/risks12110174
Emmanuel, I., Sun, Y., & Wang, Z. (2024). A Machine Learning-Based Credit Risk Prediction Engine System Using a Stacked Classifier and a Filter-Based Feature Selection Method. Journal of Big Data, 11(1), 23. DOI: 10.1186/s40537-024-00882-0
Espinoza, F. E. T., & Coral Ygnacio, M. A. (2023). Credit Risk Assessment Models in Financial Technology: A Review. TecnoLógicas, 26(58), e2679. DOI: 3442/344275988008
Laborda, J., & Ryoo, S. (2021). Feature Selection in a Credit Scoring Model. Mathematics, 9(7), 746. DOI: 10.3390/math9070746
Li, Y., Stasinakis, C., & Yeo, W. M. (2022). A Hybrid XGBoost-MLP Model for Credit Risk Assessment on Digital Supply Chain Finance. Forecasting, 4(1), 184–207. DOI: 10.3390/forecast4010011
Lyócsa, Š., Vašaničová, P., Hadji Misheva, B., & Vateha, M. D. (2022). Default or Profit Scoring Credit Systems? Evidence from European and US Peer-to-Peer Lending Markets. Financial Innovation, 8(1), 32. DOI: 10.1186/s40854-022-00338-5
Melese, T., Berhane, T., Mohammed, A., & Walelgn, A. (2023). Credit-Risk Prediction Model Using Hybrid Deep–Machine-Learning Based Algorithms. Scientific Programming, 2023, Article 6675425. DOI: 10.1155/2023/6675425
Nallakaruppan, M. K., Chaturvedi, H., Grover, V., Balusamy, B., et al. (2024). Credit Risk Assessment and Financial Decision Support Using Explainable Artificial Intelligence. Risks, 12(10), 164. DOI: 10.3390/risks12100164
Pérez, E. M., Ramírez Guzmán, M. E., & Hernández Jiménez, A. (2024). Predicción del riesgo crediticio a microfinanciera usando aprendizaje computacional. Revista Mexicana de Economía y Finanzas (Nueva Época), 19(4), e868. DOI: 10.21919/remef.v19i4.868
Robisco, A. A., & Carbó Martínez, J. M. (2022). Measuring the Model Risk-Adjusted Performance of Machine Learning Algorithms in Credit Default Prediction. Financial Innovation, 8(1), 70. DOI: 10.1186/s40854-022-00366-1
Shen, F., Zhao, X., Kou, G., & Alsaadi, F. E. (2021). A New Deep Learning Ensemble Credit Risk Evaluation Model with an Improved Synthetic Minority Oversampling Technique. Applied Soft Computing, 98, 106852. DOI: 10.1016/j.asoc.2020.106852
Shi, S., Tse, R., Luo, W., D’Addona, S., & Pau, G. (2022). Machine Learning-Driven Credit Risk: A Systemic Review. Neural Computing and Applications, 34(19), 14327–14339. DOI: 10.1007/s00521-022-07472-2
Shi, Y., Qu, Y., Chen, Z., Mi, Y., & Wang, Y. (2024). Improved Credit Risk Prediction Based on an Integrated Graph Representation Learning Approach with Graph Transformation. European Journal of Operational Research, 315(2), 786–801. DOI: 10.1016/j.ejor.2023.12.028
Soni, U., Jethava, G., & Ganatra, A. (2024). Latest Advancements in Credit Risk Assessment with Machine Learning and Deep Learning Techniques. Cybernetics and Information Technologies, 24(4), 22–44. DOI: 10.2478/cait-2024-0034
Wang, W., Zuo, X., & Han, D. (2024). Predict Credit Risk with XGBoost. Applied and Computational Engineering, 74, 164–177. DOI: 10.54254/2755-2721/74/20240462