Research Article

Approche d’ensemble d’empilement pour prédire l’approbation d’un prêt à l’aide de techniques d’apprentissage automatique

DOI:

10.3791/68832

September 23rd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Cette étude développe un modèle d’ensemble d’empilement intégrant XGBoost, CatBoost (Gradient Boosting Model), LightGBM (Efficient Gradient Boosting Model), AdaBoost et Extra Trees pour prédire les approbations de prêts à l’aide des données Kaggle. Avec une précision de 98 %, il identifie les principaux prédicteurs tels que le revenu et la cote de crédit, favorisant ainsi des décisions justes et efficaces en matière d’approbation et/ou de rejet de prêt.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Les innovations en matière de prêts numériques et de technologie financière ont bouleversé les systèmes bancaires établis, modifiant l’inclusion financière et la disponibilité du crédit dans les pays du monde entier. Cette étude examine comment les plateformes de prêt entre pairs (P2P) et numériques évoluent, en mettant l’accent sur la façon dont des technologies telles que l’intelligence artificielle et l’apprentissage automatique modifient la façon dont les prêts sont approuvés. Une étude approfondie de la littérature met en évidence les opportunités et les problèmes de l’écosystème des prêts numériques, tels que l’évaluation des risques algorithmiques, la confiance des clients, l’exclusion financière et les failles réglementaires. Cet article suggère une approche solide d’apprentissage automatique qui utilise un modèle d’ensemble d’empilement pour prévoir avec précision les approbations de prêts afin de résoudre ces problèmes. Les données ont été prétraitées à l’aide du partitionnement d’essai, de l’analyse exploratoire et de l’encodage des étiquettes à l’aide d’un ensemble de données Kaggle accessible au public qui comprenait les données démographiques des candidats, les caractéristiques financières et les antécédents de crédit. Avec XGBoost servant de méta-apprenant, l’ensemble intègre les classificateurs Gradient Boosting Model, Efficient Gradient Boosting, AdaBoost et Extra Trees en tant qu’apprenants de base. Avec une précision de 98 %, le modèle a été évalué à l’aide de mesures telles que l’exactitude, la précision, le rappel, le score F1 et les mesures d’erreur (MAE - Erreur absolue moyenne, MSE - Erreur quadratique moyenne et RMSE - Erreur quadratique moyenne). Selon les études de corrélation, des facteurs tels que les actifs, les revenus et les scores CIBIL ont un impact significatif sur l’approbation des prêts. Surpassant les méthodes conventionnelles, le modèle a montré un équilibre et une généralisation entre les deux classes. L’utilité de ces modèles pour les déterminations de crédit automatisées et fondées sur les données est soulignée dans la conclusion de l’article.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dans la dernière phase de la transformation technologique du secteur bancaire, de nouveaux fournisseurs de services financiers perturbateurs venus de l’extérieur du système bancaire établi sont entrés sur le marché1. Les grandes entreprises technologiques (grandes entreprises technologiques qui se concentrent principalement sur les prêts directs ou auprès d’institutions financières) et les FinTech (technologies financières, y compris des modèles tels que les prêts P2P et les alternatives de crédit en ligne aux banques traditionnelles) font des percées substantielles dans le secteur financier, posant un défi aux....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Collecte de données

Cette étude a utilisé l’ensemble de données de prédiction de l’approbation des prêts disponible sur Kaggle. L’ensemble de données a été extrait en février 2025 et se compose de 4269 enregistrements visant à évaluer les données sur les prêts et à prévoir les résultats de l’approbation des prêts. Il comprend 12 colonnes contenant des informations détaillées sur les profils démographiques des candidats, tels que le statut d’emploi, les personnes à charge, les travailleurs indépendants, le montant du prêt, la durée du prêt, les scores CIBIL, les antécédents financiers et les a....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Analyse de corrélation des caractéristiques

La carte thermique de corrélation des caractéristiques (figure 2) a fourni des informations utiles sur les interrelations entre les différents attributs. De fortes corrélations positives ont été trouvées entre le revenu, le montant annuel du prêt et les variables liées aux actifs tels que .......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Le modèle d’ensemble d’empilement pour la prédiction de l’approbation des prêts fonctionne exceptionnellement bien sur diverses mesures d’évaluation, faisant preuve d’une grande précision et d’une grande fiabilité. La carte thermique des corrélations a révélé que les indicateurs financiers tels que le revenu annuel, le montant du prêt et la valeur des actifs sont fortement interdépendants, soulignant leur importance dans l’évolution des prêts, tandis que les scores CIBIL ont une forte co.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

L’auteur ne déclare aucun conflit d’intérêts lié à cette recherche.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Cette recherche a été financée par l’Université VIT-AP, Amaravati, Inde.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Kagglehttps://www.kaggle.com/
Pandashttps://pandas.pydata.org/
Bibliothèque de modèlesIBMhttps://www.ibm.com

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. European Systemic Risk Board. Reports of the Advisory Scientific Committee. , Elsevier. (2012).
  2. Vives, X. The impact of FinTech on banking. Eur Econ. 2, 97-105 (2017).
  3. Jacobides, M. G., Drexler, M., Rico, J. Rethinking the future of financial services: A structural and evolutionary perspective on regulation.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Stacking EnsembleLoan Approval PredictionMachine Learning TechniquesDigital LendingPeer To Peer LendingAlgorithmic Risk AssessmentGradient BoostingXGBoost ModelCredit ScoringFinancial Inclusion

Related Articles