Research Article

Stacking Ensemble-benadering voor het voorspellen van de goedkeuring van leningen met behulp van machine learning-technieken

DOI:

10.3791/68832

September 23rd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Deze studie ontwikkelt een stapelensemblemodel dat XGBoost, CatBoost (Gradient Boosting Model), LightGBM (Efficient Gradient Boosting Model), AdaBoost en Extra Trees integreert om leninggoedkeuringen te voorspellen met behulp van Kaggle-gegevens. Met een nauwkeurigheid van 98% identificeert het belangrijke voorspellers zoals inkomen en kredietscore, waardoor eerlijke, efficiënte beslissingen over de goedkeuring en/of afwijzing van leningen worden bevorderd.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Digitale leningen en fintech-innovaties hebben gevestigde banksystemen op zijn kop gezet, waardoor financiële inclusie en beschikbaarheid van krediet in landen over de hele wereld zijn veranderd. Deze studie onderzoekt hoe peer-to-peer (P2P) en digitale leenplatforms veranderen, en benadrukt hoe technologieën zoals kunstmatige intelligentie en machine learning de manier veranderen waarop leningen worden goedgekeurd. Een grondige studie van de literatuur belicht de kansen en problemen in het ecosysteem van digitale kredietverlening, zoals algoritmische risicobeoordeling, klantvertrouwen, financiële uitsluiting en mazen in de regelgeving. Dit artikel stelt een sterke machine learning-benadering voor die gebruikmaakt van een stapelensemblemodel om de goedkeuring van leningen nauwkeurig te voorspellen om deze problemen aan te pakken. De gegevens werden voorbewerkt met behulp van train-test partitionering, verkennende analyse en labelcodering met behulp van een openbaar toegankelijke Kaggle-dataset die demografische gegevens, financiële kenmerken en kredietgeschiedenis van sollicitanten bevatte. Met XGBoost als meta-leerling, bevat het ensemble de classificaties Gradient Boosting, Efficient Gradient Boosting, AdaBoost en Extra Trees als basisleerlingen. Met een nauwkeurigheid van 98% werd het model beoordeeld aan de hand van metingen zoals nauwkeurigheid, precisie, herinnering, F1-score en foutmetrieken (MAE-Mean Absolute Error, MSE-Mean Squared Error en RMSE-Root Mean Square Error). Volgens correlatiestudies hebben factoren zoals activa, inkomen en CIBIL-scores een aanzienlijke invloed op de goedkeuring van leningen. Het model presteerde beter dan conventionele methoden en vertoonde evenwicht en generalisatie in beide klassen. Het nut van deze modellen voor geautomatiseerde, datagestuurde kredietbepalingen wordt benadrukt in de conclusie van het artikel.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

In de laatste fase van de technologische transformatie van de banksector zijn disruptieve nieuwe financiële dienstverleners van buiten het gevestigde banksysteem op de markt gekomen1. BigTech (grote technologiebedrijven die zich voornamelijk richten op directe leningen of met financiële instellingen) en FinTech (financiële technologie, inclusief modellen zoals P2P-leningen en online kredietalternatieven voor traditionele banken) bedrijven maken een aanzienlijke opmars in de financiële sector en vormen een uitdaging voor traditioneel bankieren, ondanks de inspanningen van banken om zich aan te passen aan het dig....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dataverzameling

Deze studie maakte gebruik van de Loan Approval Prediction Dataset die beschikbaar is op Kaggle. De dataset is geëxtraheerd in februari 2025 en bestaat uit 4269 records die gericht zijn op het evalueren van leninggegevens en het voorspellen van de resultaten van de goedkeuring van leningen. Het bevat 12 kolommen met gedetailleerde informatie over de demografische profielen van aanvragers, zoals arbeidsstatus, personen ten laste, zelfstandigen, geleend bedrag, looptijd van de lening, CIBIL-scores, financiële achtergrond en leningspecifieke kenmerken. De dataset is geïmporteerd ....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Analyse van de correlatie van kenmerken

De feature correlation heatmap (Figuur 2) gaf nuttige informatie over de onderlinge relaties tussen verschillende attributen. Er werden sterke positieve correlaties gevonden tussen inkomen, jaarlijks geleend bedrag en activagerelateerde variabelen zoals de waarde van luxe activa en de waarde v.......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Het stapelensemblemodel voor het voorspellen van de goedkeuring van leningen presteert uitzonderlijk goed in verschillende evaluatiestatistieken en toont een grote nauwkeurigheid en betrouwbaarheid. Uit de correlaties heatmap bleek dat financiële indicatoren zoals jaarinkomen, geleend bedrag en activawaarden sterk met elkaar verbonden zijn, wat hun belang in de evolutie van leningen benadrukt, terwijl de CIBIL-scores een sterke negatieve correlatie hebben met de status van de lening, waa.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

De auteur verklaart geen belangenconflict met betrekking tot dit onderzoek.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

Dit onderzoek werd ondersteund door VIT-AP University, Amaravati, India.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
Kagglehttps://www.kaggle.com/
Pandashttps://pandas.pydata.org/
Model libraryIBMhttps://www.ibm.com

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. European Systemic Risk Board. Reports of the Advisory Scientific Committee. , Elsevier. (2012).
  2. Vives, X. The impact of FinTech on banking. Eur Econ. 2, 97-105 (2017).
  3. Jacobides, M. G., Drexler, M., Rico, J. Rethinking the future of financial services: A structural and evolutionary perspective on regulation.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Stacking EnsembleLoan Approval PredictionMachine Learning TechniquesDigital LendingPeer To Peer LendingAlgorithmic Risk AssessmentGradient BoostingXGBoost ModelCredit ScoringFinancial Inclusion

Related Articles