Research Article

機械学習技術を用いたローン承認予測のためのスタッキングアンサンブルアプローチ

DOI:

10.3791/68832

September 23rd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

本研究では、XGBoost、CatBoost(勾配ブースティングモデル)、LightGBM(Efficient Gradient Boosting Model)、AdaBoost、Extra Treesを統合したスタッキングアンサンブルモデルを開発し、Kaggleデータを用いた融資承認を予測します。98%の精度を達成し、収入や信用スコアなどの主要な予測因子を特定し、ローンの承認および/または拒否に関する公正で効率的な決定を促進します。

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

デジタル融資とフィンテックのイノベーションは、既存の銀行システムを覆し、世界中の国々の金融包摂と信用の利用可能性を変えました。この調査では、ピアツーピア (P2P) およびデジタル融資プラットフォームがどのように変化しているかを調査し、人工知能や機械学習などのテクノロジーが融資の承認方法をどのように変えているかを強調します。文献を徹底的に調査すると、アルゴリズムによるリスク評価、顧客の信頼、金融排除、規制の抜け穴など、デジタル融資エコシステムにおける機会と問題が浮き彫りになります。本論文では、これらの課題に対処するために、スタッキングアンサンブルモデルを用いてローン承認を正確に予測する強力な機械学習アプローチを提案する。データは、トレーニングテストのパーティショニング、探索的分析、および申請者の人口統計、財務特性、信用履歴を含む一般にアクセス可能なKaggleデータセットを使用したラベルエンコーディングを使用して前処理されました。XGBoost をメタ学習器として機能するアンサンブルには、Gradient Boosting Model、Efficient Gradient Boosting、AdaBoost、および Extra Trees 分類器が基本学習器として組み込まれています。98% の精度で、モデルは、精度、精度、再現率、F1 スコア、およびエラー メトリック (MAE- 平均絶対誤差、MSE- 平均二乗誤差、および RMSE- 二乗平均平方根誤差) などの尺度を使用して評価されました。相関研究によると、資産、収入、CIBIL スコアなどの要因がローンの承認に大きな影響を与えます。従来の方法よりも優れたパフォーマンスを発揮したこのモデルは、両方のクラスでバランスと一般化を示しました。自動化されたデータ駆動型の信用決定におけるこれらのモデルの有用性は、論文の結論で強調されています。

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

銀行業界のテクノロジー変革の最新段階では、既存の銀行システムの外から破壊的な新しい金融サービスプロバイダーが市場に参入しています1.ビッグテック(主に直接または金融機関との融資に重点を置いた大手テクノロジー企業)とフィンテック(P2P融資や従来の銀行に代わるオンラインクレジットなどのモデルを含む金融テクノロジー)企業は金融セクターに大きく進出しており、銀行がデジタル環境に適応しようと努力しているにもかかわらず、従来の銀行業務に課題をもたらしています2.この急速な進化は金融エコシステムの変化を示しており、非伝統的なプレーヤーが金融サービスへのアクセスと提供の方法をますます再構築しています3.デジタル融資の出現は銀行信用と負の相関関係があり、新しい貸し手が市場に参入するにつれて、従来の銀行業務が代替デジタル信用に取って代わられる可能性があることを示唆しています4.この移行は、2008年の世界金融危機(GFC)によってさらに促進され、金融サービスに対する顧客の信頼が大幅に低下し、金融テクノロジーやフィンテックベンチャーの拡大を促進しました5.フィンテックとは、テクノロジーと金融の組み合わせを表す用語であり、金融ソリューションを提供する....

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

データ収集

この調査では、Kaggle で利用可能なローン承認予測データセットを利用しました。データセットは2025年2月に抽出され、ローンデータの評価とローン承認結果の予測を目的とした4269件のレコードで構成されています。これには、雇用状況、扶養家族、自営業者、ローン金額、ローン期間、CIBIL スコア、財務背景、ローン固有の属性など、申請者の人口統計プロファイルに関する詳細情報で構成される 12 の列が含まれています。データセットはPandasライブラリを使用してインポートされ、df.head()を使用して視覚的に検査され、その構造と品質が理解されました。

データの前処理

データの前処理段階では、最初のステップでは、予測値がなく、モデルにノイズが導入される可能性があるため、識別子列 (loan_id) を削除しました。2 番目のステップでは、教育、自営業者、loan_statusなどのカテゴリ変数を数値表現に変換するラベル エンコーディングが含まれていました。この変換は、sklearn.preprocessing モジュールの Label Encoder を使用して実行されました。具体的には、教育は卒業生の場合は 0、卒業していない場....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

特徴相関分析

特徴相関ヒートマップ (図 2) は、さまざまな属性間の相互関係に関する有用な情報を提供しました。収入、年間融資額、高級資産価値や銀行資産価値などの資産関連変数との間には強い正の相関関係が見られ、申請者の財務状況が融資評価において重要であることが示されました。興味深いことに、CIBILスコアはローンステータスとかなりの負の相関関係(-0.77)があり、クレジットスコアが高い申請者はローンが付与される可能性が有意に高いことを示しており、これは一般的な金融リスク評価方法と一致しています。

混同行列の評価

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ローン承認予測のためのスタッキング アンサンブル モデルは、さまざまな評価指標にわたって非常に優れたパフォーマンスを発揮し、優れた精度と信頼性を示しています。相関ヒートマップでは、年収、融資額、資産価値などの財務指標が強く相互に関連しており、融資の進化におけるその重要性が強調されているのに対し、CIBILスコアは融資状況と強い負の相関関係があり、信用力評価におけるCIBILスコアの役割が強化されていることが明らかになりました。モデルの混同行列はエラー率が低く、854例中839例を正確に検出し、誤分類はわずか15例でした。分類測定では、全体的な精度は 98% で、精度、想起率、F-1 スコアは、受け入れられたクラスと拒否されたクラスの両方で一貫して 0.98 以上であり、重大なクラスの不均衡やバイアスがないことを示しています。MAE、MSE、RMSEなどの誤差行列はすべて低く、モデルが堅牢で正確に予測されたことを示しています。視覚化メトリックは、両方のクラスにわたるモデルのバランスのとれた一貫したパフォーマンスを強調しました。勾配ブースティング モデル、効率的な勾配ブース.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

著者は、この研究に関連する利益相反を宣言しません。

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

この研究は、インドのアマラヴァティにある VIT-AP 大学の支援を受けました。

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
カグルhttps://www.kaggle.com/
パンダhttps://pandas.pydata.org/
モデルライブラリIBMhttps://www.ibm.com

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. European Systemic Risk Board. Reports of the Advisory Scientific Committee. , Elsevier. (2012).
  2. Vives, X. The impact of FinTech on banking. Eur Econ. 2, 97-105 (2017).
  3. Jacobides, M. G., Drexler, M., Rico, J. Rethinking the future of financial services: A structural and evolutionary perspective on regulation.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Stacking EnsembleLoan Approval PredictionMachine Learning TechniquesDigital LendingPeer To Peer LendingAlgorithmic Risk AssessmentGradient BoostingXGBoost ModelCredit ScoringFinancial Inclusion

Related Articles