Research Article

גישת אנסמבל ערימה לחיזוי אישור הלוואות באמצעות טכניקות למידת מכונה

DOI:

10.3791/68832

September 23rd, 2025

In This Article

Summary

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מחקר זה מפתח מודל אנסמבל ערימה המשלב XGBoost, CatBoost (Gradient Boosting Model), LightGBM (Efficient Gradient Boosting Model), AdaBoost ו-Extra Trees כדי לחזות אישורי הלוואות באמצעות נתוני Kaggle. הוא משיג דיוק של 98%, מזהה מנבאים מרכזיים כמו הכנסה ודירוג אשראי, ומקדם החלטות הוגנות ויעילות על אישור ו/או דחיית הלוואה.

Abstract

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

הלוואות דיגיטליות וחידושים בתחום הפינטק הפכו את מערכות הבנקאות המבוססות, ושינו את ההכללה הפיננסית ואת זמינות האשראי במדינות ברחבי העולם. מחקר זה בוחן כיצד פלטפורמות עמית לעמית (P2P) והלוואות דיגיטליות משתנות, תוך שימת דגש על האופן שבו טכנולוגיות כמו בינה מלאכותית ולמידת מכונה משנות את אופן אישור ההלוואות. מחקר מעמיק של הספרות מדגיש את ההזדמנויות והבעיות במערכת האקולוגית של ההלוואות הדיגיטליות, כגון הערכת סיכונים אלגוריתמית, אמון לקוחות, הדרה פיננסית ופרצות רגולטוריות. מאמר זה מציע גישה חזקה של למידת מכונה המשתמשת במודל אנסמבל ערימה כדי לחזות במדויק אישורי הלוואות על מנת לטפל בבעיות אלה. הנתונים עובדו מראש באמצעות חלוקת מבחני רכבת, ניתוח גישוש וקידוד תוויות באמצעות מערך נתונים נגיש לציבור של Kaggle שכלל נתונים דמוגרפיים של המועמדים, מאפיינים פיננסיים והיסטוריית אשראי. כאשר XGBoost משמש כמטא-לומד, האנסמבל משלב את מודל הגברת השיפוע, הגברת שיפוע יעילה, AdaBoost ומסווגים של עצים נוספים כלומדים בסיסיים. עם דיוק של 98%, המודל הוערך באמצעות מדדים הכוללים דיוק, דיוק, זיכרון, ציון F1 ומדדי שגיאה (MAE- שגיאה מוחלטת ממוצעת, MSE- שגיאה ממוצעת בריבוע ו- RMSE- שגיאה ממוצעת ריבועית שורש). על פי מחקרי מתאם, לגורמים הכוללים נכסים, הכנסה וציוני CIBIL יש השפעה משמעותית על אישורי הלוואות. המודל עלה על שיטות קונבנציונליות, והראה איזון והכללה בשתי המחלקות. התועלת של מודלים אלה לקביעות אשראי אוטומטיות ומבוססות נתונים מודגשת בסיכום המאמר.

Introduction

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

בשלב האחרון של הטרנספורמציה הטכנולוגית של תעשיית הבנקאות, ספקי שירותים פיננסיים חדשים משבשים מחוץ למערכת הבנקאית המבוססת נכנסו לשוק1. חברות ביג-טק (חברות טכנולוגיה גדולות המתמקדות בעיקר בהלוואות ישירות או עם מוסדות פיננסיים) ופינטק (טכנולוגיה פיננסית, כולל מודלים כמו הלוואות P2P וחלופות אשראי מקוונות לבנקים מסורתיים) עושות כניסות משמעותיות למגזר הפיננסי, ומציבות אתגר לבנקאות המסורתית למרות מאמצי הבנקים להסתגל לנוף הדיגיטלי2. התפתחות מהירה זו מסמנת שינוי במערכת האקולוגית הפיננסית, שבה שחקנים לא מסורתיים מעצבים מחדש יותר ויותר את האופן שבו ניגשים לשירותים פיננסיים ומסופקים

Access restricted. Please log in or start a trial to view this content.

Protocol

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

איסוף נתונים

מחקר זה השתמש במערך הנתונים של חיזוי אישור הלוואות הזמין ב-Kaggle. מערך הנתונים חולץ בפברואר 2025 ומורכב מ-4269 רשומות שמטרתן להעריך נתוני הלוואות ולחזות את תוצאות אישור ההלוואות. הוא כולל 12 עמודות הכוללות מידע מפורט על הפרופילים הדמוגרפיים של המועמדים, כגון מצב תעסוקה, תלויים, עצמאים, סכום הלוואה, תקופת הלוואה, ציוני CIBIL, רקע פיננסי ומאפיינים ספציפיים להלוואה. מערך הנתונים יובא באמצעות ספריית Pandas ונבדק ויזואלית באמצעות df.head () כדי להבין את המבנה והאיכות שלו.

עיבוד מקדים של נתונים

במהלך שלב העיבוד המק....

Access restricted. Please log in or start a trial to view this content.

Results

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

ניתוח מתאם תכונות

מפת החום של מתאם התכונות (איור 2) נתנה מידע שימושי על יחסי הגומלין בין תכונות שונות. נמצאו מתאמים חיוביים חזקים בין הכנסה, סכום הלוואה שנתי ומשתנים הקשורים לנכסים כגון שווי נכסי יוקרה ושווי נכסי בנק, מה שמוכיח כי הפרופיל הפיננסי של המבקש חשוב בהערכת ההלוואה. מעניין לציין שלציון CIBIL היה מתאם שלילי משמעותי (-0.77) .......

Access restricted. Please log in or start a trial to view this content.

Discussion

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מודל אנסמבל הערימה לחיזוי אישור הלוואות מתפקד בצורה יוצאת דופן על פני מדדי הערכה שונים, ומפגין דיוק ואמינות רבה. מפת החום של המתאמים חשפה כי אינדיקטורים פיננסיים כגון הכנסה שנתית, סכום הלוואה וערכי נכסים קשורים זה בזה מאוד, ומדגישים את חשיבותם בהתפתחות ההלוואות, בעוד שלציוני CIBIL יש מתאם שלילי חזק עם מצב ההלוואה, מה שמחזק את תפקידם בהערכת כדאיות האשראי. למטריצת הבלבול של המודל היה שיעור שגיאות נמוך, וזיהתה במדויק 839 מתוך 854 דוגמאות עם 15 סיווגים שגויים בלבד. מדדי הסיווג הראו דיוק כולל.......

Access restricted. Please log in or start a trial to view this content.

Disclosures

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

המחבר מצהיר שאין ניגוד עניינים הקשור למחקר זה.

Acknowledgements

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,

מחקר זה נתמך על ידי אוניברסיטת VIT-AP, אמראווטי, הודו.

....

Access restricted. Please log in or start a trial to view this content.

Materials

List of materials used in this article
NameCompanyCatalog NumberComments
קגלhttps://www.kaggle.com/
פנדותhttps://pandas.pydata.org/
ספריית מודליםIBMhttps://www.ibm.com

References

Loading...
$$\rightleftharpoonup{xx}$$ $$\longleftharp{xx}$$, $$\longrightharp{xx}$$,
  1. European Systemic Risk Board. Reports of the Advisory Scientific Committee. , Elsevier. (2012).
  2. Vives, X. The impact of FinTech on banking. Eur Econ. 2, 97-105 (2017).
  3. Jacobides, M. G., Drexler, M., Rico, J. Rethinking the future of financial services: A structural and evolutionary perspective on regulation.

Access restricted. Please log in or start a trial to view this content.

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Tags

Stacking EnsembleLoan Approval PredictionMachine Learning TechniquesDigital LendingPeer To Peer LendingAlgorithmic Risk AssessmentGradient BoostingXGBoost ModelCredit ScoringFinancial Inclusion

Related Articles