$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
בהקשר של טרנספורמציה דיגיטלית חינוכית גלובלית, הערכת כתיבה אוטומטית (AWE) אומצה באופן נרחב בזכות יתרונותיה בזמן אמת וסטנדרטיים; עם זאת, מסגרות מסורתיות הממוקדות בדיוק לעיתים מתעלמות מדאגות של שוויון ותפיסות התלמידים, ובכך מגבילות שקיפות וערך חינוכי. כדי להתמודד עם מגבלה זו, מחקר זה מציע מסגרת AI ניתנת להסבר (XAI) שנועדה לספק משוב שקוף וניתן לפרשנות, לאפשר ללומדים להבין ולסמוך על הערכה אוטומטית, ומשלב מודל אימות רב-רמתי – מסגרת ההערכה התלת-רמתית (TLEF), הכוללת דיוק טכני, שוויון קבוצתי ואישי, ותפיסת הלומדים, יחד עם מודל הגינות בינה מלאכותית (AFMM). באמצעות דגימה אקראית שכבתית, נאספו נתונים מ-764 לומדים רב-לשוניים (דוברי אנגלית, סינית וספרדית) לאורך רמות מסגרת אירופה משותפת לשפות (CEFR) A2 עד C1, באמצעות משימות כתיבה, ניקוד כפול על ידי מומחים בינה מלאכותית ואנושיים, ושאלונים מובנים. במקום למנות מבחנים בודדים, נעשה שימוש בניתוח סטטיסטי מרובה כדי לבחון תוקף, הוגנות והקשר בין הלומד לתפיסה. ניתוחים סטטיסטיים שילבו קורלציה, שגיאת ממוצע ריבועי שורשית (RMSE), בדיקות סיכויים מאוזנים ומידול משוואות מבניות (SEM). הממצאים מגלים שבעוד שמערכת ההערכה בכתיבה בסיוע AI (AWE) (קריטריון ETS) משיגה תוקף כולל (r = 0.82), קיימים פערים משמעותיים: דוברי שפת אם סינית מראים את ההסכמה הנמוכה ביותר עם המערכים האנושיים (0.72) ואת ה-RMSE הגבוה ביותר (חציון 2.15), הטיות ההגינות בולטות במיוחד ברמות מיומנות נמוכות יותר (ΔEO = 0.15 ללומדים A2), וההגינות הנתפסת מתווכת במלואה את הקשר בין דיוק נתפס לשביעות רצון הלומדים. עם מיומנות ורגישות להגינות. על ידי מסגור מחדש של הוגנות ותפיסה כממדים חיוניים של ההסבר, המחקר מחזק את הבסיס התיאורטי של AWE ומספק מסלול מעשי להגדלת השקיפות, השוויון והקבלה החברתית בטכנולוגיות חינוכיות.