$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
Im Kontext der globalen digitalen Bildungstransformation wurde die automatisierte Schreibbewertung (AWE) aufgrund ihrer Echtzeit- und standardisierten Vorteile weit verbreitet übernommen; traditionelle, genauigkeitsorientierte Rahmenwerke vernachlässigen jedoch oft Gerechtigkeitsanliegen und die Wahrnehmung der Lernenden, was Transparenz und pädagogischen Wert einschränkt. Um diese Einschränkung zu beheben, schlägt diese Forschung ein erklärbares KI-(XAI)-Framework vor, das transparentes und interpretierbares Feedback bietet, sodass Lernende automatisierte Evaluation verstehen und vertrauen können, und integriert ein mehrstufiges Validierungsmodell, das Three-Level Evaluation Framework (TLEF), das technische Genauigkeit, Gruppen- und Einzelgerechtigkeit sowie die Wahrnehmung der Lernenden abdeckt, zusammen mit dem AI Fairness Mediation Model (AFMM). Mit geschichteter Zufallsstichprobe wurden Daten von 764 mehrsprachigen Lernenden (Muttersprachler von Englisch, Chinesisch und Spanisch) auf den Niveaus A2 bis C1 (CEFR) durch Schreibaufgaben, doppelte Bewertung durch KI- und menschliche Experten sowie strukturierte Fragebögen erhoben. Anstatt einzelne Tests aufzulisten, wurde eine multiple statistische Analyse eingesetzt, um Validität, Fairness und die Beziehung zwischen Lernenden und Wahrnehmung zu untersuchen. Statistische Analysen kombinierten Korrelation, Root Mean Square Error (RMSE), Equalized Odds Testing und Structural Equation Modeling (SEM). Die Ergebnisse zeigen, dass das KI-unterstützte Schreibbewertungssystem (AWE) (ETS-Kriterium) zwar eine Gesamtvalidität erzielt (r = 0,82), signifikante Unterschiede jedoch bestehen: Chinesische Muttersprachler zeigen die geringste Übereinstimmung mit menschlichen Bewertern (0,72) und den höchsten RMSE (Median 2,15), Fairness-Bias sind bei niedrigeren Kompetenzniveaus am ausgeprägtesten (ΔEO = 0,15 für A2-Lernende), und wahrgenommene Fairness vermittelt vollständig den Zusammenhang zwischen wahrgenommener Genauigkeit und Lernzufriedenheit. wobei die Kompetenz die Fairness-Sensibilität moderiert. Indem Fairness und Wahrnehmung als wesentliche Dimensionen der Erklärbarkeit neu definiert werden, stärkt die Forschung die theoretische Grundlage von AWE und bietet einen praktischen Weg zur Erhöhung von Transparenz, Gerechtigkeit und sozialer Akzeptanz in Bildungstechnologien.