$$\rightleftharpoonup{xx}$$
$$\longleftharp{xx}$$,
$$\longrightharp{xx}$$,
En el contexto de la transformación digital educativa global, la evaluación automatizada de escritura (AWE) ha sido ampliamente adoptada debido a sus ventajas en tiempo real y estandarizadas; Sin embargo, los marcos tradicionales orientados a la precisión suelen descuidar las preocupaciones sobre la equidad y las percepciones de los alumnos, limitando así la transparencia y el valor educativo. Para abordar esta limitación, esta investigación propone un marco de IA explicable (XAI) diseñado para proporcionar retroalimentación transparente e interpretable, permitiendo a los estudiantes comprender y confiar en la evaluación automatizada, e integra un modelo de validación multinivel, el Marco de Evaluación de Tres Niveles (TLEF), que abarca la precisión técnica, la equidad tanto en grupo como en el individual, y la percepción del alumno, junto con el Modelo de Mediación de Equidad de IA (AFMM). Utilizando muestreo aleatorio estratificado, se recogieron datos de 764 estudiantes multilingües (hablantes nativos de inglés, chino y español) a través de los niveles A2 a C1 del Marco Europeo Común de Referencia para las Lenguas (MCER) mediante tareas de redacción, doble puntuación por parte de expertos en IA y humanos, y cuestionarios estructurados. En lugar de listar pruebas individuales, se empleó análisis estadísticos múltiples para examinar la validez, la equidad y la relación entre el aprendiz y la percepción. Los análisis estadísticos combinaron correlación, error cuadrático medio raíz (RMSE), pruebas de probabilidades igualadas y modelado de ecuaciones estructurales (SEM). Los hallazgos revelan que, aunque el sistema de evaluación de escritura asistida por IA (AWE) (Criterio ETS) alcanza validez global (r = 0,82), persisten disparidades significativas: los hablantes nativos de chino muestran la menor concordancia con los evaluadores humanos (0,72) y la RMSE más alta (mediana 2,15), los sesgos de equidad son más pronunciados en niveles de competencia más bajos (ΔEO = 0,15 para los estudiantes A2), y la equidad percibida media plenamente el vínculo entre la precisión percibida y la satisfacción del alumno, con competencia en la sensibilidad a la equidad. Al replantear la equidad y la percepción como dimensiones esenciales de la explicabilidad, la investigación refuerza la base teórica de la AWE y proporciona un camino práctico para aumentar la transparencia, la equidad y la aceptación social en las tecnologías educativas.