本研究开发了一个三层评估框架和公平调解模型,用于评估AI辅助的英语书写系统。通过764个跨语言样本,结果显示了准确率差异、对非母语学习者(尤其是中文A2水平)的公平偏见以及公平感知作为用户满意度的关键调节因素,提供了理论和实践上的启示。
Access restricted. Please log in or start a trial to view this content.
Access restricted. Please log in or start a trial to view this content.
Access restricted. Please log in or start a trial to view this content.
Access restricted. Please log in or start a trial to view this content.
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| Data Storage System | 加密、访问控制的服务器用于存储匿名数据。 | 机构服务器 | 存储-002 |
| ETS标准系统 | 用于评分写作任务的AI辅助写作评估系统。 | 教育测试服务(ETS) | ETS-001 |
| 公平与准确分析工具 | RMSE、均衡赔率和统计分析工具。 | 自定义脚本/统计包 | 工具-FA-001 |
| <强>人类专家评级 | 由三位拥有超过10年经验的语言学家提供独立评级。 | 内部评级员 | HR-EXP-003 |
| <强>学习者感知问卷 | 一份包含8项公平与满意度的问卷,评分为7分李克特量表。 | 内部开发 | QUES-008 |
| 统计软件(R 4.3.1) | 用于数据分析,包括结构方程建模(SEM)。 | R基金会 | R-SW-431 |
| <强>分层随机抽样数据 | 从CEFR A2至C1级别的764名多语学习者收集的数据。 | 研究参与者 | 数据-764 |
| <强>写作任务提示 | 三个标准化论文题目,分别涉及全球化、在线教育和人工智能伦理。 | 基于 Moodle 的平台 | 提示-003 |
Access restricted. Please log in or start a trial to view this content.
Request permission to reuse the text or figures of this JoVE article
Request Permission