T/SAIAS 0013.4-2023 教育通用人工智能大模型 第4部分:测评规范
T/SAIAS 0013.4-2023
团体标准
中文(简体)
现行
页数:0页
|
格式:PDF
基本信息
标准号
T/SAIAS 0013.4-2023
标准类型
团体标准
标准状态
现行
发布日期
2023-07-08
实施日期
2023-08-08
发布单位/组织
-
归口单位
上海市人工智能行业协会
适用范围
范围:本文件规定了教育通用人工智能大模型的测评框架、测评指标、测评维度和测评方法。
本文件适用于教育通用人工智能大模型的基础能力和教学功能的测评;
主要技术内容:本文件规定了一系列用于评估大模型全方面能力的测评指标、综合测试模型本身的自然语言处理能力、模型应用于各教育场景的能力、模型的价值观、安全性和数据合规性等各个方面。对以上每一个维度的测评、都相应需要一个高质量的动态更新的测评数据。1.教育通用人工智能大模型测评框架包括测评指标、测评维度、测评数据集、模型基础能力测评和安全风险测评五个部分。2.本文件定义了3个一级测评指标和12个二级测评指标,4个一级测评维度、19个二级测评维度和76个三级测评维度。每一个三级测评维度、需要用相应的测试数据集进行相应指标的测评。3.所有测评维度可以单独测试或者选择部分测试维度组成一个测试子集、或者选择全集进行组合测试。模型基础能力和安全风险测评维度可以参考已有的团体、行业、国家或国际标准
发布历史
-
2023年07月
文前页预览
当前资源暂不支持预览
研制信息
- 起草单位:
- 上海交通大学、华东师范大学、百度网讯科技有限公司、科大讯飞股份有限公司、华为技术有限公司、上海市人工智能行业协会、网易有道信息技术(北京)有限公司、新华三技术有限公司、阿里云计算有限公司、北京高思博乐教育科技股份有限公司、思必驰科技股份有限公司、清华大学、北京邮电大学、国家开放大学、华中师范大学、江苏师范大学、青岛伟东云教育集团有限公司、山东悦知教育科技有限公司、北京世纪好未来教育科技有限公司、第四范式(北京)技术有限公司、北京市第二十中学、江苏中教科信息技术有限公司、成都康赛信息技术有限公司
- 起草人:
- 申丽萍、吴永和、王士进、张军城、李青、吴砥、卢海燕、钟俊浩、张军、竺林、黄瑾、应振宇、吕雪莹、杨坤、陈露、陈曦、赵佳宝、张博、刘清彪、贺媛婧、刘吉兵、岳鹏、郑曌、唐雪飞、缪庆亮、李春晖、何朝帆、兰焜耀
- 出版信息:
- 页数:- | 字数:- | 开本: -
内容描述
暂无内容
推荐标准
- T/TIC 087-2025 废有机溶剂综合利用产品规范 2025-01-10
- T/TIC 086-2025 废有机溶剂综合利用技术规范 2025-01-10
- T/CERS 0062-2024 云数据中心温室气体减排量计算技术规范 2024-12-24
- T/CI 429-2024 绿色设计产品评价技术规范 锂离子电池用复合铜箔 2024-07-15
- T/CASMES 512-2025 隔声防盗门 2025-02-14
- T/CTHDESA T/HZHX-001-2025 城市公共厕所运行维护安全作业规程 2025-01-09
- T/HEBQIA 349-2025 低压喷吹离线脉冲袋式除尘器 2025-02-20
- T/CPQS E00078-2025 带空净集成设备的室内空气健康及舒适性质量评价规范 2025-01-13
- T/SPMA 001-2025 生活饮用水中15种消毒副产物的测定 液液萃取/气相色谱法 2025-02-14
- T/CPASE GT031-2024 涉危险化学品特种设备重大危险源的判定原则 2024-06-17