T/SAIAS 040-2025 以人为中心的大模型评测方法
T/SAIAS 040-2025 Human-Centric Testing and Evaluation Methods for Large Models
团体标准
中文(简体)
现行
页数:0页
|
格式:PDF
基本信息
标准号
T/SAIAS 040-2025
标准类型
团体标准
标准状态
现行
发布日期
2025-12-18
实施日期
2025-12-19
发布单位/组织
-
归口单位
上海市人工智能行业协会
适用范围
本文件描述了以人为中心的大模型评测维度、评测方法和评测条件等。
本文件适用于以人为中心对大模型的能力进行测试和评估,涵盖理解与生成能力两个方面,并为大模型的设计、开发、应用提供参考。
本文件描述了以人为中心的大模型评测维度、评测方法和评测条件等。
本文件适用于以人为中心对大模型的能力进行测试和评估,涵盖理解与生成能力两个方面,并为大模型的设计、开发、应用提供参考
发布历史
-
2025年12月
文前页预览
当前资源暂不支持预览
研制信息
- 起草单位:
- 上海人工智能创新中心、上海市人工智能行业协会、上海交通大学、华东师范大学、蚂蚁科技集团股份有限公司、中国移动通信集团有限公司、北京三快在线科技有限公司、天翼视联科技有限公司、腾讯科技(深圳)有限公司、上海建工四建集团有限公司
- 起草人:
- 翟广涛、石伯明、张子澄、郭一锦、钟俊浩、赵春昊、闵雄阔、刘笑宏、胡孟晗、孙伟、曹汐、秦日臻、彭晋、孙曦、曹雪植、张国稳、应江勇、李明阳、黄利贤、方超、张英楠
- 出版信息:
- 页数:- | 字数:- | 开本: -
内容描述
暂无内容
定制服务
推荐标准
- GB/T 8000-2001 热交换器用黄铜管残余应力检验方法 氨熏试验法 2001-03-26
- GB 18350-2001 变性燃料乙醇 2001-04-02
- CJ/T 130-2001 再生树脂复合材料水箅 2001-03-28
- GB/T 14805.9-2001 用于行政、商业和运输业电子数据交换的应用级语法规则(语法版本号:4) 第9部分:安全密钥和证书管理报文(报文类型为KEYMAN) 2001-04-09
- GB/T 15635.2-2001 用于行政、商业和运输业电子数据交换的复合数据元目录 第2部分:交互式电子数据交换复合数据元目录 2001-04-09
- GB/T 15634.2-2001 用于行政、商业和运输业电子数据交换的段目录 第2部分:交互式电子数据交换段目录 2001-04-09
- GB/T 8618-2001 制盐工业主要产品取样方法 2001-04-08
- GB 18351-2001 车用乙醇汽油 2001-04-02
- GB/T 12906-2001 中国标准书号条码 2001-04-09
- GB/T 15947-2001 用于行政、商业和运输业电子数据交换的报文设计规则 2001-04-09