T/CA 605.3-2026 大模型综合能力评价技术规范

T/CA 605.3-2026 Technical Specification for Comprehensive Evaluation of Large Models

团体标准 中文(简体) 现行 页数:0页 | 格式:PDF

基本信息

标准号
T/CA 605.3-2026
标准类型
团体标准
标准状态
现行
中国标准分类号(CCS)
-
国际标准分类号(ICS)
发布日期
2026-02-05
实施日期
2026-02-10
发布单位/组织
-
归口单位
中国通信工业协会
适用范围
本文件规定了大模型的自然语言处理聚焦文本分类、信息抽取、文本问答等核心基础任务;图像识别聚焦静态图像分类、目标检测、静态图像分割等基础视觉任务;语音识别聚焦语音转文本、声纹识别、环境音分类等基础语音任务的评价。 本文件适用于大模型研发机构、应用服务提供商、第三方评价机构、行业用户等主体,对大模型在自然语言处理、图像识别、语音识别三类基础任务的性能进行评估与测试。 本文件不适用于多模态复杂交互、行业深度定制等超出基础任务范畴的评价

发布历史

文前页预览

当前资源暂不支持预览

研制信息

起草单位:
北京万界智算科技有限公司、北京万界数据科技有限责任公司、京东科技信息技术有限公司、北京深度算源科技有限公司、上海交通大学宁波人工智能研究院、温州市数据局算力和模型处、北京云之印科技有限公司、武汉大学经济与管理学院、宜创(北京)科技有限公司、杭州炎炎界墨数字科技有限公司、山东创润实业有限公司、福建省云之印控股有限责任公司、北京云之畔数字科技有限公司、北京国印智联科技有限公司
起草人:
刘高阳、王小鹏、张江涛、刘鑫悦、刘阳、陈永祥、王晨光、周旋、卫达、杜旌、宜博、李昕、张宇、陈楚君、王家祥、刘海连
出版信息:
页数:- | 字数:- | 开本: -

内容描述

暂无内容

定制服务

    推荐标准