GB/T 45288.3-2025 人工智能 大模型 第3部分:服务能力成熟度评估
GB/T 45288.3-2025 Artificial intelligence—Large-scale model—Part 3:Service capability maturity assessment
基本信息
本文件适用于服务提供方和需求方对大模型平台、模型定制及推理运营服务的能力进行全面评估,也适用于指导大模型服务能力的规划、设计和实现。
发布历史
-
2025年01月
研制信息
- 起草单位:
- 中国电子技术标准化研究院、华为技术有限公司、浪潮云信息技术股份公司、清华大学、华为云计算技术有限公司、中国科学院自动化研究所、北京百度网讯科技有限公司、深圳市腾讯计算机系统有限公司、菲特(天津)检测技术有限公司、北京奇虎科技有限公司、北京航空航天大学、国能信息技术有限公司、麒麟合盛网络技术股份有限公司、上海市人工智能行业协会、上海燧原科技股份有限公司、阿里云计算有限公司、平头哥(上海)半导体技术有限公司、上海计算机软件技术开发中心、浙江大华技术股份有限公司、青岛海信电子技术服务有限公司、上海人工智能研究院有限公司、南方电网人工智能科技有限公司、航天信息股份有限公司、广东电网有限责任公司、北京大学长沙计算与数字经济研究院、北京大学、中国科学院软件研究所、蚂蚁科技集团股份有限公司、中国移动通信集团有限公司、马上消费金融股份有限公司、深圳云天励飞技术股份有限公司、深圳思谋信息科技有限公司、北京格灵深瞳信息技术股份有限公司、中国南方电网有限责任公司超高压输电公司、北京软件产品质量检测检验中心有限公司、中国电力科学研究院有限公司、上海文鳐信息科技有限公司、浪潮软件科技有限公司、浪潮电子信息产业股份有限公司、浪潮软件集团有限公司、中电科大数据研究院有限公司、上海商汤智能科技有限公司、中国电信集团有限公司、科大讯飞股份有限公司、中国电信股份有限公司北京研究院、中移(苏州)软件技术有限公司、中国科学院新疆理化技术研究所、杭州海康威视数字技术股份有限公司、上海文鳐信息科技有限公司、西北工业大学、云知声智能科技股份有限公司、北京工业大学、北京智芯微电子科技有限公司
- 起草人:
- 徐洋、马珊珊、于超、王莞尔、董建、陶建华、曹晓琦、鲍薇、黄现翠、马骋昊、郑佳佳、郑子木、朱贵波、王金桥、刘静、汪群博、杨旭、马同森、靳伟、刘海涛、曹彬、张向征、任海峰、刘祥龙、刘艾杉、张旭、陈曦、赵春昊、蒋燕、梅敬青、彭骏涛、张艺伯、陈敏刚、孔维生、刘微、刘常昱、宋海涛、任正国、邵彦宁、刘佳宁、周昊、杨超、孟令中、孙曦、金镝、李宽、王志芳、吕江波、胡全一、王宁、王志刚、孔昊、莫文昊、仲凯韬、王珂琛、刘璐、张天霖、蒋慧、刘敬谦、刘威辰、高建清、孟建、舒珏淋、商兴宇、李旭东、杨雅婷、钟凯伦、仲凯韬、张涛、梁家恩、刘峥、郑哲、武姗姗
- 出版信息:
- 页数:18页 | 字数:35 千字 | 开本: 大16开
内容描述
ICS35240
CCSL.70
中华人民共和国国家标准
GB/T452883—2025
.
人工智能大模型
第3部分服务能力成熟度评估
:
Artificialintelligence—Large-scalemodel—
Part3Servicecaabilitmaturitassessment
:pyy
2025-01-24发布2025-01-24实施
国家市场监督管理总局发布
国家标准化管理委员会
GB/T452883—2025
.
目次
前言
…………………………Ⅲ
引言
…………………………Ⅳ
范围
1………………………1
规范性引用文件
2…………………………1
术语和定义
3………………1
缩略语
4……………………1
概述
5………………………2
大模型服务类型
5.1……………………2
服务能力框架
5.2………………………2
评估指标
6…………………3
大模型平台
6.1…………………………3
大模型开发定制
6.2……………………7
大模型推理及运营
6.3…………………9
成熟度分级规则
7…………………………11
成熟度等级
7.1…………………………11
能力要求
7.2……………12
成熟度评估方法
8…………………………13
评分方法
8.1……………13
评估域权重
8.2…………………………13
计算方法
8.3……………13
成熟度等级判定
8.4……………………14
Ⅰ
GB/T452883—2025
.
前言
本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定
GB/T1.1—2020《1:》
起草
。
本文件是人工智能大模型的第部分已经发布了以下部分
GB/T45288《》3,GB/T45288:
第部分通用要求
———1:;
第部分评测指标与方法
———2:;
第部分服务能力成熟度评估
———3:。
请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别专利的责任
。。
本文件由全国信息技术标准化技术委员会提出并归口
(SAC/TC28)。
本文件起草单位中国电子技术标准化研究院华为技术有限公司浪潮云信息技术股份公司清华
:、、、
大学华为云计算技术有限公司中国科学院自动化研究所北京百度网讯科技有限公司深圳市腾讯计
、、、、
算机系统有限公司菲特天津检测技术有限公司北京奇虎科技有限公司北京航空航天大学国能信
、()、、、
息技术有限公司麒麟合盛网络技术股份有限公司上海市人工智能行业协会上海燧原科技股份有限
、、、
公司阿里云计算有限公司平头哥上海半导体技术有限公司上海计算机软件技术开发中心浙江大
、、()、、
华技术股份有限公司青岛海信电子技术服务有限公司上海人工智能研究院有限公司南方电网人工
、、、
智能科技有限公司航天信息股份有限公司广东电网有限责任公司北京大学长沙计算与数字经济研
、、、
究院北京大学中国科学院软件研究所蚂蚁科技集团股份有限公司中国移动通信集团有限公司
、、、、、
马上消费金融股份有限公司深圳云天励飞技术股份有限公司深圳思谋信息科技有限公司北京格灵
、、、
深瞳信息技术股份有限公司中国南方电网有限责任公司超高压输电公司北京软件产品质量检测检验
、、
中心有限公司中国电力科学研究院有限公司上海文鳐信息科技有限公司浪潮软件科技有限公司
、、、、
浪潮电子信息产业股份有限公司浪潮软件集团有限公司中电科大数据研究院有限公司上海商汤智
、、、
能科技有限公司中国电信集团有限公司科大讯飞股份有限公司中国电信股份有限公司北京研究院
、、、、
中移苏州软件技术有限公司中国科学院新疆理化技术研究所杭州海康威视数字技术股份有限公
()、、
司上海文鳐信息科技有限公司西北工业大学云知声智能科技股份有限公司北京工业大学北京智
、、、、、
芯微电子科技有限公司
。
本文件主要起草人徐洋马珊珊于超王莞尔董建陶建华曹晓琦鲍薇黄现翠马骋昊
:、、、、、、、、、、
郑佳佳郑子木朱贵波王金桥刘静汪群博杨旭马同森靳伟刘海涛曹彬张向征任海峰
、、、、、、、、、、、、、
刘祥龙刘艾杉张旭陈曦赵春昊蒋燕梅敬青彭骏涛张艺伯陈敏刚孔维生刘微刘常昱
、、、、、、、、、、、、、
宋海涛任正国邵彦宁刘佳宁周昊杨超孟令中孙曦金镝李宽王志芳吕江波胡全一王宁
、、、、、、、、、、、、、、
王志刚孔昊莫文昊仲凯韬王珂琛刘璐张天霖蒋慧刘敬谦刘威辰高建清孟建舒珏淋
、、、、、、、、、、、、、
商兴宇李旭东杨雅婷钟凯伦仲凯韬张涛梁家恩刘峥郑哲武姗姗
、、、、、、、、、。
Ⅲ
GB/T452883—2025
.
引言
大模型已成为人工智能发展的重要技术手段在引领产业变革中发挥重要作用国内外人工智能相
,,
关机构相继研究开发百余种大模型产品和评测榜单导致用户难以有效评价人工智能产品的技术水平
,
和服务能力旨在规定通用大模型的技术要求评测指标和服务能力拟由五个部分
。GB/T45288、,
构成
。
第部分通用要求目的在于确立大模型的参考架构规定通用技术要求
———1:。,。
第部分评测指标与方法目的在于确立大模型的评测指标描述评测方法
———2:。,。
第部分服务能力成熟度评估目的在于给出大模型服务能力成熟度等级及评估方法
———3:。。
第部分计算机视觉大模型目的在于定义计算机视觉大模型的概念和功能规定技术要求
———4:。,
和测试方法
。
第部分多模态大模型目的在于定义多模态大模型的概念和功能规定技术要求和测试
———5:。,
方法
。
Ⅳ
GB/T452883—2025
.
人工智能大模型
第3部分服务能力成熟度评估
:
1范围
本文件给出了大模型服务能力框架和评估指标描述了大模型服务能力成熟度等级划分及评估
,
方法
。
本文件适用于服务提供方和需求方对大模型平台模型定制及推理运营服务的能力进行全面评估
、,
也适用于指导大模型服务能力的规划设计和实现
、。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款其中注日期的引用文
。,
件仅该日期对应的版本适用于本文件不注日期的引用文件其最新版本包括所有的修改单适用于
,;,()
本文件
。
信息技术人工智能平台计算资源规范
GB/T42018—2022
3术语和定义
下列术语和定义适用于本文件
。
31
.
大模型平台large-scalemodelplatform
为开发或使用大模型提供各类资源的软硬件平台
。
注大模型平台不包含大模型
:。
32
.
大模型服务large-scalemodelservice
开发应用大模型及大模型系统的服务以及以此为手段提供支持需方业务活动的服务
、,。
注大模型系统是大模型与大模型平台的集成是与大模型服务相关的活动过程等的集合
:,、。
33
.
工具链toolchain
用于支撑大模型开发定制及应用的软件集合
、。
34
.
指令instruct
由大模型输入和输出信号构成的二元组
。
注如自然语言处理的大模型指令以提问文本和回答文本成对呈现
:,。
4缩略语
下列缩略语适用于本文件
。
人工智能
AI:(ArtificialIntelligence)
1
GB/T452883—2025
.
应用程序编程接口
API:(ApplicationProgrammingInterface)
中央处理器
CPU:(CentralProcessingUnit)
千兆位以太网
GE:(GigabitEthernet)
图形处理器
GPU:(GraphicProcessUnit)
网络文件系统
NFS:(NetworkFileSystem)
参数高效微调
PEFT:(Parameter-EfficientFine-Tuning)
每秒千万亿次浮点运算
PFLOPS:(PetaFloatingPointOperationsPerSecond)
可移植操作系统接口
POSIX:(PortableOperatingSystemInterface)
强化自训练
REST:(ReinforcedSelf-Training)
基于人类反馈的强化学习
RLHF:(ReinforcementLearningfromHumanFeedback)
软件开发工具包
SDK:(SoftwareDevelopmentKit)
简单存储服务
S3:(SimpleStorageService)
5概述
51大模型服务类型
.
基于大模型服务的功能特性流程阶段服务所面向的用户需求及技术实现的不同层面等维度大
、、,
模型服务分为大模型平台服务大模型开发定制服务大模型推理及运营服务见表
、、,1。
表1大模型服务类型说明
序号服务类型供方需方说明
供方利用软硬件基础设施为需方提供大模型
模型提供者应用,
大模型平台服务基础设施提供者、开发定制的技术环境包括硬件资源软件及
1服务者,、
工具链平台综合性能等不包含大模型本身
、,
大模型开发定制模型提供者应用模型应用集成者通过一系列的活动模型设计开发微调等
、、(、、),
2服务服务者应用消费者向需方交付符合环境限制及性能要求的模型
模型应用消费者供方利用大模型处理需方的特定输入交付推
大模型推理及运模型应用服务者,
、如终端用户业理结果提供技术支持及开展应用活动以满
3营服务应用集成者(、、,
务系统开发者等足需方在性能效率等方面的要求
)、
52服务能力框架
.
大模型服务能力框架能力域包括大模型平台能力域大模型开发定制能力域大模型推理及运营能
、、
力域见表
,2。
大模型平台能力域为模型开发定制模型推理及运营等提供计算资源软硬件基础设施平台
a):、、
的能力包括硬件软件及工具链平台综合个能力子域
,、、3。
大模型开发定制能力域提供大模型设计开发及定制服务的能力包括数据资源模型生产定
b):、,、
制个能力子域
2。
大模型推理及运营能力域基于大模型及其系统提供推理或运营服务的能力包括模型推理
c):,、
平台应用运营赋能个能力子域
、3。
2
GB/T452883—2025
.
表2能力域和能力子项
能力主域能力子域能力子项
计算资源
硬件网络资源
存储资源
训练工具
数据处理工具
微调工具
软件及工具链
大模型平台模型压缩工具
监测及分析工具
模型评估工具
兼容性
可靠性
平台综合
分布式并行优化
易用性
数据接入
数据资源
数据处理
模型设计
定制服务
推荐标准
- T/ZHHX 002-2024 三角梅盆花生产技术规程与质量等级 2024-04-22
- T/NAIA 0312-2024 肉牛发情控制及冷配技术规程 2024-10-02
- T/CAZG 015-2022 动物园动物化学保定操作规程 2022-12-06
- T/CAPAS 0201-2024 南方山地丘陵水稻旱直播全生物降解地膜覆盖栽培技术规范 2024-12-05
- T/CSAPA 001-2024 流浪动物救助基地建设规范 2024-07-23
- T/HNSGJXH 0036-2024 涟源涟红 玳玳酸橙栽培技术规程 2024-06-15
- T/JTYGL 006-2024 成都市油橄榄扦插育苗繁殖技术规程 2024-07-31
- T/LTQYXH 001-2023 唐山板栗(新鲜板栗)团体标准 2024-06-20
- T/IMOIA 007-2024 燕麦麸皮中主要蒽酰胺的提取技术规程 2024-12-05
- T/CSAPA 002-2024 流浪动物救助基地动物领养要求 2024-07-23