GB/T 45401.2-2025 人工智能 计算设备调度与协同 第2部分:分布式计算框架

GB/T 45401.2-2025 Artificial intelligence—Scheduling and cooperation for computing devices—Part 2:Framework for distributed computing

国家标准 中文简体 现行 页数:28页 | 格式:PDF

基本信息

标准号
GB/T 45401.2-2025
相关服务
标准类型
国家标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2025-03-28
实施日期
2025-03-28
发布单位/组织
国家市场监督管理总局、国家标准化管理委员会
归口单位
全国信息技术标准化技术委员会(SAC/TC 28)
适用范围
本文件确立了人工智能计算设备分布式计算的架构,规定了功能和性能技术要求,定义了分布式计算协同接口。
本文件适用于用于分布式人工智能计算系统的设计、开发和测试。

文前页预览

研制信息

起草单位:
中国电子技术标准化研究院、华为技术有限公司、北京航空航天大学、中国科学院软件研究所、华为云计算技术有限公司、阿里云计算有限公司、北京百度网讯科技有限公司、浪潮电子信息产业股份有限公司、上海商汤智能科技有限公司、北京大学武汉人工智能研究院、上海市人工智能行业协会、中国移动通信集团有限公司、中国科学院计算技术研究所、科大讯飞股份有限公司、北京大学、深圳云天励飞技术股份有限公司、上海天数智芯半导体有限公司、北京壁仞科技开发有限公司、杭州海康威视数字技术股份有限公司、南方电网人工智能科技有限公司、龙芯中科技术股份有限公司、苏州登临科技有限公司、浙江大华技术股份有限公司、蚂蚁科技集团股份有限公司、国科础石(重庆)软件有限公司、广东电网有限责任公司、广电运通集团股份有限公司、上海计算机软件技术开发中心、上海文鳐信息科技有限公司、京东方科技集团股份有限公司、天津(滨海)人工智能创新中心
起草人:
曹晓琦、董建、杨雨泽、鲍薇、徐洋、于超、李斌斌、王莞尔、栾钟治、朱毅鑫、董乾、孟令中、郑子木、吴涛、田晓利、张亚强、马珊珊、马骋昊、赵春昊、吴庚、曹汐、王煜炜、吴婷、杨超、王志芳、余雪松、丁瑞全、叶挺群、董召杰、马莞悦、代君、孔维生、郭智慧、罗勇军、严宇平、陈浩敏、杨波、陈敏刚、牛科科、仲凯韬、姜幸群、史殿习
出版信息:
页数:28页 | 字数:42 千字 | 开本: 大16开

内容描述

ICS35020

CCSL.70

中华人民共和国国家标准

GB/T454012—2025

.

人工智能计算设备调度与协同

第2部分分布式计算框架

:

Artificialintelligence—Schedulingandcooperationforcomputingdevices—

Part2Frameworkfordistributedcomutin

:pg

2025-03-28发布2025-03-28实施

国家市场监督管理总局发布

国家标准化管理委员会

GB/T454012—2025

.

目次

前言

…………………………Ⅲ

引言

…………………………Ⅳ

范围

1………………………1

规范性引用文件

2…………………………1

术语和定义

3………………1

缩略语

4……………………2

概述

5………………………2

总体框架

5.1……………2

适用性

5.2………………3

计算设备技术要求

6………………………3

云侧设备

6.1……………3

边侧设备

6.2……………4

端侧设备

6.3……………4

分布式计算协同技术要求

7………………5

架构

7.1…………………5

通用要求

7.2……………5

组件要求

7.3……………6

云云协同要求

7.4………………………8

云边端协同要求

7.5……………………9

多端协同要求

7.6………………………11

云边端分布式计算协同接口

8……………12

边侧节点管理

8.1………………………12

部署及更新

8.2…………………………14

任务运行管理

8.3………………………17

参考文献

……………………19

GB/T454012—2025

.

前言

本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定

GB/T1.1—2020《1:》

起草

本文件是人工智能计算设备调度与协同的第部分已经发布了

GB/T45401《》2。GB/T45401

以下部分

:

第部分虚拟化与调度

———1:;

第部分分布式计算框架

———2:。

请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别专利的责任

。。

本文由全国信息技术标准化技术委员会提出并归口

(SAC/TC28)。

本文件起草单位中国电子技术标准化研究院华为技术有限公司北京航空航天大学中国科学院

:、、、

软件研究所华为云计算技术有限公司阿里云计算有限公司北京百度网讯科技有限公司浪潮电子信

、、、、

息产业股份有限公司上海商汤智能科技有限公司北京大学武汉人工智能研究院上海市人工智能行

、、、

业协会中国移动通信集团有限公司中国科学院计算技术研究所科大讯飞股份有限公司北京大学

、、、、、

深圳云天励飞技术股份有限公司上海天数智芯半导体有限公司北京壁仞科技开发有限公司杭州海

、、、

康威视数字技术股份有限公司南方电网人工智能科技有限公司龙芯中科技术股份有限公司苏州登

、、、

临科技有限公司浙江大华技术股份有限公司蚂蚁科技集团股份有限公司国科础石重庆软件有限

、、、()

公司广东电网有限责任公司广电运通集团股份有限公司上海计算机软件技术开发中心上海文鳐信

、、、、

息科技有限公司京东方科技集团股份有限公司天津滨海人工智能创新中心

、、()。

本文件主要起草人曹晓琦董建杨雨泽鲍薇徐洋于超李斌斌王莞尔栾钟治朱毅鑫董乾

:、、、、、、、、、、、

孟令中郑子木吴涛田晓利张亚强马珊珊马骋昊赵春昊吴庚曹汐王煜炜吴婷杨超王志芳

、、、、、、、、、、、、、、

余雪松丁瑞全叶挺群董召杰马莞悦代君孔维生郭智慧罗勇军严宇平陈浩敏杨波陈敏刚

、、、、、、、、、、、、、

牛科科仲凯韬姜幸群史殿习

、、、。

GB/T454012—2025

.

引言

随着人工智能计算形态的不断发展承载人工智能应用的计算设备的部署和使用呈现分布式全场

,、

景的趋势同一人工智能计算任务往往需要多种形态的计算设备协作完成为不同地域类型的用户提

。,、

供服务需要对不同形态的计算设备资源合理利用及分配明确必要的技术架构能力要求以及接口

。,、

等为产品提供参考框架以及评价体系缓解不同形态人工智能计算设备横向协同割裂的现状

,,。

人工智能计算设备调度与协同拟由两个部分组成

GB/T45401《》。

第部分虚拟化与调度旨在确立人工智能计算设备虚拟化与调度系统的架构规定技术要

———1:,,

求及对应的测试方法

第部分分布式计算框架旨在确立人工智能计算设备分布式计算的架构规定功能和性能

———2:,,

技术要求定义分布式计算协同接口

,。

GB/T454012—2025

.

人工智能计算设备调度与协同

第2部分分布式计算框架

:

1范围

本文件确立了人工智能计算设备分布式计算的架构规定了功能和性能技术要求定义了分布式计

,,

算协同接口

本文件适用于用于分布式人工智能计算系统的设计开发和测试

、。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款其中注日期的引用文

。,

件仅该日期对应的版本适用于本文件不注日期的引用文件其最新版本包括所有的修改单适用于

,;,()

本文件

信息技术人工智能术语

GB/T41867

信息技术人工智能平台计算资源规范

GB/T42018—2022

人工智能计算设备调度与协同第部分虚拟化与调度

GB/T45401.1—20251:

人工智能异构人工智能加速器统一接口

GB/T45280—2025

人工智能服务器系统性能测试方法

GB/T45087—2024

3术语和定义

和界定的以及下列术

GB/T41867、GB/T42018—2022、GB/T45401.1—2025GB/T45280—2025

语和定义适用于本文件

31

.

分布式机器学习distributedmachinelearning

一种机器学习的方法或过程利用互联网络作为首选通信载体在不同子系统上完成同一个机器学

,,

习任务

注1互联网络包含局域互联网及广域互联网

:。

注2分布式按照机器学习任务种类不同分布式机器学习分为分布式训练分布式推理

:,、。

来源有修改

[:ISO/IEC2382:2015,2178059,]

32

.

联邦机器学习federatedmachinelearning

[][]

一种机器学习方法或过程使多个参加者协作构建及使用机器学习模型而不暴露参加者的私有

,

数据

33

.

增量学习incrementallearning

一种分为多个阶段的自适应学习方法其中在前驱阶段学得的知识被转化为适当形式以便为后继

,,

1

定制服务