T/AII 008-2023 深度学习算法框架通用接口规范
T/AII 008-2023 Deep learning algorithm framework generic interface specification
基本信息
发布历史
-
2023年12月
研制信息
- 起草单位:
- 博瀚智能(深圳)有限公司、北京大学、深圳云天励飞技术股份有限公司、达闼机器人股份有限公司、深圳市酷开网络科技股份有限公司、麒麟合盛网络技术股份有限公司、软通智慧科技有限公司、上海致宇信息技术有限公司、深思考人工智能机器人科技(北京)有限公司、北京智境云创科技有限公司、深圳优地科技有限公司、深圳云译科技有限公司、中电金信软件(深圳)有限公司、深圳云知声信息技术有限公司、深圳市木愚科技有限公司、上海思岚科技有限公司、广州九四智能科技有限公司、深圳市华赛睿飞智能科技有限公司、静观照(深圳)科技有限公司、深圳市易行网数字科技有限公司、新译信息科技(北京)有限公司、超参数科技(深圳)有限公司、深圳玩智商科技有限公司、边无际(北京)科技有限公司、深圳市即构科技有限公司
- 起草人:
- 陈鹏、王忠强、许佳、董豪、刘奕良、张衡、饶雪、张站朝、张伟、李晓榕、吴旭、张旭、邓小波、齐全、郭文鹏、陈思成、邹伟军、杨志明、王雪艳、王智武、罗沛、夏舸、刘开军、郭煜、梅华平、康恒、卢庆华、张丽萍、刘嗣平、汤丁青、林必毅、封其国、周艺恺、曾鹏、陈丹霞、田亮、刘劲松、刘永升、罗敏、王品、何英、陈永立、何建新、李凯
- 出版信息:
- 页数:30页 | 字数:- | 开本: -
内容描述
ICS35.020
CCSL70
团体标准
T/AII008—2023
深度学习算法框架通用接口规范
Generalinterfacespecificationfordeeplearningalgorithmframeworks
2023-12-26发布2023-12-26实施
深圳市人工智能行业协会发布
T/AII008—2023
目次
前言.................................................................................III
引言..................................................................................IV
1范围.................................................................................1
2规范性引用文件.......................................................................1
3术语和定义...........................................................................1
4缩略语...............................................................................2
5深度学习算法框架通用接口模型.........................................................3
5.1算法接口目标.......................................................................3
5.2算法接口模型.......................................................................3
6深度学习算法框架通用接口要求.........................................................6
6.1框架适配层.........................................................................6
6.2核心算法层.........................................................................6
6.3应用层............................................................................10
附录A(规范性)基础接口..............................................................12
A.1张量Tensor........................................................................12
A.2模块Module........................................................................13
附录B(规范性)接口参数表............................................................16
B.1数据读取.........................................................................16
B.2采样器...........................................................................16
B.3优化器...........................................................................18
B.4训练器...........................................................................19
B.5推理器...........................................................................20
B.6评估器...........................................................................21
B.7数据操作.........................................................................22
参考文献..............................................................................24
图1系统结构标准说明图·······························································································4
图2总体接口图···········································································································5
表A.1initialize接口参数列表························································································12
表A.2index接口参数列表····························································································12
表A.3permute接口参数列表·························································································13
I
T/AII008—2023
表A.4reshape接口参数列表··························································································13
表A.5forward接口参数列表·························································································14
表A.6get_parameters接口参数列表················································································14
表A.7get_modules接口参数列表···················································································14
表A.8load_state_dict接口参数列表·················································································14
表A.9backward接口参数列表·······················································································15
表B.1construct_dataset接口参数列表........................................................................................................16
表B.2get_sample接口参数列表..................................................................................................................16
表B.3construct_sampler接口参数列表.......................................................................................................17
表B.4iterate_sample接口参数列表.............................................................................................................17
表B.5iterate_batch接口参数列表...............................................................................................................17
表B.6construct_optimizer接口参数列表....................................................................................................18
表B.7update_learnable_parameter接口参数列表.......................................................................................18
表B.8zero_gradient接口参数列表..............................................................................................................19
表B.9construct_trainer接口参数列表.........................................................................................................19
表B.10train_one_batch接口参数列表........................................................................................................19
表B.11train_one_epoch接口参数列表........................................................................................................20
表B.12construct_inference接口参数列表...................................................................................................20
表B.13infer_one_sample接口参数列表.....................................................................................................21
表B.14infer_samples接口参数列表............................................................................................................21
表B.15construct_evalvater接口参数列表...................................................................................................22
表B.16evalvate接口参数列表.....................................................................................................................22
表B.17construct_operator接口参数列表....................................................................................................22
表B.18operate接口参数列表......................................................................................................................23
II
T/AII008—2023
前言
本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
本文件由深圳市人工智能行业协会(AII)提出并归口。
本文件起草单位:博瀚智能(深圳)有限公司、北京大学、深圳云天励飞技术股份有限公司、达闼
机器人股份有限公司、深圳市酷开网络科技股份有限公司、麒麟合盛网络技术股份有限公司、软通智慧
科技有限公司、上海致宇信息技术有限公司、深思考人工智能机器人科技(北京)有限公司、北京智境
云创科技有限公司、深圳优地科技有限公司、深圳云译科技有限公司、中电金信软件(深圳)有限公司、
深圳云知声信息技术有限公司、深圳市木愚科技有限公司、上海思岚科技有限公司、广州九四智能科技
有限公司、深圳市华赛睿飞智能科技有限公司、静观照(深圳)科技有限公司、深圳市易行网数字科技
有限公司、新译信息科技(北京)有限公司、超参数科技(深圳)有限公司、深圳玩智商科技有限公司、
边无际(北京)科技有限公司、深圳市即构科技有限公司。
本文件主要起草人:陈鹏、王忠强、许佳、董豪、刘奕良、张衡、饶雪、张站朝、张伟、李晓榕、
吴旭、张旭、邓小波、齐全、郭文鹏、陈思成、邹伟军、杨志明、王雪艳、王智武、罗沛、夏舸、刘开
军、郭煜、梅华平、康恒、卢庆华、张丽萍、刘嗣平、汤丁青、林必毅、封其国、周艺恺、曾鹏、陈丹
霞、田亮、刘劲松、刘永升、罗敏、王品、何英、陈永立、何建新、李凯。
III
T/AII008—2023
引言
随着深度学习应用越来越广泛,深度学习框架、计算硬件、操作系统、应用种类也呈现多样化趋势。
其中,常用的深度学习框架有TensorFlow、PyTorch、昇思(MindSpore)、飞桨(PaddlePaddle)等,
由于多任务、跨算法、不同框架之间的代码不通用,且用户学习多个框架的成本较高。因此,跨框架、
跨平台的开发需求愈发强烈。根据跨框架、跨平台接口发展需求,博瀚智能(深圳)有限公司联合相关
单位制定了《深度学习算法框架通用接口规范》。
本文件旨在为深度学习算法框架提供统一接口的标准,规范了面向多任务、跨算法框架通用应用接
口目标、接口模型以及接口库的技术要求等。
IV
T/AII008—2023
深度学习算法框架通用接口规范
1范围
本文件确立了面向深度学习算法框架通用应用接口模型、规定了接口功能及技术要求。
本文件适用于基于深度学习的算法开发和应用过程中所涉及应用编程接口的适配与调用。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
ISO/IEC22989:2022信息技术人工智能概念和术语(Informationtechnology—Artificial
intelligence—Artificialintelligenceconceptsandterminology)
3术语和定义
ISO/IEC22989:2022界定的术语和定义适用于本文件。
3.1
深度学习deeplearning
通过训练具有多个隐藏层的神经网络来创建丰富的层次表示的方法。
[来源:ISO/IEC22989:2022,3.4.4]
3.2
模型训练modeltraining
基于机器学习算法,通过使用训练数据来确定或改进机器学习模型参数的过程。
[来源:ISO/IEC22989:2022,3.3.15]
3.3
训练数据trainingdata
用于训练机器学习模型的数据。
[来源:ISO/IEC22989:2022,3.3.16]
1
T/AII008—2023
4缩略语
下列缩略语适用于本文件。
ASR:自动语音识别(AutomaticSpeechRecognition)
BERT:双向语言表征注意力模型(BidirectionalEncoderRepresentationfromTransformers)
ByteNet:一种基于CNN的机器翻译模型(NeuralMachineTranslationbasedonCNN)
CNN:卷积神经网络(ConvolutionalNeuralNetworks)
Conformer:一种基于卷积增强的语音识别模型(Convolution-augmentedTransformerforSpeech
Recognition)
DeepLabv3:一种基于空洞可分离卷积、编解码架构的语义分割模型(Encoder-DecoderwithAtrous
SeparableConvolutionforSemanticImageSegmentation)
EfficientNet:一种高效的卷积网络模型(EfficientNet)
FasterRCNN:一种基于区域建议网络的实时目标检测模型(TowardsReal-TimeObjectDetection
withRegionProposalNetworks)
HRNet:一种高分辨率的人体姿态评估的深度模型(DeepHigh-ResolutionRepresentation
LearningforHumanPoseEstimation)
MaskRCNN:一种图像实例分割模型
OCR:光学字符识别(OpticalCharacterRecognition)
PFLD:实用人脸关键点检测器(APracticalFacialLandmarkDetector)
ResNet:残差网络(ResidualNetwork)
Resnet3D:基于三维卷积的残差网络(ResidualNetworkwith3DCNN)
RetinaNet:一种目标检测模型
RNNT:一种用于语音识别的RNN变换模型(Rnn-Transducer)
S3D:可分离三维卷积网络(Separable3DCNN)
SSD:单步多框检测器(SingleShotMultiBoxDetector)
T5:文本到文本转换注意力模型(Text-To-TextTransferTransformer)
TextCNN:一种用于文本分类的卷积网络模型(ConvolutionalNeuralNetworksforSentence
Classification)
Transformer:基于注意力机制的神经网络(NeuralNetworkbasedonAttentionMechanism)
TrOCR:基于注意力的光学字符检测(Transformer-basedOpticalCharacterRecognition)
TTS:语音合成(Text-to-Speech)
UNet:一种用于生物医药领域图像分割的卷积网络(ConvolutionalNetworksforBiomedicalImage
Segmentation)
VGGNet:由VGG组提出的图像分类网络模型(VisualGeometryGroupNetwork)
WaveNet:一种用于生成原始音频波形的神经网络模型(AGenerativeModelforRawAudio)
XLNet:一种自回归预训练语言模型(GeneralizedAutoregressivePretrainingforLanguage
Understanding)
YOLO:YOLO单阶段目标检测器(YouOnlyLookOnce)
2
T/AII008—2023
5深度学习算法框架通用接口模型
5.1算法接口目标
通过统一接口适配层,可实现下列目标。
a)算法支持使用不同的深度学习框架作为后端。
b)算法支持视觉、音频、文本等不同数据处理的深度学习任务。
c)在不同的硬件如服务器或分布式集群上正常运行。
d)算法支持不同数据的读入。
5.2算法接口模型
从系统资源、框架适配、核心算法、应用四个层面描述了框架、数据、算法、模型之间的关系。图
1给出了系统结构说明图,本文件主要规定的是框架适配、核心算法、应用三个层的技术要求。
a)系统资源层:包括硬件和软件两部分,提供计算机视觉系统必须的存储、计算和推理等功能。
系统资源层的具体实现各个厂商有自己的方式,对此本文件不做进一步描述和规定。
b)框架适配层:使用统一的框架接口为上层系统过程提供算子、函数接口、优化接口、模型接口
等服务接口,确保适配不同的深度学习框架。
c)核心算法层:包含数据、模型、训练、推理等基类定义,以及各领域的经典模型和算法,并确
定数据、算法、流程等方面的基础协作逻辑。
d)应用层:完成图像、文本、音频等各领域、各任务的模型训练、模型推理等过程,在模型训练
过程中需要调用本文件定义的各类接口。
3
T/AII008—2023
应
用图像处理自然语言处理视频处理音频处理
层
训练和推理数据规范
模型规范
核
心
训练器推理器数据解析
算数据结构
法
层
数据增强
前处理优化器
模型结构
后处理数据迭代数据集
框统一接口定义
架
适
配
层接口实现1接口实现2…接口实现N
框架1框架2…框架N
系
统
资机器学习运行环境
源
层
硬件设备和计算调度
定制服务
推荐标准
- T/SSEA 0430-2024 基于图像识别技术的废钢铁智能检判系统效果评价方法 2024-08-16
- T/UNP 361-2024 航空用高品质海绵钛生产技术规范 2024-12-05
- T/CISA 405-2024 钛微合金化高强钢热连轧钢板及钢带 2024-03-29
- T/CZRX 0089-2024 高容量锂离子电池金属化合物负极材料电化学性试验方法 2024-12-23
- T/UNP 362-2024 海绵钛制品通用技术规范 2024-12-05
- T/SSEA 0431-2024 钢渣基全固废充填胶凝材料 2024-08-16
- T/SSEA 0427-2024 质量分级及“领跑者”评价要求 非调质冷镦钢热轧盘条 2024-08-16
- T/CSTA 0108-2024 高磁导率低矫顽力FeNiMnSi软磁合金 2024-08-16
- T/SSEA 0429-2024 钢铁行业绿色供应链管理指南 2024-08-16
- T/CNIA 0256-2024 绿色设计产品评价技术规范 稀土系储氢合金粉 2024-09-14