T/AII 008-2023 深度学习算法框架通用接口规范

T/AII 008-2023 Deep learning algorithm framework generic interface specification

团体标准 中文(简体) 现行 页数:30页 | 格式:PDF

基本信息

标准号
T/AII 008-2023
标准类型
团体标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2023-12-26
实施日期
2023-12-26
发布单位/组织
-
归口单位
深圳市人工智能行业协会
适用范围
范围:本文件确立了面向深度学习算法框架通用应用接口模型、规定了接口功能及技术要求。 本文件适用于基于深度学习的算法开发和应用过程中所涉及应用编程接口的适配与调用; 主要技术内容:本文件是为深度学习算法框架提供统一接口的标准,规范了面向多任务、跨算法框架通用应用接口目标、接口模型以及接口库的技术要求等

发布历史

研制信息

起草单位:
博瀚智能(深圳)有限公司、北京大学、深圳云天励飞技术股份有限公司、达闼机器人股份有限公司、深圳市酷开网络科技股份有限公司、麒麟合盛网络技术股份有限公司、软通智慧科技有限公司、上海致宇信息技术有限公司、深思考人工智能机器人科技(北京)有限公司、北京智境云创科技有限公司、深圳优地科技有限公司、深圳云译科技有限公司、中电金信软件(深圳)有限公司、深圳云知声信息技术有限公司、深圳市木愚科技有限公司、上海思岚科技有限公司、广州九四智能科技有限公司、深圳市华赛睿飞智能科技有限公司、静观照(深圳)科技有限公司、深圳市易行网数字科技有限公司、新译信息科技(北京)有限公司、超参数科技(深圳)有限公司、深圳玩智商科技有限公司、边无际(北京)科技有限公司、深圳市即构科技有限公司
起草人:
陈鹏、王忠强、许佳、董豪、刘奕良、张衡、饶雪、张站朝、张伟、李晓榕、吴旭、张旭、邓小波、齐全、郭文鹏、陈思成、邹伟军、杨志明、王雪艳、王智武、罗沛、夏舸、刘开军、郭煜、梅华平、康恒、卢庆华、张丽萍、刘嗣平、汤丁青、林必毅、封其国、周艺恺、曾鹏、陈丹霞、田亮、刘劲松、刘永升、罗敏、王品、何英、陈永立、何建新、李凯
出版信息:
页数:30页 | 字数:- | 开本: -

内容描述

ICS35.020

CCSL70

团体标准

T/AII008—2023

深度学习算法框架通用接口规范

Generalinterfacespecificationfordeeplearningalgorithmframeworks

2023-12-26发布2023-12-26实施

深圳市人工智能行业协会发布

T/AII008—2023

目次

前言.................................................................................III

引言..................................................................................IV

1范围.................................................................................1

2规范性引用文件.......................................................................1

3术语和定义...........................................................................1

4缩略语...............................................................................2

5深度学习算法框架通用接口模型.........................................................3

5.1算法接口目标.......................................................................3

5.2算法接口模型.......................................................................3

6深度学习算法框架通用接口要求.........................................................6

6.1框架适配层.........................................................................6

6.2核心算法层.........................................................................6

6.3应用层............................................................................10

附录A(规范性)基础接口..............................................................12

A.1张量Tensor........................................................................12

A.2模块Module........................................................................13

附录B(规范性)接口参数表............................................................16

B.1数据读取.........................................................................16

B.2采样器...........................................................................16

B.3优化器...........................................................................18

B.4训练器...........................................................................19

B.5推理器...........................................................................20

B.6评估器...........................................................................21

B.7数据操作.........................................................................22

参考文献..............................................................................24

图1系统结构标准说明图·······························································································4

图2总体接口图···········································································································5

表A.1initialize接口参数列表························································································12

表A.2index接口参数列表····························································································12

表A.3permute接口参数列表·························································································13

I

T/AII008—2023

表A.4reshape接口参数列表··························································································13

表A.5forward接口参数列表·························································································14

表A.6get_parameters接口参数列表················································································14

表A.7get_modules接口参数列表···················································································14

表A.8load_state_dict接口参数列表·················································································14

表A.9backward接口参数列表·······················································································15

表B.1construct_dataset接口参数列表........................................................................................................16

表B.2get_sample接口参数列表..................................................................................................................16

表B.3construct_sampler接口参数列表.......................................................................................................17

表B.4iterate_sample接口参数列表.............................................................................................................17

表B.5iterate_batch接口参数列表...............................................................................................................17

表B.6construct_optimizer接口参数列表....................................................................................................18

表B.7update_learnable_parameter接口参数列表.......................................................................................18

表B.8zero_gradient接口参数列表..............................................................................................................19

表B.9construct_trainer接口参数列表.........................................................................................................19

表B.10train_one_batch接口参数列表........................................................................................................19

表B.11train_one_epoch接口参数列表........................................................................................................20

表B.12construct_inference接口参数列表...................................................................................................20

表B.13infer_one_sample接口参数列表.....................................................................................................21

表B.14infer_samples接口参数列表............................................................................................................21

表B.15construct_evalvater接口参数列表...................................................................................................22

表B.16evalvate接口参数列表.....................................................................................................................22

表B.17construct_operator接口参数列表....................................................................................................22

表B.18operate接口参数列表......................................................................................................................23

II

T/AII008—2023

前言

本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

本文件由深圳市人工智能行业协会(AII)提出并归口。

本文件起草单位:博瀚智能(深圳)有限公司、北京大学、深圳云天励飞技术股份有限公司、达闼

机器人股份有限公司、深圳市酷开网络科技股份有限公司、麒麟合盛网络技术股份有限公司、软通智慧

科技有限公司、上海致宇信息技术有限公司、深思考人工智能机器人科技(北京)有限公司、北京智境

云创科技有限公司、深圳优地科技有限公司、深圳云译科技有限公司、中电金信软件(深圳)有限公司、

深圳云知声信息技术有限公司、深圳市木愚科技有限公司、上海思岚科技有限公司、广州九四智能科技

有限公司、深圳市华赛睿飞智能科技有限公司、静观照(深圳)科技有限公司、深圳市易行网数字科技

有限公司、新译信息科技(北京)有限公司、超参数科技(深圳)有限公司、深圳玩智商科技有限公司、

边无际(北京)科技有限公司、深圳市即构科技有限公司。

本文件主要起草人:陈鹏、王忠强、许佳、董豪、刘奕良、张衡、饶雪、张站朝、张伟、李晓榕、

吴旭、张旭、邓小波、齐全、郭文鹏、陈思成、邹伟军、杨志明、王雪艳、王智武、罗沛、夏舸、刘开

军、郭煜、梅华平、康恒、卢庆华、张丽萍、刘嗣平、汤丁青、林必毅、封其国、周艺恺、曾鹏、陈丹

霞、田亮、刘劲松、刘永升、罗敏、王品、何英、陈永立、何建新、李凯。

III

T/AII008—2023

引言

随着深度学习应用越来越广泛,深度学习框架、计算硬件、操作系统、应用种类也呈现多样化趋势。

其中,常用的深度学习框架有TensorFlow、PyTorch、昇思(MindSpore)、飞桨(PaddlePaddle)等,

由于多任务、跨算法、不同框架之间的代码不通用,且用户学习多个框架的成本较高。因此,跨框架、

跨平台的开发需求愈发强烈。根据跨框架、跨平台接口发展需求,博瀚智能(深圳)有限公司联合相关

单位制定了《深度学习算法框架通用接口规范》。

本文件旨在为深度学习算法框架提供统一接口的标准,规范了面向多任务、跨算法框架通用应用接

口目标、接口模型以及接口库的技术要求等。

IV

T/AII008—2023

深度学习算法框架通用接口规范

1范围

本文件确立了面向深度学习算法框架通用应用接口模型、规定了接口功能及技术要求。

本文件适用于基于深度学习的算法开发和应用过程中所涉及应用编程接口的适配与调用。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

ISO/IEC22989:2022信息技术人工智能概念和术语(Informationtechnology—Artificial

intelligence—Artificialintelligenceconceptsandterminology)

3术语和定义

ISO/IEC22989:2022界定的术语和定义适用于本文件。

3.1

深度学习deeplearning

通过训练具有多个隐藏层的神经网络来创建丰富的层次表示的方法。

[来源:ISO/IEC22989:2022,3.4.4]

3.2

模型训练modeltraining

基于机器学习算法,通过使用训练数据来确定或改进机器学习模型参数的过程。

[来源:ISO/IEC22989:2022,3.3.15]

3.3

训练数据trainingdata

用于训练机器学习模型的数据。

[来源:ISO/IEC22989:2022,3.3.16]

1

T/AII008—2023

4缩略语

下列缩略语适用于本文件。

ASR:自动语音识别(AutomaticSpeechRecognition)

BERT:双向语言表征注意力模型(BidirectionalEncoderRepresentationfromTransformers)

ByteNet:一种基于CNN的机器翻译模型(NeuralMachineTranslationbasedonCNN)

CNN:卷积神经网络(ConvolutionalNeuralNetworks)

Conformer:一种基于卷积增强的语音识别模型(Convolution-augmentedTransformerforSpeech

Recognition)

DeepLabv3:一种基于空洞可分离卷积、编解码架构的语义分割模型(Encoder-DecoderwithAtrous

SeparableConvolutionforSemanticImageSegmentation)

EfficientNet:一种高效的卷积网络模型(EfficientNet)

FasterRCNN:一种基于区域建议网络的实时目标检测模型(TowardsReal-TimeObjectDetection

withRegionProposalNetworks)

HRNet:一种高分辨率的人体姿态评估的深度模型(DeepHigh-ResolutionRepresentation

LearningforHumanPoseEstimation)

MaskRCNN:一种图像实例分割模型

OCR:光学字符识别(OpticalCharacterRecognition)

PFLD:实用人脸关键点检测器(APracticalFacialLandmarkDetector)

ResNet:残差网络(ResidualNetwork)

Resnet3D:基于三维卷积的残差网络(ResidualNetworkwith3DCNN)

RetinaNet:一种目标检测模型

RNNT:一种用于语音识别的RNN变换模型(Rnn-Transducer)

S3D:可分离三维卷积网络(Separable3DCNN)

SSD:单步多框检测器(SingleShotMultiBoxDetector)

T5:文本到文本转换注意力模型(Text-To-TextTransferTransformer)

TextCNN:一种用于文本分类的卷积网络模型(ConvolutionalNeuralNetworksforSentence

Classification)

Transformer:基于注意力机制的神经网络(NeuralNetworkbasedonAttentionMechanism)

TrOCR:基于注意力的光学字符检测(Transformer-basedOpticalCharacterRecognition)

TTS:语音合成(Text-to-Speech)

UNet:一种用于生物医药领域图像分割的卷积网络(ConvolutionalNetworksforBiomedicalImage

Segmentation)

VGGNet:由VGG组提出的图像分类网络模型(VisualGeometryGroupNetwork)

WaveNet:一种用于生成原始音频波形的神经网络模型(AGenerativeModelforRawAudio)

XLNet:一种自回归预训练语言模型(GeneralizedAutoregressivePretrainingforLanguage

Understanding)

YOLO:YOLO单阶段目标检测器(YouOnlyLookOnce)

2

T/AII008—2023

5深度学习算法框架通用接口模型

5.1算法接口目标

通过统一接口适配层,可实现下列目标。

a)算法支持使用不同的深度学习框架作为后端。

b)算法支持视觉、音频、文本等不同数据处理的深度学习任务。

c)在不同的硬件如服务器或分布式集群上正常运行。

d)算法支持不同数据的读入。

5.2算法接口模型

从系统资源、框架适配、核心算法、应用四个层面描述了框架、数据、算法、模型之间的关系。图

1给出了系统结构说明图,本文件主要规定的是框架适配、核心算法、应用三个层的技术要求。

a)系统资源层:包括硬件和软件两部分,提供计算机视觉系统必须的存储、计算和推理等功能。

系统资源层的具体实现各个厂商有自己的方式,对此本文件不做进一步描述和规定。

b)框架适配层:使用统一的框架接口为上层系统过程提供算子、函数接口、优化接口、模型接口

等服务接口,确保适配不同的深度学习框架。

c)核心算法层:包含数据、模型、训练、推理等基类定义,以及各领域的经典模型和算法,并确

定数据、算法、流程等方面的基础协作逻辑。

d)应用层:完成图像、文本、音频等各领域、各任务的模型训练、模型推理等过程,在模型训练

过程中需要调用本文件定义的各类接口。

3

T/AII008—2023

用图像处理自然语言处理视频处理音频处理

训练和推理数据规范

模型规范

训练器推理器数据解析

算数据结构

数据增强

前处理优化器

模型结构

后处理数据迭代数据集

框统一接口定义

层接口实现1接口实现2…接口实现N

框架1框架2…框架N

资机器学习运行环境

硬件设备和计算调度

定制服务

    相似标准推荐

    更多>