DB23/T 3857-2024 人工智能数据标注总体框架规范

DB23/T 3857-2024 Artificial intelligence data labeling general framework specification

黑龙江省地方标准 简体中文 现行 页数:9页 | 格式:PDF

基本信息

标准号
DB23/T 3857-2024
标准类型
黑龙江省地方标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2024-08-30
实施日期
2024-09-29
发布单位/组织
黑龙江省市场监督管理局
归口单位
黑龙江省委网络安全和信息化委员会办公室
适用范围
-

发布历史

研制信息

起草单位:
黑龙江省网络空间研究中心
起草人:
出版信息:
页数:9页 | 字数:- | 开本: -

内容描述

ICS01.140.20

CCSL70

23

黑龙江省地方标准

DB23/T3857—2024

人工智能数据标注总体框架规范

2024-08-30发布2024-09-29实施

黑龙江省市场监督管理局发布

DB23/T3857—2024

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起

草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。

本文件由中共黑龙江省委网络安全和信息化委员会办公室提出并归口。

本文件起草单位:黑龙江省网络空间研究中心

本文件主要起草人:白瑞、呼大永、方舟、曲家兴、杨霄璇、宋雪、李锐、李晗、徐雪吟、刘颖、

孟鸽、孙腾

I

DB23/T3857—2024

人工智能数据标注总体框架规范

1范围

本文件规定了人工智能数据标注的要求、总体框架、任务规划、任务实施、任务评审、交付验收、

总结和后期维护。

本文件适用于面向人工智能学习、研发或应用等需要实施数据标注的行政主管部门、高校、科研院

所和企事业单位,其他行业和机构可参照执行。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T35295信息技术大数据术语

GB/T25069信息安全技术术语

3术语和定义

下列术语和定义适用于本文件。

数据标注

对准备使用人工智能研究的文本、图像、音频和视频等数据进行特征标注以满足正常可用的过程。

数据标签

用于标识出数据特征并建立标注数据与人工智能可用数据之间联系的信息。

数据标注工具

能够进行数据标注及在数据标注过程中进行管理、控制等过程中发挥作用软件的统称。

数据标注技术

对数据进行转写、切割、提取、选择、富集标注、点标注、线标注、框标注、区域标注等操作的技

术。

数据标注合格率

标注任务中,符合标注规则要求的已标注数据总量与所有已标注数据总量的比值。

4基本要求

标注人员

参与数据标注的人员应具备相应的资质,对确定符合要求的人员培训,应做到:

1

DB23/T3857—2024

a)根据标注任务说明,对标注人员进行岗前能力培训。培训合格者,参与标注任务;

b)建立标注人员能力档案,记录标注人员承担标注任务的相关内容,用于进行标注人员能力评估

与标注质量追踪。

明确职责

应规定参与人工智能数据标注的所有角色的职能,并做到:

a)设立人工智能数据管理岗位。该岗位要求对业务、法律法规比较熟悉,能够根据业务实际需

要确定承担数据管理工作的部门或人员;

b)明确各环节角色的职责。应明确数据标注人员、数据标注培训人员、数据标注质量控制人员

以及与人工智能数据标注相关的其他角色的职责。

合法合规

应出台规章制度保障人工智能数据标注任务的合法合规性,并做到:

a)学习并严格执行与数据保护、数据安全相关的法律法规、制度等;

b)正确对个人隐私和敏感数据进行处理,确保标注过程合法合规;

c)建立跨部门、跨组织数据标注、传输的保护制度。

保障质量

应确保人工智能数据标注的质量,并做到:

a)确保人工智能数据标注的准确性、可用性、完整性;

b)建立质量保障制度,提高数据标注合格率;

c)建立定期抽查,不定期检测的质量控制制度。

标注范围最小化

应确保数据标注相关角色对数据掌握范围的最小化,并做到:

a)数据标注任务开始前,明确数据接触范围及使用范围;

b)提供技术或建立制度保证数据标注过程中,数据范围不扩散;

c)数据标注任务完成后,及时回收数据操作权限。

数据安全

应从以下几方面做好数据保密,确保数据安全:

a)数据分发,使用必要的安全方式确保人工智能数据分发过程的安全性要求;

b)数据存储,建立访问控制制度和加密机制确保人工智能数据存储保密性要求;

c)加密数据的标注,使用加密算法对加密人工智能数据进行运算标注,如同态加密算法等;

d)数据汇总,使用数据隔离等方式确保人工智能数据汇总时满足保密性要求;

e)密码密钥的安全,建立人工智能数据密码密钥管理系统。

数据完整

为确保标注过程数据完整性,应做到:

a)接收人工智能数据可验证,保证接收的数据已通过认证;

b)人工智能数据传输过程完

定制服务

    相似标准推荐

    更多>