DB23/T 3857-2024 人工智能数据标注总体框架规范
DB23/T 3857-2024 Artificial intelligence data labeling general framework specification
基本信息
发布历史
-
2024年08月
研制信息
- 起草单位:
- 黑龙江省网络空间研究中心
- 起草人:
- 出版信息:
- 页数:9页 | 字数:- | 开本: -
内容描述
ICS01.140.20
CCSL70
23
黑龙江省地方标准
DB23/T3857—2024
人工智能数据标注总体框架规范
2024-08-30发布2024-09-29实施
黑龙江省市场监督管理局发布
DB23/T3857—2024
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起
草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。
本文件由中共黑龙江省委网络安全和信息化委员会办公室提出并归口。
本文件起草单位:黑龙江省网络空间研究中心
本文件主要起草人:白瑞、呼大永、方舟、曲家兴、杨霄璇、宋雪、李锐、李晗、徐雪吟、刘颖、
孟鸽、孙腾
I
DB23/T3857—2024
人工智能数据标注总体框架规范
1范围
本文件规定了人工智能数据标注的要求、总体框架、任务规划、任务实施、任务评审、交付验收、
总结和后期维护。
本文件适用于面向人工智能学习、研发或应用等需要实施数据标注的行政主管部门、高校、科研院
所和企事业单位,其他行业和机构可参照执行。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T35295信息技术大数据术语
GB/T25069信息安全技术术语
3术语和定义
下列术语和定义适用于本文件。
数据标注
对准备使用人工智能研究的文本、图像、音频和视频等数据进行特征标注以满足正常可用的过程。
数据标签
用于标识出数据特征并建立标注数据与人工智能可用数据之间联系的信息。
数据标注工具
能够进行数据标注及在数据标注过程中进行管理、控制等过程中发挥作用软件的统称。
数据标注技术
对数据进行转写、切割、提取、选择、富集标注、点标注、线标注、框标注、区域标注等操作的技
术。
数据标注合格率
标注任务中,符合标注规则要求的已标注数据总量与所有已标注数据总量的比值。
4基本要求
标注人员
参与数据标注的人员应具备相应的资质,对确定符合要求的人员培训,应做到:
1
DB23/T3857—2024
a)根据标注任务说明,对标注人员进行岗前能力培训。培训合格者,参与标注任务;
b)建立标注人员能力档案,记录标注人员承担标注任务的相关内容,用于进行标注人员能力评估
与标注质量追踪。
明确职责
应规定参与人工智能数据标注的所有角色的职能,并做到:
a)设立人工智能数据管理岗位。该岗位要求对业务、法律法规比较熟悉,能够根据业务实际需
要确定承担数据管理工作的部门或人员;
b)明确各环节角色的职责。应明确数据标注人员、数据标注培训人员、数据标注质量控制人员
以及与人工智能数据标注相关的其他角色的职责。
合法合规
应出台规章制度保障人工智能数据标注任务的合法合规性,并做到:
a)学习并严格执行与数据保护、数据安全相关的法律法规、制度等;
b)正确对个人隐私和敏感数据进行处理,确保标注过程合法合规;
c)建立跨部门、跨组织数据标注、传输的保护制度。
保障质量
应确保人工智能数据标注的质量,并做到:
a)确保人工智能数据标注的准确性、可用性、完整性;
b)建立质量保障制度,提高数据标注合格率;
c)建立定期抽查,不定期检测的质量控制制度。
标注范围最小化
应确保数据标注相关角色对数据掌握范围的最小化,并做到:
a)数据标注任务开始前,明确数据接触范围及使用范围;
b)提供技术或建立制度保证数据标注过程中,数据范围不扩散;
c)数据标注任务完成后,及时回收数据操作权限。
数据安全
应从以下几方面做好数据保密,确保数据安全:
a)数据分发,使用必要的安全方式确保人工智能数据分发过程的安全性要求;
b)数据存储,建立访问控制制度和加密机制确保人工智能数据存储保密性要求;
c)加密数据的标注,使用加密算法对加密人工智能数据进行运算标注,如同态加密算法等;
d)数据汇总,使用数据隔离等方式确保人工智能数据汇总时满足保密性要求;
e)密码密钥的安全,建立人工智能数据密码密钥管理系统。
数据完整
为确保标注过程数据完整性,应做到:
a)接收人工智能数据可验证,保证接收的数据已通过认证;
b)人工智能数据传输过程完
定制服务
推荐标准
- T/XJBX 0064-2025 BIM在施工管理中的应用规范 2025-09-15
- T/GBC 83-2025 农村信用信息化术语 2025-09-12
- T/SDBDA 78-2025 商事登记注册地址信息采集规范 2025-09-12
- T/GBC 90-2025 农村信用信息资源目录编制规范 2025-09-12
- T/GBC 86-2025 农村信用信息系统通用要求 2025-09-12
- T/DZJN 466-2025 单对以太网系统工程技术规范 2025-09-11
- T/CCTAS 251-2025 铁路主导型综合客运枢纽信息服务系统技术要求 2025-09-12
- T/GBC 88-2025 农村信用信息数据采集规范 2025-09-12
- T/BIA 31-2025 基于LBE的VR沉浸探索空间解决方案技术要求和评估方法 2025-09-15
- T/XJBX 0065-2025 数字媒体生成式AI内容安全治理技术规范 2025-09-15