GB/T 45674-2025 网络安全技术 生成式人工智能数据标注安全规范

GB/T 45674-2025 Cybersecurity technology—Generative artificial intelligence data annotation security specification

国家标准 中文简体 即将实施 页数:24页 | 格式:PDF

基本信息

标准号
GB/T 45674-2025
相关服务
标准类型
国家标准
标准状态
即将实施
中国标准分类号(CCS)
国际标准分类号(ICS)
-
发布日期
2025-04-25
实施日期
2025-11-01
发布单位/组织
国家市场监督管理总局、国家标准化管理委员会
归口单位
全国网络安全标准化技术委员会(SAC/TC 260)
适用范围
本文件规定了生成式人工智能训练的数据标注平台或工具安全要求、数据标注规则安全要求、数据标注人员要求、数据标注核验要求,描述了数据标注安全评价方法。
本文件适用于生成式人工智能数据标注组织方开展训练数据标注活动,并为生成式人工智能数据需求方对于数据标注进行检查、验收或第三方机构对数据标注进行安全性评估提供参考。

发布历史

文前页预览

研制信息

起草单位:
国家计算机网络应急技术处理协调中心、中国电子技术标准化研究院、北京中关村实验室、北京快手科技有限公司、北京百度网讯科技有限公司、北京天融信网络安全技术有限公司、阿里云计算有限公司、北京大学、国家计算机网络应急技术处理协调中心江苏分中心、公安部第三研究所、清华大学、上海人工智能创新中心、北京市公安局人工智能安全研究中心、西安邮电大学、浙江大学、中国科学院信息工程研究所、中国移动通信集团有限公司、小米科技有限责任公司、蚂蚁科技集团股份有限公司、华为云计算技术有限公司、北京数安行科技有限公司、北京晴数智慧科技有限公司、北京零一万物科技有限公司、北京奇虎科技有限公司、科大讯飞股份有限公司、联想(北京)有限公司、启明星辰信息技术集团股份有限公司、亚信科技(成都)有限公司、杭州萤石软件有限公司、北京东方通网信科技有限公司、广东省信息安全测评中心、厦门美柚股份有限公司、北京瑞莱智慧科技有限公司、天翼安全科技有限公司、北京远鉴信息技术有限公司、上海商汤智能科技有限公司、苏州核数聚信息科技有限公司、南京领行科技股份有限公司、江苏满运软件科技有限公司、长安通信科技有限责任公司、OPPO广东移动通信有限公司
起草人:
张震、谭知行、张妍婷、贺敏、刘勇、孙旭东、徐恪、陈钟、杜金浩、郝春亮、任奎、刘楠、落红卫、叶晓俊、安勍、胡影、王龑、姚龙、谢安明、嵇程、江为强、丁治国、雷晓锋、戴娇、谷晨、张晴晴、郭建领、张勇、罗磊、刘玉红、廖双晓、蒋慧、赵云、张峰、许晓耕、王文宇、陈洋、张夏、彭骏涛、包沉浮、王海棠、孟凡芹、赵丽丽、刘俊华、李家锟、崔婷婷、余瀚洋、李峰风、臧娇娇、林冠辰、丁欣、王士进、韩晗、张向征、胡嵩智、徐怡悦、管铭、张天奕、黄喆、刘俊、周雪、郑榕、刘栋、罗旭鹏、郑鸿咚、蒋发群、马梦娜、田伟丽、胡月、黄鹏华、张小敏、张中维、周城、李根、李笑如、张秉晟、王和俊、刘洞宾
出版信息:
页数:24页 | 字数:38 千字 | 开本: 大16开

内容描述

ICS35030

CCSL.80

中华人民共和国国家标准

GB/T45674—2025

网络安全技术

生成式人工智能数据标注安全规范

Cybersecuritytechnology—Generativeartificialintelligencedataannotation

securityspecification

2025-04-25发布2025-11-01实施

国家市场监督管理总局发布

国家标准化管理委员会

GB/T45674—2025

目次

前言

…………………………Ⅲ

引言

…………………………Ⅳ

范围

1………………………1

规范性引用文件

2…………………………1

术语和定义

3………………1

概述

4………………………2

数据标注平台或工具安全要求

5…………3

数据标注规则安全要求

6…………………3

数据标注人员要求

7………………………4

安全培训

7.1……………4

任务分配

7.2……………4

人员管理

7.3……………4

数据标注核验要求

8………………………5

基本要求

8.1……………5

功能性标注核验安全要求

8.2…………5

安全性标注核验安全要求

8.3…………6

数据标注安全评价方法

9…………………6

数据标注平台或工具安全要求评价方法

9.1…………6

数据标注规则安全要求评价方法

9.2…………………7

数据标注人员要求评价方法

9.3………………………8

数据标注核验要求评价方法

9.4………………………10

附录资料性生成式人工智能数据标注示例

A()………12

附录资料性人工智能标注任务类型示例

B()…………14

GB/T45674—2025

前言

本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定

GB/T1.1—2020《1:》

起草

请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别专利的责任

。。

本文件由全国网络安全标准化技术委员会提出并归口

(SAC/TC260)。

本文件起草单位国家计算机网络应急技术处理协调中心中国电子技术标准化研究院北京中关

:、、

村实验室北京快手科技有限公司北京百度网讯科技有限公司北京天融信网络安全技术有限公司

、、、、

阿里云计算有限公司北京大学国家计算机网络应急技术处理协调中心江苏分中心公安部第三研究

、、、

所清华大学上海人工智能创新中心北京市公安局人工智能安全研究中心西安邮电大学浙江大学

、、、、、、

中国科学院信息工程研究所中国移动通信集团有限公司小米科技有限责任公司蚂蚁科技集团股份

、、、

有限公司华为云计算技术有限公司北京数安行科技有限公司北京晴数智慧科技有限公司北京零一

、、、、

万物科技有限公司北京奇虎科技有限公司科大讯飞股份有限公司联想北京有限公司启明星辰信

、、、()、

息技术集团股份有限公司亚信科技成都有限公司杭州萤石软件有限公司北京东方通网信科技有

、()、、

限公司广东省信息安全测评中心厦门美柚股份有限公司北京瑞莱智慧科技有限公司天翼安全科技

、、、、

有限公司北京远鉴信息技术有限公司上海商汤智能科技有限公司苏州核数聚信息科技有限公司

、、、、

南京领行科技股份有限公司江苏满运软件科技有限公司长安通信科技有限责任公司广东移

、、、OPPO

动通信有限公司

本文件主要起草人张震谭知行张妍婷贺敏刘勇孙旭东徐恪陈钟杜金浩郝春亮任奎

:、、、、、、、、、、、

刘楠落红卫叶晓俊安勍胡影王龑姚龙谢安明嵇程江为强丁治国雷晓锋戴娇谷晨

、、、、、、、、、、、、、、

张晴晴郭建领张勇罗磊刘玉红廖双晓蒋慧赵云张峰许晓耕王文宇陈洋张夏彭骏涛

、、、、、、、、、、、、、、

包沉浮王海棠孟凡芹赵丽丽刘俊华李家锟崔婷婷余瀚洋李峰风臧娇娇林冠辰丁欣

、、、、、、、、、、、、

王士进韩晗张向征胡嵩智徐怡悦管铭张天奕黄喆刘俊周雪郑榕刘栋罗旭鹏郑鸿咚

、、、、、、、、、、、、、、

蒋发群马梦娜田伟丽胡月黄鹏华张小敏张中维周城李根李笑如张秉晟王和俊刘洞宾

、、、、、、、、、、、、。

GB/T45674—2025

引言

数据标注是生成式人工智能的关键活动直接决定了训练数据以及生成内容的质量和安全水平但

,,

由于标注规则不完善人员管理不规范核验标准不明确等原因在数据标注过程中也可能为生成式人

、、,

工智能引入新的风险隐患亟需标准规范用于提高数据标注的安全水平为加强生成式人工智能数据

,。

标注活动的安全管理采取有效措施防范和处置相关风险编制本文件旨在帮助服务提供者数据标注

,,,、

组织方以及数据需求方明确数据标注的安全基线提高服务安全水平

、。

GB/T45674—2025

网络安全技术

生成式人工智能数据标注安全规范

1范围

本文件规定了生成式人工智能训练的数据标注平台或工具安全要求数据标注规则安全要求数据

、、

标注人员要求数据标注核验要求描述了数据标注安全评价方法

、,。

本文件适用于生成式人工智能数据标注组织方开展训练数据标注活动并为生成式人工智能数据

,

需求方对于数据标注进行检查验收或第三方机构对数据标注进行安全性评估提供参考

、。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款其中注日期的引用文

。,

件仅该日期对应的版本适用于本文件不注日期的引用文件其最新版本包括所有的修改单适用于

,;,()

本文件

人工智能面向机器学习的数据标注规程

GB/T42755—2023

网络安全技术生成式人工智能服务安全基本要求

GB/T45654—2025

3术语和定义

下列术语和定义适用于本文件

31

.

提示信息prompt

引导生成式人工智能模型完成特定任务并提供合理输出内容的输入信息

32

.

响应信息response

在生成式人工智能数据标注中按照提示信息要求形成的符合人类认知的应答信息用于训练模型

,,

形成对提示信息输出相应内容模式或风格的响应的能力

、。

33

.

生成式人工智能数据标注generativeartificialintelligencedataannotation

通过人工操作或使用自动化技术机制基于对提示信息的响应信息内容将特定信息如标签类别

,,、

或属性添加到文本图片音频视频或者其他数据样本的过程

、、、。

注以下简称数据标注

:“”。

来源

[:GB/T45654—2025,3.5]

34

.

功能性数据标注functionaldataannotation

用于训练生成式人工智能模型具备完成特定任务能力的数据标注

来源

[:GB/T45654—2025,3.6]

35

.

安全性数据标注securitydataannotation

用于训练生成式人工智能模型提升输出响应信息安全性的数据标注

来源

[:GB/T45654—2025,3.7]

1

定制服务