GB/T 45652-2025 网络安全技术 生成式人工智能预训练和优化训练数据安全规范
GB/T 45652-2025 Cybersecurity technology—Security specification for generative artificial intelligence pre-training and fine-tuning data
基本信息
本文件适用于生成式人工智能服务提供者开展预训练和优化训练数据处理活动以及安全自评估,也适用于第三方机构对预训练和优化训练数据进行安全性评估。
发布历史
-
2025年04月
文前页预览
研制信息
- 起草单位:
- 北京中关村实验室、国家计算机网络应急技术处理协调中心、中国电子技术标准化研究院、北京大学、北京天融信网络安全技术有限公司、北京快手科技有限公司、阿里巴巴(北京)软件服务有限公司、北京百度网讯科技有限公司、清华大学、北京瑞莱智慧科技有限公司、天翼安全科技有限公司、中国移动通信集团有限公司、小米科技有限责任公司、阿里云计算有限公司、北京面壁智能科技有限责任公司、杭州萤石软件有限公司、北京理工大学、北京零一万物科技有限公司、中国科学院自动化研究所、联想(北京)有限公司、北京奇虎科技有限公司、科大讯飞股份有限公司、华为云计算技术有限公司、北京数安行科技有限公司、公安部第三研究所、蚂蚁科技集团股份有限公司、北京启明星辰信息安全技术有限公司、中国科学院计算技术研究所
- 起草人:
- 徐恪、姚龙、张震、刘勇、谭知行、李琦、谢安明、许晓耕、杨光、崔天宇、郝春亮、张妍婷、薛智慧、郭建领、谷晨、姜文、叶晓俊、田天、梁伟、江为强、李家锟、彭骏涛、汪华东、郑鸿咚、洪延青、王海棠、朱贵波、孟遥、张向征、刘俊华、李峰风、刘玉红、刘楠、林冠辰、王龑、落红卫、谭映水、张峰、孙旭东、杜金浩、徐世真、安鹏、于阳、孙勇、郭洁昕、吴建亮、王霞、王金桥、高博雅、管铭、王士进、赵丽丽、王文宇、丁治国、蒋发群、盛强、吴博文
- 出版信息:
- 页数:24页 | 字数:30 千字 | 开本: 大16开
内容描述
ICS35030
CCSL.80
中华人民共和国国家标准
GB/T45652—2025
网络安全技术生成式人工智能预训练
和优化训练数据安全规范
Cybersecuritytechnology—Securityspecificationforgenerativeartificial
intelligencepre-trainingandfine-tuningdata
2025-04-25发布2025-11-01实施
国家市场监督管理总局发布
国家标准化管理委员会
GB/T45652—2025
目次
前言
…………………………Ⅲ
引言
…………………………Ⅳ
范围
1………………………1
规范性引用文件
2…………………………1
术语和定义
3………………1
通用安全要求
4……………2
预训练数据处理活动的安全要求
5………………………3
数据收集
5.1……………3
数据预处理
5.2…………………………3
数据使用
5.3……………4
优化训练数据处理活动的安全要求
6……………………4
数据收集
6.1……………4
数据预处理
6.2…………………………5
数据使用
6.3……………5
评价方法
7…………………5
通用安全评价方法
7.1…………………5
预训练数据处理活动评价方法
7.2……………………7
数据收集
7.2.1………………………7
数据预处理
7.2.2……………………8
数据使用
7.2.3………………………10
优化训练数据处理活动评价方法
7.3…………………10
数据收集
7.3.1………………………10
数据预处理
7.3.2……………………11
数据使用
7.3.3………………………12
参考文献
……………………14
Ⅰ
GB/T45652—2025
前言
本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定
GB/T1.1—2020《1:》
起草
。
请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别专利的责任
。。
本文件由全国网络安全标准化技术委员会提出并归口
(SAC/TC260)。
本文件起草单位北京中关村实验室国家计算机网络应急技术处理协调中心中国电子技术标准
:、、
化研究院北京大学北京天融信网络安全技术有限公司北京快手科技有限公司阿里巴巴北京软件
、、、、()
服务有限公司北京百度网讯科技有限公司清华大学北京瑞莱智慧科技有限公司天翼安全科技有限
、、、、
公司中国移动通信集团有限公司小米科技有限责任公司阿里云计算有限公司北京面壁智能科技有
、、、、
限责任公司杭州萤石软件有限公司北京理工大学北京零一万物科技有限公司中国科学院自动化研
、、、、
究所联想北京有限公司北京奇虎科技有限公司科大讯飞股份有限公司华为云计算技术有限公
、()、、、
司北京数安行科技有限公司公安部第三研究所蚂蚁科技集团股份有限公司北京启明星辰信息安全
、、、、
技术有限公司中国科学院计算技术研究所
、。
本文件主要起草人徐恪姚龙张震刘勇谭知行李琦谢安明许晓耕杨光崔天宇郝春亮
:、、、、、、、、、、、
张妍婷薛智慧郭建领谷晨姜文叶晓俊田天梁伟江为强李家锟彭骏涛汪华东郑鸿咚
、、、、、、、、、、、、、
洪延青王海棠朱贵波孟遥张向征刘俊华李峰风刘玉红刘楠林冠辰王龑落红卫谭映水
、、、、、、、、、、、、、
张峰孙旭东杜金浩徐世真安鹏于阳孙勇郭洁昕吴建亮王霞王金桥高博雅管铭王士进
、、、、、、、、、、、、、、
赵丽丽王文宇丁治国蒋发群盛强吴博文
、、、、、。
Ⅲ
GB/T45652—2025
引言
预训练和优化训练数据是生成式人工智能的基础直接决定了生成内容的质量和安全水平但由于
,,
预训练和优化训练数据在收集预处理使用等处理活动中存在安全风险亟需标准规范用于提高预训
、、,
练和优化训练数据的安全水平
。
Ⅳ
GB/T45652—2025
网络安全技术生成式人工智能预训练
和优化训练数据安全规范
1范围
本文件规定了生成式人工智能预训练和优化训练数据及其处理活动的安全要求描述了相应的评
,
价方法
。
本文件适用于生成式人工智能服务提供者开展预训练和优化训练数据处理活动以及安全自评估
,
也适用于第三方机构对预训练和优化训练数据进行安全性评估
。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款其中注日期的引用文
。,
件仅该日期对应的版本适用于本文件不注日期的引用文件其最新版本包括所有的修改单适用于
,;,()
本文件
。
信息安全技术个人信息安全规范
GB/T35273
信息安全技术网络数据处理安全要求
GB/T41479—2022
3术语和定义
下列术语和定义适用于本文件
。
31
.
生成式人工智能服务generativeartificialintelligenceservice
利用生成式人工智能技术向公众提供生成文本图片音频视频等内容的服务
、、、。
来源
[:GB/T45654—2025,3.1]
32
.
服务提供者serviceprovider
以交互界面可编程接口等形式提供生成式人工智能服务的组织或个人
、。
33
.
服务使用者serviceuser
使用生成式人工智能服务的组织或个人
。
34
.
预训练pre-training
使用大规模数据使生成式人工智能模型获得通用知识的训练过程
。
35
.
优化训练fine-tuning
在预训练基础上使用特定领域数据使生成式人工智能模型获得面向领域服务能力的训练过程
,。
注特定领域不限于某一个专业领域通常覆盖多个领域
:,。
1
定制服务
推荐标准
- DB36/T 616-2011 汽车客运站服务规范 2011-07-06
- DB52/T 709-2011 人工马尾松单株立木地上部分二元生物量表 2011-02-25
- DB52/T 705-2011 人工马尾松地径材积表 2011-02-25
- DB52/T 707-2011 人工马尾松二元立木材积生长率表 2011-02-25
- DB52/T 719-2011 水蕨菜仿生栽培技术规程 2011-06-14
- DB31/T 545-2011 行政审批办事指南编制指引 2011-07-17
- DB52/T 706-2011 杉木二元立木材积生长率表 2011-02-25
- DB52/T 711-2011 人工马尾松相对树高曲线表 2011-02-25
- DB31/T 544-2011 行政审批业务手册编制指引 2011-07-17
- DB52/T 720-2011 全坝外掺氧化镁混凝土拱坝技术规范 2011-06-20