DB21/T 3893-2023 工业数据流通 数据清洗规范

DB21/T 3893-2023

辽宁省地方标准 简体中文 现行 页数:18页 | 格式:PDF

基本信息

标准号
DB21/T 3893-2023
标准类型
辽宁省地方标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2023-12-30
实施日期
2024-01-30
发布单位/组织
辽宁省市场监督管理局
归口单位
辽宁省工业和信息化厅
适用范围
-

发布历史

研制信息

起草单位:
沈阳华睿博信息技术有限公司、国家计算机网络应急技术处理协调中心辽宁分中心、辽宁艾特斯智能交通技术有限公司、辽宁职业学院、东北大学、上海数据交易所、辽宁省大数据管理中心、北京赛迪时代信息产业股份有限公司、辽宁省先进装备制造业基地建设工程中心
起草人:
出版信息:
页数:18页 | 字数:- | 开本: -

内容描述

ICS25.040.40

CCSL70

21

辽宁省地方标准

DB21/T3893—2023

工业数据流通数据清洗规范

2023-12-30发布2024-01-30实施

辽宁省市场监督管理局发布

DB21/T3893—2023

目次

前言.................................................................................III

1范围................................................................................1

2规范性引用文件......................................................................1

3术语和定义..........................................................................1

4缩略语..............................................................................2

5清洗目的............................................................................2

6清洗范围............................................................................2

7过程要求............................................................................3

7.1清洗流程........................................................................3

7.2数据抽取........................................................................3

7.3定义规则........................................................................3

7.4数据过滤........................................................................4

7.5数据校验........................................................................4

7.6错误标识........................................................................4

7.7修正处理........................................................................5

7.8数据转换........................................................................6

7.9结果检验........................................................................6

7.10数据加载.......................................................................8

8环境要求............................................................................8

8.1数据脱敏........................................................................8

8.2数据安全.......................................................................10

8.3人员能力.......................................................................10

9质量要求...........................................................................10

参考文献..............................................................................12

I

DB21/T3893—2023

前言

本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起

草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由辽宁省工业和信息化厅提出并归口。

本文件起草单位:沈阳华睿博信息技术有限公司、国家计算机网络应急技术处理协调中心辽宁分中

心、辽宁艾特斯智能交通技术有限公司、辽宁职业学院、东北大学、上海数据交易所、辽宁省大数据管

理中心、北京赛迪时代信息产业股份有限公司、辽宁省先进装备制造业基地建设工程中心。

本文件主要起草人:邵华、李凯、黄书鹏、王宇飞、宋宪辉、王义刚、申翔宇、谭振华、杨成实、

张翔宇、魏国伟、刘洋。

本文件发布实施后,任何单位和个人如有问题和意见建议,均可以通过来电和来函等方式进行反馈,

我们将及时答复并认真处理,根据实际情况依法进行评估及复审。

归口管理部门通信地址:沈阳市辽宁省沈阳市皇姑区北陵大街45-2号。

归口管理部门联系电话:024-86913384。

文件起草单位通讯地址:辽宁省沈阳市和平区青年大街386号华阳国际大厦2396。

文件起草单位联系电话:18698849086。

III

DB21/T3893—2023

工业数据流通数据清洗规范

1范围

本文件规定了工业数据清洗的过程要求、环境要求和质量要求。

本文件适用于数据流通中的工业数据清洗。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文

件。

GB/T22239-2019信息安全技术网络安全等级保护基本要求

GB/T35274-2017信息安全技术大数据服务安全能力要求

GB/T35295-2017信息技术大数据术语

GB/T37973-2019信息安全技术大数据安全管理指南

GB/T39477-2020信息安全技术政务信息共享数据安全技术要求

GB/T42128-2022智能制造工业数据分类原则

DA/T82-2019基于文档型非关系型数据库的档案数据存储规范

3术语和定义

下列术语和定义适用于本文件。

3.1

数据清洗datacleaning

运用一定方法识别并修正数据问题,提高数据质量的过程。

3.2

工业数据industrialdata

在工业领域中,涉及企业的所有生产活动和服务所产生的数据。

[来源:GB/T42128-2022,3.1.1]

3.3

结构化数据structureddata

一种数据表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用关

系模型予以有效描述。

[来源:GB/T35295-2017,2.2.13]

3.4

非结构化数据unstructureddata

不具有预定义模型或未以预定义方式组织的数据。

[来源:GB/T35295-2017,2.1.25]

1

DB21/T3893—2023

3.5

半结构化数据semi-structureddata

具有结构性,但结构变化大,且难以用结构化数据的处理方法将其放进二维表的数据。

示例:XML文档内容,每项都被一对标记封起来,如<title></title>,表面上看是结构化数据,但<title></title>之间

的数据却是千变万化,这是典型的半结构化数据。

[来源:DA/T82-2019,2.8]

3.6

定制服务

    推荐标准

    相似标准推荐

    更多>