T/JSIA 0002-2022 能源大数据 数据目录指南

T/JSIA 0002-2022

团体标准 中文(简体) 现行 页数:23页 | 格式:PDF

基本信息

标准号
T/JSIA 0002-2022
标准类型
团体标准
标准状态
现行
中国标准分类号(CCS)
-
国际标准分类号(ICS)
发布日期
2022-12-01
实施日期
2022-12-02
发布单位/组织
-
归口单位
江苏省软件行业协会
适用范围
范围:本文件提供了能源大数据中心的元数据、数据目录编码、数据目录管理等方面的建议和指导。 本文件适用于指导能源大数据中心开展数据目录的规划、编目、注册、管理、服务及使用工作; 主要技术内容:4.2.1目录名称目录名称应包括但不限于:a)定义:数据目录的标题名称;b)数据类型:字符串;c)值域:自由文本,见附录A;d)注解:必选项;最大出现次数为1;e)取值示例:煤炭生产企业信息。4.2.2目录编码目录编码应包括但不限于:a)定义:数据目录唯一不变的标识编码;b)数据类型:字符串;c)值域:自由文本,见附录A;d)注解:必选项;最大出现次数为1;e)取值示例:P320000-EP-1001-01。4.2.3目录摘要目录摘要应包括但不限于:a)定义:对数据目录内容进行概要说明的文字;b)数据类型:字符串;c)值域:自由文本;d)注解:必选项;最大出现次数为1;e)取值示例:指煤炭生产企业的基础数据、位置数据等。4.2.4目录标签目录标签应包括但不限于:a)定义:用于标识目录内容的通用词、形式化词或短语;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为N;e)取值示例:煤炭生产。4.2.5目录安全定级目录安全定级应包括但不限于:a)定义:包括1级、2级、3级、4级、5级;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为1;e)取值示例:1级。4.2.6开放和共享形式开放和共享形式应包括但不限于:a)定义:包括原始数据、脱敏数据、标签数据、验真数据和群体数据等;b)数据类型:字符串;c)值域:自由文本d)注解:可选项;最大出现次数为N;e)取值示例:脱敏数据。4.2.7开放和共享属性开放和共享属性应包括但不限于:a)定义:包括不予开放和共享、有条件开放和共享和无条件开放和共享三类;b)数据类型:字符串;c)值域:自由文本;d)注解:必选项;最大出现次数为1;e)取值示例:不予开放和共享。4.2.8目录开放和共享技术方式目录开放和共享技术方式应包括但不限于:a)定义:包括但不限于“API获取”“数据库封装”“文件”“网页链接”“推送”或“交换库”;b)数据类型:字符串;c)值域:自由文本;d)注解:可选项;最大出现次数为N;e)取值示例:API获取

研制信息

起草单位:
国家电网有限公司、国网江苏省电力有限公司、国网江苏省电力有限公司信通分公司、国家电网有限公司大数据中心、国网江苏省电力有限公司营销服务中心、江苏方天电力技术有限公司
起草人:
徐春雷、顾斌、刘梅招、夏飞、车伟、凌绍伟、顾颖程、刘凯、罗慧、皮一晨、宋玉、程环宇、孙博、许梦晗、汤雷、赵申、刘琛、余晗、沈子奇、孔月萍、吴亦贝、邵恩泽、王子涵
出版信息:
页数:23页 | 字数:- | 开本: -

内容描述

ICS35.080

L77

T/JSIA

江苏省软件行业协会团体标准

T/JSIA0002—2022

能源大数据数据目录指南

Energybigdata——Guidelinesfordatacatalog

2022-12-01发布2022-12-02实施

江苏省软件行业协会  发布

T/JSIA0002—2022

目次

前言.......................................................................................................................................................................II

1范围...................................................................................................................................................................1

2规范性引用文件...............................................................................................................................................1

3术语和定义.......................................................................................................................................................1

4元数据...............................................................................................................................................................2

4.1元数据属性...............................................................................................................................................2

4.2业务元数据...............................................................................................................................................3

4.3管理元数据...............................................................................................................................................5

5数据目录编码...................................................................................................................................................8

5.1数据目录编码原则和方法.......................................................................................................................8

5.2数据目录编码格式...................................................................................................................................8

5.3一级类编码...............................................................................................................................................9

5.4二级类编码...............................................................................................................................................9

5.5三级类编码...............................................................................................................................................9

5.6四级类编码.............................................................................................................................................11

5.7扩展机制.................................................................................................................................................11

5.8目录编码示例.........................................................................................................................................11

6数据目录管理.................................................................................................................................................11

6.1数据目录管理架构.................................................................................................................................11

6.2数据目录管理参与角色.........................................................................................................................12

6.3数据目录管理环节.................................................................................................................................12

附录A(资料性)数据目录分类与编码示例...................................................................................................15

参考文献...............................................................................................................................................................19

I

T/JSIA0002—2022

前言

本标准按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起

草。

本标准由江苏省软件和信息技术服务标准化技术委员会、江苏省软件行业协会提出和归口。

本标准由国网江苏省电力有限公司共同提出。

本标准起草单位:国家电网有限公司、国网江苏省电力有限公司、国网江苏省电力有限公司信通分

公司、国家电网有限公司大数据中心、国网江苏省电力有限公司营销服务中心、江苏方天电力技术有限

公司

本标准主要起草人:徐春雷、顾斌、刘梅招、夏飞、车伟、凌绍伟、顾颖程、刘凯、罗慧、皮一晨、

宋玉、程环宇、孙博、许梦晗、汤雷、赵申、刘琛、余晗、沈子奇、孔月萍、吴亦贝、邵恩泽、王子涵。

II

T/JSIA0002—2022

能源大数据数据目录指南

1范围

本文件提供了能源大数据中心的元数据、数据目录编码、数据目录管理等方面的建议和指导。

本文件适用于指导能源大数据中心开展数据目录的规划、编目、注册、管理、服务及使用工作。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T2260-2007中华人民共和国行政区划代码

GB/T2589-2020综合能耗计算通则

GB/T7027-2002信息分类和编码的基本原则与方法

GB/T7408-2005数据元和交换格式信息交换日期和时间表示法

GB18030-2005信息技术中文编码字符集

GB/T21063.3-2007政务信息资源目录体系第3部分:核心元数据

GB/T21063.4-2007政务信息资源目录体系第4部分:政务信息资源分类

GB/T22373-2021标准文献元数据

GB/T29870-2013能源分类与代码

GB/T38667-2020信息技术大数据数据分类指南

DB37/T2975-2017国土资源数据目录体系规范

3术语和定义

下列术语和定义适用于本文件。

3.1

能源大数据energybigdata

煤炭、石油、天然气、电力、新能源、热力、水等能源行业生产、运输、消费、运营和管理过程中

产生的数据,以及宏观经济运行、生态环境、气象等能源行业密切相关的数据。

注:它可以具有大数据的体量、速度、多样性和易变性特征。能源数据的特征,当其在网络上传输时或暂时驻留于

计算机存储器中以备读出或更新时,表征的是动态能源数据。

3.2

能源大数据中心energybigdatacenter

能源大数据的数据汇聚中心、价值创造中心、开放共享中心。一般具有实体或虚拟的组织管理形式

和机构,包含基础设施、数据管理、产品服务、运营管理、安全防护等部分。

3.3

目录catalog

采用规范的元数据提取的、描述某个具体信息资源特征的一组信息。

1

T/JSIA0002—2022

[来源:DB37/T2975-2017,定义3.1]

3.4

分类classification

按照选定的属性(或特征)区分分类对象,将具有某种共同属性(或特征)的分类对象集合在一起

的过程。

[来源:DB37/T2975-2017,定义3.6]

3.5

编目catalogue

采编数据核心元数据或服务资源元数据的过程。

[来源:DB37/T2975-2017,定义3.7]

3.6

元数据metadata

定义和描述其他数据的数据。

[来源:GB/T22373-2021,定义3.3.]

3.7

元数据元素metadataelement

元数据的基本单元,用以描述信息资源某个特性。

注:元数据元素在元数据实体中是唯一的。

[来源:GB/T21063.3-2007,定义3.1]

3.8

元数据实体metadataentity

一组说明信息资源相关特性的元数据元素。

注:可以保护一个或一个以上元数据实体。

[来源:GB/T21063.3-2007,定义3.2]

3.9

耗能工质energy-consumedmedium

在生产过程中所消耗的不作为原料使用、也不进入产品,在生产或制取时需要直接消耗能源的工作

物质。

[来源:GB/T2589-2020,定义3.1]

4元数据

4.1元数据属性

参照GB/T21063.3-2007的相关规定,元数据属性包括:中文名称、定义、数据类型、值域、注解、

取值示例。

4.1.1中文名称

指元数据元素或元数据实体的中文名称,用4.2和4.3中各条的标题来表达。

4.1.2定义

描述元数据实体或元数据元素的基本内容,给出数据目录某个特性的概念和说明。

2

T/JSIA0002—2022

4.1.3数据类型

说明元数据元素的数据类型,对元数据元素的有效值域及允许的有效操作进行了规定。例如整型、

实型、布尔型、字符串、日期等。

4.1.4值域

说明元数据元素可以取值的范围。

4.1.5注解

对元数据元素的含义的进一步解释,包括该元数据元素的约束(必选、可选)和最大出现次数。

4.1.5.1约束

说明元数据实体或元数据元素是否必须选取的属性。包括必选、可选:

a)必选:表明该元数据实体或元数据元素必须选择;

b)可选:根据实际应用可以选择也可以不选择的元数据实体或元数据元素。已经定义的可选元

数据实体或元数据元素可充分说明数据目录。

可选元数据实体可以包括必选元数据元素,但只当可选实体被选用时才成为必选。如果一个可选元

数据实体未被使用,则该实体所包括的元素(包括必选元素)也不选用。

4.1.5.2最大出现次数

说明元数据实体或元数据元素可以具有的最大实例数目。只出现一次的用“1”表示,多次重复出

现的用“N”表示。允许不为1的固定出现次数用相应的数字表示,如“2”、“3”、“4”等。

4.1.6取值示例

对于每一个元数据元素,都列举一个著录时的填写内容示例。

4.2业务元数据

4.2.1目录名称

目录名称应包括但不限于:

a)定义:数据目录的标题名称;

b)数据类型:字符串;

c)值域:自由文本,见附录A;

d)注解:必选项;最大出现次数为1;

e)取值示例:煤炭生产企业信息。

4.2.2目录编码

目录编码应包括但不限于:

a)定义:数据目录唯一不变的标识编码;

b)数据类型:字符串;

c)值域:自由文本,见附录A;

d)注解:必选项;最大出现次数为1;

3

T/JSIA0002—2022

e)取值示例:P320000-EP-1001-01。

4.2.3目录摘要

目录摘要应包括但不限于:

a)定义:对数据目录内容进行概要说明的文字;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:必选项;最大出现次数为1;

e)取值示例:指煤炭生产企业的基础数据、位置数据等。

4.2.4目录标签

目录标签应包括但不限于:

a)定义:用于标识目录内容的通用词、形式化词或短语;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:可选项;最大出现次数为N;

e)取值示例:煤炭生产。

4.2.5目录安全定级

目录安全定级应包括但不限于:

a)定义:包括1级、2级、3级、4级、5级;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:可选项;最大出现次数为1;

e)取值示例:1级。

4.2.6开放和共享形式

开放和共享形式应包括但不限于:

a)定义:包括原始数据、脱敏数据、标签数据、验真数据和群体数据等;

b)数据类型:字符串;

c)值域:自由文本

d)注解:可选项;最大出现次数为N;

e)取值示例:脱敏数据。

4.2.7开放和共享属性

开放和共享属性应包括但不限于:

a)定义:包括不予开放和共享、有条件开放和共享和无条件开放和共享三类;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:必选项;最大出现次数为1;

e)取值示例:不予开放和共享。

4

T/JSIA0002—2022

4.2.8目录开放和共享技术方式

目录开放和共享技术方式应包括但不限于:

a)定义:包括但不限于“API获取”“数据库封装”“文件”“网页链接”“推送”或“交换库”;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:可选项;最大出现次数为N;

e)取值示例:API获取。

4.3管理元数据

4.3.1目录状态

目录状态应包括但不限于:

a)定义:包括注册待审核、审核通过、返回修改、上架启用、启用后申请更新、停用;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:必选项;最大出现次数为N;

e)取值示例:上架启用。

4.3.2目录版本

目录版本应包括但不限于:

a)定义:目录的版本号信息;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:必选项;最大出现次数为1;

e)取值示例:version_211101。

4.3.3目录注册日期

目录注册日期应包括但不限于:

a)定义:目录提供方申请注册目录的日期;

b)数据类型:日期型;

c)值域:按GB/T7408-2005执行,格式为CCYY-MM-DD;

d)注解:可选项;最大出现次数为1;

e)取值示例:2021-11-11。

4.3.4目录审核日期

目录审核日期应包括但不限于:

a)定义:目录运营方审核注册目录的日期;

b)数据类型:日期型;

c)值域:按GB/T7408-2005执行,格式为CCYY-MM-DD;

d)注解:可选项;最大出现次数为1;

e)取值示例:2021-11-12。

5

T/JSIA0002—2022

4.3.5目录上架日期

目录上架日期应包括但不限于:

a)定义:目录运营方发布目录上架的日期;

b)数据类型:日期型;

c)值域:按GB/T7408-2005执行,格式为CCYY-MM-DD;

d)注解:可选项;最大出现次数为1;

e)取值示例:2021-11-13。

4.3.6目录更新日期

目录更新日期应包括但不限于:

a)定义:目录上架启用后,目录提供方再次提交的更新日期;

b)数据类型:日期型;

c)值域:按GB/T7408-2005执行,格式为CCYY-MM-DD;

d)注解:可选项;最大出现次数为N;

e)取值示例:2021-11-21。

4.3.7目录停用日期

目录停用日期应包括但不限于:

a)定义:目录运营方停用目录的日期;

b)数据类型:日期型;

c)值域:按GB/T7408-2005执行,格式为CCYY-MM-DD;

d)注解:可选项;最大出现次数为N;

e)取值示例:2021-11-25。

4.3.8目录提供方信息

目录提供方信息应包括但不限于:

a)定义:包括目录提供方单位/部门、联系人、联系电话;

b)数据类型:复合型;

c)注解:可选项;最大出现次数为N。

4.3.8.1目录提供方单位

目录提供方单位应包括但不限于:

a)定义:目录提供方的单位/部门名称;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:必选项;最大出现次数为1;

e)取值示例:江苏电力信息技术有限公司**部门。

4.3.8.2目录提供方联系人

目录提供方联系人应包括但不限于:

a)定义:目录提供方的联系人;

6

T/JSIA0002—2022

b)数据类型:字符串;

c)值域:自由文本;

d)注解:可选项;最大出现次数为1;

e)取值示例:张三。

4.3.8.3目录提供方联系电话

目录提供方联系电话应包括但不限于:

a)定义:目录提供方的联系电话;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:可选项;最大出现次数为1;

e)取值示例:137********。

4.3.9目录运营方信息

目录运营方信息应包括但不限于:

a)定义:包括目录运营方单位/部门、联系人、联系电话;

b)数据类型:复合型;

c)注解:可选项;最大出现次数为N。

4.3.9.1目录运营方单位

目录运营方单位应包括但不限于:

a)定义:目录运营方的单位/部门名称;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:必选项;最大出现次数为1;

e)取值示例:国网江苏省电力有限公司营销服务中心**部门。

4.3.9.2目录运营方联系人

目录运营方联系人应包括但不限于:

a)定义:目录运营方的联系人;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:可选项;最大出现次数为1;

e)取值示例:张三。

4.3.9.3目录运营方联系电话

目录运营方联系电话应包括但不限于:

a)定义:目录运营方的联系电话;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:可选项;最大出现次数为1;

7

T/JSIA0002—2022

e)取值示例:137********。

4.3.10目录管理方信息

目录管理方信息应包括但不限于:

a)定义:包括目录管理方单位/部门、联系人、联系电话;

b)数据类型:复合型;

c)注解:可选项;最大出现次数为N。

4.3.10.1目录管理方单位

目录管理方单位应包括但不限于:

a)定义:目录管理方的单位/部门名称;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:必选项;最大出现次数为1;

e)取值示例:国网江苏省电力有限公司**部。

4.3.10.2目录管理方联系人

目录管理方联系人应包括但不限于:

a)定义:目录管理方的联系人;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:可选项;最大出现次数为1;

e)取值示例:张三。

4.3.10.3目录管理方联系电话

目录管理方联系电话应包括但不限于:

a)定义:目录管理方的联系电话;

b)数据类型:字符串;

c)值域:自由文本;

d)注解:可选项;最大出现次数为1;

e)取值示例:137********。

5数据目录编码

5.1数据目录编码原则和方法

本文件数据目录编码的原则和方法遵循GB/T7027-2002的规定。数据目录编码使用的英文字母和阿

拉伯数字遵循GB18030-2005的规定。

5.2数据目录编码格式

数据目录编码由一级类编码、二级类编码、三级类编码和四级类编码四部分组成,编码之间用字符

“-”隔开

定制服务

    相似标准推荐

    更多>