DB13/T 2351.2-2016 标准文献结构化数据规范 第2部分:指标元数据
DB13/T 2351.2-2016 Standard document structuring data specification Part 2: Indicator metadata
基本信息
发布历史
-
2016年05月
研制信息
- 起草单位:
- 起草人:
- 出版信息:
- 页数:23页 | 字数:- | 开本: -
内容描述
ICS01.140.20
A14
DB13
河北省地方标准
DB13/T2351.2—2016
标准文献结构化数据规范
第2部分:指标元数据
Structureddataspecificationsofstandarddocuments
Part2:Indicatormetadata
2016-05-23发布2016-07-01实施
河北省质量技术监督局发布
DB13/T2351.2—2016
目次
前言................................................................................II
引言...............................................................................III
1范围..............................................................................1
2规范性引用文件....................................................................1
3术语和定义........................................................................1
4指标元数据的属性..................................................................2
5指标元数据模型....................................................................2
6技术指标元数据描述................................................................3
7指标元数据字典描述...............................................................10
8指标元数据扩展原则和方法.........................................................10
附录A(规范性附录)标准文献指标元数据代码集.......................................11
附录B(资料性附录)标准文献结构化指标元数据-字典描述..............................12
参考文献............................................................................17
I
DB13/T2351.2—2016
前言
本部分按照GB/T1.1-2009给出的规则起草。
DB13/T2351《标准文献结构化数据规范》包括了3部分:
——第1部分:全文元数据;
——第2部分:指标元数据
——第3部分:元数据著录规则。
本部分是第2部分,本部分与第3部分配套使用。
本部分由河北省服务业标准化技术委员会提出并归口。
本部分起草单位:河北省标准化研究院。
本部分主要起草人:马星晓、施健、卢艳芳、郭天强、闫志强、李建勋、谢燕、张园园、陈南、赵
倩、安姣。
II
DB13/T2351.2—2016
引言
标准文献电子文档格式有DOCX、数字版PDF、扫描版PDF。在生产、科研和管理过程中,往往需要
定位到标准内容、指标信息上,如:检索标准指标、指标比对及标准水平分析等。但是,现有的标准文
献电子文档为非结构化文档,这一特性决定它的内容检索指向性笼统模糊,故而,以非结构化文档为单
元存储无法实现小颗粒度的指标数据的检索、比对分析。只有通过数据处理将非结构化文档转换为结构
化或半结构化文档方能解决上述问题。
为寻求上述瓶颈的突破,河北省标准化研究院在2012年将标准文献结构化列为重点科研项目,在
此基础上,2013年又承担了国家标准化委员会标准化信息中心的《“双打”重点产品标准文献结构化内
容数据库》项目,而实现标准文献结构化必须首要解决2个问题:1)结构化标准的数据结构问题,换而
言之,标准结构化加工抽取出的数据是哪些数据?2)抽取出来的数据进行加工应符合什么样的数据规
范要求,方能满足与原始标准文本内容的一致性的需求。
解决第一个问题,需要建立标准结构化数据模型,并通过元数据规范来实现;
解决第二个问题,需要建立数据的著录规则,实现数据的规范性。
项目组在确定文献结构化抽取技术的基础上,对4000余项强制性国家标准的内容要素逐一进行了
分析研究、归纳总结后,按UML思想确定了标准结构化数据模型,并在工程上对4000余项强制性国家标
准进行了结构化数据的抽取验证,确定了结构化元数据。通过验证测试,逐步完善了加工抽取结构化数
据的规范要求,形成了《标准文献结构化数据规范》。
目前,在行业内广泛使用的GB/T22373-2008《标准文献元数据》是针对标准文献题录的元数据标
准,侧重的是标准文献形式特征,而此次制定的《标准文献结构化数据规范》是关于标准内容结构化的
全文元数据和指标元数据规范,希望此两个标准的结合使用,实现标准文献信息资源的统一描述,促进
标准文献信息资源的开发利用。
III
DB13/T2351.2—2016
标准文献结构化数据规范第2部分:指标元数据
1范围
本部分规定了标准文献结构化技术指标元数据(以下简称指标元数据)的术语和定义、属性、数据
模型、数据描述以及扩展原则和方法。
本部分适用于标准文献结构化数据的处理。
2规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T7408数据元和交换格式信息交换日期和时间表示法(GB/T7408-2005,ISO8601:2000,
IDT)
GB/T18391.3-2009信息技术元数据注册系统(MDR)第3部分:注册系统元模型与基本属性
(ISO/IEC11179-3:2003,IDT)
GB/T19710-2005地理信息元数据(ISO19115-2003,MOD)
GB/T26816-2011信息资源核心元数据
DB13/T2351.1-2016标准文献结构化数据规范第1部分:全文元数据
3术语和定义
下列术语和定义适用于本文件。
3.1
信息资源informationresource
在政治、经济和社会等各领域产生和使用、具有各种载体形式的信息内容。
[GB/T26816-2011,定义3.1]
3.2
元数据metadata
定义和描述其他数据的数据。
[GB/T18391.3-2009,定义3.2.18]
3.3
元数据元素metadataelement
元数据的基本单元。
注:元数据元素在元数据实体中是唯一的。
[GB/T19710-2005,定义4.61]
1
DB13/T2351.2—2016
3.4
元数据实体metadataentity
一组说明信息资源相关特性的元数据元素。
注:可以包含一个或一个以上元数据实体。
[GB/T19710-2005,定义4.71]
3.5
核心元数据coremetadata
描述信息资源基本属性的元数据元素和元数据实体。
[GB/T26816-2011,定义3.5]
4指标元数据的属性
本部分采用摘要表示的方法定义和描述标准结构化指标元数据,摘要内容包括以下八个属性:中文
名称、英文名称、缩写名、定义、数据类型、值域、约束/条件、最大出现次数。
4.1中文名称
元数据元素或元数据实体的中文名称,用第6章中各条的标题来表达。
4.2英文名称
应符合DB13/T2351.1-2016中4.2的规定。
4.3缩写名
应符合GB/T26816-2011中4.6的规定。
4.4定义
应符合GB/T26816-2011中4.2的规定。
4.5数据类型
应符合GB/T26816-2011中4.4的规定。
4.6值域
应符合GB/T26816-2011中4.5的规定。
4.7约束/条件
应符合GB/T26816-2011中4.7的规定,约束/条件代码见DB13/TXXXX.1-2016附录A表A.1。
4.8最大出现次数
应符合GB/T26816-2011中4.8的规定。
5指标元数据模型
2
DB13/T2351.2—2016
标准文献结构化指标元数据模型见图1。
1
+标识符:string
1+技术指标:技术指标
+版本信息:版本信息
1
+位置信息:位置信息
+类别状态信息:类别状态信息
+指标状态:string1..*
+是否强制:bool
+指标类型:string1
+指标性质:string
1
1..*
+更新时间:string
+记录状态:string+标准对象:string
+版本:string+指标对象:string
+加工单位:string+指标对象属性:指标对象属性+指标对象属性名称:string
+指标影响因素:指标影响因素10..*+指标对象属性值:string
+指标名称:string+指标对象属性类型:string
1+指标内容:string
+标准号:string+计量单位:string
+标准名称:string+指标注:string
+篇章条编号:string+表注:string
+指标影响因素名称:string
+表号:string+试验方法:string
10..*+指标影响因素值:string
+表名:string-指标组ID:string
+指标影响因素类型:string
图1指标元数据模型
6技术指标元数据描述
6.1技术指标元数据
中文名称:技术指标元数据
英文名称:TechnicalIndicatorMetadata
缩写名:TechIndMdata
定义:描述结构化标准中技术指标数据的元数据。
数据类型:复合型
约束/条件:M
最大出现次数:1
6.2标识符
应符合DB13/T2351.1-2015中6.2的规定。
6.3技术指标
中文名称:技术指标
英文名称:TechnicalIndicator
缩写名:TechInd
3
DB13/T2351.2—2016
定义:描述标准质量特性指标的一组信息。
数据类型:复合型
约束/条件:M
最大出现次数:1
6.4标准对象
中文名称:标准对象
英文名称:documentobject
缩写名:docObj
定义:描述一个实体的标准化活动的作用对象。
数据类型:字符串
值域:自由文本
约束/条件:M
最大出现次数:1
6.5指标对象
中文名称:指标对象
英文名称:indicatorobject
缩写名:indObj
定义:描述一个实体的质量特征的作用对象。
数据类型:字符串
值域:自由文本
约束/条件:M
最大出现次数:1
6.6指标对象属性
中文名称:指标对象属性
英文名称:IndicatorObjectAttribute
缩写名:IndObjAttr
定义:描述指标对象特征、特性的一组信息。
数据类型:复合型
约束/条件:O
最大出现次数:N
6.7指标对象属性名称
中文名称:指标对象属性名称
英文名称:indicatorobjectattributename
缩写名:indObjAttrNm
描述指标对象的特性、特征的名称。如:形状、颜色、气味、优劣、用
定义:
途等都是指标对象的性质。
数据类型:字符串
值域:自由文本
约束/条件:M
4
DB13/T2351.2—2016
最大出现次数:1
6.8指标对象属性值
中文名称:指标对象属性值
英文名称:indicatorobjectattributevalue
缩写名:indObjAttrVal
定义:描述指标对象属性的内容。
数据类型:字符串
值域:自由文本
约束/条件:M
最大出现次数:1
6.9指标对象属性类型
中文名称:指标对象属性类型
英文名称:indicatorobjectattributetype
缩写名:indObjAttrTyp
定义:描述指标对象的类别。
数据类型:字符串
值域:字典
约束/条件:O
最大出现次数:N
6.10指标影响因素
中文名称:指标影响因素
英文名称:IndicatorInfluencingFactor
缩写名:IndInfluFact
定义:描述与指标数据有关的一组信息。
数据类型:复合型
约束/条件:O
最大出现次数:N
6.11指标影响因素名称
中文名称:指标影响因素名称
英文名称:indicatorinfluencingfactorname
缩写名:indInfluFactNm
对指标数据产生有一定约束关系的因素名称。如:环境因素、测试方法、
定义:
工具、工艺、作用对象等。
数据类型:字符串
值域:自由文本
约束/条件:M
最大出现次数:1
6.12指标影响因素值
5
DB13/T2351.2—2016
中文名称:指标影响因素值
英文名称:indicatorinfluencingfactorvalue
缩写名:indInfluFactVal
定义:指标影响因素的具体内容描述。
数据类型:字符串
值域:自由文本
约束/条件:M
最大出现次数:1
6.13指标影响因素类型
中文名称:指标影响因素类型
英文名称:indicatorinfluencingfactortype
缩写名:indInfluFactTyp
定义:描述指标影响因素的类别。
数据类型:字符串
值域:字典
约束/条件:O
最大出现次数:N
6.14指标名称
中文名称:指标名称
英文名称:indicatorname
缩写名:
定制服务
推荐标准
- T/CAI 158-2021 地理标志产品 固安小磨香油 2021-11-30
- T/SCAQ 012-2023 火锅食材 牛油 2023-10-25
- T/XYSCY 0001-2022 信阳山茶油 2022-09-30
- T/QPA 004-2022 高油酸花生脱壳良好操作规范 2022-05-18
- T/CCOA 23-2020 食用鸭油 2020-12-21
- T/CCOA 22-2020 食用鸡油 2020-12-21
- T/SDAS 536-2022 山东黑花生 2022-12-15
- T/ZSGTS 252-2023 香山之品 大豆油 2023-06-29
- T/CQDB 0005-2020 地理标志产品 彭水紫苏油 2020-12-25
- T/ZZB 0674-2018 米糠油 2018-10-26