DB15/T 2021.1-2020 草原大数据 第1部分:基础数据

DB15/T 2021.1-2020 Grassland Big Data Part 1: Basic Data

内蒙古自治区地方标准 简体中文 现行 页数:27页 | 格式:PDF

基本信息

标准号
DB15/T 2021.1-2020
标准类型
内蒙古自治区地方标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2020-10-20
实施日期
2020-11-20
发布单位/组织
内蒙古自治区市场监督管理局
归口单位
-
适用范围
-

发布历史

研制信息

起草单位:
起草人:
出版信息:
页数:27页 | 字数:- | 开本: -

内容描述

ICS35.240

CCSL70

DB15

内蒙古自治区地方标准

DB15/T2021.1—2020

草原大数据第1部分:基础数据

Grasslandbigdata-Part1:Basicdata

2020-10-20发布2020-11-20实施

内蒙古自治区市场监督管理局发布

DB15/T2021.1—2020

目次

前言................................................................................II

1范围..............................................................................1

2规范性引用文件....................................................................1

3术语和定义........................................................................1

4总则..............................................................................6

5草原大数据标准体系基本框架........................................................7

6草原大数据元数据属性的描述方法....................................................9

7草原大数据标识类属性..............................................................9

8草原大数据技术...................................................................14

9数据质量评估流程与评价方法.......................................................18

10草原大数据安全..................................................................19

11平台及工具类标准................................................................19

参考文献............................................................................22

I

DB15/T2021.1—2020

前言

本部分按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

DB15/T2021《草原大数据》的结构分为4个部分:

——第1部分:基础数据;

——第2部分:数据分类与编码;

——第3部分:数据元;

——第4部分:代码集。

本部分为DB15/T2021的第1部分。

本部分由内蒙古自治区农牧厅提出并归口。

本部分起草单位:内蒙古自治区农牧业信息中心、内蒙古云利科技有限公司、内蒙古草原工作

站、内蒙古草原监督管理局、内蒙古草原勘察规划院、内蒙古饲料草种监督检验站、内蒙古农业大

学、鄂托克前旗数字林草信息中心。

本部分主要起草人:刘永志、马超、付学良、王晓峰、张巧燕、朝格敖其尔、王伊拉图、赵于

东、李雪东、朱玉成、李慧旻、李宏慧、董改芳、王云利、刘爱军、高文渊、常炳文、巩韶飞。

II

DB15/T2021.1—2020

草原大数据第1部分:基础数据

1范围

本部分规定了草原大数据的数据采集、处理技术、平台及工具和信息安全等技术及管理要求。

本部分适用于内蒙古草原信息的共享、交换、评价与服务。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用

文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)

适用于本文件。

GB/T19710-2005地理信息元数据

GB/T20157信息技术软件维护

GB/T20531-2006移动数据库应用编程接口规范

GB/T22080信息技术安全技术信息安全管理体系要求

GB/T24450社会经济目标分类与代码

GB/Z28828信息安全技术公共及商用服务信息系统个人信息保护指南

GB/T29262信息技术面向服务的体系结构(SOA)术语

GB/T29263信息技术面向服务的体系结构(SOA)应用的总体技术要求

GB/T31495.1-2015信息安全技术信息安全保障指标体系及评价方法第1部分概念和模型

GB/T31495.2-2015信息安全技术信息安全保障指标体系及评价方法第2部分指标体系范

GB/T31495.3-2015信息安全技术信息安全保障指标体系及评价方法第3部分实施指南

GB/T32908非结构化数据访问接口规范

GB/T34949实时数据库C语言接口规范

GB/T34960.5信息技术服务治理第5部分:数据治理规范

GB/T36073数据管理能力成熟度评估模型

GB/T34978信息安全技术移动智能终端个人信息保护技术要求

GB/T37721信息技术大数据分析系统功能要求

GB/T37722信息技术大数据存储与处理系统功能要求标准

LY/T2930-2017林业数据采集规范

LY/T2181湿地信息分类与代码

LY/T2182荒漠化信息分类与编码

LY/T1814自然保护区生物多样性调查规范

LY/T2179野生动植物保护信息分类与编码

QX/T102气象资料分类与编码

DL/T1456电力系统数据库通用访问接口规范

1

DB15/T2021.1—2020

3术语和定义

GB/T19710界定的以及下列术语和定义适用于本文件。为了便于使用,以下重复列出GB/T19710

中的一些术语和定义。

3.1

大数据bigdata

具有体量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的

包含大量数据集的数据。

注:国际上,大数据的4个特征普遍不加修饰地直接用volume、variety、velocity和variability予以表述,并

分别赋予了它们在大数据语境下的定义。体量(volume)指构成大数据的数据集的规模;多样性(variety)

指数据可能来自多个数据仓库、数据领域或多种数据类型;速度(velocity)指单位时间的数据流量;多

变性(variability)指大数据其他特征,即体量、速度和多样性等特征都处于多变状态。

3.2

草原大数据grasslandbigdata

通过大数据技术将草原相关的数据整合起来应用在草原管理相关的业务领域,赋能政府机构,

提升政务实施效能的数据。这些数据包含了政府开展工作产生、采集以及因服务需求而采集的外部

大数据,以及为政府自有和面向政府的大数据。

注:从数据属性来看,草原大数据分为自然信息类、建设类、管理统计监察类和服务与民生消费类。自然信息

类包含地理、资源、气象、环境、水利等;建设类包含交通设施、旅游景点、住宅建设等;管理统计监察

类包含工商、税收、人口、机构、企业、商品等;服务与民生消费类包含水、电、燃气、通信、医疗、出

行等。

3.3

元数据metadata

关于数据的数据。

[来源:GB/T19710-2005,定义4.5]

3.4

元数据元素metadataelement

元数据的基本单元。

[来源:GB/T19710-2005,定义4.6]

3.5

元数据实体metadataentity

一组说明数据相同特性的元数据元素。

2

DB15/T2021.1—2020

注:可以包括一个或一个以上的元数据实体。

[来源:GB/T19710-2005,定义4.7]

3.6

核心元数据coremetadata

描述草原大数据最基本信息的元数据最小集合。

3.7

数据源datasource

数据的来源是提供某种所需要数据的器件或原始媒体。在数据源中存储了所有建立数据库连接

的信息。

草原大数据的数据源必需可靠且具备更新能力,常用的数据源有:

a)观测数据:现场获取的实测数据,它们包括野外实地勘测量算数据、台站的观测记录数据、

遥测数据等;

b)分析测定数据:利用物理和化学方法分析测定的数据;

c)图形数据:各种地形图和专题地图等;

d)统计调查数据:各种类型的统计报表、社会调查数据等;

e)遥感数据:由地面、航空或航天遥感获得的数据。

3.8

结构化数据structureddata

可以组织成行列结构,可识别的数据。这类数据通常是一条记录,或者一个文件,或者是被正

确标记过的数据中的某一个字段,并且可以被精确地定位。

3.9

半结构化数据semi-structureddata

半结构化数据不具有结构化数据严格的存储结构,但它可以使用标签或其他形式的标记方式以

保证数据的层次结构。

3.10

非结构化数据un-structureddata

非结构化数据一般被认为是大量纯文本数据,其中还可能包含日期,数字和实例。

3.11

复杂结构的数据complexstructureddata

由两个或多个相互关联部分组成的数据,这类数据不能简单地由结构化查询语言(SQL)或工具解

析。

3

DB15/T2021.1—2020

3.12

云计算cloudcomputing

构建在网络上的分布式计算系统,数据是存储于机房外的(即云端)。

3.13

聚类分析clusteringanalysis

将相似的对象聚合在一起,每类相似的对象组合成一个聚类(或簇)的过程。这种分析方法的目

的在于分析数据间的差异和相似性。

3.14

数据聚合工具dataaggregationtools

将分散于众多数据源的数据转化成一个全新数据源的过程。

3.15

数据虚拟化datavirtualization

数据整合的过程,以此获得更多的数据信息,这个过程通常会引入其他技术,例如数据库、应

用程序、文件系统、网页技术、大数据技术等等。

3.16

去身份识别de-identification

也称为匿名化(anonymization),确保个人信息不会通过数据被识别。

3.17

文件存贮数据库documentstoredatabases

也称为文档数据库(document-orienteddatabase),为存储、管理、恢复文档数据而专门设计

的数据库,这类文档数据也称为半结构化数据。

3.18

数据抽取、转换及装载Extract,TransformandLoad,ETL

是一种用于数据库或者数据仓库的处理过程。即从各种不同的数据源提取(E)数据,并转换(T)

成能满足业务需要的数据,最后将其加载(L)到数据库。

3.19

Hadoop数据库(HBase)

一个开源的、非关系型、分布式数据库,与Hadoop框架共同使用。

4

DB15/T2021.1—2020

3.20

Hadoop分布式文件系统Hadoopdistributedfilesystem

是一个被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统。

3.21

内存数据库in-memorydatabase

一种数据库管理系统,与普通数据库管理系统不同之处在于,它用主存来存储数据,而非硬盘。

其特点在于能高速地进行数据的处理和存取。

3.22

物联网InternetofThings

在普通的设备中装上传感器,使这些设备能够在任何时间任何地点与网络相连。

3.23

法律上的数据一致性juridicaldatacompliance

存储在云上的数据要符合当地的法律。例如,当用云存储数据涉及到的有关数据开放共享原则、

个人隐私信息等在不同国家有不同的法律定义,该数据应该符合当地数据存放的法律。

3.24

M2M数据machinetomachinedata

两台或多台机器间交流与传输的内容。

3.25

机器数据machinedata

由传感器或算法在机器上产生的数据。

3.26

机器学习machinelearning

机器学习是人工智能的一部分,指的是机器能够从它们所完成的任务中进行自我学习,通过长

期的累积实现自我改进。

3.27

多维数据库multi-dimensionaldatabase

用于优化数据联机分析处理(OLAP)程序,优化数据仓库的一种数据库。

3.28

多值数据库multiValuedatabase

一种特殊的多维数据库:能处理

定制服务

    推荐标准