DB3212/T 1119-2022 综合人口库数据元规范

DB3212/T 1119-2022 Comprehensive Population Data Warehouse Metadata Specification

江苏省地方标准 简体中文 现行 页数:226页 | 格式:PDF

基本信息

标准号
DB3212/T 1119-2022
标准类型
江苏省地方标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2022-12-28
实施日期
2022-12-28
发布单位/组织
泰州市市场监督管理局
归口单位
-
适用范围
-

发布历史

研制信息

起草单位:
起草人:
出版信息:
页数:226页 | 字数:- | 开本: -

内容描述

ICS35.020

72

CCSLDB3212

泰州市地方标准

DB3212/T1119—2022

综合人口库数据元规范

Dataelementspecificationofvomprehensivepopulationdatabase

2022-12-28发布2022-12-28实施

泰州市市场监督管理局发布

DB3212/T1119—2022

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规

定起草。

本文件由泰州市大数据管理局提出。

本文件由泰州市大数据管理局归口。

本文件起草单位:泰州市大数据管理局、泰州市标准化院。

本文件主要起草人:梁鑫晨、孙慧、王小冬、赵文涛、刘小芳、陈书剑、许鑫、施驰乐、吴薇、陈

蓝生、王友成、李海鹏、张婧娴、郭健。

I

DB3212/T1119—2022

综合人口库数据元规范

1范围

本文件规定了综合人口数据元的分类、内部标识符组成和数据元目录。

本文件适用于政务部门之间的数据交换与共享。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T18391.1—2009信息技术.元数据注册系统(MDR).第1部分:框架

GB/T19488.1电子政务数据元第1部分:设计和管理规范

3术语和定义

下列术语和定义适用于本文件。

3.1

数据data

信息的可再解释的形式化表示,以适应于通信、解释或处理。

注:数据可以由人工或自动的方式加工、处理。

[GB/T18391.1—2009,定义3.2.6]

3.2

数据元dataelement

由一组属性规定其定义、标识、表示和允许值的数据单元。

[GB/T18391.1—2009,定义3.3.8]

3.3

元数据metadata

定义和描述其他数据的数据。

[GB/T18391.1—2002,定义3.41]

3.4

电子政务数据元electronicgovernmentdataelement

电子政务数据元是指政务活动过程中涉及的所有数据元。

[GB/T19488.1—2004,定义3.3]

3.5

属性attribute

某个对象或实体的一种特性。

[GB/T18391.1-2002,定义3.3]

3.6

值域valuedomain

允许值的集合。

[GB/T18391.1-2009,定义3.3.38]

4综合人口库数据元分类

4.1一级分类

1

DB3212/T1119—2022

综合人口库数据元一级分类为11类,按照自然人的生命历程进行划分。分类码由2位阿拉伯数字

组成,分类代码如表1所示。

表1一级分类代码

序号一级分类一级分类代码

1基本信息01

2身份识别信息02

3教育信息03

4资质荣誉04

5就业社保05

6社会救助06

7健康医疗07

8资产信息08

9社会关系09

10生活信息10

11其他信息11

4.2二级分类

综合人口库二级分类码由5位阿拉伯数字组成,表示专题数据,从00001开始顺序递增。其它类信

息默认为“00000”。二级分类代码如表2所示。

表2二级分类代码

一级一级二级分

序号二级分类说明

分类代码类码

基本登记信

100001包括自然人的姓名、公民身份号码等基础信息项

基本

201通讯信息00002包括自然人的地址、电话等相关信息项

信息

3出生信息00003包括自然人的出生证明、出生登记等相关信息项

4死亡信息00004包括自然人的火化、死亡证明等相关信息项

涵盖自然人的身份证、居住证、护照、工作证、残疾人证等各类

5身份证件信息00001

识别02证件相关信息项

6信息生物特征00002包括自然人的照片、指纹、血型、声纹等生物特征信息项

7学前教育00001包括自然人学前教育相关信息项

8义务教育00002包括自然人中小学教育等相关信息项

9高中教育00003包括自然人高中教育、中专教育等相关信息项

教育

03包括自然人大学生学籍学历、研究生教育、函授教育等相关信息

10信息高等教育00004

11职业教育00005包括自然人职业教育经历及职业培训等相关信息项

12继续教育00006包括自然人的成人学历教育等相关信息项

包括自然人拥有的从事某些责任较大、社会通用性强、关系公共

13能力资质00001利益的专业技术工作必须的准入资格,以及自然人拥有的依法独

资质

04立从事某种工作的必备的资质信息或证明信息相关项

荣誉

包括自然人从事的可以产生证明正面评价的活动信息及详情信

14荣誉表彰00002

息、行政奖励、捐赠等相关信息项

15就业情况00001包括自然人的就业或失业方面的活动信息项

16公积金信息00002包括自然人的公积金相关信息项

就业

1705纳税信息00003包括自然人的个人所得税相关信息项

社保

18社保信息00004包括自然人的社保相关信息项

19退休信息00005包括自然人的退休情况的相关信息项

20助学贷款00001包括助学贷款相关信息项

21社会低保救助00002包括低保救助等相关信息项

06

22救助扶贫救助00003包括扶贫救助、五保户救助等相关信息项

23其他社会救00004包括医疗救助、高龄津贴等相关信息项

2

DB3212/T1119—2022

一级一级二级分

序号二级分类说明

分类代码类码

24健康健康信息00001包括自然人体检、职业病、苏康码等健康方面的相关信息项

07

25医疗医疗信息00002包括自然人在卫生医疗机构进行的门诊与住院的相关信息项

26资产固定资产00001包括自然人的车辆、船舶、不动产等实物资产相关信息项

08

27信息无形资产00002包括自然人的知识产权、金融资产等无形资产项信息项

28亲属关系00001包括自然人的家庭成员关系相关信息项

社会

2909婚姻关系00002包括自然人婚姻登记等相关信息项

关系

30人际关系00003包括自然人的同事、同学关系相关信息项

31生活生活缴费00001包括自然人的生活缴费信息项

10

32信息交通出行00002包括自然人的交通出行信息项

其他

3311——00000包括各业务部门直接提供的统计数据信息等其他类信息

信息

4.3数据元内部标识符

数据元的内部标识码由14位阿拉伯数字组成,由信息资源分类码、一级分类码、二级分类码、顺

序码四部分组成,内部标识符结构的表示方式如图1所示。

图1内部标识符结构表示方式

5综合人口信息资源库数据元目录

综合人口信息资源库数据元目录见附录A。

6标准代码集

标识代码集见附录B。

7数据元描述方法及规则

7.1数据元命名规则

7.1.1基本原则

数据元名称的命名规则具体内容参见GB/T19488.1。

7.1.2唯一性规则

在一定语境下数据元名称应该唯一,名称中一般包括对象类词、特性词、表示词和限定词。

示例:在数据元“公民出生地省市县代码”中,“公民”为对象词,“出生地省市县”是该数据元的特性词,“代码”是该

3

DB3212/T1119—2022

数据元的表示词。

7.1.3语义规则

对象词表示数据元所属的事物或概念,它表示某一语境下一个活动或对象,它是数据元中占

支配地位的部分。数据元名称中应有一个且仅有一个对象词。

特性词是表示数据元的对象类的显著的、有区别的特征。数据元名称中应有一个且仅有一个

特性词。

表示词是数据元名称中描述数据元表示形成的一个成分。它描述了数据元有效值集合的格式。

数据元名称中应有一个且仅有一个表示词。

示例:在下面的数据元中

——户籍地省市县代码

——新生儿姓名

成分“户籍地”、“新生儿”是对象词。成分“省市县”、“姓名”是特性词。以上两个数据元的表示词分别为“代码”和“名

称”。

当需要描述一个数据元并使其在特定的语境中唯一时,可以使用限定词对对象类词、特性词

或表示词进行限定。限定词是可选的。

7.1.4语法规则

对象词应处于名称的第一(最左)位置。特性词应处于第二位置。表示词应处于最后位置。

限定词可以附加到对象类词、特性词和表示词上。限定词应位于被限定成分的前面。

当表示词与特性词有重复或部分重复时,可以将冗余词删掉。

示例:在上面数据元“新生儿姓名”中,“名称”是“新生儿姓名”的表示词,由于表示词“名称”与特性词“姓名”语义重复,

因此删去一个冗余词“名称”。

7.2数据类型及格式的表示方法

7.2.1数据类型及格式是指标的所有允许取值的数据类型以及格式的表达。在本标准中采用以下方法

来表示。本标准规定以下几种数据类型,见表3。

表3数据类型表

数据类型数据类型的表示方法备注

字符型C可以包括字母字符、数字字符或汉字等在内的任意字符

数值型N数值

日期型YYYYMMDD视具体情况选择使用

日期时间型YYYYMMDDhhmmss视具体情况选择使用

布尔型B是/否,on/off,true/false,T/F

二进制流BY图像、音频、WAN、RM、AVI、MPEG等二进制流文件格式

7.2.2数据格式使用以下几种形式来表达:

——数据类型后加一位数字表示定长格式。

示例:C6表示该指标是一个6位定长的字符,N6表示6位定长的数字型字符。

——数据类型后加“x..y”表示从最小到最大长度的格式。

示例:C1..10表示该指标是一个最短1位、最长10位的字符型格式;N..6表示该指标是一个最长6位的数字型字

符。

——数据类型后加“..ul”表示长度不确定的。

示例:C..ul表示该指标是一个长度不确定的字符,一般多为大量的文本内容。

——数值型(N)后加“x,y”表示小数位。

示例:N..17,2是一个最长17位、小数点后两位的一个数值。

——二进制流(BY)后加具体的媒体格式。

4

DB3212/T1119—2022

示例:BY-JPEG表示该指标是一个“JPEG”格式的文件。

5

DB3212/T1119—2022

A

附录A

(规范性)

综合人口信息资源库数据元目录

A.1基本信息

A.1.1基本登记信息

内部标识符:02010000100001

中文名称:证件号码

中文全拼:zheng-jian-hao-ma

中文首拼:ZJHM

定义:由特定机构颁发的可以证明个人身份的证件号码

关系:

数据类型:字符型

数据格式:c..30

值域:

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000100002

中文名称:证件类型

中文全拼:zheng-jian-lei-xing

中文首拼:ZJLX

定义:由特定机构颁发的可以证明个人身份的证件的名称

关系:无由公共数据元“身份证件类型”派生

数据类型:数值型

数据格式:n10

值域:《2.1DB32T4040.2-2021政务大数据数据元规范第2部分:公共数据元》

同义名称:

计量单位:

来源部门:公安部门

备注:

--------------------------------------------------------------------------

内部标识符:02010000100003

中文名称:姓名

中文全拼:xing-ming

中文首拼:XM

定义:在户籍管理部门正式登记注册、人事档案中正式记载的姓氏名称

关系:

数据类型:字符型

数据格式:C..100

值域:

同义名称:

计量单位:

来源部门:公安部门

6

DB3212/T1119—2022

备注:

-------------------------------------------------------------------------

内部标识符:02010000100004

中文名称:性别

中文全拼:xing-bie

中文首拼:XB

定义:人的基本生理特征

关系:

数据类型:字符型

数据格式:C..12

值域:GB/T2261.1—2003个人基本信息分类与代码第1部分:人的性别代码

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000100005

中文名称:民族

中文全拼:min-zu

中文首拼:MZ

定义:个人所属的、经国家认可在户籍管理部门登记注册的民族名称

关系:

数据类型:字符型

数据格式:C..10

值域:GB/T3304—1991中国各民族名称的罗马字母拼写法和代码

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000100006

中文名称:出生日期

中文全拼:chu-sheng-ri-qi

中文首拼:CSRQ

定义:出生证签署的,并在户籍部门正式登记注册、人事档案中记载的日期

关系:

数据类型:日期型

数据格式:YYYY-MM-DD

值域:

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000100007

中文名称:出生地-国家(地区)

中文全拼:chu-sheng-di--guo-jia(di-qu)

中文首拼:CSD-GJ(DQ)

定义:世界各国和地区名称的数字代码

关系:

7

DB3212/T1119—2022

数据类型:字符型

数据格式:N3

值域:GB/T2659—2000世界各国和地区名称代码

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000100008

中文名称:出生地-省市县(区)

中文全拼:chu-sheng-di--sheng-shi-xian(qu)

中文首拼:CSD-SSX(Q)

定义:设有国家政权机关的各级地区的数字代码

关系:

数据类型:字符型

数据格式:N6

值域:GB/T2260中华人民共和国行政区划代码

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000100009

中文名称:死亡标识

中文全拼:si-wang-biao-shi

中文首拼:SWBS

定义:人员的死亡标识

关系:

数据类型:字符型

数据格式:N1

值域:附录B.1

同义名称:

计量单位:

来源部门:卫生健康部门、公安部门、民政部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000100010

中文名称:死亡日期

中文全拼:si-wang-ri-qi

中文首拼:SWRQ

定义:特定日历日的标识由日历年、日历月、日历日等组合表示

关系:

数据类型:日期型

数据格式:YYYY-MM-DD

值域:

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

8

DB3212/T1119—2022

内部标识符:02010000100011

中文名称:人像ID

中文全拼:ren-xiang-id

中文首拼:RXID

定义:与照片图像的关联所使用的字段

关系:

数据类型:二进制

数据格式:BY

值域:

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000100012

中文名称:人员类别代码

中文全拼:ren-yuan-lei-bie-dai-ma

中文首拼:RYLBDM

定义:人员属性分类情况

关系:

数据类型:字符型

数据格式:N1

值域:附录B.2

同义名称:

计量单位:

来源部门:公安部门

备注:

A.1.2通讯信息

内部标识符:02010000200001

中文名称:出生地-区划内详细地址

中文全拼:chu-sheng-di--qu-hua-nei-xiang-xi-di-zhi

中文首拼:CSD-QHNXXDZ

定义:人员出生所在区划内详细地址

关系:

数据类型:字符型

数据格式:C..100

值域:地址应包含XX(省/自治区/直辖市)+XX(自治州/区/县/自治县/自治市)+XX(乡镇/街道

名称)+XX(街/路/巷名称)+XX(门/楼牌号/标志物)+XX居室号码

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000200002

中文名称:户籍地址-省市县(区)

中文全拼:hu-ji-di-zhi--sheng-shi-xian(qu)

中文首拼:HJDZ-SSX(Q)

定义:设有国家政权机关的各级地区的数字代码

关系:

9

DB3212/T1119—2022

数据类型:字符型

数据格式:N6

值域:GB/T2260中华人民共和国行政区划代码

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000200003

中文名称:户籍地址-区划内详细地址

中文全拼:hu-ji-di-zhi--qu-hua-nei-xiang-xi-di-zhi

中文首拼:HJDZ-QHNXXDZ

定义:人员户籍所在区划内详细地址

关系:

数据类型:字符型

数据格式:C..100

值域:地址应包含XX(省/自治区/直辖市)+XX(自治州/区/县/自治县/自治市)+XX(乡镇/街道

名称)+XX(街/路/巷名称)+XX(门/楼牌号/标志物)+XX居室号码

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000200004

中文名称:实际居住地址-省市县(区)

中文全拼:shi-ji-ju-zhu-di-zhi--sheng-shi-xian(qu)

中文首拼:SJJZDZ-SSX(Q)

定义:设有国家政权机关的各级地区的数字代码

关系:

数据类型:字符型

数据格式:N6

值域:GB/T2260中华人民共和国行政区划代码

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000200005

中文名称:实际居住地址-区划内详细地址

中文全拼:shi-ji-ju-zhu-di-zhi--qu-hua-nei-xiang-xi-di-zhi

中文首拼:SJJZDZ-QHNXXDZ

定义:人员实际居住所在区划内详细地址

关系:

数据类型:字符型

数据格式:C..100

值域:地址应包含XX(省/自治区/直辖市)+XX(自治州/区/县/自治县/自治市)+XX(乡镇/街道

名称)+XX(街/路/巷名称)+XX(门/楼牌号/标志物)+XX居室号码

同义名称:

计量单位:

来源部门:公安部门

10

DB3212/T1119—2022

备注:

---------------------------------------------------------------------------

内部标识符:02010000200006

中文名称:联系电话

中文全拼:lian-xi-dian-hua

中文首拼:LXDH

定义:机构或人员的移动电话号码

关系:

数据类型:字符型

数据格式:C..30

值域:

同义名称:

计量单位:

来源部门:公安部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000200007

中文名称:核酸检测结果

中文全拼:he-suan-jian-ce-jie-guo

中文首拼:HSJCJG

定义:检测结果

关系:

数据类型:字符型

数据格式:C..10

值域:

同义名称:

计量单位:

来源部门:卫健委

备注:

---------------------------------------------------------------------------

内部标识符:02010000200008

中文名称:核酸检测时间

中文全拼:he-suan-jian-ce-shi-jian

中文首拼:HSJCSJ

定义:检测结果

关系:

数据类型:日期型

数据格式:YYYY-MM-DDhh:mm:ss

值域:

同义名称:

计量单位:

来源部门:卫健委

备注:

---------------------------------------------------------------------------

内部标识符:02010000200009

中文名称:核酸检测机构

中文全拼:he-suan-jian-ce-ji-gou

中文首拼:HSJCJG

定义:检测结果

关系:

11

DB3212/T1119—2022

数据类型:字符型

数据格式:C50

值域:

同义名称:

计量单位:

来源部门:卫健委

备注:

---------------------------------------------------------------------------

内部标识符:02010000200010

中文名称:接种剂次

中文全拼:jie-zhong-ji-ci

中文首拼:JZJC

定义:检测结果

关系:

数据类型:字符型

数据格式:C50

值域:

同义名称:

计量单位:

来源部门:卫健委

备注:

---------------------------------------------------------------------------

内部标识符:02010000200011

中文名称:接种剂次

中文全拼:jie-zhong-ji-ci

中文首拼:JZJC

定义:新冠疫苗接种剂次

关系:

数据类型:字符型

数据格式:C50

值域:

同义名称:

计量单位:

来源部门:卫健委

备注:

---------------------------------------------------------------------------

内部标识符:02010000200012

中文名称:接种厂商

中文全拼:jie-zhong-chang-shang

中文首拼:JZCS

定义:新冠疫苗生产厂商

关系:

数据类型:字符型

数据格式:C50

值域:

同义名称:

计量单位:

来源部门:卫健委

备注:

---------------------------------------------------------------------------

12

DB3212/T1119—2022

内部标识符:02010000200013

中文名称:接种时间

中文全拼:jie-zhong-shi-jian

中文首拼:jzsj

定义:新冠疫苗接种时间

关系:

数据类型:日期型

数据格式:YYYY-MM-DD

值域:

同义名称:

计量单位:

来源部门:卫健委

备注:

A.1.3出生信息

内部标识符:02010000300001

中文名称:出生医学证明编号

中文全拼:chu-sheng-yi-xue-zheng-ming-bian-hao

中文首拼:CSYXZMBH

定义:出生医学证明编号信息

关系:

数据类型:字符型

数据格式:C20

值域:

同义名称:

计量单位:

来源部门:卫生健康部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000300002

中文名称:新生儿姓名

中文全拼:xin-sheng-dong-xing-ming

中文首拼:XSEXM

定义:在户籍管理部门正式登记注册、人事档案中正式记载的姓氏名称。

关系:

数据类型:字符型

数据格式:C..100

值域:

同义名称:

计量单位:

来源部门:卫生健康部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000300003

中文名称:出生时间

中文全拼:chu-sheng-shi-jian

中文首拼:CSSJ

定义:特定日历日的某个具体时间。

关系:

数据类型:日期时间

13

DB3212/T1119—2022

数据格式:YYYY-MM-DDhh:mm:ss

值域:

同义名称:

计量单位:

来源部门:卫生健康部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000300004

中文名称:孕周

中文全拼:yun-zhou

中文首拼:YZ

定义:孕周信息

关系:

数据类型:数值型

数据格式:N2

值域:

同义名称:

计量单位:

来源部门:卫生健康部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000300005

中文名称:体重

中文全拼:ti-zhong

中文首拼:TZ

定义:人身体的重量。

关系:

数据类型:数值型

数据格式:N..3

值域:范围为1-560

同义名称:

计量单位:公斤

来源部门:卫生健康部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000300006

中文名称:身长

中文全拼:shen-chang

中文首拼:SC

定义:身长信息

关系:

数据类型:数值型

数据格式:N3

值域:

同义名称:

计量单位:米

来源部门:卫生健康部门

备注:

---------------------------------------------------------------------------

内部标识符:02010000300007

14

DB3212/T1119—2022

中文名称:出生地省-市-县(区)

中文全拼:chu-sheng-di-sheng-shi-xian(qu)

中文首拼:CSDSSX

定义:行政区划单位。

关系:

数据类型:字符型

数据格式:C..80

值域:GB/T2260—2002中华人民共和国行政区划代码

同义名称:

计量单位:

来源部门:卫生健康部门

备注:

---------------------------------------------------------------------------

内部标识符:0201000030008

中文名称:医疗机构名称

中文全拼:yi-liao-ji-gou-ming-cheng

中文首拼:YLJGMC

定义:一个机构的中文名称,该名称须经登记机关或批准机关所核准一般使用机构的全称其中,机

构包括由企业登记机关、机构编制管理机关、社会团体登记机关及其他法律、法规规定的组织机构登记

机关或批准机关核准注册或登记的企业、行政机关、事业单位和社会团体等。

关系:

数据类型:字符型

数据格式:C..100

同义名称:

计量单位:

来源部门:卫生健康部门

备注:

---------------------------------------------------------------------------

内部标识符:0201000030009

中文名称:母亲姓名

定制服务

    推荐标准

    相似标准推荐

    更多>