DB33/T 2234-2019 人口综合库数据规范
DB33/T 2234-2019 Population integration data specification
基本信息
发布历史
-
2019年12月
研制信息
- 起草单位:
- 起草人:
- 出版信息:
- 页数:134页 | 字数:- | 开本: -
内容描述
ICS01.040.03
A12
DB33
浙江省地方标准
DB33/T2234-2019
人口综合库数据规范
Dataelementsspecificationforintegratedinformationdatabaseofpopulation
2019-12-30发布2020-01-30实施
浙江省市场监督管理局发布
DB33/T2234—2019
目次
前言................................................................................II
1范围...............................................................................1
2规范性引用文件.....................................................................1
3术语和定义.........................................................................2
4人口信息分类.......................................................................2
5人口综合库基础数据元...............................................................8
附录A(规范性附录)指标项描述方法及规则.....................................100
附录B(规范性附录)标准代码集...............................................102
I
DB33/T2234—2019
前言
本标准按照GB/T1.1—2009给出的规则起草。
本标准由浙江省大数据发展管理局提出并归口。
本标准起草单位:浙江省标准化研究院、杭州数梦工场科技有限公司、浙江至元数据科技有限公司、浙
江汇信科技有限公司。
本标准主要起草人:徐颖、赵程遥、施筱玲、徐峰、徐亦萍、周万、林锋、元庚、余斌、何转琴、滕志
明、王忠义、吕萌学、柴琳、胡涛。
II
DB33/T2234—2019
人口综合库数据规范
1范围
本标准规定了人口信息分类、人口综合库基础数据元、指标项描述方法规则以及标准代码集。
本标准适用于人口综合库的建设、管理和应用。
2规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T2260中华人民共和国行政区划代码
GB/T2261.1个人基本信息分类与代码第1部分:人的性别代码
GB/T2261.2个人基本信息分类与代码第2部分:婚姻状况代码
GB/T2261.3个人基本信息分类与代码第3部分:健康状况代码
GB/T2261.4个人基本信息分类与代码第4部分:从业状况(个人身份)代码
GB/T2659世界各国和地区名称代码
GB/T3304中国各民族名称的罗马字母拼写法和代码
GB/T4658学历代码
GB/T4754国民经济行业分类
GB/T4761家庭关系代码
GB/T4762政治面貌代码
GB/T6565职业分类与代码
GB/T6864中华人民共和国学位代码
GB/T8561专业技术职务代码
GB/T10114县级以下行政区划代码编制规则
GB11643公民身份号码
GB/T12407职务级别代码
GB/T14946.1全国干部、人事管理信息系统指标体系与数据结构第1部分:全国干部、人事管理信
息系统指标体系分类与代码
GB16735道路车辆车辆识别代号(VIN)
GB/T16835高等学校本科、专科专业名称代码
GB/T19488.2电子政务数据元第2部分:公共数据元目录
GB/T23705数字城市地理信息公共平台地名/地址编码规则
GA/T16.3道路交通管理信息代码第3部分:机动车使用性质代码
GA/T16.4道路交通管理信息代码第4部分:机动车车辆类型代码
GA/T16.7道路交通管理信息代码第7部分:机动车号牌种类代码
GA/T16.8道路交通管理信息代码第8部分:机动车车身颜色代码
GA/T16.9道路交通管理信息代码第9部分:机动车能源种类代码
GA/T16.17道路交通管理信息代码第17部分:机动车状态代码
1
DB33/T2234—2019
GA214.12常住人口管理信息规范第12部分:宗教信仰代码
GA/T2000.22公安信息代码第22部分:人口迁移(流动)原因代码
GA/T2000.27公安信息代码第27部分:户口性质分类与代码
GA/T2000.30公安信息代码第30部分:房屋用途代码
GA/T2000.36公安信息代码第36部分:兵役状况代码
GA/T2000.55公安信息代码第55部分:银行账户类型代码
LY/T2186森林资源数据编码类技术规范
NY/T1640农业机械分类
WS364.4卫生信息数据元值域代码第4部分:健康史
WS364.13卫生信息数据元值域代码第13部分:卫生费用
WS445.10电子病历基本数据集第10部分:住院病案首页
3术语和定义
下列术语和定义适用于本文件。
3.1
数据提供机构DataProviderinstitutions
承担向人口综合库提供人口数据工作的部门或单位(也称为数源机构)。人口综合库可由一个或多个
数据提供机构提供信息。
3.2
信息分类informationclassifying
把具有某种共同属性或特征的信息归并在一起,把具有不同属性或特征的信息区别开来的过程。
3.3
数据元dataelementoflegalentitiesandotherorganizations
用一组属性描述人口综合信息的名称、定义、数据格式、允许值和的数据单元。它是人口综合信息不
可再分的最小数据单元。
4人口信息分类
4.1分类原则
4.1.1简明性
为快速定位信息资源,框架的分类类目层级不宜超过两级,至多不超过三级,框架分类类目名称应具
有可辨识性,可以达到根据分类类目名称即可大致了解该分类下涵盖哪些类型数据。
4.1.2唯一性
2
DB33/T2234—2019
不同类目的设置不应重复,每一类人口综合信息编码仅对应一个代码,一个代码仅唯一标识一类人口
公共信息。
4.1.3实用性
按照应用需求为主导,保证人口数据框架分类实用、可操作,以实现人口综合信息采集、管理、服务、
共享为目标,实现人口综合信息的有序管理和开发利用。
4.1.4稳定性
应尽可能保持人口综合库系统以及纳入人口数据框架中的数据的相对稳定性,保证人口单位综合信息
分类能实现最大化采集,容纳现有能采集到的各类人口单位综合信息,同时人口综合库数据不会频繁的发
生分类的变化。
4.1.5扩展性
考虑到事物的发展,编码时应根据需要预留适当空位,有时还需设置一个收容项——其它,以便适应
不断扩充的需要。
4.1.6一致性
当前人口综合库规范跟已发布的法人库规范在分类原则、分类方法、编码序列等方面保持一致性,形
成系列规范。
4.2分类模式
数据分类需要满足各种业务需求对数据组织的要求,并独立于具体的数据模型和数据分布。人口数据
分类还要有利于数据的维护和扩充。
在形成属性的基本面的基础上,采用面分类法和线分类法相结合的混合分类法,共形成8个分面。
人口数据在不同分面下的分类类目见图1。
2
DB33/T2234—2019
图1人口数据分类模式
4.3分类编码规则
人口数据分类采用面分类法和线分类法结合的混合分类法进行分类编码,由三部分组成,从左往右排:
——第1位代码:1位大写罗马字符(A-Z)按顺序编码,表示分面。
——第2位代码:1位大写罗马字符(A-Z)按顺序编码,表示一级类目。
——第3、4位代码:2位阿拉伯数字(00-99),在一级类目下分别按顺序编码,表示二级类目,没
有二级类目的分面第3、4位赋码“00”。具体形式见图2。
二级分类,2位阿拉伯数字
一级分类,1位大写罗马字符
分面标识,1位大写罗马字符
图2人口数据分类编码规则
4.4分类与代码
4.4.1主体分类
3
DB33/T2234—2019
依据《中华人民共和国民法总则》中对人口和自然人的定义和分类方式对按照信息所描述的主体进行
分类。
见表1主体分类方式。
表1主体分类
分面一级分类二级分类说明
具有中国国籍,包括港澳台人士,并根据中国法律规定享有权利
1中国公民
和承担义务的人
AA自然人2外籍人士在中国境内非中国国籍的自然人
3无国籍人士在中国境内无国籍的自然人
4.4.2类型分类
类型分类指按信息所描述的内容属性类型进行分类。类型分类类目的设置尽可能覆盖现有已经归集的
数据,原则上一级分类维持不变,二级分类基本稳定,三级分类可扩充,后续如有新增的数据只需对三级
分类进行增加或调整。
类型分类方式见表2。
表2属性类型分类
分面一级分类二级分类三级分类说明
基本登记信息自然人在政府部门登记注册的信息
1登记信息
身份证件信息自然人证明身份的信息
出生信息自然人个体的出生信息
2生理状态生理体征自然人个体的生理体征信息
BA基本信息死亡信息自然人个体的死亡信息
户籍信息自然人户籍相关的信息
婚姻信息自然人的婚姻状况相关的信息
3家庭信息
户籍迁移信息自然人的户籍迁移相关的信息
亲缘关系信息自然人的血亲相关的信息
4
DB33/T2234—2019
表2(续)
分面一级分类二级分类三级分类说明
电子邮箱自然人的办事登记的电子邮箱信息
基本
4联系信息联系地址自然人联系地址信息
信息
联系电话自然人的电话信息
土地建筑及附着物自然人拥有的具有实物形态的资产
装备及设备自然人拥有的车辆、设备等资产
1实物资产
家具/用具及动植自然人拥有的家具、工具,生活生产资
物料等形式的资产
资产处置自然人资产处置过程的信息
自然人拥有的具备价值的知识产权信
知识产权
资产息
B
信息2无形资产自然人拥有或者控制的,不具有特定实
信息数据物形态,能持续发挥作用且能带来经济
利益的非货币性资源
B保险资产自然人拥有的保险类资产的总称
货币资产自然人拥有的货币化资产的总称
3金融资产
自然人可以在有组织的金融市场上进
有价证券行交易、具有现实价格和未来估价的金
融工具的总称
自然人在日常生活中的金融支付相关
公共支付
信息
自然人在日常生活中的交通出行相关
交通出行
1基本生活信息
旅馆住宿自然人在日常生活中的住宿相关信息
社会
C邮政物流自然人在日常生活中的邮寄相关信息
活动
医疗、卫生计生信息自然人在生理健康方面相关的活动
自然人在卫生医疗机进行构检查与检
2检查与检验信息
验的信息
自然人在卫生医疗机构进行门诊与住
门诊与住院信息
院的相关活动
5
DB33/T2234—2019
表2(续)
分面一级分类二级分类三级分类说明
学生信息自然人在教育方面的活动
3科技、教育考试信息自然人在教育考试方面从事的活动
科研信息自然人在科研领取从事的活动
就业信息自然人在就业方面的活动
失业信息自然人在失业方面的活动
社
纳税信息自然人在纳税方面的活动
会
C退休信息自然人在退休方面的相关信息
活4就业、社保
社保信息自然人在社保方面的活动
动
社保缴纳记录自然人社保缴纳相关信息
住房公积金自然人在公积金缴纳、领取等相关活动
救助信息自然人在救助方面的信息
文体活动自然人在文体、娱乐休闲方面的活动
5文化、体育
网吧上网自然人在网吧上网的活动
自然人拥有的从事某些责任较大、社会通用性
执业资格基本
强、关系公共利益的专业技术工作必须的准入
信息
资格
1执业资格
自然人拥有的从事某些责任较大、社会通用性
执业资格内容
强、关系公共利益的专业技术工作必须的准入
信息
B资资格详情
质能力资质基本自然人拥有的依法独立开业或独立从事某种工
D
荣信息作必备的资质或能力
2能力资质
誉能力资质内容自然人拥有的依法独立开业或独立从事某种工
信息作必备的资质或能力详情
荣誉基本信息自然人从事的可以产生正面评价的活动
荣誉内容信息自然人从事的可以产生正面评价的活动详情
3荣誉表彰
行政奖励自然人被授予行政奖励的事迹信息
捐赠信息自然人在捐赠方面的活动信息
行政处罚自然人受到行政处罚等相关信息
行政裁决自然人受到行政裁决等相关信息
行政给付自然人受到行政给付等相关信息
1行政监管
涉行政强制自然人受到行政强制等相关信息
事行政确认自然人受到行政确认等相关信息
E
涉行政征收自然人受到行政征收等相关信息
法司法案件信息自然人相牵涉司法案件相关信息
未履行生效裁
2司法信息自然人作为失信人的相关信息
判情况
强制执行信息自然人作为被强制执行对象的相关信息
6
DB33/T2234—2019
表2(续)
分面一级分类二级分类三级分类说明
司法信息法律援助自然人申请法律援助的相关信息
2
司法信息其他司法信息自然人的其他司法相关信息
违纪信息自然人涉及的违纪等相关信息
违纪、违规和违
3违规信息自然人涉及的违规等相关信息
涉约
事
BE违约信息自然人涉及的违约等相关信息
涉
法信访信息自然人相关联的信访相关信息
信访、举报和投
4举报信息自然人相关联的举报相关信息
诉
投诉信息自然人相关联的投诉相关信息
其他涉事涉法
5重点管控信息自然人其他涉及到法律法规相关信息
信息
4.4.3地域分类
按照信息主体所归属的地域进行分类,见GB/T2260。
4.4.4行业分类
按照信息主体所归属的行业进行分类,见GB/T4754。
4.4.5开放属性分类
按照信息面向公众开放的属性进行分类,见表3信息开放属性分类。
表3信息开放属性分类
分面一级分类二级分类说明
A非涉密00—可以对公众开放的信息
E
B涉密00—不可以对公众开放的信息
4.4.6共享程度分类
按照信息在部门间共享的程度进行分类,见表4信息共享程度分类。
7
DB33/T2234—2019
表4信息共享程度分类
分面一级分类二级分类说明
A无条件共享00—可提供给所有政务部门共享使用的信息
可提供给相关政务部门共享使用或仅能够部分提供给所有政务
FB有条件共享00—
部门共享使用的信息
C不予共享00—不宜提供给其他政务部门共享使用的信息
4.4.7时效分类
按照信息的有效性进行分类,见表5信息时效分类。
表5信息时效分类
分面一级分类二级分类说明
A有固定期限00—依据相关法律、法规,有固定有效期限的信息
GB无固定期限00—没有确定有效期限的信息
C无时效性00—不具备时效属性的信息
4.4.8归档情况分类
按照信息是否已归档进行分类,见表6归档情况分类。
表6归档情况分类
分面一级分类二级分类说明
A已归档00—已归档的信息
H
B未归档00—未归档的信息
5人口综合库基础数据元
5.1数据元编制原则
数据元编制过程遵从如下原则:
a)最大化采集原则:本规范所定义数据元大部分是从归集的原始数据中归纳总结选取,因此
为了保证覆盖范围的全面性,应尽可能多采集归集库中与人口相关的原始数据表的信息。
8
DB33/T2234—2019
b)一数一源原则:本规范定义了部分基础信息的提供部门,提供部门应当依职能提供数据,
保障数据来源唯一性。多源同名数据则以原始产生部门或者其注册登记机关提供的数据为
基准。
c)明确边界原则:对非人口综合库范围的数据进行弃用。
d)同义词项归并原则:在数据归集过程中,可以将分散在各个不同业务部门业务中同类数据集
进行同义合并,以及对同一数据的不同表示方式进行同义合并。如:“学历代码”和“文
化程度代码”在不同业务之中进行数据登记,在采集过程中可以进行数据集归类。又如“博
士”和“博士研究生”表示相同含义,采集过程中可以进行数据值标准化归类。
e)唯一辨识原则:数源机构提供的人口相关信息应包含人口的唯一辨识信息,本规范以人员
身份号码为单个自然人的唯一标识,包括公民身份证号码、护照号码、港澳通行证号码等。
对于公民身份证号码的15位和18位,对源头数据不做规范,人口综合库会根据对应原则
在内部进行身份证号统一转换。
f)代码标准归集:数源机构提供的人口相关数据的值域中如包含代码信息,应提供对应的代
码表以供人口综合库进行数据整合,提供的代码表定义的值域范围要能够与实际数据的取
值情况保持一致。
5.2数据元描述
5.2.1数据元属性集
本标准通过下列属性来描述每一个数据元:
a)类目:类型分类模式描述的三级类目;
b)标识符:数据元的唯一标识;
c)数据元名称:简短且含义确切的数据元的中文名称;
d)说明:数据元的具体含义;
e)数据格式:数据元允许值的类型及长度的表示格式;
f)值域:数据元的取值范围;
g)提交机构:数据来源部门。
指标项描述方法及规则的详细内容见附录A。
5.2.2数据元标识符
数据元标识符由字母数字型代码标识组成,采用两段式的编码规则,第一段为分类序号,占4位;第
二段为顺序号,占4位:
——第1位代码:1位大写罗马字符,表示数据库通用标识,区分人口综合库、法人库、地理信
息与自然资源等其他基础数据库,固定为D,代表人口综合库;
——第2位代码:1位大写罗马字符(A-Z)按顺序编码,表示一级类目,见表2属性类型分类;
——第3,4位代码:2位阿拉伯数字(00-99),表示二级类目,见表2属性类型分类;
——第5、6、7、8位代码:4位阿拉伯数字(0001-9999),代表每一类目下数据元的序号,数
字大小无含义;
——按分类代码、顺序号从左向右顺序排列。结构如图3数据元标识符结构所示。
9
DB33/T2234—2019
顺序码
二级分类,2位阿拉伯数字
一级分类,1位大写罗马字符
数据库通用标识,1位大写罗马字符
图3数据元标识符结构
5.3数据元目录
5.3.1基本信息
5.3.1.1登记信息
登记信息见表7。
表7登记信息
类
定制服务
推荐标准
- SY/T 7486-2020 地下水封洞库工程物探规程 2020-10-23
- SY/T 5171-2020 陆上石油物探测量规范 2020-10-23
- SY/T 6732-2020 陆上多波多分量地震资料处理技术规程 2020-10-23
- SY/T 6489-2020 水平井测井资料处理与解释规范 2020-10-23
- SY/T 7485-2020 岩石物理频谱激电测试技术规程 2020-10-23
- SY/T 6492-2020 声速测井仪核实技术规范 2020-10-23
- SY/T 5820-2020 天然源电磁法采集技术规程 2020-10-23
- SY/T 7610-2020 石油天然气钻采设备 高压管汇的在线检测与监测技术规范 2020-10-23
- SY/T 6915.4-2020 石油天然气钻采设备 偏心工作筒流量控制系统 第4部分:偏心工作筒及相关设备操作规程 2020-10-23
- SY/T 7002-2020 储层地球物理预测技术规范 2020-10-23