T/GDPHA 002-2023 慢乙肝临床表型及生物组学数据的数据共享和数据质量控制规范

T/GDPHA 002-2023 Data sharing and data quality control specifications for clinical phenotype and bioinformatics data of chronic hepatitis B

团体标准 中文(简体) 现行 页数:26页 | 格式:PDF

基本信息

标准号
T/GDPHA 002-2023
标准类型
团体标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2023-12-13
实施日期
2023-12-13
发布单位/组织
-
归口单位
广东省医院协会
适用范围
范围:本文件是(精准医学大数据挖掘与整合分析平台)的附属规范文档,定义了慢乙肝临床表型的和生物组学数据的数据共享和质量控制规范,确定了数据采集、数据录入、数据质控、数据共享、数据储存、数据使用、数据安全管理等标准。 本文件旨在规范慢乙肝临床表型及生物组学数据的采集、处理、共享及管理等各个环节的标准,以确保数据的准确性、可重复性和可比性,为该领域的研究提供高质量的数据支撑,适用于慢乙肝临床表型及生物组学数据的采集、处理、共享及管理等环节,旨在规范数据采集、录入、管理和共享等方面的操作流程; 主要技术内容:本文件适用与参与精准医学大数据挖掘与整合分析平台项目建设单位和接入机构,适用于研究中心、医院的慢乙肝临床表型数据和生物组学数据互联互通的规划者、开发者、建设者和使用者。在向平台共享数据时必须遵循本文件。与普通的数据处理相比,慢乙肝临床表型及生物组学数据的数据共享和质量控制规范具有以下不同之处:a)数据需经过严格的质量控制和数据审查流程,确保数据的准确性和可重复性;b)要求使用标准化的数据格式、生物样本采集和处理方案,以确保数据的一致性和可比性;c)对未经授权的数据使用和非法传播进行严格管控,保障数据的安全性和合法性;d)需要建立健全的安全管理体系,采取物理、网络、访问控制等多重措施确保数据的安全

研制信息

起草单位:
中山大学附属第三医院、广东精点数据科技股份有限公司
起草人:
揭育胜、崇雨田、刘子锋、李新华、吴元凯、李向永、周晓梅、龚娇、李青海
出版信息:
页数:26页 | 字数:- | 开本: -

内容描述

ICS11.020

CCSC05

团体标准

T/GDPHA002—2023

慢乙肝临床表型及生物组学数据的数据共享和

数据质量控制规范

DataSharingandDataQualityControlStandardforTheClinicalManifestationsand

OmicsDataofChronicHepatitisBwithMildPhenotype

2023–12-13发布2023–12-13实施

广东省医院协会发布

T/GDPHA002—2023

目次

前言...........................................................................II

1背景................................................................................3

2范围................................................................................3

3规范性引用文件......................................................................4

4术语和定义..........................................................................4

5总体说明............................................................................6

6总体核心原则........................................................................7

7数据采集要求........................................................................8

8数据录入要求.......................................................................10

9数据质控要求.......................................................................11

10数据共享要求......................................................................15

11数据共享要求......................................................................18

12数据共享要求......................................................................21

13数据安全管理制度..................................................................22

参考文献.......................................................................25

I

T/GDPHA002—2023

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由中山大学附属第三医院提出。

本文件由广东省医院协会归口。

本文件起草单位:中山大学附属第三医院、广东精点数据科技股份有限公司

本文件主要起草人:揭育胜、崇雨田、刘子锋、李新华、吴元凯、李向永、周晓梅、龚娇、李青海

II

T/GDPHA002—2023

慢乙肝临床表型及生物组学数据的数据共享和数据质量控制规范

1背景

慢性乙型肝炎(CHB),简称慢乙肝,是由乙型肝炎病毒(HBV)引起的肝炎,长期潜伏、诊断、治

疗和观察过程中需要获取多种类型的临床数据和生物组学信息,以帮助诊断、治疗和预后评估。因此,

慢乙肝临床表型及生物组学数据标准的制定和实施对于推动慢乙肝研究和诊疗工作具有重要意义。

慢乙肝临床表型包括病毒学特征(如病毒载量、HBsAg水平、HBeAg/HBeAb状态等)、临床症状和体

征(如肝功能、肝脏纤维化程度、ALT水平、腹水、肝硬化等)、影像学特征(如肝脏B超、肝脏CT、MRI、

磁共振弹性成像等)、血液生化指标(如肝功能、免疫学参数、肿瘤标志物等)、药物治疗情况(如药

物名称、用药频率、用药时间等)等指标。

慢乙肝生物组学数据包括基因表达、蛋白质表达、代谢物谱分析等方面。基因表达包括基因表达水

平和基因外显子剪接等方面,蛋白质表达包括质量谱、蛋白质互作数据等方面,代谢物谱分析包括代谢

产物分析、物种组成分析等方面。

标准化的慢乙肝临床表型及生物组学数据有助于实现数据交换和集成,以便于不同实验室和机构

对慢乙肝数据进行比较和分析。该标准还促进了基因组学、蛋白质组学、代谢组学等方面的研究,为慢

乙肝疾病的精确医疗和个体化治疗提供了基础。

目前国际上许多医学组织同样对慢乙肝临床表型及生物组学数据标准进行研究和引用,如欧洲肝

脏病学会(EASL)和美国肝脏病学会(AASLD)等,这为推动慢乙肝诊疗和研究提供了强有力的支持。

2范围

本文件是(精准医学大数据挖掘与整合分析平台)的附属规范文档,定义了慢乙肝临床表型的和生

物组学数据的数据共享和质量控制规范,确定了数据采集、数据录入、数据质控、数据共享、数据储存、

数据使用、数据安全管理等标准。

本文件旨在规范慢乙肝临床表型及生物组学数据的采集、处理、共享及管理等各个环节的标准,以

确保数据的准确性、可重复性和可比性,为该领域的研究提供高质量的数据支撑,适用于慢乙肝临床表

型及生物组学数据的采集、处理、共享及管理等环节,旨在规范数据采集、录入、管理和共享等方面的

操作流程。

本文件适用于参与精准医学大数据挖掘与整合分析平台项目建设单位和接入机构,适用于研究中

心、医院的慢乙肝临床表型数据和生物组学数据互联互通的规划者、开发者、建设者和使用者。在向平

台共享数据时必须遵循本文件。

与普通的数据处理相比,慢乙肝临床表型及生物组学数据的数据共享和质量控制规范具有以下不

同之处:

a)数据需经过严格的质量控制和数据审查流程,确保数据的准确性和可重复性;

b)要求使用标准化的数据格式、生物样本采集和处理方案,以确保数据的一致性和可比性;

c)对未经授权的数据使用和非法传播进行严格管控,保障数据的安全性和合法性;

d)需要建立健全的安全管理体系,采取物理、网络、访问控制等多重措施确保数据的安全。

本标准的应用思路如下:

3

T/GDPHA002—2023

图1标准应用思路

3规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T38664.1-2020信息技术大数据政务数据开放共享第1部分:总则

GB/T39725-2020信息安全技术医学领域数据安全指南

GB/T14396-2016疾病分类与代码

GB/T39725-2020信息安全技术医学领域数据安全指南

GB/T18391.3-2001信息技术数据元的规范与标准化第3部分:数据元的基本属性

WS/T482-2016卫生信息共享文档编制规范

T/GZBC16.1-2020医疗数据中心建设规范第3部分科研数据中心

国家科技资源共享服务平台管理办法

国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见(国办发〔2016〕47号)

科学技术部令第21号人类遗传资源管理条例实施细则

T/CHIA20-2021人类基因测序原始数据汇交元数据标准

4术语和定义

下列术语和定义适用于本文件。

概念(Concept)

通过对特征的独特组合而形成的知识单元。

数据(Data)

事实、概念或指令的一种形式化的表示形式,以适合于人工或自动方式进行通信、解释或处理。

数据元(DataElement)

用一组属性描述定义、标识、表示和允许值的一个数据单元,在一定语境下,通常用于构建一个语

义正确,独立且无歧义的特定概念主义的信息单元。

元数据(Metadata)

关于数据或数据元素的数据(可能包含其他数据描述)以及关于数据拥有权、存取路径、访问权和

数据易变性的数据。

数据脱敏(Datadesensitization)

4

T/GDPHA002—2023

通过模糊化等方法处理原始数据,以实现屏蔽敏感数据且屏蔽后的数据不可恢复的数据保护方式。

数据质量(DataQuality)

在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。

数据标准(DataStandard)

数据的命名、定义、结构和取值规范方面的规则和基准。

临床表型数据(ClinicalPhenotypicData)

表型指生物体某一特定的物理外观或成分,临床表型数据包括生物体的形态、物理形式、物理结构、

发展过程、生物化学特性、生理特性、行为和行为结果等数据。

生物组学数据(Bio-OmicsData)

生物组学数据指从整体的角度出发去研究人类组织细胞结构、基因、蛋白及其分子间相互的作用,

通过整体分析反映人体组织器官功能和代谢状态的数据。

数据共享(DataSharing)

将临床表型数据和生物组学数据提供给其他研究人员的过程,这一过程涉及数据的采集、录入、共

享、存储和使用。

数据管理者(DataAdministrator)

决定临床研究数据和生物组学数据处理的目的和方式,实际控制临床研究数据进行处理的个人、组

织和机构。

数据处理者(DataProcessor)

对临床表型数据及生物组学数据进行集成、挖掘、分析与加工的个人、组织和机构。

数据提供者(DataProviders)

指生产或收集数据,并提供数据进行共享的个人、组织和机构。

数据使用者(DataUsers)

对临床表型数据和生物组学数据有使用需求的个人、组织和机构。

平台管理者(PlatformAdministrator)

负责建设、管理和运营临床表型数据和生物组学数据共享平台,在数据开放和数据交易中为数据提

供方和使用方提供平台服务的部门。

服务提供者(ServiceProviders)

指为数据提供者、使用者或平台管理者提供数据存储、数据分析处理、数据安全保障、数据保护能

力测评等技术和安全服务,对平台管理者的工作提供支撑的个人、组织和机构。

监督者(Supervisor)

5

T/GDPHA002—2023

指依照国家法律法规和政策文件的授权,对数据共享进行指导、监督管理的政府部门,包括网信、

公安、安全、保密等部门。

慢性乙型肝炎(ChronicHepatitisB)

慢性乙型肝炎(ChronicHepatitisB)简称慢乙肝,是由乙型肝炎病毒(HBV)感染引起的慢性肝

炎。慢乙肝是全球健康问题之一,估计有超过2亿人受到HBV感染,其中大部分感染者出现持续HBV感

染状态,长期存在肝炎病毒活跃性,可能导致肝硬化或肝癌等疾病。

慢乙肝患者早期可无特殊症状,但发病时间较长,可以逐渐引起疲劳、食欲不振、恶心、腹泻等症

状。随着病情的发展,患者容易出现黄疸、肝功能异常、腹水、肝硬化、肝癌等严重后果。因此,及早

筛查和干预慢乙肝,可以减少病情发展的可能性。

慢乙肝的预防和治疗需要积极推广疫苗接种、抗病毒治疗、肝炎患者个体化治疗等综合措施。同时

在临床中也需要对慢乙肝患者进行长期的减轻症状、控制病情、防止疾病恶化和缓解肝脏损伤的治疗。

这些治疗手段包括药物治疗、心理治疗、生活方式调整等多种手段。

5总体说明

本文件确定了慢乙肝临床医学表型数据共享和生物组学数据质量控制管理策略的通用要求,规定

了临床表型数据共享数据管理(数据采集、数据录入、数据共享、数据存储、数据使用)及数据共享方

式上的通用规范,样本数据和技术规范,以及生物组学数据质量控制管理策略,确定了数据收集、数据

清洗、数据标准化处理、多组学数据整合、数据校验、数据脱敏、数据深度挖掘和注释等数据规范过程

和数据质量控制评价指标。

本规范旨在规范慢乙肝临床表型及生物组学数据的采集、处理、共享及管理等各个环节的标准,以

确保数据的准确性、可重复性和可比性,为该领域的研究提供高质量的数据支撑,适用于慢乙肝临床表

型及生物组学数据的采集、处理、共享及管理等环节,旨在规范数据采集、录入、管理和共享等方面的

操作流程。

在综合调研基础上形成慢乙肝的多病种、多组学数据集,为数据库设计、数据互联互通打下基础,

并支撑数据共享平台的开发,也可为其他疾病临床表型数据交换共享建设提供借鉴。用于指导临床表型

数据和生物组学数据在我国多地区、多中心及不同层级医院汇集与管理,促进临床表型数据的互联互通、

共建共享,为我国医疗数据资源整合和利用提供参考工具;对提升临床研究水平,产生高质量的研究结

果指导临床诊疗,保障人民健康水平,具有重要社会价值。其他医院可结合自身实际,对本文件进行审

阅,本文件规定主要包括:

(1)语义一致性

结合慢乙肝临床表型数据和生物组学数据的元数据项含义,准确理解各元数据项的含义和用法,对

本草稿中语义不清晰、类型不明确的数据项进行检查并提出修改意见,形成一致性理解,确保各层级医

院间的数据可以准确、完整映射到本文件。

(2)数据兼容性

结合各医院病临床表型数据实际进行试填写以及慢乙肝生物组学数据录入、实际应用场景,对元数

据的适用性提出扩展、修改等建议,对元数据的完备性进行检查,提出必备字段、扩展字段、使用范围、

是否必填等,确保本文件能够具有较强通用性,形成最大公约数,同时能兼容其他医院系统的特定核心

需求,具有可扩展性。

(3)接口一致性

6

T/GDPHA002—2023

结合数据提供者以及数据使用者的业务需求和软件调用方式,确保数据接口和数据格式完整统一,

为数据收割、更新、验证和服务提供支持。

6总体核心原则

价值原则

医学领域数据共享活动应阐明其社会价值,尤其是慢乙肝临床数据及生物组学数据的管理和应用。

如为实现我国全民健康提供信息和改进,或服务于区域分级诊疗、医生能力加强、医疗卫生系统监管、

传染病风险及时管控等;明确目标价值,如支持完成某项科学研究或产品开发等。现阶段对于医学领域

数据共享价值原则,可更多强调的是能产生价值,包括但不限于实现数据的可共享可交换、保证共享数

据质量等。就医学领域数据共享参与者而言,共享行为的价值产生和价值回馈等措施有利于激励医学领

域数据共享的参与。因此,无论是公益性无偿共享还是有偿共享,都应考虑体现参与各方的需求和价值

期望。

尊重原则

在医学领域数据共享中,尊重原则必不可少。例如慢乙肝临床数据以及生物组学数据是个体患者信

息的集成,对于个体患者而言,个人健康信息属于敏感信息。隐私权是公民的基本人权,医学领域数据

共享和技术进步不应以牺牲个人隐私作为代价,因而在数据共享活动中必然要有严格的隐私安全保护

要求。此外,数据共享活动的开展依靠多方的共同参与,为保证医学领域数据主体参与共享的可持续性,

面向数据主体应保障其共享数据本身涵有的基本权益。尤其在推动健康医疗科学实验数据共享时,保护

个人知识产权是促进价值性数据共享的根本措施。

信任原则

信任关系的建立和维持是促进医学领域数据,尤其是慢乙肝临床数据及生物组学数据流通共享的

动力源泉。医学领域数据共享的开展通常建立在共享活动参与者之间互相了解、互为诚信的基础之上,

数据共享流程的标准化和透明性有利于合作者之间的信任增进,进而促进医学领域数据共享活动的密

切进行。因此,在个人或组织层面建立一些必要措施以增强信任,将有助于共享环境的健康发展。在跨

区域、跨领域开展医学领域数据共享时,遵循信任原则显得尤为必要。

公平与公证原则

对于慢乙肝临床表型数据及生物组学数据共享利益分配的公平与公正体现,是促进医学领域数据

共享长足发展的关键。医学领域数据共享面向所有参与者应做到公平与公正,这意味着:数据共享方的

权责配位和利益保障,即医学领域数据的共建共享和风险共担;数据受赠方的权责匹配和获取公平,即

医学领域数据的共享共担和有权获取。以此为基础,在公平与公正原则指导下制定数据交换共享规则和

利益分配的规则,使得数据共享和利用透明化,实现互惠互利以促成医学领域数据交换与共享,增强参

与方共享意愿。

安全原则

医学领域数据安全管理应该覆盖数据所有使用环节和应用场景安全,除了满足数据安全的基本需

求,还包括数据保护、数据合规、敏感数据管理等。重视医学领域数据分级分类、医学领域数据角色授

权、医学领域数据安全过程场景化管理。为了有效实践医学领域数据安全目标和理念,应当最大限度地

减少敏感或者保密数据的扩散,尤其是向非生产环境扩散。

7

T/GDPHA002—2023

规范性原则

规范性原则更多强调医学领域数据共享在执行层面应遵守的法律规范、行为和流程规范。合法是医

学领域数据共享活动的基本遵循,任何医学领域数据共享的实施皆应确认其法律背景。例如,在国内开

展医学领域数据共享应遵循《中国人民共和国网络安全法》《中华人民共和国民法典》等,跨境开展医

学领域数据共享应遵循欧盟《通用数据保护条例》(GDPR)、美国《健康保险携带和责任法案》(HIPAA)

等。此外,鉴于数据共享相关法律法规不甚完善,医学领域数据共享操作规范等的制定与遵循可成为医

学领域数据共享活动规范开展的有益补充。

可评估和评估原则

可评估和评估原则强调对数据共享的评估以及评估内容的落地性和可操作性。“可评估”体现在:

基于法律和道德标准建立并标准化的一般以及特殊情况下的医学领域数据共享流程参照,以及所有步

骤中配备的相应的专业人员的职责与权限,据此实现医学领域数据共享的可追溯、可评估。“评估”体

现在:针对医学领域数据共享活动开展在事前、事中、事后的行为步骤合理划分和指标性规范,以便共

享行为的及时追溯和数据共享计划的适时调整。

问责制原则

“问责制”的建立可有效促进数据共享活动中各个角色承担者对职责义务、法律遵循以及数据共享

活动订立规则的恪守。我国相关法律法规提供了对于数据共享活动中可能产生违法犯罪行为进行问责

的基本依据。对于在法律法规上不尽完善但又必要的地方,伦理委员会等机构在多方共识机制下形成

定制服务

    相似标准推荐

    更多>