基本信息
发布历史
-
2024年02月
-
2025年07月
研制信息
- 起草单位:
- 中山大学附属第三医院、广东精点数据科技股份有限公司、广州市疾病预防控制中心、中山大学、广州市城市规划勘测设计研究院、医渡云(北京)技术有限公司、联通(广东)产业互联网有限公司、广州市白云区疾病预防控制中心
- 起草人:
- 刘子锋、卢娅欣、揭育胜、崇雨田、李新华、李烁、周晓梅、吴元凯、李向永、龚娇、李青海、秦鹏哲、袁俊、杜志成、刘洋、朱博威、高伟、朱艳春、陆剑云
- 出版信息:
- 页数:26页 | 字数:- | 开本: -
内容描述
ICS11.020
CCSC05
团体标准
T/GDPHA003—2023
病毒性肝炎临床表型数据共享标准
StandardforSharingClinicalphenotypicdataonviralhepatitis
2024–02–05发布2024–02–05实施
广东省医院协会 发布
T/GDPHA003—2023
目次
前言............................................................................II
1背景.................................................................................3
2范围.................................................................................3
3规范性引用文件.......................................................................4
4术语和定义...........................................................................5
5病毒性肝炎临床表型数据采集规范.......................................................6
6病毒性肝炎临床表型数据存储规范.......................................................7
7病毒性肝炎临床表型数据治理规范.......................................................8
8病毒性肝炎临床表型数据共享使用规范..................................................10
9病毒性肝炎临床表型数据验证规范......................................................11
10病毒性肝炎临床表型数据安全及伦理规范...............................................12
11病毒性肝炎常用数据标准集示例.......................................................14
参考文献........................................................................25
I
T/GDPHA003—2023
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起
草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中山大学附属第三医院提出。
本文件由广东省医院协会归口。
本文件起草单位:中山大学附属第三医院、广东精点数据科技股份有限公司、广州市疾病预防控制
中心、中山大学、广州市城市规划勘测设计研究院、医渡云(北京)技术有限公司、联通(广东)产业
互联网有限公司、广州市白云区疾病预防控制中心
本文件主要起草人:刘子锋、卢娅欣、揭育胜、崇雨田、李新华、李烁、周晓梅、吴元凯、李向永、
龚娇、李青海、秦鹏哲、袁俊、杜志成、刘洋、朱博威、高伟、朱艳春、陆剑云
II
T/GDPHA003—2023
病毒性肝炎临床表型数据共享标准
1背景
目前对医院内临床表型数据的研究日益受到重视,许多国际权威期刊如《新英格兰医学杂志》和《美
国医学会杂志》等均利用医院临床表型数据发表了大量文章。然而目前相关建设厂商间采用的系统各异,
相关标准与规范不统一,在缺乏数据共享标准和质量控制标准的情况下,难以进行数据共享、挖掘等研
究,对数据共享和利用造成障碍。
病毒性肝炎是一种常见的传染病,对人民健康和社会发展造成了严重影响。目前对于病毒性肝炎的
相关研究还大多集中在基础研究领域,然而对临床表型数据的利用尚不充分,究其原因在于缺少临床数
据共享标准。病毒性肝炎临床表型数据共享标准是指在保障患者隐私和个人信息安全的前提下,促进病
毒性肝炎临床表型数据在各机构间的共享和交流,推动该病种的预防和治疗研究。该共享标准的制定,
可以规范其数据的采集和管理,提高数据的质量和可靠性,为科学研究提供更加丰富且准确的数据资源。
目前国际上已经初步建立了几个病毒性肝炎临床表型数据共享平台,如美国国立卫生研究院的全球
肝病数据库(GlobalHepatitisOutcomesLiKaInitiative,GHOLKI)、欧洲肝病研究会的肝病数据库(Liver
DiseaseDatabase,LDD)等。然而,目前国际常见的临床医学术语,包括医学系统命名法-临床术语
(SystematizedNomenclatureofMedicine--ClinicalTerms,SNOMEDCT)、观测指标标识符逻辑命名
与编码系统(LogicalObservationIdentifiersNamesandCodes,LOINC)等,其标准制定的数据基础大
多来自于欧美,而中国国内的很多指标定义与国外不甚相同,且国外各自标准的制定也均不一致,比如,
中国诊断指南、亚太标准及欧洲标准对“慢加急性肝衰竭”的定义各不相同。基于以上问题,暂时难以
实现对各单位间病毒性肝炎数据的规范化共享与交流。
因此,建立一套针对中国患者的病毒性肝炎明确统一的数据元定义,确定临床表型数据统一表达的
内容和方式,统一同源数据的收集内容与方法,从而改善数据的共享与使用效率,显著推动病毒性肝炎
的预防和治疗研究。
2范围
旨在推动数据共享,方便科研工作者获取临床表型数据开展科学研究,针对我国法定乙类传染病中
发病率最高的病毒性肝炎病种制定本标准。本标准的发起基于广州市科技计划《重大传染病监测预警系
统构建关键技术研究与示范应用》(项目编号202206080003)。
本标准适用于对中国病毒性肝炎临床表型数据进行规范性数据治理、共享及利用,可供医疗机构、
科研机构及科研工作者使用。本标准确定了中国病毒性肝炎临床表型数据共享的通用规范,规定了病毒
性肝炎在数据采集、存储、治理、共享、验证以及数据安全及伦理等方面的要求,对病毒性肝炎专病数
据库设计、建设、数据采集、数据关联、数据共享、隐私保护等具有借鉴意义。本标准的应用可指导病
毒性肝炎临床表型数据在我国多地区、多中心及不同层级医院的汇集与管理,促进数据互联互通与共建
共享,为我国医疗数据资源整合和利用提供参考工具;对提升临床研究水平,促进国内外病毒性肝炎研
究的交流和合作具有重要的意义和价值。本标准的应用思路如下图1。
3
T/GDPHA003—2023
图1本标准应用思路
3规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注明日期的引用文
件,仅该日期对应的版本适用于本文件;不注明日期的引用文件,其最新版本(包括所有的修改单)适
用于本文件。
GB/T38664.1-2020信息技术大数据政务数据开放共享第1部分:总则
GB/T39725-2020信息安全技术健康医疗数据安全指南
GB/T14396-2016疾病分类与代码
GB/T30522-2014科技平台元数据标准化基本原则与方法
GB/T18391.3-2009信息技术元数据注册系统(MDR)第3部分:注册系统元模型与基本属性
WS/T482-2016卫生信息共享文档编制规范
WS/T363.1-2023卫生健康信息数据元目录第1部分:总则
WS365-2011城乡居民健康档案基本数据集
WS/T370—2022卫生健康信息基本数据集编制标准
WS371-2012基本信息基本数据集个人信息
WS445.1-2014电子病历基本数据集第1部分:病历概要
WS445.2-2014电子病历基本数据集第2部分:门(急)诊病历
WS445.3-2014电子病历基本数据集第3部分:门(急)诊处方
WS445.4-2014电子病历基本数据集第4部分:检查检验记录
WS445.5-2014电子病历基本数据集第5部分:一般治疗处置记录
WS445.6-2014电子病历基本数据集第6部分:助产记录
WS445.7-2014电子病历基本数据集第7部分:护理操作记录
WS445.8-2014电子病历基本数据集第8部分:护理评估与计划
WS445.9-2014电子病历基本数据集第9部分:知情告知信息
WS445.10-2014电子病历基本数据集第10部分:住院病案首页
WS445.11-2014电子病历基本数据集第11部分:中医住院病案首页
WS445.12-2014电子病历基本数据集第12部分:入院记录
WS445.13-2014电子病历基本数据集第13部分:住院病程记录
WS445.14-2014电子病历基本数据集第14部分:住院医嘱
WS445.15-2014电子病历基本数据集第15部分:出院小结
WS445.16-2014电子病历基本数据集第16部分:转诊(院)记录
WS445.17-2014电子病历基本数据集第17部分:医疗机构信息
《医学数字化影像通讯标准》(DigitalImagingandCommunicationsinMedicine,DICOM)
《观测指标标识符逻辑命名与编码系统》(LogicalObservationIdentifiersNamesandCodes,LOINC)
4
T/GDPHA003—2023
4术语和定义
下列术语和定义适用于本文件。
4.1病毒性肝炎(ViralHepatitis)
病毒性肝炎是由肝炎病毒引起的,以损害肝脏为主的感染性疾病。具有传染性强、传播途径复杂、
流行面广泛,发病率较高等特点。临床上主要表现为乏力、食欲减退、恶心、呕吐、肝肿大及肝功能损
害。从病原学上划分,包括甲、乙、丙、丁、戊型肝炎;从临床表现上划分,包括急性肝炎、慢性肝炎、
重型肝炎、淤胆型肝炎、肝炎肝硬化。
4.2临床表型数据(ClinicalPhenotypicData)
指患者在疾病发生过程中所呈现的临床表现、体征、检查结果等信息所组成的数据,如生化指标、
影像学检查结果等。
4.3数据采集(DataCollection)
指从各种来源收集数据的过程,可能涉及从临床医疗记录、生物样本、传感器设备等收集数据的方
法和过程。
4.4数据存储(DataStorage)
指将采集到的数据保存在特定的存储介质或系统中的过程,该过程涉及将数据存储在数据库、云存
储或其他物理介质中,以供后续分析、共享或使用。
4.5数据治理(DataManagement)
指对院内数据资产进行管理和控制,支撑并保障数据被安全高效地交换与应用的过程。
4.6数据加密(DataEncryption)
指通过使用加密算法,将数据转换为密文的过程,以保护数据的机密性和安全性,防止未经授权的
访问和数据泄露。
4.7数据传输(DataTransmission)
指在不同系统、设备或网络之间传输数据的过程。
4.8数据脱敏(DataDesensitization)
指通过模糊化等方法处理原始数据,以实现屏蔽敏感数据且屏蔽后的数据不可恢复的数据保护方式。
4.9数据共享(DataSharing)
指将临床表型数据和生物组学数据提供给其他研究人员的过程,这一过程涉及数据的采集、录入、
治理、共享、存储和使用。
4.10数据提供者(DataProviders)
指生产或收集数据,并提供数据进行共享的个人、组织和机构。
4.11数据使用者(DataUsers)
5
T/GDPHA003—2023
指对临床表型数据和生物组学数据有使用需求的个人、组织和机构。
4.12服务提供者(ServiceProviders)
指为数据提供者、使用者或平台管理者提供数据存储、数据分析处理、数据安全保障、数据保护能
力测评等技术和安全服务,对平台管理者的工作提供支撑的个人、组织和机构。
4.13监督者(Supervisor)
指依照国家法律法规和政策文件的授权,对数据共享进行指导、监督管理的政府部门,包括网信、
公安、安全、保密等部门。
5病毒性肝炎临床表型数据采集规范
在进行病毒性肝炎数据采集前,应先明确采集前相关准备工作,如是否已通过伦理审查、采集对象
的数据结构、被抽取系统的数据库类型、采集工具、采集方式、存储方式、校验方式以及数据安全保障
等,制定完善的采集方案。同时数据采集人员应该接受标准化统一培训,以此确保所采集数据的合法性、
规范性、可靠性、准确性、一致性等。
5.1数据采集前的准备工作
1)伦理审查:伦理审查过程用于确保研究符合伦理规范并保护研究对象的权益。数据采集前,应
确保研究对象知情同意并签署知情同意书,尽可能保证其隐私和自主权并通过伦理委员会审查。
数据采集时,应保持数据的安全性和完整性,且为确保研究过程中的公正性和透明度,应及时
向研究对象和其他相关方披露研究结果。同时,还应严格明确限制数据的使用范围和访问权限,
定期更新相关隐私政策。
2)制定规范化采集方案:包括明确研究对象的范围和特征,开展实地调研以明确需求,系统探查
和测试,明确医院被抽取的业务系统承载能力,选择合适的采集工具和采集方式,避免出现数
据采集过程中可能导致的系统崩溃等问题。
3)数据安全:采集人员应具有合法的采集文件,如合同、授权书等,并应签署个人保密协议或承
诺书以保障数据采集过程中的信息安全和患者隐私。
4)召开项目启动会:对数据采集相关人员进行系统培训,统一步调,设定项目负责人负责整个项
目进度,并详细制定项目计划书。
5.2数据采集原则
1)科学性:数据采集的方法须符合科学规范和标准,同时应注意避免主观臆断和误导性解读等问
题,确保数据客观。
2)准确性:数据采集前需选择可靠的数据源,并规范数据采集标准,以保证数据质量和可信度。
数据采集后需要进行数据校验和清洗,通过对所采集的数据进行逻辑关系、范围格式等方面的
校验,并对异常值、缺失值、重复值等数据进行识别处理,从而纠正数据中的错误和不一致性。
3)全面性:数据采集应全面反映所研究对象的各方面临床特征,包括人口学基本信息、诊断、手
术、生化、影像以及量表问卷等多领域指标。
4)完整性:数据采集应尽可能完整覆盖研究对象所处的各个环节,包括入院前、入院时、治疗过
程和随访等阶段,并对数据采集的审核流程进行严格把控,具体包括:
a.预审核阶段:在数据输入之前进行预审核,检查数据的格式、完整性和合理性。
例如,对于实验室数据,确保所有必要的生物标志物都已被记录。
6
T/GDPHA003—2023
b.实时审核:在数据录入过程中实施实时审核机制,以识别和纠正任何错误或异常。
例如,设置系统自动检测超出正常范围的数值。
c.后审核阶段:在数据录入完成后进行最终审核,以确保数据的完整性和准确性。
这包括比较不同数据源之间的信息,以验证数据的一致性。
5)可扩展性:在采集数据时,应考虑到未来可能出现的新问题和需求,尽量使得数据可扩展、可
更新。因此,在确定采集工具和标准时需要尽可能具有普适性和通用性。
6)数据质控标准:在数据采集前应制定详细的数据质量控制标准,采集过程中应定期进行数据质
量评估,例如定期对数据库进行抽样审查,以评估数据质量。此外,还需进行持续的数据质量
改进工作,根据定期评估的结果,不断优化数据采集和管理流程。
5.3数据采集范围
病毒性肝炎数据采集的过程中,应尽量保证数据涵盖患者在院内信息系统内的全部信息,因信息系
统原因无法关联的信息可通过自建主索引或人工制定规则进行关联,仍无法关联的信息应存储备用。同
时建议将患者随访信息关联到院内信息,构建多模态数据集(含影像、超声、病理、组学等数据模式)。
病毒性肝炎数据的采集内容包括但不限于:患者基本信息(包括姓名、年龄、性别等)、病史(包括现
病史、既往史、个人史等)、疾病诊断(包括主次要诊断、疾病相关并发症等)、检查结果、检验结果、
医嘱、手术记录和用药记录(包括医生的处方药品名称、用量、频率等),以及其他非结构化数据(包
括患者主诉、医生诊疗意见、波形数据以及影像图片等)。
5.4数据采集方式
在进行病毒性肝炎数据采集时,应根据数据类型和采集目的选择合适的采集方式。主要采集方式包
括以下6种:
1)接口方式:即通过建立API接口对接医院相关业务系统获取患者数据。例如,通过对接电子病
历系统获取患者基本信息、就诊记录、诊断结果、用药信息等;通过对接医学影像系统获取患
者的X线、CT、磁共振等医学影像数据;通过对接检验系统收集患者实验室检验数据;通过对
接药物管理系统获取患者处方信息和用药记录等。
2)整库采集方式:通过与数据库建立连接,使用SQL等查询语言从数据库中直接采集数据。常见
的数据库连接方式包括ODBC(OpenDatabaseConnectivity)、JDBC(JavaDatabaseConnectivity)
以及ORM(Object-RelationalMapping)等框架。
3)电子表单采集方式:即通过读取和写入各种文件格式来实现数据采集。常见的文件格式包括
CSV(逗号分隔值)、Excel、JSON(JavaScriptObjectNotation)、XML等。
4)移动设备采集方式:通过佩戴可测量和记录健康相关生理参数的传感器,可以对患者的心率、
步数、睡眠状态、运动等数据进行实时采集。同时,患者也可利用具有用户界面的移动设备自
发记录其日常饮食摄入情况、药物使用情况、血压及血糖等数据。
5)人工录入方式:对于纸质量表、纸质问卷或其他数据无法电子化的情况,可采用手动录入的方
式进行收集。担任数据录入工作的人员应接受相关培训,了解问卷量表的内容、填写规则以及
数据录入标准等,录入时应使用专业的数据录入工具,并设立严格的数据验证和检查机制,必
要时可采用双重录入和复核的方式。录入后应对数据采取抽样核查、重复录入比对及逻辑验证
等质控方式,保障数据准确性。
6)其他采集方式:对于以上5种采集方式均不适用的情况,使用者可根据实际情况采用适当的方
式进行数据收集。
6病毒性肝炎临床表型数据存储规范
7
T/GDPHA003—2023
病毒性肝炎临床表型数据存储的规范应遵循安全性和完整性原则,采取相应的安全措施和完整性检
查机制,保障数据的安全性和完整性。
6.1数据存储分类
在进行数据分类存储时,应重点注意以下几点事项:
1)根据数据敏感程度进行分类存储:对于高敏感数据应当加密存储,避免未经授权人员访问造成
数据泄露。
2)根据数据格式进行分类存储:对于非结构化数据如病理图像等占用存储空间较大的数据,可存
储其调用地址,避免冗余存储。
6.2数据存储备份
为了防止数据丢失或损坏,应建立定期备份机制。备份数据应存储在不同的地点和存储介质上,以
确保在数据丢失或损坏的情况下也能够恢复数据。
1)多地备份:为了避免单点故障和数据意外丢失,建议将数据备份到不同的位置,如不同机房、
不同城市等。
2)定期备份:定期进行数据备份可以确保数据的及时性和完整性,且可避免因数据更新导致旧数
据被覆盖的情况。
3)数据恢复测试:在备份数据后,需要进行数据恢复测试以确保备份数据可以正常恢复。
4)备份规范操作:备份操作应由专业人员进行,并且应该遵守一定的规范操作,包括备份时间、
备份方式、备份文件命名规则等。
6.3数据存储安全
病毒性肝炎数据存储的第一原则是保证数据的安全性。这包括采取各种安全措施来保护数据免受未
经授权的访问和恶意攻击,如限制数据访问权限、使用身份验证和加密技术等。此外,在数据传输和共
享过程中,也应采取相应的安全措施,如使用安全协议和加密传输等,以确保数据的机密性和完整性。
1)数据加密:所有敏感或个人身份识别信息必须进行加密,应通过使用强密码、数字证书以及其
他可靠的加密技术来实现。
2)访问权限控制:管理员应对所有用户和数据的访问权限进行分层分级管理,所有访问记录都应
记录存储,以便核对溯源。
3)物理隔离:对于存储敏感信息的服务器等设备,必须严格控制物理访问,可通过使用安全门禁、
视频监控、报警系统等措施来实现。
4)软件安全:所有服务器均应安装病毒防护软件,并定期开展安全自查工作,任何发现的漏洞都
须尽快修复,并定期进行更新和升级。
6.4数据存储完整性校验
数据完整性是指数据在存储、传输和处理过程中保持其完整性和准确性。所有与病情诊断和治疗有
关的信息都应被收集并记录下来,包括症状、检查结果、诊断、治疗方案和随访情况等。为确保数据的
完整性,应采取一系列措施,如数据备份、版本控制和数据校验等。可引入自动化的数据完整性检查和
监控机制,如定期自动检查数据的完整性、设置异常报警机制等,以提高数据完整性的维护效率。
7病毒性肝炎临床表型数据治理规范
7.1明确治理目标
8
T/GDPHA003—2023
明确数据治理目标可以帮助制定有效的数据治理策略和措施。在对数据进行后结构化处理前,需明
确数据来源、提取类型、输出值域等内容。例如,计划开展针对现病史症状的后结构化任务时,需要明
确以下问题:
1)针对单科还是全科,数据来源应与目标一致。
2)后结构化任务的实体类型和关系类型。例如,除了提取症状外,是否还需提取与症状相关的有
无、发生时间、性质程度、诱因等。
3)值域如何定义及展示等问题。
7.2标准数据元定义
为了方便不同医疗机构间的数据交流和共享,需要将病毒性肝炎临床表型数据转化为统一的数据元,
标准化数据元应与国际或国家的现有标准(如LOINC、SNOMEDCT等)一致,以便于跨机构间的数据
共享和比较以保证数据的可比性和可重复性。例如,在描述病毒RNA或DNA在单位体积血液中的含量
水平时,可以使用“病毒载量”作为数据元的名称,并使用“国际单位/毫升(IU/mL)”来描述其计量单位。
同时,还需定义该数据元的取值范围、采样时间、采集方法等相关信息,以确保数据的准确性和一致性。
7.3结构化数据治理方式
针对病毒性肝炎患者的基本信息、检验结果、诊断数据和医嘱等结构化数据,可使用以下质检和校
验机制,以保障和提高数据质量:
1)数据完整性校验:包括必填字段的校验以及约束条件的验证等。比如使用既定的数据约束规则,
确保必需字段不为空,所有字段均满足定义的数据类型和长度,数据值符合有效范围等。
2)数据一致性校验:包括数据关联和关系的验证等。确保同一患者的所有数据记录在不同时间点
保持一致,如检验结果的时间序列应连续无缺。
3)逻辑判断规则:评估数据的合理性,例如使用统计分析方法检查数据分布是否符合预期,或检
查年龄、性别等基本信息的逻辑一致性。可以通过逻辑判断规则验证数据的逻辑关系、逻辑流
程和逻辑约束,以确保数据符合逻辑规则和业务规范。
4)数据重复性校验:避免重复录入相同的数据,确保每条记录的唯一性。
数据异常检测和质控:通过建立数据异常检测和纠正机制,及时发现和修正结构化数据中的异常或
错误。可以使用数据质量仪表板,结合自动化数据监测工具和规则,监测潜在的数据质量问题,并提供
纠正措施。比如识别和修正数据中的重复记录、无效值、异常趋势等。
7.4非结构化数据治理方式
针对非结构化数据,例如医疗记录和图像等,应采用合适的数据治理方式,如自然语言处理和图像
识别等技术,以便更好地管理和利用这些数据。
基于字典表等规则匹配和基于NLP算法是数据后结构化处理的两种常见方式,就实际应用而言,二
者皆有利弊。基于规则的方法主观性强,实现快捷,但可移植性不好,很难覆盖所有语言现,且易存在
歧义现象。而分词、标注等NLP算法有自主学习能力,能够挖掘文本规律识别各类实体,对文本歧义及
变化容错性更高,且能通过不断训练提高准确性。但NLP方式往往需要大量的标注样本,成本高,实现
复杂度较大。很多情况下也会将二者结合起来开展一系列后结构化任务。
此外,随着生成式人工智能技术的迅速发展,基于大语言模型(LargeLanguageModel,LLM)对
非结构化数据进行语义理解的模式也作为数据治理的新兴方法。通过大语言模型的信息抽取能力,对长
文本非结构化数据进行语义定位,提取潜在实体及关系以构建实体关系三元组,并将所提取的三元组映
射到相关医学专业术语库及映射词典,从而形成结构化医学标准数据。此种模式构建流程相对自动化、
9
T/GDPHA003—2023
耗费成本低,能通过小样本数据标注快速提取到非结构化文本数据中的重要信息,且基于医学术语库的
术语映射可对非结构化数据的挖掘颗粒度更细化。
8病毒性肝炎临床表型数据共享使用规范
病毒性肝炎临床表型数据共享的规范应包括共享目的、共享对象、共享权限和数据隐私保护等方面。
在进行数据共享时,应遵循相关规定标准和伦理标准,确保数据的安全性和隐私保护,同时促进病毒性
肝炎的研究和治疗发展。
8.1共享目的
在进行病毒性肝炎数据共享前,应先明确数据共享的目的,并确保所有参与方都清楚了解,如促进
科学研究、改善医疗服务、推动医疗技术的发展等。数据共享过程应符合相关法律法规和伦理标准,确
保数据合法、安全地被使用和共享。例如,欧盟于2016年通过的《一般数据保护法案(GDPR)》规定了
个人数据处理的合法性标准以及相关隐私权保护的规定。
8.2共享方式
常见的数据共享接口形式主要包括实时接口和文件接口。
1)实时接口:是指在数据共享平台上直接进行数据交互,可实现即时查询、检索和获取数据。
2)文件接口:是将数据以文件的形式进行传递,常见的文件格式包括CSV、Excel、XML等。
在实际应用中,不同的临床表型数据共享方案可能采用不同的数据接口形式或者混合模式,具体选
择应根据实际情况进行综合考虑。
8.3成果分配
临床表型数据共享使用后的成果分配需要综合考虑多个利益相关方的权益和需求,并通过协商达成
一定的共识和平衡。通常,需要考虑以下几个方面:
1)数据提供者:如果临床表型数据是由某家医院提供,则该机构可能会要求对使用后的成果进行
一定的归属。
2)数据使用者:如果临床表型数据被用于研究或开发某种新的医疗产品或服务,那么数据使用者
可能会要求获得一定程度的知识产权或商业利益(可通过协议签署达成)。
3)研究人员:如果数据被用于研究,研究人员可能因此获得一定的学术声誉、出版和发表论文的
机会,以及可能的研究资金或奖励等。
4)患者:所有的数据利用最终受益的是患者,因此患者的权益也应该得到重视,患者应能够享有
数据所带来的的医疗进步成果。同时在共享成果分配时,也应考虑如何回馈患者,例如提供参
研补贴。
8.4共享数据的隐私保护机制
在进行病毒性肝炎数据共享前,建立共享数据隐私保护机制是非常重要的,这些机制旨在确保患者
的隐私和数据安全不会受到侵犯。
1)共享数据应该采用匿名化或去标识化的方式去除个人身份信息和敏感信息等。匿名化可以通过
删除或替换数据中个人身份信息(如姓名、社会保障号码等)来实现,使患者无法被唯一识别
出来。去标识化则是在保留一部分识别信息的基础上对数据进行处理,以确保患者个体隐私的
保护。
10
T/GDPHA003—2023
2)数据共享需要遵守相关法律法规的规定。例如在我国,病毒性肝炎数据共享时应严格遵守《中
华人民共和国个人信息保护法》等相关法律法规。
3)数据共享应采用安全的传输和存储方式,防止未经授权的访问引发数据泄漏。这些技术包括加
密技术、网络隔离、访问控制、审计跟踪等。
4)明确共享数据的范围应该是必要的,数据使用者可获得的数据不得超出特定研究或临床实践所
需的范围。
5)根据2021年《中华人民共和国个人信息保护法》相关条例,未满十四周岁未成年人的个人信息
全部作为敏感个人信息,因此数据共享对象应对此部分人群制定专门的个人信息处理规则。
在进行病毒性肝炎数据共享时,共享对象应签署保密协议,保证共享的数据不会被滥用、非法使用
或泄露。例如,在共享医疗图像或健康信息时,应确保受试者的身份得到保护,重点要求其保证数据的
安全性和隐私性,尽可能保护病人的权益和利益,避免泄露敏感信息。同时,还需要考虑受试者知情同
意的问题,确保数据采集和共享是建立在受试者自愿参与的基础上进行的。
9病毒性肝炎临床表型数据验证规范
病毒性肝炎临床表型数据验证的规范应包括真实性原则、保密性原则、有限性原则和权威性原则等
方面。在进行数据验证时,应遵循相关的规定标准和伦理要求,确保验证结果具有可靠性和权威性。
9.1来源真实性规范
在对病毒性肝炎数据进行验证时,应确保数据的真实性和准确性。所提取的所有验证测试数据首先
要保证来源都必须是医院真实的医疗文档,遇到模糊不清的问题时,只能认真求真,绝不得以任何理由
随意改变测试数据的内容,即使在进行数据增强等涉及具体文本内容操作时,也应该在不改变原始文档
内容的前提下进行。验证人员应对验证数据的来源进行核实,并进行必要的数据清洗和处理。验证结果
应基于可靠的数据来源,并避免虚假数据造成的误导和误判。
9.2保密性规范
在进行病毒性肝炎数据验证时,应严格保守数据隐私和机密性,无论是从法律层面还是从伦理层面,
都要求遵循保密性原则。这一原则要求不仅要在提取前数据清洗阶段做到脱敏,在验证测试时也要进行
脱敏操作,以有效保障患者的隐私和避免数据泄露。验证人员应签署保密协议,确保验证数据不会被非
法使用或泄露。同时,应采取必要的技术和管理措施,防止数据被不正当使用或访问。
9.3有限性原则
在进行病毒性肝炎数据验证时,应遵循有限性原则。应该承认,建立的任何模型都是有限的,即模
型只能适用于一定范围内的数据,模型不可能无限制推广。也就是说任何训练出来的模型都应有与之相
对应的有限数据范围,不存在一个大而全的模型能够覆盖并验证所有测试数据。每个模型都有其对应的
业务域,不能一味地追求泛化能力而忽略模型的生效范围。验证人员应明确验证的数据范围和验证的目
的,避免无关的数据被验证和使用。同时,应遵循数据共享的相关规定,仅在合法的权限范围内使用验
证数据。常用的模型评估指标如下:
1)AUC(ReceiverOperatingCharacteristiccurveandAreaUndertheCurve):用于评估二分类模型
的性能。
2)准确率(Accuracy):正确预测的样本数与总样本数的比例。
3)召回率(Recall):所有实际为正类的样本中,被模型预测为正类的比例。
4)F1分数(F1Score):综合考虑精确率和召回率的平衡指标。
11
T/GDPHA003—2023
5)均方误差(MeanSquaredError,MSE):预测值与真实值之间的平均差距的平方。
6)平均绝对误差(MeanAbsoluteError,MAE):预测值与真实值之间的平均绝对差距。
7)R方(R-squared):模型对因变量变化的解释能力。
9.4权威性原则
在进行病毒性肝炎数据验证时,应确保验证结果具有权威性和可信度。验证人员应具备相关的专业
知识和技能,并采用合适的验证方法和工具,确保验证结果可靠和准确。可根据模型的类型和任务,选
择相应的性能评估指标来衡量模型的性能表现。此外,还可以使用交叉验证、混淆矩阵等方法来更全面
地评估模型的性能和泛化能力。任何有疑议的测试结果,其最终的判断都应该以临床医生或专家的判断
为金标准。由于医疗文档的专业性和复杂性,当发生疑议时往往还需要咨询对应专科的医生。同时,验
证结果应基于科学的数据分析和研究,避免主观臆断或偏见造成的误判和误导。
10病毒性肝炎临床表型数据安全及伦理规范
数据安全和伦理规范的违反可能会导致患者隐私泄露、数据完整性破坏,以及可能会带来科研机构、
医疗供应商以及学术出版和知识产权保护等方面的信任危机。为了避免以上情况发生,需要建立相应的
规范机制。病毒性肝炎临床表型数据安全及伦理规范应包括数据查询机制、数据申请机制、数据导出机
制、数据使用机制和数据销毁机制等方面。在进行数据保护和安全管理时,应遵循相关的规定标准和伦
理要求,确保数据的安全保密和合法使用,为病毒性肝炎的预防和治疗提供科学依据和支持。
10.1数据查询机制
为保障病毒性肝炎数据安全,应设立数据查询机制。数据查询是指谁有权查看患者数据,能够查看
哪些数据,如何数据脱敏和数据授权。只有合法授权人员才能进行数据查询,同时应设立数据查询审批
流程和日志记录机制,确保查询操作的合法性和可追溯性。建议医疗机构应根据自身实际情况,遵循患
者信息保护基本原则,制定一系列相关的规章制度,做到数据查询有记录,可追溯。
10.2数据申请机制
数据申请则是数据导出的前置程序,需要明确申请权限和数据量的控制、申请人和审批人职责等,
数据申请的同时还需签署数据保密协议、获得伦理审批以及发表数据利用声明等文件。只有具备相关研
究或临床治疗资质的人员才能申请使用数据,同时应签署保密协议并遵守相关法律法规和伦理标准,确
保数据的安全保密。
10.3数据导出机制
数据导出是数据管理人员的职责,管理人员应当严格遵守医院制定的各项相关规则,避免人情导出
数据,每个导出操作都要有迹可循,做到有记录、可追溯。只有经过审批和授权的人员才能进行数据导
出,同时,还应采取加密传输、身份认证等措施,确保数据的安全性和完整性。
10.4数据利用机制
数据使用的用途十分广泛,为保护病人隐私和个人信息安全,应设立数据使用机制。数据利用是数
据使用人员获得数据后的管理,如果使用人员不按照既往申请的伦理要求使用数据,很可能会侵害到数
据提供者的知情权。因此,要求数据使用者严格按照所申请的内容和相关伦理要求使用数据,不得在获
得数据后有任何违规使用行为。只有在合法授权范围内的人员才能使用数据,同时应签署保密协议并遵
守相关法律法规和伦理标准,确保数据的安全保密。
12
T/GDPHA003—2023
10.5数据销毁机制
为保障病毒性肝炎数据安全,应设立数据销毁机制。只有在数据不再需要使用时,经过审批和授权
的人员才能进行数据销毁,同时应采取必要的技术和管理措施,确保数据被彻底销毁并避免数据泄露。
13
T/GDPHA003—2023
11病毒性肝炎常用数据标准集示例
本标准制定了200条病毒性肝炎数据标准集示例以供其他中心作为病毒性肝炎临床表型数据相关平台建设或多中心数据共享时的标准规范。该数据
标准集包括了7大常见领域的临床表型数据,并对这些指标的一级分类、二级分类、指标定义、数据类型、表示格式、单位、值域、取值来源以及ICD-10
编码进行了规范的详细定义。病毒性肝炎数据标准集示例详见下表1。
表1病毒性肝炎数据标准集示例
序数据表示ICD-10
一级分类二级分类指标名称指标定义单位值域
定制服务
推荐标准
- T/SFIA 101-2017 合成材料运动场地面层质量控制标准(试行) 2017-05-30
- T/CMES 37005-2023 滑道运营管理规范 2023-12-27
- T/CAB 0352-2024 家用和类似用途烹饪器具减盐烹饪性能评价 2024-07-12
- T/SDHACC 019-2024 家用和类似用途微波炉 2024-08-15
- T/ACCEM 499-2025 智能收发衣柜 2025-01-22
- T/CMES 37006-2024 大型游乐设施安全距离要求 2024-04-03
- T/YGAZXH 4-2025 康养机器人通用技术规范 2025-01-25
- T/CNSAIA 006-2024 车用遮阳挡 2024-11-01
- T/SDHACC 013-2024 电饭锅 2024-08-15
- T/SDHACC 017-2024 净饮机 2024-08-15