T/CRHA 066-2024 淋巴瘤临床研究元数据模型及数据质量评估规范
T/CRHA 066-2024 Lymphoma clinical research metadata model and data quality evaluation specification
基本信息
发布历史
-
2024年07月
研制信息
- 起草单位:
- 北京大学、北京大学肿瘤医院、北京灵迅医药科技有限公司、北京大学国际医院、北京大学人民医院、北京大学第三医院、中国医学科学院肿瘤医院、吉安市中心人民医院、北京大学第一医院、北京大学首钢医院、解放军总医院第五医学中心、中日友好医院、首都医科大学附属北京同仁医院、首都医科大学附属北京朝阳医院、首都医科大学附属北京世纪坛医院、莆田医院附属医院、北京嘉和美康信息技术有限公司
- 起草人:
- 侯艳、朱军、宋玉琴、米岚、王维玉、林尊文、孙嘉曦、谢彦、刘卫平、吴梦、衡反修、王立军、严智昌、赵林俊、杨申淼、景红梅、李晔雄、亓淑楠、金璿、王明迪、肖秀斌、李振玲、王亮、陈文明、张伟京、甘东辉、王泽、甘伟、曲振忠
- 出版信息:
- 页数:66页 | 字数:- | 开本: -
内容描述
ICS11.120
CCSC07
团体标准
T/CRHA066—2024
————————————————————————————————
———————
淋巴瘤临床研究元数据模型及数据质量
评估规范
Metadatamodelanddataqualityevaluationspecificationforclinical
researchoflymphoma
2024-07-25发布2024-07-30实施
中国研究型医院学会发布
T/CRHA066—2024
目次
前言....................................................................II
引言....................................................................III
1范围..................................................................1
2规范性引用文件........................................................1
3术语及定义............................................................1
4评估对象..............................................................2
5数据质量评估指标框架..................................................2
6数据质量评估指标说明..................................................3
7数据质量评估流程......................................................4
8数据结果分析评级及质量报告............................................4
附录A(资料性)淋巴瘤临床研究数据元.....................................5
附录B(资料性)淋巴瘤临床研究数据元值域................................42
附录C(资料性)数据质量评估指标及评分说明..............................54
参考文献................................................................62
I
T/CRHA066—2024
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规
则》给出的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中国研究型医院学会医疗质量管理与评价专业委员会提出。
本文件由中国研究型医院学会归口。
本文件起草单位:北京大学、北京大学肿瘤医院、北京灵迅医药科技有限公司、北京
大学国际医院、北京大学人民医院、北京大学第三医院、中国医学科学院肿瘤医院、吉安
市中心人民医院、北京大学第一医院、北京大学首钢医院、解放军总医院第五医学中心、
中日友好医院、首都医科大学附属北京同仁医院、首都医科大学附属北京朝阳医院、首都
医科大学附属北京世纪坛医院、莆田医院附属医院、北京嘉和美康信息技术有限公司。
本文件主要起草人:侯艳、朱军、宋玉琴、米岚、王维玉、林尊文、孙嘉曦、谢彦、
刘卫平、吴梦、衡反修、王立军、严智昌、赵林俊、杨申淼、景红梅、李晔雄、亓淑楠、
金璿、王明迪、肖秀斌、李振玲、王亮、陈文明、张伟京、甘东辉、王泽、甘伟、曲振忠。
II
T/CRHA066—2024
引言
为利用真实世界研究的数据库和方法学研究来加速药品的上市,旨在为医疗机构淋巴
瘤临床研究提供一套术语规范、定义明确、语义语境无歧义的标准,以提高临床研究的数
据质量,实现临床研究患者相关临床数据在发布、交换等一致性和可比性,推动现有医疗
机构临床研究在不同医疗机构、不同软件系统和不同区域之间进行交换和共享。
本文件基于已有的淋巴瘤研究标准数据集,构建淋巴瘤数据质量评估制度、原则和评
测标准体系,为后续的临床研究和真实世界研究数据库的建立提供技术支持,从而推进行
业规范与标准。
开展淋巴瘤临床研究数据集的数据质量评估的目的是构建淋巴瘤数据质量评估制度、
原则和评测标准体系,为后续的临床研究和真实世界研究数据库的建立提供技术支持,从
而推进行业规范与标准。本文件基于《国家卫健委淋巴瘤标准数据集(2022版V2.0)》规
定的元数据模型构建标准研究数据库,从多家医疗机构收集研究数据,并对数据集内容质
量进行评估评价,从疗效风险获益的角度向监管准入等部门提供更具说服力的证据,对于
药品全生命周期管理具有重要的价值。
本文件受科技部国家重点研发计划项目(2021YFF0901401)《基于医学本体的监管数据
建模与分析技术》(2021/12-2024/11)支持。
III
T/CRHA066—2024
淋巴瘤临床研究元数据模型及数据质量评估规范
1范围
本文件规定了基于淋巴瘤临床研究数据集构建数据库的术语与定义、数据质量评估对
象、评估指标框架、评估指标说明、评估方法、评估流程、数据结果分析评级及质量报告。
本文件适用于开展淋巴瘤研究的规范数据集的创建,通过数据的集中收集、处理、清
洗和质量评估评价。
2规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本
适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改版)适用于本文
件。
GB/T36344—2018信息技术数据质量评价指标
3术语及定义
下列术语和定义适用于本文件。
3.1
元数据metadata
关于数据或数据元素的数据(可能包括其数据描述),以及关于数据拥有权、存取路径、
访问权和数据易变性的数据。
3.2
数据集dataset
具有一定主题,可以标识并可以被计算机化处理的数据集合。
3.3
数据质量dataquality
在指定条件下使用时,数据的特征满足明确的和隐含的要求的程度。
3.4
淋巴瘤临床研究数据集lymphomaclinicalresearchdatase
注1:该数据集以《国家卫健委淋巴瘤标准数据集(2022版V2.0)》《中国临床肿瘤
学会(CSCO)淋巴瘤诊疗指南(2021版)》《NCCN临床实践指南:慢性淋巴细胞白血病/
小 淋巴细胞淋巴瘤(2021.V1)》及《NCCN临床实践指南:巨球蛋白血症/淋巴浆细胞性淋
巴瘤(2021.V1)》等为主要参考,结合医院特点自定义模块及数据元,从而建立高质量的
专科领域治疗体系。
注2:数据集包含患者人口学信息、就诊记录、现病史、既往史、个人史、家族史、
体格检查、诊断信息、实验室检查、内镜检查、超声检查、影像学检查、病理及免疫组化、
1
T/CRHA066—2024
骨髓检查、药物治疗、手术治疗、放射治疗、疗效评价、随访、样本库等20个模块,共计
888个变量。为方便数据提取,数据集针对每一个数据项进行详细的原始数据来源映射和
规则匹配,为进一步提升淋巴瘤诊疗水平、造福患者打好数据基础。
4评估对象
本文件以淋巴瘤临床研究数据集各子域包含数据元为评估对象,数据集由15个子域组
成,见表1,数据元明细见附录A,值域代码见附录B。
表1淋巴瘤临床研究数据集子域
域号名称定义
临床研究名称、方案版本号、临床研究中心等项目基本
FA研究项目基本情况
信息。
RZ入组及知情同意受试者临床研究入组筛查及知情同意相关信息。
RK人口学资料受试者年龄、性别、民族等基本人口社会学信息。
个人家族及既往疾病情受试者个人史、社会史及既往史信息。
JW
况
TC一般状况及体格检查受试者筛查期及访视期体格检查信息。
受试者恶性肿瘤诊断及分期信息,其中恶性肿瘤指符合
ZD淋巴瘤诊断临床试验入选标准、为该研究主要治疗目标的肿瘤,不
包括受试者既往患有的或合并诊断的恶性肿瘤。
ZL淋巴瘤既往治疗史受试者临床研究入组前恶性肿瘤的相关治疗信息。
SY干预措施受试者参与临床研究期间试验性治疗相关信息。
HB合并用药受试者参与临床临床研究期间合并用药相关信息。
受试者临床研究筛选及入组期间生物样本采集和实验室
JY试验室检验及标本采集
检验信息。
受试者参与临床研究期间影像学、内镜及功能检查(如
JC医学检查
心电图、肺功能等)大型仪器设备检查信息。
PX疗效评价受试者临床试验期间疗效评价信息。
FZ不良事件受试者临床试验期间不良事件信息。
受试者随访及长期预后信息,包括临床试验出组后的后
YH随访及预后
续治疗信息。
5数据质量评估指标框架
依据GB/T36344—2018的第3章的指标框架,结合淋巴瘤临床研究数据集的特点,制
定本规范的指标框架。
数据质量评估指标框架如图1所示。评估指标包括以下内容:
1)内容质量:包括数据规范性、准确性、完整性和可用性;
2)过程质量:包括数据处理过程的处理效果、一致性;
3)效用质量:包括数据可访问性、时效性;
4)运维质量:包括数据管理员、操作员的专业程度以及数据的可维护性。
2
T/CRHA066—2024
图1数据质量评估指标框架图
6数据质量评估指标说明
数据质量评估从以下10个维度开展,具体说明见附录C。
6.1淋巴瘤临床研究数据的规范性
衡量淋巴瘤临床研究数据符合数据标准、数据模型、业务规则、数据元或权威参考数
据的程度。
6.2淋巴瘤临床研究数据的准确性
衡量淋巴瘤临床研究数据与客观事实的符合程度。
6.3淋巴瘤临床研究数据的完整性
衡量淋巴瘤临床研究数据具备或保持应有信息的程度。
6.4淋巴瘤临床研究数据的可用性
衡量淋巴瘤临床研究数据可供使用的时间。
6.5处理效果
衡量淋巴瘤临床研究数据经清洗处理后达到的效果。
6.6淋巴瘤临床研究数据的一致性
衡量具通过不同途径获取淋巴瘤临床研究数据的一致程度。
6.7淋巴瘤临床研究数据可访问性
衡量淋巴瘤临床研究数据能被访问的程度。
6.8淋巴瘤临床研究数据时效性
衡量淋巴瘤临床研究数据产生和流转满足管理和使用时效要求的程度即从事实发生到
数据入库可用的时间间隔。
6.9可维护性
衡量淋巴瘤临床研究数据维护的难易程度和版本变更的适应性。
3
T/CRHA066—2024
6.10专业程度
衡量参与淋巴瘤临床研究数据处理人员的专业程度。
7数据质量评估流程
淋巴瘤临床研究数据集质量评估流程要求如下:
a)内容质量评估,评估淋巴瘤临床研究数据集子域及数据元是否规范、完整、准确、
可用,依据评分标准(见附录C)按照评价指标内容质量部分对子域和数据元逐项评分;
b)过程质量评估,评估淋巴瘤临床研究数据集数据元一致性和处理效果,依据评分标
准(见附录C)按照评价指标过程质量部分对子域和数据元逐项评分;
c)效用质量评估,评估淋巴瘤临床研究数据集的可访问性和时效性,依据评分标准(见
附录C)按照评价指标效用质量部分逐项评分;
d)运维质量评估,评估淋巴瘤临床研究数据集运维及贯标的难易程度,依据评分标准
(见附录C)对评价指标运维质量部分逐项评分;
e)汇总数据集各部分质量评估分值,参照质量级别评定表(见表2),判定数据集质
量级别。
8数据结果分析评级及质量报告
8.1数据结果分析评级
评估后要对评估结果进行分析:
1)对评估目标与结果进行对比分析,确定是否达到评估指标;具体说明见表3。
2)对评估的方案的有效性进行分析,确认是不是合适等。根据评估结果确定对象的质
量评价,根据评价结果鉴定质量级别。确定评价对象的质量级别是建立在相应的质量分级
方案基础上的是判断数据质量成熟度的重要依据。质量级别评定标准见表2。
表2数据质量级别评定表
序号评价结果质量级别
1Q≥85高质量权威数据集
285>Q≥70可用数据集
3Q<70参考数据集
8.2数据结果质量报告
数据质量评估结果和评价报告是所有数据质量评价项目及其评测结果的合集。
在完整的数据质量评价结果和报告中,包括全部上述内容。此外,在数据质量评价报
告中对此进行的评价过程的操作做出完整的记录,包括存在的质量级别的内容确定等。
4
T/CRHA066—2024
附录A
(资料性)
淋巴瘤临床研究数据元
淋巴瘤临床研究数据集各个子域数据元见表A.1~A.14。
表A.1研究项目基本情况数据元专用属性
数据表示
内部编码数据元名称定义允许值
类型格式
CA.03.FA.00.0001研究方案研究方案中文名称S1AN..200
CA.03.FA.00.0002研究方案编号研究方案文书的唯一识别号S1AN..50
研究方案版本当日的公元纪年
CA.03.FA.00.0003研究方案版本日期DD8
日期
知情同意书版本日知情同意书版本当日的公元纪
CA.03.FA.00.0004DD8
期年日期
CA.03.FA.00.0005申办单位申办单位的名称S1AN..100
CA.03.FA.00.0006研究单位研究单位的名称S1AN..100
CA.03.FA.00.0007研究单位编号参与研究单位的唯一标识号S1AN..50
在多中心临床研究中,负责整
个临床研究的研究者,即牵头
CA.03.FA.00.0008牵头研究者S1AN..10
单位或组长单位的主要研究者
姓名
研究单位主要研究研究单位负责临床研究的主要
CA.03.FA.00.0009S1AN..10
者研究者姓名
CA.03.FA.00.0010临床研究状态临床研究所处的阶段S3N1见表B.1
临床研究启动会召开当日的公
CA.03.FA.00.0011研究开始日期DD8
元纪年日期
对最后一例研究参与者完成全
CA .03.FA.00.0012研究结束日期部研究相关数据采集当日的DD8
公元纪年日期
CA.03.FA.00.0013研究方案调整研究方案是否发生调整LT/F
5
T/CRHA066—2024
数据表示
内部编码数据元名称定义允许值
类型格式
研究方案调整当日的公元纪年
CA.03.FA.00.0014研究方案调整日期DD8
日期
CA.03.FA.00.0015研究方案调整原因研究方案调整原因描述S1AN..200
CA.03.FA.00.0001研究方案研究方案中文名称S1AN..200
表A.2入组及知情同意数据元专用属性
数据表示
内部编码数据元名称定义允许值
类型格式
研究中分配给受试者以辨识
CA.02.RZ.00.0001受试者标识S1AN..20
其身份的唯一编号
CA.02.RZ.00.0002受试者筛选日期受试者接受入组筛选的日期DD8
受试者签署知情同意书的日
CA.02.RZ.00.0003知情同意书签署日期DD8
期
受试者经筛选后是否成功入
CA.02.RZ.00.0004受试者入组状态LT/F
组
受试者经筛选后无法入组的
CA.02.RZ.00.0005受试者入组失败原因S1AN..50
原因
受试者是否符合所有入组标
受试者是否符合所有
CA.02.RZ.00.0006准且不符合任何一条排除标LT/F
入排标准
准
受试者不符合入排标如果受试者不符合的入排标
CA.02.RZ.00.0007S1AN..10
准的编号准的具体编号
1:是;
受试者是否接受随机
CA.02.RZ.00.0008受试者是否接受随机分组S2N12:否;
分组
9:不适用
受试者接受随机分组
CA.02.RZ.00.0009受试者接受随机分组的时间DD8
时间
6
T/CRHA066—2024
CA.02.RZ.00.0010受试者随机号受试者随机号S1AN..20
受试者所分配的研究受试者所分配进入的研究组
CA.02.RZ.00.0011S1AN..20
组名称
表A.3人口学资料数据元专用属性
数据表示
内部编码数据元名称定义允许值
类型格式
研究参与者出生当日的公元纪
CA.03.RK.01.0001出生日期DD8
年日期
研究参与者从出生当日公元纪
年日起到签署知情同意书当日
止生存的时间长度。年龄满1
CA.03.RK.01.0002年龄NN3备注:0-365
周岁者,以实足年龄的相应整
数为准;不足1岁的,以实
足天数为准
年龄的计量单位。年龄满1周
年龄计量单0:年
CA.03.RK.01.0003岁者,选择年为计量单位;不S2N1
位1:天
满1岁者,以天为计量单位
研究参与者生理性别在特定编
CA.03.RK.02.0001性别S3N1GB/T2261.1
码体系中的代码
研究参与者所属国籍在特定编
CA.03.RK.03.0002国籍S3AN3GB/T2659
码体系中的代码
研究参与者所属民族类别在特
CA.03.RK.03.0003民族S3N2GB/T3304
定编码体系中的代码
研究参与者所属民族或人种类
其他民族或
CA.03.RK.03.0004别未在特定编码体系范围内S1AN..20
种族
时,记录的民族或种族信息
研究参与者当前婚姻状况的代
CA.03.RK.04.0001婚姻状况S3N2GB/T2261.2
码
7
T/CRHA066—2024
数据表示
内部编码数据元名称定义允许值
类型格式
现有子女数研究参与者现有子女的数量,
CA.03.RK.04.0002NN..2
(个)计量单位为个
研究参与者曾经妊娠次数的累
CA.03.RK.04.0003孕次NN..2
计值
研究参与者曾经生产次数的累
CA.03.RK.04.0004产次NN..2
计值
表A.4个人家族及既往疾病情况数据元专用属性
数据表示
内部编码数据元名称定义允许值
类型格式
研究参与者过去和现在的吸烟
CA.03.JW.01.0001吸烟状况代码S2N1WS365
情况代码
开始吸烟年研究参与者开始吸第一支烟的
CA.03.JW.01.0002NN..2
龄(岁)周岁年龄,计量单位为岁
平均每天的吸烟量,计量单位
CA.03.JW.01.0003日吸烟量(支)NN..3
为支
研究参与者层吸烟但已成功戒
CA.03.JW.01.0004戒烟年龄(岁)烟时的周岁年龄,计量单位为NN..2
岁
CA.03.JW.01.0005饮酒频率代码研究参与者饮酒的频率代码S3N1WS/T364.5
开始饮酒年研究参与者第一次饮酒时的周
CA.03.JW.01.0006NN..2
龄(岁)岁年龄,计量单位为岁
研究参与者平均每天的饮酒量
CA.03.JW.01.0007日饮酒量(ml)NN..3
相当于白酒量,计量单位为ml
CA.03.JW.01.0008戒酒标志标识研究参与者曾饮酒者是否LT/F
8
T/CRHA066—2024
数据表示
内部编码数据元名称定义允许值
类型格式
成功戒酒
研究参与者曾曾饮酒但现已戒
CA.03.JW.01.0009戒酒年龄(岁)酒者成功戒酒时的周岁年龄,NN..2
计量单位为岁
CA.03.JW.01.0010饮酒种类代码研究参与者饮酒种类代码S3N1WS364.5
肿瘤家族史标标识研究参与者家族成员中是
CA.03.JW.02.0001LT/F
志否有研究参与者
患肿瘤亲属与患肿瘤家族成员于研究参与者
CA.03.JW.02.0002研究参与者关的家庭和社会关系所属类别在S3N2GB/T4761
系代码特定编码体系中的代码
肿瘤家族史瘤家族成员所患肿瘤的国际疾病
CA.03.JW.02.0003S3AN..5ICD-10
别分类代码
是否诊断遗传
CA.03.JW.02.0004是否诊断遗传性疾病LT/F
性疾病
药物过敏史标标识研究参与者既往有无药物
CA.03.JW.03.0001LT/F
志过敏经历
研究参与者既往发生过敏情况
CA.03.JW.03.0002过敏史
定制服务
推荐标准
- GB/T 22080-2008 信息技术 安全技术 信息安全管理体系 要求 2008-06-19
- GB/T 22225-2008 化学品危险性评价通则 2008-06-19
- GB/T 22081-2008 信息技术 安全技术 信息安全管理实用规则 2008-06-19
- GB/T 22040-2008 公路沿线设施塑料制品耐候性要求及测试方法 2008-06-19
- GB/T 22229-2008 工业用化学品 固体及液体的蒸气压在10 -3 Pa至1 Pa范围内的测定 蒸气压平衡法 2008-06-19
- GB/T 22230-2008 工业用液态化学品 20℃时的密度测定 2008-06-19
- GB/T 22029-2008 热浸镀锌螺纹 在外螺纹上容纳镀锌层 2008-06-19
- GB/T 22231-2008 颗粒物粒度分布/纤维长度和直径分布 2008-06-19
- GB/T 22226-2008 发动机冷却液沸点测定法 2008-06-19
- GB/T 22228-2008 工业用化学品 固体及液体的蒸气压在10 -1 Pa至10 5 Pa范围内的测定 静态法 2008-06-19