基本信息
发布历史
-
2023年04月
研制信息
- 起草单位:
- 中国医学科学院药物研究所、国家人口健康科学数据中心、中国医学科学院、中国医学科学院医学信息研究所、北京协和建昊医药技术开发有限责任公司
- 起草人:
- 李燕、潘显道、刘晓宇、周伟、杨金玲、冯志强、范愉、靳洪涛、吴思竹、沈珑瑛、褚迎雪、邓海东、罗葳、刘思齐、张晓宇、王嘉阳、叶铃、刘盛宇
- 出版信息:
- 页数:14页 | 字数:- | 开本: -
内容描述
ICS01.040.19
CCSC10
T/BIA
团体标准
T/BIA15-2023
药学数据集化学
Pharmaceuticaldataset-Chemistry
2023-04-17发布2023-04-18实施
北京信息化协会发布
T/BIA15-2023
目次
前言.................................................................................II
引言................................................................................III
1范围................................................................................4
2规范性引用文件......................................................................4
3术语和定义..........................................................................4
4数据元基本属性说明..................................................................5
4.1数据元基本属性..................................................................5
4.2标识符编码规则..................................................................5
4.3数据元名称......................................................................5
4.4说明............................................................................5
4.5数据类型说明....................................................................5
4.6表示格式说明....................................................................6
4.6.1表示格式中字符含义描述规则..................................................6
4.6.2表示格式中字符长度描述规则..................................................6
4.7值域............................................................................7
5概述................................................................................7
6数据元..............................................................................7
6.1化合物的基本信息................................................................7
6.2化合物的结构信息................................................................8
6.3化合物的物理性质信息............................................................9
6.4化合物的化学性质信息............................................................9
6.5化合物的波谱信息...............................................................10
6.6化合物的含量纯度信息...........................................................11
6.7化合物的药物靶点信息...........................................................11
参考文献.............................................................................13
I
T/BIA15-2023
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由北京信息化协会提出。
本文件由北京信息化协会归口。
本文件起草单位:中国医学科学院药物研究所;国家人口健康科学数据中心;中国医学科学院;中
国医学科学院医学信息研究所;北京协和建昊医药技术开发有限责任公司。
本文件主要起草人:李燕、潘显道、刘晓宇、周伟、杨金玲、冯志强、范愉、靳洪涛、吴思竹、沈
珑瑛、褚迎雪、邓海东、罗葳、刘思齐、张晓宇、王嘉阳、叶铃、刘盛宇。
本文件为首次发布。
II
T/BIA15-2023
引言
药学数据集包括药理学、药物代谢动力学、药物毒理学、药学相关的组学及化学五个部分。本文件
是药学数据集的组成部分之一,旨在为药学相关的化学研究提供一套术语规范、定义明确的基本数据元
标准,以规范信息记录内容,实现信息在收集、存储、发布、交换等应用中的一致性和可比性,保证药
学信息的有效交换、统计和共享,是药学数据清洗工具研发的基础。
III
T/BIA15-2023
药学数据集化学
1范围
本文件规定了化合物的基本信息、化合物的结构信息、化合物的物理性质信息、化合物的化学性质
信息、化合物的波谱信息、化合物的纯度含量信息、化合物的药物靶点信息,及编码规则。
本文件适用于临床前药物研究、技术优化、研发关键技术工具、数据库构建、数据共享等。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T31074科技平台数据元设计与管理
GB/T7408数据元和交换格式信息交换日期和时间表示法
GB2312信息交换用汉字编码字符集基本集
GB3102.1-93空间和时间的量和单位
GB/T14666分析化学术语
3术语和定义
下列术语和定义适用于本文件。
3.1
化合物compound
由两种或两种以上元素的原子组成的纯净物质。具有一定的特性,通常具有一定的组成。
3.2
化学性质chemicalproperties
化合物在化学变化过程中表现出来的性质。牵扯到化合物分子(或晶体)结构和化学组成的变化。
化合物的酸碱性、氧化还原性和络合性等都属化学性质。
3.3
物理性质physicalproperties
化合物 不需要发生化学变化就表现出来的性质,如颜色、性状、气味、熔点、沸点、硬度和密度等。
3.4
靶点target
4
T/BIA15-2023
药物与机体生物大分子的结合部位即药物靶点。药物作用靶点涉及受体、酶、离子通道、转运体、
免疫系统、基因等。
4数据元基本属性说明
4.1数据元基本属性
数据元标识符、数据元名称、英文名称、说明、数据类型、表示格式、计量单位、值域。
4.2标识符编码规则
数据元标识符编码应遵循以下规则:
a)规范性引用文件中的数据元标识符编码规则适用于本文件对应数据元。
b)非引用类数据元标识符由2位大写英文字母与7位阿拉伯数字组成。按数据集首字母缩写、大
类代码、小类代码、顺序号从左至右顺序排列。结构见图1。
图1数据元标识符代码结构
图1中:
a)标识符前2位:数据集首字母缩写PD,用2位大写英文字母表示。
b)大类代码:用2位数字表示,从01开始顺序编码。
c)小类代码:用2位数字表示,数字大小无含义,在大类内进行排序,从01开始顺序编码。大
类代码与小类代码之间加“.”区分。
d)顺序号:用3位数字表示,数字大小无含义,在小类内进行排序,从001开始顺序编码。小
类代码与顺序号之间加“.”区分。
4.3数据元名称
数据元的名称是标识数据元的主要手段,简称“名称”。
4.4说明
关于数据元的含义和基本特征的说明,并使之区别于其他数据元。
4.5数据类型说明
数据元的数据类型说明见表 1。
5
T/BIA15-2023
表1数据类型说明
数据类型表示符描述
通过字符形式表达的值的类型,可包含字母字符(a~z,A~Z)、
数字字符等(默认GB2312),其中:
S1:不可枚举型,表示数据元的允许值(值域)是不可枚举
的,且以字符描述;
字符型(string)S
S2:枚举型,表示数据元的允许值(值域)是可枚举的,通常
列表值不超过3个;
S3:引用型,数据元的允许值(值域)是可枚举的,当列表值超
过3个时通常会引用代码表
又称逻辑型,采用0(False)或1(True)形式表示的逻辑值的
布尔型(boolean)L
类型
数值型(number)N通过“0”到“9”数字形式表示的值的类型
日期型(date)D采用GB/T7408中规定的YYYYMMDD格式表示的值的类型
采用GB/T7408中规定的YYYYMMDDThhmmss格式表示的值的类型
日期时间型(datetime)DT
(字符T作为时间的标志符,说明时间表示的开始)
时间型(time)T采用GB/T7408中规定的hhmmss格式表示的值的类型
上述无法表示的其他数据类型,如图像、音频、视频等二进制流
二进制(binary)BY
文件格式
4.6表示格式说明
4.6.1表示格式中字符含义描述规则
数据元的表示格式中字符含义描述规则见表2。
表2表示格式中字符含义描述规则
字符含义
A字母字符
N数字字符
AN字母或(和)数字字符
D8采用YYYYMMDD的格式表示,其中,“YYYY”表示年份,“MM”表示月份,“DD”表示日期
T6采用hhmmss的格式表示,其中“hh”表示小时,“mm”表示分钟,“ss”表示秒
采用YYYYMMDDThhmmss的格式表示,字符T作为时间的标志符,说明日的时间表示的开始;其
DT15
定制服务
推荐标准
- GB/T 3407-2010 石油混合二甲苯 2011-01-10
- GB/T 3624-2010 钛及钛合金无缝管 2011-01-10
- GB/T 386-2010 柴油十六烷值测定法 2011-01-10
- GB/T 3931-2010 联轴器 术语 2011-01-10
- GB/T 3406-2010 石油甲苯 2011-01-10
- GB/T 3146.1-2010 工业芳烃及相关物料馏程的测定 第1部分:蒸馏法 2011-01-10
- GB/T 3610-2010 电池锌饼 2011-01-10
- GB/T 3884.12-2010 铜精矿化学分析方法 第12部分:氟和氯含量的测定 离子色谱法 2011-01-10
- GB/T 4508-2010 沥青延度测定法 2011-01-10
- GB/T 3310-2010 铜及铜合金棒材超声波探伤方法 2011-01-10