GB/T 44393-2024 序列多态STR等位基因命名规则

GB/T 44393-2024 Nomenclature for sequence-based STR alleles

国家标准 中文简体 现行 页数:24页 | 格式:PDF

基本信息

标准号
GB/T 44393-2024
相关服务
标准类型
国家标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
-
发布日期
2024-08-23
实施日期
2024-12-01
发布单位/组织
国家市场监督管理总局、国家标准化管理委员会
归口单位
全国刑事技术标准化技术委员会(SAC/TC 179)
适用范围
本文件规定了序列多态STR等位基因命名的总体要求及具体规则。本文件适用于从事STR测序的实验室、企业的科研、生产、检测等,针对人类的STR等位基因命名。

发布历史

研制信息

起草单位:
公安部鉴定中心、四川大学、中国科学院北京基因组研究所(国家生物信息中心)、河北医科大学、中山大学、国家毒品实验室广东分中心、辽宁省公安厅、北京生物医药研究所、北京市公安局、中国政法大学、北京爱普益生物科技有限公司
起草人:
季安全、叶健、王乐、康克莱、刘冰、侯一平、王正、方向东、李淑瑾、孙宏钰、刘超、刘锋、戴文申、焦章平、袁丽、张驰、赵杰、周骋
出版信息:
页数:24页 | 字数:35 千字 | 开本: 大16开

内容描述

ICS07140

CCSA.92

中华人民共和国国家标准

GB/T44393—2024

序列多态STR等位基因命名规则

Nomenclatureforsequence-basedSTRalleles

2024-08-23发布2024-12-01实施

国家市场监督管理总局发布

国家标准化管理委员会

GB/T44393—2024

目次

前言

…………………………Ⅲ

引言

…………………………Ⅳ

范围

1………………………1

规范性引用文件

2…………………………1

术语和定义

3………………1

总体要求

4…………………2

命名规则

5…………………2

附录规范性基因座序列信息

A()STR…………………5

参考文献

……………………16

GB/T44393—2024

前言

本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定

GB/T1.1—2020《1:》

起草

请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别专利的责任

。。

本文件由中华人民共和国公安部提出

本文件由全国刑事技术标准化技术委员会归口

(SAC/TC179)。

本文件起草单位公安部鉴定中心四川大学中国科学院北京基因组研究所国家生物信息中心

:、、()、

河北医科大学中山大学国家毒品实验室广东分中心辽宁省公安厅北京生物医药研究所北京市公

、、、、、

安局中国政法大学北京爱普益生物科技有限公司

、、。

本文件主要起草人季安全叶健王乐康克莱刘冰侯一平王正方向东李淑瑾孙宏钰刘超

:、、、、、、、、、、、

刘锋戴文申焦章平袁丽张驰赵杰周骋

、、、、、、。

GB/T44393—2024

引言

遗传标记广泛应用于法庭科学司法鉴定医学以及人类学研究本文件面向的应用需

STR、、。STR

求制定通用的序列多态等位基因命名规则兼具统一性唯一性协调性可拓展性提高的

,STR,、、、,STR

应用价值

GB/T44393—2024

序列多态STR等位基因命名规则

1范围

本文件规定了序列多态等位基因命名的总体要求及具体规则

STR。

本文件适用于从事测序的实验室企业的科研生产检测等针对人类的等位基因

STR、、、,STR

命名

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款其中注日期的引用文

。,

件仅该日期对应的版本适用于本文件不注日期的引用文件其最新版本包括所有的修改单适用于

,;,()

本文件

法庭科学数据库选用的基因座及其数据结构

GB/T41009DNA

3术语和定义

下列术语和定义适用于本文件

31

.

短串联重复序列shorttandemrepeatSTR

;

广泛存在于真核生物基因组中重复单位通常由个个碱基构成重复次数通常在次次

,2~6,5~60

的片段

DNA。

32

.

STR等位基因STRallele

基因座上序列或和长度存在差异的片段

STRDNA/。

33

.

长度多态性lengthpolymorphism

[]

同一基因座上各等位基因之间的长度差异构成的多态性

,DNA。

34

.

序列多态性sequencepolymorphism

[]

同一基因座上各等位基因之间的序列差异构成的多态性

,DNA。

35

.

重复区序列repeatregionsequence

中重复单位串联组成的部分一般从第一个重复单位的端至最后一个重复单位的端的

STR,5',3'

序列

36

.

侧翼序列flankingregionsequence

重复区序列两侧的序列

STRDNA。

注指在的扩增片段中引物结合位置与的重复区之间的序列由于检测试剂盒的引物

:STR,PCRSTR。STRPCR

结合位置可能不同检测和报告侧翼序列的位置范围可能不同

,。

1

GB/T44393—2024

37

.

重复单位repeatunit

重复区序列中连续反复出现的序列

STRDNA。

38

.

重复结构repeatstructure

重复区序列中重复单位的组成形式

STR。

4总体要求

41应以作为比对参考序列以其正向序列作为

.GRCh38.p14(NCBIGenome:GCA_000001405.29),

序列比对依据进行序列比对定义重复结构和侧翼序列变异

STR,、。

42基因座的起始和终止位置根据参考序列位置描述不应因碱基插入或缺失而改变部分

.STR,,STR

重复区的起始位置终止位置和重复结构应符合附录

、A。

43命名规则应具备基因座可拓展性

.。

44应充分利用序列多态性信息

.STR。

45应与长度多态等位基因命名兼容命名转换为长度多态分型结果与一致

.STR,GB/T41009。

5命名规则

51命名通式

.

按照图通式结构进行命名命名应含有等位基因的长度多态分型根据等位基因实际情况可能不

1,,

含有通式中其他三个部分命名细则按照的规定执行

。5.2。

图1人类序列多态STR等位基因命名通式结构

52命名细则

.

521重复结构中仅包含单一重复单位的基因座用重复单位数目命名该等位基因

..,。

示例基因座重复结构为该基因座某等位基因重复区序列为侧翼序列与参考序列完

:TPOX[AATG]a,[AATG]8,

全相同则该等位基因命名为

,8。

522重复结构中包含XX个重复单位的基因座等位基因命名为重复单位总数目第一个重

..(>1),:(

复单位数目第二个重复单位数目第X个重复单位数目

//……/)。

示例1基因座重复结构为该基因座某等位基因重复区序列为

:D2S1338[GGAA]a[GGCA]b,[GGAA]6

侧翼序列与参考序列完全相同则该等位基因命名为

[GGCA]11,,17(6/11)。

示例2基因座重复结构为该基因座某等位基因重复区序列

:D12S391[AGAT]a[AGAC]b[AGAT]c,[AGAT]11

侧翼序列与参考序列完全相同则该等位基因命名为

[AGAC]7,,18(11/7/0)。

示例3基因座重复结构为该

:D21S11[TCTA]a[TCTG]b[TCTA]cTA[TCTA]dTCA[TCTA]eTCCATA[TCTA]f,

基因座某等位基因重复区序列为侧翼序

[TCTA]6[TCTG]5[TCTA]3TA[TCTA]3TCA[TCTA]2TCCATA[TCTA]7,

2

GB/T44393—2024

列与参考序列完全相同则该等位基因命名为

,26(6/5/3/3/2/7)。

523当等位基因的重复区序列中的重复单位存在插入序列时将该插入序列以大写英文字母形式插

..,

入等位基因名称的相应位置并以连接该插入序列和前后序列在确定插入的序列和位置时应依

,“+”。,

次优先考虑插入序列的碱基个数最少和插入位置最靠近序列端的情况

5'。

示例1基因座重复结构为该基因座某等位基因重复区序列为侧翼序列

:TH01[AATG]a,[AATG]6ATG[AATG]3,

与参考序列完全相同则该等位基因命名为

,9.3(6+ATG+3)。

示例2基因座重复结构为该基因座某等位基因重复区序列为侧翼

:D6S1043[ATCT]a,[ATCT]5ATGT[ATCT]10,

序列与参考序列完全相同则该等位基因命名为

,16(5+ATGT+10)。

示例3基因座重复结构为该基因座某等位基因重复区序列为

:vWA[TAGA]a[CAGA]bTAGA,[TAGA]3TGGA

侧翼序列与参考序列完全相同则该等位基因命名为

[TAGA]3[CAGA]4TAGACAGATAGA,,14(3+TGGA+3/4+

该序列可能的序列插入方式如图所示根据上述优先规则确定方式一作为唯一序列插入方式而进行相

TAGA+1)。2,,

应命名

图2vWA基因座等位基因14序列的可能插入方式示意图粗体标示的序列即不同方式插入序列

()

524当等位基因的侧翼序列中存在碱基替换插入缺失时将侧翼序列中的碱基替换插入缺失信

..、、,、、

息增加体现在重复区序列信息之后中括号内以重复区序列为基准定义碱基替换插入缺失位

,“[]”。、、

置以和分别表示上游和下游以表示替换并紧接替换后的碱基序列以表示

;“-”“+”“”“”;“s”“”,();“i”

插入并紧接插入的碱基序列同时以连接号-连接插入的前后位置并以下划线标示以

“”,(),“”,“”;

表示缺失当出现连续的碱基替换插入缺失时以-连接碱基替换插入缺失的起始和终止

“d”“”。、、,“”、、

位置并以下划线标示位置范围当侧翼序列中多处出现碱基替换插入缺失时按照上游在

,“”。、、,“

下游之前位置数值小的在位置数值大的之前规则依次排列中间用相连针对等位基因的侧翼序

,”,“/”。

列存在变异的情况命名还应符合以下要求

,:

当侧翼序列中存在碱基插入缺失时如果导致侧翼序列长度变化计入等位基因的长度多态

a)、,,

分型调整相应数值

,;

在报告等位基因的侧翼序列比对结果时明确所检测分析的侧翼序列的位置范围

b),;

在确定插入或缺失的序列和位置时依次优先考虑插入或缺失序列的碱基个数最少和发生位

c),

置最靠近序列端的情况

5'。

示例1基因座重复结构为该基因座某等位基因重复区序列为侧翼序列下游第个

:TPOX[AATG]a,[AATG]8,15

碱基参考序列为替换为则该等位基因命名为

(rs576104845,C)T,8[+15sT]。

示例2基因座重复结构为该基因座某等位基因重复区序列为侧翼序列下游第个

:D13S317[TATC]a,[TATC]8,1

碱基参考序列为替换为侧翼序列下游起始个碱基与重复单位同为则该等位基因命名为

(rs9546005,A)T,4TATC,

8[+1sT]。

示例3基因座重复结构为该基因座某等位基因重复区序列为侧翼序列下游第

:PentaD[AAAGA]a,[AAAGA]12,

个碱基参考序列为替换为侧翼序列下游起始个碱基与重复单位同为则该等位基因

4(rs186259515,A)G,5AAAGA,

命名为

12[+4sG]。

示例4基因座重复结构为该基因座某等位基因重复区序列为侧翼序列下游第个

:DYS531[AAAT]a,[AAAT]10,4

碱基参考序列为和第个碱基参考序列为之间插入单碱基计入等位基因的长度多态分型则该等位基因命

(A)5(T)T,,

名为

10.1[+4-5iT]。

示例5基因座重复结构为该基因座某等位基因重复区序列为侧翼序列上游第

:PentaD[AAAGA]a,[AAAGA]8,

个碱基到第个碱基参考序列为共个碱基发生缺失计入等位基因的长度多态分型则

164(AAGAAAGAAAAAA)13,,

3

GB/T44393—2024

该等位基因命名为

5.2[-16-4d]。

示例6基因座重复结构为该基因座某等位基因重复区序列为侧翼序列下游第

:PentaD[AAAGA]a,[AAAGA]12,

个碱基到第个碱基参考序列为区段内个碱基发生缺失该序列为虚构示例计入等位基因的长

1420(AAAAAAA)1(),

度多态分型按照以上优先规则确定缺失位置在最靠近序列端则该等位基因命名为

,5',11.4[+14d]。

525当插入序列位于重复区序列与侧翼序列之间时规定该插入序列计入重复区按照进行

..,,5.2.3

命名

示例1基因座重复结构为该基因座某等位基因重复区序列为且在重复区序列与上游

:D7S820[TATC]a,[TATC]9,

侧翼序列之间存在单碱基插入将该插入计入重复区序列该等位基因命名为

A,,9.1(A+9)。

示例2基因座重复结构为该基因座某等位基因重复区序列为且在重复

:D2S441[TCTA]a,[TCTA]10TTTA[TCTA]2,

区序列与上游侧翼序列之间存在单碱基插入将该插入计入重复区序列该等位基因命名为

A,,13.1(A+10+TTTA+2)。

526当等位基因的重复区序列中非重复单位存在碱基替换插入缺失时在碱基替换插入缺失发

..、、,、、

生位置的前一个重复单位数目后以星号表示并在命名通式的重复区序列中非重复单位的碱基变

“*”,

异信息部分补充说明碱基替换插入缺失处的完整序列信息以冒号起始以下划线标示替

、、,“:”。“”

换的碱基以连接插入碱基和前后序列以删除线标示缺失的碱基如果多处序列存在碱基替换

,“+”,。、

插入缺失分别在相应位置以表示并在命名通式的重复区序列中非重复单位的碱基变异信息部

、,“*”,

分依次补充说明中间用逗号相连如果以上序列的碱基插入缺失导致重复区序列长度变化则相

,“,”。、,

应调整等位基因的长度多态分型

注本条细则所适用的序列在实际人群中出现的概率很低

:。

示例1基因座重复结构为该基因座某等位基因重复区序

:FGA[GGAA]aGGAG[AAAG]bAGAAAAAA[GAAA]c,

列为即在最后两个重复单位之间序列存在个碱基的缺失侧翼序列

[GGAA]2GGAG[AAAG]12AAAAAA[GAAA]3,2,

与参考序列完全相同则该等位基因命名为该基因座的重复区序列中非重复单位序

,19.2(2/12*/3):AGAAAAAA。,

列亦计入长度多态分型

示例2基因座重复结构为该基因座某等位基因重复区序列

定制服务

    推荐标准