GB/T 44227-2024 术语资源管理 术语数据库交换(TBX)

GB/T 44227-2024 Management of terminology resources—TermBase eXchange(TBX)

国家标准 中文简体 现行 页数:48页 | 格式:PDF

基本信息

标准号
GB/T 44227-2024
标准类型
国家标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2024-07-24
实施日期
2025-02-01
发布单位/组织
国家市场监督管理总局、国家标准化管理委员会
归口单位
全国语言与术语标准化技术委员会(SAC/TC 62)
适用范围
本文件规定了描述术语资源的基本概念、元模型、数据类目、XML样式:DCA(属性式数据类目)和DCT(标签式数据类目),描述了定义TBX专用标记语言的方法。
本文件适用于分析和理解术语数据集或设计符合国际标准、国家标准和最佳实践的新术语数据库。典型用户是程序员、软件开发人员、术语专家、分析师和其他语言专业人士,应用领域包括翻译和编写。
注: TBX专用标记语言由行业利益相关者定义。实施当前共享专用标记语言所需的任何材料都作为独立的行业规范公开提供。

发布历史

研制信息

起草单位:
中国标准化研究院、北京中医药大学东直门医院、山西方是科技股份有限公司、湖北省标准化与质量研究院、厦门坤锦电子科技有限公司、西藏自治区标准化研究所、华南师范大学、中国科学技术信息研究所、北京信息科技大学、聊城大学、广东省职业研究院、北京工业大学、四川语言桥信息技术有限公司、中国中医科学院中医药信息研究所、北京集贤弘文文化传媒有限公司、华北电力大学(保定)、广州智语信息科技有限公司
起草人:
魏洁、商洪才、王海涛、陈炎明、高瑞凤、陈翔、曹馨宇、黄树福、郝天永、赵春艳、刘耀、吕学强、鲁曦、黄琼瑶、贾仰理、陈桂林、徐术坤、袁斌、王建文、刘磊、朱宪超、周洪伟、严可、瞿瑛瑛
出版信息:
页数:48页 | 字数:83 千字 | 开本: 大16开

内容描述

ICS01020

CCSA.22

中华人民共和国国家标准

GB/T44227—2024

术语资源管理术语数据库交换TBX

()

Manaementofterminoloresources—TermBaseeXchaneTBX

ggyg()

ISO300422019MOD

(:,)

2024-07-24发布2025-02-01实施

国家市场监督管理总局发布

国家标准化管理委员会

GB/T44227—2024

目次

前言

…………………………Ⅲ

范围

1………………………1

规范性引用文件

2…………………………1

术语和定义

3………………1

基本原则和概念

4…………………………4

数据类目

5…………………5

通则

5.1…………………5

核心结构模块中指定的数据类目

5.2…………………5

数据类目模块中指定的数据类目

5.3…………………5

和样式

6DCADCT………………………5

专用标记语言

7……………6

通则

7.1…………………6

专用标记语言命名

7.2…………………6

专用标记语言示例

7.3…………………6

符合专用标记语言的要求

7.4TBX……………………8

验证文档实例

7.5TBX…………………8

合规的要求

7.6TBX……………………9

核心结构

8…………………9

概述

8.1…………………9

元模型

8.2………………10

概念条目中元素的位置

8.3……………11

可能出现在多个层的元素

8.3.1……………………11

仅在术语层出现的元素

8.3.2………………………12

元素类型

8.4……………13

起分类或分组作用的元素

8.4.1……………………13

表示数据类目的元素

8.4.2…………13

内联标记元素

8.4.3…………………14

属性

8.5…………………15

类型

8.5.1……………15

8.5.2xml:lang………………………15

8.5.3idtarget……………………15

8.5.4module…………………………16

文本类型

8.6……………16

GB/T44227—2024

字符集和编码

8.7………………………16

定义数据类目模块

9………………………16

概述

9.1…………………16

命名模块

9.2……………17

选择数据类目

9.3………………………17

定义数据类目属性

9.4…………………17

定义数据类目约束

9.5…………………17

使用模块

9.6……………17

引用对象

10………………17

概述

10.1………………17

引用嵌入在附录的文件

10.2…………18

引用附录中的文件

10.3………………18

直接在条目中引用文件

10.4…………19

引用外部源

10.5………………………19

引用和记录书目来源

10.6……………19

引用和记录有关个人或组织的信息

10.7……………20

引用来自实体的原始数据

10.8noteText……………21

附录规范性核心结构元素和属性的描述

A()…………23

概述

A.1………………23

实体

A.2………………23

属性类

A.3……………24

元素

A.4………………25

附录资料性数据类目名称

B()…………35

具有标准化名称的数据类目

B.1………………………35

禁用自定义名称

B.2……………………35

附录资料性核心结构和模块说明的模式

C()TBX(TBXMD)RelaxNG…………36

参考文献

……………………40

GB/T44227—2024

前言

本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定

GB/T1.1—2020《1:》

起草

本文件修改采用术语资源管理术语数据库交换

ISO30042:2019《(TBX)》。

本文件与相比存在技术性差异这些差异涉及的条款已通过在其外侧页边空白位

ISO30042:2019,

置的垂直单线进行了标示主要技术差异及其原因如下

(|),:

更改了关于元模型中概念条目内语言段的对应关系我国国家标准术语编写

———TBX(CE)(LS),

规则与国际标准中关于对应词的要求存在差异见

(8.2);

更改了的说明内容因为中文不存在语法性别见

———<termNote>,“”(8.3.2);

更改了表中的内容应至少包含两个语言段见附录

———A.15<conceptEntry>,(LS)(A)。

本文件做了下列编辑性改动

:

更改了部分数据类目对应的值对应数据类目的值需要根据国家标准的描述修改为对应的汉

———,

语描述见

(7.3);

更改了的文件示例将示例内容改为汉语见

———TBX-Sample,(7.3);

删除了图中的标引符号说明见

———3(8.3.1);

将示例内容改为汉语描述见

———(8.4.3);

更改了示例的内容将示例内容改为汉语描述见

———,(8.5.3);

更改了示例的内容将示例内容改为汉语描述见第章

———,(10)。

请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别专利的责任

。。

本文件由全国语言与术语标准化技术委员会提出并归口

(SAC/TC62)。

本文件起草单位中国标准化研究院北京中医药大学东直门医院山西方是科技股份有限公司

:、、、

湖北省标准化与质量研究院厦门坤锦电子科技有限公司西藏自治区标准化研究所华南师范大学

、、、、

中国科学技术信息研究所北京信息科技大学聊城大学广东省职业研究院北京工业大学四川语言

、、、、、

桥信息技术有限公司中国中医科学院中医药信息研究所北京集贤弘文文化传媒有限公司华北电力

、、、

大学保定广州智语信息科技有限公司

()、。

本文件主要起草人魏洁商洪才王海涛陈炎明高瑞凤陈翔曹馨宇黄树福郝天永赵春艳

:、、、、、、、、、、

刘耀吕学强鲁曦黄琼瑶贾仰理陈桂林徐术坤袁斌王建文刘磊朱宪超周洪伟严可瞿瑛瑛

、、、、、、、、、、、、、。

GB/T44227—2024

术语资源管理术语数据库交换TBX

()

1范围

本文件规定了描述术语资源的基本概念元模型数据类目样式属性式数据类目和

、、、XML:DCA()

标签式数据类目描述了定义专用标记语言的方法

DCT(),TBX。

本文件适用于分析和理解术语数据集或设计符合国际标准国家标准和最佳实践的新术语数据库

、。

典型用户是程序员软件开发人员术语专家分析师和其他语言专业人士应用领域包括翻译和编写

、、、,。

注专用标记语言由行业利益相关者定义实施当前共享专用标记语言所需的任何材料都作为独立的行业规

:TBX。

范公开提供

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款其中注日期的引用文

。,

件仅该日期对应的版本适用于本文件不注日期的引用文件其最新版本包括所有的修改单适用于

,;,()

本文件

日期和时间信息交换表示方法第部分基本规则

ISO8601-11:(Dateandtime—Representa-

tionsforinformationinterchange—Part1:Basicrules)

注日期和时间信息交换表示法第部分基本原则

:GB/T7408.1—20231:(ISO8601-1:2019,IDT)

日期和时间信息交换表示方法第部分扩展规则

ISO8601-22:(Dateandtime—Representa-

tionsforinformationinterchange—Part2:Extensions)

所有部分术语资源管理数据类目

ISO12620()(Managementofterminologyresources—Data

categoryspecifications)

注术语工作计算机应用数据类目

:GB/T16786—2007(ISO12620:1999,NEQ)

计算机应用术语工作术语置标框架

ISO16642(Computerapplicationsinterminology—Ter-

minologicalmarkupframework)

注术语工作计算机应用术语信息置标框架

:GB/T29181—2012(ISO16642:2003,IDT)

本地化交换文件格式

ISO21720XLIFF(XML)[XLIFF(XMLLocalisationinterchangefilefor-

mat)]

信息技术通用多八位编码字符集

ISO/IEC10646(UCS)[Informationtechnology—Universal

CodedCharacterSet(UCS)]

注信息技术通用多八位编码字符集

:GB/T13000—2010(UCS)(ISO/IEC10646:2003,IDT)

3术语和定义

下列术语和定义适用于本文件

和负责维护术语数据库在标准中的使用术语数据库通过以下地址进行访问

ISOIEC,:

在线浏览平台

———ISO:/obp

电子百科全书

———IEC:

31

.

属性类attributeclass

一个或多个相关属性的集合

1

GB/T44227—2024

32

.

子元素childelement

从属于另一个元素的元素

33

.

分类元素classificationelement

用于根据概念条目中的功能对数据类目进行分类的元素

(3.5)。

例表示管理信息的数据类目

:<admin>,<admintype="originatingPerson">。

注数据类目被实例化为与给定的分类元素一起使用的类型属性的值

:。

34

.

补充信息complementaryinformationCI

;

对概念条目中所描述的内容予以补充并在术语数据集中共享的信息

(3.5)(3.29)。

35

.

概念条目conceptentry

术语条目

terminologicalentry

条目

entry

术语数据集的一部分包含与某一概念相关的术语数据

(3.29),。

来源有修改

[:ISO16642:2017,3.22,]

36

.

核心结构corestructure

在所有专用标记语言中使用的通用结构和数据类目

TBX(3.12)(3.8)。

注核心结构符合

:ISO16642(TMF)。

37

.

核心结构模块corestructuremodule

核心模块

coremodule

核心模块

TBX-TBX-Coremodule

仅包含核心结构一部分数据类目的数据类目模块

(3.6)(3.8)(3.9)。

38

.

数据类目datacategory

基于形式或语义角度的数据项类别

示例

:/partofspeech/,/subjectfield/,/definition/。

注1数据类目可以看作是数据库中字段概念的概括

:。

注2在运行文本中例如在本文档中数据类目名称用正斜杠括起来例如

:,,(/partofspeech/)。

39

.

数据类目模块

datacategorymodule

模块

module

设计符合的术语数据集使用的合法数据类目及其约束条件列表

TBX(3.29)(3.8)。

示例模块包括所有专用标记语言共有的数据类目和结构模块增加了简单词汇表所需

:TBX-CoreTBX,TBX-Min

的最少数据类目模块提供了更丰富的数据类目

,TBX-Basic。

310

.

属性式数据类目datacategoryasattributeDCA

;

表示数据的样式其中大多数数据类目表示为相应架构中声明的元素上的类型

TBX,(3.8)XML

属性的值

示例形容词

:<termNotetype="partOfSpeech"></termNote>。

2

GB/T44227—2024

311

.

标签式数据类目datacategoryastagDCT

;

大多数数据类目表示为通用标识符数据的样式

(3.8)XMLTBX。

示例形容词

:<partOfSpeech></partOfSpeech>。

312

.

专用标记语言dialect

标记语言根据的核心结构进行验证并在特定数据类目模块或数据类目模

XML,TBX(3.6),(3.9)

块集指定的级别上准确允许的数据类目并遵守所有其他相关要求

(3.8)。

注所有其他相关要求是指所讨论的专用标记语言所必需但不能在核心结构或数据类目模块中表达的约束例

:“”,

如日期格式或条件的要求这方面的一个例子出现在专用标记语言中它需要或

。TBX-Basic,/definition//

context/。

313

.

显示名称displayname

出现在软件用户界面或其他媒介上的数据类目的名称

(3.8)。

314

.

文档实例documentinstance

包含以专用标记语言表示的概念条目的文件

TBX(3.12)(3.5)。

315

.

交换exchange

;interchange

将数据从一个术语库导出并将导入另一个术语库的活动

(3.28)

定制服务

    推荐标准