T/CAPT 005-2023 中文新闻语义结构化标注

T/CAPT 005-2023

团体标准 中文(简体) 现行 页数:31页 | 格式:PDF

基本信息

标准号
T/CAPT 005-2023
标准类型
团体标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2023-07-25
实施日期
2023-08-01
发布单位/组织
-
归口单位
中国新闻技术工作者联合会
适用范围
主要技术内容:新闻写作常用表达方式所包含语义的术语和标注方法,包括新闻稿件标注说明、标注预处理、语义模板标注、新闻事件语义元标注、新闻事件关键词标注,以此形成语义标识体系

发布历史

研制信息

起草单位:
文灵科技(北京)有限公司、新华通讯社通信技术局、北京语言大学、东南大学、中国互联网新闻中心、浙江日报报业集团、中国人民大学、中国传媒大学、新华网股份有限公司
起草人:
王楠、饶高琦、杨鹏、王熠、付蓉、王建平、贾成喜、李伟忠、武国卫、宋永生、李冰、孙元康
出版信息:
页数:31页 | 字数:- | 开本: -

内容描述

ICS35.240

CCSL60

CAPT

团体标准

T/CAPT005—2023

中文新闻语义结构化标注

SpecificationforannotationofsemanticstructuringofChinesenews

2023-07-25发布2023-08-01实施

中国新闻技术工作者联合会发布

T/CAPT005—2023

目次

前言.................................................................................II

引言................................................................................III

1范围...............................................................................4

2规范性引用文件.....................................................................4

3术语和定义.........................................................................4

4新闻稿件标注说明...................................................................5

设计标注方法的总体原则.........................................................5

语义结构化标注的流程...........................................................6

5新闻稿件标注预处理.................................................................6

稿件信息采集...................................................................6

设定唯一标识符.................................................................6

6新闻稿件语义模板标注...............................................................7

内容块标注.....................................................................7

语义模板类型...................................................................7

语义模板要素..................................................................11

语义模板标注..................................................................13

7新闻事件语义元标注................................................................14

语义元标注模板................................................................14

事件语义元标注................................................................15

新闻事件内部要素标注..........................................................15

语义元参数标注................................................................16

语义元状态标注................................................................17

8新闻事件关键词标注................................................................17

附录A(资料性)标注方法示例........................................................18

A.1示例一........................................................................18

A.2示例二........................................................................24

附录B(资料性)应用场景举例........................................................27

B.1高阶语义模板的提取............................................................27

B.2稿件内容知识库的生成..........................................................27

B.3跨稿件语义模型的建立..........................................................27

B.4对传统知识图谱的改进..........................................................29

参考文献.............................................................................30

I

T/CAPT005—2023

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由文灵科技(北京)有限公司、新华通讯社通信技术局联合提出。

本文件由中国新闻技术工作者联合会归口。

本文件起草单位:文灵科技(北京)有限公司、新华通讯社通信技术局、北京语言大学、东南大学、

中国互联网新闻中心、浙江日报报业集团、中国人民大学、中国传媒大学、新华网股份有限公司。

本文件主要起草人:王楠、饶高琦、杨鹏、王熠、付蓉、王建平、贾成喜、李伟忠、武国卫、宋永

生、李冰、孙元康。

II

T/CAPT005—2023

引言

为促进人工智能产业的协调发展,新闻领域亟需制定兼具实用性和统一性的语义结构化标准,从源

头规范、指导中文新闻语义结构化,使基于该标准构建的标识体系能够同时支持新闻内容知识库的建设

和计算机神经网络新闻模型的训练,并且实现新闻知识库之间的相互兼容、互换共享,因此制定《中文

新闻语义结构化标注》。

其标注对象主要是中文新闻文本内容和多媒体新闻中的文字内容。作为指导人或计算机生成语义

结构化标识体系的通用化、标准化操作方法,本文件旨在协助标注人员在中文新闻语义结构化标注过程

中实现如下具体目标:

——使用的术语标准化;

——标注的方法规范化;

——产生的标识体系通用化。

III

T/CAPT005—2023

中文新闻语义结构化标注

1范围

本文件规定了新闻写作常用表达方式所包含语义的术语和标注方法,包括新闻稿件标注说明、标注

预处理、语义模板标注、新闻事件语义元标注、新闻事件关键词标注,以此形成语义标识体系。

本文件适用于报刊、广播、电视、通讯社、新闻网站、社交媒体等新闻内容提供商及媒体应用与研

究机构为实现计算机自动识别新闻语义、生成知识库或神经网络训练集进行的标注工作。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T20092.2-2022中文新闻信息内容第2部分:新闻元数据

GB/T20092.3-2022中文新闻信息内容第3部分:数据交换的XML格式

3术语和定义

下列术语和定义适用于本文件。

物entity

具有功能的客观存在,又称“物体”、“实体”。

注:具有行动能力的“物”的功能一般指其行为(action);不具备行动能力的“物”的功能一般指其作用和意义

(effect)。

事matter

具体时空中物的功能体现。

事物thing

由事和物组成的对立统一体或作事和物的统称。

注:在强调不受时空限制的一般规律时,一般用“事物”作为核心语义来标注。

事件event

具体时空中物的功能表现,包括行为、活动和现象。

注:对于新闻稿件,一般用已经发生的新闻“事件”作为核心语义和操作对象。

关键词keyword

能够代表语义的重要词汇。

4

T/CAPT005—2023

语义元semanticelement

利用特征量来定义的,用来表达一个完整语义的,不可拆分的基本单位。

注:对新闻稿件而言,语义元一般由文本字符串组成。

语义元参数parameterofsemanticelement

描述或限定语义元的特征量,包括属性、性质、方面、能力、数量、关系等。

注:“参数”与其他文件中的“元数据”概念类似,都是描述或限定概念的量。但本文件中界定的参数更强调原文

中概念自身拥有且代表语义的量,可用于语义分析;元数据则更强调人类为使用文字内容定义给概念的量,例

如作者、出版日期等,适用于内容管理。

语义元状态stateofsemanticelement

语义元的参数在特定时空中的取值集合。

注:语义元一般用于描述事物发展变化的动态性。

语义模板semantictemplate

表达完整语义的固定结构。

注:在自然语言处理领域,语义模板的结构要素一般由文本字符串组成。

语义结构化SemanticStructuring

标注语义结构的过程,包括识别语义模板并标注其内部要素和要素之间的关系、识别语义元并标注

其参数、提取关键词并标注其语义。

指代消歧coreferenceresolution

正确理解代词所代表的人或事物。

子句clause

完整句子中的一个成分,自有其主语和谓语。

母句mainclause

包含子句的句子。

注:子句与母句共同形成嵌套结构。

4新闻稿件标注说明

设计标注方法的总体原则

本文件的标识体系包含三方面语义:一是新闻内容本身的语义;二是新闻报道的作者通过写作传递

的语义;三是人工标注时标注人员主观意识所产生的语义。本文件设计的基本原则是,最大限度地排除

标注人员主观意识的干扰,提高新闻内容的保真度;保留新闻作者传递的语义,提升新闻稿件语义的丰

富性和完整性。为此,本文件把人工标注限制在通过文本特征或字面意思就可以判断出语义的范围内,

包括指代消歧和缺省补齐。

5

T/CAPT005—2023

标注方法示例详见:附录A。

应用场景举例详见:附录B。

语义结构化标注的流程

语义结构化标注流程如图1所示,依次对下列内容进行标注。

图1语义结构化标注流程

a)新闻稿件标注预处理,包括稿件信息采集和为标识内容设置唯一的标识符。

b)新闻稿件语义模板标注,主要标注新闻内容的语义模板内部结构。一篇新闻稿件的语义模板分

为篇章级、段落级、句子级和句子要素级。本文件的标注方法用于句子级和句子要素级。

c)新闻事件语义元标注,即主要标注其参数。在特定的新闻稿件中,通过语义模板标注,被识别

出的事件语义元及事件要素语义元,有的带参数,有的不带参数。语义元标注主要针对那些带

参数的语义元进行标注,不带参数的语义元可以当作关键词标注。

d)新闻事件关键词标注,即标注关键词本身和其绑定的语义定义。

5新闻稿件标注预处理

稿件信息采集

本文件的顶层标注对象是稿件,并将稿件作为内容管理的基本单元。

稿件元数据应符合GB/T20092.2—2022第6章规定的要求。

稿件的稿件层结构应符合GB/T20092.3—2022第11章规定的要求。

稿件信息采集模板见表1。

表1稿件信息采集模板

字段名数据类型标注内容备注

稿件ID字符串a+稿件序号(数字)来源:GB/T20092.2-2022标识元数据结构

标题字符串原文标题来源:GB/T20092.2-2022标题元数据结构

作者字符串稿件作者来源:GB/T20092.2-20226.3.4创建者

稿件来源字符串稿件发布源来源:GB/T20092.2-20225.2.7发送方

发稿时间时间发布时间来源:GB/T20092.2-20225.2.5发送时间

设定唯一标识符

为准确定位新闻稿件的内容,应对稿件、段落和句子设立唯一标识符(ID),标注模板见表2。

表2唯一标识符模板

字段名数据类型标注内容备注

稿件ID字符串a+稿件序号(数字)例如:a1表示第一篇

段ID字符串p+段序号(数字)例如:p2表示第二段

句ID字符串s+句子序号(数字)例如:s3表示第三句

内容字符串原句内容上述例子完整的句子ID为:a1p2s3

从稿件角度看,一个句子ID由稿件ID、段落ID和句子ID组成,表2具体标注步骤如下:

a)以稿件的标题为对象设立稿件ID,可附带内容管理信息(见表1);

b)以稿件中的自然段为对象设立段落ID(稿件标题不计为一段);

6

T/CAPT005—2023

c)在段落中,以句号或与句号等同效力的标点符号(如问号、叹号)为分隔符划分语句,并为每

一句设立句子ID。

6新闻稿件语义模板标注

内容块标注

当一个语义模板要素的范围超出了待标句子的边界,则需要用到内容块标注方法。

内容块由“起始值位置~终止值位置”表示。

起始值位置由“内容块第一个字所在句子ID+‘w’+起始字坐标数”表示,终止值位置由“内容块

最后一个字所在句子ID+‘w’+结束字坐标数”表示(见示例)。

字坐标的定义域是句号类标点符号结尾的句子长度,即句子第一个字坐标值为1,最后一个字符的

坐标值为定义域的最大值。计算坐标值时,标点符号算字符,空格不算字符。

示例:待标句(即第一句)ID是a2p1s1,内容块的起始字是该句中的第七个字符,结束字在第六句中的第48个字

符,则内容块是,a2p1s1w7~a2p1s6w48。

语义模板类型

6.2.1概述

语义模板类型主要分为两大类,一类是与事件相关的语义模板,另一类是句子用途为一种表达方式

的语义模板。很多情况下,一句话既与事件相关,也具有明显的表达方式。在标注时应以围绕事件语义

模板为主,兼顾表达方式。语义模板包括但不限于图2所示类型。

图2语义模板类型

6.2.2定义

“定义”句的语义模板即定义事物或事件,依据定义方式的不同,又可以分为不同的类型,包括但

不限于:

a)参考定义,即将被定义对象定义为另一个(类)参考对象(见示例1);

b)组成定义,通过列举事物的组成要素来定义事物(见示例2);

c)特征定义,通过描述事物的参数来定义事物(见示例3);

d)过程定义,通过描述事物过程的步骤来定义事物(见示例4);

7

T/CAPT005—2023

e)关系定义,通过描述事物与其他事物之间关系来定义事物(见示例5);

f)引用定义,通过引用另一段文字内容来定义当前事物(见示例6);

g)解释定义,将一个特定概念解释为一组事件的定义方法(见示例7)。

示例1:小张是中学老师。

示例2:油电混合车的动力系统主要由控制系统、驱动系统、辅助动力系统和电池组等部分构成。

示例3:小明身材高大、魁梧,而且精力充沛。

示例4:油电混合汽车起步或者缓速行驶时,车内的电动马达会辅助发动机来提供动力,当汽车速度达到一定程度

时,车内的电动马达就会进入充电状态,不再供能。

示例5:他是小明的父亲。

示例6:具体实例参见附录A。

示例7:抑郁症一般由如下症状确认:情绪低落、意志消沉、思维迟钝等。

6.2.3描述

“描述”语义模板即陈述事件内部组成要素、要素作用及其相互关系的语义模板。陈述事件同时也

是语言最主要的表达方式,称为“陈述句”。描述语义模板包括主体、客体、相关体、行为、目标、指

向、方式、工具、条件、原因、结果、时间、空间、背景等要素。

a)主体——事物或事件行为的发出者。

b)客体——事物或事件行为的接受者。

c)相关体——事物或事件中其它参与实体。

d)行为——事件主体发出的行为。

e)目标——主体发出行为的愿望。

f)指向——行为的对象。

g)方式——行为的方法、依据。

h)工具——行为所用工具、资源。

i)原因、条件——决定本事件的前置事件的状态。

j)结果——本事件导致的后续事件的状态。

k)时间、空间——事件环境的基本要素。

l)背景——与本事件相关,但不是决定关系的并发事件的状态。

事物模型由一组语义模板构成。在一些典型的事物模型中,上述描述语义模板的要素被称为“角色”,

有固定作用和固定名称。例如,采访模型中的角色是记者和受访者,记者为普适通用事物模型中的主体,

受访者为客体,模型的行为是采访。与之类似的还有直播模型中的主播、编导、摄影师等。

依据描述方法,描述语义模板又分为不同的类型,包括但不限于:

a)存现,即表示事物存在、发生、发展,以及归属关系的事件(见示例1);

b)行为事件,即事物以行为的方式发挥作用的事件,语义模板包含描述语义模板的全部要素;

c)使让,即主体让客体去做事情的表达方式,包括主体、主体行为、主体客体、客体行为、客体

客体、相关体等要素。其中,主体行为是主体发出的使让类行为,主体客体是主体行为的对象,

客体行为是客体发出的行为,客体客体是客体行为的对象。使让句的其他要素与行为事件相同

(见示例2)。

示例1:太阳出来了。其中,主体是“太阳”,主体行为是“出来了”。

示例2:我们请了个专家来培训新员工。其中,主体是“我们”,主体行为是“请了”,主体客体是“一个专家”,

客体行为是“来培训”,客体客体是“新员工”。

6.2.4响应

“响应”指用语句表达针对特定环境的反应。其中:

a)可能性,即针对特定环境客观上存在着发生某事件的概率,包括环境、可能性、事件三个要素。

其中,事件的语义模板与行为事件的相同,可能性表示为“可能”“会”“有望”和“不确定”

等(见示例1);

b)必要性,即针对特定环境做某事的意义,包括环境、必要性、事件三个要素,其中,必要性表

示为“可以”“应该”“需要”“必须”和“不确定”等(见示例2);

8

T/CAPT005—2023

c)应对,即针对某种事态而要做的事,包括但不限于:

1)措施,针对特定状态需要采取的策略,包括事态、执行者、措施、倾向四个要素(见示例

3);

2)方案,即为达特定目标计划要做的事,包括目标、制定者、计划、倾向四个要素(见示例

4);

3)政策,即依据上级政策做事,包括发出者、执行者、政策、倾向四个要素(见示例5)。

示例1:部队有望三点钟拿下敌人阵地。其中,可能性是“有望”,事件是“部队三点钟拿下敌人阵地”。

示例2:我们必须赶在敌人增援到达之前拿下敌人阵地。其中,环境是“赶在敌人增援到达之前”,必要性是“必须”,

事件是“我们拿下敌人阵地”。

示例3:长江水位已超过警戒线,防洪指挥部打开了两处泄洪闸。其中,事态是“长江水位已超过警戒线”,执行者

是“防洪指挥部”,措施是“打开了两处泄洪闸”,倾向是“负”。

示例4:为防止溃堤,防洪指挥部准备开闸泄洪。其中,目标是“为防止溃堤”,制定者是“防洪指挥部”,方案是

“开闸泄洪”,倾向是“负”。

示例5:2021年1月1日生效的国家新档案法规定,县级以上各级档案馆的档案,应当自形成之日起满二十五年向

社会开放。其中,发出者是“国家”,执行者是“县级以上各级档案馆”,政策是“档案应当自形成之日起满二十五年

向社会开放”,倾向为“正”。

6.2.5愿望

“愿望”即其拥有者主观上想做的或期待发生的事,包括希望和承诺。

a)希望,即某人期待发生的事,分为拥有者、程度、希望、倾向四个要素,希望的程度表示为“希

望”“愿意”“想”“决心”等(见示例1)。

b)承诺,即向他人保证的事,包括承诺者、程度、保证、倾向四个要素,承诺的程度表示为“承

诺”“保证”“发誓”等(见示例2)。

示例1:我决心明年考大学。其中,拥有者是“我”,程度是“决心”,希望是“明年考大学”,倾向为“正”。

示例2:我发誓一定要攻克这个技术难题。其中,承诺者是“我”,程度是“发誓一定要”,保证是“攻克这个技术

难题”,倾向是“正”。

6.2.6评价

“评价”指用语句表达态度的语义模板,包括但不限于作用描述、比较、性质、感叹和立场等。

a)作用描述即意义描述,又分为意义和事件意义:

1)意义,即用意义词直接表述意义,包括对象、意义、倾向等要素。“意义”一般会用到定

义或存现等语义模板,只是其中的参考对象或特征量为意义词(见示例1);

2)事件意义,即选取参考事件衬托意义,包括对象、参考、倾向等要素(见示例2)。

b)比较,选取参照物比较出意义,包括对象、参考、比较项和比较值等要素。“比较项”表示比

较行为的维度,例如优于、不及、碾压等,“比较值”表示在该维度上的差异大小(见示例3)。

c)性质,包括判断者、对象、性质名、性质值和倾向五个要素。“判断者”一般为作者,如果本

句是引用第三方的观点或态度,则判断者是观点或态度的拥有者。“对象”指性质的宿主。性

质判断也经常使用定义或行为事件语义模板来表达(见示例4)。

d)感叹,也是一种表达方式语义模板,即用强烈的感情或态度表达性质判断,包括感叹者,对象、

性质名,性质值和倾向五个要素(见示例5、示例6)。

e)立场,即表明支持或反对某事的态度包括拥有者、对象、立场、倾向等要素,即“拥有者”在

特定的“时空”,以特定的“方式”,针对“对象”表达“立场”。

示例1:“三审三校制度有确保稿件坚持正确出版方向的作用。”其中,对象是“三审三校制度”,意义词是“作用”,

语义模板是存现。

示例2:“虚拟现实技术为新闻播报融媒体化提供了强大手段。”其中,对象是“虚拟现实技术”,参考事件即“新

闻播报融媒体化”。

示例3:“我国首个兆瓦级铁-铬液流电池储能示范项目刷新了该技术全球最大容量纪录。”其中,对象是“我国首

个兆瓦级铁-铬液流电池储能示范项目”,参照物是“全球该技术”,比较项是“容量”,比较值是“刷新最大记录”。

示例4:“齐广璞知道自己已做得足够出色。”其中,判断者是“齐广璞”,对象是“自己”,性质名是“动作质量”,

性质值是“足够出色”。

9

T/CAPT005—2023

示例5:“秋天的香山公园多么美丽呀!”其中,感叹者是“作者”,对象是“秋天的香山公园”,性质名是“颜值”,

性质值是“美丽”,倾向是“正”。

示例6:“激动人心哪!”其中,感叹者是“作者”,对象是“人心”,性质名是“兴奋度”,性质值是“激动”,

倾向是“正”。

注:“性质值”所在维度名就是“性质名”。性质的所有维度需要各使用单位或个人在线下自行定义和维护。

6.2.7关系

“关系”语义模板是描述两个对象之间关系的方法。除专门表述关系的句子外,一个句子无论采用

何种语义模板,只要其包含的线索足以识别两个对象之间的关系,则该句子同时具有“关系语义模板”。

关系语义模板包括对象、目标和类型三个基本要素。对象即关系起始的对象,目标即关系到达的对象,

依据关系类型不同,关系语义模板要素名称不同。关系类型包括但不限于:

a)相互作用关系,其中又包括决定关系、顺承关系、影响关系等;

1)决定,即一些事物或事件决定了另一些事物或事件的发生,又分为:

(1)因果,主事件已发生的情况下,决定其发生的前置事物或事件称为“原因”;

(2)条件,主事件尚未发生的情况下,决定其发生的前置事物或事件称为“条件”;

2)顺承,即在时序上一个事件结束后紧接着无条件发生另一个事件;

3)影响,即两个事物不直接相互作用,却通过相互影响间接决定某类事件发生的概率,如联

盟关系、敌对关系等。

b)逻辑关系,其中又包括种属关系、包含关系和嵌套关系等;

1)种属,即按相同分类特征定义下的某一事物类与其子类的关系;

2)包含,即形式逻辑定义下的局部与整体关系,“局部”包含在“整体”之内;

3)嵌套,即一个过程的某个步骤是另一个过程。

c)相关关系,除相互作用关系和逻辑关系之外的其他关系,可以按需自定义,包括但不限于:

1)组成关系,即对象之间具有“局部”功能组成“整体”功能的关系(见示例1);

2)归属关系,即下级服从上级的管理关系(见示例2);

3)链条关系,又称“上下游关系”,如产业链、供应链等,即由特定行为模式串接的结构关

系(见示例3);

4)亲属关系,又称“血缘关系”,即由生育行为决定的结构关系(见示例4);

5)共现关系,即两个没有决定关系的事物共同存在于一个范畴中(见示例5)。

示例1:汽车发动机。

示例2:他是我直接领导。

示例3:稀土元素可以形成高性能永磁体,用于电机、马达、发电机、移动电源、医疗器械等领域。

示例4:晓梅是他的母亲。

示例5:他没有办离婚手续,却与另外一名女子以夫妻相称。

6.2.8状态

“状态”语义模板表述事物状态,包括事物的所有变化,包括但不限于:

a)直接状态,表示事物在特定时空的状态取值,任何描述事物参数取值的语义模板都属于状态取

值;

b)能力,表示实体可否做事的状态,可以用以往做过的事来证明,亦可以直接表达会做的事,说

明技术等级等;

c)数量,表示事物在特定时空的数量或数量变化都属于数量状态;

d)变化描述,所有表示事物变化的语义模板都属于此类,既包括使用专门变化行为词的句子,也

包括使用特殊连词表示变化的句子,如:

1)单调,即向一个方向的变化;

2)递进,即向一个方向的,程度递加的变化;

3)转折,即变化前与变化后变化方向和取值相反的变化。

很多语义模板都可以用来表达状态,例如,定义语义模板(见示例1)、行为事件语义模板(见示

例2)、直接使用行为词做状态(见示例3)、使用变化行为词(见示例4)、比较语义模板(见示例5)、

10

T/CAPT005—2023

直接使用状态词(见示例6),以及使用行为程度词(见示例7)等。无论使用什么语义模板表示状态,

都需要提取对象、科目和状态值三个基本要素,同时在状态语义模板中,还会按需包括若干其他语义模

板的要素,例如时空要素等。

示例1:这是中国队本届冬奥会的第七枚金牌。

示例2:美国经济或仅增长0.2%。

示例3:服务业核心通胀率依然高企。

示例4:她变漂亮了。

示例5:这个项目刷新了该技术全球最大容量纪录。

示例6:他非常兴奋。

示例7:他三番五次出尔反尔。

6.2.9引导

“引导”是一种纯粹的表达方式语义模板,由引导者、引导类型和引导内容三个要素组成。引导句

的类型很多,包括但不限于:

a)言语类,即引导者是人或新闻机构,引导内容是报道、讲话、转述、讲述、阐述、命令、要求、

说明等。这类引导句的类型直接填写引导词(见附录A.1.4);

b)显示类,即引导者是事物状态,引导内容是另一组事物状态,类型是“显示”;

c)看法类,即引导者是作者,引导内容是基于特定角度的一系列看法,类型是“特定角度的看法”;

当引导内容文字范围大于一个连续字符串的句子时,应采用内容块的标注方法进行标注(见6.1)。

6.2.10疑问

“疑问”也是一种纯粹的表达方式语义模板,由问体和问题两个要素组成。“问体”指疑问聚焦的

对象,“问题”指所问内容(见示例1、示例2)。

问体宜采取上述任意语义模板来表示。问题的类型包括但不限于原因、方法、定义、人物、能力、

真伪、数量、时间、空间、状态等。

示例1:“自动聊天机器人能通过图灵测试吗?”问体:自动聊天机器人通过图灵测试,问题:能力。

示例2:“如何促进新媒体健康有序发展?”问体:促进新媒体健康有序发展,问题:方法。

6.2.11否定

“否定”也是一种纯粹的表达方式,代表对象语义的反义。但是,“否定”没有自身的语义模板。

本文件通过在需要否定的对象语义要素前添加否定符“!”的形式来表示对该对象语义的否定(见示例

1)。如果是对整个语义模板的否定,则否定符“!”加在该语义模板的主行为词上(见示例2)。实际

上,响应语义模板中的可能性、必要性、倾向,愿望语义模板中的程度,评价语义模板中的倾向、比较

值、性质值或立场,以及关系语义模板中的程度都可以表达否定(见示例3),与否定符“!”配合,

可以表达否定之否定的情况(见示例4)。

示例1:他并没有这样做。其中,主体:“他”,方式:!“这样”,行为:“做”。

示例2:赚钱不是办企业的唯一目标。其中,对象:“赚钱”,参考:“办企业的唯一目标”,定义词:!“是”。

示例3:这么短的时间,他绝无可能赶到会场。其中,环境:“这么短的时间”,可能性:“绝无可能”,事件:

“他赶到会场”。

示例4:在操作水平上,小王不比小李差多少。其中,对象:“小王”,参考:“小李”,比较项:“操作水平”,

比较值:!“差多少”。

语义模板要素

语义模板结构化就是将语义模板中的要素标注出来。除缺省外,应标尽标。

6.2.1图2中末端节点语义模板的要素如表3所示。

11

T/CAPT005—2023

表3语义模板要素

名称要素

参考定义对象,参考,定义词,时间,空间

组成定义对象,组成,定义词,时间,空间

特征定义对象,特征,定义词,时间,空间

过程定义对象,步骤,定义词,时间,空间

关系定义对象,目标,定义词,关系,时间,空间

引用定义对象,内容,定义词

解释定义对象,解释,定义词

存现对象,行为,相关体,时间,空间

主体,方式,工具,指向,目标,行为,客体,相关体,时间,空间,条件,结果,背

事行为事件

件景

使让主体,主体行为,主体客体,客体行为,客体客体,相关体,时间,空间

可能性环境,可能性,事件

必要性环境,必要性,事件

响措施事态,执行者,措施,倾向

与方案目标,制定者,计划,倾向

件政策发出者,执行者,政策,倾向

关愿希望拥有者,程度,希望,倾向

望承诺承诺者,程度,保证,倾向

意义对象,意义,倾向,时间,条件

事件意义对象,参考,倾向,时间,条件

比较对象,参考,比较项,比较值,时间,条件

价性质判断者,对象,性质名,性质值,倾向

感叹感叹者,对象,性质名,性质值,倾向

立场拥有者,对象,立场,倾向,时间,空间,方式

因果原因,结果,程度

定制服务

    推荐标准

    相似标准推荐

    更多>