GB/T 20090.11-2015 信息技术 先进音视频编码 第11部分:同步文本

GB/T 20090.11-2015 Information technology—Advanced coding of audio and video—Part 11:Synchronous text

国家标准 中文简体 现行 页数:16页 | 格式:PDF

基本信息

标准号
GB/T 20090.11-2015
相关服务
标准类型
国家标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2015-12-10
实施日期
2016-08-01
发布单位/组织
中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会
归口单位
全国信息技术标准化技术委员会(SAC/TC 28)
适用范围
GB/T 20090的本部分规定了在终端设备上与音视频等其他媒体同步呈现的文本(同步文本)的格式。本部分适用于数字电视广播、数字存储媒体、因特网流媒体、多媒体通信等应用。

发布历史

研制信息

起草单位:
北京大学、中国科学院计算技术研究所、北京邮电大学
起草人:
牟伦田、霍龙社、周晓聪、陈熙霖、王雷、黄铁军、高文
出版信息:
页数:16页 | 字数:28 千字 | 开本: 大16开

内容描述

ICS35.040,____■■■—

(3B

中华人民共和国国彖标准

GB/T20090.11—2015

信息技术先进音视频编码

第11部分:同步文本

Informationtechnology—Advancedcodingofaudioandvideo—

Part11:Synchronoustext

2015-12-10发布2016-08-01实施

幅畿勰畫曹1警彎畫发布

GB/T20090.11—2015

目次

前言in

i范围1

2规范性引用文件1

3术语和定义1

4缩略语1

5文本显示属性2

5.1UTF-8支持2

5.2字节、字符2

5.3字符集支持2

5.4字休支持2

5.5颜色支持2

5.6文本显示位置3

5.7字幕滚动3

5.8语言4

5.9书写方向4

5.10文本换行4

5.11高亮、附加说明和卡拉()K4

6同步文本格式4

6.1约定4

6.2同步文本序列5

6.3文本序列头格式6

6.3.1概述6

6.3.2Language兀素6

6.3.3Layer兀素6

6.3.4Timeinfo元素6

6.3.5Position元素6

6.4样本描述集格式6

6.4.1概述6

6.4.2样本描述格式7

6.5文本样本格式9

6.5.1概述9

6.5.2Text元素9

6.5.3Dur元素9

6.5.4SD_id元素9

6.5.5Modifiers元素9

GB/T20090.11—2015

U—1—

刖s

GB/T20090«信息技术先进音视频编码》预计分为以下13个部分:

1部分:系统;

——2部分:视频;

——3部分:音频;

——4部分:符合性测试;

——5部分:参考软件;

——6部分:面向数字版权管理的可信解码器与访问协议;

——7部分:面向交互应用的视频编解码;

——8部分:在IP网络上传输AVS;

——9部分:AVS文件格式;

——10部分:移动语音和音频;

11部分:同步文本;

——12部分:综合场景;

——13部分:可重构视频编码T具集。

可能还会增加其他后续部分。

本部分为GB/T20090的11部分。

本部分按照GB/T1.1—2009给出的规则起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。

本部分由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。

本部分起草单位:北京大学、中国科学院计算技术研究所、北京邮电大学。

本部分主要起草人:牟伦田、霍龙社、周晓聪、陈熙霖、王雷、黄铁军、高文。

m

GB/T20090.11—2015

信息技术先进音视频编码

第11部分:同步文本

1范围

GB/T20090的本部分规定了在终端设备上与音视频等其他媒体同步呈现的文本(同步文本)的

格式。

本部分适用于数字电视广播、数字存储媒休、因特网流媒休、多媒体通信等应用。

2规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文

件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB/T1988—1998信息技术信息交换用七位编码字符集

GB2312—1980信息交换用汉字编码字符集基本集

GB/T4880.3—2009语种名称代码3部分:所有语种的3字母代码

GB13000—2010信息技术通用多八位编码字符集(UCS)

GB/T18793—2002信息技术可扩展置标语言(XMD1.0

RFC36298位通用字符集转换格式(UTF-8,atransformationformatofISO10646)

3术语和定义

下列术语和定义适用于本文件。

3.1

同步文本synchronoustext

具有时间属性、与音频或视频同步呈现的文本。

3.2

同步文本序列synchronoustextsequence

由一系列连续的同步文本样本所组成的序列。

3.3

样本sample

组成同步文本序列的基本单元。

3.4

样本描述sampledescription

定义文本字符串显示特性的模板。

4缩略语

下列缩略语适用于本文件。

XML可扩展置标语言(ExtensibleMarkupLanguage)

1

GB/T20090.11—2015

UCS通用字符集(UniversalCharacterSet)

UTF-88位通用字符集转换格式(8-b让UnicodeTransformationFormat)

5文本显示属性

5.1UTF-8支持

同步文本采用GB/T18793—2002CXML1.0)进行描述,XML文件统一采用RFC3629(UTF-8)编

码。终端应支持UTF-8解码。如果终端收到一个它不能显示的字符,则应显示一个预定的结果(如用

*号代替那些不能显示的字符)。

5.2字节、字符

因为允许多字节字符,所以一个字符串的实际字符数并不等于字节数。

字符串首字符的偏移值为0。当在一个文本字符串中同时指定了起始偏移值和结束偏移值时,结

束偏移值应大于或等于起始偏移值。如果对应于一个样本中的文本字符串有数个偏移说明,那么一个

元素(用于描述同步文本的XML元素)的起始偏移值的位置应大于等于前一个元素结束偏移值的位

置。注意,所有偏移值均以字符而不是字节为单位。

5.3字符集支持

所有终端宜支持完整的GB13000-2010(UCS)字符集的显示,应能够显示以下范围内的UCS

字符:

a)GB2312—1980;

b)GB/T1988—1998.

对于私有字符和未定义绘画行为的控制字符.终端都不需要显示。

5.4字体支持

字体通过其名称、尺寸和风格来进行指定。终端应识别几个名称:Serif.Sans-Serif.Monospace和

宋体。建议将它们作为不同的字体来显示相应的西文字符和中文字符。对于很多字符来说,终端可能

只有一个比较有限的字体集或仅仅只有一种字体。当终端不支持某一选定字体时,需要有一个合适的

字体来替代,从而能够显示那些仅仅只有一种字体的语言或者只有一种字型的符号。

字体通过字体列表中的名称来指定,应为文本字符串指定列表中的某一字体名称。

终端应支持大小为12磅的字体尺寸。如果一个要求的字体尺寸不为终端所支持,则终端所支持的

次小尺寸将会被使用。如果所要求的字体尺寸小于终端所支持的最小尺寸,终端将使用它所支持的最

小尺寸来代替。

终端应支持显示无风格的文本,同时支持加粗、斜体和粗斜体等风格。如果终端不支持某一风格显

示,则应选择一个替代的风格。

在样本描述中应包含一个完整的字体列表,从而使得终端可以预先加载这些字体,或者选择相应的

字体替代策略。

5.5颜色支持

文本和背景的颜色使用RGB值来指定。不要求终端必需显示RGE空间中的所有颜色。只有有限

颜色显示能力甚至只有黑白色显示的终端都是允许的。如果终端能够显示的颜色有限,它需要选择一

种合适的颜色来进行替代。一旦选定了替代颜色,则该替代策略应始终保持一致。当选择颜色替代策

略时,终端应当尽量为文本和背景分别映射不同的颜色以保证文本可见。

2

GB/T20090.11—2015

每个颜色有一个透明度值。透明度值为0表示完仝透明,为255则表示完仝不透明。可以部分支

持透明或完全支持透明。具有一定透明度的可视区域在视觉层次上比那些较暗的区域更接近于观

看者。

5.6文本显示位置

一个同步文本序列对应一个文本显示区域。同步文本显示于文本显示区域中的一个文本框内。不

同样本可使用同一个默认文本框(通过样本描述来指定),也可通过样本修饰器自定义文本框来替代默

认文本框。在用相应的颜色描画出文本之后,文本显示区域和文本框都使用背景色进行填充。如果支

持高亮显示,这些颜色可能发生改变。终端可以选择是否对文本进行平滑处理。

当将文本与视频叠加显示时,使用一个层次(layer)值来表示不同媒体流叠放的次序。层次值越小

则表示越接近于观看者。

文本显示区域的位置和大小由两对参数(tx,ty)和(widlh,height)唯-确定,见图10其中(tx,ty)

表示文本显示区域左上角像素相对于视频显示窗口坐标原点(即视频显示窗口的左上角像素)的偏移量

(规定X轴自左向右增长,Y轴自上向下增长),width表示文本显示区域的宽度,height表示文本显示

区域的高度,单位均为像素。文本框的位置通过它相对于文本显示区域左上角像素的位置来定义。

图1文本显示位置示意图

5.7字幕滚动

支持滚动式文本字幕显示。当显示滚动效果的时候,终端首先计算无滚动效果情况下文字所在的

位置(正常位置),然后再执行以下步骤:

a)对于字幕滚入,初始时文本在文本框之外,是不可见的,然后按照指定的方向逐渐滚动进入文

本框,直到正常位置为止;

b)对于字幕滚出,初始时文本位于文本框内正常位置,然后按照指定的方向逐渐滚动离开,直到

完全位于文本框之外。

需要显示的文本在显示区域内可以被截断。这意味着可以将一个长度超过文本框的字符串滚动进

入/离开显示区域,逐步地显示它们。例如文本开始时位于文本框之外,然后滚动进入到正常位置,最后

再继续以离开初始位置的方向滚出文本框。

如果定义了滚动延时,在延时期间文本会稳定在正常位置不动,即该延时指的是滚入与滚出之间的

3

GB/T20090.11—2015

延时。这表示文本的滚动可以是不连续的。如果没有定义延时,则文本在当前样本期间总是处于运动

状态。对于滚入,文本在样本持续期的末尾到达正常位置;如果有延时,则它会提前到达正常位置,然后

停留在正常位置直到样本持续期的末尾。与滚入相似,对于滚出,延时发生于文本滚动离开之前。如果

同时定义了滚入和滚出,则文本首先从外面滚动进入,然后在正常位置停留一段时间(滚动延时),最后

再滚动离开。

需要预先计算好滚动速度以使整个操作能够在样本持续期内完成,因此滚动时间应等于样本持续

期减去滚动延时。此外滚动速度还取决于实际字符串的长度。

终端可以使用简单的算法来确定实际的滚动速度,例如可以通过在每个更新周期移动文本整数个

像素来确定滚动速度。终端应确保选定的速度能够使滚动操作在样本持续期内完成。

对于滚动文本,不要求终端必需处理高亮、动态高亮或者超链接等文本效果。

5.8语言

在同步文本的序列头信息中声明所使用的语言,其值为GB/T4880.3—2009中规定的3字母语种

代码。语言选项可辅助搜索和语音合成。文本显示与语言无关。注意

定制服务

    关联标准

    相似标准推荐

    更多>