GB/T 20090.10-2013 信息技术 先进音视频编码 第10部分:移动语音和音频
GB/T 20090.10-2013 Information technology—Advanced coding of audio and video—Part 10:Mobile speech and audio
基本信息
本部分适用于下述领域:
——移动通讯;
——无线宽带多媒体通讯;
——互联网宽带流媒体业务。
发布历史
-
2013年12月
研制信息
- 起草单位:
- 武汉大学、华为技术有限公司、天津大学、上海交通大学、北京三星通信技术研究有限公司、芯晟(北京)科技有限公司、中国科学院声学研究所、展讯通信(上海)有限公司、中国电子技术标准化研究所
- 起草人:
- 高文、黄铁军、胡瑞敏、马付伟、张涛、高戈、张勇、刘佩林、王晓晨、李迅、詹杰、邓浩江、林福辉
- 出版信息:
- 页数:127页 | 字数:233 千字 | 开本: 大16开
内容描述
ICS35.040
L71
中华人民共和国国家标准
/—
GBT20090.102013
信息技术先进音视频编码
信
:
第部分移动语音和音频
10
国家标准ㅤ可打印ㅤ可复制ㅤ无水印ㅤ高清原版ㅤ去除空白页
——
InformationtechnoloAdvancedcodinofaudioandvideo
gyg
:
Part10Mobileseechandaudio
p
2013-12-31发布2014-07-15实施
中华人民共和国国家质量监督检验检疫总局
发布
中国国家标准化管理委员会
/—
GBT20090.102013
目次
前言…………………………Ⅰ
引言…………………………Ⅱ
1范围………………………1
2规范性引用文件…………………………1
3术语和定义………………1
4符号和缩略语……………3
5概述………………………5
6编码器功能描述…………………………12
7解码器功能描述…………………………82
8位分配描述……………101
……………………
、
9存储传输接口格式107
()………………………
附录A规范性附录VAD检测111
()………………
附录B规范性附录立体声参数码表115
()…………………
附录C规范性附录舒适噪声模式120
国家标准ㅤ可打印ㅤ可复制ㅤ无水印ㅤ高清原版ㅤ去除空白页
/—
GBT20090.102013
前言
/《》:
GBT20090信息技术先进音视频编码分为以下个部分
13
———:;
第部分系统
1
———:;
第部分视频
2
———:;
第部分音频
3
———:;
第部分符合性测试
4
———:;
第部分参考软件
5
———:;
第部分面向数字版权管理的可信解码器与访问协议
6
———:;
第部分面向交互应用的视频编解码
7
———:;
第部分在网络上传输
8IPAVS
———第部分:文件格式;
9AVS
———:;
第部分移动语音和音频
10
———:;
第部分同步文本
11
———:;
第部分综合场景
12
———:。
第部分可重构视频编码工具集
13
本部分为/的第部分。
GBT2009010
本部分按照/—给出的规则起草。
GBT1.12009
国家标准ㅤ可打印ㅤ可复制ㅤ无水印ㅤ高清原版ㅤ去除空白页
Ⅰ
/—
GBT20090.102013
引言
/,
GBT20090的本部分是面向新一代移动通信系统的低码率语音频编解码技术标准是为了适应
、、。
移动通讯无线宽带多媒体通讯互联网宽带流媒体业务等应用中对语音频压缩技术的需要而制定的
本部分描述的音频编解码技术支持采样频率为、、、、、
8kHz16kHz24kHz32kHz48kHz
、、、,
的位采样的单声道立体声脉冲编码调制信号解码输出是同样格
11.025kHz22.05kHz44.1kHz16
,//,
式的单声道或立体声信号单声道模式输出位流为10.4kbits~24kbits立体声模式下输出位流为
//。
12.4kbits~32kbits
,
本文件的发布机构提请注意声明符合本文件可能涉及项与数字音频编解码技术相关专利的使
11
。:,;,
用这项专利是一种实现开环基音搜索的方法和装置选
11ZL200610139703.8ZL200610145785.7
;,;
择自适应码本激励信号的方法和装置ZL200610128778.6语音或音频信号的带宽扩展方法及系统
,();,
ZL200710001186.2语音解码器中实现语音解码的方法及装置基音周期ZL200610162678.5一种解
码方法及装置;ZL200710038078.2,利用缓存来加快量化数据取得的编码和解码方法;
,;,
ZL200810038192.X基于变长分裂表的矢量量化高阶码本扩展编码及解码系统ZL200710064350.4一
;,
种格矢量量化编解码的实现方法及装置ZL200710099046.3一种高效可配置的频域参数立体声及多
;,;,
声道编解码方法与系统ZL200710006619.3一种截取输入信号的方法及装置ZL200810006804.7一
种增益量化方法及装置。
、。
本文件的发布机构对于以上专利的真实性有效性和范围无任何立场
国家标准ㅤ可打印ㅤ可复制ㅤ无水印ㅤ高清原版ㅤ去除空白页
,,
专利持有人已向本部分的发布机构保证愿意同任何申请人在合理和非歧视的条款和条件下就使
。,。
用授权许可证进行谈判这方面该专利持有人的声明已在本部分的发布机构备案
本部分涉及的专利许可遵循本部分起草组织者数字音视频编解码技术标准工作组制订并经会员签
《》,“”,。
署同意的知识产权政策通过AVS专利池进行许可具体许可条款由专利池管理委员会决定标
准实施者可通过专利池管理委员会或其授权机构获得专利池中所有专利的许可权。
。
专利池管理委员会由数字音视频编解码技术标准工作组推动发起有关事宜可联系数字音视频编
,:
解码技术标准工作组秘书处联系方法如下
:
联系人黄铁军
:
通讯地址北京信箱分箱
270431
邮政编码:
100080
电子邮件:
thuan@
jg
电话:,
+861058858303+861058858300-303
传真:
+861058858301
:://()
网址可从本网址获得最新联系方法
httg
p
Ⅱ
/—
GBT20090.102013
信息技术先进音视频编码
:
第部分移动语音和音频
10
1范围
/、。
GBT20090的本部分规定了移动语音和音频信号的编码方法编码表示及解码方法
本部分适用于下述领域:
———移动通讯;
———无线宽带多媒体通讯;
———互联网宽带流媒体业务。
2规范性引用文件
。,
下列文件对于本文件的应用是必不可少的凡是注日期的引用文件仅注日期的版本适用于本文
。,()。
件凡是不注日期的引用文件其最新版本包括所有的修改单适用于本文件
/—:(/:)
信息技术词汇第部分基本术语
GBT5271.120001evISOIEC2382-11993
q
/—:(/:)
信息技术词汇第部分数据的组织
GBT5271.420004evISOIEC2382-41987
q
/—:(/:)
信息技术词汇第部分数据通信
GBT5271.920019evISOIEC2382-91995
q
国家标准ㅤ可打印ㅤ可复制ㅤ无水印ㅤ高清原版ㅤ去除空白页
/—音频记录编解码系统
GBT155261995PCM
3术语和定义
/—、/—、/—和/—界定的以
GBT5271.12000GBT5271.42000GBT5271.92001GBT155261995
及下列术语和定义适用于本文件。
3.1
比特率bitrate
压缩位流传输到解码器输入端的速率。
3.2
位流bitstream
用作数据编码表示的有一定次序的一组位。
3.3
编码coding
读入音频样本并产生编码位流的过程。
3.4
编码器encoder
编码过程的具体实现者。
3.5
比例因子scalefactor
量化前标度一组数值的因子。
1
/—
GBT20090.102013
3.6
解码decoding
读入编码位流并产生音频信号样本的过程。
3.7
解码器decoder
完成解码处理的实体。
3.8
滤波器组filterbank
覆盖全部音频频率范围的一组带通滤波器。
3.9
时频变换time-freuenctransform
qy
音频信号从时间域向频率域的变换。
3.10
频时变换freuenc-timetransform
qy
音频信号从频率域向时间域的变换。
3.11
频谱包络sectralenveloe
pp
变换到频域后的幅度谱轮廓。
3.12
保留reserved
定义了一些特定语法元素值用于将来对本部分的扩展。
国家标准ㅤ可打印ㅤ可复制ㅤ无水印ㅤ高清原版ㅤ去除空白页
:。
注这些值不应出现在符合本部分的位流中
3.13
采样频率samlinfreuenc
pgqy
,。
在音频信号数字化过程中单位时间内采样的次数
3.14
音频缓冲区audiobuffer
解码器中用于存储压缩音频数据的存储单元。
3.15
瞬变信号ientsinal
transg
,,。
在一帧音频信号内由于信号能量等特征变化迅速需要使用短窗序列进行分析的信号
3.16
平稳信号steadsinal
yg
,,。
在一帧音频信号内由于信号能量等特征变化平缓需要使用长窗序列进行分析的信号
3.17
开环基音搜索oen-looitchsearch
ppp
直接从加权输入语音中估计最优基音延迟的过程。
:,。,
注开环基音搜索简化了基音延迟分析并且将闭环基音搜索限定到开环基音搜索的延迟值附近在编码中每两
个子帧搜索一次开环基音。
3.18
闭环基音搜索closed-looitchsearch
pp
,。
在开环基音搜索得到的基音延迟附近闭环估计最优基音延迟的过程
2
/—
GBT20090.102013
3.19
自适应码本adativecodebook
p
包括每个子帧都更新一次的激励矢量。
:。
注自适应码本的序号可用于判断迟延值
3.20
固定码本fixedcodebook
一种固定脉冲幅度为或的码本。
+1-1
3.21
感知加权滤波ercetualweihtinfilter
ppgg
利用共振峰处的噪声掩蔽特性减少主观感受到的噪声。
3.22
声音信号分类检测soundactivitdetection
y
、。
将输入的声音信号分成非有用信号语音和音乐三类
4符号和缩略语
。
本文件中使用的数学运算符和优先级与语言使用的类似但对整型除法和算术移位操作进行
C
。,‘’。
了特定的定义除特别说明外约定编号和计数从开始
0
4.1算术运算符
下列算术运算符适用于本文件。
国家标准ㅤ可打印ㅤ可复制ㅤ无水印ㅤ高清原版ㅤ去除空白页
:。
+加
:()()。
-减二元运算符或取反一元前缀运算符
:。
×乘
b
:,,。
乘幂表示的次乘幂也可表示上标
aab
:。
∧乘幂
:,。
%取模算符仅对正整数定义
/:,。
整除运算沿向的取值方向截断
0
示例:/和/截断至、/和/截断至。
74-7-41-747-4-1
,。
除法运算不做截断或四舍五入
a
:,。
除法运算不做取整或四舍五入
b
:,
x绝对值当x≥0时有
,。
当时有
x=xx<0x=-x
1;
x≥0
():()。
sin取符号sin=
ggx{;
-1x<0
;
xx≤y
(,):(,)。
minx取较小值minx=
yy{;
yx>y
;
xx≥y
(,):(,)。
maxx取较大值maxx=
yy{;
yx<y
:。
平方根
b
():(),()。
自变量取由到含的所有整数值时函数的累加和
∑iiabbfi
f
i=a
3
/—
GBT20090.102013
:。
lo以为底的对数
g10
10
:。
lo以为底的对数
g2
2
():函数。
sinsine
():函数。
coscosine
():函数的反函数。
arccoscosine
():。
exp指数
n
:。
∏a连乘
i
i=1
:。
췍卷积
b
:。
Ca排列组合数
:。
∪并
:。
⊂包含于
:。
∈属于
:。
⊄不包含于
(,):。
randab随机数
4.2逻辑运算符
下列逻辑运算符适用于本文件。
:。
||逻辑或
:。
&&逻辑与
!:。
逻辑非
国家标准ㅤ可打印ㅤ可复制ㅤ无水印ㅤ高清原版ㅤ去除空白页
4.3关系运算符
下列关系运算符适用于本文件。
:。
>大于
:。
>=大于或等于
:。
<小于
:。
<=小于或等于
:。
==等于
!:。
=不等于
4.4位运算符
下列位运算符适用于本文件。
:。
&与
:。
|或
:。
~取反
:。。
将以的补码整数表示的形式向右移位仅当取正数时定义此运算
a≫ba2bb
:。。
将以的补码整数表示的形式向左移位仅当取正数时定义此运算
a≪ba2bb
4.5赋值运算符
下列赋值运算符适用于本文件。
:。
=赋值运算符
,…,:(),、。
取从至含的值其中和是整数
x=abxabbxab
4
/—
GBT20090.102013
:,。,。
++自加x++相当于x=x+1当用于数组下标时在自加运算前先求变量值
:,。,。
--自减x--相当于x=x-1当用于数组下标时在自减运算前先求变量值
+=:自加指定值。
示例:相当于。
1x+=3x=x+3
示例:()相当于()。
2x+=-3x=x+-3
-=:自减指定值。
示例:相当于。
1x-=3x=x-3
示例:()相当于()。
2x-=-3x=x--3
4.6缩略语
下列缩略语适用于本文件。
:()
ACELP代数码书激励线性预测AlebraicCodeExcitedLinearPrediction
g
/:()
ACELPTVC代数码书激励线性预测或变换域矢量编码ACELPorTVC
:()
AVS音视频编解码标准AudioandVideocodinStandard
g
:()
BWE带宽扩展BandWidthExtension
:()
FFT快速傅里叶变换FastFourierTransform
:()
FIR有限冲击响应FiniteImulseResonse
pp
:()
ISF导谱频率ImmittanceSectralFreuencies
pq
:()
IFFT快速傅里叶逆变换InverseFastFourierTransform
:()
ISP导谱对ImmittanceSectralPairs
p
:()
ISPP正负号交错脉冲InterleavedSinle-PulsePrediction
g
:()国家标准ㅤ可打印ㅤ可复制ㅤ无水印ㅤ高清原版ㅤ去除空白页
LP线性预测LinearPrediction
:()
LPC线性预测编码LinearPredictiveCoding
:()
LTP长时预测Lon-TermPrediction
g
:()
MA滑动平均MovinAverae
gg
:()
PCM脉冲编码模式PulseCodeModulation
:()
PSVQ预测分裂矢量量化PredictionSlitVectoruantization
pq
:()
SAD声音信号分类检测SoundActivitDetection
y
:()
SID静音描述帧SilenceInsertionDescritor
p
:()
SNR信噪比SinaltoNoiseRatio
g
:()
TVC变换域矢量编码TransformVectorCoding
:()
VAD语音活动检测VoiceActivitDetection
y
:()
VQ矢量量化VectorQuantization
5概述
5.1输入信号
,
编码器的单声道或立体声输入信号是位采样的数据解码输出是同样格式的单声道或立
16PCM
,。
体声信号支持立体声解码单声道输出
5.2模块构成
,,
本部分定义的编解码器包括一系列必选或可选的模块必选模块在任何实现中都是应有的可选模
。。
块在某些实现中可以省略编解码器中包括的模块及其性质见表1
5
/—
GBT20090.102013
表1移动语音和音频标准模块列表
模块名称性质
采样频率转换滤波必选
ISP系数量化必选
自适应码本搜索必选
感知加权滤波必选
固定码本搜索和编码必选
自适应和固定码本增益量化必选
频谱扩展必选
立体声编码必选
多速率分裂表矢量量化必选
编码模式切换可选
/
峰值预整形逆整形可选
开环基音分析可选
声音分类器可选
解码后处理滤波可选
国家标准ㅤ可打印ㅤ可复制ㅤ无水印ㅤ高清原版ㅤ去除空白页
丢帧处理可选
5.3内部采样频率与比特率
,,内部采样率通过采样率转换滤波得
信号在输入编码器后其采样频率被转换为内部采样频率Fs
,。,
到其范围为12.8kHz~38.4kHz编解码器将每次处理的2048个样点分成两个1024点的超帧分别
,。
对应低频和高频每个超帧分成个样点的帧
4256
。
输入信号的低频和高频用不同的方法进行编解码低频用一个在和之间切换的核
ACELPTVC
,。
心编解码模块进行编码和解码高频则通过BWE模块进行编解码
,。
在单声道情况下包含低频和高频编码信息的编码比特率情况见表2
表2单声道基本比特率单位为位每帧
单声道基本比特率
定制服务
推荐标准
- QB/T 3744-1999 接地带灯技术条件 1999-04-21
- QB/T 1644-1998 定型发胶 1998-11-25
- JB/T 9161.8-1999 内圆磨床接杆 F型 尺寸 1999-05-20
- MT/T 47-1987 煤和岩石单向抗拉强度测定方法 1987-11-18
- HB 6371-1989 Ⅰ型货物系留环和座椅连接接头 1989-07-12
- SJ 50918/4-2002 WJ13型 螺杆驱动非线饶预调电位器详细规范 2002-10-30
- SJ 20239-1993 CO-14型精密十进位电容箱检定规程 1993-02-09
- GA 342-2001 警服材料 帽檐 2001-12-10
- EJ/T 267.1-1984 铀矿石中铀的分析方法总则及一般规定 1985-03-27
- QC/T 45-1992 汽车风窗玻璃气动刮水器型式与尺寸 1992-11-11