GB/T 22726-2008 多声道数字音频编解码技术规范

GB/T 22726-2008 Specification for multichannel digital audio coding technology

国家标准 中文简体 现行 页数:106页 | 格式:PDF

基本信息

标准号
GB/T 22726-2008
相关服务
标准类型
国家标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2008-12-22
实施日期
2009-06-01
发布单位/组织
中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会
归口单位
全国音频、视频及多媒体系统与设备标准化技术委员会
适用范围
本标准规定了多声道数字音频压缩编解码技术方案,包括:码流格式(句法结构与语义)、解码过程以及各个解码技术模块的技术要求,并对采用该技术的编码部分提供了资料性的建议和实现方法。
本标准适用于在有限容量的存储介质或有限带宽的信道上保存或传送高质量的多声道数字音频,如数字音频广播、数字电视(包括卫星、地面和有线等不同传输方式)、家庭音响、数字电影院、激光视盘机、网络流媒体、个人多媒体播放器。

发布历史

研制信息

起草单位:
广州广晟数码技术有限公司、数维科技(北京)有限公司、中国电子技术标准化研究所、中国华录集团公司
起草人:
游余立、张新刚、徐茂、伦继好、张尉雄、闫建新、姜甜、张景平、郑楚升、张培、张树华、张素兵、韩建国、杨震、范科峰
出版信息:
页数:106页 | 字数:201 千字 | 开本: 大16开

内容描述

ICS35.040

L71

固园

中华人民共和国国家标准

GB/T

多声道数字音频编解码技术规范

formuitichannelaudio

Specificationdigitalcodingtechnology

2009-06-0

2008-12-22发布1实施

丰瞀粥零瓣譬矬瞥星发布中国国家标准化管理委员会仅1。

22726--2008

GB/T

目次

前言………·

引言………

1范围……………-·………-

2规范性引用文件…………

3术语和定义、缩略语………

3.1术语和定义…………-·

3.2缩略语…

4概述……

4.1编码……

4.2解码……

5句法结构…ⅦⅧo。1。∞“叫L?o

5.1函数……--·………·…··

5.2码流……

5.3帧……·L?_o

5.4帧头……

5.5窗口序列………………

5.6码书选择及应用范围…·o∞m

5.7子带样本的量化因子…·n

5.8量化步长索引…………M

5.9和差编码决定…………·

5.10联合强度编码比例因子

5.11比特填充…………·

5.12辅助数据………·……

……

6语义………………

6.1码流……-

6.2帧…………-·…………·

6.3帧头……·

6.4窗口序列………………·

6.5码书选择与应用范围…·

6.6子带样本的量化因子-…

6.7量化步长索引…………

6.8和差编码决定………-…

6.9联合强度编码比例因子·-

6.10比特填充……………··

6.11辅助数据……………·

7解码………·一

7.1声道排放与设置………-

7.2解交叉重组………·……·

GB/T22726--2008

7.3重建量化单元的个数…………………

7.4逆量化…………………

7.5联合强度解码…………

7.6和/差解码……………

7.7可变分辨率的合成滤波器组·………··

7.8重建短/暂窗口函数序列……………

8在MPEGTS中复用音频流…………

附录A(资料性附录)相关编码技术……

A.1瞬态分析……………

A.2人耳听觉模型……···

A.3全局比特分配………

A.4Huffman码的码书的选择………·………………··

A.5和/差编码……····…··

A.6联合强度编码·……·-

附录B(规范性附录)解码用的附表……

B.]量化步长表…………

B.2临界频带表…………·…·…………·

B.3解码瞬态段的长度用的Huffman码表……………

B.4解码码书选择与应用范围用的Huffman码表……

B.5解码量化步长索引用的Huffman码表……………

B.6解码量化因子商数宽度用的Huffman码表………

B.7解码稳态量化因子用的Huffman码表…··………

B.8解码瞬态量化因子用的Huffman码表……………

附录C(规范性附录)在MPEGTS中复用音频流……

C.1Stream一1D·····-········-·····-·····················-···--·

C.2Strearfl一Type·--·····‘·’’。。‘’-······-·-·········‘…’‘’‘‘‘

C.3DRA注册描述符(DRAregistrationdescriptor)…

stream

C.4audio

DRA音频流描述符(DRAdescriptor)

C.5STD音频缓冲区大小………………

C.6字节对齐…………

附录D(资料性附录)下混合……………

D.1下混合公式和系数………………

D.].1I/O模式……………

D.1.22/OI。o/Ro模式…………………

D.1.32/0I.t/Rt模式……………·……··

D.1.43/2/J

5.1环绕声下混合模式……

参考文献……………………拍盯盯船∞娼弘盯盯盯盯即∞∞姐蛆们驰矾船盯即%弘姒呲舛虬%%卯盯卯盯盯盯%

图1编码原理框图………………-·-0

图2解码原理框图………-…………

图3可变分辨率的合成滤波器组的窗口函数………………一

图4窗口函数转换的一些例子………………一

图A.1本标准的Huffman码的码书选择方法与其他技术的区别0驼娼弘

22726--2008

GB/T

图A.2剔除一些孤立的小码书段曲

表1编码………··o

表2解码………··0

表3特殊函数定义

表4帧结构……

表5正常声道的数据结构0¨M

表6低频增强声道的数据结构……··M

表7帧头类型………··

表8两种帧头的区别………………-·

表9解码音频数据帧长用的比特数··

表10本标准支持的采样频率……····-

表11解码正常声道数用的比特数…··

表12解码低频增强声道数用的比特数

表13声道设置的附加信息决定……··

表14和差编码决定…··

表15联合强度编码决定……………··

表16窗口函数索引………………·…·

7

表1瞬态段的个数…··

表18平稳帧的瞬态段的隐含长度…………

表19第一个瞬态段的起始位置与第一个瞬态发生的位置

表20解码码书应用范围用的Huffman码书选择………

表21解码码书索引用的Huffman码书选择-…-…·……

表22解码量化因子用的Huffman码书选择……………

表23解码打包商数所需的比特数用的Huffman码书选择

表24解码量化因子用到的变量…·………··

表25解码量化步长索引用的Huffraan码书选择………

表26解码和差编码决定用到的变量……………--……·

表27完全不用和差编码的决定……………

表28和差编码决定………···

表29缺省正常声道设置……

表30常见声道设置的表示方法……………

袁3l各个声道的音频数据在音频帧中的排放顺序………

表325.1环绕的音频数据在音频帧中的排放顺序………

表33按自然顺序排列的子带样本…………

表34按交叉重组顺序排列的子带样本……

表35解交叉重组用到的变量………………

表36重建量化单元的个数用到的变量……

表37逆量化用到的变量…·……………·……-……………

表38联合强度解码用到的变量…………

表39和/差解码用到的变量………-……··

表40在瞬态发生的位置及其前后可选择的窗口函数……

表41重建短MDCT窗口函数序列用的变量……………

M"”"M他M堪均珀珀加∞加趴孙扒匏毖毖匏船舱必驰孔孙筋孙胛盯船四站弘。

GB/T22726--2008

表B.1量化步长表……·……………·

000

表B.2临界频带:8Hz,长窗口··

000

表&3临界频带:8Hz,短窗口··

025

表B.4临界频带:11Hz,长窗口··

025

表B.5临界频带:11Hz,短窗口一

000

表B.6临界频带:12Hz,长窗口··

000

表B.7临界频带:12Hz,短窗口··

000

表B.8I临界频带:16Hz,长窗口·-

000

表B.9临界频带:16Hz,短窗口··

050

表B.10f艋界频带:22Hz,长窗口

050

表B.11临界频带:22Hz,短窗口

000

表B.12临界频带:24Hz,长窗口

000

表B.13临界频带:24Hz,短窗口

000

表B.14临界频带:32Hz,长窗口

000

表B.15临界频带:32Hz,短窗口

100

表B.16临界频带:44Hz,长窗口

100

表B.17临界频带:44Hz,短窗口

表B.18000

临界频带:48Hz,长窗口

000

表B.19临界频带:48Hz,短窗口

200

表R20临界频带;88Hz,长窗口

表B.21200

l临界频带:88Hz,短窗口

000

表B.22临界频带:96Hz,长窗口

表B.23000

临界频带:96Hz,短窗口

表B.24400

I临界频带:176Hz,长窗口

400

表B.25临界频带:176Hz,短窗口

表B.26000

临界频带:192Hz,长窗口

表B.27000蛆鸲蝎蛆姐““蛎帖蛎蚰蚰蚰们们盯蛆档鸲曲∞曲∞的印印n

临界频带:192Hz,短窗口

表B.28HuffDecl—7x1……………··n

表B.29HuffDec2—64xl·················

表B.30HuffDec3—32xl·················

表B.31HuffDec4—18xl·····-···-·······

18X】···…………..

表B.32HUffDec5

表B.33HuffDec6—116xl

表B.3416xl

HuffDec7—1

表B.35HuffDec8—16xl·

表B.36HuffDec9—16xl·

表B.37x4

HuffDecl0—81

表B.38HuffDecll—25x2

表B.39HuffDecl281x2

表B.40HuffDecl3—289x2

表B.41HuffDecl4—31xl

表B.42HuffDeel5—63xl

表B.43HuffDeel6127x1n弛船黔黔弱””卵的∞∞“∞明

GB/T22726—2008

44

表BHuffDecl

7—255xl…···……………68

表B.45HuffDeel8—256xl…71

表B.46HuffDeel9—81x4···············75

表B.47HuffDec20—25x2···················-·76

表B.48HuffDec21—81x2………………···77

表B.49HuffDec22—289x2·t··················78

表B.50xl

HuffDec23—31………………···82

表B.51HuffDec24—63xl··………………83

表B.52HuffDec25—127xl····················84

表B.53HuffDec26—255x1··………………86

表B.54HuffDec27—256xl··………………89

表C.1DRA注册描述符·······…·······…··94

表C.2DRA音频流描述符····················95

V

22726—2008

GB/T

刖舌

本标准媳附录A、附录D为资料性附录,附录B、附录c为规范性附录。

本标准由工业和信息化部提出。

本标准由全国音频、视频及多媒体系统与设备标准化技术委员会归口。

本标准起草单位:广州广晟数码技术有限公司、数维科技(北京)有限公司、中国电子技术标准化研

究所、中国华录集团公司。

本标准主要起草人:游余立、张新刚、徐茂、伦继好、张尉雄、闫建新、姜甜、张景平、郑楚升、张培、

张树华、张素兵、韩建国、杨震、范科峰。

22726--2008

GB/T

引言

为了适应我国日益发展的数字音视频产业的需求,满足不同应用领域对高品质的多声道数字音频

信号的编码需要,特制定本标准。本标准是在自主研究开发的音频编解码算法的基础上,经过算法的优

化、软件及硬件的实现、测试验证等过程编制而成。

本标准规定的多声道数字音频编解码技术可在有限容量的存储介质或有限带宽的信道上保存或传

送高质量的多声道数字音频信号。

本标准规定的数字音频编解码技术方案的信号通道能保持24bit以上的精度(除了因量化而有意

舍弃的精度外)。可支持的声道设置除了常见的立体声、5.1环绕声、6.1环绕声和7.1环绕声之外,还

为未来的音频技术发展预留了空间(最多可支持64.3环绕声)。本标准可支持从8kHz到192kHz间

kHz、48kHz及96

的标准采样频率,例如44.1kHz。本标准对编码比特率(码率)没有明确限制,在具

体应用时可根据信道带宽和音质要求等因素来设定。

本标准的发布机构提请注意如下事实,声明符合本标准时,可能使用以下涉及的相关专利:

029722);

音频编码系统(中国专利申请号200710141663.5,美国专利申请号USll/669346);

558917);

音频解码(中国专利申请号200710141661.6,美国专利申请号USll/689371)。

本标准的发布机构对于专利的范围、有效性和验证资料不提出任何看法。

专利持有人已向本标准的发布机构保证,他们愿意同任何申请人在合理和非歧视的条款和条件下,

就使用授权许可证进行谈判。在这方面,该专利持有人的声明已向本标准的发布机构提交。有关资料

可从以下地址获得:

专利申请人或受让人:广州广晟数码技术有限公司;

联系人:王先文;

地址:广州市天河区能源路华南理工大学北区科技园2号楼6楼;

邮政编码:510640;

电话:020—22237078;

传真:020—22237189。

请注意除上述已经识别出的专利外,本标准的某些内容有可能涉及专利。本标准的发布机构不承

担识别这些专利的责任。

22726--2008

GB/T

多声道数字音频编解码技术规范

1范围

本标准规定了多声道数字音频压缩编解码技术方案,包括:码流格式(句法结构与语义)、解码过程

以及各个解码技术模块的技术要求,并对采用该技术的编码部分提供了资料性的建议和实现方法。

本标准适用于在有限容量的存储介质或有限带宽的信道上保存或传送高质量的多声道数字音频,

如数字音频广播、数字电视(包括卫星、地面和有线等不同传输方式)、家庭音响、数字电影院、激光视盘

机、网络流媒体、个人多媒体播放器。

2规范性引用文件

下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有

的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究

是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。

GB/TISO/

13818

IEC1:1996)

ISO639—2:1998)

GB/T4880.2—2000语种名称代码第2部分:3字母代码(eqv

ISO/IEC8859—1:1998信息技术八位单字节编码图形字符集第1部分:拉丁字母一

3术语和定义、缩略语

下列术语和定义、缩略语适用于本标准。

3.1术语和定义

3.1.1

data

音频数据audio

编码后用于表示原始音频信号魄比特序列(数据)。

3.1.2

音频样本audiosample

输入编码器或输出解码器的PCM(脉冲编码调制)样值。

3.1.3

data

辅助数据auxiliary

包括诸如时间码之类的不属于音频信号本身,但又与其有关系的数据。

3.1.4

stream

码流或比特流bit

由符合本标准的编码器产生的表示原始音频信号的比特序列。

3.1.5

windowfunction

暂窗口函数brief

总长度为256个样本,但却只用其中160个样本的MDCT(改进余弦变换)的窗口函数。

1

22726--2008

GB/T

3.1.6

band

临界频带critical

人耳对声音分辨的数学模型可用一个子带滤波器组来近似表示,该滤波器组的带宽随频率的上升

而成近似的指数上升。此滤波器组的一个子带即被称为一个I|缶界频带。

3.1.7

下混合downmix

为了获得小于N个声道数量而进行的N声道的矩阵计算,见附录D。

3.1.8

帧Dame

由符合本标准的编码器产生的表示一帧音频信号的音频数据。它是构成本标准的码流的基本单

位。本标准的一个帧可涵盖128、256、512或1024个音频样本。

3.1.9

header

帧头frame

本标准的一个帧的开头部分的音频数据,包括同步字和描述音频信号的特性的字,比如采样率、正

常声道的数目、LFE(低频增强)声道数目等。

3.1.10

低频增强声道lowenhancementchannel

frequency

在多声道系统内用于低频音响效果的一个限定带宽(<300Hz)的声道。

3.1.11

windowfunction

长窗口函数long

长度为2048个样本的MDCT的窗口函数。

3.1.12

MDCT

MDCT块block

应用一次MDCT所产生的一组频域系数或子带样本。或相应地,输入MDCT的一组新音频样本。

本标准用到的MDCT块分别包含128和1024个音频样本或子带样本。

3.1.13

channel

正常声道normal

除低频增强声道以外的声道。

3.1.14

index

量化因子quantization

量化子带样本所生成的以量化步长为单位的值。

3.1.15

size

量化步长quantizationstep

量化子带样本用的步长。

3.1.16

unit

量化单元quantization

由临界频带在频域和瞬态段在时域联合界定的一个矩形;所有在此矩形内的子带样本都属于同一

个量化单元。

2

22726--2008

GB/T

7

3.1.1

function

window

短窗口函数short

长度为256个样本的MDCT的窗口函数。

3.1.18

information

辅助信息side

一帧音频数据中不表示子带样本的、仅仅协助解码的字。

3.1.19

frame

稳态帧stationary

一帧没有瞬态的音频样本。

3.1.20

子带样本subbandsample

应用MDCT所产生的一组频域系数。

3.1.21

子带段subbandsegment

由时间界定的一段子带样本。

3.1.22

word

同步字synchronization

指示音频帧的开始的字。

3.1.23

cluster

瞬态段transient

统计特性类似的子带段。在瞬态帧内,瞬态段的起始位置通常为瞬态发生的位置。在平稳帧内,整

帧音频样本或子带为一个瞬态段。

3.1.24

frame

瞬态帧transient

一帧有瞬态的音频或子带样本。

3.1.25

location

瞬态位置transient

对瞬态帧,指示瞬态发生的位置。

3.1.26

frame

典型帧typical

含有1024个音频采样点的帧为典型帧。

3.1.27

字word

由本标准的编码器产生的音频数据的最小语义单元。

3.2缩略语

LFE(Low

FrequencyEnhancement)低频增强

MDCT(ModifiedDiscreteCosine

Transform)改进的离散余弦变换

PcM(PulseCode

Modulation)脉冲编码调制

GB/T22726--2008

4概述

4.1编码

编码的主要组成部分如图1和表1所示。附录A对其中的部分技术给出了更详细的说明。

输入PCM样本

瞬态检测

可变分辨率滤波器组L一一

人耳

交叉重组l

听赞模型

和差犏码}一—-多

_联合强度犏码}一一

全局比特分配}一叫姥性标量量化卜一

JJ

码书选择}一一一量化园子编码}一

注:实线代表音频数据,虚线代表控制/辅助信息。

图1编码原理框图

表1编码

编码模块功能

瞬态检测检测输入的PCM样本是否含有瞬态响应

把每个声道的音频信号的PCM样本分解成子带信号。该滤波器组的时频分辨率

可变分辨率分析滤波器组

由瞬态检测的结果而定

当帧中存在瞬态时,用来重组子带样本的排列M序以便于降低传输它们所需的总

交叉重组

比特数

人耳听觉模型计算人耳的噪声掩蔽阈值

可选的和/差编码把左右声道对的子带样本转换成和/差声道对

可选的联合强度编码利用人耳在高频的声像定位特性而对联合声道的高频分量进行强度编码

全局比特分配把比特资源分配给各个量化单元,以使它们的量化噪声功率低于人耳的掩蔽阈值

线性标量量化利用全局比特分配提供的量化步长来量化各个量化单元内的子带样本

基于量化因子的局部统计特征对量化因子分组,并把最佳的码书从码书库中选择

码书选择

出来分配给各组量化因子

量化因子编码利用码书选择选定的码书及其应用范围来对所有的量化因子进行Huffman编码

多路复用把所有量化因子的Huffman码和辅助信息打包成一个完整的比特流

GB/T22726—2008

4.2解码

解码的主要组成部分如图2和表2所示。

表2解码

解码模块功能

从比特流解包出各个码字。由于Huffman码属前缀码,其解码和多路解复用是在

多路解复用

同一个步骤中完成的

从比特流中解码出用于解码量化因子用的各个Huffman码书及其应用范围(ap—

码书选择

plicationrange)

量化因子解码用于从比特流中解码出量化因子

量化单元个数重建由码书应用范围重建各个瞬态段的量化单元的个数

逆量化从码流中解码出所有量化单元的量化步长,并用其乘以量化因子重建子带样本

可选的联合强度解码利用联台强度比例因子由源声道的子带样本重建联合声道的子带样本

可选的和/差解码由和/差声道的子带样本重建左右声道的子带样本

逆交叉重组当帧中存在瞬态时,逆转编码器对量化因子的交叉重组

对瞬态帧,根据瞬态的位置及MDCT的完美重建(Perfect

短/暂窗口函数序列重建

重建该帧须用的短和暂窗口函数序列

可变分辨率合成滤渡器组由子带样本重建PCM音频样本

匦卤一曲

码路兰正!

流复

用£

_一

I短/哲窗口函数序列重建I

l

l可变分辨率合成滤波嚣组1

PCM样本输出

注:实线代表音频数据,虚线代表控制/辅助信息。

图2解码原理框图

5句法结构

5.1函数

对句法的描述而定义的函数见表3。

22726--2008

GB/T

表3特殊函数定义

函数定义

返回x和y的最大值

一max(x,y)

min(x,y)返回x和Y的最小值

Ceil(x)返回大于或等于x的最小整数

ErrorHandling()错误处理

Exit()退出解码

返回Huffman码书pCodeBook的维数

GetHuffDim(pCodeBook)

GetHuffMidTread(pCodeBook)

则,返回false

GetNumHuffCodesl:pCodeBook)

用Huffman码书pCodeBook从码流中进行Huffman解码:

HuffDec(pCodeBook)

{

k一0l

unBits=0I

for(n—Oln<nNumCodes;n++)

{

nShift=pCodeBook[k++];

if(nShift>0)

{

urlBits—unBits<<nShift;

HuffDecl

pCodeBook)

unBits

l=Unpack(nShift);

}

if(unBits=一pCodeBook[k++])

{

return

pCodeBook[k];

}

k++;

}

)

数)

HuffDeeDiff(:pCodeBook)

{

nDiff=HuffDee(pCodeBook);

nlndex一(nlndex+nDiff)%nNumCodes;

HuffDeeDiff(pCodeBook)

returnnlndex;

}

始化

6

GB/T

表3(续)

函数定义

HuffDecRecurslve(pCodeBook)

(

k一一1:

do

{

k++;

HuffDecRecursive(pCodeBook)

nQIndex=HuffDee(pCodeBook);

}while(nQlndex==nNumCodes--1);

nQlndex=k*(nNumCodes一1)+nQIndex;

return

nQIndex;

)

数)

重置Huffman码书pGodeBook的记忆性变量nlndex:

ResetHufflndex(pCodeBook,nDefault)

ResetHuffIndex(pCodeBook,{

nDefault)nlndex--nDefault;

)

Unpack(X)从码流中解包出x比特无正负号的数

5.2码流

码流如下所示:

Bit—Stream()

{

while(Unpack(16)一=0x7FFF)

{

Frame();

5.3帧

帧如下所示:

Frame()

FrameHeader();

for(nCh=0;nCh<nNumNormalCh;nCh十+)

UnpackWinSequenee();

UnpackCodeBooks();

UnpackQlndex();

UnpackQSteplndex():

7

22726--2008

GB/T

if(bUseSumDiff=一true&&(nCh%2)一一1)

{

UnpackSumDff();

)

if(bUseJIC=一true&&nCh>0)

{

UnpackJicScale();

)

)

{

if(nNumBlocksPerFrm一一8)

{

nWinTypeCurrent=WIN—LONGj,ONG2LONG;

nNumCluster--1;

anNumBlocksPerFrmPerCluster[0]一l:

)

else

{

nWinTypeCurrent=WIN—SHORT—SHORT2SHORT;

nNumCluster=1}

}

UnpackCodeBooks();

UnpackQIndex();

UnpackQSteplnde

定制服务

    推荐标准