GB/T 46271-2025 信息技术 三维声技术 编码、分发与呈现

GB/T 46271-2025 Information technology—3D audio technology—Coding, distribution and presentation

国家标准 中文简体 即将实施 页数:380页 | 格式:PDF

基本信息

标准号
GB/T 46271-2025
相关服务
标准类型
国家标准
标准状态
即将实施
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2025-08-29
实施日期
2026-03-01
发布单位/组织
国家市场监督管理总局、国家标准化管理委员会
归口单位
全国信息技术标准化技术委员会(SAC/TC 28)、全国广播电视和网络视听标准化技术委员会(SAC/TC 239)
适用范围
本文件描述了三维声音频的编码、分发与呈现的方法,兼容单声道、双声道立体声、多声道环绕声等声音格式。
本文件适用于广播电视、广播流媒体、网络视听、实时通信、虚拟现实和增强现实、数字存储媒体等领域的三维声音频编码、分发与呈现。

发布历史

文前页预览

研制信息

起草单位:
中国电子技术标准化研究院、中央广播电视总台、国家广播电视总局广播电视规划院、国家广播电视总局广播电视科学研究院、华为技术有限公司、清华大学、北京字跳网络技术有限公司、赛因芯微(北京)电子科技有限公司、北京理工大学、北京大学、咪咕文化科技有限公司、中国移动通信集团有限公司、中国联合网络通信集团有限公司、中国电信集团有限公司、腾讯科技(深圳)有限公司、华为终端技术有限公司、中移(杭州)信息技术有限公司、天翼数字生活科技有限公司、联通在线信息科技有限公司、北京歌华有线网络有限公司、东方有线电视网络有限公司、爱上电视传媒(北京)有限公司、中关村视听产业技术创新联盟、世界超高清视频产业联盟
起草人:
范科峰、孙齐锋、姜文波、陈晨、宁金辉、张建东、周芸、郭晓强、王喆、窦维蓓、柳德荣、吴健、王晶、曲天书、韩建、刘先达、王亚徽、贾立鼎、李大龙、罗红、魏嘉、吕超、甄林、董原、吴坚、潘红梅、张伟民、张文刚、李婧欣、焦健波、汪芮、胡潇、朱梦尧
出版信息:
页数:380页 | 字数:716 千字 | 开本: 大16开

内容描述

ICS35040

CCSL.71

中华人民共和国国家标准

GB/T46271—2025

信息技术三维声技术编码

分发与呈现

Informationtechnolo—3Daudiotechnolo—Codindistributionand

gygyg,

presentation

2025-08-29发布2026-03-01实施

国家市场监督管理总局发布

国家标准化管理委员会

GB/T46271—2025

目次

前言

…………………………Ⅴ

引言

…………………………Ⅵ

范围

1………………………1

规范性引用文件

2…………………………1

术语和定义

3………………1

缩略语

4……………………2

约定

5………………………3

算术运算符

5.1…………………………3

逻辑运算符

5.2…………………………3

关系运算符

5.3…………………………4

位运算符

5.4……………4

赋值运算符

5.5…………………………4

助记符

5.6………………5

数学函数

5.7……………5

位流语法规则

5.8………………………5

三维声编解码及渲染框架

6………………7

通用全码率音频解码

7……………………9

概述

7.1…………………9

位流解复用语法语义及解码过程

7.2…………………15

区间解码逆量化和神经网络逆变换语法语义及解码过程

7.3、……20

频谱逆分组处理语法语义及解码过程

7.4……………24

双声道立体声比特分配和上混语法语义及解码过程

7.5……………25

多声道比特分配和上混语法语义及解码过程

7.6……………………30

比特分配和上混

7.7HOA……………32

解码后处理语法语义及解码过程

7.8…………………36

频带扩展解码语法语义及解码过程

7.9………………37

逆时域噪声整形语法语义及解码过程

7.10…………45

逆频域噪声整形语法语义及解码过程

7.11…………47

逆解码过程

7.12MDCT………………49

空间解码

7.13HOA……………………50

无损音频解码

8……………55

元数据解码

9………………55

元数据位流语法语义

9.1………………55

GB/T46271—2025

静态元数据解码语法语义

9.2…………56

动态元数据解码语法语义

9.3…………57

基本静态元数据解码语法语义

9.4……………………58

基本静态元数据节目层解码语法语义

9.5……………59

基本静态元数据内容层解码语法语义

9.6……………60

基本静态元数据对象层解码语法语义

9.7……………62

基本静态元数据对话字段解码语法语义

9.8…………64

基本静态元数据封装层解码语法语义

9.9……………64

基本静态元数据通道层解码语法语义

9.10…………67

基本静态元数据对象互动字段解码语法语义

9.11…………………68

基本静态元数据扬声器位置解码语法语义

9.12……………………70

基本静态元数据响度字段解码语法语义

9.13………70

基本静态元数据节目参考屏幕字段解码语法语义

9.14……………72

动态元数据解码语法语义

9.15Level1………………73

动态元数据解码语法语义

9.16Level2………………75

扩展静态元数据解码语法语义

9.17Level1…………76

扩展静态元数据声学环境元数据解码语法语义

9.18………………77

扩展静态元数据同种材质墙面元数据解码语法语义

9.19…………78

扩展静态元数据统一几何材质表面组成的三角形顶点解码语法语义

9.20………80

扩展静态元数据渲染信息解码语法语义

9.21………80

扩展静态元数据后期效果处理解码语法语义

9.22…………………81

扩展静态元数据均衡效果解码语法语义

9.23………82

解码过程

9.24…………………………83

附录规范性三维声编码位流语法语义

A()……………87

语法

A.1………………87

语义

A.2………………92

附录规范性音频码表

B()………………98

附录资料性三维声渲染

C()…………292

概述

C.1………………292

元数据限定

C.2………………………292

渲染器

C.31…………………………292

渲染器

C.42…………………………292

渲染器

C.53…………………………292

附录资料性通用全码率音频编码

D()………………304

概述

D.1………………304

编码预处理

D.2………………………309

下混

D.3………………316

GB/T46271—2025

神经网络变换量化和区间编码

D.4、…………………321

空间编码

D.5HOA…………………328

编码神经网络参数表

D.6……………329

附录资料性本文件元数据与中元数据的对应关系

E()GY/T404—2024………366

参考文献

……………………371

GB/T46271—2025

前言

本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定

GB/T1.1—2020《1:》

起草

本文件由全国信息技术标准化技术委员会提出

(SAC/TC28)。

本文件由全国信息技术标准化技术委员会和全国广播电视和网络视听标准化技术

(SAC/TC28)

委员会归口

(SAC/TC239)。

本文件起草单位中国电子技术标准化研究院中央广播电视总台国家广播电视总局广播电视规

:、、

划院国家广播电视总局广播电视科学研究院华为技术有限公司清华大学北京字跳网络技术有限公

、、、、

司赛因芯微北京电子科技有限公司北京理工大学北京大学咪咕文化科技有限公司中国移动通

、()、、、、

信集团有限公司中国联合网络通信集团有限公司中国电信集团有限公司腾讯科技深圳有限公司

、、、()、

华为终端技术有限公司中移杭州信息技术有限公司天翼数字生活科技有限公司联通在线信息科

、()、、

技有限公司北京歌华有线网络有限公司东方有线电视网络有限公司爱上电视传媒北京有限公司

、、、()、

中关村视听产业技术创新联盟世界超高清视频产业联盟

、。

本文件主要起草人范科峰孙齐锋姜文波陈晨宁金辉张建东周芸郭晓强王喆窦维蓓

:、、、、、、、、、、

柳德荣吴健王晶曲天书韩建刘先达王亚徽贾立鼎李大龙罗红魏嘉吕超甄林董原吴坚

、、、、、、、、、、、、、、、

潘红梅张伟民张文刚李婧欣焦健波汪芮胡潇朱梦尧

、、、、、、、。

GB/T46271—2025

引言

本文件的发布机构提请注意声明符合本文件时可能涉及中

,,7.3、7.4、7.5、7.6、7.7、7.9、7.10、7.13

与音频编解码技术相关的专利的使用

本文件的发布机构对于该专利的真实性有效性和范围无任何立场

、。

该专利持有人已向本文件的发布机构承诺他愿意同任何申请人在合理且无歧视的条款和条件

,

下就专利授权许可进行谈判该专利持有人的声明已在本文件的发布机构备案相关信息可通过以下

,。,

联系方式获得

:

专利持有人华为技术有限公司

:;

地址广东省深圳市龙岗区坂田华为基地

:A。

请注意除上述专利外本文件的某些内容仍可能涉及专利本文件的发布机构不承担识别专利的

,。

责任

GB/T46271—2025

信息技术三维声技术编码

分发与呈现

1范围

本文件描述了三维声音频的编码分发与呈现的方法兼容单声道双声道立体声多声道环绕声等

、,、、

声音格式

本文件适用于广播电视广播流媒体网络视听实时通信虚拟现实和增强现实数字存储媒体等

、、、、、

领域的三维声音频编码分发与呈现

、。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款其中注日期的引用文

。,

件仅该日期对应的版本适用于本文件不注日期的引用文件其最新版本包括所有的修改单适用于

,;,()

本文件

所有部分信息技术具有数据传输率的数字存储媒体运动图像及其

GB/T17191()1.5Mbit/s

伴音的编码

信息技术高效多媒体编码第部分音频

GB/T33475.3—20183:

信息技术虚拟现实内容表达第部分音频

GB/T44115.3—20253:

节目响度和真峰值音频电平测量算法

GY/T262—2012

用于节目制作的先进声音系统

GY/T316—2018

音频定义模型

GY/T404—2024

音频定义模型通用定义

ITU-RBS.2094:2025(Commondefinitionsfortheaudiodefinition

model)

通用移动通信系统增强语音服务编解码器

ETSITS126445V18.1.0(UMTS);LTE;5G;(EVS)

[UniversalMobileTelecommunicationsSystem(UMTS);LTE;5G;CodecforEnhancedVoiceServ-

ices(EVS)]

3术语和定义

界定的以及下列术语和定义适用于本文件

GB/T33475.3—2018。

31

.

编码位流codedbitstream

音频信号的编码表示

32

.

对象object

三维声信号中被感知为一个整体的声音或由一个声源发出的独立于环境的声音

,。

33

.

双声道立体声stereoaudio

一种音频格式使用两个声道承载有一定相位关系或者幅度关系或者相位和幅度混合关系的音频

,

1

定制服务