T/AHAI 009-2024 面向文旅场景的语音交互应用服务软件规范
T/AHAI 009-2024 Voice Interaction Application Service Software Specification for Cultural and Tourism Scenarios
基本信息
发布历史
-
2024年07月
文前页预览
研制信息
- 起草单位:
- 合肥工业大学、科大讯飞股份有限公司、中国科学技术大学、北京理工大学、 天津恒达文博科技股份有限公司、安徽财经大学、凤阳县博物馆、浙江大学
- 起草人:
- 唐益明、刘晓平、宋维涛、李琳、陈仁杰、李权、徐勇、郜静文、何永春、 刘颖、程鸣、谢文军、曹力、李世杰、唐更生、赵洋、刘越、胡开拓、张举勇、傅孝明、杨磊、王勇 超、赵磊
- 出版信息:
- 页数:12页 | 字数:- | 开本: -
内容描述
ICS01.110
CCSL62
AHAI
安徽省人工智能协会团体标准
T/AHAI009—2024
面向文旅场景的语音交互应用服务软件规范
Specificationofvoiceinteractiveapplicationservicesoftwareforculturaltourismscenes
24-07-10发布2024-07-11实施
安徽省人工智能协会 发布
T/AHAI009-2024
目 次
前言.............................................................................III
1范围...............................................................................1
2规范性引用文件.....................................................................1
3术语和定义.........................................................................1
3.1..................................................................................1
4缩略语.............................................................................2
5软件框架...........................................................................2
6技术要求...........................................................................3
6.1输入输出.........................................................................3
6.2文旅场景导览数据库...............................................................3
6.3文旅场景位置识别.................................................................3
6.4文旅场景语音识别.................................................................3
6.5文旅场景语音应答.................................................................4
6.6文旅场景语音播报.................................................................4
6.7文旅场景多轮对话.................................................................4
6.8观众咨询反馈.....................................................................5
6.9维护功能.........................................................................5
6.10可移植性........................................................................5
7测试方法...........................................................................5
7.1环境条件.........................................................................5
7.2测试准备.........................................................................5
7.3输入输出.........................................................................6
7.4文旅场景导览数据库...............................................................6
7.5文旅场景位置识别.................................................................6
7.6文旅场景语音识别.................................................................7
7.7文旅场景语音应答.................................................................7
7.8文旅场景语音播报.................................................................8
7.9文旅场景多轮对话.................................................................8
7.10观众咨询反馈....................................................................9
7.11维护功能........................................................................9
7.12可移植性........................................................................9
II
T/AHAI009-2024
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由合肥工业大学等单位提出并由安徽省人工智能协会归口。
本文件起草单位:合肥工业大学、科大讯飞股份有限公司、中国科学技术大学、北京理工大学、
天津恒达文博科技股份有限公司、安徽财经大学、凤阳县博物馆、浙江大学。
本文件主要起草人:唐益明、刘晓平、宋维涛、李琳、陈仁杰、李权、徐勇、郜静文、何永春、
刘颖、程鸣、谢文军、曹力、李世杰、唐更生、赵洋、刘越、胡开拓、张举勇、傅孝明、杨磊、王勇
超、赵磊。
III
T/AHAI009—2024
面向文旅场景的语音交互应用服务软件规范
1范围
本文件规定了应用于文旅场景时语音交互服务软件的框架、技术要求和测试方法。
本文件应用于文旅场景的语音交互应用服务软件的开发和测试。
2规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB3096-2008声环境质量标准
GB/T21023-2007中文语音识别系统通用技术规范
GB/T21024-2007中文语音合成系统通用技术规范
GB∕T36464.2-2018信息技术智能语音交互系统第2部分:智能家居
GB/T36464.3-2018智能语音交互系统第3部分:智能客服
3术语和定义
下列术语和定义适用于本文件。
3.1
语音识别speechrecognition
将人类的声音信号转化为文字或者指令的过程。
[来源:GB/T21023-2007,3.1]
3.2
语音合成speechsynthesis
通过机械的、电子的方法合成人类语言的过程。
[来源:GB/T21024-2007,3.1]
3.3
多轮对话multi-rounddialogue
在人机对话中,机器和用户之间进行多次的问答交流,机器初步明确用户意图之后,获取必要信息
以最终得到明确用户指令的方式。
3.4
噪声noise
语音采集过程中,采集到的由非目标语音信号源发出的,能干扰、影响对目标语音信号的识别、理
解或处理的声学信号。
[来源:GB∕T36464.2-2018,3.16]
3.5
问答对question&answerpair
在人机对话中,机器和用户之间进行的一次完整的提问和回答。
3.6
导览数据库navigationdatabase
1
T/AHAI009—2024
引导游览的地图、导览点分布、区域结构等各种信息汇集形成的数据库。
4缩略语
下列缩略语适用于本文件。
GPD:全球定位装置(GlobalPositioningDevice)。
5软件框架
面向文旅场景的语音交互应用服务软件系统可以基于文旅场景位置识别、文旅场景语音识别、文旅
场景语音应答、文旅场景多轮对话技术,在文旅场景的应用服务领域为用户提供机器替代人工的服务。
面向文旅场景的语音交互应用服务软件系统本身包括文旅场景语音交互应用服务的软件和相关硬
件(比如音频采样设备、传声器设备、回放设备)。
面向文旅场景的语音交互应用服务软件系统应包括总控模块、输入输出模块、文旅场景导览数据库
模块、文旅场景位置识别模块、文旅场景语音识别模块、文旅场景语音应答模块、文旅场景语音播报模
块、文旅场景多轮对话模块和观众咨询反馈模板。其应用服务软件系统框架见图
定制服务
推荐标准
- BB/T 0016-1999 包装材料 蜂窝纸板 1999-04-08
- GB/T 11348.4-1999 旋转机械转轴径向振动的测量和评定 第4部分:燃气轮机组 1999-04-08
- GB/T 11164-1999 真空镀膜设备通用技术条件 1999-04-08
- GB/T 11348.1-1999 旋转机械转轴径向振动的测量和评定 第1部分:总则 1999-04-08
- NY/T 362-1999 香荚兰 种苗 1999-04-07
- GB/T 17719-1999 工业锅炉及火焰加热炉烟气余热资源量计算方法与利用导则 1999-04-08
- NY/T 360-1999 胡椒 插条苗 1999-04-07
- GB/T 17720-1999 金属覆盖层 孔隙率试验评述 1999-04-08
- GB/T 11348.3-1999 旋转机械转轴径向振动的测量和评定 第3部分:耦合的工业机器 1999-04-08
- NY/T 359-1999 咖啡 种苗 1999-04-07