T/AHAI 009-2024 面向文旅场景的语音交互应用服务软件规范
T/AHAI 009-2024 Voice Interaction Application Service Software Specification for Cultural and Tourism Scenarios
基本信息
发布历史
-
2024年07月
研制信息
- 起草单位:
- 合肥工业大学、科大讯飞股份有限公司、中国科学技术大学、北京理工大学、 天津恒达文博科技股份有限公司、安徽财经大学、凤阳县博物馆、浙江大学
- 起草人:
- 唐益明、刘晓平、宋维涛、李琳、陈仁杰、李权、徐勇、郜静文、何永春、 刘颖、程鸣、谢文军、曹力、李世杰、唐更生、赵洋、刘越、胡开拓、张举勇、傅孝明、杨磊、王勇 超、赵磊
- 出版信息:
- 页数:12页 | 字数:- | 开本: -
内容描述
ICS01.110
CCSL62
AHAI
安徽省人工智能协会团体标准
T/AHAI009—2024
面向文旅场景的语音交互应用服务软件规范
Specificationofvoiceinteractiveapplicationservicesoftwareforculturaltourismscenes
24-07-10发布2024-07-11实施
安徽省人工智能协会 发布
T/AHAI009-2024
目 次
前言.............................................................................III
1范围...............................................................................1
2规范性引用文件.....................................................................1
3术语和定义.........................................................................1
3.1..................................................................................1
4缩略语.............................................................................2
5软件框架...........................................................................2
6技术要求...........................................................................3
6.1输入输出.........................................................................3
6.2文旅场景导览数据库...............................................................3
6.3文旅场景位置识别.................................................................3
6.4文旅场景语音识别.................................................................3
6.5文旅场景语音应答.................................................................4
6.6文旅场景语音播报.................................................................4
6.7文旅场景多轮对话.................................................................4
6.8观众咨询反馈.....................................................................5
6.9维护功能.........................................................................5
6.10可移植性........................................................................5
7测试方法...........................................................................5
7.1环境条件.........................................................................5
7.2测试准备.........................................................................5
7.3输入输出.........................................................................6
7.4文旅场景导览数据库...............................................................6
7.5文旅场景位置识别.................................................................6
7.6文旅场景语音识别.................................................................7
7.7文旅场景语音应答.................................................................7
7.8文旅场景语音播报.................................................................8
7.9文旅场景多轮对话.................................................................8
7.10观众咨询反馈....................................................................9
7.11维护功能........................................................................9
7.12可移植性........................................................................9
II
T/AHAI009-2024
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由合肥工业大学等单位提出并由安徽省人工智能协会归口。
本文件起草单位:合肥工业大学、科大讯飞股份有限公司、中国科学技术大学、北京理工大学、
天津恒达文博科技股份有限公司、安徽财经大学、凤阳县博物馆、浙江大学。
本文件主要起草人:唐益明、刘晓平、宋维涛、李琳、陈仁杰、李权、徐勇、郜静文、何永春、
刘颖、程鸣、谢文军、曹力、李世杰、唐更生、赵洋、刘越、胡开拓、张举勇、傅孝明、杨磊、王勇
超、赵磊。
III
T/AHAI009—2024
面向文旅场景的语音交互应用服务软件规范
1范围
本文件规定了应用于文旅场景时语音交互服务软件的框架、技术要求和测试方法。
本文件应用于文旅场景的语音交互应用服务软件的开发和测试。
2规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB3096-2008声环境质量标准
GB/T21023-2007中文语音识别系统通用技术规范
GB/T21024-2007中文语音合成系统通用技术规范
GB∕T36464.2-2018信息技术智能语音交互系统第2部分:智能家居
GB/T36464.3-2018智能语音交互系统第3部分:智能客服
3术语和定义
下列术语和定义适用于本文件。
3.1
语音识别speechrecognition
将人类的声音信号转化为文字或者指令的过程。
[来源:GB/T21023-2007,3.1]
3.2
语音合成speechsynthesis
通过机械的、电子的方法合成人类语言的过程。
[来源:GB/T21024-2007,3.1]
3.3
多轮对话multi-rounddialogue
在人机对话中,机器和用户之间进行多次的问答交流,机器初步明确用户意图之后,获取必要信息
以最终得到明确用户指令的方式。
3.4
噪声noise
语音采集过程中,采集到的由非目标语音信号源发出的,能干扰、影响对目标语音信号的识别、理
解或处理的声学信号。
[来源:GB∕T36464.2-2018,3.16]
3.5
问答对question&answerpair
在人机对话中,机器和用户之间进行的一次完整的提问和回答。
3.6
导览数据库navigationdatabase
1
T/AHAI009—2024
引导游览的地图、导览点分布、区域结构等各种信息汇集形成的数据库。
4缩略语
下列缩略语适用于本文件。
GPD:全球定位装置(GlobalPositioningDevice)。
5软件框架
面向文旅场景的语音交互应用服务软件系统可以基于文旅场景位置识别、文旅场景语音识别、文旅
场景语音应答、文旅场景多轮对话技术,在文旅场景的应用服务领域为用户提供机器替代人工的服务。
面向文旅场景的语音交互应用服务软件系统本身包括文旅场景语音交互应用服务的软件和相关硬
件(比如音频采样设备、传声器设备、回放设备)。
面向文旅场景的语音交互应用服务软件系统应包括总控模块、输入输出模块、文旅场景导览数据库
模块、文旅场景位置识别模块、文旅场景语音识别模块、文旅场景语音应答模块、文旅场景语音播报模
块、文旅场景多轮对话模块和观众咨询反馈模板。其应用服务软件系统框架见图
定制服务
推荐标准
- T/CISA 288-2022 高纯五氧化二钒 2022-11-07
- T/CSTM 00377E-2021 钒钛磁铁矿钒、锰、磷、铜、钴、镍、铬、 钼、铅、砷、锡、镉、钡、锌含量的测定电 感耦合等离子体原子发射光谱法 2023-01-13
- T/CISA 333-2023 路基用不锈钢渣土 2023-09-06
- T/SSEA 0232-2022 履带链轨节用热轧圆钢 2022-11-10
- T/SXJP 004-2022 拔丝用Q195WD低碳热轧圆盘条 2022-11-20
- T/HBMIA 5-2019 钢铁企业铁前成本统计导则 2019-11-13
- T/ZZB 0273-2017 磁极线圈用铜型材 2017-12-15
- T/SSEA 0294-2023 一般冷轧用热轧钢板及钢带 2023-05-20
- T/CASEI 021-2023 油气管道内检测器测试与评价 第2 部分:漏磁检测器 2023-07-20
- T/JGE 0062-2023 江西绿色生态 实心铝合金圆铸锭 2023-10-14