T/AHAI 009-2024 面向文旅场景的语音交互应用服务软件规范

T/AHAI 009-2024 Voice Interaction Application Service Software Specification for Cultural and Tourism Scenarios

团体标准 中文(简体) 现行 页数:12页 | 格式:PDF

基本信息

标准号
T/AHAI 009-2024
标准类型
团体标准
标准状态
现行
中国标准分类号(CCS)
-
国际标准分类号(ICS)
发布日期
2024-07-10
实施日期
2024-07-11
发布单位/组织
-
归口单位
安徽省人工智能协会
适用范围
主要技术内容:本文件规定了应用于文旅场景时语音交互服务软件的框架、技术要求和测试方法。 本文件应用于文旅场景的语音交互应用服务软件的开发和测试

发布历史

文前页预览

研制信息

起草单位:
合肥工业大学、科大讯飞股份有限公司、中国科学技术大学、北京理工大学、 天津恒达文博科技股份有限公司、安徽财经大学、凤阳县博物馆、浙江大学
起草人:
唐益明、刘晓平、宋维涛、李琳、陈仁杰、李权、徐勇、郜静文、何永春、 刘颖、程鸣、谢文军、曹力、李世杰、唐更生、赵洋、刘越、胡开拓、张举勇、傅孝明、杨磊、王勇 超、赵磊
出版信息:
页数:12页 | 字数:- | 开本: -

内容描述

ICS01.110

CCSL62

AHAI

安徽省人工智能协会团体标准

T/AHAI009—2024

面向文旅场景的语音交互应用服务软件规范

Specificationofvoiceinteractiveapplicationservicesoftwareforculturaltourismscenes

24-07-10发布2024-07-11实施

安徽省人工智能协会  发布

T/AHAI009-2024

目  次

前言.............................................................................III

1范围...............................................................................1

2规范性引用文件.....................................................................1

3术语和定义.........................................................................1

3.1..................................................................................1

4缩略语.............................................................................2

5软件框架...........................................................................2

6技术要求...........................................................................3

6.1输入输出.........................................................................3

6.2文旅场景导览数据库...............................................................3

6.3文旅场景位置识别.................................................................3

6.4文旅场景语音识别.................................................................3

6.5文旅场景语音应答.................................................................4

6.6文旅场景语音播报.................................................................4

6.7文旅场景多轮对话.................................................................4

6.8观众咨询反馈.....................................................................5

6.9维护功能.........................................................................5

6.10可移植性........................................................................5

7测试方法...........................................................................5

7.1环境条件.........................................................................5

7.2测试准备.........................................................................5

7.3输入输出.........................................................................6

7.4文旅场景导览数据库...............................................................6

7.5文旅场景位置识别.................................................................6

7.6文旅场景语音识别.................................................................7

7.7文旅场景语音应答.................................................................7

7.8文旅场景语音播报.................................................................8

7.9文旅场景多轮对话.................................................................8

7.10观众咨询反馈....................................................................9

7.11维护功能........................................................................9

7.12可移植性........................................................................9

II

T/AHAI009-2024

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由合肥工业大学等单位提出并由安徽省人工智能协会归口。

本文件起草单位:合肥工业大学、科大讯飞股份有限公司、中国科学技术大学、北京理工大学、

天津恒达文博科技股份有限公司、安徽财经大学、凤阳县博物馆、浙江大学。

本文件主要起草人:唐益明、刘晓平、宋维涛、李琳、陈仁杰、李权、徐勇、郜静文、何永春、

刘颖、程鸣、谢文军、曹力、李世杰、唐更生、赵洋、刘越、胡开拓、张举勇、傅孝明、杨磊、王勇

超、赵磊。

III

T/AHAI009—2024

面向文旅场景的语音交互应用服务软件规范

1范围

本文件规定了应用于文旅场景时语音交互服务软件的框架、技术要求和测试方法。

本文件应用于文旅场景的语音交互应用服务软件的开发和测试。

2规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文

件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB3096-2008声环境质量标准

GB/T21023-2007中文语音识别系统通用技术规范

GB/T21024-2007中文语音合成系统通用技术规范

GB∕T36464.2-2018信息技术智能语音交互系统第2部分:智能家居

GB/T36464.3-2018智能语音交互系统第3部分:智能客服

3术语和定义

下列术语和定义适用于本文件。

3.1

语音识别speechrecognition

将人类的声音信号转化为文字或者指令的过程。

[来源:GB/T21023-2007,3.1]

3.2

语音合成speechsynthesis

通过机械的、电子的方法合成人类语言的过程。

[来源:GB/T21024-2007,3.1]

3.3

多轮对话multi-rounddialogue

在人机对话中,机器和用户之间进行多次的问答交流,机器初步明确用户意图之后,获取必要信息

以最终得到明确用户指令的方式。

3.4

噪声noise

语音采集过程中,采集到的由非目标语音信号源发出的,能干扰、影响对目标语音信号的识别、理

解或处理的声学信号。

[来源:GB∕T36464.2-2018,3.16]

3.5

问答对question&answerpair

在人机对话中,机器和用户之间进行的一次完整的提问和回答。

3.6

导览数据库navigationdatabase

1

T/AHAI009—2024

引导游览的地图、导览点分布、区域结构等各种信息汇集形成的数据库。

4缩略语

下列缩略语适用于本文件。

GPD:全球定位装置(GlobalPositioningDevice)。

5软件框架

面向文旅场景的语音交互应用服务软件系统可以基于文旅场景位置识别、文旅场景语音识别、文旅

场景语音应答、文旅场景多轮对话技术,在文旅场景的应用服务领域为用户提供机器替代人工的服务。

面向文旅场景的语音交互应用服务软件系统本身包括文旅场景语音交互应用服务的软件和相关硬

件(比如音频采样设备、传声器设备、回放设备)。

面向文旅场景的语音交互应用服务软件系统应包括总控模块、输入输出模块、文旅场景导览数据库

模块、文旅场景位置识别模块、文旅场景语音识别模块、文旅场景语音应答模块、文旅场景语音播报模

块、文旅场景多轮对话模块和观众咨询反馈模板。其应用服务软件系统框架见图

定制服务

    相似标准推荐

    更多>