《nuance语音识别》PPT课件.ppt

上传人:san****019 文档编号:17289465 上传时间:2020-11-17 格式:PPT 页数:14 大小:408.10KB
返回 下载 相关 举报
《nuance语音识别》PPT课件.ppt_第1页
第1页 / 共14页
《nuance语音识别》PPT课件.ppt_第2页
第2页 / 共14页
《nuance语音识别》PPT课件.ppt_第3页
第3页 / 共14页
点击查看更多>>
资源描述
Nuance语音识别技术 2020/11/17 2 语音识别业务背景 语音识别技术 , Automatic Speech Recognition, 简称 ASR, 是一种让机器听懂人类语言的技术 。 语言是人类进行信息交流 的最主要 、 最长用 、 最直接的方式 。 语音识别技术是实现人机对话的一项重大突破 , 在国外近年来 发展十分迅速 , 其应用也逐步得到推广 。 近几年逐渐普及的 IVR( 自动电话应答 ) 处理了不少简单而又重 复的咨询工作 , 节省了不少人力 , 但这种按键式的语音自动应 答却让客户花费很多时间按指引来完成简单的查询 , 令用户倍 感不便 。 语音识别无疑可以解决该方面的问题。语音识别系统的开发成 功,充分发挥了计算机技术和网络技术的优势,采用先进的人 机对话方式,摆脱电话按键的束缚,人们只要象平常一样对着 电话简单的说出所需服务项目,即可轻松获取自动系统提供的 所需信息。 2020/11/17 3 语 音 识 别 应 用 示 例 Nuance公司是自然语音接口软件的佼佼者 。 使用自然 语音接口软件 , 人们可以通过电话方便安全地获取信息 、 服务并进行交易 。 每天 , 千千万万的人通过拨打运行 Nuance公司语音识别 、 语言理解和声纹鉴别软件的电话 , 进行出游预订 、 股票交易 、 与其它通讯媒体 、 企业和互 联网系统进行交往等活动 。 NUANCE 的 应 用 : 美 国 航 空 、 Bell Atlantic 、 Charles Schwab、 家庭购物网络 、 Lloyds TSB、 Sears、 UPS 。 其它厂家: IBM, INFOTALK 2020/11/17 4 NUANCE语音识别特点 海量词汇 、 独立于讲话者的健壮识别功能 Nuance系统能可靠地对多种语言进行大词汇量的识别 , 并可提供识别结果的置信度 。 该系统对 商业上使用的大量词汇提供最准确的语音识别技术 。 利用 Nuance系统开发的应用程序 , 在市场上具有最高的准确率 。 生产中的应用程序经测试 , 准确性超过 96%。 基于主机的客户 /服务机结构 Nuance系统基于开放式客户 /服务机结构 , 特别为大型应用程序所需的健壮性和可伸缩性而设计 。 呼叫者的讲话由客户端收集 , 而识别和鉴别处理的负载被平均分配到网络上的多个分开 的服务器上 。 2020/11/17 5 NUANCE语音识别特点 N-Best处理 对于有些应用程序 , 可能需要识别引擎产生可能的识别结果集 , 而不是一个最好的结果 。 Nuance系统的 N-best识别处理方法便有这个功能 , 它提供了可能的识别结果列表 , 并按可 能性从高到低排列 。 语法概率 Nuance系统允许对呼叫者所讲的特定词语或短语的在语法中的概率进行指定 。 当被讲的词语或 短语的概率可根据实际使用进行估计时 , 非常有用 。 对语法增加概率可提高识别的准确 率和速度 。 降低噪音 当进来的呼叫包含稳定的背景噪音时 , Nuance系统通过一种机制 , 使识别服务器更准确地进行 识别 。 识别服务器将进来的话语进行增强 , 以有效地将语气 、 嗡嗡声 、 哼叫声 、 嘘嘘声 等噪声过滤 。 如果相当数量的电话均含有稳定的背景噪声 , 比如在汽车上免提打电话时 , 这个机制效果较理想 。 2020/11/17 6 NUANCE语音识别特点 N-Best处理 对于有些应用程序 , 可能需要识别引擎产生可能的识别结果集 , 而不是一个最好的结果 。 Nuance系统的 N-best识别处理方法便有这个功能 , 它提供了可能的识别结果列表 , 并按可 能性从高到低排列 。 语法概率 Nuance系统允许对呼叫者所讲的特定词语或短语的在语法中的概率进行指定 。 当被讲的词语或 短语的概率可根据实际使用进行估计时 , 非常有用 。 对语法增加概率可提高识别的准确 率和速度 。 降低噪音 当进来的呼叫包含稳定的背景噪音时 , Nuance系统通过一种机制 , 使识别服务器更准确地进行 识别 。 识别服务器将进来的话语进行增强 , 以有效地将语气 、 嗡嗡声 、 哼叫声 、 嘘嘘声 等噪声过滤 。 如果相当数量的电话均含有稳定的背景噪声 , 比如在汽车上免提打电话时 , 这个机制效果较理想 。 2020/11/17 7 系统结构 INTERNET 接入模块 PSTN 语音短信 处理模块 语音短信 管理模块 计费网关 业务受理台 维护台 WEB server TTS SERVER ASR SERVER 2020/11/17 8 基于识别的业务 语音短信本身业务 公司电话簿 个人电话簿 智能点歌 股票查询和交易 智能信息点播 列车时刻查询 2020/11/17 9 业务功能公司电话簿 业务描述 系统能支持多个接入号码, 虚拟多个公司的总机。并依 靠语音识别技术,智能转接到相应的用户。 业务流程 用户拨打接入码 , 系统根据接入 码找到相应的公司数据库 , 同时 提醒用户说出相应的用户 , 系统 依据相应的用户查询数据库 , 并 得到该用户的号码 , 并通知交换 机将该号码接通 。 2020/11/17 10 业务功能公司电话簿 用户进入系统 系统播放欢迎词 用户说出联系人的姓名 用户 ASR识别系统 系统提示有多个结果 用户按键选择 系统自动转接 。 。 话路连通 , 用户通话 2020/11/17 11 业务功能公司电话簿特点 系统支持电话接入方式 用户可通过电话修改个人密码,个人上班电话和非上班电话 系统支持 WEB接入方式 系统管理员可修改所有信息 各公司管理员可增加,删除,修改本公司的电话信息 特点: 1、 用户不用记忆繁琐的电话号码 , 只需说出需要找的人名 2、 系统播放的欢迎词可由用户定制 , 以体现自己的风格 。 3、 非常具有人性化的交流界面 4、 无论是外出 、 在家或办公 , 只要有一部电话 , 就可轻松与想要联 系的人沟通 5、 语音电话本可以做到信息永存 , 永不丢失 2020/11/17 12 业务功能点歌业务 业务描述 用户接入系统,提示用户说 出歌名,并依靠语音识别技 术,查找到该歌名,并播放给用户。 业务流程 用户拨打接入码 , 提示 用户说出歌名或歌手名 , 并 依靠语音识别技术 , 查找到 该歌名或歌手名 , 若为歌名 查询数据库 , 得到该歌存储 的路径 , 并播放给用户 , 若 为歌手名 , 则读出该歌手的 专辑 , 并提醒用户选择 , 用 户选择后 , 读出该专辑的歌 名 , 并提醒用户选择 , 用户 选择后 , 给用户播放该歌曲 。 2020/11/17 13 业务功能个人电话簿 业务描述 系统能支持多个接入号码, 虚拟个人电话簿。并依靠语 音识别技术,智能将不同的 个人的呼叫转接到要找的用户。 业务流程 用户拨打接入码 , 系统根据接 入码 , 依据主叫用户 +密码 , 或系统提供的信箱号码 +密码 , 找到该用户的个人电话簿 , 同时提醒用户说出相应的用 户 , 系统依据相应的用户查 询数据库 , 并得到用户要查 询的电话号码 , 并通知交换 机将该号码接通 。 2020/11/17 14 讨论时间 谢谢,期待与您长远合作
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!