人工智能语音识别-经典课件

上传人:风*** 文档编号:252024128 上传时间:2024-11-12 格式:PPT 页数:17 大小:354.02KB
返回 下载 相关 举报
人工智能语音识别-经典课件_第1页
第1页 / 共17页
人工智能语音识别-经典课件_第2页
第2页 / 共17页
人工智能语音识别-经典课件_第3页
第3页 / 共17页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,精,*,语音识别,精,1,语音识别精1,目录,语音识别的定义,语音识别涉及领域,语音识别的类型,语音识别原理框图,DTW,算法,语音识别系统应用领域,语音识别技术的应用发展方向,精,2,目录语音识别的定义精2,语音识别的定义,语音识别,技术,就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴,。,它是语音信号处理学科的一个分支。语音识别系统的本质就是一种模式识别系统,。,常见的语音识别方法,有动态时间归整技术,(DTW),、矢量量化技术,(VQ),、隐马尔可夫模型,(HMM),、基于段长分布的非齐次隐马尔可夫模型,(DDBHMM),和人工神经元网络,(ANN),精,3,语音识别的定义语音识别技术就是让机器通过识别和理解过程把人,语音识别涉及领域,信号处理,物理学(声学),模式匹配,通信及信息理论,语言语音学,生理学,计算机科学,心理学,精,4,语音识别涉及领域信号处理物理学(声学)模式匹配通信及信息理论,语音识别的类型,按识别器的类型,孤立单词识别,连续语音识别,连续单词识别,连续言语识别与理解,按识别器对使用者的适应情况,特定人语音识别,非特定人语音识别,按语音词汇表的大小,有限词汇识别,无限词汇识别(全音节识别),精,5,语音识别的类型按识别器的类型孤立单词识别连续语音识别连续单,语音识别原理框图,精,6,语音识别原理框图精6,DTW,算法,模板匹配方法的语音识别算法需要解决的一个关键问题是说话人对同一个词的两次发音不可能完全相同,。,设参考模板有,M,帧矢量,R(1),,,R(2),,,R(m),,,R(M),,,R(m),为第,m,帧的语音特征矢量,测试模板有,N,帧矢量,T(1),,,T(2),,,T(n),,,T(N),,,T(n),是第,n,帧的语音特征矢量。,d(T(i,n,),R(i,m,),表示,T,中第,i,n,帧特征与,R,中,i,m,帧特征之间的距离,通常用欧几里德距离表示。,精,7,DTW算法模板匹配方法的语音识别算法需要解决的一个关键问题,三种匹配模式的对比,精,8,三种匹配模式的对比精8,DTW,算法,DTW,是把时间规整和距离测度计算结合起来的一种非线性规整技术,它寻找一个规整函数,i,m,=(i,n,),,将测试矢量的时间轴,n,非线性地映射到参考模板的时间轴,m,上,并使该函数满足:,D,就是处于最优时间规整情况下两矢量的距离,。,精,9,DTW算法DTW是把时间规整和距离测度计算结合起来的一种非,DTW,算法,通常规整函数必须满足如下的约束条件:,边界限制,单调性限制,连续性限制,精,10,DTW算法通常规整函数必须满足如下的约束条件:精10,DTW,算法,DTW,算法的原理图如图把测试模板的各个帧号,n=1N,在一个二维直角坐标系中的横轴上标出,把参考模板的各帧,m=1M,在纵轴上标出,通过这些表示帧号的整数坐标画出一些纵横线即可形成一个网格,网格中的每一个交叉点,(t,i,r,j,),表示测试模式中某一帧与训练模式中某一帧的交汇,。,DTW,算法分两步进行,一是计算两个模式各帧之间的距离,即求出,帧匹配距离矩阵,,二是在帧匹配距离矩阵中找出一条,最佳路径,。,精,11,DTW算法DTW算法的原理图如图把测试模板的各个帧号n=,DTW,算法,精,12,DTW算法精12,DTW,算法,搜索从,(1,1),点出发,对于局部路径约束如图,5-3,,点,(i,n,i,m,),可达到的前一个格点只可能是,(i,n,-1,i,m,),、,(i,n,-1,i,m,-l),和,(i,n,-1,i,m,-2),。那么,(i,n,i,m,),一定选择这三个距离中的最小者所对应的点作为其前续格点,这时此路径的累积距离为:,D(i,n,i,m,)=d(T(i,n,),R(i,m,)+minD(i,n,-1,i,m,),D(i,n,-1,i,m,-1),D(i,n,-1,i,m,-2),精,13,DTW算法搜索从(1,1)点出发,对于局部路径约束如图5-,语音识别系统应用领域,电话通信的语音拨,号,特别是在中、高档移动电话上,,现已普遍的具有语音拨号的功能。随着语音识别芯,片的价格降低,普通电话上也将具备语音拨号的功,能。,汽车的语音控制,对汽车的卫星导航定位系统(,GPS,)的操作,汽车空调、照明以及音响等设备的,操作,同样也可以由语音来方便的控制,。,工业控制及医疗领域,当操作人员的眼或手已经被占,用的情况下,在增加控制操作时,最好的办法就是增,加人与机器的语音交互界面。由语音对机器发出命令,,机器用语音做出应答。,精,14,语音识别系统应用领域电话通信的语音拨号 特别是在中、,语音识别系统应用领域,个人数字助理的语音交互界面,PDA,的体积很小,,人机界面一直是其应用和技术的瓶颈之一。由于在,PDA,上使用键盘非常不便,因此,现多采用手写体识,别的方法输入和查询信息。随着语音识别技术的提高,,语音将成为,PDA,主要的人机交互界面。,智能玩具,家电遥控,用语音可以控制电视机、,VCD,、空调、电扇,、窗帘的操作,而且一个遥控器就可以把家中的电器,皆用语音控起来,。,精,15,语音识别系统应用领域个人数字助理的语音交互界面 PDA的体,语音识别技术的应用发展方向,一个方向是大词汇量连续语音识别系统,,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;,另外一个重要的发展方向是小型化、便携式语音产品的应用,,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用,这些应用系统大都使用专门的硬件系统实现,特别是近几年来迅速发展的,语音信号处理,专用芯片和语音识别,片上系统,的出现。,精,16,语音识别技术的应用发展方向一个方向是大词汇量连续语音识别系统,Thank you!,精,17,Thank you!精17,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!