资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,PPT,模板下载:行业,PPT,模板:,节日,PPT,模板:素材下载:,PPT,背景图片:图表下载:,优秀,PPT,下载:教程:,Word,教程:教程:,资料下载:课件下载:,范文下载:试卷下载:,教案下载:,PPT,论坛:,从语音识别到言语识别,第三组研讨 其一,上海大学研讨课,计算机科学进展,15121856,刘知昊,PART ONE,01,语音识别,&,言语识别,?,语音识别是什么,言语识别是什么,有什么区分呢。,语音,言语交互的一种,载体,。,言语,人类沟通过程中使用的语言。,一个简洁的例子,早上起床看了一下表,嗯,.9,点了,.9,点了?,.9,点了!,言语中含有丰富的信息,并非简洁的文字可以描述。,同样的一个词或一句话,可以通过不同的韵律形式表达出截然不同的情感。,语音识别,&,言语识别,言语识别:把言语转成上述简单言语符号信息的过程。,语音识别:传统意义上的,把言语转成文本,的过程。,王晓波,&,王小波?,PART,TWO,02,语音识别的进展过程,5个进展过程,6种关键技术和4个重要模型。,五个进展过程,(依据识别的结果来看),“,”,这五个进展过程是从识别的结果来看的。固然语音识别的进展过程还可以从其他角度来看。,A,B,C,D,音素识别:1952 年美国 电报公司贝尔试验室的戴维斯等人开发了Audrey系统。,音节识别:1956 年,普林斯顿大学RCA 试验室的奥尔森等人承受同样的技术实现了10 个单音节的识别。,单词识别:1970 年以后,争论的热点主要集中在孤立词识别和连接词识别上。,连接词识别:连接词语音识别和连续语音识别也是穿插进展的两个阶段。,E,连续语音识别,:1975 年前后,Dragon 系统实现了第一个真正意义上的连续语音识别。,从识别的对象来看,特定,-,泛型,从识别的对象看,语音识别经受了特定人语音识别、非特定人语音识别两个阶段。,李开复,从识别的语种来看,特定,-,泛型,从识别的语种看,语音识别,经受了单语种语音识别和多语种,语音识别两个阶段。,多语种又分成独立语种-混合语种。,从识别的环境和词汇量来看,试验-实战,从识别的环境看,语音识别,经受了安静试验室环境、平稳噪,声环境、简单噪声环境等阶段。,从识别的词汇量看,语音识,别经受了小词汇量、中词汇量、,大词汇量、海量词汇量等阶段。,PART,THREE,03,言语识别的关键技术,5个进展过程,6种关键技术和4个重要模型。,1.,声学特征提取技术,共振峰,发音的舌位,语音识别领域产生了很多特征提取算法和改进算法。这些特征主要分为语音学特征、发音机理特征、感知机理特征和几何学特征。,2.区分特征提取技术,使类间方差与类内方差的比值最大化,3.区分度模型训练技术,随机量的概率分布是很难测定的,一般只能测得其各种均值如数学期望、方差等或某些限定条件下的值如峰值、取值个数等,符合测得这些值的分布可有多种、以至无穷多种,通常,其中有一种分布的熵最大。选用这种具有最大熵的分布作为该随机变量的分布,是一种有效的处理方法和准则。这种方法虽有肯定的主观性,但可以认为是最符合客观状况的一种选择。在投资时常常讲不要把全部的鸡蛋放在一个篮子里,这样可以降低风险。,4.大规模声学模型训练技术,利用深度神经网络拿更多的语音数据来对识别模型进展训练,5.大规模语言模型训练技术,利用加权有限状态机网络,6.大规模解码技术,“解码速度有三倍以上的提升。缘由在于,状态数从几千个降到了几十个,减小了网络简单度”,PART FOUR,04,言语识别的重要模型,5个进展过程,6种关键技术和4个重要模型。,1.隐马尔科夫模型,知道骰子有几种隐含状态数量,每种骰子是什么转换概率,依据掷骰子掷出的结果可见状态链,我想知道每次掷出来的都是哪种骰子隐含状态链。,2.多元文法模型,“,这是昨天从这棵树上掉下来的苹果。,”,“,这是昨天的树,”“,树上掉下苹果,”,3.有限状态机,限种已确定的状态已投入多少钱,依据不确定的输入每次投面值不同的钱,在这几种状态中来回转换。,4.深度神经网络,深度神经网络的消失使得识别错误率下降了30%以上。,PART FIVE,05,当下与将来,我们正在走进言语识别时代。,科大讯飞,中国最大的智能语音技术供给商,在智能语音技术领域有着长期的争论积存,并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。,苹果,Siri,移动互联网是语音识别技术有用化的催化剂,通过移动互联网收集的语音,各个机构的语音识别性能快速得到提升。,待解决的问题,&,展望,抑制噪声环境、语音语调,识别率,语境、语义等深层次信息的挖掘,THANK YOU!,
展开阅读全文