软件工程-需求分析文档

资源描述

手机语音识别系统WVWWWWWWWVw7 7-.W # V W W W W7 7W # V W W W W7 7W # V W W W W需求分析文档摘要伴随着科技进步和全球信息交流的日益扩大，嵌入式设备产品的市场规模在迅猛发展。追求小体积多功能嵌入式设备的必然趋势，使语音合成、语音识别、手写输入技术在嵌入式中的应用成了最具吸引力的功能，因此今后嵌入式产品交互应用的竞争已演化成以此三项关键技术为核心的竞争。语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。其根本目的就是研究出一种具有听觉功能的机器，这种机器能直接接受人的语音，理解人的意图，并做出相应的反应。从技术看，它属于多维模式识别和智能接口的范畴。语音识别技术是一项集声学、语音学、计算机、信息处理、人工智能等于一体的综合技术，可广泛应用于信息处理、通信与电子系统、自动控制等领域。WWWWl V V W V V W VWVWWWVWWWVwWVWWWVWWWVw- - - - - - - - -1引言31.1编写目的31.2项目背景31.3参考资料42数据描述42.1数据词典43功能需求53.1功能划分53.2功能描述53.2.1模块名称：语音信号的预处理63.2.2模块名称：特征提取模块73.2.3参考模式库模块（词条模块）83.2.4语音库识别（匹配计算模块）84性能需求104.1数据精确度104.2时间特性104.3适应性101.引言1.1编写目的伴随着科技进步和全球信息交流的日益扩大，嵌入式设备产品的市场规模在迅猛发展。追求小体积多功能嵌入式设备的必然趋势，使语音合成、语音识别、手写输入技术在嵌入式中的应用成了最具吸引力的功能，因此今后嵌入式产品交互应用的竞争已演化成以此三项关键技术为核心的竞争。语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。其根本目的就是研究出一种具有听觉功能的机器，这种机器能直接接受人的语音，理解人的意图，并做出相应的反应。从技术看，它属于多维模式识别和智能接口的范畴。语音识别技术是一项集声学、语音学、计算机、信息处理、人工智能等于一体的综合技术，可广泛应用于信息处理、通信与电子系统、自动控制等领域。本文档为手机语音识别系统的设计、实现、测试以及验收提供重要依据，也为评价系统功能和性能提供标准。本文档可供用户、项目管理人员、系统分析人员、程序设计人员以及系统测试人员阅读和参考。12项目背景嵌入式语音识别技术15J是指应用各种先进的微处理器在板级或芯片级用软件或硬件实现语音识别。语音识别系统的嵌入式实现，要求算法在保证识别效果的前提下尽可能优化, 以适应嵌入式平台存储资源少，实时性要求高的特点。实验室中高性能的大词汇量连续语音识别系统代表当今语音识别技术的先进水平。但是由于嵌入式平台资源和速度方面的限制, 嵌入式实现尚不成熟。而中小词汇量的命令词语音识别系统算法相对简单，对资源的需求较小，且系统识别率较高，能满足大多数应用的要求，成为嵌入式应用的主选。当前，语音识别技术得到了广泛应用。有些电话机、手机已经包含了语音识别拨号功能, 还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询机票、旅游、银行信息，并且取得很好的结果。但是可随身携带的嵌入式语音识别产品在人们的日常生活中尚不多见，该领域具有广阔的市场前景。在这种背景下，论文旨在根据现实生活需要，在对语音识别的嵌入式实现进行研究和了解的基础上，进行了基于模板匹配法的特定人、小词汇量语音识别系统研究，应!用于日常生活中，以方便人们的日常生活、提高人们的生活质量。从人机接口的角度看，就是使人们甩掉键盘，通过语音命令操作。项目委托单位：软件工程课程项目项目开发单位：长春工业大学软件职业技术学院项目主管部门：长春工业大学软件职业技术学院13参考资料1. 软件工程文档模版2. Data Base System Concepts (4th edition) Abraham Silberschatz et al.3. Software Engineering: A Prac titio ners Approaehition)Roger S. Pressman2数据描述主程序使能音频模块，从音频模块的缓冲区内读取语音数据到DDR SDRAM存储器中。当音频模块缓冲区全部为空时，主程序对DDR内的数据进行预处理、端点检测、线性预测倒谱系数(L PCC)的提取。如果在训练阶段，此时的L PCC系数被当作模板存入到FLASH中。如果在识别阶段,L PCC系数则会被调入DDR存储器中与测试模板进行模式匹配，并给出识别结果。模式匹配算法采用动态时间规整(DTW)算法2 2.1数据词典数据从程序内部分离出来，形成独立的外部数据文件。静态数据文件与动态数据文件相互独立，依靠特定程序分别进行参照或存取。静态数据由外部数据文件存放方式转为数据库存放方式，将以前程序中静态数据对动态数据加工的某些控制关系抽象为静态表与动态表间关系名字：语音信号信息描述：用户语音输入定义：语音信号=模拟信号+数字信号+语音帧+语音特片+语音特征名字：参考模式库描述：标准语音特征定义：参考模式库=语音特征+语音串内容名字：声学模型描述：标准语音特征定义：声学模型=语音状态+语音矢量3功能需求3.1功能划分本软件具有如下主要模块：预处理模块特征提取模块训练模块参考模式库模块相似性度量即识别模块顶层（第0层）数据流图（DFD）：3.2功能描述详见第一层数据流图处理后3.2.1模块名称：语音信号的预处理预处理模块，对输入的原始语音信号进行处理，滤除其中的不重要的信息及背景噪音等，进行语音信号的端点检测，即判定语音有效范围的始点和终点位置，并进行语音分帧以及预加重等处理工作。语音信号3. 2.2模块名称：特征提取模块特征提取模块，负责计算语音的声学参数，进行特征的计算，取出反映信号特征的关键特征参数，以降低维数，便于后续处理。语音识别系统常用的特征参数有幅度，能量，过零率, 线性预测系数(LPC)、LPC倒谱系数(LPCC)、线谱对参数(LSP)、短时频谱、共振峰频率、反映听觉特征的Mel频谱倒谱系数(MFCC)等。特征选择和提取是构建系统的关键。处理后的语音信号模块名称：训练模块功能概述在训练阶段，用户输入若干次训练语音，系统经过预处理和特征提取得到特征矢量参数 (序列)，然后通过特征建模模块建立训练语音的参考模式库。在识别阶段，将输入语音的特征矢量参数和参考模板库中的模式进行相似性度量比较，将相似度最高的模式所属的类别作为识别中间候选结果输出。后处理模块，是对上述得到的候选识别结果继续处理，通过更多的识别约束，得到最终结果。3.2.3参考模式库模块（词条模块）功能概述接受用户输入的语音信息,经提取的语音特征并同时从语音库中获取特征值，形成词条模型, 选取匹配提条，并输出。324语音库识别（匹配计算模块）功能概述在语音库识别阶段，将输入语音的特征矢量参数和参考模板库中的模式进行相似性度量比较，将相似度最高的模式所属的类别作为识别中间候选结果输出。匹配计算模块，是对上述得到的候选识别结果继续处理, 通过更多的识别约束，得到最终结果。4接口需求4.1用户接口需求用户需用麦克风输入数据。4.2硬件接口需求本识别系统是在与Infineon公司合作开发的芯片UniSpeech上实现的。UniSpeech芯片是为语音信号处理开发的专用芯片，采用0.18“i工艺生产。它将双核（DSPMCU）、存储器、模拟处理单元（ADC与DAC）集成在一个芯片中，构成了一种语音处理SoC芯片。这种芯片的设计思想主要是为语音识别和语音压缩编码领域提供一个低成本、高可靠性的硬件平台43软件接口需求声学模型的建立，语音库的建立，手机输出平台4.3通信接口需求需要用麦克风进行输入，输出时候用手机短信编辑状态输出5性能需求5.1数据精确度数据要求必须精确，可靠，真实。进行操作请求时，如：用户语音输入数据与数据库数据的相匹配性。而在满足用户请求时，系统应保证所响应数据的查全率与查准率。52时间特性为满足用户高效要求，数据的响应时间、更新处理时间、数据转换与传输时间、运行时间都应在1-2秒之内。如果需要与外设交互（如打印机）时，响应时间可能较长，但应在可接受范围之内5.3适应性本系统可在多种手机平台应用

展开阅读全文

软件工程-需求分析文档

最新文档