软件工程-需求分析文档

上传人:daj****de2 文档编号:131924644 上传时间:2022-08-07 格式:DOCX 页数:10 大小:307.57KB
返回 下载 相关 举报
软件工程-需求分析文档_第1页
第1页 / 共10页
软件工程-需求分析文档_第2页
第2页 / 共10页
软件工程-需求分析文档_第3页
第3页 / 共10页
点击查看更多>>
资源描述
手机语音识别系统WVWWWWWWWVw7 7-.W # V W W W W7 7W # V W W W W7 7W # V W W W W需求分析文档摘要伴随着科技进步和全球信息交流的日益扩大,嵌入式设备产品的市场规模在迅猛发 展。追求小体积多功能嵌入式设备的必然趋势,使语音合成、语音识别、手写输入技术在嵌 入式中的应用成了最具吸引力的功能,因此今后嵌入式产品交互应用的竞争已演化成以此三 项关键技术为核心的竞争。语音识别是通过识别和理解过程把人类的语音信号转变为文本或 命令的技术。其根本目的就是研究出一种具有听觉功能的机器,这种机器能直接接受人的语 音,理解人的意图,并做出相应的反应。从技术看,它属于多维模式识别和智能接口的范畴。 语音识别技术是一项集声学、语音学、计算机、信息处理、人工智能等于一体的综合技术, 可广泛应用于信息处理、通信与电子系统、自动控制等领域。WWWWl V V W V V W VWVWWWVWWWVwWVWWWVWWWVw- - - - - - - - -1引言31.1编写目的31.2项目背景31.3参考资料42数据描述42.1数据词典43功能需求53.1功能划分53.2功能描述53.2.1模块名称:语音信号的预处理63.2.2模块名称:特征提取模块73.2.3参考模式库模块(词条模块)83.2.4语音库识别(匹配计算模块)84性能需求104.1数据精确度104.2时间特性104.3适应性101.引言1.1编写目的伴随着科技进步和全球信息交流的日益扩大,嵌入式设备产品的市场规模在迅猛发展。 追求小体积多功能嵌入式设备的必然趋势,使语音合成、语音识别、手写输入技术在嵌入式 中的应用成了最具吸引力的功能,因此今后嵌入式产品交互应用的竞争已演化成以此三项关 键技术为核心的竞争。语音识别是通过识别和理解过程把人类的语音信号转变为文本或命令的技术。其根本目 的就是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并 做出相应的反应。从技术看,它属于多维模式识别和智能接口的范畴。语音识别技术是一项 集声学、语音学、计算机、信息处理、人工智能等于一体的综合技术,可广泛应用于信息处 理、通信与电子系统、自动控制等领域。本文档为手机语音识别系统的设计、实现、测试以及验收提供重要依据,也为评价系统 功能和性能提供标准。本文档可供用户、项目管理人员、系统分析人员、程序设计人员以及 系统测试人员阅读和参考。12项目背景嵌入式语音识别技术15J是指应用各种先进的微处理器在板级或芯片级用软件或硬件实 现语音识别。语音识别系统的嵌入式实现,要求算法在保证识别效果的前提下尽可能优化, 以适应嵌入式平台存储资源少,实时性要求高的特点。实验室中高性能的大词汇量连续语音 识别系统代表当今语音识别技术的先进水平。但是由于嵌入式平台资源和速度方面的限制, 嵌入式实现尚不成熟。而中小词汇量的命令词语音识别系统算法相对简单,对资源的需求较 小,且系统识别率较高,能满足大多数应用的要求,成为嵌入式应用的主选。当前,语音识别技术得到了广泛应用。有些电话机、手机已经包含了语音识别拨号功能, 还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话 网络用语音识别口语对话系统查询机票、旅游、银行信息,并且取得很好的结果。但是可随 身携带的嵌入式语音识别产品在人们的日常生活中尚不多见,该领域具有广阔的市场前景。 在这种背景下,论文旨在根据现实生活需要,在对语音识别的嵌入式实现进行研究和了解的 基础上,进行了基于模板匹配法的特定人、小词汇量语音识别系统研究,应!用于日常生活 中,以方便人们的日常生活、提高人们的生活质量。从人机接口的角度看,就是使人们甩掉 键盘,通过语音命令操作。项目委托单位: 软件工程课程项目项目开发单位: 长春工业大学软件职业技术学院 项目主管部门: 长春工业大学软件职业技术学院13参考资料1. 软件工程文档模版2. Data Base System Concepts (4th edition) Abraham Silberschatz et al.3. Software Engineering: A Prac titio ners Approaehition)Roger S. Pressman2数据描述主程序使能音频模块,从音频模块的缓冲区内读取语音数据到DDR SDRAM存储器中。当音 频模块缓冲区全部为空时,主程序对DDR内的数据进行预处理、端点检测、线性预测倒谱系 数(L PCC)的提取。如果在训练阶段,此时的L PCC系数被当作模板存入到FLASH中。如果 在识别阶段,L PCC系数则会被调入DDR存储器中与测试模板进行模式匹配,并给出识别结 果。模式匹配算法采用动态时间规整(DTW)算法2 2.1数据词典数据从程序内部分离出来,形成独立的外部数据文件。静态数据文件与动态数据文件相互独立,依靠特定程序分别进行参照或存取。静态数据由外部数据文件存放方式 转为数据库存放方式,将以前程序中静态数据对动态数据加工的某些控制关系抽象为静态表 与动态表间关系名字:语音信号信息描述:用户语音输入定义:语音信号=模拟信号+数字信号+语音帧+语音特片+语音特征名字:参考模式库描述:标准语音特征定义:参考模式库=语音特征+语音串内容名字:声学模型描述:标准语音特征定义:声学模型=语音状态+语音矢量3功能需求3.1功能划分本软件具有如下主要模块: 预处理模块 特征提取模块 训练模块 参考模式库模块 相似性度量即识别模块顶层(第0层)数据流图(DFD):3.2功能描述详见第一层数据流图处理后3.2.1模块名称:语音信号的预处理预处理模块,对输入的原始语音信号进行处理,滤除其中的不重要的信息及背景噪音等,进 行语音信号的端点检测,即判定语音有效范围的始点和终点位置,并进行语音分帧以及预加 重等处理工作。语音信号3. 2.2模块名称:特征提取模块特征提取模块,负责计算语音的声学参数,进行特征的计算,取出反映信号特征的关键特征 参数,以降低维数,便于后续处理。语音识别系统常用的特征参数有幅度,能量,过零率, 线性预测系数(LPC)、LPC倒谱系数(LPCC)、线谱对参数(LSP)、短时频谱、共振峰频率、反 映听觉特征的Mel频谱倒谱系数(MFCC)等。特征选择和提取是构建系统的关键。处理后的语音信号模块名称:训练模块功能概述在训练阶段,用户输入若干次训练语音,系统经过预处理和特征提取得到特征矢量参数 (序列),然后通过特征建模模块建立训练语音的参考模式库。在识别阶段,将输入语音的特 征矢量参数和参考模板库中的模式进行相似性度量比较,将相似度最高的模式所属的类别作 为识别中间候选结果输出。后处理模块,是对上述得到的候选识别结果继续处理,通过更多 的识别约束,得到最终结果。3.2.3参考模式库模块(词条模块)功能概述接受用户输入的语音信息,经提取的语音特征并同时从语音库中获取特征值,形成词条模型, 选取匹配提条,并输出。324语音库识别(匹配计算模块)功能概述在语音库识别阶段,将输入语音的特征矢量参数和参考模板库中的模式进行相似性度量比较,将相似度最 高的模式所属的类别作为识别中间候选结果输出。匹配计算模块,是对上述得到的候选识别结果继续处理, 通过更多的识别约束,得到最终结果。4接口需求4.1用户接口需求用户需用麦克风输入数据。4.2硬件接口需求本识别系统是在与Infineon公司合作开发的芯片UniSpeech上实现的。UniSpeech芯片是为 语音信号处理开发的专用芯片,采用0.18“i工艺生产。它将双核(DSPMCU)、存储器、 模拟处理单元(ADC与DAC)集成在一个芯片中,构成了一种语音处理SoC芯片。这种芯 片的设计思想主要是为语音识别和语音压缩编码领域提供一个低成本、高可靠性的硬件平台43软件接口需求声学模型的建立,语音库的建立,手机输出平台4.3通信接口需求需要用麦克风进行输入,输出时候用手机短信编辑状态输出5性能需求5.1数据精确度数据要求必须精确,可靠,真实。进行操作请求时,如:用户语音输入数据与数据库数据的 相匹配性。而在满足用户请求时,系统应保证所响应数据的查全率与查准率。52时间特性为满足用户高效要求,数据的响应时间、更新处理时间、数据转换与传输时间、运行时间都 应在1-2秒之内。如果需要与外设交互(如打印机)时,响应时间可能较长,但应在可接受 范围之内5.3适应性本系统可在多种手机平台应用
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 机械制造 > 机械制造


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!