电子信息工程基于智能语音识别控制技术的垃圾分类系统设计与实现

资源描述

广东东软学院本科毕业设计（论文）基于智能语音识别控制技术的垃圾分类系统设计与实现Design and implementation of garbage classification system based on intelligent speech recognition control technology 摘要随着中国社会的不断发展，中国环境污染问题日益严重，生活垃圾随着人口的增长越发增加。如今人们对生活环境逐渐重视起来，国家也开始深度倡导垃圾分类，进行垃圾的回收利用，但由于群众对于垃圾分类的认识度普遍不高，难以实现大范围垃圾分类规范化的目标；本设计主要分为硬件设计和软件设计。硬件部分将用到STM32F103微处理器模块、LD3320语音识别模块、JQ8900语音输出模块、舵机。主要是采用语音识别技术，通过对声音信号的处理，控制垃圾桶的运作。用户说出垃圾名称，LD3320中根据语音的信息进行预加重、加窗分帧、端点检测的方法来处理语音信号，再进行语音转文本和比对关键词的操作进行识别用户所提供的垃圾名称属于哪一类垃圾。软件部分主要是控制对垃圾桶开关的驱动、语音的匹配处理、音频的交互式输出，由此完成人机交互式的智能语音垃圾桶的语音控制功能，呼叫可应答。此次设计可以广泛运用于大城市的家庭当中，能有效缓解大城市中垃圾分类处理能力和人们垃圾分类知识不相匹配的矛盾，日常家庭使用十分便利，还可以有垃圾分类的教育学习效果。这对提升国民垃圾常识有极大的帮助，更能为国家文明卫生城市的建设出一份力，同时在市场上有较好的前景。关键词： LD3320模块 STM32F103 垃圾分类AbstractWith the continuous development of Chinese society, the problem of environmental pollution in China is becoming more and more serious. Nowadays, people pay more and more attention to the living environment, and the country has started to advocate garbage classification and recycling. However, because the general public has a low awareness of garbage classification, it is difficult to achieve the goal of standardizing large-scale garbage classification. Designed for hardware and software. The hardware part will use STM32F103 microprocessor module, LD3320 speech recognition module, JQ8900 speech output module, and steering gear.It mainly USES speech recognition technology to control the operation of garbage cans by processing sound signals. The user speaks the name of the junk. In the LD3320, pre-emphasis, windowing, and endpoint detection are used to process the voice signal based on the information of the voice. Then the operation of voice-to-text and keyword comparison is used to identify the junk name provided by the user. What kind of garbage it belongs to. The software part mainly controls the driving of the trash can switch, voice matching processing, and interactive audio output, thereby completing the voice control function of the intelligent voice trash can with human-computer interaction, and the call can be answered.The design can be widely applied to families in big cities and effectively alleviate the contradiction between the garbage classification and disposal ability of residents in big cities and their garbage classification knowledge. The daily household use is very convenient, and it can also have the effect of education and learning of garbage classification. It is of great help to raise the awareness of national waste and build a civilized and healthy city, with a good market prospectKeywords:LD3320 module STM32F103 garbage classification;目录第1章绪论11.1 课题研究背景及意义11.2 国内外语音识别技术研究现状21.2.1 国外语音识别技术研究现状21.2.2 国内语音识别技术研究现状31.3 选题背景和研究内容31.4 论文主要工作和结构安排3第2章语音识别技术52.1 语音识别技术概述52.2 语音信号的预处理62.2.1 语音信号的预加重62.2.2 语音信号加窗分帧62.2.3 语音信号端点检测62.3 语音信号的特征值提取72.4 语音识别模型9第3章系统硬件设计103.1 系统整体设计框图103.2 微处理器模块103.3 LD3320型号语音识别模块设计123.1.1 LD3320语音识别芯片简介123.3.2 LD3320语音识别芯片运行过程133.3.4 关于提高识别准确度的方法133.4 JQ8900语音芯片模块143.4.1 JQ8900语音芯片模块介绍14第4章系统软件设计154.1 软件设计思路154.2 语音识别程序设计154.3 STM32主程序设计17第5章系统测试205.1 测试用具205.2 硬件测试205.3 软件测试22第6章总结与展望266.1 总结266.2 展望26参考文献28致谢29附录30第1章绪论1.1 课题研究背景及意义中国的发展如觉醒的雄狮，越发迅速，而产生的垃圾越发增多，同时大量垃圾所产生的污染问题和处理难题也随之而来。不一样的垃圾只有采用不一样的方法处理，才能最大化地无污染处理垃圾。如果可以得当地处理生活废物，就可以增加土地利用率。一些塑料类制品在土地中难以被分解，这就会土壤收到污染。对垃圾有效分类处理之后，这些污染问题就可以极大程度地得到解决。对于垃圾的处理方式，我们过国家大多是使用土壤掩埋的方式，这样就使得土地被占用。并且会吸引虫害，污染空气。如果想要对这些垃圾进行更加充分合理地处理，就需要用到垃圾分类，这可以使土壤得到解放，提高土地利用率。有些生活上被遗弃的物品例如废纸、塑料瓶、废旧金属等，都可以变废为宝，再生再利用。伴随着国民生活水平的提高，丰富的日产生活也伴随这更高的垃圾废物产出。根据统计的数据显示，2019年上海平均每人每天生产1.05公斤的垃圾。面对日益增加的垃圾生产速度，需要对这庞大的垃圾进行处理，而垃圾的处理，正确且环保的最佳方式是根据垃圾种类的不同，使用垃圾分类的方法进行回收，后期再针对不同的垃圾进行不同的方式处理，如垃圾再生法、垃圾堆肥法、垃圾生物降解法，这样才能更好地保护土地不被污染和促进资源的再生使用。但是垃圾处理的难度不在于技术上的缺失，而是在于人们普遍缺乏垃圾分类的意识和知识。为了进一步响应国家号召，需要极大程度上地提高人们对于垃圾分类方面的知识。对于垃圾分类来说，家庭应该是垃圾分类的第一大的接触群体，如果家庭中的垃圾可以分类打包，再扔进小区或垃圾站中，将可以极大程度得增加垃圾分类处理的处理效率。对此，人们需要一个时刻帮助他们在丢垃圾时对垃圾进行分类的智能产品。针对这一现象，本文提出了一个人性化、智能化的设计智能语音控制垃圾分类垃圾桶。语音控制技术当中最重要的一个环节就是语音的识别，需要较为快速精准地从当前使用环节中识别出使用者所提供的的语音资料进行分析处理，再做出应答。近年来，语音控制技术在产品和生活中的应用越来越成熟，但是还是有很多尚未解决的问题，比如中长距离识别问题、识别效率问题、抗干扰问题等等。在今天看来，语音识别技术再当今社会中，有着重要的研究发展地位，其技术之下的产品也有着较高的实用价值。图1-1 城市垃圾产量排行及处理方式1.2 国内外语音识别技术研究现状1.2.1 国外语音识别技术研究现状对于语音识别技术的发展来说，国外在较早期的时候，就有人对语音识别技术做出了研究。20世纪60年代中期，出现了一批专门研究语音识别技术的科学家，并且他们发现了很多有关于数字信号处理的有关处理方法，比如快速傅立叶变换（FFT）、时频分析、数字模拟滤波器等，这对后续的语音识别技术的发展提供了坚实有力的技术基础。20世纪70年代以后，线性预测技术（LPC）的概念逐渐提出。这项对于数字信号处理有着重要的作用，成为当时研究人员处理信号特征信息时的重要方法，且衍射到了其他更多的技术领域。在20世纪的末期，有一种新的技术开始被使用，就是矢量量化（VQ），其慢慢地被人们应用于语音信号处理当中。此项技术主要是基于聚类分析的新型高效数据压缩技术。与此同时，科学家们也发现了另一个用于描述语音信号的技术模型隐马尔代夫模型。这项技术的出现不仅是的后期语音信号处理技术的更迅速地发展起来，更时慢慢成为了绝大部分的研究基石。再到后来，越来越多的公司加入到语言识别技术的研究当中来，并研究出了部分实用性较高的产品。在语音识别产品中要求其需要有较高的准确度，后来慢慢将准确率作为识别技术中重要的评价标准之一，同时这一标准也在后来的探索实践中慢慢地更新升级。1.2.2 国内语音识别技术研究现状早在二十世纪中期，我国就开始了对于语言识别技术的研究，并且完成了的从研究室到生产应用整个过程。之后，国家为了鼓励此技术的发展研究，专门设立了两年滚动一次的语言识别技术研究项目。迄今为止，中国和其他国家对于语音识别技术的掌握已经没有太大的差距。对于我国来说，中国话的语音识别技术非常具有独特的优势和水平，而且在各国的相同技术中也属于高科技含量的技术。我国在许多高等院校都有设立科研单位去深入开发语言识别技术，其中多所院校的成果得到了国家的肯定，且被列入了国家级的重点项目。在众多的语言识别技术研究所当中，清华大学的一个小组获得了较大的突破，其研发的一项语言识别产品有着非常之高的准确度，对于各种数字串的识别都有着高达百分之九十五的准确率，在世界各国所研究的语言识别产品中，这已经成为最优秀的设计之一。一直到了2002年，中科院方面协同其附属公司在语言识别产品方面的研发初见完工，且发布了一款名叫PattasrD 产品，它可以在多种平台和应用中使用。这款产品的发布，结束了1998年以来中国语音识别产品被外国公司垄断的困境。1.3 选题背景和研究内容自我国研究和开发语音识别技术以来，这项现在也已经成为较为成熟的领域，随着社会的发展，语音识别技术下开发的产品也渐渐走进了社会生活当中。交互式的语音交流对服务类的智能产品来说是较为必要的。而对于语音的运用中，却极少有专门用来解决垃圾分类处理的产品，此次研究的内容和选题正是根据当今中国所存在的问题和发布的政策的基础上，对语音识别技术的实际运用。此次研究主要针对单片机的操作和语音识别技术的整个工作流程进行探讨，利用软件和硬件相搭配的方式操作整个系统的运行，以提高交互性和实用性，达到较高的实用水平。1.4 论文主要工作和结构安排本文主要围绕搭建的垃圾分类系统，探讨和研究语音识别的主要处理过程，总的流程图如下所示，文章主要分为6个章节第一章：主要为绪论部分，主题内容为讲述了本次系统设计中主要技术的语音识别技术的研究过程，以及世界当中对音乐识别技术的发现与研究，同时阐述了本次论文编写工作的工作安排等。第二章：从整体的角度上面较为详细地阐述了语音识别技术的主要部分。还讲述了语音信号的特征值提取以及识别模型，最后实现信息匹配。为后续硬件和软件设计部分打下基础。第三章：主要为系统硬件设计的内容，主要包括框图的设计和各个模块的选择以及介绍。围绕着LD3320、STM32F103、JQ8900来讲述整个系统的设计过程。第四章：主要为系统的软件设计，分为STM32的响应执行、LD3320的识别交互、JQ8900的语音输出部分，讲述整个系统的内部程序具体实现过程。第五章：为系统测试环节。测试本次设计的系统识别率以及是否有异常反应的问题，得出较为准确的结论来总结此次设计的系统是否可靠。第六章：再次讨论此次论文撰写和系统设计的整体情况以及不足之处，根据情况提出进一步的改进意见，希望未来能在此研究上有所完善。第2章语音识别技术2.1 语音识别技术概述对于日常生活来说，语言是人与人之间的一种重要的沟通方式，在人与机器之中如果想要通过语言交流，那么就要用到语音识别技术。此技术是以交流用语为研究和处理的对象，通过对语音信号多重处理，转化为机器用语，再做出对应的相应，以达到让机器人“听人话”的目的。语音识别技术可以让人摆脱键盘和操作装置的束缚，使用更加自然的、人性化的沟通语言进行输入操作。在这样的优势之下，语言控制技术也逐渐变成了信息技术中的一项关键技术。现如今语音识别技术的系统分类大致可以分为如下几类。（1）按语音提供者与系统的关系上看：a. 单体特定语音识别系统。即仅考虑专门用户提供的语音进行识别。b. 非单体特定语音识别系统。即语音提供者可以是任意用户。c. 多人语音识别系统。即可以识别多人同时提供的语音信息。（2）按语音提供者的说话方式考虑：a. 孤立词语音识别系统。即每个词语的识别需要孤立输出，输入时每个词需有所停顿。b. 连续词语语音识别系统。即在词语发音清晰的情况下可以较为连贯地输入。c. 通用语音识别系统。即可以识别更加自然的用户语言数据，可以不被方言、连音所干扰而使识别率下降。（3）从系统识别的单词量上看：a. 小型词汇量语音识别系统。可识别的词语数大概在数十个至数百个之间。b. 中型词汇量语音识别系统。可识别的词语数大概在数百个至数千个之间。c. 大型词汇量语音识别系统。可识别的词语数大概在数万个以上，此系统对于计算机的配置和运算能力有较高的要求。语音识别的分类也会随着时代的进步不断更新和增加。本次的设计的系统主要为非个人特定的、连续词语的、中型词汇量的语音识别系统。系统总体性能较为接近实用型。2.2 语音信号的预处理对于语音识别技术最开始的部分，需要接受杂质较多的原始语音流进行最初的处理操作，而预处理的目的就是减少语音信号中其他干扰语音流，如：噪音干扰和呼吸所产生的气流声等对信号整体质量的影响。其中包括信号的预加重、加窗分帧和端点检测等过程。2.2.1 语音信号的预加重在一般自然情况下，对于语音流来说，信号的能量在高频的地方较为不稳定，容易产生信号衰弱的情况，而低频的部分是处在比较平稳的状态。而此项操作主要就是为了增强语音流信号当中高频的频段，让整体的信号可以更加趋于稳定，进而可以减少噪声影响，提高识别的信噪比。预处理可以使得有用的高频段的频谱质量得到提升，弥补因信号发出后一段时间内随时的频谱信号，以便后续进行频谱分析和相关特征参数提取时的准确度。以数字滤波器为例，对语言信号进行预加重处理。则R（n）经过滤波器后的信号与S(n)预加重前语音信号的关系式（2-1）为：R(n) = S(n) - 0.9375 S(n-1) （2-1）2.2.2 语音信号加窗分帧一般条件下，时间也会对信号产生一定的影响，但在正常情况中，语音信号在10ms到30ms时间长度内是相对稳定的。而分帧处理则是根据语音信号具有这样的特性，我们将语音信号分成一段段来分析，这样可以得到更加稳定的语言信号。一般来说，加窗函数是可以用来处理帧内语音信号。具体操作是将语音信号与加窗函数进行相乘，形成加窗语音信号。窗函数可以有多种选择，比如三角窗、汉明窗、矩形窗等。对于常用的处理方法，我们一般来说会采用汉明窗与矩形窗的形式，其所需的表达式为：汉明窗表达式（2-2）：（2-2）矩形窗表达式（2-3）：（2-3）2.2.3 语音信号端点检测系统在获取语音信号的时通常会夹杂着一些不需要的信号，此项检测过程主要就是针对这种现象，通过找到语音信号中开始和结束的两个端点。然后根据这两个端点，进行适当的提取分离操作，得出我们真正需要的语音信号。这个操作可以为后续的识别做基础，有效地提高了识别时的准确度。这里可以用语音信号的短时能量和过零率来进行判断。语音信号的短时能量定义式（2-4）为：（2-4）其中N代表窗长，(n-m)为窗函数，则语音信号的短时过零率定义式（2-5）为：（2-5）其中，关于汉明窗函数(n)和符号函数sgn 的相关定义式（2-6）为：（2-6）2.3 语音信号的特征值提取对于进行预处理完成后的信号，还需要对其进行特征值的提取，在提取时需要满足以下条件：需要可以明确表现出语音信号的特性。需要尽量包含较少的特征量。提取方法尽可能简便，减少提取的复杂度和时间。我们常用的提取特征值的方法中，一般为线性预测倒谱系数（LPCC），线性预测系数（LPC）、梅尔频率倒谱系数（MFCC）。在此就以梅尔频率倒谱系数方法为基础，对信号进行特征值提前操作。MFCC提取特征值的基本原理是利用人耳的听觉感知和倒谱的解的相关性，这样做可以有较为良好的抗噪和识别能力。他的的转换如下（2-7）所示：（2-7）MFCC的提取过程如下图2-1所示：图2-1 MFCC的提取过程具体过程如下：（1）信号在预处理完成之后，将信号进行傅里叶变换（FFT），公式（2-8）如下：（2-8）（2）求频线能量，公式（2-9）如下：（2-9）（3）计算出每帧谱线能量经过M个梅尔滤波器后的能量值，公式（2-10）如下：（2-10）其中，关于梅尔滤波器频率响应Hm（k）的相关表达式（2-11）如下所示：（2-11）其中，(m)为中心频率，m=0,1,2,L,M-1。（4）信号在通过了梅尔滤波器之后再进行离散余弦变换（DCT），就可以求得MFCC的相关参数，计算公式（2-12）如下所示（2-12）其中，l为第l阶段参数。在一般情况下，他的阶数越高，所得到的性能就越高，但是计算量随之逐渐增加。2.4 语音识别模型语音识别模型的发展至今为止以及多种多样，其在语音识别的应用上，大多数都是基于特定识别模型的。我们现如今常用的识别模型主要有：隐马尔科夫模型（HMM）、矢量量化方法（VQ）、动态时间规程模型（DTW）、支持向量机分类模型（SVM）、ANN模型等。第3章系统硬件设计3.1 系统整体设计框图对于系统的整体设计而言，需要考虑系统如何对人声进行识别，对此，本次设计通过语音识别技术，对人产生的语音流进行识别，从而发出对应指令控制想用的舵机开合垃圾桶。其中主要的硬件设备有STM32F103C8T6核心板、LD3320语音识别模块、JQ8900语音播报模块、SG90舵机、扬声器。主要工作流程为用户提供关键词唤醒系统后，系统做出启动应答，即可输入所需丢弃的垃圾名称。系统将接收到的语音收入LD3320模块，经过一系列的处理过后发送信息给STM32F103C8T6核心板单片机，单片机根据LD3320提供的关键词信息控制14号舵机运作，从而完成开合垃圾桶操作。与此同时，单片机驱动JQ8900语音播报模块合成输出的语音信息到扬声器，做出反馈播报，表示一次正常操作的结束。具体流程见结构图3-1。图3-1 系统操作流程3.2 微处理器模块在微处理器的选择上面，为了流畅且有效率地完成整个系统的所有操作，此次设计采用的是STM32F103C8T6核心板。这一世款STM公司生产新一代的低功耗、高效率的单片机，下面将会围绕这个芯片做详细的介绍。（1）本单片机采用的是知名的ARM内核，这就使得其MCU可以同时兼容ARM工具和软件。除此之外他还有一个功耗和成本都相对较低平台，这不仅仅使其了优秀的中断响应，还未其带来了更高的计算效率。其内核使用的是32位的处理器，可以高效的识别处理代码，增加了运行效率。其内置的静态随机存取存储器可以使得CPU几乎可以以极快的速度进行读取操作，非常便利。（2）本单片机中有着四十余个中断通道和十多个高优先级的中断控制器，这就可以使得其的中断处理非常迅速。同时在外部设置的近二十个边缘检测器，可以处理各种收到的中断请求。其出触发条件多种多样，可以自由设置由上升、下降、双边沿触发，可以独立触发也可以屏蔽，非常灵活可变通。对于过多的中断同时请求的情况，可以被一个单独的寄存器挂起，根据优先程度排序处理。（3）看门狗是可以进行独立设置，内部设置了时钟振荡器，由主时钟驱动运作，可独立工作，所以即使在关机的情况下也能保持正常工作。如果在运行过程中出现某些故障，看门狗可以对系统进行重启，具有监控报警的作用。（4）可控制的I2C总线有两条，支持双向寻址，这样可以搞笑运行代码。也可以切换模式，一般来说是标准模式，在需要更快地运行时也可以设置成快速模式。（5）该处理器上安装了两个数模转换器，一般来说可以使用十六个通道进行工作。在运行，其可以机器精准地观察者通道内的情况，自动对信号进行转换，如果发生超出设定上限的情况时，也会进行冲断请求来终止错误运行。总的来说，本单片机非常适合本次系统设计，无论是从性能还是从开发效率以及先进程度来说，都是非常优秀的一款单片机。使用这款单片机，可以非常顺畅地完成庚哥系统的运行。STM32F103C8T6的主要原理图如下图3-2所示：图3-2 STM32F103C8T6主要原理图3.3 LD3320型号语音识别模块设计3.1.1 LD3320语音识别芯片简介本设计当中，需要用到语音识别技术，而在整体系统中，选择了LD3320语音识别模块，由此模块对人声进行识别操作。这是一款低功耗和高效能的芯片，同时具有出色识别效率和准确性的芯片。在使用上，他完全可以单独使用完成程序的执行，也可以链接其他的系统，实现通讯运行和其他的控制功能。识别流程图如下图3-3所示：图3-3LD3320语音识别主要流程图语言识别芯片简单逻辑电路图如下图3-4所示：图3-4 LD3320简单逻辑电路图3.3.2 LD3320语音识别芯片运行过程由于LD3320芯片有可离线操作的特性，其可以识别的指令会收到内存的影响而变得有所限制。但是对于本次系统来说，用户想要实现迅速、流畅、较全面得交互式体验式完全最够的。在芯片内部，需要先设置好与所需识别的语音关键词相应的拼音排列。在用户发出提前设置好的唤醒信号时，系统才会被唤醒，芯片会根据用户输入的语音信号，对收集到的语音信息进行一系列的语音分析操作，最终得出的识别结果会根据此前输入拼音字符串进行逐一比对，最后得出匹配度最高的关键词，再将信息转换成对应的识别码反馈给单片机，由单片机做出后续操作。同时LD3320会继续回到起始状态，继续准备接收下一条语音指令信号。具体流程图如下图3-5所示：图3-5 LD3320运行过程图3.3.4 关于提高识别准确度的方法（1）使用二级或多级口令。使用多级口令可以在平时环境下减少误触发的可能，同时在一级口令被识别之后，系统会有更好的准备识别所需语音信息。（2）在噪声相对较低的地方运行。周围的噪声干扰对系统识别语音信息有着非常大的影响。这会直接影响到最终识别结果的准确性，所以在安静环境下更有利于系统的运行。（3）增加意思相近的关键字。对于本次同来说，识别的语音信息较为固定。为了提高系统的实用性，可以增加更多的词来表示同一种物品，这样可以使系统的识别更加全面和准确。（4）保证系统有充足的工作电源。电源对于整个语音识别系统来说是至关重要的一个部分，没有正常的电源提供则无法启动相应的功能模块正常工作。3.4 JQ8900语音芯片模块3.4.1 JQ8900语音芯片模块介绍这是一款非常优秀的处理模块，自身安装了优质的内核，可以非常稳定、高效、低功耗地实现各种功能。其可以有多种控制方式，比如开关、播放器、单片机等。在一定情况下可以智能生成控制命令，不需要太多的精力去调整测试，对于新手可以非常快速地学习、掌握和使用。他的使用范围也是非常广泛，几乎可以适用于各种条件不是非常恶劣的场所，对于一般的系统设计都可以应用。对于语言识别来说，声音的播放质量也是至关重要的一项指标。JQ8900对于语言质量的要求较为严格，可以支持6000HZ以上22000HZ以下的声音文件的播放，播放效果与源文件几乎没有差别。对于JQ8900的使用，可以将其当作U盘操作，不需要其他的操作去执行内容的变更。 JQ8900主要原理图如图3-6所示：图3-6 JQ8900主要原理图第4章系统软件设计4.1 软件设计思路对于此次系统设计而言，需要用到部分软件编程设计，主要是运用C语言控制单片机，这也是最为常见的一种变成语言，它的好处是在于现如今C语言的应用较为广泛，目前的开发程度也较高，可以有更多的参考资料可供开发者使用，而且其自身对于单片机的要求并不高。所以本词系统的软件部分主要使C语言编程。本次系统中需要运用到软件编程驱动的模块主要有STM32F103C8T6单片机、LD3320语言识别模块、JQ8900语音播报模块、SG90舵机。按照模块化简单分类，主要程序、语音识别程序、语音播放程序、舵机驱动程序。4.2 语音识别程序设计在系统中，语言识别部分是最为主要的部分之一，其程序编程也是最为主要的一环。它直接控制的是LD3320语音识别芯片，同时也有部分与单片机的数据交互。首先，需将系统进行初始化，对于一些寄存器和变量需要赋予无关后续判断的初值，保证程序无干扰运行。寄存器设置如下图4-1所示：图4-1 寄存器设置在完成了初始化寄存器后，在进行串口和中断方面的相关设定。随后就是ASR识别部分程序。首先需要启动ASR识别程序，对ASR进行初始化，然后把一些垃圾类型写入到LD3320芯片内，完成之后开启ASR识别功能。在这当中每次进行一个环节都会设定一个函数LD_Reset( )去检测芯片内部是否出现异常，如果出现异常，则会重新启动LD3320芯片，在系统重启五次之后则会反馈0说明启动是吧，出现内部故障无法启动。这样可以保证芯片的芯片如果出现问题可以及时发现改正。相关开启程序与流程图如下图4-2、图4-3所示：图4-2 ASR启动程序图4-3启动程序流程图如果LD3320模块感应到语音流信息时，则其将发送中断到相关函数中，功能是再次验证此次识别程序有无正常得出相关信息。当未得到有用信息时，则须重新配置相关变量，等待再次接收信号。最后根据识别的结果返回对应的识别码，完成识别模块的一系列操作。主程序如图4-4所示：图4-4 main函数主要程序4.3 STM32主程序设计STM32主程序主要是根据LD3320识别语音流数据后得到的识别码，控制相对应的舵机和语音播报。主程序运行流程图如图4-5所示图4-5主程序运行流程图SG90舵机的主要用途是用于控制垃圾桶的开合，总共有四个，分别控制湿垃圾、干垃圾、有害垃圾、可回收垃圾。在舵机的控制上，主要采用的是PWM信号，通过调节占空比来调节舵机转动。JQ8900语音播报模块主要是用于播放互动性的语音信息。驱动时需要先对端口设置一个低电平，然后进行一段时间的延时再设置为高电平，就可以完成对应的语音播放。在主程序，需要有对应的延时函数，PWM信号定义和初始化，舵机的复位等，作为系统开始正式运作之前的准备。然后根据传入的识别码，分别选择不同的垃圾桶，对应不同的操作。首先是将JQ8900模块进行唤醒，然后根据识别码向对应语音播报端口发送低电平信号，同时使用PWM信号启动舵机转动。完成之后将识别码归零操作以便下次识别，防止死循环。舵机标志为1，进入舵机复位函数使舵机控制的垃圾桶打开数秒后自动关闭，增加自动化程度。最后延时一点时间，发送高电平到先前操作的语音播报端口。整个环节结束。 STM32主函数主要程序框图如图4-6所示：图4-6 STM32主函数主要程序框图第5章系统测试5.1测试用具硬件测试仪器：万用表、电源软件测试仪器：无被测相关对象：湿垃圾菜叶、饼干、蛋壳、玉米、面包干垃圾旧浴缸、猫砂、橡皮泥、尿不湿、贝壳有害垃圾电池、打火机、创可贴、酒精、油漆可回收垃圾易拉罐、报纸、旧书包、旧鞋子、牛奶盒5.2硬件测试硬件方面的测试主要检查电路中的通电和各个元器件是否正常。由于模块与模块之间的电路焊接主要是运用手工焊接，可能会有部分焊接点出现空焊或虚焊的问题，也有可能在一些引脚密集处出现连焊的问题。所以需要检测系统在电路上面的顺畅链接程度。测试方法为将万用表调节为通断检测档，双手持用黑红两色表笔，分别架在对两个模块之间手工焊接的两端，如果万用表发出“滴”的声音，则说明两端焊接正常。如果声音断断续续，则可能有接触不良的现象，需要进行加锡或重新焊接的工作。如果没有声音，则需要根据现场情况判断短路电路的修复方法。系统焊接图如图5-1所示图5-1 实物焊接图整个系统正面图如图5-2所示：图5-2 系统正面图LD3320语音识别模块有其自身专门的检测流程。其在正常供电情况下时通过使用者通过串口测试工具内的功能信息，面向模块说一句“小杰”，当模块中的D1灯发光之后，再说出下一级指令，重复多次操作，如识别无误，则模块可正常使用。如果有误，则需要联系卖家进行更换。JQ8900的测试需要调用串口调试工具，将JQ8900根据相关接线要求连接好TTL模块，再将通过USB接口连接电脑，即可进行相关测试。在窗口界面可以使用指令通过串口发送调试，也可以直接通过点击窗口的控制键进行调试，如果功能正常，则可以正常播放音乐文件。如下图4-6所示图4-6 JQ8900串口调试窗口界面图本次硬件测试一切正常模块皆可以正常运行，在焊接和硬件的功能上没有发现较大的故障问题。5.3软件测试软件测试主要测试系统识别和交互是否正常及其识别的准确率是否达到官方数据结果。首先需要对系统通电，然后说出“我要扔垃圾”，待系统回复“请说出垃圾名”时，即可说出需要扔的垃圾名称，如系统回复的垃圾名称和打开的舵机都正确，则记为成果识别，若不正确，则记为识别失败。下面对已录入的4组共20个垃圾数据进行测试。测试结果如下表5-1所示：垃圾类型垃圾名识别成功（单位/次）识别失败（单位/次）湿垃圾菜叶82饼干73蛋壳82玉米73/次面包91干垃圾旧浴缸73猫砂82橡皮泥82尿不湿100贝壳100有害垃圾电池91打火机91创可贴82酒精73油漆100可回收物易拉罐91报纸91旧书包82旧鞋子100牛奶盒73指令我要扔垃圾17822总计34654表5-1 垃圾分类系统识别测试表系统测试时各种类型垃圾测试相关图如所示湿垃圾语音测试图5-3：图5-3 湿垃圾语音测试干垃圾语音测试图5-4：图5-4 干垃圾语音测试有害垃圾语音测试图5-5：图5-5 有害垃圾语音测试可回收物语音测试图5-6：图5-6 可回收物语音测试由上述统计结果，根据公式（5-1）：识别准确率= （5-1）对此，可以得出本次系统的识别正确率为86.5%。所以本系统在语音识别的准确度上到达标准水平，且有着较高的识别正确率。第6章总结与展望6.1 总结本次系统设计和论文主要是根据当下国家内的环境问题作为背景，运用智能化的语音识别技术对垃圾分类问题进行研究和解决。本文设计的基于智能语音识别控制技术的垃圾分类系统，可以帮助大城市中家庭垃圾进行分类，从而提升城市垃圾处理效率。经总结，本文的主要工作和成果如下：（1）对语音识别技术进行了较为完整详细地探究。对于语音识别技术的各个环节进行分别探讨。首先要做的时将接收到的语言数据流进行预处理操作，其中包括对高频语音信号的加重处理，减少噪声对信号的干扰程度。然再把通过处理后的结果进行加窗和分帧，得到更加平稳的信号，提高识别准确度。再完成端点检测，判断语音流正确的七点和重点，这个操作可以大大增加语音信号的正确率。将处理好的语音数据流进行特征值提取，再根据语音识别模型进行计算，最终转成文本。整个过程完成全部语音数据到文本数据的操作。（2）对设备整体工作流程进行了完整的阐述。从设备接收到语音信号开始，LD3320芯片开始对语音数据流进行加工处理，以便更好地进行识别操作。然后根据STM32F103C8T6内部的拼音文本进行匹配打分，得出相似度最高的结构，再将比对后的结果变成识别码反馈到单片机，交由单片机控制其余模块进行交互音频播放和开合垃圾桶控制的工作。（3）分别从软件设计和硬件设计方面清晰地介绍了本次系统的主要性能。其中的STM32F103C8T6单片机有着非常流畅的配置基础，可以使得整体几乎零等待地进行运作；LD3320语音识别芯片较高的识别率和准确性使得系统更加可靠和实用；JQ8900语音播报功能可以给用户带来更友好的交互式体验；6.2 展望总的来说本次系统设计比较顺利，功能也较为完善。但也有不够好的地方，对此，还需要慢慢做出改进和更新，才能更好的应用实际当中。（1）对于整个系统来说功能还是比较局限，想要真正运用起来，还需要增加更多功能、减少材料成本、提升识别效率和准确率。比如增加显示屏功能和按键功能，增加用户的选择性。（2）本次系统的使用环境也较为局限，主要是在安静的家庭中使用。对于测试也只测试了安静的家庭环境的数据，对于其他情况考虑较少，需要后续增加抗噪的识别算法和噪声环节下的使用测试。本次系统还有待高，语音识别技术作为当今世界上较为主流的技术之一，可以让用户体验到交互式控制的乐趣和便利。期待此技术在未来有着更高水平的发展，同时也希望更多优秀的语音识别产品也能投入运用，更加丰富我们的生活。参考文献1 王科举,廉小亲,安飒,陈彦铭,龚永罡.基于树莓派和Arduino的智能垃圾桶J.信息技术与信息化,2019(10):104-108.2 苏珍,康学亮,马飞虎.基于STM32系统的智能语音控制的垃圾桶设计J.机电信息,2019(18):142-143.3 刘晓蒙,赵立强,李伟.一种新型智能垃圾桶的设计J.物联网技术,2019,9(09):79-81.4 周飞宇,王磊,朱恩旭,唐政坤,张磊,唐珊.智能垃圾桶控制系统设计J.信息记录材料,2019,20(05):148-149.5 张园,江民欢,阚辉昂,冒书梅,王学刚.基于Arduino控制器的校园智能垃圾桶设计J.智能城市,2019,5(06):15-16.6 胡傲,谢娅娅.基于Arduino的智能垃圾桶设计J.信息通信,2019(01):164-165.7 于晓明.语音识别技术的发展及应用J.计算机时代,2019(11):28-31.8 陈心灵,钱宁博,胡佳辉,王战中.基于STM32单片机的嵌入式语音识别系统设计J.机电工程技术,2019,48(06):135-137.9 郑斯琦.基于Arduino的语音识别系统设计J.科技风,2018(11):3-4.10 赵璐,吴蒙.基于Arduino的语音识别与控制系统实现J.微型机与应用,2015,34(21):55-57+60.11 冯瑶. 基于语音识别的远程控制系统的研究与实现D.哈尔滨理工大学,2016.12 肖爱民. 基于语音识别技术的智能家居控制系统的设计D.南昌大学,2018.13 苏敏发. 基于语音识别的家用服务机器人控制系统D.广东工业大学,2014.14 钟晨帆. 基于LD3320芯片的语音识别系统设计与开发D.南京大学,2015.15 褚大伟. 语音识别交互在智能家居中的研究与应用D.石家庄铁道大学,2019. 致谢此次论文的完结收稿，也就意味着我的大学生涯的结束，在这里我要感谢在这些时间帮助过我的父母、老师、同学、朋友们，正因为有了他们的鼓舞和教导，我才能如此顺心顺意地完成这次系统设计和专业研究。感谢我的父母，在疫情期间他们支持鼓励我，让我可以全心全意地专注我的研究和设计中。他们在我没有思路，烦恼的时候孜孜不倦地和我沟通，陪我散心，让我能有美好的心情和愉快的生活，这也帮助了我打开思路，增加了做事的效率。感谢我的老师，特别致谢在东软大学四年里教育指导过我的专业课老师们，在这四年里教会了我最专业最宝贵的知识宝藏。尤其非常感谢沈洪锐老师，在我的项目开始之前就给了我们很多建议和批评，使得我能够在系统设计和论文编写方面有条不紊地进行。感谢我的同学和朋友，在一些细微的问题上他们给我提出建议，按我进行改进。对于一些电脑出现的报错，他们也会根据问题的告诉我如何解决，给我在系统设计的时候提供了很多改进意见和电脑咨询帮助。最后感谢各位参考文献的作者们，给了我很多专业又全面的研究成果，可以让我站在“巨人”的肩膀上完成此项目。今后，我将更加努力学习，深入探讨专业相关的学术研究，慢慢提升自己，为科技的发展和进步贡献自身的绵薄之力。附录系统主程序主要代码：#include sys.h#include usart.h#include oled.h#include led.h#include key.h#include timer.h#include delay.hvoid delay_s(u16 time);extern u8 Receivedata;u8 duoji_flag;int main(void)delay_init(); uart_init(9600);LED_Init(); TIM2_PWM_Init(39999,35); TIM3_PWM_Init(39999,35);TIM_SetCompare3(TIM3,37000);TIM_SetCompare4(TIM3,37000);TIM_SetCompare3(TIM2,37000);TIM_SetCompare2(TIM2,37000);while(1)if(Receivedata=0)YY1=0;delay_ms(100);YY1=1;if(Receivedata=1)YY2=0;TIM_SetCompare4(TIM3,39000);Receivedata=0;duoji_flag=1;delay_ms(100);YY2=1;if(Receivedata=2)YY3=0;TIM_SetCompare3(TIM3,39000);Receivedata=0;duoji_flag=1;delay_ms(100);YY3=1;if(Receivedata=3)YY5=0;TIM_SetCompare3(TIM2,39000);Receivedata=0;duoji_flag=1;delay_ms(100);YY5=1;if(Receivedata=4)YY4=0;TIM_SetCompare2(TIM2,39000);Receivedata=0;duoji_flag=1;delay_ms(100);YY4=1;if(duoji_flag=1)duoji_flag=0;delay_s(3);TIM_SetCompare3(TIM3,37000);TIM_SetCompare4(TIM3,37000);TIM_SetCompare2(TIM2,37000);TIM_SetCompare3(TIM2,37000);void delay_s(u16 time)u8 i=0;while(time-)for(i=0;i10;i+)delay_ms(100); 33

展开阅读全文

电子信息工程基于智能语音识别控制技术的垃圾分类系统设计与实现

最新文档