噪声估计的算法及MATLAB实现

上传人:小** 文档编号:58961899 上传时间:2022-03-01 格式:DOC 页数:58 大小:1.32MB
返回 下载 相关 举报
噪声估计的算法及MATLAB实现_第1页
第1页 / 共58页
噪声估计的算法及MATLAB实现_第2页
第2页 / 共58页
噪声估计的算法及MATLAB实现_第3页
第3页 / 共58页
点击查看更多>>
资源描述
太原理工大学毕业设计(论文)任务书毕业设计(论文)题目;噪声估计的算法及 MATLA实现毕业设计(论文)要求及原始数据(资料):论文要求:(1) 1-3周查找噪声估计算法的一些相关文献(2) 4-6周找出的几种噪声估计算法的特点(3) 7-8周确定2-3种噪声估计的算法(4) 9-11周确定大纲,完成开题报告(5) 12-13对确定的噪声估计算法进行仿真,对比找出算法的不足及今后的研究方 向(6) 14周定出初稿,最后在老师的指导下最终完稿,准备答辩论文原始数据:有关抗噪声技术的研究,在国内外作为非常重要的研究课题,已经作了大量 的研究工作,取得了丰富的研究成果。而噪声估计是语音增强中一个非常重要的 部分,在这方面的研究,国外比较多一些。传统的噪声估计方法是使用语音活动性监测 (VAD:Voice Active Detection)判 别语音是否出现,并分离出无声段,此时无声段主要表现为噪声特性,然后在无声 区通过某种统计方法,获得背景噪声特性的近似估计,对噪声谱进行更新。尽管该 方法在噪声为平稳的情况下是可行的,但是在实际的噪声环境中噪声谱的特性变 化很大,在低信噪比下,VAD的误检率会增大,在不能正确判断无声段的情况下很难 保证估计出来的噪声的准确性。因此,为了实现精确的噪声估计,就要对噪声谱 进行实时的估计。1994年Martin提出了一种基于最小值统计的方法来估计噪声,它是基于带噪 语音信号的功率水平滞后于噪声的功率水平,因此可以通过跟踪带噪语音信号功 率谱的最小值来获得噪声功率谱的估计值。 在大约1.5s的滑动窗口内寻找每一频 率带内的频谱最小值,经过补偿后和带噪语音的功率谱进行比较。不论带噪语音 的功率谱是否小于局部最小值,局部最小值都需要更新。同时,为了能更快的跟 踪并更新局部最小值和频谱最小值,把滑动窗口分为子窗口,在每个子窗口内更 新噪声的估计谱,提高了精确度。此算法的基本思路是先用一个最优平滑滤波对 带噪语音的功率谱滤波,得到一个噪声的粗略估计。然后找出粗略噪声中的在一 定时间窗内的最小值,对这个最小值进行一些偏差修正,即得到所要估计的噪声 的方差。1995年 Dobl in ger通过比较前帧带噪语音子带平滑功率谱最小值和后帧带噪语 音子带平滑功率谱之间大小,对带噪语音子带平滑功率谱最小值每帧进行跟踪和 更新,并将其作为估计的噪声谱,该噪声谱估计方法计算效率高,能快速适应背 景噪声的变化,但是它直接把带噪语音子带平滑功率谱最小值作为估计的噪声谱, 使得噪声谱过估计。2002年Cohen和Berdugo提出了一种基于最小值控制递归平均法的噪声估计 算法,把最小追踪法的鲁莽性与递归平均方法的简单性结合到一起,该算法能够快速地追踪突变的噪声功率谱。与最小统计相比,对最小值的跟踪不是关键性的, 在进行递归平均时不需要对语音出现与缺失进行区分,因此即使在弱语音段也同 样可以进行连续噪声估计更新。具有能够快速跟踪噪声谱的突变的能力。 Cohen的噪声估计算法依赖于最小值的跟踪算法,虽然比起Martin的最小值统计跟 踪算法效果要好的多,但无法完全避免在噪声上升区域的噪声欠估计及持续强语 音后面区域出现的噪声过估计的缺陷。2004年Rangachari和Loizou提出了一种快速估计方法,不仅使得带噪语音子 带中语音出现概率计算更准确,而且噪声谱的更新在连续时间内不依赖固定时间 的窗长,但是在语音或噪声能量过高时噪声的估计就会慢下来,而且如果时间大 于0.5s时,就会削弱一些语音能量。因此,噪声估计算法有待更进一步的改进。2009年余力,陈颖琪提出了一种基于DC变换的自适应噪声估计算法,采用DCT 系数作为块均匀度的度量,较好地适应了高低噪声的情况,算法复杂度不大,能适 用于各种实时图像视频处理系统。理论分析及实验结果表明本算法不仅在低噪声 的图片中表现出良好的性能,而且在高噪声的图片中依旧有效。 此外,还能适应不 同质量的图像。通过对基于最小统计量的噪声估计方法和改进的最小统计量控制递归平均噪 声估计算法研究发现这些噪声估计方法可以在语音存在段进行噪声估计,能够有 效地跟踪非平稳噪声。但是,这些算法在各个频带进行噪声估计, 算法复杂度高, 噪声估计方差大。于是在考虑各频带间的相关性上提出了在巴克域进行噪声估计, 减小了噪声估计方差,提高了噪声估计的准确性,并极大地减小算法运算量和存 储量。而且,在巴克域进行噪声估计更符合人耳听觉特性,增强语音具有更好的 质量。其他类似的方法还有低能量包络跟踪和基于分位数的估计方法,后者噪声的 估计是基于带噪语音未平滑功率谱的分位数,而不是提取平滑功率谱的最小值, 但是此方法计算复杂度很高,且需要很大的内存来存储过去的功率谱值。II毕业设计(论文)主要内容:本文分为五章,具体章节内容如下:第一章 绪论。噪声估计算法研究的目的和意义及国内外研究的现状。第二章几种经典的噪声估计的算法。Martin的最小统计量的估计算法, Coher和Berdugo提出的基于最小统计量控制递归平均算法 ,通过比较 最终提出改进的最小统计量控制递归平均算法,仿真结果表明,这种 方法在非平稳噪声条件下,也具有较好的噪声跟踪能力和较小的噪声 估计误差,可以有效地提高语音增强系统的性能。第三章 基于语音活动性检测的噪声估计算法及 MATLA仿真。通过基于语音活 动性检测的噪声估计算法,对能量和最小过零率的语音端点进行检 测,仿真结果得出,我们需要鲁棒性更强的算法,即使在有语音存在 的情况下,也能够实现噪声的连续估计和不断更新。第四章 最小统计递归平均的噪声估计算法及 MATLA仿真。首先研究了最小值 统计跟踪法通过仿真得出此算法不能快速跟踪真实噪声的变化,并研究了基于统计信息的非平稳噪声自适应算法,但它的计算很复杂。其次是Coher和Berdugo提出的最小值控制递归平均算法,为了进一步提 高算法性能,本文研究了一种改进的最小值控制递归平均算法,此算法在保证噪声估计准确性的同时减小了算法的复杂度。第五章 总结全文,在以后的噪声估计算法的研究中要进一步完善噪声功率谱 的估计算法,进一步将噪声估计方法和其他方法相结合,争取得到更加精确的噪声估计。学生应交出的设计文件(论文):毕业设计论文一份电子文档一份iii主要参考文献:参考文献1 张雄伟,陈亮,杨吉斌现代语音处理技术及应用M 北京:机械工业出版社,2003: 4-12.2 赵立.语音信号处理M.北京:机械工业出版社,2003: 5-10.3 R. Martin. Spectral subtract ion based on minimum statisticsC, Seve nth Europea n Signal Processing Conference, 1994, 9(5):1182-1185.4 张雪英,张刚,马建芬,语音处理与编码M,北京,兵器工业出版社,2000.5 I.Cohe n, B. Berdugo. Noise estimatio n by mi nima con trolled recursive averag ing for robust speech enhancement J, IEEE Signal Proc. Letters, 2002, 9(1):12-15. 王华奎,张立毅,数字信号处理理论及应用M,太原,太原理工大学出版社, 2005,pp.182-2037 姜琳峰,石鸿凌,孙洪,基于最优平滑和统计最小的语音增强J,武汉大学学报(理学版),2004,50(1), pp.113-1178 陈照平,马建芬,张雪英,一种基于快速噪声估计的MMSE语音增强算法J,计算机工程与应用,2007,(22),pp.113-1149 张波,曹志刚,低信噪比条件下的一种自适应有声/无声判决算法J,信号处理,1996, 12(3),pp.239-24610 杨行峻,迟惠生等.语音信号数字处理M.北京:电子工业出版社,1995: 16-22 .11 焦人杰,侯丽敏.一种快速自适应噪声谱估计方法J.声学技术,2007,26:735-740.12 胡航.语音信号处理M.哈尔滨:哈尔滨工业大学出版社,2002: 20-29.13 易克初,田斌,付强.语音信号处理M.北京:国防工业出版社,2000: 22-30.14 韩纪庆,张磊等.语音信号处理M.北京:清华大学出版社,2004: 30-41.15 韩韬.基于强背景噪声下的语音端点检测算法与实现D.长沙:湖南大学,2007.16 金学骥.语音增强算法的研究与实现D.杭州:浙江大学,2005.18 周为,邱秀清,朱敬锋等.一种基于噪声快速跟踪的语音增强算法J.电声技术,2007,31(11): 55-60.19 杨海.感知语音质量评价PESQ及其在通信系统中的应用J.江西通信科技, 2004,2004(2): 36-47.20 朱健华,语音增强方法的研究D,大连,大连理工大学,200221 胡航.语音信号处理M.哈尔滨:哈尔滨工业大学出版社,2002: 20-29.22 王永红,周德新,熊军.谱减法技术中“音乐噪声”的抑制J.桂林电子工业学院学报,1998,18(1): 38-42.专业班级通信07-1班学生乔君芮要求设计(论文)工作起止日期 指导教师签字日期教研室主任审查签字日期系主任批准签字日期V噪声估计算法的研究及MATLA仿真摘要日常的通信过程中 , 语音会常常受到环境噪声的干扰而使通话质量下降 , 严 重时使得语音处理系统不能正常工作。因此 , 必须采用信号处理方法通过语音增 强来抑制背景噪声从而提高语音通信质量 , 而噪声估计的准确性又直接影响语音 的增强效果。可见, 噪声估计是语音增强的一个非常重要的部分 , 所以研究噪声估 计算法有很好的实用价值。本文主要研究两种噪声估计算法 : 基于最小统计和最 优平滑的噪声估计算法和最小值控制递归平均法的噪声估计算法 , 通过实验仿真 比较最终研究了一种改进的最小值统计量控制递归平均噪声估计算法。本文的主要工作总结归纳为以下几方面: 首先,本文对几种经典的噪声估计算法进行研究 , 了解它们的各自优缺点 ,在 此基础上选定两种较好的算法进行具体分析。其次, 了解最小统计和最优平滑和噪声功率谱统计跟踪的噪声估计算法的原 理,它的基本思路是先用最优平滑滤波器对带噪语音的功率谱滤波 , 得到一个噪 声的粗略估计, 然后找出粗略估计噪声中的在一定时间窗内的最小值, 对这个最 小值进行一些偏差修正,即得到所要估计的噪声的方差。通过MATLA仿真看其特 征。再次, 本文研究了一种改进的最小统计法。 算法采用递归平均进行噪声估计, 其递归平均的平滑量控制递归平均噪声估计算因子受语音存在概率控制, 而语音 存在概率的计算采用了两次平滑和最小统计量跟踪。与 I. Cohen提出的IMCRA 算法相比, 本文采用了一种快速有效的最小统计量跟踪算法。 仿真结果表明: 在 非平稳噪声条件下, 该算法具有较好的噪声跟踪能力和较小的噪声估计误差, 可 以有效地提高语音增强系统的性能。最后, 对整体论文总结 ,通过研究发现改进的最小统计量控制递归平均噪声 算法在IMCRAJ法的基础上,采用了一种简单有效地最小统计量估计算法,在保证 噪声估计准确性的同时 , 减小了算法的复杂度。 同时, 基于这种噪声估计的语音增 强系统能有效地提高增强语音的信噪比 ,并且能有效地消除增强语音中的音乐噪关键词 : 噪声估计 , 谱减法, 语音检测 , 最小递归统计量INOISE ESTIMATION ALGORITHM RESEARCHAND MATLAB SIMULATIONABSTRACTThe Daily communication process, speech will often affected by environmental noise interference and make calls the quality descend, serious when make speech processing system didnt work properly. Therefore, must use signal processing methods through speech enhancement to curb backgroundnoise so asto improve the quality of voice communication, and the accuracy of the noise estimates directly affected speech enhancement effect. Visible, the speech enhancement noise estimation is a very important part, so the noise estimation algorithm has very good practical value. This paper makes a study of the two kinds of noise estimation algorithm based on least statistics and: the optimal smooth noise estimation algorithm and minimum control recursion average method noise estimation algorithm through experiment comparative simulation, finally puts forward an improved minimum statistic control recursion average noise estimation algorithm.This paper sums up the main work for the following aspects:First of all, the paper on the noise estimation algorithm several classic study, understand their respective advantages and disadvantages, based on selected two good concrete analysis algorithm.Second, understand the smallest statistics and optimal smoothing and noise power spectrum statistical tracking noise estimation algorithm of principle, it is to use the basic ideas of the optimal smoothing filter belt chirp voice power spectral filtering, get a noise a rough estimate, and then find out roughly in certain time window of noise to a minimum, within the minimum deviation correction, some of which is estimated to have the variance of noise. Through the simulation of MATLAB see its characteristics. noise recursively, estimates thathe average recursive average smooth quantity cont Again, this paper proposesan improved minimum statistics. Algorithm for recursion average noise estimates by speech exist probability is factor control, and calculation of speech exist probability by two smooth and minimum statistic tracking. And I. Cohen proposed IMCRA algorithms, this paper adopts a kind of fast and effective minimum statistic tracking algorithm. The simulation results show that the non-stationary noise conditions, the algorithm has good noise tracking ability and smaller noise estimation error, can effectively improve the performance of the system speech enhancement.Finally, the whole thesis summed up, through the researchfound that improved least statistic control recursion algorithm in IMCRA average noise based on the algorithm of a simple and effective minimum statistic estimation algorithm, noise estimation accuracy in guarantee, while reducing the algorithm complexity. Meanwhile, based on this kind of noise estimates speech enhancementsystem can effectively improve the signal-to-noise ratio of the voice enhanced, and can effectively eliminate the music noise voice enhanced. Analytical papers deficiency and future development direction.Key words: noise estimation, the spectral subtraction, voice detection, recursive least statisticIII目录1 绪 论 11.1 噪声估计算法研究的目的和意义 11.2 国内外研究的现状 21.3 论文的整体安排 32 几种经典的噪声估计的算法 42.1 几种噪声估计算法的优点 42.2 噪声估计算法 43基于语音活动性检测的噪声估计算法及 MATLA实现 63.1 基于语音活动性检测的噪声估计算法 63.1.1 短时能量 63.1.2 短时平均过零率 73.1.3 基于短时能量和短时平均过零率的语音活动性检测 73.1.4 实验仿真 94最小统计递归平均的噪声估计算法及 MATLA仿真 124.1 最小值统计法 124.1.1 最优平滑 124.1.2 最小功率谱统计跟踪 134.1.3 实验仿真 154.2 基于统计信息的非平稳噪声自适应算法 164.2.1 概述 164.2.2 非平稳噪声自适应算法 164.3 最小值控制递归平均算法 194.3.1 计算局部能量最小值 204.3.2 估计语音存在的概率 214.3.3 更新噪声谱的估计 214.4 一种改进的最小统计量控制递归平均噪声估计算法 224.4.1 改进的噪声估计算法 224.4.2 实验仿真 245总结与展望 255.1 论文的主要工作 255.2 目前存在的问题及今后的发展方向 25参考文献 26致谢 27附录: 外文文献 2841.1 噪声估计算法研究的目的和意义语音作为语言的声学表现,是人类特有的也是最重要的思想和情感交流段, 也是人机交互最自然的方式。 而人们在通信过程中, 语音常常受到环境噪声的干 扰而使通话质量下降,在实际应用中噪声的存在也会产生很多问题 , 语音处理设 备对人类语音进行获取或处理的过程不可避免地要受到来自周围环境的各种噪 声或其它讲话者的干扰, 这些干扰噪声最终将使语音处理设备的接收到的语音不 再是纯净的原始语音, 而是被噪声污染过的带噪语音。 由于环境噪声的污染会使 许多语音处理系统的性能急剧恶化,严重时使语音处理系统不能正常工作, 因此在上述情况下,背景噪声的存在不仅严重破坏了语音信号原有的模型参数和声学 特性,导致许多语音处理系统服务质量的降低, 而且会影响系统输出语音的可懂 程度,使听众产生听觉疲劳。在视频信号中也同样存在噪声 , 很多视频图像处理 都是在没有考虑噪声情况下得出的, 如果存在噪声就必将会影响这些算法的有效 性。由于噪声对视频图像处理算法的影响如此大, 因此在开发图像视频处理算法 时必须考虑噪声, 必须有一种可靠的方法能准确地估计噪声, 以便使很多图像视 频处理算法 ( 比如边缘检测、图像分割和滤波等 )在噪声存在的情况下依旧保持非 常良好的性能。然而 , 语音增强技术作为一种预处理技术,是消除这些噪声干扰 的一个最重要的手段, 它通过对带噪语音进行处理来改善语音质量, 使人们易于 接受或提高语音处理系统的性能。语音增强的主要目标是从带噪语音信号中提取尽可能纯净的原始语音, 通过语音增强,抑制背景噪声,提高语音通信质量 , 而噪声估计又是语音增强的一个 非常重要的部分, 噪声估计的准确性直接影响到语音增强的效果, 因此研究噪声 估计算法有很好的实用价值。 在这种情况下, 必须建立一个语音增强系统, 通过 对带噪语音进行处理,以消除背景噪声,改善语音质量,提高语音的清晰度、可 懂度和自然度,提高语音处理系统的性能; 或者将语音增强作为一种预处理手段, 以提高语音处理处理系统的抗干扰能力。 要实现这些第一个环节就是要利用噪声 的特性参数, 很好的将噪声估计出来。 语音增强算法可从信号输入的通道数上分 为单通道的语音增强算法和多通道的语音增强算法。 单通道语音系统在实际应用 中较为常见,如电话,手机等。这种情况下语音和噪声同时存在一个通道中,语 音信息与噪声信息必须从同一个信号中得出。 而单通道语音增强是语音增强的基 础,单通道语音增强第一个环节就是要利用噪声的特性参数, 很好的将噪声估计 出来,而在此方法中, 噪声源是不可接近的, 背景噪声的特性只能从带噪语音中 获得。因此,噪声估计的准确性会直接影响最终效果: 噪声估计过高, 则微弱的语 音将被去掉,增强语音会产生的失真; 而估计过低,则会有较多的背景残留噪声。 因此,对噪声估计方法的研究是非常必要的, 在语音算法的前期必需要对噪声进 行估计。噪声估计还在语音通讯领域非常重要, 同时在统计学、 图像处理、 军事等方 面也起着非常重要的作用 . 由于噪声的统计特性比语音的统计特性更平稳, 所以 噪声估计在统计学中也很有研究意义。 可见,噪声估计在很多领域起着非常重要的作用,那么噪声估计算法作为研究课题是非常有意义的1.2 国内外研究的现状有关抗噪声技术的研究, 在国内外作为非常重要的研究课题, 已经作了大量 的研究工作, 取得了丰富的研究成果。 而噪声估计是语音增强中非常重要的一个 部分,在这方面的研究,国外比较多一些,以下介绍几种经典的噪声估计算法。传统的噪声估计方法是使用语音活动性监测 ( VAD:Voice Active Detection) 判别语音是否出现, 并分离出无声段 ,此时无声段主要表现为噪声特性 , 然后在无 声区通过某种统计方法 , 获得背景噪声特性的近似估计 ,对噪声谱进行更新。 尽管 该方法在噪声为平稳的情况下是可行的, 但是在实际的噪声环境中噪声谱的特性 变化很大,在低信噪比下,VAD的误检率会增大,在不能正确判断无声段的情况下 很难保证估计出来的噪声的准确性。 因此,为了实现精确的噪声估计, 就要对噪 声谱进行实时的估计。1994年Martin提出了一种基于最小值统计的方法来估计噪声,它是基于带噪 语音信号的功率水平滞后于噪声的功率水平, 因此可以通过跟踪带噪语音信号功 率谱的最小值来获得噪声功率谱的估计值。在大约 1.5s 的滑动窗口内寻找每一 频率带内的频谱最小值, 经过补偿后和带噪语音的功率谱进行比较。 不论带噪语 音的功率谱是否小于局部最小值, 局部最小值都需要更新。 同时,为了能更快的 跟踪并更新局部最小值和频谱最小值, 把滑动窗口分为子窗口, 在每个子窗口内 更新噪声的估计谱,提高了精确度 4。此算法的基本思路是先用一个最优平滑 滤波对带噪语音的功率谱滤波, 得到一个噪声的粗略估计。 然后找出粗略噪声中 的在一定时间窗内的最小值, 对这个最小值进行一些偏差修正, 即得到所要估计 的噪声的方差。1995年Dobli nger通过比较前帧带噪语音子带平滑功率谱最小值和后帧带噪 语音子带平滑功率谱之间大小, 对带噪语音子带平滑功率谱最小值每帧进行跟踪 和更新, 并将其作为估计的噪声谱, 该噪声谱估计方法计算效率高, 能快速适应 背景噪声的变化, 但是它直接把带噪语音子带平滑功率谱最小值作为估计的噪声 谱,使得噪声谱过估计。 但这种算法容易将语音电平的增长当作噪声电平的增长。 与此类似的算法还有基于分位数统计量的噪声估计算法, 先对噪声估计窗内的信 号进行排序,然后按一定的分数比例取信号作为噪声估计,算法复杂度比较高。2002年Cohen和Berdugo提出了一种基于最小值控制递归平均法的噪声估计 算法,把最小追踪法的鲁棒性与递归平均方法的简单性结合到一起,该算法能够 快速地追踪突变的噪声功率谱。 与最小统计相比, 对最小值的跟踪不是关键性的, 在进行递归平均时不需要对语音出现与缺失进行区分, 因此即使在弱语音段也同 样可以进行连续噪声估计更新。具有能够快速跟踪噪声谱的突变的能力。Cohen提出的噪声估计算法不直接依赖于最小统计量,而依赖于最小值的跟踪算 法,具有较好的鲁棒性。虽然比起 Martin的最小值统计跟踪算法效果要好的多, 但无法完全避免在噪声上升区域的噪声欠估计及持续强语音后面区域出现的噪 声过估计的缺陷。为了进一步提高算法性能,Cohen提出了改进的最小统计量控制递归平均算法 (IMCRA, Improved Minima Controlled Recursive Averaging)。2004年Rangachari和Loizou提出了一种快速估计方法,不仅使得带噪语音子 带中语音出现概率计算更准确, 而且噪声谱的更新在连续时间内不依赖固定时间 的窗长,但是在语音或噪声能量过高时噪声的估计就会慢下来, 而且如果时间大 于 0.5s 时,就会削弱一些语音能量。因此,噪声估计算法有待更进一步的改进。2009年余力,陈颖琪提出了一种基于DC变换的自适应噪声估计算法,采用 DCT系数作为块均匀度的度量,较好地适应了高低噪声的情况,算法复杂度不大, 能适用于各种实时图像视频处理系统。 理论分析及实验结果表明本算法不仅在低 噪声的图片中表现出良好的性能,而且在高噪声的图片中依旧有效。此外 , 还能 适应不同质量的图像。通过对基于最小统计量的噪声估计方法和改进的最小统计量控制递归平均 噪声估计算法研究发现这些噪声估计方法可以在语音存在段进行噪声估计, 能够 有效地跟踪非平稳噪声。 但是,这些算法在各个频带进行噪声估计, 算法复杂度 高,噪声估计方差大。 于是在考虑各频带间的相关性上提出了在巴克域进行噪声 估计,减小了噪声估计方差, 提高了噪声估计的准确性, 并极大地减小算法运算 量和存储量。 而且,在巴克域进行噪声估计更符合人耳听觉特性, 增强语音具有 更好的质量。其他类似的方法还有低能量包络跟踪和基于分位数的估计方法,后者噪声 的估计是基于带噪语音未平滑功率谱的分位数,而不是提取平滑功率谱的最小 值,但是此方法计算复杂度很高,且需要很大的内存来存储过去的功率谱值。本文重点就是在前人研究的基础上,跟踪国内外最新资料,研究了一种新 的噪声估计算法,使延迟时间能够缩短,最好没有延迟。1.3 论文的整体安排第一章 绪论。噪声估计算法研究的目的和意义及国内外研究的现状。第二章 几种经典 的噪声估计 的算法。 Martin 的最小统计 量的估计算法 , Cohen和Berdugc提出的基于最小统计量控制递归平均算法,通过比较最终提出改进的最小统计量控制递归平均算法,仿真结果表明, 这种方法在非平稳噪声条件下,也具有较好的噪声跟踪能力和较小 的噪声估计误差,可以有效地提高语音增强系统的性能。第三章 基于语音活动性检测的噪声估计算法及 MATLA仿真。通过基于语音 活动性检测的噪声估计算法,对能量和最小过零率的语音端点进行 检测,仿真结果得出,我们需要鲁棒性更强的算法,即使在有语音 存在的情况下,也能够实现噪声的连续估计和不断更新。第四章 最小统计递归平均的噪声估计算法及 MATLA仿真。首先研究了最小 值统计跟踪法通过仿真得出此算法不能快速跟踪真实噪声的变化, 并研究了基于统计信息的非平稳噪声自适应算法,但它的计算很复 杂。其次是Cohen和Berdugc提出的最小值控制递归平均算法,为了 进一步提高算法性能,本文提出了一种改进的最小值控制递归平均 算法,此算法在保证噪声估计准确性的同时减小了算法的复杂度。第五章 总结全文,并分析论文存在的不足及今后的的发展方向。 在以后的噪 声估计算法的研究中要进一步完善噪声功率谱的估计算法,进一步 将噪声估计方法和其他方法相结合, 争取得到更加精确的噪声估计。2 几种经典的噪声估计的算法2.1 几种噪声估计算法的优点(1) Martin提出的基于最小统计量的噪声估计算法,是先用一个最优平滑滤波对 带噪语音的功率谱滤波, 得到一个噪声的粗略估计。 然后找出粗略噪声中的在一 定时间窗内的最小值, 对这个最小值进行一些偏差修正, 即得到所要估计的噪声 的方差。而且 , 为了能更快的跟踪并更新局部最小值和频谱最小值,把滑动窗口 分为子窗口,在每个子窗口内更新噪声的估计谱,提高了精确度。(2) Cohen和Berdugo提出的基于最小统计量控制递归平均算法 ,该方法用一个 与时频相关的平滑因子对带噪语音的过去值进行平均, 以得到噪声的估计值, 然 后在每一帧内连续的更新噪声。 采用递归平均进行噪声估计, 平滑参数受语音存 在概率控制,并由最小统计量控制语音存在概率。(3) 近年来,提出了一种自适应连续噪声谱估计方法 ,它是一种专门用语单声道 语音增强系统的噪声估计的。它不需要语音的有声 / 无声检测,噪声谱在所有的 帧中连续的更新, 并不关心本帧是语音帧还是噪声帧, 对每一帧都重新计算其噪 声功率谱。 自适应连续的噪声估计算法, 省去了对语音端点的检测, 对非平稳噪 声也有较好的适应性, 即使在有语音存在的情况下, 也能够实现噪声的连续估计 和不断更新。2.2 噪声估计算法Martin提出的基于最小统计量的噪声估计算法的基本思路是先用一个最优 平滑滤波对带噪语音的功率谱滤波, 得到一个噪声的粗略估计。 然后找出粗略噪 声中的在一定时间窗内的最小值, 对这个最小值进行一些偏差修正, 即得到所要 估计的噪声的方差。这种方法是在噪声估计窗内搜索最小值作为噪声估计量 ,而 且此算法对窗长的选择比较敏感 , 当窗长比较长时, 对非平稳噪声的跟踪速度慢, 而且容易出现噪声低估; 当窗长比较短时, 比较容易出现将语音的低能量成分当 作噪声。这些问题可以通过优化的平滑参数和偏差补偿得以改进, 虽然提高了精 确度, 但这大大地提高了算法的复杂度。 仿真结果表明 : 最小值统计跟踪法对平稳 噪声噪声的估计是比较准确的 , 但是对非平稳噪声就表现的不好了。而Cohen和Berdugo提出的最小统计量控制递归平均算法(MCRA,MinimaControlled Recursive Averaging) ,采用递归平均进行噪声估计,平滑参数受语音 存在概率控制, 并由最小统计量控制语音存在概率。 这种算法不直接依赖于最小 统计量,具有较好的鲁棒性, 它是使用一个平滑参数对功率谱的过去值进行平均, 该平滑参数是根据每个子带中语音存在的概率进行调整的。 在一给定帧的某个子 带中语音是否存在的概率可以由带噪语音的局部能量值与其待定时间窗内的最 小值的比值决定, 把该比值与某一门限做比较, 小的比值意味着该子带中不存在 语音,反之,意味着该子带内存在语音。如果给定帧的某个子带中存在语音,那 么该子带内的噪声谱等于上一帧的噪声谱, 如果不存在, 则根据带噪语音的功率谱更新噪声谱。最后,为了防止估计的噪声起伏较大,对其进行了递归平滑。 为了进一步提高算法性能, 本文研究了一种改进的最小统计量控制递归平均 算法。该算法采用递归平均进行噪声估计, 其递归平均的平滑因子受语音存在概 率控制,而语音存在概率的计算采用了两次平滑和最小统计量跟踪。与Cohen提出的 IMCRA 算法相比,本文采用的是一种快速有效的最小统计量跟踪算法,在 IMCRA 算法的基础上,利用其对语音最小统计量估计的鲁棒性,采用了一种简 单有效的最小统计量估计算法, 在保证噪声估计准确性的同时, 减小了算法的复 杂度。仿真结果表明: 在非平稳噪声条件下, 算法具有较好的噪声跟踪能力和较 小的噪声估计误差,可以有效地提高语音增强系统的性能。563基于语音活动性检测的噪声估计算法及MATLA实现传统的噪声估计方法使用语音活动监测( VAD )技术分离出无声段,这时 无声段主要表现为噪声特性,然后再通过某种统计方法,即可获得背景噪声特性 的近似估计。尽管该方法在噪声为平稳的情况下是可行的,但是在实际的噪声环境中噪声谱的特性变化很大,就很难达到好的降噪效果。从实用性、易实现性等 方面考虑,很多算法都是建立在相对理想的实验室条件下的,要求背景噪声保持平稳,信噪比较高,而且需要一定的训练算法以预先得到背景噪声及语音的统计 信息。在实际工作中,这些条件很难得到满足,而且经常会遇到信噪比较低,背 景噪声缓慢变化的情况,也不可能预先得到背景噪声或语音的统计信息。而且在 低信噪比下,VAD的误检率会增大,在不能正确判断出有声/无声段的情况下, 估计出来的噪声很难保证准确性。因此,为了实现精确的噪声估计,就要对噪声谱进行实时的估计。近年来, 人们提出了一种自适应连续噪声谱估计方法, 它是一种专门用语单声道语音增强 系统的噪声估计。噪声谱在所有的帧中连续的更新,并不关心本帧是语音帧还是 噪声帧,对每一帧都重新计算其噪声功率谱,它不需要语音的有声/无声检测,对非平稳噪声也有较好的适应性, 即使在有语音存在的情况下,也能够实现噪声 的连续估计和不断更新。本章从语音活动检测和连续更新噪声两方面入手,将几种算法的基本原理及 过程进行了详细的描述,并分析了实验结果。3.1基于语音活动性检测的噪声估计算法3.1.1短时能量语音信号和噪声信号的区别可以体现在他们的能量上,对于一列叠加有噪声干扰的语音信号而言,其语音段的能量是噪声段能量叠加语音声波能量之和。因此,语音段的能量一般要大于噪声段的能量。如果环境噪声和系统输入噪声比较小,以至于能够保证系统的信噪比相当高, 那么只要计算输入信号的短时能量或 短时平均幅度就能够把语音段和噪声背景分开。这就是仅仅基于短时能量的端点 检测方法。m :信号x(t)短时能量定义为:(3-1)语音信号的短时平均幅度定义为:cOM=v Xw m i:(3-2 )m =3短时能量有两种定义:短时时域能量和短时谱幅能量,一般用的是短时频域 能量表示,因此,短时能量用傅立叶变换后的平方表示, 平均幅度为傅立叶变换 后谱绝对值的和。短时能量主要有下面几个应用:首先利用短时能量可以区分清音和浊音,因 为浊音的能量要比清音的能量大得多; 其次可以用短时能量对有声和无声段进行 判断。3.1.2短时平均过零率信号x(t)的短时平均过零率定义为:Z=?瓦 sgn!Xw(m)_sgn R(m _1 h(t 一m )(3-3)1一般取:2N oqn1,其中n为窗长o信号的过零率是其频率量的一种简单度量, 窄带信号尤其如此。其中,当信 号为单一正弦波时,过零率为信号频率的两倍。对于采样率为 s F、频率为F0的 正弦波数字信号,平均每个样本的过零率为 s 2F / F 0。过零率有两个重要应用:第一,用于粗略地描述信号的频谱特性。第二,用 于判别清音和浊音、有声和无声。由上面定义出发,计算过零率容易受低频干扰, 所以需要对上述定义做一点修改,设置一个门限 T,将过零率的含义修改为跨过 正负门限。如下式:Z=1oOZ msgnsgn!-xm -1 -T 1+ sgn k(m )+T 】-sgn IX(m -1 )+T 】 h(t -m )(3-4)这样过零率就有一定的抗干扰能力了。 即使存在较小的随机噪声,只要它不 使信号越过正负门限所构成的带,就不会产生虚假的过零率。3.1.3基于短时能量和短时平均过零率的语音活动性检测虽然短时能量有时能将噪声和语音分开,但是在实际应用中,往往很难保证有这么高的信噪比,因而仅依靠短时能量或短时平均幅度来检测语音段的起止点 常会遇到问题。而且在一些特殊情况下,在以某些音为开始或结尾时,如当弱摩 擦音(如f,h等音素)、弱爆破音(如p, t,k等音素)为开始或结尾; 以鼻音(如ng,n,m等音素)为语音的结尾时,只用其中一个参数量来判 别语音的起点和终点是有困难的,往往会漏掉某些音素,必须同时使用这两个参数。所以,有了经典的端点检测方法Lawrennce RabineF24提出的以过零率Z和能量E为特征进行端点检测。这种方法也常称为双门限比较法。此方法是在短时能量检测方法的基础上加 上短时平均过零率,利用能量和过零率作为特征来进行检测。通常是利用过零率 来检测清音,用短时能量来检测浊音,两者配合实现可靠的语音端点检测。该方法的基本原理购如下所述:由于采集声音信号的最初的短时段为无语音 段,仅有均匀分布的背景噪声信号。 这样就可以用该语音信号的最初几帧 (一般 取10帧)信号作为背景噪声的统计样本来计算其过零率阈值ZT及能量阈值EL(低能量阈)和EU (高能量阈)。ZT的定义为:ZT = min IF,zc 亠 2,fzc( 3-5)其中IF为经验值,一般取25; zc、fzc分别为根据所取最初10帧样值算得 的过零率的“均值”和“标准差”。计算EL和EU时,先算出最初10帧信号每帧的短时平均能量或平均幅度 E,最大值记为EMAX,最小值记为EMIN。然后令:amp 1 =0.03 EMAX - EMIN EMIN(3-6)amp 2=4 EMIN(3-7)在本次设计中用前10帧的平均值来代替最小值EMIN最后按下式计算出EL和EU :EL = min amp 1,amp 2(3-8)EU =5 EL(3-9)接下来就可以用过零率阈值Z及能量阈值EL和EU来进行起止点的判别。先根据EL,EU计算出初始起点S1。方法如下所述:从第11帧开始,将每 一帧的能量E值与门限EL相比较,如果能量E超过门限EL,则将该帧计为S1。 但若后续n帧的平均能量或幅度尚未超过EU而能量又降到EL之下,则该帧不能 作为初始起点S1,然后继续寻找下一个平均能量或幅度超过EU的帧,若后续n帧的平均能量或幅度超过EU,则将此帧计为S1,该帧就可以作为根据能量信号 找到的语音的起点。但是,S1只是根据能量信息找到的起点,还未必是语音的精确起点。这是 由于语音的起始段往往存在着能量很弱的清辅音(如f,s等),仅依靠能量很难把它们和无声区分开。但人们发现这些清辅音的过零率明显高于无声段,因此 可以利用过零率这个参数来精确判断清辅音与无声区二者的分界点。当S1确定后,从S1帧之前的30帧搜索,依次比较各帧的过零率,若有3帧以上的过零率 超过ZT,则将起始点S1定为满足ZZT的最前帧的帧号,如果这些帧的过零率 都小于门限ZT则将S1作为起点。语音结束点S2的检测方法与检测起点相同, 从后向前搜索,找出第一个平均能量幅度高于EL、且其前向帧的平均能量或幅度在超出EU前没有下降到EL以下的帧号,记为N2,随后根据过零率向N2+25 帧搜索,若有3帧以上的ZZT,则将结束点N2定为满足ZZT的最后的帧号即 Ne,否则即以N2作为结束点。3.1.4实验仿真下面是以一段语音为例,进行语音端点检测的Matlab仿真。实验采用的纯净语音材料是HINT 数据库中的一条语音(语音内容:Read verse out loud forpleasure,大概2.1s左右;噪声材料取自NOISEX-92的高斯白噪声和f16战斗 机噪声。语音和噪声都是以8KHz采样,16bit量化,wav格式存储,并通过Matlab 按一定线形比例混合成不同信噪比的带噪语音。图3-1语音的原始波形图0.2440.60.811.21.41.61.S2图3-2语音的能量曲线图过:H!间图3-3语音的短时过零率曲线图由上图可以看出基于能量和短时过零率的端点检测算法在无噪声的环境下比较准确的检测到了语音的开始和结束点。为了验证其鲁棒性,禾U用了 Matlab给以上信号添加信噪比-5db的高斯白噪声,采用同样的算法,其仿真结果如下图 所示:0.5-0.50.20.61.8图3-4加入高斯白噪声的语音波形图图3-5加入高斯白噪声的能量曲线图110.040.030 02 010.20.40.6 O.a 11.21.41.B1.82f r 同co图3-6加入高斯白噪声的短时过零率曲线图由以上图中可看出,在较强背景噪声的环境下,上述算法的准确性急剧下降, 已经不能准确的检测出信号的端点了。 因此,我们需要鲁棒性更强的算法,即使 在有语音存在的情况下,也能够实现噪声的连续估计和不断更新。134最小统计递归平均的噪声估计算法及MATLAB仿真本章先研究了经典的噪声估计算法即最小值跟踪法,然后研究了基于统计信息的非平稳噪声自适应算法,最后对这两种噪声估计算法做了实验仿真。 仿真 结果表明:最小值跟踪法对平稳噪声的估计是比较准确的,但是非平稳噪声就表 现的不好了,而基于统计信息的非平稳噪声自适应算法在非平稳噪声环境中也 表现的很好,能够比较准确的跟踪上噪声的突变。4.1最小值统计法4.1.1最优平滑设带噪语音信号为y(t),它由纯净语音和噪声组成,即y(t) = s(t) + n(t),这 里t代表采样的时间标号。进一步假设s(t)和n(t)是统计独立的,并各自都是零均值 的。为了将信号转化到频域,将信号分成长度为L个采样点的帧信号,帧间重叠 为R点。对帧信号进行FFT计算,得到了频域的信号:L丄Y(&,k)= yp + u)h(u )e j2;ku/ L(4-3)u -0其中为帧号即时间的标号,k为频率点的标号,/.乙k -L _L 0,1, -L-1 I ,h(u)是一个窗序列,并假设 V h2(u)hu 0先用一个平滑过程来粗估计噪声功率谱密度 P(入k):2P(L k) =c(P(h1,k) +(1 G)Y(k,k)(4-4)2其中a是平滑参数,噪声功率的进一步估计二n ( ,k)通过取P(入,k)在一个滑动窗内的最小值来决定。上述估计还很粗糙,为了进一步提高估计的准确性还要考虑以下问题:第一,固定的a值将不适应有声/无声的变化与噪声的变化。第二,这样的噪声估计将 比真正的噪声要滞后。第三,最小值的跟踪过程比真实的噪声要滞后。因此,对 原有的噪声估计还需要一个随时间变化的平滑系数a、一个偏差补偿系数与加速跟踪方法。为了简化计算,假设信号处于无声状态。将平滑过程写成由时变平滑系数作 用的过程:(4-3)P(kk) =a(kk)P (九 _i,k) +(1 讥,k) 丫(九,k)为了使P(入,k)尽可能的接近真正的噪声功率谱密度 CN2(-k),以下式的期望值为零作为目标:(4-4)(4-5)E ,k _;N 2 ,k 2 p 1, k o 由上式得:1opt ! . , k21 +(p(&1k/jN2(k,k )1 )在实际运用中,最优估计式中的;._ ( - ,k)用上次的估计值:n强-1,k代替,并且最优系数将被限制在一个最大值 max a之间来避免丫(入k) = 1的死锁情况发生。为了提高在非稳定的噪声环境中的平滑效果,平滑系数设置一个下限为0.3。式子(3-14)可重新写成:aopt , k )= max 0.3 min1 亠P:;Z 1, k2 _/、- n 1, k - 1(4-6)216#4.1.2最小功率谱统计跟踪最小功率谱统计跟踪的方法将跟踪短时谱的最小功率谱密度,这个最小功率谱是由一个连续时间段内的最小功率谱密度求出。因为随机变量的最小值总会小于平均值,所以用最小功率谱密度值的估计存在着偏差,要得到平均值就要对最小功率谱密度进行偏差修正。在推导最小功率谱统计跟踪方法时,为了简化计算, 假设信号处于无语音状态,在有语音状态时只要将噪声的方差用带噪语音信号的 方差代替即可。设在D个连续的短时功率谱密度估计P(X, k)中的最小值为Pmm - ,k,那么:i2
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!