实验3语音信号的端点检测

上传人:痛*** 文档编号:182299024 上传时间:2023-01-22 格式:PPT 页数:20 大小:151KB
返回 下载 相关 举报
实验3语音信号的端点检测_第1页
第1页 / 共20页
实验3语音信号的端点检测_第2页
第2页 / 共20页
实验3语音信号的端点检测_第3页
第3页 / 共20页
点击查看更多>>
资源描述
实验三实验三 语音信号的端点检测语音信号的端点检测 一、实验目的一、实验目的1 1、本次实验是设计性实验,鼓励学生充分发挥、本次实验是设计性实验,鼓励学生充分发挥自己的创造性,灵活利用所学的理论知识,自己的创造性,灵活利用所学的理论知识,设计出自己的解决方案。设计出自己的解决方案。2 2、熟悉并掌握语音端点检测技术。、熟悉并掌握语音端点检测技术。二、实验原理二、实验原理语音端点检测就是检测语音信号的起点和终点,因此语音端点检测就是检测语音信号的起点和终点,因此也叫起止点识别。它是语音处理技术中的一个重要方也叫起止点识别。它是语音处理技术中的一个重要方面,其目标是要在一段输入信号中将语音信号同其它面,其目标是要在一段输入信号中将语音信号同其它信号如背景噪声分离开来。在语音识别中,一个关键信号如背景噪声分离开来。在语音识别中,一个关键问题就是如何将语音信号精确地检测出来,为获得准问题就是如何将语音信号精确地检测出来,为获得准确的识别提供前提。确的识别提供前提。以过零率以过零率ZCRZCR和能量和能量E E为特征的起止点算法的根据是背为特征的起止点算法的根据是背景噪声与语音的短时段景噪声与语音的短时段ZCRZCR及及E E特征从统计看都有相当特征从统计看都有相当的区别。这里的的区别。这里的E E特征指的是能量类特征,用到的是该特征指的是能量类特征,用到的是该类特征中的短时段平均幅度类特征中的短时段平均幅度M M特征。特征。过零率的定义为:在统计的短时段中,信号波形穿越过零率的定义为:在统计的短时段中,信号波形穿越零电平的次数。零电平的次数。该方法的要点为:由于采集声音信号的最初的短时段该方法的要点为:由于采集声音信号的最初的短时段为无语音段,仅有均匀分布的背景噪声信号。这样就为无语音段,仅有均匀分布的背景噪声信号。这样就可以用已知为静态的最初几帧(一般取帧)信号计算可以用已知为静态的最初几帧(一般取帧)信号计算其过零率阈值其过零率阈值IZCTIZCT及能量阈值及能量阈值ITLITL(低能量阈)和低能量阈)和ITUITU(高能量阈)。高能量阈)。接下来就可以用过零率阈值接下来就可以用过零率阈值IZCTIZCT及能量阈值及能量阈值ITLITL(低能低能量阈)和量阈)和ITUITU(高能量阈)来进行起点及止点的判别。高能量阈)来进行起点及止点的判别。先根据先根据ITLITL、ITUITU算得一初始起点算得一初始起点N1N1。方法为从第帧方法为从第帧1111开始,逐次比较每帧的平均幅度,开始,逐次比较每帧的平均幅度,N1N1为平均幅度超过为平均幅度超过的的ITLITL第一帧的帧号。但若后续帧的平均幅度在尚未超第一帧的帧号。但若后续帧的平均幅度在尚未超过之前过之前ITUITU又降到又降到ITLITL之下,则原之下,则原N1N1不作为初始起点,不作为初始起点,改记下一个平均幅度超过了的帧的帧号为改记下一个平均幅度超过了的帧的帧号为ITL N1ITL N1,依依此类推,在找到第一个平均幅度超过此类推,在找到第一个平均幅度超过ITUITU的帧时停止比的帧时停止比较。较。N1N1只是根据能量信息找到的起点,还未必是语音的精只是根据能量信息找到的起点,还未必是语音的精确起点。这是由于语音的起始段往往存在着能量很弱确起点。这是由于语音的起始段往往存在着能量很弱的清辅音,仅依靠能量很难把它们和无声区分开。但的清辅音,仅依靠能量很难把它们和无声区分开。但研究发现它们的过零率明显高于无声段,因此可以利研究发现它们的过零率明显高于无声段,因此可以利用过零率这个参数来精确判断清辅音与无声区二者的用过零率这个参数来精确判断清辅音与无声区二者的分界点。分界点。当当N1N1确定后,从确定后,从N1N1帧向帧向N1-25N1-25帧搜索,依次比较各帧的帧搜索,依次比较各帧的过零率,若有过零率,若有3 3帧以上的帧以上的ZCRIZCTZCRIZCT,则将起点则将起点N1N1定为定为满足满足ZCRIZCTZCRIZCT的最前帧的帧号,否则即以的最前帧的帧号,否则即以N1N1为起点。为起点。语音结束点语音结束点N2N2的检测方法与检测起点相同,从后向前的检测方法与检测起点相同,从后向前搜索,找第一个平均幅度低于搜索,找第一个平均幅度低于ITLITL、且其前向帧的平均且其前向帧的平均幅度在超出幅度在超出ITUITU前没有下降到前没有下降到ILTILT以下的帧的帧号,记以下的帧的帧号,记为为N2N2,随后根据过零率向随后根据过零率向N2+25N2+25帧搜索,若有帧搜索,若有3 3帧以上帧以上的的ZCRIZCTZCRIZCT,则将结束点则将结束点N2N2定为满足定为满足ZCRIZCTZCRIZCT的最的最后帧的帧号,否则即以后帧的帧号,否则即以N2N2作为结束点。作为结束点。三、实验要求三、实验要求 要求通过所学语音信号处理的知识,独立设计要求通过所学语音信号处理的知识,独立设计算法,实现对一段包含背景噪声且前后有一段算法,实现对一段包含背景噪声且前后有一段空白的语音信号进行端点检测,找出语音的真空白的语音信号进行端点检测,找出语音的真实起点和终点。实起点和终点。四、实现方法四、实现方法 可先用麦克风录制一段语音,然后对语音加窗分帧,可先用麦克风录制一段语音,然后对语音加窗分帧,并利用语音增强技术最大限度地滤除背景噪声;对加并利用语音增强技术最大限度地滤除背景噪声;对加窗后的语音信号求其短时平均幅度函数和短时平均过窗后的语音信号求其短时平均幅度函数和短时平均过零率,然后设定这两种参数的阈值,最终在整段语音零率,然后设定这两种参数的阈值,最终在整段语音内通过两种参数与各自的阈值比较找出语音的真实起内通过两种参数与各自的阈值比较找出语音的真实起点和终点。点和终点。五、报告要求五、报告要求 1 1、实验目的及原理说明;、实验目的及原理说明;2 2、详细的算法说明;、详细的算法说明;3 3、实验的具体实施方案;、实验的具体实施方案;4 4、实验程序清单及实验结果;、实验程序清单及实验结果;5 5、实验结果分析。、实验结果分析。6 6、参考文献(、参考文献(3-43-4本参考资料)本参考资料)例:对例:对whut.wav声音文件进行端点检测声音文件进行端点检测%声音读取声音读取 x,fs=wavread(c:whut.wav);x,fs=wavread(c:whut.wav);x=x(20000:length(x);x=x(20000:length(x);x=x;x=x;%幅度归一化到幅度归一化到-1,1-1,1x=double(x);x=double(x);x=x/max(abs(x);x=x/max(abs(x);%常数设置常数设置FrameLen=240;FrameLen=240;FrameInc=80;FrameInc=80;amp1=8;amp1=8;amp2=1;amp2=1;zcr1=10;zcr1=10;zcr2=5;zcr2=5;maxsilence=8;%8maxsilence=8;%8*10ms=80ms10ms=80msminlen=15;%15minlen=15;%15*10ms=150ms10ms=150msstatus=0;status=0;count=0;count=0;silence=0;silence=0;%计算过零率计算过零率tmp1=enframe(x(1:end-1),FrameLen,FrameInc);tmp1=enframe(x(1:end-1),FrameLen,FrameInc);tmp2=enframe(x(2:end),FrameLen,FrameInc);tmp2=enframe(x(2:end),FrameLen,FrameInc);signs=(tmp1.signs=(tmp1.*tmp2)0;tmp2)0.02;diffs=(tmp1-tmp2)0.02;zcr=sum(signs.zcr=sum(signs.*diffs,2);diffs,2);%计算短时能量计算短时能量amp=sum(abs(enframe(filter(1-0.9375,1,x),amp=sum(abs(enframe(filter(1-0.9375,1,x),FrameLen,FrameInc),2);FrameLen,FrameInc),2);%调整能量门限调整能量门限amp1=min(amp1,max(amp)/4);amp1=min(amp1,max(amp)/4);amp2=min(amp2,max(amp)/20);amp2=min(amp2,max(amp)/20);%开始端点检测开始端点检测x1=0;x1=0;x2=0;x2=0;for n=1:length(zcr)for n=1:length(zcr)goto=0;goto=0;switch statusswitch statuscase 0,1%0=case 0,1%0=静音静音,1=,1=可能开始可能开始if amp(n)amp1%if amp(n)amp1%确信进入语音段确信进入语音段x1=max(n-count-1,1);x1=max(n-count-1,1);status=2;status=2;silence=0;silence=0;count=count+1;count=count+1;elseif amp(n)amp2|.%elseif amp(n)amp2|.%可能处于语音段可能处于语音段zcr(n)zcr2zcr(n)zcr2status=1;status=1;count=count+1;count=count+1;else%else%静音状态静音状态status=0;status=0;count=0;count=0;endendcase 2,%2=case 2,%2=语音段语音段if amp(n)amp2|.%if amp(n)amp2|.%保持在语音段保持在语音段zcr(n)zcr2zcr(n)zcr2count=count+1;count=count+1;else%else%语音将结束语音将结束silence=silence+1;silence=silence+1;if silence maxsilence%if silence maxsilence%静音还不够长,尚未结束静音还不够长,尚未结束count=count+1;count=count+1;elseif count minlen%elseif count minlen%语音长度太短,认为是噪声语音长度太短,认为是噪声status=0;status=0;silence=0;silence=0;count=0;count=0;else%else%语音结束语音结束status=3;status=3;endendendendcase 3,case 3,break;break;endendend end count=count-silence/2;count=count-silence/2;x2=x1+count-1;x2=x1+count-1;x1=fix(x1x1=fix(x1*length(x)/length(amp);length(x)/length(amp);x2=fix(x2x2=fix(x2*length(x)/length(amp);length(x)/length(amp);y=x(x1:x2);y=x(x1:x2);subplot(311)subplot(311)plot(x)plot(x)title(title(原波形图原波形图)subplot(313)subplot(313)plot(y)plot(y)title(title(新波形图新波形图)
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!