第11章 多带激励声码器

上传人:熏** 文档编号:243151640 上传时间:2024-09-17 格式:PPT 页数:51 大小:1.74MB
返回 下载 相关 举报
第11章 多带激励声码器_第1页
第1页 / 共51页
第11章 多带激励声码器_第2页
第2页 / 共51页
第11章 多带激励声码器_第3页
第3页 / 共51页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,国家“十一五”规划教材,数字语音编码,讲议,同济大学电子与信息工程学院,赵晓群,编著,机械工业出版社,,2007,年,第,11,章多带激励声码器,11.2,多带激励语音模型,11.1,概述,11.4,多带激励语音合成,11.3,多带激励语音分析,第,11,章多带激励声码器,11.1,概述,CELP,、,MPLPC,等:,全极点模型,、,LPC,分析,,,合成,-,分析法,,,听觉加权,方均误差准则,,闭环,确定激励参数。,这类,混合编码,,在,4.816,kbit/s,码率内获得巨大成功。,关键技术:,是保持了合成语音与原始语音波形的相似性。,再降数码率时,合成语音质量迅速下降。,LPC,声码器:,(清,/,浊音),二元激励模型,,,分析,-,合成法,,,LPC,分析,,,清,/,浊音判别,,估计,基音周期,。,SNR,较高时,,2.4,kbit/s,及以下码率,语音,可懂度,相当高。,以上编码器,当噪声较大时,因无法准确提取参数,,性能,严重恶化,;,其它声码器,如,通道声码器,、,同态声码器,等也有同样弱点。,第,11,章,多带激励声码器,11.1,概述,同济大学电子与信息工程学院,-,3,-,赵晓群,教授,产生原因:,二元激励模型,过于简化,不符合实际语音的特性。,许多语音段,同时含,周期性,、,非周期性,分量,,过渡音段,、,有噪浊音段,更是如此。,当用,二元谱,来拟合时,合成语音,缺乏自然度,。,1988,年,MIT,林肯实验室,提出,多带激励,(,MBE,),语音编码,,,突破,二元激励的局限性,对,多个频带,逐个进行,V/U,判决,,,故称为多带激励模型。,采用,合成,-,分析法,,在,2.4, 4.8,kbit/s,码率,时性能优良。,改进方案被,国际海事卫星组织,采用(,INMARSAT-M,Voice,Codec,),,码率,为,6.4,kbit/s,。,本章主要内容:,MBE,原理,,,参数提取,方法,,合成语音,的方法。重点介绍,INMARSAT-M,Voice,Codec,标准,的算法。,第,11,章,多带激励声码器,11.1,概述,同济大学电子与信息工程学院,-,4,-,赵晓群,教授,第,11,章多带激励声码器,11.2,多带激励语音模型,窗选语音信号,为(窗长,2040,ms,):,源,-,系统语音模型,理论,语音段是,线性系统,(声道),对某种,激励信号,的响应。,设系统的,单位脉冲响应,为,则的,Fourier,变换,可表示为:,式中,H,w,(,),E,w,(,),h,w,(,n,),e,w,(,n,),的,Fourier,变换,。,重建语音信号谱,X,wr,(,),可表示为:,式中,H,wr,(,),合成滤波器,的,系统函数,;,E,wr,(,),合成滤波器的,激励信号,的,Fourier,变换,。,两者皆从,原始语音信号,中分析,提取,。,第,11,章,多带激励声码器,11.2,多带激励语音模型,同济大学电子与信息工程学院,-,5,-,赵晓群,教授,清音波形,H,wr,(,),用,全极点函数,来逼近,相应于,X,wr,(,),的,谱包络,。,MBE,按,基音,各,谐波,,将语音分成若干个,子频带,(如以,3,个相邻的谐波频带为一组进行分带),,分别对各子带进行,V/U,判决,,,激励信号,为各子带的,和,。,清音带:,用,白噪声谱,作为,激励信号谱,;,浊音带:,用,周期性,的,P,w,(,),作为,激励信号谱,。,激励信号是,周期性信号,与,非周期性噪声,按不同频带混合而成。,系统函数,H,wr,(,),的作用是:,调整,各子带分量的相对,幅度,和,相,位,,并将,E,w,(,),映射成,X,w,(,),。,该模型较符合实际语音的特性,使,合成语音谱,同,原语音谱,在频谱精细结构上,拟合得更好,。,若还利用谱的,相位,信息,则能够合成出高质量的语音。,第,11,章,多带激励声码器,11.2,多带激励语音模型,同济大学电子与信息工程学院,-,6,-,赵晓群,教授,图,11.1,:,典型的,浊音,、,清音,和,混合语音,段的分析,-,合成情况。,MBE,编码过程涉及三种参数的提取,,基音频率,;,每个,子带,的谱包络的,幅度,和,相位,参数;,每个,子带,的,V/U,判决,。,图,11.2,:,MBE,语音,编,/,解码器,的简化原理图。,第,11,章,多带激励声码器,11.2,多带激励语音模型,同济大学电子与信息工程学院,-,7,-,赵晓群,教授,图,11.2,MBE,声码器语音编,/,解码器原理图,清语音合成,浊语音合成,基音周期估计,谐波产生,频带划分,幅度估计,清,/,浊判决,相位计算,FFT,传 输,输出,Hamming,窗,同济大学电子与信息工程学院,-,8,-,赵晓群,教授,(a),浊语音段,(b),清语音段,(c),混合语音段,图,11.1,语音,MBE,的分析,-,合成波形(,10 kHz,采样,,256,点,Hamming,窗),浊音波形,清音波形,混合音波形,加窗语音谱,加窗语音谱,加窗语音谱,谱包络,谱包络,谱包络,U/V,判决结果,U/V,判决结果,U/V,判决结果,周期谱,P,(e,j,),周期谱,P,(e,j,),周期谱,P,(e,j,),白噪声谱,白噪声谱,白噪声谱,激励信号谱,激励信号谱,激励信号谱,合成语音谱,合成语音谱,合成语音谱,同济大学电子与信息工程学院,-,9,-,赵晓群,教授,第,11,章多带激励声码器,11.3,多带激励语音分析,MBE,模型参数的最优提取,计算量大,工程难以实时实现。,常用,次优,算法,分两步完成参数的提取:,确定,基音频率,和,每个分带,的,谱包络,参数,用,AbS,法,提取,;,对,每个分带,进行,V/U,判决,。,有两种参数提取方案:,使下列,加权积分,值(,加权方均谱误差,)为,最小,:,应使下列,加权积分,值达到,最小,:,式中,G,(,),频率加权函数,;,X,w,(,),X,wr,(,),原始语音谱,和,合成语音谱,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,差别:,方案,利用语音谱的,模值,;,方案,利用,模值,和,相位,,性能优于,,,但计算复杂,码率有所增加。,INMARSAT-M,Voice,Codec,采用方案,。,本节主要内容:,11.3.1,频域分析,11.3.2,时域分析,11.3.3,INMARSAT-M,改进,MBE,模型分析算法,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,10,-,赵晓群,教授,11.3.1,频域分析,1.,基音估计及各次谐波幅度的计算,设,基音周期,为,T,0,(,基音角频率,0,=,2,/T,0,)。,依次,假设,0,为各种可能出现的值。,对于,可能,的,基音角频率,值,0,,将,=,-,分为若干频带,,分界点,为:,a,m,=,(,m,-,0.5),0,b,m,=,(,m,+,0.5),0,m,=0,1,(,M,+1),设,每个,分带,a,m,b,m,中,H,wr,(,),保持不变,,H,wr,(,)=,A,m,,,则有:,式中,总的,加权方均谱,误差;,m,第,m,子带,加权方均谱,误差,,或,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,11,-,赵晓群,教授,仅考虑,幅度谱,时,考虑,幅度、,相位谱,时,令,或,,由上两式可分别,解得,一组,最佳,和 :,或,若,第,m,次谐波,的能量显,周期性,,则其能量集中在该谐波附近,;,选,周期性,P,w,(,),的作为,激励信号,E,wr,(,),,,则,合成语音谱,X,wr,(,),与,窗选语音谱,X,w,(,),在,第,m,次谐波,带内将拟合得很好(,m,最小)。,若,第,m,次谐波,的能量显,非周期性,,,则,X,w,(,),在该频带内没有特征性的形状。,仍用,P,w,(,),作为激励,,m,值将较大。此时,,应选,噪声,为激励。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,12,-,赵晓群,教授,仅考虑,幅度谱,时,考虑,幅度、,相位谱,时,分析,周期性,与,非周期性,信号激励时的,最佳解,。,浊音频带时,,选,P,w,(,),为,激励信号,,由上页两式得:,清音频带时,,激励采用,理想白噪声,(,幅度谱,= 1,),则有:,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,13,-,赵晓群,教授,仅考虑,幅度谱,时,,最佳谱幅度,考虑,幅度、相位谱,时,,最佳谱包络,。,相位信息无关紧要,,在此,无需计算,A,m,。,对于,假定,基音频率,0,的每一个谐波,,计算,A,m,或,A,m,,,再求,出,各次谐波内,的最小误差 。,则整个频带的总的最小误差:,每假设一个,基音频率,0,,计算出对应的,0,。,显然,正确的,基音周期,或其,倍数,上,,0,取,极小值,。,搜索,0,的全局最小值对应的,T,0,=2,/,0,值可能是,正确的,基音周期,的某个整数倍值。,因而,还需要对,T,0,/2,、,T,0,/3,、,处的,0,进行,校核,,,以判断,正确,的,基音周期,,从而确定,最佳基音周期,。,最后确定最佳基音周期时,还,需要考虑,前后帧,的情况。,一般相邻帧的,T,0,值变化不会太大。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,14,-,赵晓群,教授,2.,谐波频带内,V/U,判决,第,m,子带的,归一化误差能量,为:,采用,激励信号,P,w,(,),(,谱幅度,A,m,或,谱包络,A,m,、,周期,T,0,),是第,m,谐波子带的谱拟合误差。,令,频率加权函数,G,(,)=1,,上式化简为:,子带判决:,可以将相邻的几个谐波频带,合并,成一个,子频带,,,用上述同样的方法,提取,A,m,或,A,m,,并,进行,V/U,判决,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,15,-,赵晓群,教授,11.3.2,时域分析,W,(,),:,窗函数,w,(,n,),的,Fourier,变换,,0,:,归一化基音角频率,(,基音周期,T,0,,,0,= 2,/,T,0,),假设,在,-,频率范围内共,2,M,个,谐波,,,P,w,(,),为,激励,时,有,:,式中,,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,16,-,赵晓群,教授,令频率,加权函数,G,(,)=1,,由前面给出的式子,得,,全带拟合误差,:,式中,,由,上,式,可,求出,使,取,极小值,的矢量,a,为,:,再,代入,上,式,,,结合,上页,式,得,:,式中,,因此,对于某个,选定,的,T,值,时,,,计算,min,等价,于,max,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,17,-,赵晓群,教授,注:,上标,T,为转置,H,为共轭转置,为了,方便,,选择,窗函数,w,(,n,),,,使其满足,频域内正交条件,:,,,I,是,单位矩阵,;,相当于,时域,内,满足条件,:,还要求,其,Fourier,变换的,泄露,足够小,,主瓣宽度,足够窄,(,此宽度不应大于基音频率值,),。,满足,上述,条件且,w,(,n,),为,偶函数,时,,,上页计算,式可,改写,为:,注意到,0,M=,近似成立,且,0,T=,2,,则上式可,简化,为,:,式,中,T,假定的,基音周期,;,w,2,(,n,),x,(,n,),的,自相关函数,,,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,18,-,赵晓群,教授,由,Parseval,定理,,总拟合误差,写成,:,为了去除由于,T,值增加造成,的,下降,需要对,上,式,修正,,,以保证真正的,基音周期,对应的是全局最小值。,采用,无偏拟合误差公式,如下:,采用此修正后,,归一化总误差能量,应写成下列形式:,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,19,-,赵晓群,教授,设,窗函数,w,(,n,),长为,2,N,+1,,,以,原点对称,。,同时,假设,在窗长范围内有,L,个,假设基音周期,,,即:,则上页,式中,,,uB,的求和上下限应作相应的,改动,,,即得到,:,为,粗搜索,时确定,初始基音周期,T,I,所用的拟合误差,时域,表达,。,为,提高,精度,,,T,值也可取,非整数,,,如,20.5,21,21.5,。,非整数点,上,的相关函数,可,插值计算,:,实验表明,,1,0,k,Hz,采样,基音周期,的,精确,可达,0.04,样点,。,数,码率较低,时(,4.8,kbit/s,以下,),,精确到,1/4,1/8,样,点,也就满足要求了,这样运算量可以减少很多。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,20,-,赵晓群,教授,11.3.3,INMARSAT-M,改进,MBE,模型分析算法,图,11,.,3,:,INMARSAT-M,改进,MBE,模型算法框图。,语音信号,:,8,k,Hz,采样,,,线性,PCM,编码,,,语音样值的,最大,值,定标,范围,:,2,14,-,1,,,2,15,-,1,最小值定标,范围,:,-,2,15,,,-,2,14,需求出,改进,MBE,模型参数,:,基音角频率,、,V/U,判决,,,子带,谱包络参数,(,仅考虑,幅度谱,),。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,21,-,赵晓群,教授,图,11.3,MBE,语音分析算法方框图,高通滤波器,低通滤波器,基音周期,初始估计,清,/,浊判决,基音周期,精确估计,频谱估计,语音信号,1.,高通滤波,语音,经,数字,高通滤波器,,,滤,除信号中的,直流分量,。,高通滤波器,的,截止频率,约,1,0,Hz,,,传递函数,为,:,2.,低通滤波,低通滤波器,输出的信号按下式计算,:,低通滤波器,是,21,阶,FIR,数字滤波器,,其系数值列于,表,11,.1,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,22,-,赵晓群,教授,表,11,.1,FIR,低通滤波器,系数,j,h,L,(,j,),j,h,L,(,j,),j,h,L,(,j,),0,0.394201,4,-,0.063723,8,-,0.007430,1,0.297354,5,-,0.004565,9,-0.013775,2,0.093671,6,0.030659,10,-,0.002174,3,-,0.051602,7,0.016900,同济大学电子与信息工程学院,-,23,-,赵晓群,教授,图,11.4,相邻语音帧与帧之间的关系,过去帧当前帧将来帧,3.,基音估计,基音估计算法,:,应,保持,相邻语音帧,基音周期的某种,连续性,。,基音跟踪算法,:,在确定当前帧的基音周期时要考虑,相邻的,过去帧,和,将来帧,的影响。,图,11,.,4,:,当前帧,和,前后帧,之间的关系,。,帧长,为,20,ms,(,160,个,样点,),。,基音估计,算法,分,:,初始估计,、,精细估计,两,步,进行,。,初始估计,得到,初始基音周期,:,T,I,,,T,I,D,=21,21.5,114,,,精度,:,1/2,采样周期,;,再,由,精细估计,得出,归,最终,基音周期,,,精度,:,1/4,采样周期,。,两,步,法可,降低,计算复杂度,和,提高鲁棒性,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,-,40,-,20,0,20,40,60 ms,T,-2,T,-1,T,0,T,1,T,2,基音周期:,误差函数:,E,-2,(,T,),E,-1,(,T,),E,0,(,T,),E,1,(,T,),E,2,(,T,),算法,的,重要特点,:,初始估计,和,精细估计,使用不同长度的窗函数,。,初始估计窗,w,I,(,n,),长为,281,个,样点,;,精细估计窗,w,R,(,n,),长,为,221,个,样点,;,皆,是,对称三角形窗,,,两窗,中,点,对齐,。,相邻语音帧之间的,重叠量,是窗长的,函数,,,重叠量,=,窗长,-,帧移动量,(,160,个,样点,),。,w,R,(,n,),时,,,重叠量,61,个,样点,;,w,R,(,n,),时,,,121,个,样点,。,(,1),基音的,初始估计,(,步骤,见,图,11.5,),对每一个,可能,的,基音周期,T,D,,,计算,误差函数值,E,(,T,),。,然后通过,前向,与,后向基音,跟,综算法,,,比较,求出的值,,最终,选择,最佳的候选者,作为,T,I,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,24,-,赵晓群,教授,图,11.5,初始基音周期估计,后向,基音跟踪,前向,基音跟踪,比较基音,估计值,计算,误差函数,计算,误差函数,根据,归一化总误差能量,定义,,,误差函数,E,(,T,),定义,为:,式中,w,I,(,n,),归一化三角形窗,函数,,,满足,。,当,t,为,整数,值,时,,自相关函数,(,t,),定义,为,:,当,t,为,非整数,值,时,,,用,线性内插,公式,计算,(,t,),。,基音,周,期的,初始估计,T,I,为:,采用基音跟踪算法,,,保证,基音周期,T,I,的,连续性,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,25,-,赵晓群,教授,后向基音跟踪,E,-1,(,T,-1,),、,E,-2,(,T,-2,) ,过去两帧对应的,误差函数值,;,因,基音周期的,连续性,,当前帧的基音周期,T,应在,T,-1,附近,,应,满足约束条件,:,在,上式,范围内逐个,选取,T,,,并,计算,相应的,E,(,T,),,,使,E,(,T,),最小,的,T,就是后,向,估计,T,B,,,计算,后向累计误差,CE,(,T,B,),:,CE,(,T,B,),是,后向基音估计,的,置信度测度,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,26,-,赵晓群,教授,前向基音跟踪,E,1,(,T,1,),、,E,2,(,T,2,) ,将来,两帧对应的,误差函数值,;,将来两帧的基音周期,尚未确定,,,前向基音跟踪算法必须首先设法确定这些基音周期值,。,在集合,D,内选定一个,T,0,,按下面的,约束条件,选取,T,1,、,T,2,:,使,E,1,(,T,1,)+,E,2,(,T,2,),最小,的,T,1,、,T,2,表示为,,,并按下式,计算,前向累计误差函数,CE,F,(,T,0,),为:,重复上述过程,,在规定的范围内逐个,选定,T,0,,,计算,相应的,CE,F,(,T,0,),,,使其,最小,的,T,0,定义,为,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,27,-,赵晓群,教授,为防止,倍基音周期,,,考虑,取 的可能性,。,要,求,,,选择,一个与其,最接近,的值代替。,再,检查,是否,满足,下列,三个条件,之,一、,且为,最小值,的,,,若有,则,前向基音,估计,;,否,则,。,完成,前,、,后向基音跟踪,,并,求得,估计,值,后,,按下列,判决规则,确定,初始基音估计,T,I,:,If,CE,b,(,T,B,)0.48,then,T,I,=,T,B,e,lse,if,CE,b,(,T,B,),CE,F,(,T,F,),then,T,I,=,T,B,e,lse,T,I,=,T,F,最终的,基音估计的,精,度,提高到,1/4,采样周期,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,28,-,赵晓群,教授,(2,),基音的,精细,估计,图,11,.,6,:,基音精细估计,的方框图。,精细估计窗,w,R,(,n,),:,长,221,个,样点,,,归一化,三角形窗,。,由,基音初始估计,T,I,,产生,10,个,基音精细估计,的,候选值,:,将其,转换,为相应的,基音频率,0,=,2,/T,0,。,然后在这,10,个点上,进行,细搜索,,,确定,基音周期的,精细估计,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,29,-,赵晓群,教授,图,11.6,基音的精细估计,计算,A,m,(,0,),计算,X,wr,(,l,0,),计算,(,0,),256,点,DFT,16384,点,DFT,产生,10,个,0,候选值,min,(,0,),计算,窗,选,语音,和,窗函数,的,离散,Fourier,变换,。,对,窗,选,语音信号,,,计算,256,点,DFT,:,对,窗函数,计算,16384,点,DFT,:,(扩大点数,可,保证精度,),对每一个假设的,0,,,求,各谐波的,最佳谱包络值,A,m,(,0,),。,选定,0,,,则,在,-,之间有个, 2,/,0,谐波,分量,,两个,相邻谐波,之间含有,256,0,/,2,个,语音信号,的,DFT,点。,对于,第,m,次谐波,,它的,频带下限,、,上限,为:,其中,,,INT,x,表示取,大于,或,等于,x,的,最小整数,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,30,-,赵晓群,教授,根据式,:,因,窗,选,激励,P,w,(,),在频带内与,窗,函数,主瓣,包络,形状相同,,故用,W,R,(,),代替,P,w,(,),。,这意味着语音,改变,一个样点,窗,改变,64,个样点。,因此,,最佳用下式,计算,:,计算,合成语音谱,。,按下式,计算,:,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,31,-,赵晓群,教授,计算,加权总拟合误差,,,选择,最佳,0,(,或,T,0,)。,采用,DFT,的,总拟合误差,为:,在细搜索中,主要,考虑,高次谐波,频带拟合的情况,因此,,,加权函数在,低频端,可以取,0,,,求和下限,不从,1,开始,;,高频端,可以取,1,,,求和上限,也不必达到,127,。,语音,频谱,一般,限制,在,200360,0,Hz,范围内。,故,按,下,列公式,确定,求和上限,q,:,总拟合误差,可以,改写成,:,对,10,个,候选基音频率,,逐个,计算,出,总拟合误差,,,使,其,最,小,的,0,是当前帧,基音周期,的,精细估计值,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,32,-,赵晓群,教授,利用,偶对称性,,,只,计算,了,一半,的值,4.,V/U,判决,图,11,.,7,:,V/U,判决,的方框图。,利用每个谐波处,合,成,谱,与,窗选,语音谱,拟合的程度来,确定,。,若,归一化拟合误差,阈,值,,,判,定,该谐波,频,带为,浊音带,;,反之为,清音带,。,采用,DFT,时,,前面推导的,归一化误差应,改写,成,:,也可,将几个,相,邻,谐波,频带,合并,成一个,频带,,,根据该,频,带,总拟合误差,作出该带的,V/U,判决。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,33,-,赵晓群,教授,图,11.7,清,/,浊判决方框图,计算拟合误差,计算,E,0,更新,E,avg,E,min,E,max,计算阈值,与阈值比较,实用,V/U,判决,方案:,最,多分,12,个带,,判决方法,如下:,确定,谐波,的个数,M,。,计算式:,确定,子带,的个数,K,。,每个,子带,包含,3,个,谐波分量,(见,图,11.8,)。,子带数,的,计算式:,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,34,-,赵晓群,教授,图,11.8,改进的,MBE,频带结构,子带,1,子带,2,子带,K,-1,子带,K,计算,各带的,归一化拟合误差,。,计算式:,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,35,-,赵晓群,教授,计算,V/U,的,判决,阈,值,。,计算式:,第一项,:,随,0,增大,而,变大,。,当,0,增加时谐波个数将减少,,拟合误差,会变大,,,此项起到,去,偏,作用。,第二项,:,随,0,升高,而,变小,。,由于,话音高频端通常更具有随机谱的特征,,因此,较多地,判,为,清,音区,会使合成语音听起来自然,。,第三项,:,是同语音,当前帧能量,E,0,、,平均能量,E,avg,、,最小能量,E,min,、,最大能,量,E,max,有关的参数。,采用,自适应,方法,,逐帧,更新,这些,参数,,以期获得更好的效果。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,36,-,赵晓群,教授,若用,E,(0),表示,当前帧,的参数,,,E,(-1),表示,前一帧,的参数,,相关,量的,定义为,:,且,满足的,约束条件,:,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,37,-,赵晓群,教授,求出上述几个能量之后,再,确定,函数,:,V/U,判决,。,判决,规则,为:,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,38,-,赵晓群,教授,5.,求,各,谐波幅度,或,包络,图,11,.,9,:,频谱幅度,估计框图,。,改进,MBE,语音编码器,每个,分频带,包含,3,个,谐波,。,谐波,结构见,图,11,.,8,。,对于第,k,个,频带,,其,频带范围,为,a,3,k,-2,b,3,k,,,需,要,确定,3,个,频谱幅度,A,3,k,-2,、,A,3,k,-1,、,A,3,k,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,39,-,赵晓群,教授,图,11.9,频谱幅度估计,计算清音幅度,计算浊音幅度,选择清音,/,浊音谱幅度,图,11.8,改进的,MBE,频带结构,子带,1,子带,2,子带,K,-1,子带,K,浊音带,时,,,按下式,计算,:,如果,数,码率足够高,也可以,直接传送,A,m,(,0,),。,清音带,时,,,A,m,按下式,计算,:,对于,最高分频带,K,,,其,频带范围,是,a,3,k,-2,b,M,,,包含,M,-3,k,+3,个,谱幅度,。,令,直流分量,A,0,=0,。,第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,40,-,赵晓群,教授,改进,MBE,模型的全部参数,为:,基音周期,T,0,,,各带的,V/U,判决,V,k, (,k,=1,2,K,),,,各谐波处,的,最佳幅度,A,m, (,m,=1,2,M,),。,参数,传送给解码器前,需,量化,、,编码,。,INMARSAT-M,语音编码器的,比特率,为,6.4,kbit/s,,,帧长,20,ms,,,每帧,128,bit,,,其中,45,bit,留给,信道编码,用,余,83,bit,供量化,模型参数,用,。,表,11,.2,:,比特分配,表,。,(,参数量化的方法从略,),第,11,章,多带激励声码器,11.3,多带激励语音分析,同济大学电子与信息工程学院,-,41,-,赵晓群,教授,表,11,.2,模型参数比特分配,参数,基音周期,V/U,判决,频谱幅度,每帧比特数,8,K,75,-,K,第,11,章多带激励声码器,11.4,多带激励语音合成,两种,合成方法,:,频域合成法,、,时域合成法,。,频域合成法,:,重建,语音谱,,,求,Fourier,反变换,得,时域序列,。,相当于分析过程,的,逆过程,。,特点:,比较直接,但不能保证合成语音,基音周期,的,平滑变化,。,时域合成法,:,利用,插值,实现,帧间基音周期,的,平滑过渡,,,可使,合成语音更自然。,因,此,,,实际的,MBE,算法都采用这种方法。,下面,介绍,时域合成法,。,图,11,.,10,:,改进,MBE,语音合成,框图,。,浊音成分,与,清音成分,分开合成,,再,相加形成,完整的,合成语音,。,第,11,章,多带激励声码器,11.4,多带激励语音合成,同济大学电子与信息工程学院,-,42,-,赵晓群,教授,图,11.10,改进,MBE,语音合成方框图,清音合成,浊音合成,合成语音,11.4.1,清音成分的合成,清音成分,的合成用,白噪声激励,。,初始值,为,u,(,-,105) = 3147,。按下式产生一个,白噪声序列,u,(,n,),:,对相继的,合成语音,帧,,u,(,n,),移动,20,ms,(,160,样点,),,对,u,(,n,),加窗,,合成窗,w,x,(,n,),长,:,209,样点,。,因此,在相继合成语音帧之间,,噪声序列,重叠,49,样点,。,对加窗后的,u,(,n,),进行,256,点的,DFT,,,得,:,第,11,章,多带激励声码器,11.4,多带激励语音合成,同济大学电子与信息工程学院,-,43,-,赵晓群,教授,再,根据,谐波频带,m,是,浊音,区,(,V,k,=1,)或,清音,区,(,V,k,=0,),,再对,U,w,(,l,),进行,修正,得,U,wc,(,l,),:,式中,,,a,m,b,m,定义,见前面;,A,m,(0),当前帧,的,A,m,值。,m,伸缩系数,,,是,合成窗,w,x,(,n,),与,基音精细估计窗,w,R,(,n,),的函数,,修正效果相当于用一组,带通滤波器滤,除浊音带的信号。,第,11,章,多带激励声码器,11.4,多带激励语音合成,同济大学电子与信息工程学院,-,44,-,赵晓群,教授,U,wc,(,l,),中很低及很高的频率成分都置,0,,,即,:,对,得到,的,频域各点,U,wc,(,l,),,,依,下式,计算,其,IDFT,:,为,平滑,合成语音,,需,与前一帧的,清音序列,作,叠接处理,。,设,本帧,和,前一帧的,清音序列,分别,用,表示,,则,当前合成语音的清音部分,x,U,(,n,),由下式,计算,:,式,中,,,N,帧长,,,N,=160,;,且,时,,,。,第,11,章,多带激励声码器,11.4,多带激励语音合成,同济大学电子与信息工程学院,-,45,-,赵晓群,教授,11.4.2,浊音成分的合成,方法:,先,计算,各,谐波分量,x,V,m,(,n,),,再,叠加,,,得总的浊音,即,:,式中,M,(0),M,(-1),当前帧,、,前一帧,所含谐波的个数,,第,m,次谐波的,谱幅度,A,m,按以下规则,确定,:,并且,式中,A,m,(0),A,m,(-1),当前帧,、,前一帧,第,m,次谐波的,谱幅度,。,下面算式中的参数,x,(0),x,(-1),表示,当前帧,、,前一帧,的参数,x,。,第,11,章,多带激励声码器,11.4,多带激励语音合成,同济大学电子与信息工程学院,-,46,-,赵晓群,教授,分,5,种不同的前后帧组合情况,,,进行合,成语音的,平滑过渡,:,当前帧,/,前一帧,的第,m,次谐波,皆,为,清音,:,清音分量按上面,的,合成方法合成,;,浊音分量,置,0,。,当前帧,第,m,次谐波为,清音,,,前一帧,为,浊音,:,浊,/,清过渡,,该部分的,浊音分量,为:,当前帧,第,m,次谐波为,浊音,,,前一帧,为,清音,:,清,/,浊过渡,,该部分的,浊音分量,为:,当前帧,/,前一帧,的第,m,次谐波,皆,为浊音,且,该部分的,浊音分量,为:,第,11,章,多带激励声码器,11.4,多带激励语音合成,同济大学电子与信息工程学院,-,47,-,赵晓群,教授,计算中,,时,当前帧,/,前一帧,的第,m,次谐波,皆,为,浊音,,且,该部分的,浊音分量,为:,式,中,a,m,(,n,),幅度函数,;,m,(,n,),相位函数,;,第,11,章,多带激励声码器,11.4,多带激励语音合成,同济大学电子与信息工程学院,-,48,-,赵晓群,教授,其,中,,,相位参数,按以下算式每帧进行,更新,:,式中,当前帧,中清音,谱幅度,的数目,;,随机数,,在区间,-,),中均匀分布,,,;,当前帧,的,噪声序列,。,第,11,章,多带激励声码器,11.4,多带激励语音合成,同济大学电子与信息工程学院,-,49,-,赵晓群,教授,11.4.3,重建语音的产生,分别求出,:,清音部分,和,浊音部分,后,,最后的,合成语音,为,:,MBE,声码器是从改善激励源出发的一种语音压缩编码方案。是建立在频谱分析基础上的又一种,激励模式,。,低码率语音编码中,,,合成音质较传统声码器好得多,,且有较好的,自然度,和,容忍环境噪声,的能力。,第,11,章,多带激励声码器,11.4,多带激励语音合成,同济大学电子与信息工程学院,-,50,-,赵晓群,教授,谢 谢,!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!