资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,P.,141,第五章 信源编码,目的:提高通信系统有效性,实现信源与通信系统间的统计匹配。, 无失真信源编码,一) 首先,我们研究,离散、无失真、无记忆信源编码的一般,模型:,若不考虑信源统计特性:,应满足: 相互矛盾!,由 -,(一)离散、无失真、无记忆信源编码的一般模型 (续),结论:当,n = m,时,,KL,不有效。,当,K = L,时,,mn,,亦不满足有效性。,解决办法: 引入信源统计特性。,考虑信源统计特性:,即无需对全部组合的,n,的,L,次方种信息一一编码,而仅需对其中少数大概率事件集合中元素进行编码即可。,这时,我们可以修改式为:,K/LH(U)/log m - ,即考虑信源不等概率,而码字为等概率,,这就是,等长码的仙农无失真信源编码定理:,对离散,无记忆、平稳、遍历信源其符号序列:,U,=(U,1,U,2,.U,L,),,可用,K,个符号,C,=,(C1,C2.Ck),进行等长编码,对任意,0,0,,只要满足:,(,K/L)log mH(U)+ -,则当,L,足够大时,可使译码差错小于,,,反之,当 (,K/L)log mH(U)-2 -,时,,译码一定出错。,这就是,等长码信源编码定理,。,(一)离散、无失真、无记忆信源编码的一般模型 (续),(一)离散、无失真、无记忆信源编码的一般模型 (续),定理证明,主要引用了序列信源中的随机序列的渐近等同分割,A. E. P,特性.,所谓,A. E. P,是指任何一个离散随机序列信源当序列长度时,信源序列会产生两极分化.大概率事件集合与小概率事件集合 ,即,n,L,= ,对于 有性质:,(信源熵) (大概率事件熵),(等概率),对于 有性质:,(一)离散、无失真、无记忆信源编码的一般模型 (续),由此可见,信源编码只需对信源中少数落入典型大概率事件的集合 的符号进行编码即可。而对大多数属于非典型小概率事件集合 中的信源符号无需编码,且 。,由,A.P.E,推出的辅助不等式:,选典型序列 中,个,u,编码,即,为此,有下列,变长码熵匹配编码定理形式,:,其次,再讨论变长码,这时公式可进一步修改为:,(一)离散、无失真、无记忆信源编码的一般模型 (续),-,对于二进制,可进一步简化为:,-,故称它为熵匹配编码。它就是变长码信源编码定理。,可见,上述无失真信源编码定理,不仅是存在性定理,而且是构造性定理。,例:设有一简单离散信源:,L=1,n=4,对其进行近似于无失真的等长编码,若要求其编码效率为95%,差错率低于10,-6,,试求符号联合编码长度,L=?,解:,2,=0.6875 bit,2,由编码效率:,即:,可见,需要100万个信源符号联合编码,才能达到上述要求,这显然是不现实的.,下面,若进行变长编码又如何呢?,再由:,变长码 0 10 110 111,可见,若采用变长编码,逐位(,L=1),即可达到100%效率,当然这里仅是一个特例,不过它已足以说明变长码的优越性。如何译码?有两类方法:加标志信息寻找内在规律,下面,我们给出几种类型的信源编码:,其中编码为等长码,码长,K=2,,但与,p,i,不匹配,编码至为变长码,但是编码的,U,1,和,U,2,均编为“0”,编码不单义(奇异)不能用;,信源,概率,p,i,编码,编码,编码,编码,编码,U,1,1/2,00,0,0,0,0,U,2,1/4,01,0,1,10,01,U,3,1/8,10,1,00,110,011,U,4,1/8,11,10,11,111,0111,编码,,发(编码)单义,但是收(译码)不单义,,比如收到“00”可能译为 亦不能用。编码与,收、发均满足单义,故可用,但是两者是有差别的。虽然都是唯一可译码,但是编码是一类实时唯一可译码,又称为异前置码或非延长码。,所谓,异前置,是指某一码组的后面向前面看:比如,u,4,=111,,被采用后,其前面的任意组合比如11,或1均不能再采用;,所谓,非延长,码,则是某一码组的前面向后面看:比如,u,1,=0,,被采用后,则从0以后的任何延长出去组合,比如00、01、001等均不能再用。,它是最佳变长码。编码也是满足唯一可译性,但不满足异前置或非延长特性,译码时,需要延时判决,所以它不是实时可译码。比如收到“0”不立即判决,而是延迟一位,根据收到的第二位在判决第一位若为“00”则判第一位为0,即,u,1,;,若为“01”仍不能判,再观察第三位,若为“010”,则判“01”为,u,2,,,若为“011”再观察第四位,若为“0110”判为“011”为,u,3,,,若为“0111”判为,u,4,。,下面,进一步研究实时唯一可译码的码字可分离条件,它可引用很直观的“码树”概念来说明:,将变长码与码树建立“一一对应”关系:,树根,码字起点,树枝数,码的进制数,节点,码字或码字的一部分,终止节点,码字,节数,码长,非满树,变长码,满树,等长码,下面,我们寻找一种与上述“树图”等效的解析式表达式-,Kraft,不等式,。分析起来特别对含有很多符号种类的复杂信源更方便。,定理:长度为,K,i,(i,=1,2,n),的,m,进制异前置码存在的充要条,件为: -。,证明,下面仅给出必要性证明,充分性见书,,若设码树共有,K,节,则总码枝数为,m,k,个。若某个长度为,K,i,的码枝被选用,则自该支第,K,i,节点以后所有码枝不能再选用,即有,码枝不能再选用。由于,K,i,中,i,是任意的(,i=1,2,n),,所以全树中不能再选用的总码枝数应为:,,显然其值一定要小于全树总码枝数,m,k,,,即有,编码规则:,1),将信源消息,U,按概率大小排序(由大至小)。,2) 从最小两个概率开始编码,并赋予一定规则,如下支路小概率为“1”,上支路大概率为“0”。若两支路概率相等,仍为下支为“1”上支为“0”。,3) 将已编码两支路概率合并,重新排队,编码。,4) 重复步骤3)直至合并概率归一时为止。,5),从概率归一端沿树图路线逆行至对应消息编码,如,U,3,为“110”。,例,2 (续),例三 (续),可见,编成的码,C,和,C,不一样,这说明哈夫曼编码并不唯一,这是由于哈夫曼编码是与信源统计特性相匹配的编码,而不是某个信源固定特性相匹配,不唯一性是明显的,但是只要在编码和译码过程中遵守同一规则,译码是唯一的。虽然,C,和,C,不一样,但是两者都是哈夫曼编码,并且码长相等。,Kc,=0.41+0.22+0.23+20.14=2.2,Kc,=0.42+0.222+0.132=2.2,但是,若从二阶矩来看,即方差来看,,C,的方差大,,C,的方差小,所以,C,优于,C,例三 (续),下面讨论哈夫曼编码应用中的一些问题:,1)首先讨论误差扩散:哈夫曼编码是一种无失真信源最佳编码,但是在实际信道中是有失真的。噪声的引入必然要破坏长码结构,而且是变长码,错误不但影响受干扰位,还要进一步扩散。目前对扩散还没有很有效的方法,工程上克服方法有两种:一是限制哈夫曼码仅能应用于优质信道(=10,-6,)以限制扩散的可能性;二是采用定期清洗,防止扩散区域增大。但是它是靠牺牲有效性换取的。,2)其次是速率匹配问题:由于绝大多数信源是不等概率的,由它编成的码长度与速率是可变的。然而实际信道则要求其输入端速率是固定的。所以信源与信道之间还存在一个速率匹配问题。在工程上解决这一问题的方法是在两者之间加一个类似与水库的缓存器,它变速入,恒速出,以解决两者速率的匹配。,3)第三是与信源统计特性匹配的问题。其中:,(1)、小消息(符号)集信源不易匹配可采用信源消息集不断扩展的方法来解决,但是太复杂。,(2)、信源统计特性未知时,怎么办?可采用所谓通用编码的方法来解决。,上一节我们利用树图的理论寻找出一类唯一可译的变长码的编译码方法。即:,(同构),树的生成结构规律 唯一可译码变长,( 树图理论) (一一对应) 编、译码方法,这一节中我们利用数学中最简单的算术规律来构造一类无失真的信源编码。,(同构),算术规律 非分组的信源编码,(一一对应),算术编码,下面,首先从一个,PCM,编码例子入手:,000,02,0,+ 02,1,+ 02,2,0,0,02,1,+ 02,-2,+ 02,-3,001,12,0,+ 02,1,+ 02,2,1,1/8,02,1,+ 02,2,+ 12,3,010,02,0,+ 12,1,+ 02,2,2,2/8,02,1,+ 12,2,+ 02,3,011,12,0,+ 12,1,+ 02,2,3,3/8,02,1,+ 12,2,+ 12,3,100,02,0,+ 02,1,+ 12,2,4,4/8,12,1,+ 02,2,+ 02,3,101,12,0,+ 02,1,+ 12,2,5,5/8,12,1,+ 02,2,+ 12,3,110,02,0,+ 12,1,+ 12,2,6,6/8,12,1,+ 12,2,+ 02,3,111,12,0,+ 12,1,+ 12,2,7,7/8,12,1,+ 12,2,+ 12,-3,PCM,码 编码公式 对应量化层 归一化编码公式,上面例子是一个简单的三位,PCM,的例子,其编码可表示为:(简单算术表达式),三位码共有八层:, ,可见,这时信源编码过程就可以看作是上述对应二进制小数作移位相加的过程。故称它为,算术编码,。,仔细分析,上述例子仅是一个特例,因为它没有考虑信源的统计特性,(它认为信源是遵从等概率分布的)所以编出的码字是等长码,而对应的算术运算则是简单的整数项相加。(即,Ki,为整数)。,为了解决对一般的具有统计特性的信源的算术编码问题,需要将上述算术编码方式进一步拓广,并要解决信源统计特性与编出的码字相匹配。,其中最关键的是要将算术编码与信源的符号概率及累积概率建立一一对应关系。算术编码就是基于这一思路。不过,在引入统计特性后的算术编码中,每次移位的位数可以是非整数(精度有限的有理数),正是由于这种非整数的引入使算数编码变成了,非分组码,。更确切地说,在每步编码运算中除了实际移动的某一整数位以外,还以内部状态形式保留了应该移动的“分数”位,并将其累积到下一步编码运算中。这样,只要非整数的精度足够高,则就可以与信源消息匹配到任意良好的程度。,下面,从一个单消息(符号)信源入手,简述算术编码原理及编码方程的建立:,设信源序列为:,S = S,1,S,2,S,i,其中,S,i,1,2,j,N,即有,N,种类型,下面,首先将信源符号按对应概率大小排队:,S,1,S,2,S,j, S,N,即:,对应累计概率=,由于信源是由单个符号组成并相互独立,若设信源序列为:,S = S,1,S,3,S,2,S,3,= S S,3,P(S)=p(,S,1,)+p(,S,1,)p(,S,3,)+p(,S,1,)p(S,3,)p(S,2,)+p(S,1,)p(S,3,)p(S,2,)p(S,3,),=p(,S,1,S,2,S,3,)+ p(S,1,)p(S,3,)p(S,2,)p(S,3,),=p(S)+p(S)p(S,3,) -,其中,p(S)=p(S,1,)p(S,3,)p(S,2,)= p(S,1,)p(S,3,)p(S,2,),推广之:,p(S)= p(S,1,)p(S,3,) p(S,2,)p(S,3,)=p(S)p(S,3,) -,这样,将一定精度数值作为序列的算术编码,完全可类似于上述归一化分层的整数算术编码。在数学上看,它实质上是一个分割单位区间的过程。完成它必须两个递推过程:一个代表码字,C(),另一个代表状态空间,A().,若采用累积概率,P,s,表示码字,C(s),符号概率,P(s),表示状态区间,A(s),由公式可求得:,其中,sx,表示,s,的后续(增长)序列。,公式的递推公式是算术编码的基础。,- ,例:若有一单消息(符号)信源,含四种符号:,a、b、c、d,,构成一序列,S=,abda,且已知: 。,试说明算术编码及其具体编、译码过程。,解:假设起始状态为空序列,,,且令,A()=1,C()=0,下面,首先给出下列符号,符号概率,p,i,,,累积概率,P,j,如下:,由上述概率表与公式,可计算出下列一系列数值:,符号,符号概率,p,i,符号累积概率,P,j,a,b,c,d,0.100(1/2),0.010(1/4),0.001(1/8),0.001(1/8),0.000,0.100,0.110,0.111,C(a)=C()+A()P,a,=0+10=0,A(a)=A() p,a,=10.1=0.1,C(ab,)=,C(a)+A(a)P,b,=0+0.10.1=0.01,A(ab,)=A(a),p,b,=0.10.01=0.001,C(abd,)=,C(ab)+A(ab)P,d,=0.01+0.0010.111=0.010111,A(abd,)=,A(ab)p,d,=0.0010.001=0.000001,C(abda,)=,C(abd)+A(abd)P,a,=0.010111+0.000010=0.010111,A(abda,)=,A(abd)p,a,=0.0000010.1=0.0000001,上面,我们给出了整个编码过程,实际上它可以看作是对下列单位区间的划分过程:,算术编码的译码过程如下:根据编码后的数值大小比较来进行,即判断码字,C(s),落在哪一个区间就可以得出一个相应的符号序列。具体步骤如下:,1.,C(a b d a)=0.0101110.1,可译出第一符号为,a;,2.,去掉被乘概率加权因子:,C(a b d a)2=0.01011110=0.10111,在0.1,0.11间,第二个符号译为,b;,3.,去掉累积概率后再去掉被乘加权因子:0.10111-0.1=0.00111,0.001114=0.00111100=0.111在0.111,1之间,第三个符号译为,d;,4,同上 0.111-0.111=0.00,0.008=0.001000=0.00在0,0.1之间,第四个符号译为,a。,综上所述,译码后的总输出为:,S* =,abda,=S(,发送的原序列),在实际应用时,信源不是简单的单消息(符号)信源,,而是符号序列信源,这时上述递推公式应修改为:,并设所有序列从空序列,开始,即,A(,)=1,C(,)=L(,)=0,若,x,表示子序列,S,后面的待编码符号。,若,P(x/S)2,f,m,.,在收端,译码是编码的反变换,即规定一个增量,值,当收到一个“1”则在前一个值中加一个,,,收到一个“0”,则减去一个,值。,2)DPCM,型,(续),3)噪声反馈编码(,NFC), 预测编码的基本类型(续),NFC,是吸取,PCM,与,DPCM,的优点,即在,PCM,结构简单的基础上,改进其量化噪声大的缺点,将量化器设计在另外增加的一个反馈环内,以达到进一步压减量化误差的目标。这一点上类似于,DPCM.,可见,NFC,是,PCM,与,DPCM,的混合改进型., 预测编码的基本类型(续),4) 预测误差门限型(非线形),设信源输出序列为: 若仅采用前一位作为后一样值的预测值,则预测误差,若 ,不传送;,若 ,传送.,4) 预测误差门限型(非线形),(续),其中是允许误差的门限值,即可接受的最大误差,在上述图形中虽然有 ,前四个应传送, 不传送。,若选择的预测值不仅仅是前一位,而是前,n,位的线性加权和,则可构成高阶预测误差门限型,其原理同上,实现方框图如下:,显然这一类型中线性预测器与前三类是一致的,但是由于引入了非线性门限比较器,所以它实质上是一类非线性预测器。, 预测编码的基本类型(续),下面我们给出四种类型中最常用的,一种,DPCM,的性能分析:,线性预测可表示为:,其,Z,变换为:,可见线性预测器的响应为:,式中,j,为第,i,项加权系数,,N,为预测阶次。由,DPCM,接收部分框图。可求得:,故:, 预测编码的基本类型(续),可见,线性预测器为一全极点滤波器。故又称为全极点模型。,下面再分析一下,DPCM,的几个主要关系式:,预测误差:,经量化后:,其中,q,i,为量化噪声引入的误差。经无差错传输后接受端恢复后的重建信号为:,可见,,进一步性能分析可参见教材。,变换编码是从广域频域(或空域)解除信源相关性的一种有效的手段。主要数学工具是正交和准正交变换。,变换编码,下面,首先从一维信源输出开始分析:,设信源输出:,,,变换后输出:,则有:,由正交性,有:,如果,通过正交变换只传送,M DCT(,平稳马氏链),DFT WHT ,HrT,ST,但是如果从复杂性,计算复杂度上来看,上述顺序正好相反:,HrT, WHT DFT DCT KLT,ST,实用化与纯理论上的要求之间存在着一定差异:,首先:实际比理论要复杂,理论分析时往往认为信源平稳遍历的,是遵从某一个已知分布特征,,等等,实际上是办不到的,最多是近似上大致满足;,其次:理论上追求是性能越优良越好,追求最佳,实际上是要更侧重可实现性,追求性能与可实现性之间的折衷,追求准最佳。,第三:理论上往往分析各种单一最佳化方法与性能,实际上往往是实用主义,采用多种组合准最佳化。这一点,以后在图像信源编码中体现更明显。,实用型信源编码,下面,我们分别讨论三类代表性信源:,1),文件传真信源(无失真信源编码);,2,),语音信源(限失真信源编码),3)图像信源(限失真信源编码),实用型信源编码 (续),1 文件传真信源编码:,关于文件传真的一些有关知识:,(1)CCITT,建议的文件传真的两种分辨率:,A,行分辨率:1728相素/行(即8样点/,mm),,列分辨率:3.85行/,mm;,B,行分辨率:8样点/,mm,,列分辨率:7.7行/,mm;,(2)我国标准:,A,行分辨率:8样点/,mm,,列分辨率:4行/,mm;,B,行分辨率:8样点/,mm,,列分辨率:8行/,mm;,以上是对,A4,文件制定的(210*297,mm)。,如果采用各个像素按0.1直接编码,一页,A4,文件,分辨率为5样点/,mm(,行,列)则需传送: ,用2400,b/s(,或4800,b/s),则需11(5.5)分钟,若文件压缩中仅能利用文件信源的一维概率特征,据测试有:,pw=93.3%,pB,=6.7%,1 文件传真信源编码 (续),则,H(U)= - p,w,log p,w,p,B,log,p,B,= - 0.933 log 0.933,0.677 log 0.677,= 0.3546 bit,一维熵编码理论压缩比,K,O,为:,可见压缩比不高。,若二维信元符号(消息)改成“0”,“1”游程,即连“0”,连“1”的游程为单元,则可得,1 文件传真信源编码 (续),由二进制(,m=2),信源编码定理,有,对平均每个像素有:,其中,1 文件传真信源编码 (续),若定义:,则可求得:,再定义:,则可求得:,1 文件传真信源编码 (续),这时,黑、白游程混合编码条件下,平均每个像素的信源编码定理。(即像素熵编码定理),最终可求得:理论上极限压缩比为:,对,A,4,文件,中文七种样张统计特性如下:,1 文件传真信源编码 (续),例,:将无失真信源编码理论用于传真编码。目前第三类传真机采用的就是修正的哈夫曼码或者是算术码。,修正主要有三点:,1)被编码的消息(符号)不是简单的“0”和“1”;而是“0”串(0游程)“1”串(1游程)的不同长度。,2)信源制定码表的依据。不是实时的实际信源,而是采用8种(7种)典型样张可测得的统计特性来近似代表实际信源的统计特性。,3)将对整个一维1728像素的统计特性码表,在制定码表的分解、简化为两类码表的合成,即将黑白游程长度分解为:,其中,K,为基本游程长度(063位)的整数倍,由它可构成一个构造码表,而,R,其长度为0至63,称为结尾码,它是基本游程码的码表。,1 文件传真信源编码 (续),下面举一个例子说明:某一,A,4,文件中一段特性如下:,编码前总码长:,L,W1,=131,L,B1,=4,L,W2,=6,L,B2,=65,L= l,W1,+l,B1,+l,W2,+l,B2,= 131+4+6+65 = 206,位,将它进行修正哈夫曼编码(,MH),,分别查黑(,B)、,白(,W),游程4的结尾码表,构造码表有:,l,W1,= 131 = 2*64+3 = 128+3,查白游程构造码表:128 = 10010,查白游程结尾码表: 3 = 1000,故经哈夫曼编码后为:100101000 共9位,1 文件传真信源编码 (续),同理:,l,B1,=4,,查黑游程结尾码表:4 = 011 (3位),l,W2,=6,,查白游程结尾码表:6 = 1110(4位),l,B2,= 65 = 64+1: 64 = 0000001111,1 = 010,Huffman,码: 0000001111010 (13位),Huffman,编码后总长为: 9+3+4+13 = 29。,实际压缩比:,所以上述截断式实际编码修正方法对信源统计特性影响不大。工程上可实用。,1 文件传真信源编码 (续),实际统计分析表明:,对于,A,4,文件,对中文七类样张的统计平均压缩比,这一结论在前面已计算过。,1 文件传真信源编码 (续),2 语音编码,(1)混合编码,:以参量编码为主,以波形编码为辅。,在满足基本质量前提下,尽可能提高压缩率。,下面,我们首先从理论上来分析各类语音编码的潜力。,首先分析波形编码:引用,R(D),函数理论,假设语音近似遵从正态分布(实际上为近似,Gamma,分布)是一个满足短时广义平稳的一阶正态马氏链。其相关矩阵为,R()=,2,其中,2,为方差,为相关系数,在均方误差保真度准则下,由信息论可求得:,R(D)=1/2log,2,2,(1-,2,)/D,其中:,2,/D,为信噪比,且波形编码取样点间的相关系数,0.96,则可算得:,信噪比(,dB) 35 32 28 25 23 20 17,R(D)(bit) 4 3.5 2.5 2.34 2 1.5 1,压缩倍数,k 2 2.28 3.2 3.42 4 5.3 8,2 语音编码,(续),(1)混合编码,(续),上述表格绘出的,R(D),值是最保守的估计值,原因是:其一:正态分布,R(D),值大于其他一切分布,R(D),值, 故语音实际分布的,R(D),值大于上述,R(D),估计值.其二:接收语音最终是人耳,计算中未算入人耳的主观性能引入的,R(D),值变化,故实际上,R(D),还要求按照一般能进入公用移动网,大致要求其信噪比为24-25,dB,从表中可查出压缩倍数,k3.5,再考虑上述两个因素,一般可认为,k4,左右.其次,在分析参量编码,由语音分析,可认为语音最基本组成单元为音素.例如英语为例:其音素大约有 个,同时按照通常讲话速率,每秒大约发出10个音素。这时英语语音信源给出的信息率为:,仅从可懂度看,它与目前,PCM,标准速率64,kb/s,相比,可求得压缩比如下:,(1)混合编码,(续),可见其潜力很大,目前实验室声码器(参量编码)已可做到600,bit/s,左右,尚相差7-8倍。,实际上,除了保密通信以及一些特殊的军事通信以外很少采用这类低质量的参量编码(声码器)。目前,在移动通信等领域,已将信源编码的焦点转移至混合编码的方向。,自八十年代以来,,CCITT,与现在的,ITUT,等国际组织制定了一系列混合编码的标准如下:,标准,编码,传输速率,质量(,mos,),备注,G711,PCM,64,Kbit/s,4.2,G722,64,56或,48,bit/s,G726,ADPCM,40,32,24,16,Kbit/s,4.1,G727,同上,4.1,G728,LD-CELP,16,Kbit/s,4.1,G729,CS-ACELP,8,Kbit/s,4.1,宽带语音编码,(1)混合编码,(续),标准,编码,传输速率,质量(,mos,),备注,G723-1,6.3-5.3,Kbit/s,4-3.6,GSM-SR,RPELD,13,Kbit/s,3.6,GSM-ER,13,Kbit/s,4,IS-96(),13,Kbit/s,4.1,IS-641,8,Kbit/s,4,IS-54,8,Kbit/s,3.6,IS-96(),8,Kbit/s,3.4,GSM-HR,6.5,Kbit/s,3.6,FS-1016,4.8,Kbit/s,3.2,FS-1015,2.4,Kbit/s,2.4,用于多媒体低比特率,(1)混合编码,(续),决定混合编码的主要技术指标:,混合编码的综合性能=,f (,比特率、质量、时延、复杂度),下面分别讨论这四个指标:,(1),比特率(,b/s):,数量指标,取决于信源的压缩率。,比特率越低,一般质量也会相应降低,为了补救质量往往又可以采用提高复杂度(硬、软件),但是他又会带来处理时延的增大。因此要考虑综合优化。降低比特率另一措施是将固定速率改变为可变速率,IS95,中就采用了基于不同背景噪声电平的1、1/2、1/4、1/8四类不同语音速率,。,这样可以大大降传送语音的平均速率。,(1)混合编码,(续),(2),质量:,目前语音质量的评估方法是采用,CCITT,建议的5级评分的“平均评价得分,MOS“,方法,,4-5分 列为高质量 可达加入公用电话网要求;,3-4分 为基本达标,一般可入移动电话网要求;,3分以下为不合格。,评分测试条件:无背景噪声,无传输差错、无模拟转接与二次编码。显然这些条件过于理想化。,(3)时延:,语音为实时通信系统对时延很敏感,时延主要包括:算法时延、,处理时延和传输时延。三类时延之和称为单向系统时延,如果无回波,它最大允许值为400,ms,,最好在200,ms,以下,又回波,仅允许25,ms。,(1)混合编码,(续),(4)复杂度:,语音编码通常是采用,DSP,来实现的。这些芯片往往可采用每秒计算百万条信令的速度(,mips,),,随机存储器(,RAM),,和只读存储器(,ROM),来描述。目前一般将小于15,mips,的语音编码为低复杂度编码,而将大于30,mips,的语音编码为高复杂度编码。在一个芯片上装有越多的,RAM,和,ROM,,芯片价格就越高,体积就越大,所以复杂度越高,性能越好,但同时受到成本,功耗,时延等因素制约。,(1)混合编码,(续),下列表格给出这些年来,,ITU,建议的四个标准:,G729,G729A,以及两类,G7231,的四大指标量级:,G729,G729-A,G723-1,G723-1,比特率(,kb/s),8,8,6.3,5.3,话音质量(,MOS,得分),4.1,4.1,4.1,3.6,帧长(,ms),10,10,10,30,子帧长(,ms),5,5,7.5,7.5,算法延时(,ms),15,15,37.5,37.5,复杂度,MIPS(,定点,DSP),20,10.5,14.6,16,RAM(16bit,字长),2.7,k,2,k,2.2,k,2.2,k,(1)混合编码,(续),ADPCM,是在,DPCM,的基础上发展起来的。而,DPCM,前面已讨论过。由于预测误差的幅度变化范围远小于原始信号(预测前)幅度变化范围,因此在相同量化噪声条件下,DPCM,量化比特数要远少于,PCM。,从而达到语音压缩编码的目的。,ADPCM,与,DPCM,相比,主要区别在于,ADPCM,中的量化嚣和预测嚣采用了自适应控制,同时在译码嚣中多了一个同步编码调整,其作用是为了在同步级连时不产生误差积累。八十年代以来32,kb/s ADPCM,已日趋成熟。它具有与,PCM,相近的质量。下面,给出,G721 ADPCM,编、译码框图:,2 语音编码,(续),(2)波形编码,ADPCM,基本原理,
展开阅读全文