资源描述
第5章图像编码,5.1信源编码,图像编码属于信源编码范畴。其特点是利用图像信号的统计特性及人眼睛的生理和心理特性对图像进行高效编码。,信源,信源编码,信道编码,调制,传输信道,噪声,解调,信道解码,信源解码,信宿,图51数字通信系统模型,去除冗余为基础的编码方法称为第一代编码,如:PCM、DPCM、M、亚取样编码法,变换域的DFT、DCT、Walsh-Hadamard变换编码等方法以及以此为基础的混合编码法均属于经典的第一代编码法。第二代编码方法多是八十年代以后提出的新的编码方法,如金字塔编码法、Fractal编码、基于神经元网络的编码方法、小波变换编码法、模型基编码法等。,从信源角度看,图像编码大致可分三类:1)、匹配编码;2)、变换编码;3)、识别编码:,(1)、匹配编码使代码长度与图像信源的概率分布相匹配。这种编码的长短不一,使得传输、译码、存储均不方便另一个缺点是编码的先决条件是要知道图像信源的概率分布。(2)、变换编码首先把图像信源从一个空间变换到另外一个空间,然后对变换系数进行编码。预测变换函数变换,(3)、识别编码基本原理是用另外一套符号代替原来的信源中的消息,如:电报、速记等均可认为是识别编码的例子。,表51图象高效编码法,PCM预测法正交变换法统计编码其他方法,常规编码法,亚奈氏取样编码法,标准法,自适应法,标准法,自适应法,标准法,自适应法,行程编码,轮廓编码,5.2图像编码中的保真度准则,客观保真度准则主观保真度准则,5.3.1PCM编码的基本原理,脉冲编码调制(PulsecodingModulationPCM)是将模拟图像信号变为数字信号的基本手段,5.3编码,图像,低通滤波,取样保持,编码,传输信道,解码,低通滤波,解码图像,量化,图53PCM编、译码原理方框图,限制频带,防止折叠误差,时间离散化,幅度离散化,多值变多比特,多比特变多值,内插及平滑,5.3.2PCM编码的量化噪声,量化是对时间离散的模拟信号进行幅度离散化的过程,这个过程是去零取整的过程。,图54量化噪声与过载噪声的形成,由量化带来的噪声量化噪声过载噪声编码器的任务是把一个多值的数字量用多比特的二进制来表示译码器是把每一位的码字转换为实际灰度值,5.4.3编码器、译码器,(a)(b),(c)(d),(e)(f)图54编码位数对画面质量的影响,534非线性PCM编码在线性PCM编码中,量化阶是均匀的非线性PCM编码的量化阶不均匀,1,7/8,5/8,4/8,3/8,2/8,2/8,(1),(2),(3),(4),(5),(6),(7),(8),图51013折线压扩特性(信号为正时的八段),6/8,5.4统计编码,高效编码的主要方法是尽可能去除信源中的冗余成份,从而以最少的数码率传递最大的信息量。冗余度存在于像素间的相关性及像素值出现概率的不均等性之中。对于有记忆性信源来说首先要去除像素间的相关性,从而达到压缩数码率的目的。,根据像素灰度值出现概率的分布特性而进行的压缩编码叫统计编码。,5.4.1编码效率与冗余度,衡量编码方法优劣的准则:编码效率冗余度,设某个无记忆信源共有个消息,记作。其中消息ui(i=1,2,3M)各自出现的概率分别为。可把这个信源用下式表示,(522),根据该信源的消息集合,在字母集中选取符号进行编码。一般情况下取二元字母集A1,0。通常,这一离散信源中的各个消息出现的概率并不相等。根据信息论中熵的定义,可计算出该信源的熵如下式:,(523),式中H(X)代表熵,Pi代表第i个消息出现的概率。,例如,设一离散信源如下,由式(523)可算出该信源的熵,比特/消息,设对应于每个消息的码字由Ni个符号组成。也就是说每个消息所对应的码字长度各为Ni。那么,每个消息的平均码长可用下式表示,(524),式中代表平均码长,为信源中包含的消息的个数,Pi为第i个消息出现的概率,Ni为第i个消息对应的码长。就平均而言,每个符号所含有的熵为:,(525),式中代表编码效率,H(X)为信源的熵,为平均码长,n为字母集合中的字母数。,(526),显然,如果,就说明还有冗余度。因此,冗余度如下式表示:,(527),例:一个信源X和一个字母集合A如下,平均码长,bit/消息,可求得信源X的熵,所以,显然,编码后还有bit的冗余度,没有达到的最低限。,如果取,此时,那么可以编成如下等长码,的冗余度。,同样有,例:,可计算出平均码长,其效率,冗余度,5.5.2几种常用的统计编码法,变长编码是统计编码中最为主要的一种方法。变长编码的目标就是使平均码长达到低限,也就是使最优,但是,这种最优必须在一定的限制下进行。编码的基本限制就是码字要有单义性和非续长性。,表54四种代码表,最为常用的变长编码方法:霍夫曼(Huffman)码仙农费诺(Shannon-Fano)码,5.5.3霍夫曼码,霍夫曼码变长编码法能得到一组最优的变长码。设原始信源有个消息,即:,(528),霍夫曼码编码步骤:,第一步,把信源中的消息按出现的概率从大到小的顺序排列,即:,第二步,把最后两个出现概率最小的消息合并成一个消息,从而使信源的消息数减少一个,并同时再次将信源中的消息的概率从大到小排列一次,得:,(529),第三步,重复上述步骤,直到信源最后为形式为止。这里有如下形式,(530),第四步,将被合并的消息分别赋以1和0或0和1。对最后X0中的和对应地赋以1和0或0和1。,例:求下述信源的霍夫曼码,由上述步骤,合并最小的两项做一个新的信源,这样可给赋0,赋1,其中。中消息的概率大小顺序正好符合从大到小的规律,故不必重排。再做新的信源,重排得,将赋0,赋1。将和合并构成新的信源,重排得,将,赋0,,赋1。最后则,赋1。,赋0,,赋1。最后,赋0,,重排得,码字消息概率,01101100000100011,0.250.250.200.150.100.05,01,01,01,01,01,图517信源X的霍夫曼编码图,0.15,仙农费诺码的编码程序可由下述几个步骤来完成:,5.5.4仙农费诺码,第一步:设信源有非递增的概率分布,(531),其中,。把X分成两个子集合,得,(532),(534)成立或差不多成立。,并且保证,(533),第二步:给两个子集中的消息赋值,,赋1,,赋0,或给,赋0,,赋1。,第三步:重复第一步骤,将两个子集,再细分为2个子集,并且也同样使两个小子集里消息的概率之和相等或近似相等。,第四步:重复第二步骤赋值。以这样的步骤重复下去,直到每个子集内只包含一个消息为止。对每个消息所赋过的值依次排列出来就可以构成仙农费诺码,例:设有信源,其编码流程图如图518所示。编码表如表57所示。如果对各子集赋以另外一种值,即1,0,那么,同样会得到另一种编码结果,其编码表如表58所示。,码字消息概率,00011001011100110111101111,图518仙农-费诺码编码流程图,1/81/81/161/161/161/16,0,1,01,01,01,01,01,01,特点:1)、Huffman码和ShannonFano码不是唯一的;2)、Huffman码和ShannonFano码缺乏构造性,即,不能用数学方法建立一一对应关系,只能通过查表的方法构成对应关系。如果消息数目很大,所需的存储器就大,设备就复杂。3)、非等长码在传输、译码、存储都不方便。,与Huffman码不同,算术编码是一种非分组编码方法,或叫非块码。正因为算术编码不是分组编码。因此,其译码也是一个字符一个字符的译码。算术编码的基本原理设:有一4符号的信源,其分为,其概率如下表和下图所示。,5.6算术编码(Arithmeticcoding),概率区间表示概率大小,累积概率,预测编码方法主要有二种。一种是(Deltamodulation)DM编码法另一种是DPCM(DifferentialPulseCodeModulation)编码法,5.5预测编码,5.7.1预测编码的基本原理,(538),预测编码就是要对误差进行编码,而不是对样值直接编码。,编码,译码,(a)(b)图521预测编码原理,5.5.2(DM)编码,1.编码的基本原理,M编码基本原理框图如图527所示,(a)为编码原理框图,(b)为译码原理框图。M编码器包括比较器、本地译码器和脉冲形成器三个部分。,CP,图527编码、译码原理方框图,放大限幅,定时判决,本地译码,低通滤波,译码,M编码器实际上就是1bit编码的预测编码器。它用一位码字来表示,(553),式中f(t)为输入视频信号,是f(t)的预测值。当差值e(t)为一个正的增量时用“1”码来表示,当差值e(t)为一个负的增量时用“0”码来表示。,2.M编码的基本特性,M编码性能主要由斜率过载特性、量化噪声以及量化信噪比等性能来衡量,5.5.3DPCM编码,预测编码的另一种有用的形式是DPCM编码(DifferentialPulseCodeModulation)。这实际上是M和PCM两种技术相结合的编码方法。,1.DPCM编码的基本原理,利用积分器根据一行上前样本值预测现样本值,并且把现样本值与其估计值的差值进行量化和编码。这就是DPCM的基本设计思想。,图537DPCM编、译码原理框图,量化器,编码器,预测器,解码器,预测器,5.6变换编码,变换编码的通用模型如下图所示,图542图像变换编码模型,映射变换,量化器,编码器,图像变换编码基本可分为两大类:某些特殊的映射变换编码法函数变换编码法,5.6.1几种特殊的映射变换编码法,1)、一维行程编码,一维行程编码的概念如图542所示。,是相邻扫描行上行程的开始点之间的差,是这相邻行行程的差,“开始”,“消失”,2)二维行程编码,5.62正交变换编码,基本原理是通过正交函数变换把图像从空间域转换为能量比较集中的变换域。然后对变换系数进行编码,从而达到缩减比特率的目的。,5.621正交变换编码的基本概念,正交变换编码的基本原理框图如图550所示。编码器由预处理、正交变换、量化与编码几部分组成,译码器由译码、反变换及后处理组成。,图550正交变换编码原理框图,预处理,正交变换,量化编码,传输、存储,解码,反变换,后处理,正交变换编码之所以能够压缩数据率,主要是它有如下一些性质:()正交变换具有熵保持性质。这说明通过正交变换并不丢失信息,因此,可以用传输变换系数来达到传送信息的目的。,()正交变换有能量保持性质。()能量重新分配与集中。()去相关特性。正交变换可以使高度相关的空间样值变为相关性很弱的变换系数。,5.6.2.2如何选择正交变换5.6.2.3编码常用的编码方法有二种:一是区域编码法,二是门限编码法。,5.7图像编码的国际标准在图像编码中,目前的国际标准是:、静止图像:JPEG(JointPhotographicExpertGroup):“联合图片专家组”1991年提出的ISOCD10916建议草案。这个建议规定了具体的编码方法及质量要求,即:DCT+Huffman编码(基本);自适应算术编码(扩展);无失真预测,帧内预测及Huffman;,、可视电话会议电视:*CCITTH.261标准,1988年提出P64Kbit/s。P为可变系数,对于可视电话,建议P=2,会议电视建议P6。编码方法可采用混合编码法,即采用DCT变换,运动补偿DPCM及Huffman编码等方法。,、MPEG(MotionPictureExpertGroup运动图像专家组)CCITT的ISOCD11172号建议,MPEG1指标是压缩一次群(1.5Mb/s-2Mb/s),采用DCT、运动补偿、帧内、帧间预测等方法。到MPEG1、MPEG2、MPEG4、MPEG7等JBIG标准(针对二值图像)AVS标准(音视频编码标准,自主研发),
展开阅读全文