多媒体中有关JPEG方面的知识

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,5.3 JPEG,标准的主要内容,ISO/IEC 10918,号标准,“,多灰度连续色调静态图像压缩编码,”,即,JPEG,标准，选定,ADCT,作为静态图像压缩的标准化算法。,该标准为保证通用性，包含以下两种方式：,空间方式可逆编码,空间方式对于基本系统和扩展系统来说，被称为独立功能,。,DCT,方式非可逆编码，包含基本系统,(,必须保证的功能,),和扩展系统,(,扩充功能,),1,基本系统,是实现,DCT,编码与解码所需的最小功能集，大多数的应用系统只要用此标准，就能基本上满足要求。,扩展系统是为了满足更为广阔领域的应用要求而设置的。,2,5.3.1 JPEG,静态图像压缩算法,1.,基于,DPCM,的无失真编码,预测器,熵编码器,表说明,无失真编码器,源图像数据,压缩图像数据,图,5.1,无失真编码简化框图,3,基于,DPCM,的无失真编码优点是硬件易实现，重建图像质量好。,缺点是压缩比太低，大约为,2,：,1,。,4,工作原理是对,X,的预测值,X,，,将,X,-,X,进行无失真熵编码。对,X,的求法见图给出的,预测方式,。,选择值,预测,选择值,预测,0,1,2,3,非预测,a,b,c,4,5,6,7,a+b-c,a+(b-c)/2,b+(a-c)/2,(a+b)/2,(a),X,邻域,(b),预测方式,图,5.2,预测器,5,2.,基于,DCT,的有失真压缩编码,离散余弦变换,量化处理,DC,系数的编码和,AC,系数的行程编码,熵编码,6,图,5.3,基于,DCT,编码过程,FDCT,熵编码器,表说明,无失真编码器,源图像数据,压缩图像数据,量化器,表说明,8,8,块,（,YUV,每个分量）,7,图,5.4,解码过程,熵解码器,IDCT,表说明,解码器,逆量化器,表说明,8,8,块,压缩图像数据,恢复的图像数据,8,离散余弦变换,(1),首先把原始图像顺序分割成,88,子块；,(2),采样精度为,P,位,(,二进制,),，把,0,，,2,P,-1,范围的无符号数变换成,-2,P,-1,，,2,P,-1,范围的有符号数，作为离散余弦正变换,(FDCT),的输入；,(3),在输出端经离散余弦逆变换,(IDCT),后又得到一系列,88,子块，需将数值范围,-2,P,-1,，,2,P,-1,变换回,0,，,2,P,-1,来重构图像。,9,量化处理,量化是一个,“,多到一,”,的过程，失真原因,关键是找最小量化失真的量化器，,JPEG,采用线性均匀量化器，定义为对,64,个,DCT,系数除以量化步长，然后四舍五入取整：,F,Q,(u,，,v)=,Integer Round,F,(,u,，,v,)/,Q,(,u,，,v,),Q(u,，,v),是量化器步长，它是量化表的元素。量化表元素随,DCT,系数的位置和彩色分量不同有不同的值，量化表尺寸为,88,与,64,个变换系数一一对应。,这个量化表应由用户规定,(JPEG,给出参考值,-,见表,2.2,，,2.3),，并作为编码器的一个输入。,10,16,11,10,16,24,40,51,61,12,12,14,19,26,58,60,55,14,13,16,24,40,57,69,56,14,17,22,29,51,87,80,62,18,22,37,56,68,109,103,77,24,35,55,64,81,104,113,92,49,64,78,87,103,121,120,101,72,92,95,98,112,100,103,99,表,5.1,亮度量化表,11,17,18,24,47,99,99,99,99,18,21,26,66,99,99,99,99,24,26,56,99,99,99,99,99,47,66,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,表,5.2,色度量化表,12,量化的作用是在一定主观保真度图像质量前提下，丢掉那些对视觉影响不大的信息，通过量化可调节数据压缩比。,13,DC,系数的编码,64,个变换系数经量化后，坐标,u,=,v,=0,的,F(0,，,0),称,DC,系数,(,直流分量,),，它即,64,个空域图像采样值的平均值。,相邻,88,块之间,DC,系数有强相关性。,JPEG,对量化后的,DC,系数采用,DPCM,编码，即对,DIFF= DC,i,-DC,i,-1,编码。,block,i,-1,block,i,DC,i,-1,DC,i,图,5.5 DC,系数差分编码,14,AC,系数的行程编码,其余,63,个交流系数,(AC),采用行程编码。,从左上方,AC,0,，,1,开始沿对角线方向,“,Z,”,字形扫描直到,AC,7,，,7,扫描结束，这样可增加行程中连续,0,的个数。,AC,系数,编码的码字用两个字节表示，如图所示：,图,5.6,Z,字形扫描,15,图,5.7 AC,系数行程编码码字,两个非,0,值间,连续,0,的个数,表示下一个,非,0,值需要的,bit,数,下一个非,0,实际值,7,4,3,0,字节,1,字节,2,例子,：对,“,，,3,，,0,，,0,，,0,，,0,，,0,，,12,，,0,，,0,，,”,编码,，,(5,，,4),，,(12),，,.,16,熵编码,为了进一步压缩数据，,需对,DC,码和,AC,行程编码的码字再做基于统计特性的熵编码。,JPEG,建议的熵编码是,Huffman,编码和自适应二进制算术编码。,熵编码可分成两步进行,：,把,DC,码和,AC,行程码转换为中间符号序列,给这些符号赋以,变长码字,17,行程取值范围为,1,15,，超过,15,时用扩展符号,1 (15,，,0),来扩充，,63,个,AC,系数最多增加,3,个扩展符号,1,。编码结束时用,(0,，,0),表示。,“,尺寸,”,取值范围为,0,10,。,“,幅值,”,用以表示非,0,的,AC,系数的值，范围为,-2,10,，,2,10,-1,(,最长,10bit),，结构形式如表,5-5,所示。,18,1 -1,，,1,2 -3.-2,，,2.3,3 -7.-4,，,4.7,4 -15.-8,，,8.15,7,8,9 -511.-256,，,256,511,10 -1023.-512,，,512,1023,表,5.5,符号,2,结构,19,DC,系数的熵编码,对于直流分量,DC,也有类似于,AC,系数的编码格式,符号,1,：,(,尺寸,),符号,2,：,(,幅值,),“,尺寸,”,表示,DC,差值的幅值编码所需的比特数，而,“,幅值,”,表示,DC,差值的幅值，,范围为,-2,11,，,2,11,-1,。可在表,5.5,中多加一级，幅值尺寸以,1,到,11,比特表示。,将,63,个,AC,系数表示成为符号,1,和符号,2,序列，其中连续,0,的长度超过,15,时，有多个符号,1,；块结束,(EOB),时仅有一个符号,1(0,，,0),。,20,“,4,，,0,，,0,，,0,，,0,，,0,，,0,，,0,，,0,，,3,，,0,”,.,4,，,3,之间有,31,个,0.,(15,，,0),，,(15,，,0),，,(1,，,2),，,(3),可变长度熵编码就是对上述序列进行变长编码。,对,DC,系数、,AC,系数中的符号,1,采用,Huffman,表中的变长码编码,(VLC),，这里,Huffman,变长码表必须作为,JPEG,编码器输入。,符号,2,用码字长度在表,2.4,中给出的变长整数,VLI,码编码。,VLI,是变长码，但不是,Huffman,码。,VLI,的长度存放在,VLC,中，,JPEG,提供,VLI,码字表供用户使用,21,表,5.6 JPEG,压缩效果评价,压缩效果,(,比特,/,像素,),质量,0.250.50,中,好,0.500.75,好,很好,0.751.5,极好,1.22.0,与原始图像分不出来,22,MPEG,视频数据流的结构,MPEG-1,数据,体系结构,运动图像序列,图片组,图片,图片切片,宏块,块,8,像素,23,帧间预测,1,I,2,B,3,B,4,B,5,P,6,B,7,B,8,B,1,I,前向预测,双向预测,24,运动序列流的组成,典型的图像类型的显示次序,1,秒,参照帧间有,2,个,B,图像,每,0.5,秒,1,帧,I,图像,I B B P B B P B B P B B P B B I B B P B B P B B P B B P B B,25,传输顺序,MPEG,编码器需对上述图像重新排序，以便解码器高效工作，因为参照图像必须先于,B,图像恢复之前恢复。上述,1,7,帧图像重排后图像组次序为：,4,2,1,3,7,5,6,I,P,B,B,P,B,B,26,图像处理,对图像进行一系列的操作以达到预期的目的的技术称作图像处理。,图像处理可分为模拟图像处理和数字图像处理两种方式。,利用光学、照相和电子学方法对模拟图像的处理称为模拟图像处理。目前，许多军用、宇航的处理仍采用光学模拟处理。,利用计算机对数字图像进行系列操作，从而获得某种预期的结果的技术称为数字图像处理，又称计算机图像处理。通常，也简称为图像处理。,27,图像处理的内容相当丰富，包括狭义的图像处理、图像分析与图像理解。,狭义的图像处理着重强调在图像之间进行的变换，,是一个从图像到图像的过程，,是比较低层的操作。,狭义的图像处理主要满足对图像进行各种加工，以改善图像的视觉效果，或对图像进行压缩编码以减少所需存储空间或传输时间，达到传输通路的要求。,特点：主要在像素级进行处理，处理的数据量非常大。,28,图像分析,图像分析主要是对图像中感兴趣的目标进行,检测和测量，从而建立对图像的描述。,图像分析主要研究用自动或半自动装置和系统，从图像中提取有用的测度、数据或信息，生成非图像的描述或者表示。,图像分析的内容分为特征提取、符号描述、目标检测、景物匹配和识别等几个部分。,特点：是一个从图像到数据的过程，可以看作是中层处理。,29,图像理解,图像理解是在图像分析的基础上，进一步研究图像中各目标的性质和它们之间的相互联系，并得出对图像内容含义的理解以及对原来客观场景的解释，从而指导和规划行动。图像理解有时也叫景物理解。,图像理解主要是高层操作，其处理过程和方法与人类的思维推理有许多类似之处。,30,与相关学科的关系,数字图像处理是一门新的交叉学科。它与数学、物理学、生理学、心理学、电子学、计算机科学等许多学科可以相互借鉴。,从它的研究范围来看，它与模式识别、计算机视觉、计算机图形学等多个专业又互相交叉。,31,宏观世界,图像,图像,数据,(,人,),符号,新技术,新理论,新工具,图像处理,模式识别,图像分析,计算机视觉,计算机图形学,图像理解,图像理解,(,转换,),图像处理与相关学科的联系和区别,32,数字图像处理方法,数字图像的处理方法种类繁多，根据不同的分类标准可以得到不向的分类结果。,根据对图像作用域的不同，数字图像处理方法大致可分为两大类，即：空域算法和变换域算法。,33,空域处理方法,空域处理方法是指在空间域内直接对数字图像进行处理。在处理时，既可以直接对图像各像素点进行灰度上的变换处理，也可以对图像进行小区域模板的空域滤波等处理，以充分考虑像素邻域像素点对其的影响。,空域处理法主要有两大类：,(1),邻域处理法,(2),点处理法,34,变换域处理方法,变换域处理方法首先主要是通过傅立叶变换、离散余弦变换、沃尔什变换或是比较新的小波变换等变换算法，将图像从空域变换到相应的变换域，得到变换域系数阵列，然后在变换域中对图像进行处理，处理完成后再将图像从变换域反变换到空间域，得到处理结果。,35,数字图像处理的主要研究内容,1,图像变换,2,图像增强,3,图像编码与压缩,4,图像复原,5,图像重建,36,1,图像变换,图像变换是图像处理和图像分析的一个重要分支，它将图像从空间域变换到变换域，然后在变换域对图像进行处理和分析。,图像变换是许多图像处理和分析技术的基础，是图像增强和复原的基本工具，也是图像特征提取的重要手段。,常用的图像变换有傅立叶变换、,DCT,变换，小波变换等。,37,2,图像增强,图像增强是指根据一定的要求，突出图像中感兴趣的信息，而减弱或去除不需要的信息，从而使有用信息得到加强的信息处理方法。,根据增强处理过程所在的空间不同，图像增强技术可分为基于空间域的增强方法和基于频率域的增强方法两类。,图像增强主要方法有直方图增强、空域滤波法、频率域滤波法以及彩色增强法等。,38,图像灰度变换前后效果对比图,:,变换前变换后,39,线性灰度变换法,假定原始输入图像的灰度取值范围为,f,min, f,max,，输出图像的灰度取值范围,g,min, g,max,，其变换公式为：,一般要求,g,min, f,max,40,直方图变换法,直方图是多种空间域处理技术的基础。直方图操作能有效地用于图像增强。,灰度直方图,灰度直方图是灰度值的函数，它描述了图像中各灰度值的像素个数。,通常用横坐标表示像素的灰度级别，纵坐标表示对应的灰度级出现的频率（像素的个数）。频率的计算公式为：,p(r)=n,r,n,r,是图像中灰度为,r,的像素数。,41,常用的直方图是规格化和离散化的，即纵坐标用相对值表示。,设图像总像素为,N,，某一级灰度像素数为,n,r,，则直方图表示为：,p(r)= n,r,/N,原始图象,对应的直方图,42,灰度直方图反映了一幅图像的灰度分布情况。,(a) (b),(a),大多数像素灰度值取在较暗区域，图像肯定较暗,.,一般在摄影过程中曝光过强就会造成这种结果。,(b),图像的像素灰度值集中在亮区,图像将偏亮,.,一般在摄影中曝光太弱将导致这种结果。,从两幅图像的灰度分布来看图像的质量均不理想。,43,44,3,图像编码与压缩,图像编码就是利用图像信号的统计特性及人类视觉的生理学和心理学特性对图像信号进行高效编码，以解决数据量大的矛盾。,图像编码的目的有三个：尽量减少表示数字图像时需要的数据量。降低数据率以减少传输带宽；压缩信息量,便于特征抽取，为识别作准备。,根据解压重建后的图像和原始图像之间是否具有误差，图像编码压缩分为无误差编码和有误差编码两大类。,根据编码方法作用域不同，图像编码分为空间域编码和变换域编码两大类。,45,4,图像复原,图像复原也叫图像恢复。其目的是找出图像降质的起因，并尽可能消除它，使图像恢复本来面目。,常用的恢复有纠正几何失真、从已知图像信号和噪声的统计特性入手，用,Wiener,滤波等方法来改善信噪比等。,46,退化模型法,逆滤波器法,最小二乘法,最大熵复原,投影复原法,几何校正法,47,5,图像重建,重建处理则是从数据到图像的处理。也就是说输入的是某种数据，而处理结果得到的是图像。该处理的典型应用就是,CT,技术。,图像重建的主要算法有代数法、迭代法、傅里叶反投影法、卷积反投影法等。,48,(a),采样点,256,256,时的图像,(b),采样点,64,64,时的图像,(c),采样点,32,3,2,时的图像,(d),采样点,16,1,6,时的图像,49,50,二值图像也叫黑白图像，就是图像象素只存在,0,1,两个值。,51,

展开阅读全文

多媒体中有关JPEG方面的知识

最新文档