JPEG压缩编码标准.doc

上传人:w****2 文档编号:6607031 上传时间:2020-02-29 格式:DOC 页数:14 大小:110KB
返回 下载 相关 举报
JPEG压缩编码标准.doc_第1页
第1页 / 共14页
JPEG压缩编码标准.doc_第2页
第2页 / 共14页
JPEG压缩编码标准.doc_第3页
第3页 / 共14页
点击查看更多>>
资源描述
9.4 JPEG压缩编码标准JPEG是联合图象专家组(Joint Picture Expert Group)的英文缩写,是国际标准化组织(ISO)和CCITT联合制定的静态图象的压缩编码标准。和相同图象质量的其它常用文件格式(如GIF,TIFF,PCX)相比,JPEG是目前静态图象中压缩比最高的。我们给出具体的数据来对比一下。例图采用Windows95目录下的Clouds.bmp,原图大小为640*480,256色。用工具SEA(version1.3)将其分别转成24位色BMP、24位色JPEG、GIF(只能转成256色)压缩格式、24位色TIFF压缩格式、24位色TGA压缩格式。得到的文件大小(以字节为单位)分别为:921,654,17,707,177,152,923,044,768,136。可见JPEG比其它几种压缩比要高得多,而图象质量都差不多(JPEG处理的颜色只有真彩和灰度图)。正是由于JPEG的高压缩比,使得它广泛地应用于多媒体和网络程序中,例如HTML语法中选用的图象格式之一就是JPEG(另一种是GIF)。这是显然的,因为网络的带宽非常宝贵,选用一种高压缩比的文件格式是十分必要的。JPEG有几种模式,其中最常用的是基于DCT变换的顺序型模式,又称为基线系统(Baseline),以下将针对这种格式进行讨论。1. JPEG的压缩原理JPEG的压缩原理其实上面介绍的那些原理的综合,博采众家之长,这也正是JPEG有高压缩比的原因。其编码器的流程为:图9.3 JPEG编码器流程解码器基本上为上述过程的逆过程:图9.4 解码器流程88的图象经过DCT变换后,其低频分量都集中在左上角,高频分量分布在右下角(DCT变换实际上是空间域的低通滤波器)。由于该低频分量包含了图象的主要信息(如亮度),而高频与之相比,就不那么重要了,所以我们可以忽略高频分量,从而达到压缩的目的。如何将高频分量去掉,这就要用到量化,它是产生信息损失的根源。这里的量化操作,就是将某一个值除以量化表中对应的值。由于量化表左上角的值较小,右上角的值较大,这样就起到了保持低频分量,抑制高频分量的目的。JPEG使用的颜色是YUV格式。我们提到过,Y分量代表了亮度信息,UV分量代表了色差信息。相比而言,Y分量更重要一些。我们可以对Y采用细量化,对UV采用粗量化,可进一步提高压缩比。所以上面所说的量化表通常有两张,一张是针对Y的;一张是针对UV的。上面讲了,经过DCT变换后,低频分量集中在左上角,其中F(0,0)(即第一行第一列元素)代表了直流(DC)系数,即88子块的平均值,要对它单独编码。由于两个相邻的88子块的DC系数相差很小,所以对它们采用差分编码DPCM,可以提高压缩比,也就是说对相邻的子块DC系数的差值进行编码。88的其它63个元素是交流(AC)系数,采用行程编码。这里出现一个问题:这63个系数应该按照怎么样的顺序排列?为了保证低频分量先出现,高频分量后出现,以增加行程中连续“0”的个数,这63个元素采用了“之”字型(Zig-Zag)的排列方法,如图9.5所示。图9.5 Zig-Zag这63个AC系数行程编码的码字用两个字节表示,如图9.6所示。图9.6 行程编码上面,我们得到了DC码字和 AC行程码字。为了进一步提高压缩比,需要对其再进行熵编码,这里选用Huffman编码,分成两步:(1)熵编码的中间格式表示对于AC系数,有两个符号。符号1为行程和尺寸,即上面的(RunLength,Size)。(0,0)和(15,0)是两个比较特殊的情况。(0,0)表示块结束标志(EOB),(15,0)表示ZRL,当行程长度超过15时,用增加ZRL的个数来解决,所以最多有三个ZRL(316+15=63)。符号2为幅度值(Amplitude)。对于DC系数,也有两个符号。符号1为尺寸(Size);符号2为幅度值(Amplitude)。(2)熵编码对于AC系数,符号1和符号2分别进行编码。零行程长度超过15个时,有一个符号(15,0),块结束时只有一个符号(0,0)。对符号1进行Hufffman编码(亮度,色差的Huffman码表不同)。对符号2进行变长整数VLI编码。举例来说:Size=6时,Amplitude的范围是-63-32,以及3263,对绝对值相同,符号相反的码字之间为反码关系。所以AC系数为32的码字为100000,33的码字为100001,-32的码字为011111,-33的码字为011110。符号2的码字紧接于符号1的码字之后。对于DC系数,Y和UV的Huffman码表也不同。掉了这么半天的书包,你可能已经晕了,呵呵。举个例子来说明上述过程就容易明白了。下面为88的亮度(Y)图象子块经过量化后的系数。15 0 -1 0 0 0 0 0-2 -1 0 0 0 0 0 0-1 -1 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0可见量化后只有左上角的几个点(低频分量)不为零,这样采用行程编码就很有效。第一步,熵编码的中间格式表示:先看DC系数。假设前一个88子块DC系数的量化值为12,则本块DC系数与它的差为3,根据下表Size Amplitude0 01 1,12 3,-2,2,33 7-4,474 15-8,8155 31-16,16316 63-32,32637 127-64,641278 255-128,1282559 511-256,25651110 1023512,512102311 2047-1024,10242047查表得Size=2,Amplitude=3,所以DC中间格式为(2)(3)。下面对AC系数编码。经过Zig-Zag扫描后,遇到的第一个非零系数为-2,其中遇到零的个数为1(即RunLength),根据下面这张AC系数表:Size Amplitude1 1,12 3,-2,2,33 7-4,474 15-8,8155 31-16,16316 63-32,32637 127-64,641278 255-128,1282559 511-256,25651110 1023512,5121023查表得Size=2。所以RunLength=1,Size=2,Amplitude=3,所以AC中间格式为(1,2)(-2)。其余的点类似,可以求得这个88子块熵编码的中间格式为(DC)(2)(3),(1,2)(-2),(0,1)(-1),(0,1)(-1),(0,1)(-1),(2,1)(-1),(EOB)(0,0)第二步,熵编码:对于(2)(3):2查DC亮度Huffman表得到11,3经过VLI编码为011;对于(1,2)(-2):(1,2)查AC亮度Huffman表得到11011,-2是2的反码,为01;对于(0,1)(-1):(0,1)查AC亮度Huffman表得到00,-1是1的反码,为0;最后,这一88子块亮度信息压缩后的数据流为11011, 1101101, 000, 000, 000, 111000,1010。总共31比特,其压缩比是648/31=16.5,大约每个象素用半个比特。可以想见,压缩比和图象质量是呈反比的,以下是压缩效率与图象质量之间的大致关系,可以根据你的需要,选择合适的压缩比。表9.1 压缩比与图象质量的关系压缩效率(单位:bits/pixel)图象质量0.250.50中好,可满足某些应用0.500.75好很好,满足多数应用0.751.5极好,满足大多数应用1.52.0与原始图象几乎一样以上我们介绍了JPEG压缩的原理,其中DC系数使用了预测编码DPCM,AC系数使用了变换编码DCT,二者都使用了熵编码Huffman,可见几乎所有传统的压缩方法在这里都用到了。这几种方法的结合正是产生JPEG高压缩比的原因。顺便说一下,该标准是JPEG小组从很多种不同中方案中比较测试得到的,并非空穴来风。上面介绍了JPEG压缩的基本原理,下面介绍一下JPEG的文件格式。2. JPEG的文件格式JPEG文件大体上可以分成以下两个部分:标记码(Tag)加压缩数据。先介绍标记码部分。标记码部分给出了JPEG图象的所有信息(有点类似于BMP中的头信息,但要复杂的多),如图象的宽、高、Huffman表、量化表等等。标记码有很多,但绝大多数的JPEG文件只包含几种。标记码的结构为:SOIDQT DRI SOF0 DHT SOS EOI标记码由两个字节组成,高字节为0XFF,每个标记码之前可以填上个数不限的填充字节0XFF。下面介绍一些常用的标记码的结构及其含义。(1)SOI(Start of Image)标记结构 字节数0XFF 10XD8 1可作为JPEG格式的判据(JFIF还需要APP0的配合)(2)APP0(Application)标记结构 字节数 意义0XFF 10XE0 1Lp 2 APP0标记码长度,不包括前两个字节0XFF,0XE0Identifier 5 JFIF识别码 0X4A,0X46,0X49,0X46,0X00Version 2 JFIF版本号 可为0X0101或者0X0102Units 1 单位,等于零时表示未指定,为1表示英寸,为2表示厘米Xdensity 2 水平分辨率Ydensity 2 垂直分辨率Xthumbnail 1 水平点数Ythumbnail 1 垂直点数RGB0 3 RGB的值RGB1 3 RGB的值RGBn 3 RGB的值,n=Xthumbnail*YthumbnailAPP0是JPEG保留给Application所使用的标记码,而JFIF将文件的相关信息定义在此标记中。(3)DQT(Define Quantization Table)标记结构 字节数 意义0XFF 10XDB 1Lq 2 DQT标记码长度,不包括前两个字节0XFF,0XDB(Pq,Tq) 1 高四位Pq为量化表的数据精确度,Pq=0时,Q0Qn的值为8位,Pq=1时,Qt的值为16位,Tq表示量化表的编号,为03。在基本系统中,Pq=0,Tq=01,也就是说最多有两个量化表。Q0 1或2 量化表的值,Pq=0时;为一个字节,Pq=1时,为两个字节Q1 1或2 量化表的值,Pq=0时;为一个字节,Pq=1时,为两个字节Qn 1或2 量化表的值,Pq=0时,为一个字节;Pq=1时,为两个字节。n的值为063,表示量化表中64个值(之字形排列)(4)DRI(Define Restart Interval)此标记需要用到最小编码单元(MCU,Minimum Coding Unit)的概念。前面提到,Y分量数据重要,UV分量的数据相对不重要,所以可以只取UV的一部分,以增加压缩比。目前支持JPEG格式的软件通常提供两种取样方式YUV411和YUV422,其含义是YUV三个分量的数据取样比例。举例来说,如果Y取四个数据单元,即水平取样因子Hy乘以垂直取样因子Vy的值为4,而U和V各取一个数据单元,即HuVu=1,HvVv=1。那么这种部分取样就称为YUV411。如图9.7所示:图9.7 YUV411的示意图图9.8 YUV111的排列顺序易知YUV411有50%的压缩比(原来有12个数据单元,现在有6个数据单元),YUV422有33%的压缩比(原来有12个数据单元,现在有8个数据单元)。那么你可能会想,YUV911,YUV1611压缩比不是更高嘛?但是要考虑到图象质量的因素。所以JPEG标准规定了最小编码单元MCU,要求HyVy+HuVu+HvVv10。MCU中块的排列方式与H,V的值有密切关系,如图9.8、图9.9、图9.10所示。图9.9 YUV211的排列顺序图9.10 YUV411的排列顺序标记结构 字节数 意义0XFF 10XDD 1Lr 2 DRI标记码长度,不包括前两个字节0XFF,0XDDRi 2 重入间隔的MCU个数,Ri必须是一MCU行中MCU个数的整数,最后一个零头不一定刚好是Ri个MCU。每个重入间隔各自独立编码。(5)SOF(Start of Frame) 在基本系统中,只处理SOF0标记结构 字节数 意义0XFF 10XC0 1Lf 2 SOF标记码长度,不包括前两个字节0XFF,0XC0P 1 基本系统中,为0X08Y 2 图象高度X 2 图象宽度Nf 1 Frame中的成分个数,一般为1或3,1代表灰度图,3代表真彩图C1 1 成分编号1(H1,V1) 1 第一个水平和垂直采样因子Tq1 1 该量化表编号C2 1 成分编号2(H2,V2) 1 第二个水平和垂直采样因子Tq2 1 该量化表编号Cn 1 成分编号n(Hn,Vn) 1 第n个水平和垂直采样因子Tqn 1 该量化表编号(6)DHT(Define Huffman Table)标记结构 字节数 意义0XFF 10XC4 1Lh 2 DHT标记码长度,不包括前两个字节0XFF,0XC4(Tc,Th) 1 L1 1L2 1 L16 1V1 1V2 1Vt 1Tc为高4位,Th为低4位。在基本系统中,Tc为0或1,为0时,指DC所用的Huffman表,为1时,指AC所用的Huffman表。Th表示Huffman表的编号,在基本系统中,其值为0或1。所以,在基本系统中,最多有4个Huffman表,如下所示:Tc Th Huffman表编号(2Tc+Th)0 01 10 21 1 3Ln表示每个n比特的Huffman码字的个数,n=116Vt表示每个Huffman码字所对应的值,也就是我们前面所讲的符号1,对DC来说该值为(Size),对AC来说该值为(RunLength,Size)。t=L1+L2+L16(7)SOS(Start of Scan)标记结构 字节数 意义0XFF 10XDA 1Ls 2 DHT标记码长度,不包括前两个字节0XFF,0XDANs 1Cs1 1(Td1,Ta1) 1Cs2 1(Td2,Ta2) 1CsNs 1(TdNs,TaNs) 1Ss 1Se 1(Ah,Al) 1Ns为Scan中成分的个数,在基本系统中,Ns=Nf(Frame中成分个数)。CSNs为在Scan中成分的编号。TdNs为高4位,TaNs为低4位,分别表示DC和AC编码表的编号。在基本系统中Ss=0,Se=63,Ah=0,Al=0。(8)EOI(End of Image) 结束标志标记结构 字节数 意义0XFF 10XD9 13. JPEG基本系统解码器的实现笔者曾经实现了一个Windows下JPEG基本系统的解码器,限于篇幅,这里就不给源程序了,只给出大体上的程序流程图(见图9.11)。图9.11 JPEG解码器的程序流程图图9.12 程序运行时的画面由于没有用到什么优化算法,该解码器的速度并不高,在用VC的性能评测工具Profile评测该程序时我发现最耗时的地方是反离散余弦变换(IDCT)那里,其实这是显然的,浮点数的指令条数要比整数的多得多,因此采用一种快速的IDCT算法能很大的提高性能,我这里采用是目前被认为比较好的一种快速IDCT算法,其主要思想是把二维IDCT分解成行和列两个一维IDCT。图9.12是程序运行时的画面。源程序参见本书所附软盘
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 临时分类 > 人文社科


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!