资源描述
离离 散散 余余 弦弦 变变 换换(Discrete Cosine Transform,DCT)的的变变换换核核为为余余弦弦函函数数。DCT除除了了具具有有一一般般的的正正交交变变换换性性质质外外,它它的的变变换换阵阵的的基基向向量量能能很很好好地地描描述述人人类类语语音音信信号号和和图图像像信信号号的的相相关关特特征征。因因此此,在在对对语语音音信信号号、图图像像信信号号的的变变换换中中,DCT变变换换被被认认为为是是一一种种准准最最佳佳变变换换。近近年年颁颁布布的的一一系系列列视视频频压压缩缩编编码码的的国国际际标标准准建建议议中中,都都把把DCT作作为为其其中中的的一一个个基基本本处处理理模模块块。除除此此之之外外,DCT还还是一种可分离的变换。是一种可分离的变换。离散余弦变换(离散余弦变换(DCT)及其应用)及其应用离散余弦变换(DiscreteCosine1离散余弦变换(离散余弦变换(DCT)及其应用)及其应用1.1一维离散余弦变换一维离散余弦变换一维一维CT的变换核定义为的变换核定义为:(1-1)式中,x,u=0,1,2,N1;(1-2)一维DCT定义如下:设f(x)|x=0,1,N-1为离散的信号列。离散余弦变换(DCT)及其应用1.1一维离散余弦变换(1-12离散余弦变换(离散余弦变换(DCT)及其应用)及其应用(1-3)式中,u,x=0,1,2,N1。将变换式展开整理后,可以写成矩阵的形式,即F=Gf(1-4)其中(1-5)离散余弦变换(DCT)及其应用(1-3)式中,u,x=3离散余弦变换(离散余弦变换(DCT)及其应用)及其应用一维DCT的逆变换IDCT定义为式中,x,u=0,1,2,N1。可见一维DCT的逆变换核与正变换核是相同的。(1-6)离散余弦变换(DCT)及其应用一维DCT的逆变换IDCT定41.2 二维离散余弦变换二维离散余弦变换考虑到两个变量,很容易将一维DCT的定义推广到二维DCT。其正变换核为离散余弦变换(离散余弦变换(DCT)及其应用)及其应用(1-7)式中,C(u)和C(v)的定义同式(7-48);x,u=0,1,2,M1;y,v=0,1,2,N1。二维DCT定义如下:设f(x,y)为MN的数字图像矩阵,则(1-8)1.2二维离散余弦变换离散余弦变换(DCT)及其应用(1-5离散余弦变换(离散余弦变换(DCT)及其应用)及其应用式中:x,u=0,1,2,M1;y,v=0,1,2,N1。二维DCT逆变换定义如下:(1-9)式中:x,u=0,1,2,M1;y,v=0,1,2,N1。类似一维矩阵形式的DCT,可以写出二维DCT的矩阵形式如下:F=GfGT(1-10)离散余弦变换(DCT)及其应用式中:x,u=0,16离散余弦变换(离散余弦变换(DCT)及其应用)及其应用同时,由式(1-8)和式(1-9)可知二维DCT的逆变换核与正变换核相同,且是可分离的,即(1-11)式中:C(u)和C(v)的定义同式(1-2);x,u=0,1,2,M1;y,v=0,1,2,N1。离散余弦变换(DCT)及其应用同时,由式(17离散余弦变换(离散余弦变换(DCT)及其应用)及其应用通常根据可分离性,二维DCT可用两次一维DCT来完成,其算法流程与DFT类似,即(1-12)离散余弦变换(DCT)及其应用通常根据可分离81.3 快速离散余弦变换快速离散余弦变换离散余弦变换(离散余弦变换(DCT)及其应用)及其应用离散余弦变换的计算量相当大,在实用中非常不方便,也需要研究相应的快速算法。目前已有多种快速DCT(FCT),在此介绍一种由FFT的思路发展起来的FCT。首先,将f(x)延拓为x=0,1,2,N-1x=N,N+1,2N-1(1-13)1.3快速离散余弦变换离散余弦变换(DCT)及其应用9离散余弦变换(离散余弦变换(DCT)及其应用)及其应用按照一维DCT的定义,fe(x)的DCT为(1-14)式中,Re表示取复数的实部。离散余弦变换(DCT)及其应用按照一维DCT的定义,fe(x10离散余弦变换(离散余弦变换(DCT)及其应用)及其应用由于为fe(x)的2N点DFT。因此,在作DCT时,可把长度为N的f(x)的长度延拓为2N点的序列fe(x),然后对fe(x)作DFT,最后取DFT的实部便可得到DCT的结果。同理对于离散余弦逆变换IDCT,可首先将F(u)延拓为u=0,1,2,N-1u=N,N+1,2N-1(1-15)离散余弦变换(DCT)及其应用由于11离散余弦变换(离散余弦变换(DCT)及其应用)及其应用由式(1-9)可得,DCT的IDCT为(1-16)由式(7-63)可见,IDCT可由的2N点的IDFT来实现。离散余弦变换(DCT)及其应用由式(1-9)可得,DCT的I12离散余弦变换(离散余弦变换(DCT)及其应用)及其应用最后要注意的是二维DCT的频谱分布,其谱域分布与DFT相差一倍,如图1-1所示。从图中可以看出,对于DCT而言,(0,0)点对应于频谱的低频成分,(N-1,N-1)点对应于高频成分,而同阶的DFT中,(N2,N2)点对应于高频成分(注:此频谱图中未作频谱中心平移)。由于DFT和IDFT已有快速算法FFT和IFFT,因此可用它们实现快速DCT和IDCT算法FCT及IFCT。不过,由于FFT及IFFT中要涉及到复数运算,因此这种FCT及IFCT算法并不是最佳的。离散余弦变换(DCT)及其应用最后要注意的是二13离散余弦变换(离散余弦变换(DCT)及其应用)及其应用图1-1DFT和DCT的频谱分布(a)DFT频谱分布;(b)DCT频谱分布离散余弦变换(DCT)及其应用图1-1DFT和DCT的频谱141.4 离散余弦变换在图像压缩中的应用离散余弦变换在图像压缩中的应用1.4.1图像压缩概述图像压缩概述 多媒体数据的显著特点:数据量非常大。例如,多媒体数据的显著特点:数据量非常大。例如,一张彩色相片的数据量可达一张彩色相片的数据量可达10MB10MB;视频影像和声音由;视频影像和声音由于连续播放,数据量更加庞大。这对计算机的存储以于连续播放,数据量更加庞大。这对计算机的存储以及网络传输都造成了极大的负担。解决办法之一就是及网络传输都造成了极大的负担。解决办法之一就是进行数据压缩,压缩后再进行存储和传输,到需要时进行数据压缩,压缩后再进行存储和传输,到需要时再解压、还原。再解压、还原。在位图格式的图像存储方式中,像素与像素之在位图格式的图像存储方式中,像素与像素之间在行方向和列方向都具有很大的相关性,我们说整间在行方向和列方向都具有很大的相关性,我们说整体数据的体数据的冗余度很大冗余度很大,需要对图像数据进行很大程度,需要对图像数据进行很大程度的压缩的压缩离散余弦变换(离散余弦变换(DCT)及其应用)及其应用1.4离散余弦变换在图像压缩中的应用离散余弦变换(DCT)15离散余弦变换(离散余弦变换(DCT)及其应用)及其应用多媒体数据的冗余类型多媒体数据的冗余类型多媒体数据表示中存在着大量的冗余,数据压缩技术就是利用多媒体数据的冗余性来减少数据量的方法。常见图像、视频、音频数据中存在的冗余类型如下:1.空间冗余2.时间冗余3.视觉冗余离散余弦变换(DCT)及其应用多媒体数据的冗余类型 多媒体数16离散余弦变换(离散余弦变换(DCT)及其应用)及其应用1.空间冗余 一一幅幅图图像像表表面面上上各各采采样样点点的的颜颜色色之之间间往往往往存存在在着着空空间间连连贯贯性性,基基于于离离散散像像素素采采样样来来表表示示物物体体表表面面颜颜色色的的像像素存储方式可利用空间连贯性,达到减少数据量的目的。素存储方式可利用空间连贯性,达到减少数据量的目的。例例如如,在在静静态态图图像像中中有有一一块块表表面面颜颜色色均均匀匀的的区区域域,在在此此区区域域中中所所有有点点的的光光强强和和色色彩彩以以及及饱饱和和度度都都是是相相同同的的,因此数据有很大的空间冗余。因此数据有很大的空间冗余。帧内压缩帧内压缩图图BitmapBitmap颜色相同的块颜色相同的块帧内压缩帧内压缩离散余弦变换(DCT)及其应用1.空间冗余一幅图像表17离散余弦变换(离散余弦变换(DCT)及其应用)及其应用2.时间冗余 运运动动图图像像一一般般为为位位于于一一时时间间轴轴区区间间的的一一组组连连续续画画面面,其其中中的的相相邻邻帧帧往往往往包包含含相相同同的的背背景景和和移移动动物物体体,只只不不过过移移动动物物体体所所在在的的空空间间位位置置略略有有不不同同,所所以以后后一一帧帧的的数数据据与与前前一一帧帧的的数数据据有有许许多多共共同同的的地地方方,这这种种共共同同性性是是由由于于相相邻邻帧帧记记录录了了相相邻邻时时刻刻的的同同一一场场景景画画面面,所所以以称称为为时时间间冗余冗余。同理,语音数据中也存在着时间冗余。同理,语音数据中也存在着时间冗余。离散余弦变换(DCT)及其应用2.时间冗余运动图像一般18离散余弦变换(离散余弦变换(DCT)及其应用)及其应用3.视觉冗余 人类的视觉系统由于受生理特性的限制,对于图像场人类的视觉系统由于受生理特性的限制,对于图像场的注意是非均匀的,人对细微的颜色差异感觉不明显。的注意是非均匀的,人对细微的颜色差异感觉不明显。例如,人类视觉的一般分辨能力为例如,人类视觉的一般分辨能力为2 26 6灰度等级,而一灰度等级,而一般的图像的量化采用的是般的图像的量化采用的是2 28 8灰度等级,即存在视觉冗余。灰度等级,即存在视觉冗余。人类的听觉对某些信号反映不太敏感,使得压缩后人类的听觉对某些信号反映不太敏感,使得压缩后再还原有允许范围的变化,人也感觉不出来。再还原有允许范围的变化,人也感觉不出来。离散余弦变换(DCT)及其应用3.视觉冗余人类的视觉19离散余弦变换(离散余弦变换(DCT)及其应用)及其应用数据压缩方法的分类数据压缩方法的分类1.按照压缩方法是否产生失真分类(1)无失真压缩无失真压缩 无失真压缩要求解压以后的数据和原始无失真压缩要求解压以后的数据和原始数据完全一致。解压后得到的数据是原数据的复制,数据完全一致。解压后得到的数据是原数据的复制,是一种可逆压缩。是一种可逆压缩。无失真压缩法去掉或减少数据中的冗余,恢复时再无失真压缩法去掉或减少数据中的冗余,恢复时再重新插到数据中,因此是可逆过程重新插到数据中,因此是可逆过程根据目前的技术水平,无损压缩算法一般可以把普根据目前的技术水平,无损压缩算法一般可以把普通文件的数据压缩到原来的通文件的数据压缩到原来的1/21/21/41/4。一些常用的。一些常用的无损压缩算法有赫夫曼无损压缩算法有赫夫曼(Huffman)(Huffman)算法和算法和LZW(Lenpel-Ziv&Welch)LZW(Lenpel-Ziv&Welch)压缩算法压缩算法离散余弦变换(DCT)及其应用数据压缩方法的分类按照压缩方法20(2)有有失失真真压压缩缩 解解压压以以后后的的数数据据和和原原始始数数据据不不完完全全一一致致,是是不不可可逆逆压压缩缩方方式式。有有失失真真压压缩缩还还原原后后,不不影影响响信信息息的表达的表达例如,图像、视频、音频数据的压缩就可以采用例如,图像、视频、音频数据的压缩就可以采用有损压缩方法,因为其中包含的数据往往多于我有损压缩方法,因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。图像、视频、产生误解,但可大大提高压缩比。图像、视频、音频数据的压缩比可高达音频数据的压缩比可高达100:1100:1,但人的主观,但人的主观感受仍不会对原始信息产生误解。感受仍不会对原始信息产生误解。离散余弦变换(离散余弦变换(DCT)及其应用)及其应用数据压缩方法的分类数据压缩方法的分类(2)有失真压缩解压以后的数据和原始数据不完全一致,是不可212.2.按照压缩方法的原理分类按照压缩方法的原理分类预测编码:预测编码:基本思想是利用已被编码的点的数据值,基本思想是利用已被编码的点的数据值,预测邻近的一个像素点的数据值预测邻近的一个像素点的数据值变换编码:基本思想是将图像的光强矩阵变换到系数空间上,然后对系数进行编码压缩统计编码:根据信息出现概率的分布特性而进行的压缩编码*无失真编码*分析合成编码:基元和特征参数混合编码:混合压缩是利用了各种单一压缩的长处,以求在压缩比、压缩效率及保真度之间取得最佳折衷离散余弦变换(离散余弦变换(DCT)及其应用)及其应用数据压缩方法的分类数据压缩方法的分类按照压缩方法的原理分类离散余弦变换(DCT)及其应用数据压缩22离散余弦变换(离散余弦变换(DCT)及其应用)及其应用影响数据压缩的要素影响数据压缩的要素压缩比压缩前后文件大小之比,越高越好,但受速度、消耗资源等的影响图像质量还原后与原图像相比,评估的方法有客观评估和主观评估压缩与解压缩速度与压缩方法和压缩编码的算法有关,一般压缩比解压缩计算量大,因而压缩比解压缩慢离散余弦变换(DCT)及其应用影响数据压缩的要素压缩比23离散余弦变换(离散余弦变换(DCT)及其应用)及其应用图像压缩编码举例图像压缩编码举例(1)(1)、行程编码(、行程编码(RLERLE)现实中有许多这样的图像,在一幅图像中具有许多现实中有许多这样的图像,在一幅图像中具有许多颜色相同的图块。在这些图块中,许多行上都具有相同颜色相同的图块。在这些图块中,许多行上都具有相同的颜色,或者在一行上有许多连续的像素都具有相同的的颜色,或者在一行上有许多连续的像素都具有相同的颜色值。在这种情况下就不需要存储每一个像素的颜色颜色值。在这种情况下就不需要存储每一个像素的颜色值,而仅仅存储一个像素的颜色值,以及具有相同颜色值,而仅仅存储一个像素的颜色值,以及具有相同颜色的的像素数目像素数目就可以,或者存储像素的颜色值,以及具有就可以,或者存储像素的颜色值,以及具有相同颜色值的行数。相同颜色值的行数。这种压缩编码称为这种压缩编码称为行程编码行程编码(run length encoding(run length encoding,RLE)RLE),具有相同颜色并且是连续的像素数目称为行程,具有相同颜色并且是连续的像素数目称为行程长度。长度。例如例如,字符串字符串AAABCDDDDDDDDBBBBBAAABCDDDDDDDDBBBBB利用利用RLERLE原理可以压缩为原理可以压缩为3ABC8D5B3ABC8D5B离散余弦变换(DCT)及其应用图像压缩编码举例(1)、行程编24RLERLE编码简单直观,编码编码简单直观,编码/解码速度快,解码速度快,因此许多图形和视频文件,如因此许多图形和视频文件,如.BMP.BMP.TIFF.TIFF及及AVIAVI等格式文件的压缩均采用此方法等格式文件的压缩均采用此方法.由于一幅图像中有许多颜色相同的图块,用一整数对由于一幅图像中有许多颜色相同的图块,用一整数对存储一个像素的颜色值及相同颜色像素的数目(长度)存储一个像素的颜色值及相同颜色像素的数目(长度)。例如:。例如:(G G,L L)离散余弦变换(离散余弦变换(DCT)及其应用)及其应用图像压缩编码举例图像压缩编码举例长度长度颜色值颜色值编码时采用从左到右,从上到下的排列,编码时采用从左到右,从上到下的排列,每当遇到一串相同数据时就用该数据及每当遇到一串相同数据时就用该数据及重复次数代替原来的数据串。重复次数代替原来的数据串。RLE编码简单直观,编码/解码速度快,离散余弦变换(DCT)25离散余弦变换(离散余弦变换(DCT)及其应用)及其应用图像压缩编码举例图像压缩编码举例000000003333333333222222222226666666111111111111111111111111555555555555888888888888888888555555555555553333222222222222222222(0,8)(3,10)(2,11)(6,7)(1,18)(1,6)(5,12)(8,18)(5,14)(3,4)(2,18)18*7的像素颜色仅用的像素颜色仅用11对数据对数据离散余弦变换(DCT)及其应用图像压缩编码举例000000026离散余弦变换(离散余弦变换(DCT)及其应用)及其应用图像压缩编码举例图像压缩编码举例游程长度编码特点:游程长度编码特点:直观,经济;直观,经济;是一种无损压缩;是一种无损压缩;压缩比取决于图像本身特点,相同颜色图像块越压缩比取决于图像本身特点,相同颜色图像块越大,图像块数目越少,压缩比越高。大,图像块数目越少,压缩比越高。适用于计算机生成的图像,例如。适用于计算机生成的图像,例如。BMPBMP、TIFTIF等,等,不适于颜色丰富的自然图像。不适于颜色丰富的自然图像。这并不是说这并不是说RLERLE编码方法不适用于自然图像的压缩,编码方法不适用于自然图像的压缩,相反,在自然图像的压缩中少不了相反,在自然图像的压缩中少不了RLERLE,只不过是,只不过是不能单纯使用不能单纯使用RLERLE一种编码方法,需要和其他的压一种编码方法,需要和其他的压缩编码技术联合应用。缩编码技术联合应用。离散余弦变换(DCT)及其应用图像压缩编码举例游程长度编码特27离散余弦变换(离散余弦变换(DCT)及其应用)及其应用图像压缩编码举例图像压缩编码举例(2)、哈夫曼编码(Huffman):由于图像中表示颜色的数据出现的概率不同,对于出现频率高的赋(编)予较短字长的码,对出现频率小的编于较长字长的码,从而减少总的代码量,但不减少总的信息量。离散余弦变换(DCT)及其应用图像压缩编码举例(2)、哈夫曼28离散余弦变换(离散余弦变换(DCT)及其应用)及其应用(1)(1)初初始始化化,根根据据符符号号概概率率的的大大小小按按由由大大到到小小顺顺序序对对符符号进行排序号进行排序 (2)(2)把把概概率率最最小小的的两两个个符符号号组组成成一一个个节节点点,如如图图4-024-02中中的的D D和和E E组成节点组成节点P P1 1。(3)(3)重重复复步步骤骤2 2,得得到到节节点点P P2 2、P P3 3和和P P4 4,形形成成一一棵棵“树树”,其中的,其中的P P4 4称为根节点。称为根节点。(4)(4)从从根根节节点点P P4 4开开始始到到相相应应于于每每个个符符号号的的“树树叶叶”,从从上上到到下下标标上上“0”(“0”(上上枝枝)或或者者“1”(“1”(下下枝枝),至至于于哪哪个个为为“1”“1”哪哪个个为为“0”“0”则则无无关关紧紧要要,最最后后的的结结果果仅仅仅仅是是分配的代码不同,而代码的平均长度是相同的。分配的代码不同,而代码的平均长度是相同的。(5)(5)从从根根节节点点P P4 4开开始始顺顺着着树树枝枝到到每每个个叶叶子子分分别别写写出出每每个个符号的代码。符号的代码。图像压缩编码举例图像压缩编码举例离散余弦变换(DCT)及其应用(1)初始化,根据符号概率的大29离散余弦变换(离散余弦变换(DCT)及其应用)及其应用图像压缩编码举例图像压缩编码举例赫夫曼编码举例赫夫曼编码举例符号符号出现的次数出现的次数loglog2 2(1/p(1/pi i)分配的代码分配的代码需要的位数需要的位数A A15(0.3846)15(0.3846)1.381.380 01515B B7(0.1795)7(0.1795)2.482.481001002121C C6(0.1538)6(0.1538)2.702.701011011818D D6(0.1538)6(0.1538)2.702.701101101818E E5(0.1282)5(0.1282)2.962.961111111515离散余弦变换(DCT)及其应用图像压缩编码举例赫夫曼编码举例30离散余弦变换(离散余弦变换(DCT)及其应用)及其应用图像压缩编码举例图像压缩编码举例赫夫曼编码举例赫夫曼编码举例离散余弦变换(DCT)及其应用图像压缩编码举例赫夫曼编码举例31离散余弦变换(离散余弦变换(DCT)及其应用)及其应用1.4 1.4 基于基于DCTDCT图像压缩图像压缩1)基本概念)基本概念将在空域上描述的图象,经过某种变换(通常采用,将在空域上描述的图象,经过某种变换(通常采用,余弦变换、傅立叶变换、沃尔什变换等),在某种余弦变换、傅立叶变换、沃尔什变换等),在某种变换域里进行描述。变换域里进行描述。在变换域里,首先降低了图象的相关性;其次通过在变换域里,首先降低了图象的相关性;其次通过某种图象处理(如频域的二维滤波)以及熵编码,某种图象处理(如频域的二维滤波)以及熵编码,则可进一步压缩图象的编码比特率。则可进一步压缩图象的编码比特率。离散余弦变换(DCT)及其应用1.4基于DCT图像压缩1)32离散余弦变换(离散余弦变换(DCT)及其应用)及其应用基于基于DCTDCT图像压缩图像压缩2)变换压缩原理框图变换压缩原理框图离散余弦变换(DCT)及其应用基于DCT图像压缩2)变换压缩33离散余弦变换(离散余弦变换(DCT)及其应用)及其应用基于基于DCTDCT图像压缩图像压缩3)常用图象变换技术讨论)常用图象变换技术讨论傅立叶变换和余弦变换傅立叶变换和余弦变换傅立叶变换及频谱移中后,其能量集中在中心附傅立叶变换及频谱移中后,其能量集中在中心附近。中心数据又称为直流分量,代表全图数值的近。中心数据又称为直流分量,代表全图数值的算术平均值。算术平均值。其编码误差来源有:变换系数经过量化器而引起其编码误差来源有:变换系数经过量化器而引起的量化误差。常使高频分量为的量化误差。常使高频分量为0,导致图象模糊。,导致图象模糊。离散余弦变换(DCT)及其应用基于DCT图像压缩3)常用图象34离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG1)JPEG基本系统基本系统2)FDCT和和IDCT3)量化与反量化)量化与反量化4)对量化系数的处理和组织)对量化系数的处理和组织5)熵编码)熵编码6)应用举例)应用举例离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG135离散余弦变换(离散余弦变换(DCT)及其应用)及其应用1)JPEG基本系统基本系统以以8*8的图象块为基本单位进行编码;的图象块为基本单位进行编码;将将RGB转换为亮度转换为亮度-色调色调-饱和度系统,并重新采样;饱和度系统,并重新采样;静止图像编码国际标准静止图像编码国际标准JPEGJPEG离散余弦变换(DCT)及其应用1)JPEG基本系统静止图像编36离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEGYIQ(NTSC制)与制)与YUV(PAL制)制)Y:指颜色的明视度、亮度、灰度值;:指颜色的明视度、亮度、灰度值;I或或U:指色:指色调;调;Q或或V:指饱和度。:指饱和度。Y=0.299R+0.587G+0.114BI=0.596R-0.247G-0.322BQ=0.211R-0.523G+0.312BU=0.148R-0.289G+0.473BV=0.615R-0.515G-0.1B离散余弦变换(DCT)及其应用静止图像编码国际标准JPEGY37离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG思想:人对亮度比对色彩敏感,在光线不足的情况下,思想:人对亮度比对色彩敏感,在光线不足的情况下,所观察物体都是黑白的。因此可以对色调和饱和度做所观察物体都是黑白的。因此可以对色调和饱和度做粗略处理。粗略处理。方法:对方法:对8*8图象块矩阵,图象块矩阵,Y成分数据不变,成分数据不变,U每每2*2个个数据求平均,数据求平均,V每每2*1个数据求平均。称为个数据求平均。称为YUV421系系统。统。除此除此,还有还有YUV422,411,420等系统等系统.离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG思38离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG2)FDCT与与IDCT思想:人眼对低频数据比对高频数据敏感。思想:人眼对低频数据比对高频数据敏感。根据根据8*8的二维的二维DCT定义定义离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG239离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG称称F(0,0)为直流系数,其他为交流系数。)为直流系数,其他为交流系数。JPEG标准不规定标准不规定FDCT和和IDCT的算法。的算法。离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG称40离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG3)量化与反量化)量化与反量化思想:将每个思想:将每个DCT系数除以各自量化步长并四舍五入系数除以各自量化步长并四舍五入后取整,得到量化系数。后取整,得到量化系数。JPEG系统分别规定了亮度分量和色度分量的量化表,系统分别规定了亮度分量和色度分量的量化表,显然色度分量相应的量化步长比亮度分量大。显然色度分量相应的量化步长比亮度分量大。离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG341离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG4)对量化系数的处理和组织)对量化系数的处理和组织思想:思想:JPEG采用定长和变长相结合的编码方法。采用定长和变长相结合的编码方法。直流系数:通常相邻直流系数:通常相邻8*8图象块的图象块的DC分量很接近,因分量很接近,因此此JPEG对量化后的直流分量采用无失真对量化后的直流分量采用无失真DPCM编码。编码。通常通常JPEG要保存所需比特数和实际差值。要保存所需比特数和实际差值。交流系数:经过量化后,交流系数:经过量化后,AC分量出现较多的分量出现较多的0。JPEG采用对采用对0系数的行程长度编码。而对非系数的行程长度编码。而对非0值,则要保存值,则要保存所需数和实际值。所需数和实际值。离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG442离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEGZIG-ZAG排序:为使连续的排序:为使连续的0个数增多,采用个数增多,采用Z形编码。形编码。离散余弦变换(DCT)及其应用静止图像编码国际标准JPEGZ43离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG5)熵编码)熵编码对于直流系数的差值,采用对于直流系数的差值,采用Huffman编码。编码。JPEG标准标准为亮度和色度分量分别拟定了为亮度和色度分量分别拟定了Huffman码表。码表。对于交流对于交流0系数的行长,采用系数的行长,采用Huffamn编码。同样编码。同样JPEG标准为亮度和色度分量分别拟定了标准为亮度和色度分量分别拟定了Huffman码表。码表。计算每象素的平均比特称为码率。计算每象素的平均比特称为码率。0.250.50图象质量中等,满足某些应用图象质量中等,满足某些应用0.500.75质量好,满足多数应用质量好,满足多数应用0.751.50极好,满足大多数应用极好,满足大多数应用1.502.0与原始图象质量一样与原始图象质量一样离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG544离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG6)应用举例)应用举例Lenna图象的一个图象的一个8*8方块方块离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG645离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG经过经过FDCT后的变换系数矩阵后的变换系数矩阵离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG经46离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG根据亮度量化表量化后得到的量化系数矩阵根据亮度量化表量化后得到的量化系数矩阵离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG根47离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG假设上一编码块的直流量化系数为假设上一编码块的直流量化系数为77,则直流差值,则直流差值为为2。则该图象块编码为则该图象块编码为离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG假48离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG反量化反量化离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG反49离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG反变换反变换离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG反50离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG编码比特率与质量因子编码比特率与质量因子通常在图象传输时要求固定比特率,通常在图象传输时要求固定比特率,JPEG通过设通过设定一个质量控制因子定一个质量控制因子Q,在量化时用该因子与量化,在量化时用该因子与量化表中的量化步长相乘作为实际的量化步长。表中的量化步长相乘作为实际的量化步长。则要求较高比特率时,则要求较高比特率时,Q取较小值如取较小值如0.1;否则取;否则取大值。大值。Q与比特流一起传送给解码端。与比特流一起传送给解码端。离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG编51离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG压缩率压缩率9.2离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG压52离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG压缩率压缩率18.4离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG压53离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEG压缩率压缩率51.6离散余弦变换(DCT)及其应用静止图像编码国际标准JPEG压54离散余弦变换(离散余弦变换(DCT)及其应用)及其应用静止图像编码国际标准静止图像编码国际标准JPEGJPEGH.261:用于电视电话和电视会议;码率:用于电视电话和电视会议;码率128kbps384kbps;MPEG1:用于数字存储媒体(如用于数字存储媒体(如VCD),码率为),码率为11.5Mbps,适,适合通讯网络;合通讯网络;MPEG2:用于数字电视和高清晰度电视(如:用于数字电视和高清晰度电视(如CCTV Ch 5),码率为),码率为1.530Mbps;MPEG4:用于:用于64Kbps以下带宽的音视编码,实现基于内容的编码;以下带宽的音视编码,实现基于内容的编码;其他编码方法:子带编码、小波编码其他编码方法:子带编码、小波编码JPEG2000、分形编码和基于模、分形编码和基于模型的编码等。型的编码等。离散余弦变换(DCT)及其应用静止图像编码国际标准JPEGH55离散余弦变换(离散余弦变换(DCT)及其应用)及其应用1.4 离散余弦变换在数字水印中的应用离散余弦变换在数字水印中的应用近几年来,数字作品盗版现象日益严重,有关数字作品的版权保护问题已经引起了各方面的关注;数字水印技术作为新型的版权保护技术,已经得到广泛的认可,有越来越多的技术人员投入到这方面的研究中,并取得了很好的成绩。数字水印技术离散余弦变换(DCT)及其应用1.4离散余弦变换在数字水印56离散余弦变换(离散余弦变换(DCT)及其应用)及其应用数字水印分类数字水印有多种分类方法按照可视性:可见水印和隐形水印;按照鲁棒性:脆弱性水印和健壮性水印;按照嵌入方法:空间域和变换域水印;按照检测与提取方法分类:私有水印、半公开水印和公开水印;离散余弦变换(DCT)及其应用数字水印分类数字水印有多种分类57离散余弦变换(离散余弦变换(DCT)及其应用)及其应用数字水印原理用户密钥无水印的输入图像数字水印数字水印插入算法有水印的输出图像数字水印插入过程用户密钥有水印的输入图像数字水印(特定的ID数字水印检测算法判决结果(有水印存在?数字水印检测过程离散余弦变换(DCT)及其应用数字水印原理用户密钥无水印的输58离散余弦变换(离散余弦变换(DCT)及其应用)及其应用数字水印分存数字水印分存主要是将秘密共享的思想引入到数字水印中;借助秘密共享的算法中国剩余定理,利用(k,n)方案实现水印分存;水印分存可以实现基于部分内容的水印提取,对内容侵权有比较好的鉴定能力,可以有效的保护数字作品的版权。离散余弦变换(DCT)及其应用数字水印分存数字水印分存主要是59离散余弦变换(离散余弦变换(DCT)及其应用)及其应用数字水印分存原理可以将任何水印文件(如数字序列、文本、图标等)都看作二进制流文件;水印分存步骤:(1)对水印图像进行置乱;(2)按8比特切割,转化为十进制数据;(3)对切割后的水印数据进行分存;注:分存后的水印数据需要用9比特表示。离散余弦变换(DCT)及其应用数字水印分存原理可以将任何水印60离散余弦变换(离散余弦变换(DCT)及其应用)及其应用空间域水印嵌入算法嵌入算法与LSB算法类似,将水印信息嵌入到图像像素的最低两比特。嵌入算法:(1)将原始图像进行分块,分为n块;(2)将水印信息按块转化为二进制比特流,分别嵌入到各块图像像素的最低两比特中;注:要保管好m,与块相一一对应。离散余弦变换(DCT)及其应用空间域水印嵌入算法嵌入算法与L61离散余弦变换(离散余弦变换(DCT)及其应用)及其应用空域水印实例:图象的位平面表示87654321离散余弦变换(DCT)及其应用空域水印实例:图象的位平面表示62离散余弦变换(离散余弦变换(DCT)及其应用)及其应用LSB隐藏原理图解Lena原图:8-bit灰度BMP图象离散余弦变换(DCT)及其应用LSB隐藏原理图解Lena原图63离散余弦变换(离散余弦变换(DCT)及其应用)及其应用Lena位平面与能量分布第一个位平面与去掉第1个位平面的Lena:离散余弦变换(DCT)及其应用Lena位平面与能量分布第一个64离散余弦变换(离散余弦变换(DCT)及其应用)及其应用Lena位平面与能量分布第二个位平面与去掉第1-2个位平面的Lena:离散余弦变换(DCT)及其应用Lena位平面与能量分布第二个65离散余弦变换(离散余弦变换(DCT)及其应用)及其应用Lena位平面与能量分布第三个位平面与去掉第1-3个位平面的Lena:离散余弦变换(DCT)及其应用Lena位平面与能量分布第三个66离散余弦变换(离散余弦变换(DCT)及其应用)及其应用Lena位平面与能量分布第四个位平面与去掉第1-4个位平面的Lena:离散余弦变换(DCT)及其应用Lena位平面与能量分布第四个67离散余弦变换(离散余弦变换(DCT)及其应用)及其应用Lena位平面与能量分布第五个位平面与去掉第1-5个位平面的Lena:离散余弦变换(DCT)及其应用Lena位平面与能量分布第五个68离散余弦变换(离散余弦变换(DCT)及其应用)及其应用Lena位平面与能量分布第六个位平面与去掉第1-6个位平面的Lena:离散余弦变换(DCT)及其应用Lena位平面与能量分布第六个69离散余弦变换(离散余弦变换(DCT)及其应用)及其应用Lena位平面与能量分布第七个位平面与去掉第1-7个位平面的Lena:离散余弦变换(DCT)及其应用Lena位平面与能量分布第七个70离散余弦变换(离散余弦变换(DCT)及其应用)及其应用实验结果原始图像原始图像(512*512)(512*512)空间域水印图像空间域水印图像(145*29)(145*29)离散余弦变换(DCT)及其应用实验结果原始图像(571离散余弦变换(离散余弦变换(DCT)及其应用)及其应用实验结果基于LSB算法嵌入水印结果离散余弦变换(DCT)及其应用实验结果基于72离散余弦变换(离散余弦变换(DCT)及其应用)及其应用实验结果剪切实验结果离散余弦变换(DCT)及其应用实验结果剪切73离散余弦变换(离散余弦变换(DCT)及其应用)及其应用变换域水印嵌入算法主要基于DCT变换,水印信息嵌入到DCT系数上;嵌入步骤:(1)将图像分为n块,每块再按8*8分块,进行DCT变换;(2)按下图所示嵌入水印数据;离散余弦变换(DCT)及其应用变换域水印嵌入算法主要基于DC74离散余弦变换(离散余弦变换(DCT)及其应用)及其应用离散余弦变换(DCT)及其应用75离散余弦变换(离散余弦变换(DCT)及其应用)及其应用变换域水印嵌入算法A11A12A31A21A13A33A32A22A23A51A52A42A41A71A61A53A43A73A72A62A63A91A92A82A81A93A83离散余弦变换(DCT)及其应用变换域水印嵌入算法76离散余弦变换(离散余弦变换(DCT)及其应用)及其应用水印嵌入DCT系数ifBi=1doAi2=max(Ai1,Ai2,Ai3)orAi2=max(Ai1,Ai2,Ai3)+d;elsedoAi2=min(Ai1,Ai2,Ai3)orAi2=min(Ai1,Ai2,Ai3)-d;注:d是调节参数离散余弦变换(DCT)及其应用水印嵌入DCT系数ifB77离散余弦变换(离散余弦变换(DCT)及其应用)及其应用水印提取算法水印提取实际上就是水印嵌入的逆过程水印提取的步骤:(1)将携带水印的图像分为n块,挑选其中较为完整的t块,提取出嵌入的水印数据;(2)将数据重新转化为十进制,按照中国剩余定理恢复原始的水印信息;(3)将恢复的水印信息转化为二进制数据进行逆置乱恢复原始水印。离散余弦变换(DCT)及其应用水印提取算法水印提取实际上就是78离散余弦变换(离散余弦变换(DCT)及其应用)及其应用从DCT系数中提取水印信息ifAi2=(Ai1+Ai3)/2doBi=1;elseBi=0;注:提取水印时有可能出现误判,即当等号成立时,将比特位都判做1,此时是有可能为0的,误判的概率为50%。离散余弦变换(DCT)及其应用从DCT系数中提取水印信息if79离散余弦变换(离散余弦变换(DCT)及其应用)及其应用实验结果原始图像原始图像(512*512)(512*512)变换域水印图像变换域水印图像(168*32)(168*32)离散余弦变换(DCT)及其应用实验结果原始图像(580离散余弦变换(离散余弦变换(DCT)及其应用)及其应用实验结果基于DCT变换嵌入水印结果离散余弦变换(DCT)及其应用实验结果基于81离散余弦变换(离散余弦变换(DCT)及其应用)及其应用实验结果添加高斯噪声实验结果离散余弦变换(DCT)及其应用实验结果添加高斯噪声82离散余弦变换(离散余弦变换(DCT)及其应用)及其应用实验结果滤波处理实验结果离散余弦变换(DCT)及其应用实验结果滤波处理实验83离散余弦变换(离散余弦变换(DCT)及其应用)及其应用实验结果JPEG压缩处理结果离散余弦变换(DCT)及其应用实验结果JPEG压84离散余弦变换(离散余弦变换(DCT)及其应用)及其应用噪声滤波混合处理离散余弦变换(DCT)及其应用噪声滤波混合处理85离散余弦变换(离散余弦变换(DCT)及其应用)及其应用噪声JPEG压缩混合处理离散余弦变换(DCT)及其应用噪声JPEG压缩混合处理86离散余弦变换(离散余弦变换(DCT)及其应用)及其应用三重攻击混合处理离散余弦变换(DCT)及其应用三重攻击混合处理87离散余弦变换(离散余弦变换(DCT)及其应用)及其应用基于基于DCTDCT的算法优点的算法优点水印隐藏效果好恢复水印不需要原始图像可以抵抗多种攻击 剪裁攻击;添加噪声;JPEG压缩处理;滤波处理等。离散余弦变换(DCT)及其应用基于DCT的算法优点水印隐藏效88基于DCT算法的不足离散余弦变换(离散余弦变换(DCT)及其应用)及其应用分存算法扩张了水印信息,相对减少了可嵌入的水印的容量;水印恢复时涉及到模数逆运算,增大了计算量和计算时间;可能由十进制、二进制之间的相互转换引入扩散性错误;对某些攻击无抵抗能力;基于DCT算法的不足离散余弦变换(DCT)及其应用分存算法扩89
展开阅读全文