资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,落霞与孤鹜齐飞,秋水共长天一色,落霞与孤鹜齐飞秋水共长天一色,讨论题目,图像处理技术给我们学习、工作和生活带来了哪些好的和不好的变化?,讨论题目 图像处理技术给我们学习、工作和生活,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,夫妻相,夫妻相,官员悬浮照,官员悬浮照,凤姐,+,范冰冰,+,=,凤姐+范冰冰+=,华南虎事件,华南虎事件,图像处理技术,第,3,章,3.,1 图像原理,3.,1.1 图像与图形,3.,1.2 图像分辨率,3.,1.3 图像颜色与颜色深度,3.,2 图像文件,3.,2.1 图像文件格式,3.,2.2 图像文件的体积与保存,3.,3 图像的获取,3.,3.1 获取途径,3.,3.2 图像扫描技术,3.,3.3 数码拍摄技术,3.,4 图像处理技术,3.,4.1 图像的点处理,3.,4.2 图像的组处理,3.,4.3 图像的几何处理,3.,4.4 图像的帧处理,3.,5 图像的浏览,3.,5.1 图像浏览软件简介,3.,5.2 图片浏览界面基本功能,3.,5.3 图像文件格式,3.,5.4 建立或取消文件关联,3.6,图像数据的压缩,图像处理技术第 3 章3.1 图像原理 3.3.3,3.1.1,图像与图形,3.1,图像原理,图像:直接量化的原始信号形式,图像的最小单位是像点,用于表现自然影像,图形:运算形成的抽象化产物,图形由具有方向和长度的,矢量表示,用于分析运算结果,简单,图形表示,3.1.1 图像与图形3.1图像原理 图像:直接量化的原,位图图像,图像由基本显示单元“像点”构成,图像像点,8bit (2,8,=256,色,),16bit (2,16,=65536,色,),24bit (2,24,=16M,色,),8,位图像,16,位图像,24,位图像,二进制位与图像之间,存在严格的“位映射”关系,像点由若干个二进制位进行描述,二进制位代表图像颜色的数量,具有位映射关系的图叫作“位图”,“,位图”特指图像,位图图像 图像由基本显示单元“像点”构成图像像点8bit,位图的放大,位图的放大,矢量图的放大,矢量图的放大,矢量图和位图的比较(,1,),矢量图,位图,表达对象的复杂程度,适合表现比较细致,层次和色彩比较丰富,包括大量细节的场景,不适合表达复杂的对象,显示速度,显示速度,较快,,存储器中图像的数据可以装入内存直接显示在显示器上,在显示时需要经过重新计算,因而显示速度相对,慢,一些,文件大小,要存储二维对象的每一个像素,图像文件所占存储空间,较大,,通常要进行压缩,只保存生成图形的算法、图形的控制点和属性信息,因此占用的存储空间,很小,。,缩放时的性质,放大后图像,会失真,,呈现锯齿状,这是因为图像存放的是固定像素的信息,当对位图图像进行放大时,像素个数并没有增加,而是像素本身放大,,并不保存具体的绘制的像素,保存的是图形的算法信息,当对矢量图形进行放大时,它需要进行重新计算和重新显示即可,所以,不会失真,。,矢量图和位图的比较(1)矢量图位图表达对象的复杂程度适合表,矢量图和位图的比较(,2,),矢量图,位图,应用,侧重于“绘制”和“创建”,常用于商标、标志、图案设计,侧重于“获取”和“复制”,典型的处理软件,AutoCAD,,,3DMax,Photoshop,注意:,随着计算机科学的发展,图形和图像之间的区别越来越模糊,图形与图像的内涵日益接近,以致于在某些情况下,图形和图像两者已融合在一起,无法区分。利用真实感图形绘制技术可以将图形数据变成图像,利用模式识别技术可以从图像数据中提取几何数据,把图像转换成图形。,矢量图和位图的比较(2)矢量图位图应用侧重于“绘制”和“创,图像处理的内容,图像的数字化,图像的数字化是指将一幅图像通过采样、量化、编码转变成计算机能够接受的数字图像。,图像编码压缩,数字化后的图像数据量大,需采用编码技术来压缩信息,以便节省图像传输和处理的时间,减少存储容量。常见的压缩编码包括预测编码、变换编码、分形编码、小波变换等。,图像变换,图像的变换是将空间域的处理转换为变换域的处理,不仅可以减少计算量,而且可获得更有效的处理。图像还变换包括传统的几何变换,例如图像的缩放、旋转、平移、投影等。,图像恢复技术,图像处理是研究如何通过有关技术修改和解释现有图像。图像处理的研究对象是数字图像,其研究的主要内容包括以下方面。,图像恢复是采用某种滤波方法,如去除噪声、干扰和模糊等,恢复或重建原来的图像。,图像识别,图像处理的内容 图像的数字化 图像编码压缩 图像,图形处理的内容,图形的输入,图形的输入研究的是如何开发利用图形输入设备及软件将图形输入到计算机中,以便进行各种处理。,图形的变换处理,图形的变换处理包括对图形进行变换,(,如几何变换、投影变换、建模、造型,),和运算,(,如图形的并、交、差运算,),处理。,图形的生成与输出,图形的生成与输出研究的是如何将图形特定的表示形式转换成图形输出系统便于接受的表示形式,并将图形在显示屏或打印机等输出设备上显示输出。,图形,处理研究的是如何通过计算机生成、处理和显示图形,其广泛用于计算机辅助设计与制造、计算机艺术、计算机模拟、计算机动画和虚拟现实等领域。,图形处理的内容 图形的输入 图形的变换处理 图,Resolution (,分辨率,),单位,图像分辨率,dpi,的数值越大,图像越清晰,dpi (display pixels / inch),每英寸显示的像点数,300 dpi 96 dpi 21 dpi,dpi,视觉效果,清晰度,绝对清晰度,3.,1.2, Resolution (分辨率)单位图像分辨率 dpi,图像分辨率,3.,1.2,A:200dpi,B:50dpi,图像,B,放大四倍,图像分辨率3.1.2A:200dpi B:50dpi图像B放,分辨率,3.,1.2,分辨率是影响图像质量的重要因素,分为屏幕分辨率、图像分辨率、显示器分辨率和像素分辨率。,1,屏幕分辨率,屏幕分辨率是指某一种显示方式下,计算机屏幕上最大的显示区域,以水平和垂直的像素表示。,2,图像分辨率,图像分辨率指数字化图像的大小,以水平和垂直的像素点表示 。,3,显示器分辨率,显示器分辨率指显示器本身所能支持各种显示方式下最大的屏幕分辨率,通常它用像素之间的距离来表示,即点距。,4,像素分辨率,像素分辨率指一个像素的宽和长的比例(也称为像素的长宽比),在像素分辨率不同的机器间传输图像时会产生意想不到的畸变。,分辨率3.1.2 分辨率是影响图像质量的重要因素,分为,常见分辨率,显示器:,96 dpi,显示用图片:,96 dpi,动画、视频:,96 dpi,平板,扫描仪:,1200 dpi,底片扫描仪,4800 dpi,激光打印机:,6001200 dpi,喷墨打印机:,720,2880 dpi,印刷图片,:,300,600 dpi,常见分辨率 显示器:96 dpi 平板扫描仪:1200,图像颜色与颜色深度,3.,1.3,色彩的亮度、色调和饱和度,1,亮度,亮度也称为明度,是指彩色所引起的人眼对明暗程度的感觉。它与被观察物体的发光强度有关。对于色调、饱和度固定的光而言,当其全部能量增强时,亮度增加,因此亮度与光功率有关。,2,色调,色调也称为色相,指颜色的基本面貌,即人们称呼某种颜色的名称,如红、绿、蓝等。色调与光波的波长有关,不同的波长反映不同的颜色感。色调是人们看到一种或多种波长的光时所产生的综合效果。它反映颜色的种类,是决定颜色的基本特性。,3,饱和度,饱和度也称为纯度,指颜色的深浅程度。对于同一色调的彩色光,饱和度越高则颜色越纯。凡是经过混合后所产生的颜色,它的色彩饱和度比未混合的原来的颜色低。饱和度的增减还会影响到颜色的亮度。,图像颜色与颜色深度3.1.3色彩的亮度、色调和饱和度1亮度,图像颜色与颜色深度,3.,1.3,色彩模型,色彩模型是指已经建立好的用于描述和重现色彩的各种模型。各个应用领域一般使用不同的色彩模型。常用的色彩模型有,HSB,、,RGB,、,CMYK,以及,Lab,色彩模型。,1,HSB,模型,HSB,指的是色调,(Hue),、饱和度,(Saturation),、亮度,(Brightness),。该模型是用色彩的三要素来描述颜色,适合于色彩设计,绝大部分的设计软件都提供了这种色彩模型,包括,Windows,的系统调色板也是采用这种色彩模型。,色相变化,纯,度,变,化,明度,变,化,windows,系统调色板,图像颜色与颜色深度3.1.3色彩模型 色彩模型是指已经,图像颜色与颜色深度,3.,1.3,色彩模型,色彩模型是指已经建立好的用于描述和重现色彩的各种模型。各个应用领域一般使用不同的色彩模型。常用的色彩模型有,HSB,、,RGB,、,CMYK,以及,Lab,色彩模型。,加色法混合,方式,减,色法混合,方式,2,RGB,模型,RGB,是指红(,Red,)、绿(,Green,)、蓝(,Blue,)三种色光。,该模式采用加色法混合方式。,3,CMYK,模型,CMYK,是指青色(,Cyan,)、品红,(Magenta),、黄色(,Yellow),、黑色,(blacK),四种油墨色。该模式采用减色法混合方式。,图像颜色与颜色深度3.1.3色彩模型 色彩模型是指已经,图像颜色与颜色深度,3.,1.3,色彩模型,色彩模型是指已经建立好的用于描述和重现色彩的各种模型。各个应用领域一般使用不同的色彩模型。常用的色彩模型有,HSB,、,RGB,、,CMYK,以及,Lab,色彩模型。,4,Lab,模型,Lab,色彩模型用三组数值表示色彩:,L,:,Lightness,亮度数值,从,0,到,100,。,a,:,红色和绿色两种原色之间的变化区域,数值从,-120,到,+120,b,:,黄色到蓝色两种原色之间的变化区域,数值从,-120,到,+120,图像颜色与颜色深度3.1.3色彩模型 色彩模型是指已经,图像颜色与颜色深度,3.,1.3,色彩模型的相互转换,在一个典型的多媒体计算机系统中,常常涉及到用几种不同的颜色空间表示图形和图像的颜色,以对应于不同的场合和应用,各种颜色空间可以方便地进行转换,。,RGB,颜色空间可与,HSI,空间相互转换,,HSI,颜色空间与,RGB,颜色空间的转换关系如下:,图像颜色与颜色深度3.1.3色彩模型的相互转换,图像颜色与颜色深度,3.,1.3,与自然界中的影像不同,数字化图像的颜色数量具有准确的数量级,,这是采用一定长度的二进制数描述颜色的缘故。,图像的颜色,二值图像,黑白双色(,0,或,1,),灰度图像,2,的,8,次方,=255,种黑白变化色,彩色图像,采用,RGB,彩色空间(,R,G,B,),一般写成(,0255,,,0255,,,0255,),图像颜色与颜色深度3.1.3 与自然界中的影像不同,数字化,图像颜色与颜色深度,3.,1.3,与自然界中的影像不同,数字化图像的颜色数量具有准确的数量级,,这是采用一定长度的二进制数描述颜色的缘故。,颜色深度,颜色深度,图像中描述每个像素所需的二进制位数,单位为,bit,。,彩色或灰度图像分别用,4 bit,、,8 bit,、,16 bit,、,24 bit,和,32 bit,二进制数,表示。当彩色深度达到或高于,24 bit,位时,图像的颜色数量已经足够,多,基本上还原了自然影像,习惯上把这种图像叫做“真彩色”图像。,图像颜色与颜色深度3.1.3 与自然界中的影像不同,数字化,文件,颜色与分辨率,用途,.GIF,256,/ 96,dpi,用于动画、多媒体程序界面,网页界面,. BMP,256,2,24,/ *,dpi,用于,Windows,环境下的任何场合,. TIF,256,2,32,/ *,dpi,用于专业印刷,. JPG,2,16,2,32,/ *,dpi,用于数字图片保存、传送,. TGA,256,2,24,/,96,dpi,用于专业动画影视制作,. PCD,2,16,2,32,/ *,dpi,用于,PHOTO CD,注意:图像文件的扩展名不要轻易修改,否则不能使用,图像文件,数字化图像以文件的形式存在,其文件名有严格的约定。,3.,2,3.,2.1 图像文件格式,文件颜色与分辨率用途.GIF256 / 96dpi用于动画、,A4,幅面(横),24 bit,彩色,300 dpi,分辨率,图像文件的体积与保存,. JPG,883,KB,损失,15%,色,重复保存,损失加剧,. GIF,4,501,KB,256,色,格式转换容易失真,. BMP,25,481,KB,真彩色,数据量大,. TGA,25,481,KB,真彩色,数据量大,. PCD,25,481,KB,真彩色,数据量大,. TIF,25,697,KB,真彩色,数据量大,数据对比,3.,2.2,A4幅面(横)图像文件的体积与保存. JPG 88,图像文件的体积与保存,3.,2.2,1.,PCX,格式,2.,DIB,和,BMP,格式,3.,GIF,格式,PCX,格式最初由,Z-Soft,公司为其图像处理软件,PC Paintbrush,设计的文件格式,。,该格式使用游程长编码(,RLE,)方法进行压缩,压缩比适中,适合于一般软件的使用,压缩和解压缩的速度都比较快。另外,各种扫描仪扫描得到的图像一般都能存成,PCX,格式。,DIB,是,Windows,所使用的与设备无关的点位图文件存储格式。,BMP,是标准的,Windows,和,OS/2,的图像格式的基本位图格式。,BMP,文件格式存储的图像数据都不能压缩,因此图像文件的大小较大。,GIF,(,Graphics Interchange Format,)格式,译为图形交换格式,用于在不同的平台上进行图像交流和传输。,GIF,是使用,LZW,压缩方法的主要图形文件格式,因此,文件压缩比较高,文件较小。,图像文件的体积与保存3.2.21. PCX格式 2. DIB,图像文件的体积与保存,3.,2.2,4.,TIFF,格式,5.,JPEG,格式,6.,PCD,格式,TIFF,(,Tag Image File Format,)格式称为标记图像文件格式,支持所有的图形类型,同时被许多图形应用软件(如,CorelDraw,,,PhotoShop,等)所支持。,TIFF,格式文件分为压缩和非压缩两类,非压缩的,TIF,文件独立于软硬件,但压缩文件要复杂多了,图形文件压缩后,格式改为,TIEF,格式。,JPEG,格式采用的是有损压缩编码格式,文件非常小,而且可以调整压缩比。,JPEG,文件的显示比较慢,仔细观察图像的边缘可以看出不太明显的失真。适用于要处理大量图像的场合,一般不适合用来存储原始图像。,PCD,格式是,Kodak,公司开发的电子照片文件存储格式,是,Photo-CD,的专用格式,一般都存储在,CD-ROM,上,读取,PCD,文件要用,Kodak,公司出的专门软件。,图像文件的体积与保存3.2.24.TIFF格式5. JPEG,图像的获取,3.,3,图像获取,把自然影像转换成数字化图像的过程。,扫描仪,数字图像,3.,3.1 获取途径,1),利用设备进行模数转换,数码相机,2),从光盘图像库或互联网上获取,PCD,、,JPG,格式,互联网合法渠道,图像的获取3.3 图像获取 把自然影像转换成数字化图,图像扫描技术,3.,3,.,2,扫描仪,TWAIN,扫描驱动程序,保证扫描质量的条件,正确的扫描方法,正确的扫描参数,合适的颜色深度,适当的后期处理,增加锐度,去网纹,选择分辨率,300 dpi,24 bit,调整,亮度,/,对比度,饱和度,色调,高分辨率扫描,转换分辨率使用,!,图像扫描技术3.3.2扫描仪TWAIN扫描驱动程序 保证扫,数码拍摄技术,3.,3,.3,传统构图,个性构图,强调个人意愿,,画面比例独特,,布局大胆且有新意。,讲求均衡,,画面比例规则,,具有平衡感。,个性构图,(,宽,),个性构图,(,高,),传统构图,(,黄金分割,),数码拍摄技术3.3.3 传统构图 个性构图强调个人意愿,,构图规则,1,)画面中的海面、水面、,地平面要水平,不可,倾斜。,2,)画面要简洁,主体要,突出,应大胆除去多,余的、与主体无关的,元素。,3,)画面要均衡,注意空,间的安排。,构图规则1)画面中的海面、水面、2)画面要简洁,主体要3),构图规则,4,)人物与景物的关系要把握好,要人、景兼顾。,人物过小,人物和景物的比例较合适,构图规则4)人物与景物的关系要把握好,要人、景兼顾。人物过,光圈与快门控制,若,CCD,获得的光线不足,将产生“躁点”,影响画面质量。,光圈,2.8 4 5.6 8 11 16 22,快门,1/s,光圈,B,8 15 30 60 125 250 500 1000,感光指数为常数时的关系,2.8,4,5.6,8,11,16,22,光圈与速度的关系,(1),速度 曝光量,(2),光圈 曝光量,感光度,60,感光速度慢,颗粒小,影像清晰,适于光照条件非常好的场合,100,感光速度中等,颗粒中,影像较清晰,适于白天,400,感光速度快,颗粒较粗,影像一般,适于傍晚、黎明、室内,1000,感光速度极快,颗粒粗,影像一般,适于高速运动物体的摄影,光圈与快门控制 若CCD获得的光线不足,将产生“躁点”,,景深控制,景深是衡量照片纵深清晰度的指标,光圈可控制景深。,景深,深,景深,浅,光圈越大,景深越浅。,光圈越小,景深越深。,景深控制 景深是衡量照片纵深清晰度的指标,光圈可控制景深,光线运用,为了获得锐度好、光线明亮的数码照片,,应在光线比较充足的时候拍摄。,在光线不足时拍摄风光,不要打开闪光灯,,否则效果不理想。,傍晚和早晨的色彩丰富,拍摄风光不要使用,闪光灯,为了避免“脱焦”,要支三脚架拍摄。,逆光拍摄人物时,为了避免人物黑暗,,使用闪光灯是必要的。,光线运用为了获得锐度好、光线明亮的数码照片,傍晚和早晨的色,光线运用,自然光,+,辅助光,反射光,反射光,反光伞,反光伞,反光伞,反射光,反光板,有源光,柔光灯箱,日光,直射光,光线运用自然光 + 辅助光反射光反射光反光伞反光伞反光伞反,图像处理技术,3.,4,3.,4.1 图像的点处理,点处理算法,图像基本算法,处理对象是像点。,1,亮度调整,对图像的所有像点加上一个常数或减少一个常数,可改变亮度值。,2,对比度调整,把像点亮度阀值以上的像点增加亮度,阀值以下的像点降低亮度。,3,亮度反置处理,用最大允许亮度值减去当前亮度值,用其差值作为该像点的新值。,亮度处理 对比度处理 亮度反,置处理,图像处理技术3.43.4.1 图像的点处理 点处理算法,图像的组处理,3.,4,.2,组处理算法,处理对象是一组像点,又叫“区处理或块处理”。,1,图像边缘处理,增强边缘,使图像的轮廓清晰。用拉普拉斯变换、平移和差分运算、,梯度边缘运算进行处理。,2,图像锐化处理,通过运算增加像点之间的亮度差异,使图像的亮度和色彩变得尖锐。,3,图像柔化处理,采用计算相邻像素平均值的方法实现。图像柔和、虚化、朦胧。,图像边缘处理 图像锐化处理 图像柔化处理,图像的组处理3.4.2 组处理算法 处理对象是一组像,图像的几何处理,3.,4,.3,1,图像的放大与缩小,图像放大,把原图像的一个像点演变成若干个像点,使像点数量大,于原图像,像点密度不变,体积增加。,缩小图像,把原图像的多个像点演变成一个像点,细节丢失,像点,数量减少,体积缩小。,图像整倍数缩放时,不产生畸变失真。非整倍数缩放时,,则用线性差值取代产生的小数,会产生畸变失真。,2,图像旋转,图像旋转依据如下的算法进行:,(x,y),(x,y),x,y,z,x,=,x,0,+(,x,-,x,0,)cos,- (,y - y,0,)sin,y,=,y,0,+(,y - y,0,)cos, +,(,x - x,0,)sin,图像的几何处理3.4.31图像的放大与缩小 图像整倍数缩,图像的帧处理,3.,4,.4,图像的帧处理,将一幅以上的图像以某种,特定的形式,合成在一起,,形成新的图像。,1),进行“逻辑与”、“逻辑或”、“异或”的合成运算。,2),按照相加、相减以及有条件的复合算法进行合成。,3),覆盖、取平均值进行合成。,亮度叠加效果,图像的帧处理3.4.4 图像的帧处理 将一幅以上的图,鼠标双击某图像文件名,,即可立即启动,ACDSee,软件的图片显示界面,,并显示该图像。,图像的浏览,3.,5,3.,5.1 图像浏览软件简介,ACDSee ,图像浏览软件,在图片显示界面中,鼠标,双击图片,即可打开图片,浏览界面。,3.,5,.2,图片浏览界面基本功能,图片小样,小图片,路径显示,工具,鼠标双击某图像文件名,图像的浏览3.53.5.1 图像浏览,基本功能,1),浏览图片,左侧路径显示栏中选择路经,右侧浏览图像文件。,2),显示图片内容,在浏览界面中双击小图片,即可显示大幅图片。,再次双击大图片,返回小图片浏览状态。,3),转移图片,直接拖曳。,4),复制图片,按下,Ctrl,健拖曳。,5),文件更名,两次单击图片,更名。,6),删除图片,选中,按,Delete,键。,7),文件格式转换,鼠标右键单击图片,,选择“工具,/,转换文件格式”。,基本功能1) 浏览图片 左侧路径显示栏中选择路经,右,图像文件格式,3.,5,.3,BMP,DIB RLE,EMF,GIF,JPG,JPEG JPE JIF JFI,KDC,PCD,PCX DCX,PIC,PNG,PSD,TGA,TIF,TIFF,WMF,Windows,及,OS/2,使用的位图,增强图元文件,256,色的压缩文件,JPEG,压缩文件,以及,JFIF,文件,Kodak,公司开发的文件,保存在,CD,上的,Kodak,图片文件,Zsoft Publisher,软件制作的文件,Soft Images,的文件,Portable,网络用图形文件,Photoshop,制作的带有图层的文件,主要用于动画制作的,Targa,文件,主要用于印刷的图像文件,Windows,系统使用的剪贴画文件,ACDSee,支持的常见格式 说 明,图像文件格式3.5.3BMP DIB RLEWindows及,建立或取消文件关联,3.,5,.4,(2),选择“图像”等卡片,(3),选择关联文件格式,或单击“全选”按钮,(4),单击“确定”按钮,(1),选择“工具,/,文件关联”菜单,操作步骤,关联的作用,鼠标双击被关联的对象,自动启动,ACDSee,软件,并显示对象。,在安装新软件时,已经,建立的关联可能被解除,建立或取消文件关联3.5.4(2) 选择“图像”等卡片(3),图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,数字图像压缩的两个基本原理,数字图像的相关性。,人的视觉心理特征。,在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。,人的视觉对于边缘急剧变化不敏感,(,视觉掩盖效应,),,对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。,从信息论观点来看,图像作为一个信源,描述信源的数据 是信息量,(,信源熵,),和信息冗余量之和。信息冗余有许多种,如空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余等,数据压缩实质上是减少这些冗余量。从数学上讲,图像可以看作一个多维函数,压缩描述这个函数的数据量实质是减少其相关性。另外在一些情况下,允许图像有一定的失真,而并不妨碍图像的实际应用。,图像数据的压缩3.63.6.1 图像数据的压缩算法 数字图像,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,1,图像数据压缩的可能性,空间冗余,时间冗余,信息熵冗余,结构冗余,知识冗余,视觉冗余,其它冗余,图像数据的压缩3.63.6.1 图像数据的压缩算法 1图像,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,2,图像压缩方法,衡量一个压缩编码方法优劣的重要指标是:,压缩比要高,有几倍、几十倍,也有几百乃至几千倍;,压缩与解压缩要快,算法要简单,硬件实现容易;,解压缩的图像质量要好。,压缩编码算法,无损压缩编码,哈夫曼编码,算术编码,行程编码,有损压缩编码,预测编码,频率域方法,空间域方法,模型方法,基于重要性,混合编码,JBIG,H261,JPEG,MPEG,等技术,图像数据的压缩3.63.6.1 图像数据的压缩算法 2图像,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,3,无损压缩编码,经常使用的无损压缩方法有,香农,-,范诺编码,霍夫曼编码,算术编码,RLE,编码,所谓无损压缩格式,是利用数据的统计冗余进行压缩,可完全回复原始数据而不引起任何失真,但压缩率是受到数据统计冗余度的理论限制,一般为,2:1,到,5:1.,这类方法广泛用于文本数据,程序和特殊应用场合的图像数据,(,如指纹图像,医学图像等,),的压缩。由于压缩比的限制,仅使用无损压缩方法是不可能解决图像和数字视频的存储和传输的所有问题,.,图像数据的压缩3.63.6.1 图像数据的压缩算法 3无损,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,3,无损压缩编码,香农,-,范诺(,Shannon-Fano,)编码,的目的是产生具有最小冗余的码词(,code word,)。其基本思想是产生编码长度可变的码词。码词长度可变指的是,被编码的一些消息的符号可以用比较短的码词来表示。估计码词长度的准则是符号出现的概率。符号出现的概率越大,其码词的长度越短。,香农,-,范诺编码算法步骤:, 按照符号出现的概率减少的顺序将待编码的符号排成序列。, 将符号分成两组,使这两组符号概率和相等或几乎相等。, 将第一组赋值为,0,,第二组赋值为,1,。, 对每一组,重复步骤的操作。,图像数据的压缩3.63.6.1 图像数据的压缩算法 3无损,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,3,无损压缩编码,霍夫曼编码,的基本方法是先对图像数据扫描一遍,计算出各种像素出现的概率,按概率的大小指定不同长度的唯一码字,由此得到一张该图像的霍夫曼码表。编码后的图像数据记录的是每个像素的码字,而码字与实际像素值的对应关系记录在码表中。,算法步骤如下:, 初始化,根据符号概率的大小按由大到小顺序对符号进行排序。, 把概率最小的两个符号组成一个新符号(节点),即新符号的概率等于这两个符号概率之和。, 重复第,2,步,直到形成一个符号为止(树),其概率最后等于,1,。, 从编码树的根开始回溯到原始的符号,并将每一下分枝赋值为,1,,上分枝赋值为,0,。,图像数据的压缩3.63.6.1 图像数据的压缩算法 3无损,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,算术编码,在图像数据压缩标准,(,如,JPEG,,,JBIG),中扮演了重要的角色。在算术编码中,消息用,0,到,1,之间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在,0,到,1,之间。编码过程中的间隔决定了符号压缩后的输出。,算术编码,特点,:,不必预先定义概率模型,自适应模式具有独特的优点;,信源符号概率接近时,建议使用算术编码,这种情况下其效率高于,Huffman,编码。,算术编码实现方法复杂一些,但,JPEG,成员对多幅图像的测试结果表明,算术编码比,Huffman,编码提高了,5%,左右的效率。,图像数据的压缩3.63.6.1 图像数据的压缩算法,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,行程编码,RLE,。,现实中有许多这样的图像,在一幅图像中具有许多颜色相同的图块。在这些图块中,许多行上都具有相同的颜色,或者在一行上有许多连续的象素都具有相同的颜色值。在这种情况下就不需要存储每一个象素的颜色值,而仅仅存储一个象素的颜色值,以及具有相同颜色的象素数目就可以,或者存储一个象素的颜色值,以及具有相同颜色值的行数。这种压缩编码称为行程编码,常用,(run length encoding,,,RLE),表示,具有相同颜色并且是连续的象素数目称为行程长度。,行程编码的基本原理是:,用一个符号值或串长代替具有相同值的连续符号(连续符号构成了一段连续的“行程”。行程编码因此而得名),使符号长度少于原始数据的长度。,例如 :,5555557777733322221llllll,行程编码为:(,5,,,6,)(,7,,,5,)(,3,,,3,)(,2,,,4,)(,l,,,7,) 。,图像数据的压缩3.63.6.1 图像数据的压缩算法 行程编码,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,4,预测编码,从相邻数据之间由强的相关性特点考虑,可以利用前面已经出现的数值,进行预测(估计),得到一个预测值,将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法即为预测编码方法。,差分脉冲编码调制,(DPCM),帧间预测编码,图像数据的压缩3.63.6.1 图像数据的压缩算法 4预测,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,4,预测编码,差分脉冲编码调制,DPCM(differential pulse code modulation),是利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。,差分脉冲编码调制的思想是,根据过去的样本去估算,(estimate),下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。,图,5.13,DPCM,图像数据的压缩3.63.6.1 图像数据的压缩算法 4预测,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,4,预测编码,活动图像是由连续图像帧组成的时间图像序列,它在时间上比在空间上具有更大的相关性。大多数电视图像相邻帧间细节变化是很小的,即视频图像帧间具有很强的相关性,利用帧所具有的相关性的特点进行帧间编码,可获得比帧内编码高得多的压缩比。,帧间预测编码是利用视频图像帧间的相关性,即时间相关性,来达到图像压缩的目的,即不直接传送当前帧的像素值,而是传送,x,和其前一帧或后一帧的对应像素,x,之间的差值,这称为帧间预测。广泛用于普通电视、会议电视、视频电话、高清晰度电视的压缩编码。,图,5.14,帧间预测,图像数据的压缩3.63.6.1 图像数据的压缩算法 4预测,图像数据的压缩,3.6,3.6.1,图像数据的压缩算法,5.,变换编码,变换编码,是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种(空间),然后再对信号进行编码。,常用的变换编码有:,离散余弦变换(,DCT,),沃尔什,哈达玛变换(,WHT,),离散傅里叶变换(,DFT,),卡亨南,洛维变换(,KLT,),小波变换,1974,年,,N,Ahmed,等人提出了离散余弦变换,(DCT),,最大特点是对于一般的图像都能够将像块的能量集中于少数低频,DCT,系数上,这样就可能只编码和传输少数系数而不严重影响图像质量。,DCT,不能直接对图像产生压缩作用,但对图像的能量具有很好的集中效果,为压缩打下了基础。,一维离散余弦变换,二维离散余弦变换,图像数据的压缩3.63.6.1 图像数据的压缩算法 5.,图像数据的压缩,3.6,3.6.2,图像数据的压缩标准,1. JPEG,JPEG,是一个适用范围很广的静态图像数据压缩标准,具有连续色调、多级灰度和静态图像特点的数字图像压缩编码方法,被确定为,JPEG,国际标准。,JPEG,专家组开发了两种基本的压缩算法,一种是采用以离散余弦变换,(Discrete Cosine Transform,,,DCT),为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2,图像数据的压缩标准,1. JPEG,JPEG,算法框图,压缩编码大致分成三个步骤:,使用正向离散余弦变换,(FDCT),把空间域表示的图变换成频率域表示的图。,使用加权函数对,DCT,系数进行量化,这个加权函数对于人的视觉系统是最佳的。,使用霍夫曼可变字长编码器对量化系数进行编码。,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2,图像数据的压缩标准,1. JPEG,离散余弦变换。对每个单独的彩色图像分量,把整个分量图像分成,88,的图像块,并作为两维离散余弦变换,DCT,的输入。通过,DCT,变换,把能量集中在少数几个系数上。,图,5-16 DCT,系数,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2,图像数据的压缩标准,1. JPEG,量化是对经过,FDCT,变换后的频率系数进行量化。量化的目的是减小非“,0”,系数的幅度以及增加“,0”,值系数的数目,量化是图像质量下降的最主要原因。,量化阶段需要两个,8*8,矩阵数据,一个是专门处理亮度的频率系数,另一个则是针对色度的频率系数,将频率系数除以量化矩阵的值,取得与商数最近的整数,即完成量化。,亮度量化值,色度量化值,16,11,10,16,24,40,51,61,12,12,14,19,26,58,60,55,14,13,16,24,40,57,69,56,14,17,22,29,51,87,80,62,18,22,37,56,68,104,103,77,24,35,55,64,81,104,113,92,49,64,78,87,103,121,120,101,72,92,95,98,112,100,103,99,17,18,24,47,99,99,99,99,18,21,26,66,99,99,99,99,24,26,56,99,99,99,99,99,47,66,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,99,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2,图像数据的压缩标准,1. JPEG,量化后得到的仍是,64,个系数,量化并没有改变系数的性质。经过,DCT,变换后,低频分量集中在左上角,其中,F,(,0,,,0,)(即第一行第一列元素)代表了直流(,DC,)系数,即,8*8,子块的平均值,要对它单独编码。由于两个相邻的,8*8,子块的,DC,系数相差很小,所以对它们采用差分编码,DPCM,,可以提高压缩比,也就是说对相邻的子块,DC,系数的差值进行编码。,8*8,的其它,63,个元素是交流(,AC,)系数,采用行程编码。,DCT,变换之后得到的,DC,直流系数有两个特点,一是系数的数值比较大,二是相邻,88,图像块的,DC,系数值变化不大。根据这个特点,,JPEG,算法使用了差分脉冲调制编码,(DPCM),技术,对相邻图像块之间量化,DC,系数的差值,(Delta),进行编码,,Delta,DC(0, 0)k-DC(0, 0)k-1,量化后,AC,系数的特点是,1 64,矢量中包含有许多“,0”,系数,并且许多“,0”,是连续的,因此使用非常简单和直观的游程长度编码,(RLE),对它们进行编码。,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2,图像数据的压缩标准,1. JPEG,为了进一步达到压缩数据的目的,需对量化后的,DC,系数,和行程编码后的,AC,系数进行基于统计特性的熵编码。,JPEG,建议使用两种熵编码方法:哈夫曼,(Huffman),编码和自适应二进制算术编码,(Adaptive Binary Arithmetic Coding),。,DC,、,AC,系数行程编码的码字用两个字节表示:,第一个字节的前,4,位对于,DC,系数而言,总为,0,;对于,AC,系数而言,表示非零系数前所包含的连续,0,的个数。低,4,为对于,DC,系数而言,表示差值的幅值编码所需的比特数;对于,AC,系数而言,表示下一个非零系数幅值编码所需的比特数。,第二个字节表示,DC,差值的幅值或下一个非零系数幅值。,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2,图像数据的压缩标准,2. MPEG,MPEG,的全称是运动图像专家组(,Moving Picture Experts Group,),是专门制定多媒体领域内的国际标准的一个组织,该组织成立于,1988,年,由全世界大约,300,名多媒体技术专家组成。,MPEG,标准是一系列视频、音频、数据的压缩标准。分成,MPEG,视频、,MPEG,音频和,MPEG,系统三大部分。,目前,,MPEG,的标准主要有:,MPEG-1,、,MPEG-2,、,MPEG-4,、,MPEG-7,、,MPEG-21,。,MPEG,系统的组成,MPEG,系统:定义音频、视频及有关数据的同步;,MPEG,视频:定义视频数据的编码和重建图像所需的解码过程,亮度信号分辨率为,360240,,色度信号分辨率为,180120,;,MPEG,音频:定义音频数据的编码和解码;,一致性测试。,图像数据的压缩3.63.6.2 图像数据的压缩标准2. M,图像数据的压缩,3.6,3.6.2,图像数据的压缩标准,2. MPEG,MPEG,的视频数据流结构,序列层,图像组层,图像层,片层,宏块层,块层,图像数据的压缩3.63.6.2 图像数据的压缩标准2. M,图像数据的压缩,3.6,3.6.2,图像数据的压缩标准,2. MPEG,MPEG,运动图像类型,I,帧,P,帧,B,帧,D,帧,图像数据的压缩3.63.6.2 图像数据的压缩标准2. M,图像数据的压缩,3.6,3.6.2,图像数据的压缩标准,2. MPEG,视频流的组成,允许编码端自行选择,I,帧的使用频率和在视频流中的位置。,允许编码端自行选择任何两帧参考图像之间的,B,帧数。,编码端的视频流记录格式并不要求与典型图像显示顺序一致。,MPEG,实现视频编码采用两种基本技术:,基于块的运动补偿技术,目的是减少时间上冗余性;,基于,DCT,变换的,ADCT,技术,以减少空间上冗余性。,运动补偿技术,运动补偿预测是以子块(,1616,)为预测单元,把当前子块认为是先前某一时刻图像子块的位移,位移的内容包括运动方向和运动幅度。,图像数据的压缩3.63.6.2 图像数据的压缩标准2. M,第,3,章 图像处理技术,小结,3.,1 图像原理,3.,1.1 图像与图形,3.,1.2 图像分辨率,3.,1.3 图像颜色与颜色深度,3.,2 图像文件,3.,2.1 图像文件格式,3.,2.2 图像文件的体积与保存,3.,3 图像的获取,3.,3.1 获取途径,3.,3.2 图像扫描技术,3.,3.3 数码拍摄技术,3.,4 图像处理技术,3.,4.1 图像的点处理,3.,4.2 图像的组处理,3.,4.3 图像的几何处理,3.,4.4 图像的帧处理,3.,5 图像的浏览,3.,5.1 图像浏览软件简介,3.,5.2 图片浏览界面基本功能,3.,5.3 图像文件格式,3.,5.4 建立或取消文件关联,3.6,图像数据的压缩,第3章 图像处理技术小结3.1 图像原理 3.3.,
展开阅读全文