数字图像处理基础

资源描述

单击此处编辑母版标题样式,单击此处编辑母版副标题样式,第2章图像处理基础,第2章图像处理基础,2.1 人眼成像过程,2.2 简单的图像形成模型,2.3 图像的数字化,2.4,数字图像的基本类型,2.5,数字图像的基本文件格式,2.6,傅里叶变换,2.1 人眼成像过程,人眼是一个平均半径为,20mm,的球状器官。它由三层薄膜包围着，如右图所示。最外层是坚硬的蛋白质膜，其中，位于前方的大约,1,6,部分为有弹性的透明组织，称为角膜，光线从这里进入眼内。,其余,5,6,为白色不透明组织，称为巩膜，它的作用是巩固和保护整个眼球。中间一层由虹膜和脉络膜组成。虹膜的中间有一个圆孔，称为瞳孔。它的大小可以由连接虹膜的环状肌肉组织来调节，以控制进入眼睛内部的光通量大小，其作用和照相机中的光圈一样。最内一层为视网膜，它的表面分布有大量光敏细胞。,除了三层薄膜，在瞳孔后面有一个扁球形的透明体。水晶体的作用如同可变焦距的一个透镜，它的曲率可以由睫状肌的收缩进行调节，从而使景象始终能刚好地聚焦于黄斑区。眼睛的晶状体和普通光学透镜之间的主要差别在于前者的适应性强。,用眼睛看建筑物侧面的图解，,C,点是晶状体的光心,近视眼,远视眼,2.,2,简单的图像形成模型,一幅图像实际上记录的是物体辐射能量的空间分布，这个分布是空间坐标、时间和波长的函数，即:,I=,(,x,y,z,t,),当一幅图像为平面单色图像时，空间坐标变量,z,波长,可以从函数中去除，一幅图像可以用一个二维分布函数表示:,f,(,x,y,t,),一幅平面静态单色图像，可以将时间函数,t,从函数中去除，图像可以用,f,(,x,y,),来表示。,2.,3,图像的数字化,几个名词：图象、图像、图片、影象、图形,Image,Picture,Pattern,连续图像,照片、电视、录象、电影,数学表达式：,f,(,x,y,t,),是一个二维分布函数，,t,是时间变量。,2.,3,图像的数字化,连续图像,数字图像,离散化,目的：便于计算机处理。,离散化,:,空间采样,:512512,象素,Pixel,分辨率,Resolution,幅值量化：,256,级,2,8,级,8bit,灰度级,Grey level,数字图像可以理解为对二维函数,f,(,x,，,y,),进行采样和量化,(,即离散处理,),后得到的图像，因此，通常用二维矩阵来表示一幅数字图像。,将一幅图像进行数字化的过程就是在计算机内生成一个二维矩阵的过程。,数字化过程主要包括两个步骤：,采样,和,量化,。,2.,3.1,采样,采样（,Sampling,）:是对图像空间坐标的离散化，它决定了图像的空间分辨率。,用一个网格把待处理的图像覆盖，然后把每一小格上模拟图像的各个亮度取平均值，作为该小方格中点的值。,图像的采样,对一幅图像采样时，若每行（即横向）像素为,M,个，每列（即纵向）像素为,N,个，则图像大小为,MN,个像素，从而,f(x,y),构成一个,MN,实数矩阵：,每个元素为图像,f(x,y),的离散采样值，称之为像元或像素。,类比,一维信号,电压,流量,t,x,y,二维图象,二维采样定理（,Nyguist,准则）,1/x,1/y2,倍的图象函数上限频带。,2.,3.2,量化,把采样后所得的各像素灰度值从模拟量到离散量的转换称为图像灰度的量化。,量化是对图像幅度坐标的离散化，它决定了图像的幅度分辨率。,曹冲秤象与离散化,量化,量化的方法包括：,等间隔量化,和,非非等间隔量化,。,等间隔量化,就是简单地把采样值的灰度范围等间隔地分割并进行量化。也称为均匀量化或线性量化。,为了减小量化误差，引入了,非均匀量化,的方法。非均匀量化依据一副图像具体的灰度值分布的概率密度函数，按总的量化误差最小的原则来进行量化。具体做法是：对图像中像素灰度值频繁出现的灰度值范围，量化间隔取小一些；对那些像素灰度值极少出现的范围，则量化间隔取大一些。,(,a),量化 (,b),量化为8,bit,量化示意图,(a)256,级灰度图象,(,b),子图,(,c),子图对应的量化数据,图像量化实例,对一幅图像，当量化级数一定时，采样点数对图像质量有着显著的影响。采样点数越多，图像质量越好；当采样点数减少时，图上的块状效应就逐渐明显。,同理，当图像的采样点数一定时，采用不同量化级数的图像质量也不一样。量化级数越多，图像质量越好，当量化级数越少时，图像质量越差，量化级数最小的极端情况就是二值图像，图像出现假轮廓。,采样点数和量化级数的关系：,(,a),采样点256,256时的图像,(,b),采样点64,64时的图像,(,c),采样点32,3,2时的图像,(,d),采样点16,1,6时的图像,采样点数与图像质量之间的关系,(,a),量化为2级的,Lena,图像,(,b),量化为16级的,Lena,图像,(,c),量化为256级的,Lena,图像,量化级数与图像质量之间的关系,1972,年,1997,年,分辨率不同,的图象比较,分辨率,640 x480,分辨率,320 x240,分辨率,160 x120,分辨率,80 x60,从粗到细地观察,分辨率,640 x480,分辨率,320 x240,分辨率,160 x120,分辨率,80 x60,查视力,=,检测分辨率？,Clockwise from top left:,Standard Lena;,Lena with a,Gaussian blur;,Lena converted,to polar coordinates;,Lenas edges;,Lena spherized,concave;,Lena spherized,convex.,1972,年,1997,年,2.,4,数字图像的基本类型,矢量图（,Vector,）,，也称矢量存储模式。矢量图是用一系列计算机指令来表示的一幅图。矢量图只存储图像内容的轮廓部分，而不是图像数据的每一点。途中每一个形状都是一个完整的公式，称为一个对象。,文件数据量小。,图像质量与分辨率无关。,不易制作色调丰富或色彩变化太多的图像，而且图像不是很逼真。,2.,4.1,二值图像,二值图像也叫黑白图像，就是图像象素只存在,0,1,两个值。,二进制的,lena,图像,2.,4.2,灰度图像,灰度图像是包含灰度级的图像，如,64,级，,256,级等。,如当像素灰度级用,8 bit,表示时，每个像素的取值就是,256,种灰度中的一种，即每个象素的灰度值为,0,到,255,中的一个。,通常，用,0,表示黑，,255,表示白，从,0,到,255,亮度逐渐增加。,2.,4.3,索引图像,索引图像把像素值直接作为索引颜色的序号，根据索引颜色的序号就可以找到该像素的实际颜色。索引颜色也称为映射颜色。,当把索引图像读入计算机时，索引颜色将被存储到调色板中。,调色板是包含不同颜色的颜色表，每种颜色以红，绿，蓝三种颜色的组合来表示。调色板的单元个数是与图像的颜色数一致的。,256,色图像有,256,个索引颜色，相应的调色板就有,256,个单元。,2.,4.4 RGB,图像,RGB,图像,是一类图像的总称，也称为,真彩色,。,这类图像不使用单独的调色板，每一个像素的颜色由存储在相应位置的红，绿，蓝颜色分量共同决定。,RGB,图像是,24,位图像，红绿蓝分量分别占用,8,位，理论上可以包含,1670,万种不同的颜色。,2.,5,数字图像的基本文件格式,每一种图像文件均有一个文件头，在文件头之后才是图像数据。文件头的内容一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。,图像文件还涉及图像文件的压缩方式和存储效率等。,常用的图像文件存储格式主要有,BMP,文件、,JPG,文件、,PCX,文件、,TIF,文件以及,GIF,文件等。,2.,5.1 BMP,图像文件格式,第一部分为,位图文件头,BITMAPFILEHEADER,，它是一个结构体，其定义如下：,typedef,struct,tagBITMAPFILEHEADER,WORD,bfType,;/,文件类型，必须是,0 x424D,DWORD,bfSize,;/,指定文件大小,WORDbfReserved1;,WORDbfReserved2;,DWORD,bfOffBits,;/,从文件头到实际位图数据的偏移字节数,BITMAPFILEHEADER;,这个结构的长度是固定的，为,14,个字节（,WORD,为无符号,16,位二进制整数，,DWORD,为无符号,32,位二进制整数）。,第二部分为,位图信息头,BITMAPINFOHEADER,，也是一个结构，其定义如下：,typedef,struct,tagBITMAPINFOHEADER,DWORD,biSize,；,/,该结构的长度，为,40,LONG,biWidth,；,LONG,biHeight,；,WORD,biPlanes,；,/,位平面数，必须为,1,WORD,biBitCount,；,/,指定颜色位数,DWORD,biCompression,；,/,指定是否压缩,DWORD,biSizeImage,；,/,实际位图数据字节数,LONG,biXPelsPerMeter,；,/,目标设备水平分辨率,LONGbiYPelsPerMeter,；,/,目标设备垂直分辨率,DWORDbiClrUsed,；,/,实际使用的颜色数,DWORDbiClrImportant,；,/,图像中重要的颜色数,BITMAPINFOHEADER,；,这个结构的长度是固定的，为,40,个字节（,LONG,为,32,位二进制整数）。其中，,biCompression,的有效值为,BI_RGB,、,BI_RLE8,、,BI_RLE4,、,BI_BITFIELDS,。,第三部分为,调色板,(Palette),。真彩色图像不需要调色板。调色板实际上是一个数组，共有,biClrUsed,个元素。数组中每个元素的类型是,RGBQUAD,结构，占,4,个字节，其定义如下：,typedef,struct,tagRGBQUAD,BYTE,rgbBlue,;/,该颜色的蓝色分量,BYTE,rgbGreen,;/,该颜色的绿色分量,BYTE,rgbRed,;/,该颜色的红色分量,BYTE,rgbReserved,;/,保留值,RGBQUAD;,第四部分就是实际的,图像数据,。对于用到调色板的位图，图像数据就是该像素颜色在调色板中的索引值，对于真彩色图像，图像数据就是实际的,R,、,G,、,B,值。,对于,2,色位图，用,1,位就可以表示该像素的颜色（一般,0,表示黑，,1,表示白），所以一个字节可以表示,8,个像素。,对于,16,色位图，用,4,位可以表示一个像素的颜色，所以一个字节可以表示,2,个像素。,对于,256,色位图，一个字节刚好可以表示,1,个像素。,2.,5.2 TIF,图像文件格式,标记图像文件格式,TIF(Tag Image File Format),是现存图像文件格式中最复杂的一种，是目前流行的图像文件交换标准之一。,TIF,格式文件的设计考虑了扩展性、方便性和可修改性，因此非常复杂，要求用更多的代码来控制它，结果导致文件读写速度慢，,TIF,代码也很长。,TIF,文件由,文件头,、,参数指针表,与,参数域、参数数据表,和,图像数据,四部分组成。,2.,5.3 GIF,图像文件格式,GIF,（,Graphics Interchange Format,）文件的全称是图形交换文件格式。,该形式存储的文件主要为不同的系统平台交流和传输图像提供方便,是,Web,及其他联机服务上常用的一种文件格式，用于,HTML,文档中的索引颜色图像。图像最大不能超过,64 M,，颜色最多为,256,色。,GIF,图像文件采取,LZW,压缩算法，存储效率高，支持多幅图像定序或覆盖，交错多屏幕绘图以及文本覆盖。,GIF,主要是为数据流而设计的一种,传输格式,，而不是作为文件的存储格式。,GIF,有五个主要部分以固定顺序出现，所有部分均由一个或多个块,(

展开阅读全文

数字图像处理基础

最新文档