图数字图象处理的基本概念.ppt

资源描述

第2章数字图象的基本概念,本章包含内容,人眼的视觉原理连续图象的描述图象数字化图象灰度直方图图象的数据结构与图象文件图象的特征与噪声,2.1人眼的视觉原理,2.1.1人眼构造三层结构:最外层：蛋白质膜(角膜、巩膜)、中间层：虹膜和脉络膜，最内层：视网膜，有大量的光敏细胞，按形状分为锥状和杆状细胞两类。其中白天视觉过程主要由锥状细胞完成，夜晚的视觉主要有杆状细胞完成。,2.1.2图象形成人观察景物，光线通过角膜，前室水状液体，水晶体，后室玻璃体，在视网膜的黄斑区成像视网膜的光敏细胞感受到强弱不同光的刺激，产生强度不同的电脉冲，通过神经纤维传送到视神经中枢不同位置的光敏细胞产生了和该处光的强弱成比例的电脉冲，于是大脑中形成景物的感觉,2.1.3视觉范围与分辨力视觉范围:指人眼能感受到的亮度范围视敏角：人眼对被观察物体刚能分辨出它最紧邻的两黑点或两白点的视角，如公式所表示：视觉锐度：又叫人眼的分辨力，是指人眼在一定距离内能够区分出相邻两点的能力，一般用视敏角的倒数描述,人眼分辨力决定因素环境照度观察对象的相对对比度个人因素,2.1.4视觉适应性和对比灵敏度暗视觉适应性：人眼适应暗环境的能力，这种适应过程大概需要30s。明视觉适应性：图像对比度：图像中最大亮度值与最小亮度值之比,描述图像总体描述亮度差异相对对比度：图像中最大亮度值与最小亮度值之差与最小亮度值之比,2.1.5亮度感觉与色觉人眼对亮度差别的感觉取决于相对亮度的变化，可用相对亮度变化描述.积分得亮度感觉:于是可得亮度感觉与亮度B成自然对数关系.人眼的亮度范围很宽.可是当适应某一平均亮度时,其感觉的亮度范围很窄.,亮度感觉的相对性给图象传输带来的好处:图象重现的亮度不必等于实际图象的亮度,只要保持两者对比度不变人眼不能感觉出来的亮度差别在重现图象时不必精确复制出来,人眼还可以分辨不同的颜色色觉:人眼分辨不同颜色的能力,指的是视网膜对不同波长光的感受特性,即在一般自然光线下分辨各种不同颜色的能力.色觉:色调,亮度,饱和度.物体的色取决于物体对各种波长光线的吸收,反射,透射能力,可分为消色物体和有色物体.消色物体显示黑,白,灰色物体,对光线的吸收不具有选择性,各种波长的光吸收能量一样有色物体:,2.1.6马赫带当亮度发生跃变时，会有一种边缘增强的感觉，视觉上会感到亮侧更亮，暗侧更暗,这种现象称为马赫带效应.它是一种主观的边缘效应.,2.2连续图像的数学描述,一幅图像可以被看作是空间各点光强度的集合。对于二维图像，可以把光强度g看作是随空间坐标（x,y）、光线波长和时间t变化的连续函数：,如果只考虑光的能量而不考虑其波长图像在视觉上表现为灰色影像-灰度图像：静止灰度图像：,人眼看到的图象是由物体的反射光组成的.可以看成所见场景的照射分量和反射光量组成,图象在(x,y)处的强度图象该点的灰度.灰度l范围Lmin,Lmax,其中要求Lmin为正,Lmax有限.,2.3图像数字化,图象数字化是将画面转化为数字图象的过程，主要包括采样和量化两个过程,2.3.1采样采样:将连续的图象换成离散点的操作关键要素:采样间隔,采样孔径,采样方式采样间隔的确定采样孔径的类型采样方式,2.3.2量化量化:将采样后离散象素的灰度转换成离散数值的过程.灰度级数(G):一幅图象中不同灰度值的个数灰度级数一般是2的整数幂,即是,从视觉效果来看只要灰度级数大于或等于26.对于一幅行数为M,列数为N的图象,如果采用gbit量化,则该图象占用的存储空间为M*N*g(bit).,（a）连续图像（b）数字化结果,（c）像素（d）灰度级,2.3.3数字图象的表示一幅连续图像f(x,y)被取样，则产生的数字图像有M行和N列。坐标(x,y)的值变成离散值，通常对这些离散坐标采用整数表示：,4行5列,图像的坐标,一幅行数为M、列数为N的图像大小为MN的矩阵形式为：,其中矩阵中的每个元素代表一个像素,2.3.4采样，量化和数字化图象数字化方式分为均匀采样，量化和非均匀采样，量化一般采用前者采样间隔越大，采样象素越少，图象空间分辨率低，质量差；采样间隔越小，采样象素越多，图象空间分辨率高，质量好，数据量大,图2-4不同采样点数对图像质量的影响（a）原始图像(256256)；（b）采样图像1(128128)；（c）采样图像2(6464)；（d）采样图像3(3232)；（e）采样图像4(1616)；（f）采样图像5(88),量化与数字化图象间的关系量化的等级越多，所得图象层次越丰富，灰度分辨率越高，质量越好，但是数据量大；量化的等级越少，所得图象欠层次，灰度分辨率变低，质量变差，会出现假轮廓现在，但是数据量小,图2-5不同量化级别对图像质量的影响（a）原始图像(256色)；（b）量化图像1(64色)；（c）量化图像2(32色)；（d）量化图像3(16色)；（e）量化图像4(4色)；（f）量化图像5(2色),对一幅图像，当量化级数Q一定时，采样点数MN对图像质量有着显著的影响采样点数越多，图像质量越好；当采样点数减少时，图上的块状效应就逐渐明显同理，当图像的采样点数一定时，采用不同量化级数的图像质量也不一样量化级数越多，图像质量越好，当量化级数越少时，图像质量越差，量化级数最小的极端情况就是二值图像，图像出现假轮廓,一般，当限定数字图像的大小时,为了得到质量较好的图像可采用如下原则：（1）对缓变的图像，应该细量化，粗采样，以避免假轮廓。（2）对细节丰富的图像，应细采样，粗量化，以避免模糊（混叠）。对于彩色图像，是按照颜色成分红（R）、绿（G）、蓝（B）分别采样和量化的若各种颜色成分均按8bit量化，即每种颜色量级别是256，则可以处理256256256=16777216种颜色。,2.3.5数字化设备组成及性能数字化器是将模拟图像转换成数字图像的数字化输入装置。组成：数字化器必须能够把图像划分为若干图像象素并给出他们的地址，量度每一个像素的灰度，把连续的度量结果化为整数，并把相关信息写入存储设备。因此必须包含：采样孔，图像扫描机构，光传感器，量化器，输出存储体。常用的数字化器扫描仪，数码相机，数码电视摄像机等,原稿,线阵CCD,A/D及图像处理,控制部分,步进电机驱动,去计算机,长光管光源,光学镜头,CCD扫描仪的系统框图,扫描仪,采用半导体隔离CCD,采用硅氧化物隔离CCD,手持式扫描仪馈纸式扫描仪鼓式扫描仪平台式扫描仪:采用CCD/CIS技术大幅面扫描仪底片扫描仪(胶片扫描仪)笔式扫描仪条码扫描仪实物扫描仪3D扫描仪,Canon656U采用CIS技术,扫描仪主要类型,扫描仪的应用灰度扫描仪最主要的应用是OCR(光学字元识别)、黑白印刷、排版及文件档案管理。彩色扫描仪主要应用于办公室简报、彩色排版、广告设计等。,镜头、感光器件（CCD或CMOS）、MPU（微处理器）、内置存储器、LCD（液晶显示器）、PC卡（可移动存储器）和接口（计算机接口、电视机接口）等部分组成,数码相机的立体剖面图,数字照相机,CompactFlash存储卡CompactFlashMemoryCard,MemoryStick,PCMCIA存储设备,数码相机及存储器,“电视制式摄像头”把景物光像转变为电信号的装置。其结构大致可分为三部分：光学系统（主要指镜头）光电转换系统（主要指摄像管或固体摄像器件）电路系统（主要指视频处理电路）光学系统的主要部件是光学镜头，它由透镜系统组合而成。,摄像机,三种常用的图像输入设备的比较,图象数字化器性能评价图像数字化器的性能评价,2.4图象灰度直方图,2.4.1概念1)反映一幅图象中各灰度级与各灰度级象素出现的频率之间的关系.其中ni表示灰度为i的象素数,n为象素总数2)是灰度级的函数，描述的是图像中每种灰度级像素的个数，反映图像中每种灰度出现的频率。横坐标是灰度级，纵坐标是灰度级出现的频率。,图像及其灰度直方图的例（512像素*512像素）,2.4.2直方图的性质1）表征了图像的一维信息。只反映图像中像素不同灰度值出现的次数（或频数）而未反映像素所在位置。2）与图像之间的关系是多对一的映射关系。一幅图像唯一确定出与之对应的直方图，但不同图像可能有相同的直方图。3）子图直方图之和为整图的直方图,2.4.3直方图的应用用于判断图象量化是否恰当一般一幅数字图像应该利用全部或几乎全部可能的灰度级；对直方图做快速检查确定图象二值化的域值使用轮廓线确定简单物体的边界的方法，称为阈值化对物体与背景有较强对比的景物的分割特别有用；,利用直方图统计图象中物体的面积计算图象的信息量(熵),2.5数字图象处理算法形式,2.5.1基本功能形式图象处理的基本功能:单幅图象-单幅图象多幅图象-单幅图象单(或多)幅图象-数字或者符号,2.5.2几种具体算法形式局部处理象素邻域:对于任一象素(i,j),把其周围象素构成的集合(i+p,j+q),p,q取适当整数叫做象素(i,j)的邻域.常用的去心邻域有4邻域,8邻域.局部处理:在对输入图象进行处理时,计算某一输出象素JP(i,j)值由IP(i,j)小邻域N(IP(i,j)中的象素值确定.局部处理应用:移动平均平滑法,空间锐化点处理:在局部处理中如果输出值JP(i,j)仅和IP(i,j)象素灰度有关的处理称为点处理点处理:图象对比度增强,图象二值化大局部处理:输出象素JP(i,j)的值取决于输入图象较大范围或者整幅图象象素的值.,迭代处理反复对图象进行某种运算直至满足给定的条件,从而得出输出图象的处理形式.应用:图象的细化跟踪处理选择满足适当条件的象素作为起始象素,检查输入的图象和已得到的输出结果,求出下一步应该处理的象素,进行规定的处理,然后在继续处理下面的象素,还是决定终止处理.特点:跟踪结果与起始位置有关利用处理结果限定处理范围可利用边界线,等高线的跟踪方面,窗口处理和模板处理对图象特定的部分进行处理的方式包括窗口处理和模班处理.窗口处理:单独对图象中选定的矩形区域进行处理,用于从图象中单独取出对象物所在的窗口而进行处理的场合.模板处理:单独处理任意形状时,必须先设一个模板平面.,串行处理串行处理:后一象素的输出结果依赖于前面的象素处理结果,并且只能依次处理各象素而不能同时对各个象素进行相同的处理方式.特点:处理算法按照一定顺序进行;用输入图象(i,j)的邻域象素值和输出图象(i,j)以前象素的处理结果计算输出图象(i,j)象素的值,并行处理并行处理:对图象内各个象素同时进行相同形式的运算.特点:处理算法按照一定顺序进行;输出图象(i,j)的值只用输入图象(i,j)以及其邻域象素值进行计算相对于不同(i,j)的输出值可以进行独立的运算,2.6图象数据结构与文件格式,2.6.1图象的数据结构数组组合方式一般是一个象素的灰度占用一个字.组合方式是一个字长存放多个象素灰度值.比特面方式将各个象素灰度按比特位存取的方式,即将所有象素灰度相同的比特位用一个二维数组表示,形成比特面.分层方式由原始图象开始依次构成象素愈来愈少的系列图象,就能使图象数据表示具有分层性,金字塔结构,树结构对图象的行,列接连不断二等分,直到图象被分割部分全体象素变成具有相同特征时不在分割,主要是用四叉树表示,用于特征提取和信息压缩.多重图象数据结构多光谱图象逐波段储存逐行存储逐象素存储,2.6.2图象文件格式图象文件格式有BMP,PCX,GIF,TIFF等格式任何一个文件格式包含以下内容:描述图象的高度,宽度以及各种物理特征:彩色定义:描述图象位图数据体:数字图像有多种存储格式，每种格式一般由不同的开发商支持。随着信息技术的发展和图像应用领域的不断拓宽，还会出现新的图像格式。因此，要进行图像处理，必须了解图像文件的格式，即图像文件的数据构成。每一种图像文件均有一个文件头，在文件头之后才是图像数据。文件头的内容一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。各种图像文件的制作还涉及到图像文件的压缩方式和存储效率等。,BMP图像文件格式,第一部分为位图文件头BITMAPFILEHEADER，它是一个结构体，其定义如下：typedefstructtagBITMAPFILEHEADERWORDbfType;DWORDbfSize;WORDbfReserved1;WORDbfReserved2;DWORDbfOffBits;BITMAPFILEHEADER;这个结构的长度是固定的，为14个字节（WORD为无符号16位二进制整数，DWORD为无符号32位二进制整数）。,第二部分为位图信息头BITMAPINFOHEADER，也是一个结构，其定义如下：typedefstructtagBITMAPINFOHEADERDWORDbiSize;LONGbiWidth;LONGbiHeight;WORDbiPlanes;WORDbiBitCount;DWORDbiCompression;DWORDbiSizeImage;LONGbiXPelsPerMeter;LONGbiYPelsPerMeter;DWORDbiClrUsed;DWORDbiClrImportant;BITMAPINFOHEADER;,这个结构的长度是固定的，为40个字节（LONG为32位二进制整数）。其中，biCompression的有效值为BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS，这都是一些Windows定义好的常量。由于RLE4和RLE8的压缩格式用的不多，今后仅讨论biCompression的有效值为BI_RGB，即不压缩的情况。,第三部分为调色板(Palette)，当然，这里是对那些需要调色板的位图文件而言的。真彩色图像是不需要调色板的，BITMAPINFOHEADER后直接是位图数据。调色板实际上是一个数组，共有biClrUsed个元素（如果该值为零，则有2的biBitCount次方个元素）。数组中每个元素的类型是一个RGBQUAD结构，占4个字节，其定义如下：typedefstructtagRGBQUADBYTErgbBlue;/该颜色的蓝色分量BYTErgbGreen;/该颜色的绿色分量BYTErgbRed;/该颜色的红色分量BYTErgbReserved;/保留值RGBQUAD;,第四部分就是实际的图像数据。对于用到调色板的位图，图像数据就是该像素颜色在调色板中的索引值，对于真彩色图像，图像数据就是实际的R、G、B值。下面就2色、16色、256色和真彩色位图分别介绍。对于2色位图，用1位就可以表示该像素的颜色（一般0表示黑，1表示白），所以一个字节可以表示8个像素。对于16色位图，用4位可以表示一个像素的颜色，所以一个字节可以表示2个像素。对于256色位图，一个字节刚好可以表示1个像素。,每一行的字节数必须是4的整数倍，如果不是，则需要补齐。这在前面介绍biSizeImage时已经提到过。BMP文件的数据存放是从下到上，从左到右的。也就是说，从文件中最先读到的是图像最下面一行的左边第一个像素，然后是左边第二个像素，接下来是倒数第二行左边第一个像素，左边第二个像素。依次类推，最后得到的是最上面一行的最右边的一个像素。,其他文件格式1.TIF图像文件格式标记图像文件格式TIF(TagImageFileFormat)，它是现存图像文件格式中最复杂的一种，它提供存储各种信息完备的手段，可以存储专门的信息而不违反格式宗旨，是目前流行的图像文件交换标准之一。TIF格式文件的设计考虑了扩展性、方便性和可修改性，因此非常复杂，要求用更多的代码来控制它，结果导致文件读写速度慢，TIF代码也很长。TIF文件由文件头、参数指针表与参数域、参数数据表和图像数据4部分组成。如表2-2表2-4所示。,1）文件头,表2-2TIF文件文件头结构,2）参数指针,表2-3TIF文件参数指针表,由一个2字节的整数和其后的一系列12字节参数域构成，最后以一个长整型数结束。若最后的长整型数为0，表示文件的参数指针表到此为至，否则该长整数为指向下一个参数指针表的偏移。,3）参数块结构,表2-4TIF文件参数块结构,2.GIF图像文件格式CompuServe开发的图形交换文件格式GIF（GraphicsInterchangeFormat），目的是在不同的系统平台上交流和传输图像。它是在Web及其他联机服务上常用的一种文件格式，用于HTML文档中的索引颜色图像，但图像最大不能超过64M，颜色最多为256色。GIF图像文件采取LZW压缩算法，存储效率高，支持多幅图像定序或覆盖，交错多屏幕绘图以及文本覆盖。GIF主要是为数据流而设计的一种传输格式，而不是作为文件的存储格式。换句话说，它具有顺序的组织形式。GIF有五个主要部分以固定顺序出现，所有部分均由一个或多个块(block)组成。每个块第一个字节中存放标识码或特征码标识。这些部分的顺序为：文件标志块、逻辑屏幕描述块、可选的“全局”色彩表块(调色板)、各图像数据块（或专用的块）以及尾块（结束码）。GIF图像文件格式如表2-5所示。,3.PCX文件PCX文件格式由ZSoft公司设计,最早使用的图像文件格式之一，由各种扫描仪扫描得到的图像几乎都能保存成PCX格式。PCX支持256种颜色，不如TARGA或TIF等格式功能强，但结构较简单，存取速度快，压缩比适中，适合于一般软件的使用。PCX格式常用于IBMPC兼容计算机。大多数PC软件支持PCX格式的第5版。第3版文件使用标准的VGA调色板，不支持自定义调色板。PCX格式支持RGB、索引颜色、灰度和位图颜色模式，但不支持alpha通道。PCX支持RLE压缩方法，图像颜色的位数可以是1、4、8或24。,PCX图像文件由三个部分组成：文件头、图像数据和256色调色板。PCX的文件头有128个字节，它包括版本号，被打印或扫描的图像的分辨率(dpi)及大小(单位为像素)，每扫描行的字节数，每像素包含的位数据和彩色平面数。位图数据用行程长度压缩算法记录数据。,4.JPEG图像格式JPEG(JointPhotographersExpertsGroup)格式即联合图像专家组,是由ISO和CCITT为静态图像所建立的第一个国际数字图像压缩标准，主要是为了解决专业摄影师所遇到的图像信息过于庞大的问题。由于JPEG的高压缩比和良好的图像质量，使得它广泛应用于多媒体和网络程序中。JPEG和GIF成为HTML语法选用的图像格式。,JPEG格式支持24位颜色，并保留照片和其他连续色调图像中存在的亮度和色相的显著和细微的变化。JPEG一般基于DCT变换的顺序型模式压缩图像。JPEG通过有选择地减少数据来压缩文件大小，因为它会弃用数据，故JPEG压缩为有损压缩。较高品质设置导致弃用的数据较少，但是JPEG压缩方法会降低图像中细节的清晰度，尤其是包含文字或矢量图形的图像。,2.7图象的特征与噪声,2.7.1图象的特征类别自然特征光谱特征:几何特征:空间分辨率,图象纹理结构,图象变形时相特征:不同时间获取同一区域图象之间的差异,人工特征直方图特征:根据直方图获取灰度与灰度级象素出现的频率的关系灰度边缘特征:反映图象中目标或对象面积以及形状线和角点特征:纹理特征:某种结构在比它更大范围内呈现重复排列,结构称为纹理基元.,重视何种特征依赖于对象及处理目的.按照特征提取的范围点特征:由象素就能决定的性质局部特征:区域特征:整体特征:统计性质和结构特征,2.7.2特征提取与特征空间特征提取:获取图象特征信息的操作,它是模式识别,图象理解等的基础.通过特征提取获得特征图象以及特征参数.,2.7.3图象噪声噪声:妨碍人的视觉器官或系统传感器对所接收的图象信息进行理解或者分析的各种因素.噪声具有随机性,目前只能用概率统计的方法认识噪声的分类:外部噪声:内部噪声:平稳噪声:非平稳噪声:,噪声特征噪声具有随机性,需用随机过程描述.一般用统计特征描述噪声:均值,方差噪声模型加性噪声模型,乘性噪声模型图象系统常见的噪声光电管噪声,摄相管噪声,前置放大器噪声,光学噪声.,

展开阅读全文

图数字图象处理的基本概念.ppt

最新文档