数字图像及其性质

上传人:回**** 文档编号:123565948 上传时间:2022-07-22 格式:DOC 页数:25 大小:1.09MB
返回 下载 相关 举报
数字图像及其性质_第1页
第1页 / 共25页
数字图像及其性质_第2页
第2页 / 共25页
数字图像及其性质_第3页
第3页 / 共25页
点击查看更多>>
资源描述
机器视觉课程之数字图像及其性质2.1基本概念这一章我们要简介某些木书中用到的基本概念和数学工具。缺少完整数学背景的读者也许会遇到某些 困难,在这种状况下,你可以忽视数学细节而关注于基本概念的直观意义,这是文中所强调的并且在本章结束时也概括出来的。这种方式不会影响你对本书的理解。图像和信号常用数学模型来描述,信号是一种依赖于具有某种物理意义的变量的函数,它可以是一维的(例如,依赖于时间 )、二维的(例如,依赖于平面上的两个坐标量)、三维的(例如 ,描述空间中的一种物体) 或高维的。对于单色的图像,一种标量函数也许就足够了,但是对于诸如由三个分量构成的彩色图像,就需 要使用矢量函数。我们要处埋的函数可以分为持续的、离散的或数字的。持续函数具有持续的定义域和值域;如果定义域是离散的,我们得到的是离散函数;而如果值域也是离散的,我们就得到数字函数.2.1.1图像函数图像(image)这一词我们一般在直观上去理解其意义,例如,人类眼睛视网膜上的图像,或者TV摄像机拍摄到的图像。图像可以表达为两个或三个变量的持续函数,在简朴的状况下变量是平曲的坐标(x,y), 但是当图像随时间变化时可以加上第三个变量。图像函数的值相应于图像点的亮度。函数值也可以表达其她物理量如温度、压力分布、离观测者的距离等。亮度(brightness)集成了不同的光学量,将亮度作为一种基本量使我们得以避免对图像的成像过程进行描述,这个过程是非常复杂的。人类眼睛视网膜或者TV摄像传感器上的图像自身是二维的(2D)。我们将这种记录了明亮度信息的 2D图像称为亮度图像(intensity image)。我们周边的真实世界自身是三维的(3D)。2D亮度图像是3D场景的透视投影(perspective projection), 这一过程由针孔摄像机拍摄的图像来体现,参见图2.1。在图中,图像平面被相对于xy平面反折过来了,以避免使用品有负坐标的镜像图像;x,y,z的值是世界坐标系中3D场景点P的坐标,f是镜头的焦距。投影后的点具有2D图像坐标平面中的坐标(x,y),其中:非线性的透视投影常被近似为线性的平行(parallel)投影或正交(orthographic)投影(projection ),其中f。隐含地,尚有的z正交投影是远处物体透视投影的极限状况。当3D物体经透视投影映射到摄像机平面后,由于这样的变换不是一对一的,因而大量的信息消失通过一幅图像来辨认和重构3D场景中的物体是个病态问题。在第9章中,我们将考虑更精细的体现,以便重新获得有关图像所描写的本来3D场景的倍息。可以预料。这不是一件简朴的事情,波及到试图建立图像中点的深度(depth)这个中间体现层次。目的是恢复完整的31体现,例如计算机图形学中的体现,即独立于视点的体现,表达在物体坐标系中而不是在观测者坐标系中,如果这样的体现可以恢复,则物体的任何视角的亮度图像可以用原则的计算机图形学技术合成出来。恢复被透视投影损失的信息只是计算机视觉中的一种问题,这重要是个几何问题,第二个问题是理解图像亮度。一幅亮度图像的唯一可用信息是像索的亮度自身,它取决于一组互相独立的因素,涉及物体表面的反射特性(由表面材料、微构造和斑纹决定)、照明特性、以及相对于观测者和光源的物体表面方向。当试图 从亮度图像恢复物体的3D几何形状时,如何分离这些因素并不容易并且又是一种病态问题。某些科学和技术学科直接在2D)阁像上进行,例如,在透明的照明条件下显微镜观测到的扁平样品的图像,书写在纸上的字符,指纹的图像,等等。因此,数字图像分析中的许多基本的有用的措施并不依赖于物体原本是2D)的或是3D的,本书的很大部分篇幅限定于这些措施的研究一,在第9章和第10章中会专门讨论3D理解问题。图像的形成过程在born 86中有论述,有关的学科涉及光度测定学(photometry)(参见9.3节)和比色学(colorimetry)。前者是有关亮度测量的,而后者是研究依赖于波长的光线的反射和散射的。比色学在 Pratt 78. Pratt 91中是作为图像解决中的领域来考虑的。图像解决一般解决的是静态(statie)图像,时间t作为常量。单色的静态图像是用持续的图像函数f(x,y)来表达的,其中的变量是平面的两个坐标。本书所考虑的图像除非特別声明大多数是指单色的静态图像。 把这取所讲的技术推广到多光谱的状况下常常是显而易见的。计算机化的图像解决使用的数字图像函数一般表达到矩阵的形式,因此其坐标是整数。图像函数的定义域是平面的一种区域R:其中x,y表达最大的图像坐标。图像函数具有有限的域,由于假定图像函数在域R外的值为零,可以使用无限求和或积分的形式。尽管矩阵中使用的(row, column)定位方式在数宇图像解决中也常用到, 但是习惯上采用的图像坐标方向仍然是一般的笛卡儿坐标形式(横轴x 纵轴y)。图像函数的值域也是有限的,按照惯例,在单色图像中最低值相应于黑,而最高值相应于白。在它们之间的亮度值是灰阶(gray level)。数字图像的品质随着空间、频谱、辐射计量、时间辨别率的增长而提高。空间辨别率(spatial resolution) 是由图像平面上图像采样点间的接近限度拟定的?频谱辨别率(spectral resolution)是由传感器获得的光线频率带宽决定的;辖射计量辨别率(radiometric resolution相应于可辨别的灰阶数量;时间辨别率(time resolution)取决于图像获取的时问釆样间隔。时问辨别率问题在动态图像分析中是重要的 , 其处埋的是图像的时间序列。图像f(x,y)可作为拟定的函数或者是随机过程的实现来看待。图像描述中的数学工具根植于线系统理论,积分变换,离散数学以及随机过程理论中。本节只概要地简介某些背面闸述中要波及到的数学工具,背景数学的具体描述可以参照相应问题中所附的文献。如果读者想要学习图像解决中的数学知识,可以从如下的推荐书开始Pavlidis82. Rosenfeld and Kak 82。数学变换假定图像函数f(x.r,)是“好形态的”,意思是指:该函数是可积的,具有可逆的傅立叶变换,等等。特殊信号(常量、冲激、非周期信号)的傅立叶变换的存在问题Papoulis62不在讨论之列,离散图像的傅立叶变换总是存在的。2. 1.2狄拉克(Dirac)分布和卷积抱负的冲激是一种重要的输人信号,它的引人使得在持续图像函数域中吋以使用线性数学现论,图像平面上的抱负冲激是用狄拉克分布(Dirac distribution)即(x,y)定义的。且对于所有的x,y0,有如下的公式(2. 4)被称为狄拉克分布的“筛特性(sift property)”.它提供函数f(x,y)d在点 ,的值:筛公式可以用来描述持续图像函数f(x,y)的采样过程。我们可以将图像函数表达到覆盖整个图像平面的位于点a、b的狄拉克脉冲的线性组合,釆样由图像函数f(x,y)W加权。卷积(convolution)在图像分析的线性措施中是一种重要的运算.二维函数f和h的卷积g记为f x h,通过积分走义为:卷积是一种非常有用的线性、平移不变的运算。数字图像在图像平面上具有有限的域.因此平移不变性只有平移量小时才有效一因而卷积常在局部使用。卷积表达的是用滤波器h做的线性滤波,线性滤波一般用于局部图像预解决和图像复原。2.1.3傅立叶变换图像是平面上两个参数的函数。研究其性质的一种也许途径是将图像分解为一组正交函数的线性组合。傅立叶变换(Fouriertansrorml使用谐波函数来分解Fapoulis62,RosenfeldandKak82。二维的傅立叶变换定义为如下的积分:傅立叶变换的存在条件在Pupoulis 62中有论述,何是对于图像解决日的而言,假定周期函数的傅立叶变换总是存在的且是合理的,傅立叶变换的逆变換定义为:参数(x,y)表达图像坐标,(u,v)称为空间频率(spatial frequencies)。公式(2.8)左端的函数f(x,y)可以解释成-组简朴周期模式的线性组合。该糢式的实部和虚部是正弦和余弦函数,函数P(u,v)代表单位模式影响度的加权函数。用F表达傅立叶变换算子.公式(2. 7)可以缩写为:则从图像解决的角度看,傅立叶变换的如下性质是比较重要的:*线性其中表达复数共轭,一种图像凼数总是实值的,因此我们可以使用傅立叶变换在第一象限的成果。 此外,如果图像还是对称的,f(x,y)f(-r,-y),那么傅立叶变换F(u,v)的成果是一 个实值函数。 *卷积对偶性:卷积公式(2. 6)和其傅立叶变换有如下的关系:这是卷积定理(Convolution thcorem)。这些对于持续函数域的傅立叶变换的性质问样合用于离散函数(图像),只是将各个公式中的积分变为求和。在图像分析中使用傅立叶变换是很普遍的。在第1章我们将看到通过拟定图像函数中的髙频(急剧的变化)部分是如何可以有助于边沿检测的。在如下方面也存应用:将图像从退化中复原过来(参见4.4.2 节),运用卷积定理进行迅速匹配(参见 5.4.1节),边界特性描述(参见6.2.3节),图像压缩(参见第12章), 以及若干其她领域。2.1.4作为随机过程的图像由于随机变化和噪声的因素,图像在本质上是记录性的Papoulis 62, Rowufdd and Kak 82.有时将图像函数作为随机过程的实现来看待有其优越性,这时有关图像的信息量和冗余性的问题可以用概率分布和有关函数来回答如果懂得槪率分布.我们可以用熵(entroy)H来度量图像的信息量。设是符号集合 的概率,所有这样的概率之和是1,熵按下式计算K阶概率分布函数或概率密度函数在实际中一般是不懂得的它体现的是诸多亊件间的复杂关系。2阶概率分布函数成槪率密度函数用于体现事件对间的关系,更简朴的是一阶概率密度函数 在懂得图像是如何获取的条件下常常可以给该函数建一种模型。描述随机过程的更为简朴的特性涉及随机过程的均值,它是用阶概率密度函数定义的:其中H(u,v)是函数h(x,y)的傅立叶变换。公式(2.25)用来描述一种线性图像滤波器h的谱特性。随机过程的一种特殊的类别是各态历通过程(ergodie process)Rosenfeld and kak 82。对于这种平稳过程,从其实现计算的均值等丁根据空间变量计算的均值。当在真实的图像域中常常没有足够的数据来计算时,从其实现计算均值是根据公式2.17)进行计算的。这个计算一般被在图像空间坐标(x,y)域屮计算的均值所取代。请注意,从理论的角度来看,这样的替代仅对各态历通过程而言才是有效的。2.1.5作为线性系统的图像公式(2,28)常用于图像预解决中表达平滑和锐化的解决,将在第4章进一步讨论。事实上实际的图像并不是线性的.图像坐标和图像函数的数值(亮度)都是有限的,结识这一点是很通要的。实际的图像的大小都是有限的,亮度的级别数也是有限的。尽管如此,在诸多状况下图像可以用线性系统来近似。2.2图像数字化2.2.1 采样在实际的图像数字转换器中,釆样间隔比Shannon采样定理公式(2. 37)所拟定的值的1/10还要小。 因素在于将数字化图像函数在显示屏上重构为持续图像的算法仅使用的是阶跃函数Pavlidis 82,即线条是由体现为方块的像素构成的。目前我们用一种256灰阶的图像来阐明稀疏采样的影响。图2. 3a是一幅256X256大小的单色图像, 图2. 3b是同一场景数字化为128X128的减少了辨别率的图像,类似地图2. 3c是64X64的图像,而图2.3d 是32X32的图像。从图2. 3a到图2. 3d图像的质量是明显地减少了。如果我们从某个距离凝神地看的话, 重构质量会得到改善,这阐明欠采样的重构仍然具有实质性的信息。在显示时,大部分的视觉退化是在重构持续函数过程中产生的混迭引起的。在重构算法中对邻近的像素进行亮度插值可以改善显示的效果,称这项技术为反混迭(amtialiasing),常用于计算机图形学中Rogers 85如果使用反混迭技术,采样的间隔可以取到接近Shannon采样定理公式(2. 37)所拟定的值,由于反混迭技术在计算方面的规定,在实际的图像解决设备中几乎没有应用。如果需要得到与一般的电视画而类似的图像质量,应当使用512X512的采样率,这就是为什么多数图像捕获卡使用这个辨别率或更髙辨别率的因素。个持续图像在采样点(sampling point)处被数字化。这些釆样点是在平面上排列的,称它们之间的几何关系为栅格(grid)。因此数字图像是一种数据构造,一般是矩阵。在实践中,栅格一般是方的(参见图4a)或者是正六边形的(参见图2.4b)。把栅格与光栅区别开是十分重要的,光栅(raster)是指在点之间定义了相邻关系的栅格。栅格中一种无限小的采样点对成于数字化图像中的一种像元像索(pixel)。全体像素覆盖了整个图像,实际的数字转换器捕获的像素具只有有限的尺寸,这是由于采样函数不是一组抱负的狄拉克冲激,而是一组有限冲激公式(2. 38),从图像分析的角度看,像素是不能再分割的一种单位。我们也常用一种“点”来一种像素。2. 2. 2量化在图像解决中,釆样的图像数值用一种数字来表达,将图像函数的持续数值(亮度)转变为其数字等价量的过程是置化(quantization)。为了使人可以察觉出图像的细微变化,童化的级别要足够的高。大部分数字图像解决仪器都采用是个等间隔的量化方式。如果用b位来表达像素亮度的数值,那么亮度阶就是一般采用每个像素8位的表达方式,也有某些系统使用6位或4位。二值图像,即或黑或白,可以用1位来表达像素。此外,有些特殊的测童仪器使用12位或更多位来表达一种像素,这种状况越来越普遍了。在置化级别不够时,图像的重要问题是浮现伪轮廓(false contour)。当亮度级别数不不小于人可以容易地辨别出的量级时,就会浮现这种状况。这个数与许多因素有关,例如平均的局部亮度值,一般在显示时需要至少100级才干避免产生这种现象Gonalcz and Wimz 87。这个问题也可以通过非等间隔的量化方略来减轻,具体的措施是对图像中较少浮现的亮度用比较大的量化间隔。我们将在4.1.2节中简介这些灰度级的变换技术。为了有效地表达数字图像的亮度,每个像素一般需要8位、4位或1位,也就是说计算机存储的每个字节分别相应地可以存下1个、2个或8个像索的亮度。图2.3a和图2. 5a到图2. 5d给出了图像中亮度级别数减少时产生的影响。图2. 3a给出的是一种256 亮度级别的原图像。如果亮度级别降到61(图2. 5a),则察觉不到退化,图2. 5b是16个亮度级别的图像. 伪轮廓开始浮现了,在具有4个亮度级别的阁2. 5c和仅有2个亮度级别的图2. 5d中伪轮廓变得更加明显。2.2.3彩色图像色彩在人类视觉感知中是极为重要的,但是在数宇图像解决的历史上并没有得到特殊的使用。这是由于所需硬件成本的因素导致的,但是从20世纪80年代以来,成本已经大幅度地减少了。彩色图像可以很以便地通过TV摄像机或扫描仪获得。随着存储成本的减少,与多光谱数据关联的大矩阵的内部存储问题也减轻了。固然,彩色显示已经是计算机系统的默认配备了。对于许多应用来说.单色阁像也许没有涉及足够 的信息,而色彩或多光谱图像(mialiti spectral image)常常可以弥补这些信息。因此,对我们的目的而言,色彩是有用的信息。色彩是与物体反射不同波长的电磁波的能力有关的,色谱在电磁光谱中大体相应于波长为400mm 700nm的一段。人类感知色彩是基于红、绿、蓝二原色(primary color)的组合,为了原则化它们,分别被定义为波位为700nm、546. lnm和438.5nmPratt 78的波的颜色,然而这并不意味着所有的色彩都可以通过这三原色组合出来。一般硬件都通过RGB横型(model)(红、绿、蓝)产生或显示色彩。因此,一种像素与一种三维的向量 (r、R、b)有关联,分量分别相应于相应色彩的亮度,其中(0,0,0)是黑,是 “纯”红,等等,其中k是每个原色的量化粒度(grarmUrity)(一般是256)。这就代表了一种k种不同颜色的色彩空间(当k= 256时,就是224),并不是所有的显示屏特别是老式的显示屏都支持这样多种颜色。由于这个因素,为了显示的目的,一般需要指定该空间的一种子集合伙为真正使用的色彩空间,我们称之为调色板 (palette)。RGB模塑可当作是3D坐标的色彩空间(参见图2.6),请注意次生颜色(seeondaty color)是两个纯原色的组合。大多数图像传感器根据这一模型提供数据,图像可以通过几种传感器抓取到,每个传感器只对一种相称狭窄的波段敏感,传感器输出端的图像函数就犹如在最简朴的状况下那样(参见第2.2.1节):犹如是单色图像那样,每个频谱段独立地数字化并表达为单个数字图像函数。有时图像以类似的方式产生出来,但是相应子不同光谱波段,例如,LANDSAT 4卫星发回从近紫外线到红外线之间的5个波段的数字图像。其她色彩模型,如果不是直觉性差点的话,同样是重要的。最典型的是CMY,青、品红、黄(Cyan,Ma genta,Yellow)色彩模型,它是基于次生颜色的减色基体系的。例如,白色减去黄色得到蓝色,而白色减去黄色和品红的组合得到蓝色和绿色(以提供红色),这种颜料(Pigment)力法在彩色印刷设备中用于墨水组合(combinging ink),YIQ模型(有时称为IYQ)用于彩色电视广播中,它是KGB表达的一种简朴的线作变换:(其逆矩阵显然也可计算出来)。这种模型是有用的.由于Y分量提供了单色显示所需要的所有信息. 进而.使人类视觉系统的特性得以运用,特别是在我们对亮度(luminance)的敏感性方面,亮度代表了察觉到的光源能量。该模型的细节和使用措施在有关的文献中可以找到Pritchard77,Smith78。另一种与图像解决有关的模型是HIS(有时称为IHS)色调(Hue)、饱和度(Saturation)和亮度(ln- tensity)。色调是指感知到的色彩(技术上,就是重要的波长),例如,“紫色或“橙黄 饱和度度量色彩是指被白光冲淡(dilution)的限度,产生淡紫色”,深紫色”等描述。HSI将亮度信息从位彩中分解出来,而色调和饱和度与人类感知相相应,因而使得该模型在开发图像解决算法中非常有用。在讲到图像增强算法(例如,均衡化算法4. 1)时,它的用途就会变得明显了,如果我们将增强算法用在RGB的每个分量上,那么人对该图像的色彩感知就变坏了,而如果仅对HSI的亮度分量做增强(让色彩信息不受影响),那么效果就会或多或少地与盼望相近。为了将RGB表达(r, g,b)转化为HSI,假设已经对基色测量做了原则化,即这些推导是根据个出名的、特殊的色彩三角形得到的,完整的推导过程请参见and Woods在计算机视觉领域,有关色彩及其应用的个更为全面的简介可参见I.uong犯久2.3数字图像性质数字图像具有某些度量和拓扑性质,与我们在基本微积分中所熟悉的持续两维函数的性质有所不同。 另一种不同点在于人对图像的感知,由于对图像质童的判断也是重要的。2.3.1数字图像的度量和拓扑性质一幅数字图像由有限大小的像素构成,像素反映图像特定位置处的亮度信息。一般(从此后来我们都这样假设)像素按照矩形采样栅格布置,我们用两维矩阵来表达这样的数字图像,矩阵的元素是整数,相应于亮度范畴的量化级別。持续图像所具有的某些明显的直觉特性在数字图像领域中没有直接的类似推广Pavlids 77, Ballard and Brown 82。距离(distance)是一种重要的例子。坐标为(i,j)和(h,k)的两点间的距离可以定义为几种形式,典型几何学和平常经验中的欧氏距离(Euclidean distance)D8定义为:欧氏距离的长处是它在事实上是直观且显然的。缺陷是平方根的计算费时且其数值不是整数。两点间的距离也可以表达为在数字栅格上从起点移动到终点所需的至少的基本步数,如果只容许横向和纵向的移动,就是距离D1、 D4也称为“都市街区(city block)”距离,这是由于:它类似于在具有栅格状街道和封闭房子块的都市里的两个位置的距离。在数字栅格中如果容许沿对角线方向的移动,我们就得到了距离D8,常称之为“棋盘(chessbosrd)”距离。距离D8等于国王在棋盘上从一处移动到另一处所需的步数。任何距离都可以作为斜切(chamfering)的基本,在斜切中产生像素与某个图像子集(多半表达某种特性)的距离,所产生的图像在该子集元素位置处的像素值为0,邻近的像素具有较小的值.而远处的数值就 大,该技术的命名源于这个阵列的外观。斜切在斜面匹配chamfer matching)中有价值,将在第5.4节简介。 如下的两遍算法是基于简化了的欧氏度量导出的Banrow et al.77,原出处是Rosenfeld and Pfalz 68。解决连通性悖论的一种措施是,对物体用4-邻接解决,而对背景用8-邻接解决(或反过来)。有关二值和更多亮度级别的数字图像悖论,在Pavlidis 77, Hom 86中有更为严格的解决及解决措施。这些问题对于方形栅格是很典型的,但是对于六边形栅格(参见图2.4)诸多问题就不存在了。六边形光栅中的任何点与其6个邻接点的距离都相似。六边形光栅也有某些自身的待殊问题,例如,它很难用傅立叶变换来表达。解决连接(conncctivity)问题的另一种措施是使用基于单元复合(cell complex)的离散拓扑Kova- lcvaky89。这种措施得出了一整套有关图像编码与分割的理论,其中波及的许多问题我们在背面会遇到, 例如边界和区域的表达问题。这种思想最早是Riemann在19世纪提出来的,它考虑的是不同维数的集合的族,0维的点可以陚给具有更高维构造(例如像素数组)的集合,这样可以排除我们所见到的悖论。考虑到简朴性和易于解决,尽管存在上述缺欠,多数数字化转换器仍然使用方形栅格。区域的边界(border)是图像分析中的另一种重要概念,区域R的边界是它自身的一种像索集合,其中的每个点具有一种或更多种尺外的邻接点。该定义与我们对边界的直觉理解相相应,即边界是区域的界线上的点的集合。 有时我们称这样定义的边界为内部边界(intter border),以便与外部边界(out border)相区 别。外部边界是指区域的背景(即区域的补案)的边界。边沿(edge)是更深一步的槪念。它是一种像素和其直接邻域的局部性质,它是一种有大小和方向的矢量。边沿计算的对象是具有诸多亮度级别的图像,计算边沿的方式是计算图像函数的梯度。边沿的方向与梯度的方向垂直,梯度方向指向函数增长的方向。我们在第4. 3. 2节将具体讨论边沿内容。请注意“边界”与“边沿”是不同的。边界是与区域有关的全局概念,而边沿表达图像函数的局部性质; 边界与边沿也是关联的,一种寻找边界的措施是连接明显的边沿(在图像函数上具有大梯度的点)。这种措施将在第5. 2节简介。边沿性质从属于一种像素及其邻域,有时评估两个像素对之间的性质也是有益的,裂缝边沿(crack edge)就是这样的一种概念。每个像索有四个裂缝边沿,由其4-邻接关系定义而得。裂缝边沿的方向沿着亮度增大的方向,是90的倍数,其幅值是有关像素对亮度差的绝对值。裂缝边沿参见图2.11,这部分内容将在第5章的图像分割中用到。图像的拓扑性质topological property)对于橡皮面变换(rubber sheet transformation)具有不变性。想像一下在一种小的橡皮球表面上绘制物体的状况,物体的拓扑性质是在橡皮表面任意伸展时都具有不变性的部分。伸展不会变化物体部分的连通性,也不会变化区域中孔的数目。Euler-Poincare特性(characfcHstic) 是图像的一种拓扑性质,定义为区域数与其中的孔数的差值。其她不具有橡皮面不变性的性质将在第 6. 3.1节简介。凸包(convex bull)是用来表述物体拓扑性质的一种概念,凸包是涉及物体的一种最社区域,该区域中任意两点之间的连线都属于本区域,例如,考虑一种形状类似于宇母R的物体(参见图2.12)。想像一种细橡皮带紧绕着物体.橡皮带的形状就反映了物体的凸包,凸包的计算在第6. 3.3节中描述。非规则形状的物体可以用一组它的拓扑分量来表达。凸包中非物体的部分称为凸提(deficit of convexi-ty)。 它可以分解为两个子集,其一是湖(lake)(图 2. 12中有阴影线的部分),完全被物体所包围;其二是海湾 (bay),与物体凸包的边界连通。凸包、湖和海湾有时用来描述物体,这些特性在第6章(物体描述)和第11章(数学形态学)中将会用到。2.3.2直方图图像的亮度直方图(brishtness histogratn)h,(x)给出图像中亮度值z浮现的频率,一幅有L个灰阶的图像的直方图由具有l个元素的一维数组表达。算法2.2 计算亮度直方图11. 数组h的所有元素陚值为0,2- 对于图像f的所有像素,做解决.前面我们曾讲过,图像可以作为随机过程的实现来分析,故可以考虑一阶密度函数它表达像素(x,y)的亮度值是z,如果不考虑像素的位置,我们得到一种密度函数P1(z),亮度直方图就是它的估计。直方图一般用条状图来显示。图2.13给出了图2.3中图像的直方图。直方图一般是有关图像的唯一可得到的全局信息。在寻找最佳的照明条件以便抓取图像、进行灰阶变换以及将图像分割为物体和背景这些场合,都要用到直方图。请注意,同始终方图也许相应几幅图像,例如, 当背景是常数时物体位置的变化不会影响直方图。数字图像的直方图一般均有诸多局部极小值和极大值,这会使进一步的解决变得复杂,这个问题可以通过对直方图进行局部平滑来解决,例如,可以用相邻直方图元素的局部平均来做,因此新的直方图可按下式来计算:其中K记一种常量,代表平滑所使用的邻域的大小。这个算法需要某种边界调节,也不能保证清除所冇的局部极小。尚有某些其她平滑技术,重要的有高斯模糊(GaussUn blurring),在直方图的状况下,它是 2D;高斯模糊公式(4. 52)的简化,将在第4. 3.3节中简介。2.3.3图像的视觉感知我们在设计或使用数字图像解决算法或设备时,应当考虑人的图像感知原理。如果一幅图像要由人来分析的话,信息应当用人容易感知的变量来体现,这些是心理物理参数,涉及对比度、边界、形状、纹理、色彩, 等等。只有当物体可以毫不费力地从背景中辨别出来时,人才干从图像中发现它们。有关人的感知原理的具体论述可以参见Cornsweet 70,Winston 75,Marr 82,Levine 85。人的图像感知产生诸多错觉,理解这些现象对于理解视觉机理有协助。其中比较为人熟知的某些错觉我们在这里将提到,从计算机视觉的角度 Frkby 79详尽地论述这一主题。如果人的视觉系统对复合输入刺激的响应是线性的,即是各自刺激的简朴的和,问题就会相对容易些。某些刺激的衰减,即图像中物体的部分区域,可以通过亮度、对比度、持续时间来补偿。事实上,人的感知敏感度大体上是与输人信号的强度成对数关系的。在这种情況下,通过一种初始的对数变换,复合刺激的响应可以作为线性的看待。对比度(contrast )对比度足亮度的局部变化,定义为物体亮度的平均值与背景亮度的比值。人的眼睛对亮度的敏感性成对数关系,意味着对于同样的感知,髙亮度需要髙的对比度。表观上的亮度很大限度上取决于局部背景的亮度,这种现象被称为条件对比度(conditional contrast)。 图2.14给出了分別处在暗和亮背景中的两个同样亮度的小方块,人对其中的小方块感知到的亮度是不同的。敏锐度(acuity)敏锐度是察觉图像细节的能力。人的眼睛对于图像平面中的亮度的缓慢和迅速变化敏感度差某些,而对于其间的中档变化较为敏感。敏锐度也随着离光轴距离的增长而减少。图像的辨别率受制于人眼的辨别能力,用比观测者所具有的更高的辨别率充体现视觉信息是没故意义的,光学中的辨别率定义为如下的最大视角的倒数:观测者与两个近来的她所可以辨别的点之间的视角。 这两个点再近的话,就会被当作一种点。人对物休的视觉辨别率在物体位于眼睛前250mm处,照明度在500 lux的状况下最佳.这样的照明是由 400mm远的60W灯泡提供的。在这种状况下,可以辨别的两个点之间的距离大概是0.15mm。物体边界(Object border)物体边界具有大量的信息Marr 82,物体和简朴模式的边界,例如斑点或线,能引起适应性影响ad- aptauon effoets),类似于前面讲过的条件对比度。Ebbinghaus错觉是一种人们熟知的例子,图像中心的两个同样直径的圆看起来直径不同(参见图2.15)。色彩(color)由于在正常的照明条件下,人眼对色彩比亮度更敏感,因此色彩对于感知十分重要。色彩的量化和表达在第2.2. 3节已经简介过了,色彩可以表达为红、绿、蓝(RGB)二原色的组合,但是色彩感知用HSI坐标系统来表达更好。色彩感知与其她心理物理量同样也受类似的适应性错觉(dadpration illusion)的影响。2.3.4图像品质在图像的捕获、传播或解决过程中也许使图像退化,图像品质的度量可以用来估计退化的限度。我们对图像品质的规定取决于具体的应用目的。估计图像品质的措施可分为两类:主观的和客观的。主观的措施常用于电视技术中,其中最后评判原则是一组挑选出来的内行和外行观众的感觉。她们根据一张原则清单通过给出估计评分来评价图像,有关 主观措施的具体内容可参见Pratt 78。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 各类标准


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!