数字信号处理中山学院信息工程李飞鹏第10章.ppt

上传人:max****ui 文档编号:11543306 上传时间:2020-04-28 格式:PPT 页数:44 大小:968KB
返回 下载 相关 举报
数字信号处理中山学院信息工程李飞鹏第10章.ppt_第1页
第1页 / 共44页
数字信号处理中山学院信息工程李飞鹏第10章.ppt_第2页
第2页 / 共44页
数字信号处理中山学院信息工程李飞鹏第10章.ppt_第3页
第3页 / 共44页
点击查看更多>>
资源描述
第十章图像特征与理解,10.1图像的几何特征10.2形状特征10.3纹理的基本概念10.4欧拉数与孔洞数10.5图像匹配10.6MATLAB编程实例,图10-1物体位置由质心表示,10.1图像的几何特征,10.1.1位置与方向1.位置,图像中物体并不是一个点,因此,用其面积中心作为位置。面积中心就是单位面积质量恒定的相同形状图形的质心O(见图10-1)。若图像中的物体对应的像素位置坐标为(xi,yj)(i=0,1,n1;j=0,1,m1),则可用下式计算质心位置坐标:,(10-1),2.方向,我们不仅需要知道物体的位置,而且还要知道物体在图像中的方向。如果物体是细长的,则可以把较长方向的轴定义为物体的方向。如图10-2所示,通常,将最小惯量轴定义为物体的方向。也就是说,要找出一条直线,使下式定义的E值最小:,式中,r是点(x,y)到直线的垂直距离。,(10-2),图10-2物体方向可由最小惯量轴定义,10.1.2周长周长即区域的边界长度。一个形状简单的物体用相对较短的周长来包围它所占有的面积。周长在区别简单或复杂形状物体时特别有用。由于表示方法不同,因而计算方法也不同,常用的方法如下:(1)当把像素看作单位面积小方块时,图像中的区域和背景均由小方块组成。区域的周长即为区域和背景交界线的长度和,此时边界用隙码表示。因此,求周长就是计算隙码的长度。,(2)当把像素看作一个个点时,则周长用链码表示,求周长也即计算链码长度。当链码值为奇数时,其长度记作;当链码值为偶数时,其长度记作1。即周长p表示为,(10-3),式中,Ne和No分别是边界链码(8方向)中走偶步与走奇步的数目。,(3)周长用边界所占面积表示,也即边界点数之和,每个点占面积为1的一个小方块。边界的编码方法请参考10.2.6节。以图9-3所示的区域为例,采用上述三种计算周长的方法求得边界的周长分别是:(1)边界用隙码表示时,周长为24;(2)边界用链码表示时,周长为10+5;(3)边界用面积表示时,周长为15。,图10-3周长计算实例,10.1.3面积面积只与物体的边界有关,而与其内部灰度级的变化无关。1.像素计数面积最简单的面积计算方法是统计边界内部(也包括边界上)的像素的数目。计算公式如下:,对二值图像,若1示物体,0表示背景,则其面积就是统计f(x,y)=1的个数。,2.由边界行程码或链码计算面积由各种封闭边界区域的描述来计算面积也很方便,可分如下情况:(1)已知区域的行程编码,只需把值为1的行程长度相加,即为区域面积;(2)若给定封闭边界的某种表示,则相应连通区域的面积应为区域外边界包围的面积与内边界包围的面积之差。,3.用边界坐标计算面积Green(格林)定理表明,在x-y平面中的一个封闭曲线包围的面积由其轮廓积分给定,即,(10-8),积分沿着闭合曲线进行。将其离散化,变为,(10-9),Nb为边界点的数目,(xi,yi)为边界点座标。,10.1.4长轴和短轴物体的边界已知时,可用其外接矩形来刻画它的基本形状,如图10-4(a)所示。求物体的外接矩形,只需计算边界点的最大和最小坐标值,就可得到其水平和垂直跨度。对任意朝向的物体,需要先确定主轴,然后计算主轴方向上的长度和与之垂直方向上的宽度,这样的外接矩形是物体的最小外接矩形(MinimumEnclosingRectangle,MER)。,计算MER的一种方法是,将物体的边界以每次3左右的增量在90范围内旋转。每旋转一次记录一次其坐标系方向上的外接矩形边界点的最大和最小值。旋转到某一个角度后,外接矩形面积达到最小。取面积最小的外接矩形的参数为主轴意义下的长度和宽度,如图10-4(b)所示。,图10-4MER法求物体的长轴和短轴(a)坐标系中的外接矩形;(b)旋转使外接矩形最小,10.1.5距离图像中两点P(x,y)和Q(u,v)之间的距离是重要的几何性质,常用如下三种方法测量:(1)欧几里德距离:,(10-10),(2)市区距离:,(10-11),(3)棋盘距离:,(10-12),显然,以P为起点的市区距离小于等于t(t=1,2,)的点形成以P为中心的菱形。图10-5(a)为t2时的情形。可见,d4(P,Q)是从P到Q最短的4路径的长度。同样,以P为起点的棋盘距离小于等于t(t=1,2,)的点形成以P为中心的正方形。图10-5(b)为t2时的情形。同样,d8(P,Q)是从P到Q最短的8路径的长度。,图10-5两种距离表示法(a)d4(P,Q)2;(b)d8(P,Q)2,d4、d8因计算简便而常用,而欧氏距离较少被采用。,10.2形状特征,10.2.1矩形度矩形度反映物体对其外接矩形的充满程度,用物体面积与其最小外接矩形的面积之比来描述,即,(9-13),式中,AO是物体面积,而AMER是MER面积。R值在0-1之间,当物体为矩形时,R取得最大值1.0。,另一个形状特征是长宽比:,r为MER宽与长的比值。利用r可以将细长的物体与圆形或方形的物体区分开来。,10.2.2圆形度,1.致密度Co度量圆形度最常用的是致密度,即周长(P)的平方与面积(A)的比:,(10-15),2.其它常用的圆形度指标还有:边界能量E-目标趋向圆形时,E趋向最小值;圆形性C-目标趋向圆形时,C趋向无穷大。,10.2.3球状性球状性(Sphericity)S既可以描述二维目标也可以描述三维目标,其定义为,(9-22),在二维情况下,ri代表区域内切圆(Inscribedcircle)的半径,而rc代表外接圆(Circumscribedcircle)的半径,圆心在区域重心上,如图9-7所示。当区域为圆形时,球状性的值S达到最大值1.0,而当区域为其他形状时,则有S1.0。,图9-7球状性定义示意图,10.2.4图像边界的链码表示,链码是边界的表示方法,它用一系列特定长度和方向的相连的直线段来表示目标的边界。因为线段的长度固定,所以只有边界的起点需要用绝对坐标表示,其余点都可用接续方向来代表偏移量。表示方向数比表示坐标值所需比特数少,因此链码可大大减少边界表示的数据量。数字图像一般按固定间距采集,因此最简单的链码是跟踪边界并赋给每两个相邻像素的连线一个方向值。常用的有4方向和8方向链码,如图10-9(a)、(b)所示。,图10-9码值与方向对应关系(a)4方向链码;(b)8方向链码;(c)边界编码图形,对图10-9(c)所示边界,设起始点O的坐标为(5,5),则可分别用以下4方向和8方向链码表示区域的边界:4方向链码:(5,5)11123232300;8方向链码:(5,5)222455600。使用链码时,起始点的选择很关键。对同一个边界,如用不同的边界点作为起始点,得到的链码是不同的。,10.3纹理的基本概念,有时,物体在纹理上与其周围背景和其他物体有区别,这时,图像分割必须以纹理为基础。纹理是图像分析中常用的概念,纹理(Tuxture)一词最初指纤维物的外观,一般来说,可以认为纹理是由许多相互接近的、互相编织的元素构成,它们富有周期性。在图像分析中可将纹理定义为“一种反映一个区域中像素灰度级的空间分布的属性”。,人工纹理是某种符号的有序排列,这些符号可以是线条、点、字母等,是有规则的。自然纹理是具有重复排列现象的自然景象,如砖墙、森林、草地等照片,往往是无规则的。认识纹理的方法有两种:一是凭直观印象,一是凭图像自身的结构。基于结构的观点导致了用数学来描述和度量纹理,常见的有统计法、自相关函数法、频谱法、联合概率矩阵法等。这里不再仔细讨论。详细请参阅相关文献。,图10-12人工纹理与自然纹理(a)人工纹理;(b)自然纹理,(a),(b),10.4欧拉数与孔洞数拓扑学(Topology)研究图形的性质。区域的拓扑性质不依赖于距离及其测量特性。如图10-19所示,考察区域中的孔洞数H,它不受伸长、旋转的影响,但如果撕裂或折叠时H会发生变化。区域内的连接部分的个数C是区域的另一拓扑特性。一个集合的连接部分是它的最大子集,在这个子集的任何地方都可以用一条完全在子集中的曲线相连接。图10-20里有三个连接部分。,图10-19图像中的孔洞,图10-20有三个连接部分的区域,欧拉数(Eulernumber)E定义如下:EC-H(10-53)欧拉数也是区域的拓扑特性之一。图(a)中有1个连接和1个孔洞,所以其欧拉数为0;图(b)中有1个连接和2个孔洞,其欧拉数为1。,图10-21具有欧拉数为0和-1的图形,10.5图像匹配,10.5.1模板匹配模板匹配是指用一个较小的图像(模板)与源图像进行比较,以确定在源图像中是否存在与模板相同或相似的区域。常用的匹配测度为模板与原图像对应区域(子图)的误差平方和。设f(x,y)为MN的原图像,t(j,k)为JK(JM,KN)的模板图像,则误差平方和测度定义为:,(10-55),将式(10-55)展开可得,第一项是原图中与模板对应区域的子图的能量,,第三项为模板的能量,它们都与匹配的性质和结果无关;第二项是子图与模板的互相关,它随像素位置的变化而变化,当模板和子图相匹配时,该项取得极大值。将其归一化,可得到模板匹配的相关函数:,当模板与子图完全一样时,相关函数(i,j)=1。,基于上述,模板匹配的搜索过程就变成了随座标位置(x,y)的变动寻找的最大值的过程。图10-22给出了模板匹配的示意图。对任何一个(x,y),都可以算出一个R(x,y)值。当x和y变化时,t(j,k)在原图像区域中移动并得出R(x,y)的所有值。R(x,y)取最大值时给出了匹配的最佳位置,从该位置开始在原图像中取出与模板大小相同的一个子图,便可得到最佳匹配图像。,图10-22模板匹配示意图,用归一化互相关求匹配的计算工作量非常大,如果做全搜索,除最佳匹配点外,其余做的都是无效运算,所以有必要对其进行改进,以提高运算速度。模板匹配的主要局限性在于它只能进行平行移动,如果原图像中要匹配的目标发生旋转、大小变化或只有部分可见,该算法无效。,图5-16模板匹配示例(a)原图像与匹配结果;(b)模板图像,(a),(b),10.6MATLAB编程实例,一.二值图像面积的求取-函数bwareatotal=bwarea(BW);%二值图像BW的面积为total例:计算二值图像(eagle1.tif)膨胀之后图像面积的改变。BW1=imread(d:testpictureseagle1.tif);%读入图像SE=ones(5);%定义结构元素BW2=imdilate(BW1,SE);%进行膨胀运算subplot(1,2,1),imshow(BW1);%显示原图subplot(1,2,2),imshow(BW2);%显示膨胀后图像increase=(bwarea(BW2)-bwarea(BW1)/bwarea(BW1);disp(increase);%计算和显示面积的改变,二.二值图像边界的识别-函数bwperimBW2=bwperim(BW1);%BW2为BW1的边界例:用形态学方法识别图像的边界.BW1=imread(d:testpictureseagle2.tif);BW2=bwperim(BW1);%进行边界识别subplot(1,2,1),imshow(BW1);%显示原图subplot(1,2,2),imshow(BW2);%显示识别结果,计算二值图像的欧拉数eul=bweuler(BW1,8);%eul为BW1的欧拉数例:BW1=imread(circbw.tif);eul=bweuler(BW1,8);disp(eul);eul=-85欧拉数为负表示孔洞的数目多于连接的数目。,实验三预备知识,实验相关的函数dctmtx(n)-产生nxn的DCT变换核.例:T=dctmtx(8);%T为8x8的DCT变换核矩阵;2.blkproc(I,mn,P1*x*P2,T1,T2);-对图像I进行块大小为mn的分块运算处理,x表示当前块,P1*x*P2表示运算规则为:将当前块x左乘矩阵P1右乘矩阵P2,P1和P2是形参,实参为T1和T2.例1:T=dctmtx(16);B=blkproc(A,1616,P1*x*P2,T,T);例2:T=ones(8);B=blkproc(A,88,P1*x,T);,实验参考程序:I=imread(lena_gray.bmp);I=im2double(I);T=dctmtx(8);%定义8x8的dct变换矩阵B=blkproc(I,88,P1*x*P2,T,T);%进行(分块)dct变换mask=11110000111000001100000010000000000000000000000000000000%定义变换系数掩模,00000000;%它决定了压缩比B2=blkproc(B,88,P1.*x,mask);%只保留前10个系数I2=blkproc(B2,88,P1*x*P2,T,T);%分块dct逆变换imshow(I),figure,imshow(I2);%显示压缩前后图像,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!