508.中分辨率遥感影像中线状地物提取方法研究开题报告毕业论文

资源描述

开题报告论文题目:中分辨率遥感影像中线状地物提取方法研究【开题报告+毕业论文】学生姓名: 学号: 专业: 遥感科学与技术指导教师: 1 立项依据1.1社会需求 1858年世界上第一张航空相片获得后，出现的航片判读技术是现代遥感技术的雏形。1956年世界上第一颗人造地球卫星发射成功，为遥感技术的发展创造了新的条件。“遥感”一词最早是由美国人Evelvn（1962）在“环境遥感”专题讨论会上提出并被正式采用的。自1972年美国第一颗地球资源技术卫星（ERTS-1）成功发射并获取了大量地球表面卫星影像后，遥感技术便开始在世界范围内迅速发展和广泛应用。遥感技术是一门新兴综合性科学技术，是在不直接接触的情况下，对目标物体或自然现象远距离感知的一门探测技术。它集中了空间、电子、光学、计算机、生物学和地学等科学的最新成就，是现代高新技术领域的重要组成部分。由于其能够动态，快速，准确，多手段提供多种对地观测资料，从而得到了迅猛的发展；也正是由于它的客观性和实用性，使它在国民经济和国防建设中承担了越来越重要的角色。遥感技术的出现，揭开了人类从外层空间观测地球的序幕，为人类认识国土、开发资源、监测环境、研究灾害、分析全球环境变化等提供了新的途径。遥感作为获取自然资源、生态环境和人类活动等时、空数据的重要来源和技术手段，人们对从遥感数据中抽取各种相关专题信息的需求和兴趣日益提高。近年来, 遥感成像精度的日益提高以及高分辨率影像的日渐商业化, 为利用高分辨率影像提取目标信息提供了基础和条件，从而为GIS数据的更新、GIS的应用提供了有利的条件。但如何自动或半自动处理、解译海量的遥感影像数据是整个社会信息化过程中面临的最重要的问题之一。其中，从遥感影像中提取地物目标则成为重中之重。对遥感影像的特征提取一般分为三种，一是面状特征的提取；二是线状特征的提取；三是点状特征的提取。对于线状地物，一方面它本身就是重要地物（如道路，水系），一方面它是其他面状地物的边缘，所以在当代的对遥感影像的特征提取方法的研究中占有及其重要的地位。本课题研究的主要内容就是利用多种线状地物提取算子实现对遥感影像中不同种类的线状地物的提取。1.2研究现状对线状特征提取的研究一刻也没有停止过。当代的数字摄影测量系统大多数都可以通过自动或半自动的模型定向和影象匹配生成数字高程模型，并已经在国内外的生产单位获得了广泛的应用。道路网和水系等线状地物(特别是道路)是非常重要的地理基础信息，而目前对它们的自动识别仍然很难。以道路网的自动提取为例，从20世纪70年代至今，已作了大量的研究，并在特定的情况下取得了一些进展，如在中小比例尺的航空影像上，道路不密集的农村地区可以确认大部分的道路网，但仍有相当部分的错误。而且相对于人工引导，先自动识别然后再纠错的工作量在现阶段要大很多，在可预见的将来，达到足以代替人工测图自动化程度的实用化系统仍然难以出现。鉴于此和实际应用的考虑，在目前的条件下，由人工干预或人工引导的半自动提取，将人的模式识别能力和计算机快速、精确的计算能力有机地结合起来，能较大地提高效率和减轻劳动强度。是现阶段研究的主要方式。 2研究内容、研究目标,以及拟解决的关键问题2.1 研究内容深入了解数字图像处理中四种典型算子(Sobel算子,Prewitt算子,Laplacian算子,Canny算子)的特点。研究和掌握几种典型线状地物的特点并研究提取各种线状地物所对应的最佳算子。根据以上研究结果在Microsoft Visual C+ 6.0环境下编制一个图像处理平台并用四种典型算子采用人机交互方式提取图像上相对应的线状地物。2.2研究目标在Microsoft Visual C+ 6.0环境下编程实现。由用户选择线状地物类别，程序自动确定一个合适的算子。用户通过用鼠标拖拉矩形窗口选择提取区域，在人机交互的模式下完成对中分辨率遥感影像线状地物的提取。2.3关键问题由于是用户通过选择线状地物类别来进行人机交互，故程序自动确定合适的线状地物提取算子是整个程序成败的关键。通过利用四种典型的线状地物提取算子实验不同种的线状地物并横向比较提取结果图，是解决这个问题的最佳方法。3. 拟采取的研究方案特征提取边缘检测算子的基本思想是图像的边缘是图像中象素灰度有阶越变化或屋顶状变化的那些象素的集合。而对于阶跃状边缘点P，灰度变化曲线的一阶导数在P点达到极值，二阶导数在P近旁呈零交叉。对于屋顶状边缘点Q，灰度变化曲线的一阶导数在Q点近旁呈零交叉，二阶导数在Q点达到极值。利用边缘灰度变化的一阶或二阶导数特点，可以将边缘点检测出来。在此课题的研究中，我们将由用户来选择地物种类并由程序自动匹配算子。对于用户选择的地物种类，程序匹配的算子如何对于提取结果有重要的影响。基于此通过利用四种典型的线状地物提取算子分别对不同种类的线状地物进行提取，然后对同一种类线状地物的四种不同算子提取结果图进行横向对比，多次反复实验得出每种线状地物所对应的最佳算子。并通过实验结果在Microsoft Visual C+ 6.0环境下编制图像处理平台以处理线状地物提取工作。4.研究阶段与进度1-3 周：理论准备。阅读、消化、吸收相关理论和编程方法、技巧。4-6周：编程、实验。按照毕业设计指标要求，完成程序的编写调试，并进行实验，取得不少于指标所要求的成果。7-10周: 撰写论文，做答辩的准备。5. 参考资料1 贾永红.数字图像处理.武汉:武汉大学出版社,20032 孙家抦.遥感原理与应用.武汉:武汉大学出版社,20033 孙家广.计算机图形学.北京:清华大学出版社,20004 胡翔云,张祖勋,张剑清. 航空影像上线状地物的半自动提取. 中国图像图形学报,2002(2)5 赵俊娟,尹京苑,单新建. 基于形状特征的高分辨率遥感影像目标分割. 测绘通报,2005(1)6 何智勇,章孝灿,黄智才,蒋亨显. 一种高分辨率遥感影像水体提取技术. 浙江大学学报(理学版),2004(11)7 熊盛青.国土资源遥感技术应用现状与发展趋势. 国土资源遥感,2002(3)8王宏志,朱俊林.我国利用遥感数据提取土地利用现状信息的技术进展. 国土资源遥感, 2000(9)目录摘要第一章绪论11.1 研究背景和意义11.2 本文的研究目标和方法7第二章数字图像处理图像分割概述92.1 综述92.2 基于阈值的图像分割方法92.3 边缘检测112.4 纹理分割12第三章线状地物特征提取方法133.1 Sobel算子133.2 Prewitt算子143.3 Laplacian算子153.4 Canny算子17第四章实验194.1 实验流程194.2 实验平台实现代码28第五章结论与展望29参考文献30致谢31附录 32摘要从航空影像半自动提取道路等线状地物是日前实用化的数字摄影测量系统要达到更高的自动化程度所必然遇到的问题之一，而要使提取的效果更好，边缘提取算子的优劣起着决定性作用。本文从图像分割边缘检测的原理入手，通过对Sobel、Prewitt、Laplacian、Canny四种典型边缘提取算子对线状地物进行提取的效果。详细介绍了四种算法的原理，指出了四种算子各自的优缺点并通过实验结果进行分析得出了四种算子对于线状地物提取的适用范围。关键词：遥感影像：线状地物：边缘检测：半自动提取Abstract In this paper, the author has made a detail analysis on several existing methods of the edge detection (Sobel、Prewitt、Laplacian、Canny) for semi-automatic road and linear structure extraction by using some multi-spectral remote sensing images acquired from different spatial resolutions ,districts ,and road characteristics. Their advantages and disadvantages have been generalized in order for us to make use of these methods for various applicable purposes. Finally, the author recommended some research issues for future study.Keywords: remote sensing image: linear object and structure: edge detection: semi-autometic extraction第一章绪论从影像（图像）获取信息是人类获得知识的主要来源之一，进入信息时代，如何自动处理、解译海量的图像数据是在整个社会信息化过程中面临的重要问题。目前在地面影像的获取方面，实时、全天候、大面积获得地球表面的高分辨率、高精度、多时相、多光谱的数字影像成为可能，而与之相对应的理论和算法也在不断的更新和增强，作为获得地面几何与物理信息的主要信息源，航空遥感影像解译或者说信息的自动或半自动提取是摄影测量与遥感以及计算机图形学等领域的热门课题，有着十分重要的理论和现实意义。1.1 研究背景和意义1.1.1摄影测量与遥感的发展摄影测量与遥感通俗的说就是利用摄影技术摄取（主要是航空摄影也可以是地面摄影）物体的影像，从而识别此物体并测求其形状和位置。从摄影在1839年被发明，摄影测量(早期叫“图像量测学”Icoaometry)有一二百年的历史了。在航空技术发达以后，称为航空摄影测量学。随着空间技术的发展，进而出现了航天摄影测量学。这是从摄影平台的发展所说的。按照技术处理手段划分，今天众所周知的摄影测量发展的三个阶段就是模拟、解析和数字摄影测量。模拟法摄影测量是指用光学或机械方法模拟摄影过程，使两个投影器恢复摄影时的位置、姿态和相互关系，形成一个比例缩小了的几何模型，即所谓摄影过程的几何反转，在此模型上的量测相当干对原物体的量测。所得到的结果通过机械或齿轮传动方式直接在绘图桌上绘出各种图件来，如地形图或各种专题图，它主要研究摄影测量的基本原理（如摄影过程的几何反转、恢复光束和变换光束的原理、影像变形的规律等），各种模拟仪器，如测图仪、纠正仪等的结构、操作方法与过程等。随着电子计算机的问世，人们自然会想到用它来完成摄影测量中复杂的几何解算和大量的数值计算。1957年，Helava博士提出了利用计算机进行解析测图的思想。到70年代中期，解析测图仪进入了商用阶段.各个阶段的代表产品有:德国Zisa，最早的Planicomp C-100,以及C100, C110. C120, C130系列，瑞士Wild和Korn厂的AC1, BCI, AC2. BC2以及DSRI, DSRII等。解析测图仪是世界上实现将测量成果数字化的仪器.在机助测图软件的控制下，将在立体模型上测得的结果首先存储在计算机中，然后再传输到数控绘图机上绘出图件。这种以数字形式存储在计算机中地图，构成了测绘数据库和建立各种地理信息系统的基础。解析摄影测量侧重于研究摄影测量的严密解算方法和理论，应用平差和粗差检测的理论和算法提高结果的精度和可靠性，各种解析仪器(包括正射投影仪)的理论与方法。数字摄影测量可视为解析摄影测量的继续和扩展.在解析摄影测量中所研究的严密解算理论均被继承，它的研究重点是怎样将计算机学科中的模式识别理论用于摄影测量，实现自动或半自动的识别，最终达到摄影测量的自动化。数字摄影测量将数字化的影像或数字影像作为处理对象，以计算机对影像框标和同名点的识别来代替人眼的观测从而自动获取地面的三维信息。相对模拟和解析摄影测量，它不论从获取信息的手段、能力、效率还是灵活性都是一个革命性的飞跃。表1.1.1列出了摄影测量三个阶段的特点。表1-1 摄影测量三个阶段的特点发展阶段原始资料投影方式仪器操作方式产品模拟摄影测量相片物理投影模拟测图仪作业员手工模拟产品解析摄影测量相片物理投影解析测图仪机助作业员操作模拟产品数字产品数字摄影测量相片数字化影像或数字影像数字投影计算机自动化操作作业员干预模拟产品数字产品进入上世纪九十年代以来，商用的数字摄影测量工作站(Digital Photogrammetric Work station-DPW)开始进入市场和生产单位.最近德国摄影测量学者C.Heipke将目前市场上的DPW按照功能、自动化程度和价格粗略地分为四类: (1)能完成所有传统的摄影测量任务;除了地面控制点的辨识和量测以及矢量数据的获取以外，所有的工作都高度自动化；系统提供立体观视测；有的提供多CPU支持。供应商有Autometric, LH Systems, Z/I Imaging,Erdas,Inpho, Supresoft(以中国武汉测绘科技大学研制的VirtuoZ。为基础成立的公司)等。(2)自动化程度低一些的。如DVP Geornatics, ISM, KLT Associates, R-Well等公司的产品。(3)主要用来生成正射影像的遥感系统，如ER Mapper, Matra,MircoImages, PCI Geomatics等的产品。(4)用于矢量数据获取的系统，如瑞士联邦工学院ETH开发的CyberCityModeler, DEFiNiENS的eCognition Inpho的infect系统等。以第1类的几个自动化程度较高的系统为例，表1.1.2列出了它们的主要功能。表1-2 主流摄影测量工作站的主要功能厂商AutometricLH systemsErdasImphoSupersoftZ/I imaging产品SoftPloterNTSOCETStereo AnalystImpho GrammetryVirtuoZoZ/I imaging自动内定向相对定向YesYesYesYesYesYes自动影像匹配YesYesNoYesYesYes自动空三YesYesNoYesYesYes自动相差检测NoYesNoYesYesYes自动等高线生成半自动YesYesYesYesYes制图工具YesYesYesYesYesYes半自动线划提取NoYesYesYesYesYes半自动角点提取YesYesYesYes简单房屋提取YesDPW目前在自动匹配生成数字地面模型（DTM）等方面日趋成熟，但在自动获取制图所需的矢量数据(主要是道路、河流等线状地物和建筑物等)方面。虽然以基于模型的目标提取研究取得了一些进展，大部分工作仍由手工完成或有了一些半自动功能，而这些往往占到整个工作量的一大半甚至80%以上(例如城市地区的测图)。要真正从影像上自动识别并精确量测地物是数字摄影测量界的热门问题也是难点，是最终高度自动化地图影像获取基础地理信息的关键问题。国外有很多专门研究的项目和机构从事人工地物自动提取的研究，如美国的Radius项目和Mckeown实验室、南加州大学Nevatia领导的研究组、DARPA的AP-GD项目、瑞士的Amobe项目和ETH,德国的波恩大学、奥地利的格拉茨技术大学、法国的国家地理院（IGN）等.由瑞士的ETH发起，在1995, 1997和2001年连续召开了三届人工地物自动提取方面的专门研讨会，并出版了论文集。在遥感方面，随着航天遥感技术的飞速发展，由航天飞机和各种大、中、小卫星系统提供的空间遥感图像大量增加，它们的空间分别率、光谱分辨率和时间分辨率不断提高，与航空摄影测量和地面测量等地图生产的传统手段一起，为从影像获取建设数字地球空间数据框架的基础信息准备了丰富的数据源，影像信息成为了空间信息的主要载体。表1.1.3是九十年代以来高空间分辨率遥感卫星的发射进度一览。表1-3 遥感卫星发射进度发射时间传感器，遥感计划组织，国家空间分辨率(m)光谱模式Huben相机,KubenRSA，前苏联3-4.53-10Pan, MS(4波段)PAN,IRS1ISPO,印度5.8PanAVNIR,ADEOSNASDA，日本8 16Pan, MS(4波段)His,LewisNASA,美国5 30Pan, MS(2波段)PAN/MS EarlybirdEarthwatch,美国3 15Pan, MS(3波段)EROS,EROSIA1&CSTI,以色列1Pan, MS(4波段)Orbview3, Orbview3Orbimage,美国1 2 4Pan, MS(4波段)PAN/MS,QickbirdEarthwatch,美国0.8 3.3Pan, MS(2,4波段)HR PAN,IRS-P6ISPO,印度2.5 PanAVNIR2,ALOSNASDA，日本2.5 10Pan, MS(4波段)从Landsat, Spot, MOMS 02P, KVR 1000, Spot5、到IKNOIS，像元尺寸从30米、10米、6米到3米、2米、1米，测制数字正射影像图(DOM)和线划图(DLG)的能力从1:100000到1:5000:空间对地观测传感器、卫星系统的发展将为获取地球表面信息提供更多的数据源。合成孔径侧视雷达的发展主要体现在时间分辨率的提高上，而激光断面扫描仪Laser Scaner)可以直接测定地面高程，建立DTM:雷达干涉测量(SAR Interferometry)和差分干涉测量技术(D-InSAR)也可用来测定地面的三维坐标。但是，据联合国测量署的统计，全球1: 5万和1: 2.5万的地图更新的周期分别是50年和20年，这种更新速度显然无法适应现代社会飞速发展的孺要.大量的堆积如山的航空遥感影像及相关的数据与数据处理手段，主要是从影像中自动提取我们所需要的信息的能力之间，存在巨大的反差。另一方面，美国副总统戈尔在1998年1月所做的“数字地球对21世纪人类星球的理解”报告中提出了数字地球的概念，简而言之数字地球就是将地球上的一切(包括人类的活动)数字化，在国内外引起了重大的反响。数字地球作为信息高速公路和国家空间数据基础设施(NSDI)计划的自然延伸，必须在空间基础设施充分发展的前提下实现，是数字地球的核心和基础，是建设数字地球不可逾越的重要阶段。以省级空间数据框架(Spatial Data Infrastruchue-SDI)的建设为例，SDI应当包含以下主要内容: (1)数字正射影像(DOM)。这是最重要的基础空间信息，1: 10000的地形信息的采集无疑需要采用航测的方式。将来还有可能用到遥感:我国各省测绘局目前进行的1: 10000的DOM和DEM生产是SDI建设的最重要的组成部分，而且几乎全部都便用了数字摄影测量工作站。(2)数字高程模型(DEM)。它是生产数字正射影像过程中的副产品，因为要得到DOM必须先有DEM。(3)行政界限。(4)道路和水系。(5)大地控制点成果数据和地名数据库。戈尔在谈到为建立“数字地球”所需要的技术时，特别提及了卫星图像以及lm分辨率的遥感图像，同时特别强调了图像自动解译与多源数据融合。地物提取自动化研究的进展和半自动化提取功能逐步引入到DPW中将大大提高从影像获取矢量数据的效率，从而为高效建立SDI提供有力的技术支撑。1.1.2 计算机视觉与图像理解领域的难题从Marr等人在1979年综合图像处理、心理物理学、神经生理学等的研究成果构建了第一个计算机视觉(Computer Vision-CV)的“视觉计算理论”框架以来，计算机视觉逐渐成为人工智能的一个重要的、活跃的研究领域。东京大学的Hirochka moue在1993年IJCAI大会的特邀报告:“基于视觉的机器人行为现实世界人工智能研究的工具和实验平台”中指出:计算机视觉不仅对机器人，而且在更广泛的意义上对人工智能也起着关键的作用，人工智能不应失去对计算机视觉和机器人研究进展的重视。Haraliclc和Shapiro将计算机视觉、图像理解(Image Understanding-IU)或场景分析(Scene Analysis)定义为:针对单一或多波段传感器获取的一幅影像、多幅或序列影像进行计算机分析的影像处理、模式识别和人工智能等技术的组合，这种分析的目的是为了对三维环境中感兴趣的目标进行识别、定位和定向，并给出这些目标的符号描述。图1.1.1计算机同人在判读航空影像的视觉感知能力方面的差异图1.1.1形象地表示了计算机同人在判读航空影像的视觉感知能力方面的差异。人类的视觉感知系统以一种目前并不清楚的信息触合机制从输入的视觉信号获得场景的解译。大脑的信息处理系统对视觉信号是以神经网络的大规模分布式的计算来完成的，这其中神经系统的并行与串行处理相结合、自组织与自适应、对信息的选择机制、整体与全局的切换、先验知识的融合等等功能，都是本质上只是对数据进行离散的串行符号处理，数据带宽有限的数字计算机所难以模拟的。一是缺乏理论基础，二是技术上难以实现。对航空影像的自动解译，如前文所述，数字摄影测量在自动提取地表的高程等几何信息方面取得了较大的进展，但对于地物属性信息，即所谓的“语义信息”的自动提取还是目前的瓶颈问题。航空影像中目标的多样性和复杂性是其主要原因之一。航空影像的复杂程度由影像中目标的复杂度、光照条件、大气透明度、传感器的性能与分辨率等决定，而且影像本身又有着不同程度的崎交，这些都是解决航空遥感影像理解中面临的问题。航空遥感影像中存储着极为丰富的信息，影像特征结构复杂，既包括地形、植被、水文这样的自然特征，又包含房屋和道路这样的人工地物。此外，这些特征之间的关系也是相当复杂，不论是几何关系还是语义(Semantic)关系，都不是用简单的方法所能描述的。对人工地物自动提取和三维重建几乎涉及到计算机视觉与图像理解各个方面。图1.1,2表示了航空影像理解的一些问题。Arcot和Trinder曾经就它所涉及的建模和表达问题(Modeling and Representation)，包括知识表达、解译的控制策略、特征属性描述等方面做过归纳; Frank对其涉及的感知编组(Perceptual Grouping)、知识的表达和建模、不确定性处理以及解译的界面等方面做过详细的阐述。图1.1.2 航空影像理解的问题1.2 本文的研究目标和方法1.2.1 研究目标由上文所述，从各方面条件来说，由于问题的高度复杂性，无法在短时间内研究特征地物的全自动提取，要建立相应的影像理解系统也超出了本人的能力。本文的指导思想是：针对具体问题，分析当前研究趋势，紧密联系目前的迫切需要，争取在具体的应用上获得实质性的进展。本文的研究目标是：（1）从当前提高数字摄影测量工作站获取地物矢量数据的效率的迫切要求出发，争取在人机协同对线状地物(道路，水系，管线等)的提取方面取得有理论与实用价值的研究成果。（2）深入了解数字图像处理中四种典型算子(Sobel算子,Prewitt算子,Laplacian算子,Canny算子)的特点。研究和掌握几种典型线状地物的特点并研究提取各种线状地物所对应的最佳算子。根据以上研究结果在Microsoft Visual C+ 6.0环境下编制一个图像处理平台并用四种典型算子采用人机交互方式提取图像上相对应的线状地物。 1.2.2 研究方法特征提取边缘检测算子的基本思想是图像的边缘是图像中象素灰度有阶跃变化或屋顶状变化的那些象素的集合。而对于阶跃状边缘点P，灰度变化曲线的一阶导数在P点达到极值，二阶导数在P近旁呈零交叉。对于屋顶状边缘点Q，灰度变化曲线的一阶导数在Q点近旁呈零交叉，二阶导数在Q点达到极值。利用边缘灰度变化的一阶或二阶导数特点，可以将边缘点检测出来。在此课题的研究中，我们将由用户来选择地物种类并由程序自动匹配算子。对于用户选择的地物种类，程序匹配的算子如何对于提取结果有重要的影响。基于此通过利用四种典型的线状地物提取算子分别对不同种类的线状地物进行提取，然后对同一种类线状地物的四种不同算子提取结果图进行横向对比，多次反复实验得出每种线状地物所对应的最佳算子。并通过实验结果在Microsoft Visual C+ 6.0环境下编制图像处理平台以处理线状地物提取工作。第二章数字图像处理图像分割概述2.1 综述在对图像处理的研究和应用中，人们往往仅对图像中的某些部分感兴趣，这些感兴趣的部分常称为目标或对象，他们一般对应图像中特定的、具有独特性质的区域。图像处理的重要任务就是对图像中的对象进行分析和理解。图像处理着重强调在图像之间进行变换以改善图像的视觉效果；图像分析则主要是对图像中感兴趣的目标进行检测和测量，以获得他们的客观信息，从而建立对图像的描述；图像理解的重点是在图像分析的基础上，进一步研究图像中各目标的性质和他们之间的相互关系，并得出对原始客观场景的解释，从而指导和规划行动。而为了辩识、分析和理解目标，需要将他们提取出来，在此基础上才有可能对目标进一步分析。图像分割就是指把图像分成互不重叠的区域并提取出感兴趣目标的技术。图像分割是由图像处理到图像分析的关键步骤，一方面，他是表达目标的基础，对特征测量有重要的影响；另一方面，因为图像分割及基于分割的目标表达、特征提取和参数测量等，都将原图像转化为更抽象、更紧凑的形式，使得更高层的图像分析和理解成为可能。图像分割作为自动化图像分析或理解的第一步具有非常重要的作用。它所应用的范围涉及到对图像中目标的检测，识别和测量。图像分割的技术可以分为基于内容和非基于内容的。非基于内容的分割技术忽视了图像特征之间的相关性：象素只是简单根据一些全局特性来聚合到一起。基于内容的分割技术强调了图像特征之间的关联性。如灰度相似性和频谱近似性。在以下的几个部分，我们就一些常用的方法加以介绍。2.2基于阈值的图像分割方法阈值分割方法是一种简单非基于内容的图像分割技术。我们可以认为图像阈值分割方法是通过一定阈值将象素分为两类。即高于阈值的为一类，低于阈值的为一类。所以它分割出来的图像是二值的。阈值分割方法通常是基于一定的特性(全局特性)来进行的。例如边缘检测(一种检测边缘强度的方法)的梯度算法。根据梯度值我们选取一个阈值来区分边缘点和非边缘点。这个阈值可以是固定也可以是自适应选取的。阈值的选取是与直方图有着紧密的联系。阈值分割技术通常涉及到如何分析直方图。不同特征的分水岭都可以很好地通过此特征的直方图来体现。总的来说，直方图的峰值往往体现了若干类的类中心值。我们可以通过这些峰值来划分象素类别以达到图像分割的目的。在阈值分割的过程中，阈值可以通过以下的两种方式获得：(1) 对每个象素反复计算；(2) 将所有特征提取方程式通过一次扫描获得参数值，并将结果存储到查寻表中，在表中我们再将他们映射到两个类中；在阈值选取的过程中，我们通常分为固定阈值和自适应阈值。2.2.1 固定阈值分割在固定阈值中，阈值对于整幅图像是相同的。固定阈值往往不考虑邻域之间的相关性。固定阈值通常是如下式给出的： T是我们给出的阈值。在固定阈值的分割方法中，图像分割方法是否成功依赖于这个阈值的选择。常见的固定阈值分割方法有以下几种形式：l Otsu分割方法Otsu分割方法是选择两类最低点来区分两类，这种方法已经是分割中公式化方法。其主要方式是选择一个评判函数作为一种统计特征分离的标准。在Otsu中，我们常选用灰度均值与方差作为我们参考的直方图的统计特征。在选择阈值的过程中，我们通过对评判函数参数的不断变换，让其达到最优的目的以获取最佳的分割阈值。l 基于熵的分割方法熵作为一种信息容量的度量常常被用于分割。与Otsu方法相似的是基于熵的方法也是在一个初始分类的基础上不断寻优的过程。而不同的是其判别函数的不同，在基于熵的方法中，评判的主要原则是两类熵都为最大时的阈值为最佳阈值。l 基于矩的分割方法基于矩方法的分割方法在这里是对直方图而言的，不同阶次的矩将在选择不同阈值分割后的情况下被计算出来，同时这些矩也要对原图进行计算，那些分割后图像的矩与原图矩最接近的即为最优阈值。l 最小误差分割方法最小误差分割方法是通过假定直方图含有两类分布的情况下，通过迭代的方法选取满足两类评判函数达到最小的方法。在迭代的每一步，一个预判阈值会通过计算当前直方图的均值和方差给出，这样可以减少方法的运算量。以上是对固定阈值分割的基本描述，可以看出在分割的过程中用固定阈值分割的常用方法是怎样通过一系列方法来对直方图做出恰当的解释，即通过一个评判函数来决定图像的分割的。这样的方法往往只适应对图像做出两类的判别，而对多类问题的解决有待进一步的研究。2.2.2 自适应闭值分割方法自适应阈值分割方法又被人称作区域阈值分割方法。它是通过对区域性质的分析来达到对多目标分割的。常用的自适应阈值分割方法：l 基于区域分割方法这种物体分割的方法包含两种主要的技术，即区域分裂和区域合并。究竟使用哪一种技术取决于图像的初始分割情况。我们在设计和应用基于区域的物体分割算法时，通常都设立一个初始分割，如果初始分割对比我们需要的最终分割结果过于细化的话，我们就需要使用区域归并的方法，按照某种合并条件，将相邻的符合归并条件的区域合为一个区域;特别的，当初始分割细化到了一个象素就认为是一个区域的话，这种方法就成为了纯粹的区域增长。相反，如果初始分割对比我们需要的最终分割结果过于粗略的话，我们就需要使用区域分裂的方法，在大的、过于粗略的区域内部再进行分割。当然，分裂和合并有时在一个算法内部是交错进行的。l 基于MRF随机场的分割方法最初的MRF随机场分割方法是通过选取一些样本作为一幅图像目标与背景来分别获取此图像中目标与背景的分布形式，得到初始分布概率。然后，以这些样本所得到先验概率通过统计学理论来计算未知象素的条件概率来判断此象素是否属于目标象素。随着MRF随机场的不断发展，人工选取样本的方法变为对图像本身象素分布的估计，相应的先验概率也是通过一些统计的方法来获取假设分布函数的参数来计算的。常用的估计为最大似然估计。当然，在MRF随机场分割方法中对邻域簇的定义也非常关键。在特定图像中，例如SAR图像，根据SAR图像成像特点，将不同邻域簇内部排列作为目标、背景和阴影分割的重要因素对图像进行分割，对小目标的分割有不错的效果。2.3 边缘检测边缘检测可以被定义为图像中发生突变的象素。边界中含有很重要的信息，它是图像中区域变化的标志，是目标区域的重要线索。目前还没有一个非常好定义边界的算法。我们在图像处理中常把边界根据其边界两侧灰度分布特点分为阶跃形、斜坡形、屋脊形和冲击形。边缘检测过程中的步骤可分为以下几步:1噪声消除:由于噪声严重影响边缘的检测，对噪声的消除直接影响到对边缘的提取。但是由于噪声的特性很类似边缘的特性，所以在进行噪声消除的过程中，我们应该根据实际需求去完成。2边缘增强:边缘增强是根据对边缘特性的理解来选用一种滤波器，使得满足这种边缘特性的象素得到相应的增强。3边缘检测:决定哪些是边缘哪些是噪声的过程。比如设定一定的阈值。我们把边缘检测算子按照不同数学方法总分为一阶派生算子和二阶派生算子。一阶派生算子是根据边缘的象素灰度变化最为剧烈，在数学公式上体现为一阶倒数最大的地方作为边缘定义的依据。一阶派生算子依赖于灰度变化方向并不是各向同性的。二阶派生算子是根据边缘的奇异型，在数学公式上体现为二阶过零的特性作为边缘定义的依据。二阶派生算子是各向同性的。常见的边缘检测方法有下面几种：梯度算子，Roberts算子，Prewitt算子，Sobel算子，Kirsch滤波器，Frei&Chen滤波器等为一阶派生算子。LapIacian算子为二阶派生算子。随着视觉理论的不断完善，现在边缘检测的理论中Marr提出了多尺度的概念，因此，一些基于多尺度的图像边缘检测方法也应运而生，最有代表性的是canny算子和一系列的小波算子。它们可以根据不同的要求给出不同尺度下的边缘图像来满足不同的需求。2.4 纹理分割对纹理图像很难下一个确切的定义。类似于布纹、草地、砖砌地面等重复性结构的图像成为纹理图像。一般来说，纹理图像中灰度分布具有某种周期性，即便灰度变化是随机的，它也具有一定的统计特性。因此，纹理图像的分割是依赖于纹理特征的提取。纹理图像在很大范围内没有重大细节变化，在这些区域内图像往往显示出重复性结构。纹理可分为人工纹理和天然纹理。人工纹理是由自然背景上的符号排列组成，这些符号可以是线条、点、字母、数字等。自然纹理是具有重复排列的自然景象，如砖墙、种子、森林、草地之类的照片。本文针对的大多是遥感图像。遥感图像有自然纹理信息丰富，且纹理基元不易提取的特点。因此，我们采用统计的方法来研究纹理特性。描述纹理特性的参数有很多种，对于纹理图像来说有必要知道各个象素及其邻近象素的灰度分布情况。了解邻近象素灰度值变化情况的最简单方法是取一阶微分、二阶微分值的平均值与方差，如果要考虑纹理的方向特性，则可考查垂直两方向的方向差分的平均值与方差。常用的检测纹理的测度有空间自相关函数、傅立叶功率谱、灰度共生矩阵、方向滤波器等。第三章线状地物特征提取方法由上章内容知道，图像分割的目的是为了做特征提取，而对于本文所研究的线状地物的特征提取来说，综合比较图像分割的三大类方法，图像分割中的边缘检测算子是本文重点要研究的问题。边缘是指图像中象素灰度有阶跃变化或屋顶状变化的那些象素的集合。他存在于目标与背景、目标与目标、区域与区域、基元与基元之间。它对图像识别和分析十分有用，边缘能勾画出目标物体轮廓，使观察者一目了然，包含了丰实的信息（如方向、阶跃性质、形状等），是图像识别中抽取的重要属性。边缘粗略分为阶跃状和屋顶状两种。阶跃状边缘位于其两边的象素灰度值有明显不同的地方；屋顶状边缘位于灰度值从增加到减少的转折处。对于阶跃状边缘点P，灰度变化曲线的一阶导数在P点达到极值，二阶导数在P近旁呈零交叉。对于屋顶状边缘点Q，灰度变化曲线的一阶导数在Q点近旁呈零交叉，二阶导数在Q点达到极值。利用边缘灰度变化的一阶或二阶导数特点，可以将边缘点检测出来。下面对几种典型的边缘检测算子予以研究。在具体讨论边缘算子之前首先给出一些术语的定义：(1)边缘点：图像中具有坐标(x，y)，且处在强度显著变化的位置上的点。(2)边缘段：对应于边缘点坐标(x，y)及其方位，边缘的方位可能是梯度角。(3)边缘检测器：从图像中抽取边缘（边缘点和边缘段）集合的算法。(4)边缘跟踪：一个用来确定轮廓的图像(指滤波后的图像)搜索过程。3.1 Sobel算子Sobel算子是一种梯度幅值，既：其中的偏导数用下式计算： Sx(a2+ca3+a4)-(a0+ca7+a6) Sy(a0+ca1+a2)-(a4+ca5+a6) 其中常数c=2。Sx和Sy可用卷积模板表示为图3.1.1来实现图3.1.1 Sobel卷积模板请注意这一算子把重点放在接近于模板中心的像素点。图3.1.1和图3.1.2表明了这一算子的作用。图3.1.2 说明Sobel算子的领域象素点标记在计算梯度值时，对于数字图像，可以用一阶差分代替一阶微分：求梯度时对于平方和运算及开方运算，可以用两个分量的绝对值之和表示，即：Sobel梯度算子是先做成加权平均，再微分，然后求梯度，即：上述各式中像索之间的关系见图3.1.3。图3.1.3 象素关系表3.2 Prewitt算子Prewitt算子是一个33算子，根据周围8个点的像素值来确定这个像素的梯度。Prewitt算子是利用像素点上下、左右邻点灰度差，在边缘处达到极值检测边缘，对噪声具有平滑作用。由于边缘点像素的灰度值与其邻域点像素的灰度值有显著不同，在实际应用中通常采用微分算子和模板匹配方法检测图像的边缘。所谓模板匹配法，就是通过了解与模板的匹配程度来提取物体的边缘轮廓，即先选定若干种有代表性的标准样板，再把一部分图像与这些模板进行比较后，从中选出最相似者的方法。图3.2.1 Prewitt算子模板图3.2.1所示为Prewitt算子八个与边界方向对应的模板，每个模板对某种特定边缘方向作出最大响应，所有八个方向中的最大值作为边缘幅度图像的输出。假设图像中某一点Q及其33区域的灰度如下图2所示，分别设ai( i = 1 ,2 ,3 ,4 ,5 ,6 ,7 ,8)为经过Prewitt算子第i种模板处理后图像Q点的灰度值。图3.2.2 某33象素区域例如采用模板(C)，则a3=q0+q1-q2-q3-q4+q5+q6+q7-2q9 =(q0+q1+q5+q6+q7)-(q2+q3+q4)-2q9经过处理后点Q处的灰度值WW=maxai,i=1,2,3,4,5,6,7,8从上面八个匹配模板可以看出，Prewitt算子在进行边缘检测时对图像的低频噪声进行了消除。从而使图像的高频噪声分离成一个个孤立的噪声干扰区域。有利于进行区域分割处理。然而Prewitt算子与模板结合进行边缘检测的方法运算量大，处理图片时间较长，因此在实时图像处理系统中并不适应，必须对算法进行改进，在处理速度方面获得更好的效果，为系统图像后继处理赢得时间。3.3 Laplacian算子对于阶跃状边缘，其二阶导数在边缘点出现零交叉，并且边缘点两旁象素的二阶导数异号。据此，对数字图像的每一个象素计算关于x轴和y轴的二阶偏导数之和。上式就是著名的拉普拉斯（Laplacian）算子。拉普拉斯算子是一种二阶导数算子，它对1个连续函数f(x，y)，它在位置(x，y)的拉普拉斯值定义如下：在数字图像中，计算函数的拉普拉斯值也可借助各种模板实现。对模板的基本要求是对应中心象素的系数应是负的，而对应中心邻近象素的系数应是负的，而且它们的和应该是零。常用的二种模板见图3.3.1所示。图3.3.1 拉普拉斯算子模板其中是高斯分布的均方差。如果令，那么根据拉普拉斯值定义：这是一个轴对称函数，在处有过零点，在时为正，在时为负。拉普拉斯算子是一种二阶导数算子，所以对图像中的噪声相当敏感。另外它常产生双象素宽的边缘，而且也能提供边缘方向的信息、。由于以上原因，拉普拉斯算子很少直接用于检测边缘，而主要用于己知边缘象素后确定该象素是在图像的暗区或明区一边。而实际中，将图像与2D高斯函数的拉普拉斯相卷积得到的算子，其平均值是零。如果将它与图像卷积，不会改变图像的整体动态范围。但由于它相当光滑，如果将它与图像卷积会模糊图像，并目_其模糊程度是正比于的。而且这种方法的计算复杂度比较大。对于拉普拉斯算子，经过二次微分后，所提取的边界象素己经小在原来的边界上。由于二次微分算子没有方向性，对定位失真也无法进行修正。因此，定位失真是拉普拉斯算子存在的问题。3.4 Canny算子Canny的主要工作是推导了最优边缘检测算子。他认为一个优良的边缘检测算子应具有以下3个特性。1好的检测性能。不漏检真实边缘也不把非边缘点作为边缘点检出，使输出的信噪比最大。2好的定位性能。检测到的边缘点与实际边缘点位置最近。3唯一性。对于单个边缘点仅有一个响应。根据以上3个准则，Canny推导出最优边缘检测算子的一个近似实现是：边界点位于图像被高斯函数平滑后的梯度幅度的极大值点。该算法的实现过程如下：(1)用下式所示的一维高斯函数分别按行和列对原始图像f(x，y)进行平滑除噪，得到平滑图像I(x，y)。其中*是卷积运算符。这一步实际是一个低通滤波过程，用于消除空间尺度小于高斯空间系数的图像灰度变化。(2)对I(x, y)的每个像素I(i，j)，使用如图3.4.1所示的22大小模板作为对x和y方向偏微分的一阶近似来计算其梯度的大小M(i，j)和方向O(i，j)。图3.4.1 Canny算子模板(3)对梯度图像进行非极大值抑制。像素I(i，j)的梯度方向O(i，j)可被定义为属于图3.4.2所示的4个区之一，各区有其相应的比较方向，用不同的邻近像素进行比较以决定梯度局部极大值。例如，如果中心像素I(i，j) 的梯度方向属于第2区，则把其梯度值M(i，j)与它左上和右下相邻像素的梯度值比较，若非局部极大值，就把像素I(i，j)的梯度值M(i，j)设为0。图3.4.2 I(i，j)的梯度方向图(4)对梯度图像取两次阈值thl和th2 ,th2 = 2thl。首先将梯度值小于th1的像素的梯度设为0，得到图像1;然后将梯度值小于th2的像素的梯度设为。，得到图像2。图像2阈值较高，噪声较少，但造成了边缘信息损失;而图像1阈值较低，保留了较多信息。最后以图像2为基础，以图像1为补充进行边缘连接获得图像边缘。在实际应用中，Canny算法取得了良好的效果。然而,Canny算法在实际应用中也存在如下问题：1Canny算法的噪声平滑能力与边缘定位能力相矛盾。当高斯空间系数取值较小时，边缘定位精度高，但图像平滑作用较弱，在有噪声的情况下不稳定;要获得好的噪声抑制效果，必须增大的取值，但又导致模板增大，使边缘位置偏移严重，且运算量增加。2对于一幅具体图像，用Canny算法检测边缘时最佳的值和梯度阈值th1和th2完全依赖人工获得，无法满足大图像库中图像边缘自动检测的要求。第四章实验4.1 实验流程4.1.1 搭建实验平台本次设计的实验平台是基于Microsoft Visual C+ 6.0环境所编制的Windows应用程序，该程序由：(1)读取并显示BMP图像；(2)鼠标拉矩形框确定处理范围；(3)对矩形框内分别利用四种典型线状地物提取算子进行处理；(4)对提取出的结果作二值化，以突出地物边缘。四个功能模块组成，现分别介绍功能模块的实现：l 读取并显示BMP图像：以.BMP为后缀的图像文件格式被称作BMP图像，它是一种设备无关位图DIB。要计算机读取DIB位图，我们首先要对这种数据格式有一个清晰的了解。1. DIB位图的结构： DIB位图文件的结构如图所示，包括位图文件头结构BITMAPFILEHEADER,位图信息头结构BITMAPINFOHEADER、位图颜色表RGBQUAD和位图像素数据四部分。表4-1 DIB位图文件结构位图文件头结构BITMAPFILEHEADER位图信息头结构BITMAPINFOHEADER位图颜色表RGBQUAD位图像素数据位图文件头BITMAPFILEHEADER含有文件的类型、大小和打印格式等信息。Windows.h中对其定义为：typedef struct tagBITMAPFILEHEADERWORD bftype; /*位图文件的类型，必须为BM*/DWORD bfSize; /*位图文件的大小*/WORD bfReserved1; /*位图文件保留字，。必须是0*/WORD bfReserved2; /*位图文件保留字，。必须是0*/ DWORD bfoffBits; /*位图数据相对于位图文件头的偏移量表示*/BITMAPFILEHEADER;位图信息头BITMAPINFOHEADER用于说明位图的尺寸。Windows.h中对其定义为：typedef struct tagBITMAPINFOHEADERDWORD biSize; /*本结构大小的字节数*/DWORD biWidth;/*位图的宽度，以象素为单位*/DWORD biHeight;/*位图的高度，以象素为单位*/WORD biplanes;/*目标设备的位平面数，必须为1*/WORD biBitCount;/*每个象素的位数，必须是1（单色）、4（16色）、8（256色）或24（真彩色）*/DWORD biCompression; /*位图的压缩类型，必须是0（不压缩）、1（BIRLE8压缩）或2（BIRLE4压缩）*/DWORD biSizeImage; /*位图的大小，以字节为单位*/DWORD biXPeIsPerMeter; /*位图的目标设备水平分辨率，以每米象素数为单位*/DWORD biYPeIsPerMeter; /*位图的目标设备垂直分辨率，以每米象素数为单位*/DWORD biClrUsed; /*位图实际使用的颜色表中的颜色地址数*/DWORD biClrImportant; /*位图现实过程中被认为重要颜色的地址数*/BITMAPINFOHEADER;颜色表RGBQUAD用于说明位图中的颜色。它有若干个表项，每一表项是一个RGBQUAD类型的结构，定义一种颜色。Windows.h中对其定义为：Typedef tagRGBQUADBYTE rgbBlue; /*蓝色的亮度*/BYTE rgbGreen; /*绿色的亮度*/BYTE rgbRed; /*红色的亮度*/BYTE rgbReserved; /*必须为0*/ RGBQUAD;表项的个数由biBitCount确定。DIB位图的位数据紧跟在颜色表后面。数据可以是不压缩的，也可以是压缩的。对4位和8位位图，可以采用RLE(游程长度编码)压缩，分别称为RLE4和RLE8位图。位数据以行为单位存储，每行都被填充到一个四字节边界，即每行所占的存储长度总是四字

展开阅读全文

508.中分辨率遥感影像中线状地物提取方法研究开题报告毕业论文

最新文档