图像检索技术研究【优秀毕业课程设计】

资源描述

I 摘要在网络和多媒体技术越来越发达的今天，信息检索技术成了现在计算机领域的重要内容，而图像检索技术正是这其中的重要内容之一。网络资源的极大丰富以及图像检索技术不断发展成熟，使得图像检索技术的应用领域不断扩大，这为图像检索技术的继续研究提供条件。以此同时，随着网络传送速度与计算机信息处理速度的提高，网页中对多媒体信息的使用变得十分普及，特别是图像信息，己经成为表示网页内容不可缺少的组成部分。在实现对网页中文本信息提取的同时，如何再为用户抽取所需的图片资料，是信息检索中一个重要的方面。于是各种基于图像检索系统应运而生。它们采用不同的工作方式，极大地方便了用户对网上图像进行检索。本文首先介绍各种图像检索技术的工作原理、研究现状、相关图像检索引擎与发展趋势；然后，对几种比较热门的图像检索算法进行研究和对比。关键字 : 图像检索检索引擎文本处理信息检索相似度相关反馈 I 目录 1 前言 . 1 题来源 . 1 有的图像检索技术 . 2 索引擎的工作原理 . 2 像检索引擎的检索途径 . 3 几个基本引擎的分析 . 4 索引擎的基本要点 . 5 像检索的发展方向 . 6 2 基于颜色的图像检索 . 7 色特征提取 . 7 似度计算 . 10 验结果 . 10 3 基于纹理的图像检索 . 10 理特征提取 . 10 相似度计算 . 13 验结果 . 13 4 综合颜色和纹理特征的图像检索 . 14 合特征检索的思想 . 14 关反馈 . 15 验结果及结论 . 15 5 基于图像检索 . 17 本与图像之间的关系 . 17 示图像内容的文本标记 . 17 本的权值比较 . 18 像信息检索 . 18 索模型与相似度 . 18 词技术和匹配方法 . 20 索反馈 . 22 验结果 . 24 6 总结 . 25 参考文献 . 27 . 28 致谢 . 错误 !未定义书签。仲恺农业工程学院毕业论文 (设计 )成绩评定表 . 错误 !未定义书签。 1 1 前言题来源据统计，人类接受的外部信息， 70%以上来自视觉，图像作为一种内容丰富，表现直观的多媒体信息被大量广泛地使用，如何有效管理、检索图像信息成为迫切需要解决的问题。传统的基于文本的检索无法满足海量环境下多媒体信息库的检索要求。为了克服基于文本方法的局限性，出现了基于内容的图像检索。随着多媒体技术及络的迅速发展，图像来源不断扩大，大容量高速存储系统为图像的海量存储提供了基本保障，各行各业对图像的使用越来越多，图像信息资源的管理和检索也就显得越来越重要。但由于身结构上、管理上的问题，想要在确、快速、全面地找到自己所想要的图像，却变成了件非常不容易的事。由于容没有结构；网上信息量庞大且还在不断的增加。因此，网络产生了检索引擎。虽然这些给网络用户提供了不少的帮助，但由于偏离准确、快速、全面地检索自己所要的图像还相当遥远，所以对图像检索还要作很大的研究。根据国内外现有的检索引擎和国际上的有关研究小组的种种资料表明，现有的网络资源和检索引擎有如下特点： (1)索引的数据种类丰富，如文字、图像、声音等多媒体。数据的存取协议也是多种多样的，如 (2)索引数据量大，以致不可能有某个数据库能包括整个索引，目前最大的检索引擎，其中的索引也只不过覆盖了一小部分； (3)资源消耗太大，系统需要将件传送至本地然后分析，大量占用昂贵的网络带宽和加被检索结点的负担。另外由于现有的检索引擎一般是集中式的，所以检索引擎服务器本身的硬件配置也极高，才能处理庞大的数据量和及时地响应用户的查询请求； (4)不能有效解决索引失效问题，很多时候，检索引擎会返回无效的查询结果； (5)各检索工具各行其事，不能相互协作，在一定意义上讲是一种资源的浪费。二十一世纪是一个多元化的信息社会，对图像的需求将是前所未有的巨大的，图像数据库也将得到长足的发展。因此，图像检索系统具有广阔的应用前景。 2 有的图像检索技术近年来随着用户对网上图像检索要求的不断增长，各种图像检索引擎应运而生，它们各自以不同的工作方式为用户提供各种检索途径，使网上图像信息的检索变得非常简单，尽管还不很完善，却已经可以满足用户的大多数要求。最基本的检索引擎的结构，是由停地从上收集数据，存放在检索引擎的数据库中。用户通过检索引擎服务器上的口，提出检索请求，过其它技术访问数据库，并将用户的检索请求转换成相应的数据存取语句，送给数据库引擎处理，并把查询结果通过网页显示给用户。网络检索的基本原理是通过网络机器人定期在页上爬行，然后发现新的网页，把它们取回来放到本地的数据库中，用户的查询请求可以通过查询本地的数据库来得到。一般来说网络信息检索的实现机制一般有两种：一是通过手工方式对网页进行索引，它的缺点是覆盖率比较低，同时不能保证最新的信息。查询匹配是通过用户写入的关键字和网页的描述和标题来进行匹配，而不是通过全文的匹配进行的；二是对网页进行自动的索引，这种能实现自动的文档分类，实际上采用了信息提取的技术。但是在分类准确性上可能不如手工分类。在现在所有运行的检索工具来说，一般都有一个期的访问一些站点，来检查这些站点的变化，同时查找新的站点。一般站点有一个件用来说明服务器不希望问的区域，必须遵守这个规定。如果是自动索引的话，要对该页面根据其内容进行索引，根据它的关键字的情况把它归到某一类中。页面的信息是通过元数据的形式保存的，典型的元数据包括标题、址、一个该页面的简要的介绍，关键字或者是索引短语、文件的大小和最后的更新的日期。尽管元数据有一定的标准，但是很多站点都采用自己的模板。文档提取机制和索引策略对索引擎的有效性有很大的关系。高级的检索选项一般包括：布尔方法或者是短语匹配和自然语言处理。一个查询所产生的结果按照提取机制被分成不同的等级提交给用户。最相关的放在最前面。每一个提取出来的文档的元数据被显示给用户。同时包括该文档所在的址。另外有一些关于某一个主题的专门的引擎，它们只对某一个主题的内容进行检索和 3 处理，这样信息的取全率和精度相对就比较高。目前，图像检索引擎主要通过以下两种方法识别图像： (1)自动查找图像文件。通过两个签，即检测是否存在可显示的图像文件，示 “显示下面的图像文件 ”，导向的是嵌入式图像；而表示 “下面是一个链接 ”，导向的是被链接的图像。检索引擎通过检查文件扩展名来判断其导向的是否为图像文件，如果文件扩展名是是一个可显示的图像。 (2)人工干预找出图像。进行分类，由人工对网上的图像及站点进行选择。这种方法可以产生准确的查询体系，但劳动强度太大，因此要限制处理图像的数量。由于图像不同于文本，需要人们按照各自的理解来说明其蕴含的意义，因此图像检索比文本的查询和匹配要困难得多。像检索引擎的检索途径传统的图像检索技术是基于关键字的精确匹配检索，系统内的图像用关键字标识，检索线索是与标识相一致的关键字，即输入是关键字，输出是图像。它又包括两种途径： (1)基于图像外部信息进行检索。即根据图像的文件名或目录名、路径名、链路、是目前图像检索引擎采用最多的方法。在找出图像文件后，图像检索引擎通过查看文件名或路径名确定文件内容，也可以通过查看图像的标题来匹配检索词。 (2)基于手工标注的检索。手工对图像的内容（如物体、背景、颜色等）进行描述并分类，将其标注为一系列关键字，并建立索引。检索时，将主要在这些描述词中检索用户输入的关键字。这种查询方式是比较准确的，一般可以获得较好的查准率，但需人工参与，劳动强度大，因而限制了可处理的图像数量。另外，由于图像所包含的信息量庞大，不同用户对于同一张图像的看法又不尽相同，导致了对图像的标注缺乏统一标准。 2. 图像可视属性的检索而基于图像内容的检索主要是由图像分析软件自动抽取图像的颜色、形状、纹理等特征，建立特征索引库，其输入为用户要查找的图像的大致特征描述或示例，通过一定相似性匹配规则，输出为与之具有相近特征的图像，按相似程度排列，供用户选择，从而把在传统图像检索技术中一般用户难以完成的图像特征描述、提取与识别等难题，交由系统去解决。 4 这是一种基于图像本身特征层次的检索，特别适用于检索目标明确的查询要求，但目前这种较成熟的检索技术主要应用于图像数据库的检索。在图像检索引擎中应用这种检索技术还有一定困难，但己有部分图像检索引擎尝试了这种检索方法。 (1)一个简单但是功能强大的索引，它的一个优点是有一个面向主题检索的可扩展的分类。你可以把你的检索短语和相似的分类目录的主题短语相互参照，而那些主题短语会自动加到你的查询中去。使你的检索有更好的主题相关性。同时它也支持对图像的查询。它能够漫游等。不支持布尔操作，但是可以使用符号 +和 -。 (2)一个大容量的，基于引的能帮你在闻组，图像，视频音频片段。支持多种语言和简单的自然语言查询。盖面约为上可索引的网页的 30% (3)立于 1998 年，自称是第一个基于多媒体检索引擎。虽严格讲，它并非是一个图像检索引擎，但可以将检索限制在图像检索上。它的工作原理是在文件名、路径名或签中检索检索词。主要使用关键词检索，可以用或来增加或排除关键词，使用尽可能少的关键词会更有效。在高级检索中，可以将检索结果图像限制在格式中。检索结果显示简图、图像类型（如图像大小、最后被查找的日期、检索词的匹配数量、标引使用的关键词、成功下载的可靠程度等，并同时给出图像文件的源站点的主要缺陷是标引深度不足，查准率较低，但查全率较好。 (4) 这是由织开发的一个真正人工建立的完全的关键词式索引。面的教师负责选择图像丰富的站点，然后对每幅选定的图像内容进行描述，给出关键词。因此它的最大特点就是人工干预，关键词检索是主要的检索手段。检索结果将显示一个简短的标题、有关图像的说明（如彩色或黑白）、文件的大小、文件类型及象素多少等，但不显示简图。单击该标题可得到原图像，但需由该溯才能找出源站点。由于人工干预检索过程，它的查准率极好，但这也限制了它的查全率。它的检索范围很有限，只包括人工选择的部分站点。 5 (5)所收录的图像进行了详尽的内容描述，并支持短语检索，从而使其查准率大大提高。它根据文件扩展名识别图像，在描述词、文件名、目录名或段中查询检索词。结果显示的信息极为丰富，包括简图、图像大小、最后检索日期、图像文件名、图像内容描述词、图像所在页面等。点击简图将得到原图及更多的信息，如著作权人和更多的相关图像。比较而言它的检索效果很好，速度也很快。索引擎的基本要点 (1)索引文档的容量：现在最大的检索引擎可能包含了超过 100,000,000 个链接，但这也只是整个上的一小部分。因为收集资料的只能从“已知”的链接开始收集网页资料，而只有一小部分页和这些“已知”的网页有连接；现在还没有一个检索引擎能够随网页内容的更新比较及时地更新索引； (2)覆盖面：地理覆盖面和主题覆盖面； (3)索引更新频率：不同的检索引擎，索引更新频率相差很大，有的是几周，有的是一年。索引更新频率有两种定义，一种比较少用的定义是新的网页能被收录进索引数据库中，另一种是同一页多少时间才被检查一次，有必要时更新索引。有的检索引擎会对经常更新的网页和多人访问的网页进行更频繁的重建索引工作； (4)采集过程：采集过程有宽度优先、深度优先两种算法；一般认为宽度优先对扩大内容的覆盖面有利，深度优先算法有助于提供更多的细节资料； (5)索引算法：有的检索引擎只处理元标记和一小部分文档内容，而有一些检索引擎则是对全文进行索引； (6)结果显示：有的检索引擎只显示网页的标题，有些则有更详细的一些信息，比如网页的内容，更新日期等； (7)查询算法：一个优秀的查询算法是很重要的，最基本的布尔查询，短语查询，有的检索引擎还提供指定属性的查询，比如可以指定对网页的作者、主题进行查询。另外有的检索引擎还采用了相关度反馈、概念查询等算法； (8)用户界面：很多检索引擎都提供了简单查询和高级查询两个界面。并且提供了必要的帮助和范例。 6 像检索的发展方向图像检索技术给用户提供了一个在互联网上检索感兴趣图像资源的有效手段，基于文本和基于内容是图像检索发展的两个分支，不过从目前图像检索研究的趋势而言，尤其结合网络环境下图像的特征嵌入在具有文本内容的档中，出现了三个不同的研究着眼点。 (1)基于文本的检索研究立足于文本，对图像进行检索。试图将传统的文本检索技术移植于对多媒体信息的检索上，因为基于文本的检索技术发展已经成熟。如法、概率方法、位置方法、摘要方法、分类或聚类方法、词性标注法等，不仅技术发展较为成熟，同时分析和实现的难度略小。但是因为受控词汇本身的局限，易歧义，更新慢，所以不太容易应对网络上日新月异的各类图像。 (2)基于内容的检索研究立足于图像内容，对图像进行分析和检索。相比而言，尽管图像检索已经出现了诸如直方图、颜色矩、颜色集等多种表征图像特征的方法，但是要突破对低层次特征的分析，实现更高语义上的检索，实现难度大，进展慢。不过，基于内容的图像检索建立在多媒体信息的内容语义上，能够更为客观地反映媒体本质的特征。 (3)基于文本内容结合的检索研究结合文本和内容，二者虽侧重不同但却互相补充。如果能将二者结合起来取长补短，则网络的图像检索技术必有新的进展。已有的图像检索引擎在信息的自动加工和标引方面都有待提高，需要开发出计算机自动识别和标引图像的算法和技术，以完善现有的检索功能，并与已有的成熟的图像库检索技术相结合，这是今后应该研究的一个课题。而且，图像库检索技术也应面向网络，利用网络技术进行改造，提供新的问界面代替原来的应用系统界面。同时将巨大的图像库资源利用网络实现共享。 (4)对基于内容编码技术的研究可以说，三个方向都是相互影响和促进的，任何一个方向的进展都会促进图像检索技术向前更进一步。目前，国际上还没有通用的基于内容的编码标准。 20 世纪 90 年代初，国际上就开始了对基于内容的图像信息检索方面的研究。从基本的颜色检索，到综合利用多种图像特征进行检索，大量原型系统已经推出，其中，部分已投入到实际应用中以检验其有效 7 性。同时，准作为基于内容的多媒体编码标准也正在制定当中，即将成为国际标准中的一员。因此，应尽快对准进行研究，分析其编码的实质，在此基础上进一步研究基于内容检索的系统，使我国基于内容的图像检索尽快走向实际应用阶段。 (5)对用户查询接口的研究这涉及到用户对图像内容的感知表达、交互方式的设计、用户如何形成并提交查询等方面。现代多媒体信息系统的一个重要特征就是信息获取过程的可交互性，人在系统中是主动的。除了提供示例和描绘查询基本接口之外，用户的查询接口应提供丰富的交互能力，使用户在主动的交互过程中表达对图像语义的感知，调整查询参数及其组合，最终获得满意的查询结果。用户的查询接口应该是直观易用的，底层的特征选择对用户是透明的。这里涉及到如何把用户的查询表达转换为可以执行检索的特征矢量，如何从交互过程中获取用户的内容感知，以便选择合适的检索特征等问题。一个优秀的检索引擎必须处理以下几个问题： (1)网页的分类 (2)自然语言的处理 (3)检索策略的调度和协作 (4)面向特定用户的检索。因此，现在有很多的网络检索工具，也就是说检索引擎采用了智能的检索手段来增强它的检索能力，而图片检索正是其中的一大块内容。随着网上多媒体的广泛应用，对图像的检索需求将会越来越迫切。未来的图像检索技术将是网络技术和基于内容的图像库检索技术的结合。随着多媒体信息处理技术的日益发展和深化，图像信息的加工、处理和检索标准的出台，网上的图像检索技术将会日趋完善，而图像检索引擎也将成为的新宠。 2 基于颜色的图像检索色特征提取颜色特征是一种全局特征，描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征，此时所有属于图像或图像区域的像素都有各自的贡献。 8 由于颜色对图像或图像区域的方向、大小等变化不敏感，所以颜色特征不能很好地捕捉图像中对象的局部特征。另外，仅使用颜色特征查询时，如果数据库很大 ,常会将许多不需要的图像也检索出来。颜色特征是在图像检索中应用最为广泛的视觉特征，主要原因在于颜色往往和图像中所包含的物体或场景十分相关。此外，与其它的视觉特征相比，颜色特征对图像本身的尺寸、方向、视角的依赖性较小，从而具有较高的稳定性。为了正确地使用颜色，需要建立颜色模型。颜色特征是图像最直观而明显的特征，一般采用直方图来描述。颜色直方图是表示图像中颜色分布的一种方法，它的横轴表示颜色等级，纵轴表示在某一个颜色等级上具有该颜色的像素在整幅图像中所占的比例，直方图颜色空间中的每一个刻度表示了颜色空间中的一种颜色。采用直方图计算图像间的相似性比较简单，但它不能反映图像中对象的空间特征。在颜色布局描述符中，对分割好的 88 的图像取每一块图像的颜色平均值，形成一个颜色平均值矩阵，然后对其用二维离散余弦进行变换，取低频分量作为颜色特征。考虑到本文所选的测试图片都是及减少计算量，提高检索速度的因素，本文的颜色布局描述符的提取方法如下： (1)将整幅图像分成 44 块，计算每一块中所有象素以此作为该块的代表颜色（主颜色）。 (2)将各块的颜色平均值进行离散余弦变换（得到国际静止图像压缩标准基础。由于大多数图像的高频分量较小，相应于图像高频分量的系数经常为零，加上人眼对高频成分的失真不太敏感，所以可用更粗的量化。因此，在一般检索中可以利用部分 (3)对到 (4)对于 R、 G、别从个低频分量，形成 12个参数，共同构成该图像的颜色特征向量。图 1 为颜色特征提取的流程图。 9 将图片划分成 4 * 4 块计算每一块的 R G B 平均值（该块的代表颜色）将平均值进行离散余弦变换（得到系数矩阵）对系数矩阵进行之字形扫描和量化，得到系数从系数中取出 4 个低频分量共 1 2 个分量构成特征向量图 1 颜色特征提取流程图 10 似度计算国际标准此在本算法中匹配时也使用欧式距离公式，即为： i 22 )()()(),( 其中，各个分量的 i（ i=0， 1， 2， 3）个验结果本文实验的图库是从标准测试图像库像库中选取的，包括由海滩、恐龙、大象、马、花等组成的 120 副图片，得到利用颜色特征检索图片的查准率和查全率为下表。表 1 利用颜色特征的结果类型利用颜色特征的查准率利用颜色特征的查全率海滩龙象景基于纹理的图像检索理特征提取图像可以看成是不同纹理区域的组合，纹理通常定义为图像的某种局部性质，或是对局部区域中像素之间关系的一种度量。纹理特征可用来对图像中的空间信息进行一定程 11 度的定量描述。在国际标准边缘直方图。边缘直方图是基于图像边缘的统计特征，能较好地反映目标的边缘和纹理特征，而且运算速度较高。因此在本文中选取边缘直方图来提取图像的纹理特征。下面介绍提取的具体步骤： (1)将个象素的灰度值可以根据色分量按下列公式计算得到： i,j)=(i,j)+(i,j)+(i,j)。 (2)将整幅图像分成 44 块。 (3)分别对 16块 1/16子图像进行缘算子运算，得到边缘图像。 (4)统计子图像中的边缘直方图，该直方图包括 4个直方条。（横轴为 0， 1， 2，3四个边缘方向，纵轴为该方向上的象素数占子图像总的象素数的比率） (5)将 16个子图像的直方条综合起来，得到包括 64个直方条的整幅图像的边缘直方图。图 2为图像纹理特征流程图。 12 将 bm p 图像转换成灰度图将整幅图像分成 4 4块进行s o be l 边缘算子运算统计子图像中的边缘直方图将 16 个子图像的直方条综合起来取出图像的边缘图 2 图像纹理特征流程图下面介绍用首先介绍一下法中用到的 4个核模板： 13 图 3 法模板图 4 法的边缘方向编号 (1)将图像中的象素点的灰度值分别与以上四个方向的核模板相乘。 (2)比较四个乘积数值，取最大的那个数值，作为该象素点的新的灰度值。 (3)取适当的阈值 T，若新的灰度值 T ，则认为该象素点为边缘点。通过以上算法提取出图像的边缘。相似度计算仍然采用欧式距离公式作为相似度的计算公式，如下： 63 0 2)(),( i 其中；，验结果实验平台如出结果如下表。 14 表 2 利用纹理特征的检索结果类型利用纹理特征查准率利用纹理特征查全率海滩龙象景综合颜色和纹理特征的图像检索合特征检索的思想图 5 对于以上三幅图像，假设它们是原图像的 1/4图像（其余 3/4图像与此 1/4图像相同），如果按照本文中的利用颜色特征进行检索，那么将得出完全相似的结论，但是实际上这三幅图像给人的感觉是完全不同的。因此说单一的依靠提取一种特征来进行检索，得出的结果往往是不尽如人意的。在本文中，利用颜色布局描述符结合了颜色特征和空间关系的特点；利用边缘直方图作为纹理特征弥补了颜色特征缺乏空间分布信息的不足，考虑到图像中的边缘多对应目标的边界或轮廓，边缘直方图描述符在一定程度上还反映了图像中目标的形状信息。 15 因此这两种特征描述符达到了不同特征的优势互补的效果，而且，这两种特征在提取的过程中都归一化到了 0， 1区间，可以综合在一起进行图像检索。设颜色特征的权重为理特征权重为且 t=1，则综合特征的相似度计算公式为： ),(),(),( S 关反馈由于颜色特征的权重理特征权重 0， 1区间 ,而在这个区间不同的权重的选择所得出的效果肯定是有差异的。为了能在实验中得到最佳的实验结果，就需要对权重的值进行多次的选择。在确定 20%和 80%之间取值，每 5%取一次值，并计算出每次取值的图像检索的查全率。同时相应改变而得到最佳的反馈值。验结果及结论通过上述的反馈实验，得出关系图如下： 16 图 6 权重取值反馈关系由图 6可见当右时，图像的检索查全率最高，于是选取同样利用上述的平台，得出综合利用颜色和纹理的检索方法的查准率和查全率，并以之和单独利用颜色或纹理的检索方法进行比对。表 3 六类图片的查准率类型利用颜色特征利用纹理特征利用综合特征海滩龙象景 4 六类图片的查全率类型利用颜色特征利用纹理特征利用综合特征海滩龙象景表中的数据可以看出，利用综合特征进行图像检索得到的查准率和查全率都要高于使用任何一种单一方法进行图像检索得到的查准率和查全率。通过以上的实验结果数据可以看出：本文中综合利用颜色和纹理特征进行图像检索的效果比使用单一特征进行 17 检索的效果更好，更符合人的视觉要求。因此，本文提出的综合颜色和纹理特征进行图像检索的方法是有效的，有意义的方法。 5 基于图像检索本与图像之间的关系在文本检索中，检索引擎主要考虑中相关文字信息以及它的语义，这些文本信息反映出网页的内容，但不完全与网页中图片的内容一致。在，根据获反映图片信息的文字信息，分析这些文本的语义具有重要的意义。如在档中标记以及其周围的文字信息，与网页中的插图的内容有着密切的联系。示图像内容的文本标记为了能识别嵌入网页中图片的内容，必须仔细检索过对知以下几个方面的标记与文本和图像内容有着最为密切的联系。 (1)图像的说明，这些文本出现在图像的周围，用一句过多句话表示出图像的内容，当图像被置于表格中时，同一单元或相邻单元格内的文字也常用与表示图像的含义。 (2)图像的标题，通常用一个关键词表示图像信息。 (3)图像的标签，使用一段短语说明图片的摘要信息，图片无法显示时用标签的文本取代图片，显示摘要信息。 (4)网页的标题，该标题反映出网页的中心内容，作为表现网页内容的图片与网页的标题之间也有着一定的联系。以上讨论的是文档和嵌入网页中图像文本信息的关系，当然还存在其他的文本与多媒体信息和图像有关。但是作为检索引擎要考虑的方面，既要保证抽取信息的准确性，也要兼顾程序执行中时间、空间的复杂度。过多地引入与图像关系不是十分紧密的内容作为检索的依据，会引入检索时的躁声干扰，降低检索效率。 18 以上讨论了网页中对图像信息的描述，在图像的检索中，首先是要建立描述图片内容特征的查询语句，然后比较、区分描述信息与查询语句之间的异同，获取需要检索的图像。但以上信息在对图像描述时侧重于不同角度，同时与图像信息的联系程度也不一样。图像标题和网页标题是简单的词条，两者中相对来说图像标题更接近图像的主题内容。图像的标签和图像的说明是文本信息对图像内容的描述，后者相对来说更为详细。所以在比较、区分各类文本信息以决定是否符合检索要求时，它们所占的权值应该是有所不同的。根据信息的重要程度，他们所占的权值大小按次序如下：像信息检索在对图像的检索，也就是对图像信息的检索，根据图像自身所带的信息，选其中某一种或几种进行检索，进而检索到相关的图像，再经过选取得到所需的图像。而索引擎采用何种检索模型，它所提供检索质量将直接影响到检索的效果。现在使用较多的是布尔检索模型、概率检索模型、概率推理网络模型和向量空间模型。这里采用的是近年来使用较多且效果较好的一种信息检索模型：向量空间模型。在用向量空间模型进行检索的时候，首先把描述网页中的图片的文字信息看作是有序的词条序列，这样把以上归纳的信息分别称为：应用模型时，我首先要将这些信息向量化，把文档映射为一个特征向量 V(d)=( 1(d)； n(d)，其中 ti(i=1,2, ,n)为一列互不雷同的词条项， i(d)为一般被定义为 d)的函数，即 )()( i 在信息检索中常用的词条权值计算方法为数 )lo g ()(ii 其中 N 为所有文档的数目，含有词条文档数目。式有很多变种，下 19 面是一个常用的式： ni 1.0(l o g)()o g ()()( 根据公式，文档集中包含某一词条的文档越多，说明它区分文档类别属性的能力越低，其权值越小；另一方面，某一文档中某一词条出现的频率越高，说明它区分文档内容属性的能力越强，其权值越大。两文档之间的相似度可以用其对应的向量之间的夹角余弦来表示，即文档 ()()()()(c o s),( 进行查询的过程中，先将查询条件要依据布尔模型 : 当中时，将对应的第，否则置为 0，即 1 也就是说当两词条完全相同时，这一项为 1，其余情况为 0。可以看出文档含有完全相同的词条时，相似度 =1；而其中无相同时的词条时，相似度 =0。从而文档的相似度为 ()()(),(根据文档之间的相似度，结合机器学习的一些算法如神经网络算法，以将文档集分类划分为一些小的文档子集。在查询过程中，可以计算出每个文档与查询的相似度，进而可以根据相似度的大小，将查询的结果进行排序。向量空间模型可以实现文档的自动分类和对查询结果的相似度排序，能够有效提高检索效率；它的缺点是相似度的计算量大，当有新文档加入时，则必须重新计算词的权值。 20 流程为 : 文字信息向量化文档映射成一个特征向量查询条件向量化查询图 7 向量空间模型检索流程词技术和匹配方法 1. 常用的切词算法如下： (1)最大正向匹配法基本思想是：设 D 为词典，中的最大词长，是每次从取长度为子串与 D 中的词进行匹配。若成功，则该子串为词，指针后移则子串逐次减一进行匹配。 (2)逆向最大匹配法它的基本原理与前面的相同，不同的是分词的扫描方向，它是从右至左取子串进行匹配。统计结果表明，单纯使用正向最大匹配的错误率为 1/169，单纯使用逆向最大匹配的错误率为 1/245，它切分的准确率上比正向匹配法有很大提高。 (3)基于词频的统计方法 21 统计方法一般不依赖于词典，而是将原文中任意前后紧邻的两个字作为一个词进行出现频率的统计，出现的次数越高，成为一个词的可能性也就越大。在频率超过某个预先设定得阈值时，就将其作为一个词进行索引。这种方法能够有效地提取出未登录词。 2. 匹配方法： (1)词典存储格式：首先对存储形式进行建模，结构是 3层树形结构，如下 A 1A 3A 2A 1 B 1 ( f , n 1 )A 1 C 1 ( t , n 3 )A 1 B 2 ( t , n 2 )A D 1 ( t , n 4 )F 1G 2 H 1G 2H 1 R 1 T 1图 8 3 层树形结构一层存储所有单字。第二层保存所有的双字词和多字词的前两个字（因为，也许会出现词，但是词的情况），并对两者做不同标记 (t/f)。每一个可成词的单字对应一系列第二层结点，用来存储所有以该字为词首的双字（包括上述两种情况）。并且，在这里，针对每一个双字，需要记录以该双字为词首的所有词的最大长度，实际中，可以保存除去该双字部分的最大长度 (记为 n)。第三层存储以某一双字为首的所有词。为了减少存储空间，只存储除去该双字以外的部分（如上图所示）。每一层各结点需按某种次序排列，可使用分查找等方法进行查询。采用这种层次的存储结构，可以很快把查询词的工作缩小到一个很小的范围内，有利于分词效率的提高。 (2)匹配方法由于词库中的最大词长通常大于所切分出的词长，为了提高切分的效率，不采用逐次减一个字的方法，而是使用正向逐一增长的方法。假设对一个句子进行分词处理，算法描述如下： 1) 两个字（开始时为在词典中查询 2) 不存在，则单字词，一次分词结束，返回 1。 22 3) 存在，判断否为词，并从词典中获取该词下层节点汉字的最大长度，设为 n 4) 若 n=0，一次分词结束，保存结果。 5) 否则， i=2，转 6)。 6 ) i=i+1，若 i=n+3，转 8)；否则，转 7)。 7) 再取一个字（此处为判断第三层中是否有以不需要恰好匹配，只要匹配开始的。 8) 若存在，分词结束，返回最近一次能够恰好匹配的 Cj(保证检索精度 80%，从图 12中看出，当相似度临界值 60%。当相似度临界值取检索模型可以保证检索精度 80%，而检索完全度 60%。为决定试从终得出比较合理地反映出图片与这些文本的相关性，保证检索的准确性。 6 总结本文概括介绍了图像检索的现状和发展方向，并对其中几个算法进行了分析和比较。在了解了检索引擎的检索原理公式和反馈原理之后 ,可以根据其理论做出相应的检索引 26 擎 ,并能作出比较检索效果。但为了能更好的使用，还得去仔细更好的给文档进行分类，更多的对此引擎进行反馈训练查询等，使得在毕业论文的过程中，遇到了很多的问题。首先，图像检索的算法对我来说过于深奥，为此我看了很多的关于这方面的算法的研究，大概能知道具体的思路了。本人的水平和技术都很有限，论文里可能存在着某些问题和错误，在这方面希望能得到老师们的体谅，本人也将继续努力。最后，在这个论文的编写中，我确实学到了不少东西，在眼界和思想上都得到了一定的扩展，尤其是关于图像这方面，以前几乎没接触过这方面的知识，现在也能大概知道关于这方面的发展和相关的技术。而我在今后也将更加努力的学习，扩展自己的见识，提高自己的能力。 27 参考文献 1张量，詹国华，袁贞明 .基于 2朱学芳 .多媒体信息处理与检索技术 M，电子工业出版社， 2003： 1673陈滢，徐宏炳，王能斌 .协作式

展开阅读全文

图像检索技术研究【优秀毕业课程设计】

最新文档