资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,因特网信息资源检索,搜索引擎(,Search Engine,)是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织的处理,并为用户提供检索服务,从而起到信息导航的目的。,信息检索,目录索引类搜索引擎,全文搜索引擎,baidu,sogou,sina,sohu,按目录类别查找搜索,:,比如,:,查高考资料,选择“,教育,”类目,没找到“高考”,就找“教育”里跟接近“高考”的“,中小学教育,”,找到啦!,按关键词语查找搜索,:,注意啦,要先在这里输入关键字!,现在可以按“搜索”按钮了,点击我就可以进入“高考”有关内容了!,工作原理,全文搜索引擎的工作原理,搜索引擎是如何搜索信息的呢?,你听说过“,网络机器人,”、“,爬虫,”、“,蜘蛛,”吗?,他们只是搜索引擎的一个部分,叫“,搜索器,”,搜索器,定期自动到各网站上抓取网页,搜索引擎的组成,索引器,分析抓取的网页,索引,存入服务器的数据库中,检索器,接收用户提交的关键词,从索引数据库中提取相关资源,显现结果,搜索器,索引器,输入查询表达式,查询结果显示,查询信息排序,采集结果,索引,数据库,检索器,索引,排序,用户查询,查询结果,信息采集,筛选,全文搜索引擎的工作原理:,百度搜索“海南概括”:,百度蜘蛛,输入“海南概括”,查询结果显示,查询信息排序,检索器,索引器,索引,数据库,索引,排序,用户查询,查询结果,检索,中国日报网,爬,中国在线海南概括页面,网址,抓,抽取“海南,、概括”等,关键字,抽取,关联,工作原理,目录索引类搜索引擎的工作原理,(,1,)人工采集和存储网络信息,手工为每个网站确定一个标题,给出大概的描述,建立关键字索引,将其放入相应的类目体系中。,(,2,)网络目录:,按主题性质分类,以某种分类体系为依据,形成由信息链组成的树状结构,即总目录,专题目录,链接,网站,先分领域,后分各科专,题,最后列出网站,特点和区别,目录索引,全文索引,无需输入关键字,可通过浏览主题了解某一主题的相关资源,需要关键字查询,人工采集并存储网络信息,搜索器在因特网中抓取网页,索引器提取、组织并建立数据库,网页内容丰富、学术性较强,信息资源多、复杂,不易了解主题内容,维护费用大、更新速度慢,搜索器定期自动“抓”网页,元搜索引擎,(,1995,年出现)是一种调用其他多个独立搜索引擎的引擎,是对多个独立搜索引擎的整合、调用、控制和优化,能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。,元搜索引擎在搜索的时候,用户只需,提交一次搜索请求,,而且可以,同时搜索多个数据库,,并根据多个搜索引擎的检索结果,进行二次加工,,如对检索结果进行重排和标明检索结果来源等,输出给用户。,缺点:,一般支持,AND,、,OR,、,NOT,等操作,一般只使用简单、直接的搜索策略,并且检索速度也慢。,元搜索引擎,当我们查找图片、音频等信息时,使用综合信息检索引擎通常会找到很多无用的信息,所以搜索效率和有效性都不高。这时,就可以使用特色搜索引擎,(有时是综合信息检索工具中的一个功能),,特色检索工具专门搜集某一类的信息资源,内容丰富,数据量大,能帮助我们迅速找到一些有用的信息,。,此外还有一些专业性质的搜索引擎,如,SOSIG,是专门搜集社会科学信息的信息检索工具(),涉及经济学、哲学、教育、政治、环境科学、心里学、人类学、社会福利、政府管理和妇女研究等信息资源。,特色信息检索工具,以,FTP,、,Telnet,、,Usenet,等资源为检索,对象的检索工具。,如北大天网、,Archic,等。,其他信息检索工具,发展趋势,专业垂直搜索引擎,多媒体信息检索,传统的多媒体数据库中,除了文本和数字还包括图形、图象、声音、视频、动画等各种媒体组合。但多媒体信息具有丰富的内涵,如:,图象的颜色、纹理、形状,,,动画中的运动、声音和音调,等。例如歌曲的,旋律、音调、音质,等难以用文字描述。这正是基于内容的音频检索需要研究和解决的问题,以期达到更深的检索层次和更好的检索效果。,专业垂直类搜索引擎只面向某一个,特定的领域,,专注于自己的,特长和核心技术,,能够保证对该领域信息的,完全收录和及时更新,。,
展开阅读全文