互联网信息检索原理

资源描述

互联网信息检索原理I 从信息利用的角度考察，互联网信息资源由哪三方面构成？答：从信息利用的角度考察，互联网信息资源由连接在网上的计算机中的无数信息、网上的各种信息工具以及网络通信渠道三方面构成。2简述网络信息资源的特点。答：网络信息资源的特点是数量庞大、增长迅速；更新频繁、变化无常、分布散乱；良莠混杂。3 .如何正确认识网络信息与印刷性出版物在出版类型上的对应关系？按照出版类型区分，网络信息资源有着和印刷型出版物类似的对应关系。例如，印刷型的期刊有网络期刊与其相对应，印刷型的图书有网络图书与其相对应，印刷型的报告有网络报告与其相对应，如此等等。这种对应关系，仅限于我们对网络文献信息类型的认识，不能应用于具体的文献。例如，早期的印刷型文献一般不会有网络形式，多数的当前印刷型学术文献也不太可能找到对应的网上电子版本。4.何谓原创性网络信息和二次网络信息？按照内容是否具有原创性，网络信息资源有一次资源和二次资源的区分。一次资源是指首次发表的原创性信息，二次资源是转载已有的信息。5 .何谓可见网络信息和不可见网络信息？按照是否属于搜索引擎检索范围，网络信息资源可分为可见资源和不可见资源两类。6. 简述网络可见信息的两个条件。可见资源是搜索引擎可搜索到的资源。这种资源要满足两个条件：一是必须含有 HTML超链接，二是没有设置口令，7. 简述网站和网页的关系。网页是用 HTML或DHTML、XML等语言写成的文本文件。而网站则是有独立的域名，由若干相关网页组成的一个站点。按照微软公司的比喻，如果把WWW当作是Internet上的大型图书馆，则每个Web站点就是一本书，每个Web页面就是书的一页。8. 为什么说网络学术信息不能唾手可得？原因主要有三：一是查找主页信息通常要通过查找搜索引擎之类的中介数据库才能进行。而使用这些工具需要一些专门的技术，希望高效率地查找网络信息时尤其如此。二是一般情况下只使用一两种搜索引擎所得的结果往往是沧海一粟。三是互联网上学术类与非学术类信息的比例是 1 : 10。再则，网上学术信息很多是以不可见资源形式存在着。因此查找网上信息的难度更大一些。9 按工作方式区分的搜索引擎有哪三类搜索引擎？按照工作方式的不同，搜索引擎可以分为主题引擎、目录引擎和多元引擎。10 .简述主题引擎的三个组成部分。主题引擎由三个主要部分构成： Robot、Index和搜索软件。II 请举出典型的国外和国内主题引擎各一个。国外主题引擎的代表是Google，国内代表为百度。12 .为什么主题引擎的分类途径不如目录指南型引擎？主题搜索引擎提供的分类途径或者为自动分类的结果，或是借用其他目录引擎的分类数据（例如Google利用网景公司的Open Directory分类），因而分类检索效果不如由人工仔细分类的目录指南型搜索引擎。13 .简述主题引擎与目录指南型引擎的主要区别。（1 ）信息处理深度, 目录指南型引擎为网站，主题型引擎为网页；（2）信息处理方式，目录指南型引擎为有人工参与，主题型引擎为全自动化；（3）信息的质量和数量, 目录指南型引擎质量上相对较高，主题型引擎数量上相对较多。14 .为什么目录指南型引擎的主题查找效果不如主题型引擎？目录指南型引擎的主题检索只在对站点人工描述语言中进行，查找范围有限，所得结果通常是分类类名和网站名称，结果数量远不如主题引擎。15 .举出国内外目录指南型引擎典型代表各一个。目录引擎的国外代表是 Yahoo !，国内代表有新浪网。16.什么是多元搜索引擎?简述其工作原理。多元引擎是一种起检索中介作用的搜索引擎。多元引擎本身没有存放网页信息的数据库。当用户查询一个关键词时，它把查询请求转换成其他数个搜索引擎能够接受的命令格式，并行地或者有选择性地访问这些搜索引擎并查询这个关键词，处理这些搜索引擎返回的结果，然后再返回给用户。17 .举出国内外多元引擎典型代表各一个。国外多元搜索引擎的代表是Dogpile，国内的代表是万纬等。18 简述中外问搜索引擎的主要区别。中文引擎可以使用英语等外文查找信息，外文引擎也可以使用中文；因而这两种引擎的区别不在于使用的语言，而在于收集和处理信息的侧重点。中文引擎主要收集和处理的信息是中文网页，查找中文资料的效果通常胜过外文引擎。反之，如果需要查找英文信息，直接使用境外英文引擎效果更好。19 .百度引擎的网页快照可以起什么作用？百度服务器通过程序收集网页时，在缓存器中保留了网页备份。“网页快照”即是网页备份的链接。当点击检索结果标题没有结果时，“网页快照”可以用于帮助获取某些“消失”了的网页信息。20分别给出百度引擎限制于URL字段、标题字段和网站字段的检索命令。他们分别是inurl, intitle和site.21.简述百度引擎的三种逻辑运算符。逻辑与为空格，逻辑或为“|”，逻辑非为“ -”22 .什么是虚拟图书馆？虚拟图书馆是一种网络信息利用工具。它针对某一学科或领域的研究者的需要，将互联网上与之有关的各种资源线索，包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URL，进行系统地收集、核实并加以组织，以网站、网页或数据库形式提供给用户浏览或者检索。23 .简述使用虚拟图书馆的场合。使用虚拟图书馆查找信息的场合为: 当时间短促，不允许浏览由搜索引擎查得的巨量的信息时；当希望看到比较可靠的网络信息；当希望对某个领域有个整体的、较全面的了解时。23 .能否以网上信息资源完全代替印刷型文献。哪一些文献的全文更适合从网上获得？目前，网上信息资源不能完全代替印刷型文献，尤其是学术型文献。近几年的国内学术期刊文献、部分国外学术期刊文献和部分专利文献，比较适合于通过网络获取。24 .通过搜索引擎获得的未经审查的各种非正式出版物称为什么文献？通过搜索引擎获得的未经审查的各种非正式出版物称为灰色文献。

展开阅读全文

互联网信息检索原理

最新文档