互联网信息检索原理

上传人:shug****ng1 文档编号:180395120 上传时间:2023-01-06 格式:DOCX 页数:4 大小:12.22KB
返回 下载 相关 举报
互联网信息检索原理_第1页
第1页 / 共4页
互联网信息检索原理_第2页
第2页 / 共4页
互联网信息检索原理_第3页
第3页 / 共4页
点击查看更多>>
资源描述
互联网信息检索原理I 从信息利用的角度考察,互联网信息资源由哪三方面构成?答:从 信息利用的角度考察,互联网信息资源由连接在网上的计算机中的无数信 息、网上的各种信息工具以及网络通信渠道三方面构成。2简述网络信息资源的特点。答:网络信息资源的特点是数量庞大、 增长迅速;更新频繁、变化无常、分布散乱;良莠混杂。3 .如何正确认识网络信息与印刷性出版物在出版类型上的对应关系? 按照出版类型区分,网络信息资源有着和印刷型出版物类似的对应关系。 例如,印刷型的期刊有网络期刊与其相对应,印刷型的图书有网络图书与 其相对应,印刷型的报告有网络报告与其相对应,如此等等。这种对应关 系,仅限于我们对网络文献信息类型的认识,不能应用于具体的文献。例 如,早期的印刷型文献一般不会有网络形式,多数的当前印刷型学术文献 也不太可能找到对应的网上电子版本。4.何谓原创性网络信息和二次网络信息?按照内容是否具有原创性, 网络信息资源有一次资源和二次资源的区分。一次资源是指首次发表的原 创性信息,二次资源是转载已有的信息。5 .何谓可见网络信息和不可见网络信息?按照是否属于搜索引擎检索 范围,网络信息资源可分为可见资源和不可见资源两类。6. 简述网络可见信息的两个条件。可见资源是搜索引擎可搜索到的资 源。这种资源要满足两个条件:一是必须含有 HTML超链接,二是没有设置 口令,7. 简述网站和网页的关系。网页是用 HTML或DHTML、XML等语言写成 的文本文件。而网站则是有独立的域名,由若干相关网页组成的一个站点。 按照微软公司的比喻,如果把WWW当作是Internet上的大型图书馆,则每 个Web站点就是一本书,每个Web页面就是书的一页。8. 为什么说网络学术信息不能唾手可得?原因主要有三:一是查找主 页信息通常要通过查找搜索引擎之类的中介数据库才能进行。而使用这些 工具需要一些专门的技术,希望高效率地查找网络信息时尤其如此。二是 一般情况下只使用一两种搜索引擎所得的结果往往是沧海一粟。三是互联网上学术类与非学术类信息的比例是 1 : 10。再则,网上学术信息很多是以 不可见资源形式存在着。因此查找网上信息的难度更大一些。9 按工作方式区分的搜索引擎有哪三类搜索引擎?按照工作方式的不同,搜索引擎可 以分为主题引擎、目录引擎和多元引擎。10 .简述主题引擎的三个组成部分。主题引擎由三个主要部分构成: Robot、Index和搜索软件。II 请举出典型的国外和国内主题引擎各一个。国外主题引擎的代表 是Google,国内代表为百度。12 .为什么主题引擎的分类途径不如目录指南型引擎?主题搜索引擎 提供的分类途径或者为自动分类的结果,或是借用其他目录引擎的分类数据(例如Google利用网景公司的Open Directory分类),因而分类检索效 果不如由人工仔细分类的目录指南型搜索引擎。13 .简述主题引擎与目录指南型引擎的主要区别。 (1 )信息处理深度, 目录指南型引擎为网站,主题型引擎为网页;(2)信息处理方式,目录指 南型引擎为有人工参与,主题型引擎为全自动化; (3)信息的质量和数量, 目录指南型引擎质量上相对较高,主题型引擎数量上相对较多。14 .为什么目录指南型引擎的主题查找效果不如主题型引擎?目录指 南型引擎的主题检索只在对站点人工描述语言中进行,查找范围有限,所 得结果通常是分类类名和网站名称,结果数量远不如主题引擎。15 .举出国内外目录指南型引擎典型代表各一个。目录引擎的国外代 表是 Yahoo !,国内代表有新浪网。16.什么是多元搜索引擎?简述其工作原理。多元引擎是一种起检索 中介作用的搜索引擎。多元引擎本身没有存放网页信息的数据库。当用户 查询一个关键词时,它把查询请求转换成其他数个搜索引擎能够接受的命 令格式,并行地或者有选择性地访问这些搜索引擎并查询这个关键词,处 理这些搜索引擎返回的结果,然后再返回给用户。17 .举出国内外多元引擎典型代表各一个。国外多元搜索引擎的代表 是Dogpile,国内的代表是万纬等。18 简述中外问搜索引擎的主要区别。中文引擎可以使用英语等外文 查找信息,外文引擎也可以使用中文;因而这两种引擎的区别不在于使用 的语言,而在于收集和处理信息的侧重点。中文引擎主要收集和处理的信 息是中文网页,查找中文资料的效果通常胜过外文引擎。反之,如果需要 查找英文信息,直接使用境外英文引擎效果更好。19 .百度引擎的网页快照可以起什么作用?百度服务器通过程序收集 网页时,在缓存器中保留了网页备份。“网页快照”即是网页备份的链接。 当点击检索结果标题没有结果时,“网页快照”可以用于帮助获取某些“消失”了的网页信息。20分别给出百度引擎限制于URL字段、标题字段和网站字段的检索 命令。他们分别是inurl, intitle和site.21.简述百度引擎的三种逻辑运算符。逻辑与为空格,逻辑或为“|”, 逻辑非为“ -”22 .什么是虚拟图书馆?虚拟图书馆是一种网络信息利用工具。它针 对某一学科或领域的研究者的需要,将互联网上与之有关的各种资源线索, 包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URL,进行系统地收集、核实并加以组织,以网站、 网页或数据库形式提供给用户浏览或者检索。23 .简述使用虚拟图书馆的场合。使用虚拟图书馆查找信息的场合为: 当时间短促,不允许浏览由搜索引擎查得的巨量的信息时;当希望看到比 较可靠的网络信息;当希望对某个领域有个整体的、较全面的了解时。23 .能否以网上信息资源完全代替印刷型文献。哪一些文献的全文更 适合从网上获得?目前,网上信息资源不能完全代替印刷型文献,尤其是 学术型文献。近几年的国内学术期刊文献、部分国外学术期刊文献和部分 专利文献,比较适合于通过网络获取。24 .通过搜索引擎获得的未经审查的各种非正式出版物称为什么文 献?通过搜索引擎获得的未经审查的各种非正式出版物称为灰色文献。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!