计算机检索的基本原理及过程

上传人:jian****019 文档编号:250605988 上传时间:2024-11-03 格式:PPT 页数:29 大小:291.66KB
返回 下载 相关 举报
计算机检索的基本原理及过程_第1页
第1页 / 共29页
计算机检索的基本原理及过程_第2页
第2页 / 共29页
计算机检索的基本原理及过程_第3页
第3页 / 共29页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,计算机检索的基本原理及过程,目 录,文献数据库的概念,文献数据库检索步骤,主题词关键词的选取,文献数据库的字段检索,检索效果评价,常用检索技术,计算机信息检索实例,1,文献数据库,文献数据库是将各个学科领域、各种专业技术方面的文献信息汇集在一起,经过分门别类的组织、加工、编排后形成的数据库。它能够提供人们方便而快速地,更具针对性地查找各种文献资料的线索或者全文。,文献数据库基本知识,1.1,文献数据库的类型,按收录文献的类型划分,按提供信息的详略划分,图书文献数据库,期刊文献数据库,专利文献数据库,会议文献数据库,文摘数据库,作者,关键词,题名,论文来源,文摘,全文数据库,全文,+,文献数据库基本知识,2、,文献数据库检索步骤,确定检索要求和目标,拟定检索对象范围,主题,词,选择数据库及,检索途径,实施检索并显示检索结果,用,检索技术,优化检索结果,选择输出(打印、拷贝或发送至电子邮箱),2.1 选择检索词,利用主题词表,选取规范化的主题词或词组,利用印刷版的检索工具书,手工试检,根据检出文献的主题词标引情况,选取合适的主题词。,选用自由词,由于词表规模的限制,不可能对某一专业作全面检索时,应考虑选用自由词,尽可能多地选用与课题有关的同义词,以防漏检,。,检索词选取时应注意的问题,避免冷僻词,找出隐性概念,使用核心概念,注意同义词近义词词型变化,2.2,检索途径,作者(文章的责任者),篇名(或题名),机构(如浙江工业大学),关键词(如污水处理、高层建筑),主题词(规范化的主题概念,如用激光不用雷射),文摘(论文或图书的摘要或内容提要),引文(即参考文献),基金(如国家自然科学基金项目),刊名(期刊的名称),全文(或者全记录),逻辑算符,位置算符,截词符,常用命令,2.3 常用检索技术常用算符,逻辑检索概念示意图,A,B,A,B,A,B,A and B,A or B,B not A,与、AND、*,用于概念交叉和限定。起缩小检索范围和提高文献查准率的作用。,例 Solar*Energy,常用算符逻辑算符,或、OR、,用于概念之间并列关系的组配。增加主题的同义词,,以扩大检索范围,避免文献漏检。,例 www+internet+network,常用算符逻辑算符,非、NOT、,从原检索范围中剔除一部分不需要的内容。,例 EnergyNuclear,除核能以外的有关能源方面的文献才被命中。,常用算符逻辑算符,常用算符位置算符,布尔算符中的逻辑“与”只要求两个检索词必须同时出现在同一篇文献中,而没有限定算符两侧检索词之间的位置关系,有时难免造成误检。,常用算符位置算符,例如,查找“细菌对染料破坏”方面的文献,,检索词:细菌、破坏、染料,逻辑“与”组配,检索结果:命中同时用这三个词标引的文献,有“细菌对染料的破坏”方面的文献,,也会有“染料对细菌的破坏”方面的文献,,要排除后一部分的文献,就需用位置算符限定词与词之间的位置关系。,(W)或()算符:“With”的缩写,词序不许颠倒,两词之间不许插词,只许空格或连字符号,例 CD(W)ROM 将命中 CD ROM 或 CD-ROM,solar()energy 检出 solar energy,常用算符位置算符,常用算符位置算符,(nW)算符:“n words”的缩写,(nW)是从(W)算符引伸出来,检索词之间允许插入0n个词,词序不许颠倒,例 anticorrosion(1W)paint,可检出 anticorrosion paint 和 anticorrosion of paint,例 检索“材料磨损”(WEAR OF MATERIALS)方面的文献,,检索式:WEAR(1W)MATERIALS,常用算符位置算符,(N)算符:“Near”的缩写,词序可以颠倒,两词之间不许插词,例 cross(N)section,可检出 cross section 和 section cross,常用算符位置算符,(nN)算符:,(nN)是从(N)算符引伸出来,检索词之间允许插入0n个词,词序可以颠倒,常用算符位置算符,(F)算符:“Field”的缩写,算符两侧的检索词必须在同一字段内,词序及两词间插入的词数不限,例 digital(F)computer/TI,AB,常用算符位置算符,(S)算符:“Sentence”和“Sub-field”的缩写,算符两侧的检索词必须在同一句子,词序及两词间插入的词数不限,常用算符位置算符,上述位置算符可以混合用于同一检索式中,由于检索系统是按从左到右的顺序处理检索式,因此,应将限制最严的算符放在最左边。,非限制性截词:“?”加在词干或不完整的词上,对词的完整意义进行检索。,computer?代表 Computer,computers,computerized等,限制性截词:analy?er 命中记录中将出现analyzer 和analyser;work?命中记录中将出现,work,works,worker,workers,working,常用算符截词符,3、检索效率,检索系统进行检索时产生的有效结果,它直接反映了检索系统性能的好坏。,衡量检索效果的指标,查全率(recall ratio),查准率(precision ratio),检索出的相关文献量,数据库中的全部相关文献,查全率R=,x100%,检索出的相关文献量,检出的文献总量,查准率P=,x100%,最理想的检索结果是查全率和查准率都达到100。,R,100表示数据库中收录的全部相关文献都被检索出来,P,100表示检索出来的文献全部都是相关文献,但事实上,检索中有许多因素使这个指标很难达到,。,R,0,P,查全率R,与查准率P的关系曲线,C,A,D,B,C.W.Cleverdon(英)进行,Granfield试验,得出,查全率R与查准率P曲线。,RP之间存在着互逆关系,A点,检索词数量多,泛指性强,,查全率较高但查准率却非常低,B点,检索词专指性较强,查准率就高,查全率因此降低,C,D,两点,两种极端的折衷。,查全率一般在6070,查准率一般在4050,无论怎样调整检索策略和改进系,统效率,都无法使P和R,同时接近100。,4、计算机检索实例,课题名称:高层建筑的抗震结构设计,课题分析,该课题涉及的主要概念有:高层、建筑、抗震问题和结构设计等方面。,作 业,1、信息素质包括哪几个方面?,2、信息检索活动的功用有哪些?,3、文献按加工深度、出版形式和载体形态分别可分成哪几类?,4、文献检索的工具有哪些?文献数据库可分成哪几种类型?请列举五种检索途径。,5、请查询本校图书馆的馆藏目录,写出5本有关“计算机应用”或“国际贸易”的图书的索书号并简要说明索书号的构成。,6、什么是检索语言,检索语言有几种?请详细列举并进行比较。,7、文献检索的方法有哪些?各自的优缺点是什么?,8、如何提高检索文献的效率并查全查准文献?,9、检索词选取时应注意的问题有哪些?,10、国际商业经济活动中应了解的信息有哪些?(非经贸专业不做),11、请说明计算机检索系统的基本原理及检索过程。,12、布尔逻辑检索、截词检索、词位置检索、加权检索各举一例。,13、通过浏览浙工大图书馆网页,说明图书馆的资源布局,服务项目(包括网上服务项目至少8项)并对网页加以评论(200字以上),
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!