信息检索技术(讲授版)

上传人:biao****biao 文档编号:243095317 上传时间:2024-09-15 格式:PPT 页数:78 大小:2.49MB
返回 下载 相关 举报
信息检索技术(讲授版)_第1页
第1页 / 共78页
信息检索技术(讲授版)_第2页
第2页 / 共78页
信息检索技术(讲授版)_第3页
第3页 / 共78页
点击查看更多>>
资源描述
,单击此处编辑母版文本样式,第二级,*,*,单击此处编辑母版标题样式,信息检索技术,郭伟玲,检索方法,search method,检索方法及检索途径,(一)检索方法,查找,(Searching),就是实施检索策略、搜寻所得文献信息的过程。以下几种方法,无论是计算机还是手工检索,都是常用的方法。,1.,“,拉网法,”,在不了解查询某一专题信息的,URL,地址时,可从提供信息总目的,Web,页面开始浏览,沿着专题链接层层查找,直至找到有关的内容为止。然后用,“,书签,”,保存这个页面的,URL,,转向另一个分支。这种方法可以迅速获得较多的相关地址,然后进行筛选。就使用引擎而言,国外专家也建议先用链接页面多、响应时间快的引擎。,2.,引文法,(,跟踪法,),文献之间的引证和被引证关系揭示了文献之间存在的某种内在联系,引文法,(,也有称为跟踪法,),就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。这些材料指明了与用户需求最密切的文献线索,往往包含了相似的观点、思路、方法,具有启发意义。,引文法又可分为两种,一种是由远及近地搜寻,即找到一篇有价值的论文后进一步查找该论文被哪些其它文献引用过,以便了解后人对该论文的评论、是否有人对此作过进一步研究、实践结果如何、最新的进展怎样等等。由远及近地追寻,越查资料越新,研究也就越深入,但这种查法主要依靠专门的引文索引,如,科学引文索引,、,社会科学引文索引,。,另一种较为普遍的查法是由近及远地追溯,这样由一变十,由十变百地获取更多相关文献,直到满足要求为止。这种方法适合于历史研究或对背景资料的查询, 其缺点是越查材料越旧,追溯得到的文献与现在的研究专题越来越疏远。因此,最好是选择综述、评论和质量较高的专著作为起点,它们所附的参考文献筛选严格,有时还附有评论。,3.,常规法,所谓常规法就是利用常规检索工具查找有关文献的方法,是信息时代应掌握的最基本的信息查找方法。现在对文献的书目控制手段已日趋完善,各种印刷版、缩微版、光盘版和网络版的检索工具层出不穷,有很大的挑选余地。用户应根据自己的检索知识和条件选用一种或几种检索工具。,常规法可分为顺查法、逆查法和抽查法。,4.,排除、限定和合取法,这实际上是将信息加工的方法融入检索中去。思维中使用,排除这一概念,是指对查找对象的产生和存在的状态在时间和空间上加以外在否定。,把这一方法移植到检索中,就是在时间或空间上极大地收缩检索范围。,限定法是相对于排除法而言的,指对查找对象在时间和空间上加以内在的肯定,。排除的结果必然是限定,反之亦然。,(二)检索途径(检索入口),所谓检索途径就是检索时切入信息群体的路径。,检索途径有两大类,一类是用信息的外部特征,如题名、责任者、某种序号、机构名等作为检索标识;另一类是用能够描述信息内容的分类号、关键词、主题词等作为检索标识。在数据库中检索时,几乎所有的字段都可以作为检索的途径。,分类检索,这种检索是根据信息内容的学科分类来进行的。最大的优点能保证信息的系统性,而且具有较好的族性检索功能。,分类检索的要点:,1,。对待检课题的概念及学科间的各种关系清楚;,2,。正确掌握相关课题的分类名称、分类号,手工检索中掌握工具的分类排检。,分类检索的步骤:,1,。分析待检课题,确定其学科,并厘清学科间的各种关系。,2,。查出待检课题的分类号(工具简单时可以省略),3,。选择适当的检索工具,4,。进入检索系统后选择分类号途径,并在对话框内输入分类号,开始检索。,5,。对比题目,阅览相关信息,选出所需信息,并下载相关信息,6,。原文的索取,类号,F204,科学技术管理,类名,国家科技管理入,此;,项目评价理,论方法入,F224.5.,参见,G311,。,注释和,参照,类级,(用空格、并行和字体表示),中图法,结构,1,)类目结构,3/18,中图法,共,五大部类,,二十二个大类,,53,811,个类目,(,包括专用和通用类目,),。,部类,大类,(一级类目,),二级类目,三级类目,四级类目,五级类目,中图法,8,种复分表,4/18,中图法,结构,1,)类目结构,中图法,五大部类,马克思主义、列宁主义、毛泽东思想,自然科学,哲学 宗教,社会科学,综合性图书,5/18,中图法,结构,1,)类目结构,F,经济,一级类目,6/18,F,、经济类,F0,经济学,F5,交通运输经济,F7,贸易经济,F6,邮电经济,F4,工业经济,F3,农业经济,F2,经济计划与管理,F1,世界各国经济概况、经济史、经济地理,F8,财政、金融,二级类目,7/18,三级类目,F2,经济计划与管理,F20,国民经济管理,F25,物质经济,F28,基本建设经济,F27,企业经济,F24,劳动经济,F23,会计,F22,经济计算、经济数学方法,F21,计划经济,F29,城市与市政经济,8/18,F25,物质经济,F250,物质经济理论,F259,世界各国物质经济,F253,物质企业经营与管理,F252,物质流通,F251,物质管理,四级类目,9/18,14/18,中图法,标记制度,1.,采用字母、数字混合制的标记符号与层累小数制的标记制度。其中,字母用来表示大类,其他各级类目则用数字表示。,“,T,工业技术,“,大类范围广泛,内容繁多,故又在该类基础上采用双位拉丁字母标记所属的,16,个二级类目。,2.,对于超过,10,个同位类时,采用八分制,(1,8 91 92),或双位制,(11 12,99),。,3.,间隔符号,.,置于字母段后自左至右没三位数字后。,4.,推荐符号,a,置于马克思、恩格斯、列宁、斯大林、毛泽东、邓小平六位经典作家著作的互见分类好之后。,5.,总论复分符号,-,国家、地区区分号() 时代区分号,=,名族、种族区分号,“,”,通用时间、地点区分号,起止符号,/,6.,组配符号:置于相组配的类号之间,表示主类号之间的概念交叉组配。,7.,联合符号,+,当文献具有多个并列关系的主题时,需相应赋予多个分类号以表达并列主题。,辅助符号的排列次序:,-,(),“,”,= : +,15/18,中图法,标记制度,例,1,:,哲学辞典,类号为,“,B-61,”,,,“,-61,”,是总论复分号,表示辞典。,例,2,:,法国的邮电事业,的类号为,“,F635.65,”,,,“,F63,”,代表世界各国 邮电事业,,“,565,”,为世界地区复分号,是法国的代号。如主表类目没有注明依世界地区表复分时,则在世界地区复分号上加国家区分号,“,(),”,以示区别,例,3,:,上海市现代摄影作品集,是,“,J426.51,”,,,“,J426,”,代表现代摄影作品集,,“,51,”,为中国地区复分号,指上海市。,例,4,:,“,F813,817,”,各国财政,表明日本财政为,F813.13,,英国财政为,F815.61,,美国财政为,F817.12,。,16/18,检索实习题举例:,图书馆图书标识:索书号,图书馆同一分类号的文献数量很多,为了区别相同类号的文献,在分类号的基础上,又给了一个区分符号,这个符号称之为书次号。书次号与分类号一起共同构成索书号。浙江传媒学院图书馆的文献就是按照索书号的顺序排架管理的,书次号使用的是著者号,同样以字母+数字标明。,。,中文书索书号如:,G,25,4.97,/,Q097=2,17/18,案例,课题:工农业废水的循环利用的研究,分类号分析:,该课题的学科分类主要属于环境科学类,跨工业农业学科,;,根据,中国图书馆分类法,,涉及“废水再利用”及其分类号“,X70”,;,工业,分类号,T,;,农业,分类号为,S,;进一步查找,中图法,得出分类号:,X703,学校图书馆内检索,根据分类号检索的几种结果,1,分类号为,X703/M14,2,分类号为,X703/A42,3,分类号为,X703/L4,词汇检索,与分类号检索相比,词汇检索具有直观、灵活、专指性和适应性好的特点,同时检索速度也比分类检索快。,词汇检索的要点:首先是要选好检索词,正确理解词间关系,检索中还要注意词间关系的正确表达。,常用的词汇检索有关键词检索和主题检索。计算机检索时,选择任意字段检索时,检索项也可以是各种词汇。,词汇检索的步骤:,a,、 分析课题,确定检索词及词间关系,b,、选择适当的检索工具,c,、选择词汇检索途径,在对话框内输入检索词 (注意词间关系的表达),d,、 根据快捷显示,选出有用信息并下载。,e,、 原文的索取,其他检索途径,1,、题名检索,包括书名、刊名、篇名和其他信息的标题等,2,、作者,3,、机构,4,、号码,分类号、 报告号、登记号、专利号、,ISBN,、,ISSN,记录号等,5,、来源,6,、其他特殊途径,(,1,)检索字段数据库可供检索字段有二种,一种是反映内容的主题字段,如:题名、叙词、 标识词和文摘等。字段检索时,使用后缀符如:如:,/TI,表示,Title,(篇名),/AB,表示,Abstract,(文摘),/DE,表示,Descriptor,(叙词,规范词)例如:,electron/ti,表示,electron,一词须出现在篇名字段;,electron/ti,ab,表示,electron,一词须出现在篇名或文摘字段。,后缀代码(,suffix code,),对应基本索引(,basic index,),反映文献的主题内容,将字段代码放在检索词之后,并用“,/”,号连接。 另一种则是反映形式特征的检索字段,如:作者、文献类型、语种、出版时间等。 前缀代码(,prefix code,),往往是用于表达文献外部特征的字段,即一些辅助性检索字段,将字段代码放在检索词之前,用号连接。 如:,AN=EIP98124488325,(,AN,:,Abstract Number),文摘号,AU=LIU,LITIAN,(,AU,:,Author,)作者,BN=0-8155-0963-4,(,BN,:,ISBN,)国际标准书号,CD=19880520,(,CD,:,Conference Date,)会议召开日期,AU=Salton? AND PY=199?,表示查找,Salton,所写的,并且是,1990,年后发表的所有文献。,(,2,)限制符 在一些检索系统中,提供一类表示文献类型、文种、出版时间等的限制符号,放在检索式的右边,起到约束检索结果的效果。 限制符的使用和字段检索一样,也要遵循所选检索系统和数据库的规定。 如在,DIALOG,系统中:,/ENG -,要求在英语出版物中检索,/NONENG-,要求在非英语出版物中检索,/1998,:,2000-,要求在,1998-2000,年的出版物中检索,Chess/PAT-,表示检索结果只要,chess,这一主题的专利文献,。,基本检索技术,search skill,1.检索算符,2.检索策略,3.检索评价,检索算符,1,、布尔检索,AND,(默认、空格、,+,、,all of these words,),OR,(,必须大写,关键词,1,、关键词,2,,,|,,,/,any of,these words,),NOT,(,-, none of these words,),NEAR,下面以“计算机”和“文献检索” 两个词来解释三种逻辑算符的含义。,计算机”,AND“,文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。,计算机”,OR“,文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。,计算机”,NOT“,文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。,这里需要说明的是,在,Windows,环境下,尤其是在中文数据库及网站中,逻辑检索可以用算符将检索要求编成综合表达式向计算机一次输入检索提问,也可以用窗口上的逻辑指令按钮(与、或、非)进行分步组配提问和检索。,案例,布尔逻辑算符,布尔逻辑算符是规定检索词之间逻辑关系的算符,利用布尔逻辑算符进行检索词或代码的逻辑组配,是计算机信息检索系统中最常用的一种检索方法,也称布尔检索。,布尔逻辑算符通常包括以下三种:,(,1,)逻辑,“,或,”,:,(OR),或,“,+”,表示,(,2,)逻辑,“,与,”,:,(AND),或,“*”,表示,(,3,)逻辑,“,非,”,:,(NOT),或,“,-”,表示,(,1,)逻辑,“,与,”,(,AND,或,*,),逻辑“与” (,AND,),是用来组配具有相互交叉限定关系的检索概念。逻辑“与”有时也用,“*”,代替,其含义是检出的记录中同时含有“,AND,”前后两个检索词。如:查找有关,“,纳米,”,和“材料”方面的文献时,其检索式为:,Nano AND Materials,Nano,*,Materials,当,你希望所找的文章中包含两个或两个以上的检索概念时,你可以在检索式中用,“,AND,”,将这些关键词连接起来,表示这些关键词必须同时出现在记录中的某处。使用,“,AND,”,将缩小检索范围。,如:,students AND Internet,输入上面这个检索式,会找到关于,students,和,internet,同时出现的文章,只包含其中一个词的文章是不会被检索到的。因此,在连接不同概念的检索词时,,AND,是非常有用的。在一个检索式中,,AND,可以被使用多次。,如,: students AND Internet AND assignments,有的中文数据库用,“,*,”,来代替,AND,就象下面的这个例子。当然,不是所有的中文数据库都支持这种用法,你可以查看帮助文件加以确认。,如:学生 * 互联网,(,2),逻辑,“,或,”,:用,“,OR,”,或,“,+,”,表示,在检索中,你也可以用,逻辑“或”(,OR,),连接关键词。检索式(,A OR B,)可以检索到包含,A,或者,B,或者,A,和,B,同时出现的文献。,OR,最好用于针对一个概念的同义词检索。很显然,使用,OR,可以扩大检索范围。,例如,Internet OR Web,使用上面这个检索式,使用了网络的同义词。,会找到有关,Internet,或,Web,的文献或,Internet,与,Web,同时出现的文献。,也可以在一次搜索中多次使用,OR,:,如:,Internet OR Web OR online,OR,digital OR wired,有的中文数据库在使用,OR,时需用,“,+”,来代替:,互联网,+,网络,+,在线,OR,用于组配具有并列关系、概念相同或相近的检索词,如同义词、相关词等。用,OR,算符的基本作用是扩大检索范围,增加命中的文献量,提高检索的查全率。,如:查找“肿瘤”的检索式为:,cancer,(癌),or tumor,(瘤),or carcinoma,(癌),(,3,)逻辑非:,“,not”,或,“,-”,表示,NOT,的含义是排除,意味着在检索结果中只出现其中的一个关键词而不应出现另一个关键词。,例如,:,computer NOT software,输入上面这个检索式,会检索到有关,computer,的文章,但这些文章中不应包括和,software,相关的内容。,需要注意的是,有的中文数据库在使用,NOT,时需用,“,-”,来代替,就象下面的例子。当然,不是所有的中文数据库都支持这种用法,你可以查看帮助文件加以确认,.,如:计算机,-,软件,上,述检索式用于查找只出现计算机而不出现计算机软件的文献,用于连接排除关系的检索词,即排除不需要的和影响检索结果的概念。用,NOT,连接检索词,A,和检索词,B,,,检索式为:,A NOT B (,或,A,B),表示检索含有检索词,A,而不含检索词,B,的信息,即将包含检索词,B,的信息集合排除掉。,如:查找“动物的乙肝病毒”的文献的检索式为:,hepatitis B virus,(乙肝病毒),not human,(人类),图(,a),图(,b),图(,c),例,检索水稻和小麦不包括除草和施肥有关栽培的文献,(,水稻,+,小麦,) *,栽培,-,(,除草,+,施肥,) in TI,例,计算机内存管理机制分析 其检索式为:,(Memory management) AND mechanism AND,(,analysis OR analyze,),在这个检索式中,包含了,4,个概念,这,4,个概念用单元词或词组表示,将这,4,个概念用布尔逻辑算符,AND,和,OR,以及括号()连接起来,即构成一个检索式。,例,综合分析治疗乙型肝炎的中药的信息,(乙型肝炎,OR,乙肝)(中药,OR,中成药,OR,中草药),或者(乙型肝炎,+,乙肝)(中药,+,中成药),【,例,】,中国西部的土地利用,(,西部,+,新疆,+,青海,+,甘肃,+,宁夏,)*(,土地,+,利用,)*,土地,(Land or ground or earth or soil) and (use or explitage or utilization) and (west* and China),【,例,】,工农业废水的循环利用的研究,(,工业,+,农业,)*(,废水,+,污水,)*(,循环利用,+,再生利用,),注意!,检索式可以表达复杂的检索提问,将各个检索点、不同属性值、不同的关系统统组织在一个检索式中,完成检索任务。 拟好检索式后,就要选择检索途径或检索字段。不同的数据库其检索式的表达略有不同,如要求在题名里检索:,Artificial neural networks AND forecastingEI,数据库中的检索式为:,(Artificial neural networks) WN TI) AND (forecasting) WN TI),SCI,数据库中的检索式为:,TI =(Artificial neural networks) AND TI =(forecasting),故在检索前应有所了解。以免影响检索质量和检索效果。,在,EI,数据库的检索结果中的检索式,检索式,例如:用,Google,高级搜索在网页标题中查找有关“全球”和“金融危机”的网页的检索式:,检索式,2.,截词检索,(*、?),截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。按截断的位置来分,截词可有后截断、前截断、中截断三种类型。按截断字符数量分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。,综合搜索引擎一般不支持截词检索,后截断,中截断,前截断,无限截断,如,: economic,?,?,有限截断,截词检索与截词检索算符,economic,economic,s,economic,st,economic,alism,economic,economic,s,economic,st,如,: economic,*,如:,wom,?,n,woman,women,一般仅允许有限截断,如,:,?,lish,sul*ur,sul,f,ur,sul,ph,ur,无限截断,有限截断,前后截断,如,:,?computer,?,可检出,: computer,、,computer,s,、,computer,ize,、,computer,ized,、,mini,computer,、,mini,computer,s,、,micro,computer,、,micro,computer,s,3,、位置检索,位置检索一般用用来限制检索项之间的位置关系和前后次序。其目的是增强检索项组配的灵活性,更准确地表达复杂的检索概念。常用的位置算符有以下几种:,邻近位置算符(,W,),(,W,)算符也可以简写为()算符,,A,(,W,),B,,表示,A,紧挨着,B,,并且顺序不能颠倒。,A,和,B,之间除允许有一个空格、一个标志符号或一个连接号以外,不得插入任何单位或字母。,邻词位置算符(,nw,),A(nw)B,,表示两个词的次序不变,其间可以插入,n,个词。,句子位置算符(,S,),A(s)B,表,A,和,B,必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,,A,与,B,之间可以有若干个其他的词。,字段位置符(,F,),A,(,F,),B,,表示,A,和,B,必须同时出现在记录的同一个字段之中,但位置和次序不限,两者之间还可以任意加词。如,Rice(F)Genetics/Ti,要求,Rice,和,Genetics,必在同时出现在篇名之中。,(字段标识符:,TI,、,AU,、,AB,、,SO,、,PY,、,LA,、,DE,、,TN,),记录位置算符(,C,),A,(,C,),B,其作用等同于,A and B,,均表示,A,和,B,同时出现在同一记录内,但词序不限,也不要求在同一字段内。,4,、加权检索,这种检索是对检索词之间的关系从量上加以限制。通过判定检索词或字符串在检索中对信息命中与否的影响程度,根据权值的大小依序输出结果。,5,、字符串检索(词组检索或短语检索),这种检索将字符串当作一个独立的运算单元,进行严格地匹配。,6,、概念检索,同时对同义词、近义词、广义词、狭义词进行检索。,7,、深入检索(二次检索),指在检索结果中作进一步查询,以得到更精确的结果。,8,、模糊检索与精确匹配,9,、自然语言检索,(,Ask Jeeves,)、实名检索(,3721,),10,、组合检索:,检索项组合、检索途径组合、分次检索结果组合等、,11,、限定检索,就是将检索词限定在一定的范围内进行检索,(,1,)限定网站,【,实例,】,输入“金庸 古龙,site,:,”,搜索包含“金庸”和“古龙”的中文新浪网站页面。,(,2,)限定网页,【,实例,】,输入“,inurl:midi,沧海一声笑”查找,MIDI,曲“沧海一声笑”。,【,实例,】,输入,inurl:plog/register.php,,搜索,plog,注册文件,(,现在用的很普遍的一套,PHP,博客程序,在其安装说明中明确说明希望用户安装后删除,register.php,文件,),。,【,实例,】,输入“,inurl ecurity windows,10,site:”,查找微软网站上关于,windows,1,0,的安全课题资料。,(,3,)限定标题,【,实例,】,输入“,intitle:,张娜拉 写真”查找韩国张娜拉的照片集。,(,4,)限定文件类型,【,实例,】,输入,filetype:lit lit (booksebooks),,搜索网络图书(,FILETYPE,可以更换)。,【,实例,】,利用后缀名来搜索电子书,输入“存在与虚无,chm”,、“菜根谭,exe”,、 “水煮三国,chm ”,。,(,5,)其他类型限定,【,实例,】,输入“,related: inurl:(service or authors or administrators or users),,搜索密码文件。,6,信息检索的基本步骤,分析检索课题,1.,主题概念,2.,信息类型,3.,时间范围,4.,检索目的,构造检索式,(试验性检索),1.简单提问式,2.上下文提问式,3.复合提问式,4.结构性提问式,调整检索策略(正式检索),1,信息量过多时,2.,信息量太少时,输出检索结果,1.,文摘,2.,全文,选择检索系统,1.,学科范围,2.,系统类型,3.,系统功能,确定检索词,1.,切分,2.,删除,3.,替补,4.,组合,5.,增加,用户评价,确定检索词,1,切分,切分是对课题的语句以自由词为单位进行拆分,转换为检索的最小单元。自由词切分仅适用于自然语言检索。,例,1,:检索“妇女吸烟与肺癌的关系研究”相关文献。,直接切分:,妇女,|,吸烟,|,与,|,肺癌,|,的,|,关系,|,研究),注意,当词切分后将失去原来的意思时,不应再切分,如“中国科学院”、“电子邮件”,2,删除,删除是对自然语言中不具有实质性检索意义的,虚词,(如介词、连词、副词等),或者,使用频率较低的词,,或者,专指性太高、过分宽泛的词,,或者,过分具体的限定词、禁用词,,或者,不能表达课题实质的高频词,,或者存在蕴含关系,可以合并的词,,一律予以删除,使自然语言转换成为关键词和主题词的集合。,例,2,:检索“中国,IT,业的发展前景研究”方面的相关文献。进行拆分以后,,发展、前景、研究,这三个自由词具有一定的检索意义,但是由于或者是意义过于宽泛、或者是不能表达课题实质、或者是存在蕴含关系的原因,没有必要全部作为检索词,根据需要可以保留,1-2,个作为检索词。,3,替补,替补就是在进行切分、删除后,对检索词进行替换和补充。,“公交”应替换为:公共交通;,“绿色包装”中的“绿色”,应替换为:环保、无污染、可降解;,“煤气中毒”应替换为:一氧化碳中毒;,“非典”应考虑补充:,SARS,、非典型肺炎、传染性非典型肺炎、严重急性呼吸综合征(,severe acute respiratory syndrome,),;,4,增加,增加“限义词”。有两种方法:直接增加限义词、挖掘隐含词、提取潜在的检索词;把限义词以逻辑的方式加入,可采用逻辑“与”或逻辑“非”的方法增加限义词。,分析隐含概念。挖掘潜在的主题词还可以通过对上位词、下位词、同类词关系的分析得到其它相关主题词。如例,1,:“妇女吸烟与肺癌的关系研究”,切分、删除后得:吸烟、肺癌两个检索词,分析、补充上位词可增加检索词:,烟、癌症、恶性肿瘤,。,构造检索式(试验性检索),所谓的,检索提问式,(,query,,,search formulation,),是信息检索中用来表达用户检索提问的逻辑表达式,主要是使用各种,布尔逻辑算符、位置算符、截词符、限制算符,以及系统规定的其他组配连接符号将检索词进行,组配,,确定检索词之间的概念关系或位置关系,。,简单提问式,含一个检索词的提问式;,上下文提问式,精确短语或近似精确短语的提问式,也可称为短语提问式;,复合提问式,含有布尔算符和至少,2,个检索词的提问式;,结构性提问式,含有,2,个以上布尔算符和至少,4,个检索词的多层结构组合的提问式。,例如:,“华中农业大学研究生招生”,计算机*网络安全,-,病毒,番茄*基因*(果实成熟,+,果实软化,+,耐贮藏,+,衰老,+,滞绿,+,叶绿素降解),课题:地震序列分析的工具和方法研究,要完成本项检索课题,必须使用结构性提问式:,(“sequence analysis” IN TI) AND (method* OR tool* OR instrument*) IN,A,B ),AND (Seismic OR earthquake),2.,检索策略,执行一个课题的检索是有过程、分步来完成的,检索步骤的科学安排称为检索策略(,search strategy,) ,它是为实现检索目标而制定的全盘计划或方案。,信息检索的基本流程,分析检索要求,选择数,据库,确定检索词,构成检索式,提交计算机,结果显示,完成,满意,修改检索式,不满意,5,调整检索策略(正式检索),所谓,检索策略,(,search strategy,)就是为完成检索课题,实现检索目的,对检索的全过程进行谋划之后所制定的全盘检索方案。,在实施检索时,应及时分析检索结果,与检索的内容、目的和要求是否一致,,同时根据,检索结果的多少,对检索策略进行相应的修改和调整,以获得最佳的,查全率,和,查准率,,直至得到比较满意的检索结果为止。,调整检索策略(正式检索),1,当检索结果信息量过多时,原因,:选用了多义性的检索词;截词截得过短;输入的检索词太少;应该使用“与(,AND,)”的使用了“或(,OR,)”;优先运算符“()”使用错误。,考虑缩小检索范围,方法如下:,(,1,)采用专指性强的主题词(主题词表),减少同义词、同族相关词等相关性不强的检索词;,(,2,)增加限制概念,采用“,AND”,算符连接检索词或进行二次检索;,(,3,)使用字段限定,把检索词限定在题目、主题词等主要字段;,(,4,)缩短检索年限,限制检索结果的文献类型、语种及出版国;,(,5,)使用“,NOT”,算符,排除无关概念;,(,6,)调整位置算符,由松变严;,(,7,)改模糊检索为精确检索。,2,当检索结果信息量太少时,原因,:检索词拼写错误;遗漏重要的同义词或隐含概念;检索词过于冷僻具体;没有使用截词算符;位置算符和字段算符使用的过多;使用过多的“,AND”,算符。,考虑扩大检索范围,方法如下:,(,1,)根据分类结构体系扩展关键的检索词,用“扩展”按钮增加同义词和相关词并用“,OR”,算符连接这些词;,(,2,)降低检索词的专指度,可从词表或检出文献中选择上位词或泛指词补充到检索式中;,(,3,)减少检索年限、文献类型、语种及出版国的限制,如增加回溯检索年限;,(,4,)取消某些限制过严的字段限制、位置算符限制(或者改用限制程度较小的位置算符),(,5,)在词干相同的单词后使用截词符(?或*);,(,6,)改精确检索为模糊检索;,(,7,)同时使用拼写正确的词,以及拼写错误的词或存在多种普遍错别字的词作为检索词。,例如:,要求在,INSPEC,数据库中检索,“,TITLE,”,(题名)字段中同时包含,network payment,(网络支付)和,security,(安全)的文献;检索年代范围为:,2010,2011,年,检索结果:,1,条,扩大检索条件,由于检索结果太少,所以应扩大检索条件,将上述例子中的检索字段由“题名”更改为 “,Abstract”,(文摘);,检索年代范围,扩大为:,20052011年,检索结果:,188,条,(由此可见,经过调整检索策略后,检索结果从,1,条增加为,188,条,大大的改善了检索结果,),
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!