信息检索策略

上传人:t****d 文档编号:243398652 上传时间:2024-09-22 格式:PPT 页数:49 大小:231.50KB
返回 下载 相关 举报
信息检索策略_第1页
第1页 / 共49页
信息检索策略_第2页
第2页 / 共49页
信息检索策略_第3页
第3页 / 共49页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,2.5信息检索的策略,检索策略就是在检索过程中如何高效率实施检索的途径、方法和步骤。,2.5.1信息检索的途径,2.5.2信息检索方法,2.5.3信息检索技术,2.5.4信息检索步骤,9/22/2024,1,2.5.1信息检索途径(示意图),9/22/2024,2,2.5.2 信息检索方法(示意图),9/22/2024,3,2.5.3 计算机信息检索的技术,信息检索技术是指信息检索过程的原理、方法、策略、设备条件和检索手段等因素的总称。,主要介绍电子信息检索的技术。,电子信息检索过程中,为保证检索结果准确全面、经济高效,各种检索系统均为用户提供了多种不同的检索功能,其中使用比较普遍的有以下几种。,9/22/2024,4,2.5.3 计算机信息检索的技术,1.布尔逻辑检索,利用布尔逻辑算符对检索词或代码进行逻辑组配,是信息检索系统中最基本、最常用的一种检索技术。,常用的布尔逻辑算符有:逻辑“或”、逻辑“与”和逻辑“非”。,9/22/2024,5,2.5.3 计算机信息检索的技术,1.布尔逻辑检索,(1)逻辑“或”(用“OR”或“”表示),逻辑“或”是用来组配具有同义或同族关系的词,,如同义词、相关词等。其含义是,检出的记录中,至少含有两个检索词当中的一个。(如:“汽车”和“车辆”是相关词),“OR” 算符的基本作用是扩大检索范围,,增加命中文献量,防止漏检,,提高检索结果的查全率。,9/22/2024,6,2.5.3 计算机信息检索的技术,1.布尔逻辑检索,(2)逻辑“与”(用“AND”或“”表示),逻辑“与”是一种用于交叉和限定关系的组配。,其含义是检出的记录必须同时含有所有的检索词。,其基本作用是缩小检索范围,减少命中的文献量,有利于提高查准率。,逻辑“与”一般用于组配不同概念的检索词。,(,如查找我校某教师发表的文章,解决同名问题,用“AND”组配可提高查准率,如“刘红光”/作者字段 AND“江苏大学”/机构字段AND“汽车”/关键词字段;,如 “刘红光” 、“江苏大学”就是不同概念的检索词。,9/22/2024,7,2.5.3 计算机信息检索的技术,1.布尔逻辑检索,(3)逻辑“非”(用“NOT”或“-”表示),逻辑“非”是一种排斥关系的组配,用于在某一记录集合中排除含有某一概念的记录。,逻辑“非”的基本作用是缩小检索范围,起到减少输出文献量的作用。,例如:在含有概念A的集合中排除含有概念,B的记录,可表示为“ANOTB”或“AB”。,如:如“刘红光”/作者字段 AND“江苏大学”/机构字段NOT“汽车”/关键词字段;,如:“激光加工” NOT “激光切割”,9/22/2024,8,2.5.3 计算机信息检索的技术,布尔逻辑检索图示,9/22/2024,9,1、布尔逻辑检索,布尔逻辑算符的,优先级顺序为,NOT,,,AND,,,OR,。,另外可以,使用括号,改变它们之间的运算顺序。,应注意,对于同一个布尔逻辑提问式来说,,不同的运算顺序会有不同的检索结果,。,9/22/2024,10,2.5.3计算机信息检索的技术,2.截词检索,截词检索是预防漏检、提高查全率的一种常用检索技术。,根据词的截断位置划分为后方截词、前方截词、中间截词三种类型。,根据截断的字符数量划分为有限截断和无限截断两种类型。,主要用于英文数据库的检索。,9/22/2024,11,2.5.3计算机信息检索的技术,(1)后方截词,也称前方一致检索。将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。,例1:comput* 可检出computer,computing,computers,computation等。,例2:acid?可检出acid acidic acids,但不能检出下列词汇:acidicity acidify等。,9/22/2024,12,2.5.3计算机信息检索的技术,(1)后方截词,使用后方截词,归纳起来,主要使用在如下4个方面:,词的单复数,如book?,wom?n,年代,如199?(90年代),作者,如用Eric*可检出所有姓Eric的作者。,同根词,如用technic* 可检出technical,technicality,technician等。,9/22/2024,13,2.5.3计算机信息检索的技术,(2)前方截词,也称后方一致检索。它是将截词符放在某一词干的前方,用以表示词头不同但词尾相同的所有词。,例如:?press 可能检出depress express impress等。,前截断和后截断可以结合使用。例如:*chemi*可以检出:chemical, chemistry,chemist, electro chemistry等。,9/22/2024,14,2.5.3计算机信息检索的技术,(3)中间截词,又称中间屏蔽,它把截断符号放置在一个检索词的中间,屏蔽词中不同的字符。一般地,中间截词只允许有限截断。,例如:wom?n可表示woman women等。,9/22/2024,15,2.5.3计算机信息检索的技术,3.位置检索,用于规定检索词相互之间的邻近关系,包括在记录中的顺序和相对位置。,位置检索是一种增强的逻辑与(AND)检索,一般用于全文数据库查询系统。,具体的说,位置检索可划分为以下4种不同形式:邻接检索、同句检索、同字段检索、同记录检索。,9/22/2024,16,2.5.3计算机信息检索的技术,3.位置检索,(1)邻接检索,通过专门的位置运算符来规定检索式中的检索词在检索结果中出现的相对位置,以使检索结果更加准确。运算符为:(W)与(nW);(N)与(nN)。,9/22/2024,17,2.5.3计算机信息检索的技术,3.位置检索,(1)邻接检索,(W)(或())- (W)算符中的W含义为“With”。即表示其两侧的检索词必须紧密相连,词间空格和标点符号都用此算符代替,不得插入其它词,两词的,词序不可以颠倒,。,例如:“Pollution(W)Cotrol”(或者“Pollution()Cotrol”)表示系统只检索含有“Pollution Cotrol” 词组的记录。,9/22/2024,18,2.5.3计算机信息检索的技术,3.位置检索,(1)邻接检索,(nW)-(nW)算符中的W含义为“Word”。即允许两词间插入最多为n个其它词,包括实词和禁用词,但词序不变。,例如:“communication(2W)satellite”,系统只检索含有communication satellite、communication though satellite、communication on the satellite词组的记录。,9/22/2024,19,2.5.3计算机信息检索的技术,3.位置检索,(1)邻接检索,(N)- (N)算符中的N含义为“Near”。即表示其两侧的检索词必须紧密相连,但词序可以颠倒,不得插入其它词。,(nN)-(nN)允许两词间插入最多为n个其它词,包括实词和禁用词,词序可以颠倒。例如:“cotton (2N)processing”, 表示cotton processing、 processing of cotton、 processing of Egyptian cotton的文献记录都会命中。,9/22/2024,20,2.5.3计算机信息检索的技术,3.位置检索,(2)同句检索,要求参加检索运算的两个检索词必须在同一自然句中出现,其先后顺序不受限制。同句检索的运算符为:(S)-sentence。,9/22/2024,21,2.5.3计算机信息检索的技术,3.位置检索,(3)同字段检索,对同句检索条件的进一步放宽,可以使用同字段检索方法。同字段检索的运算符号为:(F)算符、(L)算符表示在此运算符两侧的检索词必须同时出现在数据库记录的同一个字段中,词序可变,字段类型采用后缀符限定。运算符为:(L)-link。,该算符只适用于有正式词表且词表中的词有从属关系的数据库。,9/22/2024,22,2.5.3计算机信息检索的技术,3.位置检索,(4)同记录检索,要求运算符两侧的检索词同在一条数据库记录中出现,这与书目数据库中的布尔逻辑运算符AND完全等价,在全文数据库中则略有不同。运算符为:(C)-citation。,9/22/2024,23,2.5.3计算机信息检索的技术,4.限制检索,泛指检索系统中提供的缩小或约束检索结果的检索方法。主要有以下方式:,(1)字段限制,(2)二次检索,9/22/2024,24,2.5.3计算机信息检索的技术,4.限制检索,(1)字段限制,字段限制可针对特定年代、特定类别、特定检索点等做限制,主要分为两种类型:,基本索引字段限制检索,辅助索引字段检索,9/22/2024,25,2.5.3计算机信息检索的技术,4.限制检索,(1)字段限制,基本索引字段限制检索 。 通常包括:题名(TI-title)、关键词(ID-identifier或keyword)、主题词(DE-descriptor)、文摘(AB-abstract)、分类号(CC-classification code)、全文(full text)等。,其用法是在需要指定字段的检索词后加上后缀运算符“/”和段码(为后缀字段限制)(不同系统后缀运算符表示不同)。,例如:“optical/TI and fiber/TI”的含义是指在题名字段中查找含有“optical” 和 “fiber”两词的所有记录。,9/22/2024,26,2.5.3计算机信息检索的技术,4.限制检索,(1)字段限制,辅助索引字段检索指表达文献外部特征字段的检索,如:作者(AU-author)、期刊名(JN-journal name)、出版年(PY-publication)、语种(LA-language)、文献类型(DT-document type)等。,用法是在需要指定字段的检索词(有时检索词需放在双引号内)之前加上前缀运算符“=”和段码(为前缀字段限制)(不同系统后缀运算符表示不同)。,例如:AU=“Robert.S.”的含义是在作者字段中查找含有人名为“Robert.S.”的所有记录。,9/22/2024,27,2.5.3计算机信息检索的技术,5优先处理算符“( )”,-表示在( )中的运算先做。,6、范围限制,对数值进行检索是,数值的范围进行限制,必须使用范围算符。可用py(=),如: py =1990表示查找1990年的文献;,大于(),如py1990表示查找1990年以后的文献;py1990表示查找1990年以及1990年以后的文献;,小于(),如:py表示查找1990年以前的文献,py表示查找1990年以及1990年以前的文献。范围符号(:),如:1991:1994,则表示查找1991到1994年的文献。,9/22/2024,28,2.5.3计算机信息检索的技术,检索效果的评价:,查全率 R Recall Ratio: R= A/(A+C) *100%,查准率 P Precision Ration: P=A /(A+B) *100%,9/22/2024,29,2.5.4 检索步骤,1、分析研究课题,2、选择检索系统,3、确定检索词,构造检索式,4、检索的实施,查找信息线索,5、索取原始文献,9/22/2024,30,2.5.4 检索步骤,1、分析研究课题,分析研究课题的目的是使检索者确定课题要解决的实质问题,即它所含的概念和具体要求及它们之间的关系,这是制定检索策略的根本出发点,也是影响检索效率高低或成败的重要因素。,9/22/2024,31,2.5.4 检索步骤,1、分析研究课题(,明确检索要求,),该项研究从何时开始研究?哪些国家、哪些学者从事此项研究?研究有何目的、意义?,该研究的成果对推动科学技术发展的贡献如何?在理论和实践层面有哪些应用?产生的效益如何?,到目前为止已经做的工作,其的研究的思路、方法如何?研究中已经解决的问题,形成的理论、技术、成果(文献、标准、专利等)有哪些?,目前该研究的热点是什么?还有哪些问题还值得研究下去,其前景如何?,你自己的研究内容、研究思路、研究的技术路线、预期的成果和创新之处,等等。,9/22/2024,32,2.5.4 检索步骤,1、分析研究课题(提炼检索词),即分析出课题所涉及学科的重要概念,并提炼能代表这些概念的若干个词或词组(检索词),进而分析概念之间的上下左右关系。,有些课题的实质性内容很难从课题的名称上反映出来,需要从课题所属的专业角度作深入分析,才能提炼出能确切反映课题内容的检索概念。,另外,要少用或不用对课题检索意义不大的词。,“展望” ,“应用” “开发”“研究”、“方法”、“影响”、 “效率”等等。,不用词义延伸过多的词。“制造”制备、生产、加工、工艺等,“提炼”精炼、提取、萃取、回收、利用等。,9/22/2024,33,2.5.4 检索步骤,2、选择检索系统,根据课题学科范围,所需文献类型,选择合适的检索系统。,根据所具备的条件选择手工检索工具或计算机检索数据库,也可采用二者结合的方法。,选择报道及时,收录文献全面,索引系统完备的检索系统。,既要选择使用综合性的检索工具,也应注意选择使用专业性或单一性的检索工具。,9/22/2024,34,2.5.4 检索步骤,(,3)编制检索式,检索的目的无非就是两种:查全还是查准。,影响查全率的种种因素:,如:,检索词是否扩大到穷尽,,是否已用了,所有可能的同义词和准同义词或不同的拼法,;是否合理运用了逻辑“或”;是否对课题检索策略作了必要的扩大。,影响查准率的因素:,如:,是否尽量选用了专指度较高的检索词,;是否采用了逻辑“与”和逻辑“非”算符来优化检索;是否对检索课题作了范围的有效限制等等,。(如“制造”词义太泛),9/22/2024,35,2.5.4 检索步骤,(4)检索的实施,查找信息线索(检索结果评价、调整检索式、检索结果选择、下载),选择专集或分类,以缩小检索范围,提高检索速度;,检索字段:根据检索的要求选择。如:关键词、主题词;作者、作者单位等。字段选择:一般初学者选择“关键词” 或“主题词”字段;,年限选择:先尽量放宽;,先选全部期刊,检索结果数量太多时,再缩小范围,如选核心期刊或EI收录期刊等;,排序要求:相关度(检索词出现频率高的排在前),时间顺序(从现在往前排:2007、2006、2005);,9/22/2024,36,2.5.4 检索步骤,(5)索取原始文献,获取原文的途径,:,本单位图书情报部门 。,掌握国内主要的或对口的图书情报机构的馆藏信息。,从著者获取原文。,从检索刊物出版机构获取原文。,利用国际联机检索终端向国外订购原文。,9/22/2024,37,示例:“,汽车底盘集成控制”,1、分析研究课题,研究课题主题,课题要解决的实质问题是:全面了解“汽车底盘集成控制”的研究情况,为下一步研究寻找新的研究点和创新点。,回答以下问题:,(1)该项研究从何时开始研究?,自从20世纪80年代以来,为了提高汽车性能,人们开发了各种各样的底盘主动控制系统。这些系统按汽车运动方向可以分为3类:纵向的制动和驱动控制、横向的转向和横摆力矩控制以及垂向的悬架控制。,9/22/2024,38,示例:,“,汽车底盘集成控制综述”,(2)哪些国家、哪些学者从事此项研究?,日本较早开始研究底盘集成控制。在1987年研制的日ARC2X车上就有了集成控制系统。在丰田的FXV2II研究实验车上装备有主动悬架AS、四轮驱动4WD、四轮转向4WS、ABS和牵引力控制系统TCS,控制器按照驾驶员意图,根据一定的控制规律控制执行器,以达到优化整车性能的目的。,德国一些汽车公司。,国内有吉林大学、同济大学(王伟、姜烨等)、合肥工业大学等单位在研究。,9/22/2024,39,示例:,“,汽车底盘集成控制综述”,(3)研究有何目的、意义?,“底盘集成控制”是当前底盘的研发热点,因为它有着传统控制无法比拟的优点,具体如下。,消除各系统间的冲突,改善车辆性能,减少传感器,降低系统复杂性,9/22/2024,40,示例,:“汽车底盘集成控制”,(4)到目前为止已经做的工作,其的研究的思路、方法如何?研究中已经解决的问题,形成的理论、技术、成果(文献、标准、专利等)有哪些?,(5)目前该研究的热点是什么?还有哪些问题还值得研究下去,其前景如何?,(6)你自己的研究内容、研究思路、研究的技术路线、预期的成果和创新之处,等等。,9/22/2024,41,示例:,“,汽车底盘集成控制”,1、分析研究课题,课题所涉及的学科范围,交通运输,公路运输,汽车工程,汽车结构部件,汽车底盘(总论),9/22/2024,42,示例:,“,汽车底盘集成控制”,课题所需文献的内容及其特征。,课题所需文献的类型,:,专著、期刊论文、学位论文、会议论文,专利文献;,年代范围:集中在20世纪80年代至今;,主要是语种:英语、德语、日语;,有关作者及机构,:,日本丰田、德国;,吉林大学、同济大学(王伟、姜烨等)、合肥工业大学等。,9/22/2024,43,示例,:,“,汽车底盘集成控制”,2、选择检索系统,根据课题学科范围,所需文献类型,选择合适的检索系统,;,选择报道及时,收录文献全面,索引系统完备的检索系统,;,既要选择使用综合性的检索工具,也应注意选择使用专业性或单一性的检索工具。,CNKI-期刊全文数据库 、CNKI-优秀博硕士学位论文全文数据库、CNKI-中国重要会议论文全文数据库、EI、IEL、Science Direct、PQDD 学位论文(全文数据库)、,中华人民共和国国家知识产权局网站。,9/22/2024,44,示例:,“,汽车底盘集成控制”,1、分析研究课题(提炼检索词),提炼能代表这些概念的若干个词或词组:,从标题中直接提炼:,汽车(车辆) 底盘 集成控制,控制结构,Automobile(Vehicle); Chassis; Integrated control; Control structure,9/22/2024,45,示例:“,汽车底盘集成控制综述”,(3)编制检索式,汽车,(车辆),;底盘,;,集成控制,;,控制结构,Automobile (Vehicle ); Chassis; Integrated control; Control structure,(汽车or车辆)and 底盘and 集成控制 and 控制结构,(Automobile + Vehicle ) * Chassis *,Integrated control; Control structure,底盘and集成控制,ChassisI* ntegrated control,底盘and控制结构,ChassisI* Control structure,9/22/2024,46,课堂练习:查找以下论文的全文,例:Car interior noise analysis and control,Song, Chuan-Xue,(State Key Laboratory of Automobile Dynamic Simulation, Jilin University);,Zhao, Tong-Hang,Source:,Jilin Daxue Xuebao (Gongxueban)/Journal of Jilin University (Engineering and Technology Edition), v 37, n 5, September, 2007, p 1000-1004 Language: Chinese,9/22/2024,47,课堂练习(编制检索式,),1、无级变速器多片湿式离合器起步分析,2、,汽车悬架性能测试方法及测试系统研究,3、,车内噪声质量的主观评价及其改善措施的研究与发展,4、越野汽车机械自动变速器换挡规律的自适应控制,9/22/2024,48,作业:,1.何为检索工具?最常用的哪几种?各有何特点?,2.信息检索有哪些的途径?,3.中国图书馆分类法共有几个基本部类、几个基本大类?采用了怎样的标记符号?中图法中表示自然科学(社会科学)有哪几大类?请标出一般工业技术;汽车工程、交通工程、交通运输、电子学、电讯技术;自动化技术、计算机技术的类号。,5信息检索有哪些步骤?,6.,请根据自己的专业和兴趣,自拟中文课题(范围适当),写出中英文关键词。,9/22/2024,49,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!