第一讲-文献信息检索基础知识课件

上传人:痛*** 文档编号:241650600 上传时间:2024-07-13 格式:PPT 页数:109 大小:1.49MB
返回 下载 相关 举报
第一讲-文献信息检索基础知识课件_第1页
第1页 / 共109页
第一讲-文献信息检索基础知识课件_第2页
第2页 / 共109页
第一讲-文献信息检索基础知识课件_第3页
第3页 / 共109页
点击查看更多>>
资源描述
大家好大家好1第一讲 文献信息检索基础知识2第一节信息与信息素养第二节科技文献的类型第三节信息检索与文献检索工具第四节信息检索原理第五节信息检索的方法和途径第六节信息检索常用技术及检索效果评价3第一节 信息与信息素养 4一、信息的基本含义一、信息的基本含义1 1、图书馆学和情报学领域,信息被定义为事物、图书馆学和情报学领域,信息被定义为事物或记录。或记录。2 2、综合学术界对信息的定义,可以认为信息是、综合学术界对信息的定义,可以认为信息是以物质介质为载体,传递和反映世界各种事物存以物质介质为载体,传递和反映世界各种事物存在方式、运动规律及特点的表征。在方式、运动规律及特点的表征。5风、雨、雷、电、春、夏、秋、自然信息语言、战争、贫困、喜、怒、哀、乐社会信息科学家破译染色体的基因信息科学信息6从生产力的角度可以将人类社会划分为四个发展阶段:从生产力的角度可以将人类社会划分为四个发展阶段:原始社会、农业社会、工业社会和信息社会。原始社会、农业社会、工业社会和信息社会。信息社会的主要标志是信息与知识成为社会最重要的基础性信息社会的主要标志是信息与知识成为社会最重要的基础性资源。资源。(一)信息与社会(一)信息与社会7 在人类漫长的发展历程中,物质、能量、信息三种在人类漫长的发展历程中,物质、能量、信息三种资源支配着人类最基本的生产活动。资源支配着人类最基本的生产活动。物质物质-向人类提供材料及生活必需品向人类提供材料及生活必需品 信息信息-向人类提供知识和智慧向人类提供知识和智慧 能量能量-向人类提供动力向人类提供动力 信息社会的主要标志是信息与知识成为社会最重要信息社会的主要标志是信息与知识成为社会最重要的基础性资源。的基础性资源。81.1.客观性客观性2.2.时效性时效性3.3.载体性载体性4.4.传递性传递性5.5.可塑性可塑性6.6.共享性共享性7.7.可开发性可开发性8.8.可增值性可增值性(二)信息的基本特征二)信息的基本特征9 一个完整的信息传递过程必须具备一个完整的信息传递过程必须具备信源信源(信息的发出体)、(信息的发出体)、信宿信宿(信息的接受体)、(信息的接受体)、信道信道(信息的传递媒介)和(信息的传递媒介)和信息信息四个基本要四个基本要素。素。101.1.知识知识知识是人们对客观事物的认识和经验总和。知识是人们对客观事物的认识和经验总和。知识与信息的关系:知识与信息的关系:知识是信息的一部分,不直接知识是信息的一部分,不直接等同于信息;知识是人类大脑活动的产物,是系统等同于信息;知识是人类大脑活动的产物,是系统化、精炼化的信息。化、精炼化的信息。2.2.情报情报情报是传递中的有用的知识或信息,是为解决特定情报是传递中的有用的知识或信息,是为解决特定问题所需要的知识。问题所需要的知识。(三)与信息有关的基本概念(三)与信息有关的基本概念113.3.文献文献文献是记录知识的一切载体。文献是记录知识的一切载体。三个基本要素:三个基本要素:1 1)文献含有知识信息)文献含有知识信息 ;2 2)负载知识信息的物质载体)负载知识信息的物质载体 ;3 3)记录知识信息的符号和技术)记录知识信息的符号和技术 ;12二、什么是信息素养二、什么是信息素养p信息素养有广义狭义之分。广义指信息社会对个信息素养有广义狭义之分。广义指信息社会对个人品质、道德观念、知识体系和能力要求的总合,人品质、道德观念、知识体系和能力要求的总合,或信息时代国民应有的素质,包括品质和能力两个或信息时代国民应有的素质,包括品质和能力两个方面。狭义指获取信息和使用信息的能力与品质。方面。狭义指获取信息和使用信息的能力与品质。p 美国信息产业协会主席保罗美国信息产业协会主席保罗 .泽考斯基(泽考斯基(Paul Paul ZurkowaskiZurkowaski)19741974年在美国全国图书馆与情报学委年在美国全国图书馆与情报学委员会上,最早提出了信息素养的概念,他把信息素员会上,最早提出了信息素养的概念,他把信息素养概括为:养概括为:“利用大量的信息工具及主要信息源使利用大量的信息工具及主要信息源使问题得到解答的技术和技能。问题得到解答的技术和技能。”13信息素养为什么重要在科技飞速发展、信息资源激增的当今时代,信息素养越来越显示其重要性联合国教科文组织(UNESCO)2003年把信息素养定为终身学习的基础和未来公民的必备能力之一国外发达国家早已把信息素养融入到自己的教育体系中,而我国在信息素养教育领域尚处于探索和起步阶段我国教育界在面向21世纪教育振兴行动计划中明确提出到2010年在全国建立起终身学习体系,信息素养是终身学习的条件。14IL的简明定义的简明定义Tobeinformationliterate,apersonmustbeabletorecognizewheninformationisneededandhavetheabilitytolocate,evaluate,anduseeffectivelytheneededinformation.具有信息素养的人能够知道什么时候需要信息,能够有效地获取、评价和利用所需要的信息。美国图书馆协会ALA,1989发现、检索、分析、评价与利用信息的技能或能力。15信息素养的主要内容信息意识信息技能信息评价及利用信息安全及信息道德16信息意识研究策略信息需求对新信息的敏锐,时刻追求新知识的热情提高学生的信息关注程度 17信息技能信息源:了解信息如何产生及其传播途径;了解各种不同的信息源及其特征;选用适当的信息满足个人的信息需求。信息检索策略:分析个人的信息需求,检索并利用基本的信息制定信息检索策略,识别重点概念并提练检索用的关键词,利用基本检索技巧构建检索式,将课题或是问题纳入一个合适的研究范围内。检索路径:查找图书目录,期刊索引,中外文电子文献数据库,有效的网络搜索信息获取的能力和技巧。18信息评价及利用信息评价的重要性信息评价的准则:对获取的信息进行辩识、选择,创新知识的能力,养成批判性地分析、评价信息资源的能力(评价指标:准确性、权威性、时效性、经济性、易获取性)对信息的分类、整理、保存、创造性地利用等。19信息安全及信息道德对于网络安全和计算机犯罪的认识、对计算机病毒的防范行为等;继承已有的知识成果,尊重知识产权,不抄袭剽窃,培养学生用一定的信息伦理与道德准则规范自身行为的能力;(例如:不标注参考文献)20IL是一种基本能力是一种基本能力“21世纪的能力素质”的5个方面:基本学习技能(指读、写、算)信息素养信息素养 创新思维能力 人际交往与合作精神 实践能力 美国教育技术CEO论坛 2001年第4季度报告21IL是一种综合能力是一种综合能力信息素养需要诸多知识背景;信息素养需要信息技术的支持,信息技术是它的有力的工具;信息素养是一种信息能力;信息素养是一种了解、搜集、评价和利用信息的知识结构。22IL在中国的研究和实践在中国的研究和实践信息素养概念在20世纪90年代中期被介绍到中国国内。1997年起,开始有论文发表。2002年8月,教育部高校图书情报工作委员会第三次会议上,信息素养教育成为一个重要的讨论议题。将以文献检索课为核心的高校图书馆用户教育发展为信息素养教育,已在图书馆界达成共识。23IL在中国的研究和实践在中国的研究和实践ILIL在我国的基础在我国的基础信息用户教育信息用户教育新生入馆教育图书馆参观与导读帮助读者熟悉图书馆资源和各种服务。专题讲座与培训帮助读者掌握专门检索工具的使用。文献检索与利用课帮助学生学习和应用检索知识。国家教委在1982年发出正式文件,高校应开设文献检索和利用课程24第二节 科技文献的类型25一、文献的主要类型(一一)按按载载体体类类型型分分:印印刷刷型型、缩缩微微型型、电电子子型型、声声像型像型(二)(二)按出版类型分:按出版类型分:图书、连续出版物、特种文献图书、连续出版物、特种文献(三)按加工深度分:一次、二次、三次(三)按加工深度分:一次、二次、三次26(一一)根据文献的载体形式划分根据文献的载体形式划分印刷型印刷型缩微型缩微型电子型电子型声像型声像型图图 书书连连续续出出版版物物资资 料料缩缩微微平平片片缩缩微微胶胶卷卷缩缩微微胶胶片片磁磁带带、磁磁盘盘光光 盘盘联联机机网网络络版版录录音音带带、录录像像带带唱唱片片、幻幻灯灯片片电电影影胶胶卷卷27印刷型文献印刷型文献载体:纸张载体:纸张实例:教科书实例:教科书记录手段:油印、石印、记录手段:油印、石印、铅印、胶印、复印铅印、胶印、复印特点:可直接阅读,方便特点:可直接阅读,方便 使用;但难于实现机使用;但难于实现机 械化和自动化;收藏械化和自动化;收藏 文献占用空间大。文献占用空间大。利用纸张为存储介质,以手写、印刷为记录手段利用纸张为存储介质,以手写、印刷为记录手段而产生的文献。包括油印、铅印、胶印、复印等印刷而产生的文献。包括油印、铅印、胶印、复印等印刷品及手稿。品及手稿。28缩微型文献缩微型文献载体:载体:感光材料感光材料 实例:实例:缩微平片、缩微胶片缩微平片、缩微胶片记录手段:记录手段:光学缩微技术光学缩微技术特点:特点:体积小;价格低;不能直接阅读体积小;价格低;不能直接阅读 是以感光材料为存储介质,利用缩微照相技术使是以感光材料为存储介质,利用缩微照相技术使文献缩微化的文献。文献缩微化的文献。29声像型文献声像型文献载体:载体:磁性材料、感光材料磁性材料、感光材料实例:实例:录像带、幻灯片录像带、幻灯片记录手段:记录手段:磁记录、光学技术磁记录、光学技术特点:特点:直观、生动、形象;成直观、生动、形象;成 本高;不易检索和更新。本高;不易检索和更新。以磁性或感光材料为存储介质,利用特定的设备及以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像信息的文献。技术,直接记录声音、图像信息的文献。30电子型文献电子型文献载体:载体:磁性材料磁性材料实例:实例:磁盘、光盘磁盘、光盘记录手段:记录手段:计算机输入计算机输入特点:特点:存储密度高、速度快存储密度高、速度快;易复制易复制;成本高;不能成本高;不能 直接阅读。直接阅读。以电子数据的方式将图、文、声、像等信息存储以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源现的信息资源。31 按按出出版版形形式式及及内内容容的的不不同同 图图 书书连续出版物连续出版物 特种文献特种文献科技报告科技报告会议文献会议文献政府出版物政府出版物专利文献专利文献标准文献标准文献产品资料产品资料学位论文学位论文期刊期刊报纸报纸(二二)根据文献的编辑出版形式划分根据文献的编辑出版形式划分32图书的含义图书的含义 凡篇幅达凡篇幅达4848页以页以上并构一个书目单元上并构一个书目单元的文献称为图书。的文献称为图书。国际标准书号(国际标准书号(ISBN)33国际标准书号(ISBNISBN)(International Standard Book Number)每一种正式出版的图书的唯一标识代码,是专门为识别图书等文献而设计的国际编号。例例如如:信息检索原理与方法教程,赵岩碧主编,化学工业出版社,2005年3月出版。其ISBN号为:7-5025-6431-4ISBN7-5025-6431-4(旧号)ISBN978-7-5025-6431-5(2007年后出版图书采用的新号)第一段:978是由国际物品编码(EANUCC)系统专门提供给国际ISBN管理系统的产品标识编码。第二段:7 语区号,代表国家、地区、语种如0和1英,2法,3德,4日,5-俄,7中,88-意大利,9971-新加坡第三段:5025 出版社代号,由国家或地区ISBN中心分配;第四段:6431 出版图书号,由出版社按出版顺序所给;第五段:校验位34 期期 刊刊 期刊又称杂志,它是期刊又称杂志,它是指采用统一名称定期或不指采用统一名称定期或不定期出版的连续性出版物。定期出版的连续性出版物。国际标准刊号(国际标准刊号(ISSN)35国际标准连续出版物号国际标准连续出版物号(ISSN)正式出版的期刊有ISSN代码,即国际标准连续性出版物编号,是国际连续出版物数据系统国际中心为在该系统登记的连续出版物分配的号码。采用ISSN编码系统的出版物有期刊、会议录等。如:中国图书馆学报国际标准刊号国际标准刊号:ISSN10018867全长全长8 8位位,前前7 7位为刊名代号位为刊名代号,末位为校验位末位为校验位36期刊的特点期刊的特点A A、期刊以品种为单位形成知识流;、期刊以品种为单位形成知识流;B B、报道文献速度快,内容新颖,能及时反映世界科、报道文献速度快,内容新颖,能及时反映世界科 技水平,但不如图书成熟;技水平,但不如图书成熟;C C、品种多,数量大,覆盖了人类所以知识领域及各、品种多,数量大,覆盖了人类所以知识领域及各 学科专业,具有很强的容纳性。学科专业,具有很强的容纳性。D D、科技期刊、科技期刊 是最重要的一次文献。是最重要的一次文献。37 核核 心心 期期 刊刊 *少数刊载某一学科大量高质量专业论文的期刊。少数刊载某一学科大量高质量专业论文的期刊。*特点特点 (1 1)刊载专业文献密度高,信息含量高;)刊载专业文献密度高,信息含量高;(2 2)水平较高,代表本学科的最新发展水平;)水平较高,代表本学科的最新发展水平;(3 3)出版相对稳定,所载文献寿命较长;)出版相对稳定,所载文献寿命较长;(4 4)利用率和被引率较高。)利用率和被引率较高。目前,许多单位核心期刊的判定是以目前,许多单位核心期刊的判定是以 中文核心期刊要目总览中文核心期刊要目总览为标准为标准38 是以报道新闻及评是以报道新闻及评论为主,出版周期比期论为主,出版周期比期刊更短,多为活页性连刊更短,多为活页性连续出版物。其特点是内续出版物。其特点是内容丰富、信息量大、出容丰富、信息量大、出版迅速、发行量大、读版迅速、发行量大、读者众多。者众多。39 科科 技技 报报 告告 科技报告是科技工作者对科学、技术研究结果或科技报告是科技工作者对科学、技术研究结果或研究进展的记录。研究进展的记录。科技报告的特点科技报告的特点(1 1)反映新的科研成果迅速;)反映新的科研成果迅速;(2 2)内容多样化;)内容多样化;(3 3)质量参差不齐;)质量参差不齐;(4 4)保密性强;)保密性强;(5 5)每份报告独立成册,有连续编号。)每份报告独立成册,有连续编号。40会议文献会议文献会议文献是指在各会议文献是指在各种会议上宣读、交流的种会议上宣读、交流的论文、报告及其它有关论文、报告及其它有关文献。文献。41政府出版物政府出版物政府出版物是指由政府机构制作出政府出版物是指由政府机构制作出版或由政府指定出版商出版的文献。版或由政府指定出版商出版的文献。政府出版物的类型政府出版物的类型(1 1)行政性文件)行政性文件(2 2)科技文献)科技文献42专专 利利 文文 献献专利文献是指实行专利制专利文献是指实行专利制度的国家申请、审批专利过程度的国家申请、审批专利过程中所产生的专利申请书、说明中所产生的专利申请书、说明书及官方文件或出版物。其中书及官方文件或出版物。其中最重要的是专利说明书。最重要的是专利说明书。43标准文献标准文献与标准化活动有关的一切文献都称为标准文献。其与标准化活动有关的一切文献都称为标准文献。其主体是标准,还包括标准形成过程的各种档案、宣传推主体是标准,还包括标准形成过程的各种档案、宣传推广标准的手册及其它出版物。广标准的手册及其它出版物。标准标准是按规定程序制订,经权威机构公认或主管部是按规定程序制订,经权威机构公认或主管部门批准的在特定范围内执行的规格、规则、技术要求等门批准的在特定范围内执行的规格、规则、技术要求等规范性文件。规范性文件。44 产产 品品 资资 料料 指厂商为推销产品而印制的各种指厂商为推销产品而印制的各种宣传资料、技术资料。如公司介绍、宣传资料、技术资料。如公司介绍、产品目录、样本、说明书等,它反映产品目录、样本、说明书等,它反映厂家、公司及产品的有关信息,对产厂家、公司及产品的有关信息,对产品采购,仪器设备的维护、使用及新品采购,仪器设备的维护、使用及新产品开发具有重要价值。产品开发具有重要价值。45按文献按文献的加工的加工深度分深度分一次文献一次文献二次文献二次文献三次文献三次文献(三)不同加工层次的文献信息(三)不同加工层次的文献信息46 一一 次次 文文 献献*作者以自己的研究成果为基础创作或撰写,作者以自己的研究成果为基础创作或撰写,并通过某种渠道而公开的文献;并通过某种渠道而公开的文献;*对知识的第一次加工;具有创造性;对知识的第一次加工;具有创造性;*大多数期刊论文、科技报告、学位论文、会大多数期刊论文、科技报告、学位论文、会 议文献、专利文献、技术档案等。议文献、专利文献、技术档案等。47 *对一次文献进行浓缩、整序及加工处理而成对一次文献进行浓缩、整序及加工处理而成 的具有报道和检索作用的文献;的具有报道和检索作用的文献;*对知识的第二次加工;有序化;提供一次文对知识的第二次加工;有序化;提供一次文 献线索;献线索;*目录、题录、文摘等检索工具。目录、题录、文摘等检索工具。二二 次次 文文 献献48*指从一次文献中提取数据、事实和有关结论,指从一次文献中提取数据、事实和有关结论,并经过综合分析与重新组合而编写的文献。并经过综合分析与重新组合而编写的文献。*对知识的再加工;提供文献检索;对知识的再加工;提供文献检索;*综述、专著综述、专著;字词典、百科全书字词典、百科全书三三 次次 文文 献献49 一次文献是检索的对象(目标)一次文献是检索的对象(目标)二次文献是检索的工具(手段)二次文献是检索的工具(手段)三次文献是情报研究的成果(检索目标三次文献是情报研究的成果(检索目标+检索手段)检索手段)从检索的角度来看从检索的角度来看一次、二次、三次文献三者之间的关系一次、二次、三次文献三者之间的关系50从知识加工角度来看从知识加工角度来看一次、二次、三次文献三者之间的关系一次、二次、三次文献三者之间的关系 从一次文献到二次文献、三次文献是一个由博到约、从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走想有序、由一种有序结构演献资源的层次结构由无序走想有序、由一种有序结构演变为另一种完善的有序结构的过程。变为另一种完善的有序结构的过程。51第三节 信息检索与信息检索工具52一、信息检索的定义及类型一、信息检索的定义及类型(一)信息检索的定义(一)信息检索的定义广义的信息检索广义的信息检索:是指将信息按一定的方式组织是指将信息按一定的方式组织和存储起来和存储起来,并根据信息用户的需要找出有关信息的并根据信息用户的需要找出有关信息的过程和技术。全称为过程和技术。全称为“信息存储与检索信息存储与检索”。狭义的信息检索狭义的信息检索:指该过程的后半部分指该过程的后半部分,即从信息即从信息集合中找出所需要的信息的过程集合中找出所需要的信息的过程,相当于人们通常所相当于人们通常所说的信息查寻。说的信息查寻。人们多用人们多用“文献检索文献检索”的概念,强调了检索对象。的概念,强调了检索对象。53(二)信息检索的类型(二)信息检索的类型1 1、按检索内容划分:、按检索内容划分:文献检索、数据检索、事实检索文献检索、数据检索、事实检索2 2、按信息检索手段划为、按信息检索手段划为:手工检索、计算机检索手工检索、计算机检索3 3、按信息组织方式划分:、按信息组织方式划分:全文检索、超文本检索、超媒体检索全文检索、超文本检索、超媒体检索54第四节 信息检索原理55将文献将文献检索标识检索标识与文献与文献存贮标识存贮标识进行类比,进行类比,二者若取得一致(即二者二者若取得一致(即二者匹配匹配),就可将文),就可将文献库中符合检索提问要求的文献取出来。献库中符合检索提问要求的文献取出来。信息检索的原理信息检索的原理简而简而 言之言之检索标识检索标识存贮标识存贮标识匹配匹配检索命中检索命中将文献将文献检索标识检索标识与文献与文献存贮标识存贮标识进行类比,进行类比,二者若取得一致(即二者二者若取得一致(即二者匹配匹配),就可将文),就可将文献库中符合检索提问要求的文献取出来。献库中符合检索提问要求的文献取出来。56原始文献原始文献加工整理加工整理数据库数据库提提 问问检检 索索输输 出出存存 储储检检 索索57检索过程分析检索者检索系统信息源(大量信息)信息源(大量信息)充分标注(检索语言)充分标注(检索语言)可检索(检索技术、规则等)可检索(检索技术、规则等)可显示(屏幕显示或打印)可显示(屏幕显示或打印)信息之间的连接等信息之间的连接等表达需求表达需求反馈结果反馈结果信息检索的本质,实际上就是信息集合与需求集合的匹配与选择。58第五节 信息检索的方法和途径59(一)信息检索语言60检索语言主要有:检索语言主要有:1 1、分类语言:、分类语言:以学科体系为基础,将各种概念按学科性质进行分类和系统排列,并用分类号予以编排组织成一个完整的体系。2 2、主题语言:主题语言:用词语来表达各种概念,即用规范化或未规范化语言中的名词、名词性词组或短语作为主题词,来表达各种概念,将各种概念不管其相互关系,完全按字顺排列。3 3、号码语言:、号码语言:按文献代码,如专利号、标准号、报告号等的顺序排检。61中图法中图法体系结构:体系结构:基本部类(基本部类(5 5个)个)基本大类(基本大类(2222个)个)1马列、毛泽东思想:马列、毛泽东思想:A马列、毛泽东思想马列、毛泽东思想2.哲学哲学:B哲学哲学3.社会科学社会科学:C社会科学总论;社会科学总论;D政治、法律;政治、法律;E军事;军事;F经济;经济;G文化、科学、文化、科学、教育、体育教育、体育;H语言、文字;语言、文字;I文学;文学;J艺术;艺术;K历史、地理历史、地理4.自然科学自然科学:N自然科学总论;自然科学总论;O数理科学和化学;数理科学和化学;P天文学、地球科学;天文学、地球科学;Q生物科学;生物科学;R医学、医学、卫生;卫生;S农业科学;农业科学;T工业技术;工业技术;U交交通运输;通运输;V航空、航天;航空、航天;X环境科学、劳环境科学、劳动保护科学(安全科学)动保护科学(安全科学)5.综合性图书综合性图书:Z综合性图书综合性图书62中图法22大类是基础,每一大类下根据学科的具体内容层层细分为二级、三级、四级类目,这逐级划分下去就形成了等级分明的科学系统。如:O O 一级类目一级类目 数、理、化数、理、化 O1O1 O3O3 O4O4 O6O6 O7 O7 二级类目二级类目 数学数学 力学力学 物理化学物理化学 晶体晶体 O11O11O12 O12 O13 O13 三级类目三级类目古典数学古典数学 初等数学初等数学 高等数学高等数学 O121O121 O122 O122 O123 O123 O124 O124 四级四级类目类目 算术算术 初等代数初等代数 初等几何初等几何 三角三角 中图法全称为中图法全称为“中国图书馆分类法中国图书馆分类法”所有图书按中图法编制成相应的索书号进行排架所有图书按中图法编制成相应的索书号进行排架63什么是关键词什么是关键词直接选用文献中的自然语言作为基本的词汇,出现在文献标题(篇名、章节名)、摘要和正文中,能揭示和描述文献主题内容具有实质意义的的那些词语,且不加规范化处理。64(二)文献信息检索方法常用法回溯法循环法65常用法(又称工具法)常用法(又称工具法)1.1.顺查顺查法:由远及近,从后向前。法:由远及近,从后向前。如:已知某研究课题的最初产生年代(如:已知某研究课题的最初产生年代(19901990)了解了解 发展过程发展过程从最初的年代(从最初的年代(19901990)开始,逐步往近期查)开始,逐步往近期查2.2.倒查倒查法:由近及远,从前向后。一般查法:由近及远,从前向后。一般查1-51-5年,年,重点重点:在:在近期文献,只要查到基本满足需要为止。近期文献,只要查到基本满足需要为止。3.3.抽查抽查法:是抓住某学科发展迅速,研究成果发表较多的法:是抓住某学科发展迅速,研究成果发表较多的时期,进行重点检索。时期,进行重点检索。前提前提:熟悉学科发展特点。:熟悉学科发展特点。指直接利用检索工具(系统)检索文献信息的方法,指直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。这是文献检索中最常用的一种方法。66回溯法(引文法)回溯法(引文法)回溯法是指不利用一般的检索工具,而是利用已经掌握的回溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的文献末尾所列的参考文献参考文献,进行逐一地回溯查找,进行逐一地回溯查找“引文引文”的一的一种最简便的扩大情报来源的方法。它还可以从查到的种最简便的扩大情报来源的方法。它还可以从查到的“引文引文”中再回溯查找中再回溯查找“引文引文”,像滚雪球一样,依据文献间的引用关,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。系,获得越来越多的内容相关文献。优点优点:在没有检索工具或检索工具不全的情况下能借助一些在没有检索工具或检索工具不全的情况下能借助一些引文索引,述评或专著的参考文献查找。引文索引,述评或专著的参考文献查找。缺点缺点:查得的文献不全面,比较陈旧。查得的文献不全面,比较陈旧。67循环法(又称为分段法)循环法(又称为分段法)它是把上述两种方法加以综合运用的方法,既要利用它是把上述两种方法加以综合运用的方法,既要利用检索工具进行常规检索,又要利用文献后所附参考文献进检索工具进行常规检索,又要利用文献后所附参考文献进行回溯检索,分期分段地交替使用这两种方法。行回溯检索,分期分段地交替使用这两种方法。68(三)文献信息检索途径分类途径主题途径著者途径其他途径691.1.分类途径分类途径u分类途径是指按照文献资料所属学科(专业)分类途径是指按照文献资料所属学科(专业)类别进行检索的途径,它所依据的是检索工具中类别进行检索的途径,它所依据的是检索工具中的分类索引。的分类索引。u 分类途径检索文献关键在于正确理解检索工具分类途径检索文献关键在于正确理解检索工具的分类表,将待查项目划分到相应的类目中去。的分类表,将待查项目划分到相应的类目中去。702.2.主题途径主题途径u主题途径是指通过文献资料的内容主题进行检主题途径是指通过文献资料的内容主题进行检索的途径,它依据的是各种主题索引或关键词索索的途径,它依据的是各种主题索引或关键词索引,检索者只要根据项目确定检索词(主题词或引,检索者只要根据项目确定检索词(主题词或关键词),便可以实施检索。关键词),便可以实施检索。u 主题途径检索文献关键在于分析项目、提炼主主题途径检索文献关键在于分析项目、提炼主题概念,运用词语来表达主题概念。主题途径是题概念,运用词语来表达主题概念。主题途径是一种主要的检索途径。一种主要的检索途径。713.3.著者途径著者途径u著者途径是指根据已知文献著者来查找文献的途著者途径是指根据已知文献著者来查找文献的途径,它依据的是著者索引,包括个人著者索引和机径,它依据的是著者索引,包括个人著者索引和机关团体索引。关团体索引。724.4.其他途径其他途径u其他途径包括利用检索工具的各种专用索引来检其他途径包括利用检索工具的各种专用索引来检索的途径。索的途径。u 专用索引的种类很多,常见的有各种号码索引专用索引的种类很多,常见的有各种号码索引(如专利号、入藏号、报告号等),专用符号代码(如专利号、入藏号、报告号等),专用符号代码索引(如元素符号、分子式、结构式等),专用名索引(如元素符号、分子式、结构式等),专用名词术语索引(如地名、机构名、商品名、生物属名词术语索引(如地名、机构名、商品名、生物属名等)。等)。73课堂讨论题:找一些有关翻译技巧的书刊,用馆藏查询的哪些途径可以获得?74(四)文献信息检索步骤文献信息检索是根据课题的要求,利用检索工具,文献信息检索是根据课题的要求,利用检索工具,按照一定的步骤和方法查找文献信息的过程。完成按照一定的步骤和方法查找文献信息的过程。完成这个过程一般需要经过五个基本步骤:这个过程一般需要经过五个基本步骤:751、分析课题与确定检索要求2、选择检索方式与检索工具3、确定检索途径与方法4、优化检索提问与策略5、整理检索结果6、获取原文76第六节 信息检索常用技术及检索效果评价77一、信息检索常用技术布尔逻辑检索截词检索位置检索字段限制检索781、布尔逻辑检索 在计算机文献检索中,用户的检索需求是通过检索检索提问式提问式表达的,用逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。布尔逻辑运算符:系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND/*AND/*(与)、(与)、OR/+OR/+(或)、(或)、NOT/NOT/(非)(非)。(1)ANDAND 或*算符 实现逻辑“与与”组配 检索时,命中信息同时含有两个概念,专指性强。如:trafficANDcontrol79 (2)OR 或 +算符 实现逻辑“或或”组配 (3)NOT 或 算符 实现逻辑“非非”组配检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比AND扩大。如:railwayORrailroad命中信息包含逻辑A、不包含逻辑B或同时有A和B的,排除了不需要的检索词。如:fruitNOTapple80布尔逻辑算符优先顺序J执行优先顺序通常是:执行优先顺序通常是:NOTANDORNOTANDOR。J优先处理算符优先处理算符 -“()()”。与布尔逻辑算符搭配。与布尔逻辑算符搭配使用调整逻辑运算符的运算顺序,使某些算符优先使用调整逻辑运算符的运算顺序,使某些算符优先进行逻辑匹配。进行逻辑匹配。81课堂讨论题:课堂讨论题:试分析以下检索内容,利用布尔逻辑算符,试分析以下检索内容,利用布尔逻辑算符,构建出相关的检索式构建出相关的检索式1 1、检索数控机床的产品信息的相关文献、检索数控机床的产品信息的相关文献 2 2、检索计算机算法或计算机程序语言的相关文献、检索计算机算法或计算机程序语言的相关文献 3 3、检索除因特网之外的计算机相关文献、检索除因特网之外的计算机相关文献 4 4、检索工业模具设计与制造的相关文献、检索工业模具设计与制造的相关文献822、截词检索 截词是指将检索词在适当的地方截断,截词检索是用截断截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符词的一个局部进行的检索,凡是满足这个截词所有字符(串串)的的记录,系统都为命中。记录,系统都为命中。截词检索主要是利用检索词的词干或不完整的词形进截词检索主要是利用检索词的词干或不完整的词形进行检索。行检索。截词检索在西文数据库中广泛使用。是在词干后可能变化截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量的输入量,又可扩大查找范围,提高查全率。又可扩大查找范围,提高查全率。按截词位置分按截词位置分:前截断、后截断、中间截断、左右截断;前截断、后截断、中间截断、左右截断;按截词的字符数量分:有限截词、无限截词。按截词的字符数量分:有限截词、无限截词。“?”、“*”表示截词的截断符号,各检索系统有不表示截词的截断符号,各检索系统有不同的规定,没有统一标准。同的规定,没有统一标准。83 前前截断截断J在检索字符串前方(左方)截断有限或无限的字母。如:输入*chemistry 可检出:micromicrochemistry(微量化学)macromacrochemistry(常量化学)abioabiochemistry (无机化学)iatroiatrochemistry(化学疗法)J这种方法可以省略输入各种词头有变化的检索词的麻烦。84 后后截断截断J在检索字符串后(右方)截断有限或无限的字母。如:librar*library,librarian,librariesJ这种方法可以省略输入各种词尾有变化的检索词的麻烦。主要用于主要用于 单复数检索(如Econom*:Economy,Economics,Economical)词根检索(buil*:building,built)年代检索(199*:1990,19911999)等85中间中间截断截断J在检索词中间嵌入截断符号,允许检索词中间有若干形式的变化。如:输入wom*n 可检出:woma an,wome en 输入defen*e 可检出:defenc ce(防卫),defens se J主要解决一些英美拼写不同,单复数形式不同的词的输入。86左右左右截断截断J将检索词左右词头、词尾部分同时截断,检索词中间一致。如:输入*biolog*可检出:neuroneurobiology y(神经生物学)neuroneurobiologistist micromicrobiology y(微生物学)micromicrobiologistist J适用于广泛课题的资料检索87 有限有限截词截词J对词干以外可以出现的字母数量进行限定。如:输入computer?表示截断处有0-2个字母变化,可检出:computer,computers,输入stud?表示截断处有0-3个字母变化,可检出:study,studies,studied,student,88无限无限截词截词J不限制被截断的字符数量。在检索词后加一个“*”,表示该词后可加任意个字符。如:输入educat*可检出 educate,educator,educators,educated,educating,education,注意:使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。893、位置检索通过位置运算符来规定和限制检索词之间的相对位置,弥补通过位置运算符来规定和限制检索词之间的相对位置,弥补布尔逻辑运算符构造某些提问式的不足,表达复杂专深的概布尔逻辑运算符构造某些提问式的不足,表达复杂专深的概念,从而提高检索的专指度。念,从而提高检索的专指度。位置算符通常位置算符通常只出现在英文数据库中,多用于全文检索只出现在英文数据库中,多用于全文检索。DialogDialog等一些大型检索系统才支持位置算符。等一些大型检索系统才支持位置算符。J在检索提问式中同时出现位置算符和逻辑算符时,执行的先在检索提问式中同时出现位置算符和逻辑算符时,执行的先后顺序为:后顺序为:先位置算符,后逻辑算符先位置算符,后逻辑算符注:不同的机检系统,位置算符的功能及算符不同,也有的检注:不同的机检系统,位置算符的功能及算符不同,也有的检索系统不支持位置运算符,检索之前应该先看看数据库的帮索系统不支持位置运算符,检索之前应该先看看数据库的帮助信息。助信息。90字段算符字段算符F、L位置检索位置检索相邻位置算符相邻位置算符W、nW;N、nN句子位置算符句子位置算符 S91 相邻相邻位置算符:位置算符:W WnWnWW W:with的缩写 两词相邻,词序不变,中间不可插词,但两词之间可有一个标点、连字符或空格。例:输入CDCD(W)ROMROM 将命中 CD ROM 或 CD-ROM输入solarsolar(W)energyenergy 检出 solar energy92nWnWnW:nword的缩写两词之间允许插入0-n个词,词序不变。例:communication(2W)satellite 将检索出含有communication satellite、communication via satellite、communication on the satellite的记录93NnNN N:near的缩写 两词中间不可插词(但两词间可有一个标点,连字符或空格),允许词序发生颠倒。例:输入cross(N)section可检出 cross section 和 sectioncross 94nNnN:nnear的缩写 两词中间可插0n个词(两词间可有一个标点,连字符或空格),允许词序发生颠倒。例:输入cotton(2N)processing可检出cotton processing、processing ofcotton、processingofEgyptiancotton95 字段字段算符:算符:FF F:field的缩写 两词必须出现在同一字段中(如篇名、文摘、叙词等),词序与词量不限制。如:输入pollution(F)control/AB检出的结果中 pollution和 control同时出现在文摘(abstract)字段中 96 句子句子位置算符:位置算符:S S S:Sentence的缩写 两词必须出现在同一句子或子字段中,词序与插入词量不受限制。如:输入computer(W)control(S)system 可检出文摘中含有“This paper is concerned with an application of the computer control technique in a intelligent system for testing inner walls of pipes.”这样一句话的文献记录。97短语检索短语检索 字段检索字段检索4、限制检索98短语短语检索检索 将检索词用双引号”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度。例:”Global Positioning SystemGlobal Positioning System”(GPS(GPS,全球,全球定位系统定位系统)只检索出规定字段中包含完整词组的记录。99字段字段检索检索 为了缩小检索范围,可利用字段代码来限制检索词出现的字段,以提高检索速度和查准率。如:rice in ti(表示只在题目字段中查找文献)rice in ab(只在文摘中查找)au=Smith,J.C(查作者为Smith,J.C 的 文章)py=1998(只查1998年的文章)la=Chinese(只查语种为中文的文献)100常用检索字段中英文对照西文数据库常用字段西文数据库常用字段中文数据库常用字段中文数据库常用字段字段名称字段代码AbstractsAB文摘AuthorAU作者Corporate Source、Organization、CompanyCS机构名称Descriptor、SubjectDE叙词/主题词Document TypeDT文献类型Full-textFT全文ISSN/ISBNISSN/ISBN国际标准连续出版物号/书号Journal Name、Publication TitleJN期刊名称Keyword、TopicKW关键词LanguageLA语言Publication YearPY出版年TitleTI题名101查全率(检全率)查全率(检全率)查准率(检准率)查准率(检准率)二、二、检索效果评价102漏检率漏检率误检率误检率103二、影响检索效果的主要原因信息系统组织结构、检索系统功能问题检索策略、检索方法问题104三、提高检索效果的措施熟悉各种信息系统特征认真分析课题需求灵活掌握检索方法和提高制定检索策略的能力105(1)输出篇数过多时此时多数是由误检造成的,原因主要有以下几点:1)没有对检索词进行限制。包括字段限制,时间限制,分类限制等。2)主题概念不够具体或具有多义性导致误检。例如,仅使用mathematics进行检索结果很多,就需要整检索策略,将概念具体化。如:mathematics and economic 再如,检索世界贸易组织仅输入“WTO”,系统可能会检索出“World Tourism Organization”(世界旅游组织)3)对所选的检索词截词截得过短。例如,使用math?将有太多的检索结果。等等106检索结果的反馈调整缩小检索范围的措施缩小检索范围的措施提高检索词的专指度。增加AND连接,进一步限定主题词。把检索词限定在主要字段,如标题字段、主题词字段等。缩短检索年限,或限定某些刊物。107(2)输出篇数过少时此时多数是由漏检造成的,原因可能有以下几点:1)选用了不规范的主题词或某些产品的俗称、商品名作为检索词。例如,没有使用学名“马铃薯”而使用了俗名“土豆”又如,没有使用“表面活性济”而使用了商品名称“迪恩普”,都会造成漏检。2)同义词没有充分考虑。例如,检索“物理化学”,没有考虑到“物理有机化学”,“物化”等同义词,导致漏检。3)上位概念或下位概念没有完整运用。例如,“燃料”是上位概念,下位概念可以有“固体燃料”、“液体燃料”、“气体燃料”,甚至还有“煤”、“油”、“煤气”、“天然气”等,这些概念在检索“燃料”时都应该加以考虑。等等108检索结果的反馈调整扩大检索范围的措施扩大检索范围的措施降低检索词的专指度,可从词表或检出文献中选择泛指词。调节检索式的网罗度,如删除某个不重要的检索词。进行族性检索,可用分类号或用OR连接一组同义词和近义词。取消某些限制过严的限制符。109
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!