科技文献检索第二章检索基础知识.ppt

上传人:zhu****ei 文档编号:3496007 上传时间:2019-12-16 格式:PPT 页数:45 大小:2.37MB
返回 下载 相关 举报
科技文献检索第二章检索基础知识.ppt_第1页
第1页 / 共45页
科技文献检索第二章检索基础知识.ppt_第2页
第2页 / 共45页
科技文献检索第二章检索基础知识.ppt_第3页
第3页 / 共45页
点击查看更多>>
资源描述
,第二章检索基础知识,2.1检索定义2.2检索语言2.3检索系统2.4检索方法2.5检索步骤2.6检索效率,2.1.1文献检索概念文献检索广义上讲包括文献信息的存储和检索两个过程。狭义是指有目的地开展对于经过有序化后的文献信息的集合体所开展的查找活动及过程。,信息存储与检索过程图,文献信息,分析,检索课题,文献信息特征,检索提问信息,分析,著录,标引,选用,检索语言和名称规范,文献信息标识(检索项),检索提问标识(检索词),形成,形成,检索系统,输入,检索,检索结果,输出,存储过程,检索过程,2.1.2信息检索的原理,文献检索的过程就是检索提问标识与存储在检索工具中的著录标引标识相匹配的过程.,2.1.3检索的类型,1、按检索对象划分3类文献检索(DocumentRetrieval)数据检索(DataRetrieval)事实检索(FactRetrieval),2、按信息检索手段划分2类手工信息检索计算机信息检索,3、按检索系统的工作方式划分4类脱机检索(Off-lineRetrieval)联机检索(On-lineRetrieval)光盘检索(CD-ROMRetrieval)因特网检索(InternetRetrieval),4、按检索工具类型划分6类目录检索(CatalogSearching)题录检索(TitleSearching)文摘检索(AbstractSearching)索引检索(IndexSearching)全文检索(FullTextSearching)参考工具检索(FactandDataSearching),2.2检索语言,信息检索语言(Retrievallanguage)是用来描述文献的内容特征、外表特征和表达用户信息提问的一种专门语言。当存储信息时,检索系统对文献内容进行分析,概括分析出若干能代表文献内容的词语,并赋予一定的标识,如题名、著者、主题词等,作为存储与检索的依据,然后被纳入到数据库中。当检索信息时,检索人员首先要对检索课题进行分析,同样形成若干能代表信息需求的词语,然后通过检索系统在数据库中匹配具有同样词语和标识的文献,找到自己所需要的信息。,信息检索语言,2.2.1分类语言,分类语言又称分类法,是将文献主题概念按知识学科性质进行分类和系统排列,并用号码(分类号)表达各种概念的检索语言,包括体系分类法和组配分类法。,中国图书馆图书分类法中国科学院图书馆图书分类法中国人民大学图书馆图书分类法美国国会图书馆分类法杜威十进位分类法,中国图书馆分类法,T工业技术TP自动化技术、计算机技术TP1自动化基础理论TP2自动化技术及设备TP3计算技术、计算机技术TP30一般性问题TP31计算机软件TP311程序设计、软件工程TP311.1程序设计TP311.11程序设计方法TP311.12数据结构TP311.13数据库理论与系统TP311.131数据库理论TP311.132数据库系统:按类型分TP311.132.1层次数据库TP311.132.2网络数据库TP311.132.3关系数据库TP311.132.4面向对象的数据库.TP6射流技术TP7遥感技术TP8远动技术,杜威十进分类法(DDC)1873年美国图书馆学家杜威所创,目前该分类法已经被翻译成30多种语言,在全球超过135个国家的20多万个图书馆使用,在美国,95%的公共图书馆,25%的学院图书馆大学图书馆以及20%的专门图书馆使用该分类法。,杜威十进分类法(DDC),310普通统计学000总类320政治学371学校管理、100哲学类330经济学特殊教育200宗教类340法律372初等教育300社会科学类350公共行政管理373中等教育400语言类360社会机构社会团体374成人教育500纯科学类370教育375课程600应用科学类380商务、通讯、运输376妇女教育700艺术类390习俗、礼仪、民俗377学校与宗教800文学类378高等教育900地理历史类379政府法规管理与资助,分类语言的特点,(1)分类法符合人们认识事物的规律和处理事物的习惯。(2)由于分类法是按学科、专业集中文献,能系统地揭示文献内容特征,因此能够实现族性检索,获得较高的查全率。(3)便于组织图书资料的排架。(4)分类检索语言是一种先组式语言,不能随时修改补充。,2.2.2主题语言,主题语言主题语言,也称主题法,是一种用语词标识处理原始信息、组织主题检索工具或检索系统的检索语言。主题语言又分为标题词语言、单元词语言、关键词语言和叙词语言。主题词就是指以规定概念为基准,经过规范化和优先处理后,具有组配功能、能够显示词间语义关系动态性的词或词组。主题检索适合特性检索,系统性不强。,关键词语言关键词语言是直接选用文献信息中的自然语言作基本词汇,并将那些能够揭示文献信息题名或主题意旨的关键性自然语词作为关键词进行标引的一种检索语言。,叙词语言叙词语言是以自然语言词汇为基础,以概念组配为基本特征,适应现代信息需求而发展起来的一种信息检索语言类型。叙词又称描述词、叙述词,是以概念为基础,经过优选和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需要的语词。叙词语言的特点:直观,专指性强,组配性高,结构严谨,标引能力强。叙词语言示例:汉语主题词表、英国科学文摘使用的INSPECThesaurus、美国工程索引93年后使用的EiThesaurus等。,2.3.1文献检索系统定义是指按某种方式、方法建立起来的供文献信息用户查检文献信息及原始文献的一种有层次的体系,是表征有序的信息特征的集合体。(包括各种手工检索工具和各类计算机检索系统),2.3检索系统,2.3.2检索系统的类型1.目录(catalog)它主要用于反映文献的出版情况或收藏情况。目录是对一批相关文献外部特征的揭示和报道。通常以一个完整的出版或收藏单位为著录的基本单位来报道和记录文献。只记录文献外部特征(如名称,著者,出版事项等)。目录一般按分类或字顺编排,主要供人们了解出版或收藏机构是否拥有所需图书、期刊等出版物。目录类型:馆藏目录:反映一个图书馆文献收藏情况的目录。联合目录:反映一个地区或一个系统甚至全国或世界范围的图书馆、信息服务机构文献收藏情况的一种统一目录。,按出版类型划分:图书目录、期刊目录、会议论文目录。按物质形式划分:卡片目录、书本目录、机读目录(MARC)、联机公共检索目录(OPAC,OnlinePublicAccessCatalog)等。,OPAC:是指以计算机编码形式存贮在计算机系统内,供读者通过终端设备进行联机检索的图书馆目录,即书目数据库的一种形式。,2.题录(bibliography)题录在揭示文献内容的深度方面,比目录深入,但又比文摘简单。题录是单篇文献外表特征的揭示和报导,即对某一文献外部特征的描述,由一组著录项目构成一条文献记录。题录的著录项目一般有著者,篇名及出处等,常以一个内容上独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。示例1:,3.文摘(abstract)更有利于用户判断检索结果的准确性。文摘是指对一份文献(或称一个文献单元)的内容所做的简略、准确的描述,文摘的著录项目除了著者,篇名及出处等外,还有表示文献内容特征的摘要。,4.索引(index)索引是对一组信息集合的有系统的指引。索引是一种附属性的检索工具,通常称为辅助索引。索引具有便于检索,揭示事物比较深入、全面、明细等方面的优点。索引的用途在文献检索中体现得极为突出,科技文献数量庞大、内容复杂多样,使用面广且频繁。虽然已将其中绝大部分加工压缩成文摘或题录等。但如果没索引,查检起来还是很不方便。严格地说,没有索引的检索工具不能称为完善的检索工具。最常用的索引是主题索引、分类索引和著者索引等。,目录:单位出版物题录:单位出版物中的单篇文献文摘:单位出版物中的单篇文献索引:单位出版物或单篇文献中的知识单元,检索工具的著录对象,手工信息检索工具的著录项目目录:出版物名称-编著者-出版项附注项题录:题目/著者/出处文摘:题目/著者/出处、文摘索引:知识单元-顺序号(或页码)期刊论文的文献出处:刊名、年、卷、期、页码,(三)文献检索系统的功能报道文献信息存储文献信息检索文献信息,2.4检索的方法,信息检索方法,工具法,引文法,循环法,2.4.1工具法概念:利用文献检索系统(工具),根据已经掌握的相关线索(如书名、刊名、篇名、作者姓名、主题词、分类号等等),进行系统而全面的文献检索的方法。类型:顺查法、倒查法、抽查法,2.4.2引文法概念:利用文献后面的参考文献查找信息的方法特点:所检文献专指度较高、信息越来越旧、容易误导;在检索工具短缺时采用此法.,2.4.3循环法概念:工具法和引文法交替使用的检索方法特点:优势互补了解课题发展动态,选择信息检索方法的原则:,1、有检索工具时用工具法或循环法2、无检索工具时用引文法3、新兴学科或知识更新快的学科课题用倒查法4、查全率要求高用顺查法5、已经掌握课题发展的规律特点用抽查法,2.5检索步骤,分析检索课题,明确检索要求选择检索工具,确定检索途径确定检索标识,确定检索运算构筑检索提问,获取初步结果调整检索策略,获取所需信息,2.6检索效果的评价及其优化检索效果评价的意义(1)提高检索效率(2)改善系统性能,检索效果评价的指标评价检索效果的常用指标有:查全率(Recallratio)-用R表示查准率(Precisionratio)用P表示漏检率(Omissionratio)-用O表示误检率(Fall-outratio)-用F表示高查全率和查准率是人们在检索活动中通常所追求的目标。,查全率查全率是指被检出的相关文献量与系统文档中实有的相关文献量之间的比率。它是衡量信息检索系统收录内容及其用户检索结果的完整程度的指标。可用下式表示:被检出相关文献量查全率(R)=100%系统中相关文献总量,查准率查准率是指检出的相关文献量与检出文献总量之间的比率。它是衡量信息检索系统收录内容及用户检索结果精确度的尺度。可用下式表示:检出相关文献量检准率(P)=100%检出文献总量,影响用户查全率与查准率的不良因素(1)对检索目标把握不准确(2)对检索系统选择不洽当(3)检索词和逻辑组配不当(4)检索途径和方法选择不当(5)系统功能不熟悉、检索技能不熟练,检索效果的优化手段提高检索系统的功能提高数据库的质量提高检索人员的素质优化检索策略,提高查全率的主要方法(1)准确把握检索对象及目的,选择合适的数据库。(2)降低检索词或分类号的专指度。(3)更多地采用学科分类途径来扩大检索范围。(4)减少逻辑“与”及逻辑“非”的使用。(5)增加逻辑“或”及截词检索技术的使用。(6)采用“全文检索”。(7)不限定检索对象的文献类型、时间段、文种等。,提高查准率的主要方法(1)准确把握检索对象及目的,选择合适的数据库。(2)提高检索词或分类号的专指度。(3)更多地采用专用名词及特性检索的途径。(4)选择逻辑“与”及逻辑“非”的使用。(5)减少或不采用逻辑“或”及截词检索技术的使用。(6)限定检索词出现的字段及在段落、文句中的位置。(7)不选“全文检索”.(8)限定检索对象的文献类型、时间段、文种及其它特征。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!