信息检索与应用基础知识课件

上传人:沈*** 文档编号:241048730 上传时间:2024-05-27 格式:PPTX 页数:40 大小:884.23KB
返回 下载 相关 举报
信息检索与应用基础知识课件_第1页
第1页 / 共40页
信息检索与应用基础知识课件_第2页
第2页 / 共40页
信息检索与应用基础知识课件_第3页
第3页 / 共40页
点击查看更多>>
资源描述
信息检索与应用基础知识内容提要信息和信息检索的定义信息检索语言信息检索工具信息检索途径信息检索技术信息的定义信息信息:是客观事物存在的方式或运动状态,以及关于客观 存在方式或运动状态的陈述。知知识:知识是人们对客观事物存在和运动规律的认识。文献文献:任何人类的知识用文字、图形、符号、声频、视频 的手段记录下来的东西。统统可称为文献。文献也可称为固化在一定载体上的知识。信息、文献、知识之间的联系信息信息文献文献知知识文献信息图书期刊会议文献学位论文专利文献标准文献研究报告政府出版物产品样本技术档案信息检索的定义信息信息检索(索(Information Retrieval)广义:将信息按一定的方式组织和存储起来,并根据用户 的需要找出有关信息的过程和技术。全称“信息存储与检索”(InformationStorageandRetrieval)。狭义:从信息集合中找出所需要的信息的过程。又相当于“信息查寻”(InformationSearch)。文献文献检索索是以文献为检索对象,从已存贮的文献库中查找特定文献的过程。事事实检索索是以事实为检索对象,查找某一事物发生的时间、地点及过程。数据数据检索索是以数据为检索对象的一种检索,包括数值、公式、图表等。在这个大数据时代,数据检索尤为重要。信息级别一次信息一次信息又称原始信息,著者本人研究并公开发表或出版的信息。信息检索最终目的就是查找到最适用的一次信息二次信息二次信息对一次信息进行整理和浓缩,并按外部特征(题名、著者)或内容特征(分类号、主题词)将其“有序化”,形成新的信息形式。信息检索主要讲述二次信息的编排体系和使用方法三次信息三次信息利用二次信息,选择有关的一次信息加以分析、综合而编纂出的第三层次的信息形式。三次信息具有系统性、综合性、知识性和概括性的特点一次信息一次信息二次信息二次信息三次信息三次信息知知识产生生记录档档 案案学学位位论文文标 准准科科技技报告告专利利说明明书会会议论文文期期刊刊论文文专 著著目目 录索索 引引文文 摘摘传播播信信息息利利用用述述 评综 述述词 典典年年 鉴手手 册册百百科科全全书内容提要信息和信息检索的定义信息检索语言信息检索工具信息检索途径信息检索技术信息检索语言的定义信息信息检索索语言言:是应文献信息的加工、存贮和检索的共同需要而编制的专门语言,它是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。是一种人工语言。有分分类检索索语言言和主主题检索索语言言两种。分类检索语言(以中图法为例)中中图法法 五个部类:马克思主义、列宁思想、毛泽东思想;哲学;社会科学;自然科学;综合性图书。22个大类(一级类目)采用字母与数字相结合的方式编制建议总结Proposals中图法中图法主题检索语言主题检索语言:关关键词检索索语言言和标题词检索索语言言。关键词检索语言:关键词是指那些出现在文献的标题(篇名、章节名)以及摘要、正文中,对表征文献主题内容具有实质检索意义的词,亦即对揭示和描述主题内容来说是重要的、带关键性的可以作为检索“入口”的那些词。标题词检索语言:标题词是指表征文献内容特征的、经过规范化了的名词术语(包括词组和短语)。标题词语言是先组式检索语言,组配固定,不易混乱,标题词表是标题词及其使用规则的汇编,是一部标题词词典。内容提要信息和信息检索的定义信息检索语言信息检索工具信息检索途径信息检索技术信息检索工具信息信息检索工具索工具是根据某种信息需要而按照一定的规则组织编制的工具或系统。传统的信息检索工具如字典、百科全书、文摘、书目、索引等,现在流行的检索工具如数据库、搜索引擎、专业性网站等。具备的4个条件个条件:1.对所收录信息的各种特征要有详细的描述;2.每条描述记录都标明有可供检索用的标识;3.全部描述记录科学地组织成一个有机的整体;4.具有多种必要的检索手段。信息检索工具的分类信息信息检索工具索工具目目录题录索引索引文摘文摘参考工参考工具具书搜索引搜索引擎擎数据数据库按著按著录信息特征分信息特征分目录型检索工具一切可供检索使用的目录均可称为目录型检索工具。它主要报道信息的外表特征,著录具体出版事宜及其收藏信息。常见的目录按其收录范围可以分为国家目录、联合目录、馆藏目录;按报道的范围分为综合性目录和专题性目录。索引型检索工具将信息的外部特征或内部特征(例如题名、著者、主题、分类等)用各种检索语言进行描述,并将它们按照一定的方法组织起来,用户根据查处的线索可以进一步查找原始信息内容的工具。索引与目录的区别在于它不仅能揭示信息的外部特征,还能揭示信息的内部特征。常见的索引有主题索引、分类索引和关键词索引。文摘型检索工具文摘一般由题录和内容摘要两部分组成,它在描述信息外部特征的基础上,还增加有揭示内容特征的摘要部分,是系统地报道、积累和检索信息的主要检索工具,也是传统检索工具的核心。按文摘的目的和用途划分,它可以分为报道性文摘、指示性文摘、报道指示性文摘和评论性文摘。数据库数据库包括目录、索引、文摘、搜索引擎等工具的内容,但是由于其组织的特殊性,也可以认为是一种检索工具。参考工具书参考工具书是分析和著录大量具体而常用的科学数据库与事实以备查用的各种常用工具书的总称。其中包括字典、词典、年鉴、百科全书、指南、手册、名录等。搜索引擎将网络信息分门别类地组织起来,通过搜索网址的方式来实现信息检索的工具就是搜索引擎。它是一种网络检索工具,检索到的既可以是一般的信息线索,也可以是原始信息全文,既可以是一般的文本信息,也可以是多媒体信息。信息检索工具的分类信息信息检索工具索工具综合性合性检索工具索工具专业性性检索工具索工具单一性一性检索工具索工具按收按收录范范围分分综合性检索工具收录的学科范围较广,涉及的信息种类和语种也比较多。例如,美国的工程索引Ei专业性检索工具收录的学科范围比较窄,仅限于报道某学科或专业的信息,但收录该学科信息的类型比较全。例如,美国的化学学会电子期刊数据库ACS单一性检索工具指收录的文献类型比较单一,文献的著录格式也标准、规范。例如中国专利公报,就是典型的单一性检索工具,它仅仅收录单一的文献类型专利文献,著录格式简单规范,易于查找。内容提要信息和信息检索的定义信息检索语言信息检索工具信息检索途径信息检索技术信息检索途径信息信息检索途径索途径内部特征途径内部特征途径分分类途径途径主主题途径途径外部特征途径外部特征途径题名途径名途径著者途径著者途径引文途径引文途径序号途径序号途径代代码途径途径内部特征途径分分类途径途径:按学科分类体系来检索文献。主主题途径途径:通过反映文献资料内容的主题词来检索文献。外部特征途径题名途径名途径:题名包括书名、刊名等。著者途径著者途径:从著者、编者、译者、专利权人的姓名或机关团体名称字顺进行检索的途径统称为著者途径。引文途径:引文途径:文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。序号途径:序号途径:有些文献有特定的序号,如专利号、报告号、合同号、标准号、国际标准书号和刊号等。文献序号对于识别一定的文献,具有明确、简短、唯一性特点。依此编成的各种序号索引可以提供按序号自身顺序检索文献信息的途径。代代码途径:途径:利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进行检索。内容提要信息和信息检索的定义信息检索语言信息检索工具信息检索途径信息检索技术信息检索技术布布尔逻辑检索技索技术:指利用布尔逻辑运算符连接各个检索词,然后由计算机进行相应逻辑运算,以找出所需信息的方法。截截词检索技索技术:截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。布尔逻辑检索技术逻辑与与“AND”和和“*”用AND和*表示。可用来表示其所连接的两个检索项的交叉部分,也即交集部分。如果用AND连接检索词A和检索词B,则检索式为:AANDB(或A*B):表示让系统检索同时包含检索词A和检索词B的信息集合C。布尔逻辑检索技术逻辑或或 “OR”和和“+”用OR或+表示。用于连接并列关系的检索词。用OR连接检索词A和检索词B,则检索式为:AORB或(A+B)。表示让系统查找含有检索词A、B之一,或同时包括检索词A和检索词B的信息。布尔逻辑检索技术逻辑非非“NOT”和和“”用NOT或-号表示。用于连接排除关系的检索词,即排除不需要的和影响检索结果的概念。用NOT连接检索词A和检索词B,检索式为:ANOTB(或A-B)。表示检索含有检索词A而不含检索词B的信息,即将包含检索词B的信息集合排除掉。截词检索技术截截词检索技索技术前截断前截断中截断中截断后截断后截断截截词算符在不同的系算符在不同的系统中有不同的表达形式,需要中有不同的表达形式,需要说明的是不同的明的是不同的系系统所用的截所用的截词符也不同,常用的有符也不同,常用的有?、$、*等。分等。分为有限有限截截词(即一个截(即一个截词符只代表一个字符)和无限截符只代表一个字符)和无限截词(一个截(一个截词符可代表符可代表多个字符)。多个字符)。截词检索技术无限截词举例前截断前截断:后方一致。如:?computer表示minicomputer,microcomputer等。中截断中截断:中间一致。如?comput?表示minicomputer,microcomputers等后截断后截断:前方一致。如:comput?表示computer,computers,computing等短语检索技术短短语检索索又叫“精确检索”,用双引号“”表示,要求检索出来的表现形式和输入的表现形式完全一致。一般在以下情况下使用:1、机构名称机构名称2、人名、人名3、地名、地名4、专业名称名称
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!