资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第一章,信息检索原理,第二章,信息检索语言,第三章,中文工具书的使用,第四章,中文数据库检索,第五章,美国,工程索引,(,Ei,),第六章,英国,科学文摘,(,SA,),第七章,美国,科学引文索引,(SCI),第八章,剑桥科学文摘(,CSA,),第九章,应用科学技术索引,(ASTP),第十章,美国土木工程师协会数据资源系统(,ASCE,),第十一章,美国,公路研究文摘,(,HRA,),第十二章,美国机动车工程师协会数字图书馆全文数据库(,SAE,),第十三章,美国,地质学题录与索引,(,BIG,),第十四章,专利概述,第十五章,中国专利文献检索,第十六章,世界专利文献检索,第十七章,计算机信息检索基础,第十八章,联机信息检索,第十九章,光盘信息检索,第二十章,因特网信息检索,第二十一章,搜索引擎,第一章 信息检索原理 第二章 信,1,第一章,信息检索原理,第二章,信息检索语言,第三章,中文工具书的使用,第四章,中文数据库检索,第五章,美国,工程索引,(,Ei,),第六章,英国,科学文摘,(,SA,),第七章,美国,科学引文索引,(SCI),?,第八章,剑桥科学文摘(,CSA,),?,第九章,应用科学技术索引,(ASTP),?,第十章,美国土木工程师协会数据资源系统(,ASCE,),?,第十一章,美国,公路研究文摘,(,HRA,),?,第十二章,美国机动车工程师协会数字图书馆全文数据库(,SAE,),?,第十三章,美国,地质学题录与索引,(,BIG,),第十四章,专利概述,第十五章,中国专利文献检索,第十六章,世界专利文献检索,第十七章,计算机信息检索基础,?,第十八章,联机信息检索,?,第十九章,光盘信息检索,第二十章,因特网信息检索,第二十一章,搜索引擎,第一章 信息检索原理 第二章 信,2,第二章 信息检索语言,第一节,信息检索语言概述,第二节,信息检索语言基础,第三节,分类语言,第四节,主题语言,Return,第二章 信息检索语言第一节 信息检索语言概述第二节,3,第一节 信息检索语言概述,一、检索语言的基点,“,序”,序 是关于规律性的概念通常指有规则。,二、“序”与信息检索语言,三、信息检索语言的定义,Return,第一节 信息检索语言概述一、检索语言的基点“序”Ret,4,信息检索语言的定义,信息检索的基本原理是将用户的检索提问标识与检索工具或数据库记录中的信息特征标识进行对比,当二者一致时,即为检索命中。,由此可见,能否准确地检索出用户所需的信息,关键在于能否准确地选择表达检索提问的标识。这里讲的“准确”,是指用户所选用的检索提问标识必须与检索工具或数据库中标引文献记录所甲的信息特征标识完全一致,这就要求检索人员和标引人员必须遵循同一种规则,这个规则就是检索语言。,信息检索语言的定义信息检索的基本原理是将用户的检索提问标识与,5,检索语言就是为沟通信息标引与信息检索两个过程而编制的人工语言,是连接标引人员与检索人员双方思路的桥梁。,信息检索的作用:,(,1,)帮助信息工作人员完整、准确、快速地标引信息的内容特征和外表特征,完成信息的存储过程,也就是利用检索语言编制检索工具或建立检索系统。各种图书资料分类表、主题词表都是利用检索语言编制而成的。,(,2,)帮助检索者系统、全面、准确地查找所需的文献资料,完成文献的检索过程。,(,3,)帮助信息管理人员系统地组织大量而无序的文献,从而使信息的管理科学化。检索者为了查找所需的文献资料,必须具备检索语言的基本知识,熟悉和掌握各种检索语言的结构体系。,检索语言就是为沟通信息标引与信息检索两个过程而编制的人工语言,6,第二节 信息检索语言基础,一、概念及其逻辑关系,等同关系,同义关系示意图,属分关系,属分关系示意图,相关关系,交叉关系示意图,矛盾关系示意图,对立关系示意图,二、检索语言类型,表述文献外部特征的检索语言,表述文献内容特征的检索语言,检索语言类型示意图,Return,第二节 信息检索语言基础一、概念及其逻辑关系 等同关,7,信息检索语言基础,(,一,),等同关系,等同关系是指两个或两个以上的词所表达的概念完全相同或基本相同。它包括同义关系和准同义关系。,1,同义关系,同义关系指所表达的概念完全相同。,其逻辑关系,如图,2-1,所示。图中,A,、,B,分别表示两个同义词,重合的,A,、,B,两圆代表这两个同义词所表达的概念具有同义关系,即,A,和,B,外延完全重合。,同义词的形式主要有:规范词与俗称,(,如引桥与桥头引线,),:全称与简称,(,如澳大利亚与澳洲,),等。,2,准同义关系:指所表达的概念基本相同或相近。准同义词的形式主要有:,近似词,(,如汽车排气与汽车废气,),;,泛指词与专指词,(,如汽车管理与汽车检验,),;,部分反义词,(,如稳定性与不稳定性,),等。,在检索语言中,为了保持事物一概念一语言形成一一对应的关系,只能选择一个概念作为正式的标引词。,信息检索语言基础(一)等同关系,8,(,二,),属分关系,属分关系又称属种关系。它是指这样两个概念:其中一个概念完全被包括在另一个概念的外延里,是另一个概念外延的一部分。外延较大的概念称为属概念,(,上位概念,),,外延较小的概念称为种概念,(,下位概念,),。其逻辑关系如图,2-2,所示。,(,三,),相关关系,指概念之间关系密切但又不同于等同关系和属分关系的一种关系。它不像前两种关系那样密切,灵活性较大。相关关系一般有以上三种类型。,1.,交叉关系,交叉关系又称部分重合关系。它是指有一部分外延相生命的概念之间的关系。,信息检索电子ppt课件,9,(,三,),相关关系,2.,矛盾关系,矛盾关系是指外延上互相排斥,而其外延之和等于其共同上位概念外延总和的两个概念间的关系。其逻辑关系,如图,2-4,所示,。以“金属材料”和“非金属材料”为例,其中,A,代表金属材料,非,A,代表非金属材料,,A,与非,A,的外延之和为其中的圆,表示“材料”。,3,对立关系,对立关系是指在外延上互相排斥,但其外延之和不等于其上位概念外延总和的概念间的关系。其逻辑关系如图,2-5,所示。以“冷加工”与“热加工”为例,图中,A,代表冷加工,,B,代表热加工,它们的概念外延之和并不等于“金属压力加工”这个上位概念的外延。金属压力加工还包括“轧制”、“压制”、“拉拢”等加工工艺。即冷加工与热加工的概念外延之和小于其共同上位概念的外延,它们之间还存在着中间概念,即图中的,C,。这是它和矛盾关系最本质的区别。,(三)相关关系 2.矛盾关系,10,二、检索语言类型,文献外部特征的检索语言和表述文献内容特征的检索语言,,如图,2-6,所示,。,文献的外部特征通常指题名、著者、专利号、报告号等信息,而内容特征通常指文献的主题概念、文献所属的学科等。在揭示文献内容和表达检索提问方面,内容特征比外部特征更具有深度。,(一)表述文献外部特征的检索语言,(二)表述文献内容特征的检索语言,二、检索语言类型文献外部特征的检索语言和表述文献内容特征的检,11,信息检索语言,描写文献外部特征,描写文献内容特征,分类语言,主题语言,单元词语言,标题词语言,关键词语言,叙词语言,体系分类语言,组配分类语言,混合分类语言,题名语言,著者语言,号码语言,图,2-6,检索语言类型,Return,信息检索语言描写文献外部特征描写文献内容特征分类语言主题语言,12,第三节 分类语言,一、体系分类语言的概念,目前最常用的分类语言是体系分类语言。,二、体系分类表的编排结构,类目表,中图法,结构示意图,辅助表,索引,三、体系分类表的评价,体系分类表的优点,体系分类表存在的问题与不足,Return,第三节 分类语言 一、体系分类语言的概念 类目表,13,1.,分类语言,体系分类语言是一种先组式检索语言。它建立在科学分类的基础上,运用概念划分与概括的方法,将大大小小的概念进行层层划分,从而产生不同级别且存在隶属关系和体现知识等级体系的类目,每一类目分别以不同的符号做标记,每个符号都是表达特定知识概念的语词。体系分类语言就是以学科体系为基础,用标记符号作为概念标识并按类编排的检索语言。,广义上讲,分类语言也属于主题语言。分类语言是按学科范畴划分而构成的一种语言体系,它集中反映学科的系统性、反映它们的相关、从属、派生等关系,从总体到局部分层、分面展开,形成分类体系。由类目号码及名称作为检索语言,构成分类类目表,如前述图书分类表、专利分类表用的都是分类语言。,1.分类语言 体系分类语言是一种先组式检索语言。它建,14,先组式(,pre-coordination,)语言:先组式语言:是指在检索实施前已事先组配好的一种检索语言,用户只能用这种已经固定好的检索词组形式去完成检索,它有较好的直接性和专指性,但灵活度差,比如标题词语言。,后组式(,post-coordination,)语言:后组式语言:是指在检索实施前未事先组配好的、以单元词等形式出现的一种检索语言,在检索时将它们临时组配起来,表达一定的概念,来完成检索。这种后组方式提供了灵活的组配方式,在计算机检索中的到广泛应用。如单元词法和叙词法。,先组式(pre-coordination)语言:先组,15,体系分类表是体系分类语言的具体体现形式。现以在我国使用较广的,中国图书馆分类法,(简称,中图法,)为例说明其结构体系和使用方法。,中图法,是我国第一部集中了全国图书馆和信息部门的力量共同编制的一部综合性大型文献分类表。,1975,年初版,到,1999,年已出版第四版(印刷版和机读版)。目前,中图法,广泛应用于各类型图书馆。,中图法,主要由类目表、辅助表和索引三部分构成。,(一)类目表,类目表是,中图法,最主要的组成部分,它由基本部类、基本大类、简表及详表构成。,1,基本部类和基本大类,中图法,有五个基本部类:马克思主义、列宁主义、毛泽东思想、邓小平理论;哲学、宗教;社会科学;自然科学;综合性图书。这是整个分类表最先确定、最本质、最概括的区分。,中图法,在基本部类的基础上进一步展开类目,形成,22,个基本大类,即一级类目。,2,简表,简表是在基本大类的基础上进一步区分出的类目。它是整个分类表的骨架,起着承上启下的作用。简表一般包括一、二、三级类目,可以反映出整个分类表的概貌。,3.,详表(主表),体系分类表是体系分类语言的具体体现形式。现以在我国使用较广的,16,(二)辅助表,中图法,的辅助表分两种:,1,通用复分表,该表置于,中图法,的最后,适用于整个主表;,2,专用复分表,该表只适用于某个学科,列于主表中有关类下。复分表是将各学科或某学科通用的类目集中编制而成,主要目的在于缩小分类表的篇幅。,(三)索引,(中国图书馆分类法)索引,单独出版发行,它收录了分类表中已列出的具有检索意义的概念,并将这些概念依汉语拼音字顺排列起来。它的编制目的主要在于提供从字顺查检分类表类目的途径,其次是使分类表具有一定程度的主题检索功能。,(二)辅助表,17,体系分类表的优、缺点,(一)体系分类表的优点如下:,(,1,)它是以学科和专业集中文献的,强调知识的系统性,所以从学科和专业的角度检索文献,会获得较好的族性检索效果。,(,2,)它将概念逐级划分,便于扩大和缩小检索范围。,(,3,)它是组织分类目录、分类索引和文献分类排架的依据。,(二)体系分类表存在的问题与不足:,(,1,)体系分类表对标引和检索主题概念复杂的文献时不够准确。因为学科之间相互渗透和相互融合越来越多,直线序列的分类表难以反映多元性的知识空间,在表达复杂主题概念时不够准确,影响到查准率。,(,2,)因新兴学科、边缘学科或交叉学科而产生的类目不能及时地体现。体系分类语言是一种先组式语言,所以根据它编制的分类表不能随时修改和补充。,(,3,)使用分类语言,必须了解科学分类体系,否则不容易找到准确的类目。因此检索时的思路比较复杂。,(,4,)体系分类表有利于族性检索,但不利于特性检索。如“汽车
展开阅读全文