第二章信息检索方法课件

上传人:vosvybf****vycfil... 文档编号:243126817 上传时间:2024-09-16 格式:PPT 页数:100 大小:1.98MB
返回 下载 相关 举报
第二章信息检索方法课件_第1页
第1页 / 共100页
第二章信息检索方法课件_第2页
第2页 / 共100页
第二章信息检索方法课件_第3页
第3页 / 共100页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章,信息检索方法,2.1,检索的概念及原理,2.2,检索工具概述,2.3,检索方法及检索途径,2.4,检索式的拟订,2.5,检索步骤,2.1,信息检索的概念,一、信息检索的基本概念,狭义:是指依据一定的方法,从已经组织好的大量有关文献信息集合中,查找并获取特定的相关文献信息的过程。,广义:将信息按照一定的方式组织和,存储,起来,并根据用户的需求,找出,有关信息的过程。,信息检索的类型,(根据不同的检索对象):,一、,数据检索:,检索的结果是数据。如某种材料的电阻;某变压器的参数;化学分子式、数据图表等,(,手册,),某地方,GDP,增长情况,(,年鉴,),二、,事实检索:,检索的结果是事实结论。查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的,(,年鉴,),三、,文献检索:,检索的结果是文献资料。查找相关文献的内容、出处、收藏单位等。如系统地查找信息检索方面的相关文献,(,论文,),文献检索是信息检索的一种最基本的、最主要的形式。,检索工具是人们用来存储、报道和查找各类信息的工具 。,按著录信息的特征划分,著录是指编制检索工具时对文献的内容和形式特征进行分析、选择和记录的过程。,目录型检索工具,文摘型检索工具,索引型检索工具,全文型检索工具,一、检索工具的定义及类型,2.2,检索工具概述,目录能反映一定历史时期科学文化发展的概貌,作用:,了解本学科的研究历史和研究现状。,通过各类书目,可查寻与研究课题密切相关的事实和资料。,按收录的范围可分为:馆藏目录、出版社目录、国家书目、联合目录。,1,、目录型检索工具,2,、文摘型检索工具,特点:具有摘要,提供文献的外表特征和内容特征。如:,中国生物学文摘,、美国,化学文摘,作用:,帮助读者快速判断文献内容,节省阅读时间,替代原文,图,2-2 EI,的一例文摘,3,、索引型检索工具,索引一般是附在专著或年鉴、百科全书等工具书之后以及收录内容较多的二次文献之后,按主题词、人名、地名、事件、概念等内容要项编排,按其内容可分为主题索引、分类索引、关键词索引、引文索引。,图,2-3 ,中国大百科全书,的一例索引,特点,:,提供全文下载,4,、全文型检索工具,按所收信息的学科内容划分,:,综合性检索工具,我国的综合性数据库其加工深度不及专业性检索工具,检索途径少。,专科性检索工具,能够比较集中、迅速准确和全面地反映某学科领域的最新发展状况和最前沿的科研水平。详细完整的专业信息极具针对性。,数据库的类型,书目数据库,全文数据库,文摘数据库,按信息处理层次划分,期刊论文数据库,书目及图书全文数据库,专利数据库,学位论文数据库,产品数据库,按收录的文献类型划分,图像数据库,文本数据库,数值数据库,声音数据库,视频数据库,多媒体数据库,按媒体信息划分,综合性数据库,专业性数据库,按收录文献信,息的范围划分,单机数据库,联机数据库,网络数据库,按,服务模式,划分,二 、,检索工具的选择,考虑学科范围、信息类型和数据量,【,例题,】,用,_,检索,-,呋喃甲醇羧酸酯的合成、含有碳和氢元素的化合物的英文综合学术性文献。,A.,外文,Elsevier,数据库,B.,外文农业类,CAB,文摘数据库,C.,外文农业类,AGRICOLA,数据库,D.,外文食品科技文摘数据库,FSTA,了解收录的文献类型,【,例题,】,已知参考文献:王涛,.,土木工程,CAD.,中国水利水电出版社,.2012.,要找原文,使用,_,检索,土木工程,CAD,。,A.,中文科技期刊数据库,B.,中国人民大学报刊全文数据库,C.,国务院发展研究中心,D.,图书馆的馆藏查询,信息网,【,例题,】,使用,检索,CN200920135079.3,一种土木连锁建筑结构。,A.,维普中文科技期刊数据库,B.,图书馆馆藏查询,C.,中国人民大学报刊全文数据库,D.,中国国家知识产权,大,局专利数据库,E.,中国国家科技图书文献中心,(NSTL),【,例题,】,用,检索编号是,GB/T17302.2-1998,的文献,A.,中国国家知识产权局,B.,中国国家科技图书,专利数据库 文献中心,(NSTL),C.,国务院发展研究中心信息网,D.,中国标准信息服务网,考虑信息的时间范围,同一个数据库版本不同,时效性也不一定相同。,例如清华大学图书馆收藏的,工程索引,(,EI,)各种载体及馆藏的简况比较:,印刷版(,EI,)月刊,年度更新,收录文献源,2600,种,馆藏年限,1968-1996,。,光盘版(,Ei Compendex,)季度更新,收录文献源,2600,种,馆藏年限,1970,1997,年。,网络版(,Ei CompendexWeb,)包括光盘版(,Ei Compendex,)和,Ei PageOne,两部分,半月更新,收录文献源,5000,种,馆藏年限,1970,至今。,因此网络版(,Ei CompendexWeb,)信息更新最快,量最大。,2.3,检索方法及检索途径,检索方法,:,1,常规法:,所谓常规法就是利用常规检索工具查找有关文献的方法,顺查法、倒查法、抽查法,2,引文法,就是查找参考文献或引用文献的方法。由远及近地搜寻,;,由近及远地追溯,3,综合法,引文法和常规法结合,思考:信息检索就是从一定的文献集合(即检索系统)中查找出符合特定需要的文献,那么这个过程是如何实现的呢?,标引,检索,输出,存储,过程,一次,信息,信息,特征,信息特征,标识,检索,过程,检索,课题,检索,提问,检索提问标识,分析,分析,标引,输入,图,2-1,信息检索原理图,检 索 结 果,信息检索语言,检索系统,存储信息与检索信息所依据的规则不一致,检索途径,常用字段缩写:,TI,Title,文章题目,AB,Abstract,文章摘要,KW,Key Word,关键词,AU,Author,作者,AF,Affiliation,作者单位,SO,Source,文章来源(刊名信息等),ISSN(ISBN),International standard Serial (book) Number,PY,Publication year,出版年,LA,Language,语种,1,、,主题途径,2,、,分类途径,3,、,责任者,/,刊名途径,4,、,号码途径,检索途径,主题途径是采用反映文献主题概念的检索词作为检索入口的一种检索途径,也是最常用、最重要的检索途径。,主题,“,是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和问题,”,,即文献的,“,中心内容,”,。,每种文献都包含着若干主题,研究或阐述一个或多个问题。,1,、主题途径,主题途径的优缺点,通常适合特性检索,查准率高;不适合族性检索,查全率低,【,实例,】,主题词,“,C,语言,程序设计,”,就比分类号,TP312,表达得更准,希望专指度高时采用主题途径。,【,获取主题词的技巧,】,在图书的版权页可以找到在版编目里面的主题词和分类号码。或者在图书馆的馆藏数据找到主题词。,【,实例,】,版权页样例如右图所示,2,、分类途径,(,1,)图书期刊分类法,(,2,)专利分类法,(,3,)标准文献分类法,(,4,)分类途径的优缺点,(,1,)图书期刊分类法,世界三大图书分类法:,杜威十进分类法,(DDC),(,Dewey decimal Classification,),国际十进分类法,(UDC),(,Universal Decimal Classification),国会图书馆图书分类法,(LCC),(,Library congress classification),中国图书分类法:,中国图书馆分类法,(中图法),中国科学院图书馆分类法,(科图法),中国人民大学图书馆分类法,(人大法),中图法,介绍,中图法,中国图书馆分类法,,以学科来组织知识,将全部知识领域划分为,5,个基本部类,,22,大类。,五大部类分别为:,马列主义、毛泽东思想;,哲学;,社会科学;,自然科学;,综合性图书。,A,马克思主义、列宁主义,毛泽东思想、 邓小平理论,B,哲学、宗教,C,社会科学总论,D,政治、法律,E,军事,F,经济,G,文化、科学、教育、体育,H,语言、文字,I,文学,J,艺术,K,历史、地理,N,自然科学总论,O,数理科学和化学,P,天文学、地球科学,Q,生物科学,R,医药、卫生,S,农业科学,T,工业技术,U,交通运输,V,航空、航天,X,环境科学、安全科学,Z,综合性图书,U1,综合运输,U2,铁路运输,U4,公路运输,U6,水路运输,U8,航空运输,U41,道路工程,U44,桥涵工程,U45,隧道工程,U46,汽车工程,U48,其他道路,运输工具,U49,交通工程与公路,运输技术管理,U441,结构原理、,结构力学,U442,勘测、设计,与计算,U443,桥梁构造,U444,桥梁建筑材料,U445,桥梁施工,U446,桥梁试验观测,与检定,U447,桥梁安全与,事故,U448,各种桥型,U449,涵洞工程,图,2-4,中图法,结构示意图,简表,马列,哲学,社会科学,自然科学,综合,基本大类,详表,T,类又可分为以下几类,TB,一般工业技术,TD,矿业技术,TE,石油、天然气工业,TF,冶金工业,TG,金属学、金属工艺,TH,机械、仪表工艺,TJ,武器工业,TK,动力工程,TL,原子能技术,TM,电工技术,TN,无线电电子学,电信技术,TP,自动化技术,计算机技术,TQ,化学工业,TS,轻工业、手工业,TU,建筑科学,TV,水利工程,中图法,从大类到小类,层层展开,不断细分,形成完整的知识体系。,例如:,关于红楼梦研究资料的分类为,I207.411,I,文学,I2,中国文学,I207,文学评论和研究,I207.4,小说研究,I207.41,古代小说研究,I207.411 ,红楼梦,研究与评论,【,例题,】,哲学辞典,类号为:,B-61,【,例题,】,法国的货币与银行,的类号为:,F825.65,【,例题,】,在图书馆公共查询系统中检索游记小说,: I267.4,(,2,)专利分类法,专利分类法是根据专利的功能(效果)或其用途所属的行业部分来分类,目前,世界上大部分国家采用国际专利分类法(,Interna-tional Patent Classification,,简称,IPC,)国际专利分类法,(,简称,IPC),,,IPC,是世界上应用最广泛的专利分类体系,,覆盖了世界所有,专,利文献的,95%,。,IPC,适用于,发明,和,实用新型,专利的分类。,我国于,1997,年正式加入,IPC,联盟。,部号,部名,分部名,部号,部名,分部名,A,人类生活必需,农业,E,固定建筑物,建筑,食品;烟草,钻进;采矿,个人或家用物品,保健;娱乐,B,作业;运输,分离;混合,F,机械工程;照明;采暖;武器;爆破,发动机和泵,成型,一般工程,印刷,照明;加热,交通运输,武器;爆破,C,化学;冶金,化学,G,物理,仪器,冶金,核子学,D,纺织;造纸,纺织或未列入其他类的柔性材料,H,电学,造纸,IPC,分类简表,第,2,讲,信息检索基础,(,3,),标准文献分类法,世界各国的标准分类法同文献资料分类法类似,或以数字为标记、或以字母为标记、或以字母和数字混合为标记。,我国的标准分类法采用混合标记,一级类目以专业划分,用字母表示类号,二级类目采用等级列类方法用双位制数字表示。排检时先按照字母顺序,大类相同再按双位数字顺序排列。中国标准分类法,(,Chinese Classification for Standards,,简称,CCS,),【,部分分类,】,A,综合,00,09,标准化管理与一般规定,10,19,经济、文化,20,39,基础标准,40,49,基础学科,50,64,计量,65,74,标准物质,75,79,测绘,B,农业林业,00,09,农业、林业综合,10,14,土壤与肥料,15,19,植物保护,20,29,粮食与饲料作物,30,39,经济作物,40,49,畜牧,50,59,水产、渔业,(,4,)分类途径的特点,1,)通常适合族性检索,查全率高;不适合特性检索,查准率低,2,)不能适应学科发展中的变化,难以反映新学科和新名词术语,【,实例,】,食品风险分析是保证食品安全的一种新模式,同时也是一门正在发展中的新兴学科。风险分析的目标在于保护消费者的健康和促进公平的食品贸易。目前的文章在分类上暂时归入, R155.5 ,食品卫生与检验和, TS201.6 ,食品安全与卫生。没有一个专门的,“,食品风险分析,”,分类号。,英文版著者索引中人名规则,按姓、名次序排列:一般为原文中所使用的名字,姓在前,接着是逗号,然后是名。,例如:,Arrow B. Smith,著录为:,Smith,,,Arrow B.,3,、责任者,/,刊名途径,作者无疑是最佳检索途径之一。欧美人的姓名大量使用简称,姓氏一般用全称,而名则以简写居多。,例如,:,以著名物理学家史蒂芬,威廉,霍金(Stephen William Hawking)为例,在Google Scholar中检索输入,“,SW Hawking,”,较,“,Stephen William Hawking,”,检索效果更为理想。,同样万维网之父蒂姆,伯纳斯,李的名字。除输入,“,Tim Berners,Lee,”,外,还应输入,“,T Berners,Lee,”,或是,“,T B Lee,”,。,若无法确定作者准确姓名,可仅输入作者的姓氏。如2007年诺贝尔经济学奖获奖者之一莱昂尼德,赫维奇(Leonid Hurwicz)。在Google Scholar中仅输入,“,Hurwicz,”,,其查准率、查全率也是非常高的。,翻译为英文的中国著者姓名,(,1,)翻译的规则,分为音译和意译。中国著者姓名和团体机构名称的音译,一般用汉语拼音。,【,实例,】,原西南师范大学在欧洲专利数据库就有三种写法:,Southwest China Normal University,Southwest Normal University,Xinan Teachers, University,有的数据库例如,工程索引,常将,University,缩写成,Univ,。,中国人名翻译成英文名字基本上是用汉语拼音。,以杨振宁为例,可输入,“,Yang Zhenning,”,或输入,“,Zhen Ning Yang,”,,以输入,“,CN Yang,”,命中的文献最多。,同样,要查询李政道的文献,可分别输入,“,TD Lee,”,、,“,Tsung Dao Lee,”,、,“,li zhengdao,”,。,刊名也是有效的检索途径之一,并大量使用缩略语。,IEEE,系列期刊的刊名均为,“,IEEE Transactions on,”,。,以,IEEE Transactions on Systems,为例,仅输入其全称是不够的,还应输入,“,IEEE Trans,Syst,”,。,以,“,Knowledge and Information Systems,”,一刊为例,除输入全称外,还需输入,“,know1,inf,syst,”,。,(,2,)拼写形式,【,例题,】,在英文数据库检索作者,“,金长青,”,的论文,作者名除了,“,Jin, ChangQing,”,还有其他拼写形式?,【,题解,】 ChangQing Jin,Jin, Chang-Qing,Jin CQ,CQ,,,Jin,Jin, C.Q,Jin, C.Q.,Jin, C.-Q,4,、 号码途径,常见的号码索引:,ISBN,号、索书号、,ISSN,号、专利号、入藏号、报告号、标准编号,常见的专用符号代码索引:,元素符号、分子式、结构式等,常见的专用名词术语索引,地名、机构名、商品名、生物属名等,注,:索书号,:,由两部分组成,中间用空格隔开。,第一部分是根据图书的学科主题所取用的分类号码。,第二部分是按照图书作者姓名所编排的著者号码,或者是按照图书进入馆藏时间的先后所取用的顺序号码。,种次号,中图分类号,2.4,检索式的拟订,2.4.1,布尔逻辑检索算符,2.4.2,位置检索算符,2.4.3,截词检索算符,2.4.4,字段揭示及限制算符,2.4.5,其它符号,2.4.6,注意事项,精确与模糊检索,基本技术,词间位置检索,加权检索,布尔逻辑检索,限定字段检索,限定范围检索,截词检索,1,2,3,4,5,6,7,1.,逻辑,“,与,”,(AND),,表示为,A and B,或,A * B,2.,逻辑,“,或,”,(OR),,表示为,A or B,或,A + B,3.,逻辑,“,非,”,(NOT),,表示为,A not B,或,A - B,2.4.1,布尔逻辑检索算符,逻辑,“,与,”,用,“,and,”,、,“,*,”,或者空格表示。在网络搜索引擎中习惯用空格代替,“,and,”,。表示检出的记录必须同时包含所有的检索词,可以缩小检索范围,减少命中文献量,提高查准率。,A,B,A and B,例:检索,“,太阳能,”,文献,太阳,能源,【,实例,】,检索课题,“,前视红外图像分割方法研究,”,【,实例,】,检索课题,“,中国外汇储备规模的研究,”,逻辑,“,或,”,用,“,or,”,、,“,”,或逗号表示。在网络搜索引擎中习惯用逗号代替,“,OR,”,。表示检出的记录中至少含有多个检索词中的任何一个,可以扩大检索范围,增加命中文献量,防止漏检。常用于连接同义词,相关词等。,A,B,A or B,例:检索,“,光盘和磁盘,”,文献,光盘,磁盘,【,实例,】,在搜索引擎中输入,“,计算机,OR,多媒体,OR Windows98,”,则查询至少包含,“,计算机,”,、,“,多媒体,”,、,“,Windows 98,”,三者之一的信息。,逻辑,“,非,”,(NOT),表示检索结果中排除含有某些词的记录,可以缩小检索范围,减少文献输出量,但并不一定能提高查准率。,A,B,A not B,例:检索,“,除核能以外有关能源,”,文献,能源,核能,【,实例,】,输入:,automobile not car,,就要求查询的结果中包含,automobile,(汽车),但同时不能包含,car,(小汽车)。,【,实例,】,在搜索引擎中输入:电视台,-,中央电视台,查询结果不包含,“,中央电视台,”,。,相同的检索词在不同的字段中检索到的结果不同。,【,实例,】,用,中文科技期刊数据库,检索机械产品采用计算机辅助设计的论文。,用不同字段作为途径,如下所示:,选择,”,u=,任意字段,”,输入,“,计算机辅助*产品,”,,查出,3090,篇;,选择,”,m=,题名或关键词,”,输入,“,计算机辅助*产品,”,,查出,665,篇;,选择,“,t=,题名,”,输入,“,计算机辅助*产品,”,,查出,149,篇;,选择,“,k=,关键词,”,输入,“,计算机辅助*产品,”,,查出,576,篇;,检索入口 选择,“,c=,分类号,”,输入,“,机械产品,”,的分类号,“,TH122,”,年限设定,查到,12379,条。,也叫,“,邻接检索,”,,,表示两个或多个检索词之间的关系检索方式,常用的位置算符有,:,1. w (with),表示两个检索词前后次序固定,二者之间只能间隔连字符、空格或者是逗号。,【,实例,】,在,OCLC,中输入,communication w satellite,;,2,.,wN (with N),表示两个检索词前后次序固定,二者之间最多间隔,N,个字符。,【,实例,】,在,EBSCO,中输入,communication w3 satellite,;,2.4.2,位置检索算符,3. n( Near),表示两个检索词可以互换顺序,二者之间只能间隔连字符、空格或者是逗号。,【,实例,】,在,OCLC,中输入,communication n satellite,;,4. nN( Near N),表示两个检索词可以互换顺序,二者之间最多间隔,N,个字符。,【,实例,】,在,EBSCO,中输入,communication n3 satellite;,比较:在,EBSCO,中输入,source and law,、,source w2 law,2.4.3,截词检索算符,检索,color,检索,computer,、,microcomputer,、,minicomputer,英语词根,ology,截词符(通配符),提高查全率,防止漏检的有力手段,也可以简化输入,包括有限截词和无限截词,常用的截词符有:*, ?, #,!,,,$,有限截词,一个符号表示一个字符,一般使用,“,?,”,(英文半角问号)代表,0-1,个字符。,比如,: chip?,可检索出:,chips,(右截断),无限截词,一个符号表示任意多个字符,标准符号是,“,*,”,,代表,0-n,个字符,也称为通配符。,比如,:comput*,可检出:,compute, Computer, computers, computing, Computerize,等,.,注:不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认,2.4.3,截词检索算符,后截断,无限截断,如:,physic?,截词检索与截词检索算符,Physic,physic,s,physic,st,physic,alism,Physic,physic,s,physic,st,如:,physic*,有限截断,中文数据库里面习惯称为,“,前方一致,”,中截断,前截断,如:,m?n,man,men,如:,*,computer,minicomputer,computer,microcomputer,中文数据库里面习惯称为,“,后方一致,”,Onelook,(,在线词典,),例如,:,查找后缀为,:ology,Title (ti)=computer,Py=2008,La=english,限定网站:,site:,link:whitehouse.gov,限定网页:,inurl:,flash,荷塘月色,限定文件类型:,filetype:ppt,通信,2.4.4,字段限制检索,2.4.5,其它符号,1,括号,括在其中的操作符先起作用。,三聚氰胺*,(,农产品,+,鸡蛋,+,牛奶,+,大米,),2,引号,引号内的检索项以整体形式出现。如:,information retrieval,表示,information AND retrieval,而,“,information retrieval,”,则表示一个词组,3,个别数据库使用的特殊符号,某些搜索引擎使用加号(,+,)表示该单词必须出现。,在某些搜索引擎中输入,“,+,电脑,+,电话,+,传真,”,就表示要查找的内容必须要同时包含,“,电脑、电话、传真,”,这三个关键词。,个别数据库例如,“,国研网,”,、山东标准网使用,“,&,”,代替,“,and,”,;欧洲专利局光盘数据库的,“,without,”,、美国专利商标局数据库的,“,andnot,”,就是通用的,“,not,”,。,4.,英语或汉语中都有许多虚词,不能作为检索词。,如:汉语中,“,的、地、得、了,”,等助词,;,英语中的,a about also and any as at be between by both for some so not this with,等介词或冠词等,思考:比较,3,个检索式检索结果的不同,“,Information retrieval”/Ti,Information AND retrieval /Ti,Information (n) retrieval /Ti,Information (F) retrieval,不仅要求在题名字段中,而且是短语,只要求在题名字段中,而不严格限制它们是短语,如“,information organization methods for effective retrieval”,要求在题名字段中,还要求两者之间不能有其他词,只需要在同一个字段中,2.5,检索步骤,1,分析课题,2,检索策略,选择合适的检索工具,选择检索途径,拟订检索式,3,实施检索,4,筛选文献,5,索取原文,1.,弄清课题学科属性、专业范围及其相关内容,课题是单一学科还是涉及多学科或跨学科。,当课题涉及多学科时,以主要学科为检索重点,次要学科为补充。,例:超声波技术在医学上的应用。,2.5.1,分析课题,2.,弄清检索课题的信息类型和时间要求,时间要求上,研究层次低、学科发展快的,则检索的时段可以适当缩短。,例如:查,“,超声波技术的应用,”,和查国内外研究社会保障制度的文章。,3.,考虑课题的特殊要求,4.,明确检索者自身的信息需求,检索策略是对检索的全面策划,在操作上主要指检索式的编制和数据库、检索途径的选择。,正确的检索策略可以优化检索过程,以最小的花费、最短的时间获得最佳的检索效果。,2.5.2,检索策略,1.,确定检索词、检索式,切分:是对课题的语句以词为单位进行切分,转换为检索的最小单元。,例:检索,“,吸烟与肺癌的关系研究,”,相关文献。,例:检索,“,肺气肿病人的血氧测定法,”,方面的相关文献。,注意:应保持词意义的完整。,删除:对不具有检索意思的虚词或过分宽泛的限定词应予以删除。,替换:是对表达不清晰或容易造成检索误差的词用更明确、更具体的词予以替换。如公交,公共交通,绿色包装,-,环保包装等,增加:针对一词多义或者在检索结果中有很多干扰信息时,可采用增加检索词达到“限义”的手段。,例:神经网络在旋转机械故障诊断中的应用研究,1.,本课题包含,“,神经网络,”,“,旋转机械,”,“,故障诊断,”,三个概念,“,应用,”,和,“,研究,”,属于意义过于宽泛的词,不应该作为检索词。,2.,扩展,神经网络:相关的上位词有人工智能,旋转机械,故障诊断:相关词有故障定位、故障检测,上位词有容错技术,3.,检索式:,(神经网络,OR,人工智能),AND,(旋转机械),AND (,故障诊断,OR,故障定位,OR,故障检测,OR,容错技术),例:查找与电子图书标准化有关的文献,检索式:,(电子图书,OR,电子书,OR,数字图书,OR,在线图书),AND,(,标准化,OR,标准,OR,规范),standard, standards , standardize, standardizing, standardization, standardizations,standard*,(e-book OR,“,electronic book,”,OR,“,digital book,”,OR,“,online book,”,)AND (standard* OR specification),2.,确定检索途径,已知文献的外部特征,尽量使用该外部特征进行检索;文献的外部特征未知,则通常采用内容特征进行检索。,采用内容特征:希望泛指度高时选择分类途径,希望专指度高时采用主题途径。,.,要从概念入手,而不是从字面意思入手;,.,概念扩展时要考虑同义词、相关词、上位词,/,下位词等,(,既词表中提到的用、代、分、属、参、族),还要注意中英文混用的现象 ;,3.,当课题比较生疏时,应当首先利用百科全书、图书等弄清楚概念,了解课题的有关专业知识,弄清楚课,题的内容和要解决的问题以及解决该问题的初步设想等,进而确定检索的主题范围。,4.,人文社会科学的检索,如果是回溯检索,应该熟悉不同年代所使用的概念和术语,5.,忽略那些意义过于宽泛、通用的词,比如,:,“,研究,”,、,“,应用,”,、,“,探讨,”,等。,须注意的问题:,示 例,1.,检索关于研究鲁迅的论文,应选择什么检索字段。,【,题解,】,必须选择标题或者关键词,,不能选择为作者途径,。,2.,用,中文科技期刊数据库,检索胡鞍钢在,公共管理学报,上面发表的论文。,【,题解,】 A=,胡鞍钢*,J=,公共管理学报,。,3.,写出,“,研究法律与经济和政治的关系,“,的课题的检索式。,【,题解,】,法律*(经济,+,政治),4.,检索有关,“,中国国内商业银行的信贷管理或信贷风险的研究,”,方面的相关文献。,【,题解,】,(商业银行,-,外资银行)*(信贷管理,+,信贷风险),查找华中科技大学罗俊院士,1999,年以来发表的文章?,AU=Luo Jun AND,(,AF=,Huazhong Univ*,),AND PY=1999,查找,2002,年出版或发表的关于克隆人立法方面的英文著作或论文。,“,The legislation of human cloning” or human clone and legislat* and LA=English and PY=2002,3.,选择数据库,选择数据库要考虑以下因素:,1.,检索目的:检索的学科范围、地区范围、语种范围、时间范围、文献类型,检索深度为题录、文摘还是全文等等,。,2.,检索结果:对于研究生做学位论文来说,做课题前应充分了解一下本课题国内外的研究现状(即论文的综述部分),这时应对该课题进行较全面的检索,包括综述性的文章,要求全面;对于该课题的核心部分,即该课题所要解决的具体问题,创新的地方,则需要准,技术细节越细越好。,3.,检索内容所属学科,对与自己相关的数据库要有一个全面的了解,.,2.5.4,筛选文献,应当根据课题的科学技术要点,将检索结果分为密切相关文献和一般相关文献。对相关文献情况及对相关文献的主要论点进行对比分析。,1,网上下载原文,2,就近借阅,3,文献传递,收获,2.5.5,获取原文,【,例题,】,华中科技大学学生已知一些理工科类大学学位论文题目,如何获得原文?,【,题解,】,方法,1:,使用华中科技大学图书馆的馆藏目录查询到图书形式的学位论文,直接借阅:,方法,2,:使用图书馆购买的学位论文数据库检索,可以直接查看近年来的原文。,方法,3,:本地没有的则通过网上检索得到题目后,再从高校图书馆、国家科技图书文献中心(,NSTL,)通过馆际互借寻找全文,收费较低,时差也短。,方法,4,:外文图书可以通过,OCLC,获取。,检索效率,查全率和查准率是判定检索效果的主要指标。,查全率,:,(,Recall Ratio,) 指系统在进行某一检索时,检索出的相关文献量与系统文献库中相关文献总量的比率。用公式表示为:,检出的相关文献量,系统数据库中的相关文献总量,R=,X100%,扩大检索范围,提高查全率的方法,1,、跨库检索,2,、选择较大检索范围的字段如摘要,3,、外文单词使用截词符,4,、使用上位词(如飞行器,_,航天飞机,_,载人航天飞机),5,、考虑同义词或近义词(使用布尔逻辑符,or,连接),6,、逐步扩大算符的检索范围,逐步提高查全率的算符依次是:位置算符,w,wn,near ,逻辑算符,and or,查准率,:,(,Precision Ratio,)指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率。用公式表示为:,检出的相关文献量,检出的文献总量,P=,X100%,缩小检索范围,提高查准率的方法,1,、选择专业性检索工具如使用产品数据库、特种搜索引擎。,2,、选择检索范围较小的字段,3,、逐步缩小算符的检索范围,逐步提高查准率的算符依次是:,逻辑算符,or and ,位置算符,near,wn,w,;使用算符,not,排除干扰信息。,4,、使用二次检索,5,、使用下位词,OCLC,检索结果,EBSCO,检索结果,OCLC,检索结果,EBSCO,检索结果,EBSCO,检索结果,EBSCO,检索结果,Thank You !,人有了知识,就会具备各种分析能力,,明辨是非的能力。,所以我们要勤恳读书,广泛阅读,,古人说“书中自有黄金屋。,”通过阅读科技书籍,我们能丰富知识,,培养逻辑思维能力;,通过阅读文学作品,我们能提高文学鉴赏水平,,培养文学情趣;,通过阅读报刊,我们能增长见识,扩大自己的知识面。,有许多书籍还能培养我们的道德情操,,给我们巨大的精神力量,,鼓舞我们前进,。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!