计算机检索原理自动化

上传人:jian****019 文档编号:249350793 上传时间:2024-10-28 格式:PPT 页数:28 大小:1.33MB
返回 下载 相关 举报
计算机检索原理自动化_第1页
第1页 / 共28页
计算机检索原理自动化_第2页
第2页 / 共28页
计算机检索原理自动化_第3页
第3页 / 共28页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章 计算机检索原理,计算机检索概述,1.,计算机检索的发展,2.,计算机检索的原理,3.,文献数据库简介,4.,计算机检索中常用的运算符,5.,计算机检索策略的制定及调整,1.,计算机检索的发展历史,计算机检索从产生到现在经历了,4,个阶段,:,(,1,),20,世纪,50,年代,以批量处理、脱机检索为特点的第一阶段(美国海军兵器中心,NOTS,,,4000,条记录,“与”,不能人机对话);,(,2,),20,世纪,60,年代末,联机检索阶段(出现网络,,dialog,,人机对话);,(,3,),20,世纪,70-80,年代,联机检索与光盘检索共同发展阶段;,前三阶段以文献数据库检索为主;,(,4,),20,世纪,90,年代,基于互连网的数据库检索和,Internet,网上信息检索并重的第四阶段。,因特网成为重要的电子信息源,2.,计算机检索的原理,计算机检索的原理就是利用计算机将用户所提出的,检索标识,与检索系统中的,标引标识,进行比较,将匹配的文献视为命中。,检索标识(检索式)是检索者根据对课题的分析,制定出的既能反映课题的要求,又符合计算机检索要求的检索语言,其中包括适当的检索词,以及合适的逻辑算符和位置算符。,3.,文献数据库简介,3.1,数据库的定义和类型,3.1.1,定义:按一定方式存储的相互关联的数据集合。,它是检索工具的一种。,根据,ISO/DIS5217,号标准,数据库至少要由一种文档组成。,3.1.2,数据库类型:,文献目录型数据库(,bibliographic database).,也称为书目数据库或者目录数据库,是二次文献数据库,包含文摘数据库、题录数据库、索引数据库、各国的,MARC,格式的图书目录。,如,EI,SCIE,等。,指南数据库(,reference databases).,也称指示性数据库,其内容是关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,是指引用户从其他有关的信息源获取更详细的信息的一类数据库。,如中国人物数据库、,Dialog,系统中的邓白氏国际市场情报库,。,数值数据库(,numeric database).,又称数据型数据库,此类数据库存储的均为数据信息。,如中国统计年鉴,Dialog,系统中的公司披露数据库,。,全文型数据库(,full-text database),。是指储存的数据是文献全文或者其主要部分是文献全文的一种数据库。,如中国期刊全文数据库,重庆维普期刊全文库,。,3.2,数据库的构成,由文档、记录、字段构成。,(,1,)文档(,file),,若干个逻辑记录构成的信息集合成为文挡。,(,2,)记录(,record),,记录是若干个字段组成的文献单元。,(,3,)字段(,field),,是文献著录的基本单元,用来描述文献主题内容相关的某种属性。,4.,计算机检索中常用的运算符,4.1,逻辑算符,4.1.1,逻辑“与”。用“,and”,或者“*”表示,是用以组配不同的概念逻辑符号,表示“,and”,连接的两个词在一个记录中必须同时出现。,如:,Library and Computer,Library,Computer,4.1.2,逻辑“或”。用“,or”,或“,+”,表示。是用来组配相同或相近概念的逻辑算符,表示在记录中出现其一即可作为命中。如:,fiber or fibre,fiber,fibre,4.1.3,逻辑“非”。在系统中用“,not”,或者“,-”,表示,排除某个概念的逻辑算符,如:,Patent not Japan,表示检中的记录中包含,Patent,,不包含,Japan,。,Patent,Japan,4.2,优先算符,优先算符用()表示,在含有多个运算的检索式中,可以用()将需要优先运算的部分括上,系统会优先运算()中的部分,然后在按照,not,and,or,的顺序进行运算。,如:,S(fiber or fibre)and optical,4.3,截词符和屏蔽符,4.3.1.,截词符:用“?”或者“*”,不同数据库有不同的规定,屏蔽符:“?”作为屏蔽符,加在单词中间,可以代表,1,个字符的变化。如:,wom?n,表示,women,和,woman,。词中使用几个屏蔽符,则代表有几个字符的变化。有的数据库使用“,#”,4.4,位置算符,位置算符是用来规定检索词之间的位置关系的算符,:,4.4.1.,(,w),(nW),意思是,with,表示它连结的两个词前后位置确定,中间插词不能超过,0-n,个。(,w),也写作(),实际上是,(0W),,表示连接的两个词必须紧密相连,中间不能插词,但是中间可以加连字符。如:,S motor(W)lorry,可以检出,motor-lorry,和,motor lorry,。,4.4.2.(N),(nN),意思是,near,表示它连结的两个词前后次序不限,中间可以插入,n,个词。(,N,)实际上是(,0N,),表示连结的两个词中间不得插入其他词。如:,S corrosion(N)resist?,可以检索出,corrosion resistance;corrosion resistant;resisting corrosion;,S protect?(2N)forest,可以检出,protection of forest,forest protection,protecting the forest,等。,(,S,),意思是,subfield,或,sentence,它表示连结的两个检索词要在同一个子字段或同一句话中出现。如:,S computer(s)library,是要求,computer,和,library,在同一个句子中出现,S cs=wuhan(s)university,是要求,wuhan,和,university,在,cs,字段中的同一个子字段出现。,(,F,),意思是,field,表示连结的两个词要在同一个字段中出现。如:,S fieldbus(f)multimedia,是要求,fieldbus,和,multimedia,在同一个字段中出现。,以上是计算机中常用的位置算符,但并非所有的系统都可用,不同的检索系统有其自己的规定。,5.,计算机检索策略的制定及调整,1.,概念的选取,(,1,)核心概念的选取,:,变温,条件下,煤层,损伤与,瓦斯,运移的,热流固,耦合,模型,(,2,)发掘隐含概念,:,并购,剥离、拍卖;石质文物的保护,(,3,)考虑同义词:,保护,conservation,preservation,protection,(,4,)使用规范的用语,:,行业术语,用词表来规范:,单车,-,自行车,(,5,)排除不必要的概念:使用专业数据库或通用词,(,6,)使用准确的代码:标准号、专利号、产品代码,2.,数据库的选择,(,1,)合适的主题范畴 (社科、工程技术、化学、医学,),(,2,)合适的数据库类型、年度范围(专利、标准、期刊、书,),3.,检索策略的制定及调整,(,1,)拟定检索式:,变温,条件下,煤层,损伤与,瓦斯,运移的热流固耦合,模型,(非等温,or,变温),and,(煤层,and(,损伤,or,破坏,or,损坏,)or,煤岩体,and,损伤,),and,(瓦斯,or,煤层气,or,煤气),and,(运移,or,漂移,or,运动),and,热流固,(,2,)如果检索结果太少,适当调整策略,以扩大检索范围(增加同义词或隐含概念),a.,热流固有没有同义词 热,-,流,-,固;,b.,去掉,热流固,;,c.,去掉第一个检索词,(非等温,or,变温),(,3,)如果检索结果太多,也要适当调整策略,以缩小,检索范围(增加概念或用字段、年代等限制、增加检索词)。,(非等温,or,变温),and,煤层,/,主题,and(,损伤,or,破坏,or,损坏),and,(瓦斯,or,煤层气),/,主题,and,(运移,or,漂移,or,运动),and,热流固,and(,耦合模型,or,数学模型,),第一检索式结果为,0,去掉热流固还是,0,再去掉(变温,+,非等温)条件:,47,条。可以在这里选择,再检索,(,变温,+,非等温,)*(,煤层,+,煤岩体,)*,(,瓦斯,+,煤层气,+,煤气):,18,条,再去掉煤层:(等温,+,非等温)*(,瓦斯,or,煤层气,or,煤气):,63,条,也可以,在老师的委托单中提到:煤基质收缩效应(,4,条)、滑脱效应,分别检索一下,在老师的委托单中提到:煤基质收缩效应、滑脱效应(,169,条),分别检索一下,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!