《信息检索基本技术》PPT课件.ppt

上传人:tia****nde 文档编号:11501409 上传时间:2020-04-26 格式:PPT 页数:33 大小:563.50KB
返回 下载 相关 举报
《信息检索基本技术》PPT课件.ppt_第1页
第1页 / 共33页
《信息检索基本技术》PPT课件.ppt_第2页
第2页 / 共33页
《信息检索基本技术》PPT课件.ppt_第3页
第3页 / 共33页
点击查看更多>>
资源描述
,第三章信息检索基本技术,一、概述,从检索手段看,信息检索可分为手工检索和计算机检索。手工检索使用的检索工具主要是印刷型(书本式)的检索工具;计算机检索则运用现代通信技术、网络技术,利用光盘检索、联机检索、网络数据库、Internet网络检索等多种形式来获取信息。,检索手段信息载体存储方式检索途径检索策略实现检索效率手检纸张印刷型较少人脑低机检磁盘光盘等电子型较多计算机高,二、计算机检索,一)原理计算机将输入机检系统的检索提问特征标识(检索词)或用布尔逻辑运算符(and、or、not)联结起来的检索提问式与已存储在系统中的文献特征标识(如:主题词、分类号、作者姓名等)进行机械性匹配比较,凡符合给定的比较原则和逻辑运算条件者即为命中文献。,二)计算机检索特点,1.内容广泛信息量大;2.速度快,效率高;3.检索途径多;4.用户界面友好,使用方便;5.资源更新快;6.直接输出检索结果。,三)计算机信息检索系统分类,按信息访问模式划分:联机检索系统光盘检索系统网络数据库Internet网络检索,DIALOG,美国DIALOG系统是世界上最大的联机检索系统,该系统始建于1963年,原隶属于美国洛克希德导弹与宇航公司,于1972年正式向公众提供联机检索服务。DIALOG系统目前已在全世界100多个国家和地区拥有10余万个联机终端,数据库量已从最初的100多个发展为今天的450多个,数据库的内容涉及自然科学、社会科学、工程技术、人文科学、商业经济等各个领域,是一个综合性检索系统,其数据库数量之多、范围之广、用户之多均堪称世界之最。,三、步骤与方法1、分析课题确定主题2、选择数据库1)收录文献的来源、学科特点2)收录文献的文献类型和时间范围3)收费标准及能否索取到原文3、选择检索词,4、制定检索策略1)查找文献在类型、文种、时间等方面;2)进行概念分析、选择检索词;3)运用逻辑运算符、位置运算符、截词符等构造检索表达式;逻辑运算符:“OR”:逻辑或(和),用“+”表示,。“AND”:逻辑与(积),用“*”表示。“NOT”:逻辑非(差),用“-”表示。“太阳”“能量”,练习,1、PATENT*/+/-CHINA2、在秦岭隧道中发表的有关掘进机和TBM的文章3、除发表的有关秦岭隧道中掘进机和TBM的文章KEYS:2、(掘进机)秦岭隧道3、(掘进机)秦岭隧道思考:还可以有那种形式,COMPUTERNETWORKS(1)Applications(2)023065(3)Computerinformationcommunicationnetworksandexpertsystems.(4)Computerizeddatacommunicationnetworkswhichprovidedatatouserslocatedasadistancefromeachotherareconsidered.Thepossibilitiesofsuchcommunicationnetworksforusersofdifferentprofessionsareindicated,andtheadvantagesofthisnewinformationexchangetechnologyarereviewed.(Authorabstract)(5)8Refs.(6)InRussian.(7)Pahtavan,K(8)(WorcesterpolytechnicInst).(9)Liefer,MarkE.(11)ACMTransOffInfSystv6n3Jul1988p277-302(10),位置运算符:(w)算符With:(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N个词(N为自然数),词序不得颠倒例如:input(w)outputinputoutput;input,output;input-outputwear(1w)materialswearmaterials、wearofmaterials。,(n)算符near:(n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1、2、3),且词序任意。例如:information(n)retrievalinformationretrieval、retrieval-information,economic(2n)recoveryeconomicrecovery、recoveryfromeconomictroubles,、building(w)construction2、building(1w)construction3、building(n)constructionKeys:、buildingconstruction;building-construction2、buildingandconstruction;buildingunderconstruction3、constructionbuilding;Construction-building,截词符无限截词符“*”,代表零至无数多个字母;computer*computer;computered;computering;有限截词符“?”,只能代表一个字母;teen?teens例如:*chemi*chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry,1、ne?t2、查找检索结果为”ZhejiangUnivTechnol”的文献Keys:1、neat;nest;next2、ZhejiangandUniv*andTech*,限制检索(Range)1)字段检索:1、基本索引字段:描述文献内容特征的字段,一般用后缀形式表示。/ABABSTRACT文摘/DEDESCRIPTOR叙词/IDIDENTIFIER自由标引词/TITITLE篇名例如查找微型机和个人计算机方面的文章。要求“微型机”一词出现在叙词字段、标题字段或文摘字段中,“个人计算机”一词出现在标题字段或文摘字段中microcomputer*/de,ti,abOR(personalcomputer)/ti,ab,2、辅助索引字段:描述文献外部特征的字段,检索时辅助索引字段代码置于检索词之前,一般不单独使用,常与基本索引字段配合使用。AA=AUTHORAFFILIATION著者单位AD=APPLICATIONDATE专利申请日AN=ABSTRACTNUMBER,文摘号APPLICATIONNUMBER专利申请号AU=AUTHORORINVENTOR著者或发明者PY=PUBLICATIONYEAR出版年CY=CONFERENCEYEAR会议年份,例如查找微型机和个人计算机方面的文章。要求“微型机”一词出现在叙词字段、标题字段或文摘字段中,“个人计算机”一词出现在标题字段或文摘字段中。要查找1999年出版的英文或法文的微型机或个人计算机方面的期刊(microcomputer)/de,ti,abOR(personalcomputer)/ti,ab)ANDPY1999AND(LAENORFR)ANDDTSerials,4.进行查找、检出相关文献并分析检索结果;5.对检索式进行反馈修改。,四、检索实例1、“心脏病与吸烟之间的联系”(英文)2、门式起重机的研究3、西红柿的病虫害预防与养殖、搜索计算机行业的营销状况,但不需要查询方正计算机的营销状况、查找年的文献、查找杜彦良发表的有关掘进机和的文章、查找除了石家庄铁道学院发表的有关掘进机和的文章,1、(HEART(5N)DISEASE+HEART(5N)ATTACK)*(SMOK*+TOBACCO)2、门式起重机门式*起重机3、(番茄+西红柿)*(病虫害*预防+养殖)、(计算机营销)方正、:;、作者杜彦良(题名掘进机题名)、(题名掘进机题名)机构石家庄铁道学院,五、Internet网络检索,一)Internet基本概念Internet是国际互联网,也称因特网,它是一个计算机网络的网络。Internet将世界上不计其数的计算机及计算机网络互联起来,它们共同遵循TCP/IP通讯协议。Internet是信息高速公路的原形。,(1)中国科技网CSTnet,(3)中国公用计算机互联网CHINANET,,二)搜索引擎概述,搜索引擎(SearchEngines)是指对WWW站点资源和其他网络资源进行标引和检索的一类检索系统机制。搜索引擎最根本的任务是向网络访问者提供一个高效的访问机制。搜索引擎本身是个网站,但搜索引擎的数据库中存放的是其他网站的信息,而不是自己的信息。搜索引擎不仅接受用户的访问,还根据用户的搜索要求,在庞大的数据库中搜索出满足用户需要的站点。,搜索引擎常用的检索方法有关键词检索和目录浏览两种形式。关键词检索:用户直接输入检索词,搜索引擎通过查找索引数据库中包含有检索词的记录来提供用户所需的信息资源。检索方便直接,而且可以使用逻辑算符、位置算符、截词符等来构成检索式,可以限制检索对象的地区、数据类型、时间等,因而可准确检索满足特定条件的网络资源。目录浏览:用户通过浏览层次型的目录来寻找相关的信息资源。目录按一定的主题分类体系组织,并辅之年代、地区等分类。用户一般采取逐层浏览目录、逐步细化来寻找合适的类别直至具体资源。检索和浏览在信息查询过程中各有其功用。一般地说,检索便于有的放矢,直接获取检索结果;浏览利于边查边看,发现未曾预料的结果。,(三)几种常用的搜索引擎,1.一种典型的搜索引擎介绍ahoo!(1)分类浏览(2)关键词检索在检索输入框中直接输入检索词或词组,Yahoo!将在索引数据库中进行检索。中文yahoo()中文yahoo则是yahoo为中文用户开发的中文网站查询系统,它收集了数以万计的中文网站,不论你要找的网站是用国标码简体字、繁体字还是图形中文,只要是好的中文网站,你都可以在这里到,2Google(http:/www.G)Google是目前资深网民最喜欢的一个中外文科技类网页搜索引擎,Google最大优点就是检索结果相关性强,查准率高。特点:使用偏好、语言工具、手气不错。3.百度(,4、“搜狐”(http:/)搜狐是由我国网络开发人员于1998年5月在北京推出的大型中文搜索引擎,目前拥有40多万网页的数据库。现在流传这样一句话“出门找地图,上网找搜狐”,可见其重要性。5、“天网”(,使用搜索引擎注意事项:1.不管哪个搜索引擎,都要先看帮助2.参考搜索引擎实用技巧举例,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!