《文献检索》PPT课件.ppt

上传人:max****ui 文档编号:16212851 上传时间:2020-09-23 格式:PPT 页数:95 大小:3.80MB
返回 下载 相关 举报
《文献检索》PPT课件.ppt_第1页
第1页 / 共95页
《文献检索》PPT课件.ppt_第2页
第2页 / 共95页
《文献检索》PPT课件.ppt_第3页
第3页 / 共95页
点击查看更多>>
资源描述
文献信息检索,文献检索的必要性,文献资料日益庞大 出版速度加快 载体形式多样化,文献检索要解决的问题 面对日益增长的文献资源,如何通过一种有效的方法,以最少的时间和精力来获取自己所要的信息。 科技人员必备的基本技能:文献检索是科学研究的先期工作 知识更新的手段 能力的培养,文献检索的必要性,文献检索的必要性,第一部分 文献信息基础 第二部分 手工检索工具概述 第三部分 网络信息资源检索与 图书馆信息资源 第四部分 数据库检索 第五部分 国外著名检索工具及 联机检索系统 第六部分 学术论文的撰写,内容,第一部分 文献信息基础,一、信息、知识、文献,信息 信息是用文字、数据或信号等形式通过一定的传递和处理来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。 信息的基本属性: 普遍性和客观性。 传递性。 依附性和转换性。 共享性。,知识: 知识是人类在认识和改造世界的社会实践中获得的对事物本质认识的成果和结晶。 文献: 文献是记录有知识的一切载体。 信息、知识、文献三者关系 信息是生产知识的原料。 知识是被人类系统化后的信息。 文献是存储、传递知识信息的载体。,二、信息的类型,按信息的加工深度划分,按信息的载体形式划分,按信息的出版类型划分,图书 期刊 会议文献 科技报告 专利文献 学位论文 技术标准 政府出版物 产品样本和说明书 技术档案 报纸,三、信息类型的识别,图书的著录格式 图书的著录特点是:有书名,有著者,有的还有编者;必有出版地、出版社名和出版年份;非第一版的图书有版次;有的图书还给出国际标准书号(ISBN)。 例: W.V.Etten, Foundamentals of optical fiber 著者 书名 communication,London:Prentice-Hall(1991), 出版地 出版社 出版年份 xii+407pp 页码,期刊论文的著录格式 期刊论文著录的特点是:有作者,有时有篇名;期刊名称常常缩写,有的还以斜体给出;必定有卷号,有的有期号。 例: G.H. Huynh. Barriers to carrier mediated drug and 作者 篇名 gene delivery to brain tumors, Journal of 期刊名 Controlled Release, Vol. 110, Issue 2, 236-259 (2006) 卷号 期号 页码 出版时间,会议论文的著录格式 会议文献著录的特点是:有表示会议的专门用词,如Conference,Symposium,Convention,Workshop,Meeting,Congress,Assembly等;有表示会议录的一些词,如Proceedings of.,Collection of.;有的有会议召开的地点、届次、时间,以及会议录的出版社、出版地、出版时间等。 例: C.G. Liu, et al. Self-Assembled Nanoparticles Based The 3rd Sino-Korea Symposium on Biomaterial & Nano-Biotechnology. June 23-25, 2005. P59-59. Ji Nan University, Guangdong, China.,科技报告的著录格式 科技报告著录的特点是:有表示报告的词,如Report,Memorandum等;有报告号。 例: J.S.Bymes,“Application of approximation theory in antenna design,signal processing and filtering”,Final report.AD-A244,725 Promethesus,,专利说明书的著录格式 专利说明书著录的特点是:通常有表示专利的词(Patent);有专利号。专利号按国际规定由两个字母表示的国家名称和其后的顺序号构成。 例: B.D.Dayton,“Differential amplifier apparatus”,US Patent No.5095282,1992,学位论文的著录格式 学位论文著录的特点是:通常有表示学位论文的词,如Thesis,Dissertation等;有的有论文作者所在学校的校名。 例: T.W.Lin,“Design of time-signal spectrum analyzers”,Ph.D dissertation,The Pennsylvania State Univ.,2005,四、信息检索的含义 指将信息按一定方式组织和储存起来,并针对信息用户的特定需求查找出所需信息内容的过程。,数据库: 由计算机进行处理的一定数量同类信息的有序集合,是用来存储和查找文献的信息的电子化检索工具。,信息检索示意图:,信息检索的实质 信息检索的实质是信息用户的需求和一定的信息集合的比较和选择的过程,即匹配的过程。 信息检索的类型 文献检索(书目信息检索):即检索结果是关于某主题知识的文献线索,它是通过二次文献,包括传统的以纸张为存储介质的现代计算机检索系统,找出所需的一次文献或三次文献。 数据检索:就是满足数据需求的检索过程,如数理化等科学数据、经济数据、历史数据、地理数据等。 事实检索:就是对特定的事件或事实的检索。事实内容包括大量的科学事件和社会事件。例如:我国建成最早的高速公路是哪条?何时建设? 概念检索:就是查找特定概念的含义、作用、原理或使用范围等解释性内容或说明。最常见的概念检索是查找各种参考工具书,例如字词典、百科全书、名录、手册、指南等参考工具书。,信息检索类型图,信息 检索,直接答案(数据、事实),间接答案(文献线索),参考性工具书,检索性工具书,文献检索,数据检索,事实检索,概念检索,五、信息检索的意义 信息与现代科技的发展 现代科技发展特点:高速化、综合化、专业化。,信息检索意义,信息量急剧增长 信息的使用寿命缩短,充分利用信息资源,避免重复劳动。 为人们更新知识、实现终身学习提供途径。,六、信息检索语言 检索语言概念,检索的基本原理: 是将用户的检索提问词与数据库文献记录中的标引词进行对比,当提问词与标引词匹配一致时,即为命中,检索成功。 检索语言: 是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。,检索语言的类型划分,分类语言 是以学科体系为基础,用号码作为概念标识,按分类编排的检索语言。,国内一般高校图书馆使用的分类语言表是中国图书馆图书分类法(第四版),简称中图法,是我国图书馆和情报单位普遍使用的一部综合性的分类法。,A 马克思主义、列宁主义、毛泽东思想、邓小平理论B 哲学、宗教C 社会科学总论D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术U 交通运输V 航空、航天 X 环境科学、安全科学 Z 综合性图书,中国图书馆图书分类法的基本大类:,计22类,主题语言 主题语言是以词语作为概念标识,按字顺编排的检索语言。 主题语言包括:,标题词语言最早使用的一种主题语言。它以规范化的自然语义作为标识,来表达文献涉及的主题概念,并将全部标识按字母顺序排列。表达主题的词语称为标题词。 单元词语言是从文献内容中抽选出来的最基本的词汇,将代表最一般、最基本的、不可再分割的概念单元的词作为单独标引文献的单位。 叙词语言从自然语言中优选出来并经过规范化处理的名词术语。叙词语言是采用表示单元概念的规范化语词的组配来对文献内容主题进行描述的检索语言,也是目前使用最广泛的主题语言。 关键词语言直接从文献题名、文摘或正文中抽取出来的未经规范化处理的词。是一种用自然语言做标识的检索语言。,七、信息检索步骤,用户评价,结果输出,具体操作,制定检索表达式,检索结果,选择检索途径,确定检索工具,选择检索系统,主题分析,需求课题,用户,第二部分 手工检索工具概述,手工检索工具是指印刷型检索工具,通称为工具书,它在社会科学信息检索、数据、事实检索等方面起着重要的作用。,一、工具书的概念: 工具书是根据一定的查阅需要,系统汇集有关的知识资料或文献信息,按便于检索的方法编排的特种图书。 二、工具书的特点: 目的上的查考性 内容上的概括性 形式上的检索性 三、工具书的结构: 由序跋、凡例、正文、辅助索引、附录等五部 分组成,四、工具书的类型,五、工具书的排检方法,形序法部首法、笔画法、笔形法 中文字顺法 号码法四角号码法、五笔字型法 汉语拼音字母法 字顺法 音序法 注音字母法 韵母法 声部法 工具书的 逐词排列法 外文字顺法 彻底字母排列法 排检方法 学科体系分类法 分类法 事物性质分类法 标题法 主题法 元词法 键词法 时序法 地序法,1、字顺法,字顺法按文种分为中文字顺法和外文字顺法。 中文字顺排检法:分汉字形体结构和声韵规律 字典、词典、百科全书、某些类书、索引、手册等 多采用这种方法。 字顺法又可分形序法、音序法和号码法。 形序排检法是根据汉字的形体结构,按照字形的某一共 同性将汉字序列化的排检方法。形序法包括部首法、 笔画法和笔形法。 音序法是按字音顺序排列汉字的方法。有汉语拼音字母法、注音字母法和韵部法等。 号码排检法是根据汉字的形体结构,用数码代表一定部位的笔形并按数码大小为序的排检方法。号码法实际上是形序法的一种变形。号码法有 四角号码法、中国字度撷法及其他各种号码法。,2、分类排检法 分类排检法是把文献或知识内容,按照学科体系或事物性质分门别类加以组织的排检方法。,3、主题排检法 主题排检法:根据代表事物或概念的名词术语的字顺 进行排检的方法。 4、时序排检法 时序排检法:简称时序法,又称“年代排检法”、“编年排检法”。按照时间特征区分次第的排检法,年表、历表、大事记、年谱、年鉴、史书、传记等文献中常采用此法。 5、地序排检法 地序排检法:按照地理特征区分文献次第的排检法。主要用于地图和地方文献等地区性较强的文献,有利于突出文献的出版地或内容涉及的地理区域。,第三部分 网络信息资源检索 与图书馆信息资源,一、信息资源: 1、概念: 信息资源是信息与资源两个概念在信息时代的历史条件下,伴随信息对社会经济的日益影响而整合衍生出的新概念。即信息资源是信息世界中对人类有价值的那一部分信息,是附加了人类劳动的、可供人类利用的信息。 2、基本要素:信息、人、符号、载体 (1)信息:组成信息资源的原料 (2)人:信息资源的生产者和利用者 (3)符号:生产信息资源的媒介和手段 (4)载体:存储和利用信息资源的物质形式 3、特点: 可再生性 可共享性,二、网络信息资源 1、概念: 网络信息资源是以电子计算机技术、通信技术、多媒体技术相互融合而形成的以电子网络为传输性载体和传输媒介的信息资源。 2、分类: 按人类信息交流的方式划分: a、非正式出版信息。 b、半正式出版信息。 c、正式出版信息。 按照信息的加工程度划分: a、一次网络信息资源 b、二次网络信息资源 c、三次网络信息资源 按照网络信息的内容和用途、信息的表现形式、发布机构、 传输协议等分类,二、网络信息资源 3、网络信息资源的特点: (1)信息量大,传播广泛; (2)信息层次多,品种多样; (3)自由发布,交流直接; (4)信息传播速度快,变化频繁; (5)检索方便,价廉实惠; (6)分散无序,缺乏管理; (7)内容庞杂,质量不一。,三、网络信息检索方法: 直接浏览 网址查询 偶然发现 顺“链”而行 通过网络资源指南来查找信息 局限性在于:由于其管理、维护跟不上网络信息的增长速度,导致其收录范围不够全面,新颖性、及时性可能不够强;且用户还要受标引者分类思想的控制。 利用搜索引擎进行信息检索 搜索引擎是提供给用户进行关键词、词组或自然 语言检索的工具。用户提出检索要求,搜索引擎代替 用户在数据库中进行检索,并将检索结果提供给用户。,四、网络信息检索技术 分类目录检索 关键词检索 目录与关键词检索相结合 布尔逻辑检索 词组检索 是将一个词组或短语用双引号“”括起作为一个独立 运算单元,进行严格匹配 加/减号检索 截词检索 字段检索 空格、逗号、括号、引号的作用,布尔逻辑检索: 逻辑与 概念:是一种具有概念交叉或概念限定关系的组配 算符:*、AND、& 逻辑或 概念:是一种具有概念并列关系的组配 算符:+、OR、 逻辑非 概念:是一种具有概念排除关系的组配 算符:-、NOT、!,截词检索:指在检索词的合适位置进行截断,然后使用 截词符进行处理 后截词 有限后截词:主要用于词的单、复数,动词的词尾变化等,截词符是“?”,截几个词就在词根后加几个,如system?可以代表system,systems等; 无限后截词:主要用于同根词,词根后加一个“?”或者“*”,表示无限截词符号,如如comput*可以代表compute、computer、computing、computation、computerisation 中截词:也称屏蔽词,主要用于英、美拼写不同的词和单复数 拼写不同的词,中截词符号为“?”如wom?n可以代表 woman、 women等。 前截词:又称左截词、后方一致,允许检索词的前端有若干变 化形式,截词符一般为为“*”。如*physics可以代表physics、 astrophysics、biophysics、geophysics等,字段检索: 字段检索是一种用于限定提问关键词在数据库记录中出现的区域 搜索引擎常用的字段有: title/t:题名字段,表示查找标题中包含检索提问式的页面 subject:主题字段,表示查找主题中包含检索提问式的页面 text:文本字段,表示文本中包含检索提问式的页面 author:作者字段,表示查找作者中包含检索提问式的页面 keywords:关键词字段,表示查找关键词中包含检索提问式的页面,空格、逗号、括号、引号的作用: 空格:其作用与逻辑“与”相同 逗号:其作用类似逻辑“或” 区别是,检索结果输出时,包含指定关键词越多的页面,其排列的位置越靠前 括号:其作用是使括在其中的运算符优先执行,用于 改变复杂检索式中固有逻辑运算符优先级的次序。如 检索式“多媒体 and (计算机 or 网络)” 引号:其作用是括在其中的多个词被当作一个短语来检索。,五、网络信息检索工具 概念 指在因特网上提供信息检索服务的计算机系统,其检索的对象是存在于因特网信息空间中各种类型的网络信息资源。 一般构成 一般由索引程序、数据库和检索代理软件组成。 常用搜索引擎简介 百度和GOOGLE,1、百度():,百度公司于1999年底成立于美国硅谷,是目前全球最优秀的中文信息检索与传递技术供应商。百度搜索引擎拥有目前世界上最大的中文搜索引擎,总量超过3.5亿页以上,并且还在保持快速的增长。 百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点。,主要搜索功能,基本搜索方法,检索结果,1、双引号精确匹配,主要搜索语法,如果检索词加双引号时检索的结果是137篇,显示如下图:,如果检索词不加双引号时检索的结果是3520篇,显示如下图:,2、intitle关键词在网页标题中 网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式是把查询内容中特别关键的部分,用“intitle:”限定起来。注意:intitle:和后面的关键词之间不要有空格。,例如:找杨振宁的事迹。 检索式为:事迹 intitle:杨振宁。,用“事迹 intitle:杨振宁” 检索的结果是1080篇,结果如下:,检索词用“杨振宁事迹”时检索的结果是49200篇,结果如下:,3、filetype对搜索对象做格式限制 使用方法是在“Filetype:”后跟文件格式。“Filetype:”可以跟以下文件格式:DOC、PPT、PDF、TXT、RTF、ALL,其中,ALL表示搜索所有这些文件类型。,例如:想搜索含有关键词“霍金”、“黑洞”的pdf文档。 检索式为:霍金 黑洞 filetype:pdf。,4、inurl限定在URL链接中搜索,URL(Uniform Resource Locator) 统一资源定位器:用于确定所需文档在Internet上的位置,也称为网页地址 ,例:,如:找关于photoshop的使用技巧 检索式为:photoshop inurl:jiqiao 上面这个查询串中的“photoshop”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。注意:inurl:语法和后面所跟的关键词不要有空格。,5、site限定搜索目标范围: 如果用户已经知道某个站点中有自己需要找的东西,可以把搜索范围限定在这个站点中,提高查询效率。使用的方式是在查询内容的后面,加上“site:站点域名”。,例如:搜索结果为S这个网站上含有关键字“mp3播放器”的网页。注意: “site:”后面跟的站点域名,不要带“http:/”和“/”符号;另外,site:和站点名之间不要带空格。 输入检索式:mp3播放器 site:,6、减号(-)不含特定关键字: 如果用户想除去包含特定关键词的网页,可以用减号语法。,例如:想搜索有关武侠小说神雕侠侣方面的内容而不希望出现关于其电视剧方面的网页。 检索式为:神雕侠侣 -电视剧,7、书名号()精确匹配 书名号是百度独有的一个特殊查询语法。 加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号括起来的内容,不会被拆分。 书名号在某些情况下特别有效果,例如查名字很通俗和常用的那些电影或者小说。 比如要查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具手机,而加上书名号后,手机结果就都是关于电影或书方面的了。,8、管道符号“|”并行搜索: 可以使用“A|B”来搜索“或者包含词语A,或者包含词语B”的网页。,例如:要查询“图片”或“写真”相关资料,无须分两次查询,只要输入检索式“图片|写真”搜索即可。百度会提供跟“|”前后任何字词相关的资料,并把最相关的网页排在前列。,目前百度网页搜索的特色功能包括: 百度快照、相关搜索、拼音提示、错别字提示、英汉互译词典、计算器和度量衡转换、股票、列车时刻表和飞机航班查询、天气查询、高级搜索、地区搜索和个性设置等。,特色功能,百度快照,相关搜索,拼音提示,错别字提示,英汉互译词典,计算器和度量衡转换,股票、列车时刻表和飞机航班查询,天气查询,高级搜索,2、Google(http:/) Google成立于1998年,Google 通过自己的公共站点 提供服务。 公司还为信息内容供应商提供联合品牌的网络搜索解决方案。 规模最大的支持多语种(Google允许以多种语言进行搜索,在操作界面中提供多达30余种语言选择 目前Google每天处理的搜索请求已达2亿次 属于全文(Full Text)搜索引擎,图书馆信息资源简介 概念:图书馆信息资源是图书馆所收藏和链接的各类型文献信息资源的总和。,形式 纸质信息资源 主要包括各种书籍(如手抄的古籍文献和各种印刷型书籍)、连续出版物(如期刊、报纸)、政府出版物(如百科全书、年鉴)和其他印刷资源。 缩微信息资源 图形信息资源 说明或补充纸质信息资源的图形或视觉化媒体 声像信息资源,形式 计算机信息资源 指计算机能够处理的信息资源,包括计算机可读目录、电子期刊、电子图书、自建数据库或购置的光盘数据库等。 网络信息资源 指通过通信线路和专用设备而获取的其他图书馆或社会组织的信息资源 图书馆目录 是重要的信息资源,是图书馆信息资源体系的提示与导引。图书馆目录主要有书本式目录、卡片式目录、联机公共检索目录和光盘目录等。,利用方式,外借 阅览 咨询 定题服务 网络查阅 通过登录图书馆网页,浏览网页内的信息、查询图书馆书目文献联机目录和索引、预约借还书、利用数据库查检文献等。,图书馆网站结构简介 (网址为:http:/210.43.9.3 ): (一) 图书馆介绍部分: 入馆须知 开放时间 借阅规则 规章制度 机构设置 使用指南 公告栏(图书馆要闻),(二)图书馆网上服务部分: 1、书目检索(馆藏查询):实现图书馆Web服务器与数据库服务器以联机方式提供馆藏查询功能,提供例如书名、作者、关键词(主题)、出版社等方式进行检索。 2、电子资源/试用数据库:提供本馆购买的数据库,是图书馆最主要的网上服务项目,也是用户通过图书馆网站利用资源、获取文献信息的主要途径。 3、读者服务:给读者提供查询本人借阅馆内图书资料相关情况的途径 4、新书荐购:提供各大出版社电子书目数据下载,方便读者向图书馆反映其所需要的新书,优化图书馆资源配置。 5、咨询台:图书馆与读者交流的主要方式之一,方便读者向图书馆提出咨询问题,并能更好地提出意见和建议。,(三)网络信息导航部分: 1、信息服务:设有 “学科导航”、“文献检索”等,主要收集有关学科信息源的网址,建立学科导航系统,帮助读者在茫茫的网上电子信息世界中漫游、可以最快的速度和最短的时间检索并获得所需的有关学科全面的文献信息(特别是网上的各种免费资料)。 2、精品课程链接:提供国内著名高等院校的精品课程链接,读者可以直接访问,获得相关的课程内容。,3、网络导航:以分类目录的形式汇集提供了网上一些主要的信息资源站点的链接,使读者通过这些站点可以直接获得相关资料或其有关站点的网址。 4、国内外网上图书馆链接:主要提供与国内外著名的图书馆Web站点进行链接,使读者通过本馆主页直接可以访问到知名图书馆的站点,获取大量的收费、免费或提供试用的数据库信息,方便读者,免除记忆各资料库网址之苦。,Thanks a Lot!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!