文献检索-第一章-文献检索基础知识教材课件

上传人:沈*** 文档编号:241438459 上传时间:2024-06-26 格式:PPT 页数:71 大小:1.44MB
返回 下载 相关 举报
文献检索-第一章-文献检索基础知识教材课件_第1页
第1页 / 共71页
文献检索-第一章-文献检索基础知识教材课件_第2页
第2页 / 共71页
文献检索-第一章-文献检索基础知识教材课件_第3页
第3页 / 共71页
点击查看更多>>
资源描述
126-3文献检索与利用文献检索与利用课程开设背景:课程开设背景:1984年,教育部下发了印发的通知1992年,教育部高等教育司颁发了文献检索课教学基本要求1985年,国家教育部印发的通知 4文献信息检索与利用文献信息检索与利用目的目的寻找资源寻找资源利用资源利用资源工具课工具课5第一章第一章 文献检索基础知识文献检索基础知识信息、知识、文献与情报信息、知识、文献与情报1文献信息资源的类型、特点文献信息资源的类型、特点 2文献检索概述文献检索概述3检索语言检索语言4计算机检索基本技术计算机检索基本技术 信信检索效果评价及其优化检索效果评价及其优化 66 第一节第一节 信息、知识、文献与情报信息、知识、文献与情报南唐南唐.李中在李中在碧云集碧云集 暮春怀故人暮春怀故人一诗一诗中写道:中写道:“梦断美人沉梦断美人沉信息信息,目穿长路倚楼台,目穿长路倚楼台”最早的信息出现:7一、信息的含义一、信息的含义一、信息的含义一、信息的含义客观世界各种事物特征和变化的反映,以及经过人们大脑加工后的再现。第一节第一节 信息、知识、文献与情报信息、知识、文献与情报信息的主要属性信息的主要属性 客观性、传递性、可存贮性、可加工性客观性、传递性、可存贮性、可加工性、时效性、时效性、共享性、共享性、价值性价值性 如:信号、消息、报道、通知、报告、情报、知识、如:信号、消息、报道、通知、报告、情报、知识、见闻、资料、文献、指令等。见闻、资料、文献、指令等。8二、知识的含义是人类在改造客观世界实践中所获得的认识和经验的总和,是信息的一部分。也可以说:人类对大量信息进行思维分析,加工提炼,并加以系统和深化的结果。第一节第一节 信息、知识、文献与情报信息、知识、文献与情报信息人脑(认识、整序)知识【例如】显示器黑屏(信息)知识的类型 原理知识、事实知识、人力知识、技能知识9三、情报的含义(1)定义:人们在一定时间内,为一定目的而传递的有用的知识或信息。(2)属性:时间性、传递性、效用性 第一节第一节 信息、知识、文献与情报信息、知识、文献与情报四、文献的含义 定义:文献是用一定的技术手段记录人类知识、信息的一切载体,或称其为固化在一定物质载体上的知识。构成文献的三要素:信息内容、载体材料和记录方式信息知识文献五、信息、知识、情报和文献的联系与区别五、信息、知识、情报和文献的联系与区别 10情报一、按文献信息的载形式划分一、按文献信息的载形式划分 第二节第二节 文献信息资源的类型、特点文献信息资源的类型、特点 1.印刷型112.缩微型3.视听型(音像型文献)4.电子型(机读型文献)12二、出版形式划分:二、出版形式划分:第二节第二节 文献信息资源的类型、特点文献信息资源的类型、特点 1.图书(ISBN)2.期刊(ISSN、CN)3.科技报告4.政府出版物5.会议文献7.专利文献8.学位论文9.产品资料10.档案6.标准文献13三、按文献是否加工及加工深度划分三、按文献是否加工及加工深度划分 第二节第二节 文献信息资源的类型、特点文献信息资源的类型、特点 1.零次文献未经公开发表或交流的文献。2.一次文献(原始文献、一级文献一级文献)一次文献是人们直接以自己的生产、科研、社会活动等实践经验为依据生产出来的文献。如:专著、期刊论文、学位论文、专利文献、科技报告、会议录等等3.二次文献(通称检索工具)第二节第二节 文献信息资源的类型、特点文献信息资源的类型、特点 通过对一次文献的加工使之成为系统的、便于查找一次文献的工具。如目录、题录、索引、文摘等二次文献的重要性在于它可以提供查找一次文献的 线索。144.4.三次文献(参考性文献)三次文献(参考性文献)第二节第二节 文献信息资源的类型、特点文献信息资源的类型、特点 是在一、二次文献的基础上,经过综合分析而编写出来的文献。如词典、综述、指南数据、百科全书、年鉴15 第三节第三节 文献检索概述文献检索概述 一、文献检索的含义一、文献检索的含义所谓检索:是指查找、寻求、获取的意思。而信息检索简单的说就是信息的有序化识别和查找。文献检索(广义概念):将信息按一定的方式组织和存储起来,并根据信息用户的需要查找出有关信息的过程,全称又叫“信息的存储与检索(Information Storage and Retrieval)。文献检索(狭义概念)从信息集合中查出所需要信息的过程。16原始文献原始文献加工整理加工整理数据库数据库提提 问问检检 索索输输 出出存存 储储检检 索索17 第三节第三节 文献检索概述文献检索概述 二、检索的分类二、检索的分类1.1.按其检索对象(或存贮内容)分为:按其检索对象(或存贮内容)分为:(1 1)全文检索)全文检索以整篇文章或整本图书为检索对象的检索方法。(2 2)数据检索)数据检索又称数值检索,是以具有数量性质,并以数值形式表示的数据为检索内容的信息检索。即检索系统中存储的是大量的数据,包括物质的参数、电话号码、观测数据、统计数据等,也包括图表、化学分子式、物质的各种特性等非数字数据。18 第三节第三节 文献检索概述文献检索概述(3 3)事实检索)事实检索是以具体事项为检索内容的信息检索,要求从检索系统存储的各种原始信息资源中查出专门的事实材料。19 第三节第三节 文献检索概述文献检索概述 2.2.按文献存贮载体及实现查找技术手段分为按文献存贮载体及实现查找技术手段分为20(1)手工检索以手工方式,利用图书馆卡片目录和书本式文摘、索引等检索工具进行的检索活动。(2)计算机检索(computer-based retrieval)借助于计算机设备进行人机对话的方式进行检索。第三节第三节 文献检索概述文献检索概述 三、文献信息检索方法及途径三、文献信息检索方法及途径21(2)追溯法(3)循环检索法(又称分段法或综合法)1.检索方法(1)工具法(又称常用法)包括顺查法、倒查法(逆查法)和抽查法 第三节第三节 文献检索概述文献检索概述 2.检索途径(又称检索入口)指用户检索文献信息的出发点和依据,它是由信息的内部特征和外部特征构成的。22 第四节第四节 检索语言检索语言 一、检索语言概述一、检索语言概述检索语言是文献存贮和检索所遵循的一种规范,可以用来描述文献的内容特征或外部特征,以便将文献整理、加工、存贮于检索系统之中。同时,它也可以表达文献检索提问的内容,以便把一定的文献从检索系统中检索出来。23作用:作用:检索语言是标引人员和检索者之间进行交流的媒介,也是人与检索系统之间交流的桥梁 6-2425检检索索语语言言表述文献外表表述文献外表特征的语言特征的语言表述文献内容表述文献内容特征的语言特征的语言题名题名(title)、刊名、刊名责任者责任者(author)号码号码(code)引文引文(reference)分类语言分类语言(classification)主题词主题词(subject)关键词关键词(keyword)等等信息检索语言的类型信息检索语言的类型 第四节第四节 检索语言检索语言 二、分类检索语言(分类法)二、分类检索语言(分类法)将各种概念按学科性质进行分类和系统排列的语言,具体体现为用分类号和类目来表达信息的主题概念。1.1.中国图书馆分类法(简称中图法)中国图书馆分类法(简称中图法)按照从总到分,从一般到具体的编制原则,确定分类体系。中图法的标记符号采用字母与阿拉伯数字相结合的混合号码。即用一个字母表示一个大类,以字母的顺序反映大类的序列。2627中中图图法法五五大大部部分分1.1.1.1.马列主义、毛泽东思想、邓小平理论马列主义、毛泽东思想、邓小平理论马列主义、毛泽东思想、邓小平理论马列主义、毛泽东思想、邓小平理论2.2.2.2.哲学哲学哲学哲学3.3.3.3.社会科学社会科学社会科学社会科学4.4.4.4.自然科学自然科学自然科学自然科学5.5.5.5.综合性图书综合性图书综合性图书综合性图书A A 马克思主义、列宁主义、毛泽东思想、邓小平理论马克思主义、列宁主义、毛泽东思想、邓小平理论B B 哲学哲学C 社会科学总论社会科学总论N N 自然科学总论自然科学总论D D 政治、法律政治、法律O O 数理科学和化学数理科学和化学E E 军事军事P P 天文学和地球科学天文学和地球科学F F 经济经济Q Q 生物科学生物科学G G 文化、科学、教育、体育文化、科学、教育、体育R R 医药、卫生医药、卫生H H 语言、文字语言、文字S S 农业科学农业科学I I文学文学T T 工业技术工业技术J J 艺术艺术 U U 交通运输交通运输K K 历史、地理历史、地理 V V 航空、航天航空、航天 X X 环境科学环境科学Z Z 综合性图书综合性图书中图法中图法二十二个基本大类(一级类目表)二十二个基本大类(一级类目表)中图分类号查询中图分类号查询 社会科学总论社会科学总论(二级类目表)(二级类目表)29C0C0 社会科学理论与方法论社会科学理论与方法论 C1C1 社会科学现状及发展社会科学现状及发展 C2C2 团体、会议、社会科学机构团体、会议、社会科学机构 C3C3 社会科学研究方法社会科学研究方法 C4C4 社会科学教育与普及社会科学教育与普及 C5C5 社会科学丛书、文集、连续性出版物社会科学丛书、文集、连续性出版物 C6C6 社会科学参考工具书社会科学参考工具书 C7C7 社会科学文献检索工具书社会科学文献检索工具书C8 C8 统计学统计学 C91C91 社会学社会学 30C81统计方法C82专类统计学C829世界各国统计工作C83世界各国统计资料中图分类号查询中图分类号查询 社会科学总论社会科学总论 统计学(三级统计学(三级类目表)类目表)第四节第四节 检索语言检索语言 2.其它分类法国内:国内:中国科学院图书馆图书分类法(科图法)、中国人民大学图书馆图书分类法(人大法)等。国外:国外:杜威十进分类法(DDC)、美国国会图书馆分类法(LC)、国际十进分类法(UDC)等。31 第四节 检索语言 三、关键词检索语言三、关键词检索语言对表述文献中心内容有实质意义的词汇,是从论文的题名、摘要和正文中选取出来的,关键词又称自由词,属自然语言范畴。32 第四节第四节 检索语言检索语言 四、主题词检索语言主题词:在标引和检索中用以表达文献主题的经规范化的词或词组。参见汉语主题词表和世界汉语主题词表如:经济 管理 调整 调控 控制 结构 制度 所有制 股份制责任制 流通 产业 行业 改革 改造 33 第五节第五节 计算机检索基本技术计算机检索基本技术 一、布尔逻辑检索二、截词检索三、词间位置检索四、字段限定检索五、短语或词组检索34一、布尔逻辑检索一、布尔逻辑检索指通过标准的布尔逻辑关系算符来表达检索词与检索词间的逻辑关系的检索方法。35第五节 计算机检索基本技术 1.1.1.1.逻辑与:常用逻辑与:常用逻辑与:常用逻辑与:常用“ANDANDANDAND”、“*”表示表示表示表示组配方式:A*B A*B 或:或:A AND B A AND B 表示两个概念的交叉和限定关系,只有同时含有这两个概念的记录才算命中信息 在检索系统中通常表述为在检索系统中通常表述为“并且并且”作用:作用:增加限制条件,即增加检索的专指性,以缩小提问范围,减少文献输出量,提高查准率。36第五节第五节 计算机检索基本技术计算机检索基本技术【例例】写出下列检索条件的逻辑与的检索式查找胡元林2000年撰写的有关财务管理的文章 检索式1:财务管理*胡元林*2000检索式2:财务管理 and 胡元林 and 2000 37第五节第五节 计算机检索基本技术计算机检索基本技术 2.2.2.2.逻辑或(又称逻辑和):常用逻辑或(又称逻辑和):常用逻辑或(又称逻辑和):常用逻辑或(又称逻辑和):常用“OROROROR”、“+”表示表示表示表示检索词检索词A A、B B的逻辑或运算关系的逻辑表达式为:的逻辑或运算关系的逻辑表达式为:A+B A+B 或:或:A OR BA OR B 在检索系统中通常表述为在检索系统中通常表述为“或者或者”含义:含有A或含有B或同时含有A、B检索词的信息都是命中信息作用:放宽提问范围,增加检索结果,起扩检作用,提高查全率。38第五节第五节 计算机检索基本技术计算机检索基本技术 3.3.逻辑非(又称逻辑差):常用逻辑非(又称逻辑差):常用“NOTNOTNOTNOT”、“-”表示表示组配方式:A A B B,A NOT BA NOT B表示检索出含有A词而不含有B 词的信息。作用:逻辑非用于排除不希望出现的检索词,它和“*”的作用相似,能够缩小命中文献范围,增强检索的准确性。举例:举例:主题=信息科技 not 主题=档案39在检索系统中通常表述为“不包含不包含”第五节第五节 计算机检索基本技术计算机检索基本技术 例如检索:“打印机驱动程序”查询关键词:打印机、驱动程序检索表达式:打印机驱动程序例如检索:“微型计算机”方面的有关信息查询关键词:微型计算机、微机检索表达式:微型计算机微机 40第五节第五节 计算机检索基本技术计算机检索基本技术 中文数据库用:中文数据库用:*+-+-and or notand or not西文数据库用西文数据库用:and or notand or not布尔逻辑检索需注意问题41 42第五节第五节 计算机检索基本技术计算机检索基本技术 在布尔逻辑符为如下运算顺序时:在布尔逻辑符为如下运算顺序时:not and or如改变顺序用()例:例:A-B+A-C A-B+A-C 等价于等价于 (A-BA-B)+(A-A-C C)A*(B+C)A*(B+C)等价于等价于 A*B+A*C A*B+A*C1、截词检索概念:就是截断检索词进行的检索,并认为凡是满足这个词局部中的所有字符(串)的文献,都为命中的文献。二、截词检索二、截词检索(主要应用于西文数字资源的检索)主要应用于西文数字资源的检索)作用:为了减少检索词输入量,节省机时,同时又扩大检索范围,保证查全率。截词符截词符:“?”代表一个字符 “*”代表任意一个字符串43第五节第五节 计算机检索基本技术计算机检索基本技术 如:如:protectprotect*截词种类按截词符位置分前截词后截词前后截词中间截词44第五节第五节 计算机检索基本技术计算机检索基本技术 前截词(左截词、后方一致)允许检索词前有若干变化。【例】*physics可检索出:physics、astrophysics、biophysics、chemicalphysics、geophysics等结果。45第五节第五节 计算机检索基本技术计算机检索基本技术 46第五节第五节 计算机检索基本技术计算机检索基本技术 后截词(右截词、前方一致)允许检索词尾有若干变化。【例】comput*可检索出:computer、computing、computerised、computerized、computerization等结果。第五节第五节 计算机检索基本技术计算机检索基本技术 前后截词(中间一致)词干的前后各有一个截词符,允许检索词的前端和尾部各有若干变化形式。【例】*computer*可检索出:computer、computers、computerize、computerized、computerization、minicomputer、minicomputers、microcomputer、microcomputers等结果47第五节第五节 计算机检索基本技术计算机检索基本技术 48中间截词(前后一致)允许检索词中间有若干变化【例】wom*n可检索出:woman、women。【例】defen*e可检索出:defence、defense(英美的不同拼法)常用的“?”和“*”在不同的数据库中其用法不一定相同。在允许截词的检索工具中,一般是指后截词,部分支持中间截词,左截词比较少见。在一些数据库里仅用“?”代表截词符N?表示在此位置上最多允许出现N个字符数两个?之间空一格(?),表示该位置允许出现01 个字符 运用截词注意问题运用截词注意问题49第五节第五节 计算机检索基本技术计算机检索基本技术 三、词间位置检索位置检索是用位置算符来表达检索词与检索词之间的临近关系。50第五节第五节 计算机检索基本技术计算机检索基本技术 1、(W)算符 表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其他的词或字母,但允许有一空格或标点符号。如:biological(W)control 相当于检索 biological controlCD(W)ROM 相当于检索 CD ROM或CD-ROM。51第五节第五节 计算机检索基本技术计算机检索基本技术 2、(nW)算符(nW)是n个words的缩写,表示此算符两侧的检索词之间最多允许插入n个词,且词序不可变。如wear(1W)material相当于检索wear materials、wear of materials等词。52第五节第五节 计算机检索基本技术计算机检索基本技术 3 3、(、(N N)算符)算符(N)是near的缩写,表示此算符两侧的检索词必须紧密相连,词序可变,词间不允许插入其他词或字母,但允许有一空格或标点符号。53第五节第五节 计算机检索基本技术计算机检索基本技术 如检索式:environment(N)protection 相当于检索environment protection或:protection environment 54第五节第五节 计算机检索基本技术计算机检索基本技术 4 4、(、(nNnN)算符)算符(nN)表示两词间最多可插入n个词,且检索词词序可变。如检索式:environment(2N)protection 可检索出:environment protectionenvironment of water protectionprotection of forest environment等结果。邻近检索注意事项邻近检索对提高检索的查全率和查准率有重要作用,网络检索中基本上支持(W)、(nW)和(N)、(nN)检索。不同的系统,不同的数据库,词位符号虽然含义相同,但形式可能有所不同。有的可能有括号,有的可能没有。小写n有时在大写的W、N前面,有时在大写的W、N后面。常见的形式有:(W)、W、W/;(N)、N;(nW)、nW、(Wn)、Wn;(nN)、nN(Nn)、Nn;第五节 计算机文献检索基础 55 四、字段限定检索字段限定检索:是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法,检索时计算机只对限定字段进行查找,以提高检索效果。注意:不同的数据库其字段代码可能不同。字段限定检索表达式有字段限定检索表达式有:“字段标识符=检索词”“字段标识符:检索词”“检索词with字段标识符”检索词in字段标识符:如:李红 in AU56第五节第五节 计算机检索基本技术计算机检索基本技术“检索词in字段标识符”57字段检索包括两种形式:v一是通过菜单选择检索字段,v二是用命令的方式输入字段限制算符。第五节第五节 计算机检索基本技术计算机检索基本技术 58第五节第五节 计算机检索基本技术计算机检索基本技术 59五、短语或词组检索短语或词组检索第五节第五节 计算机检索基本技术计算机检索基本技术 短语或词组检索常用运算符为“”。当用户需要检索与输入形式完全相同的短语或词组时,可以将其放入“”中,如“computer net”,系统将严格匹配,检出含有短语computer net的记录。检检索索需需求求分分析析检检索索课课题题制制定定检检索索策策略略试试检检索索正正式式检检索索索索取取原原文文不满意不满意文献检索的基本步骤文献检索的基本步骤 检索策略:就是在分析检索提问的基础上,确定检索的数据库、检索词,并明确检索词之间的逻辑关系和查找步骤的科学安排。检索式:即检索词与各种组配算符组配成的表达式61检索策略组配算符通常有布尔逻辑算符、截词符布尔逻辑算符、截词符(通配符通配符)、位置算符、嵌套、位置算符、嵌套算符算符(优先算符优先算符)四种。四种。62检索策略的制定(1)选择检索工具或检索系统及数据库(2)选择检索方式(3)选择检索途径(4)构造检索式 63【例】查找财务风险预警研究方面的文献(国内文献)64文献类型:文献类型:期刊论文、会议文献、学位论文(国内文献)1.中文科技期刊全文数据库(维普)2.万方数据资源 3.CNKI数据资源检索途径:检索途径:篇名、关键词分分析析课课题题检索词:检索词:财务风险、预警检索工具:检索工具:65检索表达式:检索表达式:篇名篇名=财务风险财务风险*关键词关键词=预警预警66 第六节 检索效果评价及其优化 一、检索效果评价检索效果评价(广义):从技术效果和经济效果两个方面对检索结果进行评价。检索效果评价(狭义):对检索结果全面性、准确性的评价(技术评价)。67 第六节第六节 检索效果评价及其优化检索效果评价及其优化 二、检索效果评价的指标:查全率:就是系统在进行某一检索时,被检出的相关文 献量占系统文档中存储的相关文献量的比重。漏检率:就是系统在进行某一检索时,漏检的相关文 献量占系统中存储的相关文献量的比重。68 第六节第六节 检索效果评价及其优化检索效果评价及其优化 查准率:就是系统在进行某一检索时,被检出的相关文献量占检索出文献总量的比重。误检率:就是系统在进行某一检索时,被检出的不相 关文献量占检索出文献总量的比重。69 第六节 检索效果评价及其优化【例】在一次检索中,共检出文献100篇,经过专家判定,其中与提问相关的文献为80篇,其余的20篇为误检文献,检索系统中还有120篇相关文献,由于各种原因而未被检出(漏检)。查全率=80/200=40%查准率=80/100=80%漏检率=120/200=60%误检率=20/100=20%70 提高查全率的主要方法提高查全率的主要方法(1)准确把握检索对象及目的,选择合适的数据;(2)降低检索词或分类号的专指度;(3)更多地采用学科分类途径来扩大检索范围;(4)减少逻辑“与”及逻辑“非”的使用;(5)增加逻辑“或”及截词检索技术的使用;(6)采用“全文检索”;(7)不限定检索对象的文献类型、时间段、文种 等。71 提高查准率的主要方法提高查准率的主要方法1)准确把握检索对象及目的,选择合适的数据库(2)提高检索词或分类号的专指度(3)更多地采用专用名词及特性检索的途径(4)选择逻辑“与”及逻辑“非”的使用(5)减少或不采用逻辑“或”及截词检索技术的使用(6)限定检索词出现的字段及在段落、文句中的位 置 (7)不选“全文检索”(8)限定检索对象的文献类型、时间段、文种及其 它特征
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!