《信息检索与利用》ppt课件

上传人:风*** 文档编号:240782258 上传时间:2024-05-08 格式:PPT 页数:97 大小:1.77MB
返回 下载 相关 举报
《信息检索与利用》ppt课件_第1页
第1页 / 共97页
《信息检索与利用》ppt课件_第2页
第2页 / 共97页
《信息检索与利用》ppt课件_第3页
第3页 / 共97页
点击查看更多>>
资源描述
*1*1*2信息检索与利用信息检索与利用主讲:陈清文主讲:陈清文Email:Tele:83642478*2信息检索与利用*3联合国教科文组织对大学生能力提出的“四会”&learn to be 学会做人&learn to do 学会做事&learn to be with others学会与人相处&learn to how to learn 学会如何学习 最重要的是:“学会如何学习的能力”*3联合国教科文组织对大学生能力提出的“四会”&l*4为什么要学习文献检索?w文献资源日益庞大n非科技文献,每10年甚至78年翻一番n科技文献,尤其是尖端科学的文献增加速度更快,如,原子能文献每23 年就翻一番,且倍增周期逐年缩短n据估计目前每年出版的各种类型的科技文献有1000多万篇w出版速度加快据国外报导,2006年全世界出版v科技文献2000印张/秒v4-5种新书/小时v新增3种刊物/小时载体形式多样化*4为什么要学习文献检索?文献资源日益庞大文献检索需要解决的问题如何从信息的海洋中获取我需要的知识?我们被信息的海洋包围着,但是确被知识饿死了!文献检索需要解决的问题如何从信息的海洋中获取我需要的知识*6这门课的目的这门课的目的(Purpose)是是:面对日益增长的文献资源,如何通过一种有效的方法,以最少的时间与精力来获取自己所要的信息这就是文献检索所要解决的问题。*6这门课的目的(Purpose)是:*7学会了文献检索有什么好处?w对于科技人员:w文献检索是科技人员必备的基本技能文献检索是科学研究的先期工作*7学会了文献检索有什么好处?对于科技人员:*8一个科研人员的时间分配表查资料50%写报告10%实验研究30%计划思考10%*8一个科研人员的时间分配表查资料写报告实验研究计划思考*9学会了文献检索有什么好处?对于一般大众w文献检索是知识更新的手段n通过文献检索获取学术动态n通过文献检索寻找未知问题的答案w是能力的培养n提高自学的能力提高自学的能力n文献检索课的一个重要目标就是培养学生的信息意识文献检索课的一个重要目标就是培养学生的信息意识*9学会了文献检索有什么好处?对于一般大众*10怎样学好文献检索课w陆游 冬夜读书示子律 古人学问无遗力,少壮功夫老始成。纸上得来终觉浅,绝知此事要躬行。这是陆游的一首教子诗,名字叫冬夜读书示子律,作于宁宗庄元五年(公元1199年)底。诗人就知识的获取,从两方面谈了自己的看法:一是要花气力,一是“要躬行”。诗中表达的思想不仅是冬夜读书的体会,更是诗人勤奋学习的经验总结。*10怎样学好文献检索课陆游 冬夜读书示子律 古人学问*11文献检索课教学大纲w医学文献检索与论文写作医学文献检索与论文写作教学大纲教学大纲w大纲说明大纲说明w课程编号:课程编号:7125001 w课程性质:课程性质:专业模块课w适用专业:生物适用专业:生物医学专业w先修课程先修课程:专业基础课、英语、计算机与网络应用基础 w学学 分:分:2 w学学 时:时:32(讲课20学时,上机12学时)w课程的性质、任务及地位:课程的性质、任务及地位:w文献检索与利用课是为大学生开设的一门重要公共基础课。通过本课程的教学,逐步培养大学生良好的信息素养,增强大学生的信息意识和掌握现代化信息检索与利用的技能,提高开发和利用信息资源的能力,增强自学能力、独立研究能力和创新能力。*11文献检索课教学大纲医学文献检索与论文写作教学大纲*12文献检索课教学大纲w教学目的与要求教学目的与要求:w通过本课程的学习,使学生了解文献信息与文献信息检索的基本知识,熟悉各类型信息资源的分布与流变规律以及信息媒体的特点、类型与用途。学会常用信息检索系统的使用方法,重点掌握计算机信息检索的基本概念和检索技术,熟练掌握各种中、外文数据库、网络检索工具以及其他网络信息资源的检索与利用。为将来进一步学习、工作或教学、科研打下坚实基础。w本课程是一门实践性很强的科学方法课,教学必须理论联系实际,实践环节的安排尤为重要,建议采用多媒体或网络演示教学,并安排相应课时的实习。其基本的教学要求是精讲文献信息的获取技巧,特别是网络信息获取技巧,教学中在注意对基本概念介绍的同时,重在对检索系统操作方法、操作步骤的介绍,要使学生能从检索实例中掌握对具体检索系统的使用,并进行模拟练习,善于根据自己感兴趣的学科或研究课题进行实际操作。增强广大学生的情报意识,培养他们的信息获取能力和独立研究的能力。*12文献检索课教学大纲教学目的与要求:*13文献检索课教学安排课时分配表:序列内容 学 时 上机1第一章文献检索基础知识 22第二章计算机文献检索 23第三章常用中文数据库 4 4学时4第四章常用国外全文数据库4 4学时5第五章常用国外文摘数据库26第六章事实、专利与标准文献数据库 27第七章网络信息资源检索与利用2 2学时8第八章学术论文撰写与投稿29 综合实习报告 2学时10 总计 20学时 12学时*13文献检索课教学安排课时分配表:*14文献检索课考核要求w考核与成绩评定:w考勤(10)w实习和作业(30)w综合实习报告(60)w三者相结合。w *14文献检索课考核要求考核与成绩评定:*15教材教材1.医学信息检索与利用夏知平主编,复旦大学出版社,2007年出版*15教材1.医学信息检索与利用*16教学参考书1.医学信息检索与利用陈界等主编:中国科技出版社,第二版2003年;2.新编医学文献检索郭继军主编,人民卫生出版社,2004年;3.生物医学信息检索与利用,王秀平主编:科技文献出版社,2004年;4.医学文献检索,方平主编,人民卫生出版社,2003年4.信息检索焦玉英,符绍宏,何绍华主编,武汉大学出版社,2001.5.实用生物医学信息检索 谢志秐主编,复旦大学出版社,2004.*16教学参考书*17一、基本概念信息信息情报情报知识知识文献文献*17一、基本概念信息*18信息(Information)w信息信息是客观事物存在的方式或运动状态,以及关于客观事物存在方式或运动状态的陈述。情报与文献工作词汇、基本术语对信息的定义:物质存在的一种形式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义。信息论创始人申农认为:信息是用来消除不确定性的东西*18信息(Information)信息是客观事物存在的方式*19信息信息,最初的含义是指音信和消息,南唐李中暮春怀故人诗“梦断美人沉信息,目穿长路倚楼台”及宋代陈亮梅花诗“欲传春信息,不怕雪埋藏”中的信息就是这个概念。随着社会的进步和科技的发展,信息远远超出了原先的含义,是指通过各种手段传递的一切符号,它已经成为我们使用频率最高的词汇之一。*19信息信息,最初的含义是指音信和消息,南唐李中暮春怀故*20信息无处不在,无时不有,无人不用信息无处不在,无时不有,无人不用w冰消雪融、草木发芽,这是自然带给我们冰消雪融、草木发芽,这是自然带给我们季节变换的信息;季节变换的信息;w新闻报道、商品广告,这是新闻报道、商品广告,这是社会带给我们的信息社会带给我们的信息;w闹钟的铃声把我们从睡梦中叫醒,这是闹钟的铃声把我们从睡梦中叫醒,这是生活中的信息。生活中的信息。w我们无时无刻地与信息有联系。我们无时无刻地与信息有联系。w生生活活充充满满了了信信息息。听听课课、看看书书读读报报、看看电电视视、听听广广播播、我我们们接接受受信信息息,同同时时我我们们点点头头、摆摆手手、跺跺脚脚、摸摸鼻鼻子子、说说、唱唱等等,一一举举一一动动都都在在发发出出或或传传递递信信息息。人人与与人人间间传传递递信信息息可可通通过过:肢体语言、口头语言、书面语言等。肢体语言、口头语言、书面语言等。*20信息无处不在,无时不有,无人不用冰消雪融、草木发芽,这*21信息的特征信息的特征w(1)(1)客观性客观性w地地震震,海海啸啸,花花草草树树林林的的发发芽芽、生生长长和和枯枯萎萎,广广播播电电视视、网网络络的的新新闻闻、广广告告等等等等发发出出的的信信息息,不不管管你你知知道道不不知知道道,感感知知不不感感知知,它它都都是是客客观观存存在在。只只要要有有物物质质存存在在,就就有有信信息息的的存存在。在。w因因此此,信信息息是是客客观观存存在在的的,不不以以人人们们的的意意志志为为转转移移的的。它它是是现现实实世世界界中中各各种种事事物物运运动动与与状状态态的的反反映映,它它可可以以被被人人们们所所感感知知、处处理理、存存储储和和使使用用。它它的的客客观观性性还还表表现现在在反反映映客客观观世世界界变化的信息包含在各种物质之中。变化的信息包含在各种物质之中。*21信息的特征(1)客观性*22(2)(2)时效性时效性w朝鲜战争与兰德咨询公司故事朝鲜战争与兰德咨询公司故事 w在在美美国国出出兵兵朝朝鲜鲜之之前前,美美政政府府曾曾请请美美国国著著名名的的咨咨询询机机构构兰兰德德公公司司做做一一预预测测:如如果果美美国国出出兵兵中中国国会会不不会会出出兵兵?兰兰德德公公司司请请了了大大批批资资深深专专家家,从从中中共共历历史史、军军力力、国国际际关关系系、甚甚至至中中共共领领袖袖性性格格等等各各方方面面做做了了精精深深的的分分析析,最最后后得得出出结结论论是是:“中中国国将将出出兵兵朝朝鲜鲜”。其其主主题题词词只只有有7 7个个字字,要要价价150150万万美美元元。美美国国国国防防部部认认为为是是敲敲诈诈,不不予予理理睬睬,在在自自认认为为中中共共不不敢敢出出兵兵的的假假设设下下,冒冒险险出出兵兵,结结果果“在在错错误误的的时时间间,在在错错误误的的地地点,与错误的敌人进行了一场错误的战争点,与错误的敌人进行了一场错误的战争”。w一一直直到到前前些些年年,美美国国政政府府检检讨讨当当年年决决策策错错误误时时,向向兰兰德德公公司司付付了了一一大大笔笔款款,表表示示对对科科学学预预测测的的重重新新估估价价与与信信服服。很很明明显显,如如果果美美国国政政府府当当年年尊尊重重科科学学预预测测,相相信信中中共共会会出出兵兵,他他是是决决不不敢敢冒冒这这个个险险的的,那那朝朝鲜鲜历史将重新改写,抗美援朝也就不存在了。历史将重新改写,抗美援朝也就不存在了。w由上例可以看出信息是具有较强时效性的。由上例可以看出信息是具有较强时效性的。w客客观观事事物物总总是是不不断断地地发发展展变变化化,因因而而信信息息也也会会发发展展变变化化,如如果果信信息息不不能能适适时时地地反反映映事事物物存存在在的的方方式式和和运运动动状状态态,那那么么,这这一一信信息息就就失失去去其其效用。效用。*22(2)时效性朝鲜战争与兰德咨询公司故事*23(3)(3)传递性传递性w大庆油田产量失密事件大庆油田产量失密事件w19601960年年王王进进喜喜被被冠冠之之以以“铁铁人人”的的称称号号以以后后,国国内内的的各各大大报报纸纸对对他他都都有有了了相相关关的的报报道道。谁谁想想到到被被狡狡猾猾的的日日本本人人嗅嗅出出蛛蛛丝丝马马迹迹,竟竟从从中中了了解解了了大大庆庆油油田田开开采采的的一一些些情情况况。日日本本人人发发现现,王王进进喜喜原原来来的的工工作作地地点点是是甘甘肃肃玉玉门门油油田田,19591959年年1010月月参参加加国国庆庆观观礼礼后后他他就就销销声声匿匿迹迹了了,由由此此推推断大庆开发时间应该为断大庆开发时间应该为19591959年年9 9月;月;w19661966年年7 7月月,中中国国画画报报曾曾刊刊载载王王铁铁人人头头戴戴厚厚厚厚瓜瓜皮皮帽帽的的照照片片,凭凭着着对对中中国国地地理理的的熟熟知知,日日本本人人很很快快就就推推断断出出王王进进喜喜的的工工作作地地应应该该在在零零下下3030度的东北地区;度的东北地区;w还还根根据据其其他他相相关关信信息息,测测算算出出了了油油田田与与北北京京的的距距离离,断断定定油油田田应应在在哈哈尔滨与齐齐哈尔之间;尔滨与齐齐哈尔之间;w1010月月份份,人人民民中中国国也也刊刊登登出出宣宣传传王王进进喜喜的的文文章章,在在其其中中透透出出一一个个“马家窑马家窑”的地理信息,日本人便由此推出大庆在安达车站附近。的地理信息,日本人便由此推出大庆在安达车站附近。w据据称称,日日本本人人通通过过精精细细、准准确确的的情情报报对对大大庆庆油油田田进进行行了了成成功功调调查查,后后来几乎垄断了我国石油设备进口市场。来几乎垄断了我国石油设备进口市场。*23(3)传递性大庆油田产量失密事件*24w从从上上例例中中可可以以看看出出,大大庆庆油油田田的的信信息息是是刊刊载载在在人人民民画画报报等等这这些些公公开开发发行行的的报报刊刊杂杂志志上上的的,而而日日本本人人正正是是利利用用这这些些公公开开的的报报纸纸、杂杂志志分分析析中中我我国国大大庆庆油油田田的的产产量量和和设备需求,获取了最高的经济利益。设备需求,获取了最高的经济利益。w在在本本例例中中,大大庆庆石石油油信信息息从从国国内内报报刊刊杂杂志志社社这这一一信信息息的的发发源源地地通通过过人人民民画画报报等等报报刊刊杂杂志志这这些些载载体体,传传到到了了日日本本人人的的手手里里,经经过过他他们们的的分分析析、处处理理后后,加加以以运运用用,获取了高额的经济利益。获取了高额的经济利益。w信信息息的的传传递递性性是是指指任任何何信信息息只只有有从从信信源源出出发发,经经过过信信息息载载体体传传递递才才能能被被信信宿宿接接受受并并进进行行处处理理和和运运用用。也也就就是是说说,信信息息可可以以在在时时间间上上或或空空间间上上从从一一点点移移动动到到另另一一点点,可可以以通通过过语语言言、动动作作、文文字字、通通信信、电电子子计计算算机机等等各各种种渠渠道道和媒介传播。和媒介传播。*24从上例中可以看出,大庆油田的信息是刊载在人民画报等*25(4)(4)共享性共享性 英国剧作家萧伯纳说:你我是朋友,各拿一个苹果,彼此交换,交换后仍然是各有一个苹果。倘若你有一种思想,彼此交流思想,那么我们每个人就有两种思想了。同一内容的信息可以在同一时间或不同时间里被多个信息用户使用。同一内容的信息可以在同一时间或不同时间里被多个信息用户使用。一条信息被用户吸收和利用并不影响信息的本身和被其他用户的反一条信息被用户吸收和利用并不影响信息的本身和被其他用户的反复使用,各用户分享的份额也不会因为分享的人的多少而受影响。复使用,各用户分享的份额也不会因为分享的人的多少而受影响。正如萧伯纳所举的正如萧伯纳所举的“苹果与思想苹果与思想”的例子,苹果交换以后双方仍然的例子,苹果交换以后双方仍然各自仅有一个苹果,但信息交换以后双方都有了两种信息。信息共各自仅有一个苹果,但信息交换以后双方都有了两种信息。信息共享性是推动社会交流的原动力。享性是推动社会交流的原动力。*25(4)共享性 英国剧作家萧伯纳说:你我是朋友,各*26(5)(5)中介性中介性w人人们们看看柳柳树树发发芽芽,就就知知道道春春天天来来了了,看看到到天天上上乌乌云云滚滚滚滚,就就知知道道要要下下雨雨了了,这这就就是是这这些些自自然然世世界界发出的信息。发出的信息。w信信息息是是介介于于物物质质世世界界和和精精神神世世界界之之间间的的过过渡渡状状态态的的东东西西,是是人人们们认认识识事事物物、感感知知世世界界的的不不可可缺缺少少的的中中间间环环节节。它它贯贯穿穿于于认认知知活活动动的的始始终终,认认知知过过程本身就是一个以信息为中介的信息运动过程。程本身就是一个以信息为中介的信息运动过程。w人人类类认认识识世世界界和和改改造造世世界界的的过过程程,是是一一个个不不断断从从客客观观世世界界获获得得信信息息,并并对对信信息息进进行行加加工工处处理理,形形成成新新的的认认知知结结构构,然然后后通通过过实实践践活活动动反反作作用用于于客客观世界的过程观世界的过程。*26(5)中介性人们看柳树发芽,就知道春天来了,看到天上乌*27情报(Information 2)w情情报报是是人人们们为为一一定定目目的的而而搜搜集集的的有有使使用用价价值值的的知知识识或或信信息息。“是是被被有有目目的利用的、活化的知识与信息的利用的、活化的知识与信息”。w情报有如下几点属性:情报有如下几点属性:w(1)(1)知知识识性性与与信信息息性性:情情报报要要具具有有实实质质性性的的内内容容-知知识识与与信信息息,没没有有知知识识信息内容的情报是不存在的。信息内容的情报是不存在的。w(2)(2)实实用用性性:人人们们利利用用情情报报是是为为了了获获取取实实际际效效益益或或解解决决特特定定的的问问题题。对对没没有有使使用用价价值值的的知知识识和和信信息息,人人们们不不会会产产生生客客观观需需要要的的动动机机。只只有有当当知知识识信息与人们的客观需要联系起来,才能活化形成情报。信息与人们的客观需要联系起来,才能活化形成情报。w(3)(3)传传递递性性:只只有有在在传传递递、交交流流、运运动动过过程程中中活活化化了了的的知知识识与与信信息息才才能能成成为情报。它是情报的本质特征,情报传递效果直接影响其使用。为情报。它是情报的本质特征,情报传递效果直接影响其使用。w(4)(4)时时效效性性:特特定定的的情情报报只只有有在在合合适适的的时时间间内内传传递递和和利利用用才才会会产产生生更更大大的的效用。过时的情报就会成为失效情报。效用。过时的情报就会成为失效情报。w(5)(5)针针对对性性:情情报报是是针针对对特特定定用用户户、特特定定需需求求提提供供的的有有使使用用价价值值的的知知识识与与信息,具有很强的针对性。信息,具有很强的针对性。*27情报(Information 2)情报是人们为一定*28知识w知识知识是人们对客观事物存在和运动规律的认识。w知识是建立在信息的基础上经过加工而形成的。*28知识知识是人们对客观事物存在和运动规律的认识。*29人类社会中的信息知识改变命运,信息改变生活!w信息对于人类来说,它和空气、水、信息对于人类来说,它和空气、水、食物等一样,都是不可缺少的,而且食物等一样,都是不可缺少的,而且在某种意义上讲,还显得更为重要。在某种意义上讲,还显得更为重要。w在人类社会发展中,特别是在步入信在人类社会发展中,特别是在步入信息社会的今天,信息在社会发展中的息社会的今天,信息在社会发展中的作用越来越大,可以说,谁占有了信作用越来越大,可以说,谁占有了信息,谁在收集、加工、处理和利用信息,谁在收集、加工、处理和利用信息方面领先一步,谁就能在竞争中获息方面领先一步,谁就能在竞争中获得优势。得优势。*29人类社会中的信息知识改变命运,*30文献记录有知识的一切载体。三要素:1.知识:文献的实质内容。2.载体:文献的外在形式。3.记录:将两者联系起来的手段。医学文献:记录有医学知识的一切载体。*30文献记录有知识的一切载体。*311.1.文献信息资源的构成文献信息资源的构成 (3 3)按文献信息的加工程度划分)按文献信息的加工程度划分 零次文献零次文献 是指未以公开形式进入社会流通使用的实验记录、会议记录、内部档案、论文草稿、设计草稿等。具有信息内容新颖、不公开交流、难以获得、不成熟、不定型的特点。*311.文献信息资源的构成*321.1.文献信息资源的构成文献信息资源的构成 (3 3)按文献信息的加工程度划分)按文献信息的加工程度划分 一次文献一次文献一次文献一次文献 是指作者以本人生产与科研工作成果为依是指作者以本人生产与科研工作成果为依 据,据,创作、撰写而形成的文献。如期刊论文、科技报告、创作、撰写而形成的文献。如期刊论文、科技报告、会议论文、专利说明书及各种专著等等。会议论文、专利说明书及各种专著等等。一次文献一次文献的特点在于内容新颖、翔实、具体,一般说它是文的特点在于内容新颖、翔实、具体,一般说它是文献信息检索的终极目标。献信息检索的终极目标。*321.文献信息资源的构成*331.1.文献信息资源的构成文献信息资源的构成 (3 3)按文献信息的加工程度划分)按文献信息的加工程度划分 二次文献二次文献 是指对一次文献信息进行加工、提炼、浓缩,而形是指对一次文献信息进行加工、提炼、浓缩,而形成的工具性文献。它主要包括各种书目、题录和文摘成的工具性文献。它主要包括各种书目、题录和文摘(数据库)。二次文献是人们对一次文献进行有效的(数据库)。二次文献是人们对一次文献进行有效的管理、控制和利用的工具管理、控制和利用的工具,它提供了一次文献的概略,它提供了一次文献的概略及线索。及线索。*331.文献信息资源的构成*341.1.文献信息资源的构成文献信息资源的构成 (3 3)按文献信息的加工程度划分)按文献信息的加工程度划分 三次文献三次文献 是根据特定的要求指对一次文献和二次文献的内是根据特定的要求指对一次文献和二次文献的内容进行综合分析、系统整理、高度浓缩后形成的文献。容进行综合分析、系统整理、高度浓缩后形成的文献。如各种词典、百科全书、年鉴、指南数据库等等。三如各种词典、百科全书、年鉴、指南数据库等等。三次文献提供各种事实与数据。次文献提供各种事实与数据。*341.文献信息资源的构成*35零次文献零次文献零次文献零次文献零次文献零次文献零次文献零次文献一次一次一次一次二次二次三次三次检索工具检索工具*35零次文献零次文献零次文献零次文献一次一次二次三次检索工*36信息与文献、情报、知识的关系信息与文献、情报、知识的关系w 信息与文献、情报、知识的关系信息与文献、情报、知识的关系 信息信息 知识知识 情报情报 文献文献知识情报信息文献*36信息与文献、情报、知识的关系 信息与文献、情报、知识的*37四、检索语言w检索语言是文献中用来描述文献外表特征和内容特征和表达情报提问内容的一种专门人工语言,又称情报语言、标引语言、索引语言等。*37四、检索语言检索语言是文献中用来描述文献外表特征和内容*38检索语言的分类w分类检索语言w主题检索语言w符号检索语言*38检索语言的分类分类检索语言*39分类检索语言w体系分类法:以科学分类为基础,结合文献的特点,采用概念逻辑分类的原理,层层划分,构成具有上下类、同位类的概念等级体系。w用分类号来表达各种概念。*39分类检索语言体系分类法:以科学分类为基础,结合文献的特*40中国图书馆分类法简表wA A马列、毛泽东思想马列、毛泽东思想wB B哲学哲学wC C社会科学总论社会科学总论wD D政治、法律政治、法律wE E军事军事wF F经济经济wG G文教、科学、体育文教、科学、体育wH H语言、文字语言、文字wI I文学文学wJ J艺术艺术wK K历史、地理历史、地理wN N自然科学总论自然科学总论wO O数学、物理、化学数学、物理、化学wP P天文学、地球科学天文学、地球科学wQ Q生物科学生物科学wR R医药、卫生医药、卫生wS S农业科学农业科学wT T工业科学工业科学wU U交通运输交通运输wV V航空、航天航空、航天wX X环境科学环境科学wZ Z综合性图书综合性图书*40中国图书馆分类法简表A马列、毛泽东思想N自然科学总*41R医药、卫生wR1 R1 预防医学、卫生学预防医学、卫生学wR2R2中国医学中国医学wR3R3基础医学基础医学wR4R4临床医学临床医学wR5R5内科学内科学-wR6R6外科学外科学wR71R71妇产科学妇产科学w.wR8R8特种医学特种医学wR9R9药学药学wR51R51传染病传染病wR52R52结核病结核病wR53R53寄生虫病寄生虫病wR54R54心脏、血管疾病心脏、血管疾病wR55R55血液及淋巴系疾病血液及淋巴系疾病wR56R56呼吸系及胸部疾病呼吸系及胸部疾病wR57R57消化系及腹部疾病消化系及腹部疾病wR58R58内分泌腺疾病及代谢病内分泌腺疾病及代谢病wR59R59全身性疾病全身性疾病*41R医药、卫生R1 预防医学、卫生学R51传染病*42体系分类法的优缺点w优点:系统性强,族性检索,便于按学科、专业直接检索比较广泛的课题。查全率较高。w缺点:缺乏专指性,查准率不高,不能满足专深课题以及新兴学科、交叉学科和边缘学科知识的检索。*42体系分类法的优缺点优点:系统性强,族性检索,便于按学科*43主题检索语言w以文献的主题内容为依据,用词语作为概念标识,并按一定的顺序排列而成的一种检索语言。w优点:直接性、专指性强,比较适合专深课题的检索。*43主题检索语言以文献的主题内容为依据,用词语作为概念标识*44主题词 经过规范化处理的具有实质性意义的词或词组。“规范”:是对一个概念的同义词、近义词和拼法变异词适当归并,采用参照系统,并有主题词的范畴表和树状结构。形成专门的主题词表。*44主题词 经过规范化处理的具有实质性意义的*45主题词表w 国内医学检索工具使用:中国中医药学主题词表、医学主题词注释字顺表。w 国外医学检索工具:Medical Subject Headings,(MeSH,医学主题词表)。*45主题词表 国内医学检索工具使用:*46主题词的特点 (1)规范错综复杂的名词概念,对同义词、近义词、多义词 进行规范和控制,使标引人员与检索人员在检索时有共同语言。(2)主题词具有主题集中、学科分散的特点,故能提高文献检索的查全率和查准率。*46主题词的特点 (1)规范错综复杂的名词概念*47关键词w未经严格规范化处理的检索词或词组(自然语言)。通常是从文献的题目、摘要、正文中选取出来。标引出的关键词在文献中起关键性作用,通常是由名词、形容词等实质性词构成。*47关键词未经严格规范化处理的检索词或词组(自然语言)。通*48关键词的特点 优点:可不用主题词表,自由选词,不受限制。缺点:同一主题的文献可能分散在不同的词下,可能造成漏检。要提高查全率,就必须分别检索同一主题的同义词和近义词等。*48关键词的特点 优点:可不用主题词表,自由选词,不受*494.4.常用文献检索途径及方法常用文献检索途径及方法 常用检索方法常用检索方法 (1)(1)追溯法追溯法 利用已经掌握的文献中所列举的参考文献利用已经掌握的文献中所列举的参考文献,根据其所提供的线索追踪、溯源及查找更多相关文根据其所提供的线索追踪、溯源及查找更多相关文献的方法。献的方法。*494.常用文献检索途径及方法 *504.4.常用文献检索途径及方法常用文献检索途径及方法 常用检索方法常用检索方法 (2)(2)工具法工具法 利用文献检索系统(工具),根据已经掌握的利用文献检索系统(工具),根据已经掌握的相关线索(如书名、刊名、篇名、作者姓名、主题相关线索(如书名、刊名、篇名、作者姓名、主题词、分类号等等),进行系统而全面的文献检索的词、分类号等等),进行系统而全面的文献检索的方法。方法。*504.常用文献检索途径及方法 *51 常用检索方法常用检索方法常用常用文献检索途文献检索途途径及方途径及方法法 (3)(3)循环法循环法采用追溯法与工具法交替进行的方式进行相关的文采用追溯法与工具法交替进行的方式进行相关的文献信息检索的方法。献信息检索的方法。*51 常用检索方法常用文献检索途途径及方法 *52五、文献检索途径w是检索工具提供的检索入口。通常检索工具都编有索引,如是检索工具提供的检索入口。通常检索工具都编有索引,如分类索引、主题索引、作者索引、代码索引、引文索引等,分类索引、主题索引、作者索引、代码索引、引文索引等,一种索引就是相应的检索途径。一种索引就是相应的检索途径。w计算机检索提供的途径几乎包括文献所有的外部特征和内容计算机检索提供的途径几乎包括文献所有的外部特征和内容特征,如标题、作者、作者单位、出处、文摘、关键词、主特征,如标题、作者、作者单位、出处、文摘、关键词、主题词、分类号、题词、分类号、ISSN等。等。*52五、文献检索途径是检索工具提供的检索入口。通常检索工具*53分类途径分类途径w分类途径:根据拟检文献的学科性质,利用分类目录,从分分类途径:根据拟检文献的学科性质,利用分类目录,从分类的角度进行的文献的检索。类的角度进行的文献的检索。分类法:分类法:中图法中图法、科图法科图法等等w在手工检索工具中使用较多,关键在于对分类法的熟悉和理在手工检索工具中使用较多,关键在于对分类法的熟悉和理解。解。*53分类途径分类途径:根据拟检文献的学科性质,利用分类目录*54主题途径主题途径w主题词途径:利用主题索引或主题词字段检索。关键在于主题词的选取和确定。w关键词途径:利用关键词索引和关键词字段检索。选词比较自由,但注意漏检率较高。*54主题途径主题词途径:利用主题索引或主题词字段检索。关键*55著者途径著者途径 按照著者的姓和名的汉语拼音顺序或外文字母顺序按照著者的姓和名的汉语拼音顺序或外文字母顺序,利用,利用著者索引或著者字段检索。著者索引或著者字段检索。注意姓名的缩写形式,一般姓是全称,名为缩写的首字母。注意姓名的缩写形式,一般姓是全称,名为缩写的首字母。区别同名同姓的著者,利用单位名称、地址或研究课题的区别同名同姓的著者,利用单位名称、地址或研究课题的不同加以区分。不同加以区分。*55著者途径 按照著者的姓和名的汉语拼音顺序或*56二、计算机文献检索1.1.文献信息数据库文献信息数据库 2.2.计算机信息检索基础计算机信息检索基础 3.3.检索效果评价及其优化检索效果评价及其优化*56二、计算机文献检索1.文献信息数据库*571.1.文献信息数据库文献信息数据库 文献文献是记录一切人类知识信息的载体。(文献情报术语国际标准(ISO/DIS5217)数据库数据库是结构化的数据集合,至少由一种文档组成并能够满足某种特定目的或特定数据处理系统需要的数据集合。当数据库记录的对象为文献信息时,就称为文献信息数据库文献信息数据库。*571.文献信息数据库*58 文献信息数据库的结构文献信息数据库的结构 一个数据库通常由一个主文档一个数据库通常由一个主文档(Master File)(Master File)和若干个和若干个索引文档或称倒排文档索引文档或称倒排文档(Inverted File)(Inverted File)组成。组成。文档文档是具有某种特征的全部记录的集合。是具有某种特征的全部记录的集合。记录记录是构成文档的基本单元,由各种反映文献特征是构成文档的基本单元,由各种反映文献特征的字段组成。如一篇论文、一件专利、一本图书、一个标准的字段组成。如一篇论文、一件专利、一本图书、一个标准的相关信息都能够成为文挡中的一条记录。的相关信息都能够成为文挡中的一条记录。字段字段是记录的基本组成元素。一条记录的常见字段是记录的基本组成元素。一条记录的常见字段通常包含题名字段、著者字段、主题词字段、文献出处字段通常包含题名字段、著者字段、主题词字段、文献出处字段(如刊名等)多种字段。(如刊名等)多种字段。*58 *59 文献信息数据库的评价标准文献信息数据库的评价标准 收录内容范围收录内容范围系统准确。系统准确。揭示文献详略揭示文献详略完备详细。完备详细。更新速度快慢更新速度快慢及时快速。及时快速。检索字段多寡检索字段多寡途径丰富。途径丰富。检索功能强弱检索功能强弱高效完善。高效完善。用户使用方便用户使用方便易学易用。易学易用。维护服务质量维护服务质量及时维护。及时维护。*59 文献信息数据库的评价标准*602.2.计算机信息检索基础计算机信息检索基础 计算机信息检索计算机信息检索 指利用计算机及相关软件和通信设施,对本地计算机、远程服务器及网上信息进行检索的过程或活动。随着信息技术的快速发展及对各种文献信息的数字化处理,计算机文献信息检索已经成为文献信息检索的主要手段。*602.计算机信息检索基础*61 计算机信息检索发展过程计算机信息检索发展过程 脱机检索阶段脱机检索阶段(50年代中期到60年代中期)联机检索阶段联机检索阶段(60年代中期到70年代中期)光盘数据库检索阶段光盘数据库检索阶段(70年代中期到80年代末)网络化检索阶段网络化检索阶段(90初年代至今)*61 计算机信息检索发展过程*62计算机信息检索发展过程计算机信息检索发展过程*62计算机信息检索发展过程*63计算机检索的原理w狭义:信息检索是指从任何信息集合中查出所需信息的活动、过程和方法。w广义:信息检索还包括信息存储,两者又往往合并称为“信息存储与检索”w信息检索的全过程包括存储和检索两个过程。w二、信息检索的本质w是信息用户的需求和信息集合的比较w与选择,即匹配(match)的过程。用户根w据检索需求,对一定的信息集合采用一w定的技术手段,根据一定的线索与准则w找出相关的信息。*63计算机检索的原理狭义:信息检索是指从任何信息集合中查出*64计算机文献检索的原理*64计算机文献检索的原理*65 计算机检索的一般步骤计算机检索的一般步骤 (1)分析检索课题,明确检索要求 (2)选择适当检索系统(数据库)(3)确定检索途径及检索词 (4)构建检索提问式 (5)上机检索并调整检索策略 (6)输出检索结果*65 计算机检索的一般步骤*66计算机检索的步骤计算机检索的步骤w(1).了解检索课题了解检索课题.分析课题的目的和范围,明确课题要分析课题的目的和范围,明确课题要解决的实质性问题。解决的实质性问题。w具体须明确:具体须明确:课题所涉及的学科范围,年代范围,文献类型,课题所涉及的学科范围,年代范围,文献类型,出版类型,文献信息的语种。出版类型,文献信息的语种。w(2).选择检索工具:根据检索课题的主题及学科范围选择选择检索工具:根据检索课题的主题及学科范围选择对口的检索工具(数据库)。对口的检索工具(数据库)。w检索工具选择标准:专业对口,检索途径多,收录范围广。检索工具选择标准:专业对口,检索途径多,收录范围广。w(3).确定检索途径和检索策略:根据课题已知条件和检索确定检索途径和检索策略:根据课题已知条件和检索工具中有什么检索途径,如主题途径,分子式途径,分类号工具中有什么检索途径,如主题途径,分子式途径,分类号途径等,确定检索途径;途径等,确定检索途径;w检索策略指检索前制定的概念组配即用逻辑运算符构造提问检索策略指检索前制定的概念组配即用逻辑运算符构造提问表达式和在检索时执行检索顺序的方案。表达式和在检索时执行检索顺序的方案。*66计算机检索的步骤(1).了解检索课题.分析课题的目*67计算机检索的步骤计算机检索的步骤w(4).实施检索:实施检索:w在选择的数据库进行检索。并在选择的数据库进行检索。并对检出文对检出文献进行相关性分析、评价;必要时对检索词献进行相关性分析、评价;必要时对检索词或检索式进行修改,直至检出结果符合要求;或检索式进行修改,直至检出结果符合要求;(5).获取原始文献信息:获取原始文献信息:w根据文摘出处获取原文信息,刊名缩写根据文摘出处获取原文信息,刊名缩写还原为全称,查本馆书目检索系统或其还原为全称,查本馆书目检索系统或其它馆书目检索系统,判断原文所在地它馆书目检索系统,判断原文所在地获取原文获取原文*67计算机检索的步骤(4).实施检索:*68 计算机检索基本技术计算机检索基本技术 布尔逻辑检索技术布尔逻辑检索技术 布尔检索技术是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑运算,以检索出所需信息的方法。常用算符及含义:AND AND(*)表示由该符号连接的检索式的运算结果为逻辑与。OR OR(+)表示由该符号连接的检索式的运算结果为逻辑或。NOTNOT(-)表示由该符号连接的检索式的运算结果为逻辑非。*68 计算机检索基本技术*692、逻辑与、逻辑与(逻辑乘逻辑乘)(*、AND)w逻辑与逻辑与 ANDAND运算符,用来组配不运算符,用来组配不同检索概念。其含义是检出的记同检索概念。其含义是检出的记录必须同时含有所共有的检索词录必须同时含有所共有的检索词w检索时,数据库中同时含有检索检索时,数据库中同时含有检索词词A和检索词和检索词B的文献才是命中的文献才是命中文献。文献。A*B*692、逻辑与(逻辑乘)(*、AND)A*B*70组配方式:组配方式:A*B或者或者AandB,表示检索必须同时,表示检索必须同时含有含有A、B两词的文章。两词的文章。作用:增加限制条件,即增加检索的专指性作用:增加限制条件,即增加检索的专指性,以缩小提问范以缩小提问范围围,减少文献输出量减少文献输出量,提高查准率。提高查准率。在实际检索中,不同概念组面之间及同一组面内的不同含义的词之间通常使用AND算符。用AND表示它所连接的两个检索词必须同时出现在结果中才满足检索条件,例如检索式 computer and law就 要 检 索 结 果 中 必 须 同 时 包 含computer 和law。检索式A AND B所表达的复合概念相当于包含检索词A的结果集与包含检索词B的结果集的重合部分,如图中两个圆交叉部分*70组配方式:A*B或者A and B,表示检索必须同时含*711、逻辑或逻辑或(逻辑和逻辑和)(+、OR)A+B*711、逻辑或(逻辑和)(+、OR)A+B*72作用:放宽提问范围,增加检索结果,起作用:放宽提问范围,增加检索结果,起扩检作用,提高查全率。扩检作用,提高查全率。逻辑逻辑或或组配方式:组配方式:AORB或者或者AB,表示检索,表示检索含有含有A词,或含有词,或含有B词,或同时包含词,或同时包含A、B两词的文章。两词的文章。*72作用:放宽提问范围,增加检索结果,起扩检作用,提高查*733、逻辑非(逻辑非(、NOT)w数据库中凡含有检索词A而不要检索词B的文献,为命中文献。w逻辑非NOT运算符,是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。AB*733、逻辑非(、NOT)数据库中凡含有检索词A而不要*74逻辑非逻辑非组配方式:组配方式:AB,表示检索出含有,表示检索出含有A词而不词而不含有含有B词的文章。词的文章。作用:逻辑非用于排除不希望出现的检索词,作用:逻辑非用于排除不希望出现的检索词,它和它和“*”的作用相似,能够缩小命中文献范的作用相似,能够缩小命中文献范围,增强检索的准确性。围,增强检索的准确性。3、逻辑非(逻辑非(、NOT)*74逻辑非3、逻辑非(、NOT)*75 *截词检索技术截词检索技术 截词检索是为扩大检索范围与增加检索结果而采用的一种检索技术。常见的截词符号及含义:“*”可代表多个字符 “?”代表单个的字符 一个“n?”或者“n?”代表0个到9个额外的字符。*75 *截词检索技术 *76 截词检索 l所谓截词检索指在检索式中用专门符号(截词符号)表示检索词的某一部分允许有一定的词形变化,结果中只要包含其中任意一个就满足检索要求。l主要是提高查全率,不同的数据库和搜索引擎有不同的截字符,截词符一般用“?”或“*”表示*76 截词检索 所谓截词检索指在检索式中用专门符号*77截词检索的方式 w按截词位置可分为前截词、后截词、前后截词和中间截词 w截断字符数的不同,可分为有限截断和无限截断*77截词检索的方式 按截词位置可分为前截词、后截词、前后截*78截词位置分w右截词,又称后截词、前方一致。允许检索词尾有若干变化。例如comput*将检索出computer、computing、computerised、computerized、computerization等结果。w中间截词,又称中间一致。允许检索词中间有若干变化。例如wom*n,检索到woman、women的结果。英美的不同拼法,defen*e可同时检出defence和defense的结果。w左截词,又称前截词、后方一致,允许检索词前有若干变化,例如*physics就可检索到physics、astrophysics、biophysics、chemophysics、geophysics等词的结果。*Computer可检索computer、minicomputer、microcomputer等结果。*78截词位置分右截词,又称后截词、前方一致。允许检索词尾有*79截词位置分w前后截词:词干的前后各有一个截词符,允许检索词的前端和尾部各有若干变化形式。如*computer*可检索computer、computers、computerize、computerized、computerization、minicomputer、minicomputers、microcomputer、microcomputers等结果。*79截词位置分前后截词:词干的前后各有一个截词符,允许检索*80截断字符数的不同分 w无限截断:在检索词的词干前后,加一个“*”,表示在此位置上可能出现的字符数量不受限制,可查找词干相同的所有词。按截词符的位置分为前截词、后截词和前后截词,如前述所举例子。w有限截断:在检索词的词干前后,加几个“?”,表示在此位置上最多允许出现的字符数。两个“?”之间空一格,即“?”,表示该位置允许出现01个字符,在空格前每增加一个“?”,表示增加一个字符,“?”表示该位置允许出现02个字符,依此类推。按截词符的位置同样分为前截词、后截词和前后截词。如computer?可检出computer和computers的信息,computer?可检出computer、computers、computerize的信息。*80截断字符数的不同分 无限截断:在检索词的词干前后,加一*81截词举例截词举例n符号:符号:*,?,?n前截断:前截断:*magnetic magnetic magnetic,electro-magnetic magnetic,electro-magnetic,electromagnetic,thermo-magnetic,electromagnetic,thermo-magnetic,n后截断:后截断:librar*librar*library,libraries,library,libraries,librarian,librarian,n中截断:中截断:organi?ation organi?ation organization,organisation organization,organisationn无限截断:无限截断:不限制被截断的字符数量,不限制被截断的字符数量,n例如例如输入输入educat*educat*,可以检索,可以检索educatoreducator,educatorseducators,educatededucated,educatingeducating,educationeducation,educationaleducational,等等。,等等。n 有限截断:有限截断:限制被截断的字符数量,限制被截断的字符数量,n例如例如输入输入educat?educat?,表示被截断的字符只有两个,可以检,表示被截断的字符只有两个,可以检索索educatoreducator,educatededucated两个词。两个词。*81截词举例符号:*,?*82 *位置检索技术位置检索技术 位置检索可要求检索词以用户所规定的相对位置出现。常用的位置算符及含义:(W)算符(WITH)表示两个检索词紧挨着,词序不能颠倒,中间不得插入其他词、字母或代码,但允许有空格或标点符号,也可用()表示。(n W)算符(n WORD)表示两个检索词中间可插入n个词,但它们之间的顺序不可颠倒。*82 *位置检索技术 *83*位置检索技术位置检索技术 (N)算符(NEAR)表示两个检索词必须相连,不得插入其他词,但词序可以颠倒。(n N)算符(n NEAR)表示两个检索词中间可以插入n个词,且词序可以颠倒。*83*位置检索技术*84*位置检索技术位置检索技术 (F)算符(FIELD)表示两个检索词必须同时出现在同一个字段内,但两词的词序和中间插入的词数不限。(S)算符(SUBFIELD)表示两个检索词必须出现在同一个子字段中,但两词的词序和插入的词数不限。*84*位置检索技术*85w常用的位置算符有算符算符功能功能表达式表达式检索结果检索结果W两两词词相相邻邻,按按输输入入时时顺序排列顺序排列Education(W)school,或或EducationschoolnW同同上上,两两词词中中间间允允许许插入插入n个词个词Education(1W)schoolEducationschoolEducationschoolsEducationandmusicschoolSchoolofcontinuededucationN两两词词紧紧密密相相邻邻,中中间间不不能能插插入入其其他他词词,顺顺序序可可以以颠颠倒倒Education(N)school,EducationschoolSchooleducationnN同同上上,两两词词中中间间可可以以插插入入n个词个词Education(1N)schoolEducationschoolSchoolofeducationEducationmusicschoolF两个词同在一个标引字段两个词同在一个标引字段中中Education(F)school例如同时出现在题名或文摘字段中例如同时出现在题名或文摘字段中Same两个词同在一个段落中两个词同在一个段落中 EducationSameschool同时出现在一个段落中同时出现在一个段落中*85常用的位置算符有算符 功能 表达式 检索结果 W两词相*86(4)、限定检索为了缩小检索范围,可利用为了缩小检索范围,可利用字段代码字段代码来限制检索词出现的来限制检索词出现的字段,以提高检索速度和命中率。字段,以提高检索速度和命中率。如:如:riceinti(表示只在题名字段中查找文献)(表示只在题名字段中查找文献)riceinde(只在主题词中查找)(只在主题词中查找)riceinab(只在文摘中查找)(只在文摘中查找)au=Smith,J.C(查作者为查作者为Smith,J.C的文章的文章)py=1998(只查只查1998年的文章年的文章)la=Chinese(只查语种为中文的文献只查语种为中文的文献)*86(4)、限定检索 *87 检索效果评价的指标检索效果评价的指标 评价检索效果的常用指标有:查全率(Recall ratio)-用R表示查准率(Precision ratio)用P表示漏检率(Omission ratio)-用O表示误检率(Fall-out ratio)-用F表示 高查全率和查准率是人们在检索活动中通常所追求的目标。*87 检索效果评价的指标*88查全率查全率:反映用户在文献检索时,检出的相关文献与数据查全率:反映用户在文献检索时,检出的相关文献与数据库中与自己研究课题相关文献的数量比例。又称库中与自己研究课题相关文献的数量比例。又称“检全率检全率”、“命中率命中率”*88查全率查全率:反映用户在文献检索时,检出的相关文献与数*89查准率查准率:是指检出的相关文献量与检出的全部文献总量的是指检出的相关文献量与检出的全部文献总量的比率比率,是衡量信息检索系统精确度的尺度是衡量信息检索系统精确度的尺度.查查准准率率*89查准率:是指检出的相关文献量与检出的全部文献总量的比率*90查全率查全率A和查准率和查准率P两者之间存在两者之间存在互逆互逆关系关系*90查全率A和查准率P两者之间存在互逆关系*91检索效果评价的指标检索效果评价的指标w漏检率(O)1-Rw误检率(F)1-P*91检索效果评价的指标漏检率(O)1-R*92漏检率w漏检率就是漏检的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下式表示:w漏检率漏检相关文献量 *100%w 系统中相关文献总量*92漏检率漏检率就是漏检的相关文献量与检索系统中相关文献总*93误检率误检率误检率是指误检(检不出相关)文献总量的比误检率是指误检(检不出相关)文献总量的比率,是衡量信息检索系统误检文献和程度的尺率,是衡量信息检索系统误检文献和程度的尺度。可用下式表示:度。可用下式表示:误检率误检率误检文献量误检文献量 *100100 检出文献总量检出文献总量*93*94 提高查全率的主要方法提高查全率的主要方法(1)1)准确把握检索对象及目的准确把握检索对象及目的,选择合适的数据库。选择合适的数据库。(2)(2)降低检索词或分类号的专指度。降低检索
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!