资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,生物医学信息检索,主讲人:余丽,生物医学信息检索主讲人:余丽,1,第一章信息检索概述,第一节 信息、信息社会、信息检索,一、信息的概念(Information),广义:信息是指事物存在方式及其运动规律、特点的外在表现形式,以及信息活动中各种要素的总称,包括信息本体、与信息有关的人员、设备、技术和资金等各种资源。,狭义:信息是指文献资源或数据资源,包括任何媒体中的片段、文章、图书、情报、观念等。,第一章信息检索概述第一节 信息、信息社会、信息检索,第一章信息检索概述,二、信息素养,信息素养,(Information literacy)指具有检索、分析、评价和利用各种信息源以解决信息需求及制定明智决策的能力,是对个人信息行为能力、独立学习能力以及批判性思维能力等概括性描述。,信息素养包括,:信息意识、信息能力、信息道德等方面。,第一章信息检索概述二、信息素养,第一篇信息检索概述,三、信息的特征,)客观性,)普遍性,)依附性,)认知性,)转移性和变换性,)价值性,)存储性,)传递性,)共享性,)时效性,第一篇信息检索概述三、信息的特征)价值性,第一篇信息检索概述,四、信息的类型,信息按照其外在的表现形式和内涵等,有许多不同的分类法。了解信息的类型,对获取信息、分析信息、表达信息都很有必要。,几种主要的信息类型,1、按载体形式,2、按出版类型,3、按使用级别,4、网络信息资源,第一篇信息检索概述四、信息的类型,第一篇信息检索概述,印刷型,纸张-,图书、期刊、专利文献等,缩微型,感光材料-,缩微胶片、平片、胶卷,视听型,磁带等-,录音带、录像带、电影胶片,机读型,磁、光盘-,电子期刊、图书、数据库,1、按载体类型,第一篇信息检索概述印刷型纸张-图书、期刊、专利文献等缩微型,图书,期刊,特种文献,内容比较成熟、系统、可靠的出,版物,是学习和参考的主要信息源,I,nternational,S,tandard,B,ook,N,umber,有固定名称和连续卷号、期号的定,期出版物,。,所含信息量大、新颖,,是科研工作主要信息源,(ISSN),其它文献资料出版物的总称,信息,全面、密度高,一般图书馆不做重,点收藏,2、按出版类型,第一篇信息检索概述,图书期刊特种文献 内容比较成熟、系统、可靠的出有固定名称和连,文献出版类型,第一篇信息检索概述,文献出版类型第一篇信息检索概述,一次信息,二次信息,三次信息,原始创作,:,是以作者本人的工作经验、观察,或实际科研成果为依据而创作的具有一定发明,创造或一些新见解的文献。,书目文献,:,是对一定范围、时间或类型的大量,一次性文献按其特征收集整理、压缩、加工,并,按一定顺序组织编排、用于检索查找利用这些文,献而编制的文献。,高级信息产物,:,在充分利用二次文献的基础上,对一次文献做出的系统整理和概括的论述,并加,以分析综合编写而成的概括性文献。,零次信息,指未正式发表或未进入社会交流的最原始的文献,3、按使用级别,第一篇信息检索概述,一次信息二次信息 三次信息 原始创作:是以作者本人的工作经验,第一篇信息检索概述,第一篇信息检索概述,4、网络信息资源,“通过计算机网络可以利用的各种信息资源的总和”,网络中存在着大量的生物学和医药学信息资源,它连接着世界上许多著名的医学研究机构、医科大学和医院,成为一个集生物医学信息资源为一体的数据资源网,在数量、结构、分布和传播的范围、载体形态、内涵和传递手段等方面都显示出了新的特点,第一篇信息检索概述,4、网络信息资源“通过计算机网络可以利用的各种信息资源的总和,网络资源特点,数量巨大,增长迅速,内容丰富,形式多样,时效性强,变化迅速,交互性好,可以共享,分布广泛,无序化,信息冗余,缺乏管理,商业性强,多数收费,第一篇信息检索概述,网络资源特点 数量巨大,增长迅速第一篇信息检索概述,五、文献检索效果评价,1.查全率与查准率的概念,查全率,是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。,查全率R,100%,漏检率 O,100%,第一篇信息检索概述,五、文献检索效果评价 第一篇信息检索概述,查准率,是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。,查准率P,100%,误检率N,100%,第一篇信息检索概述,查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总,检索效率的基本特性,如图所示:,P高则R底;R高则P底,要取得较好的检索效果应兼顾二者,一般,,查全率为:6070,查准率为:4050,R,P,0,第一篇信息检索概述,检索效率的基本特性RP0第一篇信息检索概述,2.影响检索效果的因素,(1)影响查全率的因素,文献库收录文献不全;,索引词汇缺乏控制和专指性;,词表结构不完整;,词间关系模糊或不正确;,标引不详或标引前后不一致;,标引人员遗漏了原文的重要概念或用词,不当等。,第一篇信息检索概述,从文献存储来看,主要有,2.影响检索效果的因素 第一篇信息检索概述从文献存储来,检索策略过于简单;,选词和进行逻辑组配不当;,检索途径和方法太少;,检索人员业务不熟练和缺乏耐心;,检索系统不具备截词功能和反馈功,能,检索时不能全面地描述检索,要求等。,第一篇信息检索概述,从情报检索来看,主要有,检索策略过于简单;第一篇信息检索概述从情报检索来看,,(2)影响查准率的因素,索引词不能准确描述文献主题和检索要求;,组配规则不严密;,选词及词间关系不正确;,标引过于详尽;,组配错误;,检索时所用检索词(或检索式)专指度不够,,检索面宽于检索要求;,检索系统不具备逻辑“非”功能和反馈功能;检索式中允许容纳的词数量有限;,截词部位不当,检索式中使用逻辑“或”不当,第一篇信息检索概述,(2)影响查准率的因素 第一篇信息检索概述,一、信息与知识,第二章信息与知识、情报、文献,1.信息 information,信息指物质存在或运动方式与状态的表现形式或反映,是现实世界事物的反映,它提供了客观世界事物的消息、知识,是事物的一种普遍属性。,2.知识 knowledge,是人们对自然界、人类社会中各种信息进行分析、加工提炼,并且加以系统和深化而形成的信息集合。,知识就是信息,是信息的高级形态。,一、信息与知识第二章信息与知识、情报、文献1.信息 inf,第二章信息与知识、情报、文献,二、信息与情报(Information),1、情报的概念,情报是指用不同的方法和手段,在有效的时间内所获得的有针对性和有价值的知识。,西方:情报和信息是同一个词 Information,我国:情报是一种信息,但信息不是情报。要将信息变成情报一般要经过选择、统计分析和加工整理的过程,情报的概念范围要比信息窄一些。,2、情报的特点,知识性、传递性、效用性。,第二章信息与知识、情报、文献二、信息与情报(Informa,第二章信息与知识、情报、文献,三、信息与文献(Document),1、文献的概念,文献是指以文字、图像、公式、声频、视频、代码等手段将信息、知识记录或描述在一定的物质载体上,并能起到存储和传播信息情报和知识作用的一切载体。,文献三要素:内容上的知识或信息、揭示和表达知识信息的标识符号、记录信息符号的物质载体。,国家标准GB-3469-83文献类型与文献载体代码中定义:,文献是记录有知识的一切载体(甲骨、纸本、光盘),第二章信息与知识、情报、文献三、信息与文献(Docum,2、现代文献的发展趋势 P27,数量庞大,增长速度快,出版类型复杂多样,文种繁多,内容交叉重复,文献发表分散,新陈代谢频繁,文献老化加快,文献交流传播迅速,文献发表时滞严重,文献日益向数字化、电子化、多媒体化、缩微化发展,第二章信息与知识、情报、文献,2、现代文献的发展趋势 P27 数量庞大,增长速度快第二章,四、信息与知识、情报、文献的关系,情报是一种信息,但信息不是情报,文献是信息的内核和载体,事物,产生,信息,大脑加工,知识,记录,文献,信息,知识,文献,情报,第二章信息与知识、情报、文献,四、信息与知识、情报、文献的关系情报是一种信息,但信息不是情,第三章信息检索原理,一、信息检索,信息检索是信息传播过程中的一个重要环节,是指从信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。,广义的说包括,信息存储,和,信息检索,两个过程,而实施信息检索的主要方法就是利用各种检索系统。即信息检索的基本原理就是检索者的,检索提问词,与存储与检索系统中的,检索标引词,进行匹配对比、取得一致,即为检索命中,命中结果可以从检索中以各种方式输出。检索者可据此线索对原文进行判断、筛选,以获取自己所需要的信息。,第三章信息检索原理 一、信息检索,1、信息存储过程,第三章信息检索原理,信息的搜集与选择,信息的著录加工,信息的标引加工,信息的结构编排,目的是把一篇文献变成一条著录,一条著录必须能体现文献的外表特征和内容特征。,把文献的主要内容用非常简明的标识(即标志)表示出来。标识可以是号码(分类号),也可以是其它的。,信息的排列顺序,1、信息存储过程第三章信息检索原理信息的搜集与选择信息的,图书著录,馆 藏 号:4418391,文摘类型:R,ISBN号:92-828-556-S,语种:Ger,中图类号:TD94,文献题名:NMRSpekeropie zur stofflichen Charakter is ierung von Braunkohlen bei der hydrierenden Veredlung,作者:Michel,D,团体作者:European Commission,国别:BE,缩称:CEC,出版日期:1999,页:164S,第三章信息检索原理,图书著录馆 藏 号:4418391第三章信息检索原理,期刊著录,记录标识:9807001,记录来源:JX,文献类型:刊,文献题名:机械零件组成编码频率分析及设计规范化通用标准化,作者:鲍子强,作者单位:长沙重型机器厂,母体文献:矿山机械,卷期页码:1997,No.12,p.3942,出版单位:洛阳矿山机械研究所,分 类 号:97*TD-3*12,主 题 词:标准化,成组技术,机械零件,设计,文摘:(略),第三章信息检索原理,期刊著录记录标识:9807001第三章信息检索原理,专利著录,发明名称:蓖麻脱皮筛选机,范畴:B07B 1/20,范畴分类:27F 33A 13A,国别:,省市:12,申 请 人:刘国喜,通讯地址:(300011)天津市河西区三水南里126幢,发 明 人:刘国喜,代 理 人:闫俊芬,代理机构:12100 天津市专利事务所专利代理服务部,代理机构地址:(300051)天津市和平区成都道116号,法律状态:授权,说明书页数:003,附图页数:02,权 项 数:003,文摘:(略),第三章信息检索原理,专利著录发明名称:蓖麻脱皮筛选机第三章信息检索原理,会议文献著录,论文题名:从更宽阔的视野观察与思考冶金反应工程学问题,作者:曲英:北京科技大学,李士琦:北京科技大学,会议名称:第七届全国冶金反应工程学术会议,会议届次:7,会议时间:19980515,会议地点:沈阳,会议主办者:东北大学,母体文献:东北大学学报(自然科学版)(第19卷增刊),出 版 地:沈阳,出版单位:东北大学学报编辑部,出版时间:19980500,页码:13,馆 藏 号:H043339,分 类 号:TF01,N94,关 键 词:反映工程,,冶金,,系统工程,可持续发展,文摘:(略),第三章信息检索原理,会议文献著录论文题名:从更宽阔的视野观察与思考冶金反应工程,标准文献著录,标 准 号:GB/T 1990.2-98,发布日期:1998-11-13,标准状态:ST,实施日期:1999-05-01,起草单位:中国标准化与信息分类编码研究所,标准名称:
展开阅读全文