资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章 信息检索概述,第二章 信息检索概述,1,一 信息与信息源,1、信息,信息的含义:信息原指消息的传递,现指应用文字、数据或信号等形式通过一定的传递和处理,来表现各种相互联系的客观事物在运动中所具有的特征性内容的总称。信息不是指事物本身,而是事物存在的方式和运动状态的表现形式,是客观事物经过感知或认识后的再现。,一 信息与信息源 1、信息,2,信息的特征,客观性:,信息不是虚无飘渺的事物,它的存在可以被人们感知、获取、传递和利用,依附性:,信息必须依附于一定的载体(如声波、纸张、化学材料、磁性材料等)才能流通和传递。,可传递性,:不同载体的信息可以通过计算机、人际交流、文献交流或大众传媒等手段传递给信息用户,最大化的利用信息,可塑性:,信息在流通和使用过程中,人们借助于先进的技术,可以对其进行综合、分析及加工处理,时效性:,由于事物是在不断变化着的,因此表征事物存在方式和运动状态的信息也必然会随之改变,共享性:,信息可以多次传播,不失其内容,与实物交易不同。,第二章-信息检索概述课件,3,信息 知识 情报与文献,知识:人类在改造世界的过程中所获得的认识和经验的总和。,信息被人类所感知并被提炼加工即成为知识。,知识是信息升华的结果,是一种浓缩的系统化的信息。,信息是知识的基础,知识是信息的核心。,信息 知识 情报与文献,4,情报,:是人们在一定时间内为一定目的而传递的有使用价值的知识或信息,它有明确的接受对象,属于人工知识或信息的范畴,它来源于信息与知识,是激活了的知识、动态的信息。,文献,:是记录知识或信息的一切载体。即用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体。实际上文献是由知识内容、信息符号和载体材料三个不可分割的基本要素构成。知识是文献的实质内容,符号、文字、声音是人体感觉信息的媒介,载体是文献的外在形式。,情报:是人们在一定时间内为一定目的而传递的有使用价值的知识或,5,它们之间的逻辑关系和范畴关系,它们之间的逻辑关系和范畴关系,6,思考题,偶尔从别人那里听到一个未经证实的事,是不是信息?为什么?,农谚是直接关系农业的耕种、收获和其他农事的谚语,它们是长期以来劳动人民农业生产知识、经验的总结。下面看几条有关气象的农谚:,朝霞不出门,晚霞走千里/蜘蛛结网,雨必晴;蚂蚁搬家,雨必下/天上钩钩云,地下雨淋淋/天上鲤鱼斑,明天晒谷不用翻/云往东,刮阵风;云往西,披蓑衣,指出每一条谚语中,哪些是信息,哪些是知识?从中可以得到什么启示?,思考题偶尔从别人那里听到一个未经证实的事,是不是信息?为什么,7,2、信息源,文献信息源(具体内容见第三章),有信息价值,被人为记录和保存,能够被传播,接收端可以反复重现其内容,非文献信息源,有信息价值但不具有或并不明显具有其他要素特征。强调是通过人的感官获取的实时信息,或者说第一手的知识信息。,2、信息源文献信息源(具体内容见第三章),8,非文献信息源可分为实物信息、口头信息和实情信息,实物信息,就是现实存在的物化了的各种物质形态的信息。包括实物、样品或展览会的展品。,口头信息,是指存在于人脑记忆中,通过交谈、谈论、报告等方式交流传播的信息,非文献信息源可分为实物信息、口头信息和实情信息,9,实情信息,是现实存在的自然现象和社会现象的信息。它的表现形式不是实物,而是自然现象或者社会现象的状态及其发展过程。,自然现象(气候、水文、物理、化学、生物等的演进和反应的状态和过程),社会现象(政治法律事务、军事行动、企业、商业和事业机构运行状态、工程现象、演出现场、经济交易的实时交互过程、人机运动过程等),实情信息是现实存在的自然现象和社会现象的信息。它的表现形式不,10,思考题,以下词条可代表不同类型的信息源,请按文献信息源和非文献信息源为他们分类,汽车、敦煌石窟、四库全书、一年内的天气变化数据、上市公司年报、经济新闻、地震仪测得的数据、图书缩微胶片、甲骨文、古时候的陶片、记录片、古籍,我国气象专家根据多种信息,预测出2008年可能出现像1998年那样的大洪水,结果该年自6月中旬以来,浙江、福建、江西、湖南、广东、广西等地部分地区遭受强暴雨袭击,造成严重洪涝、山体滑坡和泥石流灾害,预言变成现实。请问专家预测可能会用到哪些信息?分别属于什么信息类型?,思考题以下词条可代表不同类型的信息源,请按文献信息源和非文献,11,“信息分析与预测”是竞争情报领域一项很重要的手段。例如:通过检索竞争对手在某一技术领域的专利申请,并对其信息内容进行深入分析,便可以判断出竞争对手的R&D(研究与发展)方向、经营策略、产品和技术优势。请问专利属于什么类型的信息源?为什么可以通过搜集和分析所掌握的信息预测出竞争对手的发展状态和趋势?,“信息分析与预测”是竞争情报领域一项很重要的手段。例如:通过,12,案例分析:,为了在极短的时间内尽快开发出一系列驰骋全球的名牌摩托车产品,1968年日本集中了全国各摩托车修理厂200名具有丰富专业知识和研究能力的工程技术人员和情报人员,分成12个小组,用了一年的时间,走遍世界上所有重要的摩托车生产厂家,对世界摩托车工业进行了有史以来最广泛的全球性调查。在订货、帮助建厂的幌子下,他们搜集了大量的信息,并带回170多部样机。他们每种样机购回两部,一部解剖,一部做运行试验,并结合搜集到的信息,对全部厂家各种型号的摩托车及其零部件的质量、优缺点等进行比较、分析和综合,博采众家之长,最后设计出一种轻便耐用、性能优良、价格便宜的摩托车,并迅速占领国内市场。,案例分析:,13,1)通过以上案例你得到什么启示?,2)例子中日本从世界各地带回来的摩托车是否属于信息?如果不是请说明理由,如果是请说明属于什么类型的信息?,3)如果你是试验小组成员,除了摩托车你还会搜集哪些信息?为什么?,1)通过以上案例你得到什么启示?,14,3、信息社会的基本内容:3I、3C、3A、3R,3I,:Information(信息)、Intelligence(智能)、Integration(集成、综合),3C,:Computer(计算机)、Communication(通讯)、Control(控制),3A,:Factory Automation(工厂自动化)、Office Automation(办公自动化)Home Automation(家庭自动化),3R,:Material Revolution(材料革命)、Energy Revolution(能源革命)、Information Revolution(信息革命),3、信息社会的基本内容:3I、3C、3A、3R3I:In,15,二、信息检索的基本内容,1、概念:,1)信息检索(information retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。所以,它的全称又叫信息存储与检索(information storage and retrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。相当于我们所说的信息查询(information search)。,二、信息检索的基本内容1、概念:,16,2)检索语言:检索语言是把信息的存储与检索联系起来,把标引人员与用户联系起来,以便取得共同的理解、实现交流的语言。有人工语言(主题语言和分类语言)、自然语言之分。(第三章详细介绍)3)检索方法:常用法、追溯法和循环法(第四章详细介绍),2)检索语言:检索语言是把信息的存储与检索联系起来,把标引人,17,检索词、检索式、检索策略,(第四章详细介绍)检索词是用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录。检索式也称检索提问式,是要求系统执行的检索语句。简单的检索式由一个检索词和一个字段名构成,复杂的检索式由多个检索词和字段名通过关系算符连接而成。如:要利用英文搜索引擎查找网络信息检索方面的资料,检索式为(Web OR Internet OR WWW)AND(Search*OR Retrieval*)。,检索词、检索式、检索策略(第四章详细介绍)检,18,检索策略:,所谓检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、学科领域、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。也就是为满足信息需求所制定的一系列检索方案。,检索策略:所谓检索策略,就是在分析课题内容,19,5)检中结果、查全率、查准率(第四章详细介绍)检中结果又称检索结果集,是数据库中满足(检索式(即符合检索条件)的那些记录的集合查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例,5)检中结果、查全率、查准率(第四章详细介绍)检中结果又称,20,2、信息检索的类型,:,(1)根据检索手段的不同,分为手工检索、计算机检索(光盘检索、联机检索和网络检索)(2)根据检索对象、形式的不同,分为文献型信息检索、数据型信息检索、事实型信息检索。,2、信息检索的类型:(1)根据检索手段的不同,分为手工检索,21,文献型信息检索(Document Retrieval),:以文献(包括题录、文摘)为检索,对象,的检索。凡是查找某一主题、时代、地区、著者、文种的有关文献,以及回答这些文献的出处和收藏处所等,都属于文献型信息检索的范畴。完成文献型信息检索主要借助于各种书目型数据库。,文献型信息检索(Document Retrie,22,数据型信息检索(Data Retrieval),:以数值或数据为对象的一种检索,包括文献中的某一数据、公式、图表,以及某一物质的化学分子式等,数据检索分为数值型与非数值型。完成数据型信息检索主要借助于各种数值数据库和统计数据库。,数据型信息检索(Data Retrieval):以数值或数据,23,事实型信息检索(Fact Retrieval),:以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索,其检索结果主要是客观事实或为说明事实而提供的相关资料。如:,2001,年,7,月通过的奥运会主办城市的结果与过程。完成事实型信息检索主要借助于各种指南数据库和全文数据库。,事实型信息检索(Fact Retrieval):以某一客观事,24,3、信息检索的发展历程,3.1,基本方向,:手工检索向计算机检索(如穿孔、缩微、自动化)发展,但是手工检索与计算机检索将长期并存。因为计算机检索有其缺陷:(1)硬件条件不足:没有计算机,不能上网,(2)数据库不完善,(3)网络慢或网络故障等等。,3、信息检索的发展历程3.1基本方向:手工检索向计算机,25,3.2,计算机信息检索的的产生和发展,分为五个阶段:,(1),脱机批处理检索,:1954一64。定期由专职检索人员把许多用户课题汇总,批量处理提问要求,并把结果提供给用户。直接在计算机旁检索,不需要远程终端设备及通信网络。用户在计算机处理成批检索课题之后才知道检索结果,不能直接、及时修改检索策略,查全率和查准率受到一定限制。,3.2计算机信息检索的的产生和发展,分为五个阶段:(,26,(,2)联机情报检索,:,20世纪70年代投入商业运营。用户在计算机检索系统的终端上,通过通信网络,使用特定的指令和算符,以人机对话方式,查询远程计算机检索系统核心的数据库,从中获取所需信息的计算机检索系统。,第二章-信息检索概述课件,27,联机检索系统由三个部分组成,:主机系统、通讯系统和终端设备,主机系统,是联机检索系统的核心,它具备处理速度快、多道程序和分时功能,内存容量大,多样化的输入输出设备。,通讯系统,是指终端设备与主机系统进行通信的设备。通信线路分为两种:专用的直达线路;通过拨号选择对方的交换线路。前者是特定通信线路,后者使用电话网和用户电报网,联机系统使用的通信线路就属于后一种。,终端系统,是
展开阅读全文