信息获取与信息检索教材课件

上传人:无*** 文档编号:241102699 上传时间:2024-05-31 格式:PPT 页数:44 大小:2.96MB
返回 下载 相关 举报
信息获取与信息检索教材课件_第1页
第1页 / 共44页
信息获取与信息检索教材课件_第2页
第2页 / 共44页
信息获取与信息检索教材课件_第3页
第3页 / 共44页
点击查看更多>>
资源描述
第二讲 信息获取与信息检索 信息获取 信息检索原理 信息检索途径 一、信息获取一、信息获取 1 1信息获取的概念信息获取的概念 人们为得到所需信息进行的各种活动与过人们为得到所需信息进行的各种活动与过程程。要求:(1)准确性原则。获取信息的准确性;(2)时效性原则。最少时间、最快速度;(3)连贯性原则。全面、完整;(4)开拓性原则。捕捉信息、注重信息之间的关联,开发信息。2信息获取方式信息获取方式 信息获取方式:人们获取信息的方法与形式人们获取信息的方法与形式。人类的社会活动形形色色,获取信息的方式也千差万别。一个招聘的故事:上网、114、户外广告牌、图书馆。(1)从交流渠道看信息交流主要有正式交流和非正式交流两种方式。从正式交流渠道获取。通过出版发行系统、图书馆系统、情报(信息)所系统、档案馆系统等信息机构获取信息。通过购买,或通过信息检索、咨询、外借、阅览、复制等方法获得。常设机构,保障度高。从非正式交流渠道获取。由信息创造者与信息接收者双方直接完成的交流。直接对话、会议、参观、访问、演讲、书信、信息发布会等。随机性强,保障度低。(2)从公开程度看非常手段获取。采用隐蔽的、异常的方式获取信息。窃听、窃取、策反、侦察、网络黑客等。女艾中国历史上有文字记载的第一个间谍。太康、后羿、寒浞、浇(ao)与殪(yi)、相、少康、女艾 开始用于军事信息、政治信息,现对于经济信息、科技信息的收集的使用也日趋增加。德国就有50000多名职业经济间谍,再如日本一些大的企业,外派经济间谍往往超过千人。正常手段获取。采用公开的、合法的方式获取信息。利用报纸、广播、电视、购买、交换等方式。英国人雅各布摘抄德国报纸、小册子、德军的编制结构、160多名部队指挥官的姓名简历、希特勒追查(3)从信息载体看网络检索法。在高速信息网中获取信息、传递信息的方法。因特网已成为世界上最大的信息宝库,它是全球范围内传播和交流科研信息、教育信息、文化信息、商业信息、政府信息以及消闲娱乐信息的重要渠道。报刊阅读法。通过对报刊的摘录获取所需信息。如通过阅读中国物价、价格理论与实践等报刊,能了解到价格管理体制改革、以及全国物价总水平变动等方面的信息。广播收听法。是指通过收听广播获得所需信息的方法。每一个广播电台都能够提供很多有价值的信息,只要我们做一个有心人,就可以通过收听广播获得大量信息。电视收看法。是指通过收看电视获取信息的方法。通过中央电视台、各省电视台以及各市电视台的新闻节目,可以收集到很多政治、经济、科技、文化、教育方面的信息。电信接收法。电信接收法是指通过电话、电报获取信息的方法。电话、电报是两条很重要的信息传递通道。电脑显示法。很多信息都储存在数据库中,如果我们想查询有关信息,只要敲一下键盘,显示器上就可显示出来。对面交谈法。面对面交谈法是指通过两个人或多个人的交谈获取信息的方法。信息咨询法。通过向咨询公司询问、通过通信询问来收集信息。文件研究法。从文件中寻找所需信息的方法。如通过对国外有关文件的研究,可以了解有关国家的政治、经济、科技、军事、文体、教卫等多方面的信息。工具检索法。利用各种检索工具、参考工具、资料工具、边缘工具等获取有关信息。(4)从获取形式看会议获取法。出席各类会议可以获得有关信息,如学术讨论会、经济交流会、技术鉴定会、产品展销会、选样会、订货会、交易会、展览会、计划会、信息发布会、科技交流会、外贸会等。行业获取法。从中央各部委到各省、市、自治区,一直到各企业,都成立了有关的行业组织机构,在横向上和纵向上进行联合,组成了各类信息网络。现场调查法。是指派专人深入第一线,直接对信息进行收集。通过参观访问或现场考察,能直接了解研究单位、生产单位或经销单位的具体情况,对有价值的新产品、新设备、新工艺、新方法等,除了文字记录外,还可以拍摄照片、录像或录音。资料索得法。对相关文献资料的获得是掌握信息的有效方法。如:直接索取,直接向生产者或编撰者索取产品目录、商业广告等;互赠互换,用自己的文献与他人交换 公关获取法。利用公共关系可获得一些有用的信息。如:参加社交,通过各种“沙龙”、庆典活动获得信息;利用机构团体,通过上级部门、科研单位、高等院校、各种学术团体和社会团体。委托搜集法,可委托有关单位和人员帮助搜集,如咨询服务单位、出版发行单位,以及营销人员、个人的亲戚朋友、同事、上级或部下等。定点搜集法。是指聘请信息收集员进行定点信息收集的方法。如可在每一大、中城市中聘请一位信息收集员,随时向信息中心报告所掌握的各种信息。有偿购买法。是指从有偿信息服务机构购买信息的方法。如:国家经委的中国经济信息中心、国家旅游局的中国旅游信息中心,可以购买到所需要的信息。数据核算法。是指利用会计和统计的方法加工、核算出新信息。比如我国工业产值在国民经济总产值中的比例信息,就要通过会统核算方法进行等。兵与灶预测分析法。是指用预测的方法来估算未来事物发展变化信息的方法。主要有经验判断法、典型调查法、专家综合分析法、数学模型法等等。日本获取大庆油田的秘密。二、信息检索原理1信息检索的概念信息检索的概念 信息利用的关键在于信息获取,而信息获取的核心则是信息检索。信息检索,是指从从有有序序的的信信息息资资源中查寻所需信息的过程源中查寻所需信息的过程。广义的信息检索包括存贮与查询。(1)存贮过程)存贮过程 把大量杂乱无序的信息加以科学地组织,形成一个信息集合体。选材:从信息资源中选择一定范围和水平的信息。分析:对被选定的信息素材的内容主题及其它有检索意义的特征进行分析。浓缩:用有效形式对信息的内容及物质形态的特征进行记录,以形成条目、单元。标识:为条目、单元赋予检索标识。排序:对条目、单元进行有序地排列,使之成为一个能随时存取的检索系统。(2)查询过程 存贮的逆过程,即从已经组织好的信息集合体中查检和索取出所需的信息。定题:信息用户将自己的信息需求加以明确化。择库:选择符合信息需求的检索工具、网站或数据库。提问:形成检索提问,对检索提问进行概念分析并用检索系统所用词表中的词加以表达。查询:有次序地在检索系统中查寻同检索词相一致的检索标识,实质上是信息用户的检索提问与检索系统中的检索标识相匹配而决定取舍的过程。索取:对检索结果进行筛选,或获得原始信息。2信息检索的类型(1)书目检索。以文献线索为检索内容。检索系统存贮的是书目、索引、文摘等“二次文献”,它们是文献的外表特征与内容特征的描述,是文献的“替代物”。检索获得的是与检索课题有关的一系列文献线索,然后再通过阅读决定取舍。(2)数据检索。以数值为检索内容。检索系统存贮的是大量的数据,包括物质熔点、电话号码、统计数据等数字数据,也包括图表、化合物分子式和结构式等非数字数据,并提供一定的运算推导能力。这些数据是经过专家测试、评价、筛选过的,信息用户可直接用来进行定量分析。(3)事实检索。以事项为检索内容的信息检索。检索系统存贮的是从原始文献中抽取的事实,并有简单的逻辑判断能力。检索获得的是有关某一事物的具体答案。如检索机构、产品、广告等。(4)全文检索。检索系统存贮的整篇文章乃至整本图书的全部文本,可检索出整篇文章,或检索出有关的句、段、节、章等文字,并能进行各种频率统计和内容分析。(5)音像检索。以声音和图像为检索内容的信息检索。例如利用因特网可以实现超文本和多媒体形式的网络信息检索,可检索一张图片、一段影像、音乐。3信息检索系统(1)信息检索系统的概念简称检索系统,是指拥有一定的存贮、检索技术设备,存贮有经过加工的信息,并能为信息用户提供所需信息的一种工作系统。信息检索系统是信息检索过程中的中枢,功能:吸收信息 加工信息 存贮信息 检索信息信息检索系统一般分为以下类型:(1)手工检索系统。指完全依靠人工操作方式检索信息的工具或设施,如卡片式或书本式的目录、索引、文摘、参考工具书以及手工穿孔卡片等。(2)计算机检索系统。把信息存贮在计算机存贮设备(如磁带、磁盘、磁鼓等)上,再利用计算机根据程序进行检索。人们习惯将计算机检索系统称为“检索系统”,将手工检索系统称为“检索工具”。包括单机检索系统、联机检索系统、网络检索系统、光盘检索系统。(2)信息检索系统的评价)信息检索系统的评价查全率:检索系统在进行某一课题检索时,检出的相关文献量与系统数据库中相关文献总量的比率。假设该系统总共存入和该课题相关的文献30篇,检索时查出了其中的18篇,这次检索的查全率就等于18/30100%=60%。查全率是用来描述检索系统检出相关文献能力的一种尺度。查准率:检索系统在进行某一课题检索时,检出的相关文献量与检出文献总量的比率。假定上面提到的那次检索总共查出36篇文献,经审查确定其中18篇是相关的,而另外18篇与该课题无关。这样,这次检索的查准率就等于18/36100%=50%。查准率是用来描述检索系统拒绝不相关文献能力或检索精确度的一种尺度。收录范围:是指检索系统数据库覆盖的学科范围、信息类型、数量和时间跨度。数据库的收录范围全面,才能保证真正的查全,可以把收录范围看作是查全率的延伸。响应时间:在委托检索中,它表示从送交提问到收到检索结果所需的时间。用户负担:是指用户在检索过程中花费的精力的总和。输出形式:检索系统检出的信息的形式,可能是文献号、题录、文摘或全文等。输出的信息越多并且便于浏览,用户就越容易做出相关性判断。三、信息检索途径人们检索信息,都是以信息的某一特征作为出发点,从一定的途径进行的。以文献为例,文献的内容特征和外表特征都可以成为检索的出发点。1分类途径分类途径,是根据信息的内容类别进行检索的途径。要熟悉检索系统所采用的分类法。分类法又叫分类表。要顺利地判断自己所研究的课题、所需要的信息的分类归属,按检索工具所采用分类体系的部类、大类、小类、子目、细目逐级查找,层层区别,直至适宜为止。文献分类北京图书馆国外博士学位论文目录(19821992)20类网络分类“新浪网分类”30多个频道2 2主题途径主题途径主题途径,是根据信息内容的主题特征进行检索的途径。表示信息主体所论述和研究的事物或问题的概念叫做主题。用以表达信息主体主题概念的词叫做主题词。主题词表是把主题词按照一定方式组织的集中性词汇表 主题途径又分为:v标题途径:规范化v单元词途径:组配v叙词途径:规范化、组配v关键词途径:自由词3文献名称途径文献名称途径,根据文献外表的名称特征进行检索。如:书名目录或索引、刊名目录或索引、篇名目录。文献来源索引:介绍该工具摘录的刊物名称、出版情况及价格等情况的一览表。4责任者途径责任者途径,根据信息主体责任者的名称特征进行检索。“责任者”不仅指作者、译者、编者,还包括专利发明人、专利权受让者、研究合同户、会议召集单位等,既有个人责任者,又有团体责任者。5代码途径代码途径,是根据信息单元的序号或代号检索信息的途径。许多类型的文献往往都有唯一性序号,例如专利号、报告号、合同号、标准号、国际标准书号(ISBN)、国际标准连续出版物编号(ISSN)等;在某些学科或专业文献中,也有一些特殊的代号,如化学化工方面的分子式、化学物质登记号、韦氏线型代码、拓扑代码等。6引文途径引文途径:根据文献所附参考或引用文献的特征进行检索的途径。论文写作需参考有关文章,或作为理论根据,或作为比较对象,或取其数据,或对某一课题作历史的回顾。一是根据某一文献末尾所附参考文献进行追溯。二是利用引文索引。7时序途径时序途径是根据时间顺序检索文献的途径。多用于一些时间概念较强领域的工具书中,如按发表时间先后编排的论文索引、大事记、年表等。8地序途径 地序途径是根据自然区域或行政区划的顺序检索文献的途径。多用于一些地理因素较强的参考工具书中,如地图集、地名录、地理沿革表等,它有行政区划排列法和地名字顺排列法两种情况。9字顺途径根据文字的读音和形体特点排列检索信息的途径。音序途径(汉语 拼 音 法、注音字母法).形序途径(部首法、笔画笔形法、号码法)。10特殊途径为适应某些专业的需要或某些信息的特点编制有专用索引。专用索引的标目往往是某些专业的专用名词术语。例如:生物学方面的生物分类索引、属类索引、动物名称索引等;商业贸易方面的商品名索引、产品名索引等;其它方面有世界名人索引、药名索引、矿物索引等等。思考题1什么是信息获取?它有哪些要求和形式?2什么是信息检索?它有哪些过程和类型?3评价信息检索系统有哪些主要标准?4信息检索途径有哪些?哪些是以内容特征为基础的,哪些是以外表特征为基础的?5 请总结自己比较熟悉的获取信息的方式。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!