研究生信息检索第一章.ppt

上传人:max****ui 文档编号:6250007 上传时间:2020-02-20 格式:PPT 页数:134 大小:4.16MB
返回 下载 相关 举报
研究生信息检索第一章.ppt_第1页
第1页 / 共134页
研究生信息检索第一章.ppt_第2页
第2页 / 共134页
研究生信息检索第一章.ppt_第3页
第3页 / 共134页
点击查看更多>>
资源描述
信息检索 开课学期 2010 2011 1任课教师 钟云志电话 13088991106Email zyz2000 实验地点 图书馆实验报告及相关材料存放地址 检索什么到哪里去检索使用什么检索如何检索 第一章绪论 一 信息的含义二 科研的基本步骤三 信息检索的含义四 信息源及信息的组织 一 信息的含义 为什么检索信息 消除事物的不确定性与信息类似的词汇 文献 情报 资料 资讯等 二 科研的基本步骤 选题查阅资料 研究设计和制定研究计划收集和整理资料 开展研究撰写研究报告 三 信息检索的定义 信息存贮 组织 信息查找进行信息检索的前提 检索提问 检索课题信息检索类型 检索什么 确定性检索相关性检索信息检索工具 信息检索系统 使用什么检索 信息检索系统的物理结构硬件部分 主机 存贮器 输入输出设备 数据处理或数据输出有关的其他设备 软件部分 系统软件 操作系统 语言处理程序 数据库管理程序 诊断程序等应用软件 数据采集程序 自动标引程序 建库与索引程序 词汇管理程序 检索匹配程序 用户接口程序等信息资源集合 信息检索系统的基本逻辑结构 四 信息源及信息的组织 个人为满足其信息需要而获得信息的来源 称为 信息源 文献信息源非文献信息源 电子信息源纸本信息源其他信息源 一次信息源二次信息源三次信息源 文献的类型及识别什么是信息组织信息组织的基本内容图书馆的信息组织信息组织的两大思想 文献的类型及识别 按照其性质 特点和出版方式可分为 图书 期刊 特种文献 包括科技报告 会议文献 专利文献 学位论文 标准文献等 按文献的载体形式可分为 印刷型文献 纸本文献 缩微型文献 声像型文献 机读型文献 电子型文献 按文献加工程度 文献等级结构 一次文献 二次文献 三次文献 图书ISBN978 7 5083 6266 3期刊ISSN 1001 019X核心期刊 中文核心期刊要目总览 2008版 文献标识码是按照 中国学术期刊 光盘版 检索与评价数据规范 规定的分类码 其作用在于对文章按其内容进行归类 以便于文献的统计 期刊评价 确定文献的检索范围 具体如下 A 理论与应用研究学术论文 包括综述报告 B 实用性技术成果报告 科技 理论学习与社会实践总结 社科 C 业务指导与技术管理性文章 包括领导讲话 特约评论等 D 一般动态性信息 通讯 报道 会议活动 专访等 E 文件 资料 包括历史资料 统计资料 机构 人物 书刊 知识介绍等 参考文献著录中的文献类别代码 专著 M会议录 C汇编 G报纸 N期刊 J学位论文 D报告 R标准 S专利 P数据库 DB计算机程序 CP电子公告 EB专著 论文集中的析出文献用单字 A 标识 其他未说明的文献类型 用单字 Z 标识 文后参考文献著录规则 GB T7714 2005 学位论文 dissertation thesis 会议文献 conference Proceedings 标准文献专利文献其他 什么是信息组织 信息组织 也叫信息整序 是利用一定的规则 方法和技术对信息的外部特征和内容特征进行揭示和描述 并按给定的参数和序列公式排列 使信息从无序集合转换为有序集合的过程 外部特征 信息的物理载体直接反映的信息对象 构成信息的外在的 形式的特征内部特征 信息包含的内容 由主题词 关键词或其它知识单元表达 信息描述和揭示根据信息组织和检索的需要 对信息的主题内容 形式特征 物质形态等进行分析和记录信息存储将经过加工整理序化后的信息按一定格式与顺序存储在特定的载体中 信息组织的基本内容 图书馆的信息组织 物理陈列 分类号 索书号 上架 更新 图书馆的信息组织 馆藏书目检索库题名 作者 出版时间 分类号 国际标准书号 索书号 主题词 信息组织的两大思想 分类方法根据信息的学科体系特征来序列信息的一种方法体系 如 中国图书馆分类法 UDC等主题方法根据文献主题特征来组织排列信息的一种方法 由受控的自然语言语词直接表达主题概念 应用分类法 Yahoo分类目录门户网站分类频道 分类搜索浏览主题法 百度 Google 搜索引擎 信息组织的两大思想 第二章网络学术信息检索的基本知识 第一节网络学术信息资源概述第二节网络学术资源检索原理和方法第三节信息检索的基本步骤 第一节网络学术信息资源概述 网络学术信息资源的特点网络学术资源的类型网络学术信息资源检索中几个基本术语网络学术资源的基本服务模式网络学术资源的合理使用 网络学术信息资源的特点 总体来说 正在形成由商业出版机构和非赢利学术出版机构开发生产的电子化文献为主 基于开放存取 OA 的理念出版的学术成果为辅的网络学术资源生产 交流与传播体系 具体来说 内容丰富 增长迅速 形式多样服务的主体 传统学术文献出版机构开放存取 从内容和学科来看 不同领域 地域 语言从媒体形式来看 文本 图片 音频 视频 三维虚拟影像结构复杂 格式多样分布式保存 集成化服务多种服务模式面向最终用户 网络学术资源的类型 书目型数据库文摘 索引数据库馆藏书目数据库 OPAC 全文数据库参考工具数据库其他资源 几个基本术语 网络信息资源检索中的几个基本术语DOI DOI是 DigitalObjectIdentifier 的简写 用来标识在数字环境中的内容对象 随着时间推移 数字对象的某些有关信息可能会有变化 包括从哪里可以找到它 但是DOI不会改变 DOI是一个永久性的标识号 由InternationalDOIFoundation管理 例如 doi 10 1016 j actao 2007 05 006SDOL SpringerLink等数据库中采用 http dx doi org SICI SICI SerialItemandContributionIdentifier 主要是用来配合ISSN 以辨识某一种期刊或该期刊的某一期或某一篇文章 SICIcode用于目前美国图书馆界在推动的馆际合作计划NAILDD计划 以及文献传递服务 除了SICIcode之外 美国出版界也有BICIcode BookItemandContributionIdentifier 用来辨识套书中的某一册及某一篇章 例如 0002 8231 199412 45 102 3 TX 2 MJSTOR数据库中采用 PMID PMID为PubMedIdentifier或PubMedUniqueIdentifier的缩写 形式为一组号码 用于指定PubMed生命科学 lifescience 生物医学 biomedicalscientific 每一篇期刊文章 例如 PMID 15258113PUBMED数据库中采用 参考文献链接系统 CrossRefCrossRef是一个基于DOI实现文献引文跨出版社服务平台链接的参考链接服务系统 提供的链接服务可以从文献的参考文献链接到全文 一篇文献的引文 或参考文献 原文如果有网络版并注册了DOI 用户就可以利用引文中设置的CrossRef链接按钮直接链接到引文所在的出版社网页 获得引文文摘信息 如果图书馆从出版社订购了该网络版期刊 读者将可以由此打开引文全文 http www crossref org RSSRSS是基于XML技术的互联网内容发布和集成技术 是一种描述新闻或其他Web内容的方式 通过 Feed 将最新的信息即时主动推送到用户桌面 使用户不必直接访问网站就能得到更新的内容 网络学术资源的基本服务模式 商业学术资源的销售与访问控制模式个人用户 团体用户 主要采取图书馆共建共享方式订购网络学术资源 中国高等教育文献保障系统 CALIS ChinaAcademicLibrary InformationSystem 国外学术资源的四种服务方式建立国内镜像服务器租用国际网络专线购买电子资源裸数据直接通过因特网登录国外主站点进行访问 网络学术资源的合理使用 电子资源的许可协议合理使用的基本操作规则一般来说 不得使用任何软件 工具下载图书馆购买的电子资源 不得批量下载文献 也不得将所获得的文献提供给校外人员 更不允许利用获得的文献资料进行非法牟利 校内任何单位和个人 如设置相应的代理服务器 一定要事先得到图书馆允许 并且保证该服务器不得允许校园外IP通过它访问图书馆购买的电子资源 远程访问图书馆电子资源技术代理服务器EZproxyVPN VirtualPrivateNetwork Athens 代理服务器代理服务器受支持协议的限制 一些客户端服务器模式的电子资源如CA网络版SciFinder 无法通过代理服务器访问 EZproxy与普通代理服务器软件的主要区别 它采用 URL重写 技术 用户无需修改浏览器的设置就能实现代理访问资源的功能VPN VirtualPrivateNetwork 依靠ISP Intemet服务提供商 和其他NSP 网络服务提供商 在公用网络中建立专用的数据通信网络的技术 AthensAthens是英国高等教育部于1996年开始实施的一个用于网络数据库登录管理的项目 随后成为英国教育部门和卫生部门利用网络资源的事实标准 第二节网络资源检索原理和方法 网络资源检索基本概念基本检索技术检索结果的分析与管理 网络资源检索基本概念 检索字段与检索途径检索语言与主题词表检索方式在线帮助机制 检索字段与检索途径数据库中最小的数据单元为字段 fileld 包括文献题名 著者 文摘 来源出版物 关键词 主题词 全文等 检索字段或检索途径是用户检索时所选择的入口 这是两个相互呼应的概念 选择什么样的检索字段 即遵循了什么样的检索途径 基本检索字段 辅助检索字段基本检索字段 反映文献内容特征的字段 辅助检索字段 反映文献外表特征的字段 题名字段泛指文献名称 包括图书题名 期刊题名 论文篇名 会议文献篇名 学会论文篇名等 著者字段主题词字段文摘字段全部字段 检索语言与主题词表检索语言主题语言分类语言主题词表 中图法 马克思主义 列宁主义 毛泽东思想 邓小平理论A马克思主义 列宁主义 毛泽东思想 邓小平理论 哲学B哲学 宗教 社会科学C社会科学总论D政治 法律E军事F经济G文化 科学 教育 体育H语言 文字I文学J艺术K历史 地理 自然科学N自然科学总论O数理科学和化学P天文学 地球科学Q生物科学R医药 卫生S农业科学T工业技术U交通运输V航空 航天X环境科学 安全科学 综合性图书Z综合性图书 TB一般工业技术TD矿业工程TE石油 天然气工业TF冶金工业TG金属学与金属工艺TH机械 仪表工业TJ武器工业TK能源与动力工程TL原子能技术TM电工技术TN无线电电子学 电信技术TP自动化技术 计算机技术TQ化学工业TS轻工业 手工业TU建筑科学TV水利工程 0总类 科学和知识1哲学 心理学2宗教 神学3社会科学4 语言 5数学和自然科学6应用科学 医学 技术7艺术 娱乐 体育8语言 语言学 文学9地理 传记 历史 获取信息方式基本检索高级检索专业检索二次检索与检索历史限定检索范围浏览 CSA OVID EI ERIC netlibrary SpringerLink CNKI中国期刊全文数据库 SDOL 在线帮助机制特定上下文帮助在线用户手册资源内容介绍 基本检索技术 布尔逻辑算符位置算符截词算符限定字段检索检索式的编制检索结果的浏览与输出 布尔逻辑算符逻辑 或 和 用符号 or 或 表示 其逻辑表达式为 AorB或A B其意义为检索记录中凡含有检索词A或检索词B 或同时含有检索词A和B的 均为命中文献 逻辑 与 用符号 and 或 表示 其逻辑表达式为 A B或AandB其意义为检索记录中必须同时含有检索词A和B的文献 才算命中文献 逻辑 非 用符号 not 或 其逻辑表达式为 AnotB或A B其意义为 检索记录中含有检索词A 但不能含有检索词B的文献 才算命中文献 位置算符With 设定需检索的两个词或词组在同一字段中 但不限制位置的先后 Near 设定需检索的两个词或词组在同一语句中 相对于 with 更接近 此外 在使用 near 运算符时 还可以在该运算符后添加一个数字以便进一步限定两个词之间的邻近程度 如 near3 设定需检索的两个词或词组在同一句子中且相隔不超过3个单词 截词算符截词检索主要是利用检索词的词干或不完整的词形进行检索 截词符一般用 表示后方截词 用于前方一致的派生词检索 如 信息 则表示在数据库中含有信息 信息技术 信息检索等方面的文献记录均为命中文献 前方截词 用于后方一致的派生词检索 如 经济则数据库中含有经济 工业经济 农业经济等方面的文献均为命中文献 有限截词在检索词后面加上一个或一个以上的 空一格 再加一个 如 Comput 可检索出 Computer Computers Computing截词检索在不同的计算机检索系统中规定不同 请使用时注意 限定字段检索为了缩小检索范围 可利用字段代码来限制检索词出现的字段 以提高检索速度和命中率 如 riceinti 表示只在题目字段中查找文献 riceinab 只在文摘中查找 au Smith J C 查作者为Smith J C的文章 py 1998 只查1998年的文章 la Chinese 只查语种为中文的文献 检索式的编制确定合适的检索词检索词要求 准 而 全 检索词的来源 已有知识的积累 即熟悉要检索的课题 根据现有文献获得检索词构造检索式 检索历史的重复与检索式的调整缩窄检索条件使用更窄的检索词替代已经使用的检索词使用恰当的主题词代替自然语言词限定检索词出现在特定字段中and和not的使用其他条件的限定 如语言 出版日期 文献类型等放宽检索条件减少and组合的检索词的数量增加同义词的数量更多使用截词符去掉吗限定条件 如语言 日期等使用 全部字段 选项 数据库中检索历史重复与检索式调整的实现检索历史二次检索索引的浏览 检索结果的浏览与输出检索结果的显示与排序按相关性 Relevance 按日期 date 按作者姓名 AuthorA Z AuthorZ A 检索结果的输出下载 Download 存盘 Save 打印 Print 电子邮件 Email 标记 Mark Select Check 输出 Export 检索结果的分析与管理 检索效果的评价个人文献信息管理系统 检索效果的评价查全率与查准率 收录范围输出格式与方式链接的可靠性资源的更新频率系统辅助分析功能的使用如ISIWebofScience数据库的分析功能 AnalyzeResults 个人文献信息管理系统RefWorksEndNotesNoteExpressReferenceManager医学文献王 选择标准 系统能够支持多种文献类型的数据格式系统支持访问的联机检索系统的列表 以及导入数据的格式个关键信息字段 提供用户自行建立格式的功能支持从网络学术资源中转入检索结果支持学术期刊的引用及参考文献的著录格式支持中文文献管理 第三节信息检索的基本步骤 分析检索课题选择检索系统和数据库确定检索词构建检索提问式上机检索并调整检索策略输出检索结果 分析检索课题弄清用户信息需求的目的和意图 分析课题涉及的学科范围 主题要求 课题所需信息的内容及其特征 课题所需信息的类型 包括文献类型 年代范围 语种 著者 机构等 课题对查新 查准 查全的指标要求 选择系统和数据库数据库收录的信息内容所涉及的学科范围 数据库收录的文献类型 数量 时间范围以及更新周期 数据库所提供的检索途径 检索功能和服务方式 确定检索词先选用主题词 当所选的数据库具有规范化词表时 应优先选用该数据库词表中与检索课题相关的规范化主题词 从而可获得最佳的检索效果 选用数据库规定的代码 许多数据库的文档中使用各种代码来表示各种主题范畴 有很高的匹配性 选用常用的专业术语 在数据库没有专用的词表或词表中没有可选的词时 可以从一些已有的相关专业文献中选择常用的专业术语作为检索词 选用同义词与相关词 同义词 近义词 相关词 缩写词 词形变化等应尽量选全 以提高查全率 构建检索提问式使用逻辑 与 算符可以缩小命中范围 起到缩检的作用 得到的检索结果专指性强 查准率也就高 使用逻辑 或 算符可以扩大命中范围 得到更多的检索结果 起到扩检的作用 查全率也就高 使用 非 算符可以缩小命中范围 得到更切题的检索效果 也可以提高查准率 但是使用时要慎重 以免把一些相关信息漏掉 在构建检索提问式时 还要注意位置算符 截词符等的使用方法 及各个检索项的限定要求及输入次序等 上机检索并调整检索策略检索结果信息量过多原因可能有以下两点 一是主题词本身的多义性导致误检 二是对所选的检索词的截词截得太短 在这种情况下 就要考虑缩小检索范围 提高检索结果的查准率 检索结果信息量过少原因主要有 首先 选用了不规范的主题词或某些产品的俗称 商品名称作为检索词 其二 同义词 相关词 近义词没有运用全 其三 上位概念或下位概念没有完整运用 针对这种情况 就要考虑扩大检索范围 提高检索结果的查全率 输出检索结果根据检索系统提供的检索结果输出格式 选择需要的记录以及相应的字段 全部字段或部分字段 将结果显示在显示器屏幕上 存储到磁盘或直接打印输出 网络数据库检索系统还提供电子邮件发送 输出到个人文献管理工具里面等功能
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!