课件2:因特网信息资源检索

上传人:y****3 文档编号:22069955 上传时间:2021-05-19 格式:PPT 页数:28 大小:472.50KB
返回 下载 相关 举报
课件2:因特网信息资源检索_第1页
第1页 / 共28页
课件2:因特网信息资源检索_第2页
第2页 / 共28页
课件2:因特网信息资源检索_第3页
第3页 / 共28页
点击查看更多>>
资源描述
因特网信息资源检索 因 特 网 中 的 信 息 检 索信 息 检 索 工 具 的 工 作 原 理1.3因 特 网 信 息 资 源 检 索 本 环 节 主 要 内 容主 要 学 习 各 种 搜 索 引 擎 及 其 发 展 趋 势 , 并在 此 基 础 上 进 一 步 分 析 了 搜 索 引 擎 的 工 作原 理 。 搜 索 引 擎 是 什 么 ? A.网 页 B.网 站 C.一 组 程 序 D.access 搜 索 引 擎 是 一 种 用 于 帮 助 因 特 网 用 户查 询 信 息 的 搜 索 工 具 , 它 以 一 定 的 策 略 在因 特 网 中 搜 集 、 发 现 信 息 , 对 信 息 进 行 理解 、 提 取 、 组 织 和 处 理 , 并 为 用 户 提 供 检索 服 务 , 从 而 起 到 信 息 导 航 目 的 。 注 意 的 问 题 搜 索 引 擎 并 不 真 正 搜 索 互 联 网 , 它 搜 索 的实 际 上 是 预 先 整 理 好 的 网 页 索 引 数 据 库 。 搜 索 引 擎 , 也 不 能 真 正 理 解 网 页 上 的 内 容, 它 只 能 机 械 的 匹 配 网 页 上 的 文 字 。 因 特 网 信 息 资 源 检 索1.目 录 索 引 类 搜 索 引 擎2.全 文 搜 索 引 擎3.特 色 信 息 检 索 工 具4.其 它 信 息 检 索 工 具5.元 搜 索 引 擎 1.3因 特 网 信 息 资 源 检 索搜 索 引 擎 指 用 于 因 特 网 信 息 查 找 的 网 络 工 具 。1.目 录 索 引 类 与 全 文 搜 索 引 擎(1)目 录 索 引 类 搜 索 引 擎 ( 其 搜 索 方 式 也 称 为 分 类 搜 索 )目 录 搜 索 引 擎 将 收 取 到 的 各 个 网 站 ( 网 页 ) 的 信 息 按 照 目 录 分 类 , 建 立 索 引 数 据 库 供 人 们 分 类 查 找 。代 表 网 站 : 搜 狐 ( ) 新 浪 () 网 易 () 雅 虎 () 搜 网 () 目 录 索 引 类 搜 索 引 擎 的 基 本 工 作 原 理 目 录 索 引 类 搜 索 引 擎 一 般 采 用 人 工 方 式 采 集 和 存 储 网 络 信 息 , 依 靠手 工 为 每 个 网 站 确 定 一 个 标 题 , 并 给 出 大 概 的 描 述 , 建 立 关 键 字 索 引 ,将 其 放 入 相 应 的 类 目 体 系 中 。1.3.2信 息 检 索 工 具 的 工 作 原 理特 点 : 在 查 询 信 息 时 , 不 用 事 先 确 定 信 息 检 索 目 标 ( 即 关 键 词 ) ,可 以 通 过 浏 览 主 题 了 解 某 一 主 题 的 相 关 资 源 。优 点 : 目 录 索 引 类 搜 索 引 擎 的 网 页 由 人 工 精 选 , 网 页 内 容 丰 富 , 学术 性 较 强 。缺 点 : 更 新 速 度 慢 。 专 题 目 录 链 接网 站总 目 录1.3.2信 息 检 索 工 具 的 工 作 原 理搜 索 的 例 子 : 选 择 题1.目 录 索 引 类 搜 索 引 擎 一 般 采 用 什 么 方 式 采集 和 存 储 信 息 ( ) 。A.人 工 方 式 B.蜘 蛛 程 序 C.关 键 字 检 索 D.检 索 工 具A ( 2) 全 文 搜 索 引 擎 ( 其 使 用 方 法 也 称 为 关 键 词 查 询 )全 文 搜 索 引 擎 用 代 表 所 需 信 息 主 题 的 关 键 词 进 行 信 息 查 询 。 谷 歌 google: ( ) 百 度 : ( ) 北 大 天 网 : ( ) 特 点 : 通 过 从 因 特 网 上 提 取 的 各 个 网 站 的 信 息 ( 以 网 页 文 字为 主 ) 而 建 立 的 索 引 数 据 库 。1.3因 特 网 信 息 资 源 检 索 1.3.2信 息 检 索 工 具 的 工 作 原 理组 成 部 分 负 责 工 作搜 索 器 负 责 定 期 地 自 动 到 各 个 网 站 上 , 把 网 页 抓 下 来 , 并 顺 着 上 面 的链 接 , 持 续 不 断 地 抓 取 网 页 。索 引 器 把 搜 索 器 抓 来 的 网 页 进 行 分 析 , 按 照 关 键 词 句 进 行 索 引 , 并存 入 服 务 器 的 数 据 库 中 。检 索 器 面 向 用 户 , 接 收 用 户 提 交 的 查 询 字 串 , 在 索 引 数 据 库 中 查 询 ,并 将 结 果 反 馈 给 用 户 。搜 索 引 擎 的 组 成 全 文 搜 索 引 擎 的 工 作 原 理购 物 描 述 商 品 特 征 取 贷 交 给 顾 客查 找 信 息 输 入 描 述 信 息 的 关 键 词 在 数 据 库 中 检 索 结 果 呈 现 全 文 搜 索 引 擎 的 工 作 原 理 :1.3.2信 息 检 索 工 具 的 工 作 原 理查 询 结 果用 户 查 询输 入 查 询 表 达 式 检 索 器 查 询 结 果 显 示查 询 信 息 排 序 索 引 器 搜 索 器筛 选 信 息 采 集索 引排 序索 引数 据 库 采 集 结 果 上 半 部下 半 部 全 文 搜 索 引 擎 的 工 作 过 程 是 什 么 ? 课 本P72-73 搜 索 引 擎 的 工 作 过 程 从 互 联 网 上 “ 抓 取 ” 网 页 建 立 索 引 数 据 库 在 索 引 数 据 库 中 搜 索 排 序 用 户 接 口 : 查 询 和 响 应 全 文 搜 索 引 擎输 入 关 键 字 查 询 信 息 排 序 索 引 数 据 库用 户 查 询 查 询 结 果检 索搜 索 下 列 不 属 于 搜 索 引 擎 中 “ 搜 索 器 ” 工 作 程序 的 是 ( ) 。A.网 络 机 器 人 B.蜘 蛛C.爬 虫 D.CuteFTPD 2.特 色 信 息 检 索 工 具1.3因 特 网 信 息 资 源 检 索 我 们 经 常 使 用 的 一 般 是 综 合 信 息 检 索 工 具 , 而 当 们 我 们 要 查 找 图 片 、 地 图 等 信 息时 , 使 用 综 合 搜 索 引 擎 会 找 到 很 多 无 用 的 信 息 , 而 且 搜 索 的 效 率 和 有 效 性 都 不 高 。 这时 就 可 以 使 用 特 色 搜 索 引 擎 ( 有 时 是 综 合 检 索 工 具 中 的 一 个 功 能 ) 一 类 以 FTP、 Telnet、 Usenet( Uses Network的 缩 写 新 闻 讨 论 组 , 是 全 世 界 最 大 的 电 子 布 告 栏 系 统 ) 等 资 源 为 检 索对 象 的 检 索 工 具 , 如 北 大 天 网 、 Archie等 。1.3因 特 网 信 息 资 源 检 索3.其 他 信 息 检 索 工 具 4.其 他 信 息 检 索 工 具 以 FTP、 Telnet、 Usenet等 资 源 为 检 索 对 象 。 5.元 搜 索 引 擎1.3因 特 网 信 息 资 源 检 索 一 般 的 网 络 检 索 工 具 局 限 在 本 引 擎 的 数 据 库 内 进 行 搜 索 , 由 于 不 同 的搜 索 引 擎 各 自 的 信 息 收 集 方 式 和 范 围 、 检 索 算 法 和 结 果 排 序 方 法 都 各 不相 同 , 因 此 检 索 结 果 也 不 尽 相 同 。 为 了 获 得 较 好 的 结 果 , 1995年 出 现 了元 搜 索 引 擎 , 元 搜 索 引 擎 能 方 便 地 检 索 多 个 搜 索 引 擎 , 扩 大 检 索 范 围 ,提 高 检 索 的 全 面 性 。 但 是 由 于 元 搜 索 引 擎 出 现 的 时 间 短 , 一 些 搜 索 引 擎强 大 的 检 索 功 能 还 不 能 实 现 。元 搜 索 引 擎 这 是 一 种 搜 索 引 擎 之 上 的 ( 强 调 逻 辑 关 系 、 逻 辑 结 构 ) 搜索 引 擎 , 它 可 以 同 时 检 索 多 个 成 员 搜 索 引 擎 的 数 据 库 。 常 用 元 搜 索 引 擎1、 Ithaki ( http:/ 持 包 括 中 文 在 内 的 14种 语 言 检 索 。2、 Ixquick ( http:/ 搜 索 网 站 、 MP3、 新 闻 、 图 象 等 多 种 网 络 资 源 3、 qbSearch http:/ Turbo10 http:/ Dogpile http:/ Webcrawler http:/ S http:/ 1.3因 特 网 信 息 资 源 检 索 下 列 不 属 于 元 搜 索 引 擎 特 点 的 是 ( ) 。A.搜 索 时 , 用 户 必 须 多 次 提 交 搜 索 请 求B.可 同 时 搜 索 多 个 数 据 库C.一 般 支 持 AND、 OR、 NOT等 操 作D.一 般 只 使 用 简 单 、 直 接 的 搜 索 策 略A 三 、 因 特 网 资 源 检 索 策 略 搜 索 内 容 引 擎 选 择一 般 信 息 资 源 综 合 性 的 ( 百 度 、 google) 图 片 、 视 频 特 色 的 , 也 可 以 用 综 合 搜 索 引 擎 的某 个 功 能 专 业 性 较 强 专 业 搜 索 引 擎 全 面 了 解 网 上 信 息 资 源 元 搜 索 引 擎 四、网上信息检索技巧 1、 使 用 空 格 输 入 更 多 的 关 键 词 ,只 要 在 关 键 词 中 间 留 空 格 , 这 相 当 于 多 个 关 键 词 之 间 的 关 系 是 逻 辑 “ 与 ” 。 练 习 1,查 找 “ 出 门 在 外 ” 的 歌 曲 2、 使 用 减 号 . 要 避 免 搜 索 某 个 词 语 ,可 以 在 这 个 词 前 面 加 上 一 个减 号 (“-”, 英 文 字 符 ).但 在 减 号 之 前 必 须 留 一 空 格 .如 要 了 解搜 索 引 擎 历 史 ,可 以 这 样 输 入 关 键 字 :搜 索 引 擎 宗 教 -佛 教 -基 督 教 3、 添 加 英 文 双 引 号 . 双 引 号 中 的 词 语 在 查 询 到 的 文 档 中 将 作 为 一个 整 体 出 现 .这 一 方 法 在 查 找 名 言 警 句 或 专 有 名 词 时 显得 格 外 有 用 . 练 习 2,请 你 比 较 应 用 下 面 两 组 关 键 词 的 搜 索 结果 有 什 么 不 同 1,理 科 的 学 习 方 法 2,“理 科 的 学 习 方 法 ” 4,查 找 特 定 格 式 的 文 件 . Google可 以 直 接 搜 索 13种 非 HTML文 件 .其 中包 括 Flash的 swf 文 档 ,Microsoft Office的(doc, ppt, xls, rtf) ,pdf和 其 它 类 型 文 档 .格 式 是 :关 键 词 filetype:类 型 名 . (梅 花 三 弄 filetype:swf) 四、网上信息检索技巧 5、 标 题 搜 索 . 当 我 们 需 要 搜 索 一 篇 关 于 某 个 主 题 的 文 章 时 ,可 以 用 以 下 的 关 键 字 :“intitle:关 键 字 ” .如 “ intitle:南 瓜 饼 ” 对 比 “ intitle:南 瓜 饼 ” 和 “ 南 瓜 饼 ” 的 查 找 结果 6、 网 页 快 照 . Google 在 访 问 网 站 时 ,会 将 看 过 的 网 页 复 制 一 份 网 页 快 照 ,以 备 在 找 不 到 原 来 的 网 页 时 使 用 . 四、网上信息检索技巧 五 . 因 特 网 信 息 检 索 发 展 趋 势n ( 1) 多 媒 体 信 息 检 索n ( 2) 专 业 垂 直 搜 索 引 擎1.3因 特 网 信 息 资 源 检 索 课 堂 总 结 这 节 课 我 们 学 习 了 两 大 知 识 点 : 一 是 信 息 检 索的 方 法 ; 二 是 搜 索 引 擎 特 点 及 工 作 原 理 , 这 一部 分 是 我 们 这 节 课 的 重 点 , 也 是 难 点 , 只 有 你真 正 理 解 了 它 们 工 作 的 原 理 , 我 们 才 会 真 正 能够 根 据 不 同 查 询 要 求 , 综 合 并 灵 活 使 用 各 种 检索 工 具 , 准 确 、 高 效 地 获 取 我 们 所 需 要 的 信 息, 这 也 是 我 们 课 标 所 要 求 的 。 Thank you!
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!