人工智能第二章

上传人:san****019 文档编号:21363160 上传时间:2021-04-29 格式:PPT 页数:35 大小:1,020.94KB
返回 下载 相关 举报
人工智能第二章_第1页
第1页 / 共35页
人工智能第二章_第2页
第2页 / 共35页
人工智能第二章_第3页
第3页 / 共35页
点击查看更多>>
资源描述
第 二 章 智 能 Agent 内 容 提 要 Agents和 环 境 理 性 Agent 环 境 的 性 质 Agent的 类 型 与 结 构 Agent通 过 感 知 器 感 知 环 境 并 通 过 执 行 器 对所 处 的 环 境 产 生 影 响 人 类 Agent 眼 睛 , 耳 朵 为 感 知 器 手 , 脚 , 声 道 为 执 行 器 机 器 人 Agent 摄 像 头 , 红 外 距 测 仪 为 感 知 器 马 达 为 执 行 器 Agent函 数 将 任 何 感 知 历 史 数 据 映 射 为 行 为 :Agent程 序 通 过 在 物 理 系 统 上 运 行 来 实 现Agent函 数Agent = 体 系 结 构 + 程 序 感 知 器 : 地 点 和 内 容 ( eg. A,Dirty)行 为 : 向 左 , 向 右 , 洗 尘 , 无 操 作 理 性 agent: 对 于 每 一 可 能 的 感 知 数 据 序 列 ,一 个 理 性 的 agent应 该 采 取 一 个 行 为 以 达 到最 大 的 性 能 。理 性 判 断 的 4个 因 素性 能 度 量先 验 知 识可 以 完 成 的 行 动截 至 到 此 刻 的 感 知 序 列 一 个 Agent应 该 根 据 它 感 知 的 信 息 和 它 能 够 进行 的 行 为 而 做 正 确 的 事 情正 确 的 行 为 将 使 得 Agent能 够 取 得 最 大 的 成 功性 能 度 量 : 一 个 客 观 的 标 准 来 评 价 Agent的 行为 的 成 功 性Eg.真 空 器 agent的 性 能 度 量 可 以 是 它 清 洗 区 域 的 数量 , 花 费 的 时 间 , 消 耗 的 能 量 , 产 生 的 噪 音 等 等Eg.真 空 洗 尘 器 8个 小 时 内 清 理 的 灰 尘 总 量 来 度 量 性能 ?以 行 为 来 度 量 性 能 不 如 以 结 果 来 度 量 性 能 全 知 : 明 确 知 道 它 的 行 动 产 生 的 实 际 结 果并 且 作 出 相 应 的 动 作理 性 不 等 同 于 全 知 (已 知 的 知 识 都 是 有 限 的 )理 性 不 等 于 完 美 :理 性 是 使 期 望 的 性 能 最 大 化完 美 是 使 实 际 的 性 能 最 大 化 理 性 agent能 够 进 行 信 息 收 集 。理 性 的 agent应 该 具 有 自 主 性 , 能 够 进 行 学习 从 环 境 的 感 知 信 息 中 根 据 历 史 经 验 来 学 习 任 务 环 境 : 包 括 性 能 (Performance), 环 境(Environment), agent的 执 行 器 (Actuators)和 传 感 器 (Sensors), 英 文 缩 写 为 PEAS对 于 每 一 个 智 能 agent,必 须 说 明 其 PEAS参 数Eg.自 动 驾 驶 出 租 车性 能 度 量环 境执 行 器传 感 器 Eg.自 动 驾 驶 出 租 车性 能 度 量 : 安 全 性 , 快 速 性 , 交 通 违 规 , 舒 适度 , 利 润环 境 : 马 路 , 其 他 交 通 工 具 , 行 人 , 乘 客执 行 器 : 方 向 盘 , 加 速 油 门 , 刹 车 , 语 音 合 成器传 感 器 : 摄 像 头 , 红 外 或 声 纳 , 速 度 表 , GPS,键 盘 , 麦 克 风 Eg.医 疗 诊 断 系 统性 能 度 量 : 病 人 的 健 康 性 , 病 人 花 费环 境 : 病 人 , 医 院 , 工 作 人 员执 行 器 : 显 示 屏 (询 问 , 测 试 , 诊 断 , 治 疗 方 案 )传 感 器 : 键 盘 (输 入 症 状 , 现 场 检 测 , 病 人 的 回答 ) Eg.挑 拣 零 件 机 器 人性 能 度 量 : 正 确 挑 拣 的 零 件 所 占 的 百 分 比环 境 : 零 件 传 送 带 , 容 器执 行 器 : 机 器 人 手 臂 和 手传 感 器 : 摄 像 头 , 关 节 感 知 器 Eg.交 互 式 英 语 教 学 者性 能 度 量 : 最 大 化 学 生 成 绩环 境 : 学 生执 行 器 : 显 示 屏 (练 习 题 , 建 议 , 正 确 答 案 )传 感 器 : 键 盘 完 全 可 观 察 的 vs.部 分 可 观 察 的一 个 agent的 传 感 器 在 每 个 时 间 点 上 都 能 获 取 环 境的 完 整 状 态一 个 agent的 传 感 器 在 每 个 时 间 点 上 都 能 获 取 环 境的 部 分 状 态真 空 洗 尘 器 ? 自 动 驾 驶 汽 车 ?单 agent vs.多 agent单 agent独 自 运 行 eg.字 谜 游 戏多 agent同 时 运 行 eg.国 际 象 棋国 际 象 棋 vs. 驾 驶 出 租 车 ? 确 定 的 vs.随 机 的环 境 的 下 一 个 状 态 完 全 取 决 于 当 前 状 态 和 agent执行 的 动 作部 分 可 观 察 ?出 租 车 驾 驶 ? 真 空 吸 尘 器 ?片 段 式 的 vs. 延 续 式 的agent的 经 历 被 分 成 一 个 个 原 子 片 段 , 在 每 个 片 段中 agent感 知 信 息 并 完 成 单 个 行 动 , 下 一 个 片 段 不依 赖 于 以 前 的 片 段检 查 次 品 零 件 的 机 器 人 ? 国 际 象 棋 ? 静 态 的 vs. 动 态 的环 境 在 agent计 算 的 时 候 不 会 变 化 (vs.会 变 化 )半 动 态 的 :环 境 本 身 不 变 化 但 agent的 性 能 评 价随 时 间 变 化出 租 车 , 国 际 象 棋 , 填 字 游 戏 ?离 散 的 vs.连 续 的环 境 的 状 态 , 时 间 的 处 理 方 式 以 及 agent的 感 知信 息 和 行 动 都 有 离 散 /连 续 之 分国 际 象 棋 , 出 租 车 驾 驶 ? 环 境 的 性 质 决 定 了 agent的 设 计最 难 处 理 的 情 况 :部 分 可 观 察 的 , 随 机 的 , 连 续 的 , 动 态 的 , 延 续 式的 , 多 agent的 一 个 agent用 agent函 数 来 表 示agent函 数 将 感 知 数 据 序 列 映 射 为 行 为 Agent程 序以 传 感 器 得 到 的 当 前 感 知 信 息 为 输 入以 执 行 器 的 行 动 为 输 出仅 仅 以 当 前 感 知 为 输 入 而 不 是 以 整 个 历 史 感 知为 输 入 缺 点表 太 大创 建 表 时 间 长非 自 主 性 , 需 人 工 填 写即 使 能 够 学 习 , 也 需 要 很 长 的 时 间 四 种 基 本 的 类 型简 单 反 射 agent基 于 模 型 的 反 射 agent基 于 目 标 的 agent基 于 效 用 的 agent 基 于 当 前 的 感 知 选 择 行 动 , 不 关 注 感 知 历 史 环 境 是 完 全 可 观 察 的 还 是 部 分 可 观 察 的 ?Eg. 真 空 吸 尘 器 问 题 , 刹 车 问 题 Agent根 据 感 知 历 史 维 持 内 部 状 态Agent随 时 更 新 内 部 状 态 信 息 除 了 根 据 感 知 信 息 之 外 , 还 要 根 据 目 标 信 息 来选 择 行 动效 率 比 较 低 , 需 要 推 理搜 索 和 规 划 算 法 当 达 到 目 标 的 行 为 有 很 多 种 的 时 候 , 需 要 考 虑效 率环 境 是 部 分 可 观 察 的 和 随 机 的 , 不 确 定 下 的 决策 过 程 可 以 通 过 基 于 效 用 的 agent来 实 现 。效 用 的 作 用多 目 标 相 冲 突 时多 目 标 在 不 确 定 环 境 中一 个 目 标 有 多 种 行 为 可 以 达 到 时 4个组件性能元件:相当于整个agent评判元件:反映性能元件做得如何学习元件:负责改进提高问题产生器:提出一些新的有建设性的探索尝试Eg.出租车行驶 Agents和 环 境 理 性 Agent 环 境 的 性 质 Agent的 类 型 与 结 构 QA?
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!