资源描述
辽宁科技大学本科生毕业设计 第 1 页 4720, 510) 642a of as an to In we of in In we on of on of he of in of in to In we to as of a in an a in to a In 辽宁科技大学本科生毕业设计 第 2 页 to a s to by on in c,f(et 1984;et 1988)as of by an In a is by at is to of to to of a of of et 1988;et 1989;992). in is to an or to an In its of et 1984; et 1988)a as in it is at is in My in 987, as a of of a of my My in of he me to At in to be i (1986), 1987) en 1988). In of 辽宁科技大学本科生毕业设计 第 3 页 in of on of or it it be at it in of or be of in be a us of in In of to it is to so of In of to be in In in is by in of of a of of of to of on i) In is of in at c,f(i,1987;987;989)of In in is of a is in is as is of a in in is It to us in to in of it to to of an 辽宁科技大学本科生毕业设计 第 4 页 by We 990) of so In of we to by in a et 1990). as et 1988; et 1989; et 1990), of be in or in of in in as so et 1988;et 1989),of at of of is by to of at of of so is of a of in a so a of be by or a in a to a of a to a in I on of of to in to of at of do a at in be is at 辽宁科技大学本科生毕业设计 第 5 页 of at a be as of to do of in us as an of In a of be in or in of in a of of a a to or of is in it is so to to to to in 987) of so (In an is to in an is by in to of to to in to be et 1991) we a of on in to of to In in of of of of by is in to of of in of in of 辽宁科技大学本科生毕业设计 第 6 页 of of of to of it is to of we of in on on of in in 辽宁科技大学本科生毕业设计 第 7 页 机器人 模仿控制 论 罗伯特霍洛维茨 机械工程学系 加州大学伯克利分校 伯克利分校,加州 94720 ,美国 电话: ( 510 ) 642子邮箱: 要 模仿 控制涵盖了一类可编程机器 的 控制算法,如机器人 的动作 就是 通过一个互动的进程, 以及能让 机器来执行复杂任务 的机动马达来实现的 。在本文中,我们讨论了 机器人模仿 控制器功能的识别和自适应控 制算法 的使用 。 我们 还特别 讨论 了在积分变换基础上 改 进 模仿 方案 ,重复控制器和自适应模仿 方案 的 异同 , 突出 了在 积分变换 基础上 自适应模仿算法 的 稳定性和收敛性 ,并 给 出 了 表明其中 一些特性 的 实验结果。 关键词:模仿控制,自适应控制,重复控制,机器人 导言 机器人 技术 和 模仿 人类 的 人工智能 一直是最难以实现的追求和目标。 虽然关于 人 类许多方面 的 模仿 仍然没有得到很好的 实现 , 但是 在模仿 人类如何 获得 执行复杂的动 作所必 需 的运动技能 上, 机器人运动控制已经取得了 很大 进展。在本文中,我们将参照 模仿控制器类的控制系统, 生 成 一个 以 迭代方式 进行的控 制 动作,并 运 用功能适应算法,以执行规定的 动作 。在典型的 模仿 控制应用 软件中,测试系统测试出错误信号后 便 更新控制输入,而 适应算法 也因此不断地 提高控制系统的性能 ,从而受控制的机器可以反复 执行规定的任务 。 在 研究 机器人运动控制 的 领域里 ,模仿控制这一术语 也许是第一次 为 他的同事们 所 使用 (c,f(et 1984;et 1988)。 模仿控制定义为 通过 迭代 方式 改善进程 从而 达到零误差渐近跟踪 的一类 控制算法, 他也把它命名为 模仿。在这个过程中 , 机器人总 是从相同的初始条件 开始,在 一个单一的有限 度的范围内进行反复的任务追踪 。 控制动作的 每 次测试 结果 相当于控制动作的 前 一次测试结果 再加上加上 条 件 比例跟踪误差及其时间导数。 辽宁科技大学本科生毕业设计 第 8 页 与 模仿和改善控制 方案 并行发展的是 ,大量的研究已经 直接 针对机器人轨迹跟踪重复控制算法的应用和其他运动控制问题 (et 1988;et 1989;992)。重复控制的基本目标是 消 除 不明 周期 干扰或 跟踪 未知定期参考轨迹。在它最简单的形式 中 ,许多重复控制算法 的 定期信号发生器 与 改善模仿 规律很 相似 (et 1984; et 1988)。然而,在模仿过程中的行为改善控制器有 时间界限 ,该行为不断重复控制器 上调节 器 的动作 。此外, 对于 模仿 改善 的方法,假定 机器人 在 每一 次 模仿 试验 中 总是 从相同的初始条件开始执行任务 的 ,但是这不是重复控制方法那种情况 。 我 在 模仿和重复控制 方面的兴趣开始于 1987 年, 是因为那时我和 我的 校友及 同事起 学习研究了 一类 有关 机器人 自适应和重复控制器稳定 性 的知识 。我的同事和朋友 重复控制 这块领域里 一直 都 非常积极地 去 研究 , 也是 他 把 我 引入 了这个 课 题。当时机器人 技术 和控制 领域里有很多人都积极的为 机器人 寻找 能 渐近稳定的 自适应控制算法 ,所以 这些算法 都必须通过严格的 证 明 。 最近, i(1986), 987 以及 988)已经通过运 用钝性解决了这个问题。 与此相反 的是 , 在那 一时期大部分模仿和重复控制的的稳定 性 成果 都是建立在 几个不现实的假设 之上的,或者 是动态的机器人线性假定,或者 是 被认为可能是至少部分线性反馈控制。此外, 还 有人认为在大多数工程 中 ,即使 是 短暂的模仿 , 机器人 的 实际反应 也 是定期或重复的,并 且还 可直接 测量出 联合加速度 。 最近我 和 们的自适应控制研究 中 已 证明了这种说法 ,并得出结论 ,我们 认为模仿控制器 可 使用类似的做法 进行 合成和分析。 我们觉得,模仿和控制器的主要优点 在于它的简单和直接。在 机器人轨迹控制 的其他方法中 , 还 包括参数自适应控制, 但是 有必要计算 一下 所谓的 机器人 逆动力学方程。在许多 类似 的 方法中, 这些方程必须 以 实际 时间 计算 。 相反,在改善模仿和重复控制 的方法中 , 动作的控制是由 简单功能 的自 适应 算法相关 产生的 。此外 , 由于 在工业 应用 的 大多数机器人涉及重复执行同样的任务, 那么 实现 一个 不需要任何一个 有 经验或者具备一定 知识结构的机器人运动方程 而仅 通过实践 “ 模仿 ” 的 控制算法 的想法 ,也非常 具有吸引力 成模仿控制器的 方法 根 据如下见解:一)在模仿控制 方面 ,电机灵巧 度 不是通过使用获得的反馈 来实现的 。这是 当时大部分 自适应控制器采用的 方法 (c,f(i,1987; 987;989)。在这些自适应 的方法中, 非线性控制 规 律和参数调整算法的 递减都是 实 辽宁科技大学本科生毕业设计 第 9 页 际机器人关节坐 标和速度 的性 能 。二)与此相反,在模仿控制算法 中 ,机动灵活 的 获得是 通过使用一种前馈控制 的动作 ,这是存储在内存 中的,当执行任务时便可以检索出来。但是 模仿 的 过程中 要 涉及 到 调整前馈 动作后 功能 的适应性 。三) 反馈信息在使 系统 稳定和保证前馈功能误差和跟踪误差 之间映射的 严格被动 中发挥着基础性的作用 。因此,很明显,我们认 为 为了 在 模仿和反复算法综合和分析 中的 自适应控制结果 的基础上使用被动 ,有必要 计算 和证明自适应控制法的稳定, 即能 实现机器人动态线性的前馈控制,而不是 反馈控制 。我们 把 这些结果 写 在 ( 990)并有 所谓的期望补偿自适应律( 的介绍 。在这 个自适应 方案 中, 非线性控制律和参数自适应算法 递减都是改变后 运动轨迹和速度 的性能 。后来我们就可以 通过 运 用 重复控制法 (et 1990)代替 自适应法的 合成重复控制器的机器人手臂 了 。 不幸的是, 正如在 (et 1988; et 1989; et 1990)讨论的一样 ,渐近收敛的基 础的重复控制 系统 只有在机械 动态或 局限性 干扰信号 的严格限 制性条件下才能保证。这些条件一 般 不适合 应用在机器人 的 控制中。 大 多数情况下,更新 方案 后有相应的修改 ,如所谓的 Q 滤波器修改 (et 1988;et 1989), 可以 增强重复控制器 强度 , 但是要 以牺牲限制其跟踪性能 为代价 。同样,就 机器人开始时的每一个模仿 实验的初始条件而言,在合理的假设下, 融合改善模仿 方案 已经得到证明 。到目前为止 ,我们讨论的 改善模仿和重复控制 方案 的 另一个缺点 ,就是这些算法是为单一任务的迭代模仿而提出的 。在这些领域 里 没有任何研究工作 可 提供拓展 模仿 工序的 一个 这样的 机制, 它能使机器同时模仿大量 家务工作 ,或提 是 供一个系统的机制, 即运用通过模仿特殊任务获得的灵活性 去 执行 稍微 有点不同 但具有类似性质的工作 。 在 教员 后 ,我 和 这些问题 进行了研究 。 我们的研究表明,本 质改变 和重复控制 规律的巨大局限性 和 这些用来模仿多样任务的算法的失效在某种程度上 源于一个事实, 即 所有这些 方案 都是 使用点对点功能适应 算法。这些 算法 仅仅只更新了 控制输入在当前即时的时间 内的实用性,但并 没有提供一种可以在相邻时间内 更新控制输入 的 机制。然而,大多数应用中的必须查明 的 控制功能,通常至少 是 分段连续 的 。因此,在某一特定点 上控制的实用性 将 和附近的点的实用性几乎一样 ,而 点对点 的 功能更新 规 律不 能 充分利用这种情况。这个 焦点 已 经 更广泛 地 影响模仿 问题 和可寻址 内容 存储器 的问题 。让我们考虑 把机器人的多 任务模仿控制算法 的情 辽宁科技大学本科生毕业设计 第 10 页 况 作为一个例子。在此应用程序 中 , 几个功能变量必须确定,即机器人的逆动力学 参数 。在有限的时间 内用于训练 改善控制 的 轨道不能访问 到主函数 每一个点(或载体)。因此,在用 点至点更新的 规 律 时,执行一次 任务 中 控制输入功能 的精确识别 将不会提供生成控制输入任务 的 任何信息,除非其他类似的轨道相 交,或 者使用了 某种插值 。类似地, 在可 寻址内容存储器 中 ,可取的做法是模仿算法 应 有一个 “ 插值 “ 的 性能 ,因此,输入向量是类似以前的经验 输入向量, 但对系统来说还是新的向量 ,输出向量 还是 类似以前的经验 输出载体。 在 机器人模仿控制 的 插值 问题上, ( 987)一书 提出 了 利用所谓的 “ 小脑模型算术计算机 ” (解决办法 。 在 该算法 中,一个 输入向量 被 映射到 在 中间记忆的几个点上,而 输出向量 是由总结存储在输入向量被映射到的所有点的值算出的 。输入向量的 映射有一个特性就是在中间记忆中彼此靠近的输入向量将映射在重叠的区 域, 这能 导致插值 的 自动 进 行。 在 (et 1991)中 ,我们介绍了 基于 积分变换 的 模仿控制系统 的 一类功能识别算法,以便处理 在上文提到的 点对点 的 重复性和模仿改善控制器的 强度 和插值问题。在这种自适应模仿算法 中, 未知函数 是以 第一类积分方程 的形式 定义 的,这种积分方程由 已知的和未知的 核心 功能影响 函数组成 。模仿过程中涉及 到通过估计影响函数对未知函数的间接估计 。整个影响函数被 调整 成 与每一个点的核心值成 比例。因此,在更新影响 函数和发生函数 的估计 中核心值的使用为 这些算法提供了理想 的 插值和平滑 的性能 ,并且 克 服 了前面点对点改善和重复 控制 方案 的有关多变函数 估计中 的 限制 问题 。此外,积分变换 的运 用 使得这些模仿算法表现出强大的稳定性和收敛性 成为可能 。 需要提醒的是,在 我们讨论的 研究报告中 使用的机器人 环境 跟踪模仿控制方面, 以及 强调 的 改善模仿 方案 和 重复控制 方案 及 模仿 方案 异同的 基础 都是 积分变换。在这一领域一些未 得到解 决的问题 的 结论和思 考 将在后续介绍 。
展开阅读全文