资源描述
基于 Multi-Agent 的多机器人编队控制摘要: 多移动机器人协调是当前机器人技术的一个重要发展方向。多移动机器人之间的协调与 合作将大大提高机器人行为的智能化程度,完成由单个机器人难以完成的更加复杂的作业。多 移动机器人协调技术的研究对提高机器人的智能化水平及加快机器人的实用化进程具有重要的 理论研究意义和实用价值。本文结合多智能体技术对多机器人编队控制进行了研究,同时根据 具体的多机器人系统,进行了仿真实验。验证了多智能体技术在机器人编队控制系统中的应用, 完成了小规模的编队控制。关键词: 多智能体;多机器人;编队控制;协调控制;模糊控制Multi-robot Formation Control Based on Multi - AgentAbstract : The problem of multi-robot cooperation and coordination is central to mobile robotics. Cooperation and coordination will improve the intelligent performance of robots and can complete lots of impossible missions for single robot.The research on multi-robot cooperation and coordination is of great academic and applied significance. The multi-robot formation is developed combined with the multi-agent technology in this dissertation, and the simulation is done with the multi-robot system. The application of multi-agent is verified in the multi-robot formation control through a small system adopt the fomation control.Key words: Multi-agent ;Multi-robot ;Formation control;Coordination control; Fuzzycontrol1. 国内外机器人系统发展现状自 80 年代末以来,基于多智能体系统理论研究多机器人协作受到了普遍的关注,从军 事领域到工业与民用领域, 从星际探险到海底考察, 从比赛到教学, 都取得了不同程度的进 步。近年来,在IEEER&A,IROS等著名的国际机器人学术会议上,几乎每次会议都有多智能 体协作机器人系统的专题。 一些机器人学术刊物出版了有关多智能体机器人的研究专辑。 些研究项目,如 ACTRESS,CEBOT,GOFER,SWARM已进行了多年 。目前,国内关于群体机器人系统的研究刚刚起步,基本上还处于基础技术的研究阶段, 这方面的研究成果报道比较少。 中科院沈阳自动化所机器人开放研究实验室是国内研究多机 器人技术较早也较全面的科研单位。(1) CEBOT(Cellular Robotic System)CEBOT是一种自重构机器人系统 (Self-Reconfigurable Robotic System),它的研究是受生物 细胞结构的启发, 将系统中众多的具有相同和不同功能的机器人视为细胞元, 这些细胞元可 以移动,寻找和组合。根据任务或环境的变化, 细胞元机器人可以自组织成器官化机器人, 多个器官化机器人 可以进一步自组织, 形成更加复杂的机器人系统。 细胞结构机器人系统强调是单元体的组合 如何根据任务和环境的要求动态重构。 因此, 系统具有多变的构型, 可以具有学习和适应的 系统智能 (Group Intelligence) ,并具有分布式的体系结构 3。(2) ALLANCE/L-ALLANCE 系统ALLIANCE是由美国学者 Parker提出的用于研究异质、中小规模、独立性强的、疏松配合关系的机器人协调的一种结构。通过传感器信息和精确的广播(Broadcast式通讯)来感知自身的行动效应和其他机器人的行动。每个机器人是基于行为控制的。L-ALLIANCE是该结构的扩展,通过再励学习来调整行为控制器的参数。(3) Cooperative Robotics实验系统美国Oak Ridge国家实验室的 Lynne E.Parker博士在多 Age nt协作、自主Agent体系结构、 多Age nt通讯等方面做了许多工作1117。例如人机协作,移动机器人协作,多Age nt协作, 智能Age nt体系等。他们研究的协作机器人是集成了感知、推理动作的智能系统,着重研究在环境未知且在任务执行过程中环境动态变化的情况下,机器人如何协作完成任务。(4) Socially Mobile和 The Nerd Herd 实验系统美国USC大学的学者如 M.J.Mataric等在基于行为的多机器人协作方面做了许多工作。他们采用自下而上的路线,基于行为的方式研究分析、设计机器人群行为的表现,在多机器人学习、群体行为、协调与协作等方面展开工作3。(5) 中科院沈阳自动化所机器人开放研究实验室主要面向发展具有感知、思维和动作能力的先进机器人系统,研究机器人学基础理论方法、关键技术、机器人系统集成技术和机器人应用技术。我国机器人学领域著名科学家蒋新松院士曾任实验室主任。实验室现任主任为沈阳自动化研究所所长王越超研究员。图 1.1 CEBOT(Cellular Robotic System)图 1.2Cooperative Robotics 实验系统的图1.3沈阳自动化所多机器人系统CESAR Emperor2多智能体系统的分类Age nt作为智能计算实体,能自主完成一定任务。但是,实际中所有的系统都是分布式的,个体的知识、能力都是有限的,面对一些复杂的问题,如具有分布式数据或知识,或要 求分布式控制的系统,不得不采用多个Age nt协作系统。通过适当的体系结构将个体组织起 来,不仅能够弥补个体的不足,而且能使整个系统的能力超过任何单个个体的能力,这样的系统称为多智能体系统 (Multi-Agent System, MAS)。多智能体系统的体系结构主要研究如何将多个单智能体组织为一个群体并使各个智能 体有效地进行协调合作,从而产生总体解决问题的能力。多智能体系统是由大量具有环境观 察、任务规划和操作功能的智能体组成。为了把这些智能体组织成一个复杂的系统,来有效的完成某些预定任务, 需要一个合适的控制结构。 多智能体系统的体系结构可从不同的角度 来划分。2.1根据系统中智能体之间的相对关系来划分按照系统中多智能体之间的相对关系,通常多智能体系统可以分为如下几种结构: (1 )完全型网络结构通信对等和信息的局部化是该类型结构的主要特点。该结构体系要求各智能体均具有通信和控制功能模块,并且要保存系统内所有智能体成员的信息和知识,还要求保持所有智能体之间的通讯链路。 对于解决复杂的问题、 或结构复杂的系统来说, 完全型网络结构体系的效率会大大降低,并呈现出一种无组织的状态2O(2 )层次型网络结构在该类型系统结构中,智能体被分为不同的层次,在同一层上的智能体彼此不能够直接 进行通信,而需要经过其上一层智能体来完成。上一层智能体负责其下一层智能体的决策和控制。该结构中智能体不需要保存系统内所有的智能体信息,只需要保存下一层智能体的相关信息和知识,该结构尽管在通信上不如完全网络型简略,但结构层次分明,管理方便2(3 )联盟型网络结构系统内的智能体按照某种方式(通常按照距离远近、 智能体功能等)来划分为不同的智能体联盟。在各联盟内部都存在一个协助智能体,它负责不同联盟之间的通信。不同联盟之间处于对等的关系,类似于完全网络型各智能体之间的关系2。图2.2层次型网络结构图2.3联盟型网络结构2.2从多智能体协调系统的体系结构来划分多智能体协调系统的体系结构是整个系统执行协调合作任务的基础,决定了系统的能力和局限性。多智能体协调系统的体系结构分为集中式(Centralized)、分散式(Decentralized)和分布式(Distributed)三种。协调(Coordination)是指智能体对自己的局部行为进行推理,并估计其他智能体的行为,以保证协作行为以连贯的方式进行的一个过程。(1) 集中式(Centralized)控制结构系统由一个智能体集中控制整个系统,它是一种规划与决策的自上而下Top-Down式的层次控制结构,其层的数量和复杂性决定了系统响应所需的时间和行为决策的质量。系统的协调性较好,但实时性、动态性较差,对环境变化响应能力差,集中式系统由一个核心智能体和多个与之在结构上分散的、独立的协作智能体构成。核心智能体负责任务的动态分配与资源的动态调度,协调各协作智能体间的竞争与合作。该类系统较易实现系统的管理、控制和调度。分散式(Decentralized)控制结构系统各智能体具有高度智能自治能力,各智能体自行处理信息、自行规划与决策、自行执行自己的任务,与其它智能体相互通讯来协调各自行为而没有任何集中控制单元这种结构有较好的容错能力和可扩展性,但对通讯要求较高(多边通信),且多边协商效率较低(各有各的算法,思路不统一),无法保证全局目标的实现。分布式(Distributed)控制结构系统其介于上述两者之间,是一种全局上各智能体等同的智能分布一分层式结构而局部集中 的结构方式。这种结构方式是分散式的水平交互与集中式的垂直控制相结合的产物,其由彼此独立、完全平等、无逻辑上的主从关系的、能够自律的一组智能体构成。各智能体按预先 规定的协议,根据系统的目标、状态与自身的状态、能力、资源和知识,利用通信网络相互 间协商与谈判,确定各自的任务,协调各自的行为活动,实现资源、知识、信息和功能的共 享,协作完成共同的任务以达到整体目标。在该类系统中,各智能体在结构和功能上彼此独立,都以同样的方式通过网络通信相互发生关系,具有良好的封装性,因此使系统具有很好的容错性、开放性和扩展性。既提高了协调效率,又不影响系统的实时性、动态性、容错性 和扩展性5。图2.4集中式、分散式、分布式控制系统结构3多机器人控制系统模型系统控制结构明确了系统中具有不同职能的个体相互间的控制关系。与MAS体系结构相同,多移动机器人系统的控制结构也分为集中和分散两种类型,其中分散式又可分为分层式和分布式。为了实现多移动机器人系统动态和灵活的控制,借鉴MAS体系结构的研究,这里设计了一种多移动机器人协调控制系统模型。图3.1智能控制器结构该系统控制结构的上层是由中央控制器、避障模块、多移动机器人路径规划、任务规划模块、人机界面和通讯模块组成。它的核心是中央控制器, 它负责调用其它的智能体以及对其各个智能体进行协调控制。下层是具有一定智能的各个机器人组成。中央控制器由四个系统(知识库系统、模型库系统、数据库系统及总控系统)构成。其 中总控系统控制着其它三个系统的连接与调用。知识库系统从数据库系统中取得事实进行推理,从而决定从模型库中调用何种模型进行计算并确定模型中的一些参数。选定的模型从数 据库中获得初始数据进行运算并将运算结果送回数据库。4. 多机器人系统中的信息交互在目前的多机器人系统中,由于考虑到现场的复杂性与系统的灵活性,普遍采用无线通信来完成多机器人之间的数据交互。在无线通信领域存在有多种通讯方式,各种通讯方式有各自的特点,根据具体的通讯系统, 采用不同的无线通讯手段。 在我们试验系统中采用的是 无线局域网(WLAN),无线局域网利用了无线多址信道和宽带调制技术来提供统一的物理层 平台,并以此来支持计算机和相关设备之间的数据通信,并为通信的移动化、个性化和多媒体应用提供了可能。因此在多机器人协调控制中,无线局域网完全能满足通讯与可靠性的要 求。4.1无线局域网络无线局域网的设备通常有以下几种:无线网卡(终端)、无线接入点(Access Point接入端)、无线网桥(点对点传输设备)图4.1基于无线网桥的无线局域网设置该系统是以对Pio neer 3 H8-AT机器人的改造基础上形成的HEBUT2机器人和另一台同结构的机器人为平台进行研究的。本系统中的各机器人之间的通信系统是建立在以WLAN为基础,利用基站和多移动机器人进行一点对多点的通讯。在我们的多机器人系统中,我们采用了 802.11b协议,具体的协议定义与通信帧的结构 可以参考802.11b的国际标准。在无线通信的建立上可以借助与多种专用的软件来编程实 现,在我们的系统中采用了另外一种方法,即在Visual C+环境下应用WINSOCK控件进行网络编程。WINSOCK控件提供了访问TCP和UDP网络服务的方便途径。采用TCP协议可以提供双向的、可靠的、有序的和无重复投递的数据流。TCP允许创建和维护与远程计算机的连接,连接两台计算机就可彼此进行数据传输。用户数据文报协议(UDP)是一个无连接协议。采用UDP协议,支持双向的数据流,但计算机并不建立连接,不保证有序、可靠或无重复 的投递。在使用中,采用TCP协议的编程模型应用最为广泛,因为面向连接协议提供了一系列的数据纠错功能,可以保证在网络上传输的数据及时、无误地到达对方,In ternet上的多数服务(WWW、FTP、Telnet、SMTP)就是靠此协议运转的。采用UDP协议由于不用建立TCP和连接,传输比连接协议快,无数据纠错功能,不保证数据的可靠传递。比较上述的UCP两种通信协议后,本项目采取了TCP协议进行通信。4.2 WINSOCK使用的主要函数Server端使用的主要函数:Bind()函数指定用于 TCP连接的 LocalPort和 LocalIPoListe n()函数设置侦听模式。该方法仅适用于TCP连接。Accept。在处理ConnectionRequest事件时用这个方法接受新连接。Sen dData()用于数据的发送。Close(关闭与对方的连接。Client端使用的主要函数:Conn ect()要求连接到远程计算机。GetData()得到远程计算机上的数据。Server图4.2 WINSOCK通信流程4.3无线网络应用层协议多移动机器人系统利用 WLAN建立的通信是建立在 TCP/IP协议栈上的应用层的协议, 协议中的主要是利用底层的TCP/IP协议规定特定格式的字符串,这些字符中包含着:各机器人的当前的状态信息;主控端对各机器人的遥操作信息;各机器人上的传感器信息。包括了两组共6个颜色传感器的开关量信息,以及车体上的两组共 6个超声传感器返回的测距信息。还包括了 GPS接收机接收到的位置信息,以及条码传感器采集回来的位置信息等内容。4.4在通信系统中的应用多移动机器人的通信系统中分为了移动机器人端和控制台端两部分。但在网络结构上, 移动机器人端为服务器端(server),而控制台端为客户端(client),这中分配方式的原因有 以下几点。移动机器人端的 PC 一旦启动后就没有办法在对其进行操作了。由于移动机器人的移 动端PC并没有安装显示器,以及键盘鼠标等输入设备,所以一旦开启PC后,移动机器人 自动进入 WINME 操作系统,然后自动启动编写好的程序,等待终控端的连接,所以要将移 动端作为 server 端。移动机器人通信系统的可扩展性。 移动机器人的通信系统中可涉及的通信对象并不只 有一个移动机器人, 所以控制端的连接要有选择性, 通信也要有选择性。 终控端可以同时连 接多个移动机器人,并进行多机的同时控制。5. 多机器人系统编队避障控制所谓队形控制就是指多个移动机器人在前进的过程中,保持某种队形 ,同时又要适应环境(例如障碍物 )约束的控制技术。 队形保持控制一般分为两步 :首先根据当前环境确定各机器人 的目标位置; 然后根据一定的控制策略生成控制命令, 驱动机器人以一定队形驶向目标位置。路径规划主要涉及的问题包括:利用获得的移动机器人环境信息建立较为合理的模型 , 再用某种算法寻找一条从起始状态到目标状态的最优或近似最优的无碰撞路径; 能够处理环 境模型中的不确定因素和路径跟踪中出现的误差,使外界物体对机器人的影响降到最小;如何利用已知的所有信息来引导机器人的动作,从而得到相对更优的行为决策4。5.1 几种常见的编队控制策略 2 多移动机器人的路径规划问题不单纯是单个移动机器人的路径规划问题的延伸,还要考虑多移动机器人之间的协调、 编队避障 (机器人可能成为其他机器人的障碍)等 ,因而使问题更加复杂。1. 跟随领航者法 跟随领航者法的基本思想是: 在多移动机器人组成的群体中, 某个机器人被指定为领航 者,其余作为它的跟随者, 跟随者以一定的距离跟踪领航机器人的位置和方向。 对该方法进 行拓展,可以指定一个领航者, 也可以指定多个领航者, 但群体队形的领航者只有一个,这 与一个步兵班在进攻中可以划分为若干战斗小组是类似的。 根据领航者与跟随机器人之间的 相对位置关系, 就可以形成不同的网络拓扑结构, 即形成不同的队形。 该方法中, 协作是通 过共享领航机器人的状态等信息实现的。跟随领航者法的优点是, 仅仅给定领航者的行为或轨迹就可以控制整个机器人群体的行 为。该方法的主要缺点是系统中没有明确的队形反馈,例如,如果领航机器人前进得太快, 那么跟随机器人就有可能不能及时跟踪。 另一个缺点是如果领航机器人失效, 那么整个队形 就会无法保持。2. 基于行为法 基于行为法的基本思想是: 首先为机器人规定一些期望的基本行为, 一般情况下, 机器 人的行为包括避碰、 避障、驶向目标和保持队形等。 当机器人的传感器受到外界环境刺激时, 机器人根据传感器的测得的信息作出反应, 改变自身的运动方向和速度。 行为选择模块通过 一定的机制来综合各行为的输出, 并将综合结果作为机器人当前的行为输出。 该方法中, 协 作是通过共享机器人之间的相对位置、 状态等信息实现的。 对该方法的拓展和改进主要体现 在对各行为输出的处理上,即行为选择机制上。3. 虚拟结构法 假想将刚体上的某些点用机器人代替, 并以刚体上的坐标系统作为参考坐标系, 那么刚 体运动时, 机器人在参考坐标系下的坐标不变, 机器人之间的相对位置也保持不变, 即机器 人之间可以保持一定的几何形状, 它们之间形成了一个刚性结构, 这样的结构称为虚拟结构。 虽然每个机器人相对于参考系统位置不变, 但它仍可以一定的自由度来改变自己的方向。 多 移动机器人以刚体上的不同点作为各自的跟踪目标就可以形成一定的队形2 。5.2 多机器人编队策略本文选用的是美国 ActivMedia公司生产的Pioneer 3 H8-AT机器人,它有四个橡胶轮胎,同侧轮是由一个伺服电机驱动,类似与履带式驱动结构。因此可以将其简化成两轮移动载体 模型,且两轮同轴而且位于车体的中心位置。Pioneer 3移动机器人上装有颜色传感器、 条码传感器、路径跟踪 CCD监视CCD,它们 负责环境感知信号的采集;视频传输模块将 CCD的AN信号传输到监视器上,可以远程监 视;无线网卡负责移动机器人和外界的数据通 信。Pioneer 3 H8-AT移动机器人的下位机 MCU 承担了底盘驱动和传感信号采集的工作,并将各种信息传输给上位机,待上位机处理以后, 再将输出的信息通过串口通信送往底层控制, 以实现移动机器人的两轮驱动。控制策略:本文是以 Pioneer 3移动机器 人改造后的HEBUT2机器人作为领航机器人, 它要一直沿着一根宽度为 56cm的红色的轨 迹运动到一个目标位置,另一机器人一定的距 离跟踪领航机器人的位置和方向。CCD另一种方案领航机器人用于路径跟踪的传感器有两种方案: 是颜色传感器和条码传感器组合。当使用路径跟踪 CCD时,运用 图像处理的方法从 CCD采集的图像 信息中提取出路径,经过 CCD坐标 和车体坐标的换算得出移动机械手 相对与车体的偏航角,进而由程序处 理发出纠偏指令,移动载体进行纠 偏。再通过路径上所贴的不同颜色的 路标进行定位。其优点是纠偏量合 理,路径跟踪轨迹圆滑,但精度较差, 且易受光线影响。图5.1经改装后的Pioneer 3移动机器人一种方案是路径跟踪路径图5.2颜色传感器与条形码传感器颜色和条码传感器组合的方案中,颜色传感器使用的是KEYENCE司的CZ-V1,CZ-10它对颜色的辨识准确、误报率低、运行可靠。选用两组对路径进行辨识,当机器人偏差较大时,颜色变化引起传感器 I/O输出量变化,主机 PC检测到后程序纠偏,完成巡迹。条形码 传感器主要是起定位的作用,当机器人运动到条形码的上方时,条码扫描器扫中条码同时将条码的内容通过串口发给主机,主机解析条码的内容来做出相应的动作。其优点是跟踪准确,不易受干扰,但跟踪轨迹成“之”字形比较严重。在实际使用中,采取两种方式结合使用, 取其优势,视现场情况而定。多移动机器人队形控制中应该做到:队列向目标区域运动时尽量保持队形(除非队列中有机器人遇到障碍物);机器人在遇到障碍物后,先进行避障,然后恢复队形并要求时 间尽可能的短,恢复队形后再向目标位置运动。5.3多机器人编队控制算法本课题采用了闭环1-2编队控制算法。I为两机器人之间的相对距离,“为两机器人间的相对角度。算法的中心思想是将机器人间的I和“保持在一个固定的值1。ROBOT1 是 leader,ROBOT2是 follower。那么,ROBOT2跟随 ROBOT1 运动。每台机器人的位姿为(xi,yi, Bi),它们就是机器人的参考原点的坐标,已在全局坐标系中表示出来。0是全局坐标系原点。机器人的转动中心点位于中心轴上两驱动轮的中心位置。R0B0T1和R0B0T2的两参考原点间的直线距离就是两机器人间的距离I,d表示参考点和转动中心点间在中心轴线上的直线距离。线速度的正方向为机器人前行的方向,角速度的正方向为逆时针方向。R0B0T1LiRDBQI2图5.3两个机器人的数学模型对于第i号机器人来说,它本地的状态变量(xi,yi,vi, 3 i)是从定位线程得到的,而它所得到的其他机器人的信息(xj,yj, 0 j,vj, 3 j)(j工i)是通过无限网卡传输过来的。跟随机器人将自己与领航机器人间的相对参数(I, “)以及系统所期望的理想之(Id, W d)之差反馈于机器人自身,再通过比例控制器将这一反馈信息作用于自身的速度(v)和角速度(3 ),从而完成跟随控制。5.4恢复队形阶段的路径规划当队形被严重打乱时,队列的首要任务是快速恢复队形。保持队形的控制方法虽然可以保证队形收敛到目标队形,但所需的恢复时间较长,因此需要寻找更有效的控制方法以保证队形快速恢复。显然,队列恢复队形所需的时间就是队列中最后到达局部目标位姿的机器人 所花费的时间。因此本论文将快速恢复队形问题转化为寻找各机器人局部目标位姿问题,使得各机器人从当前位姿运动到对应局部目标位姿的最长时间最短5。记R(i=1,2, ,n)当前位姿为Qi,局部目标位姿 Giq,最终位姿Qi*。显然,当队列恢复队形 时,各机器人的局部目标位姿受到I-W编队参数的约束,故只要确定队列中一个机器人的局部目标位姿,即可得到其他机器人的局部目标位姿。本文直接规划R的局部目标位姿 Qig,其他机器人的局部目标位姿Qig可根据Qig计算得到。5.5多机器人编队中避障控制本论文使用了一种基于模糊逻辑的移动机器人“感知一动作”行为控制的新方法利用模糊逻辑来融合多个“感知一动作”行为,来改善系统的实时性和可靠性。模糊控制的核心部分为模糊控制器。模糊控制器的控制规则由计算机的程序实现,微机通过采样获取被控制量的精确值,然后将此量与给定值比较得到误差信号E(在此取误差反馈)。一般误差信号 E作为模糊控制器的输入量。把误差信号E的精确量进行模糊化变成模糊量,误差E的模糊量可用响应的模糊语言表示。至此,得到了误差E的模糊语言集合的一个子集e(e实际上是一个模糊向量)。再由e和模糊控制规则 R模糊关系)根据推理合成规则 进行决策,得到模糊控制量u.以下给出了移动机器人的模糊逻辑控制方案,即所选取的模糊控制器的输入输出变量,得到移动机器人左该机器人是通过安装在机器人前端的多超声传感器阵列来获取环境信息, 侧、右侧的障碍物距离信息。输出变量是机器人在前进方向上的旋转角度。模糊控制器左侧距离信息右側距离儁息模糊星化反模糊化机器人旋转角度图5.4模糊逻辑模型与控制方案5.5.1输入量模糊化(1) 设距离信号的模糊语言变量值的集合为:近,中,远,简化表示为:ND, MD,LD(2) 根据超声传感器的实测距离,输入距离信号的实际论域为X* 500,1500毫米;采用线性变换:x=1/100x*-10取计算论域为x -5,5。(3) 左、右两侧输入距离的模糊语言隶属度函数如图5.5所示:5-4-32“0 I 2345图5.5输入距离的隶属度函数隶属 规则-5-4-3-2-1012345ND10.80.60.40.2000000MD00.20.40.60.810.80.60.40.20LD0000000.20.40.60.81表1.输入距离量隶属度规则5.5.2输岀量模糊化设输出的模糊语言集合如下:右转,稍微右转,前进,稍微左转,左转简化表示为:TR, TRL, GA, TLL TL移动机器人的输出变量即旋转角度的实际论域为-30 , 30,单位是度,且向左转为正方向;采用线性变换,y=215y*取计算论域为-4 , 4。角度输出的模糊语言隶属度函数如图4.11所示:TRTRLGA TLLTL432101234图5.6输出变量隶属度函数规则-4-3-2-101234TR10.50000000TRL00.510.500000GA0000.510.5000TLL000000.510.50TL00000000.51表2.输出角度隶属规则表5.5.3最终的模糊控制规则用Rd表示机器人右侧与障碍物的距离;Ld表示机器人左侧与障碍物的距离;U表示输出。机器人的避障规则如表 3所示,根据模糊输入的输出控制如表4所示:DRUDLNDMDLDNDTRLTLLTLMDTRLGATLLLDTRTRLGA表3.避障模糊控制规则-5-4-3-2-1012345-5-11222333444-4-1-1122233344-3-1-1012223334-2-2-1-101222333-1-2-2-1-101122330-3-2-2-1-10112231-3-3-2-2-1-1011222-3-3-3-2-2-2-101123-4-3-3-3-2-2-2-10114-4-4-3-3-3-2-2-2-1005-4-4-4-3-3-3-2-2-2-10表4.输入输出模糊控制规则5.6去模糊化去模糊化的方法很多,常用的有最大隶属度法、加权平均法、取中位数法等,本文采用了加权平均法。例如:Ld输入为1000 ( mm) ,Rd输入为900 ( mm),根据x=1/100x*-10转换到计算论域中为, X左=0, X右=-1。则查表4可以得到输出角度的模糊变量为1,输出向量为0 , 0, 0.5, 0.5 ,0, TR, TRL,GA, TLL,TL对应角度为-30,-15 0 , 15 30 。应用加权平均法,可得:*Ty = -30 , 15 0 15 300, 0, 0.5, 0.5, 0y =7.5,表示机器人向左转 7.56. 仿真结果与试运行状态在本论文中,实际使用了 Pion eer 3 H8-AT型智能移动机器人前方的六个超声传感器,把它们分成了左组和右组,选取每组中的最小的一个数值作为输入。因此,在仿真实验中机器人按照实际的移动机器人的设置,分别在机器人的左前和右前位置上布置了相同的超声传感 器,这样就可以探测到机器人前方的比较完全的信息。由于实际的机器人有盲区问题,而在仿真中的超声波传感器的测距范围是0,+,所以在仿真中传感器的检测范围按照实际值设置为0.5, 1.5(单位:米)。在多移动机器人以一定的队形移动的控制中,主要是利用闭环 1-2控制算法来实现的。其中机器人的避障行为,是通过建立模糊规则设计了模糊控制器来 实现的。(1) 单个机器人避障行为的仿真,如图6.1所示。(2) 在无障碍物的环境下,两机器人以l=1m, 2 =30度的队形移动的仿真结果,如图6.2所示。恃厲拈果(I I迅,日图6.1单机器人避障行为仿真扮止纯槊I I)I 1 a ROBOT2RflEOTL-./ 卜7 1怙盘蛉杲I 2 1图6.2多机器人避障行为仿真本实验实现了移动机器人的路径跟踪、避障行为(图6.3所示)以及解死锁等行为,并能够实现良好的人机交互,完成复杂的任务。图6.3实验机器人在障碍环境中7总结体会多移动机器人技术的研究是机器人技术发展的一种大的趋势,它将对机器人技术的发展带来很大的变革,多移动机器人系统在工业、农业、服务业、国防等领域具有广阔的应用背景,目前多移动机器人技术的研究己经成为国际学术前沿的研究热点。作为当前人工智能领域中研究热点的 MAS理论,以Age nt为其核心概念,研究MAS如何通过Age nt间的协调与协作完成复杂任务,特别是分布式任务。本论文的研究工作主要从多移动机器人系统的高层组织与规划着手,以全局观念研究多移动机器人系统协调协作机制以及其它问题,解决了多移动机器人系统研究中的一些问题。 同时,也看到了当前在多移动机器人系统研究中对多移动机器人系统的研究主要围绕具体任 务或具体实验系统展开,而且各机器人都是同构的,使得系统的应用范围和扩充性有限,研究成果往往难以推广。鉴于多移动机器人系统智能化、自治化和网络化发展的趋势, 总结本文工作,并结合已有研究的不足,还需要在以下几方面进行改进和完善:1 多智能体的理论与应用研究刚刚起步,把多智能体技术应用到多移动机器人协调控 制系统中,是一种较新的方法,我们只做了比较初步的工作,在理论和实际应用上还存在一 些差距,需进一步完善。2在多移动机器人系统中,还需要进一步提高单个机器人智能体的智能化程度,使机 器人能够更有效的理解人类的意图。参考文献:1 D.Sri nivasa n and M.C.Choy. Cooperative multi-age nt system for coord in ated traffic sig nalcontrol . IEE Proceedi ngs. Vol. 153, No. 1, March 20062 Brett J You ng, Ra ndal W Beard, Jed M Kelsey.A Con trol Scheme for Improvi ng Multi-Vehicle Formation Maneuvers.American Control Conference , Arlington , VA, June 25 -27,2001,704-7093 郭胜辉,张明路.基于多智能体的多移动机器人协调控制技术【D】河北工业大学.2006.104 王俊松等.基于Multi-Age nt的多机器人控制技术.天津职业技术师范学院学报【J】.第14 卷,第2期,2004年6月.3-7 苏治宝,陆际联.多移动机器人队形控制的研究方法.机器人【J】第25卷,第1期,2003年1月.88-91
展开阅读全文