最新倒立摆系统的研究现状及发展

上传人:沈*** 文档编号:97065295 上传时间:2022-05-26 格式:DOC 页数:51 大小:431KB
返回 下载 相关 举报
最新倒立摆系统的研究现状及发展_第1页
第1页 / 共51页
最新倒立摆系统的研究现状及发展_第2页
第2页 / 共51页
最新倒立摆系统的研究现状及发展_第3页
第3页 / 共51页
点击查看更多>>
资源描述
倒立摆系统的研究现状及发展1 绪论1.1 课题的来源与意义 自动控制自从其产生以来,广泛地应用在工业、农业、交通运输 和国防各个方面, 凡是控制性能要求较高的场合, 都离不开自动控制。 倒立摆系统作为研究控制理论的一种典型的实验装置,具有成本低 廉,结构简单, 物理参数和结构易于调整的优点。然而倒立摆系统本 身所具有的高阶次、不稳定、多变量、非线性和强耦合特性,是一个 绝对不稳定系统, 必须采用十分有效地控制策略才能使之稳定。 倒立 摆系统是研究变结构控制,非线性控制,目标定位控制,智能控制等 控制方法理想的试验平台 1 。研究倒立摆系统除了较强的理论意义, 同时还具有广泛的实践意 义。控制理论中许多抽象的概念如稳定性, 能控性,快速性和鲁棒性, 都可以通过倒立摆系统直观的表现出来, 同时其动态过程与人类的行 走姿态类似, 其平衡与火箭的发射姿态调整类似, 因此倒立摆在研究 双足机器人直立行走、 火箭发射过程的姿态调整和直升机飞行控制领 域中有重要的现实意义, 相关的科研成果已经应用到航天科技和机器 人学等诸多领域。1.2 国内外研究现状 对倒立摆的控制研究主要是稳定问题和起摆问题的研究, 目前对 稳定问题的关注比较多。1.2.1 倒立摆稳定问题的研究 倒立摆稳定的研究就是设计控制器使倒立摆系统在稳定点保持 稳定,并且在一定限度内的干扰下可以回复到稳定状态。 倒立摆系统 的最初研究开始于二十世纪 50 年代,麻省理工学院( MIT )的控制 论专家根据火箭发射助推器原理设计出一级倒立摆实验设备。 控制目 的一般是使摆杆在垂直位置倒立。 而后世界各国都将一级倒立摆控制 作为验证某种控制理论或方法的典型方案。 后来人们参照双足机器人 控制问题研制二级倒立摆控制设备。 最常见的典型倒立摆有三种: 它 们是直线型倒立摆,平面型倒立摆,环型倒立摆等,它们是目前国内 外广泛采用的模型, 这也是研究各种控制算法的基础, 分别简述如下 :(1) 直线型倒立摆它是最常见倒立摆系统, 也称车摆装置, 根据目前的研究它又分 为1、2、3、4级车摆,典型结构图如图 1一 1所示,图中以一级车 摆为例,它是由可以沿直线导轨运动的小车以及一端固定于小车之上 的匀质长杆组成的系统, 小车可以通过转动装置由力矩电机、 步进电 机、直流电机或者交流伺服电机驱动,车的导轨一般有固定的行程, 因而小车的运动范围都是受到限制的。(2) 环型倒立摆环型倒立摆也称摆杆式倒立摆, 如图 1一 1所示,图中以二级为 例,一般是由水平放置的摆杆和连在其端接的自由倒摆组成, 原理上 也可以看成是车摆的轨道为圆轨情况, 摆杆是通过传动电机带动旋转 的。此摆设计好了可以摆脱普通车摆的行程限制, 但是同时带来了一个新的非线性因素:离心力作用(3) 旋转式倒立摆环型摆也叫旋转式倒立摆,但是这里的旋转式倒立摆不同于第二 种的环型摆,它的摆杆(旋臂)是在竖直平面内旋转的,而环型摆摆杆 是在水平面旋转的。(4) 复合倒立摆系列复合倒立摆为一类新型倒立摆,由运动本体和摆杆组件组成,其 运动本体可以很方便的调整成三种模式,一是(2)中所述的环形倒立摆,还可以把本体翻转90度,连杆竖直向下和竖直向上组成托摆和 顶 摆 两 种 形 式 的 倒 立 摆。1-1昇种制dir毛址图1-1各种倒立摆系统国外对倒立摆系统的研究可以追朔到六十年代,1966年,Scheafer 和Cannon应用Bang-Bang控制理论首先将一个曲轴稳定于倒置位置 上。在60年代后期,作为一个典型的不稳定、严重的非线性证例提 出了倒立摆的概念,并将其用于对一类不稳定、非线性和快速性系统 控制能力的检验。由于倒立摆系统的典型性,对它的控制引起了各国 科学家的普遍重视,从而使得用多种方法对倒立摆的控制成为具有挑 战性的世界性课题。当时主要集中在直线倒立摆系统的线性控制上 面。到70年代初,各国学者用状态回馈理论对不同类型的倒立摆控 制问题进行了广泛的研究,1976年Morietc2发表的研究论文,首先 把倒立摆系统在平衡点附近线性化,利用状态空间方法设计比例微分 控制器,实现了一级倒立摆的稳定控制。1980年,Furuta etc3等人基 于线性化方法,实现了二级倒立摆的控制。1984年,Furuta等人首次 实现双电机三级倒立摆实物控制4。1984 年,Wattes研究了 LQR(Linear Quadratic Regulator)法控制倒立摆5。LQR方法主要基于系统的线性模型和二次性能指针:J 二 0 (XtQX uTRu)dt(1.1)实际上是寻找一个最优的状态回馈向量K,从而设计一个最优回馈控制器。Wattes验证了改变权重矩阵可以得到不同的状态回馈向 量,从而产生不同的控制效果。八十年代后期开始,倒立摆系统中的非线性特性得到较多的研究,并且提出了一系列基于非线性分析的控制策略。1992年,Furuta等人提出了倒立摆系统的变结构控制。1995年,Fradkov等人7 提出的基于无源性的控制。另外Wiklund等人8应用基于李亚普诺夫 的方法控制了环形一级倒立摆,Yamakita等人9给出了环形二级倒立摆的实验结果。近年来随着智慧控制方法的研究逐渐受到人们的重视,模糊控制、神经网络、拟人智能控制、遗传算法和专家系统等越来越多的智能算 法应用到倒立摆系统的控制上。 1997 年, T.H.Hung 等10设计了类 PI 模糊控制器应用于一级倒立摆控制, 具有系统结构简单对硬件依赖 小的特点。 1995年, Li11 利用两个并行的模糊滑模来分别控制小车 和摆杆偏角。 1996年张乃尧等 12采用模糊双死循环控制方案成功地 稳定住了一级倒立摆。 Deris13 利用神经网络的自学习能力来整定 PID控制器参数。1997年,Gordillo14比较了 LQR方法和基于遗传算 法的控制方法, 结论是传统控制方法比遗传算法控制效果更好。 1993 年,Bouslama15利用一个简单的神经网络来学习模糊控制器的输入 输出数据,设计了新型控制器。 1994 年,北京航空航天大学张明廉 教授 1 6将人工智能与自动控制理论相结合,提出“拟人智慧控制理 论”,实现了用单电机控制三级倒立摆实物。 北京师范大学李洪兴 17 教授采用变论域自我调整模糊控制理论研究四级倒立摆控制问题, 成 功实现了四级倒立摆实物系统控制 18。对倒立摆这样的一个典型被控对象进行研究,无论在理论上和方 法上都具有重要意义。 不仅由于其级数增加而产生的控制难度是对人 类控制能力的有力挑战, 更重要的是实现其控制稳定的过程中不断发 现新的控制方法、 探索新的控制理论, 并进而将新的控制方法应用到 更广泛的受控对象中。 各种控制理论和方法都可以在这里得以充分实 践,并且可以促成相互间的有机结合。 随着控制理论的不断向前发展, 越来越多的理论被成功运用于倒立摆系统的控制: 如基于状态空间极 点配置、二次型最优控制 1921、基于能量的控制 22、基于滑模控制的方法23、基于模糊逻辑的控制 3646、基于神经网络理论 2425、 模糊逻辑与神经网络相结合的控制 26 、基于遗传算法的控制 27以 及基于遗传算法的神经网络控制 28 等等。常见的控制策略与算法有 以下几种:(1) 状态回馈H控制方法(2) 智慧控制理论的方法(3) 鲁棒控制方法1.2.2 起摆问题的研究 倒立摆起摆问题是指设计控制器,能够将摆杆从竖直向下的自然 状态摆动到竖直向上的位置。 对于倒立摆起摆问题的研究主要方法有 能量控制、启发式控制、拟人智慧控制等。较早研究起摆问题的文献有:1976年,Mori2等人提出包含两个 控制器,一个控制器用来自起摆, 另一个控制器用来使摆杆稳定在平 衡态附近。1996年,K.J.Astrom32研究了用能量控制策略,实现了 一级倒立摆的起摆。朱江滨等人提出了一种基于专家系统及变步长预测控制的实时非 线性控制方法,仿真实现了二级倒立摆的摆起及稳定控制 33。李祖 枢等人利用拟人智慧控制理论研究了二级倒立摆的起摆和控制问题 34。目前用于倒立摆起摆的控制方法主要有: 能量控制, 启发式控制, 拟人智慧控制等。社会化的大生产使工业生产规模越来越大, 生产装置越来越复杂, 工业对象成为高阶次、非线性、多输入多输出的复杂对象,而且控制精度要求越来越高。 这就对控制理论提出了新的更高的要求。 倒立摆 系统是一个典型的多输入多输出、非线性、高阶次的不稳定系统。研 究倒立摆的精确控制对复杂工业对象的控制有着不可估量的工程应 用价值。1.2.3倒立摆控制存在的主要问题倒立摆系统是一个非线形、 不稳定、单输入多输出的多变量系统, 对它进行稳定控制,其控制方法大致可分为两类 :(1)现代控制理论方 法:在非线形模型的平衡点附近对其进行线性化,再根据近似线性模 型,设计出控制规律。常见的有状态回馈的极点配置法,二次型性能 指针的最优控制和基于非线性观测器的控制方法等。 (2)智慧控制方 法:其主要特点是不依赖于系统数学模型,通过模拟人的智慧或利用 专家的经验较为直接地对倒立摆进行控制。 有模糊控制、 神经网络控 制、规则控制和模糊神经网络控制等。应用现代控制理论方法设计出的倒立摆的控制规律存在以下几 个问题 :(1)由于系统本身是一个非线性系统,经过线性化后,所得到 的模型与原模型只能在很小的范围内接近, 从而限制了系统的稳定范 围;(2)对于二级倒立摆系统来说,线性化后得到一个六阶的状态方 程,如果采用状态回馈的方法,则必须测量出系统的六个状态变量, 由于其中三个速度变量测量起来很困难,这样就必须设计状态观测 器,而状态观测器的引入对系统的稳定性和鲁棒性都有一定的不良影 响;(3)倒立摆系统是一个灵敏度很高、变化很快的系统,要求控制 器有很决的响应速度。据计算倒立摆系统的采样周期应在 5ms 左右, 因此,不能进行在线控制规律的适应性调整,也就是说,只能预先根 据系统模型求出一个不变的控制规律固定在控制器中, 这样就对系统 的模型精度要求很高。而模型参数中的一些非线性因素是容易变化 的,例如转动摩擦系数,水平摩擦系数及皮带的滞后,使基于模型的 控制规律难以严格符合系统实际模型, 这会导致系统的鲁棒性和稳定 性较差。智慧控制可以部分地解决上述问题。 首先智能控制不依赖系 统数学模型,所以就不存在因简化模型所带来的稳定范围减小的问 题。其次智慧控制规律的建立并不以预先确定的系统模型为基础的, 而是基于专家的经验或人们的常识, 只要该经验或常识基本反映系统 的特性,那么被控对象的参数变化对控制系统的收敛问题的影响就很 小。最后,智能控制规律的修改要方便得多,要修改基于数学模型的 控制规律, 整个算法结构都得变动, 而修改智能控制中的规则只需修 改某一或某几个规则,便可达到修改的目的。因此,智能控制系统维 护起来较为简单易行,其稳定性和鲁棒性较好。另外,倒立摆在实现方面还需要解决许多具体控制问题, 如传感 器的线性度执行电机的死区、 外围电路的零点漂移、 信号采集的速度 和精度等问题,这些问题的解决是成功地稳定倒立摆的关键。2 倒立摆系统数学模型系统建模可以分为两种: 机理建模和实验建模。 实验建模就是通 过在研究对象上加上一系列的研究者事先确定的输入信号, 激励研究 对象并通过传感器检测其可观测的输出, 应用数学手段建立起系统的 输入-输出关系。这里面包括输入信号的设计选取, 输出信号的精确 检测,数学算法的研究等等内容。机理建模就是在了解研究对象的运 动规律基础上,通过物理、化学的知识和数学手段建立起系统内部的 输入状态关系。对于倒立摆系统,由于其本身是自不稳定的系统,实验建模存在 一定的困难。但是忽略掉一些次要的因素后,倒立摆系统就是一个典 型的运动的刚体系统,可以在惯性坐标系内应用经典力学理论建立系 统的动力学方程。下面我们采用其中的牛顿-欧拉方法和拉格朗日方 法分别建立直线型一级倒立摆系统的数学模型。 采用拉格朗日法建立 二级倒立摆系统的数学模型。2.1直线一级倒立摆的数学模型2.1.1运动方程的推导2.1.1.1牛顿力学方法在忽略了空气阻力和各种摩擦之后,可将直线一级倒立摆系统抽 象成小车和匀质杆组成的系统,如图 2-1所示。图2.1直线一级倒立摆模型为了建立倒立摆系统的数学模型,做以下假设:M小车品质m摆杆品质b小车摩擦系数l摆杆转动轴心到杆质心的长度I摆杆惯量F加在小车上的力x小车位置图2-2和2-3是系统中小车和摆杆的受力分析图。其中,N和P为小车与摆杆相互作用力的水平和垂直方向的分量。在实际倒立摆系统中检测和执行装置的正负方向已经完全确定,因而向量方向定义如图2-2所示,图示方向为向量正方向。ms-2小牛:咙力分析闾3-3損轩堂力井祈分析小车水平方向所受的合力,可以得到以下方程:Mx=F-bx-N(2.1)由摆杆水平方向的受力进行分析可以得到下面等式:d2N (x l sin 对(2.2)dt2把这个等式代入式(2.1 )中,就得到系统的第一个运动方程N = mx ml 二cost mH2 sin(2.3)(M m)x bx mH cost - mH2 sin F(2.4)为了推出系统的第二个运动方程,对摆杆垂直方向上的合力进行 分析,得到下面方程P - mgd2二 m 2 dt(l COS n)即 *2P -mg = -ml)sin)- ml cos :力矩平衡方程如下-Pl sin v - Nl cost - I(2.5)(2.6)(2.7)合并方程(2.6)和(2.7),约去P和N,得到第二个运动方程2 (I ml 户 mgl sin)- -mlxcos(2.8)线性化后两个运动方程如下(I +ml 2沖 一mgl = mlxM +m)x+bx-ml$=u(2.9)对 (2.9)进行拉普拉斯变换,得到(I +ml2)(s)2 -mgl(s) = mlX (s)s222(M +m)X(s)s +bX(s)sml (s)s =U(s)(2.10)假设初始条件为0由于输出为角度r求解方程组的第一个方程,可以得到X(s)引2(I ml )ml(2.11)::j(s)mls2X(s) (I ml2)s2 - mgl(2.12)如果令 =x,则有(s)vsml(I ml 2)s2 -mgl(2.13)把上式(2.13)代入方程组(2.10)的第二个方程,得到U (s) =(Mm)2(I ml )ml 9(s)s2 b s2(I ml )ml耳住(s)s - mH (s)s2 s(2.15)(2.16)-mlbI(M m) Mmlmgl(M m) .2I(M m) Mml I (Mmlm) Mml(2.14)整理后得到传递函数ml 2s::j(s)q(2.17)整理后得到系统状态空间方程01002-(I ml )bI (M m) Mmlm2gl0001而-mlbm) MmlI (M m) Mml2mgl (M m)I (M m) Mml22(1+ml )21 (M +m) + Mml0ml0| I (M m) Mml(2.18)y *;卜陰:L*ix0+ I u0(2.19)对于质量分布均匀的摆杆有I =1 ml23(2.20)由式(2.9)的第一个方程可以得到,殂色x4l 4l设 X 二 X,x, -, Jux,则有(2.21)(2.22)(2.23)2.1.1.2拉格朗日方法F面采用拉格朗日方程对单级倒立摆系统建模。(2.24)拉格朗日方程为L(q,q) =T(q,q) V(q,q)其中L为拉格朗日操作数,q为系统的广义坐标,T为系统的动能,V为系统的势能ddt(2.25)其中i =1,2,3n , fi为系统在第i个广义坐标上的外力,在一级倒立摆系统中,系统的广义坐标有二个广义坐标,分别为x/。首先计算系统的动能T - Tm Tm(2.26)其中TM,Tm分别为小车和摆杆1的动能小车的动能12TmMx2摆杆的动能(2.27)Tm 二 J Tm(2.28)其中Tm.Tm分别为摆杆的平动动能和转动动能。设以下变数:Xpe nd 摆杆质心横坐标Ype nd摆杆质心纵坐标则有xpend 二丨sinypend = I cos(2.29)摆杆的平动动能和转动动能分别为2 2 d(xpend) Jd(ypend)、dt J 十 L dt J(2.30)Tm Jp1*2于是有摆杆的总动能系统的势能为*d(xpend )(ypend 空的 dtV =Vm = m g ypend = mgl cosdt2( 2.31)(2.32)由于系统在广义坐标下没有外力,所以有d ;L .:Ld!0(2.33)对直线一级倒立摆,系统的状态变量为:求解状态方程:X 二 AX Bu y = CX Du(2.34)则有VIx6L*J010000000001 000-4lxl - -|x0010I*yjxj10000103u0u_0(2.35)可以看出,利用拉格朗日方法和牛顿力学方法得到的状态方程是 相同的,不同之处在于,输入 U为小车的加速度x ,而输入u为外界给小车施加的力,对于不同的输入,系统的状态方程不一样,对 比较简单的直线一级倒立摆,利用牛顿力学的方法计算比较方便和快 捷,但对于多级倒立摆,利用拉格朗日方法程序设计计算会比较方便。二级倒立摆系统数学模型二级倒立摆系统结构二级倒立摆系统如图所示。二级倒立摆装置由沿导轨运动的小车 和通过转轴固定在小车上的摆体组成。 在轨道一端装有用来测量小车 位移的光电编码器。摆体与小车之间、摆体与摆体之间由转轴连接, 并在连接处有2个光电编码器分别用来测量一级摆和二级摆的角度。 一摆、二摆可以绕各自的转轴在水平导轨所在的铅垂面内自由转动而 小车则由交流伺服电机、皮带轮、传动带带动在水平导轨上左右运动, 从而使倒立摆稳定在竖直位置并且可以沿着导轨倒立行走。二级倒立摆系统的微分方程本文采用分析力学中的Lagrange方程建立二级倒立摆系统的微 分方程。首先,对系统作如下假设:1)小车、一级摆杆和二级摆杆都是刚体。2)皮带轮与皮带间无相对滑动,皮带不能拉伸变长。3)小车与导轨之间的摩擦力与小车速度成正比。4)各级摆杆与转轴间的转动摩擦力矩与摆杆的角速度成正比。数学模型推导:a)系统总动能:T =To - T 1 T2小车的动能:T -m0r 22一级摆动能:心皿电计斎+肠1) +斎he。创1. 2 1mi r l1 eosp1l1 sin “刁厶匕能2 如瞪 dsi nS+l2si 叫,2d2&(LiCOSi Leos?)= J2 - m2 -r L1 cosr2円 JeosT? i 亠si 门哥诂 l2 si nn 2 2b)系统总势能:VW0+V1+V2小车势能:V。= 0,一级摆势能:ym1gl1 cost二级摆势能:V2 =m2g(L1 cos. jeos);C)系统总耗散能:Do D1 D2,小车耗散能:Do =丄付2,2一级摆耗散能:D212二级摆耗散能:D2 = 1 f2 (日2 -日1 Y ;2由Lagrange函数禾口 Lagrange函数设q 二 r!丄一丄卫二u dt 汀 jr :r(2.36);D+g a 丄odt:-2 :V2(2.37)(2.38)将 L=T 一 v 和 D 代入式(2 一 36)、式(2 一 37)、式(2 一 38),并进行化简的到:2 2(m0 m1m2)r(m1l1m2L11 cos1m2l2v2 cos一 一mhhm2Li sinm2lp2 sin v2-for= i2.39m1l1m2L1 r cos円 J1m|L2i刊 m2h L存2 cosr2-入亠ff2 刊-f2L1l2m22 sin二2 -冇二2 -m1l1 m2L3 gsin 円=0(2.40)m2l2rcosr2 mtL1lp1 cos二2 - 6 亠 J2 m2l;二2m2L1lp1 sin 二2 - 6 f2 刃f22 _ m2l2gsin 寸2 = 0(2.41)m0 m m2; m1l1 m2L1 cos韦;m2l2 cosr2H1(22).22j=(m + m2L1 Jcos ; J1 + m1 1 +m2L 1; m2l2L1 cos(日2.m2l2 cos日2; m2l2L1 cos日2 -色)J2m2lh3倒, 戶血伽冷 +m2L gsinkmzJgsin日2 丫h。二 100 T根据上面3个微分方程式rlh3 I.;. i,七h0uH 1 (日1,日2 )日1 = H 2 (日1 ,日2 ,日1,3 2 )也臭一(mohu)3神经网络控制3.1神经网络发展现状人工神经网络(ArtificialNeuraINctwork , ANN)是80年代之后迅 速发展起来的一门新兴学科。它是模仿生物神经系统的信息传递和反 射功能来获得处理事物的一种“智能”信息处理系统。人工神经网络 从理论探索到进入大规模工程实用阶段,到现在也只有短短10多年的时间。美国神经网络学家 HechtNielsen曾为人工神经网络给出以下定 义:人工神经网络是由多个非常简单的处理单元彼此按某种方式连接 而成的计算机系统,该系统是靠其状态对外部输入信息的动态响应来 处理信息的。可见人工神经网络的信息处理功能是依靠计算机的强大 处理能力来实现的,但它又不同于一般的计算机系统。它没有预先确 定的、串行的运算操作,也没有确定的内存。它由许多互连的简单处 理单元组成,学习达到平衡后,由各个神经元的权值组成的整个网络的分布状态, 就是所求的结果。 网络学习的过程也就是各神经元权值 的调整过程 。1958年美国计算机学家罗森布拉特(FrallkRosenblatt)提出了一种 具有三层网络特性的神经网络结构,称为“感知机”(PercePtio n),这或许是世界上第一个真正优秀的人工神经网络。 在此以后的一段时间 内,神经网络引进了许多人的兴趣,同时也引起了很大的争议。 1969 年,美国著名人工智能学者 Min sky和PaPert写了一本评论人工神经 网络的书感知机(PercePtion)。称感知机不能解决“阂值”这一问 题,这本书引起了人们对 60 年代后期神经网络发展面临过热现象的 争议。此书的发表为刚燃起的人工神经网络之火,泼了一大盆冷水。 加以那时人工智能以功能模拟为目标的另一分支出现了转机, 产生了 以知识信息处理为基础的知识工程, 给人工智能从实验室走向实用带 来了希望。这使神经网络的研究进入低潮时期。70 年代后期,在人的智慧行为机器再现上,由于传统模型距离 人类自身的真实模型较远, 表现出了极大的局限性。 对于那些还找不 到有效计算方法和明确的计算方法的问题,如 :在人工智能、模糊识 别、动力学过程模拟等方面,就碰到了有限时间和空间的障碍,对于 人脑所具有的直觉感知、创造性思维、联想功能等,这些迫使人工智 能和计算机科学家必须另外寻找发展智能计算机的途径, 并把注意力 重新转向人脑的信息处理模式。难能可贵的是,在此期间,仍由不少 学者在极端艰苦的条件下致力于人工神经网络研究。1982 年, Hopfield 将人工神经网络成功地应用在组合优化问题, 提出了 HNN 模型从而有力地推动了神经网络的研究。他引入了“计 算能量函数”的概念,给出了网络定性判据。它的电子电路实现为神 经计算机的研究奠定了基础, 同时开拓了神经网络于联想记忆和优 化计算的新途径。1985年,Rumelhart提出了误差反向传播算法,即 BP 算法,把学习的结果回馈到中间层的隐含单元,改变它们的权系 数矩阵,从而到预期的学习目的,它是至今为止最普遍的网络。这一 算法的出现, 使神经网络获得一个比较实用和有效的训练方法。 由于 它具有节后化、全息性、鲁棒性、并行性、非线性等突出的特点,在 许多领域如工况监测和控制、 故障诊断、结构分析、高智商机械设计、 多传感器信息集成和融合、 系统识别与智能控制、 制造过程中作业计 划的优化等面得到了成功的应用 910。它的应用和发展不但会推动 神经动力学本身, 而且将影响一代计算机的设计原理, 有可能为新一 代计算机和人工智能开辟一条崭新的途径。 同时它为学习识别和计算 提供了新的途径,有可能给信息科学带来革命性的变化。目前已经建立了多种神经元与网络的模型, 尤其在自动控制领域 神经网络技术得到了巨大发展。神经网络对控制领域有着巨大吸引 力,是由它本身的一些重要特点和性质决定的 :1. 人工神经网络是从输入到输出的高度非线性映像,任意的连续非线 性函数映像关系都可由某一多层神经网络以任意精度加以逼近, 便于 解决非线性控制问题。2. 具有分布式存储信息的特点,即一个信息不是存在一个地方,而是 分布在不同的位置,当局部网络受损时,能恢复原的信息3. 对信息的处理及推理过程具有并行的特点。大规模互联网络结构能 很快实现全局性的实时信息处理,并很好地协调多种输入信息之间的 关系,同时人工神经网络模型具有自动搜索能量函数极值点的功能, 这种优化计算能力在自我调整控制设计中十分有用。4. 神经网络具有自组织、自学习、自适应等特点。对信息处理过程中 具有很强的泛化能力。同时它还具有较强的容错特性,提高了信息处理的可靠性和鲁棒性。5神经网络的结构是相同神经元的大规模组合,可处理多输入信号并 具有许多输出,适合用于多变量系统;适合用大规模 集成电路实现;也适合于用计算技术进行模拟实现。3.2神经网络原理和模型1神经网络基本结构单元神经网络的基本单元是神经元,它类似于生物体的神经系统基本 单元,神经元是一个多输入单输出结构,其功能为模拟生理神经元的 最基本特征。其结构示意图如图2一 i所示。图中为神经元输入信号,为平移信号,为神经元闭值,屮:为到宀连 接的权值。对图示神经元,其输入可表示为:兀往=y叫可输出为:+2其中,f是神经元转换函数,又称为神经元启动函数。神经网络是由 大量神经元的关联而构成,它是一个非线性动力学系统,其特点在于 对信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简 单,功能有限,但大量神经元构成的网络系统所能实现的行为却是极 其强大。神经网络的基本结构可以描述为具有下列性质的有向图:(I) 每个节点有一个状态向量;,;节点i到节点j有一个连接权系数;(3) 每个节点有一个阂值;(4) 每个节点定义一个变换函数儿【(工八丨最基本形式为f()神经网络模型各种各样,它们是从不同的角度对生物神经系统不 同层次的描述和模拟。 代表性的网络模型有感知器、 多层前馈 B 一 P 网络、 RBF 网络、双向联想记忆 (BAM) 、Hopfield 网络等.3.3 神经网络在控制系统中的应用神经网络在非线性系统控制中有着广泛的应用, 迄今为止己经有 了十几种控制案,但总体上仍可归结为以下几类 :(l) 在基于模型的各种控制结构中充当对象的模型 ;(2) 充当控制器 ;(3) 在控制系统中起优化计算的作用 ;(4) 与其它智能控制方法,如专家系统、模糊控制相融合,为其提供 非参数化对模型、推理模型等。下面给出几种典型的神经网络控制(1)神经网络直接逆控制 直接逆控制是使系统的一个逆模型与受控系统串联, 直接作为系统的 前馈控制器使受控系统的输出等于期望输出。 该方案很大程度上依赖 于逆模型的精确程度。 逆系的输入必须与训练时的输出足够接近, 系 统方能正常工作,因此无法有目的地选择训信号。(2) 神经网络自适应控制 神经网络具有逼近任意连续有界非线性函数的能力, 将神经网络与常 规的自适应制方案相结合,产生了神经网络自适应控制的两种类型, 即神经网络自校正控制系 (NeuralNetworkSelf-TuningControl ,简称 NNSTc)和神经网络模型参考自适应控制(3) 神经网络 PID 控制利用神经网络所具有的自适应能力和非线性映像功能, 通过实际系统 性能的学来实现具有最佳组合的 PID 控制。(4) 神经网络内模控制 在内模控制结构中, 系统的正向模型与实际系统并联, 两者输出之差 被用做回馈号,此回馈信号又由前馈信道的滤波器及控制器进行处 理。由内模控制性质知,该控器直接与系统的逆有关。引入滤波器是 为了获得期望的鲁棒性和跟踪响应。(5) 神经网络预测控制 预测控制的特征是预测模型、 滚动优化和回馈校正。 其中神经网络预 测控制器建了非线性被控对象的预测模型, 可在线学习修正。 利用此 预测模型就可以由目前的控太原理土大学硕士研究生学位论文输入, 预测出被控系统在将来一段时间范围的输出值。(6) 神经网络解耦控制 神经网络解祸通常基于逆系统控制的思想, 一般采用三层前向静态网 络;除直接逆控制解祸方法,还有基于自我调整解祸思想的神经网络 解棍方法和 PID 神经网络解祸方法。 神经网络解祸控制的难点是难以 确定通用的解藕条件判据, 目前的解祸策略都带有尝试性, 主要依靠 模拟试验来进行研究。(7) 神经网络专家系统控制 这是一种将神经网络与专家系统相结合的控制方式。 由于专家系统善 于表达知识和逻辑推理, 神经网络善于非线性映像和直觉推理, 将二 者相结合发挥各自的优势,就会获得更好的控制效果。(8) 神经网络模糊控制 神经网络和模糊逻辑相结合的方式有:1.用神经网络驱动模糊推理的模糊控制 ;2 用神经网络记忆模糊规则的控制 ;3.用神经网络优化模糊 控制器的参数。(9) 神经网络与遗传算法的结合 遗传算法与神经网络的结合主要体现在三方面:1.网络连接权值的进化;2,网络结构的进化 ;3.学习算法的进化。基于进化计算的神经网络 设计和实现己在众多领域得到应用, 但总体上看, 理论方法有待于完 善规范,应用研究有待于加强提高。3.4 神经网络控制的不足在智能控制领域中, BP 网络是一类有力的学习系统,其结构简单, 易于程序设计, 因此在控制领域中得到广泛的应用。 但实际应用中还 存在一些问题。1,需要较长的训练时间对于一些复杂的问题, BP 算法可能要进行几小时甚至更长的时 间训练。这主要是由于学习速率所造成的, 针对这一问题可采用变化 的学习速率或自适应的学习速率来加以改造。2、未成熟饱和在网络的训练过程中, 当其权值调得过大, 可能使得所有的或大 部分神经元的权总和值n偏大,这使得启动函数的输入工作在 S型转 移函数的饱和区,从而导致其导数f(n)非常小,从而使得对网络权值 的调节过程几乎停顿下来。 通常为了避免这种现象的发生, 一是选取 较小的初始权值, 二是采用较小的学习速率, 但这又增加了训练时间。 3、局部极小值BP 算法可以使网络权值收敛到一个解,但它并不能保证所示为 误差超平面的全局最小解,很可能是一个局部极小解。这是因为 BP 算法采用的是下降法, 训练是从某一起始点沿误差函数的斜面逐渐达 到误差的最小值。对于复杂的网络,其误差函数为多维空间的曲面, 就像一个碗,其碗底是最小值点。但是这个碗的表面是凹凸不平的, 因而在对其训练过程中, 可能存在某一小谷区, 而这一小谷区产生的 是一个局部极小值。 由此点向各方向变化均使误差增加, 以致于使训 练无法跨出这一局部极小值。 通常的作用是采用多层网络和较多的神 经元,有可能使结果得到改善。然而,增加神经元或者增加同层神经 元的个数, 同时增加了网络的复杂性以及训练的时间。 在一定的情况 下可能是不明智的。 因此可通过选用几组不同初始条件对网络进行训 练,然后再从中挑选出最好的结果。3.5 倒立摆神经网络理论的应用早在 1983年, Barto 等【15】就设计了两个单层神经网络,采用 AHC(Adantiveheuristiccritic) 学习算法实现状态离散化的倒立摆控 制。而在1989年,Anderson【16】进一步用两个双层神经网络和 AIIC 方法实现了状态未离散化的倒立摆系统平衡控制。但这两种算法都 只能针对一类模型。蒋国飞等【 17】通过训练 BP 网络来逼近口值函 数,并利用 BP 网络的泛化能力,实现了基于口学习算法的状态未离 散化的确定和随机倒立摆的无模型学习控制 ,不仅处理的模型对象更 广泛,而且相对前两种算法而言,该算法具有更好的学习效果。单波等 18 利用神经网络建立倒立摆系统模型,以此来描述被 控对象的输人输出关系,并由此计算出系统在未来若干时刻的误差。 然后由误差确定系统的目标函数, 通过滚动优化、 反馈校正来实现对 系统的实时控制。 运用该算法不仅可以避免对被控对象做复杂的数学 分析,而且还具有较快的收敛速度以及较强的鲁棒性。为了克服神经网络控制器结构不能改变的缺点, si 等【 19将神 经网络理论与增强式学习基本原理相结合, 提出了一种在线学习控制 系统。该实时学习系统能随着时间的推移而在两方面逐步提高它的性 能 :通过自身偏差不断学习 ;系统状态通过神经网络学习过程被储存。应用于倒立摆系统的神经网络控制算法一般都需要倒立摆系统 的输人输出数据以及各种提示信息。而 Houge 等【】利用参数均取 整数值的 SONNET(Self-organizing neural net work eligibility trace)网 络模型 ,无需预先分开输人空间,不必依赖系统输出数据,而仅仅 只需知道倒摆系统的失败信号和系统的当前状态, 即可对倒立摆进行 有效的控制将神经网络理论应用于倒立摆系统的控制还有许多成功的例子, 但由于神经网络理论本身的缺陷, 有一些问题需要解决。 如在如何有 效地获取神经网络控制器的初始结构和参数值等方面就有许多间题 值得探讨。有许多学者已经在这一方面做了有益尝试并取得了一些成 果【】例如,Pasemanr等提出了一种 ENS(Evolution of neurl system by stochastic syn thesis)算法来获取神经网络的内部结构和权值。运用该控制算法,系统各状态变量不必量化,可以连续取值,且系统具有 很强的鲁棒性。4 遗传算法4.1 遗传算法的发展概述遗传算法(Genetic Algorithms,简称GAs)是一种基于生物界中的 自然选择原理和自然遗传机制的随机搜索算法 39。它模拟了生物界 中的生命进化机制, 并用在人工系统中实现特定目标的优化。 这是一 种在思想和方法上别开生面的全新优化搜索算法。 传统的优化搜索算 法往往要求所求解的函数具有连续、 可微的性质, 有要求搜索空间及 噪声相对较小的限制。 而遗传算法不受问题性质的限制, 可以在巨大 的空间上实行概率性搜索, 能在搜索的过程中自动获取和积累有关搜 索空间的指示,并自我调整地控制搜索过程, 以求得最优解或较优解。 遗传算法的这种特点使得它能够处理许多复杂问题, 具有广泛的适用 性和鲁棒性。在自动控制、组合优化、模式识别、机器学习、人工生 命、管理决策等许多领域都得到了广泛的应用 4041 。近年来, 自动控制己成为遗传算法最活跃的研究领域之一, 包括 PID 控制、最优控制、自我调整、鲁棒控制、模糊控制、神经网络控 制及系统辨识等许多分支 4243 。越来越多的研究人员开始研究用 遗传算法及其改进算法解决控制领域中的难题。 在科技高速发展的今 天,对大规模的、 复杂的、不确定性的系统进行有效控制的要求在不 断提高,如何准确方便地优化各种控制方法中控制器的结构和参数己 成为迫切需要解决的问题。 尽管遗传算法经过几十年的理论及应用研 究已获得了大量的成果, 但其理论基础仍较薄弱, 一些参数的选取还 要依靠实验经验的积累。 因此,对遗传算法本身及其解决控制问题的 能力的深入研究具有重要的现实意义。从本世纪 40 年代,生物模拟就成为了计算科学的一个组成部分, 如早期的自动机理论就是假设机器是由类似于神经元的基本元素构 成的。近几十年来,人们关注着如 :机器能否思维、基于原则的专家 系统是否胜任人类的工作、 以及神经网络可否使机器具有看和听的能 力等等这些有关生物模拟的问题。自从人们接受了达尔文的生物进化理论之后, 科学家们就对生物 的进化机制产生极大的兴趣。自然进化特征在 60 年代就引起了美国 Michigan 大学的 JohnHolland 的极大兴趣,那时 Holland 从事如何建 立能学习的机器研究。他注意到学习不仅可通过单个生物体的适应, 而且可通过一个种群的许多代进化适应实现。他受达尔文进化论 “适者生存”的启发,逐渐认识在机器学习的研究中,为获得一个好 的学习方法, 仅靠单个策略的建立和改进是不够的, 还要依赖于包含 许多候选策略的群体繁殖。这种研究思想起源于遗传进化, Holland 就将这个研究领域取名为遗传算法。从 1985 年到 1993 年,召开了五届国际遗传算法学术会议, 遗传 算法己经有了很大的发展,并开始渗透到人工智能、神经网络、机器 人和运筹学等领域。 遗传算法是多学科相互结合与渗透的产物, 它已 经发展成一种自组织、自适应的综合技术,广泛用在计算机科学、工 程设计、管理科学和社会科学等领域。4.2遗传算法的概念、特点及应用421遗传算法的基本步骤遗传算法GA是建立在自然选择和群体遗传机制基础上的随机 迭代、进化,具有广泛适应性的概率搜索寻优算法。对于某个给定的优化问题,目标函数为:H=f(x , y, z,(x, y,乙二 R要求八)使H为极大值和极小值,以适应优化的需 要。此处,门是(x, y, z)的定义域,H为实数,f为解空间(x, y, z)F 到实数域H F r的一种映射。GA要根据目标函数H设 定一个适应性函数F,用以判别某个样本的优劣程度。遗传算法的基 本步骤如下:(1) 编码米用二进制编码方案对优化变量进行编码。米用二进制编码的策 略是将各优化分量分别进行编码然后合并成 I个二进制位串,就代表 了优化问题的1个可能解。如自变量X、丫、Z的1组取值用12个比 特的二进制代码串表示为:1000 1001 1100XYZ(2) 初始群体的生成通过随机方法产生出给定数量初始群体的个体,这些个体就是一F p批二进制代码串。首先,对每个个体计算其相应的适应度,按 的大小评价该个体染色体的素质。愈大表示第i个个体的素质愈好,优化的目标是找到厂最大时所对应的个体。初始种群的素质一般还比 较差,GA操作数的任务就是从这些初始群体出发,模拟进化过程择 优去劣,逐次迭代,选出优秀的种群与个体,以达到优化的目的。选择根据各个个体的适应度,按照一定的规则和方法,从第 t代群体 P(t )中选择出一些优良的个体遗传到下一代群体 P(t+1)中。一般选择 的规则是适应度越大的个体,赋予更大的选择概率,通常巴儿, 即适应度值高的个体有更多的繁殖后代的机会, 以使优良特性得以遗 传和保留。(4) 交叉将群体P(t)内的各个个体随机搭配成对,对每一对个体,以交p叉概率交换他们之间的部分染色体。交叉的方法是随机选取一个(或两个)截断点,将双亲的二进制代码串在截断点处切开,然后交换其尾部(或中间部分)以产生新的一代如:双亲A1001 0110B1100 1001后代A 1001 1001B 1100 0110(5) 变异对群体P( t)内的每个个体,以变异概率改变某一个或某一些基因串上的基因值为其他的等位基因。对于二进制基因串就是将1改为0或将0改为1,如:变异A1100 1101 110101101重复上述过程, 各代种群的优良基因逐渐积累, 种群的平均适应 度和个体适应度不断上升,直到迭代收敛,即找到最优解为止。虽然在目前的技术条件下, 关于整个进化的机制还没有完全弄清 楚,但通过许多实验和在微观世界里面进行的科学研究, 人们逐渐认 识了它们的许多特征。 生物体的生成是染色体译码的结果, 所以生物 体结构编码的染色体变化是进化发生的根本原因。 染色体的编码和译 码过程的细节人们并不是完全了解, 但下面几个关于进化理论的一般 特性己广为人们所接受, (这些特性往往又作为遗传算法的基本法则 ): 进行过程发生是在染色体上, 而不是发生在它们所编码的生物 体上; 自然选择把染色体以及由它们所译成的结构的表现联系在一 起,那些适应性好的个体的染色体经常比差的个体的染色体有更多的 繁殖机会; 变异可以使生物体子代的染色体不同于它们父代的染色体。 通 过结合两个父代染色体中的物质, 重组过程可以产生有很大差异的染 色体; 生物进化没有一记忆。 有关产生个体的信息包含在个体所携带 染色体的集合以及染色体编码的结构之中, 这些个体会很好地适应它 们的环境。4.2.2 遗传算法的一般流程 与自然界的生物进化过程相类似, 遗传算法的运算过程也是一个反复 迭代的过程,第t代群体记做P(t),经过一代遗传和进化后,得到第t+l代群体,它 们也是由M个个体组成的群体,记做P(t+l)。这个群体不断地经过遗 传和进化操作, 并且每次都按照优胜劣汰的规则, 将适应度值较高的 个体更多地遗传到下一代。 这样最终在群体中将会得到一个优良的个 体C*,它所对应的表现型X将达到或接近于问题的最优解 X*。 遗传算法的主要计算过程如下 :(1) 对问题的可行解进行染色体编码 ;(2) 产生初始种群 ;(3) 对种群内的各个个体进行适应度评价 ;(4) 根据个体的适应度进行选择操作,然后交叉、变异产生新的群体;(5) 返回到 (3),对该组群体译码进行新的评价 ;(6) 若当前解满足要求或进化过程中达到一定的进化代数,计算结束, 否则转 (3),继续进行。遗传算法的基本流程如图 2.4所示图2一4遺转算去的基區沆程图lig 2*4 The basic flow of genedc algoriihm图2.4遗传算法基本流程图4.23遗传算法的特点与其他优化算法相比,遗传算法具有如下优点:(1) 将搜索过程作用在编码后的字符串上,不直接作用在优化问题的 具体变量上,在搜索中用到的是随机的变换规则,而不是确定的规则。 它在搜索时采用启发式的搜索,而不是盲目的穷举,因而具有更高搜 索效率。(2) 现行的大多数优化算法都是基于线性、凸性、可微性等要求,而 遗传算法只需要适合度信息, 不需要导数等其他辅助信息, 对问题的 依赖性较小,因而具有高度的非线性,适用范围更广。此外还可以写 出一个通用算法,以求解许多不同的优化问题。(3) 遗传算法从一组初始点开始搜索,而不是从某一个单一的初始点 开始搜索。而目 _给出的是一组优化解,而不是一个优化解,这样可 以给设计者更大的选择余地。 它能太原理 _ 大学硕十研究生学位论文 在解空间内充分搜索,具有全局优化能力。(4) 遗传算法具有很强的易修改性。即使对原问题进行很小的改动(比如目标函数的改进 ),现行的大多数算法就有可能完全不能使用,而 遗传算法则只需作很小的修改就完全可以适应新的问题。(5) 遗传算法具有很强的可并行性,可通过并行计算来提高计算速度, 因而更适用于大规模复杂问题的优化。 正是基于以上优点, 遗传算法 对优化工作者来说充满了吸引力。但是由于遗传算法是一种较新的算法, 在实际运用中也还有许多地方 有待进一步地深入和改进,主要集中在以下几个方面 :(1) 遗传算法的理论研究比较滞后。由于遗传算法本身也是一种仿生 的思想,尽管实践效果很好,但理论证明比较困难。而且这种算法提 出来的时间还不是很长,因此其理论和实践的研究几乎是平行进行 的。(2) GA 算法本身的参数还缺乏定量的标准,目前采用的都是经验数 值,而且不同的编码、不同的遗传技术都会影响到遗传参数的选取, 因而会影响到算法的通用性。(3) GA 对处理约束化问题还缺乏有效的手段, 传统的罚函数法中对惩 罚因子的选取还是一个比较困难的技术问题。4.3 遗传算法的应用 由于遗传算法具有上述的众多特点, 所以它广泛应用于很多学科。 而 且它不依赖于问题的具体领域, 它具有自我调整性、 全局优化性和隐 含并行性,体现出很强的解决问题的能力。(1)函数优化和组合优化 人们构造各种各样的函数来检测遗传算法的性能, 通过对各种几何特 性不同的函数计算, 结果表明遗传算法均具有较好的性能。 而且对于 一些非线性、多模型、多目标的函数优化问题,遗传算法也能得到较 好的结果。 同时对于大规模的组合优化问题,
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!