毕业设计(论文)基于LQR的二级倒立摆控制系统

上传人:仙*** 文档编号:34557608 上传时间:2021-10-21 格式:DOC 页数:52 大小:2.49MB
返回 下载 相关 举报
毕业设计(论文)基于LQR的二级倒立摆控制系统_第1页
第1页 / 共52页
毕业设计(论文)基于LQR的二级倒立摆控制系统_第2页
第2页 / 共52页
毕业设计(论文)基于LQR的二级倒立摆控制系统_第3页
第3页 / 共52页
点击查看更多>>
资源描述
基于LQR的二级倒立摆控制系统学 院专 业班 级学 号姓 名指导教师负责教师沈阳航空航天大学2011年6月沈阳航空航天大学毕业设计论文摘 要倒立摆系统是一个典型的多变量、非线性、强耦合和快速运动的高阶不稳定系统,它是检验各种新的控制理论和方法有效性的典型理想模型。在其控制过程中,能有效地反映诸如镇定性、鲁棒性、随动性以及跟踪等许多关键问题。本文主要研究二级倒立摆LQR控制方法。首先建立了二级倒立摆的数学模型,然后对二级倒立摆的数学模型进行控制设计,应用遗传算法确定系统性能指标函数中的加权阵Q,R得到系统状态反馈控制矩阵。用MATLAB进行了系统仿真。在几次凑试Q矩阵值后系统的响应结果都不尽如人意,于是采用遗传算法对Q矩阵优化。仿真结果证明:经过遗传算法优化后的系统响应能更加满足设计要求。最后在实验台上进行了试验,验证了matlab中仿真的结果。关键词:二级倒立摆;LQR控制;遗传算法Research on Double Inverted Pendulum Control System based on LQRAbstractThe inverted pendulum is a typical high order system, with multi- variable, non-linear, strong-coupling, fleet and absolutely instable. It is representative as an ideal model to prove new control theory and techniques. During the control process, pendulum can effectively reflect many key problems such as equanimity, robust, follow-up and track, Therefore,this paper studies a control method of double inverted pendulum LQR. First of all, the mathematical model of the double inverted pendulum is established, then make a control design to double inverted pendulum on the mathematical model, and determine the system performance index weight matrix Q, R by using genetic algorithm in order to attain the system state feedback control matrix. Finally, the simulation of the system is made by MATLAB. After several test matrix Q value the results are not satisfactory response, then we optimize Q matrix by using Genetic Algorithm. Simulation results show: that the system response can meet the design requirements effectively after Genetic Algorithm optimization. Key words:Double inverted pendulum; LQR control; Genetic Algorithm. 目 录摘 要I1 绪论11.1 引言11.2 倒立摆设备简介11.3国内外研究情况51.4论文的主要内容82倒立摆数学模型的建立与分析92.1数学建模的方法92.2二级倒立摆的结构和工作原理92.3拉格朗日运动方程102.4推导建立数学模型112.5 二级倒立摆系统性能分析182.5.1 能控性分析182.5.2 能观性分析183 线性二次最优控制算法简介203.1线性二次型最优调节器原理203.2 加权阵Q、R的选择224 遗传算法234.1 遗传算法的基本理论234.2 基本遗传算法244.3基本遗传算法的局限性244.4遗传算法的求解步骤254.5遗传算法的特点264.7遗传算法优化加权阵285 二级倒立摆LQR控制设计及仿真295.1 二级倒立摆控制系统框图295.2 任选加权阵的LQR最优控制仿真295.3用遗传算法优化Q阵的仿真结果335.4 实物演示35结论37致 谢38参考文献39附录(程序清单)41 451 绪论1.1 引言 随着现代科学技术的快速发展,控制工程所面临的问题越来越复杂。许多系统具有严重非线性、模型不确定、大滞后等特点。倒立摆就是这样的复杂系统,对它的研究具有一般性。倒立摆源于火箭发射器,最初的研究开始于二十世纪50 年代,由美国麻省理工学院的控制理论专家根据火箭发射助推器原理设计出一级倒立摆实验设备。倒立摆的控制技巧同杂技运动员倒立平衡表演有异曲同工之处,这表明一个不稳定的被控对象,通过人的直觉、采取定性的手段,可以使之具有良好的稳定性。在控制理论的发展过程中,某一理论的正确性及其在实际应用中的可行性需要一个按其理论设计的控制器去控制一个典型对象来验证。倒立摆系统作为一个实验装置,形象直观,结构简单,成本低廉;作为一个控制对象,他又相当复杂,同时就其本身而言,是一个高阶次、不稳定、多变量、非线性、强耦合系统,只有采取行之有效的控制方法才能使之稳定,因此倒立摆装置被公认为是自动控制理论中的典型实验设备1。通过对倒立摆系统的研究,不仅可以解决控制中的理论问题,还能将控制理论所涉及的三个基础学科:力学、数学和电学有机的结合起来,在倒立摆系统中进行综合应用。对倒立摆系统进行控制,其稳定效果非常明了,可以通过角度、位移和稳定时间直接度量,控制好坏一目了然。理论是工程的先导,对倒立摆的研究不仅有其深远的理论意义,还有重要的工程背景。从日常生活中所见到的任何重心在上,支点在下的控制问题,到空间飞行器和各类伺服云台的稳定,都和倒立摆的控制有很大的相似性,故对其的稳定控制在实际中有很多用场,如海上钻井平台的稳定控制、卫星发射架的稳定控制、火箭姿态控制、飞机安全着陆化工过程控制等都属于这类问题。针对上面的实际问题,启发了人们采用智能控制方法对倒立摆进行控制。因此对倒立摆机理的研究具有重要的理论和实际意义,成为控制理论中经久不衰的研究课题。1.2 倒立摆设备简介倒立摆系统的最初研究开始于二十世纪五十年代,麻省理工大学电机工程系设计出单级倒立摆系统这个实验设备。后来在此基础上,人们又进行拓展,产生了直线二级倒立摆、环型倒立摆、平面倒立摆、柔性连接倒立摆、多级倒立摆等实验设备。下面对这些设备具体介绍:1.直线倒立摆系统 或称为“小车-倒立摆系统”,是由可以沿直线导轨运动的小车以及一端固定于小车之上的匀质长杆组成的系统。小车可以通过传动装置由力矩电机、步进电机、直流电机、或者交流伺服电机驱动。小车导轨一般有固定的行程,因此小车的运动范围是受到限制的。2.环型倒立摆系统 可以将它看成是将小车的直线导轨弯曲而成的系统。一般是由水平放置的连杆以及一端固定在连杆末端的匀质长杆组成。连杆是通过传动机构由电机驱动沿中心的轴线转动。这种形式摆脱了摆杆运动行程受到限制这一不利的因素,但是摆杆的圆周运动带来了另外的一种不利的非线形因素,离心力作用。3.平面倒立摆系统 匀质摆杆的底端可以在平面内自由运动,并且摆杆可以沿平面内的任一轴线转动。这样系统可运动的维数增加了,从而系统的复杂性和控制器设计的难度也相应的增加。根据倒立摆摆杆底端运动平台装置不同,驱动的数目可能各不相同,但是至少需要两个电机驱动。一般可以采用X-Y平台、二自由度并联机构或者二自由度SCARA机械臂作为平面倒立摆系统的运动平台。4.柔性连接倒立摆系统 在原倒立摆系统的基础之上引入了新的自由振荡环节:自由弹簧系统。由于闭环系统的响应频率受到弹簧系统振荡频率的限制,增加了对控制器设计的限制。通过对系统动态特性的分析,弹簧弹性系数越小,对电机驱动的响应频率要求越快,系统越是趋于临界阻尼的状态。5.Acrobot2、Penduot3等其他形式的倒立摆系统 主要是机械结构不同,其被控对象的本质为非线性欠冗余机电系统没有发生变化,因而对系统的研究手段和研究方法是一样的。对于多级倒立摆系统,有两种基本的形式:串联倒立摆系统和并联倒立摆系统。所谓串联倒立摆系统是指对各摆杆“头尾”相接,呈串联形式连接。而并联倒立摆系统是指多个摆杆底端都连接在“小车”上,呈并联形式连接。串联倒立摆系统中各摆杆任何一个的角度、角速度、角加速度变化都会对另外的摆杆角度、角速度、角加速度产生影响;而并联倒立摆系统每个摆杆的状态变化不受其他摆杆状态变化的影响,只与水平连杆的角速度及角加速度有关。几种不同类型的倒立摆系统实物如图1.1所示。 图1.1 各类倒立摆系统当人用手托起一根立起的竹竿时,他会通过手臂的不断移动来保持平衡,使竹竿不倒。假如两根竹竿上下在一起(自由连接),还能长时间保持稳定直立么?通过实验仪器将这样的两根棍在自由连接状态下立起来,最下边的一根棍与滑轨上的一个小车自由连接。通过小车在滑轨上左右移动来保持两根棍上下立在一起不倒。从科学的角度讲,这就叫二级倒立摆。二级倒立摆装置如图1.2 所示: 图1.2 直线倒立摆本体 图1.3 电气控制箱本实验控制装置是由固高科技(深圳)有限公司开发的直线倒立摆系统。倒立摆系统包含倒立摆本体、电控箱及由运动控制卡和普通PC机组成的控制平台等三大部分。图1.4 倒立摆系统组成框图直线倒立摆本体:直线倒立摆本体(参见图1.2)由基座、交流伺服电机、同步带、带轮 、滑竿、滑套、滑台、摆杆、角编码器、限位开关等组成。小车由电机通过同步带驱动在滑杆上来回运动,保持摆杆平衡。电机编码器和角编码器向运动控制卡反馈小车和摆杆位置( 线位移和角位移)。电气控制箱:电控箱(参见图1.3)内安装有如下主要部件:交流伺服驱动器、I/O接口板、开关电源、开关和指示灯等电气元件。控制平台:控制平台主要由以下部分组成:与IBM PC/AT机兼容的PC机、GM400运动控制卡、GM400运动控制卡用户接口软件、演示实验软件。1.3国内外研究情况倒立摆装置被公认为自动控制理论中的典型试验设备,也是控制理论教学和科研中不可多得的典型物理模型,当前国内外有很多学者研究控制算法时都在利用倒立摆进行仿真验证,倒立摆系统稳定效果非常明了,可以通过摆动角度、位移和稳定时间直接度量,控制好坏一目了然。国外对倒立摆系统的研究可以追朔到六十年代,Schaefer和Cannon于1966年应用Bang-Bang控制理论,将一个曲轴稳定于倒置位置。随着现行理论系统的发展,使得对可观测系统的状态重构系统成为可能。1970年,Bryon和luenberger首次指出应用观测器重构系统状态,能实现倒立摆系统的稳定控制,1972年,W.R.Sturgen和W.V.Los cutoff应用全阶模拟观测器采用极点配置法实现了倒立摆的稳定控制,但采用降维观测法没有成功,他们把原因归结为:降维观测器对系统的参数误差比较敏感,同时,全维观测器对系统的量测噪声有滤波作用,而降维观测器则不然。在这之后,K.Furuta等在1978年采用小型计算机实现了对二级倒立摆的稳定控制, 1980 年,他们又完成了二级倒立摆在倾斜轨道上的稳定控制,1984 年,他们在二级倒立摆的基础上提出了一种三级倒立摆的稳定控制,并用微型计算机实现了稳定控制.在此期间,他们采用了降维观测器和线性函数观测器,并指出了W.R.Sturgen和W.V.Loscutff用降维观测器失败在于反馈设计不当及采用模拟线路时小信号的不精确以及大信号的饱和引入了误差。进入九十年代, K.Furuta等人在1992年提出了倒立摆系统的变结构控制。1995 年,Tetsuhiko Yamamoto,Shin-ichi Hanada 等人提出了应用遗传算法优化神经网络控制单级倒立摆制4。1996 年,Lin ZL.;Gutmann M,Shamash YA,Saberi A,提出的采用线性状态反馈方法控制单级倒立摆5。1997 年,T.H.Hung等设计了类PI模糊控制器应用于一级倒立摆控制,具有系统结构简单对硬件依赖小的特点。1998 年,Kim SY.和Hu BB.针对二级倒立摆的运行轨迹,提出来轨道控制,实现了二级摆的稳定控制6。1999年,V,A.Tsachouridis,G.A.Medrano-Cerda 应用离散方法控制三级倒立摆7。2000 年,Hidekazu Nishimur,针对倒立摆末态特性,应用初态和末态的误差,调节单级倒立摆的运动控制,这种控制方法并不要求有精确的稳定,而是在不断的调节中形成动态的稳定。2001 年, David Angeli, 应用连续状态反馈使倒立摆全局稳定8。2002 年,Seong Ik Han;Jong Shik Kim;Jae Weon Choi,应用非线性鲁棒控制平行倒立摆9。国内的研究工作是从八十年代开始的, 1982 年,西交通大学完成了二级倒立摆系统的研制和控制,控制算法采用的是最优控制和降维观测器,用模拟电路实现。1983 年,国防科技大学完成了一级倒立摆系统的研制并于1984 年实现微机控制。1984 年,北京理工大学自控系田介眉等人,用模拟电路和观测器实现了一级倒立摆稳定控制和任意位置的正弦摆动控制。1985年,尹征琦等人采用降维观测器的模拟控制器实现了对二级倒立摆的控制。1987年,梁任秋等实现了用单片机对二级倒立摆的控制。1987 年,西交通大学又完成了二级倒立摆系统的微机控制,控制算法采用的是最优控制和线性函数观测器。同年,上海机械学院完成了一级倒立摆在倾斜轨道上的控制,之后又研制了平行倒立摆的微机控制系统,在该系统中,两根长度不等的铝制摆杆安装在同一小车上,且只能在垂直的平面上做相对于小车的摆动或随小车平行运动,采用PC-86 微型机,12 位的A/D 转换器和12 位的D/A 转换器,由观测器和线性反馈组成了控制器。该校研究生还研制了一级倒立摆系统的模糊控制方法。1987 年,清华大学梁任秋等人研究了二级倒立摆系统的控制,并对连续系统极点配置法,连续系统二次型性能指标法,采样系统或离散系统二次型性能指标法,这三种方法进行了探讨和比较。1989 年,哈尔滨工业大学研究生胡正涛完成了二级倒立摆控制装置,采用二次型最优调节器,用降维观测器对系统状态进行重构,同时也用线性函数观测器进行了实验。国内进入90年代后,倒立摆方面的主要研究成果有:1992年,北京理工大学自控系研究生李来湘完成了基于简化模型的二级倒立摆控制,以及在线参数系统辨识。1993年,北京航空航天大学自控系张明廉教授等人,利用规约法设计了一级倒立摆仿人控制器,并通过PC-286 等设备稳定了一级倒立摆,具有良好的鲁棒性。1994年,他们又利用规约法实现了三级倒立摆的稳定控制,达到世界先进水平。1995年,程福雁等人,对二级倒立摆,采用模糊控制,实现了稳定的倒立摆控制10。1996年,张乃尧,发表了文章“倒立摆的双闭环模糊控制”11,该文章被很多文献引用,对应用智能方法控制倒立摆作出相当大的贡献。1997 年王晓凯,将倒立摆的数学模型简化,实现倒立摆的控制实验研究。1998 年蒋国飞,基于Q学习算法和BP 神经网络进行倒立摆控制,实现了神经网络在控制上的应用。王卫华在1999 年,运用专家模糊控制12,实现了单级倒立摆的动态控制。2002年 8 月北京师范大学数学系李洪兴教授领导的科研团队采用“变论域自适应模糊控制理论”成功地实现了全球首例“四级倒立摆实物系统控制”。 而由此项理论产生的方法和技术将在半导体及精密仪器加工、机器人技术、导弹拦截控制系统、航空器对接控制技术等方面具有广阔的开发利用前景。综合文献资料,倒立摆的控制方法总结如下:1.PID 控制,通过对倒立摆物理模型的分析,建立倒立摆的动力学模型,然后使用状态空间理论推导出其非线性模型,再在平衡点处进行线性化得到倒立摆系统的状态方程和输出方程,于是设计出 PID 控制器实现其控制。2.状态反馈控制,通过对倒立摆物理模型的分析,建立倒立摆的动力学模型,然后使用状态空间理论推导出状态方程和输出方程,应用状态反馈和 Kalman 滤波相结合的方法,实现对倒立摆的控制。3.利用云模型14,15实现对倒立摆的控制,用云模型构成语言值,用语言值构成规则,形成一种定性的推理机制。这种拟人控制不要求给出被控对象精确的数学模型,仅仅依据人的经验、感受和逻辑判断,将人用自然语言表达的控制经验,通过语言原子和云模型转换到语言控制规则器中,就能解决非线性问题和不确定性问题。4.神经网络控制,已经得到证明,神经网络(Neural Network, NN)能够任意充分地逼近复杂的非线性关系,NN 能够学习与适应严重不确定性系统的动态特性,所有定量或定性的信息都等势分布贮存于网络内的各种神经元,故有很强的鲁棒性和容错性;也可将 Q 学习算法16和 BP 神经网络有效结合,实现状态未离散化的倒立摆的无模型学习控制。5.遗传算法(Genetic Algorithms, GA),高晓智17在 Michine 的倒立摆控制Boxes方案的基础上,利用 GA 对每个 BOX 中的控制作用进行了寻优,结果表明GA 可以有效地解决倒立摆的平衡问题。6.自适应控制,主要是为倒立摆设计出自适应控制器。7.模糊控制,主要是以模糊集合论、模糊语言变量以及模糊逻辑推理为基础的一种计算机数字控制。从线性控制与非线性控制的角度分类,模糊控制是一种非线性开展。模糊控制适用于控制参量无精确的表示方法和被控对象参数之间无精确的相互关系的情况。8.变论域自适应模糊控制理论,李洪兴教授领导的模糊系统与模糊信息研究中心在国际上首次成功实现了四级倒立摆实物控制系统,添补了一项世界空白,这是我国自己培养的学者站在中国的土地上采用自己提出的控制理论完成的一项世界领先水平的科研成果。9.使用几种智能控制算法相结合实现倒立摆的控制,比如模糊自适应控制,分散鲁棒自适应控制,仿人智能控制等等;10.采用遗传算法与神经网络相结合的方法,首先建立倒立摆系统的数学模型,然后为其设计出神经网络控制器,再利用改进的遗传算法训练神经网络的权值,从而实现对倒立摆的控制,采用 GA 学习的 NN 控制器兼有NN 的广泛映射能力和 GA 快速收敛以及增强式学习等性能。1.4论文的主要内容本文主要研究二级倒立摆的数学模型的建立与分析,并对倒立摆系统进行控制方法的研究。2主要介绍了对倒立摆的建模3主要介绍了最优二次算法,4阐述了遗传算法及其应用,5主要实现matlab仿真与实物演示的对比且进行了实物演示。2倒立摆数学模型的建立与分析2.1数学建模的方法所谓系统的数学模型就是利用数学结构来反映系统内部之间、内部与外部某些因素之间的精确的定量的表示。它是分析、设计、预报和控制一个系统的基础,所以要对一个系统进行研究,首先要建立它的数学模型。建立倒立摆系统的模型时,一般采用牛顿运动规律,结果要解算大量的微分方程组,而且考虑到质点组受到的约束条件,建模问题将更加复杂,为此本文采用分析力学方法中的Lagrange方程推导倒立摆的系统模型。Lagrange方程有如下特点:1.它是以广义坐标表达的任意完整系统的运动方程式,方程式的数目和系统的自由度是一致的。2.理想约束反力不出现在方程组中,因此在建立运动方程式时,只需分析已知的主动力,而不必分析未知的约束反力。3.Lagrange方程是以能量观点建立起来的运动方程,为了列出系统的运动方程,只需要从两个方面去分析,一个是表征系统运动的动力学量系统的动能,另一个是表征主动力作用的动力学量广义力。因此用Lagrange方程来求解系统的动力学方程可以大大简化建模过程。2.2二级倒立摆的结构和工作原理如图2.1,系统包括计算机、运动控制卡、伺服机构、倒立摆本体(小车,上摆,下摆,皮带轮等)和光电码盘几大部分,组成了一个闭环系统。光电码盘1将小车的位移、速度信号反馈给伺服驱动器和运动控制卡,下面一节摆杆(和小车相连)的角度、角速度信号由光电码盘2反馈回控制卡和伺服驱动器,上面一节摆杆的角度和角速度信号则由光电码盘3反馈。计算机从运动控制卡中读取实时数据,确定控制决策(小车向哪个方向移动、移动速度、加速度等),并由运动控制卡来实现该控制决策,产生相应的控制量,使电机转动,带动小车运动,保持两节摆杆的平衡。图2.1 系统结构和工作原理图2.3拉格朗日运动方程拉格朗日提出了用能量的方法推导物理系统的数学模型,首先我们引入广义坐标,拉格朗日方程。广义坐标: 系统的广义坐标是描述系统运动必需的一组独立坐标,广义坐标数等同于系统自由度数。如果系统的运动用n维广义坐标q1,q2,qn来表示,我们可以把这n维广义坐标看成是n维空间的n位坐标系中的坐标。对于任一系统可由n维空间中的一点来表征。系统在n维空间中运动形成的若干系统点连成一条曲线,此曲线表示系统点的轨迹。拉格朗日方程: (2.1)式中,拉格朗日算子,系统的广义坐标,系统的动能,系统的势能。拉格朗日方程由广义坐标和表示为: (2.2)式中,系统沿该广义坐标方向上的外力,在本系统中,设系统的三个广义坐标分别是。 2.4推导建立数学模型在推导数学模型之前,我们需要几点必要的假设:1.上摆、下摆及小车均是刚体;2.皮带轮与传动带之间无相对滑动;传动皮带无伸长现象;3.小车运动时所受的摩擦力正比于小车的速度;4.小车的驱动力与直流放大器的输入成正比,且无滞后,忽略电机电枢绕组中的电感;5.下摆转动时所受到的摩擦力矩正比于下摆的转动速度;6.上摆运动时所受到的摩擦力矩正比于上摆对下摆的相对角速度;二级倒立摆的运动分析示意图如图2.2yxxFm1m3m2M图2.2 二级倒立摆运动分析示意图倒立摆系统参数如下:M=1.096Kg 小车系统的等效质量=0.05Kg 摆杆1 质量=0.0775m 摆杆1 转动中心到杆质心距离m2=0.13Kg 摆杆2 质量l2=0.25m 摆杆2 转动中心到杆质心距离=0.236Kg 质量块质量 F:作用在系统上的外力:摆杆1 与垂直向上方向的夹角 :摆杆2 与垂直向上方向的夹角首先,计算系统的动能: (2.3)小车动能: (2.4)摆杆1动能: (2.5)式中, (2.6) (2.7)则 (2.8)摆杆2动能: (2.9)式中, (2.10) (2.11) (2.12)质量块动能: (2.13)因此,可以得到系统动能: (2.14)系统的势能为:(2.15)至此得到拉格朗日算子: (2.16)由于因为在广义坐标上均无外力作用,有以下等式成立: (2.17) (2.18)展开(2.17)、(2.18)式,分别得到(2.19)、(2.20)式 (2.19) (2.20)将(2.19)、(2.20)式对求解代数方程,得到以下两式 (2.21) (2.22)表示成以下形式: (2.23) (2.24)取平衡位置时各变量的初值为零, (2.25)将(2.23)式在平衡位置进行泰勒级数展开,并线性化,令 (2.26) (2.27) (2.28) (2.29) (2.30) (2.31) (2.32)得到线性化之后的公式 (2.33)将在平衡位置进行泰勒级数展开,并线性化,令 (2.34) (2.35) (2.36) (2.37) (2.38) (2.39) (2.40)得到 (2.41)即: (2.42) (2.43)现在得到了两个线性微分方程,由于我们采用加速度作为输入,因此还需加上一个方程: (2.44)取状态变量如下: (2.45)则状态空间方程如下: (2.46)将以下参数代入 M=1.096Kg =0.05Kg m2=0.13Kg =0.0775m l2=0.25m =0.236Kg 求出各个值:=86.69 =-40.31=-21.62 =39.45=6.64 =-0.088 得到状态方程各个参数矩阵: A=B=C=D= 2.5 二级倒立摆系统性能分析 2.5.1 能控性分析对于线形状态方程 (2.49)其能控性矩阵为: (2.50)求的秩 (2.51)所以系统是完全能控的。2.5.2 能观性分析其能观性矩阵为: (2.52)求OM 的秩rank(2.53)所以系统是完全能观的。可控性矩阵的条件数决定系统控制的难控程度,条件数越大,系统越难控制。可控性矩阵的条件数为: (2.54)前面能控性和能观性的判断毕竟是针对线性化后的数学模型。实际的倒立摆的非线性很重,同时一些参数(如转动惯量等)的数值并不一定准确,另外一些参数(如摩擦力矩系数)也不准确,对象的条件数较大,这些因素都使得二级倒立摆的实际控制比较难以实现。3 线性二次最优控制算法简介最优控制就是在一定条件下,在完成所要求的控制任务时,使系统规定的性能指标具有最优值的一种控制。对于线性系统,若取状态变量的二次型函数的积分做为系统的性能指标,这种系统最优化问题称为线性系统二次型性能指标的最优控制问题,简称线性二次型(LQR)问题。线性二次型控制理论已成为反馈系统设计的一种重要工具。3.1线性二次型最优调节器原理设给定线性系统的状态方程为: (3.1)其中:状态向量,是矩阵;控制向量,是矩阵;输出向量,是矩阵;A系统矩阵,是矩阵;B控制矩阵, 是矩阵;C输出矩阵,是矩阵;若用表示系统的期望输出,则从系统的输出端定义: (3.2)为系统的误差向量,是矩阵。求取最优控制,使基于误差向量e构成的指标函数: (3.3)取最小值,其中S为对称半正定矩阵,Q为对称半正定矩阵,R为对称半正定矩阵。它们是用来权衡向量e(t)及控制向量U(t)在指标函数J中重要程度的加权矩阵。其中各项所表示的物理意义简述如下:1.被积函数中的第一项是在控制过程中由于误差的存在而出现的代价函数项。由于加权矩阵Q是对称半正定的,故只要误差存在,该代价函数总为非负。它说明,当e(t)=0时,代价函数为零;而误差越大,则因此付出的代价也就越大。如误差为标量函数e(t),则项变成。于是,上述代价函数的积分便是在古典控制理论中熟悉的用以评价系统性能的误差平方积分准则。2.被积函数中的第二项是用来衡量控制作用强弱的代价函数项。由于加权矩阵R是对称正定,故只要有控制U(t)存在该代价函数总是正的,而且控制U(t)越大,则付出的代价也越大。注意,加权矩阵Q和R的选取是立足提高控制性能与降低控制能量消耗的折衷考虑上的。这体现在,如果重视提高控制性能,则应增加加权矩阵Q的各个元素;反之,如果重视降低控制能量的消耗,则需增大加权矩阵R各个元素。3.指标函数的第一项是在终端时刻上对误差要求设置的代价函数。它表示在给定终端时刻到来时,系统实际输出y(t)接近期望输出的程度。综上所述,具有二次型指标函数的最优控制问题,实际上在于用不大控制能量来实现较小的误差,以在能量和误差两个方面实现综合最优。因为在倒立摆系统中CI,及0,则有 (3.4)并且倒立摆的控制是时线性定常系统的状态调节问题,所以指标函数可以等价为: (3.5)采用反馈控制: (3.6)其中 (3.7)其中,P为满足Riccati方程的唯一正定对称解: (3.8)综上所述,系统的设计步骤可概括如下:1.求解式(3.8)Riccati方程,求得矩阵P。如果正定矩阵P存在,则系统是稳定的或矩阵A-BK 是稳定的。2.将此矩阵P代入方程式(3.7),得到的即为最优反馈增益矩阵K。3.2 加权阵Q、R的选择在利用LQR方法设计控制器时,一个最关键的问题是二次型性能指标的选取。二次型性能指标与实际工程意义的品质指标间的联系至今未完全建立。因此,确定加权阵Q, R是一项重要且困难的工作。一般来说,加权矩阵Q和R的选取是在立足提高控制性能与降低控制能量消耗的折衷上考虑的。为了使问题简单,且使加权阵Q和R的各元素有明显的物理意义,通常将加权阵Q和R选为对角阵。这样可以看出是对状态X平方的加权,相对增大就意味着对X的要求较严;R是对控制量u的平方的加权,当R相对较大,意味着控制费用增高,使得控制能量较小,反馈减弱,当R相对很小时,控制费用较低,反馈增强,系统动态响应迅速。对于二级倒立摆系统,二次型性能指标应能使其在调节过程中不偏离倒立摆的控制区域且尽可能在系统的线性范围内,根据前面对二级倒立摆运动分析,在考虑倒立摆系统的各个状态时,上摆偏角应比下摆的偏角重要,下摆的偏角应比小车的位移x重要,因此要在选择加权矩阵Q和R时反映这些要求。4 遗传算法遗传算法(Genetic Algorithms,简称GA)是一种基于生物界中的自然选择原理和自然遗传机制的随机搜索算法18。它模拟了生物界中的生命进化机制,并用在人工系统中实现特定目标的优化。这是一种在思想和方法上别开生面的全新优化搜索算法。传统的优化搜索算法往往要求所求的函数具有连续、可微的性质,有要求搜索空间及噪声相对较小的限制。而遗传算法不受问题性质的限制,可以在巨大的空间上实行概率性搜索,能在搜索的过程中自动获取和积累有关搜索空间的指示,并自适应地控制搜索过程,以求得最优解或较优解。遗传算法的这种特点使得它能够处理许多复杂问题,具有广泛的适用性和鲁捧性。在自动控制、组合优化、模式识别、机器学习、人工生命、管理决策等许多领域都得到了广泛的应用19,20。近年来,自动控制己成为遗传算法最活跃的研究领域之一,包括PID控制、最优控制、自适应、鲁棒控制、模糊控制、神经网络控制及系统辨识等许多分支21,22。越来越多的研究人员开始研究用遗传算法及其改进算法解决控制领域中的难题。在科技高速发展的今天,对大规模的、复杂的、不确定性的系统进行有效控制的要求在不断提高,如何准确方便地优化各种控制方法中控制器的结构和参数己成为迫切需要解决的问题。尽管遗传算法经过几十年的理论及应用研究已获得了大量的成果,但其理论基础仍较薄弱,一些参数的选取还要依靠实验经验的积累。因此,对遗传算法本身及其解决控制问题的能力的深入研究具有重要的现实意义。4.1 遗传算法的基本理论遗传算法最早是由美国Michigan大学的John Holland和他的同事及学生提出的。它将“适者生存”的理论引入到搜索过程中,实现编码串之间有组织但又随机的信息交换。其基本思想是模仿生物界中基因的复制、交叉和变异的行为,以获得离散搜索或者参数寻优的结果。生物个体的所有信息都包含在基因中,种群经过一代代的进化,优胜劣汰。不适应环境的基因被淘汰,具有竞争力的个体则生存下来并得以繁衍后代。如果把待定的参数与生物个体进行对应,就能比较容易地理解遗传算法的基本原理了。待定参数决定了系统的性能,参数寻优的目的就是要获得使系统性能最佳的一组参数。把一组参数下系统的性能指标函数看成是这组参数对环境的适应能力,性能指标好的个体具有强的生存能力并遗传给后代,指标差的个体的生存能力较弱。这样,经过很多代的进化,最后存活的个体必定是最适应环境的,其生存能力最强。遗传算法的主要特点是群体搜索策略和群体中个体之间的信息交换,搜索不依赖梯度信息,也不需要求解函数可微,只需要该函数在约束条件下可解,因此该方法尤为适用于处理传统方法难以解决的复杂和非线性问题。4.2 基本遗传算法基本遗传算法(Standard Genetic Algorithms,简称SGA)是Goldberg总结出的一种最基本的遗传算法,其工作流程和结构形式是Goldberg在天然气管道控制优化应用中首先提出的。它只使用选择算子、交叉算子和变异算子这三种基本的遗传算子,其遗传进化操作简单,容易理解,是其它一些遗传算法的雏形和基础,也是研究各种遗传算法性能和优缺点的对象。在实际应用中,可结合具体领域知识和问题特征对SGA进行改进,增强SGA的功能和解决问题的能力,以形成各式各样的具体的GA。遗传算法的出发点是一个简单的群体模型,该模型满足以下假设23:(1)染色体由一固定长度的字符串组成,其中的每一位有有限数目的等位基因。(2)群体由有限数目的基因型个体组成。(3)每一个基因型个体有一相应的适应度,表示该个体的生存与复制能力。适应度为大于零的实数,适应度越大表示生存能力越强。基本遗传算法的特点是采用轮盘赌选择方法(适应度比例法),单点交叉,位点变异,群体中允许有相同的个体存在。遗传算法的实现是一个迭代过程,它以编码空间代替问题空间,以适应度函数为评价依据,以群体为进化基础,以对群体中个体的位串的遗传操作实现选择和遗传机制,通过随机重组位串中的重要基因,使群体不断进化,最终达到求解目的。4.3基本遗传算法的局限性基本遗传算法采用二进制编码二进制编码优点很多,简单、易于实现,符合最小字符集编码原则,有较强的通用性,但它不反映所求问题的结构特征,无法利用具体领域的特定知识,遗传算子可选择的操作方式有限,精度也不太高。选择采用轮盘赌方法,当群体适应度差异非常大时,最佳个体的生存机会显著增高,较差个体的生存机会被剥夺,使最佳个体很快充满整个群体。遗传算法也较早地丧失了进化能力。根据模式定理,即使基本GAs搜索到最优解,但在交叉和变异算子的作用下仍然可能在生成下一代群体的过程中丢失,当前群体中最优解被破坏的概率与群体规模和迭代次数成反比。文献24证明了在交叉概率Pc(O,1),变异概率Pm(0,1),且采用轮盘赌方法的基本遗传算法是不能收敛到全局最优解的。另外,针对不同问题,仅采用单点交叉和基本位变异的方法是远远不够的,其中交叉是遗传算法生成新群体,带动群体进化的主要方法,是遗传算法的核心,变异是维持群体多样性,突破局部极值的重要手段,两算子的操作方式对整个GA的影响捆当大,应根据具体问题选择设计适当的操作方式。SGA采用固定的控制参数,在处理复杂问题时,很难同时兼顾搜索范围广和搜索速率快的矛盾,容易陷入局部极值或使搜索时间增长,Grefenstette25采用一组测试函数进行了大量的实验,试图发现一组通用的或具有普适性的最佳参数,但结果表明。这样的参数很难找到,因此,采用固定参数的GA有很多值得改进的地方。4.4遗传算法的求解步骤1.编码、初始化首先要把问题的解表示成为遗传算法可以接受的格式,即2进制或字符串的格式。接着产生初解群,即串或个体的集合。这个初始的群体也就是问题假设解的集合,也称为初始群体。通常以随机方法产生初始群体。问题的最优解将通过这些初始假设解进化而求出。2.选择这是从群体中选择出较适应环境的个体。这些选中的个体用于繁殖下一代。故有时也称这一操作为再生(Reproduction)。由于在选择用于繁殖下一代的个体时,是根据个体对环境的适应度而决定其繁殖量的,故也称为非均匀再生(Differential Reproduction)。适应度准则体现了适者生存,不适应者淘汰的自然法则。给出目标函数f,则f(a)称为个体a的适应度。适应度较高的个体,繁殖下一代的数目较多。适应度较小的个体,繁殖下一代的数目较少,甚至被淘汰。这样,就产生了对环境适应能力较强的后代。对于问题求解角度来讲,就是选择出和最优解较接近的中间解。3.交叉对于选中用于繁殖下一代的个体,随机地选择两个个体的相同位置,在选中的位置实行交换。这个过程反映了随机信息交换,目的在于产生新的基因组合,也即产生新的个体。交叉时,可实行单点交叉或多点交叉。例如有个体:S1=100101 S2=010111,选择它们的左边3位进行单点交叉操作,则有=010101 =100111 4.变异根据生物遗传中基因变异的原理,对某些个体的某些位执行变异。在变异时,对执行变异的串的对应位求反,即把1变为0,把0变为1。例如有个体:S=101011,对其第1,4位置的基因进行变异,则有=001111。单靠变异不能在求解中得到好处。但是,它能保证算法过程不会产生无法进化的单一群体。因为所有个体都一样时,交叉无法产生新的个体,这时只能靠变异产生新的个体。也就是说,变异增加了全局优化的特质。5.全局最优收敛当最优个体的适应度达到给定的阀值,或者最优个体的适应度和群体适应度不再上升时,则算法的迭代过程收敛、算法结束。否则,用经过选择、交叉、变异所得到的新一代群体取代上一代群体,并返回到第2步即选择操作处继续循环执行。遗传算法的求解流程如图4.1所示:4.5遗传算法的特点遗传算法具有以下几个特点1.遗传算法从问题的候选解集合开始搜索,而不是从单个解开始。这是遗传算法与传统优化算法的极大区别。传统优化算法是从单个初始值开始迭代求最优解的,容易误入局部最优解。遗传算法从初始群体开始搜索,覆盖面大,利于全局择优。2.遗传算法求解时使用特定问题的信息极少,容易形成通用算法程序。由于遗传算法使用适应值这一信息进行搜索,并不需要问题导数等与问题直接相关的信息。遗传算法只需适应度和串编码等通用信息,故几乎可处理任何问题。3.遗传算法有极强的容错能力。遗传算法的初始群体本身就带有大量与最优解甚远的信息。通过选择、交叉、变异操作能迅速排除与最优解相差极大的串,这是一个强烈的滤波过程,并且是一个并行滤波机制。故而,遗传算法有很高的容错能力。4.遗传算法中的选择、交叉和变异都是随机操作,而不是确定的精确规则。这说明遗传算法是采用随机方法进行最优解搜索,选择体现了向最优解迫近,交叉体现了最优解的产生,变异体现了全局最优解的覆盖。YESNO生成初始群体计算适应度选择交叉变异满足终止条件?开始结束Gen=Gen+1Gen=0计算适应度 图4.1 遗传算法的求解流程4.6遗传算法的应用关键遗传算法在应用中最关键的问题有如下3个:1.串的编码方式这本质是问题编码。一般把问题的各种参数用二进制编码,构成子串,然后把子串拼接构成“染色体”串。串长度及编码形式对算法收敛影响极大。2.适应度函数的确定适应度函数也称对象函数,这是题求解品质的测量函数,往往也称为问题的“环境”。一般可以把问题的模型函数作为对象函数,但有时需要另行构造。3.遗传算法自身参数设定遗传算法自身参数有3个,即群体大小M、交叉概率Pc和变异概率Pm。群体大小M太小时难以求出最优解,太大则延长收敛时间,一般情况下专家建议n=20200。交叉概率Pc和变异概率都取为20。4.7遗传算法优化加权阵采用遗传算法优化加权阵的具体步骤如下:1.确定参数的染色体编码方法。将Q矩阵的对角线6 个元素作为待寻优参数,采用长度为10 位的二进制编码串来分别表示这6个参数,然后将这些二进制编码串连接在一起,组成一个610 位长的二进制编码串;取R =5;2.确定解码方法。解码时需先将810 位长的二进制编码串切断为6个10 位长的二进制编码串,然后分别将它们转换为对应的十进制整数代码;3.确定优化目标函数的类型及数学描述形式。在LQR最优控制中取目标函数为,这里为4.设计遗传算子。选择运算采用比例选择算子,交叉运算采用单点交叉算子,变异运算采用基本位变异算子;5.选取遗传算法的控制参数。设群体大小为300,最大迭代次数为1000,交叉概率选为0.9,变异概率选为0.1并随机产生初始群体; 6.确定个体评价方法。在本设计中将适应度取为目标函数值的倒数,即 ; 7.进行遗传算法搜索过程,即采用随机采样的方法选择个体、通过交叉和变异产生新个体、再计算新个体的目标函数值;8.如果收敛条件满足(即超过给定的最大代次),则结束算法;否则,重复7。通过上述算法就确定了使目标函数值最小加权矩阵Q 中的待优化元素的值,从而确定反馈控制规律的向量K 。5 二级倒立摆LQR控制设计及仿真5.1 二级倒立摆控制系统框图对二级倒立摆采用LQR控制设计,确定系统的状态反馈,其系统的框图如图5.1所示。- KNx-+uy图5.1 二级倒立摆控制系统的框图输出y ,即小车的位移,一级、二级摆与竖直方向的夹角。控制器设计时,系统输入为单位阶跃输入。系统运行时,通过控制器的调节,小车可以达到指定位置,摆杆可以回到竖直位置。用LQR控制,其关键问题是加权阵的选择,本文针对加权阵的确定方式对二级倒立摆系统进行仿真研究。5.2 任选加权阵的LQR最优控制仿真实现最优控制的具体程序参见附录的最优控制法M文件。1. 当加权矩阵:Q= ,R=0.1时,反馈矩阵: k= ,仿真结果如图5.2所示,实际曲线如图5.3所示。2. 当加权矩阵:Q= ,R=0.1时, 反馈矩阵: k=, 仿真结果如图5.4所示,实际曲线如图5.5所示。3.当加权矩阵:Q= ,R=1时,反馈矩阵: k=, 仿真结果如图5.6所示,实际取下如图5.7所示。图5.2 最优控制第一组仿真5.3 实际仿真图1图5.4 最优控制第二组仿真图图5.5 实际仿真图2图5.6 最优控制第三组仿真图图5.7实际仿真图3通过三组仿真图象的对比,当R 不变而Q 变大时,调整时间减少,超调量减小,摆杆的角度变化也减小,上升时间也同时减小;当Q 不变而R 增大时,倒立摆系统的调整时间与超调量增大,上升时间也同时增大;显然,当Q 和R 的变化与上述两种情况相反时,结论恰好相反。5.3用遗传算法优化Q阵的仿真结果实现遗传算法的具体程序参见附录的遗传算法M文件。优化前加权矩阵:Q=,遗传算法优化后加权矩阵:Q=反馈矩阵:K= 8.5659 167.2183 -256.0237 15.6702 6.5208 -42.2482 仿真曲线如图5.8所示,实际曲线如图5.9所示。图5.8 优化前后优化后的响应曲线图5.9实际曲线图从上图可以看出经过遗传算法优化后的系统响应的速度加快,超调量明显减少,稳定时间和上升时间有所减少,系统的动态性能和静态性能经过遗传算法优化后的要比没有优化的控制效果好了很多。 5.4 实物演示图5.10半实物仿真框图图5.11实物演示1图5.12实物演示2结论倒立摆系统作为典型的非线性、多变量、强耦合、自然不稳定系统,是研究控制理论的理想实验手段。随着科学技术的迅猛发展,对控制系统性能的要求不断提高,非线性控制和智能控制业已成为控制界研究的热点问题。本文首先阐述了与倒立摆系统有关的国内国外现状以及研究倒立摆系统的可行性及必要性,给出了其实际的物理背景。然后,借助拉格朗日方程,建立了二级倒立摆的数学模型,并通过线性化,得到了二级倒立摆系统的状态空间模型。应用现代控制理论,分析了倒立摆的稳定性、能控性、能观性。随后采用二次型最优控制理论研究了倒立摆控制问题,并且运用遗传算法优化加权矩阵得到更好的控制效果。并进行了Matlab仿真,通过优化前后优化后的响应曲线可以看出经过遗传算法优化后的系统响应的速度加快,超调量明显减少,稳定时间和上升时间有所减少,系统的动态性能和静态性能经过遗传算法优化后的要比没有优化的控制效果好了很多。最后在实验台上进行了
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!