基于神经网络自学习的PID控制算法研究学士学位论文

上传人:无*** 文档编号:88736719 上传时间:2022-05-11 格式:DOC 页数:63 大小:955.52KB
返回 下载 相关 举报
基于神经网络自学习的PID控制算法研究学士学位论文_第1页
第1页 / 共63页
基于神经网络自学习的PID控制算法研究学士学位论文_第2页
第2页 / 共63页
基于神经网络自学习的PID控制算法研究学士学位论文_第3页
第3页 / 共63页
点击查看更多>>
资源描述
沈阳理工大学学士学位论文 摘 要PID(比例-积分-微分)控制器作为最早实用化的控制器已有50年以上的年历史,现在仍然是应用最广泛、最普遍的工业控制器。PID控制器简单易懂,使用中不需精确的物理系统模型等先决条件,因而成为最受欢迎的、应用最为普遍的控制器。PID控制器最早发展起来的原因,是由于其算法简单、鲁棒性好和可靠性高,被广泛应用于过程控制和运动控制中,特别适用于可建立精确数学模型的确定性控制系统。但是常规的PID控制器参数往往整定欠佳、性能不良,对运行环境的适应性很差。而神经网络具有很强的非线性映射能力、自学习的能力、联想记忆的能力、并具有可行批量信息处理方式及良好的容错性能。本次本课题设计的目的就是为了建立一种单神经网络的PID控制器,使得人工神经网络与传统PID控制相结合互相补充,共同提高控制质量、以及控制效率并利用Matlab软件进行仿真。关键词:PID控制;神经网络PID;RBF算法;MATLAB仿真 ABSTRACT The PID ( PID ) controller as the first practical controller has 50 years of history, is still the most widely used industrial controller. The PID controller is simple and easy to understand, without the use of accurate system models prerequisites, and thus become the most widely used controller. The PID control room is the earliest developed one of the control strategy, because of its simple algorithm, good robustness and high reliability, is widely used in process control and movement control, especially can be applied to establish the precise mathematical model of uncertainty control system. But the conventional PID controller parameters often setting bad, poor performance, the operating condition adaptability is poor. While the neural network has very strong nonlinear mapping ability, self-learning ability, the capacity of associative memory, parallel information processing and fine fault-tolerant performance. This topic design proposed is to establish a single PID neural network controller, the artificial neural network and traditional PID control are combined to complement each other, work together to improve the control quality, and the use of Matlab software simulation.Key words: PID control;neural network PID ;RBFalgorithm ; MATLAB simulation目 录 1 绪论1.1 课题研究背景11.2 课题研究意义21.2.1 感知模式识别21.2.2 具有容错和容差能力21.2.3 神经网络在工作时具有高速度和潜在的超高速31.2.4 PID神经元对现有神经元类型的补充和完善31.3 课题目前研究现状31.3.1 采用神经元网络确定PID参数31.3.2 单神经元结构PID控制器41.4 本文的主要任务及研究内容51.4.1 分析了传统控制的局限性51.4.2 分析了神经元网络应用于控制中的不足之处51.4.3 分析了传统PID控制的特点及其改进方法的研究现状61.4.4 建立了基于BP神经网络整定的控制62 神经网络72.1 神经网络的基本概念72.1.1 时空整合功能82.1.2 动态极化性82.1.3 兴奋与抑制状态82.1.4 结构的可塑性92.1.5 脉冲与电位信号的转换92.1.6 突触延期和不应期92.1.7 学习、遗忘和疲劳92.2 人工神经元模型92.3 神经网络的结构112.3.1 前馈型网络122.3.2 反馈型网络122.4 神经网络的工作方式132.5 神经网络的学习142.5.1 学习方式142.5.2 学习算法142.5.3 学习与自适应163 PID控制器163.1 传统控制理论的局限性163.1.1 不适用于不确定性系统的控制173.1.2 不适应非线性系统的控制173.1.3 不适应时变系统的控制173.1.4 不适应多变量系统的控制173.2 PID控制概述183.3 PID控制的原理和特点183.4 PID控制的预置和参数整定203.4.1 比例增益P203.4.2 积分时间I213.4.3 微分时间 D213.5 PID参数的调整原则213.6 PID工作应注意问题223.7 PID控制的意义及其应用224 基于RBF神经网络整定的控制及MATLAB仿真234.1 MATLAB 语言简介234.1.1 MATLAB 概述234.1.2 MATLAB语言特点244.2 神经网络工具箱函数244.3 基于simulink的神经网络控制254.3.2 滚动优化254.3.3 反馈校正254.4 RBF神经网络264.4.1 RBF神经网络介绍264.4.2 RBF网络结构264.4.3 RBF网络特点264.4.4 RBF网络函数的逼近274.4.5 RBF网络的学习算法294.4.6 RBF网络PID整定原理304.4.7 仿真实例31结论35致谢36参考文献37附录A39 附录B53V 1 绪论从二十世纪四十年代以来,传统经典的控制理论得到了飞速的发展。并且形成了较为完整和详细的理论体系,同时在工业生产中得到了普遍的运用。近几十年,为了解决军事、航天、工业系统等复杂的控制要求,控制理论以日新月异的速度飞快的发展起来,经历了现代控制理论和大系统理论两个重要的的发展阶段。但是,它对精确数学模型的依赖性,以及在具体工况下的实用性应用受到了很大的限制。无论是现代控制理论还是大系统控制,其分析、综合和设计都是建立在严格的和精确的数学模型基础之上。而在科学技术和生产力水平快速发展的今天,人们对大规模、多变、复杂和不确定性系统实行自动控制的要求逐步的提高。故而,传统的基于精确数学模型的控制理论的局限性日益明显。为了更好的适应时代的发展和控制技术的要求,我们需要转向更加实用可行的PID控制。PID控制是最早发展起来的控制策略之一,由于其鲁棒性好、算法简单、及可靠性高,被普遍应用于过程控制和运动控制中,尤其适用于可建立精确数学模型的确定性系统。然而传统PID控制器不能达到理想的控制要求,而在实际生产过程中由于受到参数整定方法繁杂的干扰,常规PID控制器参数往往整定欠佳、性能不良,对运动工况的适应性很差。为了克服常规PID控制的缺点,控制界已经提出了大量的针对PID控制的改进方案,例如自校正的PID控制、广义预测的PID控制、模糊的PID控制、专家的的PID控制、智能PID控制等。以上各种方案的理论依据不同,研究方向也尽不相同,但是它们的共同点都是针对如何选取和整定PID控制参数,都是在保持传统PID控制器结构不变的基础上,采用新的手段在线或离线整定PID参数,这些方法在一定程度上提高了PID控制器的性能和效果,但这些方案一般都是针对某些具体问题,所以缺乏通用性,附加的结构或者算法也增加了控制器的复杂性,使它们的广泛应用受到了限制。但是,随着神经元网络的研究、应用和发展,人们开始采用神经元网络和PID控制相互结合,以便改进传统PID控制的性能,这种研究已经取得了一些进展和成果。1.1 课题研究背景不管是神经网络还是pid控制技术,都是由国外的技术传入中国。神经网络仍然出于理论型研究范围,这些方面都是比较理论的。神经网络系统理论的发展是缓慢与不平衡的。神经网络发展的第一次热潮是自1943年M-P模型开始的,至该世纪60年代结束,这一段时间可以称为神经网络系统理论发展的初期阶段,这个时期的主要特点是多种神经网络的模型的产生与学习算法的确定。1957年Rosenblantt提出了感知器(Perceptron)理论模型;1962年Widrow提出了自适应(Adaline)线性元件理论模型等等。这些模型和算法在很大程度上丰富了神经网络系统理论。第二次热潮是在1982年,在美国科学院的刊物上发表了著名的Hopfield模型理论,这是一个非线性动力系统的理论模型,它引起了各国科学家的关注,并试图将这一数学模型进行电子学或者光学的硬件实现,这就形成了人工神经网络的重点研究。迄今为止的神经网络研究总的来说可分为三大方向。1)探究人脑神经系统的生物结构和大脑机制,这实际上是神经网络理论的初衷。2)应用微电子学或者光学器件形成特殊功能网络,这主要是新一代计算机制造领域所关注和重视的问题。3)将神经网络理论作为一种解决某些问题的手段和方法的必要性,这些问题在利用传统方法时或者无法解决,或者在处理计划上尚存困难。1.2 课题研究意义研究在深入的了解了神经网络与传统PID控制的发展历史和目前的发展状况后,使得当下研究这个课题具有重要的意义。1.2.1 感知模式识别 神经网络进过调试能有效提出信号、图像、语音、声纳等易感知模式的特征,并能解决现有启发性模式识别系统不能很好解决的不变量探索、自适应、抽象概括的问题,神经网络已在遥感、计算机视觉、语音识别、医学图像分析、计算机输入装置等方面有了新的应用。1.2.2 具有容错和容差能力每个神经元和每个连接对网络的整体功能的贡献是微小的以致于少量神经元和连接发生故障对整体功能的影响很小。此外神经元激活函数的“压扁特性又高概率地把这种影响压缩到最低限度从而使整个同络具有较强的鲁棒性(硬件容错性能)。另一方面输入向量中每个分量对同络输出的贡献是散小的所以少量分量有偏差对同络输出影响很小。同时,激活函数的“压扁 特性把这种影响进一步压缩到最低限度使整个同络的容差能力增强 。1.2.3 神经网络在工作时具有高速度和潜在的超高速神经网络体系的结构上的两大特性数据处理的超大规摸并行性和数据存储分布性 完全消除丁冯诺依曼体系结掏中存在的 处理器一存储器瓶颈”从而在工作时具有高速度另一方面。一旦用VLSI技术或(和)光学技术实现了神经同络(这是可能的)。神经同络的工作过程就成为实际系统状态的演化过程1.2.4 PID神经元对现有神经元类型的补充和完善目前应用较多的神经元模型,一般只考虑了神经元的静态特性,只把神经元看作是具有静态输入-输出映射关系的单元,只能处理静态信息。对于动态信息处理,一般只是通过神经元网络的互联方式的动态结构进行。PID神经元中,不仅有具有静态非线性映射功能的比例元,还有可处理动态信息的微分元和积分元。PID神经元即具有一般神经元的共性,但具备着不同的特征,尤其是积分元和微分元的引入,使作为数学基石的微积分概念同神经元网络的基本单元相融为一体,增强了神经元处理信息的能力,充实和完善了神经元的种类和功能,使神经元网络的行为更加丰富多样化。1.3 课题目前研究现状近年来,随着神经网络的研究和应用,人们开始将神经元网络和传统PID控制相互结合,以便改进传统PID控制的性能,并且已经取得了一些研究成果。目前已经提出的神经元网络和PID控制相结合的方法可以归结为两种类型:一、采用神经元网络整定PID参数;二、单神经元结构的PID控制器。这两种类型分别具有各自的特点和不足之处,如下所述:1.3.1 采用神经元网络确定PID参数这种方法和上述其他改进方案类似,是在传统的PID控制器的基础上符合一个或者多个神经元网络,利用神经元网络的自学习功能确定和调整PID参数,其结构如图所示。由图1.1可知,此控制器分为两个部分:一部分为虚线内部部分,按传统PID控制器的结构,对系统偏差信号进行比例、积分和微分处理并进行加权重值相加,这些权重值即为比例、积分和微分系数;另一部分则为神经网络,普遍采用多层前向网络,此网络根据系统的输入和输出信息,通过不断的学习和调整,提供第一部分所需要的PID参数。被控对象神经网络 图1.1 神经元网络和PID控制现有结合方式一1.3.2 单神经元结构PID控制器单神经元结构PID控制系统的结构如下图所示,三个并联为单神经元网络,它不承担比例、积分、微分的处理工作,它的输入信号分别为系统偏差、偏差的积分和微分,其单神经元的输入权重值一一对应比例、积分、微分系数。 W2被控对象 W1 W3 图1.2 神经元网络和PID控制现有结合方式二比较图1.1和图1.2可知,单神经元结构PID控制器的形式与传统PID控制器的形式是相同的,所不同的是传统PID控制器的比例、积分、微分参数是预先给定的和固定的,而单神经元结构PID控制器的比例、积分、微分参数对应网络的连接权重值,可按某种算法改变。虽然单神经元结构PID控制器的结构简单、容易实现,也具备神经元网络的些许优势,但它也有本质性的弱点。一方面,它依然是一种可选择PID控制器参数的方法。另一方面,这种网络类似于单层感知器,需要用Delta算法来修正权重值。这种单层网络只具备线性分类能力,不能进行简单的异或逻辑运算,更不具备任意函数的逼近能力,这种控制器在复杂系统的控制中难以达到良好的性能。以上所述的两种类型的神经元网络和PID控制的结合方式还有一个共同的不足之处,就是它们尚没有应用于多输入多输出的多变量系统控制,目前的研究结果都是在一些比较简单的单变量系统的控制应用方面。1.4 本文的主要任务及研究内容1.4.1 分析了传统控制的局限性传统控制方法对于一些已知的、线性时不变的、或近似线性的单变量系统控制是行之有效的,但是对于非线性的、多变量的时变的、复杂系统的控制无能为力了,对于参数、结构未知的控制系统也无能为力。其主要原因是由于传统控制是基于模型控制,传统控制器的设计前提就是被控系统特性完全已知且能建立精确的数学模型,而且只对对象具有线性模型时的控制方法是比较成熟的。由于在实际的控制系统中,被控对象的已知性、时不变、线性等条件往往难以满足或全部满足,因而局限了传统控制的应用,也促进建立和发展新的控制理论及其控制方法。1.4.2 分析了神经元网络应用于控制中的不足之处神经元网络的本质性非线性特征和并行结构以及其自学习功能,可以处理那些难以用精确模型或者详细描述的系统信息,使它在复杂系统的控制反面具有显著优势。但是,传统神经元网络也存在着欠缺之处,主要包括:收敛速度较慢,学习时间长,结构选取主要靠经验和试验,连接权重初值为随机数,容易陷入局部极小、静态网络和动态控制性能的矛盾,神经元网络的结构、参数、机能难以和控制系统的性能要求相对应,等等。这些不足之处使传统神经元网络难以在控制系统中普遍应用。1.4.3 分析了传统PID控制的特点及其改进方法的研究现状PID控制是目前应用最多的一种传统控制方法,只要比例、积分、微分三种控制作用协调适当,就会得到快速敏捷、平稳准确的控制效果。然而,PID控制也无法避免传统控制的共同弱点。为了改善传统PID控制的性能,在已有大量的研究结果问世,各有其优点和缺点,其中包括神经元网络和PID控制相结合的研究。但是,现有的神经元网络和PID控制相结合的方法存在着缺陷,这些方法仅仅是用神经元网络予以辅助选取PID参数。因此,虽然使传统PID控制的性能得到了一些改善,但使控制系统也不能避免一般神经元网络的弱点。1.4.4 建立了基于RBF神经网络整定的控制在具体了解MATLAB的相关知识和使用方法的同时深入学习了RBF算法、RBF网络学习算法以及PID整定,并在此基础上建立模型,运用MATLAB进行仿真,得出仿真图像,并写出仿真程序。 2 神经网络2.1 神经网络的基本概念神经生理学和神经解剖学已经证明了人的思维是由人脑完成的。神经元是组成人脑最基本的单元,能够接受并处理信息,人脑是一个复杂的信息并行加工处理巨系统。探索人脑组织的结构、工作原理及信息处理的机制,是整个人类面临的一项巨大挑战。生物神经元,也称神经细胞,是构成神经系统的基本单元。生物神经元主要由细胞体、树突和轴突构成,其基本结构如图2.1所示。 图2.1 生物神经元结构1)细胞体细胞体由细胞质、细胞核与细胞膜组成。细胞体是生物神经元的主体,它是生物神经元新陈代谢的中心,同时还负责接收并处理从其他神经元传递过来的信息。细胞体的本质是细胞核,外部是细胞膜,细胞膜外是许多外延的纤维包裹着,细胞膜内外有电位差,称为膜电位,膜外为正,膜内为负。2)轴突轴突是细胞体向外延伸出的所有纤维中最长的一条分支。每个生物神经元只有一个轴突,长度最大可达到1m或以上,其作用相当于生物神经元的输出电缆,它通过末端部分出的许多神经末梢以及末梢端的突触向其他生物神经元输出神经冲动。 3)树突树突是由细胞体内向外伸出的除轴突外的其他纤维分支,长度一般较短,但分支较多。它相当于神经元输入端,用于接收从四面八方传来的神经冲动。 4)突触突触是轴突的终端。是生物神经元之间的连接间接口。一个生物神经元通过其轴突的神经末梢,经突触与另一个神经元的树突连接,以实现信息的传递。从生物的控制理论来看,作为信息处理和控制基本单元的生物神经元,具有以下功能特点。2.1.1 时空整合功能 生物神经元在不同时间通过同一突触传入的信息,具有时间整合功能;对于同一时间通过不同突触传入的信息,具有时空整合功能。两种功能互相结合,使生物神经元具有时空整合的输入信息处理功能。2.1.2 动态极化性在每一种生物神经元中,信息都是以可预知的确定方向流动的,即从生物神经元的接收信息部分传到轴突的起始部分,再传到轴突终端的突触,不可反向流动,最后再传给另一生物神经元。尽管不同的生物神经元在形状及功能上都有明显的不同,但绝大多数生物神经元都是按这一方向进行信息流动的。2.1.3 兴奋与抑制状态生物神经元具有两种常规工作状态,即兴奋状态和抑制状态。所谓兴奋状态是指生物神经元对输入信息整合后使细胞膜电位升高,且超过了动作电位阈值,此时产生神经冲动并由轴突输出。抑制状态是指对输入信息整合后,细胞膜电位值下降到低于动作电位阈值,从而导致无神经冲动输出。2.1.4 结构的可塑性由于突触传递信息的特性是可变的,也就是它随着神经冲动传递方式的变化,传递作用强弱不同,形成了生物神经元之间连接的柔性,此种特性又称为生物神经元结构的可塑性。2.1.5 脉冲与电位信号的转换突触界面具有脉冲与电位信号的变换功能。沿轴突传递的电脉冲是等幅的、离散脉冲信号,而细胞膜电位变化为连续的电位信号,这两种信号是在突触接口进行变换的。2.1.6 突触延期和不应期突触对信息的传递具有延时和不应期,在相邻的两次输入之间需要一定的时间间隔,在此期间,无激励也不传递信息,这称为不应期。2.1.7 学习、遗忘和疲劳由于生物神经元的结构可塑性,突触的传递作用有减弱、增强、和饱和三种情况。所以,神经细胞也具有相应的遗忘、学习、和疲劳效应。2.2 人工神经元模型 . . . 生物神经元经抽象化后,可得图2.2所示的一种人工神经元模型,他有三个基本要素。图2.2为人工神经元模型: 图2.2 人工神经元模型1.连接权连接权对应于生物神经元突触,各个神经元之间的连接强度由连接权的权值表示为正表示激活,为负表示抑制。2.求和单元用于求取各输入信号的加权和线性组合。3.激活函数激活函数的作用是起非线性映射作用,并将人工神经元输出幅度限制在一定范围内,一般限制在(0,1)或(-1,1)之间。激活函数也称为传输函数。此外,还有一个阈值(或偏值)以上作用可分别以数学式表达出来,即式中,为输入信号,它相当于生物神经元的树突,为人工神经元的输入信息 为神经元k的权值;为线性组合结果;为阈值,为激活函数;为神经元k的输出,它相当于生物神经元的轴突,为人工神经元的输出信息。若把输入的维数增加一维,则可把阈值包括进去,此处增加了一个新的连接,其输入,如图2.3所示 . . . 图2.3 输入扩维后的人工神经元模型激活函数一般有以下几种形式:1)阶跃函数表达式为 2)分段线性函数表达式为2.3 神经网络的结构人工神经网络(artificial neural networks,ANN)是由大量人工神经元广泛互连而组成,它可用来模拟人脑神经系统的结构和功能。人工神经网络可以看成是以人工神经元为节点,用又向加权弧连接起来的又向图。在此又向图中,人工神经元就是对生物神经元的模拟,而又向加权弧则是轴突突触树突对的模拟。又向弧的权值表示相互连接两个人工神经元间相互作用的强弱1,2。人工神经网络是生物神经网络的一种近似和模拟。它主要从两个方面进行模拟。一种是从生理结构和实现机理方面进行模拟,它涉及生物学、生理学、物理、心理学及化学等许多基础科学。由于生物神经网络的结构和机理相当复杂,现在距离完全认识它们还相差甚远。另一种则是从功能上加以模拟,即尽量使得人工神经网络具有生物神经网络的某些功能特性,识别、如学习、控制等功能。2.3.1 前馈型网络前馈型神经网络是整个神经网络体系中最常见的一种网络,其网络中各个神经元接受前一级的输入,并输出到下一级,网络中没有反馈,如图2.4所示。 图2.4 前馈网络节点分为两类,即计算单元和输入单元,每一计算单元可有任意个输入,但是只能有一个输出。通常前馈网络可分为不同的层,第i层的输入只与第i-1层输出相连,输入和输出节点与外界相连,而其他中间层则成为隐含层,它们是一种强有力的学习系统,其结构简易于编程。从系统观点看,前馈神经网络是一静态非线性映射,通过简单非线性处理的复合映射可获得复杂的非线性处理能力。但从便于计算的观点看,前馈神经网络并非是一种强有力的计算系统,并不具有丰富的动力学行为。大部分前馈神经网络是学习网络,并不注意系统的动力学行为,它们的模式识别能力和分类能力一般强于其他类型的神经网络。2.3.2反馈型网络反馈型神经网络又称递归网络或回归网络。在反馈网络中,输入信号决定反馈系统的初始状态,然后系统进过一系列状态转移后,逐步收敛于平衡状态。这样的平衡状态就是反馈网络经计算后的输出结果,由此可见,稳定性是反馈网络中最重要的问题之一。如果能找到网络的Lyapunov函数,则能保证网络从任意初始状态都能收敛到局部最小的点。反馈神经网络中的所有节点都是计算单元,同时也可以接收输入,并向外输出,且可画成一个无向图,其中每个连接弧都是双向的,也可以画成如2-5图所示,若总单元数为n,则每一个节点有n个输入和一个输出。 图2.5 反馈网络2.4 神经网络的工作方式神经网络的工作过程主演分为两个阶段:第一阶段是学习阶段,此阶段各计算单元状态不变,各连接权上的权值可由学习来修改;第二阶段是工作期,此时各连接权固定,计算单元变化,以达到某种稳定状态。从作用效果看,前馈网络主要是函数映射,可用于模拟识别和任意函数逼近。反馈网络则按对能量函数的极小点的利用来分类有两种;第一类是能量函数的所有极小点都能起作用,这一类主要用作各种联想存储器;第二类只是利用全局极小点,它主要用于求解最优化相关问题。2.5 神经网络的学习2.5.1 学习方式通过向外部环境学习获取知识并改进自身性能是神经网络的一个重要特点,在一般情况下,性能的改善是按某种预定的度量调节自身参数随时间而逐步达到的,学习方式有三种:1.无监督学习(无教师学习)。2.有监督学习(有教师学习)。3.强化学习(或再励学习)4。2.5.2 学习算法1)Hebb学习规则神经心理学家HEBB提出的学习规则可归结为“当某一突触(连接)两端的神经元的激活同步(同为抑制或同为激活)时,则应减弱y反之该连接的强度应增加,”,用数学方式则描述为 式中,分别为两端神经元的状态,其中最常用的一种情况为 式中,为学习速率。由于的相关性成例,故有时称之为相关学习规则。上式定义的HEBB规则实际上是一种无监督学习规则,它不需要关于目标输出的任何相关信息。原始的Hebb学习规则对权值矩阵的取值未做任何限制,因而学习后权值可取任意值。为了克服这一弊病,在Hebb学习规则的基础上增加一个衰减项,即 衰减项的加入能够增加网络学习的“记忆”功能,并且能够有效地对权值的取值加以限制。衰减系数的取值在(0,1)之间。当取0时,就变成原始Hebb学习规则。另外,此规则也可以采用有监督的学习,对于有监督学习的Hebb学习规则而言,是将目标输出代替实际输出。由此,算法被告知的就是网络需要做什么,而不是网络当前正在做什么,可描述为2)学习规则(误差纠正规则)若为输入时神经元i在k时刻的实际输出,表示则相应的期望输出,则误差信号可写为误差纠正学习的最终目的是使某一基于的目标函数达到最小,以使网络中每一输出单元的实际输出在某种统计意义上最逼近于期望的输出。一旦选定了目标函数形式,误差纠正学习就成为一个典型的最优化问题。最常用的目标函数是均方误差判据,定义为 式中,E是统计期望算子;L为网络输出数。 上式的前提条件是被学习的过程是宽而平稳的,具体方法可用最陡梯度下降法。直接用J作为目标函数时,需要知道整个过程的统计特性,为解决这一困难常用J在时刻k的瞬时值J(k)代替J,即 问题变为求J(k)对权值的极小值,根据最陡梯度下降法可得式中,为学习速率或步长();为激活函数。这就是通常说的误差纠正学习规则,用于控制每次误差修正值。它是基于使输出方差最小的思想而建立。3)竞争学习规则顾名思义,在竞争学习时网络各输出单元相互竞争,最后只有一个最强者被激活。最常见的一种情况是输出神经元之间有侧向抑制性连接。这样众多输出单元中如有某一单元较强,则它将获取该单元并抑制其他单元,最后只有比较强者处于激活状态。最常用的有以下三种:Instar规则:Kohonen规则:Outstar规则:2.5.3 学习与自适应当学习系统所处环境较为平稳时,从理论上说可以通过监督学习学到环境的统计特征,这些统计特征可被学习系统作为经验而记住。如果环境是非平稳的,则通过监督学习没有能力跟踪这种变化,为解决此问题需要网络有一定的自适应能力,此时对每一个不同输入都作为一个新的例子被对待。此时模型被当做一个预测器,基于前一时刻输出x(k-1)和模型在k-1时刻的参数,它估计出k时刻输出,与实际输出值x(k)比较,其差值e(k)称为“新息”。 3 PID控制器3.1 传统控制理论的局限性传统的控制理论都是建立在以积分和微分为工具的精确模型之上。迄今为止,还不存在一种直接使用工程技术用语来描述系统和解决这方面问题的方法。从工程技术用语到数学描述的映射过程中,一方面虽然使问题作了很多简化,但在另一方面却使原问题丢失很多信息6,7。传统控制理论在具体控制系统中的局限性,主要表现在以下几个方面:3.1.1 不适用于不确定性系统的控制传统控制是基于模型的控制,即认为控制、对象及干扰的模型是已知的或者是经过辨别可以精确得到的。但是,由于被控制系统的参数和结构往往难以测量或辨识,很多被控制系统的参数和结构还具有不确定性,甚至常常会发生突变。对于这些未知、不确定或者知之甚少的控制系统,难以建立精确的数学模型,所以使采用传统控制理论无法实现有效的控制。3.1.2不适应非线性系统的控制一般的被控制系统都具有非线性特性,当非线性特性的影响较小时,传统控制理论通常将其近似线性化后设计控制器。当被控系统具有高度非线性特性时,传统控制理论中虽然也有一些方法可利用,但只是针对一些具体问题,有较多的附加条件,大多数过于复杂而难以在实际中运用。3.1.3不适应时变系统的控制在实际被控制系统的参数和结构随时间而发生变化,绝对不变的系统是不存在的。当这种变化甚微时,经过一系列的近似后,才能利用传统控制理论进行系统综合处理。如果时变因素扰动较大,则传统控制理论则无法应用。3.1.4不适应多变量系统的控制在多变量系统的控制问题一直都是控制理论界和控制工程界研究的重点和难点,多变量系统除了与单变量系统一样存在着、不确定性和时变问题以外,还存在着系统各要素间相互耦合、相互制约等特殊而复杂的问题。如果多变量系统为线性时不变而且结构和参数为已知,还可以应用传统控制理的论设计解耦器和控制器,对多变量系统进行控制。如果以上条件均不成立,则传统控制理论无法应用。而在实际中,这些条件一般难以完全满足。传统的控制理论虽然也能采取相应的办法对付控制对象的不确定性和复杂性,如自适应控制和鲁棒控制也可以克服系统中所包含的不确定性,以达到优化控制的目的。但是自适应控制是以自动调节控制器的参数为前提条件,使控制器与被控对象和环境达到良好的“匹配”,以削弱不确定性干扰因素的影响。从本质上说,自校正和自适应控制都是通过对系统某些重要参数的估计,以补偿的方法来克服不确定性和干扰性。比较适合于系统参数在一定范围内的波动较慢的变化情况。鲁棒控制则是针对在一定的外部干扰和内部参数变化作用下,以提高系统的不灵敏度为目的来抵制不确定性的。根据这一思想和原理所导出的算法,其鲁棒的应用区域是很有限的。因此,在实际应用中,尤其在工业过程控制中,由于被控对象的严重非线性,数学模型的不确定性以及系统工作点变化剧烈等因素,鲁棒和自适应控制存在这难以弥补的严重缺陷,其应用的有效性受到很大的限制,这就促使人们需要提出新的控制技术和方法。3.2 PID控制概述PID(比例-积分-微分)控制器作为最早的实用化的控制器已有50多年的历史,现在依然是应用最广泛的工业控制器8。PID控制器简单易懂,使用中不需要精确的系统模型等先决条件,因而成为应用最为广泛的工业控制器。PID 控制器是一个在工业控制中常见的反馈回路部件。这个控制器把收集到的数据和一个参考值进行对比,然后把这个差异作为计算新的输入值,这个新的输入值是可以让系统的数据达到或者保持在参考值。和其他简单的控制运算不同,PID控制器可以根据历史数据的差别的出现率来调整和改变输入值,这样可以使系统更加的准确,更加稳定。可以通过数学方法来证明,在其他控制方法导致系统有稳定误差或过程反复的情况下,一个PID反馈回路却可以保持系统的稳定性。PID控制器由比例单元(P)、积分单元(I)和微分单元(D)组成。其输入e (t)与输出u (t)的关系为 u(t)=kp(e(t)+1/TIe(t)dt+TD*de(t)/dt) 式中积分的上下限分别是0和t,因此它的传递函数为:G(s)=U(s)/E(s)=kp(1+1/(TI*s)+TD*s) 其中kp为比例系数;TI为积分时间常数;TD为微分时间常数。微分被控对象 比例 积分3.3 PID控制的原理和特点在模拟控制系统中,控制器最常用的控制规律是PID控制。PID控制系统原理框图如下图所示。系统由模拟PID控制器和被控制对象组成 图3.1 模拟PID控制系统原理框图PID控制器是一种线性控制器,它根据给定值X (t)与实际输出值Y(t)构成控制偏差: E(t)=X(t)-Y(t) PID的控制规律为: 或写成传递函数的形式: 式中,是比例系数;是积分时间常数;是微分时间常数。简单来说,PID控制器就是根据系统的误差,利用比例、积分、微分计算出控制量进行控制的。 1)比例(P)控制比例控制是一种最为简单的控制方式。其控制器的输出与输入误差信号成比例关系。当仅有比例控制时系统输出存在稳态误差(Steady-state error)。 2)积分(I)控制在积分控制中,控制器的输出与输入误差信号的积分成正比关系。对一个自动控制系统,如果在进入稳态后存在稳态误差,则称这个控制系统是有稳态误差的或简称有差系统(System with Steady-state Error)。为了消除稳态误差,控制器中必须引入“积分项”。积分项对误差取决于时间的积分,随着时间的增加,积分项会增大。这样,即使误差很小,积分项也会慢慢随着时间的增加而加大,它推动控制器的输出增大使稳态误差进一步减小,直到等于零。因此,比例+积分(PI)的控制器,可以使系统在进入稳态后实现无稳态误差。 3)微分(D)控制在微分控制中,控制器的输出与输入误差信号的微分(即误差的变化率)成正比的关系。自动控制系统在克服误差的调节过程中可能会出现振荡甚至失稳。其原因是由于存在着较大惯性组件(环节)或有滞后(delay)组件,具有抑制误差的功能,其变化总是滞后于误差的变化。其解决的办法是使抑制误差的作用的变化“超前”,即在误差接近零时,抑制误差的作用就应该是零。这就是说,在控制器中仅仅引入 “比例”项往往是不够的,比例项的作用仅是放大误差的幅值,而目前需要增加的是“微分项”,它能够预测误差变化的趋势,这样,具有比例+微分的控制器,就能够提前使抑制误差的控制作用为零,甚至为负值,从而避免了被控量的严重超调。所以对有滞后或较大惯性的被控对象,比例+微分(PD)控制器能改善系统在调节过程中的动态特性。在PID控制器中,比例部分的作用是产生与偏差成正比的输出信号,以便消除偏差;积分部分的作用是产生与偏差的积分值成正比的输出信号,以便消除系统的静态误差;微分部分的作用产生与偏差的变化率成正比的输出信号,以便加快控制器的调节速率,缩短过渡过程时间,减少超调。如果这三个部分配合得当,便可得到快速敏捷、平稳准确的调节效果。因此,PID控制器设计的关键问题是如何选择比例、积分和微分系数,而这些参数的整定的困难使PID控制器在实际的应用中受到限制。实际上,PID控制规律是一种线性的控制规律,它也具有传统控制理论的弱点,仅在简单的线性单变量系统中有良好的控制效果,而在复杂系统的控制中效果则往往不佳。3.4 PID控制的预置和参数整定3.4.1 比例增益P变频器的PID功能是根据目标信号和反馈信号的差值来调节输出频率的一方面,我们希望目标信号和反馈信号无限接近,即差值很小,从而满足调节信号的精度:另一方面,我们又希望调节信号有一定的幅度,来保证调节的灵敏度。解决这一矛盾的方法就是事先将差值信号进行放大9,10。比例增益 P的作用 就是用来设置差值信号的放大系数的。任何一种变频器的参数P都给出一个可设置的数值波动范围,一般在初次调试时,P可按中间偏大值预置或者暂时默认为出厂值,待设备运转时再按实际情况精调。 3.4.2 积分时间I如上所述,比例增益P越大,调节灵敏度就越高,但是由于传动系统和控制电路都有惯性,调节结果达到最佳值时不能瞬间停止,导致“超调”,然后又反过来调整,再次超调,形成振荡。为此引入积分环节I,其目的是,使经过比例增益P放大后的差值信号在积分时间内逐渐增大(或减小),从而减缓其变化的速度,防止振荡。但积分时间I太长,当反馈信号急剧变化时,被控物理量难以迅速恢复。因此,积分环节I的取值与拖动系统的时间常数有关:拖动系统的时间常数较小,积分时间应短些;拖动系统的时间常数较大,积分时间应长些。 3.4.3 微分时间D微分时间D是根据差值信号变化的速率,提前给出一个相应的调节动作,从而缩短调节时间,克服因积分时间过长而使得恢复滞后的缺陷。D的取值也与拖动系统的时间常数有关:拖动系统的时间常数较小,微分时间应短些;反之,拖动系统的时间常数较大,微分时间应长些。3.5 PID参数的调整原则P、I、D各参数的预置是相辅相成的,运行现场应根据实际情况进行如下细调:被控物理量在目标值附近振荡,首先加大积分时间 I ,如仍有振荡,可适当减小比例增益P。被控物理量在发生变化后难以恢复,应首先加大比例增益P,如果恢复仍较缓慢,可适当减小积分时间I,还可加大微分时间D。 PID控制器的参数整定是控制系统设计的最核心内容。它是根据被控过程的特性来确定PID控制器的比例系数、微分时间和积分时间的大小。PID控制器参数整定的方法很多,概括起来有两大类:一是理论计算整定法,它主要是依据系统的数学模型,经过理论计算来确定控制器参数。由这种方法所得到的计算数据未必可以直接用,还必须通过实际工程进行调整和修改。二是工程整定方法,它主要依赖工程经验,直接在控制系统的试验中进行,并且方法简单、易于掌握,在工程实际中被广泛采用。在PID控制器参数的工程整定方法中,主要有反应曲线法、临界比例法、和衰减法。两种方法各有其特点,其共同点都是通过不断循环试验,然后按照工程经验公式对控制器参数进行整定。但无论采用哪一种方法所得到的控制器参数,都需要在实际操作运行中进行最后调整与完善。现在一般采用的是临界比例法。利用此种方法进行 PID控制器参数的整定步骤如下:(1)首先应预选择一个足够短的采样周期让系统工作;(2)只加入比例控制环节,直到系统对输入的阶跃响应出现临界振荡,记下这时的临界振荡周期和比例放大系数;(3)在一定的控制度下通过理论的公式计算得到PID控制器的参数。在实际调试中,只能先预先大致设定一个经验值,然后根据调节效果修改。 3.6 PID工作应注意问题三个参数的设定是PID控制算法极为关键的问题。一般来说编程时只能设定它们的大概的数值,在系统运行中通过反复的调试来确定最佳值。因此调试阶段的程序必须得能随时记忆和修改这三个参数。3.7 PID控制的意义及其应用目前工业自动化控制水平已成为衡量各行各业现代化水平的一个重要标志。同时,控制理论的发展也经历了初期的古典控制理论、中期的现代控制理论和高潮的智能控制理论三个阶段。智能控制的典型实例是模糊全自动洗衣机、机器人等。自动控制系统可分为闭环控制系统和开环控制系统。一个控制系统包括控制器、执行机构、变送器、传感器、输入输出接口。控制器的输出经过输出接口、执行机构,被加到被控系统上;控制系统的被控制量,经过传感器,变送器,通过输入接口送到控制器。不同的控制系统,其传感器、变送器和执行机构是不一样的。比如压力控制系统需要采用压力传感器,而电加热控制系统的传感器需要的是温度传感器。目前,PID控制及其控制器或智能PID控制器已经很多,许多产品已在工程实际中得到了广泛的应用,有各种各样的PID控制器产品,各大公司均开发了具有PID参数自整定功能的智能调节控制器 (intelligent regulator),其中PID智能控制器参数的自动调整是通过智能化调整或自校正、自适应算法来实现。有利用PID控制实现的、液位、温度、流量、压力、控制器,有能实现PID控制功能的可编程控制器(PLC),还有可实现PID控制的PC系统等等。 可编程控制器(PLC) 是利用闭环控制模块来实现PID控制,而可编程控制器(PLC)则可以直接与ControlNet相连,如Rockwell的PLC-5等。还有可以实现 PID控制功能的控制器,如Rockwell 的Logix系列产品,它可以直接与ControlNet相连,利用网络来实现远程控制功能。PID控制器由于用途广泛、使用灵活,已有系列化产品,使用中只需设定三个参数(Kp,Ti和Td)即可。在很多情况下,并不一定需要全部的三个单元,可以取其中的一到两个单元,但比例控制单元是不可或缺的。首先,PID应用领域广。虽然很多工业过程是非线性或时变的,但通过对其简化可以变成基本动态特性和线性不随时间变化的控制系统,这样PID就可有效的控制了。其次,PID参数也容易整定。也就是,PID参数Kp,Ti和Td可以根据过程的动态特性的变化特征及时整定。如果过程的动态特性变化,例如可能由负载的变化引起系统动态特性变化,PID参数就可以重新整定。第三,PID控制器在实践中也不断的寻求改进。 4 基于RBF神经网络整定的控制及MATLAB仿真 4.1 MATLAB 语言简介 4.1.1 MATLAB 概述MATLAB诞生于20世纪70年代初期,MATLAB(矩阵实验室)是MATrix LABoratory的缩写,是一款由美国The MathWorks公司出品的商业数学软件。MATLAB是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。除了矩阵运算、绘制函数/数据图像等常用功能外,MATLAB还可以用来创建用户界面及与调用其它语言(包括C,C+和FORTRAN)编写的程序13,14。尽管MATLAB主要用于数值运算,但利用为数众多的附加工具箱(Toolbox)它也适合不同领域的应用,例如控制系统设计与分析、图像处理、信号处理与通讯、金融建模和分析等。另外还有一个配套软件包Simulink,提供了一个可视化开发环境,常用于系统模拟、动态/嵌入式系统开发等方面。4.1.2 MATLAB语言特点 MATLAB的语言异于其它的高级语言特点,被称为第四代计算机语言。其特点在于摆脱了对于计算机的依赖性,第四代语言的MATLAB使人们从纯粹而繁琐的程序代码中解放了出来。其丰富的函数库使得开发者免予花费较多的时间在编程上。MATLAB语言最大的特点就是快捷、简单和实用。主要的特点在于:语句简单 用户使用方便 高效方便的矩阵和数组 移植性很好,开放性很好 编程效率高,内涵丰富 运算扩充能力强,交互性好 方便的绘图功能4.2 神经网络工具箱函数 神经网络工具箱是在MATLAB环境下开发出来的众多工具箱之一。它以人工神经网络理论为基础,利用MATLAB编程语言构造出许多典型神经网络的激活函数,如S型、线性、竞争层、饱和线性等激活函数,使设计者对所选定网络输出的计算,转变为对激活函数的调用。另外,可以根据各种典型的修正网络权值的规则,加上网络的训练过程,利用MATLAB语言编写各种网络权值训练的子程序。这样一来,网络的设计者可以根据自己的需要调用工具箱中有关神经网络的设计与训练的程序,使自己能够从繁琐的编程中解脱出来,集中精力思考和解决问题,从而提高效率和质量。最新版的MATLAB 神经网络工具箱为Version4.0.3,它几乎涵盖了所有的神经网络的基本常用类型,对各种网络模型又提供了各种学习算法,我们可以根据自己的需要调用工具箱中的有关设计与训练函数,很方便地进行神经网络的设计和仿真。目前神经网络工具箱提供的神经网络模型主要用于:函数逼近和模型拟合;信息处理和预测;神经网络控制;故障诊断。4.3 基于simulink的神经网络控制神经网络工具箱提供了一组可以在simlink中使用的模块,它们可以用来建立网络和基于网络的控制器。工具箱中还提供了3类控制的有关simulinked实例,分别为模型预测控制、模型参考控制和反馈线性化控制。Mpc是20世纪70年代后期发展起来的一类新型的计算机控制算法,称为预测模型。这种算法的本质特征包括三个要素:预测模型、滚动优化和反馈校正。4.3.1 预测模型 在模型预测控制中需要一个描述系统动态行为的基础模型,称为预测模型。这个预测模型应该具有根据系统的历史信息和未来输入,预测其未来输出值的功能。4.3.2 滚动优化预测控制实质上是一种优化控制算法,它采用滚动式的有限时域的输出优化。这种优化方式有两
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!