无约束优化方法(白版).ppt

资源描述

第四章无约束优化方法 4 1最速下降法梯度法 4 2牛顿类方法 4 3变尺度法 4 4共轭方向法 4 5鲍威尔方法 4 6其它方法如坐标轮换法单纯形法第1章所列举的机械优化设计问题都是在一定的限制条件下追求某一指标为最小它们都属于约束优化问题工程问题大都如此为什么要研究无约束优化问题 1 有些实际问题其数学模型本身就是一个无约束优化问题 2 通过熟悉它的解法可以为研究约束优化问题打下良好的基础 3 约束优化问题的求解可以通过一系列无约束优化方法来达到所以无约束优化问题的解法是优化设计方法的基本组成部分也是优化方法的基础 4 对于多维无约束问题来说古典极值理论中令一阶导数为零但要求二阶可微且要判断海赛矩阵为正定才能求得极小点这种方法有理论意义但无实用价值和一维问题一样若多元函数F X 不可微亦无法求解但古典极值理论是无约束优化方法发展的基础目前已研究出很多种无约束优化方法它们的主要不同点在于构造搜索方向上的差别 1 间接法要使用导数如梯度法阻尼牛顿法变尺度法共轭梯度法等 2 直接法不使用导数信息如坐标轮换法鲍威尔法单纯形法等无约束优化问题是求n维设计变量使目标函数搜索方向的构成问题乃是无约束优化方法的关键用直接法寻找极小点时不必求函数的导数只要计算目标函数值这类方法较适用于解决变量个数较少的 n 20 问题一般情况下比间接法效率低间接法除要计算目标函数值外还要计算目标函数的梯度有的还要计算其海赛矩阵 4 1梯度法基本思想函数的负梯度方向是函数值在该点下降最快的方向将n维问题转化为一系列沿负梯度方向用一维搜索方法寻优的问题利用负梯度作为搜索方向故称最速下降法或梯度法搜索方向s取该点的负梯度方向最速下降方向使函数值在该点附近的范围内下降最快为了使目标函数值沿搜索方向能够获得最大的下降值其步长因子应取一维搜索的最佳步长即有根据一元函数极值的必要条件和多元复合函数求导公式得在最速下降法中相邻两个迭代点上的函数梯度相互垂直而搜索方向就是负梯度方向因此相邻两个搜索方向互相垂直这就是说在迭代点向函数极小点靠近的过程走的是曲折的路线形成之字形的锯齿现象而且越接近极小点锯齿越细图4 2最速下降法的搜索路径方法特点 1 初始点可任选每次迭代计算量小存储量少程序简短即使从一个不好的初始点出发开始的几步迭代目标函数值下降很快然后慢慢逼近局部极小点 2 任意相邻两点的搜索方向是正交的它的迭代路径为绕道逼近极小点当迭代点接近极小点时步长变得很小越走越慢沿负梯度方向进行一维搜索有为一维搜索最佳步长应满足极值必要条件例4 1求目标函数的极小点解取初始点则初始点处函数值及梯度分别为算出一维搜索最佳步长第一次迭代设计点位置和函数值继续作下去经10次迭代后得到最优解这个问题的目标函数的等值线为一簇椭圆迭代点从走的是一段锯齿形路线见下图将上例中目标函数引入变换其等值线由椭圆变成一簇同心圆仍从即出发进行最速下降法寻优此时沿负梯度方向进行一维搜索则函数f X 变为 y1 x1 y2 5x2 由从而算得一步计算后设计点的位置及其目标函数经变换后只需一次迭代就可找到最优解这是因为经过尺度变换等值线由椭圆变成圆梯度法的特点 1 理论明确程序简单对初始点要求不严格 2 对一般函数而言梯度法的收敛速度并不快因为最速下降方向仅仅是指某点的一个局部性质 3 梯度法相邻两次搜索方向的正交性决定了迭代全过程的搜索路线呈锯齿状在远离极小点时逼近速度较快而在接近极小点时逼近速度较慢 4 梯度法的收敛速度与目标函数的性质密切相关对于等值线面为同心圆球的目标函数一次搜索即可达到极小点 4 2牛顿法及其改进设为的极小点这就是多元函数求极值的牛顿法迭代公式对于二次函数海赛矩阵H是一个常矩阵其中各元素均为常数因此无论从任何点出发只需一步就可找到极小点例4 2求目标函数的极小点解取初始点从牛顿法迭代公式的推演中可以看到迭代点的位置是按照极值条件确定的其中并未含有沿下降方向搜寻的概念因此对于非二次函数如果采用上述牛顿迭代公式有时会使函数值上升阻尼牛顿法阻尼因子沿牛顿方向进行一维搜索的最佳步长由下式求得经过一次迭代即求得极小点函数极小值阻尼牛顿法程序框图方法特点 1 初始点应选在X 附近有一定难度 2 尽管每次迭代都不会是函数值上升但不能保证每次下降 3 若迭代点的海赛矩阵为奇异则无法求逆矩阵不能构造牛顿法方向 4 不仅要计算梯度还要求海赛矩阵及其逆矩阵计算量和存储量大此外对于二阶不可微的F X 也不适用虽然阻尼牛顿法有上述缺点但在特定条件下它具有收敛最快的优点并为其他的算法提供了思路和理论依据一般迭代式梯度法牛顿法阻尼牛顿法梯度法与牛顿法 4 3变尺度法 DFP变尺度法首先有戴维顿 Davidon 与1959年提出又于1963年由弗莱彻 Fletcher 和鲍维尔加以发展和完善成为现代公认的较好的算法之一 DFP法是基于牛顿法的思想又作了重要改进这种算法仅用到梯度不必计算海赛阵及其逆矩阵但又能使搜索方向逐渐逼近牛顿方向具有较快的收敛速度基本思想变量的尺度变换是放大或缩小各个坐标通过尺度变换可以把函数的偏心程度降到最低限度例如在用最速下降法求的极小值时需要进行10次迭代才能达到极小点如作变换 y1 x1 y2 5x2 消除了函数的偏心用最速下降法只需一次迭代即可求得极小点梯度法构造简单只用到一阶偏导数计算量小初始点可任选且开始几次迭代目标函数值下降很快其主要缺点是迭代点接近X 时即使对二次正定函数收敛也非常慢牛顿法收敛很快对于二次函数只需迭代一次便达到最优点对非二次函数也能较快迭代到最优点但要计算二阶偏导数矩阵及其逆阵对维数较高的优化问题其计算工作和存储量都太大能不能将两种算法的优点综合起来扬长避短 Ak是需要构造n n的一个对称方阵如Ak I 则得到梯度法变尺度法的关键在于尺度矩阵Ak的产生对于二次函数进行尺度变换在新的坐标系中函数f x 的二次项变为目的减少二次项的偏心如G是正定则总存在矩阵Q 使得用矩阵Q 1右乘等式两边得用矩阵Q左乘等式两边得所以上式说明二次函数矩阵G的逆阵可以通过尺度变换矩阵Q来求得牛顿迭代公式记搜索方向迭代公式 A称为变尺度矩阵在例4 2中如取求得构造尺度矩阵Ak 从初始矩阵A0 I 单位矩阵开始通过对公式因此一旦达到最优点附近就可望达到牛顿法的收敛速度 1 DFP法 Davidon Fletcher Powell 式中 2 BFGS算法 Broyden Fletcher Goldfrob Shanno DFP算法由于舍入误差和一维搜索不精确有可能导致构造矩阵的正定性遭到破坏以至算法不稳定 BFGS算法对于维数较高问题具有更好的稳定性例4 3 用DFP算法求下列问题的极值解 1 取初始点为了按DFP法构造第一次搜寻方向d0 需计算初始点处的梯度取初始变尺度矩阵为单位矩阵A0 I 则第一次搜寻方向为沿d0方向进行一维搜索得为一维搜索最佳步长应满足得 2 再按DFP法构造点x1处的搜寻方向d1 需计算代入校正公式第二次搜寻方向为再沿d1进行一维搜索得为一维搜索最佳步长应满足 3 判断x2是否为极值点梯度海赛矩阵梯度为零向量海赛矩阵正定可见点满足极值充要条件因此为极小点 4 4共轭方向法 1 共轭方向设G为n n阶实对称正定矩阵如果有两个n维向量d0和d1满足则称向量d0与d1关于矩阵G共轭当G为单位矩阵时假设目标函数f x 在极值点附近的二次近似函数为对二维情况任选取初始点x0沿某个下降方向d0作一维搜索得x1 因为是沿d0方向搜索的最佳步长即在点x1处函数f x 沿方向d0的方向导数为零考虑到点x1处方向导数与梯度之间的关系故有如果按最速下降法选择负梯度方向为搜索方向则将发生锯齿现象取下一次的迭代搜索方向d1直指极小点x 如果能够选定这样的搜索方向那么对于二元二次函数只需顺次进行d0 d1两次直线搜索就可以求到极小点x 即有那么这样的d1方向应该满足什么条件呢对于前述的二次函数当时 x 是f x 极小点应满足极值必要条件故有将等式两边同时左乘得有就是使d1直指极小点x d1所必须满足的条件两个向量d0和d1称为G的共轭向量或称d0和d1对G是共轭方向 2 共轭方向的性质性质1若非零向量系d0 d1 d2 dm 1是对G共轭则这m个向量是线性无关的性质2在n维空间中互相共轭的非零向量的个数不超过n 性质3从任意初始点出发顺次沿n个G的共轭方向d0 d1 d2 进行一维搜索最多经过n次迭代就可以找到的二次函数f x 极小点关键新的共轭方向确定在无约束方法中许多算法都是以共轭方向作为搜索方向它们具有许多特点根据构造共轭方向的原理不同可以形成不同的共轭方向法 3 共轭梯度法共轭梯度法是共轭方向法中的一种该方法中每一个共轭向量都是依赖于迭代点处的负梯度而构造出来从xk出发沿负梯度方向作一维搜索设与dk共轭的下一个方向dk 1由dk和点xk 1的负梯度的线形组合构成即共轭条件则解得令为函数的泰勒二次展开式则上两式相减并代入将式与式两边相乘并应用共轭条件得因此已知初始点 1 1 T 例题4 4求下列问题的极值解 1 第一次沿负梯度方向搜寻计算初始点处的梯度为一维搜索最佳步长应满足迭代精度得 2 第二次迭代代入目标函数得因收敛由从而有 4 5鲍威尔方法鲍威尔法是以共轭方向为基础的收敛较快的直接法之一是一种十分有效的算法 1964年鲍维尔提出这种算法其基本思想是直接利用迭代点的目标函数值来构造共轭方向然后从任一初始点开始逐次沿共轭方向作一维搜索求极小点并在以后的实践中进行了改进对函数基本思想在不用导数的前提下在迭代中逐次构造G的共轭方向 1 共轭方向的生成设xk xk 1为从不同点出发沿同一方向dj进行一维搜索而到的两个极小点梯度和等值面相垂直的性质 dj和xk xk 1两点处的梯度gk gk 1之间存在关系另一方面对于上述二次函数其xk xk 1两点处的梯度可表示为因而有取这说明只要沿dj方向分别对函作两次一维搜索得到两个极小点xk和xk 1 那么这两点的连线所给出的方向dk就是与dj一起对G共轭的方向 2 基本算法二维情况描述鲍威尔的基本算法 1 任选一初始点x0 再选两个线性无关的向量如坐标轴单位向量e1 1 0 T和e2 0 1 T作为初始搜索方向 2 从x0出发顺次沿e1 e1作一维搜索得点两点连线得一新方向d1 沿d2作一维搜索得点x2 即是二维问题的极小点x 方法的基本迭代格式包括共轭方向产生和方向替换两主要步骤用d1代替e1形成两个线性无关向量d1 e2 作为下一轮迭代的搜索方向再从出发沿d1作一维搜索得点作为下一轮迭代的初始点 3 从出发顺次沿e2 d1作一维搜索得到点两点连线得一新方向把二维情况的基本算法扩展到n维则鲍威尔基本算法的要点是在每一轮迭代中总有一个始点第一轮的始点是任选的初始点和n个线性独立的搜索方向从始点出发顺次沿n个方向作一维搜索得一终点由始点和终点决定了一个新的搜索方向用这个方向替换原来n个方向中的一个于是形成新的搜索方向组替换的原则是去掉原方向组的第一个方向而将新方向排在原方向的最后此外规定从这一轮的搜索终点出发沿新的搜索方向作一维搜索而得到的极小点作为下一轮迭代的始点这样就形成算法的循环上述基本算法仅具有理论意义因为在迭代中的n个搜索方向有时会变成线性相关而不能形成共轭方向这时组不成n维空间可能求不到极小点所以上述基本算法有待改进 3 改进的算法在鲍威尔基本算法中每一轮迭代都用连结始点和终点所产生出的搜索方向去替换原向量组中的第一个向量而不管它的好坏这是产生向量组线性相关的原因所在在改进的算法中首先判断原向量组是否需要替换如果需要替换还要进一步判断原向量组中哪个向量最坏然后再用新产生的向量替换这个最坏的向量以保证逐次生成共轭方向为此要解决两个关键问题 1 dk 1是否较好是否应该进入新的方向组即方向组是否进行更新 2 如果应该更新方向组 dk 1不一定替换方向而是有选择地替换某一方向令在k次循环中分别称为一轮迭代的始点终点和反射点则在循环中函数下降最多的第m次迭代是记相应的方向为为了构成共轭性好的方向组须遵循下列准则在k次循环中若满足条件和则选用新方向dk 并在第k 1迭代中用dk替换对应于的方向否则仍然用原方向组进行第k 1迭代因此这样重复迭代的结果后面加进去的向量都彼此对G共轭经n轮迭代即可得到一个由n个共轭方向所组成的方向组对于二次函次最多n次就可找到极小点而对一般函数往往要超过n次才能找到极小点这里 n 表示设计空间的维数例4 5用改进的鲍威尔法求目标函数解 1 第1轮迭代计算沿e1方向进行一维搜索得以为起点沿第二坐标轴方向e2进行一维搜索得确定此轮中的最大下降量及其相应方向反射点及其函数值检验Powell条件由于满足Powell条件则淘汰函数值下降量最大的方向e1 下一轮的基本方向组为e2 构成新的方向沿方向一维搜索得极小点和极小值此点为下轮迭代初始点按点距准则检验终止条件需进行第二轮迭代机算 2 第2轮迭代计算此轮基本方向组为e2 分别相当于起始点为沿e2方向进行一维搜索得以为起点沿方向一维搜索得确定此轮中函数值最大下降量及其相应方向反射点及其函数值检验Powell条件淘汰函数值下降量最大的方向e2 下一轮的基本方向组应为构成新的方向沿方向进行一维搜索得检验终止条件 3 第3轮迭代计算此轮基本方向组为起始点为先后沿方向进行一维搜索得故最优解检验终止条件实际上前两轮迭代的为共轭方向由于本例目标函数是二次函数按共轭方向的二次收敛性故前两轮的结果就是问题的最优解但每一轮迭代都需要进行n 1次迭代前面介绍的许多优化方法除鲍威尔 Powell 法外都需要计算目标函数的导数而在实际工程的最优化问题中目标函数的导数往往很难求出或者根本无法求出下面所介绍的方法只需要计算目标函数值无需求其导数因此计算比较简单其几何概念也比较清晰属于直接法的无约束最优化方法这类方法适用于不知道目标函数的数学表达式而仅知其具体算法的情况这也是直接法的一个优点 4 6其它方法如坐标轮换法单纯形法坐标轮换法坐标轮换法的基本思想是将一个n维优化问题转化为依次沿n个坐标方向反复进行一维搜索问题这种方法的实质是把n维问题的求优过程转化为对每个变量逐次进行一维求优的循环过程每次一维搜索时只允许n个变量的一次改动其余 n 1 个变量固定不变故坐标轮换法也常称单变量法或变量交错法坐标轮换法此法的效能在很大程度上取决于目标函数的性质 1 计算量少程序简单不需要求函数导数的直接探索目标函数最优解的方法 2 探索路线较长问题的维数愈多求解的效率愈低当维数n 10时则不应采用此法仅适用于n较少 n 10 的目标函数求优 3 改变初始点重新迭代可避免出现病态方法特点步长加速法 Hook Reeves算法一步长加速法原理步长加速法也称之为离散步长的Hook Reeves算法是一种不使用导数的直接搜索算法其算法过程可分成两个基本阶段坐标循环试探及模矢加速搜索见下图从初始探点Y0出发依次沿n个坐标方向用固定步长进行试探寻找更好的点而模矢加速搜索就是沿模矢方向加大步长前进以得到第k 1次迭代的出发点Y0 这样就完成了一次迭代然后再从新的Y0出发进行下一轮坐标循环试探如此重复进行使目标值不断减小二步长加速法算法设问题为 X0为初始点个坐标轴的单位方向向量初始坐标循环试探的步长为 0 模矢加速搜索的加速步长因子为a 1 通常取a 2 迭代终止准则为为预先确定的正数 1 2 否则转 6 否则令 6 5 单纯形方法一基本思想单纯形替换法也是一种不使用导数的求解无约束极小化问题的直接搜索方法与前面几种方法不同的是单纯形替换法不是利用搜索方向从一个点迭代到另一个更优的点而是从一个单纯形迭代到另一个更优的单纯形定义单纯形n维空间中的恰好有n 1个顶点极点的有界的凸多面体称之为一个单纯形根据定义可知一维空间中的单纯形是线段二维空间中的单纯形是三角形而三维空间中的单纯形则是四面体在单纯形替换算法中从一个单纯形到另一个单纯形的迭代主要通过反射扩张收缩和缩边这4个操作来实现下面以二维问题为例来对4种操作进行说明参见下图 1 反射设除了最劣点X1以外的基余顶点的中心为X4 作X1关于点X4的对称点X5 称X5为X1的反射点求反射点的过程称之为反射 2 扩张在得到反射点X5之后如果X5优于原单纯形的最劣点即有表明反射方向 X5 X1 是有利方向反射成功若进一步有可沿反射方向前进适当的距离到点X6 X6称之为扩张点求扩张点的过程称之为扩张扩张之后若扩张点X6优于反射点X5 则扩张成功以X6取代X1 得新单纯形 X6 X2 X3 否则扩张失败舍弃扩张点以反射X5点取代X1 得新单纯形 X5 X2 X3 设当前的单纯形的顶点为X1 X2 X3 且有如果出现表示反射完全失败应退回到介于X4与X1之间的某个点X8 3 收缩在得到反射点X5之后如果有表示反射部分成功方向 X5 X1 虽然是有利方向但X5前进过远应收缩到介于X4与X5之间的某个点X7 上述两种从反射点向X1方向后退的过程都称之为收缩如果收缩点优于原来的最劣点X1 称收缩成功并以收缩点取代原最劣点构成新单纯形 X7 X2 X3 或 X8 X2 X3 否则称之为收缩失败舍弃收缩点 4 缩边若收缩失败则应压缩当前单纯形的边长令最优点X3不动而其余顶点向X3方向压缩使边长缩短通常缩短一半以产生新单纯形如下图所示点X1压缩到点X9 点X2压缩到点X10 得新单纯形 X9 X10 X3 这一过程称之为缩边二单纯形替换算法设初始点为X0 初始边长h ei为坐标轴方向的单位向量预定正数 2 比较各项点Xi的函数值挑出其中的最优点记为XL 最劣点记XH 次差点记为Xw 3 求反射中心其中 a 0 通常取a 1 输出XL 为原问题近似极小点否则转 2 5 如果满足表1无约束优化方法搜索方向之间的相互联系间接法海赛矩阵的逆阵无约束优化方法间接法总结 1 梯度法方向负梯度用到一阶导数适合于精度不高或用于复杂函数寻找一个好的初始点2 牛顿法用到一阶导数和海色矩阵具有二次收敛性要求海色矩阵奇异且维数不宜太高3 共轭梯度法用到一阶导数具有二次收敛性4 变尺度法收敛快效果好被认为是目前最有效的无约束优化方法适用于维数较高具有一阶偏导数的目标函数 1 坐标轮换法计算效率较低适合维数较低目标函数无导数或导数较难求得2 步长加速法同坐标轮换法对目标函数的性态的适应性更好3 Powell法具有二次收敛性收敛速度较快可靠性高被认为是直接法中最有效的方法之一4 单纯形法思路清楚收敛慢无约束优化方法直接法总结无约束优化上机 Powell法优化设计程序与一维搜索黄金分割法组合题目编程求解函数的极小点x 初始点x0 1 1 T 迭代精度上机地点 4109 材控装控 4211 机自时间周一晚6 00 9 30

展开阅读全文