《现代优化技术-靳志宏》算法收敛性.ppt

资源描述

现代优化技术第13讲算法收敛性浅析一模拟退火算法的基本思想启发注意到一个自然规则物质总是趋于最低的能态水总是向低处流电子总是向最低能级的轨道排布最低能态是最稳定的状态物质会自动地趋向的最低能态模拟退火算法起源物理退火原理模拟退火算法与物理退火过程的相似关系模拟退火算法 Metropolis准则 Metropolis准则假设在状态xold时系统受到某种扰动而使其状态变为xnew 与此相对应系统的能量也从E xold 变成E xnew 系统由状态xold变为状态xnew的接受概率p 模拟退火算法流程随机产生一个初始解x0 令xbest x0 并计算目标函数值E x0 设置初始温度T 0 To DowhileT Tmin 降温过程forj 1 k 等温过程对当前最优解xbest按照某一邻域函数产生一新的解xnew 计算新的目标函数值E xnew 并计算目标函数值的增量 E E xnew E xbest 如果 E 0 则xbest xnew 如果 E 0 则p exp E T i 如果c random 0 1 p xbest xnew 否则xbest xbest Endfor按照温度控制策略更新T EndDo输出当前最优点计算结束模拟退火算法要素 1 状态空间与状态产生函数邻域函数搜索空间也称为状态空间它由经过编码的可行解的集合所组成状态产生函数邻域函数应尽可能保证产生的候选解能遍布全部解空间通常由两部分组成即产生候选解的方式和候选解产生的概率分布候选解一般按照某一概率分布对解空间进行随机采样来获得概率分布可以是均匀分布正态分布指数分布等等模拟退火算法要素 2 状态转移概率接受概率 p状态转移概率是指从一个状态xold 一个可行解向另一个状态xnew 另一个可行解的转移概率通俗的理解是接受一个新解为当前解的概率它与当前的温度参数T有关随温度下降而减小一般采用Metropolis准则模拟退火算法要素 3 冷却进度表T t 冷却进度表是指从某一高温状态To向低温状态冷却时的降温管理表假设时刻t的温度用T t 来表示则经典模拟退火算法的降温方式为而快速模拟退火算法的降温方式为这两种方式都能够使得模拟退火算法收敛于全局最小点模拟退火算法要素 4 初始温度T0实验表明初温越大获得高质量解的几率越大但花费的计算时间将增加因此初温的确定应折衷考虑优化质量和优化效率常用方法包括 1 均匀抽样一组状态以各状态目标值的方差为初温 2 随机产生一组状态确定两两状态间的最大目标值差 max 然后依据差值利用一定的函数确定初温比如 t0 max pr 其中pr为初始接受概率 3 利用经验公式给出模拟退火算法要素 5 内循环终止准则或称Metropolis抽样稳定准则用于决定在各温度下产生候选解的数目常用的抽样稳定准则包括 1 检验目标函数的均值是否稳定 2 连续若干步的目标值变化较小 3 按一定的步数抽样模拟退火算法要素 6 外循环终止准则即算法终止准则常用的包括 1 设置终止温度的阈值 2 设置外循环迭代次数 3 算法搜索到的最优值连续若干步保持不变 4 检验系统熵是否稳定模拟退火算法的改进也可通过增加某些环节而实现对模拟退火算法的改进主要的改进方式包括 1 增加升温或重升温过程在算法进程的适当时机将温度适当提高从而可激活各状态的接受概率以调整搜索进程中的当前状态避免算法在局部极小解处停滞不前 2 增加记忆功能为避免搜索过程中由于执行概率接受环节而遗失当前遇到的最优解可通过增加存储环节将 BestSoFar 的状态记忆下来 3 增加补充搜索过程即在退火过程结束后以搜索到的最优解为初始状态再次执行模拟退火过程或局部性搜索 4 对每一当前状态采用多次搜索策略以概率接受区域内的最优状态而非标准SA的单次比较方式 5 结合其他搜索机制的算法如遗传算法混沌搜索等 6 上述各方法的综合应用 15 1随机过程的概念随机过程被认为是概率论的动力学部分即它的研究对象是随时间演变的随机现象它是从多维随机变量向一族无限多个随机变量的推广给定一随机试验其样本空间将样本空间中的每一元作如下对应便得到一系列结果 17 例1 抛掷一枚硬币的试验样本空间是现定义 18 19 20 例5 考虑抛掷一颗骰子的试验 22 随机过程的分类随机过程可根据参数集T和任一时刻的状态分为四类参数集T可分为离散集和连续集两种情况任一时刻的状态分别为离散型随机变量和连续型随机变量两种连续参数连续型的随机过程如例2 例3连续参数离散型的随机过程如例1 例4离散参数离散型的随机过程如例5离散参数连续型的随机过程如下例马尔科夫Markov链引例假定某大学有1万学生每人每月用1支牙膏并且只使用中华牙膏与黑妹牙膏两者之一根据本月 12月调查有3000人使用黑妹牙膏 7000人使用中华牙膏又据调查使用黑妹牙膏的3000人中有60 的人下月将继续使用黑妹牙膏 40 的人将改用中华牙膏使用中华牙膏的7000人中有70 的人下月将继续使用中华牙膏 30 的人将改用黑妹牙膏据此可以得到如表所示的统计表状态和状态转移状态是指客观事物可能出现或存在的状况如企业的产品在市场上可能畅销也可能滞销状态转移是指客观事物由一种状态到另一种状态的变化客观事物的状态不是固定不变的它可能处于这种状态也可能处于那种状态往往条件变化状态也会发生变化如某种产品在市场上本来是滞销的但是由于销售渠道变化了或者消费心理发生了变化等它便可能变为畅销产品转移概率与转移概率矩阵假定某大学有1万学生每人每月用1支牙膏并且只使用中华牙膏与黑妹牙膏两者之一根据本月 12月调查有3000人使用黑妹牙膏 7000人使用中华牙膏又据调查使用黑妹牙膏的3000人中有60 的人下月将继续使用黑妹牙膏 40 的人将改用中华牙膏使用中华牙膏的7000人中有70 的人下月将继续使用中华牙膏 30 的人将改用黑妹牙膏据此可以得到如表所示的统计表上表中的4个概率就称为状态的转移概率而这四个转移概率组成的矩阵B 称为转移概率矩阵可以看出转移概率矩阵的一个特点是其各行元素之和为 2转移概率矩阵及柯尔莫哥洛夫定理例1某计算机机房的一台计算机经常出故障研究者每隔15min观察一次计算机的运行状态收集了24h的数据共作97次观察用1表示正常状态用0表示不正常状态所得的数据序列如下 1110010011111110011110111111001111111110001101101111011011010111101110111101111110011011111100111 近邻探索过程全局最优解局部最优解2 局部最优解1 邻域目标函数値模拟退火算法的数学模型可以描述为在给定邻域结构后模拟退火过程是从一个状态到另一个状态不断地随机游动我们可以用马尔科夫链描述这一过程对给定的温度t 两个状态的转移概率定义为称为从i到j的产生概率 generationprobability 表示在状态i时 j状态被选取的概率比较容易理解的是j为i的邻居如果在邻域中等概率选取则j被选中的概率为称为接受概率 acceptanceprobability 表示产生状态j后 j状态被接受的概率在模拟退火算法中常见的是由上面三组公式可以看出一步转移概率只同状态i转移到状态j有关同第几次迭代无关因此马氏链是时齐的正是这个原因将这一类算法取名为时齐算法下面介绍几个概率论中常用概念辅助同学们理解算法收敛性的讨论过程若存在n 使得则称状态i可达状态j 记成若状态i和状态j满足且则称状态i和状态j相通记成有如下定理定理若且则有定义从i到达j的首达时刻的随机变量为其概率定义为迟早到达概率定义为定理的充分必要条件是定理状态j是常返的则以概率1系统无穷次返回状态j 状态j是非常返的则以概率1 系统只有限次返回状态j 记表示自状态i出发系统通过j状态至少m次的概率记表示状态i出发通过j状态至少m次的时间于是有进而所以常返的含义常返中的一种特殊情况为正常返定义当时为正常返当时为零常返常返定理表明常返是以概率1无穷次返回同一状态上式表明有些常返状态的平均返回次数是有限的而有些是无限的当马氏链的离散状态均为常返且平均返回次数有限就称该马氏链是正常返的在模拟退火的理论中经常用到的一个概念是不可约不可约中用到的一个概念是闭集一个集合C是闭集的定义为有这表示集合C是一个封闭的集合 i不可达到j 对任意n成立除整个状态空间外没有别的闭集的马氏链成为不可约的马氏链定理1 不可约有限状态且时齐的马氏链是正常返的定理2 非周期不可约且时齐的马氏链是正常返的充分必要条件存在唯一平稳分布满足模拟退火算法的时齐算法当具有以下条件成立时则可以认为该模拟退火算法收敛全局最优解 1 在每一个给定的温度t 给出算法一步转移概率的一些限定条件使得定理2成立由此得到平稳分布概率 2 给出平稳分布应该满足的条件使得当温度渐进达到0度时平稳分布的极限存在即要求 3 进一步要求平稳分布的极限具有全局最优性条件其中是最优状态集合探索空间 searchspace 与实行可能域 feasiblesolutionfield 1 探索空间实行可能域目标函数值探索评价基准近邻例一台机器的交货期最小迟延排序问题工件的集合 1 2 3 4 可行解的集合从 1 2 3 4 中構成4 种可能的排序目标函数一台机器的交货期最小迟延排序问题目标函数交货期迟延的合計最小化可行解順列 1234所对应的目标函数 J1 6 近邻一台机器的交货期最小迟延排序问题近邻两个相邻工件交換后得到的排序可行解1234的近邻 1243 1324 2134 一台机器的交货期最小迟延排序问题近邻图 1234 1243 点与解一一对应 6 6 7 7 5 4 3 5 7 7 10 8 7 8 6 6 8 5 5 4 6 10 目标函数值 2134 1324 探索空间 searchspace 与实行可能域 feasiblesolutionfield 2 探索空间目标函数值 objectivefunctionvalue 惩罚函数值 penaltyfunctionvalue 实行可能域探索空间实行可能域探索评价基准带有时间窗约束的VRP问题邻域交换不能随意进行因为需要满足客户时间窗的硬性要求处理办法有两种 1 不排斥不可行解用惩罚函数进行处理通常为在目标函数设置一个惩罚项如果突破时间窗则使目标函数为一个正无穷大的值该种做法的实质是扩大了解空间使近邻搜索空间具有完备性同时又不影响搜索结果但会影响搜索路径有好有坏这样的改造会使邻域内选择解的概率满足上述定理的假设条件充分满足随机性会提高算法的各方面性能因此是推荐方法 2 排斥不可行解直接忽略不能满足上述定理的条件影响算法收敛性解空间的搜索解离散随机状态随机状态的跳转满意解最终状态 SA接受准则 GA算子状态转移概率矩阵目标函数的导向性稳态概率最大似然值对应状态考试题型选择 20 判断 20 简答 60 简答内容 1 对于概念技术细节的描述原理的阐述 2 编码设计 3 编写算法伪代码 4 算法的时间复杂度计算 5 收敛性简要分析下次课 1 数学模型算法设计以及程序设计的关系难点约束条件的算法处理模式定理与积木块假设算法迭代中不可行解的处理办法 2 算法程序实现的实例详解适应度函数编写的难点复杂模型的程序推进核心时间残值矩阵 Q A

展开阅读全文