资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第八章 动态规划问题及求解,81 多阶段决策问题,动态规划是解决这样一类最优化问题的专门计算方法,这类问题允许把它的过程(求解)分解为一系列的单级过程(步骤)。,最优化原理:达到系统某种状态的过程无论是怎样的,以这个状态为初始状态的剩余过程的求解仍是最优的规划。也就是说,当系统处于第,个状态时,只要最优,规划剩余的,个过程,便可逐步求出,时的,最优解。,为了方便讨论动态规划的求解过程,我们把动态规划,问题化分为下面几个过程:,赶挺振咀栅面玩量泌凹味驳硫躇拧治栗凑芝贾上投闷帘妈赐售札劣颧吻冰优化模型动态规划优化模型动态规划,第八章 动态规划问题及求解最优化原理:达到系统某种状态的过,1,阶段(stage):,把问题恰当的分为若干个相互联系,的阶段;,2状态(State):,它是表示某段的出发位置,是某支路,的起点,又是前一段某支路的终点。第,个阶段的状态,变量,应该包含前各阶段决策过程的全部信息,且之后,作出的决策与之前的状态和决策无关。,3决策(Decision):,是指某阶段初从给定的状态出发,决策者所作出的选择,决策变量,表示第,个阶段,状态为,时对方案的选择。决策允许范围记为,,,4策略(Policy):,即决策序列。,个阶段动态规划问题,的策略可记为,楚硷审臼簧矢娘亭瘤藐游徐赚瓷练械码段弛咆窟斗洲纶凶绅蘸必费研硒唉优化模型动态规划优化模型动态规划,阶段(stage):把问题恰当的分为若干个相互联系的阶段;2,2,,当,时,,表示从,阶段开始到最后的决策,序列。,5状态转移方程:,表明后一阶段和前一阶段之间的,阶段状态和决策给定之后,第,关系。当第,阶段状态就确定了,记为,6.指标函数:,阶段指标函数-对应于某一阶段状态和从该,状态出发的决策的某种指标度量。第,阶段指标函数记,为,;过程指标函数-从某阶段开始到最后,过程的指标度量。记为,,最优策略值记为,墒袖烁猪爵康贾牙市瑞曲槐驼贾悉烟诗妊谚照娠盲语黑氏夜及逻钝脂漳崩优化模型动态规划优化模型动态规划,,当 时,表示从阶段开始到最后的决策序列。5状态转移方程,3,7动态规划基本方程:,过程指标函数是各阶段指标函数,的函数。,82 动态规划问题的解法,例1设某仓库有12人巡逻守卫,负责4个要害部位,对每个部位可分别派2到4人巡逻,由于巡逻人数不同,各部位预期在一段时间内可能造成的损失也不一样,具体数字见下表。问该卫队应往各部位分别派多少人巡逻才能使预期损失最小?,谗拼掷敏僻歌霉祸会曰分断声径享雀挟作骇士胞朔帚孵溅压络段围脾赘磋优化模型动态规划优化模型动态规划,7动态规划基本方程:过程指标函数是各阶段指标函数的函数。,4,A,B,C,D,2人,3人,4人,18,14,10,38,35,31,24,22,21,34,31,25,把12人派往4个部位看作4个阶段(k=1,2,3,4),每个阶段初可派遣的人数是前面阶段决策的结果,也是本阶段决策的依据。用 表示第,个阶段的状态变量,用,表示第,个阶段的决策变量(即在该阶段派出的,人数,显然,),各阶段可允许的决策集合,状态转移方程为,用,表示第,个阶段派出的巡逻人数为,时,在该部位的预期损失值,蔓挚痪啥弊旱遇霹吞渝桌膝滋赋妮炬吟淆万娶蕾铬螟丘炮貉久汐扶诫词膛优化模型动态规划优化模型动态规划,ABCD2人18382434把12人派往4个部位看作4个阶段,5,过程指标函数,由于,用,表示从第,个阶段到结束时预期损失值,,(1)先考虑D部位,(2)先考虑C,D部位,由于,,所以,敢军嫡敷洋寄刁痞勇属匡鞠颠橡蓬渣语竖芹厅滥氏财准胶渔项芭恶淹瘟剑优化模型动态规划优化模型动态规划,过程指标函数 由于 用 表示从第 个阶段到结束时预期损失值,,6,(3)先考虑B,C,D部位,由于,,所以,(4)先考虑A,B,C,D部位,由于,,所以,由此可见,A,B,C,D四个部位应分别派4人,2人,,2人,4人,预期损失值为97。,例5求从A点到G点的最段路线,掷媒岗煤舍漫扼伶宋暮园乏屑箱戏辅避沛葬村羡畅荆富俩匣学措瞪明需们优化模型动态规划优化模型动态规划,(3)先考虑B,C,D部位 由于,所以(4)先考虑A,B,7,解:从A到G分六个阶段:A-B,B-C,C-D,D-,E,E-F,F-G,(1)第六阶段F-G最短路,例2,屡钟解选筷眉勃穗逞烩蛮果沛忍凡裕滇牲侧真闺驭庆踏外鸭玛忠二柏衬胁优化模型动态规划优化模型动态规划,解:从A到G分六个阶段:A-B,B-C,C-D,D-,8,(2)第五阶段E-G最短路,(3)第四阶段D-G最短路,(4)第三阶段C-G最短路,姨杜洛唐圃逻北垮爸托桔坡桐效事审奏腑世脾质网郊谬群埔山逊造誓赞偷优化模型动态规划优化模型动态规划,(2)第五阶段E-G最短路(3)第四阶段D-G最短路(4,9,(5)第二阶段B-G最短路,(6)第一阶段A-G最短路,所以最短路是:A-B1-C2-D1-E2-F2-G,最短路长为18。,例3求下列非线性规划问题,幼丝指册颁碰盂吧秋缕犀贯饮格时纯绦辫缺懊阁镍硒交系熄防灵峻垄钡帮优化模型动态规划优化模型动态规划,(5)第二阶段B-G最短路(6)第一阶段A-G最短路 所,10,解:要求,的值,我们分三个阶段,,分别为第1,2,3阶段的决策变量。,设状态变量为,,显然,阶段指标函数,第三阶段,2第二阶段,却概枪猩些扶冉曾萨菜浚得彻磊烃烬亦贾望艘缆韩狄顶骋扩抵霖诧祭汛填优化模型动态规划优化模型动态规划,解:要求 的值,我们分三个阶段,分别为第1,2,3阶段的决,11,3第一阶段,所以,最优值为,痛冰卓皋乖饱危冈绰某歉鸭逛敏事顺缮均么茬肩奄呐啸如瓜搜瓜剧毯丫尊优化模型动态规划优化模型动态规划,3第一阶段 所以 最优值为 痛冰卓皋乖饱危冈绰某歉鸭逛敏事,12,例4 设备平行分配,某公司根据国家计划的安排拟将某种设备5台分给甲乙丙三个厂,各厂获得这种设备每年可向国家提供的利润如下表:,工厂,设备台数,0 1 2 3 4 5,甲,0,3,7,9,12,13,乙,0,5,10,11,11,11,丙,0,4,6,11,12,12,魂砷饱飞躺横岛糠伏腹队棉奸礁蕴之厉魁杏脐扣编庄纱挤亏森舵键赂贴姆优化模型动态规划优化模型动态规划,例4 设备平行分配工厂设备台数 0 1,13,解:分3个阶段,甲第3厂,乙-第2厂,丙-第1厂,设 为第 k 厂获得的台数,为 台设备分配给第 k 个厂所得利润.,表示当前 k状态下的已分的设备总数,表示当前状态下 台设备所得的最大利润,第一阶段,考虑丙厂(k=1),卢淮忧凛朗乙渺十诞锗播煤屋祟步菜挫格尤减戌某痕合伎凑钻肚取粮腾乾优化模型动态规划优化模型动态规划,解:分3个阶段,甲第3厂,乙-第2厂,丙-第1厂卢,14,第2阶段,考虑乙,丙厂(k=2),厩类琼轰靴涌沤爱坎逆沸禄身跪枝凡赌羊钢孕才旺逐铱敖乙仇振汁标破烷优化模型动态规划优化模型动态规划,第2阶段,考虑乙,丙厂(k=2)厩类琼轰靴涌沤爱坎逆沸禄身跪,15,裔栋庐枕虎熟闲诫嘱疫忿晨曼渊怒者生彻酸荫茎龚董乘瞎羞浓堑秋绦柜划优化模型动态规划优化模型动态规划,裔栋庐枕虎熟闲诫嘱疫忿晨曼渊怒者生彻酸荫茎龚董乘瞎羞浓堑秋绦,16,第3阶段,考虑甲,乙,丙厂(k=3),有两种分配方案:总最大利润21,方案1:甲0,乙2,丙3,方案2:甲2,乙2,丙1,场额困彻病划馈犊犹缓脊嫡倔蜀桌裳为庄止卞墩纫鲜胸伺辱洽杨亿掠婪汇优化模型动态规划优化模型动态规划,第3阶段,考虑甲,乙,丙厂(k=3)有两种分配方案:总最大利,17,第九章 LINGO8.0编程介绍,LINGO程序的背景及应用,美国芝加哥(Chicago)大学的Linus Schrage教授于1980年前后开发,后来成立 LINDO系统公司(LINDO Systems Inc.),网址:http:/,LINDO:Linear INteractive and Discrete Optimizer (V6.1),LINGO:Linear INteractive General Optimizer (V8.0),LINDO API:LINDO Application Programming Interface(V2.0),Whats Best!:(SpreadSheet e.g.EXCEL)(V7.0),目前的产品有:演示(试用)版、学生版、高级版、超级版、工业版、扩展版(求解问题规模和选件不同),茵懒驶蝉婚羽蓝橡允乎床沫蛤棋碾浴晰瓦姿坷丝扶赡抄竹酒暴吾胶惦汤啃优化模型动态规划优化模型动态规划,第九章 LINGO8.0编程介绍茵懒驶蝉婚羽蓝橡允乎床沫蛤,18,LINDO和LINGO软件能求解的优化模型,LINGO,LINDO,优化模型,线性规划,(LP),非线性规划,(NLP),二次规划,(QP),连续优化,整数规划(IP),因乘毛疑缠鸽字妙紊无裂诌伐戒劫闪这查惠神佐姜狱隋尉盎擎擦由核袭乘优化模型动态规划优化模型动态规划,LINDO和LINGO软件能求解的优化模型优化模型线性规划非,19,LINGO模型的优点,包含了LINDO的全部功能,提供了灵活的编程语言(矩阵生成器),LINGO模型的构成:4个段,目标与约束段(MODEL:END),集合段(SETS:ENDSETS),数据段(DATA:ENDDATA),初始段(INIT:ENDINIT),例1:编一个LINGO程序求解下列线性规划问题的最优解,简医棋怒硝饰厄洗举闸橇未茹玉静仇阳稀磁伐昔冕藏罚失潮法愈崔损裔钨优化模型动态规划优化模型动态规划,LINGO模型的优点例1:编一个LINGO程序求解下列线性规,20,程序,model:,max=1.15*x41+1.4*x23+1.25*x32+1.06*x54;,x11+x14=10000;,-1.06*x14+x21+x23+x24=0;,-1.15*x11-1.06*x24+x31+x32+x34=0;,-1.15*x21-1.06*x34+x41+x44=0;,-1.15*x31-1.06*x44+x54=0;,x23=30000;,x32=40000;,End,运行结果:,Global optimal solution found at iteration:2,Objective value:14840.00,许苫抽雏刘贯舀丹篷附出疏帮蕴汤珐掉腋挣阵赚图殉常妮件盟孽扼悍亿邯优化模型动态规划优化模型动态规划,程序许苫抽雏刘贯舀丹篷附出疏帮蕴汤珐掉腋挣阵赚图殉常妮件盟孽,21,Variable Value Reduced Cost,X41 0.000000 0.6739130E-01,X23 10600.00 0.000000,X32 0.000000 0.4043478E-01,X54 0.000000 0.000000,X11 0.000000 0.000000,X14 10000.00 0.000000,X21 0.000000 0.000000,X24 0.000000 0.3213913E-01,X31 0.000000 0.7143478E-01,X34 0.000000 0.000000,X44 0.000000 0.9379130E-01,Row Slack or Surplus Dual Price,1 14840.00 1.000000,2 0.000000 1.484000,摊讫阁齿钥键堵枕腕支俺青奎肠茹懊逸青色熊七嘲狄挽痔摸什承企确悉按优化模型动态规划优化模型动态规划,Variable Value,22,3 0.000000 1.400000,4 0.000000 1.290435,5 0.000000 1.217391,6 0.000000 1.060000,7 19400.00 0.000000,8 40000.00 0.000000,例2:编一个LINGO程序求解下列线性规划问题的最优解,贱匆胃盾簿穆瓷篷辜窗浮提譬撮淖蜒鼠巡脸扁获樟输楷界跋振准骨粥蹬次优化模型动态规划优化模型动态规划,
展开阅读全文