决策理论与方法教学PPT第四章课件

资源描述

决策理论与方法决策理论与方法（Decision Making Theory and Methods）决策理论与方法决策理论与方法编写组编写组教育部高等学校管理科学与工程类学科专业教学指导委员会教育部高等学校管理科学与工程类学科专业教学指导委员会推荐教材推荐教材决策理论与方法决策理论与方法（Decision Making Theor决策理论与方法决策理论与方法第 2 页第 2 页第四章动态决策分析第四章第四章动态决策分析动态决策分析决策理论与方法决策理论与方法第 3 页第 3 页学习目的学习目的了解多阶段决策、序贯决策的概念及特点；了解多阶段决策、序贯决策的概念及特点；掌握动态规划与决策树方法及其在多阶段决策、掌握动态规划与决策树方法及其在多阶段决策、序贯决策中的应用。序贯决策中的应用。学习目的了解多阶段决策、序贯决策的概念及特点；学习目的了解多阶段决策、序贯决策的概念及特点；决策理论与方法决策理论与方法第 4 页第 4 页本讲内容本讲内容4.1动态决策的基本原理动态决策的基本原理4.2多属性决策多属性决策本讲内容本讲内容4.1动态决策的基本原理动态决策的基本原理决策理论与方法决策理论与方法第 5 页第 5 页4.1 4.1 多阶段决策问题的提多阶段决策问题的提出出4.1.1 4.1.1 动态规划概述动态规划概述规划问题的最终目的就是确定各决策变量的取值，以使目标函数达到极大规划问题的最终目的就是确定各决策变量的取值，以使目标函数达到极大或极小。在线性规划和非线性规划中，决策变量都是以集合的形式被一次性处理的；或极小。在线性规划和非线性规划中，决策变量都是以集合的形式被一次性处理的；然而，有时我们也会面对决策变量需分期、分批处理的多阶段决策问题。然而，有时我们也会面对决策变量需分期、分批处理的多阶段决策问题。所所谓谓多多阶阶段段决决策策问问题题是是指指这这样样一一类类活活动动过过程程：它它可可以以分分解解为为若若干干个个互互相相联联系系的的阶阶段段，在在每每一一阶阶段段分分别别对对应应着着一一组组可可供供选选取取的的决决策策集集合合，即即构构成成过过程程的的每每个个阶阶段段都都需需要要进进行行一一次次决决策策。将将各各个个阶阶段段的的决决策策综综合合起起来来构构成成一一个个决决策策序序列列，称称为为一一个个策策略略。显显然然，由由于于各各个个阶阶段段选选取取的的决决策策不不同同，对对应应整整个个过过程程可可以以有有一一系系列列不不同同的的策策略略。当当过过程程采采取取某某个个具具体体策策略略时时，相相应应可可以以得得到到一一个个确确定定的的效效果果，采采取取不不同同的的策策略略，就就会会得得到到不不同同的的效效果果。多多阶阶段段的的决决策策问问题题，就就是是要要在在所所有有可可能能采采取取的的策策略略中中选选取取一一个个最最优优策策略略，以以便便得得到到最最佳佳的的效效果果。动动态态规规划划同同前前面面介介绍绍过过的的各各种种优优化化方方法法不不同同，它它不不是是一一种种算算法法，而而是是考考察察问问题题的的一一种种途途径径。动动态态规规划划是是一一种种求求解解多多阶阶段段决决策策问问题题的的系系统统技技术术，可可以以说说它它横横跨跨整整个个规规划划领领域域（线线性性规规划划和和非非线线性性规规划划）。当当然然，由由于于动动态态规规划划不不是是一一种种特特定定的的算算法法，因因而而它它不不像像线线性性规规划划那那样样有有一一个个标标准准的的数数学学表表达达式式和和明明确确定定义义的的一一组组规规则则，动动态态规规划划必必须须对对具具体体问问题题进进行行具具体体的的分分析析处处理理。在在多多阶阶段段决决策策问问题题中中，有有些些问问题题对对阶阶段段的的划划分分具具有有明明显显的的时时序序性性，动动态态规规划划的的“动动态态”二二字字也由此而得名。也由此而得名。4.1 多阶段决策问题的提出多阶段决策问题的提出4.1.1 动态规划概述动态规划概述决策理论与方法决策理论与方法第 6 页第 6 页动动态态规规划划的的主主要要创创始始人人是是美美国国数数学学家家贝贝尔尔曼曼。2020世世纪纪4040年年代代末末5050年年代代初初，当当时时在在兰兰德德公公司司从从事事研研究究工工作作的的贝贝尔尔曼曼首首先先提提出出了了动动态态规规划划的的概概念念。19511951年年贝贝尔尔曼曼首首先先提提出出了了动动态态规规划划中中解解决决多多阶阶段段决决策策问问题题的的最最优优化化原原理理，并并给给出出了了许许多多实实际际问问题题的的解解法法。19571957年年贝贝尔尔曼曼出出版版了了他他的的第第一一部部著著作作动动态态规规划划，标标志志着着运运筹筹学学这这一一重重要要分分支支的的诞诞生生。该该著著作作成成为为当当时时唯唯一一的的进进一一步步研研究究和和应应用用动动态态规规划划的的理理论论源源泉泉。19611961年年贝贝尔尔曼曼出出版版了了他他的的第第二二部部著著作作，并并于于19621962年年同同杜杜瑞瑞佛佛思思合合作作出出版版了了第第三三部部著著作作。在在贝贝尔尔曼曼及及其其助助手手们们致致力力于于发发展展和和推推广广这这一一技技术术的的同同时时，其其他他一一些些学学者者也也对对动动态态规规划划的的发发展展作作了了巨巨大大的的贡贡献献，其其中中最最值值得得一一提提的的是是爱爱尔尔思思和和梅梅特特顿顿。爱爱尔尔思思先先后后于于19611961年年和和19641964年年出出版版了了两两部部关关于于动动态态规规划划的的著著作作，并并于于19641964年年同同尼尼母母霍霍思思尔尔、威威尔尔德德一一道道创创建建了了处处理理分分支支、循循环环性性多多阶阶段段决决策策系系统统的的一一般般性性理理论论。梅梅特特顿顿提提出出了了许许多多对对动动态态规规划划后后来来发发展展有着重要意义的基础性观点，并且对明晰动态规划路径的数学性质作出了巨大的贡献。有着重要意义的基础性观点，并且对明晰动态规划路径的数学性质作出了巨大的贡献。动动态态规规划划从从创创立立到到现现在在5050多多年年来来，无无论论在在工工程程技技术术、企企业业管管理理还还是是在在工工农农业业生生产产及及军军事事等等部部门门都都有有着着广广泛泛的的应应用用，并并取取得得了了显显著著的的效效果果。在在管管理理方方面面，动动态态规规划划可可用用于于资资源源分分配配问问题题、最最短短路路径径问问题题、库库存存问问题题、背背包包问问题题、设设备备更更新新问问题题、最最优优控控制制问问题题等等等等，所所以以动动态态规规划划是现代管理学中进行科学决策不可缺少的工具。是现代管理学中进行科学决策不可缺少的工具。动动态态规规划划的的优优点点在在于于，它它把把一一个个多多维维决决策策问问题题转转化化为为若若干干个个一一维维最最优优化化问问题题，而而对对一一维维最最优优化化问问题题一一个个一一个个地地去去解解，这这种种方方法法是是许许多多求求极极值值方方法法所所做做不不到到的的，它它几几乎乎优优于于所所有有现现存存的的优优化化方方法法。除除此此之之外外，动动态态规规划划能能求求出出全全局局极极大大或或极极小小，这这一一点点也也优优于于其其他他优优化化方方法法。需需要要指指出出的的是是，动动态态规规划划是是求求解解最最优优化化问问题题的的一一种种方方法法，是是解解决决问问题题的的一一种种途途径径，而而不不是是一一种种算算法法。在在前前面面我我们们学学习习了了用用单单纯纯形形法法解解线线性性规规划划问问题题，凡凡是是具具有有线线性性规规划划问问题题那那样样统统一一的的数数学学模模型型都都可以用单纯形法去求解，而可以用单纯形法去求解，而动态规划的主要创始人是美国数学家贝尔曼。动态规划的主要创始人是美国数学家贝尔曼。20决策理论与方法决策理论与方法第 7 页第 7 页动动态态规规划划问问题题的的求求解解却却没没有有统统一一的的方方法法（类类似似于于单单纯纯形形法法）。因因此此在在用用动动态态规规划划求求解解最最优优化化问问题题中中，必必须须对对具具体体问问题题具具体体分分析析，针针对对不不同同的的问问题题，使使用用动动态态规规划划最最优优化化原原理理和和方方法法，建建立立起起与与其其相相应应的的数数学学模模型型，然然后后再再用用动动态态规规划划方方法法去去求求解解。根根据据动动态态规规划划这这些些特特点点，要要求求我我们们在在学学好好动动态态规规划划的的基基本本原原理理和和方方法法的的同同时时，还还应应具具有有丰丰富富的的想想象象力力，只只有有这这样样才才能能建建好好模模型型求求出出问问题的最优解。题的最优解。动态规划问题的求解却没有统一的方法（类似于单纯形法）。因此在动态规划问题的求解却没有统一的方法（类似于单纯形法）。因此在决策理论与方法决策理论与方法第 8 页第 8 页4.1 动态决策的基本原理动态决策的基本原理4.1.1 动态规划动态规划动态规划（动态规划（dynamic Programming，DP）是解）是解决多阶段决策过程最优化的一种方法，其基本思路是决多阶段决策过程最优化的一种方法，其基本思路是将多阶段决策过程转化为一系列相互关联的单阶段问将多阶段决策过程转化为一系列相互关联的单阶段问题，并依次求解。题，并依次求解。DP是离散系统最优化的一种有效工具，目前动是离散系统最优化的一种有效工具，目前动态规划已广泛用于工业、农业、工程技术、资源、环态规划已广泛用于工业、农业、工程技术、资源、环境、经济、社会等领域。境、经济、社会等领域。4.1 动态决策的基本原理动态决策的基本原理4.1.1 动态规划动态规划决策理论与方法决策理论与方法第 9 页第 9 页4.1 动态决策的基本原理动态决策的基本原理4.1.1 动态规划动态规划例例4-1-1 最最优优线线路路问问题题。由由水水源源地地向向城城市市的的输输水水线线路路需需通通过过3个个控控制制点点，每每个个控控制制点点均均有有两两个个可可选选方方案案，每每段段线线路路的的输输水水费费用用如如下下图图所所示示。选选出出一一条条输输水水线路，使得总输水费用最小。线路，使得总输水费用最小。4.1 动态决策的基本原理动态决策的基本原理4.1.1 动态规划动态规划决策理论与方法决策理论与方法第 10 页第 10 页4.1 动态决策的基本原理动态决策的基本原理4.1.1 动态规划动态规划最优性原理（最优性原理（the principle of optimality）也称为）也称为Bellman原理，是原理，是R.Bellman提出的提出的DP的基本原理，的基本原理，其表述为：其表述为：“一个过程的最优策略具有这样的性质，一个过程的最优策略具有这样的性质，即无论初始状态和初始决策如何，对于由前面的决策即无论初始状态和初始决策如何，对于由前面的决策所形成的状态来说，其后各阶段的决策序列必定构成所形成的状态来说，其后各阶段的决策序列必定构成相应子过程的最优策略相应子过程的最优策略”。4.1 动态决策的基本原理动态决策的基本原理4.1.1 动态规划动态规划决策理论与方法决策理论与方法第 11 页第 11 页4.1 动态决策的基本原理动态决策的基本原理4.1.2 决策树决策树决策树决策树(decision tree)就是将决策过程各个阶段之就是将决策过程各个阶段之间的结构绘制成一张箭线图，每个决策或事件（即自间的结构绘制成一张箭线图，每个决策或事件（即自然状态）都可能引出两个或多个事件，导致不同的结然状态）都可能引出两个或多个事件，导致不同的结果。果。决策树的构成有四个要素：决策树的构成有四个要素：1)决策结点；决策结点；2)方案方案枝；枝；3)状态结点；状态结点；4)概率枝。概率枝。4.1 动态决策的基本原理动态决策的基本原理4.1.2 决策树决策树决策理论与方法决策理论与方法第 12 页第 12 页4.1 动态决策的基本原理动态决策的基本原理4.1.2 决策树决策树方案枝方案枝决策结点概率枝概率枝状态结点概率枝概率枝概率枝状态结点概率枝4.1 动态决策的基本原理动态决策的基本原理4.1.2 决策树方案枝方案枝决策决策树方案枝方案枝决策决策理论与方法决策理论与方法第 13 页第 13 页4.1 动态决策的基本原理动态决策的基本原理4.1.2 决策树决策树决策树法的决策程序如下：决策树法的决策程序如下：1)绘制树状图，根据已知条件排列出各个方案和绘制树状图，根据已知条件排列出各个方案和每一方案的各种自然状态。每一方案的各种自然状态。2)将各状态概率及损益值标于概率枝上。将各状态概率及损益值标于概率枝上。3)计算各方案期望值并将其标于该方案对应的状计算各方案期望值并将其标于该方案对应的状态结点上。态结点上。4)进行剪枝，比较各个方案的期望值，并标于方进行剪枝，比较各个方案的期望值，并标于方案枝上，将期望值小的案枝上，将期望值小的(即劣等方案剪掉即劣等方案剪掉)所剩的最后所剩的最后方案为最佳方案。方案为最佳方案。4.1 动态决策的基本原理动态决策的基本原理4.1.2 决策树决策树决策理论与方法决策理论与方法第 14 页第 14 页4.2 多阶段决策多阶段决策多阶段决策有以下三个特点，多阶段决策有以下三个特点，第一，决策者需要做出时间上有先后之别的多个第一，决策者需要做出时间上有先后之别的多个决策；决策；第二，前一次决策的选择将直接影响到后一次决第二，前一次决策的选择将直接影响到后一次决策，后一次决策的状态取决于前一次决策的结果；策，后一次决策的状态取决于前一次决策的结果；第三，决策者关心的是多次决策的总结果，而不第三，决策者关心的是多次决策的总结果，而不是各次决策的即时后果。是各次决策的即时后果。4.2 多阶段决策多阶段决策决策理论与方法决策理论与方法第 15 页第 15 页4.2 多阶段决策多阶段决策4.2.1 多阶段决策过程的基本概念多阶段决策过程的基本概念（1）阶段）阶段（2）状态）状态（3）决策与策略）决策与策略（4）指标函数与目标函数）指标函数与目标函数（5）多阶段决策过程多阶段决策过程4.2 多阶段决策多阶段决策4.2.1 多阶段决策过程的基本概念多阶段决策过程的基本概念决策理论与方法决策理论与方法第 16 页第 16 页4.2 多阶段决策多阶段决策4.2.2 多阶段决策问题的决策方法多阶段决策问题的决策方法多多阶阶段段决决策策问问题题包包括括确确定定型型与与随随机机型型两两大大类类，在在确确定定型型多多阶阶段段决决策策中中，目目标标值值都都是是确确定定值值，在在风风险险型型多阶段决策中，目标值用期望值作为评价的标准。多阶段决策中，目标值用期望值作为评价的标准。下面分别以两个例子说明其决策方法。下面分别以两个例子说明其决策方法。4.2 多阶段决策多阶段决策4.2.2 多阶段决策问题的决策方法多阶段决策问题的决策方法决策理论与方法决策理论与方法第 17 页第 17 页4.2 多阶段决策多阶段决策4.2.2 多阶段决策问题的决策多阶段决策问题的决策方法方法例例4-2-1 某公司考虑为某新产品定某公司考虑为某新产品定价，该产品的单价拟从每件价，该产品的单价拟从每件5元、元、6元、元、7元、元、8元这四个价格中选元这四个价格中选取其中之一，每年年初允许变动取其中之一，每年年初允许变动价格，但幅度不能超过价格，但幅度不能超过1元。该元。该公司预计该产品畅销只有五年，公司预计该产品畅销只有五年，五年后将被淘汰，另据销售情况五年后将被淘汰，另据销售情况的预测，在价格不同的情况下各的预测，在价格不同的情况下各年的预计利润额见右表。年的预计利润额见右表。单价第1年第2年第3年第4年第5年5元10121520256元12131620247元14141618188元16151514144.2 多阶段决策多阶段决策4.2.2 多阶段决策问题的决策方法单价第多阶段决策问题的决策方法单价第决策理论与方法决策理论与方法第 18 页第 18 页4.2 多阶段决策多阶段决策4.2.2 多阶段决策问题的决策方法多阶段决策问题的决策方法例例4-2-1决策图决策图 736045845元1012152025736045846元1213162024736045847元1414161818736045848元16151514144.2 多阶段决策多阶段决策4.2.2 多阶段决策问题的决策方法多阶段决策问题的决策方法 73决策理论与方法决策理论与方法第 19 页第 19 页4.2 多阶段决策多阶段决策4.2.2 多阶段决策问题的决策方法多阶段决策问题的决策方法例例4-2-2 为了更正确地掌握市场情况，正式投产公司为了更正确地掌握市场情况，正式投产公司打算先生产少量产品试销，试销费需要打算先生产少量产品试销，试销费需要5000元。试元。试销结果分为产品受欢迎销结果分为产品受欢迎(H1)，一般，一般(H2)和不受欢迎和不受欢迎(H3)三种。由于试销面不宽，试销结果的准确性有限。三种。由于试销面不宽，试销结果的准确性有限。其准确度（似然分布矩阵）见下表：其准确度（似然分布矩阵）见下表：P P()P P(HH1 1)P P(HH2 2)P P(HH3 3)1 10.60.60.60.60.30.30.10.1 2 20.30.30.20.20.60.60.20.2 3 30.10.10.20.20.30.30.50.54.2 多阶段决策多阶段决策4.2.2 多阶段决策问题的决策方法多阶段决策问题的决策方法 P决策理论与方法决策理论与方法第 20 页第 20 页4.2 多阶段决策多阶段决策4.2.2 多阶段决策问题的决策方法多阶段决策问题的决策方法例例4-2-2的表格的表格（0.6）（0.3）（0.1）4000020000-300003000030000-20000100001000010000 （0.6）（0.3）（0.1）0.60.20.20.30.60.30.10.20.54.2 多阶段决策多阶段决策4.2.2 多阶段决策问题的决策方法多阶段决策问题的决策方法（0决策理论与方法决策理论与方法第 21 页第 21 页如如不不买买此此项项专专利利，把把这这笔笔费费用用用用在在其其他他方方面面，在在同同样样的时期可获利的时期可获利1.1万元。那么，该公司应该如何决万元。那么，该公司应该如何决（1）是否买专利？）是否买专利？（2）如果买专利，是否采取试销办法？）如果买专利，是否采取试销办法？（3）如如果果不不试试销销，应应大大批批生生产产，中中批批生生产产还还是是小小批批生生产产？如如果果试试销销，又又应应该该如如何何根根据据试试销销结结果果决决定定其其行行动？动？如不买此项专利，把这笔费用用在其他方面，在同样的时期可获利如不买此项专利，把这笔费用用在其他方面，在同样的时期可获利1决策理论与方法决策理论与方法第 22 页第 22 页第一阶段第一阶段127买专利买专利不买专利不买专利试销试销不试销不试销3456H1H2H38910a1a2a3123（略）（略）第二阶段第二阶段第三阶段第三阶段例例4-2-2第一阶段第一阶段127买专利不买专利试销不试销买专利不买专利试销不试销3456H1H2H38决策理论与方法决策理论与方法第 23 页第 23 页例例4-2-2解：这是一个三阶段决策问题，采用解：这是一个三阶段决策问题，采用逆序归逆序归纳法进行决策分析，先要计算在一定的试销纳法进行决策分析，先要计算在一定的试销结果下的各后验概率。由全概率公式：结果下的各后验概率。由全概率公式：计算得计算得：例例4-2-2解：这是一个三阶段决策问题，采用逆序归纳法进行决解：这是一个三阶段决策问题，采用逆序归纳法进行决决策理论与方法决策理论与方法第 24 页第 24 页例例4-2-2再再由贝叶斯公式：由贝叶斯公式：计算得计算得：例例4-2-2再由贝叶斯公式：计算得：再由贝叶斯公式：计算得：决策理论与方法决策理论与方法第 25 页第 25 页例例4-2-2v当试销结果为当试销结果为 H1时：时：故当试销结果为故当试销结果为 H1时，应选择大批生产时，应选择大批生产a1，截，截去方案去方案a2、a3，结点结点4的值为的值为3.406万元万元。-结点结点8-结点结点9-结点结点10例例4-2-2当试销结果为当试销结果为 H1时：故当试销结果为时：故当试销结果为 H1时，应时，应决策理论与方法决策理论与方法第 26 页第 26 页例例4-2-2v当试销结果当试销结果为为 H2时：时：故当试销结果为故当试销结果为 H2时，应选择中批生产时，应选择中批生产a2，截，截去方案去方案a1、a3，结点结点5的值为的值为2.62万元万元。例例4-2-2当试销结果为当试销结果为 H2时：故当试销结果为时：故当试销结果为 H2时，应时，应决策理论与方法决策理论与方法第 27 页第 27 页例例4-2-2v当试销结果为当试销结果为 H3时：时：故当试销结果为故当试销结果为 H3时，也应选择中批生产时，也应选择中批生产a2，截去方案截去方案a1、a3，结点结点6的值为的值为1.53万元万元。例例4-2-2当试销结果为当试销结果为 H3时：故当试销结果为时：故当试销结果为 H3时，也时，也决策理论与方法决策理论与方法第 28 页第 28 页例例4-2-2v试销收益期望值：试销收益期望值：故当不试销时，应选择大批生产故当不试销时，应选择大批生产a1，截去方案，截去方案a2、a3，结点结点7的值为的值为2.7万元万元。v不试销的收益期望值：不试销的收益期望值：-结点结点3例例4-2-2试销收益期望值：故当不试销时，应选择大批生产试销收益期望值：故当不试销时，应选择大批生产a1决策理论与方法决策理论与方法第 29 页第 29 页例例4-2-2决策：（决策：（1）购买专利；）购买专利；（2）不试销；）不试销；（3）大批生产）大批生产a2。v购购买买专专利利总总期期望望收收益益2.711.7万万元元，大大于于不不买买技技术术的的收收益益1.1万万元元，截截去去不不买买专专利利方方案案，结点结点1的值为的值为1.7万元万元。v试试销销收收益益期期望望值值扣扣除除试试销销费费用用5000元元后后小小于于不不试试销销的的收收益益值值，截截去去试试销销方方案案，结结点点2的的值值为为2.7万元万元。例例4-2-2决策：（决策：（1）购买专利；购买专利总期望收益）购买专利；购买专利总期望收益2.7决策理论与方法决策理论与方法第 30 页第 30 页第一阶段第一阶段127买专利买专利不买专利不买专利试销试销不试销不试销3456H10.44H2 0.39H3 0.178910a1a2a30.8180.1360.046（略）（略）第二阶段第二阶段第三阶段第三阶段例例4-2-24万元万元2万元万元3万元万元1.1万元万元3.406万万2.77万万1万万3.406万万2.62万万1.53万万2.78054万万-0.5万万2.7万万2.7万万-1万万1.7万万第一阶段第一阶段127买专利不买专利试销不试销买专利不买专利试销不试销3456H10.44决策理论与方法决策理论与方法第 31 页第 31 页决策理论与方法教学决策理论与方法教学PPT第四章课件第四章课件

展开阅读全文

决策理论与方法教学PPT第四章课件

最新文档