资源描述
,单击此处编辑母版标题样式,*,信息学院,罗捍东,第 一 节 决策的分类,(1)按性质的重要性分类:战略决策(战略计划) 、策略决策(管理控制) 、执行决策(运行控制), 三级,战略决策,是涉及某组织发展和生存有关的全局性、长远性问题的决策,如厂址的选择,新产品开发,新市场开发,原料供应地的选择等。,策略决策,是为完成战略决策所规定的目的而进行的决策,如对一个企业来讲,产品规格的选择、工艺方案和设备的选择,厂区和车间内工艺路线的布置等。,执行决策,是根据策略决策的要求对执行方案的选择,如公司中产品合格标准的选择,日常生产调度的决策。,第 十 一 章 决 策 论,1,决策结构不同,解决问题方式也不同,(3)按定量和定性分类:定量决策,定性决策,(4)按决策环境分类:确定型、风险型、不确定型,(5)按决策过程的连续性分类:单项决策、序贯决策,(2)按决策的结构分类:程序决策(有章可循)和非程序决策(凭经验直觉)。,解决问题方式,程序决策,非程序决策,传统方式,习惯,标准规程,直观判断,创造概测,选拔人材,现代方式,运筹学,管理信息系统,培训决策者,人工智能,专家系统,2,第二节,决策过程,构造人们决策行为的模型有两种方法:一是面向决策结果的方法,二是面向决策过程的方法。,可见,任何一个决策都有一个过程和程序,决非决策者灵机一动拍板就行。决策过程包括预决策 决策 决策后三个互相依懒的阶段。,3,任何决策问题都有以下要素构成决策模型:,(1)决策者,可以是个人,委员会或某组织,一般指领导者。,(2)可供选择的方案,行动或策略。,(3)准则是衡量选择方案,包括目的、目标、属性、正确性的标准,有单一准则和多准则。,(4)事件是指不为决策者所控制的客观存在的将发生的状态。,(5)每一事件的发生将发产生某种结果,如获得收益或损失。,(6)决策者的价值观,如决策者对货币额或不同风险程度的主观价值观念。,4,确定型的决策,是指不包含有随机因素的决策问题,每个决策都会得到一个唯一的事先可知的结果。,从决策的观点来看,前面讲的数学规划方法等都是确定型的决策问题,这里讨论的决策问题,都是具有不确定因素和有风险的决策。,5,第三节,不确定型的决策,所谓不确定型的决策是指决策者对环境情况不甚了解,这时决策者主要根据自己的主观倾向进行决策,由决策者的主观态度不同基本可分为五种准则,它们是:悲观主义准则、乐观主义准则、折衷主义准则、等可能性准则、最小机会损失准则,下面举例说明。,例1:,某厂是按批生产某产品,并按批销售,每件产品的生产成本是30元,批发价格是每件35元,若每月生产的产品当月销售不完,则每件损失1元,工厂每投产一批是10件,最大生产能力是40件,决策者可选择的生产方案为0、10、20、30、40五种,假设决策者只知道未来产品的需求情况是0、10、20、30、40五种,试问这时决策者应如何决策?,6,解:,这个问题可用决策矩阵来描述,决策者可选择的行动方案有五种。这是他的策略集合,记作,S,i,,,i=1,2,3,4,5,。,产品的,销售情况有五种:,0、10、20、30、40,,但不知他们发生的概率,这就是事件集合,记作,E,j, ,,j=1,2,3,4,5,。,每个“,策,略事件,”对都可以计算出相应的收益值或损失值,如当选择月产量为,20,件时,而销出量为,10,件,这时收益额为:,10(35-30)-1(20-10)=40(元),可以一一计算出“,策略事件,”对应的收益值或损失值,记作,a,ij,,将这些数据汇总在下矩阵中:,7,这就是,决策矩阵,,根据决策矩阵中元素所示的含义不同,又可称为,收益矩阵,、,损失矩阵,、,风险矩阵,、,后悔值矩阵,等等。,下面讨论决策者是如何应用决策准则进行决策的。,8,悲观主义,决策准则亦称,保守主义,决策准则。当决策者面临着各事件的发生概率不确定时,决策者处理问题时就比较谨慎。他分析各种最坏的可能结果,从中选择最好者,以它对应的策略为决策策略。,用符号表示为,max min决策准则,。,在收益矩阵中先从各策略所对应的可能发生的“,策略事件,”对的结果中选出最小值:,一、 悲观主义(max min)决策准则,再从中选出最大者,以它对应的策略为决策者应选的决策策略:,它对应的策略为,S,1,。即为决策者应选的策略,在这里是“,不生产,”。,9,上述计算公式表示为:,E,j,S,i,-40,200,140,80,20,-40,40,策,略,-30,150,150,90,30,-30,30,-20,100,100,100,40,-20,20,-10,50,50,50,50,-10,10,0,0,0,0,0,0,0,决策方案的选择,40,30,20,10,0,状 态,在表格上表示为:,10,持,乐观主义,(,max max,)决策准则的决策者对待风险的态度与悲观主义者万全不同,当它面临情况不明的策略问题时,他决不放弃任何一个可获得最好结果的机会,以争取好中之好的乐观态度来选择他的决策策略。决策者在分析收益矩阵各策略的“,策略事件,”对的结果中选最大者:,二、乐观主义(max max)决策准则,再从中选出最大者,以它对应的策略为决策者应选的决策策略:,它对应的策略为,S,5,。即为决策者应选的策略,在这里是“,生产,40件,”。,11,上述计算公式表示为:,E,j,S,i,200,200,140,80,20,-40,40,策,略,150,150,150,90,30,-30,30,100,100,100,100,40,-20,20,50,50,50,50,50,-10,10,0,0,0,0,0,0,0,决策方案的选择,40,30,20,10,0,状 态,在表格上表示为:,12,当用,max min决策准则,或,max max决策准则,来处理问题时,有的决策者认为这样太极端了,于是提出把这两种决策准则予以综合,令,为乐观系数,且,01,,并用以下关系式表示,三、折衷主义(乐观系数)决策准则,决策者计算各策略的,折衷值,,然后在所有这些,折衷值,中选择最大者:,用 分别表示第,i,个策略可能得到的最大收益值与最小收益值。,折衷值定义为:,13,例如在本例中设, =1/3,,则,H,i,: 0 , 10 , 20 , 30 , 40 .,于是选策略为,S,5,,即产生40件。,14,E,i,40,max,200,140,80,20,-40,40,策,略,30,150,150,90,30,-30,30,20,100,100,100,40,-20,20,10,50,50,50,50,-10,10,0,0,0,0,0,0,0,决策方案的选择,40,30,20,10,0,状 态,S,i,用表格表示为(, =1/3,):,15,等可能性准则认为:当一人面临着某事件集合,在没有什么确切理由来说明这一事件比那一事件有更多发生机会时,只能认为各事件发生的机会是均等的。即每一事件发生的概率都是,1/事件数,。决策者计算各策略的收益期望值,然后在所有这些期望值中选择最大者,以它对应的策略为决策策略。,四、,等可能性(Laplace)决策,准则,然后在所有这些期望值中选最大者:,于是选策略为,S,5,,即产生40件。,16,上述计算公式表示为:,80,max,200,140,80,20,-40,40,策,略,1/5,1/5,1/5,1/5,1/5,78,150,150,90,30,-30,30,64,100,100,100,40,-20,20,38,50,50,50,50,-10,10,0,0,0,0,0,0,0,决 策 方 案 的 选 择,40,30,20,10,0,状 态,E,i,S,i,用表格表示为:,17,最小机会损失决策准则亦称最小后悔值决策准则。首先将收益矩阵中各元素变换为对应的,机会损失值(后悔值,遗憾值),。其含义是:当某一事件发生后,由于决策者没有选用收益最大的策略,而形成的损失值.因此决策者希望后悔值达到最小。具体方法如下:,五、最小机会损失(后悔值)决策准则,确定某一状态下的收益最大值:,计算,某一状态下各决策的后悔值:,确定,各决策的,最大后悔值:,求出最大后悔值中的最小者:,18,40,min,0,10,20,30,40,40,策,略,50,50,0,10,20,30,30,100,100,50,0,10,20,20,150,150,100,50,0,10,10,200,200,150,100,50,0,0,决 策 方 案 的 选 择,40,30,20,10,0,事 件,E,i,S,i,用公式表示为:,用表格计算表示为:,于是选策略为,S,5,,即产生40件。,19,第四节,风险决策,计算各决策的期望收益:,风险决策是指决策者对客观情况不完全了解,但对将发生各状态的概率是已知的。决策者往往通过调查,根据过去的经验或主观估计等途径获得这些概率。在风险决策中一般采用期望值作为决策准则,,常用的有最大期望收益决策准则和最小,期望,机会损失决策准则。,决策矩阵的各元素代表“,策略-事件,” 的收益值。各状态发生的概率为,p,j,,先计算各策略的期望收益值,然后从这些期望收益中选取最大者,它对应的策略为决策应选策略。即:,一、最大期望收益决策准则(EMV ),20,以例1的数据计算,E,i,S,i,状 态,0,10,20,30,40,0.1,0.2,0.4,0.2,0.1,策,略,0,0,0,0,0,0,0,10,-10,50,50,50,50,44,20,-20,40,100,100,100,76,30,-30,30,90,150,150,84,max,40,-40,20,80,140,200,80,决 策 方 案 的 选 择,即选择策略,S,4,,生产 30件。,然后,选择:,21,矩阵的各元素代表“,策略事件,”对的,机会损失值,,各事件,E,j,发生的概率为,P,j,。先计算各策略的期望损失值:,二、最小期望机会损失决策准则(,EOL,),然后从这些期望机会损失值中选取最小者,它对应的策略应是决策者所选策略。即:。,表上运算与,前面,EMV,相似.,22,三、,EMV,与,EOL,决策准则的关系,从本质上讲,EMV,与,EOL,决策准则是一样的,它们之间的关系是:,设决策矩阵的收益值为,a,ij,。因为当发生的事件的所需量等于所选策略的生产量时,收益值最大,即在收益矩阵的对角线上的值都是其所在列中的最大者。于是机会损失矩阵可通过以下求得,见下表。,23,24,第,i,策略的机会损失为:,EOL,i,=E(S,/,i,)=p,1,(,a,11,-,a,i1,)+p,2,(,a,22,-,a,i2,)+ + p,n,(,a,nn,-,a,in,),= p,1,a,11,+p,2,a,22,+ + p,n,a,nn,(p,1,a,i1,+p,2,a,i2,+ + p,n,a,in,),=K E(S,i,) = K EMV,i,故当,EMV,为最大时,,EOL,便为最小。所以在决策时用这两个决策准则所得结果是相同的。,25,四、全情报的价值(EVPI),当决策者耗费了一定经费进行调研,获得了各事件发生概率的信号,应采取“随机应变”的战术,,这时所得的期望收益称为全情报的期望收益,记作,EPPL,,这收益应当大于至少等于最大期望收益。即:,称为对,全情报的价值,记作,EVPI,,,EPPLEMV,*,,则,EPPL-EMV,*,= EVPI,实际应用时考虑费用构成很复杂,这里仅说明全情报价值的概念和其意义。,26,五、主 观 概 率,风险决策时决策者要估计各事件出现的概率,而许多决策问题的概率不能通过随机试验去确定,根本无法进行重复试验。如估计某企业倒闭的可能性,只能由决策者根据他对这事件的了解去确定。这样确定的概率反映了决策者对事件出现的信念程度,称为主观概率,。,客观概率论者认为概率如同重量、容积、硬度等一样,是研究对象的物理属性。而主观概率者则认为概率是人们对现象的知识的现状的测度,而不是现象本身的测度,因此不是研究对象的物理属性。主观概率论者不是主观臆造事件发生的概率,而是依赖于对事件作周密的观察,去获得事前信息。事前信息愈丰富,则确定的主观概率就愈准确。主观概率论者并不否认实践是第一性的观点。所以主观概率是进行决策的依据。,确定主观概率时,一般采用专家估计法。,27,直接估计法,是要求参加估计者直接提出概率的估计方法。,例如推荐三名本科生考研时,请五位任课教师估计他们考得第一的概率,若各任课教师作出如下的估计,以下表:,直接估计法,由表的最未一行得到学生1的概率是0.43,他是最高者。,28,29,前面曾提到决策者常常碰到的问题是没有掌握充分的信息,于是决策者通过调查及做试验等途径去获得更多的更确切的信息,以便掌握各事件发生的概率。这可以利用贝叶斯公式来实现,它体现了最大限度地利用现有信息,并加以连续观察和重新估计。其步骤为:,六、修正概率的方法贝叶斯公式的应用,(1)先由过去的经验或专家估计获得将发生事件的事前(先验)概率。,(2)根据调查或试验计算得到条件概率,利用贝叶斯公式:,计算出各事件的事后(后验)概率。,30,例2:,某钻井大队在某地区进行石油勘察,主观估计有石油的概率为,P(O)=0.5,;无油的概率为,P(D)=1-0.5=0.5,,为了提高钻探的效果,先作地震试验,根据积累的资料得知:凡有油地区作试验,结果亦好的概率为,P(F0)=0.9,;作试验结果不好的概率为,P(U0)=0.1,;凡无油地区作试验结果好的概率为,P(FD)=0.2,;作试验结果不好的概率为,P(UD)=0.8,;问在该地区作试验后,有油与无油的概率各是多少?,解:,先计算做地震试验好与不好的概率;,做地震试验好的概率(全概公式),P(F)=P(O)P(FO)P(D)P(FD),=0.50.90.50.2=0.55,31,做地震试验不好的概率,P(U)=P(O)P(UO)P(D)P(UD),=0.50.10.50.8=0.45,做地震试验好的条件下,无油的概率:,利用贝叶斯公式计算各事件的事后(后验)概率,做地震试验好的条件下,有油的概率:,32,做地震试验,不,好的条件下,无油的概率:,做地震试验,不,好的条件下,有油的概率:,33,例3:,某厂生产电子元件。每批产品次品率的概率分布如下表:该厂进行抽样检验,现抽样20件,发现一件次品,试修订事前概率。,解:,根据以上数据计算相应概率列表如下:,次品率p,0.02,0.05,0.10,0.15,0.20,事前概率P(p),0.4,0.3,0.15,0.1,0.05,34,次品率,p,事前概率,P,O,(p),条件概率,P(,x,=1|20,P),联合概率,P(,x,=1p),事后概率,P(p|,x,=1),(1),(2),(3),(4),(5),0. 02,0.05,0.10,0.15,0.20,0.4,0.3,0.15,0.10,0.05,0.2725,0.3774,0.2701,0.1368,0.0577,0.10900,0.11319,0.04052,0.01368,0.00288,0.39030,0.40531,0.14509,0.04899,0.01031,合计,1.00,P(,x,=1) =0.27927,1.0000,35,表中第(3)列的数字表示在次品率为,p,总,体中抽,20,个检验,有,1个次品,的概率,这概率可由以下计算得到。因为产品抽样检验的次品率是服从,二项分布,。,这可,通过,计算或查表得到:,P(,x,=1|20,0.02)=0.2725,P(,x,=1|20,0.05)=0.3774,表中第(4)列数,字,是按,(4)=(2)(3),求得的。,然后求得:,P(,x,=1)=P(,x,=1p,i,)=0.27927,事后概率按:,(5)=(4)/P(,x,=1)=(4)/0.27927,求得,。,36,第 五 节,效用理论在决策中的应用,一 、效用及效用曲线,效用概念首先是由贝努利提出的,他认为人们对钱财的真实价值的考虑,与他的钱财拥有量有对数关系,如右图。,效用U,货币M,这就是贝努力的货币效用函数,经济管理学家将效用作为指标,用来衡量人们对某些事物的主观价值,态度、偏爱倾向等等。,37,保险业中,尽管按期望值得到的受灾损失比所付的保险金额要小的多。或购买奖券时,按期望值计算的得奖金额,要小于购买奖券的支付,但仍然有很多人愿意付出相对小的支出,为了避免可能出现的很大损失,或有机会得到相当大一笔奖金。可见实际取货币价值大小不能完全用来衡量一个人的意愿倾向,由于具体的情况和每个人所处地位的差异对一定钱数的吸引力及愿冒风险的态度是不同的,为了具体进行衡量,在决策分析中引进了效用值这个概念。,例如在风险情况下进行决策,决策者对风险的态度是不同的,用效用来量化,决策者对待风险的态度,,可以给每个,决策,测定他的,效用曲线(函数),。最大期望收益值的决策在风险决策中得到广泛应用,但在有些情况下,决策者并不按这个原则去做。比较典型的例子:一是保险业,二是购买各种奖券、彩票。,38,例1:,有一个投资为200万元的工厂。该厂发生火灾的可能性是0.1。工厂的决策者面临的问题是:要不要保险。若保险,每年应支付2500元保险费,在一旦发生火灾后,保险公司可以偿还全部资产。若不保险,就不需要支付保险费,但发生火灾后,工厂的决策者承担资产损失的责任。,决策者面对这个决策问题时,若仍按货币益损期望值为准则进行决策,他的结论悬不保险。因为工厂发生火灾的损失的期望值是:200万元0.0012000元小于保险费。这种结论往往与实际情况不一致。工厂决策者一般都是愿意保险她并愿意每年支付保险玖而不希望发生火灾。,39,例2:,设工人甲在工作中作出了贡献。厂领导决定给他发一笔奖金,并规定两种领奖办法:,第一种,直接发给某甲100元奖金;,第二种,采用抽签发奖办法,抽中了,可得到奖金300元,,抽不中,则得不到奖金。 (抽中或抽不中的概率各为0.5)。,问甲愿意按那种办法领奖?,40,在风险情况下,只作一次决策时,再用最大期望值决策准则,就不那么合理了。如下表是各方案及按最大收益期望值的计算结果。表中的三个方案的,EMV,都相同,显然这三个方案并不是等价的。另一方面,因,EMV,*,给出的是平均意义下的最大,当决策只实现一次时,用,EMV,*,决策准则就不恰当了。这时可用最大效用值决策准则来解决这一矛盾。,效用值是一个相对的指标值,一般可规定:凡对决策者最爱好、最倾向、最愿意的事物(事件)的效用值赋予1,而最不爱好的赋予0。也可以用其他的数值范围,如(100 0)。效用无量纲指标。通过效用这一指标可将某些难于量化有质的差别的事物(事件)给予量化。如某人面临多种方案的选择工作时,要考虑地点、工作性质、单位福利等等。可将要考虑的因素都折合为效用值。得到各方案的综合效用值,然后选择效用值最大的方案,这就是,最大效用值决策准则,。,41,200 200,200,-100,-200 -500,-100,600,500,400,-200 200,400,600,500,A,B,C,0.2,0.2,0.3,0.3,EMV,E,4,E,3,E,2,E,1,E,j,p,i,S,i,42,确定效用曲线的基本方法有两种,一种是直接提问法,另一种是对比提问法。,二、,效用曲线的确定,1,直接提问法,是向决策者提出一系列问题,要求决策者进行主观衡量并作出回答。例如向某决策者提问:“今年你企业获利100万,你是满意的,那么获利多少,你会加倍满意?”若决策者回答200万。这样不断地提问与回答,可绘制出这决策者的获利效用曲线。显然这种提问与回答是十分含糊的,很难确切,所以应用较少。,43,2,对比提问法,:设决策者面临两种可选方案A,1,,A,2,。A,1,表示他可无任何风险地得到一笔金额,x,2,;,A,2,表示他可以概率,p,得到一笔金额,x,1,,或以概率,(1-p),得到金额,x,3,;且,x,1,x,2,x,3,,设,U(,x,),表示金额,x,的效用值。若在某条件下,这决策者认为A,1,、A,2,两方案等价时,可表示为:,pU(,x,1,)+(1-p)U(,x,3,)=U(,x,2,),确切地讲,这决策者认为,x,2,的效用值等于,x,1,、,x,3,的效用期望值。于是可用对比提问法来测定决策者的风险效用曲线。从上式可见,其中有,x,1,、,x,2,、,x,3,、p,四个变量,若其中任意三个为已知时,向决策者提问第四个变量应取何值?并请决策者作出主观判断第四个变量应取的值是多少。提问的方式大致有三种:,44,(1),每,次固定,x,1,、,x,2,、,x,3,的值,改变,p,,问决策者:“,p,取何值时,认为,A,1,与,A,2,等价。,(2),每,次固定,p、,x,1,、,x,3,的值,改变,x,2,,问决策者:“,x,2,取何值时,认为,A,1,与,A,2,等价。”,(3)每次固定,p、,x,2,、,x,3,(或,x,1,)的值, 改变,x,3,(或,x,1,),问决策者:“,x,3,(或,x,1,)取何值时,,认为,A,1,与,A,2,等价。”,一般采用改进的,V,M,法。即每次取,p=0.5,,固定,x,1,、,x,3,利用:,0.5U(,x,1,)+0.5U(,x,3,)=U(,x,2,) ,,确定,x,2,的值,,,由此,可绘出这决策者的效用曲线,。,45,当用计算机时需用解析式来表示效用曲线,并对决策者测得的数据进行拟合,常用的关系式有以下六种。,三、,效用曲线的拟合,(1)线性函数:,U,(,x,) =,c,1,+,a,1,(,x,c,2,),(2)指数函数:,(3)双指数函数:,(4)指数加线性函数:,(5)幂函数:,(6)对数函数:,46,第 六 节 序列决策(决策树方法),有些决策问题,当进行决策后又产生一些新情况,并需要进行新的决策,接着又有一些新情况,又需要进行新的决策。这样决策、情况、决策构成一个序列,这就是序列决策。描述序列决策的有力工具是决策树,决策树是由决策点,事件及结果构成的树形结构图。一般选用最大收益期望值和最大效用期望值或最大效用值为决策准则,下面用例子加以说明。,47,例1:,某洗衣机厂,根据市场信息认为单缸洗衣机将不受消费者欢迎,双缸洗衣机可以上马,现在有两种方案可供选择:,A,1,:,把原生产单缸洗衣机生产线改造扩建为生产双缸机的生产线;,A,2,:,保留原生产单缸机的生产线,新建一条生产双缸机的专门生产线。据预测,双缸机销路好的概率估计为,0.7,销路不好的概率为,0.3,。在两种情况下各方案的益损值如下表,试求最优方案。,48,损益值单位:百万元,S,i,A,i,S,1,:销路好,S,1,:销路差,p,1,= 0.7,p,2,= 0.3,A,1,80,30,A,2,100,-30,解:,根据以上资料,可绘出如下图所示的决策树:,49,图中,,方格,表示决策点,从决策点引出的分支称为方案分支(或策略分支),分支数就是可能的方案数,如本例中有两个方案即从方格引出两条方案分支A,1,、A,2,。,A,1,A,2,S,1,: p,1,=0.7,S,2,: p,2,=0.3,S,1,: p,1,=0.7,S,2,: p,2,=0.3,80,30,100,-30,65,61,65,2,3,1,50,圆圈,表示状态点,从状态点引出全部状态分支(或概率分支)。在状态分支上标明该状态出现的概率。,三角形,表示结果点,旁边的数字表示这一方案在相应状态下的益损值。,在绘制决策树时,对决策点和状态点进行编号,号码就写在方格或圆圈中。对各状态点计算益损值的期望值,写在圆圈的上方。,在本例中:,状态点2:,E,1,= 0.7,80 + 0.3,30 = 65,状态点3:,E,2,= 0.7,100 + 0.3,(-30) = 61,因此在状态点2和3的上方分别标上,65,和,61,。,51,计算完从一个决策点引出的所有方案分枝所连接的状态点的期望值后,按目标要求删去不合要求的方案分枝,把保留下来的方案分枝所连接的状态点上的数字移到决策点上方。,本例中,要求期望值较大,因此删去,A,2,分枝。保留,A,1,分枝,把状态点2上的数字移到决策点的上方。现在决策树已绘完,最优决策方案是,A,1,。,由这个例子可以看出,决策树的绘制可分为建树和计算期望值两个步骤。建树时,从左到右依次绘出所有的决策点、方案分枝、状态点、状态分枝、结果点。然后标上相应的概率,按上法从右到左(即从结果点开始)计算期望值,删除一些分枝就可得到完整的决策树。,52,例,2,:,设有某石油钻探队,在某地区进行石油勘察,可以先作地震试验,然后决定是否钻井,或者不做地震试验,只凭经验决定是否钻井。做地震试验的费用为每次,3000,元,钻井费用为,10000,元。若钻井出油可获收入,40000,元,若钻井不出油则没有任何收入,各种情况下的概率已估计出来,问钻探队的决策者如何决策使得期望收入值达到最大。,解:,根据以上资料,可绘出如下图所示的决策树:,53,40000,0,-10000,1,1,2,2,0,0.85,出油,不出油,不钻井,不出油,3,好,钻井,不好,不试验,钻井,0.15,40000,0,3,0.1,出油,不出油,0.9,试验,40000,0,-10000,4,4,0,0.55,出油,不出油,不钻井,钻井,0.45,-3000,-10000,34000,4000,22000,0,不钻井,0.6,0.4,24000,0,12000,144000,12000,54,1),计算各事件点的收入期望值:,事件点2:,E,2,=40000,0.85 + 0,0.15 =34000,事件点3:,E,3,=40000,0.10 + 0,0.90 =4000,事件点4:,E,4,=40000,0.55 + 0,0.45 =22000,将收入期望标在相应各点处(图中红色数字) 。,2),按最大收入期望值决策准则在各决策点进行决策:,决策点2:,max(34000-10000),0=24000,决策点3:,max(4000-10000),0=0,决策点4:,max(22000-10000),0=12000,并选择相应决策。,55,34000,0,1,1,2,不钻井,好,钻井,不好,不试验,试验,-3000,4000,0,-10000,3,不钻井,钻井,-10000,4,不钻井,钻井,-10000,22000,0,56,3),计算事件点1的收入期望值:,事件点1:,E,1,=24000,0.6 + 0,0.4 =14400,4),在决策点进行决策:,决策点1:,max(14400-3000),12000=12000,相应决策是不做地震试验。,这个决策问题的决策序列是:不做地震试验,直接钻井,期望收入为,12000,元。,24000,1,1,好,不好,不试验,试验,-3000,0.6,0.4,12000,0,57,例,3,:,决策者的效用函数如下,试以最大效用期望值决策。,解:,根据以上资料,可绘出如下图所示的决策树:,58,27000,-13000,-10000,1,1,2,2,-3000,0.85,出油,不出油,不钻井,不出油,3,好,钻井,不好,不试验,钻井,0.15,27000,-13000,3,0.1,出油,不出油,0.9,试验,30000,-10000,-10000,4,4,0,0.55,出油,不出油,不钻井,钻井,0.45,-3000,-10000,-3000,不钻井,0.6,0.4,0,0.6,0,0.27,0.68,0.6,效用值,0.98,纯收入,0.98,1,59,1),计算各事件点的效用期望值:,事件点2:,E,2,=0.98,0.85 + 0,0.15 =0.833,事件点3:,E,3,=0.98,0.10 + 0,0.90 =0.098,事件点4:,E,4,=1,0.55 + 0.27,0.45 =0.672,将效用期望标在相应各点处(图中红色数字) 。,2),按最大效用期望值决策准则在各决策点进行决策:,决策点2:,max0.833,0.6=0.833,决策点3:,max0.098,0.6=0.6,决策点4:,max0.672,0.68=0.68,并选择相应决策。,60,3),计算事件点1的效用期望值:,事件点1:,E,1,=0.833,0.6 + 0.6,0.4 =0.7938,4),在决策点进行决策:,决策点1:,max0.7938,0.68=0.7938,相应决策是做地震试验。,这个决策问题的决策序列是:先做地震试验,试验结果好则钻井,试验结果不好则不钻井,期望效用为,0.7938,元。,61,第 七 节 灵敏度分析,通常在决策摸型中自然状态的概率和收益值往往由估计或预测得到,不可能十分正确,此外,实际情况也不断变化。现在需分析为决策所用的数据可在多少范围内变动原最优决策方案有效,进行这种分析称为灵敏度分析,下面举例说明,。,一、,灵敏度分析的意义,62,例1 :,假设有外表完全相同的木盒100只,将其分为两组,一组内装白球,有70盒,另一组内装黑球,有30盒,现从这100盒中任取一盒,请你猜,如果这盒内装的是白球,猜对了得500分,猜错了罚200分;如果这盒内装的是黑球,猜对了得1000分,猜错了罚150分,。,为使期望得分最多应选那一方案?有关数据列于下表:,概率,方案,自然状态,白,黑,0.7,0.3,猜白,500,-200,猜黑,-150,1000,63,解:,计算各方案的期望收益值:,经比较可知“,猜白,”方案是最优,,“,猜白,”的期望值为: 0.7500+0.3(-200)=290,“,猜黑,”的期望值为: 0.7(-150)+0.31000=195,现假定出现白球的概率从0.7变到0.8,这时各方案的期望值为:,“,猜白,”的期望值为: 0.8500+0.2(-200)=360,“,猜黑,”的期望值为: 0.8(-150)+0.21000=80,经比较可知“猜白”方案是最,仍,优.,64,可见由于各自然状态发生的概率的变化,可引起最优方案的改变,那么转折点如何确定?,现在的最优方案不是猜白,而是猜黑了。,再假定出现白球的概率从0.7变到0.6,这时各方案的期望值为:,“,猜白,”有的期值为: 0.6500+0.4(-200)=220,“,猜黑,”的期望值为: 0.6(-150)+0.41000=310,65,二、转折概率,继续上面的例子,若设p为出现白球的概率,则1-p为出现黑球的概率,当这两个方案的期望值相等时,,P可表示为:,即: p500+(1-p)(-200)=p(-150)+(1-p)100,求得 p=0.65,称它为转折概率。,即当 p0.65,猜白是最优方案。当P0.65时,猜黑是最优方案。,66,若这些数据在某允许范围内变动,而最优方案保持不变,这方案就是比较稳定的。,反之,这数据在允许范围内稍加变动,则最优方案就有变化,这方案就是不稳定的,由此可以得出那些非常敏感的变量 ,那些不太敏感的变量,以及最优方案不变条件下,这些变量允许变化的范围。,67,第 八节 多目标决策模型,前面讨论的模型主要涉及单目标的问题,而在现实活动中,决策的目标却往往有许多个。例如,对企业产品的生产管理,既希望达到高利润,又希望优质和低消耗,还希望减少对环境的污染等。这就是一个多目标决策的问题又如选购一个好的计算机系统,似乎只有一个目标,但由于要从多方面去反映,要用多个不同的准则来衡量,比如,性能要好,维护要容易,费用要省。这些准则自然构成了多个目标,故也是一个多目标决策问题。,68,多目标决策由于考虑的目标多,有些目标之间又彼此有矛盾,这就使多目标问题成为一个复杂而困难的问题。但由于客观实际的需要,多目标决策问题越来越受到重视,因而出现了许多解决此类问题的方法。一般来说,其基本途径是,把求解多目标问题转化为求解单目标问题。其主要步骤是,先转化为单目标问题,然后利用单目标模型的解法,求出单目标模型的最优解,以此作为多目标问题的解。,化多目标问题为单目标问题的方法大致可分为两类,一类是转化为一个单目标问题;另一类是转化为多个单目标问题。关健是如何转化。这方面已有不少方法,本章介绍几种常用的主要模型和方法。,69,多目标决策模型的应用很广泛,其主要方面有:国家发展战略规划、地区发展现划、企业经营管理、工程项目管理、交通运输管理、科研管理、环境保护与管理、工程设计与工艺设计、公共事业规划、军事国防事业等。,下面通过具体例子来介绍多目标决策模型及其求解方法。,70,例1:,某工厂在一个计划期内生产甲、乙两种产品,各产品都要消耗A、B、C三种不同的资源,每件产品对资源的单位消耗、各种资源的限量以及各产品的单位价格、单位利润和所造成的单位污染如下表所示:,71,假定产品能全部销售出去,问每期怎样安排生产,才能使利润和产值都最大,且造成的污染最小?,解:,设,x,1,、,x,2,分别表示甲、乙两种产品的数量。,该问题有3个目标,即:,(利润最大),(产值最大),(污染最小),72,该问题的约束条件为:,建立该问题的多目标规划模型如下:,73,多目标规划的求解方法是将多目标规划化为单目标规划。,74,一、主要目标法,在有些多目标决策问题中,各种目标的重要性程度往往不一样,其中一个重要性程度最高和最为关键的目标,称之为主要目标,其余的目标则为非主要目标。,对于上述模型的3个目标,工厂确定利润最大为主要目标,另两个目标则通过预先给定的希望达到的目标值转化为约束条件。经研究,工厂认为总产值至少应达到20000个单位,而污染量则应控制在90个单位以下,即:,75,由主要目标法得到如下单目标规划问题:,76,用单纯形法求解,得:,77,在考虑多目标决策问题时,假定各目标函数具有相同的量纲,按照一定的规则分给各目标函数赋以权系数,作线性加权和评价函数。,二、,线性加权和法,于是可将求解多目标决策问题转化为求解如下单目标决策问题。,78,在解决多目标决策问题时,如果决策者能够对各个目标作出排序,那么,决策时可以按照各个目标的重要性程度依次求出各目标的最优解。当在某个目标时求得了唯一解,则不再考虑剩下目标的最优解了。该唯一解就是所求的多目标问题的有效解。,三、,字典序法,则字典序法的求解步骤如下:,例如,考虑多目标决策问题时,不妨设各目标的重要性排序为:,79,设该问题的最优解为,x,*,,且,f,1,(,x,),。若,x,*,是唯一的最优解,则,x,*,就是多目标决策问题的满意解,停止;否则,令k1,转第二步:,第一步:求解相应于,f,1,(,x,),的第一个单目标问题:,第二步:求解相应于,f,k+,1,(,x,),的第k+1个单目标问题:,80,第三步:设该问题的最优解为,x,*,,若,x,*,是唯一的最优解,则,x,*,就是多目标决策问题满意解,停止;否则,置k+1 k,转第二步:,81,STEM法是一种交互法法,其求解过程通过分析者与决策者之间的对话逐步进行而求得最满意解,故又称步骤法。,四、,STEM法,步骤法的基本思想是,首先分别求出决策问题的一组理想解,实际上就是分别对各目标求出最优解:,这些解无法同时达到,但可以当作一组理想的最优值,以理想解作为一个标准,可以估计有效解。然后通过对话,不断修改目标值,并把降低要求的目标作为新的约束条件加到原来的约束条件中去重新计算,直到决策者得到满意的解。,82,步骤法算法如下:,第一步:分别求以下,m,个单目标问题的最优解:,设最优解为,x,i,*,(i1,2,m,),其相应的目标值即理想值为,f,i,*,(i1,2,m,)。此最优解处别的目标所取的值用,z,ki,表示,即,z,ki,=,f,k,(,x,i,*,),(k1,2,m,),把上述计算的结果列入下表:,83,在上表中确定每一列的最小值并记第i列的最小值为,:,84,第二步:求解,其中:,85,第三步:将(1)式的解,x,0,和相应的目标值,f,1,(,x,0,),,f,2,(,x,0,) ,,,f,m,(,x,0,),交给决策者去判断。决策者把这些目标值与理想值进行比较后,如果认为其中某些目标值太坏,另一些目标值可以不需要那么太好,可以把比较好的目标值中的某一个修改得差一些,以使水平太坏的目标得到改善。,在上式中,,f,i,*,-,f,i,(,x,),是第i个目标的实际值和它的理想值的偏差,,i,是相应的权系数,是目标与理想值的最大加权偏差,求得的解,x,将使最大加权偏差为最小。,86,作业:P,297,11.3 ,11.5 ,11.6,87,
展开阅读全文