第八章对策与决策模型课件

资源描述

第八章第八章对策与决策模型对策与决策模型浙江大学数学建模基地浙江大学数学建模基地第八章第八章对策与决策模型对策与决策模型对策与决策是人们生活和工作中经常会遇到的择优活动。对策与决策是人们生活和工作中经常会遇到的择优活动。人们在处理一个问题时，往往会面临几种情况，同时又存在人们在处理一个问题时，往往会面临几种情况，同时又存在几种可行方案可供选择，要求根据自己的行动目的选定一种几种可行方案可供选择，要求根据自己的行动目的选定一种方案，以期获得最佳的结果。方案，以期获得最佳的结果。有时，人们面临的问题具有竞争性质，如商业上的竞争、有时，人们面临的问题具有竞争性质，如商业上的竞争、体育中的比赛和军事行动、政治派别的斗争等等。这时竞争体育中的比赛和军事行动、政治派别的斗争等等。这时竞争双方或各方都要发挥自己的优势，使己方获得最好结果。因双方或各方都要发挥自己的优势，使己方获得最好结果。因而双方或各方都要根据不同情况、不同对手做出自己的决择，而双方或各方都要根据不同情况、不同对手做出自己的决择，此时的决策称为对策。在有些情况下，如果我们把可能出现此时的决策称为对策。在有些情况下，如果我们把可能出现的若干种情况也看作是竞争对手可采取的几种策略，那么也的若干种情况也看作是竞争对手可采取的几种策略，那么也可以把决策问题当作对策问题来求解。可以把决策问题当作对策问题来求解。8.1 8.1 对策问题对策问题对策问题的特征是参与者为利益相互冲突的各方，其结局对策问题的特征是参与者为利益相互冲突的各方，其结局不取决于其中任意一方的努力而是各方所采取的策略的综合不取决于其中任意一方的努力而是各方所采取的策略的综合结果。结果。先考察几个实际例子。先考察几个实际例子。例例8.1 （田忌赛马）（田忌赛马）田忌赛马是大多数人都熟知的故事，传说战国时期齐王欲与田忌赛马是大多数人都熟知的故事，传说战国时期齐王欲与大将田忌赛马，双方约定每人挑选上、中、下三个等级的马大将田忌赛马，双方约定每人挑选上、中、下三个等级的马各一匹进行比赛，每局赌金为一千金。齐王同等级的马均比各一匹进行比赛，每局赌金为一千金。齐王同等级的马均比田忌的马略胜一筹，似乎必胜无疑。田忌的朋友孙膑给他出田忌的马略胜一筹，似乎必胜无疑。田忌的朋友孙膑给他出了一个主意，让他用下等马比齐王的上等马，上等马对齐王了一个主意，让他用下等马比齐王的上等马，上等马对齐王的中等马，中等马对齐王的下等马，结果田忌二胜一败，反的中等马，中等马对齐王的下等马，结果田忌二胜一败，反而赢了一千金。而赢了一千金。例例8.2 （石头（石头剪子剪子布）布）这是一个大多数人小是一个大多数人小时候都玩候都玩过的游的游戏。游。游戏双方只能双方只能选石石头、剪子、布中的一种，石、剪子、布中的一种，石头赢剪子，剪子剪子，剪子赢布，而布又布，而布又赢石石头，赢者得一分，者得一分，输者失一分，双方相同者失一分，双方相同时不得分，不得分，见下下表。表。表表8.18.1石石头剪子剪子布布石石头011剪子剪子101布布110例例8.3 （囚犯的困惑）（囚犯的困惑）警察同警察同时逮捕了两人并分开关押，逮捕的原因是他逮捕了两人并分开关押，逮捕的原因是他们持有大持有大量量伪币，警方，警方怀疑他疑他们伪造造钱币，但没有找到充分，但没有找到充分证据，希据，希望他望他们能自己供能自己供认，这两个人都知道：如果他两个人都知道：如果他们双方都不供双方都不供认，将被以使用和持有大量，将被以使用和持有大量伪币罪被各判刑罪被各判刑1818个月；如果双个月；如果双方都供方都供认伪造了造了钱币，将各被判刑，将各被判刑3 3年；如果一方供年；如果一方供认另一方另一方不供不供认，则供供认方将被从方将被从宽处理而免刑，但另一方面将被判理而免刑，但另一方面将被判刑刑7 7年。将嫌疑犯年。将嫌疑犯A A、B B被判刑的几种可能情况列表如下被判刑的几种可能情况列表如下：表表8.28.2嫌疑犯嫌疑犯B供供认不供不供认嫌疑犯嫌疑犯A供供认不供不供认（3，3）（0，7）（7，0）（1.5，1.5）表中每对数字表示嫌疑犯表中每对数字表示嫌疑犯A A、B B被判刑的年数。如果两名疑犯均担心对方被判刑的年数。如果两名疑犯均担心对方供认并希望受到最轻的惩罚，最保险的办法自然是承认制造了伪币。供认并希望受到最轻的惩罚，最保险的办法自然是承认制造了伪币。一、对策的基本要素一、对策的基本要素（1 1）局中人局中人。参加决策的各方被称为决策问题的局中人，一。参加决策的各方被称为决策问题的局中人，一个决策总是可以包含两名局中人（如棋类比赛、人与大自然个决策总是可以包含两名局中人（如棋类比赛、人与大自然作斗争等），也可以包含多于两名局中人（如大多数商业中作斗争等），也可以包含多于两名局中人（如大多数商业中的竞争、政治派别间的斗争）。局中人必须要拥用可供其选的竞争、政治派别间的斗争）。局中人必须要拥用可供其选择并影响最终结局的策略，在例择并影响最终结局的策略，在例8.38.3中，局中人是中，局中人是A A、B B两名疑两名疑犯，警方不是局中人。两名疑犯最终如何判刑取决于他们各犯，警方不是局中人。两名疑犯最终如何判刑取决于他们各自采取的态度，警方不能为他们做出选择。自采取的态度，警方不能为他们做出选择。从这些简单实例中可以看出对策现象从这些简单实例中可以看出对策现象中包含的几个基本要素。中包含的几个基本要素。（2 2）策略集合策略集合。局中人能采取的可行方案称为策略，每一。局中人能采取的可行方案称为策略，每一局中人可采取的全部策略称为此局中人的策略集合。对策问局中人可采取的全部策略称为此局中人的策略集合。对策问题中，对应于每一局中人存在着一个策略集合，而每一策略题中，对应于每一局中人存在着一个策略集合，而每一策略集合中至少要有两个策略，否则该局中人可从此对策问题中集合中至少要有两个策略，否则该局中人可从此对策问题中删去，因为对他来讲，不存在选择策略的余地。应当注意的删去，因为对他来讲，不存在选择策略的余地。应当注意的是，所谓策略是指在整个竞争过程中对付他方的完整方法，是，所谓策略是指在整个竞争过程中对付他方的完整方法，并非指竞争过程中某步所采取的具体局部办法。例如下棋中并非指竞争过程中某步所采取的具体局部办法。例如下棋中的某步只能看和一个完整策略的组成部分，而不能看成一个的某步只能看和一个完整策略的组成部分，而不能看成一个完整的策略。当然，有时可将它看成一个多阶段对策中的子完整的策略。当然，有时可将它看成一个多阶段对策中的子对策。策略集合可以是有限集也可以是无限集。策略集为有对策。策略集合可以是有限集也可以是无限集。策略集为有限集时称为有限对策，否则称为无限对策。限集时称为有限对策，否则称为无限对策。记局中人记局中人i i的策略集合为的策略集合为SiSi。当对策问题各方都从各自的策略。当对策问题各方都从各自的策略集合中选定了一个策略后，各方采取的策略全体可用一矢量集合中选定了一个策略后，各方采取的策略全体可用一矢量S S表示，称之为一个纯局势（简称局势）。表示，称之为一个纯局势（简称局势）。例如例如，若一，若一对策中包含策中包含A、B两名局中人，其策略集合分两名局中人，其策略集合分别为SA=1,m，SB=1,n。若。若A选择策略策略 i而而B选策策略略 j，则（i,j）就构成此）就构成此对策的一个策的一个纯局局势。显然，然，SA与与SB一共可构成一共可构成mn个个纯局局势，它，它们构成表构成表8.3。对策策问题的全体的全体纯局局势构成的集合构成的集合S称称为此此对策策问题的局的局势集合。集合。(m,n)(m,j)(m,2)(m,1)m(i,n)(i,j)(i,2)(i,1)i(2,n)(2,j)(2,2)(2,1)2(1,n)(1,j)(1,2)(1,1)1A的的策策略略nJ21B的策略的策略（3 3）赢得函数（或称支付函数）。得函数（或称支付函数）。对策的策的结果用矢量表示，果用矢量表示，称之称之为赢得函数。得函数。赢得函数得函数F F为定定义在局在局势集合集合S S上的矢上的矢值函函数，数，对于于S S中的每一中的每一纯局局势S S，F F（S S）指出了每一局中人在此）指出了每一局中人在此对策策结果下果下应赢得（或支付）的得（或支付）的值。综上所述，一个上所述，一个对策模型策模型由局中人、策略集合和由局中人、策略集合和赢得函数三部分得函数三部分组成。成。记局中人集合局中人集合为I I=1,=1,k k，对每一每一i iI I，有一策略集合，有一策略集合S Si i，当，当I I中每一中每一局中人局中人i i选定策略后得一个局定策略后得一个局势s s；将；将s s代入代入赢得函数得函数F F，即得，即得一矢量一矢量F F(s s)=()=(F F1 1(s s),),F Fk k(s s)，其中，其中F Fi i(s s)为在局在局势s s下局中人下局中人i i的的赢得（或支付）。得（或支付）。本节讨论只有两名局中人的对策问题，即两人对策，其结果可本节讨论只有两名局中人的对策问题，即两人对策，其结果可以推广到一般的对策模型中去。对于只有两名局中人的对策问以推广到一般的对策模型中去。对于只有两名局中人的对策问题，其局势集合和赢得函数均可用表格表示。例如，表题，其局势集合和赢得函数均可用表格表示。例如，表8.28.2就给就给出了例出了例8.38.3的局势集合和赢得函数。的局势集合和赢得函数。二、零和对策二、零和对策存在一存在一类特殊的特殊的对策策问题。在。在这类对策中，当策中，当纯局局势确定后，确定后，A A之所得恰之所得恰为B B之所失，或者之所失，或者A A之所失恰之所失恰为B B之所得，即双方所得之所得，即双方所得之和之和总为零。在零和零。在零和对策中，因策中，因F F1 1(s s)=)=F F2 2(s s)，只需指出其中，只需指出其中一人的一人的赢得得值即可，故即可，故赢得函数可用得函数可用赢得矩得矩阵表示。例如若表示。例如若A A有有m m种策略，种策略，B B有有n n种策略，种策略，赢得矩得矩阵表示若表示若A A选取策略选取策略i i而而B B选取策略选取策略j j，则，则A A之所得为之所得为a aijij（当（当a aijij00时为支付）。时为支付）。在有些两人在有些两人对策的策的赢得表中，得表中，A A之所得并非明之所得并非明显为B B之所失，但之所失，但双方双方赢得数之和得数之和为一常数。例如在表一常数。例如在表8.48.4中，无中，无论A A、B B怎怎样选取策略，双方取策略，双方赢得得总和均和均为1010，此，此时，若将各人，若将各人赢得数减去两得数减去两人的平均人的平均赢得数，即可将得数，即可将赢得表化得表化为零和零和赢得表。表得表。表8.48.4中的中的对策在策在转化化为零和零和对策后，具有策后，具有赢得矩得矩阵表表8.48.4局中人局中人B123局中人局中人A1(8,2)(1,9)(7,3)2(4,6)(9,1)(3,7)3(2,8)(6,4)(8,2)4(6,4)(4,6)(6,4)给定一个两人对策只需给出局中人给定一个两人对策只需给出局中人A A、B B的策略集合的策略集合S SA A、S SB B及表示双方赢得值的赢得矩阵及表示双方赢得值的赢得矩阵R R。综上所述，当遇到零和对。综上所述，当遇到零和对策或可转化为零和对策的问题时，策或可转化为零和对策的问题时，R R可用通常意义下的矩阵可用通常意义下的矩阵表示，否则表示，否则R R的元素为一两维矢量。的元素为一两维矢量。故两人对策故两人对策G G又可称为矩阵对策并可简记成又可称为矩阵对策并可简记成G G=S SA A,S SB B,R R 例例8.4 给定给定G=SA,SB,R，其中其中SA=1,2,3，SB=1,2,3,4 从从R R中可以看出，若中可以看出，若A A希望获得最大赢利希望获得最大赢利3030，需采取策略，需采取策略 1 1，但此时若，但此时若B B采采取策略取策略 4 4，A A非但得不到非但得不到3030，反而会失去，反而会失去2222。为了稳妥，双方都应考虑到。为了稳妥，双方都应考虑到对方有使自己损失最大的动机，在最坏的可能中争取最好的结果。局中人对方有使自己损失最大的动机，在最坏的可能中争取最好的结果。局中人A A采取策略采取策略 1 1、2 2、3 3时，最坏的赢得结果分别为时，最坏的赢得结果分别为min 12,6,30,22 =22min 14,2,18,10=2min 6,0,10,16=10其中最好的可能为其中最好的可能为max max 22,2,22,2,10=210=2。如果如果A A采取策略采取策略 2 2，无论，无论B B采采取什么策略，取什么策略，A A的赢得均不会少于的赢得均不会少于2.2.B B采取各方案的最大损失为采取各方案的最大损失为max 12,14,max 12,14,6=146=14，max max 6,2,0=26,2,0=2，max max 30,18,30,18,10=3010=30和和max max 22,10,16=1622,10,16=16。当。当B B采取策略采取策略 2 2时，其损失时，其损失不会超过不会超过2 2。注意到在赢得矩阵中，。注意到在赢得矩阵中，2 2既是所在行中的最小元素又是所在列既是所在行中的最小元素又是所在列中的最大元素。此时，只要对方不改变策略，任一局中人都不可能通过变中的最大元素。此时，只要对方不改变策略，任一局中人都不可能通过变换策略来增大赢得或减小损失，称这样的局势为对策的一个稳定点或稳定换策略来增大赢得或减小损失，称这样的局势为对策的一个稳定点或稳定解，（注：也被称为鞍点）解，（注：也被称为鞍点）定义8.1 对于两人对策对于两人对策G=SA,SB,R，若有，若有，则称，则称G具有稳定解，并称具有稳定解，并称VG为对策为对策G的值。若纯局势（的值。若纯局势（）使得）使得，则称（，则称（）为对策）为对策G的鞍点或稳定解，赢得矩阵中与（的鞍点或稳定解，赢得矩阵中与（）相）相对应的元素对应的元素称为赢得矩阵的鞍点，称为赢得矩阵的鞍点，与与分别称为局中人分别称为局中人A与与B的最的最优策略。优策略。对（8.18.1）式中的）式中的赢得矩得矩阵，容易，容易发现不存在具有上述性不存在具有上述性质的鞍点。的鞍点。给定定一个一个对策策G G，如何判断它是否具有鞍点呢？，如何判断它是否具有鞍点呢？为了回答了回答这一一问题，先引入下，先引入下面的极大极小原理。面的极大极小原理。定理定理8.18.1 设G=SA,SB,R，记，则必有必有+0证明:，易见易见为为A的最小赢得，的最小赢得，为为B的最小赢得，的最小赢得，由于由于G是零和对策，故是零和对策，故+0必成立。必成立。定理定理8.28.2 零和零和对策策G G具有具有稳定解的充要条件定解的充要条件为+=0=0。证明：（充分性）（充分性）由由和和的定的定义可知，存在一行（例如可知，存在一行（例如p p行）行）为p p行中的最小元素且存在一列（例如行中的最小元素且存在一列（例如q q列），列），为q q列中的列中的最大元素。故有最大元素。故有 a apqpq且且a apqpq又因又因+=0=0，所以，所以=，从而得出，从而得出a apqpq=，a apqpq为赢得矩得矩阵的鞍点，（的鞍点，（p p,q q）为G G的的稳定解。定解。（必要性）（必要性）若若G G具有具有稳定解（定解（p p,q q），），则a apqpq为赢得矩得矩阵的鞍点。故有的鞍点。故有从而可得从而可得+0+0，但根据定理，但根据定理8.18.1，+0+0必成立，故必有必成立，故必有+=0=0。上述定理上述定理给出了出了对策策问题有有稳定解（定解（简称称为解）的充要条件。当解）的充要条件。当对策策问题有解有解时，其解可以不唯一。例如，若，其解可以不唯一。例如，若则易易见，（，（2,2），（），（2,4），（），（4,2），（），（4,4）均）均为此此对策策问题的解。的解。一般又可以一般又可以证明。明。定理定理8.3 8.3 对策策问题的解具有下列性的解具有下列性质：（1）无差）无差别性。若（性。若（,）与（）与（,）同）同为对策策G的解，的解，则必有必有。（2 2）可交）可交换性。若（性。若（,j1j1）、（）、（,j2j2）均）均为对策策G G的解，的解，则（,j2j2）和（）和（,j1j1）也必）也必为G G的解。的解。定理定理8.3的证明非常容易，作为习题的证明非常容易，作为习题留给读者自己去完成。留给读者自己去完成。具有具有稳定解的零和定解的零和对策策问题是一是一类特特别简单的的对策策问题，它所，它所对应的的赢得矩得矩阵存在鞍点，任一局中人都不可能通存在鞍点，任一局中人都不可能通过自己自己单方面的努力来改方面的努力来改进结果。然而，在果。然而，在实际遇到的零和遇到的零和对策中更典型的是策中更典型的是+0的情况。由于的情况。由于赢得得矩矩阵中不存在鞍点，至少存在一名局中人，在他中不存在鞍点，至少存在一名局中人，在他单方面改方面改变策略的情况策略的情况下，有可能改善自己的收益。例如，考察（下，有可能改善自己的收益。例如，考察（8.1）中的）中的赢得矩得矩阵R。若双若双方都采取保守的方都采取保守的max min原原则，将会出将会出现纯局局势（4,1）或）或（4,3）。但如果局中人）。但如果局中人A适当改适当改换策略，他可以增加收入。例如，如策略，他可以增加收入。例如，如果果B采用策略采用策略 1，而，而A改改换策略策略 1，则A可收益可收益 3。但此。但此时若若B改改换策略策略 2，又会使，又会使A输掉掉4，。此。此时，在只使用，在只使用纯策略的范策略的范围内，内，对策策问题无解。无解。这类决策如果只决策如果只进行一次，局中人除了碰运气以外行一次，局中人除了碰运气以外别无无办法。但法。但如果如果这类决策要反复决策要反复进行多次，行多次，则局中人固定采用一种策略局中人固定采用一种策略显然是不明然是不明智的，因智的，因为一旦一旦对手看出你会采用什么策略，他将会手看出你会采用什么策略，他将会选用用对自己最自己最为有有利的策略。利的策略。这时，局中人均，局中人均应根据某种概率来根据某种概率来选用各种策略，即采用混用各种策略，即采用混合策略的合策略的办法，使自己的期望收益尽可能大。法，使自己的期望收益尽可能大。设A方用概率方用概率xi选用策略用策略 i，B方用概率方用概率yj选用策略用策略 j，且双方每次且双方每次选用什么策略是随机的，不能用什么策略是随机的，不能让对方看出方看出规律，律，记X=(x1,xm)T，Y=(y1,yn)T，则A的期望的期望赢得得为E(X,Y)=XTRY其中，其中，R为为A方的赢得矩阵方的赢得矩阵。记记 SA:策策略略1,mSB:策策略略1,n概概率率x1,xm概概率率y1,yn分分别称称SA与与SB为A方和方和B方的混合策略。方的混合策略。对于需要使用混合策略的于需要使用混合策略的对策策问题，也有具有，也有具有稳定解的定解的对策策问题的的类似似结果。果。定定义8.2 若存在若存在m维概率向量和概率向量和n维概率向量，使得概率向量，使得对一切一切m维概率向量概率向量X和和n维概率向量概率向量y有有则称（称（,）为混合策略混合策略对策策问题的鞍点。的鞍点。定理定理8.4 （Von Neumann）任意混合策略）任意混合策略对策策问题必存在鞍点，即必存在概率向必存在鞍点，即必存在概率向量和，使得：量和，使得：（证明从略）。明从略）。使用使用纯策略的策略的对策策问题（具有（具有稳定解的定解的对策策问题）可以看成使用混合策略的）可以看成使用混合策略的对策策问题的特殊情况，相当于以概率的特殊情况，相当于以概率1选取其中某一策略，以概率取其中某一策略，以概率0选取其余策略。取其余策略。对于双方均只有两种策略的于双方均只有两种策略的对策策问题（即（即22对策），可按几何方法求解。策），可按几何方法求解。例例8.58.5 A A、B B为作战双方，为作战双方，A A方拟派两架轰炸机方拟派两架轰炸机I I和和IIII去轰炸去轰炸B B方的指挥部，方的指挥部，轰炸机轰炸机I I在前面飞行，在前面飞行，IIII随后。两架轰炸机中只有一架带有炸弹，而另随后。两架轰炸机中只有一架带有炸弹，而另一架仅为护航。轰炸机飞至一架仅为护航。轰炸机飞至B B方上空，受到方上空，受到B B方战斗机的阻击。若战斗机方战斗机的阻击。若战斗机阻击后面的轰炸机阻击后面的轰炸机IIII，它仅受，它仅受IIII的射击，被击中的概率为的射击，被击中的概率为0.30.3（I I来不及来不及返回击它）。若战斗机阻击返回击它）。若战斗机阻击I I，它将同时受到两架轰炸机的射击，被击，它将同时受到两架轰炸机的射击，被击中的概率为中的概率为0.70.7。一旦战斗机未被击落，它将以。一旦战斗机未被击落，它将以0.60.6的概率击毁其选中的的概率击毁其选中的轰炸机。请为轰炸机。请为A A、B B双方各选择一个最优策略，即：对于双方各选择一个最优策略，即：对于A A方应选择哪一方应选择哪一架轰炸机装载炸弹？对于架轰炸机装载炸弹？对于B B方战斗机应阻击哪一架轰炸机？方战斗机应阻击哪一架轰炸机？解：解：双方可双方可选择的策略集分的策略集分别为SA=1,2,1：轰炸机炸机 I 装炸装炸弹，II 护航航 2：轰炸机炸机 II 装炸装炸弹，I 护航航SA=1,2,1：阻：阻击轰炸机炸机 I 2：阻：阻击轰炸机炸机 II赢得矩得矩阵R=（aij）22，aij为A方采取策略方采取策略 i而而B方采取策略方采取策略 j 时，轰炸炸机机轰炸炸B方指方指挥部的概率，由部的概率，由题意可意可计算出：算出：a11=0.7+0.3(10.6)=0.82a12=1,a21=1a22=0.3+0.7(10.6)=0.58即即易求得易求得，。由于由于+0，矩矩阵R不存在鞍点，不存在鞍点，应当求最佳混合策略。当求最佳混合策略。现设A以概率以概率x1取策略取策略 1、概率、概率x2取策略取策略 2；B以概率以概率y1取策略取策略 1、概率、概率y2取策略取策略 2。先从先从B方来考方来考虑问题。B采用采用 1时，A方方轰炸机攻炸机攻击指指挥部的概率的期部的概率的期望望值为E（1）=0。82x1+x2，而，而B采用采用 2时，A方方轰炸机攻炸机攻击指指挥部的部的概率的期望概率的期望值为E（2）=x1+0.58x2。若。若E（1）E（2），不妨），不妨设E（1）2且且n2时，采用几何方法求解就，采用几何方法求解就变得相当麻得相当麻烦，此此时通常采用通常采用线性性规划方法求解。划方法求解。现设A以概率以概率x2采取策略采取策略 2，若，若B采取策略采取策略 2，则A的期望的期望赢得得为a11(1x2)+a21x2。对应x2的不同取的不同取值（0 x21），），a11(1x2)+a12x2恰好构成恰好构成连接两个接两个B1的直的直线段。段。类似地，似地，连接两个接两个B2的直的直线段恰好段恰好对应当当B取取 2而而A以概率以概率x2取取2时的的赢得得a12(1x2)+a22x2。设两直两直线段相交于段相交于N，并并设N对应于于。若。若A以小于以小于的的x2取策略取策略 2，则B可以采取可以采取 1使使A的期望的期望赢得减小；反之，若得减小；反之，若x2 ，则B又可采取又可采取 2而使而使A的的赢得减小。故得减小。故A的的最佳混合策略最佳混合策略为以以 =1 概率取概率取 1，以概率取，以概率取 2（注：（注：B的最佳混的最佳混合策略可合策略可类似用几何方法求得）。似用几何方法求得）。A方方选择混合策略混合策略的目的是使得的目的是使得其中其中ej为只有第只有第j个分量个分量为1而其余分量均而其余分量均为零的向量，零的向量，Ej=XTRej。记，由于，由于，在在yk=1，yj=0（jk）时达到最大达到最大值u，故故应为线性性规划划问题 min u ,j=1,2,n(即即EjEk)xi0,i=1,2,mS.t的解。的解。同理，同理，应为线性性规划划max ,i=1,2,myj0,i=1,2,nS.t的解。的解。由由线性性规划知划知识，（，（8.2）与（）与（8.3）互）互为对偶偶线性性规划，它划，它们具有相同的最具有相同的最优目目标函数函数值。关于。关于线性性规划划对偶理偶理论，有，有兴趣的趣的读者可以参者可以参阅有关有关书籍，例如籍，例如鲁恩恩伯杰的伯杰的“线性与非性与非线性性规划引划引论”。为了了寻找例找例8.5中中A方的最方的最优混合策略，求解混合策略，求解线性性规划划min uS.t 0.82x1+x2 u x1+0.58x2 u x1+x2=1 x1,x2 0可得最可得最优混合策略混合策略x1=0.7,x2=0.3。类似求解似求解线性性规划划max S.t 0.82y1+y2 y1+0.58y2 y1+y2=1 y1,y2 0可得可得B方最方最优混合策略：混合策略：y1=0.7,y2=0.3。三、非零和三、非零和对策策除了零和除了零和对策外，策外，还存在着另一存在着另一类对策策问题，局中人，局中人获利之和并非常数。利之和并非常数。例例8.48.4 现有一有一对策策问题，双方，双方获利情况利情况见表表8.58.5。表表8.58.5B方方A方方1231234（8,2）（3,4）（1,6）（4,2）（0,9）（9,0）（6,2）（4,6）（7,3）（2,7）（8,1）（5,1）假如假如A、B双方仍采取双方仍采取稳妥的妥的办法，法，A发现如采取策略如采取策略4，则至少可至少可获利利4，而，而B发现如采取策略如采取策略1，则至少可至少可获利利2。因而，。因而，这种求种求稳妥的想法妥的想法将将导至出至出现局局势（4，2）。）。容易看出，从整体上看，容易看出，从整体上看，结果并不是最好的，因果并不是最好的，因为双方的双方的总获利有可能利有可能达到达到10。不。不难看出，依靠看出，依靠单方面的努力不一定能收到良好的效果。看来，方面的努力不一定能收到良好的效果。看来，对这一一对策策问题，双方最好，双方最好还是握手言和，相互配合，先取得是握手言和，相互配合，先取得总体上的体上的最大最大获利，然后再按某一双方均利，然后再按某一双方均认为较为合理的方式来分享合理的方式来分享这一已一已经获得的最大得的最大获利。利。例例8.4说明，明，总获利数并非常数的利数并非常数的对策策问题（即不能（即不能转化化为零和零和对策的策的问题），是一，是一类存在着合作基存在着合作基础的的对策策问题。当然，。当然，这里里还存在着一个留待解决存在着一个留待解决而又十分关而又十分关键的的问题：如何分享：如何分享总获利，如果不能达到一个双方（或各方）利，如果不能达到一个双方（或各方）都能接受的都能接受的“公平公平”的分配原的分配原则，则合作仍然不能合作仍然不能实现。怎。怎样建立一个建立一个“公公平平”的分配原的分配原则是一个是一个较为困困难的的问题，将在第九章中介，将在第九章中介绍。最后，我们来考察几个对策问题最后，我们来考察几个对策问题的实例。的实例。例例8.68.6（战例分析）例分析）1944年年8月，美月，美军第一第一军和英和英军占占领法国法国诺曼第不久，曼第不久，立即从海防前立即从海防前线穿穿过海峡，向海峡，向Avranches进军。美。美军第一第一军和英和英军的行的行动直接威直接威胁到德到德军第九第九军。美。美军第三第三军也开到了也开到了Avranches的南部，双方的南部，双方军队所所处的地理位置如的地理位置如图8.2所示。所示。美美军方面的指方面的指挥官是官是Bradley将将军，德，德军指指挥官是官是Von Kluge将将军。Von Kluge将将军面面临的的问题是或者向西是或者向西进攻，加攻，加强强他的西部防他的西部防线，切断美，切断美军援助；或者撤退到援助；或者撤退到东部，占据塞那河部，占据塞那河流域的有利地形，并能得到德流域的有利地形，并能得到德军第十第十五五军的援助。的援助。Bradley将将军的的问题是如何是如何调动他的后他的后备军，后，后备军驻扎在海峡南部。扎在海峡南部。Bradley将将军有三种可供有三种可供选择的策略：的策略：他可以命令后他可以命令后备军原地待命，当海峡原地待命，当海峡形形势危急危急时支援第一支援第一军或出或出击东部部敌人，以减人，以减轻第一第一军的的压力。力。双方双方应如何决策，使自己能有如何决策，使自己能有较大的机会大的机会赢得得战争的争的胜利呢？利呢？我我们将用建立矩将用建立矩阵对策模型的方法，来策模型的方法，来试图求得双方的最求得双方的最优策略。模型假策略。模型假设：1、Bradley将将军和和Von Kluge将将军分分别为对策策问题的局中人的局中人A和和B。2、局中人、局中人A的策略集合的策略集合为SA=1,2,3，其中：其中：1为后后备军增援保增援保卫海峡；海峡；2为后后备军东征，切断德征，切断德军后路；后路；3为后后备军待命待命 3、局中人、局中人B的策略集合的策略集合为SB=1,2，其中：其中：1为德国向西德国向西进攻海峡，攻海峡，切断美切断美军援助；援助；2为德德军撤退到撤退到东部，占部，占领塞塞纳河流域有利地形。河流域有利地形。4、SA、SB构成六种构成六种纯局局势，综合双方合双方实力，各种局力，各种局势估估计结果如下。若果如下。若B采取采取策略策略 1，即德，即德军采取攻采取攻势，则有有（1）（）（1,1），估），估计美美军击败德德军并占并占领海峡的可能性（即概率）海峡的可能性（即概率）为（2）（）（2,1），估），估计美美军取取胜的可能的可能为。德。德军很可能打破美很可能打破美军第一第一军的防的防线，并切断美，并切断美军的退路。的退路。（3）（）（3,1），估），估计美美军可以根据需要增援。如不需增援，后可以根据需要增援。如不需增援，后备军可可东进绕行到德行到德军后方。后方。这样，美，美军将占将占领海峡并海峡并彻底底歼灭德德军第九第九军。情况（情况（1 1）、（）、（2 2）、（）、（3 3）如）如图8.38.3（1 1）、（）、（2 2）、（）、（3 3）所示。）所示。若若B采取策略采取策略 2，即德，即德军第九第九军东撤，占据塞撤，占据塞纳河流域有利地形，河流域有利地形，则有有（4）（）（1,2），美方），美方扩大了大了战线，德，德军虽占据了有利地形，美占据了有利地形，美军仍有仍有击败德德军的可能性。的可能性。（5）（）（2,2），美后），美后备军东进给德德军东撤造成撤造成压力并挫力并挫伤德德军，使美，使美军击败德德军的可能性增大到的可能性增大到。（6）（）（3,2），美后），美后备军待命。在待命。在发现德德军撤退后，奉命向撤退后，奉命向东扰乱乱敌方撤退，方撤退，为以后以后歼灭德第九德第九军创造条件，估造条件，估计是美是美军击败德德军的可能性的可能性。情况（情况（4）、（）、（5）、（）、（6）见图8.3（4）、（）、（5）（）（6）所示。）所示。上述分析估上述分析估计是由是由Bradley将将军作出的，据此构造出作出的，据此构造出A方方赢得矩得矩阵这是一个是一个32对策矩策矩阵。可以求得。可以求得，不存在，不存在稳定解，定解，需要考需要考虑其他解法。其他解法。定定义8.3 对于于赢得矩得矩阵R，如果如果对所有所有j，aijakj均成立，且至少存在一个均成立，且至少存在一个使使得得则称称i行行优于于k行（策略行（策略ai优于于ak）。）。同同样，如，如对一切一切i有有aijakl，且至少有一个且至少有一个i0使得使得，则称称j列列优于于l例（局中人例（局中人B的策略的策略 j优于于 l）。）。易易见，若一个，若一个对策矩策矩阵的第的第i行行优于第于第k行，行，则无无论局中人局中人B选择哪种策略，局中哪种策略，局中人人A采取策略采取策略 i的的获利利总优于（至少不次于）采取策略于（至少不次于）采取策略 k的的获利。利。定理定理8.5 对于矩于矩阵对策策G=SA,SB,R，若矩若矩阵R的某行的某行优于第于第i1,ik行，行，则局中人局中人A在在选取最取最优策略策略时，必取，必取。令令，R为从从R中划去第中划去第i1行，行，ik行后剩下的矩行后剩下的矩阵，则的最的最优策略即原策略即原对策策G的最的最优策略，策略，对于于R中中列的最列的最优关系也有关系也有类似的似的结果。果。利用利用这一定理，有一定理，有时对策策问题可先可先进行化行化简，降低矩，降低矩阵的的阶数。数。现在回在回过来来讨论美、德美、德军队对策策问题。在。在Bradleg构造的矩构造的矩阵中容易中容易发现a1ja3j,j=1,2故故 3优于于 1。根据上面的定理根据上面的定理8.5，可划去，可划去该矩矩阵的第一行，得到的第一行，得到22赢得矩得矩阵这仍然是一个无鞍点的仍然是一个无鞍点的对策矩策矩阵。设Bradley以概率以概率p1取策略取策略 2而以概而以概率率p2取略取略 3，则应有有解得解得类似地，似地，设Von Kluge 以概率以概率q1取策略取策略 1而以概率而以概率q2取策略取策略 2，则应有有解得解得。由于两由于两军作作战并非可以反复并非可以反复进行的行的对策策问题，看来最大的可能是美，看来最大的可能是美军采采取策略取策略 3而德而德军采取策略采取策略 2，即美方后，即美方后备军待命而德待命而德军第九第九军东撤。撤。事事实上，当上，当时双方指双方指挥官正是官正是这样决策的，如果真能决策的，如果真能实行，双方行，双方胜负还难以料定。但正当德以料定。但正当德军第九第九军刚开始开始东撤撤时，突然接到了希特勒的命令，突然接到了希特勒的命令要他要他们向西向西进攻，从而失去了他攻，从而失去了他们有可能取得的最佳有可能取得的最佳结局，走上必然局，走上必然灭亡的道路。亡的道路。Von Kluge将将军指指挥的德的德军向西向西进攻，开始攻，开始时德德军占占领了海了海峡，但随之即被美峡，但随之即被美军包包围遭到了全遭到了全军复复灭，Von Kluge本人在失本人在失败后自后自杀。例例8.7 （防坦克地雷（防坦克地雷场的布的布设）实战中，攻方中，攻方为了增了增强强攻攻击力，大量力，大量使用攻使用攻击力力强强、防御、防御坚固的坦克；守方固的坦克；守方为了抵御了抵御对方攻方攻击，需要大量，需要大量杀伤敌方的有生力量，有效方的有生力量，有效对策之一是布策之一是布设防坦克地雷防坦克地雷场。1、分析、分析评价防坦克地雷价防坦克地雷场的重要指的重要指标是是战斗效力，而布雷密度是基本因素之一。斗效力，而布雷密度是基本因素之一。只要有足只要有足够多的地雷，用多的地雷，用较高密度的地雷高密度的地雷场对付付敌方方进攻攻总是行之有效是行之有效的。但在的。但在实际战斗中，地雷不太可能是足斗中，地雷不太可能是足够多的。假多的。假设：（1）防坦克地雷数量有限；）防坦克地雷数量有限；（2）通）通过侦察、分析，已知察、分析，已知敌方可能采用方可能采用 1、2、n种种进攻策略之一；攻策略之一；（3）通）通过敌情分析，确定了防御正面的情分析，确定了防御正面的宽度，并根据我方地雷数量，度，并根据我方地雷数量，设计了了 1,2,m这m种布雷方案。种布雷方案。问采取哪一方案或什么采取哪一方案或什么样的混合策略能有效的混合策略能有效击毁毁敌方的坦克？方的坦克？本例在本例在过去一般是凭指去一般是凭指挥员的作的作战经验定性决策的，定性决策的，现用矩用矩阵对策方法策方法进行定量行定量择优。由于每两由于每两辆坦克之坦克之间一般要保持一般要保持50米的米的间距，因而距，因而进攻正面拉得很攻正面拉得很宽，如一个梯如一个梯队20辆坦克，坦克，进攻正面攻正面约为一公里一公里宽。因。因为只有有限个防御只有有限个防御正面，用有限个正面，用有限个进攻策略来描述攻策略来描述敌方的方的进攻状攻状态是非常接近是非常接近实际情况情况的。的。对守方来守方来讲，布雷密度通常可分成，布雷密度通常可分成0.5,1,1.5,2等有限个等等有限个等级。按常。按常规做法，在防御正面上一般采用同一种技做法，在防御正面上一般采用同一种技术密度。密度。为了提高了提高杀伤率，率，现将一个防御正面划分成几段，各段允将一个防御正面划分成几段，各段允许采用不同密度。采用不同密度。2、对策决策策决策要用矩要用矩阵对策决策，关策决策，关键问题是如何列出守方的是如何列出守方的赢得矩得矩阵。由效率。由效率评定定试验可得出在各种布雷密度下的可得出在各种布雷密度下的杀伤率表，如表率表，如表8.6所示。所示。表表8.6布雷密度布雷密度0.511.52杀伤率率0.640.870.950.98根据上表，在确定方案后即可根据各段不同密度根据上表，在确定方案后即可根据各段不同密度针对攻方的攻方的进攻策略攻策略计算算出坦克的出坦克的杀伤率。率。为便于理解，作便于理解，作为实例分析下面两种情况：例分析下面两种情况：情况情况1 设守方只有守方只有1500个防坦克地雷，欲布个防坦克地雷，欲布设在攻方必在攻方必经的的2公里攻公里攻击正面上。攻方一个坦克梯正面上。攻方一个坦克梯队的的20辆坦克展开成坦克展开成1公里公里宽的的阵面，但既可面，但既可能从左能从左侧进攻（策略攻（策略 1）也可能从右）也可能从右侧进攻（策略攻（策略 2）。守方）。守方设计了了三种布雷方案三种布雷方案 1,2,3,（图8.4），），试求守方的求守方的赢得矩得矩阵和最和最优策略。策略。图图8.4情况情况1求解：容易求得守方的求解：容易求得守方的赢得矩得矩阵这是一个有鞍点的矩是一个有鞍点的矩阵，鞍点，鞍点为a22。守方只要按。守方只要按 2方案布雷，方案布雷，则不管不管攻方从哪一攻方从哪一侧进攻，攻，总可可毁毁伤对方方47.5%的坦克。的坦克。情况情况2 攻方一梯攻方一梯队20辆坦克可从左坦克可从左侧（1）、中路（）、中路（2）或右翼（）或右翼（3）进攻，展开成攻，展开成1公里布公里布阵。守方只有。守方只有2000个防坦克地雷，初步提出三种布个防坦克地雷，初步提出三种布雷方案，如雷方案，如图8.5所示，所示，试求守方采用何种布雷方案求守方采用何种布雷方案较好。好。图图8.5对情况情况2，可求得守方的，可求得守方的赢得矩得矩阵为此此时，矩，矩阵A中不存在鞍点，中不存在鞍点，对策无策无稳定解，定解，应采用混合策略。可以求采用混合策略。可以求得，此得，此时守方如按照守方如按照0.166:0.456:0.378的比例采取策略的比例采取策略 1,2,3布雷，布雷，平均可平均可毁毁伤对方方83.5%的坦克。的坦克。由本例可以看出，在决策由本例可以看出，在决策问题中，策略的中，策略的设计至关重要，它直接影响到至关重要，它直接影响到赢得矩得矩阵。策略的。策略的设计并没有包含在决策并没有包含在决策问题的求解中，事的求解中，事实上，上，仅当当策略策略设计完成后，即策略集合完成后，即策略集合给定后，决策定后，决策问题才被才被给定，从而才能被定，从而才能被求解，因而，在用求解，因而，在用对策策论方法研究方法研究实际课题时，应当特当特别注意策略的注意策略的设计。这一部分工作既具有一定的一部分工作既具有一定的创造性又在很大程度上影响到造性又在很大程度上影响到结果，果，对它研究也是十分有趣的。它研究也是十分有趣的。8.2 决策问题决策问题人人们在在处理理问题时，常常会面，常常会面临几种可能出几种可能出现的自然情况，同的自然情况，同时又存又存在着几种可供在着几种可供选择的行的行动方案。此方案。此时，需要决策者根据已知信息作决，需要决策者根据已知信息作决策，即策，即选择出最佳的行出最佳的行动方案，方案，这样的的问题称称为决策决策问题。面。面临的几的几种自然情况叫做自然状种自然情况叫做自然状态或或简称状称状态。状。状态是客是客观存在的，是不可控存在的，是不可控因素。可供因素。可供选择的行的行动方案叫做策略，方案叫做策略，这是可控因素，是可控因素，选择哪一方案哪一方案由决策者决定。由决策者决定。例例8.8 在开采石油在开采石油时，会遇到是否在某，会遇到是否在某处钻井的井的问题。尽管勘探。尽管勘探队已作已作了大量了大量调研分析，但由于地下研分析，但由于地下结构极构极为复复杂，仍无法准确，仍无法准确预测开采的开采的结果，决策者可以决定果，决策者可以决定钻井，也可以决定不井，也可以决定不钻井。井。设根据根据经验和勘探和勘探资料，料，决策者已掌握一定的信息并列出表决策者已掌握一定的信息并列出表8.7。表表8.7000不不钻井（井（2）402030钻井（井（1）P(3)=0.3 P(2)=0.5 P(1)=0.2（亿元）元）高高产油井（油井（3）一般（一般（2）无油（无油（1）自然状自然状态概率概率收益收益方案方案问：决策者：决策者应如何作出决策？如何作出决策？解：由解：由题意可以看出，决策意可以看出，决策问题应包含三方面信息：状包含三方面信息：状态集合集合Q=1,n、策略集合、策略集合A=1,m及收益及收益R=aij，其中，其中aij表示表示如果决策者如果决策者选取策略取策略i而出而出现的状的状态为j，则决策者的收益决策者的收益值为aij（当（当aij为负值时表示表示损失失值）。）。决策决策问题按自然状按自然状态的不同情况，常被分的不同情况，常被分为三种三种类型：确定型、型：确定型、风险型型（或随机型）和不确定型。（或随机型）和不确定型。确定型决策是只存在一种可能自然状确定型决策是只存在一种可能自然状态的决策的决策问题。这种决策种决策问题的的结构构较为简单，决策者只需比，决策者只需比较各种方案，确定哪一方案最各种方案，确定哪一方案最优即可。即可。值得得一提的是策略集也可以是无限集，例如，一提的是策略集也可以是无限集，例如，线性性规划就可行看成一个策略划就可行看成一个策略集是限集的确定型决策，集是限集的确定型决策，问题要求决策者从可行解集合（策略集）中挑要求决策者从可行解集合（策略集）中挑选出最出最优解。确定型决策的求解并非全是解。确定型决策的求解并非全是简单的，但由于的，但由于这些些问题一般一般均有其自己的均有其自己的专门算法，本算法，本节不准不准备再作介再作介绍。在本。在本节中，我中，我们主要主要讨论风险型与不确定型决策，并介型与不确定型决策，并介绍它它们的求解方法。的求解方法。一、一、风险型决策型决策问题在在风险型决策型决策问题中存在着两种以上可能出中存在着两种以上可能出现的自然状的自然状态。决策者不知。决策者不知道究竟会出道究竟会出现哪一种状哪一种状态，但知道各种状，但知道各种状态出出现的概率有多大。例如，例的概率有多大。例如，例8.8就是一个就是一个风险型决策型决策问题。对于于风险型决策型决策问题，最常用的决策方法是期望，最常用的决策方法是期望值法，即根据各方案的期法，即根据各方案的期望收益或期望望收益或期望损失来失来评估各方案的估各方案的优劣并据此作出决策。如劣并据此作出决策。如对例例1，分，分别求出方案求出方案 1（钻井）和井）和 2（不（不钻井）的期望收益井）的期望收益值：E（1）=0.2（30）+0.520+0.340=16（万元）万元）E（2）=0由于由于E（1）E（2），），选取取 1作作为最佳策略。最佳策略。风险型决策也可采用期望后悔型决策也可采用期望后悔值法求解。首先，求出采取方案法求解。首先，求出采取方案 i而而出出现状状态 j时的后悔的后悔值。例如，如果不例如，如果不钻井，但事井，但事实上上该处可开出一口高可开出一口高产井，井，则后悔后悔值为40。因因为钻井可收益井可收益40万元，但决策者作了不万元，但决策者作了不钻井的决策，未井的决策，未获得本来可以得本来可以获得的得的40万元收益。然后，比万元收益。然后，比较各方案的期望后悔各方案的期望后悔值，选取期望后悔最取期望后悔最小的方案作小的方案作为最佳策略。在例最佳策略。在例8.8中，如采用期望后悔中，如采用期望后悔值法，法，则E（1）=6，E（2）=22，取，取 1为最佳策略。最佳策略。在在选取策略取策略 i而出而出现状状态 j时后悔后悔值为的理由是在的理由是在出出现状状态 j情况下的最大可能收益情况下的最大可能收益为。定理定理8.6 最大期望收益法与最小期望后悔最大期望收益法与最小期望后悔值法等价，即两者法等价，即两者选出的最佳出的最佳策略相同。策略相同。证明：由证明：由得得故故等式（等式（8.4）的右端）的右端项为一常数，其左端一常数，其左端项为采取策略采取策略 i时期后悔期后悔值与与期望收益期望收益值之和，从而，若某策略使期望收益最大，之和，从而，若某策略使期望收益最大，则该策略必使期望策略必使期望后悔后悔值最小，定理得最小，定理得证。对于于较为复复杂的决策的决策问题，尤其是需要作多，尤其是需要作多阶段决策的段决策的问题，常采用，常采用较直直观的决策的决策树方法，但从本方法，但从本质上上讲，决策，决策树方法仍然是一种期望方法仍然是一种期望值法。法。例例8.9 某工程按正常速度施工某工程按正常速度施工时，若无坏天气影响可确保在，若无坏天气影响可确保在30天内按期天内按期完工。但根据天气完工。但根据天气预报，15天后天气肯定天后天气肯定变坏。有坏。有40%的可能会出的可能会出现阴阴雨天气而不影响工期，在雨天气而不影响工期，在50%的可能会遇到小的可能会遇到小风暴而使工期推暴而使工期推迟15天，天，另有另有10%的可能会遇到大的可能会遇到大风暴而使工期推暴而使工期推迟20天。天。对于可能出于可能出现的情况，的情况，考考虑两种方案：两种方案：（1）提前）提前紧急加班，在急加班，在15天内完成工程，天内完成工程，实施此方案需增加开支施此方案需增加开支18000元。元。（2）先按正常速度施工，）先按正常速度施工，15天后根据天后根据实际出出现的天气状况再作决策。的天气状况再作决策。如遇到阴雨天气，如遇到阴雨天气，则维持正常速度，不必支付持正常速度，不必支付额外外费用。用。如遇到小如遇到小风暴，有两个暴，有两个备选方案：（方案：（i）维持正常速度施工，支付工程延持正常速度施工，支付工程延期期损失失费20000元。（元。（ii）采取）采取应急措施。急措施。实施此施此应急措施有三种可能急措施有三种可能结果：有果：有50%可能减少可能减少误工期工期1天，支付天，支付应急急费用和延期用和延期损失失费共共24000元；元；有有30%可能减少可能减少误工期工期2天，支付天，支付应急急费用和延期用和延期损失失费共共18000元；有元；有20%可能减少可能减少误工期工期3天，支付天，支付应急急费用和延期用和延期损失失费共共12000元。元。如遇大如遇大风暴，也有两个方案可供暴，也有两个方案可供选择：（：（i）维持正常速度施工，支付工持正常速度施工，支付工程延期程延期损失失费50000元。（元。（ii）采取）采取应急措施。急措施。实施此施此应急措施也有三种急措施也有三种可能可能结果：有果：有70%可能减少可能减少误工期工期2天，支付天，支付应急急费及及误工工费共共54000元；元；有有20%可能减少可能减少误工期工期3天，支付天，支付应急急费及及误工工费共共46000元；有元；有10%可可能减少能减少误工期工期4天，支付天，支付应急急费和和误工工费共共38000元。元。根据上述情况，根据上述情况，试作出最佳决策使支付的作出最佳决策使支付的额外外费用最少。用最少。解：由于未来的天气状解：由于未来的天气状态未知，但各种天气状况出未知，但各种天气状况出现的概率已知，本例的概率已知，本例是一个是一个风险型决策型决策问题，所，所谓的的额外外费用用应理解理解为期望期望值。本例要求作多次决策，工程初期本例要求作多次决策，工程初期应决定是按正常速度施工决定是按正常速度施工还是提前是提前紧急加急加班。如按正常速度施工，班。如按正常速度施工，则15天后天后还需根据天气状况再作一次决策，以决需根据天气状况再作一次决策，以决定是否采取定是否采取应急措施，故本例急措施，故本例为多多阶段（两段（两阶段）决策段）决策问题。为便于分析便于分析和决策，

展开阅读全文

第八章对策与决策模型课件

最新文档