决策理论-第七章-竞争型决策分析--博弈论ppt课件

资源描述

第七章第七章竞争型决策分析竞争型决策分析第七章竞争型决策分析1第一节第一节竞争型决策分析与博弈论竞争型决策分析与博弈论1 12 2第二节第二节完全信息静态博弈完全信息静态博弈3 3第三节第三节完全信息动态博弈完全信息动态博弈第一节竞争型决策分析与博弈论12第二节完全信息静态博2博弈论的思想溯源竞争型决策考虑竞争对手信息下所做的最优决策n市场竞争n政党竞争博弈论的思想溯源竞争型决策考虑竞争对手信息下所做的最优决策3 美藉匈牙利数学家冯诺依曼（John Von Neuman）和美藉奥地利经济学家摩根斯顿（Morgenstern）相识于普林斯顿大学，他们于1944年出版了经典著作博弈论与经济行为，为现代博弈论的发展奠定了基础。美国的数学家、经济学家纳什纳什（John Nash），美籍匈牙利经济学家海萨尼海萨尼（John C.Harsanyi）和德国经济学家泽尔泽尔滕滕（R.Selten）因对博弈论的卓越贡献而获得1994年度的诺贝尔经济学家。海萨尼纳什美藉匈牙利数学家冯诺依曼（John4 值得一提的是纳什，他发表奠定其在博弈论中重要地位的学术论文时，年仅22岁，被人称为“一个天才”。1959年，纳什被精神病医生诊断为“妄想性精神分裂”，饱受精神病折磨40余年。泽尔滕泽尔滕 5 “要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解”保罗萨缪尔森 “要想在现代社会做一个有文化的人，你必须对博弈论有一个大6什么是博弈论？博弈论是研究理性的决策者之间的冲突与合作冲突与合作的理论，具体讲就是研究当决策主体的行为在发生直接的相互作用相互作用时，人们如何进行决策以及这种决策的均衡均衡问题。什么是博弈论？博弈论是研究理性的决策者之间的冲突与合作的理7什么是博弈？博弈是指代表不同利益主体的决策者，在一定的环境条件和规则下，根据所掌握的信息，同时或先后、一次或多次从各自允许选择的行动方案中加以选择并实施，从而取得各自相应结果的过程。如下棋，最后的结果就是由下棋双方你来我往轮流如下棋，最后的结果就是由下棋双方你来我往轮流做出决策，决策又相互影响、相互作用而得出的结做出决策，决策又相互影响、相互作用而得出的结果。果。什么是博弈？博弈是指代表不同利益主体的决策者，在一定的环境8(一)囚徒困境两个小偷甲和乙联手作案，私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯，政策是若一人招供但另一人未招，则招者立即被释放，未招者判入狱10年；若二人都招则两人各判刑5年;若两人都不招则未获证据但因私入民宅各拘留1年。一、从“囚徒困境”谈起(一)囚徒困境一、从“囚徒困境”谈起9 甲和乙是参与博弈的人，称为“局中人”。表1中每一个小方格内的数字被称为局中人的支付，其中左边的数字代表甲的支付，右边的是乙的支付。表1中的双变量矩阵称为博弈支付矩阵。局中人所选择的战略构成的组合（招,招）被称为博弈均衡。这个组合中前后两个战略分别表示甲和乙所选择的战略。甲和乙是参与博弈的人，称为“局中人”。表1中10表1 囚徒困境博弈乙招不招招甲不招（问题1：甲、乙如何选择？）-5,-50,-10-10,0-1,-1表1 囚徒困境博弈-5,-50,-10-10,0-1,-111 对甲来说，尽管他不知道乙是选择了“招”还是“不招”，他发现他自己选择“招”都是比选择“不招”为好的。因此，“不招”是相对于“招”的劣战略，他不会选择劣战略。所以，甲会选择“招”。同样，根据对称性，乙也会选择“招”，结果是甲乙两人都“招”。12表1 囚徒困境博弈乙招不招招甲不招-5,-50,-10-10,0-1,-1表1 囚徒困境博弈-5,-50,-10-10,0-1,-113 甲和乙都不会选择劣战略“不招”，称为“剔除劣战略的占优战略均衡”。其中“招”是占优于(优于)“不招”的占优战略。甲和乙都不会选择劣战略“不招”，称为“剔除劣14总结n囚徒困境反映了一个深刻的问题，这就是个人追求最大自身利益的行为，常常并不能导致实现社会的最大利益，也常常不能真正实现个人自身利益的最大化。n我们可以利用这个道理来分析日常生活中的许多不合作现象。总结囚徒困境反映了一个深刻的问题，这就是个人追求最大自15对经典经济学的冲击“纳什均衡纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。国富论：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。对经典经济学的冲击“纳什均衡”首先对亚当斯密的“看不见的手16 2.生活中的“囚徒困境”例子例子例子1:1:商家价格战商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利，但实际上却是相互杀价，结果都赚不到钱。当一些商家共谋将价格抬高，消费者实际上不用着急，因为商家联合维持高价的垄断行为一般不会持久，可以等待垄断的自身崩溃，价格就会掉下来。2.生活中的“囚徒困境”例子例子1:商家价格战17n 譬如，2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位，他们搞了一个“彩电厂家价格自律联盟”，并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时，国家有关部门还未出台相关的反垄断法律，对于这种在发达国家明显属于违法行为的所谓“自律联盟”，国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋，并且还通过媒体大肆炒作，这在发达国家是不可思议的。譬如，2000年我国几家生产彩电的大厂商合谋将彩18n 但是，尽管政府当时无力制止这种事情，公众也不必担心彩电价格会上涨。这是因为，“彩电厂商自律联盟”只不过是一种“囚徒困境”，彩电价格不会上涨。在高峰会议之后不到二周，国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态：无论其他厂商是否降价，我自己降价是有利于自己的市场份额扩大的。但是，尽管政府当时无力制止这种事情，公众也不必担19n例子例子2:2:为什么要加入为什么要加入WTOWTO？WTO是一个自愿性申请加入的自由贸易联盟，即WTO成员国之间实现低关税或零关税的相互间自由贸易。为什么需要一个组织来协调国家之间的自由贸易呢？这是因为，如果没有一个协调组织，国与国之间的贸易就不会呈现低关税或零关税的自由贸易局面，因为这时国与国之间的贸易是一个“囚徒困境”。给定一个国家对另一个国家的货物实行低关税，另一个国家反过来对这个国家的货物实行高关税是占优于实行低关税的战略的。例子2:为什么要加入WTO？20田忌赛马田忌赛马n 古代齐威王与大将田忌赛马，田忌的谋士孙膑运用计谋帮助田忌以弱胜强。n 比赛规则：田忌与齐威王各出三匹马，一对一比赛三场，每一场的输方要赔1千金给赢方。双方的马按实力都可以分为上、中、下，但齐威王的上、中、下均优于田忌的上、中、下。实际上，田忌的上马、中马要优于齐威王的中马、下马。n 比赛结果：田忌连输三场；后孙膑建议，以上对中、以中对下、以下对上，结果以2：1赢得比赛。田忌赛马古代齐威王与大将田忌赛马，田忌的谋士孙膑运用计谋帮21n 这个案例生动地告诉我们，巧妙地运用策略是多么的重要。n 但是，事情并没有结束，齐威王也很聪明，他利用各种手段，很快明白了自己输掉比赛的原因而及时地调整了自己的对策。这样，齐威王与田忌的赛马也就成了一个具有策略依存特征的决策较量，构成了一个典型的博弈问题n 如果把赢一千金记成收益1，输一千金记成收益为1，则齐威王和田忌在各种策略组合下的收益如下表所示：田忌赛马续篇田忌赛马续篇这个案例生动地告诉我们，巧妙地运用策略是多么的重要。田22上中下上下中中上下中下上下上中下中上上中下3，-31，-11，-11，-1-1，11，-1上下中1，-13，-31，-11，-11，-1-1，1中上下1，-1-1，13，-31，-11，-11，-1中下上-1，11，-11，-13，-31，-11，-1下上中1，-11，-11，-1-1，13，-31，-1下中上1，-11，-1-1，11，-11，-13，-3齐齐威威王王田忌田忌田忌赛马续篇田忌赛马续篇上中下上下中中上下中下上下上中下中上上中下3，-31，-1123 在上述混合策略下，齐威王的期望得益为1/6（3+1+1+1+1-1）=1；田忌的期望得益为1/6（1-3-1-1-1-1）=-1，即多次进行这样的赛马，齐威王平均每次能赢田忌1千金，这是因为齐威王三匹马的总体实力略胜田忌三匹马总体实力的缘故.田忌赛马续篇田忌赛马续篇在上述混合策略下，齐威王的期望得益为1/624博弈的要素1 1、参与人、参与人是指博弈中独立决策、独立承担结果的决策主体。是指博弈中独立决策、独立承担结果的决策主体。他们可以是自然人或团体或法人，如企业、国家、地区、社团、欧盟、北约等。那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人，而只能当做环境参数来处理。如指手划脚的看牌人、看棋人，企业的顾问等。博弈的要素1、参与人25博弈的要素2、策略策略指每个博弈方在进行决策时可以选择的方法、做法等，策略有纯策略纯策略和混合策略混合策略之分。纯策略指参与人在博弈中可以选择采用的行动方案，混合策略是在纯策略空间上的一种概率分布，表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。博弈的要素2、策略26博弈的要素3、支付支付每个博弈方从各种策略组合中获得的收益或效用，它是策略组合的函数，所以也称支付函数记为博弈的要素3、支付27博弈的要素4、博弈方的信息博弈方的信息信息是博弈参与方有关其他博弈方的策略、收益等知识。5 5、博弈的次序、博弈的次序规定一个博弈就必须规定其次序，不同的次序是不同的博弈。6 6、结果和均衡、结果和均衡结果指博弈中博弈方的行动所产生的每一可能情形。博弈的要素4、博弈方的信息28博弈的分类一、一、按参与方数目：按参与方数目：1、单人博弈2、两人博弈3、多人博弈博弈的分类一、按参与方数目：29博弈的分类二、二、按各博弈方可选策略数量的多少按各博弈方可选策略数量的多少n1、有限博弈n2、无限博弈博弈的分类二、按各博弈方可选策略数量的多少30博弈的分类三、按参加博弈的各个博弈方从博弈中所获得的三、按参加博弈的各个博弈方从博弈中所获得的利益总和利益总和1、零和博弈2、常和博弈3、变和博弈博弈的分类三、按参加博弈的各个博弈方从博弈中所获得的利益总和31博弈的分类四、按参与人行动的先后顺序四、按参与人行动的先后顺序1、静态博弈2、动态博弈博弈的分类四、按参与人行动的先后顺序32博弈的分类五、按参与人所掌握的信息五、按参与人所掌握的信息1、完全信息博弈2、不完全信息博弈博弈的分类五、按参与人所掌握的信息33 行动顺序行动顺序信信息息静态静态动态动态完全信息完全信息完全信息静态博弈完全信息静态博弈纳什均衡纳什均衡纳什（纳什（1950,19511950,1951）完全信息动态博弈完全信息动态博弈子博弈精炼纳什均衡子博弈精炼纳什均衡泽尔腾（泽尔腾（19651965）不完全信息不完全信息不完全信息静态博弈不完全信息静态博弈贝叶斯纳什均衡贝叶斯纳什均衡海萨尼（海萨尼（1967-19681967-1968）不完全信息动态博弈不完全信息动态博弈精炼贝叶斯纳什均衡精炼贝叶斯纳什均衡泽尔腾（泽尔腾（19751975）六.博弈的分类混合划分行动顺序静态动态完全信息静态博弈完全信34第一节第一节竞争型决策分析与博弈论竞争型决策分析与博弈论1 12 2第二节第二节完全信息静态博弈完全信息静态博弈3 3第三节第三节完全信息动态博弈完全信息动态博弈第一节竞争型决策分析与博弈论12第二节完全信息静态博35一.博弈的标准式表达n基本要素基本要素:q参与人参与人q策略集策略集q收益收益一.博弈的标准式表达基本要素:36二纳什均衡-5，-50，-10-10，0-1，-1囚囚徒徒困困境境求解方法求解方法:划线法划线法纳什均衡纳什均衡（Nash equilibrium）是指这样一种策略组合，这种策略组合由所有参与人的最优策略组成，也就是说，在给定别人策略的情况下，没有任何单个参与人有积极性选择其他策略，从而没有任何人有积极性打破这种均衡。二纳什均衡-5，-50，-10-10，0-1，37三.两人有限零和博弈n(一)两人有限零和博弈模型n(二)最优纯策略纳什均衡n(三)最优混合策略纳什均衡三.两人有限零和博弈(一)两人有限零和博弈模型38 1.智猪博弈猪圈中有一头大猪和一头小猪，在猪圈的一端设有一个按钮，每按一下，位于猪圈另一端的食槽中就会有10单位的猪食进槽，但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽，则大猪吃到9单位食物，小猪仅能吃到1单位食物；如果两猪同时到食槽，则大猪吃7单位，小猪吃3单位食物；如果小猪先到，大猪吃6单位而小猪吃4单位食物。下面给出这个博弈的支付矩阵。二、智猪博弈：对诸多经济现象的解释 1.智猪博弈二、智猪博弈：对诸多经济现象的解释39智猪博弈小猪按等待按大猪等待 5,14,49,-10,0智猪博弈5,14,49,-10,040 这个博弈没有“剔除劣战略均衡”，因为大猪没有劣战略。但是，小猪有一个劣战略“按”，因为无论大猪作何选择，小猪选择“等待”是比选择“按”更好一些的战略。所以，如果小猪是理性的，小猪会剔除“按”，而选择“等待”；大猪知道小猪会选择“等待”，从而自己选择“按”，所以，可以预料博弈的结果是(按,等待）。这称为“重复剔除劣战略的占优战略均衡”，其中小猪的战略“等待”占优于战略“按”，而给定小猪剔除了劣战略“按”后，大猪的战略“按”又占优于战略“等待”。这个博弈没有“剔除劣战略均衡”，因为大猪没有劣战略。41总结在寻找智猪博弈的均衡解时，我们的做法可归纳如下：1、首先找出某一博弈参与人的严格劣战略，将它剔除掉，从新构造一个不包括已剔除战略的博弈；2、然后继续剔除这个新的博弈中某一参与人的严格劣战略；3、重复进行这一过程，直到剩下唯一的参与人战略组合为止。这唯一的参与人战略组合，就是这个博弈的均衡解，称为重复剔除的占优战略均衡。总结在寻找智猪博弈的均衡解时，我们的做法可归纳如下：42生活中的智猪博弈例1:股市博弈在股票市场上，大户是大猪，他们要进行技术分析，收集信息、预测股价走势，但大量散户就是小猪。他们不会花成本去进行技术分析，而是跟着大户的投资战略进行股票买卖，即所谓“散户跟大户”的现象。生活中的智猪博弈例1:股市博弈43n例2：为何股份公司中的大股东才有投票权？在股份公司中，大股东是大猪，他们要收集信息监督经理，因而拥有决定经理任免的投票权，而小股东是小猪，不会直接花精力去监督经理，因而没有投票权。例2：为何股份公司中的大股东才有投票权？44 例3：为什么中小企业不会花钱去开发新产品？在技术创新市场上，大企业是大猪，它们投入大量资金进行技术创新，开发新产品，而中小企业是小猪，不会进行大规模技术创新，而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品的产品去销售。例3：为什么中小企业不会花钱去开发新产品？45斗鸡博弈n 同一宿舍的两个男同学关系相当不错，在他们的生活中出现一位女生，他们两人都对这个女生很有好感。现在假如两个人同时公开宣布喜欢这个女生并准备去追求，则他们都觉得很尴尬，而且他们的关系也会出现僵化，这是他们不愿意得到的结果（在这里假定没有哪个同学特别喜欢这个女生，可以不顾一切，也假定这个女生不是特别偏向哪个男生）。下面是他们的支付矩阵：斗鸡博弈同一宿舍的两个男同学关系相当不错，在他们的生46斗鸡博弈乙方追求不追求甲方追求3，32,1不追求1,20，0斗鸡博弈乙方甲方追求3，32,1不追求1,47斗鸡博弈n 要是甲首先宣布开始追求那个女孩，那乙同学的最优选择就是放弃，这样的话就可以避免和好朋友闹翻，这正是他最不愿意看到的；同样，要是乙同学首先宣布开始追求那女孩，那甲同学的最优选择也同样是放弃，道理是一样的。这时候就出现了两个纳什均衡：一个是甲同学追求、乙同学不追求；另一个就是甲同学不追求、乙同学追求。到底哪个均衡会出现了，这要由生活中其他的偶然因素决定，有时是甲同学碰巧先宣布，有时是乙同学碰巧先宣布。斗鸡博弈要是甲首先宣布开始追求那个女孩，那乙同学的最优48经济生活中的实例n 在城市街道上，我们常见到一些地段上的商店十分拥挤，构成一个繁荣的商业中心区，但另一些地段却十分冷僻，没什么商店。对于这种现象，我们可以运用纳什均衡的概念来加以解释。甲乙 1/2 商业位置博弈经济生活中的实例在城市街道上，我们常见到一些地49第一节第一节竞争型决策分析与博弈论竞争型决策分析与博弈论1 12 2第二节第二节完全信息静态博弈完全信息静态博弈3 3第三节第三节完全信息动态博弈完全信息动态博弈第一节竞争型决策分析与博弈论12第二节完全信息静态博50第三节第三节完全信息动态均衡完全信息动态均衡一、子博弈精炼纳什均衡二、重复博弈三、动态博弈战略行动第三节完全信息动态均衡一、子博弈精炼纳什均衡51一、子博弈精炼纳什均衡一、子博弈精炼纳什均衡n在动态博弈中，参与人的行动有先后顺序，而且后行动的参与人在自己行动之前可以观测可以观测到先行动者的行动到先行动者的行动，并选择相应战略。n由于先行动者拥有后行动者可能选择战略的完全信息，因而先行动者在选择自己的战略时，就可以预先考虑自己的选择对后行动者选择的影响，并采取相应的对策。n以某一房地产开发博弈为例，下图显示了静态条件下双方参与人的得失。一、子博弈精炼纳什均衡在动态博弈中，参与人的行动有先后顺序52图1 房地产开发博弈B开发不开发A 开发-3,-31,0不开发0,10,0图1 房地产开发博弈BA开发-3,-31,0不开发0,1053子博弈的定义n子博弈是原博弈的一部分，它本身可以作为一个独立的博弈进行分析。例如图1中，每一列或每一行都是一个子博弈，任何博弈本身则被称为自身的一个子博弈。在A先采取行动后，B对A的回应构成包括原博弈在内的三个子博弈。子博弈的定义子博弈是原博弈的一部分，它本身可以作为一个独立54房地产开发商A是先行动者。在行动之前，A对竞争者B的战略进行了预测，认为B有四种战略可选：1、无论A A是否开发，是否开发，B B都要开发都要开发；2、如果A A开发，开发，B B也开发也开发；如果A A不开发，不开发，B B也不开发也不开发。3、如果A A开发，开发，B B就不开发就不开发；如果A A不开发，不开发，B B就开发就开发。4、无论A A是否开发，是否开发，B B必定不开发必定不开发。将B可能采取的战略与图1中博弈双方相应选择的得失结合起来，可以得出下图。房地产开发商A是先行动者。在行动之前，A对竞争者B的战略进55图2 A对B的预测B 开开发,开开发开开发,不开不开发不开不开发,开开发不开不开发,不开不开发A开开发-3,-3-3,-3-3,-3-3,-31,01,01,01,0不开不开发0,10,10,00,00,10,10,00,0图2 A对B的预测BA开发-3,-3-3,-31,056在图1中，存在着两个纳什均衡，即（A开发，B不开发）和（A不开发，B开发），而在B可能选择的战略中：战略1虽然包括了上述后一种纳什均衡，但没有包括前一种纳什均衡；战略4虽然包括了上述前一种纳什均衡，但没有包括后一种纳什均衡；战略2则上述两种纳什均衡都没有包括；只有战略3包括了上述两种均衡。换句话说，如果B选择战略3，那么不论A作出什么选择，B的回应都达到纳什均衡，而在给定B会采取战略3来回应A的选择的前提下，开发是A的最优策略，因而A选择了开发。在图1中，存在着两个纳什均衡，即（A开发，B不开发）和（A57以上的分析方法，称为子博弈精炼纳什均衡。只有当某一战略选择在每一个子博弈（包括原博弈）上都构成一个纳什均衡时，这一战略组合才是子博弈精炼纳什均衡。而前面提到的B的四种战略中，只有战略3在所有子博弈中都构成纳什均衡，所有这一博弈中唯一的子博弈精炼纳什均衡，就是（开发，（不开发，开发），即作为后行动者的B选择战略3，而作为先行动者的A选择开发。以上的分析方法，称为子博弈精炼纳什均衡。只有当某一战略选择58注意n在A选择开发时，无论B选择战略3或战略4，其结果都构成纳什均衡，而子博弈精炼纳什均衡法要剔除的，正是这种在特定情况下是合理的，而在其他情况下不合理的战略组合。注意在A选择开发时，无论B选择战略3或战略4，其结果都59谢谢大家60

展开阅读全文

决策理论-第七章-竞争型决策分析--博弈论ppt课件

最新文档