微观经济学第十章博弈论初步

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第,10,章博弈论初步,10.1,本章框架结构图,博弈论在,20,世纪,50,年代由数学家约翰,冯,诺依曼（,Von Neumann,）和经济学家奥斯卡,摩根斯坦（,Morgenstern,）引入经济学，目前已经成为主流经济分析的主要工具，对寡头理论、信息经济学等经济理论的发展作出了重要贡献。,一、博弈论的几个基本概念,博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学,。在策略性环境中，每一个人进行的决策和采取的行动都会对其他人产生影响。因此，每个人在进行策略性决策和采取策略性行动时，要根据其他人的可能反应来决定自己的决策和行动。,1,博弈参与人,参与人或称局中人，是指博弈中的决策主体，即在博弈中进行决策的个体。参与人既可以是个人，也可以是团体（企业或国家）。每个参与人的目标是通过选择行动使自己的效用最大化。,2,策略,策略是指参与人选择行为的规则，也就是指参与人应该在什么条件下选择什么样的行动，以保证自身利益最大化。,3,支付函数,支付函数也称为效用函数，表明了博弈的参与人采取的每种策略组合的结果或收益，它是所有参与人策略或行动的函数，是每个参与人真正关心的东西。,4,支付矩阵,参与博弈的多个参与人的收益可以用一个矩阵或框图表示，这样的矩阵或框图称之为支付矩阵，也称之为博弈矩阵或收益矩阵。,其中，博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。表,10-1,即为一个支付矩阵。,表,10-1,支付矩阵,二、同时博弈：纯策略均衡,“,同时博弈,”,是参与人同时进行决策或行动的博弈。,在同时博弈中，在给定其他参与人的策略时，某个参与人的最优策略称之为该参与人的条件优势策略（简称条件策略），而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合（简称条件策略组合）。,1,占优策略,在一些特殊的博弈中，一个参与人的最优策略可能并不依赖于其他人的选择。也就是说，,无论其他参与人采取什么策略，该参与人的最优策略是惟一的，这样的策略称之为占优策略。,如表,10-2,所示，通过对支付矩阵的分析可以看出，如果,A,、,B,两厂商都是理性的，则这个博弈的结果是两厂商都做广告，即不管一个厂商如何决定，另外一个厂商都会选择做广告。这种策略均衡称之为占优策略均衡（,equilibrium in dominant strategies,）,。,表,10-2,广告博弈的支付矩阵,2,纳什均衡,并不是每个博弈的各个参与人都有一个占优策略。如表,10-3,所示，通过对支付矩阵的分析可以看出，现在厂商,A,没有占优策略，它的最优决策取决于厂商,B,的选择。如果厂商,B,做广告，则厂商,A,最好也做广告；但如果厂商,B,不做广告，厂商,A,不做广告又是最好的选择。这种均衡就是纳什均衡（,Nash equilibrium,）。所谓,纳什均衡，指的是参与人的这样一种策略组合，在该策略组合上，任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中，当所有其他人都不改变策略时，没有人会改变自己的策略，则该策略组合就是一个纳什均衡。,表,10-3,广告博弈的支付矩阵,3,纳什均衡与占优策略均衡的区别,每一个占优策略均衡一定是纳什均衡，但并非每一个纳什均衡都是占优策略均衡,。纳什均衡是有条件的占优策略均衡。,一个博弈可能存在一个以上的纳什均衡，但是一个博弈也可能不存在纯策略纳什均衡，如表,10-4,所示。,表,10-4,没有纳什均衡的同时博弈,【,例,10.1】,下列说法错误的是（）。,A,占优策略均衡一定是纳什均衡,B,纳什均衡不一定是占优策略均衡,C,占优策略均衡中，每个参与者都是在针对其他参与者的某个特定策略而做出最优反应,D,纳什均衡中，每个参与者都是在针对其他参与者的最优反应策略而做出最优反应,【,答案,】,C,【,解析,】,占优策略均衡中，不论其他参与者采取何种策略，每个参与者都会选择其自身的最优策略。,4,寻找纳什均衡的方法,条件策略下划线法,对于一个简单的,“,二人同时博弈,”,，可以用一个以二元数组为元素的支付矩阵来表示，并用,“,条件策略下划线法,”,来确定它的纳什均衡。具体步骤如下：,（,1,）把整个博弈的支付矩阵分解为两个参与人的支付矩阵。,（,2,）在第一个（即位于整个博弈矩阵左方的）参与人的支付矩阵中，找出每一列的最大者，并在其下画线。,（,3,）在第二个（即位于整个博弈矩阵上方的）参与人的支付矩阵中，找出每一行的最大者，并在其下画线。,（,4,）将已经画好线的两个参与人的支付矩阵再合并起来，得到带有下划线的整个博弈的支付矩阵。,（,5,）在带有下划线的整个的支付矩阵中，找到两个数字之下均画有线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。,表,10-5,寡头博弈：合作与不合作,【,例,10.2】,考虑两寡头厂商,A,和,B,的如下支付矩阵，二者的,（,纳什）均衡策略组合为,（,）。,A,（,U,，,L,）,B,（,D,，,R,）,C,（,U,，,R,）,D,（,D,，,L,）,【,答案,】,B,【,解析,】,在一个纳什均衡里，任何一个参与者都不会改变自己的最优策略如果其他参与者均不改变各自的最优策略，即要求任何一个参与者在其他参与者的最优策略选择给定的条件下，其选择的策略也是最优的。对于本题，当,B,选择,U,时，,A,会选择,R,，因为；当,B,选择,D,时，,A,会选择,R,，因为。当,A,选择,L,时，,B,会选择,U,，因为；当,A,选择,R,时，,B,会选择,D,，因为。因此，依据纳什均衡定义，可知是纳什均衡。,5,囚徒困境,囚徒困境的博弈模型的假设条件是：甲、乙两个被怀疑为合谋偷窃的嫌疑犯被警方抓获，但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁，并单独进行审讯，即双方无法互通信息。警方向这两个嫌疑犯交待的量刑原则是：如果一方坦白，另一方不坦白，则坦白者从宽处理，判刑,1,年；不坦白者从重处理，判刑,7,年。如果两人都坦白，则每人都各判刑,5,年。如果两个都不坦白，则警方由于证据不足，只能对每个人各判刑,2,年。表,10-6,的支付矩阵描述了这一博弈。表中的报酬均为负数，以表示判刑的年数。,表,10-6,囚徒困境,通过分析可以看出，囚徒困境的博弈有一个占优策略均衡（坦白、坦白）。但是，如果两人都是选择不坦白（即合作），则都可以获得最好的结局。很清楚，,囚徒困境的占优策略均衡反映了一个矛盾：即个人理性和团体理性的冲突。,三、同时博弈：混合策略均衡,并不是所有的博弈都存在纳什均衡。比如，如表,10-7,所示。这博弈就不存在纯策略纳什均衡，但却存在混合策略纳什均衡。,混合策略纳什均衡是这样一种均衡，在这种均衡下，给定其他参与人的策略选择概率，每个参与人都为自己确定了选择每一种策略的最优概率。,表,10-7,社会福利博弈,所有参与人的混合策略的组合构成,“,混合策略组合,”,。混合策略组合与参与人的支付的乘积之和为参与人的期望支付。当其他参与人的混合策略确定之后，某个参与人选择的可以使自己的期望支付达到最大的混合策略是该参与人的条件混合策略（其几何表示为,“,条件混合策略曲线,”,）。不同参与人的条件混合策略曲线的,“,交点,”,就是混合策略条件下的纳什均衡。可以证明，混合策略均衡总是存在的。,【,例,10.3】,在一条狭窄巷子里，两个年青人骑着自行车相向而行。每人都有两个策略，即或者选择,“,冲过去,”,或者选择,“,避让,”,。如果选择,“,避让,”,，不管对方采取什么策略，他得到的收益都是,0,。如果其中一个人采取,“,冲过去,”,的策略，如果对方采取,“,避让,”,，那么他得到的收益是,9,；如果对方不避让，那么他得到的收益是,-36,。这个博弈有两个纯策略纳什均衡和（）。,A,一个混合策略纳什均衡，即两人都以,80%,概率选择,“,避让,”,，以,20%,的概率选择,“,冲过去,”,B,两个混合策略纳什均衡，即每个青年人轮流采取避让或者冲过去,C,一个混合策略纳什均衡，即一人以,80,的概率选择,“,避让,”,，另一人以,20,的概率选择,“,冲过去,”,D,一个混合策略纳什均衡，即两人都以,40,的概率选择,“,避让,”,，以,60,的概率选择,“,冲过去,”,【,答案,】,A,【,解析,】,根据题中条件可写出两人的收益矩阵，如表,10-8,所示。,表,10-8,两人的收益矩阵,从收益矩阵可看出，这个博弈有两个纯策略纳什均衡（冲过去，避让），（避让，冲过去）。设甲选择冲过去的概率为，乙选择冲过去的概率为。对于甲来说，应该使冲过去的期望收益等于避让的期望收益，即,，解得；对于乙来说，也应该使其冲过去的期望收益等于避让的期望收益，即，解得。所以，存在一个混合策略纳什均衡。,乙,选择概率,冲过去,避让,甲,冲过去,-36,，,-36,9,，,0,避让,0,，,9,0,，,0,选择概率,四、序贯博弈,“,序贯博弈,”,是参与人的决策和行动有先有后的博弈。描述序贯博弈的更加方便也更加自然的工具是,“,博弈树,”,。博弈树由,“,点,”,（包括,“,起点,”,、,“,中间点,”,、,“,终点,”,）、连接点的,“,线段,”,以及标在这些点和线段旁边的文字和数字组成。,在博弈树中，一个纳什均衡代表一条均衡的路径。在该均衡路径上，没有哪个参与人愿意单独改变自己的策略。,图,10-1,博弈树,在序贯博弈中，可能存在多个纳什均衡的情况。在多个纳什均衡中，有些可能并不合理。所谓对纳什均衡的,“,精炼,”,，就是要从众多的纳什均衡中进一步确定,“,更好,”,的纳什均衡。纳什均衡的精炼方法通常是使用所谓的,“,逆向归纳法,”,，具体包括以下两个步骤：,第一步，先从博弈的最后阶段的每一个决策点开始，确定相应参与人此时所选择的策略，并把参与人所放弃的其他策略删除，从而得到原博弈的一个简化博弈。,第二步，再对简化博弈重复步骤一的程序，直到最后，得到原博弈的一个最简博弈。这个最简博弈，就是原博弈的解；而在存在多重纳什均衡时，它就是对纳什均衡的精炼。,【,例,10.4】,在下面的博弈树中，确定纳什均衡和逆向归纳策略。,答：,纳什均衡是（决策,1,，决策,3,）、逆向归纳策略也是（决策,1,，决策,3,）。分析如下：,（,1,）（决策,1,，决策,3,）是一个纳什均衡。在该策略组合上，没有哪个参与人愿意单独改变自己的策略。首先，参与人,B,不会单独改变自己的策略。如果它单独改变策略，即将原来的决策,3,变为决策,4,，参与人,B,的支付将从原来的,3,下降到,0,。其次，参与人,A,也不会单独改变自己的策略。如果它单独改变策略，即将原来的决策,1,变为决策,2,，则策略组合就成为（决策,2,，决策,3,），参与人,A,的支付将从原来的,1,下降到,0,。,（,2,）采用逆向归纳法，可以判断出逆向归纳策略也是（决策,1,，决策,3,）。首先，如果参与人,A,选择决策,1,，参与人,B,肯定不会选择决策,4,。另一方面，如果参与人,A,选择决策,2,，参与人,B,肯定不会选择决策,4,。在此情况下，考察参与人,A,的选择。由博弈树可以看出，参与人,A,的最优选择是决策,1,。最终结果是，参与人,A,选择决策,1,，参与人,B,选择决策,3,，即最优策略组合为（决策,1,，决策,3,）。,10.3,名校考研真题详解,一、名词解释,1,纳什均衡,（,Nash equilibrium,）,浙江大学,2005,研；厦门大学,2006,、,2008,研；中南财经政法大学,2007,、,2009,研；财政部财政科学研究所,2008,研；西安交通大学,2009,研,答：,纳什均衡（,Nash Equilibrium,）又称为非合作均衡，是博弈论的一个重要术语，以提出者约翰,纳什的名字命名。,纳什均衡是指这样一种策略集，在这一策略集中，每一个博弈者都确信，在给定

展开阅读全文

微观经济学第十章博弈论初步

最新文档