资源描述
,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,Click to edit Master title style,高等院校经济学专业“十二五规划教材,西方经济学,微观局部,主编 张玉明 聂艳华,对外经济贸易大学出版社,第八章,博弈论初步,8.1本章框架结构图,博弈论在20世纪50年代由数学家约翰冯诺依曼Von Neumann和经济学家奥斯卡摩根斯坦Morgenstern引入经济学,目前已经成为主流经济分析的主要工具,对寡头理论、信息经济学等经济理论的开展作出了重要奉献。,【,学习目的】,1掌握博弈的根本含义及其分类。,2.掌握囚徒的困境博弈的意义。,3.掌握严格下策反复消去法的分析思路;掌握纳什均衡的定义及其无限策略博弈和混合策略博弈中纳什均衡的解。,4.了解重复博弈中有限次重复博弈与无限次重复博弈概念及意义。,【,主要内容,】,第一节,博弈论概述,第二节,囚徒的困境,第三节,纳什均衡,第四节,重复博弈,博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反响来决定自己的决策和行动。,1博弈参与人,参与人或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。参与人既可以是个人,也可以是团体企业或国家。每个参与人的目标是通过选择行动使自己的效用最大化。,2策略,策略是指参与人选择行为的规那么,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。,一、博弈论的几个根本概念,第一节,博弈论概述,3支付函数,支付函数也称为效用函数,说明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。,4支付矩阵,参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。,其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个根本要素。表10-1即为一个支付矩阵。,表8-1支付矩阵,第一节,博弈论概述,二、同时博弈:纯策略均衡,“同时博弈是参与人同时进行决策或行动的博弈。在同时博弈中,在给定其他参与人的策略时,某个参与人的最优策略称之为该参与人的条件优势策略简称条件策略,而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合简称条件策略组合。,1占优策略,在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。也就是说,无论其他参与人采取什么策略,该参与人的最优策略是惟一的,这样的策略称之为占优策略。如表10-2所示,通过对支付矩阵的分析可以看出,如果A、B两厂商都是理性的,那么这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都会选择做广告。这种策略均衡称之为占优策略均衡equilibrium in dominant strategies。,表8-2广告博弈的支付矩阵,第二节纳什均衡,并不是每个博弈的各个参与人都有一个占优策略。如表10-3所示,通过对支付矩阵的分析可以看出,现在厂商A没有占优策略,它的最优决策取决于厂商B的选择。如果厂商B做广告,那么厂商A最好也做广告;但如果厂商B不做广告,厂商A不做广告又是最好的选择。这种均衡就是纳什均衡Nash equilibrium。所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中,当所有其他人都不改变策略时,没有人会改变自己的策略,那么该策略组合就是一个纳什均衡。,表8-3广告博弈的支付矩阵,3,纳什均衡与占优策略均衡的区别,每一个占优策略均衡一定是纳什均衡,但并非每一个纳什均衡都是占优策略均衡,。纳什均衡是有条件的占优策略均衡。,一个博弈可能存在一个以上的纳什均衡,但是一个博弈也可能不存在纯策略纳什均衡,如表,8-4,所示。,表,8-4,没有纳什均衡的同时博弈,例题,1,【例8.1】以下说法错误的选项是。,A占优策略均衡一定是纳什均衡,B纳什均衡不一定是占优策略均衡,C占优策略均衡中,每个参与者都是在针对其他参与者的某个特定策略而做出最优反响,D纳什均衡中,每个参与者都是在针对其他参与者的最优反响策略而做出最优反响,【答案】C,【解析】占优策略均衡中,不管其他参与者采取何种策略,每个参与者都会选择其自身的最优策略。,4,寻找纳什均衡的方法,条件策略下划线法,对于一个简单的“二人同时博弈,可以用一个以二元数组为元素的支付矩阵来表示,并用“条件策略下划线法来确定它的纳什均衡。具体步骤如下:,1把整个博弈的支付矩阵分解为两个参与人的支付矩阵。,2在第一个即位于整个博弈矩阵左方的参与人的支付矩阵中,找出每一列的最大者,并在其下画线。,3在第二个即位于整个博弈矩阵上方的参与人的支付矩阵中,找出每一行的最大者,并在其下画线。,4将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵。,5在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。,例题,2,【例8.2】考虑两寡头厂商A和B的如下支付矩阵,二者的纳什均衡策略组合为。,AU,LBD,R,CU,RDD,L,【答案】B,【解析】在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略如果其他参与者均不改变各自的最优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于此题,当B选择U时,A会选择R,因为 ;当B选择D时,A会选择R,因为 。当A选择L时,B会选择U,因为 ;当A选择R时,B会选择D,因为 。因此,依据纳什均衡定义,可知 是纳什均衡。,第三节囚徒困境,囚徒困境的博弈模型的假设条件是:甲、乙两个被疑心为合谋偷窃的嫌疑犯被警方抓获,但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁,并单独进行审讯,即双方无法互通信息。警方向这两个嫌疑犯交待的量刑原那么是:如果一方坦白,另一方不坦白,那么坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两人都坦白,那么每人都各判刑5年。如果两个都不坦白,那么警方由于证据缺乏,只能对每个人各判刑2年。表8-6的支付矩阵描述了这一博弈。表中的报酬均为负数,以表示判刑的年数。,表,8-6,囚徒困境,通过分析可以看出,囚徒困境的博弈有一个占优策略均衡坦白、坦白。但是,如果两人都是选择不坦白即合作,那么都可以获得最好的结局。很清楚,囚徒困境的占优策略均衡反映了一个矛盾:即个人理性和团体理性的冲突。,第三节囚徒困境,同时博弈:混合策略均衡,并不是所有的博弈都存在纳什均衡。比方,如表8-7所示。这博弈就不存在纯策略纳什均衡,但却存在混合策略纳什均衡。混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。,表,8-7,社会福利博弈,同时博弈:混合策略均衡,所有参与人的混合策略的组合构成“混合策略组合。混合策略组合与参与人的支付的乘积之和为参与人的期望支付。当其他参与人的混合策略确定之后,某个参与人选择的可以使自己的期望支付到达最大的混合策略是该参与人的条件混合策略其几何表示为“条件混合策略曲线。不同参与人的条件混合策略曲线的“交点就是混合策略条件下的纳什均衡。可以证明,混合策略均衡总是存在的。,【例8.3】在一条狭窄巷子里,两个年青人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去或者选择“避让。如果选择“避让,不管对方采取什么策略,他得到的收益都是0。如果其中一个人采取“冲过去的策略,如果对方采取“避让,那么他得到的收益是9;如果对方不避让,那么他得到的收益是-36。这个博弈有两个纯策略纳什均衡和。,A一个混合策略纳什均衡,即两人都以80%概率选择“避让,以20%的概率选择“冲过去,B两个混合策略纳什均衡,即每个青年人轮流采取避让或者冲过去,C一个混合策略纳什均衡,即一人以80的概率选择“避让,另一人以20的概率选择“冲过去,D一个混合策略纳什均衡,即两人都以40的概率选择“避让,以60的概率选择“冲过去,例子,3,例题,3,【答案】A,【解析】根据题中条件可写出两人的收益矩阵,如表8-8所示。,表8-8两人的收益矩阵,从收益矩阵可看出,这个博弈有两个纯策略纳什均衡冲过去,避让,避让,冲过去。设甲选择冲过去的概率为r,乙选择冲过去的概率为c。对于甲来说,应该使冲过去的期望收益等于避让的期望收益,即,,解得r=0.2;对于乙来说,也应该使其冲过去的期望收益等于避让的期望收益,即 ,解得c=0.2。所以,存在一个混合策略纳什均衡。,乙,选择概率,冲过去,避让,甲,冲过去,-36,,,-36,9,,,0,避让,0,,,9,0,,,0,选择概率,第四节序贯博弈,“序贯博弈是参与人的决策和行动有先有后的博弈。描述序贯博弈的更加方便也更加自然的工具是“博弈树。博弈树由“点包括“起点、“中间点、“终点、连接点的“线段以及标在这些点和线段旁边的文字和数字组成。在博弈树中,一个纳什均衡代表一条均衡的路径。在该均衡路径上,没有哪个参与人愿意单独改变自己的策略。,图,8-1,博弈树,在序贯博弈中,可能存在多个纳什均衡的情况。在多个纳什均衡中,有些可能并不合理。所谓对纳什均衡的“精炼,就是要从众多的纳什均衡中进一步确定“更好的纳什均衡。纳什均衡的精炼方法通常是使用所谓的“逆向归纳法,具体包括以下两个步骤:,第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈。,第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解;而在存在多重纳什均衡时,它就是对纳什均衡的精炼。,第四节序贯博弈,例题,4,【,例,8.4】,在下面的博弈树中,确定纳什均衡和逆向归纳策略。,例题,4,答:纳什均衡是决策1,决策3、逆向归纳策略也是决策1,决策3。分析如下:,1决策1,决策3是一个纳什均衡。在该策略组合上,没有哪个参与人愿意单独改变自己的策略。首先,参与人B不会单独改变自己的策略。如果它单独改变策略,即将原来的决策3变为决策4,参与人B的支付将从原来的3下降到0。其次,参与人A也不会单独改变自己的策略。如果它单独改变策略,即将原来的决策1变为决策2,那么策略组合就成为决策2,决策3,参与人A的支付将从原来的1下降到0。,2采用逆向归纳法,可以判断出逆向归纳策略也是决策1,决策3。首先,如果参与人A选择决策1,参与人B肯定不会选择决策4。另一方面,如果参与人A选择决策2,参与人B肯定不会选择决策4。在此情况下,考察参与人A的选择。由博弈树可以看出,参与人A的最优选择是决策1。最终结果是,参与人A选择决策1,参与人B选择决策3,即最优策略组合为决策1,决策3。,一、名词解释,1纳什均衡Nash equilibrium浙江大学2005研;厦门大学2006、2021研;中南财经政法大学2007、2021研;财政部财政科学研究所2021研;西安交通大学2021研,答:纳什均衡Nash Equilibrium又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰纳什的名字命名。,纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。,与其相联系的一个概念是占优策略均衡。占优策略均衡指这样一种均衡,不管其对手采取什么策略,该竞争者采取的策略都是最优策略。纳什均衡指每一
展开阅读全文