博弈论完全信息静态博弈.ppt

上传人:sh****n 文档编号:2542733 上传时间:2019-11-27 格式:PPT 页数:109 大小:642KB
返回 下载 相关 举报
博弈论完全信息静态博弈.ppt_第1页
第1页 / 共109页
博弈论完全信息静态博弈.ppt_第2页
第2页 / 共109页
博弈论完全信息静态博弈.ppt_第3页
第3页 / 共109页
点击查看更多>>
资源描述
知彼知己,百战不殆,摘自孙子兵法,完全信息静态博弈概念,各参与人对彼此的策略集、支付函数有准确了解 博弈行为同时进行 一些实例 石头、剪子、布游戏 彼此了解的两个厂商的价格战,完全信息静态博弈概念,有些实际博弈 虽然决策不是在绝对时间意义上的“同时” 但决策的时间先后差别跟博弈结果没有关系,也可看成是“同时进行的博弈”。 如不同竞标单位作出的工程投标决策,纳什均衡(Nash Equilibrium),定义。对于一个策略式表述的博弈G= N,Si, ui, iN。称策略组合s*=(s1, si, , sn)是一个纳什均衡,如果对于每一个i N, si*是给定其他参与人选择 s-i*=s1*, ,si-1*, si+1*, ,sn* 情况下参与人i的最优策略(经济理性策略),即: ui(si*, s-i*) ui(si, s-i*), 对于任意的 siSi ,任意的 iN均成立。,一类简单的纳什均衡求解方法划线法 一个抽象例子,见表图1-8,图1-8,纳什均衡(Nash Equilibrium),先考虑A,当B分别采用策略L, C, R时,A的最优策略分别为M, U, D,图1-8,纳什均衡(Nash Equilibrium),同理,当A分别采用U, M, D时,B的最优策略分别为 注意两个元素都标有横杆的格子,对应的策略为纳什均衡(为什么?),图1-8,纳什均衡(Nash Equilibrium),纳什均衡(Nash Equilibrium),纳什均衡、占优均衡、重复剔除严劣策略均衡的关系 定理a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡,但反过来不一定成立; 定理b 纳什均衡一定不能通过重复剔除严劣策略方法剔除。,纳什均衡的一致预测性质 一致预测性:如果所有参与人都预测一个特定的博弈结果会出现,那么所有的参与人都没有偏离这个结果的愿望,这个预测结果最终将成为博弈的结果。 纳什均衡具有一致预测性质。,纳什均衡(Nash Equilibrium),纳什均衡应用举例:古诺模型,这里考虑连续形式的古诺模型 两个企业,分别表示为企业1、企业2 每个企业的策略是选择产量(用qi表示),支付是利润(用i表示),它是两个企业产量的函数,生产成本与产量有关,用Ci(qi)表示,市场出清价格为P=P(q1+q2) 第i个企业的利润函数为: i=qi P(q1+q2) Ci (qi), i=1, 2,(q1*, q2*)是均衡产量意味着: q1*argmax1(q1, q2*) q2*argmax2(q1*, q2) 根据上面两个式子可以得出反应函数(reaction function): q1*=R1(q2) q2*=R2(q1) 两个反应函数的交叉点就是纳什均衡(q1*, q2*),见图1-9,纳什均衡应用举例:古诺模型,q2,q1,图1-9 古诺模型的纳什均衡,NE,纳什均衡应用举例:古诺模型,R2,R1,纳什均衡应用举例:古诺模型,实际验证 假定每个企业具有相同的不变单位成本,即C1(q1)=q1c, C2(q2)=q2c, 价格出清函数取线性形式: P=a-(q1+q2)。根据 q1*argmax1(q1, q2*) = q1P(q1+q2*) C1(q1) q2*argmax2(q1*, q2) = q2P(q1*+q2) C2(q2) 通过求一阶导数,得,于是可得到反应函数为:,纳什均衡应用举例:古诺模型,纳什均衡应用举例:古诺模型,进而可以得出每个企业的纳什均衡产量下的利润,为,可以同垄断企业的最优决策类比,纳什均衡应用举例:古诺模型,垄断条件下的最优产量,可通过计算 Q*argmax=Q*(a-Q*-c) 求出最优的产量值,垄断条件下的最优利润为,最优纳什均衡总产量,最优纳什均衡利润总和,纳什均衡应用举例:古诺模型,古诺模型的启示 寡头竞争的总产量大于垄断竞争产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。这是一个典型的囚徒困境 从另一个层面我们也了解到为什么国外有反垄断法,为什么有AT&T分拆事件。,豪泰林价格竞争模型,古诺模型中,产品是同质的(homogenous); 豪泰林模型中,引入了产品的差异性; 产品的差异性可以有很多体现形式:如品牌、外观、功能、空间差别(如房地产) 豪泰林模型中,产品的差异通过空间差别来体现 豪泰林模型的主要假设是产品的差异完全是由空间位置的不同而造成的,豪泰林价格竞争模型,模型描述 假定有一个长度为1的线性城市,消费者均匀地分布在0,1区间上。假定有两个商店,分别位于城市的两端,商店1在x=0处,商店2在x=1处,出售完全相同的产品 每个商店提供单位产品的成本为c,消费者购买商品的旅行成本与离商店的距离成正比,单位距离的成本为t 假定消费者有单位需求:要么消费1单位,要么消费0个单位(如住房消费)。消费者从消费中得到的消费者剩余为s。,豪泰林价格竞争模型,纳什均衡分析 假定两个商店同时选择自己的销售价格。假定消费者剩余s相对于购买总成本(价格加旅行费用)足够大从而所有消费者都购买一个单位的产品 令pi为商店i的价格,Di ( p1, p2)为需求函数,i=1, 2,豪泰林价格竞争模型,如果住在x的消费者在两个商店之间是无差异的,那么,所有住在x左边的将都在商店1购买,而住在x右边的将在商店2购买,需求比例分别是 D1=x, D2=1-x。 这里的x满足: p1+tx=p2+t(1-x) 解上面两个式子,可得出需求函数为,豪泰林价格竞争模型,利润函数分别为,豪泰林价格竞争模型,通过一阶导数法,可以求出两个企业的最优价格,为,均衡价格下,每个企业的最优利润为,可以进一步设想,若两个商店为了争夺顾客源,可以自由选择商店位置,那么可以计算,纳什均衡位置在0,1区间的中点0.5处,即最终两个商店汇聚一点; 这在一定程度上可以说明,为什么商店通常都聚集在一处的原因。这个现象还有其他原因吗?,豪泰林价格竞争模型,贝特兰德的双头垄断模型,1.3.B 贝特兰德的双头垄断模型 贝特兰德(1883)提出企业在竞争时选择的是产品价格而不象古诺模型中选择产量。,贝特兰德的双头垄断模型,公共地悲剧,问题描述 考虑一个有n个农民的村庄共同拥有一片草地,每个农民都有在草地上放牧的自由。每年春天,每个农民要决定自己养多少只羊。用gi 0,)代表第i个农民饲养的数量,i =1, ,n,G=gi表示n个农民饲养的总数量, v代表每只羊的平均价值。 一个重要的假设是v是G的函数,v=v (G)。因为每只羊至少要一定数量的草才不至于饿死,因此有一个最大的存活量Gmax,即,公共地悲剧,问题描述 当G 0; 当G Gmax时,v(G)=0。 当草地上的羊很少时,增加一只羊也许不会对其他羊的价值有太大的不利影响,但随着饲养量的不断增加,每只羊的价值会急剧下降,因此假定:,可用图1-10描述这个特征,Gmax G,v,图1-10 每只羊的价值随饲养总量的增加而下降曲线,公共地悲剧,均衡分析 在该博弈中,每个农民的问题是选择gi以最大化自己的利润。假定购买一只羊羔的价格为c,那么利润函数为,公共地悲剧,公共地悲剧,最优化一阶条件为,该式表明,对于每个农民来说,增加一只羊有正负两方面效用,将上面n个式子相加,在同时除以n,得,公共地悲剧,整个社会的最优化饲养量,用G*表示,为,一阶最优化条件为,公共地悲剧,比较上面两个式子,可推出GG*.,反证法 假设G G*,那么由于 v 0,因此 v(G) v (G*)。类似的,由于v0, 又可推出 0v(G) v (G*) 。 另外,从G G*还可推出G/n G*,最后要价仲裁,许多公共部门的职工是不允许罢工的,这时有关工资的分歧通过具有约束力的仲裁解决。较为重要的仲裁形式有两类:协议仲裁和最后要价仲裁。在最后要价仲裁中,争议双方各自就工资水平要价,仲裁人选择其中之一作为仲裁结果;在协议仲裁中,仲裁人可自由选定任意工资水平作为仲裁结果。本例根据法伯(1982)的研究,导出在最后要价仲裁模型处于纳什均衡时,博弈双方对工资水平的要价。,最后要价仲裁,最后要价仲裁,最后要价仲裁,博弈论在实际中应用的 一般分析框架,描述实际问题问题 问题本身的描述(文字、图表为主) 用数学模型描述 描述合理 易于处理,博弈论在实际中应用的 一般分析框架,选择合适博弈模型 完全信息静态博弈 完全信息动态博弈 合作博弈 等等,博弈论在实际中应用的 一般分析框架,描述博弈基本要素,如 参与人 参与人策略集 各参与人的效用函数 等等,博弈论在实际中应用的 一般分析框架,博弈的均衡分析 纳什均衡分析(纳什均衡与博弈结果的预测) 一些相关分析(数学的、经济的、业内的) 分析结果的“翻译” 结论,前面介绍的纳什均衡分析方法 对于相当多一类博弈问题无能为力。 如图1-11的猜硬币博弈,不存在已经定义的各种均衡,图1-11 猜硬币博弈,混合策略的提出,混合策略的提出,利用生活经验不难知道,若硬币是均匀的,以0.5的概率去猜测正面无疑是最佳决策 这就引出了用概率来确定采用何种策略的方法,这就是混合策略(mixed strategies)概念的由来 在此之前所说的策略,实质上是以概率1选取某个确定的策略或行动,我们称之为纯策略 (pure strategies),混合策略的提出,混合策略的定义:在博弈G=N, Si, ui, iN中,假设参与人i的纯策略构成的策略集合为Si=si1, sik,若参与人i以概率分布pi=(pi1, pik) 在其k个可选策略中随机选择“策略”,称这样的选择方式为混合策略。这里,0pij 1,对于j=1 , k都成立,且有: pi1+ pik=1 纯策略可看成特殊的混合策略 上述定义是在有限博弈前提下进行的,混合策略意义下的相关表述,混合策略意义下策略组合的表述 x1X1, , xnXn,其中Xi , i =1, , n表示参与人i所有纯策略生成的概率空间,xi为参与人i的一个具体混合策略 猜硬币博弈的一个混合策略就可记为(1/2, 1/2),(1/2, 1/2) 混合策略意义下支付函数如何表述?,预备知识关于风险结果的偏好,基本概念 Lotteries(风险结果). 由机会点和该机会点发出的n个机会枝的概率及相应后果构成的结构称为lottery (抽奖,意译为风险结果)。 一个风险结果可以表示为L = ( p1, a1; pn, an) 若确定性结果 ci 是众所周知的事实,风险结果也可以简记为L= (p1, , pn),预备知识关于风险结果的偏好,若对前面介绍的效用理论进行概括 仅满足序关系的效用为序数效用理论 用支付函数表示的效用关系,采用的是基数效用理论 上述两类关于确定性结果的偏好理论,无法描述决策者对不同风险结果的偏好程度,预备知识关于风险结果的偏好,针对风险结果的偏好,在一些相对合理假设的基础上,可以给出用以描述风险结果的支付函数 用数学形式表述,就是说U是一个支付函数,满足 U (p1,pK) U (p1,pK) 当且仅当(if and only if)某个决策者偏好(p1,pK) 的程度高于(p1,pK),预备知识关于风险结果的偏好,描述关于风险结果的标准方法,是由博弈论的奠基人 von Neumann 和Morgenstern,通过一系列独立性公理 (independence axiom),得出的期望效用函数或期望支付函数。详见文献4: 713 这些独立性公理,保证了通过确定性结果的支付函数u,推出决策者关于风险结果的偏好,可以用期望支付来表示。 理性决策者选择风险结果的依据是期望支付的最大化,预备知识关于风险结果的偏好,简例 对于两个风险结果 (1/2, 0; 0, 1; 1/2, 5)和 (1/2, 0; 3/4, 1; 1/4 , 5) 如果决策者更加偏好前者,则可用v-N-M效用表示上述偏好关系 比如,令u(0)=0, u(1)=1, u(5)=4 很容易验算这样定义的效用,满足风险结果偏好与期望效用的一致性,再谈混合策略,若允许每个参与人选择混合策略,则博弈结果就是一个关于纯策略组合得来一个风险结果 为研究参与人行为,需要知道各参与人对这些风险结果的偏好关系 博弈论假定每个参与人的偏好关系,可用期望支付函数表示。,再谈混合策略,于是可以定义基于混合策略意义下的博弈策略式表述 定义 基于(v-N-M效用的)策略式博弈由 参与人集合 每个参与人有一个(纯)策略集合 对于每一个参与人来说,由所有参与人纯策略组合构成的风险结果空间,存在一个v-N-M效用,混合策略意义下的纳什均衡,定义,对于博弈G= N, Si, ui, iN,基于v-N-M效用的混合策略组合*是一个纳什均衡,若对于每一个i, 以及i的任意一个混合策略i, *对应的期望支付至少和(i, *-i )的期望支付一样大,混合策略意义下的纳什均衡,换句话说,称混合策略组合*是一个纳什均衡,如果没有一个参与人通过偏离策略*i 实现支付的增加 可用数学形式简洁地写出(文科学生请练习),一个定理,对于N-人静态博弈问题,设混合策略纳什均衡对应的策略组合为(Xi , X i ) 。 对于任意的i ,若最优混合策略为Xi= x1,xl,00(不失一般性,假设前l个分量严格大于0),记分量xk (k=1, l) 对应的纯策略sk, 则对于参与人i而言,sk与其他参与人的最优混合策略组合X i 形成的局势的支付值,等于纳什均衡混合策略组合 (Xi, X i )的支付值。即ui (sk, X i ) = ui (Xi, X i )成立 , k=1, l,一个算例,简单博弈,见图1-12 先用划线法确定参与人1、2针对对手各纯策略下的最优纯策略反应。 显然没有纯策略意义下的纳什均衡。,图1-12 二人博弈,是否存在混合策略意义下的纳什均衡?,一个算例,设参与人1分别以pA、pB概率选择纯策略A和B 根据前面介绍的关于混合策略纳什均衡定理 参与人1以混合策略(pA、pB)与参与人2的纯策略C, D进行博弈时,相应支付值相等(为什么?),图1-12 二人博弈,一个算例,于是有,图1-12 二人博弈,又根据,可以求出,一个算例,同理可求出参与人2的最优混合策略,图1-12 二人博弈,在这样的混合策略组合下,参与人1相应的期望支付值为,一对夫妻要决定去看时装表演还是看足球赛。有关纯策略及相应支付情况如图1-13所示。,图1-13 性别战博弈,性别战,性别战,纯策略均衡可通过划线法计算得出,为(时装,时装),(足球,足球),支付值分别为(2,1),(1,3) 该博弈还有一个混合策略均衡,图1-13 性别战,性别战,设pw(C)和pw(F)分别是妻子选择时装表演和足球的概率,ph(C)和ph(F)是丈夫选择时装表演和足球赛的概率。经计算,可得,图1-13 性别战,性别战,当采用上面混合策略时,可以算出丈夫和妻子的收益期望,分别为,图1-13 性别战,可以看出,该结果明显不如夫妻双方能交流协商,性别战变体1:制式问题,电器和电子设备往往有不同的原理或相关技术标准,通常称为制式 图1-4就是一个2厂商的制式博弈模型 该模型存在两个纯策略均衡,以及一个混合策略均衡,图1-14 制式问题,性别战变体1:制式问题,纯策略均衡为 (制式1,制式1)、(制式2、制式2) 混合策略均衡为 (0.4, 0.6), (0.67,0.33) 相应支付值分别为0.664和1.296,图1-14 制式问题,性别战变体2:市场机会博弈,两个厂商同时发现一个市场机会,但这个市场容量并不大。如果只有一个厂商进入该市场,能赚到100个单位的利润,但如果两个厂商同时进入该市场,则他们不仅赚不到钱,而且要各亏损50单位。如果这两个厂商事先没有沟通和协商,就会出现如图1-15的博弈问题。,图1-15 市场机会,性别战变体2:市场机会博弈,本博弈有(进入,不进入)、(不进入,进入)两个纯策略均衡,其中前一个均衡对厂商1有利,第二个均衡对厂商2有利 此外,还有一个混合策略均衡,为 (2/3, 1/3),(2/3, 1/3) 期望支付均为0。,图1-15 市场机会,性别战变体2:市场机会博弈,可以把混合策略(2/3, 1/3),(2/3, 1/3)解释为: 约有2/3比例的厂商选择进入,1/3比例的厂商选择不进入,图1-15 市场机会,22双矩阵博弈的图解法,双矩阵的含义 以性别战为例,介绍22双矩阵博弈模型的图解法 为便于说明,将性别战模型再次复制与此,一对夫妻要决定去看时装表演还是看足球赛。有关纯策略及相应支付情况如图1-16所示 设妻子的混合策略为(r,1-r),丈夫的策略为(q,1-q)。这里的r,q分别表示妻子或丈夫观看时装表演的概率 为便于分析,将混合策略列于右上角,图1-16 性别战,(r,1-r), (q,1-q),22双矩阵博弈的图解法,若丈夫以q的概率选择去看时装表演(以1-q的概率去看足球),则妻子选择时装和观看足球的期望收益分别为,图1-16 性别战,(r,1-r), (q,1-q),22双矩阵博弈的图解法,比较1与2可知 当q1/3时,则选择看时装表演,图1-16 性别战,(r,1-r), (q,1-q),22双矩阵博弈的图解法,上述情况反映了妻子针对丈夫不同策略下的最佳反应,称为(妻子的)反应函数.,r,q,0 1/3 1 图1-17 妻子的反应函数,1,r=R1(q),可用图1-17表示妻子的反应函数,22双矩阵博弈的图解法,同理,可绘出丈夫的反应函数,见图1-18,r,q,0 1/3 1 图1-18 丈夫的反应函数,1,q=R2(r),3/4,22双矩阵博弈的图解法,r,q,0 1/3 1 图1-17 妻子的反应函数,1,r,q,0 1/3 1 图1-18 丈夫的反应函数,1,r=R1(q),q=R2(r),3/4,22双矩阵博弈的图解法,将这两张图合并,得到图1-19,r,q,0 1/3 1 图1-19 性别战的图解法,1,q,r=R1(q),q=R2(r),3/4,按照纳什均衡的定义,图上的三个交点既是参与人1的最优反应函数上的点,同时也是参与人2最优反应函数上的点,22双矩阵博弈的图解法,r,q,0 1/3 1 图1-19 性别战的图解法,1,q,r=R1(q),q=R2(r),3/4,这三个点的坐标为(0, 0), (1/3, 3/4),(1, 1)。对应的三个策略分别是:(足球,足球);妻子、丈夫分别以1/3、3/4的概率选择时装;(时装,时装)。,22双矩阵博弈的图解法,纳什于1950年提出并证明了纳什定理 纳什定理的主要内容为:在一个有n个参与人的策略式博弈G=S1,Sn; u1,un中,如果n是有限的,且Si是有限集(i=1,n),则该博弈至少存在一个纳什均衡(在混合策略意义下),纳什定理,纳什定理的一些说明,纳什定理的证明要用到不动点定理。 所谓不动点定理,是指 一个定义在X X上的函数f(x), 集合X是非空的、闭的、有界的和凸的 函数f是连续的 则至少存在一个x,使得f(x)=x, x 被称为不动点,纳什定理的一些说明,不动点的图形解释见下图,纳什定理的一些说明,如果映射是不连续的,不动点就不一定存在,纳什定理的一些说明,映射选择的是n人最优反应对应 其含义是,对于任意一个混合策略组合(p1,pn),对于每一个参与人i,求出I针对其他参与人混合策略(p1,pi-1, pi+1,pn)的最优反应,然后构建n个参与人最优反应对应的笛卡尔积。 一个最优混合策略组合就是这一对应集的不动点。,纳什定理的一些说明,因此只要证明前面的最优反应对应满足不动点定理条件就可以了。,多重纳什均衡解及其分析,纳什定理说明了纳什均衡在相当广泛的博弈模型中普遍存在 但是纳什均衡只是理论模型的导出结果,其适用性存在一定局限 纳什均衡的理论基础:如经济理性、决策准则一致性、共同知识等并不能涵盖现实行为(互惠性、利他性、不理性等),多重纳什均衡解及其分析,帕雷托占优均衡 帕雷托占优均衡的含义是:在多个纳什均衡中,若存在一个纳什均衡,其支付结果针对每个参与人而言都严格优于其它纳什均衡,则该纳什均衡是帕雷托占优纳什均衡。,一个战争与和平的博弈简例,见图1-20。 该博弈有两个纯策略均衡(战争,战争),(和平,和平)。(和平,和平)在帕雷托占优意义上是较好的一个均衡策略。,图1-20 帕雷托占优均衡,多重纳什均衡解及其分析,风险占优均衡(risk-dominant equilibrium) 以图1-21为例 该博弈有两个纯策略均衡(U,L)和(D,R)。显然,在帕雷托占优意义下,(U,L)要优于( D,R)。,图1-21 风险占优均衡,多重纳什均衡解及其分析,但进一步分析不难发现,若参与人1选择策略U,万一参与人2选择策略R,参与人2损失只有1单位,但对于参与人1来说只能得到支付0。也就是说,策略U对于参与人1来说是风险较大的策略。,图1-21 风险占优均衡,多重纳什均衡解及其分析,而另一个纯策略组合(D,R)则是风险占优的 许多博弈实验研究表明,实际中,人们更愿意选择风险占优均衡,图1-21 风险占优均衡,多重纳什均衡解及其分析,多重纳什均衡解及其分析,一个经典博弈问题:Stag Hunt 两个人同时发现1头鹿和2只兔子,如果两人合力抓鹿,则可以把这头价值10单位的鹿抓住,兔子则跑掉;如果两个人都去抓兔子,则各可以抓到1只价值3单位的兔子,鹿就会跑掉;但如果一个人选择了抓兔子而另一个人选择了抓鹿,那么选择抓兔子的能抓到1只兔子,选择抓鹿的人则一无所获。 由于两人来不及商量,决策必须瞬间作出,上述问题可表示为双矩阵形式,见图1-22 该博弈也存在两个纯策略纳什均衡,分别为(鹿,鹿)、(兔子,兔子) 其中风险占优的均衡为(兔子,兔子),均衡收益分别为(3, 3),图1-22 猎鹿博弈,多重纳什均衡解及其分析,多重纳什均衡解及其分析,风险占优均衡的进一步说明。 参与人对风险占优均衡的选择倾向,有一种强化的机制。当部分或所有参与人选择风险占优均衡的可能性增强的时候,任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小,而这又使得帕雷托占优均衡策略的支付更小,从而形成一种选择风险占优均衡策略的正反馈机制,并使其出现的概率越来越大。,多重纳什均衡解及其分析,当参与人数目增加时,选择合作的风险将会更大,可借助该点考虑招标机制如何减少投标方勾结问题 上述问题是我们知道建立诚信机制社会的重要意义 上述问题引出一个博弈相关分支为协调博弈(coordination game),多重纳什均衡解及其分析,聚点均衡 由实际问题抽象出来的博弈模型中,更多的一类问题是:多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系,如夫妻爱好问题的两个纯策略均衡。这时如何预测哪一个纳什均衡会出现是一个很有意义的问题 以夫妻爱好博弈为例,在实际中往往二人很默契地知道如何进行博弈,双方往往知道怎么进行选择策略,且能够相互了解(这里面排除了互相协商后达成的一致),实际博弈中参与人往往会利用博弈模型以外的信息,实现对特定博弈均衡一致关注的“聚点” 这些信息如:参与人共同的文化背景或规范,共同的知识,具有特定意义事物的特征,某些特殊的数量、位置关系等,多重纳什均衡解及其分析,一些 可能的“聚点”,如中午与12:00的聚点;夫妻爱好博弈中“(服装,服装)”与“今天是妻子生日”的聚点;参与人中地位不一致造成的均衡向有地位方倾斜的“聚点”,等等 聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性,但因为涉及因素太多,对于一般博弈模型很难总结普遍规律,只能具体问题具体分析,多重纳什均衡解及其分析,多重纳什均衡解及其分析,相关均衡(correlated equilibrium) 实际上,在现实中遇到选择困难时,特别是在长期中反复遇到相似选择难题时,常会通过收集更多信息,形成特定的机制和规则,为某种形式的制度安排等主动寻找思路。 相关均衡就是这样的一种均衡选择机制。,多重纳什均衡解及其分析,图1-23的一个博弈 该博弈有两个纯策略均衡,为(U,L)和(D,R),以及一个混合策略均衡(1/2,1/2),(1/2,1/2) 两个纯策略均衡能使双方得到6单位支付,但支付水平相差较大,图1-23 相关均衡,多重纳什均衡解及其分析,若采用混合策略均衡(1/2,1/2),(1/2,1/2),则有1/4概率遇到最不希望的结局(U,R),同时双方期望支付为2.5,也不理想,图1-23 相关均衡,多重纳什均衡解及其分析,若建立这样的机制: 抛一枚硬币,若正面朝上参与人1采用U,参与人2采用L;出现反面参与人1采用D,参与人2采用R的规则,这样的规则 排除了最不利的(U,R)组合 期望收益都等于3,处于相对公平状态,图1-23 相关均衡,多重纳什均衡解及其分析,进一步发展上述思路,还可以建立一个更好的博弈机制,这就是相关均衡理论 对于实际中比较复杂的博弈问题,参与人是否有能力设计这种机制,并且有足够能力理解、信任这种机制,是有一定疑问的。 相关均衡作为社会经济制度创新的一种解释也许更有意义。,多重纳什均衡解及其分析,防共谋均衡(coalition-proof equilibrium) 在有多个参与人的博弈中,若部分参与人通过某种形式的默契或串通形成小团体,可能得到比不串通个大的支付。这就是多人博弈的共谋问题。 防共谋均衡是指这样的一个纳什均衡,在该均衡局势下,少数参与人集合不能通过均衡策略的偏离,实现更好的局部利益。,多重纳什均衡解及其分析,在图1-24所示的博弈中,参与人1选择行策略U,D,参与人2选择列策略L,R,参与人3选择矩阵A,B。 通过划线法,不难发现,该博弈有两个纯策略纳什均衡(U,L,A)和(D,R,B)。且前者无论是帕雷托意义下还是风险占优意义下,均优于后者。,图1-24 多人博弈中的共谋问题,参与人3A,参与人3B,多重纳什均衡解及其分析,因此,若不考虑部分参与人存在串通的可能性,那么该博弈的结果应该是(U,L,A)。 但是,若考虑参与人之间存在串通的可能,那么(U,L,A)很难成为博弈的最终结果。因为,图1-24 多人博弈中的共谋问题,参与人3A,参与人3B,多重纳什均衡解及其分析,若参与人3选择A,只要参与人1和2达成一致行动的默契,分别采用D和R,他们就可以获得1单位的支付,大于(U,L,A)时得到的0支付。 一旦参与人3认为参与人1和2存在勾结,则参与人3将选择策略B。而参与人1、2一旦认识到参与人3可能选择B,则他们会选择策略组合(D,R)。,图1-24 多人博弈中的共谋问题,参与人3A,参与人3B,多重纳什均衡解及其分析,因此,从防共谋角度考虑,策略(D, R, B)还是重要的可取方案之一,是一个防共谋均衡,图1-24 多人博弈中的共谋问题,参与人3A,参与人3B,多重纳什均衡解及其分析,防共谋均衡是两个以上参与人参加的博弈中,参与人在帕雷托占优均衡中进行合作思想的扩展。,多重纳什均衡解及其分析,定义:如果一个博弈的某个策略组合满足 没有任何单个参与人的“串通”会改变博弈的结果,即单独改变策略无利可图(该策略组合是纳什均衡)。 给定选择偏离的参与人有再次偏离的自由时,没有任何两个参与人通过“串通”改变博弈的结果。 依此类推,直到所有参与人都参加的串通也不会改变博弈的结果。 满足上述要求的均衡策略组合称为“防共谋均衡”,本章结束,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!