chapter 4不完全信息动态博弈2

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,不完全信息动态博弈,1,不完全信息动态博弈,4.1 精炼贝叶斯纳什均衡,4.2 信号传递博弈及其应用举例,4.3 精炼贝叶斯均衡的再精炼,4.4 不完信息重复博弈与声誉模型,4.5 博弈论均衡概念简要总结,2,4.1.1不完全信息动态博弈简述,自然首先选择参与人的类型，然后参与人开始行动。参与人行动有先后，后行动者通过观测到先行动者的行动，修正对其类型的先验概率，选择自己的最优行动。,博弈过程是参与人选择行动和参与人不断修正信念的过程。,精炼贝叶斯均衡是不完全信息的基本概念，是完全信息动态博弈子博弈精炼纳什均衡和不完全信息静态博弈贝叶斯均衡的结合。,3,4.1.1市场进入阻挠,假定有两个时期，t=1，2.,假定在位者有两个可能的类型：低成本和高成本。概率分别为u和1-u。,t=1时期，在位者可选的价格4，5，6。,高成本和低成本在位者的单阶段最优垄断价格分别为p=6和p=5。,进入成本为2；进入后进行库诺特博弈（对称和非对称）。,目标：在位者高成本，则进入；否则，不进入。,4,4.1.1市场进入博弈,5,4.1.1市场进入阻挠,当且仅当进入者认为在位者是高成本的概率大于1/2时，选择进入。,第二阶段与不完全信息静态博弈不同：进入者会修正在位者成本函数的先验概率u；在位者会考虑价格的信息效应。,若，贝叶斯均衡：进入者选择不进入；高成本在位者选择p=6，低成本在位者选择p=5.,子博弈精炼纳什均衡无法直接用:不完全信息只有一个子博弈，所有均衡都是子博弈均衡。,6,4.1.1精炼贝叶斯均衡,精炼贝叶斯均衡(perfect liayesian equilibrium)是贝叶斯均衡、子博弈精炼均衡和贝叶斯推断的结合。它要求:(1)在每个信息集上，决策者必须有个定义在属于该信息集的所有决策结上的个概率分布(信念);（2）给定该信念集上的概率分布和其他参与人的后续战略，参与人的行动必须是最优的;(3)每一个参与人根据贝叶斯法则和均衡战略修正后验概率。,7,4.1.2贝叶斯法则,统计学上，修正之前的判断称为“先验概率”，修正之后的概率称为“后验概率”。,贝叶斯法则是人们跟据新信息从先验概率得到后验概率的基本方法,8,4.1.2贝叶斯法则,我们假定参与人的类型是独立分布的。假定参与人i有K个可能的类型，有H个可能的行动。我们用和代表一个特定的类型和一个特定的行动(因为我们现在只考虑一个参与人，我们省略了下标i)。那么，i选的边缘率是:,9,4.1.2贝叶斯法则,在均衡路径上，，但是，在非均衡路径上，，贝叶斯公式的分母为零因而贝叶斯公式在非均衡路径上给出的条件概率是型的数，是不确定的。所以，在非均衡路径，信念形成不受贝叶斯法则的制约，但也不是任意的，因为对于精炼贝叶斯均衡来说，非均衡路径上的信念与均衡路径上按贝叶斯法则决定的信念一起共同决定局中人在每一个信息集上的行动选择所构成的战略组合是精炼贝叶斯均衡。正是在均衡路径上我们按贝叶斯法则决定信念，所以称这种精炼均衡概念为贝叶斯纳什均衡。,10,4.1.2贝叶斯法则举例,把所有人划分为好人GP和坏人BP两类，所有的事划分为好事GT和坏事BT两种。,一个人干好事概率为,ProbGT=p(GT|GP)p(GP)+p(GT|BP)p(BP),如果一个人干了好事，那么这个人是好人的后验概率为：,ProbGP|GT=p(GT|GP)p(GP)/Prob(GT),11,4.1.2贝叶斯法则举例,我们认为好人的先验概率为1/2.,第一种情况，这是一件非常好的事，好人一定干，坏人一定不干，则有：,ProbGP|GT=(1*1/2)/(1*1/2+0*1/2)=1,第二种情况，这是非常一般的好事，好人会干，坏人也一定会干，则有：,ProbGP|GT=(1*1/2)/(1*1/2+1*1/2)=1/2,第三种情况，介于上述两者之间，好人肯定会干，但坏人干的概率为1/2，则有：,ProbGP|GT=(1*1/2)/(1*1/2+1/2*1/2)=2/3,12,4.1.2贝叶斯法则举例,如果我们观测到这个人干了一件坏事，我们相信，好人不会干坏事，只有坏人会干，则有,ProbGP|BT=(0*1/2)/(0*1/2+p*1/2)=0,或者,ProbBP|BT=(p*1/2)/(0*1/2+p*1/2)=1,13,4.1.3精炼贝叶斯均衡,定义:精炼贝叶斯均衡是一个战略组合，是一个,一个后验概率组合,满足:,(P)对于所有的参与人i,在每一个信息集h，,（B）是使用叶斯法则从先验概率得到,14,4.1.3精炼贝叶斯均衡,(p)是精炼条件：给定参与人的战略和参与人i的后验概率每个参与人i的战略在所有从信息集h开始的后续博弈上是最优的。是精炼纳什均衡的扩展，要求在后续博弈上够成贝叶斯均衡。,（B）是对应贝叶斯法则的运用。“可能的情况下”指贝叶斯法则对非均衡路径上行动a所对应的类型的后验概率没有定义。,精炼贝叶斯均衡是均衡战略和均衡信念的结合。是一个对应的不动点,后验概率依赖于战略，战略依赖于后验概率。不能用逆向归纳法,15,4.1.3市场进入博弈,16,4.1.3市场进入博弈,我们首先证明，不论先验概率声是多少，在第一阶段，高成本在位者选择单阶段最优垄断价格p=6和低成本在位者选择.单阶段最优垄断价格p=5不是一个精炼贝叶斯均衡。,17,4.1.3混同均衡,1首先考虑u1/2的情况。我们将证明，在这种情况下，精炼贝叶斯均衡是:不论高成本还是低成本，在位者选择p =5;进入者将进入.当只当她观测到p=6(基于 ),2 给定两类在位者都选择p=5，进入者不能从观测到的价格巾得到任何新的信息，即u(5)=(1Xu)/(1Xu+1 X(1-u)=u1/2,进入的期姐利润是u(1)+(1-u)(-1)=2u-1=1/2精炼贝叶斯均衡是:低成本的在位者选择p=4,高成本的在位者选择p=6;进入者选择不进入，如果观测到p=4; 选择进人，如果观测到p=4或p=5。,所有声u(5)=1/2与均衡是相容的，而所有不(u(5)=1/2不构成均衡因此，所假定的战略和后验概率是一个精炼贝叶斯均衡。,19,4.1.4不完美信息博弈的精炼贝叶斯均衡,在这个博弈中，有两个参与人，i=1,2。参与人1首先行动.选择L ，M或R如果他选择L,博弈结束，支付向量为(1,3);如果他选择M或R，参与人2选择U或B，但参与人2在作出自己的决策时并不知道参与人1是选择了M还是R,尽管他知道L没有被选择。,这个博弈有两个纯战胜各纳什均衡:（L， B)和（M，U）,20,4.1.4不完美信息博弈的精炼贝叶斯均衡,21,4.1.4不完美信息博弈的精炼贝叶斯均衡,子博弈精炼均衡不能剔除（L,B).,参与人1选择M和R的概率分别p和1-p。,参与人2选择U的期望效用为：,p1+(1-p) X2 =2-p,参与人2选择B的期望效用为：,p0+(I一p) 1=1-p,精炼贝叶斯均衡为M,U;p=1。,22,4.1.4精炼贝叶斯均衡例2,考虑图4. 3,这里，有3个参与人，i=1,2,3。参与人1先行动，可以选择L或R如果他选择R ,参与人2可以选择U或B如果参与人2选择B.博弈结束;如果参与人2选择U,或参与人1选择1L(此时参与人2无选择)，参与人3可以选择A或D，博弈结束。注意，当博弈进入参与人3的信息集时，参与人3不知道是参与人1选择了L还是参与人1选择了R、参与人2选择了U;因此，参与人3的信息集包含两个决策结。,23,4.1.4精炼贝叶斯均衡例2,24,4.1.4精炼贝叶斯均衡例2,两个纳什均衡（L，B，A）和（R，B,D),精炼贝叶斯均衡为（R，B，D；p2/5),25,4.2信号传递博弈,信号传递博弈是一种比较简单但有广泛应用意义的不完全信息动态博弈,在这个博弈中，有两个参与人，i=1,2；参与人1称为信号发送者，参与人2称为信号接收者(因为他接收估号);参与人1的类型是私人信息，参与人2的类型是公共信息(即只台一个类型)。博弈的顺序如下:,1“自然“首先选择参与人1的类型,，参与人1知道,但参与人2不知道，只1属于,的先验,概率。,26,4.2信号传递博弈,参与人1在观测到类型,后选择发出信号m。,参与人2观测到参与人1发出的信号m，使用贝叶斯法则计算后验概率，然后选择行动,支付函数分别为u,1,(m,a，,)和u,2,（m，a，,）,27,4.2信号传递博弈,28,4.2信号传递博弈的精炼贝叶斯均衡,定义:信号传递博弈的精炼贝叶斯均衡是战略组合（m,*,(,), a*(m)和后验概率p（ |m）的结合，它满足：,1,2,是使用贝叶斯法则得到,29,4.2信号博弈的分离均衡,分离均衡(separating equilibrium):不同类型的发送者(参与人1)以1的概率选择不同的信号，或者说，没有任何类型选择与其他类型相同的信号。在分离均衡下，信号准确地揭示出类型。,30,4.2信号博弈的混同均衡,混同均衡(pooling equilihrium):不同类型的发送者(参与人1)选择相同的信号，或者说，没有任何类型选择与其他类型不同的信号，因此，接收者(参与人2不修正先验概率(参与人1的选择没有信息量)。,31,4.2信号博弈的准分离均衡,准分离均衡(semi-separlling equilibrium):一些类型的发送者（参与人1）随机地选择信号.另一些类型的发送者选择特定的信号。,32,4.2.1米尔格罗姆-罗伯茨垄断限价模型,假定有两个阶段，两个企业。在第一阶段，企业1(在位者)是一个垄断生产者，选择价格p,1,;在第二阶段，企业2(进入者)决定是否进入，如果企业2进入，市场双寡头竞争;否则，企业1继续保持垄断地位。企业1有两个潜在类型:高成本或低成本;高成本(H)的概率为u(H),低成本(L)的概率为1-u(H)。,33,4.2.1米尔格罗姆-罗伯茨垄断限价模型,在第一阶段，企业1知道自己的类型a，企业2不知道a。为了简单起见，让我们假定。在第二阶段，企业2一旦进入，就得知a，因此第二阶段的寡头价格独立于第一阶段的价格p,1,34,4.2.1垄断限价模型的分离均衡,两个必要条件，即类型H的在位者不愿选择类型L的均衡价格，类型L在位者也不愿选择类型H的均衡价格。然后，我们描述进入者非均衡路径上的后验概率使得投有任何类型的在位者有兴趣偏离均衡价格。我们将看到，分离均衡的必要条件同时也是充足条件:必要条件决定的价格即是均衡价格(这里讲的均衡价格是指精炼贝叶斯均衡的均衡价格，而不是使供求相等的均衡价格;浅们假定，所有的可行的价格都是使供求相等的价格)。,35,4.2.1垄断限价模型的分离均衡,高成本在位者不会选择低成本在位者的均衡价格,低成本在位者的均衡价格为应满足：,36,4.2.1垄断限价模型的分离均衡,为了使分析有意义，我们假定不存在对分离均衡，即:如果 ,高成本的在位者也将选择对:,37,4.2.1垄断限价模型,38,4.2.1垄断限价模型的混同均衡,混同均衡存在的条件是,即如果进入者得不到新的信思，就选择不进入(因为期望利润小于0。如果L述条件不成立，在混同均衡下.进入者会选择进入(因为期望利润大于0);因为混同均衡不能阻止进入，在位者的最优选择是短期垄断价格,39,4.2.2用负债比例显示企业质量,在罗斯模型中.企业经理知道企业利润的真实分布函数，投资者不知道;企业利润分布函数是根据一阶随机占优,假定有两个时期，两个参与人(经理和投资者).令二为企业第二时期的利润，二在区间0,a上均匀分布;经理知道a.但投资者只知道a的概率分布(因此a是企业的类型)。在时期1，经理首先选择负债水平。.投资者然后根据观测到的负债水平D决定企业的市场价值v,0,;在时期2，企业利润实现。(从博弈i仑的角度看，第一时期包含两个博弈阶段;第二时期对我们的分析n.不重要的。,40,4.3精炼贝叶斯均衡再精炼,解决的问题,如何规定非均衡路径上的后验概率？,精炼贝叶斯均衡的精炼条件剔除了不可置信战略，但没有剔除不可置信信念（后验概率）。,后验概率的任意性导致了均衡结果的任意性。,41,4.3.1剔除劣战略,它的基本思想是，在一个博弈中，如果对f某些类型的参与人，存在某些行动或战略劣于另一些行动或战略，而对于另一些类型的参与人这点不成立，那么，当其他参与人观测到前一类行动时，他不应该以任何正的概率认为选择该行动的参与人属于前1类参与人。对非均衡路径后验概率的这个简单限制可以大大减少精炼贝叶一斯均衡的数量,42,4.3.1剔除劣战略,43,4.3.1剔除劣战略,两个纯战略精炼贝叶斯均衡：（M,U;u=1)和（L，B；u=8p-16, 则有p=2/9,58,4.4.1KMRW声誉模型,59,4.4.1KMRW声誉模型,给定囚徒2在第阶段选择D.如果理性囚徒1选择D.因徒2的后验概率不变，因而在第二阶段和第三阶段选（D，C），理性囚徒1期望支付是：,-1+0-8=-9,如果理性囚徒1在第阶段选择C, 露了自己的理性特征. 囚徒2将在第二阶段和第三阶段选择（C，C）理性囚徒1的期望支付是:,0-8-8=-16,60,4.4.1KMRW声誉模型,现在考虑囚徒2的战略。囚徒2有三种战略，分别为(D,D,C)、(C,C,C)和(C,D,C)。给定理性囚徒1在第一阶段选择D(第二、三阶段选择c，囚徒2选择(D,D,C)的期望支付为:,17p-19,61,4.4.1KMRW声誉模型,如果囚徒2选择（C,C,C),期望支付为：,0-8-8=-16,如果p=3/17,(D,D,C)优于（C,C,C),62,4.4.1KMRW声誉模型,如果p=1/9,则（D,D,C)优于(C,D,C),63,4.4.1KMRW声誉模型,囚徒1在t=1时偏离合作，,0-8-8-8=-8(T-1),囚徒1开始选择D直到T，除非囚徒2在t阶段选择了C；在后一种情况下，从t+1开始选择直到T,如果下列条件满足，这个战略肯定优于从一开始就选择C的,T(3-2p)/7p,64,4.4.1KMRW声誉模型,KMRW定理：在T阶段重复囚徒博弈中，如果每个囚徒都有p0的概率是非理性的(即只选择“针锋相对”或“冷酷战略”)，如果T足够大，那么存在一个T,0,T使得下列战略组合构成一个精炼贝叶斯均衡:所有理性囚徒在t T,0,阶段选择不合作坦白);并且，非合作阶段数量(T-T,0,) 只与p有关而与T无关。,65,4.5总结,66,

展开阅读全文

chapter 4不完全信息动态博弈2

最新文档