博弈论应用案例.ppt

资源描述

1,博弈论应用案例,联系理论与实际的桥梁,引言,GenericMethodologyManyscientificpapersintheseareashavethefollowingbasicstructure:Aproblemismodeledasagame,thegameisanalyzedbycomputingitsequilibria,andthepropertiesofthelatteraretranslatedbackintoinsightsrelevanttotheoriginalproblem,博弈论在实际中应用的一般分析框架,描述实际问题问题本身的描述（文字、图表为主）用数学模型描述描述合理易于处理,博弈论在实际中应用的一般分析框架,选择合适博弈模型完全信息静态博弈完全信息动态博弈不完全信息静态或动态博弈合作博弈等等,博弈论在实际中应用的一般分析框架,描述博弈基本要素，如参与人参与人策略集各参与人的效用函数等等,博弈论在实际中应用的一般分析框架,博弈的均衡分析纳什均衡分析（纳什均衡与博弈结果的预测）一些相关分析（数学的、经济的、业内的）分析结果的“翻译”结论,纳什均衡应用举例：公共地悲剧(tragedyofthecommons),问题描述考虑一个有n个农民的村庄共同拥有一片草地，每个农民都有在草地上放牧的自由。每年春天，每个农民要决定自己养多少只羊。用gi0,)代表第i个农民饲养的数量，i=1,n，G=gi表示n个农民饲养的总数量，v代表每只羊的平均价值。一个重要的假设是v是G的函数，v=v(G)。因为每只羊至少要一定数量的草才不至于饿死，因此有一个最大的存活量Gmax，即,纳什均衡应用举例：公共地悲剧(tragedyofthecommons),问题描述当G0;当GGmax时，v(G)=0。当草地上的羊很少时，增加一只羊也许不会对其他羊的价值有太大的不利影响，但随着饲养量的不断增加，每只羊的价值会急剧下降，因此假定：,可用图1-10描述这个特征,GmaxG,v,图1-10每只羊的价值随饲养总量的增加而下降曲线,纳什均衡应用举例：公共地悲剧(tragedyofthecommons),均衡分析在该博弈中，每个农民的问题是选择gi以最大化自己的利润。假定购买一只羊羔的价格为c，那么利润函数为,纳什均衡应用举例：公共地悲剧(tragedyofthecommons),纳什均衡应用举例：公共地悲剧(tragedyofthecommons),最优化一阶条件为,该式表明，对于每个农民来说，增加一只羊有正负两方面效用效用,将上面n个式子相加，在同时除以n，得,纳什均衡应用举例：公共地悲剧(tragedyofthecommons),整个社会的最优化饲养量，用G*表示，为,将上面n个式子相加，在同时除以n，得,一阶最优化条件为,纳什均衡应用举例：公共地悲剧(tragedyofthecommons),比较上面两个式子，可推出GG*.,反证法假设GG*,那么由于v0，因此v(G)v(G*)。类似的，由于v0,又可推出v(G)v(G*)。另外，从GG*还可推出G/nG*,中外彩电贸易战例,文章题目中美彩电“反倾销”中的竞合博弈分析作者邓跃峰，李元旭杂志名称及发表日期经济与管理研究，2003.4,事态起因,今年（2003）5月2日，美国五河电子公司与电子工人国际兄弟会以及电子产品、家具和通讯国际工会两家劳工组织一起，向美国商务部和美国国际贸易委员会提起了反倾销诉讼被起诉者中，囊括了长虹、TCL、康佳、海尔等中国主要彩电企业,事态起因,按照惯例，美国各大连锁店从每年的6-7月开始，就要筹备圣诞节商品。五河等在此时提出反倾销指控，能有效阻止美国商家从中国采购彩电，届时可独享市场。,事态起因,据调查，长虹在美国市场2002年下半年销售彩电为320万台，厦华彩电有20万台销量，其他厂商则寥寥无几。五河此举，显然是为了防患于未然，阻止这些企业进入美国市场。,中国彩电业的反应,自2003年5月23日美国国际贸易委员会就我国向美国出口的彩电是否造成倾销举行第一次听证会后，中国彩电“反倾销”出现两大阵营长虹，厦华，海尔（出口量大），联手中国机电产品进出口商会出面“应战”创维，TCL,等（出口量小），各自聘请律师应诉,中国彩电业的反应,“攘外”的同时，仍未忘“内讧”,其他利益相关方,美国本土经销商沃尔玛和APEX沃尔玛支持中国彩电业APEX袖手,其他利益相关方,由于视中国为非市场经济国家，美国商务部在反倾销调查中计算中国产品正常价值时，一直采用第三国替代的办法，即用外国相关生产要素的价格来计算中国产品的成本。美国将印度视为中国产品的替代国,诉讼日程,5月2日-6月17日以前为ITC阶段，判定美国国内彩电业是否受到中国彩电的损害，若是，案件就继续，反之则结束。,诉讼日程,第二阶段DOC调查6月28日左右，下发问卷，进行中国企业成本、价格构成、销售等方面调查10月9日，DOC初裁是否倾销、倾销幅度11月9日，前往中国实地考察12月23日DOC作出终裁,诉讼日程,12月底到2004年2月，回到ITC，进行最后终裁，决定是否向中国彩电征收反倾销税。,思辨式分析,作者认为，中国彩电业应诉成功与否，取决于中国彩电业卡特尔内企业的合作与否诉讼方五河电子公司等企业的诉讼策略美国本土彩电经销商是否支持长虹是否实施了掠夺性价格策略美国商业部和中国政府的对策,思辨式分析,对上述问题的了解是长虹的低于成本价掠夺性价格策略没有过必要，但长虹价格美国商业部的替代成本计算标准对中国企业严重不利思辨式分析后，可以建立博弈模型进行分析,参与人的确定,作者选取了前两个因素作为参与人中国彩电业与五河等美国电子企业中国彩电业内部各企业间的利益争夺,有关变量的假设,R1中国彩电业全体失败后，在美国市场损失的长期利益现值R2中国彩电业应诉期间，在美国市场短期损失的利益现值R3中国彩电业应诉部分失败后，在美国市场上损失的利益现值C诉讼成本/应诉成本N中国彩电业分化后单独应诉的数量,模型1中国彩电业与五河,五河等记为A,中国彩电行业记为C五河策略集为SA=一网打尽；集中擒获中国彩电业（联盟）的策略集SC=合作应诉；不合作应诉,模型1中国彩电业与五河,根据前面假设，可以分别计算上述支付值,模型1中国彩电业与五河,作者分析表明不管中国彩电业选择什么策略，A方采取一网打尽策略均为占优策略,模型1中国彩电业与五河,中国彩电业选取合作，应诉胜利的期望值更大因此(A1,C1)是纳什均衡点/原作者笔误为(A2,C2)/,模型1中国彩电业与五河,结论：中国彩电业应精诚合作，共同因对五河等美国彩电生产商对中国彩电企业提出的“反倾销”诉讼如果中国企业各自为战，政府应该扮演什么角色？,模型2中国彩电业内部竞争,参与人的确定长虹、厦华、海尔大量出口商，联手中国机电产品进出口商，用E表示出口较少的创维、TCL、康佳等，用D表示,模型2中国彩电业内部竞争,策略集选择,两个参与人的策略相同，均为合作应诉单独应诉,模型2中国彩电业内部竞争,作者通过定量分析，得出纳什均衡为（合作应诉，合作应诉），但如果对五河远期目标估计不足，（单独应诉，合作应诉）策略组合也可能出现,模型2中国彩电业内部竞争,上述分析的过程结合业内分析确定，详细过程，感兴趣者可察看原文分析过程,原作者得出的结论,中国政府应积极努力，改变自身在国际上的形象促进中国彩电业的合作,斯塔克博格模型,与古诺模型类似，斯塔克博格(Stackelberg)模型也有两个厂商，但两个厂商一方实力较强，一方较弱。产量决策由实力较强的一方先进行选择，较弱的一方则根据较强的一方的产量（能够完全观察得到）选择自己的产量。其他有关信息，如策略空间、支付函数、信息结构等与古诺模型一致。,斯塔克博格模型,Stackelberg博弈在实际中是很多的长虹主动出击的价格战美国的通用汽车与福特、克莱斯勒等,斯塔克博格模型,进而可以求出两个厂商在给定产量下的利润，为,斯塔克博格模型,用逆推法分析该博弈根据逆推法的思路，先分析第二个阶段厂商2的决策。在厂商2开始决策时，厂商1的选择q1实际上已经决定且为厂商2知道。因此，对于厂商2来说，相当于在给定q1的情况下，求使u2达到最大值的q2.即对u2求极值。,令厂商2的1阶导数等于0，求得等式为,即,该式表明厂商2根据场上1不同的产量来决定自己的最优产量，实质上这是厂商2的反应函数。,斯塔克博格模型,厂商1知道厂商2的这种决策思路，因此在决定q1时，就知道厂商2会按上式进行针对性的决策。因此，可将上式直接代入其利润函数，为,可以很容易地求出上式的最大值，为,斯塔克博格模型,由厂商1的最优产量决策,以及厂商2的最优反应函数,斯塔克博格模型,根据上面两个表达式，可以求出厂商2的最优产量及最优产量下的利润水平,利用斯塔克博格模型有关假设数据，可以算出二寡头古诺模型中，二厂商的均衡价格、产量、利润（过程从略）。结果与斯塔克博格模型对照，见表2-3,表2-3古诺模型和斯塔克模型对照,斯塔克博格模型,斯塔克博格模型,小结由于厂商1占据先行之利，因此获得了较大的利益。在信息不对称的博弈中，掌握较多信息的参与人（如斯塔克博格模型中参与人2）不一定得到较多的利益（与古诺模型对照）。,多阶段静态博弈简例：工作竞赛,博弈论在经济、机制理论上的应用，是现代博弈论的一个重要应用领域。传统经济理论分析往往是“思辨似的”，“语言式的”分析方式，“一千个读者就有一千个哈姆雷特”。因此，在看似合理的分析的同时，可能产生不同甚至相互矛盾的结论也就不足为奇了博弈论以定量化分析为主要特色，分析更具有严密性。,工作竞赛问题描述有两个工人，工人i(i=1或2)的产出，可用yi=ei+i，其中ei是努力程度，i是随机扰动项。,多阶段静态博弈简例：工作竞赛,生产程序如下：第一，两个工人同时选择非负的努力水平ei0；第二，随机扰动项1，2彼此独立，并服从期望值为0、密度为f()的概率分布；第三，工人的产出可以观测，但各自选择的努力水平无法观测，从而工人的工资可以决定于个人的产出，但无法直接取决于其努力水平。,多阶段静态博弈简例：工作竞赛,老板的激励措施是，工作竞赛的优胜者（即产出水平较高的工人）获得的工资为wH;失败者的工资为wL.工人获得工资水平w并付出努力程度e时的收益为u(w,e)=wg(e)，其中g(e)表示努力工作带来的负效用，是递增的凸函数（g0,g0）。老板的收益为y1+y2-wH-wL,多阶段静态博弈简例：工作竞赛,记老板为参与人1，他的行动a1是选择工作竞赛中的工资水平wH，wL；两个工人是参与人3，4，他们观测第一阶段选定的工资水平，然后同时选择行动a3,a4，也就是选择努力的程度e1,e2参与者各自的收益如前面所给出。,多阶段静态博弈简例：工作竞赛,分析假定老板已经选定了工资水平wH，wL，如果一对努力水平组合(e1*,e2*)是第二阶段两工人博弈的纳什均衡，则对于每一个i,ei*必须使工人的期望工资减去努力带来的负效用后的净收益最大，即,多阶段静态博弈简例：工作竞赛,进一步化简该式，得,其中,多阶段静态博弈简例：工作竞赛,进一步化简该式，得,多阶段静态博弈简例：工作竞赛,上式的一阶最优条件为,该式的含义是，工人i选择努力程度ei,从而使得额外努力的边际负效用g等于增加努力的边际收益，后者又等于对优胜者的奖励工资（wH-wL），乘以因努力程度提高而使获胜概率的增加。,多阶段静态博弈简例：工作竞赛,根据贝叶斯法则,多阶段静态博弈简例：工作竞赛,于是一阶条件可化为,多阶段静态博弈简例：工作竞赛,于是一阶条件可化为,多阶段静态博弈简例：工作竞赛,在对称均衡下，e1*=e2*=e*，得到新的式子,于是一阶条件可化为,多阶段静态博弈简例：工作竞赛,在对称均衡下，e1*=e2*=e*，得到新的式子,阶段结论由于g(e)是凸函数，优胜获得的奖励越高，就会激发更大的努力；另一方面，在同样的奖励水平下，对产出的随机扰动因素越大，越不值得努力工作，因为这时工作竞赛的最终结果在很大程度上取决于运气，而非努力程度。,多阶段静态博弈简例：工作竞赛,按照逆向归纳法，假定工人们同意参加工作竞赛，对于给定的wH和wL的反应，就是前面描述的对称纳什均衡策略,多阶段静态博弈简例：工作竞赛,假定工人可以寻求其他就业机会，得到的效用为Ua,如果老板要使工人有动力参加工作竞赛，则他必须选择满足下式的工资水平,多阶段静态博弈简例：工作竞赛,直观上就可看出，老板给出的工资水平在满足下式的基础上，越低越好。因此，成立,多阶段静态博弈简例：工作竞赛,直观上就可看出，老板给出的工资水平在满足下式的基础上，越低越好。因此，成立,多阶段静态博弈简例：工作竞赛,此时老板的利润为,多阶段静态博弈简例：工作竞赛,该式的一阶条件为,由式子,多阶段静态博弈简例：工作竞赛,该式的一阶条件为,可以得出,多阶段静态博弈简例：工作竞赛,该式的一阶条件为,可以得出,多阶段静态博弈简例：工作竞赛,与下式联立，就可得出老板的最优工资确定策略,信号传递博弈之一两期声誉博弈,在基本的信号传递博弈中，有两个参与人1、2分别被称为信号发送者(sender)和接收者(receiver)参与人1的类型为属于，参与人2的类型集为单元素集（不存在私人信息），对参与人1的类型集上存在一个先验信念p,这些信息都是共同知识。,信号传递博弈之一两期声誉博弈,博弈的过程是参与人1首先发送一个行动a1(行动集为A1)参与人2看到行动a2后，利用贝叶斯公式更新对参与人1类型的信念判断（后验信念）。然后选择自己的行动（在后验信念下的最大期望效用）信号博弈中完美贝叶斯均衡的含义是预见到参与人2的推断方式，参与人1选择一个最优行动a1;参与人2选择在后验概率下的最优行动后验概率的推断按照贝叶斯法则（在可能情况下）,问题描述有两个厂商，在时期1，这两家厂商都在市场上。厂商1采取行动a1，其行动集仅有两个元素“争夺”和“容纳”。如果厂商1容纳，则厂商2有利润D2，如果厂商1争夺，则厂商2有利润P2，D20P2,信号传递博弈之一两期声誉博弈,厂商1有两个潜在的类型：“清醒的”和“疯狂的”。一个清醒的厂商在选择容纳行动时获得D1，争夺时获得P1，D1P1。因此，一个清醒的厂商宁愿选择容纳。但他偏好垄断，垄断在每期获得M1,M1D1。疯狂的厂商则偏好争夺（效用函数使得他认为争夺总是值得的）,信号传递博弈之一两期声誉博弈,时期2，轮到厂商2进行行动选择，记她的行动为a2，其行动集为留下，退出。如果厂商2留下，若厂商1是清醒的，厂商1得到D1,厂商2得到收益D2；若厂商1是疯狂的，厂商1得到P1,厂商2得到收益P2；如果厂商2退出，厂商1得到垄断利润M1,厂商2得到收益0。两期的贴现率为,信号传递博弈之一两期声誉博弈,由于假定疯狂的类型总是争夺的，因此所要研究的事情是清醒类型的厂商的行为。从静态的观点来看，厂商1想在第一期选择容纳，但是若选择争夺，可能诱使厂商2相信他是疯狂的，并因此使她推出从而增加了自身第二期的利润。,信号传递博弈之一两期声誉博弈,完美贝叶斯均衡通常分为分离均衡：不同类型的参与人在上期选择不同的行动以声誉博弈模型为例，可表示为(=清醒|a1=容纳)=1(=疯狂|a1=争夺)=1,信号传递博弈之一两期声誉博弈,混同均衡(poolingequilibria):不同类型的参与人在上期选择同样的行动。在一个混同均衡里，后行动者观察到先行动者的行动后，并不更新他的信念。以声誉模型为例，可表示为(=疯狂|a1=争夺)=p,信号传递博弈之一两期声誉博弈,半分离均衡。介于前面两者之间以声誉模型为例，可表示为0(=疯狂|a1=争夺)p(=清醒|a1=容纳)=1,信号传递博弈之一两期声誉博弈,什么时候存在分离均衡呢？在这类均衡中，清醒的类型会选择容纳，其收益为D1(1+)，（厂商2则选择留下）。如果清醒的类型选择了争夺，厂商2就相信他是疯狂的，于是得到P1+M1于是分离均衡的一个必要条件是D1(1+)P1+M1在上面不等式下，（厂商1及厂商2）下面的策略和信念是PBE,信号传递博弈之一两期声誉博弈,在混同均衡中，两种类型的在位者都选择争夺。此时产生混同均衡的一个必要条件是：如果进入者在第二期留下时，他对第二期的期望收益为负数，即pD2+(1-p)P20因此在上式成立下，这样的信念和策略是PBE,信号传递博弈之一两期声誉博弈,至于半分离均衡时的分析，此处从略。,信号传递博弈之一两期声誉博弈,古巴导弹危机,参见相关文件,法律方面的一个案例Png赔偿博弈,关于庭外赔偿的Png模型具有复杂的扩展式博弈。原告声称被告疏于对其化工厂配备安全设备，从而导致有毒物质泄漏，对自己造成了损害。这一指控为真的概率为q,原告提起了诉讼，但法庭并未立即判决。休庭期间，原告和被告可在庭外和解。,法律方面的一个案例Png赔偿博弈,TheorderofplayNaturechoosesthedefendanttobeLiableforinjurytotheplaintiffwithprobabilityq=0.13andblamelessotherwise.Thedefendantobservesthisbuttheplaintiffdoesnot.TheplaintiffdecidestoSueorjusttoGrumble.ThedefendantOffersasettlementamountofS=0.15totheplaintiff,orResist,settingS=0,法律方面的一个案例Png赔偿博弈,IfthedefendantofferedS=0.15,theplaintiffagreestoSettleorheRefusesandgoestotrial,andifthedefendantofferedS=0,theplaintiffDropsthecase,forlegalcostsofP=0andD=0forhimselfandthedefendant,orchoosestoTryit,creatinglegalcostsofP=0.1andD=0.2Ifthecasegoestotrial,theplaintiffwinsdamagesofW=1ifthedefendantisLiableandW=0,ifthedefendantisBlameless.Ifthecaseisdropped,W=0.,法律方面的一个案例Png赔偿博弈,0,有罪(q),无辜(1-q),法律方面的一个案例Png赔偿博弈,0,有罪(q),无辜(1-q),法律方面的一个案例Png赔偿博弈,0,有罪(q),无辜(1-q),P1,P2,起诉,抱怨,起诉,抱怨,现状,现状,D1,D2,和解,奉陪,和解,奉陪,法律方面的一个案例Png赔偿博弈,0,有罪(q),无辜(1-q),P1,P2,起诉,抱怨,起诉,抱怨,现状,现状,D1,D2,P3,P4,P5,P6,和解,奉陪,和解,奉陪,法律方面的一个案例Png赔偿博弈,0,有罪(q),无辜(1-q),P1,P2,起诉,抱怨,起诉,抱怨,现状,现状,D1,D2,P3,P4,P5,P6,和解,奉陪,和解,奉陪,接受,拒绝,继续,撤诉,接受,拒绝,继续,撤诉,和解,审判,审判,现状,和解,审判,审判,现状,0,有罪(q),无辜(1-q),P1,P2,起诉,抱怨,起诉,抱怨,现状,现状,D1,D2,P3,P4,P5,P6,和解,奉陪,和解,奉陪,接受,拒绝,继续,撤诉,接受,拒绝,继续,撤诉,和解,审判,审判,现状,和解,审判,审判,现状,由下图说明被告的信息集非常恶劣，信息不对称非常明显。原告的策略就是要决定在三个信息集上要做出什么行动,0,有罪(q),无辜(1-q),P1,P2,起诉,抱怨,起诉,抱怨,现状,现状,D1,D2,P3,P4,P5,P6,和解,奉陪,和解,奉陪,接受,拒绝,继续,撤诉,接受,拒绝,继续,撤诉,和解,审判,审判,现状,和解,审判,审判,现状,法律方面的一个案例Png赔偿博弈,TheplaintiffspayoffisS+W-P.ThedefendantspayoffisS-W-D.可以按照上面表达式，得出各种局势下各方的收益。假定参与人是风险中性的。,法律方面的一个案例Png赔偿博弈,剩下的工作是求解相应的均衡，此处从略。详细内容参见文件,

展开阅读全文

博弈论应用案例.ppt

最新文档