完全信息动态博弈(博弈论张醒洲)

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2009-03-09,张醒洲大连理工,*,2009-03-09,张醒洲大连理工,1,完全信息动态博弈,Unit 3-1,2009-03-09,张醒洲大连理工,2,第,3,章和第,4,章概要,博弈分类,举例,解的概念,简单的完全且完美信息动态博弈,双寡头垄断模型,(1934),讨价还价模型,(1982),后向归纳结果,(BIO),2,人两阶段重复博弈,(“,同时行动”意味着“不完美信息”,),Lazear&Rosen Tournaments(1981),工作竞赛模型,Subgame Perfect Outcome(SPO),子博弈完美结果,动态博弈主题,:,可信威胁与承诺会影响现在的行为,下一次博弈开始前的所有博弈的结果都能被观察到的重复博弈,Subgame-perfect Nash equilibrium,子博弈完美,NE,2009-03-09,张醒洲大连理工,3,第,3,章概要,完全信息动态博弈,Representation,表述,Normal-form/Strategic-form,标准式,/,策略式,Extensive-form,扩展式,Solution concepts,解的概念,Nash Equilibrium(NE),Nash,均衡,Subgame-perfect Nash equilibrium(SPNE),子博弈完美,Nash,均衡,Central Issue,中心问题,credibility threats or promise(self-enforcement),可信性威胁或承诺,Theme,主题思想,一个完全信息动态博弈可能会有很多个纳什均衡，但是有些均衡包含了不可置信的威胁和承诺。子博弈完美纳什均衡就是通过了可信任检测的均衡。,2009-03-09,张醒洲大连理工,4,简单类型的完全且完美信息博弈,两人博弈类型,参与人,1,从可行集,A,1,中选择一个行动,a,1,；,参与者,2,观察到,a,1,并从可行集,A,2,中选择行动,a,2,；,两人的收益分别为,u,1,(a,1,a,2,),和,u,2,(a,1,a,2,),。,Ex.,斯塔克尔贝里,(1934),双寡头垄断模型,Tool,后向归纳法,Anticipation,后向归纳结果,2009-03-09,张醒洲大连理工,5,理论：后向归纳法,简单的完全且完美信息博弈,(CPI),两个参与人，同时行动,完全且完美信息,举例：斯塔克尔贝里,(1934),双寡头垄断模型,为了使模型更加一般化,允许更长的行动序列（可以加入更多的参与人或允许参与人行动多于一次）,一个例子,.,鲁宾斯坦的讨价还价博弈,为解决简单类型的,CPI,应用后向归纳法求解的过程如下：,2009-03-09,张醒洲大连理工,6,理论：后向归纳法（续）,第,1,步,:,分析第二阶段博弈,参与人,2,的问题,:,对参与人,1,的行动,a,1,选择最优的反应,R,2,(a,1,),参与人,2,面临的最优化问题是,:,即,2009-03-09,张醒洲大连理工,7,理论：后向归纳法（续）,请注意这个问题对两个参与人来说是一个共同知识。因此参与人,1,可以预测到参与人,2,对他的行动,a,1,所做出的反应,R,2,(a,1,),。,第,2,步,:,分析第一阶段,参与人,1,的问题,:,对参与人,2,的最优反应,R,2,(a,1,),，选择最优的行动,a,1,：,即,2009-03-09,张醒洲大连理工,8,理论：后向归纳法（续）,定义,.,简单的完全且完美信息博弈的后向归纳结果是,(a,1,*,R,2,(a,1,*),。,注意到后向归纳结果不包括不可置信的威胁,参与人,1,预测到参与人,2,是理性的，也就是,2,会对,1,可能,选择的,A,1,中的任何行动,a,1,作出最优反应,R,2,(a,1,),；,并且，参与人,1,认为参与人,2,不会选择不符合自身利益,的行动。,下面看一个例子,2009-03-09,张醒洲大连理工,9,后向归纳法内在的理性假定,一个两个人的三阶段博弈,1.,参与人,1,选择,L,或,R,，其中,L,使博,弈结束，参与人,1,的收益为,2,，参与,人,2,的收益为,0,；,2.,参与人,2,观测参与人,1,的选择。,如果,1,选择,R,，则,2,选择选择,L,或,R,，其中,L,使博弈结束，两人的,收益均为,1,；,3.,参与人,1,观察,2,的选择（并且回,忆自己在第一阶段的选择），如果,前两阶段的选择分别是,R,和,R,，则,1,可选择,L,或,R,，每一选择都将结,束博弈，选择,L,是参与人,1,的收益,为,3,，参与人,2,的收益为,0,；选择,R,时，,1,的收益是,0,，,2,的收益是,2,。,2009-03-09,张醒洲大连理工,10,后向归纳法内在的理性假定,:,一个两个人的三阶段博弈,计算后向归纳结果,第,1,步参与人,1,会在博弈的,第三阶段,选择,L”,2009-03-09,张醒洲大连理工,11,后向归纳法内在的理性假定,:,一个两个人的三阶段博弈,第,2,步参与人,2,在,第二阶段,选择,L,。,2009-03-09,张醒洲大连理工,12,后向归纳法内在的理性假定,:,一个两个人的三阶段博弈,第,3,步参与人,1,在第一阶段作出最优反应选择,L,后向归纳结果是,(L,nothing,nothing),2009-03-09,张醒洲大连理工,13,后向归纳法内在的理性假定,:,一个两个人的三阶段博弈,理性和预测,P1,是理性的，,P2,是理性的。,(L,N,N),；,(2,0),P1,是非理性的，,P2,是理性的。,(R,R,R”),；,(0,2),P1,是理性的，,P2,是非理性的。,(R,R,L”),；,(3,0),P1,是非理性的，,P2,是非理性的。,(R,L,N),；,(1,1),为什么,?,思考：,P1,认为别人以为他是疯子,P2,自聪明以为,P1,是疯子,但是,P1,真的不是疯子。结果是什么,?,2009-03-09,张醒洲大连理工,14,斯塔克尔贝里双寡头垄断模型,斯塔克尔贝里,(1934),提出一个双头垄断的动态模型，其中一个支配企业（领导者）首先行动，然后从属企业（追随者）行动。,博弈的时间顺序如下：,企业,1,选择产量,q,1,0,；,企业,2,观察到,q,1,，然后选择产量,q,2,0,;,企业,i,的利润函数如下：,其中,P(Q)=a Q,，是市场上的总产品,Q=q,1,+q,2,时的出清价格，,c,是生产的边际成本，为一常数（固定成本为,0,）。,2009-03-09,张醒洲大连理工,15,斯塔克尔贝里双寡头垄断模型,求解后向归纳结果,第,1,步计算企业,2,对企业,1,任意产量的最优反应，,R,2,(a,1,),应满足,由上式可得,已知,q,1,a-c.,2009-03-09,张醒洲大连理工,16,斯塔克尔贝里双寡头垄断模型,共同知识,由于企业,1,也能像企业,2,一样解出企业,2,的最优反应，企业,1,就可以,预测出如果他选择,q,1,，企业,2,将会选择产量,R,2,(q,1,),。那么，在博弈的,第一阶段，企业,1,的问题可表示为,由上式可得,这就是斯塔克尔贝里双寡头垄断博弈的后向归纳结果。,2009-03-09,张醒洲大连理工,17,双寡头垄断博弈：静态,vs.,动态,古诺模型和斯塔克尔贝里模型的区别：,q,1,是共同知识,(,能被企业,2,观察到,),要点,企业,1,知道企业,2,知道,q,1,损害了企业,2,。,模型,每个企业的均衡产量,总产量,市场出清价格,古诺,(a-c)/3,(a-c)/3,2(a-c)/3,(a+2c)/3,斯塔克尔贝里,(a-c)/2,(a-c)/4,3(a-c)/4,(a+3c)/4,1/3,1/2,1/4,2009-03-09,张醒洲大连理工,18,序惯谈判,一个三阶段谈判模型,鲁宾斯坦,(1982),模型,2009-03-09,张醒洲大连理工,19,一个三阶段谈判模型,参与人,1,和,2,就一美元的分配进行谈判。他们轮流提出,方案：,首先参与人,1,提出一个分配方案，参与人,2,可以接受,或拒绝；如果参与人,2,拒绝，就由参与人,2,提出分配建议，,参与人,1,选择接受或拒绝；如此进行下去。,一个条件一旦被拒绝，它就不再有任何约束力，并与,博弈下面的进程不再相关。每一个条件都代表一个阶段，,参与人都没有足够的耐心：他们对后面阶段得到的收益进,行贴现，每一阶段的贴现因子为,，,这里,0,1,。,2009-03-09,张醒洲大连理工,20,一个三阶段谈判模型,:,时间顺序,(1a),在第一阶段开始时，参与人,1,建议他分走,1,美元的,s1,，留给参与人,2,的份额是,1 s1,；,(1b),参与人,2,接受或不接受这一条件（这种情况下，博弈结束，参与人,1,的收益为,s,1,，参与人,2,的收益为,1 s,1,），或者拒绝这一条件（在这种情况下，博弈将继续进行，进入第二阶段）；,(2a),在第二阶段的开始，参与人,2,提议参与人,1,分得,1,美元的,s2,，留给参与人,2,的份额是,1 s2(,请注意在阶段,t,，,s,t,总是表示分给参与人,1,的，而不论是谁先提出的条件）；,(2b),参与人,1,或者接受条件（这种情况下，博弈结束，参与人,1,的收益,s2,和参与人,2,的收益,1 s2,都可立即拿到），或者拒绝这一条件（在这种情况下，博弈将继续进行，进入第三阶段）；,(3),一旦进入第三阶段，参与人,1,得到美元的,s,，参与人,2,得到,1-s,，这里,0 s 1,。,2009-03-09,张醒洲大连理工,21,一个三阶段谈判模型,2009-03-09,张醒洲大连理工,22,一个三阶段谈判模型,后向归纳法步骤,第,1,步参与者,2,的战略空间,提议,(,s,1-,s),提议,(s2,1-s2),，这里,s2,s,解：,对参与人,2,，如果他提议分配,s2,s,给参与人,1,，,则,(1-s)1-,s,。,因此参与人,2,的最优选择是,提议,(,s,1-,s,）,2009-03-09,张醒洲大连理工,23,一个三阶段谈判模型,第,2,步：分析第,1,阶段,参与人,1,的战略空间为,提议,(1-,(,1-,s),(,1-,s),提议,(s1,1-s1),这里,1-s1,s,参与人,1,可以提议分配,(,1-,s),给参与人,2,，参与人,2,接受这一条,件，博弈在第,1,阶段结束。,2009-03-09,张醒洲大连理工,24,鲁宾斯坦谈判模型,在第,3,阶段如何确定,s?,鲁宾斯坦说，均衡收益是,(1/(1+,),/(1+,),。,

展开阅读全文

完全信息动态博弈(博弈论张醒洲)

最新文档