完全信息动态博弈(博弈论张醒洲)

上传人:huo****ian 文档编号:253075081 上传时间:2024-11-28 格式:PPT 页数:24 大小:549.50KB
返回 下载 相关 举报
完全信息动态博弈(博弈论张醒洲)_第1页
第1页 / 共24页
完全信息动态博弈(博弈论张醒洲)_第2页
第2页 / 共24页
完全信息动态博弈(博弈论张醒洲)_第3页
第3页 / 共24页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2009-03-09,张醒洲 大连理工,*,2009-03-09,张醒洲 大连理工,1,完全信息动态博弈,Unit 3-1,2009-03-09,张醒洲 大连理工,2,第,3,章和第,4,章概要,博弈分类,举例,解的概念,简单的完全且完美信息动态博弈,双寡头垄断模型,(1934),讨价还价模型,(1982),后向归纳结果,(BIO),2,人两阶段重复博弈,(“,同时行动”意味着“不完美信息”,),Lazear&Rosen Tournaments(1981),工作竞赛模型,Subgame Perfect Outcome(SPO),子博弈完美结果,动态博弈主题,:,可信威胁与承诺会影响现在的行为,下一次博弈开始前的所有博弈的结果都能被观察到的重复博弈,Subgame-perfect Nash equilibrium,子博弈完美,NE,2009-03-09,张醒洲 大连理工,3,第,3,章概要,完全信息动态博弈,Representation,表述,Normal-form/Strategic-form,标准式,/,策略式,Extensive-form,扩展式,Solution concepts,解的概念,Nash Equilibrium(NE),Nash,均衡,Subgame-perfect Nash equilibrium(SPNE),子博弈完美,Nash,均衡,Central Issue,中心问题,credibility threats or promise(self-enforcement),可信性威胁或承诺,Theme,主题思想,一个完全信息动态博弈可能会有很多个纳什均衡,但是有些均衡包含了不可置信的威胁和承诺。子博弈完美纳什均衡就是通过了可信任检测的均衡。,2009-03-09,张醒洲 大连理工,4,简单类型的完全且完美信息博弈,两人博弈类型,参与人,1,从可行集,A,1,中选择一个行动,a,1,;,参与者,2,观察到,a,1,并从可行集,A,2,中选择行动,a,2,;,两人的收益分别为,u,1,(a,1,a,2,),和,u,2,(a,1,a,2,),。,Ex.,斯塔克尔贝里,(1934),双寡头垄断模型,Tool,后向归纳法,Anticipation,后向归纳结果,2009-03-09,张醒洲 大连理工,5,理论:后向归纳法,简单的完全且完美信息博弈,(CPI),两个参与人,同时行动,完全且完美信息,举例:斯塔克尔贝里,(1934),双寡头垄断模型,为了使模型更加一般化,允许更长的行动序列(可以加入更多的参与人或允许参与人行动多于一次),一个例子,.,鲁宾斯坦的讨价还价博弈,为解决简单类型的,CPI,应用后向归纳法求解的过程如下:,2009-03-09,张醒洲 大连理工,6,理论:后向归纳法(续),第,1,步,:,分析第二阶段博弈,参与人,2,的问题,:,对参与人,1,的行动,a,1,选择最优的反应,R,2,(a,1,),参与人,2,面临的最优化问题是,:,即,2009-03-09,张醒洲 大连理工,7,理论:后向归纳法(续),请注意这个问题对两个参与人来说是一个共同知识。因此参与人,1,可以预测到参与人,2,对他的行动,a,1,所做出的反应,R,2,(a,1,),。,第,2,步,:,分析第一阶段,参与人,1,的问题,:,对参与人,2,的最优反应,R,2,(a,1,),,选择最优的行动,a,1,:,即,2009-03-09,张醒洲 大连理工,8,理论:后向归纳法(续),定义,.,简单的完全且完美信息博弈的后向归纳结果是,(a,1,*,R,2,(a,1,*),。,注意到后向归纳结果不包括不可置信的威胁,参与人,1,预测到参与人,2,是理性的,也就是,2,会对,1,可能,选择的,A,1,中的任何行动,a,1,作出最优反应,R,2,(a,1,),;,并且,参与人,1,认为参与人,2,不会选择不符合自身利益,的行动。,下面看一个例子,2009-03-09,张醒洲 大连理工,9,后向归纳法内在的理性假定,一个两个人的三阶段博弈,1.,参与人,1,选择,L,或,R,,其中,L,使博,弈结束,参与人,1,的收益为,2,,参与,人,2,的收益为,0,;,2.,参与人,2,观测参与人,1,的选择。,如果,1,选择,R,,则,2,选择选择,L,或,R,,其中,L,使博弈结束,两人的,收益均为,1,;,3.,参与人,1,观察,2,的选择(并且回,忆自己在第一阶段的选择),如果,前两阶段的选择分别是,R,和,R,,则,1,可选择,L,或,R,,每一选择都将结,束博弈,选择,L,是参与人,1,的收益,为,3,,参与人,2,的收益为,0,;选择,R,时,,1,的收益是,0,,,2,的收益是,2,。,2009-03-09,张醒洲 大连理工,10,后向归纳法内在的理性假定,:,一个两个人的三阶段博弈,计算后向归纳结果,第,1,步 参与人,1,会在博弈的,第三阶段,选择,L”,2009-03-09,张醒洲 大连理工,11,后向归纳法内在的理性假定,:,一个两个人的三阶段博弈,第,2,步 参与人,2,在,第二阶段,选择,L,。,2009-03-09,张醒洲 大连理工,12,后向归纳法内在的理性假定,:,一个两个人的三阶段博弈,第,3,步 参与人,1,在第一阶段作出最优反应选择,L,后向归纳结果是,(L,nothing,nothing),2009-03-09,张醒洲 大连理工,13,后向归纳法内在的理性假定,:,一个两个人的三阶段博弈,理性和预测,P1,是理性的,,P2,是理性的。,(L,N,N),;,(2,0),P1,是非理性的,,P2,是理性的。,(R,R,R”),;,(0,2),P1,是理性的,,P2,是非理性的。,(R,R,L”),;,(3,0),P1,是非理性的,,P2,是非理性的。,(R,L,N),;,(1,1),为什么,?,思考:,P1,认为别人以为他是疯子,P2,自聪明以为,P1,是疯子,但是,P1,真的不是疯子。结果是什么,?,2009-03-09,张醒洲 大连理工,14,斯塔克尔贝里双寡头垄断模型,斯塔克尔贝里,(1934),提出一个双头垄断的动态模型,其中一个支配企业(领导者)首先行动,然后从属企业(追随者)行动。,博弈的时间顺序如下:,企业,1,选择产量,q,1,0,;,企业,2,观察到,q,1,,然后选择产量,q,2,0,;,企业,i,的利润函数如下:,其中,P(Q)=a Q,,是市场上的总产品,Q=q,1,+q,2,时的出清价格,,c,是生产的边际成本,为一常数(固定成本为,0,)。,2009-03-09,张醒洲 大连理工,15,斯塔克尔贝里双寡头垄断模型,求解后向归纳结果,第,1,步 计算企业,2,对企业,1,任意产量的最优反应,,R,2,(a,1,),应满足,由上式可得,已知,q,1,a-c.,2009-03-09,张醒洲 大连理工,16,斯塔克尔贝里双寡头垄断模型,共同知识,由于企业,1,也能像企业,2,一样解出企业,2,的最优反应,企业,1,就可以,预测出如果他选择,q,1,,企业,2,将会选择产量,R,2,(q,1,),。那么,在博弈的,第一阶段,企业,1,的问题可表示为,由上式可得,这就是斯塔克尔贝里双寡头垄断博弈的后向归纳结果。,2009-03-09,张醒洲 大连理工,17,双寡头垄断博弈:静态,vs.,动态,古诺模型和斯塔克尔贝里模型的区别:,q,1,是共同知识,(,能被企业,2,观察到,),要点,企业,1,知道企业,2,知道,q,1,损害了企业,2,。,模型,每个企业的均衡产量,总产量,市场出清价格,古诺,(a-c)/3,(a-c)/3,2(a-c)/3,(a+2c)/3,斯塔克尔贝里,(a-c)/2,(a-c)/4,3(a-c)/4,(a+3c)/4,1/3,1/2,1/4,2009-03-09,张醒洲 大连理工,18,序惯谈判,一个三阶段谈判模型,鲁宾斯坦,(1982),模型,2009-03-09,张醒洲 大连理工,19,一个三阶段谈判模型,参与人,1,和,2,就一美元的分配进行谈判。他们轮流提出,方案:,首先参与人,1,提出一个分配方案,参与人,2,可以接受,或拒绝;如果参与人,2,拒绝,就由参与人,2,提出分配建议,,参与人,1,选择接受或拒绝;如此进行下去。,一个条件一旦被拒绝,它就不再有任何约束力,并与,博弈下面的进程不再相关。每一个条件都代表一个阶段,,参与人都没有足够的耐心:他们对后面阶段得到的收益进,行贴现,每一阶段的贴现因子为,,,这里,0,1,。,2009-03-09,张醒洲 大连理工,20,一个三阶段谈判模型,:,时间顺序,(1a),在第一阶段开始时,参与人,1,建议他分走,1,美元的,s1,,留给参与人,2,的份额是,1 s1,;,(1b),参与人,2,接受或不接受这一条件(这种情况下,博弈结束,参与人,1,的收益为,s,1,,参与人,2,的收益为,1 s,1,),或者拒绝这一条件(在这种情况下,博弈将继续进行,进入第二阶段);,(2a),在第二阶段的开始,参与人,2,提议参与人,1,分得,1,美元的,s2,,留给参与人,2,的份额是,1 s2(,请注意在阶段,t,,,s,t,总是表示分给参与人,1,的,而不论是谁先提出的条件);,(2b),参与人,1,或者接受条件(这种情况下,博弈结束,参与人,1,的收益,s2,和参与人,2,的收益,1 s2,都可立即拿到),或者拒绝这一条件(在这种情况下,博弈将继续进行,进入第三阶段);,(3),一旦进入第三阶段,参与人,1,得到美元的,s,,参与人,2,得到,1-s,,这里,0 s 1,。,2009-03-09,张醒洲 大连理工,21,一个三阶段谈判模型,2009-03-09,张醒洲 大连理工,22,一个三阶段谈判模型,后向归纳法步骤,第,1,步 参与者,2,的战略空间,提议,(,s,1-,s),提议,(s2,1-s2),,这里,s2,s,解:,对参与人,2,,如果他提议分配,s2,s,给参与人,1,,,则,(1-s)1-,s,。,因此参与人,2,的最优选择是,提议,(,s,1-,s,),2009-03-09,张醒洲 大连理工,23,一个三阶段谈判模型,第,2,步:分析第,1,阶段,参与人,1,的战略空间为,提议,(1-,(,1-,s),(,1-,s),提议,(s1,1-s1),这里,1-s1,s,参与人,1,可以提议分配,(,1-,s),给参与人,2,,参与人,2,接受这一条,件,博弈在第,1,阶段结束。,2009-03-09,张醒洲 大连理工,24,鲁宾斯坦谈判模型,在第,3,阶段如何确定,s?,鲁宾斯坦说,均衡收益是,(1/(1+,),/(1+,),。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!