博弈论经典ppt课件

上传人:文**** 文档编号:251974859 上传时间:2024-11-11 格式:PPT 页数:24 大小:1.19MB
返回 下载 相关 举报
博弈论经典ppt课件_第1页
第1页 / 共24页
博弈论经典ppt课件_第2页
第2页 / 共24页
博弈论经典ppt课件_第3页
第3页 / 共24页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,可编辑,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,可编辑,*,1,第三章 完全信息动态博弈,一、博弈的扩展式表示,1,、博弈扩展式描述包括的六要素,1,)参与人集合;,2,)参与人的行动次序:谁在什么时候行动;,3,)参与人的行动空间:在每次行动时,参与人有哪些选择;,4,)参与人的信息集:每次行动时,参与人知道些什么;,5,)参与人的支付函数:行动结束后,每个参与人得到些什么;,6,)外生事件(即自然的选择)的概率分布。,1第三章 完全信息动态博弈一、博弈的扩展式表示1、博弈,2,2,、博弈树(博弈扩展式),1,),结,:包括决策结(采取行动的时间)与终点结。,2,),枝,:决策结到它直接后接点的连线,它代表参与人的行动、路径。,3,),信息集,:决策结的子集,要满足:信息集中每个结应属于同一参与人;参与人知道博弈进入某信息集,但不知自己处在信息集中的哪一个结(多结点信息集时);参与人在同一个信息集上的每一个结上的行动空间是相同的;信息集中每个结应是同一时点的决策结,。,例 房地产开发博弈:开发商,A,首先行动,选择开发或不开发;,A,决策后,自然选择市场需求大小;开发商,B,在观测到,A,的决策和市场需求后,决定开发或不开发。,22、博弈树(博弈扩展式)1)结:包括决策结(采取行动的时间,3,3,、静态博弈的扩展式表示,例,1,囚徒困境,例,2,四人同时决策,每人有两种选择(,L,,,U,),请画出博弈树。,练习,用博弈树表示下述博弈。,第一步:局中人,1,掷一枚硬币,结果可能是正面,H,或反面,T,;,第二步:局中人,2,不知第一步硬币的结果,再掷一次硬币;,第三步:局中人,1,知第一、二步硬币的结果,又掷一次硬币;,第四步:局中人,2,不知第三步的结果,但知一、二两步的结果,最后掷一次硬币,博弈结束(按每步结果,局中人,2,给,1,一笔报酬)。,33、静态博弈的扩展式表示例1 囚徒困境例2 四人同,4,二、扩展型博弈转化为策略型博弈,例,1,房地产开发博弈,A,开发,不开发,B,B,开发,不开发,开发,不开发,(,-3,,,-3,),(,1,,,0,),(,0,,,1,),(,0,,,0,),4二、扩展型博弈转化为策略型博弈例1 房地产开发博弈A开发,5,例,2,考虑以下动态博弈。,第一步:局中人,1,从,1,,,2,中选择一数,x,。,第二步:局中人,2,知道,x,的值,从,1,,,2,中选择,y,。,第三步:局中人,1,不知,y,,也忘了,x,,从,1,,,2,中选择,z,,博弈结束。对选定的,x,,,y,,,z,,局中人,2,给局中人,1,的费用为,U1,(,x,y,z,),U1(1,,,1,,,1)=-2,;,U1(1,,,1,,,2)=-1,;,U1(1,,,2,,,1)=3,;,U1(1,,,2,,,2)=-4,;,U1(2,,,1,,,1)=5,;,U1(2,,,1,,,2)=-2,;,U1(2,,,2,,,1)=2,;,U1(2,,,2,,,2)=6,。,5例2 考虑以下动态博弈。,6,例,3,带有机会选择的动态博弈。,第一步:用一个随机装置,从,1,,,2,中等可能地选择数,x,。,第二步:局中人,1,知道,x,值,从,1,,,2,中选择,y,。,第三步:局中人,2,不知,x,,但知,y,,从,1,,,2,中选择,z,,博弈结束。,对选定的,x,,,y,,,z,,局中人,2,给局中人,1,的费用为,U1,(,x,y,z,),U1(1,,,1,,,1)=-2,;,U1(1,,,1,,,2)=-1,;,U1(1,,,2,,,1)=3,;,U1(1,,,2,,,2)=-4,;,U1(2,,,1,,,1)=5,;,U1(2,,,1,,,2)=-2,;,U1(2,,,2,,,1)=2,;,U1(2,,,2,,,2)=6,。,6例3 带有机会选择的动态博弈。,7,练习,考虑以下动态博弈。,第一步:局中人,1,从,1,,,2,中选择一数,x,。,第二步:局中人,2,知道,x,的值,从,1,,,2,中选择,y,。,第三步:局中人,1,知道,y,的值,从,1,,,2,中选择,z,,博弈结束。对选定的,x,,,y,,,z,,局中人,2,给局中人,1,的费用为,U1,(,x,y,z,),U1(1,,,1,,,1)=-2,;,U1(1,,,1,,,2)=-1,;,U1(1,,,2,,,1)=3,;,U1(1,,,2,,,2)=-4,;,U1(2,,,1,,,1)=5,;,U1(2,,,1,,,2)=-2,;,U1(2,,,2,,,1)=2,;,U1(2,,,2,,,2)=6,。,7练习 考虑以下动态博弈。,8,三、子博弈精炼纳什均衡,子博弈定义,:一个扩展式博弈的子博弈,G,由一个决策结,x,和所有该决策结的后续结,T,(,x,)(包括终点结)组成,它满足如下条件:,1,),x,是一个单结信息集,即,h(x)=x,;,2,)对于所有的,,若 ,则 。,子博弈精炼纳什均衡定义,:称扩展式博弈,G,的策略组合,为子博弈精炼,NE,,若:,1,)它是原博弈,的,NE,;,2,)它在每一个子博弈上给出,NE,。,8三、子博弈精炼纳什均衡子博弈定义:一个扩展式博弈的子博弈G,9,定理,:有限、完美信息的扩展型博弈必存在纯策略意义下的子博弈精炼纳什均衡。,子博弈精炼纳什均衡的解法:,逆向递推法,。,例,1,2,1,L,R,L1,R1,L2,R2,(,2,,,0,),(,1,,,1,),(,3,,,0,),(,0,,,2,),9定理:有限、完美信息的扩展型博弈必存在纯策略意义下的子博弈,10,例 海盗分金:五个海盗要分配抢来的,100,枚金币,方式是,第一个人提出一种分配方案,如果同意这种方案的人达到半数,那么提议通过,否则提议的人就被扔进大海,由剩下的人再进行同样的过程。假设五个人提议的次序已定,金币不能分割,而且海盗的本性让他们觉得,如果对自己的收益没有影响,则很乐意看到别人被扔进大海,这时理性结局应是如何?,10例 海盗分金:五个海盗要分配抢来的100枚金币,方式,11,例 斯坦克尔伯格(,Stackelberg,)寡头竞争模型,例 讨价还价博弈,例 有点数为,1,,,2,,,3,的三张牌,先由,A,任抽一张,看后反放于桌上,并喊大(,H,)或小(,L,)。然后由,B,从剩下牌中任抽一张,看过后,,B,有两种选择:弃权,付给,A,一元;翻,A,的牌,当,A,喊,H,时,点数小者付给对方,3,元,当,A,喊,L,时,点数大者付给对方,2,元。要求:,1,)说明,A,、,B,各有多少纯策略?,2,)据理性原则淘汰具有劣势的策略。,3,)求双方的最优策略及各自的支付值。,11例 斯坦克尔伯格(Stackelberg)寡头竞争,12,例 银行挤提问题(具有同时选择的动态博弈),设有两投资者,每人存入银行一笔存款,D,,银行将存款投资于一长期项目。若在项目到期前,存款人提前支取,银行被迫变现,共可收回,2r,,此处,Dr,。若银行等长期项目到期支取,可回收,2R,,,RD,。设有两个提款日期,,t=1,,项目到期前,两投资者都提款,则每人可得,r,。若只有一个在,t=1,提款,他可得,D,,另一人得,2r-D,。若两人都未在,t=1,提款,在,t=2,,两人都提款,则每人得,R,;若只有一个人在,t=2,提款,他得,2R-D,,另一人得,D,;若,t=2,时,两人都不提款,银行向每个投资者返还,R,。,12例 银行挤提问题(具有同时选择的动态博弈),THANK YOU,SUCCESS,2024/11/11,13,可编辑,THANK YOUSUCCESS2023/10/61,14,例 国际竞争与最优关税(具有同时选择的动态博弈),考虑两个相似的国家,分别用,i=1,,,2,表示。每个同家各有一个企业,分别称为企业,1,、企业,2,。企业生产既可内销又可出口的同质产品。两个国家中的消费者在各自国家的市场上购买本国产品或,外国产品。引入以下记号:,1,表示国家,i,市场上的商品供给,量,。这里 表示,i,国的内销量,表示,j,国的,出口量。,2,,,i=1,,,2,表示市场的出清价格。,3,企业的边际成本为常数,c,,且无固定成本,则企业,i,的总成本,为:,为,j,国进口关税,,j=1,,,2,。博弈的顺,序为:,t=1,时,政府同时选择关税税率 和 ;,t=2,时,两国企业观察到关税税率后,同时选择出口产量和提供国内消费量,与,。企业,i,的收益(支付)为其利润额,政府,i,的的收益则,为本国总的福利,包括消费者剩余,本国企业利润,国家关税收入三部分。,14例 国际竞争与最优关税(具有同时选择的动态博弈)与。,15,例 宏观经济政策的动态一致性,考虑一个货币政策模型:博弈的参与人是政府与公众。公众选择预期通胀率,政府在给定预期通胀率的情况下选择实际通胀率。政府不仅关心通胀问题,还关心实际产出,y,,其效用函数为:,产出,y,与通胀 间的关系可用如下菲力普斯曲线描述:,15例 宏观经济政策的动态一致性产出y与通胀,16,例 工资奖金制度,模型基本假设:,1,)一个雇主有两个雇员,雇员,i,(,i=1,,,2,)的产,出为 ,雇员努力的负效用为 ,,。扰动项 从分布密度为 、均值为,0,的概率分,布中独立抽取。,2,)因产出能观察而努力水平无法观察,所以据,产量支付报酬。雇主宣布产量高的雇员将得到较高工资 ,产,量低的工资为 。,3,)雇员在已知工资(奖金)制度的情况下,,同时独立选择各自的工作努力程度 ,。,16例 工资奖金制度。扰动项 从分布密度为,17,四、重复博弈,1,、基本概念,1,),重复博弈,指同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。有限次重复博弈写为,G,(,T,),无限次重复博弈写为,。,2,)重复博弈的平均得益,若一常数 作为重复博弈(有限或无限次重复)各阶段的得益,,能产生与得益序列 相同的现值,则称 为,的平均得益。,17四、重复博弈1、基本概念1)重复博弈指同样结构的博弈重复,18,3,)对随机结束的重复博弈,设停止重复的概率为,p,,重复下去的概率为(,1-p,),则,所以,随机停止重复博弈可当作无限次重复博弈进行分析。,其中,183)对随机结束的重复博弈,设停止重复的概率为p,重复下去,19,2,、有限次重复博弈,1,)无纯策略,NE,的两人零和博弈的有限次重复博弈,唯一的子博弈完美,NE,就是所有博弈方始终采用原博弈的混合策略纳什均衡策略。此结论可推广至非零和(常和)或多个博弈方,但博弈方的利益严格对立,无纯策略
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!