博弈论经典ppt课件

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,可编辑,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,可编辑,*,1,第三章完全信息动态博弈,一、博弈的扩展式表示,1,、博弈扩展式描述包括的六要素,1,）参与人集合；,2,）参与人的行动次序：谁在什么时候行动；,3,）参与人的行动空间：在每次行动时，参与人有哪些选择；,4,）参与人的信息集：每次行动时，参与人知道些什么；,5,）参与人的支付函数：行动结束后，每个参与人得到些什么；,6,）外生事件（即自然的选择）的概率分布。,1第三章完全信息动态博弈一、博弈的扩展式表示1、博弈,2,2,、博弈树（博弈扩展式）,1,）,结,：包括决策结（采取行动的时间）与终点结。,2,）,枝,：决策结到它直接后接点的连线，它代表参与人的行动、路径。,3,）,信息集,：决策结的子集，要满足：信息集中每个结应属于同一参与人；参与人知道博弈进入某信息集，但不知自己处在信息集中的哪一个结（多结点信息集时）；参与人在同一个信息集上的每一个结上的行动空间是相同的；信息集中每个结应是同一时点的决策结,。,例房地产开发博弈：开发商,A,首先行动，选择开发或不开发；,A,决策后，自然选择市场需求大小；开发商,B,在观测到,A,的决策和市场需求后，决定开发或不开发。,22、博弈树（博弈扩展式）1）结：包括决策结（采取行动的时间,3,3,、静态博弈的扩展式表示,例,1,囚徒困境,例,2,四人同时决策，每人有两种选择（,L,，,U,），请画出博弈树。,练习,用博弈树表示下述博弈。,第一步：局中人,1,掷一枚硬币，结果可能是正面,H,或反面,T,；,第二步：局中人,2,不知第一步硬币的结果，再掷一次硬币；,第三步：局中人,1,知第一、二步硬币的结果，又掷一次硬币；,第四步：局中人,2,不知第三步的结果，但知一、二两步的结果，最后掷一次硬币，博弈结束（按每步结果，局中人,2,给,1,一笔报酬）。,33、静态博弈的扩展式表示例1 囚徒困境例2 四人同,4,二、扩展型博弈转化为策略型博弈,例,1,房地产开发博弈,A,开发,不开发,B,B,开发,不开发,开发,不开发,（,-3,，,-3,）,（,1,，,0,）,（,0,，,1,）,（,0,，,0,）,4二、扩展型博弈转化为策略型博弈例1 房地产开发博弈A开发,5,例,2,考虑以下动态博弈。,第一步：局中人,1,从,1,，,2,中选择一数,x,。,第二步：局中人,2,知道,x,的值，从,1,，,2,中选择,y,。,第三步：局中人,1,不知,y,，也忘了,x,，从,1,，,2,中选择,z,，博弈结束。对选定的,x,，,y,，,z,，局中人,2,给局中人,1,的费用为,U1,（,x,y,z,）,U1(1,，,1,，,1)=-2,；,U1(1,，,1,，,2)=-1,；,U1(1,，,2,，,1)=3,；,U1(1,，,2,，,2)=-4,；,U1(2,，,1,，,1)=5,；,U1(2,，,1,，,2)=-2,；,U1(2,，,2,，,1)=2,；,U1(2,，,2,，,2)=6,。,5例2 考虑以下动态博弈。,6,例,3,带有机会选择的动态博弈。,第一步：用一个随机装置，从,1,，,2,中等可能地选择数,x,。,第二步：局中人,1,知道,x,值，从,1,，,2,中选择,y,。,第三步：局中人,2,不知,x,，但知,y,，从,1,，,2,中选择,z,，博弈结束。,对选定的,x,，,y,，,z,，局中人,2,给局中人,1,的费用为,U1,（,x,y,z,）,U1(1,，,1,，,1)=-2,；,U1(1,，,1,，,2)=-1,；,U1(1,，,2,，,1)=3,；,U1(1,，,2,，,2)=-4,；,U1(2,，,1,，,1)=5,；,U1(2,，,1,，,2)=-2,；,U1(2,，,2,，,1)=2,；,U1(2,，,2,，,2)=6,。,6例3 带有机会选择的动态博弈。,7,练习,考虑以下动态博弈。,第一步：局中人,1,从,1,，,2,中选择一数,x,。,第二步：局中人,2,知道,x,的值，从,1,，,2,中选择,y,。,第三步：局中人,1,知道,y,的值，从,1,，,2,中选择,z,，博弈结束。对选定的,x,，,y,，,z,，局中人,2,给局中人,1,的费用为,U1,（,x,y,z,）,U1(1,，,1,，,1)=-2,；,U1(1,，,1,，,2)=-1,；,U1(1,，,2,，,1)=3,；,U1(1,，,2,，,2)=-4,；,U1(2,，,1,，,1)=5,；,U1(2,，,1,，,2)=-2,；,U1(2,，,2,，,1)=2,；,U1(2,，,2,，,2)=6,。,7练习考虑以下动态博弈。,8,三、子博弈精炼纳什均衡,子博弈定义,：一个扩展式博弈的子博弈,G,由一个决策结,x,和所有该决策结的后续结,T,（,x,）（包括终点结）组成，它满足如下条件：,1,）,x,是一个单结信息集，即,h(x)=x,；,2,）对于所有的,，若，则。,子博弈精炼纳什均衡定义,：称扩展式博弈,G,的策略组合,为子博弈精炼,NE,，若：,1,）它是原博弈,的,NE,；,2,）它在每一个子博弈上给出,NE,。,8三、子博弈精炼纳什均衡子博弈定义：一个扩展式博弈的子博弈G,9,定理,：有限、完美信息的扩展型博弈必存在纯策略意义下的子博弈精炼纳什均衡。,子博弈精炼纳什均衡的解法：,逆向递推法,。,例,1,2,1,L,R,L1,R1,L2,R2,（,2,，,0,）,（,1,，,1,）,（,3,，,0,）,（,0,，,2,）,9定理：有限、完美信息的扩展型博弈必存在纯策略意义下的子博弈,10,例海盗分金：五个海盗要分配抢来的,100,枚金币，方式是，第一个人提出一种分配方案，如果同意这种方案的人达到半数，那么提议通过，否则提议的人就被扔进大海，由剩下的人再进行同样的过程。假设五个人提议的次序已定，金币不能分割，而且海盗的本性让他们觉得，如果对自己的收益没有影响，则很乐意看到别人被扔进大海，这时理性结局应是如何？,10例海盗分金：五个海盗要分配抢来的100枚金币，方式,11,例斯坦克尔伯格（,Stackelberg,）寡头竞争模型,例讨价还价博弈,例有点数为,1,，,2,，,3,的三张牌，先由,A,任抽一张，看后反放于桌上，并喊大（,H,）或小（,L,）。然后由,B,从剩下牌中任抽一张，看过后，,B,有两种选择：弃权，付给,A,一元；翻,A,的牌，当,A,喊,H,时，点数小者付给对方,3,元，当,A,喊,L,时，点数大者付给对方,2,元。要求：,1,）说明,A,、,B,各有多少纯策略？,2,）据理性原则淘汰具有劣势的策略。,3,）求双方的最优策略及各自的支付值。,11例斯坦克尔伯格（Stackelberg）寡头竞争,12,例银行挤提问题（具有同时选择的动态博弈）,设有两投资者，每人存入银行一笔存款,D,，银行将存款投资于一长期项目。若在项目到期前，存款人提前支取，银行被迫变现，共可收回,2r,，此处,Dr,。若银行等长期项目到期支取，可回收,2R,，,RD,。设有两个提款日期，,t=1,，项目到期前，两投资者都提款，则每人可得,r,。若只有一个在,t=1,提款，他可得,D,，另一人得,2r-D,。若两人都未在,t=1,提款，在,t=2,，两人都提款，则每人得,R,；若只有一个人在,t=2,提款，他得,2R-D,，另一人得,D,；若,t=2,时，两人都不提款，银行向每个投资者返还,R,。,12例银行挤提问题（具有同时选择的动态博弈）,THANK YOU,SUCCESS,2024/11/11,13,可编辑,THANK YOUSUCCESS2023/10/61,14,例国际竞争与最优关税（具有同时选择的动态博弈）,考虑两个相似的国家，分别用,i=1,，,2,表示。每个同家各有一个企业，分别称为企业,1,、企业,2,。企业生产既可内销又可出口的同质产品。两个国家中的消费者在各自国家的市场上购买本国产品或,外国产品。引入以下记号：,1,表示国家,i,市场上的商品供给,量，。这里表示,i,国的内销量，表示,j,国的,出口量。,2,，,i=1,，,2,表示市场的出清价格。,3,企业的边际成本为常数,c,，且无固定成本，则企业,i,的总成本,为：，为,j,国进口关税，,j=1,，,2,。博弈的顺,序为：,t=1,时，政府同时选择关税税率和；,t=2,时，两国企业观察到关税税率后，同时选择出口产量和提供国内消费量,与,。企业,i,的收益（支付）为其利润额，政府,i,的的收益则,为本国总的福利，包括消费者剩余，本国企业利润，国家关税收入三部分。,14例国际竞争与最优关税（具有同时选择的动态博弈）与。,15,例宏观经济政策的动态一致性,考虑一个货币政策模型：博弈的参与人是政府与公众。公众选择预期通胀率，政府在给定预期通胀率的情况下选择实际通胀率。政府不仅关心通胀问题，还关心实际产出,y,，其效用函数为：,产出,y,与通胀间的关系可用如下菲力普斯曲线描述：,15例宏观经济政策的动态一致性产出y与通胀,16,例工资奖金制度,模型基本假设：,1,）一个雇主有两个雇员，雇员,i,（,i=1,，,2,）的产,出为，雇员努力的负效用为，,。扰动项从分布密度为、均值为,0,的概率分,布中独立抽取。,2,）因产出能观察而努力水平无法观察，所以据,产量支付报酬。雇主宣布产量高的雇员将得到较高工资，产,量低的工资为。,3,）雇员在已知工资（奖金）制度的情况下，,同时独立选择各自的工作努力程度，。,16例工资奖金制度。扰动项从分布密度为,17,四、重复博弈,1,、基本概念,1,）,重复博弈,指同样结构的博弈重复多次，其中的每次博弈称为阶段博弈。有限次重复博弈写为,G,（,T,），无限次重复博弈写为,。,2,）重复博弈的平均得益,若一常数作为重复博弈（有限或无限次重复）各阶段的得益，,能产生与得益序列相同的现值，则称为,的平均得益。,17四、重复博弈1、基本概念1）重复博弈指同样结构的博弈重复,18,3,）对随机结束的重复博弈，设停止重复的概率为,p,，重复下去的概率为（,1-p,），则,所以，随机停止重复博弈可当作无限次重复博弈进行分析。,其中,183）对随机结束的重复博弈，设停止重复的概率为p，重复下去,19,2,、有限次重复博弈,1,）无纯策略,NE,的两人零和博弈的有限次重复博弈,唯一的子博弈完美,NE,就是所有博弈方始终采用原博弈的混合策略纳什均衡策略。此结论可推广至非零和（常和）或多个博弈方，但博弈方的利益严格对立，无纯策略

展开阅读全文

博弈论经典ppt课件

最新文档