6.3 不完全信息与声誉

上传人:gp****x 文档编号:243491823 上传时间:2024-09-24 格式:PPT 页数:30 大小:91.50KB
返回 下载 相关 举报
6.3 不完全信息与声誉_第1页
第1页 / 共30页
6.3 不完全信息与声誉_第2页
第2页 / 共30页
6.3 不完全信息与声誉_第3页
第3页 / 共30页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,6.3,不完全信息与声誉,1,有限次博弈,第4章证明,只要未来足够重要,合作行为可以是无限次重复博弈的精炼纳什均衡。,但是,现实中许多博弈是有限次的,不是无限次的。,如果博弈重复的次数是有限的,无论重复多少次,合作都不会出现。,2,“连锁店悖论”(chain-store paradox),Selten (1978);,进入者,在位者,进入,不进入,默许,斗争,(40,50),(-10,0),(0,100),3,逆向归纳,假定在位者有20个市场。直观告诉我们,如果进入者在第一个市场进入,在位者应该选择斗争,因为尽管从一个市场看,斗争是不值得的,但这样做可以遏止进入者在其他市场上的进入。,唯一的精炼纳什均衡是:进入者总是进入;在位者总是默许。,4,Axelrod 实验,Axelrod(1981)实验表明:即使在有限次重复博弈中,合作行为也频繁出现。,5,问题在哪里?,一个可能的原因在于:我们前面假定不仅参与人的理性是共同知识,而且每个参与人可以选择的,策略和效用函数,都是共同知识。但现实不是这样。,可能性:逆向归纳方法的问题(,理性共识,);,信息不完全,;,6,不完全信息,KMRW模型(1982);,如果参与人对其他参与人的效用函数和策略空间的信息不完全,即使博弈重复的次数是有限的,人们也有积极性建立一个合作的声誉(reputation),合作可能会出现。,7,单方不完全信息,假定有两个参与人,A和B,进行囚徒困境博弈。如下图。,参与人A有两种可能的类型:“非理性”型:只有一种策略,tit-for-tat (TFT),或者grim strategy, 概率为p; “理性”型:可以选择任何策略,概率为(1-p);,参与人B有一种类型:理性型。,8,对“非理性”的解释,特殊的成本函数或效用函数;,讲义气、重情谊的人;内在化了“互惠对等”社会规范的人;,认知问题;,9,囚徒困境博弈,合作,背叛,合作,背叛,-1,-1,-10,0,0,-10,-8,-8,A,B,10,博弈重复两次,t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X,背叛,背叛,X,背叛,11,第2阶段,参与人A:如果是理性的,选择“背叛”;如果是非理性的,选择B在第1阶段的行动(X);,参与人B:选择“背叛”。,12,第1阶段,参与人A:如果是非理性的,选择“合作”;如果是理性的,选择“背叛”;,参与人B:如果选择合作,面临被背叛的风险,但如果A是非理性的,可以换来第2阶段的合作。,13,B在第2阶段的选择,选择合作,期望效用是:,(-1)p+(-10)(1-p)+0p+(-8)(1-p)=17p-18,如果选择背叛,期望效用函数是:,0p+(-8)(1-p)+(-8)=8p-16,最优选择是合作,如果:p=2/9;,结论:如果B认为A非理性的概率不小于2/9, B在第1阶段会选择合作,即使博弈只重复两次。,14,博弈重复3次,t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X,?,背叛,X,X,t=3,X,背叛,背叛,15,参与人A(理性)的选择,如果A是理性的,在第2阶段和第3阶段一定会选择背叛,但第1阶段也可能选择合作,因为建立一个合作的形象可以换取B在第2阶段的合作;,如果p=0.25, 并且A认为B在第1阶段会合作,给定A在第1阶段合作的话,B在在第2阶段也会合作,那么A选择合作得到:(-1)+0+(-8)=-9;,如果A选择背叛,得到:0+(-8)+(-8)=,-16;所以合作是最优的。,16,参与人B的选择,B有四种策略:,(合作,合作,背叛);,(合作,背叛,背叛);,(背叛,背叛,背叛);,(背叛,合作,背叛),17,(合作,合作,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=合作,合作,背叛,X=合作,X=合作,t=3,X=合作,背叛,背叛,-1 + (-1)p+(-10)(1-p) + 0p +(-8)(1-p) = 17p-19,预期效用=,18,(合作,背叛,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=合作,合作,背叛,X=合作,X=背叛,t=3,X=背叛,背叛,背叛,-1+0p+(-8)(1-p)+ -8= 8p-17,预期效用=,19,(背叛,背叛,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=背叛,合作,背叛,X=背叛,X=背叛,t=3,X=背叛,背叛,背叛,0+ ( -8) +,( -8),= -16,预期效用=,20,(背叛,合作,背叛),t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=背叛,合作,背叛,X=背叛,X=合作,t=3,X=合作,背叛,背叛,0+ -10 +0p+(-8)(1-p)= 8p-18,预期效用=,21,结论,只要p=2/9, 下表所列策略组合是一个精炼纳什均衡:,理性型A在第1阶段选择合作,然后在第2和第3阶段选择背叛;,B在第1和第2阶段选择合作,然后在第3阶段背叛。,22,精炼纳什均衡,t=1,t=2,A,非理性(p),理性型(1-p),B (理性型),合作,X=合作,合作,背叛,X=合作,X=合作,t=3,X=合作,背叛,背叛,23,一般结论,可以证明:如果博弈重复T次,只要p=2/9, 对于所有的T=3, 下列策略组合构成一个精炼纳什均衡:理性型A在t=1.T-2,阶段选择合作,在T-1和T阶段选择背叛;B在t=1.T-1阶段选择合作,在最后阶段T选择背叛。,背叛只在最后两阶段出现。,24,双方不完全信息,在单方不完全信息下,只要p=(3-2p)/7p;,所以,无论p多小,只要博弈重复的次数足够大,一开始就选择背叛不是最优的。,27,KMRW定理,在不完全信息的情况下,只要博弈重复的次数足够长,参与人就有积极性在博弈的早期建立一个“合作”的声誉;只是在博弈的后期,才会选择背叛;并且,非合作阶段的数量只与p有关,而与博弈的次数T无关。,看似不理性的行为其实是理性的;,28,“大智若愚”,应该树立什么样的形象?,合作与非合作;,强硬与懦弱;,对“不理智”(情绪化)行为的新解释;,29,解开“连锁店悖论”,Selten (1978);,进入者,在位者,进入,不进入,默许,斗争,(40,50),(-10,0),(0,100),30,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!