重复博弈和无名氏定理.ppt

上传人:za****8 文档编号:6250332 上传时间:2020-02-20 格式:PPT 页数:17 大小:302.84KB
返回 下载 相关 举报
重复博弈和无名氏定理.ppt_第1页
第1页 / 共17页
重复博弈和无名氏定理.ppt_第2页
第2页 / 共17页
重复博弈和无名氏定理.ppt_第3页
第3页 / 共17页
点击查看更多>>
资源描述
重复博弈和无名氏定理 动态博弈的另一种特殊但是非常重要的类型就是所谓的 重复博弈 顾名思义 重复博弈是指同样结构的博弈重复多次 其中的每次博弈称为 阶段博弈 有限次重复博弈 连锁店悖论 考虑市场进入阻挠博弈 现在假定同样的市场有20个 可以理解为在位者有20个连锁店 进入者每次进入一个市场 博弈就变成了20次重复博弈 假定进入者先进入第一个市场 在位者应该如何反应 大家可能会猜想 尽管从一个市场上看 在位者的最优选择是默认 但因为现在有20个市场要保护 为了阻止进入者进入其他19个市场 在位者应该选择斗争 在这个博弈中 在位者选择斗争的惟一原因是希望斗争能起到一种威摄力量 使进入者不敢进入 但在有限次重复博弈中 斗争并不是一个值得置信的威胁 该博弈的惟一子博弈精炼均衡是 在位者在每一个市场上都选择默许 进入者在每一个市场上选择进入 囚徒困境与市场进入阻挠博弈类似 只要博弈重复的次数是有限的 最后阶段的惟一纳什均衡就是两个囚徒都选择坦白 逆向归纳法意味着 总是坦白 是惟一的子博弈精炼均衡 上述结果表明 只要博弈的重复次数是有限的 重复本身并不改变囚徒困境的结果 无限次重复博弈和无名氏定理 当博弈重复无穷次而不是有限次时 存在着完全不同于一次博弈的子博弈精炼均衡 考虑囚徒困境博弈 假定博弈重复无穷次 考虑下列所谓的 冷酷战略 1 开始选择沉默 2 选择沉默直到有一方选择坦白 然后永远选择坦白 根据这个战略 一旦一个囚徒在某个阶段博弈中选择了坦白 之后他将永远选择坦白 我们首先证明冷酷战略是一个纳什均衡 我们将证明不论囚徒j是否选择冷酷战略 冷酷战略始终是i的最优战略 假定囚徒j选择上述冷酷战略 冷酷战略是不是囚徒i的最优战略呢 令 为贴现因子 假定两人的贴现因子相同 如果i在博弈的某个阶段首先选择了坦白 他在该阶段得到0单位的支付 但他的这种行为将触发囚徒j的 永远坦白 的惩罚 因此 i随后每个阶段的支付都是 6 因此如果给定下列条件满足 假设j没有选择坦白 i将不会选择坦白 或 解上述条件得 也就是说 如果 给定j坚持冷酷战略并且j没有 首先坦白 i不会选择首先坦白 现在假定j首先选择了坦白 那么i是否有积极性坚持冷酷战略惩罚j的不合作行为呢 假定j坚持冷酷战略 j一旦坦白将永远坦白 如果i坚持冷酷战略 他随后每阶段的支付是 6 但如果他选择任何其它战略 他在任何阶段的支付不会大于 6 因此不论 为多少 i有积极性坚持冷酷战略 类似的 假定j坚持冷酷战略 即使i自己首先选择了坦白 坚持冷酷战略也是最优的 这样 我们就证明了冷酷战略是一个纳什均衡 接下来的任务是证明这个纳什均衡是一个子博弈精炼纳什均衡 即在每一个子博弈上构成纳什均衡 因为博弈重复无限次 从任何一个阶段开始的子博弈与这个博弈的结构相同 在冷酷战略纳什下 子博弈可以划分为两类 A类 没有任何人曾经坦白 B类 至少一人曾经坦白 我们已经证明 冷酷战略在A类子博弈中构成纳什均衡 在B类 根据冷酷战略 参与人只是重复单阶段博弈的纳什均衡 它自然也是整个子博弈的纳什均衡 由此我们证明 如果 1 6 冷酷战略是无限次重复博弈的一个子博弈精炼纳什均衡 帕雷托最优 沉默 沉默 是每一个阶段的均衡结果 囚徒走出了一次性博弈的困境 实际上 也存在一些其它的战略使得当事人之间实现合作 大众定理 存在无穷多对战略 可以成为无限次重复博弈的平衡点 并同时实现双方的合作 其他的战略 恕道战略恶棍战略流氓战略傻客战略
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!