重复博弈和无名氏定理.ppt

资源描述

重复博弈和无名氏定理动态博弈的另一种特殊但是非常重要的类型就是所谓的重复博弈顾名思义重复博弈是指同样结构的博弈重复多次其中的每次博弈称为阶段博弈有限次重复博弈连锁店悖论考虑市场进入阻挠博弈现在假定同样的市场有20个可以理解为在位者有20个连锁店进入者每次进入一个市场博弈就变成了20次重复博弈假定进入者先进入第一个市场在位者应该如何反应大家可能会猜想尽管从一个市场上看在位者的最优选择是默认但因为现在有20个市场要保护为了阻止进入者进入其他19个市场在位者应该选择斗争在这个博弈中在位者选择斗争的惟一原因是希望斗争能起到一种威摄力量使进入者不敢进入但在有限次重复博弈中斗争并不是一个值得置信的威胁该博弈的惟一子博弈精炼均衡是在位者在每一个市场上都选择默许进入者在每一个市场上选择进入囚徒困境与市场进入阻挠博弈类似只要博弈重复的次数是有限的最后阶段的惟一纳什均衡就是两个囚徒都选择坦白逆向归纳法意味着总是坦白是惟一的子博弈精炼均衡上述结果表明只要博弈的重复次数是有限的重复本身并不改变囚徒困境的结果无限次重复博弈和无名氏定理当博弈重复无穷次而不是有限次时存在着完全不同于一次博弈的子博弈精炼均衡考虑囚徒困境博弈假定博弈重复无穷次考虑下列所谓的冷酷战略 1 开始选择沉默 2 选择沉默直到有一方选择坦白然后永远选择坦白根据这个战略一旦一个囚徒在某个阶段博弈中选择了坦白之后他将永远选择坦白我们首先证明冷酷战略是一个纳什均衡我们将证明不论囚徒j是否选择冷酷战略冷酷战略始终是i的最优战略假定囚徒j选择上述冷酷战略冷酷战略是不是囚徒i的最优战略呢令为贴现因子假定两人的贴现因子相同如果i在博弈的某个阶段首先选择了坦白他在该阶段得到0单位的支付但他的这种行为将触发囚徒j的永远坦白的惩罚因此 i随后每个阶段的支付都是 6 因此如果给定下列条件满足假设j没有选择坦白 i将不会选择坦白或解上述条件得也就是说如果给定j坚持冷酷战略并且j没有首先坦白 i不会选择首先坦白现在假定j首先选择了坦白那么i是否有积极性坚持冷酷战略惩罚j的不合作行为呢假定j坚持冷酷战略 j一旦坦白将永远坦白如果i坚持冷酷战略他随后每阶段的支付是 6 但如果他选择任何其它战略他在任何阶段的支付不会大于 6 因此不论为多少 i有积极性坚持冷酷战略类似的假定j坚持冷酷战略即使i自己首先选择了坦白坚持冷酷战略也是最优的这样我们就证明了冷酷战略是一个纳什均衡接下来的任务是证明这个纳什均衡是一个子博弈精炼纳什均衡即在每一个子博弈上构成纳什均衡因为博弈重复无限次从任何一个阶段开始的子博弈与这个博弈的结构相同在冷酷战略纳什下子博弈可以划分为两类 A类没有任何人曾经坦白 B类至少一人曾经坦白我们已经证明冷酷战略在A类子博弈中构成纳什均衡在B类根据冷酷战略参与人只是重复单阶段博弈的纳什均衡它自然也是整个子博弈的纳什均衡由此我们证明如果 1 6 冷酷战略是无限次重复博弈的一个子博弈精炼纳什均衡帕雷托最优沉默沉默是每一个阶段的均衡结果囚徒走出了一次性博弈的困境实际上也存在一些其它的战略使得当事人之间实现合作大众定理存在无穷多对战略可以成为无限次重复博弈的平衡点并同时实现双方的合作其他的战略恕道战略恶棍战略流氓战略傻客战略

展开阅读全文