《重复博弈》PPT课件

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章重复博弈,本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行，但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复，因为博弈方对于博弈会重复进行的意识，会使他们对利益的判断发生变化，从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加，必须把整个重复博弈过程作为整体进行研究。,本章主要内容,4.1,重复博弈引论,4.2,有限次重复博弈,4.3,无限次重复博弈,4.1 重复博弈引论,4.1.1,为何研究重复博弈,4.1.2,基本概念,4.1.1 为何研究重复博弈,经济中的长期关系,人们的预见性,未来利益对当前行为的制约,例如：,长期合同、回头客、常客等。,把这种关系理解成重复博弈，显然比理解成复杂的长期动态博弈更能反映问题的实质。,4.1.2 基本概念,有限次重复博弈：,给定一个基本博弈,G,（,可以是静态博弈，也可以是动态博弈），重复进行,T,次,G,，,并且在每次重复,G,之前各博弈方都能观察到以前博弈的结果，这样的博弈过程称为“,G,的,T,次重复博弈”，记为,G(T),。而,G,则称为,G(T),的“原博弈”。,G(T),中的每次重复称为,G(T),的一个“阶段”。,无限次重复博弈：,一个基本博弈,G,一直重复博弈下去的博弈，记为,G(),。,还有一种“随机结束的重复博弈”。,策略：,博弈方的一个策略就是在,每个阶段,（即每次重复）针对每种情况如何行为的计划。,子博弈：,从某个阶段（不包括第一阶段）开始，包括此后所有阶段的重复博弈部分。,均衡路径：,由每个阶段博弈方的行为组合串联而成。,重复博弈的得益,考虑重复博弈总体得益的情况的方法之一是计算重复博弈的,“总得益”,，即各博弈方各次重复得益的总和。,另一种方法是计算,“平均得益”,。,4.2 有限次重复博弈,4.2.1,两人零和博弈的有限次重复博弈,4.2.2,唯一纯策略纳什均衡博弈的有限次重复博弈,4.2.3,多个纯策略纳什均衡博弈的有限次重复博弈,4.2.4,有限次重复博弈的民间定理,4.2.1 两人零和博弈的有限次重复博弈,零和博弈,是严格竞争的，重复博弈并不改变这一点。,以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重复博弈一样，博弈方的正确策略是重复一次性博弈中的纳什均衡策略。,4.2.2 唯一纯策略纳什均衡博弈的有限次重复博弈,定理：设原博弈,G,有唯一的纯策略纳什均衡,则对任意整数,T,，,重复博弈,G(T),有唯一的子博弈完美纳什均衡，即各博弈方每个阶段都采用,G,的纳什均衡策略。各博弈方在,G(T),中的总得益为在,G,中得益的,T,倍，平均得益的与原博弈,G,中的得益。,-5，-5,0，-8,-8，0,-1，-1,坦,白,不坦白,囚徒,2,坦,白,不坦白,囚,徒,1,（-5，-5）,-10，-10,-13，-5,-5，-13,-6，-6,坦,白,不坦白,囚徒,2,坦,白,不坦白,囚,徒,1,（-10，-10）,有限次重复削价竞争博弈,100，100,20，150,150，20,70，70,高价,低价,高价,低价,寡头,2,寡,头,1,削价竞争博弈,有唯一纯策略纳什均衡,（70，70）有限次重复的结果仍然是,（低价，低价）,连锁店悖论,（塞尔顿,1978,年提出）,B,A,(1,10),(-2,3),(5,5),打进,不进,打击,不打击,4.2.3 多个纯策略纳什均衡博弈的有限次重复博弈,5，5,3，3,2，0,0，2,2，0,6，0,0，2,0，6,1，1,H,M,H,厂商2,M,L,厂,商,1,L,三价博弈,2，2,3，1,3，1,1，3,4，4,7，1,1，3,1，7,8，8,厂,商,1,厂商2,L,M,H,H,M,L,两次重复三价博弈的等价模型,触发策略：,两博弈方先试探合作，一旦发现对方不合作，则也用不合作报复,博弈方1：,第一次选H；如第一次结果为(H,H)，则第二次选M，否则选L,博弈方2：,同博弈方1,两市场博弈的重复博弈（重复两次）,(A,B)+(A,B)OR (B,A)+(B,A)(1,4)(4,1),连续两次采用混合策略,(2,2),(A,B)+(B,A)OR (B,A)+(A,B)(2.2,2.5),轮换策略,一次纯策略,+,一次混合策略,(1.5,3)(3,1.5),0，0,4，1,1，4,3，3,厂,商,1,厂商,2,B,A,A,B,两市场博弈,重复博弈不同策略、均衡及一次性博弈得益比较,不同策略组合、均衡得益图示,厂商2,得益,厂商1得益,(1,4),(3,3),(2.5,2.5),(2,2),(3,1.5),(4,1),(1.5,3),重复三次的触发策略：,厂商,1,：,第一阶段选,A,；如果第一阶段结果是（,A,，,A,），则第二阶段选,A,，如果第一阶段结果是（,A,，,B,），则第二阶段选,B,；第三阶段无条件选,B,。,厂商,2,：,第一阶段选,A,，第二阶段无条件选,B,，如果第一阶段结果是（,A,，,A,），则第二阶段选,A,；如果第一阶段结果是（,B,，,A,），则第三阶段选,B,。,根据双方的上述策略，,3,次重复博弈的均衡路径是（,A,，,A,）到（,A,，,B,）再到（,B,，,A,）。,平均得益为,2.67,。,4.2.4 有限次重复博弈的民间定理,个体理性得益：,不管其它博弈方行为如何，一博弈方在某个博弈中只要自己采取某种特定的策略，最低限度保证能获得的得益。,可实现得益：,博弈中所有纯策略组合得益的加权平均数组。,定理：,设原博弈的一次性博弈有均衡得益数组优于,w,，,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益，都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们,。,厂商2,得益,厂商1得益,(1,4),(3,3),(1，1),(4,1),w=(1.1),4.3 无限次重复博弈,4.3.1,两人零和博弈的无限次重复博弈,4.3.2,唯一纯策略纳什均衡博弈,的无限次重复博弈,4.3.3,无限次重复古诺模型,4.3.4,有效工资率,4.3.1 两人零和博弈的无限次重复博弈,两人零和博弈无限次重复的所有阶段都不可能发生合作，博弈方会一直重复原博弈的混合策略纳什均衡。,唯一纯策略纳什均衡博弈的无限次重复博弈,两寡头削价竞争博弈,该博弈一次性博弈均衡是都采用低价，是囚徒困境型博弈。,4，4,0，5,5，0,1，1,H,L,H,L,寡头2,寡,头,1,无限次重复两寡头削价博弈,触发策略：,第一阶段采用H，如果前t-1阶段的结果都是(H,H)，则继续采用H，否则采用L。,如果博弈方2采用L，总得益现值为,如果博弈方2采用H，总得益现值为,因此，当,V,时，即当时,此触发策略构成子博弈完美纳什均衡策略。,无限次重复博弈的民间定理,厂商2,得益,厂商1得益,(1,4),(3,3),(1,1),(4,1),(5,0),(5,0),4.3.3 无限次重复古诺模型,假定：，边际成本都为,2。,在无限次重复古诺模型中，当贴现率满足一定条件时，两厂商采用下列触发策略构成一个子博弈完美纳什均衡：,在第一阶段生产垄断产量的一半1.5；在第 t 阶段，如果前 t-1 阶段结果都是(1.5,1.5)，则继续生产1.5，否则生产古诺产量2。,设厂商1已采用该触发策略，若厂商2也采用该触发策略，则每期得益4.5，无限次重复博弈总得益的现值为：,如果厂商2偏离上述触发策略，则他在第一阶段所选产量应为给定厂商1产量为1.5时，自己的最大利润产量，即满足：,解得，此时利润为5.0625，高于触发策略第一阶段得益4.5。,但从第二阶段开始，厂商1将报复性地永远采用古诺产量2，这样厂商2也被迫永远采用古诺产量，从此得利润4。因此，无限次重复博弈第一阶段偏离的情况下总得益的现值为：,当,上述策略是厂商2对厂商1的同样触发策略的最佳反应，当,9/17时，,偏离是厂商2的最佳反应。,从上述分析中，我们可以找到为什么通货膨胀严重的国家的企业在经济活动中短期行为更为严重的一种,理论根源：,因为通货膨胀率越高，未来利益的折算成现在值的贴现系数就越低，企业就越是重视当前利益而不重视长期利益。,4.3.4 有效工资率,模型设定：,首先厂商选择工资率为，然后工人选择接受或拒绝。如果拒绝，则他作个体户得到收入小于，如果接受，则工人选择努力工作（负效用）还是偷懒（无负效用）。,厂商只能看到产量高低，高产量为，低产量,0。,工人努力工作时一定是高产量，不努力时却并不一定是0，而是高产量的概率为，低产量0的概率为。,工人努力工作时，厂商得益为，工人得益为；工人偷懒时，厂商期望得益为，工人得益为。,考虑如下的触发策略,：,厂商在第一阶段给工资率，在第t阶段，如果前面t-1阶段结果都是则继续给，否则从此永远是。,工人的策略是如果则接受，否则宁愿作个体户得到，并在以前各期结果都是和当前工资率为时努力工作，否则偷懒。,设厂商已采用上述触发策略。由于，工人接受工作是最佳反应。用记工人努力工作时无限次重复博弈得益的现值，则即,用记工人选偷懒时无限重复博弈得益的现值，则：,即,因此当即,时，努力是工人的最佳选择。,反过来，设工人已采用上述触发策略。若厂商给的工资率满足上式条件，并且威胁一旦产量降低就解雇工人，则各阶段的得益为，无限次重复博弈得益现值为。,若不愿给，则解雇工人，以后得益为,0。因此只要，厂商选择前述触发策略就是最佳反应。,综上所述，在满足,的条件下，双方的触发策略构成一个纳什均衡。而上述两式实际上意味着,即工人努力的产出扣除努力负效用后的剩余，必须不小于工人作个体户的收入即机会成本，加上一定比例的取决于努力负效用、贴现系数和偷懒可能得高产量概率的附加部分。,最后这个不等式正是存在有效工资率，工作激励有效的基本条件。,END,

展开阅读全文

《重复博弈》PPT课件

最新文档