序贯决策博弈相关资料

资源描述

*,*,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第四章序贯决策博弈,序贯决策博弈：局中人做出策略选择时知道对手的策略选择。,本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是,子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。,主要内容,1、,序贯博弈的定义和表示方法,2、寻找序贯博弈纳什均衡的“虚线排除确定法”,3、寻找序贯博弈纳什均衡的“倒推法”,4、先动优势和后动优势,5、“倒退法”的缺陷,一、序贯博弈的定义和表示方法,在动态博弈中，参与人的行动有先后顺序，而且后行动者在自己行动之前能观察到先行动者的行动。,博弈的三要素,策略是在整个博弈中所有选择、行为的“完整计划”。什么是计划：“如果对手选A，我将采取行动X，如果，我将采取行动。”在同时决策博弈中，行动就是策略，但在序贯决策博弈中，行动是指每一个决策点上局中人的决策变量或行动的具体抉择。,结果是上述“计划型”策略的策略组合，构成一条路径。,支付,对应每条路径,，而不是对应,每步选择、行为。,支付向量中，数字的排列按局中人的出场顺序出现。,构造博弈战略式表述,在进入障碍博弈中,潜在进入者只有一个信息集，两个可选择的行动，其行动空间为：,S,A,=（进入，不进入）,垄断者有两个信息集，每个信息集上有两个可选择的行动，其行动空间为：,（进入，容忍）、（进入，对抗）、（不进入，容忍）、（不进入，对抗）,扩展式表述博弈,博弈的扩展式表述：,参与人集合；参与人的行动顺序；行动空间；信息集；支付函数；外生事件（即自然的选择）的概率分布。,在扩展式表述博弈，参与人是相机行事，即“等待” 博弈到达自己的信息集（包括一个或多个决策）后再决定如何行动；在战略式表述博弈，参与人似乎是在博弈开始之前，就制定出了一个完全的相机行动计划，即“如果发生，那么我将现在”。,博弈的扩展式表述博弈树,它描述了博弈参与人的一个序贯决策过程，从博弈数的根开始，到末端点结束。,拥有初始决策节点的局中人先做出决策，他的决策引出博弈树的棱，而棱的末端将是下一个局中人做出决策，依此类推。,举例,假如某个垄断企业一年可以赚10亿元的利润，假定别的企业为了进入该行业需要投资4亿元。当新的企业准备进入时，原有垄断企业有两种决策,（1）,“容忍”，但利润要变为5亿元。这时新的企业可以得5亿，减去4亿投资，仍有1亿。（2）“抵抗”，例如降低价格，企业的利润变为2亿元，且新的企业也只得2亿，但减去投资，亏损2亿。,谁先动？潜在进入者,如何表示该博弈？,进入障碍博弈,进入者,进入,不进,垄断者,容忍,抵抗,容忍,抵抗,（1，5）,（-2，2）,（0，10）,（0，4）,垄断者,二、序贯博弈的纳什均衡,例如：性别战.,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,（2，1）,（0，0）,（-1，-1）,（1，2）,策略组合,该博弈有八种可能的策略组合：,（足球，（上）足球，（下）足球）,（足球，（上）足球，（下）芭蕾）,（足球，（上）芭蕾，（下）足球）,（足球，（上）芭蕾，（下）芭蕾）,（芭蕾，（上）足球，（下）足球）,（芭蕾，（上）足球，（下）芭蕾）,（芭蕾，（上）芭蕾，（下）足球）,（芭蕾，（上）芭蕾，（下）芭蕾）,用虚线排除确定法寻找纳什均衡,将以上策略在博弈书中用粗线表示。,将存在单独改变激励的策略用虚线表示。方法如下：,（1）找到第二阶段两根粗线所对应的支付。,（2）比较这两个支付前面的数字，如果大的数字所对应的那条“树枝”是细的，则男方存在单独偏离的动机，则男方的策略选择“树枝”用虚线表示。,（3）比较这两个后面付前面的数字，其中对应第一阶段“树枝”是细的那个数字可以不再考虑，因为男方没选这个方向。它是“虚”的。,（4）因此只在男方选的那个“树丫”上进行比较女方的支付，如果大的数字对应的“树枝”是细的，则女方的策略选择“树枝”用虚线表示。（P159),虚线排除确定法的缺陷,该方法可以找到纳什均衡，但找不到博弈的最终结果。,均衡是策略的组合，而结果则是行动的组合。,因此，我们一般用倒推法（Backwards Induction)来寻找序贯博弈的结果。,三、寻找序贯博弈的结果倒推法,从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，称为“逆推归纳法”。,逆推归纳法是动态博弈分析最重要、基本的方法。,步骤：,从博弈的最后一个阶段开始分析，通过比较最后一个参与决策的局中人的支付，推断他或她的选择，从而将他不会选的策略“枝桠”砍掉，从而回到上一个阶段，比较该阶段参与决策的局中人的支付，将他或她不会选的策略砍掉，依此类推,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,（,2,，,1,）,（0，,0,）,（-1，,-1,）,（,1,，,2,）,倒推法,：（1）在上面一个枝桠上，,由于最后一阶段是女方做决策，因此比较女方的支付1和0，将0所对应的芭蕾策略砍掉，没砍掉的打上箭头。（2）在下面一个枝桠上，由于最后一阶段是女方做决策，因此比较女方的支付-1和2，将-1所对应的足球策略砍掉，没砍掉的打上箭头。（3）回到第一个阶段，比较带箭头的两个策略男方的支付（因为此时男方做决策），将支付将较小的策略砍掉。,女,练习,开金矿博弈,不借,乙,甲,乙,借,不分,分,（1，0）,不打,打,（0，4）,（1，0）,（2，2）,倒推法的评价,逆推归纳法只能分析明确设定的博弈问题，要求博弈的结构，包括次序、规则和得益情况等都非常清楚，并且各个博弈方了解博弈结构，相互知道对方了解博弈结构。这些可能有脱实际的可能,逆推归纳法也不能分析比较复杂的动态博弈,在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难,对博弈方的理性要求太高，不仅要求所有博弈方都有高度的理性，不允许犯任何错误，而且要求所有博弈方相互了解和信任对方的理性，对理性有相同的理解，或进一步有“理性的共同知识”。,四、先动优势与后动优势,在序贯情侣博弈中，任何一方率先采取行动可能得到的好处，都比他或她后行动可能得到的好处大。这种局中人先动得益大于后行得益的情况，叫做,先动优势,。,请比较：,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,（,2,，,1,）,（0，,0,）,（-1，,-1,）,（,1,，,2,）,女,先动优势,当男方先动时，男方得2，女方得1，但当女方先动时，男方得1，女方得2。,“先下手为强”,女,足球,芭蕾,男,足球,芭蕾,足球,芭蕾,（1，2）,（-1，-1）,（0，0）,（2，1）,男,序贯博弈中的性别战,举例：情侣博弈中往往是先动一方，比如女方已经买好了电影票，再比如男方曾经多次告诉女方，世界杯就算不上班也要看D!,后动优势,后动优势：后行动的得益比先行动的得益大的情况。,例如：石头、剪刀、布的游戏。,注意,先动优势或者后动优势是关于博弈的参与人的情况或特性的描述，而不是关于博弈的本身的特性的描述。,五、博弈论给自己出难题,蜈蚣博弈是说明逆推归纳法和博弈分析困难的经典博弈。,1,2,1,1,2,1,2,R,(98,98),(97,100),d,r,(99,99),D,R,r,d,(98,101),(100,100),D,R,r,d,(0,3),D,(2,2),R,(1,1),D,

展开阅读全文

序贯决策博弈相关资料

最新文档