第三讲完全且完美信息动态博弈a讲义课件

资源描述

第三第三完全且完美信息动态博弈完全且完美信息动态博弈本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。12024/7/13动态博弈的表示法和特点：阶段和扩展性表示动态博弈的表示法和特点：阶段和扩展性表示l阶段：动态博弈中一个博弈方的一次选择行为l例子：仿冒和反仿冒博弈ABBA不制止制止（-2，5）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒第三章第三章完全且完美信息动态博弈完全且完美信息动态博弈22024/7/13动态博弈的基本特点动态博弈的基本特点l策略是在整个博弈中所有选择、行为的计划l结果是上述“计划型”策略的策略组合，构成一条路径l得益对应每条路径，而不是对应每步选择、行为l动态博弈的非对称性先后次序决定动态博弈必然是非对称的。l先选择、行为的博弈方常常更有利，有“先行优势”。第三章第三章完全且完美信息动态博弈完全且完美信息动态博弈32024/7/134第三章第三章完全且完美信息动态博弈完全且完美信息动态博弈l l完全得益完全得益l l完美过程完美过程l l动态先后动态先后l l请考虑以下问题：请考虑以下问题：（1 1）是不是信息越多越有利？）是不是信息越多越有利？（2 2）过程是否重要？）过程是否重要？（3 3）动态博弈与静态博弈有哪些异同之处？）动态博弈与静态博弈有哪些异同之处？（4 4）人们对已经过去的博弈是更注重结果还是更注重过程？其意义何在）人们对已经过去的博弈是更注重结果还是更注重过程？其意义何在？2024/7/135l可信性问题可信性问题l子博弈逆推归纳法子博弈逆推归纳法l有同时选择的两阶段动态博弈有同时选择的两阶段动态博弈第三章第三章完全且完美信息动态博弈完全且完美信息动态博弈2024/7/13那人那人那狗：博弈那狗：博弈人：蹲、逃狗：逃、追3.1 3.1 可信性问题可信性问题62024/7/137那人那人那狗：博弈那狗：博弈l人为什么蹲下？l（1）阻止狗采取对人不利的行动l（2）诱使狗采取对人有利的行动策略行动策略行动可信性可信性如何？如何？3.1 3.1 可信性问题可信性问题2024/7/133.1 3.1 可信性问题可信性问题l在动态博弈中，由于在动态博弈中，由于过程过程十分重要，类似于对未来过十分重要，类似于对未来过程的了解，它本身依赖于其它博弈方的行为。那么就程的了解，它本身依赖于其它博弈方的行为。那么就存在一个对其博弈方所可能采取策略的可信性问题。存在一个对其博弈方所可能采取策略的可信性问题。l可信性可信性：动态博弈中：动态博弈中先行为的博弈方先行为的博弈方是否应该是否应该相信后相信后行为博弈方行为博弈方会采取某种策略或行为。会采取某种策略或行为。l后行为博弈方将来采取对先行为博弈方有利的行为为后行为博弈方将来采取对先行为博弈方有利的行为为“许诺许诺”，采取对先行方不利的行为为，采取对先行方不利的行为为“威胁威胁”。82024/7/13多阶段博弈o序列博弈参与者选择策略有时间先后的顺序，通常采用博弈的扩展形式来进行分析o例子：进入博弈两个企业：一个在位企业（B）和一个潜在的进入者（A）扩展形博弈不进入进入容纳商战(900,1100)(-200,600)(0,3000)AB博弈论与企业竞争企业、政府与商业环境找出纳什均衡不进入进入容纳商战（900，1100）（-200，600）(0,3000)AB博弈论与企业竞争企业、政府与商业环境逆推归纳法和逆向思维两个纳什均衡n纳什均衡之一是如果A进入市场，B就威胁选择商战，所以A不进入市场n另一个纳什均衡是A选择进入，B随之选择容纳不进入进入容纳商战（900，1100）（-200，600）(0,3000)AB博弈论与企业竞争企业、政府与商业环境一个子博弈纳什精炼均衡不进入进入容纳商战（900，1100）（-200，600）(0,3000)ABn子博弈精练均衡：A选择进入，B选择容纳是纳什均衡在博弈每个阶段没有一个博弈方可通过改变策略提高其得益博弈论与企业竞争企业、政府与商业环境n威胁与承诺空头威胁：对对手采取的行动是不需要任何成本的，因此这种威胁是不可置信的承诺：预先花费成本来严格限制自己行为，从而使威胁成为可置信的n例子：进入博弈阻止市场进入与剩余生产能力不进入进入容纳商战（900，300）（-200，600）(0,2200)AB博弈论与企业竞争企业、政府与商业环境n在进入发生前在位企业通过不可逆转的投资（800万）来形成一部分剩余生产能力，这部分生产能力在无进入者进入市场时是多余的，但在进入发生时则降低了与进入者进行商战的成本，使在位者的最优选择从容纳改变成商战n形成额外的剩余生产能力可以阻止进入，潜在进入者知道他一旦进入，价格战就必然发生，因而构成可置信的威胁n形成剩余生产能力的行动在序列博弈中常带有先发制人的意图，因此这种行动被称为事先承诺博弈不进入进入容纳商战（900，300）（-200，600）(0,2200)AB博弈论与企业竞争企业、政府与商业环境3.1.13.1.1开金矿开金矿l条件条件：甲去开采一价值：甲去开采一价值4 4万元的金矿，缺万元的金矿，缺1 1万元，乙恰万元，乙恰好有好有1 1万元可以投资。甲向乙借万元可以投资。甲向乙借1 1万元可以可开金矿，万元可以可开金矿，并并“许诺许诺”成功后与对半分成。成功后与对半分成。l问题问题：乙是否该借钱给甲？：乙是否该借钱给甲？152024/7/13相机选择和策略中的可信性问题相机选择和策略中的可信性问题不同版本的开金矿博弈分钱和打官司的可信性乙甲（0，4）（2，2）（1，0）不借借分不分开金矿博弈不借乙甲乙借不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的开金矿博弈分钱打官司都可信乙甲乙打（2，2）不分分不借借（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈分钱打官司都不可信3.1.13.1.1开金矿开金矿162024/7/13纳什均衡的问题纳什均衡的问题第三种开金矿博弈中，（不借-不打，不分）和（借-打，分）都是纳什均衡。但后者不可信，不可能实现或稳定。l结论结论：纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中可能可能是不稳定的，不能作为预测的基础。l根源根源：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题3.1.13.1.1开金矿开金矿172024/7/133.1.13.1.1开金矿开金矿l可能性可能性即甲可能成功之后不与乙分钱（分当然好），则乙损失即甲可能成功之后不与乙分钱（分当然好），则乙损失1 1万万元。元。由此，乙决策的由此，乙决策的关键关键在于他在于他是否相信是否相信甲的甲的“许诺许诺”，而结，而结局取决于甲是否局取决于甲是否遵守遵守他的他的“许诺许诺”。接下来乙可采取一些方法以使甲尽可能兑现他的许诺接下来乙可采取一些方法以使甲尽可能兑现他的许诺打官司。打官司。182024/7/133.1.13.1.1开金矿开金矿l根据自身利益最大化根据自身利益最大化原则，甲在原则，甲在轮到行为轮到行为时的唯一选择是时的唯一选择是不分不分，而乙清楚甲的行为准而乙清楚甲的行为准则，则选择则，则选择不借不借。对乙来讲，本博弈中甲有一个。对乙来讲，本博弈中甲有一个不可不可信信的肯定不会信守的的肯定不会信守的许诺许诺。l怎样使甲的许诺变为可信的呢？怎样使甲的许诺变为可信的呢？关键关键在于必须增加一在于必须增加一些对甲行为的些对甲行为的约束约束。结点，信息集。结点，信息集乙甲（0，4）（2，2）（1，0）不借借分不分开金矿博弈192024/7/133.1.13.1.1开金矿开金矿若乙采取若乙采取法律手段法律手段，即打官司保护自己的利益，则，即打官司保护自己的利益，则博弈进程如下图所示。博弈进程如下图所示。不借乙甲乙借不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的开金矿博弈分钱打官司都可信202024/7/133.1.13.1.1开金矿开金矿在本博弈中，乙的唯一选择是在本博弈中，乙的唯一选择是打官司打官司，对甲来讲，对甲来讲，乙打官司的威胁是可信乙打官司的威胁是可信的，是肯定会信守的，他最理的，是肯定会信守的，他最理智的选择就是智的选择就是分分。即，乙的策略是在第一阶段即，乙的策略是在第一阶段借借，如甲在第二阶段，如甲在第二阶段选择选择不分不分，则第三阶段选择，则第三阶段选择打打；甲的策略是如乙在第；甲的策略是如乙在第一阶段选择一阶段选择借借，则他在第二阶段选择，则他在第二阶段选择分分。在双方这样。在双方这样的策略组合下，本博弈的路径是的策略组合下，本博弈的路径是（借，分），（借，分），双方得双方得益为益为（2 2，2 2），实现有效率的理想的结果。，实现有效率的理想的结果。212024/7/133.1.2 3.1.2 先来后到先来后到在此博弈中，后进入者博弈方在此博弈中，后进入者博弈方1 1要决定要决定是否进入市场竞争，而先进入市场的博弈是否进入市场竞争，而先进入市场的博弈方方2 2有有打击打击和和不打击不打击两种选择。两种选择。12进进进进不进不进不进不进打击打击打击打击不打击不打击不打击不打击（0 0，1010）（3 3，6 6）（5 5，5 5）222024/7/133.1.2 3.1.2 先来后到先来后到根据利润最大化原则，博弈方根据利润最大化原则，博弈方2 2的唯一选择是无情的唯一选择是无情打击对手，这时打击对手，这时博弈方博弈方2 2的打击的威胁是可信的的打击的威胁是可信的。了解。了解博弈方博弈方2 2决策原则的博弈方决策原则的博弈方1 1在第一阶段只会选择在第一阶段只会选择不进不进。该博弈的结果为该博弈的结果为（0 0，1010），即先占领市场者独享利润。，即先占领市场者独享利润。232024/7/133.1.2 3.1.2 先来后到先来后到当得益变成右图情况当得益变成右图情况以后，以后，博弈方博弈方2 2的打击的的打击的威胁就不再是可信的了威胁就不再是可信的了。这样，博弈方这样，博弈方1 1在第一阶在第一阶段的合理选择当然只有进。段的合理选择当然只有进。博弈的结果选择路径为博弈的结果选择路径为（进，不打击）（进，不打击），双方得益为，双方得益为（5 5，8 8）。后进者信息多，但利润不如先进入者。后来者不一定总是从前后进者信息多，但利润不如先进入者。后来者不一定总是从前者利益中分出一部分，而可能创造更大的总利益，而先进入者的损者利益中分出一部分，而可能创造更大的总利益，而先进入者的损失也不一定很大。失也不一定很大。进进进进不进不进不进不进打击打击打击打击不打击不打击不打击不打击（0 0，1010）（3 3，6 6）（5 5，8 8）242024/7/1321于于于于汉晋春秋汉晋春秋汉晋春秋汉晋春秋有载：其时蜀南夷帅作叛，诸葛亮来到南中，百战百捷。闻知有有载：其时蜀南夷帅作叛，诸葛亮来到南中，百战百捷。闻知有有载：其时蜀南夷帅作叛，诸葛亮来到南中，百战百捷。闻知有有载：其时蜀南夷帅作叛，诸葛亮来到南中，百战百捷。闻知有一个名叫孟获的人，向为本地的夷、汉所服，于是务要生擒他。后来诸葛亮果然一个名叫孟获的人，向为本地的夷、汉所服，于是务要生擒他。后来诸葛亮果然一个名叫孟获的人，向为本地的夷、汉所服，于是务要生擒他。后来诸葛亮果然一个名叫孟获的人，向为本地的夷、汉所服，于是务要生擒他。后来诸葛亮果然擒孟获于盘东，并采马谡之策（擒孟获于盘东，并采马谡之策（擒孟获于盘东，并采马谡之策（擒孟获于盘东，并采马谡之策（襄阳记襄阳记襄阳记襄阳记：亮纳其策，赦孟获以服南方。）：亮纳其策，赦孟获以服南方。）：亮纳其策，赦孟获以服南方。）：亮纳其策，赦孟获以服南方。），让他在蜀军的营阵之间观察，问他：这支军队怎样？孟获答道：我以前，让他在蜀军的营阵之间观察，问他：这支军队怎样？孟获答道：我以前，让他在蜀军的营阵之间观察，问他：这支军队怎样？孟获答道：我以前，让他在蜀军的营阵之间观察，问他：这支军队怎样？孟获答道：我以前不知虚实，所以才会战败。如今既然承蒙你给我观看营阵，假若这军队真的祇是不知虚实，所以才会战败。如今既然承蒙你给我观看营阵，假若这军队真的祇是不知虚实，所以才会战败。如今既然承蒙你给我观看营阵，假若这军队真的祇是不知虚实，所以才会战败。如今既然承蒙你给我观看营阵，假若这军队真的祇是如此，我一定会轻易取胜。诸葛亮大笑，便释放孟获让他再战，历经七纵七擒，如此，我一定会轻易取胜。诸葛亮大笑，便释放孟获让他再战，历经七纵七擒，如此，我一定会轻易取胜。诸葛亮大笑，便释放孟获让他再战，历经七纵七擒，如此，我一定会轻易取胜。诸葛亮大笑，便释放孟获让他再战，历经七纵七擒，而诸葛亮仍然让他离开。最后孟获止而不去，并说：先生有上天之威，我等南而诸葛亮仍然让他离开。最后孟获止而不去，并说：先生有上天之威，我等南而诸葛亮仍然让他离开。最后孟获止而不去，并说：先生有上天之威，我等南而诸葛亮仍然让他离开。最后孟获止而不去，并说：先生有上天之威，我等南人不再复反了。于是蜀军会师滇池。南中平后，诸葛亮都沿用该地的渠帅领守人不再复反了。于是蜀军会师滇池。南中平后，诸葛亮都沿用该地的渠帅领守人不再复反了。于是蜀军会师滇池。南中平后，诸葛亮都沿用该地的渠帅领守人不再复反了。于是蜀军会师滇池。南中平后，诸葛亮都沿用该地的渠帅领守当地。孟获则随诸葛亮赴成都任官。终亮之世，南方不敢复反。当地。孟获则随诸葛亮赴成都任官。终亮之世，南方不敢复反。当地。孟获则随诸葛亮赴成都任官。终亮之世，南方不敢复反。当地。孟获则随诸葛亮赴成都任官。终亮之世，南方不敢复反。七擒孟获七擒孟获七擒孟获七擒孟获252024/7/13l三国时期蜀国的国君刘备死后，许多原来归属国少数民族部落都发动了叛乱，夺取蜀国很多的土地。公元225年初春，诸葛亮率领大军出发，去平息叛乱。临走的时候，马谡对诸葛亮说：“南方的少数民族依仗地形险要，离都城又远，早就不服管了。即使我们用大军把他们征服了，以后还是要闹事的。用兵的办法，主要在于攻心，丞相这次南征，只有叫南人心服，才能够长久安宁。”l马谡的话，正合诸葛亮的心意。诸葛亮不禁连连点头说：“正是此意，正是此意。”l到了南方，诸葛亮打听到孟获不但打仗勇猛，而且在南方中部地区各族中很有威望，就决心把孟获争取过来，于是下了一道命令：只许活捉孟获，不能伤害他。l诸葛亮善于用计谋，蜀军和孟获军队交锋的时候，蜀军故意败退下来。孟获仗着他人多，一股劲儿追了过去，很快就中了蜀兵的埋伏。南兵被打得四处逃散，孟获本人就被活捉了。l孟获被押到大营，心里想，这回一定没有活路了。没想到进了大营，诸葛亮立刻叫人给他松了绑，好言好语劝说他归降。但是孟获不服气，说：“我自己不小心，中了你的计，怎么能叫人心服？”诸葛亮也不勉强他，陪着他一起骑着马在大营外兜了一圈，看看蜀军的营垒和阵容。然后又孟获：“您看我们的人马怎么样？”孟获傲慢地说：“以前我没弄清楚你们的虚实，所以败了。今天承蒙您给我看了你们的阵势，我看也不过如此。像这样的阵势，要打赢你们也不难。”诸葛亮爽朗的笑了起来，说：“既然这样，咱们来个约定，如果我能抓到你七次，你就归顺蜀国，怎么样？”孟获不以为然地答应了。l孟获被释放以后，回到自己的部落，重整旗鼓，又一次进攻蜀军。但是他本是一个有勇不谋的人，哪里是诸葛亮的对手，第二次又被活捉了。诸葛亮二话没说就把孟获放回去了。l像这样又放又捉，一直把孟获捉了七次。到了孟获第七次被捉的时候，诸葛亮还要再放。孟获却不愿意走了。他流着眼泪说：“丞相七擒孟获，信守诺言，说到做到，待我可以说是仁至议尽了。我打心底里佩服，哪里能不遵守当初的约定呢？从今以后，不敢再反了。”l孟获回去以后，还说服其他部落全部投降，重新归顺蜀国。262024/7/13诸葛亮擒纵孟获孟获逃留0,1313,-1逃留0+n,13-n13+n,0+n七擒孟获七擒孟获七擒孟获七擒孟获对策：对策：对策：对策：先行决策272024/7/133.2 3.2 子博弈和逆推归纳法子博弈和逆推归纳法l动态博弈中的子博弈动态博弈中的子博弈l逆推归纳法逆推归纳法l子博弈完美纳什均衡子博弈完美纳什均衡l寡占的斯塔克博格模型寡占的斯塔克博格模型l工会和厂商的博弈工会和厂商的博弈l讨价还价博弈讨价还价博弈282024/7/13293.2 3.2 子博弈和逆推归纳法子博弈和逆推归纳法l一、子博弈：针对树型（展开型）博弈l（二）案例：虚线圈住法不借不借乙乙甲甲乙乙借借不分不分分分（1，0）不打不打打打（0，4）（1，0）（2，2）有法律保障的开金矿博弈有法律保障的开金矿博弈2024/7/1330子博弈案例：仿冒和反仿冒博弈子博弈案例：仿冒和反仿冒博弈l虚线圈住法ABBA不制止制止（-2，5）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒2024/7/133.2.1 3.2.1 动态博弈中的子博弈动态博弈中的子博弈l定义定义：子博弈即能够子博弈即能够自成一个博弈自成一个博弈的某个动态博弈的的某个动态博弈的从其某个阶段开始的从其某个阶段开始的后续阶段后续阶段，它必须有一个，它必须有一个初始信初始信息集息集，且具备进行博弈所需的各种信息。，且具备进行博弈所需的各种信息。312024/7/13l注意：注意：原博弈的初始节点开始的博弈为原博弈本身，不称原博弈的初始节点开始的博弈为原博弈本身，不称它为原博弈的子博弈；它为原博弈的子博弈；第五章将说明在不完美信息博弈中有其它的不作为第五章将说明在不完美信息博弈中有其它的不作为子博弈的起始信息集的子博弈的起始信息集的节点。节点。3.2.2 3.2.2 逆推归纳法逆推归纳法l在动态博弈中如何求解？在动态博弈中如何求解？l动态博弈的动态博弈的特点特点是：在采取某一种决策时必须对是：在采取某一种决策时必须对其后其后可能进行的子博弈可能进行的子博弈有充分的了解，这样才能很好的进有充分的了解，这样才能很好的进行博弈并得到合理的结果（基于理性和可信性，相当行博弈并得到合理的结果（基于理性和可信性，相当于对后博弈行为的合理假设）。由此，对于完全且完于对后博弈行为的合理假设）。由此，对于完全且完美信息的动态博弈其基本求解方法可美信息的动态博弈其基本求解方法可由最后阶段的子由最后阶段的子博弈逆推博弈逆推来决定采取合适的策略来决定采取合适的策略逆推归纳法逆推归纳法。322024/7/132024/7/1333决策法则决策法则l向前展望，倒后推理3.2.2 3.2.2 逆推归纳法逆推归纳法3.2.2 3.2.2 逆推归纳法逆推归纳法l定义定义：逆推归纳法就是从动态博弈的最后一个阶段或：逆推归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始，最后一个子博弈开始，逐步向前倒推逐步向前倒推以求解动态博弈以求解动态博弈的方法。的方法。l例例借借借借不借不借不借不借（2 2，2 2）（1 1，0 0）开金矿（信守）逆推第二步开金矿（信守）逆推第二步开金矿（信守）逆推第二步开金矿（信守）逆推第二步342024/7/13乙不借借（1，0）甲不分分（0，4）（2，2）乙3.2.2 3.2.2 逆推归纳法分金币逆推归纳法分金币案例案例：5 5个海盗抢到了个海盗抢到了100100颗宝石，每一颗都一样的大小和价值连城。他们颗宝石，每一颗都一样的大小和价值连城。他们决定这么分：决定这么分：1.1.抽签决定自己的号码（抽签决定自己的号码（1 1，2 2，3 3，4 4，5 5）2.2.首先，由首先，由1 1号提出分配方案，然后大家号提出分配方案，然后大家5 5人进行表决，当且仅当超过半数的人同意人进行表决，当且仅当超过半数的人同意时，按照他的提案进行分配，否则将被扔进大海喂鲨鱼。时，按照他的提案进行分配，否则将被扔进大海喂鲨鱼。3.3.如果如果1 1号死号死后，再由后，再由2 2号提出分配方案，然后大家号提出分配方案，然后大家4 4人进行表决，当且仅当超过半人进行表决，当且仅当超过半数的人同意时，按照他的提案进行分配，否则将被扔入大海喂鲨鱼。数的人同意时，按照他的提案进行分配，否则将被扔入大海喂鲨鱼。4.4.以次类推以次类推条件条件：每个海盗都是很聪明的人，都能很理智的判断得失，从而做出选择：每个海盗都是很聪明的人，都能很理智的判断得失，从而做出选择问题问题：第一个海盗提出怎样的分配方案才能够使自己的收益最大化：第一个海盗提出怎样的分配方案才能够使自己的收益最大化352024/7/133.2.2 3.2.2 逆推归纳法分金币逆推归纳法分金币逆推过程：逆推过程：1 2 3 4 5 1 2 3 4 5 0 100 0 100 99 1 0 99 1 0 97 0 2 1 97 0 2 1 97 0 1 0 2 97 0 1 0 2结果结果:(97,:(97,0,1,0,2)0,1,0,2)362024/7/133.2.2 3.2.2 逆推归纳法动态规划逆推归纳法动态规划l动态规划的理论基础是最优性原理。它是一种解决多动态规划的理论基础是最优性原理。它是一种解决多阶段决策（序贯决策）过程最优化的一种数学方法。阶段决策（序贯决策）过程最优化的一种数学方法。l应用应用：最优路径问题、资源分配问题、生产调度、库：最优路径问题、资源分配问题、生产调度、库存、装载、排序、设备更新、最优工艺等存、装载、排序、设备更新、最优工艺等 372024/7/133.2.2 3.2.2 逆推归纳法动态规划逆推归纳法动态规划它认为整个过程的它认为整个过程的最优策略最优策略有这样的有这样的特点特点：即无论过去的状：即无论过去的状态和决策如何，对于前面的决策所形成的状态而言，余下的诸决态和决策如何，对于前面的决策所形成的状态而言，余下的诸决策必定构成最优策略。这就是说，策必定构成最优策略。这就是说，任何一个完整的最优策略的子任何一个完整的最优策略的子策略总是最优的策略总是最优的。根据这个重要的原理，用动态规划方法求解一。根据这个重要的原理，用动态规划方法求解一个优化问题首先应把问题的过程分成几个相互联系的阶段，这些个优化问题首先应把问题的过程分成几个相互联系的阶段，这些阶段的状态可以用阶段的某种特征来描述，而决策过程可以通过阶段的状态可以用阶段的某种特征来描述，而决策过程可以通过状态的演变来说明状态的演变来说明。于是就可以根据问题的实际意义，找出由一。于是就可以根据问题的实际意义，找出由一个状态演变到另一状态的状态转移方程，再根据所求问题的有关个状态演变到另一状态的状态转移方程，再根据所求问题的有关效益指标，建立起能够联系效益指标，建立起能够联系局部局部与与全局全局最优性的动态规划基本方最优性的动态规划基本方程。程。382024/7/133.2.3 3.2.3 子博弈完美纳什均衡子博弈完美纳什均衡l在动态博弈中由于博弈过程是逐步深入的，这一过程在动态博弈中由于博弈过程是逐步深入的，这一过程由每个阶段所采取的策略构成，由此引出由每个阶段所采取的策略构成，由此引出“路径路径”的的概念。概念。l路径：从第一阶段开始通过每阶段一个行为，最后达路径：从第一阶段开始通过每阶段一个行为，最后达到博弈结束的一个终端各博弈方的到博弈结束的一个终端各博弈方的行为组合行为组合。l找到了路径也就找到了一个分阶段的策略组合，这一找到了路径也就找到了一个分阶段的策略组合，这一策略组合恰似一个完整的计划，计划的最终实现取决策略组合恰似一个完整的计划，计划的最终实现取决于过程中各阶段的实现。于过程中各阶段的实现。392024/7/133.2.3 3.2.3 子博弈完美纳什均衡子博弈完美纳什均衡在开金矿案例中，策在开金矿案例中，策略组合略组合（借，分）（借，分）是是一个稳定的策略组合，一个稳定的策略组合，因为如果不分，则有因为如果不分，则有乙打官司的威胁，这乙打官司的威胁，这是双方都不愿得到的结果。是双方都不愿得到的结果。“稳定稳定”意味着博弈方都不会单独意味着博弈方都不会单独改变策略，这恰似改变策略，这恰似纳什均衡纳什均衡的概念。的概念。乙打打打打不打不打不打不打（1 1，0 0）（0 0，4 4）402024/7/13不借乙甲乙借不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的开金矿博弈分钱打官司都可信3.2.3 3.2.3 子博弈完美纳什均衡子博弈完美纳什均衡l由于动态博弈与静态博弈有较大的差异，那么如何才由于动态博弈与静态博弈有较大的差异，那么如何才能使静态博弈中的能使静态博弈中的纳什均衡纳什均衡在动态博弈中亦有相应的在动态博弈中亦有相应的概念发展？概念发展？l以以开金矿开金矿为例（注意此例与以前开金矿例子的差异）为例（注意此例与以前开金矿例子的差异）412024/7/133.2.3 3.2.3 子博弈完美纳什均衡子博弈完美纳什均衡此时打官司对乙亦无好处此时打官司对乙亦无好处（此情况在现实中可能出（此情况在现实中可能出现）。在此情况中，逆推现）。在此情况中，逆推可以得出乙不借，原因在可以得出乙不借，原因在于于乙在第三阶段打官司的乙在第三阶段打官司的威胁是不可信的威胁是不可信的。由此导。由此导致致甲在第二阶段分的许诺也变为不可信甲在第二阶段分的许诺也变为不可信。结局。结局是，甲开不成金矿，乙保本，甲失去挣钱的机是，甲开不成金矿，乙保本，甲失去挣钱的机会。会。422024/7/13乙甲乙打（2，2）不分分不借借（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈分钱打官司都不可信3.2.3 3.2.3 子博弈完美纳什均衡子博弈完美纳什均衡如果按照如果按照静态博弈静态博弈的分析方法，则的分析方法，则（借，分，（借，分，打）打）的策略组合为一个的策略组合为一个纳什均衡纳什均衡，因为任何一方，因为任何一方都不会单独改变策略而降低自己的得益。这与都不会单独改变策略而降低自己的得益。这与逆逆推归纳法推归纳法得到的结论相得到的结论相矛盾矛盾，原因原因在于路径（借，分）的在于路径（借，分）的纳什均衡策略组合包含了一个不纳什均衡策略组合包含了一个不可信的威胁，即乙在第三阶段会选择打官司的行可信的威胁，即乙在第三阶段会选择打官司的行为是不可信的。为是不可信的。432024/7/133.2.3 3.2.3 子博弈完美纳什均衡子博弈完美纳什均衡由此需要对静态博弈中的纳什均衡的概念有所调整，由此需要对静态博弈中的纳什均衡的概念有所调整，即应即应满足满足：是纳什均衡，从而具有是纳什均衡，从而具有策略稳定性策略稳定性不能包含任何的不会信守的不能包含任何的不会信守的许诺或威胁许诺或威胁这样的动态博弈策略组合称为这样的动态博弈策略组合称为子博弈纳什均衡子博弈纳什均衡。442024/7/133.2.3 3.2.3 子博弈完美纳什均衡子博弈完美纳什均衡l定义（定义（SeltenSelten塞尔顿）：如果动态博弈中各博弈方的塞尔顿）：如果动态博弈中各博弈方的策略在策略在动态博弈本身动态博弈本身和和所有子博弈中所有子博弈中都构成一个纳什都构成一个纳什均衡，则称该策略组合为一个均衡，则称该策略组合为一个“子博弈完美纳什均衡子博弈完美纳什均衡”。452024/7/133.2.3 3.2.3 子博弈完美纳什均衡子博弈完美纳什均衡l注意，用逆推归纳法所得到的解应为子博弈完美纳什均衡。注意，用逆推归纳法所得到的解应为子博弈完美纳什均衡。l动态博弈所应动态博弈所应注意注意的两点：的两点：要求各博弈方的策略对每阶段每种可能的情况都设定要求各博弈方的策略对每阶段每种可能的情况都设定一个行为方案。其意义在于避免出现不会信守的许诺或一个行为方案。其意义在于避免出现不会信守的许诺或威胁，从而使子博弈完美纳什均衡可以用。威胁，从而使子博弈完美纳什均衡可以用。假定所有博弈方都是理性的且不会犯错误的。假定所有博弈方都是理性的且不会犯错误的。462024/7/133.2.3 3.2.3 子博弈完美纳什均衡子博弈完美纳什均衡与实际情况的差异：与实际情况的差异：后续可能性后续可能性太多而无法分析，于是考虑仅知道有限后太多而无法分析，于是考虑仅知道有限后续阶段的情况？续阶段的情况？许诺有限非理性许诺有限非理性，如何考虑？比如假设非理性的次数，如何考虑？比如假设非理性的次数小于等于小于等于k k？下棋下棋K K叉树算法叉树算法博弈构成的博弈构成的“长短长短”与稳定性与稳定性，不可预测性等，不可预测性等472024/7/133.2.4 3.2.4 寡占的斯塔克博格模型寡占的斯塔克博格模型l它是它是古诺模型古诺模型在在动态博弈动态博弈中的体现中的体现l例如，在古诺模型中二厂商例如，在古诺模型中二厂商同时同时决定产量决定产量q q1 1，q q2 2，Q=qQ=q1 1+q q2 2，市场出清价格市场出清价格P=8P=8Q Q，边际成本边际成本C C1 1=C=C2 2=2=2。解得解得q q1 1*=q q2 2*=2=2，总得益为总得益为4+4=84+4=8。482024/7/133.2.4 3.2.4 寡占的斯塔克博格模型寡占的斯塔克博格模型l然而，许多实际问题为各厂商然而，许多实际问题为各厂商进入市场有先后进入市场有先后，尤其是，尤其是厂家有强弱之分，且后一厂商（跟随者）在决策时是看厂家有强弱之分，且后一厂商（跟随者）在决策时是看着前一厂商的选择的，由此引出着前一厂商的选择的，由此引出斯塔克博格模型斯塔克博格模型。l斯塔克博格模型与古诺模型相比，唯一的不同是前者有斯塔克博格模型与古诺模型相比，唯一的不同是前者有一个选择的次序问题，其他如博弈方、策略空间和得益一个选择的次序问题，其他如博弈方、策略空间和得益函数等完全都是相同的。函数等完全都是相同的。492024/7/133.2.4 3.2.4 寡占的斯塔克博格模型寡占的斯塔克博格模型l设两寡头为厂商设两寡头为厂商1 1和厂商和厂商2 2；他们的策略空间（；他们的策略空间（q q1 1、q q2 2的集的集合）都是合）都是0 0，Q Qmaxmax）中的所有实数，其中中的所有实数，其中Q Qmaxmax可看做不至可看做不至于使价格降到亏本的最大限度产量，或者是该产量与厂于使价格降到亏本的最大限度产量，或者是该产量与厂商生产能力之间的最大值；厂商商生产能力之间的最大值；厂商1 1为先进入企业，设价格为先进入企业，设价格函数函数，边际生产成本，边际生产成本，固定成本为零。，固定成本为零。502024/7/133.2.4 3.2.4 寡占的斯塔克博格模型寡占的斯塔克博格模型l用逆推法分析该博弈根据逆推法的思路，先分析第二个阶段厂商2的决策。在厂商2开始决策时，厂商1的选择q1实际上已经决定且为厂商2知道。因此，对于厂商2来说，相当于在给定q1的情况下，求使u2达到最大值的q2.即对u2求极值。512024/7/13令厂商2的1阶导数等于0，求得等式为该式表明厂商2根据场上1不同的产量来决定自己的最优产量，实质上这是厂商2的反应函数。3.2.4 3.2.4 寡占的斯塔克博格模型寡占的斯塔克博格模型厂商1知道厂商2的这种决策思路，因此在决定q1时，就知道厂商2会按上式进行针对性的决策。因此，可将上式直接代入其利润函数，为可以很容易地求出上式的最大值，为3.2.4 3.2.4 寡占的斯塔克博格模型寡占的斯塔克博格模型l由厂商1的最优产量决策以及厂商2的最优反应函数根据上面两个表达式，可以求出厂商2的最优产量及最优产量下的利润水平3.2.4 3.2.4 寡占的斯塔克博格模型寡占的斯塔克博格模型l利用斯塔克博格模型有关假设数据，可以算出二寡头古诺模型中，二厂商的均衡价格、产量、利润（过程从略）。结果与斯塔克博格模型对照，见表2-3厂商产量厂商利润市场出清价格古诺模型(2,2)(4,4)4斯塔克博格模型(3,1.5)(4.5,2.25)3.5表表2-3 古诺模型和斯塔克模型对照古诺模型和斯塔克模型对照斯塔克博格模型斯塔克博格模型3.2.4 3.2.4 寡占的斯塔克博格模型寡占的斯塔克博格模型l利用斯塔克博格模型有关假设数据，可以算出二寡头古诺模型中，二厂商的均衡价格、产量、利润（过程从略）。结果与斯塔克博格模型对照，见表2-3厂商产量厂商利润市场出清价格古诺模型(2,2)(4,4)4斯塔克博格模型(3,1.5)(4.5,2.25)3.5表表2-3 古诺模型和斯塔克模型对照古诺模型和斯塔克模型对照斯塔克博格模型斯塔克博格模型3.2.4 3.2.4 寡占的斯塔克博格模型寡占的斯塔克博格模型3.2.4 3.2.4 寡占的斯塔克博格模型寡占的斯塔克博格模型以上模型说明：以上模型说明：在在信息不对称信息不对称的博弈中，的博弈中，信息较多的博弈方信息较多的博弈方（如厂商（如厂商2 2决策之前已知厂商决策之前已知厂商1 1的实际选择，因此他有较多的信的实际选择，因此他有较多的信息）息）不一定能得到较多的得益不一定能得到较多的得益。原因原因：先行为或信息较少者认为后行为方或知识较多：先行为或信息较少者认为后行为方或知识较多者作为理性的博弈方，不可能为了公平或赌气而采取者作为理性的博弈方，不可能为了公平或赌气而采取任何对双方不利的行为，从而先发制人选择比同静态任何对双方不利的行为，从而先发制人选择比同静态决策时更大的产量而获得利益和好处。决策时更大的产量而获得利益和好处。572024/7/13先发优势建立信誉先发优势建立信誉1.在序列博弈中，首先作出策略选择和采取行动的博弈方可以占据有利地位，获得较多利益。2.首先行动优势的原因在于它造成了一种既成事实，为使利润最大化，另一方必须根据首先行动一方的策略来选择自己的策略。IBM公司曾经对市场公开承诺，对一些刚刚推向市场的新型电脑将在二、三年后以很低的价格销售。这似乎不可思议，因为既然二、三年后会降价，许多人就可能推迟购买，这将降低IBM的销量。但实际上，IBM公司这样做是为了阻止其他电脑公司模仿它的产品，电脑市场上存在大量的仿造者，它们往往紧跟在IBM公司之后推出仿造品，价格比IBM的电脑还低10%到30%。然而，当IBM公司作出这样的承诺之后，对那些仿造者来说，案例 IBM的降价承诺582024/7/13仿造IBM的产品就变得无利可图，因为等他们花费不小的成本仿造出这种产品并推向市场的时候，IBM将很快或已经降低了售价。由于电脑技术发展的速度很快，对IBM来说，作出这一承诺实际上并不需要花费太大的成本，因为这种价格降低的趋势是必然的。由于承诺降价，IBM当前的电脑销量也许会减少，但降价承诺却在很大程度上遏制了仿造品，这是值得的。592024/7/13案例 IBM的降价承诺先发优势建立信誉先发优势建立信誉破釜沉舟破釜沉舟秦朝末年，秦国大将章邯率领数10万人攻打赵国的都城巨鹿。赵国向楚国求援，楚王派项羽率兵救赵。项羽带领人马渡过漳河后，马上命令弄沉渡船，每人只带三天的粮食。将士们知道后退的路没有了，个个奋勇杀敌，终于解了赵国之危。史记卷七：“项羽乃悉引兵渡河，皆沉船，破釜甑，烧庐舍持三日粮，以示士卒必死，无一还心。”602024/7/13l秦朝末年，秦军大将章邯攻打赵国。赵军退守巨鹿(今河北平乡西南)，并被秦军重重包围。楚怀王于是封宋义为上将军，项羽为副将率军救援赵国。l宋义引兵至安阳(今山东曹县东南)后，接连46天按兵不动，对此项羽十分不満，于是要求进军决战，解困赵国。但宋义却希望秦赵两军交战后待秦军力竭之后才进攻。l但此时军中粮草缺乏士卒困顿，而宋义仍旧饮酒自顾，项羽见此忍无可忍，进营帐杀了宋义，并声称他叛国反楚。于是将士们则拥项羽为上将军。项羽杀宋义的事，威震楚国，名闻诸侯。l随后，他率所有军队悉数渡黄河前去营救赵国以解巨鹿之围。项羽在全军渡黄河之后他下令把所有的船只凿沉，打破烧饭用的锅，烧掉自己的营房，只带三天干粮，以此表决一死战，没有一点后退的打算。l正是这样已无退路的大军到了巨鹿外围，并包围了秦军和截断秦军外联的通道。楚军战士以一当十，杀伐声惊天动地。经过九次的激战，楚军最终大破秦军。而前来增援的其他各路诸侯却都因胆怯，不敢近前。楚军的骁勇善战大大提高了项羽的声威。以至战胜后，项羽于辕门接见各路诸侯时，各诸侯皆不敢正眼眼看项羽。612024/7/13章邯逃跑努力项羽软弱勇敢1,0.5-1,0.3软弱勇敢0.1,-10,1破釜沉舟破釜沉舟破釜沉舟破釜沉舟对策：对策：对策：对策：0,1章邯项羽项羽逃跑努力破釜沉舟0.8,0622024/7/13后发劣势（美国后发劣势（美国沃森沃森)后发展国家模仿发达国家的技术容易而模仿制度难，后发展国家倾向模仿技术而获得发展，但由于制度模仿的惰性，使长期发展成为不可能。后发劣势的观点：632024/7/133.2.5 3.2.5 工会与厂商的博弈工会与厂商的博弈lLeontief1964Leontief1964年提出的一个工会与厂商之间关于工资与年提出的一个工会与厂商之间关于工资与雇佣的博弈模型。雇佣的博弈模型。l条件条件：假设完全由工会决定工资，而厂商则根据工资的：假设完全由工会决定工资，而厂商则根据工资的高低来决定雇佣工人的数量。高低来决定雇佣工人的数量。l注意，此时应有一个注意，此时应有一个均衡解均衡解，原因在于工资过高则雇佣，原因在于工资过高则雇佣的人数就会减少；而如果人数过多的，则工资过少亦非的人数就会减少；而如果人数过多的，则工资过少亦非工会的希望，那就一定会存在一个较合适的值，促使工工会的希望，那就一定会存在一个较合适的值，促使工资和人数都比较合适。资和人数都比较合适。642024/7/133.2.5 3.2.5 工会与厂商的博弈工会与厂商的博弈l l工工会会的的目目标标就就是是求求出出适适合合的的工工资资和和人人数数，其其效效用用函函数数应应为为工工资资W W和和人人数数L L两两者者的的函函数数，工工会会的的的的决决策策就就是是如如何何选选择择W W*,使使l l厂商厂商关心的只有一个目标，关心的只有一个目标，即利润最大化。即利润最大化。l l用逆推归纳法来求解，注意到此处只给出了示意性函数，用逆推归纳法来求解，注意到此处只给出了示意性函数，在在实实际际问问题题上上可可以以构构造造对对应应的的函函数数，并并可可得得到到相相应应的的工工会会的的无无差差异异曲线曲线。652024/7/133.2.5 3.2.5 工会与厂商的博弈工会与厂商的博弈先由工会决定工资率，再由厂商决定雇用多少劳动力RL0W L厂商的反应函数R(L)斜率为WLW0工会的误差异曲线662024/7/133.2.6 3.2.6 讨价还价博弈三阶段讨价还价博弈讨价还价博弈三阶段讨价还价博弈l条件条件：两个人就如何分割：两个人就如何分割1 1万元进行谈判，规则如下图万元进行谈判，规则如下图所示所示672024/7/13三回合讨价还价112不接受，出S接受不接受，出S2接受出S13.2.6 3.2.6 讨价还价博弈三阶段讨价还价博弈讨价还价博弈三阶段讨价还价博弈每个阶段包括一方提出一个方案和另一方选择是否接受每个阶段包括一方提出一个方案和另一方选择是否接受该方案。每个阶段的费用（如谈判成本，利息等）导致收益减该方案。每个阶段的费用（如谈判成本，利息等）导致收益减少，少，折扣率折扣率为为，010 2 2（10000-S10000-S）。）。-同样的分析可应用于甲在第一阶段的策略，即甲在第一阶段同样的分析可应用于甲在第一阶段的策略，即甲在第一阶段给乙给乙（10000-S10000-S），甲的收益甲的收益s s1 110000-10000-（10000-10000-SS）由此分析，由此分析，双方的得益双方的得益为为（10000-10000 10000-10000+2 2S S，10000-10000-2 2S S），），这是双方都比较这是双方都比较好的均衡解，即可以在第一阶段结束。好的均衡解，即可以在第一阶段结束。712024/7/133.2.6 3.2.6 讨价还价博弈三阶段讨价还价博弈讨价还价博弈三阶段讨价还价博弈l讨论讨论：第三阶段甲的出价第三阶段甲的出价S S是双方已知的，如果不知道，是双方已知的，如果不知道，结果如何？结果如何？如果如果S S为如何值乙却必须接受，则为如何值乙却必须接受，则S S1000010000是合理是合理的，于是的，于是S S1 11000010000（1-+1-+2 2），），乙的收益为乙的收益为1000010000（-2 2）。）。722024/7/133.2.6 3.2.6 讨价还价博弈三阶段讨价还价博弈讨价还价博弈三阶段讨价还价博弈l导致最后得益取决于导致最后得益取决于-2 2的大小，的大小，-2 2越大甲的越大甲的收益比例越小，乙的则越大。考察函数收益比例越小，乙的则越大。考察函数-2 2，其在其在0.50.5时，取极大值时，取极大值0.250.25；当；当0.50.511时，随时，随的增的增大，甲的收益增加，乙的收益减少；当大，甲的收益增加，乙的收益减少；当000.50.5时，时，随随的增大，甲的收益减少，乙的收益增加。的增大，甲的收益减少，乙的收益增加。l结论结论：谈判阶段越多，甲就会损失：谈判阶段越多，甲就会损失-2 2，这是乙可这是乙可以利用的。仅当以利用的。仅当0 0时，甲不怕与乙进行谈判。时，甲不怕与乙进行谈判。732024/7/13三回合讨价还价博弈结果的讨论三回合讨价还价博弈结果的讨论3.2.6 3.2.6 讨价还价博弈三阶段讨价还价博弈讨价还价博弈三阶段讨价还价博弈3.2.6 3.2.6 讨价还价博弈无限阶段讨价还价博弈讨价还价博弈无限阶段讨价还价博弈l奇数由甲提方案（不接受）；偶数由乙提方案（不接奇数由甲提方案（不接受）；偶数由乙提方案（不接受）。如此下去对双方都没有利益，只有损失。受）。如此下去对双方都没有利益，只有损失。l注意注意，在这种情况下，无法用逆推归纳法。，在这种情况下，无法用逆推归纳法。19841984年，年，ShakedShaked和和SuttonSutton提出一个解决思路，实际上甲乙是轮提出一个解决思路，实际上甲乙是轮流提方案的，那么可用如下流提方案的，那么可用如下思路思路来处理：对一个无限来处理：对一个无限阶段博弈，从第三阶段开始（如果可以达到的话），阶段博弈，从第三阶段开始（如果可以达到的话），还是从第一阶段开始，结果应该是完全一样的。还是从第一阶段开始，结果应该是完全一样的。752024/7/133.2.6 3.2.6 讨价还价博弈无限阶段讨价还价博弈讨价还价博弈无限阶段讨价还价博弈l由此可推出（在理性的前提下）第一阶段结果与第三阶由此可推出（在理性的前提下）第一阶段结果与第三阶段结果应该是一样的。（此处实际上假设了收敛，由段结果应该是一样的。（此处实际上假设了收敛，由001w(s)-s即即w(E)w(s)+E-s（努力的激励相容约束）努力的激励相容约束）时，代理人会选择努力。时，代理人会选择努力。反之，如果反之，如果w(s)-sw(E)-E（偷偷懒的激励相容约束）时，代理懒的激励相容约束）时，代理人会选择偷懒。人会选择偷懒。2。第二阶段代理人是否接受委托。第二阶段代理人是否接受委托的选择。选择接受的条件：的选择。选择接受的条件：w(E)-E0,w(s)-s0;称为参与约称为参与约束条件。既接受委托的基本条束条件。既接受委托的基本条件。件。3。若第。若第2阶段接受的情况下，有阶段接受的情况下，有两种情况：两种情况：l接受接受拒绝拒绝R(E)-w(E),w(E)-ER(0),0(a)代理人的选择代理人的选择ll接受接受拒绝拒绝R(s)-w(s),w(s)-sR(0),0(b)代理人的选择代理人的选择22利用逆推归纳法求解子博弈纳什均衡解利用逆推归纳法求解子博弈纳什均衡解1。先看第三阶段代理人是否努力的选择。先看第三阶段代理人是否努力的选择782024/7/13激励相容约束激励相容约束参与约束3.2.7委托人代理理论（信息经济学）委托人代理理论（信息经济学）a.如果如果R(E)-w(E)R(0),委托人选委托人选择委托，反之则否。择委托，反之则否。b.如果如果R(s)-w(s)R(0),委托人选委托人选择委托，反之则否。择委托，反之则否。子博弈完美纳什均衡子博弈完美纳什均衡l委托委托不委托不委托R(E)-w(E),w(E)-ER(0),0(a)委托人的选择（委托人的选择（1努力）努力）ll委托委托不委托不委托R(s)-w(s),w(s)-sR(0),0(b)委托人的选择（委托人的选择（1偷懒）偷懒）11792024/7/13二二有不确定性但可监督的委托有不确定性但可监督的委托代理人博弈代理人博弈l代理人的努力成果有不确定性，代理人的努力成果有不确定性，但委托人对代理人能够完全监但委托人对代理人能够完全监督。督。l产出有不确定性，风险完全由产出有不确定性，风险完全由委托人承担，与代理人无关，委托人承担，与代理人无关，根据代理人的工作情况而不是根据代理人的工作情况而不是工作成果支付报酬。工作成果支付报酬。l代理人的工作成果的不确定性代理人的工作成果的不确定性直接影响的只有委托人的选择，直接影响的只有委托人的选择，不会影响代理人的选择，但会不会影响代理人的选择，但会有间接影响。有间接影响。l委托委托不委托不委托ll接受接受拒绝拒绝0,0ll努力努力偷懒偷懒0,0ll高产（高产（0.9)低产（低产（0.1)l高产高产(0.1)低产低产（0.9)10-w(E),w(E)-E10-w(s),w(s)-s20-w(E),w(E)-E20-w(s),w(s)-s3.2.7委托人代理理论（信息经济学）委托人代理理论（信息经济学）12200802024/7/13子博弈完美纳什均衡子博弈完美纳什均衡l努力的激励相容约束条件：努力的激励相容约束条件：w(E)-Ew(s)-sl偷懒的激励相容约束条件：偷懒的激励相容约束条件：w(s)-sw(E)-El代理人接受委托的条件：努力的参与约束：代理人接受委托的条件：努力的参与约束：w(E)-E0；偷懒的参与约束：偷懒的参与约束：w(s)-s0l委托人愿意委托的条件：代理人努力时，当委托人愿意委托的条件：代理人努力时，当0.920-w(E)+0.110-w(E)0时委托，否则不委托。代理人时委托，否则不委托。代理人偷懒时，当偷懒时，当0.120-w(s)+0.910-w(s)0时委托，时委托，否则不委托。否则不委托。二二有不确定性但可监督的委托有不确定性但可监督的委托代理人博弈代理人博弈812024/7/13激励相容约束激励相容约束参与约束三三有不确定性且不可监督的委托人有不确定性且不可监督的委托人代理人博弈代理人博弈l代理人的工作成果有不确代理人的工作成果有不确定性定性l委托人无法监督代理人的委托人无法监督代理人的工作工作l委托人不可能根据代理人委托人不可能根据代理人的工作情况支付报酬，只的工作情况支付报酬，只能根据代理人的工作成果能根据代理人的工作成果支付报酬，除非支付固定支付报酬，除非支付固定报酬报酬委托委托不委托不委托0,0接受接受不接受不接受努力努力偷懒偷懒0,0高产高产(0.1)低产低产(0.9)高产高产(0.9)低产低产(0.1)10-w(10),w(10)-E10-w(10),w(10)-s20-w(20),w(20)-E20-w(20),w(20)-s1220822024/7/13三三有不确定性且不可监督的委托人有不确定性且不可监督的委托人代理人博弈代理人博弈1努力的激励相容约束：努力的激励相容约束：0.9w(20)-E+0.1W(10)-E0.1w(20)-s+0.9w(10)-s2代理人接受的代理人接受的参与约束：参与约束：0.9w(20)-E+0.1W(10)-E03委托人对代理人的决策思路是清楚的，他能判断出代理委托人对代理人的决策思路是清楚的，他能判断出代理人是否努力。当人是否努力。当0.920-w(20)+0.110-

展开阅读全文

第三讲完全且完美信息动态博弈a讲义课件

最新文档