中级微观经济学 博弈论

上传人:san****019 文档编号:20302161 上传时间:2021-03-05 格式:PPT 页数:23 大小:261.75KB
返回 下载 相关 举报
中级微观经济学 博弈论_第1页
第1页 / 共23页
中级微观经济学 博弈论_第2页
第2页 / 共23页
中级微观经济学 博弈论_第3页
第3页 / 共23页
点击查看更多>>
资源描述
1 第九讲 博弈论 2 博弈论 完全信息静态博弈:纳什均衡 完全信息动态博弈:子博弈精炼纳什均衡 不完全信息静态博弈:贝叶斯纳什均衡 不完全信息动态博弈:精炼贝叶斯均衡 3 博弈的分类及对应的均衡概念 静态 动态 完全信息 完全信息静态博弈; 纳什均衡; 纳什( 1950, 1951) 完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾( 1965) 不完全信息 不完全信息静态博弈; 贝叶斯纳什均衡; 海萨尼( 1967-1968) 不完全信息动态博弈; 精炼贝叶斯纳什均衡; 泽尔腾( 1975), Kreps和 Wilson ( 1982), Fudenberg 和 Tirole( 1991) 行动顺序 信息 4 博弈论与策略行为( 1):学科概念 博弈论( Game Theory)又名对策论,游戏论。顾名 思义,是一门研究互动关系的游戏中参与者各自选择 策略的科学,换言之,是研究机智而理性的决策者之 间冲突及合作的学科。博弈论把这些复杂关系理论化, 以便分析其中的逻辑和规律,并对实际决策提供指导 或借鉴。 一个所谓游戏至少需要三个要素:( 1)博弈或游戏 参加者。博弈论分析假定参与者都是机智而理性的。 ( 2)行动或策略空间。博弈参与者必须知道他自己 及其对手伙伴的策略选择范围,并了解各种策略之间 的因果关系。( 3)有可评价优劣高下的决策行为结 果。博弈论用数字表示这类结果,并称之为支付 ( Payoff).上述 3部分描述了一个博弈的规则或结构。 5 博弈论与策略行为( 2):支付矩阵 可以用支付矩阵( Payoff Matrix,又称得益矩阵,收益矩阵,赢 得矩阵等)来描述一个博弈结构。下面这个简单的支付矩阵中, 有两个参与者厂商 A和厂商 B; 它们各自可以选择两种策略,分 别用“左右”和“上下”来标识(它们可以表示生产或不生产 某种商品,提高或不提高价格,做不做广告的选择等);数字 表示双方在不同策略选择组合下各自得到的支付,较大数字代 表较大利益或效用。例如,在厂商 A和 B分别选择上和左代表的 策略时,左上角方框的数字“ 1, 2”表示 A和 B分别得到的支付。 同理, A和 B分别选择策略下和右时,它们分别得到右下角方框 数字“ 1, 0”代表的支付。 1, 2 1, 0 2, 1 0, 1 左 上 右 下 厂商 B 厂商 A 6 博弈论与策略行为( 3):支配策略 由于游戏参与者试图实现自身利益最大化并具有机智而理性的决 策能力,加上信息方面的假定,所以上述支付矩阵表示的博弈具 有一个简单而确定的结果。从厂商 A角度来说,它采取策略“下” 而得到的支付总是好于“上”( 2, 1分别对 1, 0)。同样,对于 B来说,选择策略“左”得到的利益总是优于“右”( 1, 2分别 对 0, 1)。因此,我们可以确定预期均衡选择策略是 A选择“下” 而 B选择“左”的策略。 这一博弈中每个参与者都存在一个支配策略( Dominant Strategy, 又称占优或超优策略 )。 不管其它参与者如何选择,每个局中人 自有的那个最优选择称作支配策略,由此实现的均衡是支配均衡 (又称 占优或超优均衡) 。 1, 2 1, 0 2, 1 0, 1 左 上 右 下 厂商 B 厂商 A 7 博弈论与策略行为( 4):囚徒困境 下面支付矩阵表示著名的“囚徒困境( Prisoners Dilemma)”游戏。 从博弈论角度看,这是一个存在支配均衡的博弈:因为对囚犯 A, B来说,无论对方如何选择“坦白”都是各自的最优选择。 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保 持沉默,然而,由于猜忌,试图获得更大好处( 3个月刑期)等 竞争性动机阻碍了它们达到更好的互利选择,它们面临“囚徒困 境”。我们将看到,寡头垄断厂商经常面临类似的困境。 囚徒困境告诉我们,不满足纳什均衡的协议是无效的。 A坐 3年牢 B坐 3年牢 A坐 1年牢 B坐 1年牢 A坐 10年牢 B坐 3个月牢 A坐 3个月牢 B坐 10年牢 坦白 坦白 保持沉默 保持 沉默 囚犯 B 囚犯 A 8 完全信息静态博弈:纳什均衡 支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵 表示的博弈中,厂商 A, B在选择做广告问题上存在的策略关系。其中厂商 A 没有支配策略。因为 A的最佳决策取决于 B的选择。例如,当 B选择做广告时, A应当选择做广告,由此得到 10而不是 6的支付得益;然而,当 B选择不做广告 时, A应当选择不做广告,从而得到 20而不是 15的支付得益。假定两个厂商需 要同时决策, A应当如何决策? 解答这一问题, A需要把自己放在 B的位置,从 B的角度看什么是最好的选择, 并在此基础上考虑自己的选择。支付矩阵表明 B有一个支配策略:不论 A选择 如何, B选择做广告时利益较大( 5, 8对 0, 2),因而 A可以判断 B会选择做 广告。而在 B做广告时, A应当选择做广告。因而,均衡结局是双方都做广告。 10, 5 20, 2 6, 8 15, 0 做广告 不做广告 厂商 B 厂商 A 做广告 不做广告 9 完全信息静态博弈:纳什均衡 上述均衡结果被称作纳什均衡 (The Nash Equilibrium)。纳什均衡 指一组给定对手行为前提下个对各博弈方存在的最佳选择;在纳 什均衡状态下,只要其它参与者不变换策略选择,任何单个参与 者不可能单方面通过变换策略来提高他的所获支付。美国数学家 和统计学家纳什( Nash)50年代提出这一概念,所以称作纳什均 衡。 在上面广告策略关系事例中,给定厂商 B做广告的策略, A所能 做的一个最好选择是做广告;而当 A做广告时, B的选择仍是它 能做的最好的。因而,纳什均衡条件得到满足。 它与支配策略均衡的区别在于:在纳什均衡下,“我(你)所做 的是 给定 你(我)的选择我(你)所能做的最好的”,而支配均 衡下, “我(你)所做的是 不论 你(我)的选择我(你)所能做 的更好的”。支配均衡必然是纳什均衡,但纳什均衡未必是支配 均衡。 10 完全信息静态博弈:纳什均衡 一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策 略),有时又可能不存在纳什均衡。下面左表存在两个纳什均衡: 其中“上,左”是纳什均衡( A选上,则 B选左;且 B选左时 A仍 应选上);“下,右”也是纳什均衡( A选下,则 B选右;且 B选 右时 A仍应选下)。如没有更多信息,则无法判断均衡在什么位 置。右表没有纳什均衡。如 A选“上”, B则选“左”;然而当 B 选“左”时, A却应当选“下”。反之, A选“下”时, B应选 “右”;然而当 B选右时, A又应选“上”。没有均衡点。 2, 1 1, 2 0, 0 0, 0 左 上 右 下 局中人 B 局中人 A (左) 0, 0 -1, 3 1, 0 0, -1 左 上 右 下 局中人 B 局中人 A (右) 11 纳什均衡举例:智猪博弈 在这一例子中,无论大猪选择 “ 按 ” 还是 “ 等 待 ” ,小猪都有一个占优策略 “ 等待 ” 。在给定 小猪选择 “ 等待 ” 的条件下,打住的最优选择只 能是 “ 按 ” 。所以,纳什均衡就是:大猪按,小 猪等待,各得 4个单位。多劳者不多得。 想一想,在经济现实中智猪博弈的例子。 5, 1 4, 4 9, -1 0, 0 小猪 按 等待 大猪 按 等待 12 纳什均衡举例:性别战 这个博弈中有两个纳什均衡: (足球,足球), (芭蕾,芭蕾)。究竟哪一种纳什均衡会实际发 生?也许一次一次,形成默契;也许由先动优势 形成惯例。 2, 1 0, 0 0, 0 1, 2 女 足球 芭蕾 男 足球 芭蕾 13 纳什均衡举例:斗鸡博弈 在这个博弈中,有两个纳什均衡:如果一方进, 另一方的最优战略就是退。两人都进或都退都不 是纳什均衡。但是,就是谁会退下来呢? -3, -3 2, 0 0, 2 0, 0 B 进 退 A 进 退 14 博弈论与策略行为:重复博弈 上面讨论的“囚徒的困境”暗含的几个假定是静态的一次性博弈, 结果陷入了个体理性决策导致集体非理性结果的困境。现在我们 改变假定条件,讨论博弈可以多次进行的重复博弈( Repeated Game)。这时囚犯同时选择不交代有可能成为纳什均衡点。 因为重复性博弈中选择坦白的机会成本太高,可能成为不利的选 择。例如, A有机会与 B组成策略联盟,并对 B宣布如下方针:我 将选择沉默,并要求你也如此来增进各自利益;然而,如果你半 途背叛选择坦白,我从下一阶段游戏开始便一直采取坦白。这一 方针与 A利益一致,因而是可信的。从 B角度来看,如和 A合作, 可在每阶段得到 1年监禁的较好结果;如中途变卦,固然当期可 得一次 3个月的更好结果,但此后便每次面临 3年监禁后果,显然 是不利的。因而,重复性博弈中,”沉默 +沉默“点可能成为对 双方最佳选择,因而成为纳什均衡点。 由于博弈条件由一次 性变为重复性,均衡状态随之发生变化。 15 博弈论与策略行为:序列博弈 至此讨论的博弈是参与者同时选择。在序列博弈( Sequential Game)中,各博弈方先后依次行动。下面支付矩阵描述了一个博 弈,如果同时行动,它有两个纳什均衡点(“甜,咸”与“咸, 甜”)。假定厂商 A可以先推出甜饼干(如较快投入生产),我 们就有了序列博弈: A先作决策, B随后选择。 A决策时必须考虑 竞争者的理性反应:它知道不论自己推出那种饼干, B出于自身 利益会推出另一种。因而 A推出甜饼干, B在给定 A决策时选择咸 饼干;给定 B的选择 A的选择仍然最佳。结果两个纳什均衡点收 敛为一个(下,左)。其中 A由于具有先行者优势( First Movers Advantage)而得到较大利益, -5, -5 -5, -5 20, 10 10, 20 咸饼干 咸饼干 甜饼干 甜饼干 厂商 B 厂商 A 16 完全信息动态博弈:子博弈精炼纳 什均衡 市场进入阻挠:这个博弈中有两个纳什均衡,即(进入, 默许)和(不进入,斗争)。但是显然,斗争在这里是一 个不可置信的威胁。因为一旦进入者选择进入,在位者并 不会真的选择斗争,而会默许。 40, 50 -10, 0 0, 300 0, 300 在位者 默许 斗争 进入者 进入 不进入 17 完全信息动态博弈:子博弈精炼纳什均衡 完全信息下动态博弈的均衡,子博弈精炼纳什均衡就是将 纳什均衡中包含的不可置信的威胁战略剔除出去。 我们用扩展型来表述这种博弈形式。扩展型的表述有五个 因素组成 ( 1)参与人,( 2)每个参与人选择行动的时点, ( 3)每个参与人在每次行动时可供选择的行动集合,( 4) 每个参与人在每次行动时有关对手过去行动选择的信息, ( 5)支付函数。 下面是扩展型的形象化表述博弈树。 进入者 进入 不进入 在位者 合作 斗争 40, 50 -10, 0 0, 300 18 完全信息动态博弈:子博弈精炼纳什均衡 在动态博弈中,如果所有以前的行动是“共同知识”,那 么给定历史,从每一个行动选择开始至博弈结束又构成一 个博弈,称为“子博弈”。 一个纳什均衡称为精炼纳什均衡,当只当参与人的战略在 每一个子博弈中都构成纳什均衡。即组成精炼纳什均衡的 战略必须在每一个子博弈中都是最优的。 不可置信的威胁又引出信息经济学中一个很重要的概念, 即“承诺行动”。它是当事人使自己的威胁战略变得可置 信的行动。 19 不完全信息静态博弈:贝叶斯纳什均衡 在上例中,如果进入者实际上并不完全了解在位者的生产 函数,成本函数及偏好,这就是不完全信息博弈。如果在 位者的成本函数有两种可能,对应于这两种情况的支付矩 阵分别如下面两表所示。 40, 50 -10, 0 0, 300 0, 300 30, 100 -10, 140 0, 400 0, 400 在位者 默许 斗争 进入 不进入 进入者 在位者 默许 斗争 进入 不进入 进入者 市场进入:高成本情况 市场进入:低成本情况 20 不完全信息静态博弈:贝叶斯纳什均衡 海萨尼转换:引入一个虚拟的参与人 -“自然”,由它选 择参与人的“类型”。被选择的参与人只清楚自己的真实 类型,却不清楚其他参与人的真实类型。但是,各种可能 性的概率分布是一种“共同知识”。在上例中,自然首先 选择了在位者的类型,进入者仅知道在位者是高成本和低 成本的可能性是多少。 贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己 的类型和别人类型的概率分布的情况下,每个参与人的期 望效用达到了最大化,也就是说,没有人有积极性选择其 他战略。 在上例中,高成本可能性为 x,低成本为 1-x。选择不进入 的期望利润为零。则进入者选择进入的期望利润为 40 x+(- 10)(1-x),选择不进入的期望利润为零。则只有在 x0.2时, 进入者会选择进入。 21 不完全信息静态博弈举例:求爱博弈 如果求爱者品德优良的概率为 x。求爱者知道这个 x为多少, 那么他求爱你接受时你的期望效用为 100 x+(-100)(1-x),你 不接受时你的期望效用为零。当 x0.5时,你接受才是最 优选择。所以,如果 x0.5,贝叶斯均衡是:求爱者求爱, 你接受;当 x0.5时,贝叶斯均衡是求爱者不求爱,你不 接受。因为此时他知道他求爱会被你拒绝,这种 lose face 的事情是不会干的 100, -100 -50, 0 0, 0 0, 0 100, 100 -50, 0 0, 0 0, 0 你 接受 不接受 求爱 不求爱 求爱者 你 接受 不接受 求爱 不求爱 求爱者 品德优良者求爱 品德恶劣者求爱 22 不完全信息动态博弈:精炼贝叶斯均衡 精炼贝叶斯均衡的要点在于当事人要根据所观察 到的他人的行为来修正自己有关后者类型的 “ 信 念 ” ,也就是主观概率,并由此选择自己的行动。 精炼贝叶斯均衡是所有参与人战略和信念的一种 结合:它满足如下条件 ( 1)给定每个人有关其他 人类型的信念的情况下,它的战略都是最优的; ( 2)每个人有关他人类型的信念都是使用贝叶斯 法则所观察到的行为中获得的。 举例:黔之驴,古代社会的科举制度,我们当代 的教育体制。 23 约翰 纳什 1928 1950, 1951:非合作博 弈 1994:诺贝尔经济学奖 普林斯顿的幽灵 大学老师的评价:他 是个天才
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!