经济博弈论复旦大学

资源描述

,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,经济博弈论,教材,教学课件,主编：,1,教材：,经济博弈论（第二版）,复旦大学出版社，,2002,年,1,月,经济博弈论习题指南,复旦大学出版社，,2003,年,1,月,2,第一章导论,本章介绍博弈论的基本概念，包括什么是博弈和博弈论，给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论，对博弈论的发展历史等作简单介绍。目标是让读对博弈论的内容和博弈模型有更直观的概念和印象，本教材的基本内容，以及博弈分析的基本思想方法等形成初步的认识，为后面各章展开详细分析作好铺垫和准备。,3,本章分五节,1. 1,什么是博弈论,1. 2,几类经典博弈模型,1. 3,博弈结构和博弈的分类,1. 4,博弈论历史和发展的简要评述,1. 5,博弈论在我国的应用,4,1.1,什么是博弈论,1.1.1,从游戏到博弈,1.1.2,一个非技术性定义,5,1.1.1,从游戏到博弈,博弈就是策略对抗，或策略有关键作用的游戏,博弈,Game,，博弈论,Game Theory,，,Game,即游戏、竞技,游戏和经济等决策竞争较量的共同特征：规则、结果、策略选择，策略和利益相互依存，策略的关键作用,游戏,下棋、猜大小,经济,寡头产量决策、市场阻入、投标拍卖,政治、军事,美国和伊拉克、以色列和巴勒斯坦,6,1.1.2,一个非技术性定义,定义,：,博弈就是一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。,四个核心方面,博弈的参加者,(Player),博弈方,各博弈方的策略,(Strategies),或行为,(Actions),博弈的次序,(Order),博弈方的得益,(Payoffs),7,1.2,几个经典博弈模型,1.2.1,囚徒的困境,1.2.2,赌胜博弈,1.2.3,产量决策的古诺模型,8,1.2.1,囚徒的困境,囚徒的困境是图克（,Tucker,）,1950,年提出的,该博弈是博弈论最经典、著名的博弈,该博弈本身讲的是一个法律刑侦或犯罪学方面的问题，但可以扩展到许多经济问题，以及各种社会问题，可以揭示市场经济的根本缺陷,9,一、基本模型,-5,，,-5,0,，,-8,-8,，,0,-1,，,-1,坦白,不坦白,坦白,不坦白,两个罪犯的得益矩阵,囚徒,2,囚,徒,1,囚徒,1,：坦白,囚徒,2,：坦白,10,二、双寡头削价竞争,100,，,100,20,，,105,150,，,20,70,，,70,高价,低价,高价,低价,寡头,2,寡,头,1,双寡头的得益矩阵,政府组织协调的,必要性和重要性,寡头,1,：低价,(70),寡头,2,：低价,(70),11,1.2.2,赌胜博弈,赌博、竞技等构成的博弈问题，在经济中也有许多应用，赌胜博弈也是一类重要的博弈问题，对经济竞争和合作也有很大启示,赌胜博弈的特点是一方得等于另一方失，不可能双赢，属于,“,零和博弈,”,12,一、田忌赛马,3,，,-3,1,，,-1,1,，,-1,1,，,-1,-1,，,1,1,，,-1,1,，,-1,3,，,-3,1,，,-1,1,，,-1,1,，,-1,-1,，,1,1,，,-1,-1,，,1,3,，,-3,1,，,-1,1,，,-1,1,，,-1,-1,，,1,1,，,-1,，,1,，,-1,3,，,-3,1,，,-1,1,，,-1,1,，,-1,1,，,-1,1,，,-1,-1,，,1,3,，,-3,1,，,-1,1,，,-1,1,，,-1,-1,，,1,1,，,-1,1,，,-1,3,，,-3,上中下,上下中,中上下,中下上,下上中,下中上,上,中,下,上,下,中,中,上,下,中,下,上,下,上,中,下,中,上,田忌,齐,威,王,得益矩阵,取胜关键,：不让对方猜到自己策略，尽可能猜出对方策略,13,二、猜硬币博弈,-1,，,1,1,，,-1,1,，,-1,-1,，,1,正面,反面,猜硬币方,盖,硬,币,方,正面,反面,14,三、石头、剪子、布,0,，,0,1,，,-1,-1,，,1,-1,，,1,1,，,-1,0,，,0,1,，,-1,-1,，,1,0,，,0,石头,剪子,布,博弈方,2,石头,剪子,布,博,弈,方,1,15,1.2.3,产量决策的古诺模型,古诺模型是寡头产量竞争，是市场经济中最常见的问题之一,古诺,1838,年提出，直到现在还是经常使用,古诺模型有很多扩展,古诺模型与囚徒困境相似，对理解市场经济和博弈分析本身都有重要价值,16,一、三厂商离散产量,0,P,4,4,5,5,3,7,6,2,8,16,12,8,5,6,5,20,25,30,5,6,4,20,20,24,5,5,5,25,25,25,4,3,11,33,33,33,3,7,3,49,21,21,3,17,二、,n,个厂商连续产量,18,1.3,博弈结构和博弈分类,1.3.1,博弈中的博弈方,1.3.2,博弈中的策略,1.3.3,博弈中的得益,1.3.4,博弈的过程,1.3.5,博弈的信息结构,1.3.6,博弈方的能力和理性,1.3.7,博弈的分类和博弈理论的结构,19,1.3.1,博弈中的博弈方,博弈方,：独立决策、独立承担博弈结果的个人或组织,博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变,博弈方数量对博弈结果和分析有影响,根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈，单人博弈是退化的博弈,20,一、单人博弈,只有一个博弈方的博弈,例一：单人迷宫,入口,A,B,出口,(,奖金,M),A,1,B,1,右,左,右,左,M,0,0,扩展形,21,例二：运输路线,-7000,-16000,-10000,-10000,好天气,(75%),坏天气,(25%),自然,商,人,水路,陆路,运输路线得益矩阵,0,1,-7000,-10000,-16000,-10000,运输路线扩展形,好天气,(75%),坏天气,(25%),单人博弈实质,个体最优化问题,22,二、两人博弈,两人博弈即有两个博弈方的博弈,两人博弈最常见，研究最多，是最基本和有用的博弈类型,囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈,两人博弈有多种可能性，博弈方的利益方向可能一致，也可以不一致,23,三、多人博弈,三个博弈方之间的博弈,可能存在,“,破坏者,”,：其策略选择对自身的利益并没有影响，但却会对其他博弈方的利益产生很大的，有时甚至是决定性的影响。,申办奥运会是典型例子。,多人博弈的表示有时与两人博弈不同，需要多个得益矩阵，或者只能用描述法,24,1.3.2,博弈中的策略,策略,：博弈中各博弈方的选择内容,策略有定性定量、简单复杂之分,不同博弈方之间不仅可选策略不同，而且可选策略数量也可不同,有限博弈：每个博弈方的策略数都是有限的,无限博弈：至少有某些博弈方的策略有无限多个,25,1.3.3,博弈中的得益,得益,：各博弈方从博弈中所获得的利益,得益对应博弈的结果，也就是各博弈方策略的组合,得益是各博弈方追求的根本目标及行为和判断的主要依据,根据得益的博弈分类：零和博弈、常和博弈、变和博弈,26,零和博弈,：也称,“,严格竞争博弈,”,。博弈方之间利益始终对立，偏好通常不同,猜硬币，田忌赛马，石头,-,剪刀,-,布,常和博弈,：博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系,分配固定数额的奖金、利润，遗产官司,变和博弈,：零和博弈和常和博弈以外的所有博弈。合作利益存在，博弈效率问题的重要性。,囚徒困境、产量博弈、制式问题等,27,1.3.4,博弈的过程,博弈过程,：博弈方选择、行为的次序，包括是否多次重复选择、行为。,博弈过程对博弈结果也有重要影响。,根据博弈的过程，博弈可分为静态博弈、动态博弈、重复博弈。,28,静态博弈,：所有博弈方同时或可看作同时选择策略的博弈,田忌赛马、猜硬币、古诺模型,动态博弈,：各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动,弈棋、市场进入、领导,追随型市场结构,29,重复博弈,：同一个博弈反复进行所构成的博弈，提供了实现更有效略博弈结果的新可能,长期客户、长期合同、信誉问题,有限次重复博弈,无限次重复博弈,30,1.3.5,博弈的信息结构,完全信息博弈,：各博弈方都完全了解所有博弈方各种情况下的得益,不完全信息博弈,：至少部分博弈方不完全了解其他博弈方得益的情况的博弈，也称为,“,不对称信息博弈,”,完美信息博弈,：每个轮到行为的博弈方对博弈的进程完全了解的博弈,不完美信息博弈,：至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈,31,1.3.6,博弈方的能力和理性,完全理性和有限理性,完全理性：有完美的分析判断能力和不会犯选择行为的错误,有限理性：博弈方的判断选择能力有缺陷,个体理性和集体理性,个体理性：一个体利益最大为目标,集体理性：追求集体利益最大化,合作博弈：允许存在有约束力协议的博弈,非合作博弈：不允许存在有约束力协议的博弈,32,1.3.7,博弈的分类和博弈理论的结构,非合作博弈和合作博弈,非合作博弈范围内：完全理性博弈和有限理性博弈（进化博弈）,静态博弈，动态博弈，重复博弈,完全信息静态博弈，不完全信息静态博弈，完全且完美信息动态博弈，完全但不完美信息动态博弈，不完全信息动态博弈,零和博弈和非零和博弈，单人博弈和多人博弈,33,1.4,博弈论历史和发展简述,1.4.1,博弈论的早期研究,1.4.2,博弈论的形成,1.4.3,博弈论的成长和发展,1.4.4,博弈论的成熟及与主流经济学的融合,34,1.4.1,博弈论的早期研究,博弈论历史没有公认答案,对具有策略依存特点决策问题的研究可上溯到,18,世纪初甚至更早,博弈论真正的发展在本世纪,博弈论总体上仍然是发展中的学科,35,2000,年前我国古代的,“,齐威王田忌赛马,”,1500,年前巴比伦犹太教法典,“,婚姻合同问题,”,等。,1838,年古诺寡头模型。,1883,年伯特兰德寡头竞争模型。,1913,年齐默罗象棋博弈定理,、,“,逆推归纳法,”,1921-1927,年波雷尔混合策略的第一个现代表述，有数种策略两人博弈的极小化极大解,1928,年诺伊曼和摩根斯坦扩展形博弈定义，证明有限策略两人零和博弈有确定结果,36,1.4.2,博弈论的形成,冯,.,诺伊曼和摩根斯坦,博弈论和经济行为,Theory of Games and Economic Behavior,1944,引进扩展形（,extensive form,）表示和正规形（,normal form,）或称策略形（,strategy form,）、矩阵形（,matrix form,）表示,提出稳定集（,stable sets,）解概念,正式提出创造博弈论一般理论的主意,给出博弈论研究的一般框架、概念术语和表述方法,37,1.4.3,博弈论的成长和发展,一、第一个研究高潮，本世纪,40,年代末和,50,年代初,1950,年纳什提出,“,纳什均衡,”,（,Nash equilibrium,）概念和证明纳什定理，发展非合作博弈的基础理论。,1950,年,Melvin Dresher,和,Merrill Flood,在兰德公司（美国空军）,“,囚徒的困境,”,（,Prison,s dilemma,）博弈实验，（,Howard Raiffa,）独立进行这个博弈实验；,1952-1953,年期间（,L. S. Shapley,）和（,D. B. Gillies,）提出,“,核,”,（,Core,）作为合作博弈的一般解概念,Shapley,提出了合作博弈的,“,Shapley,值,”,（,Shapley value,）概念等。,奥曼（,R. J. Aumann,）,“,40,年代末,50,年代初是博弈论历史上令人振奋的时期，原理已经破茧而出，正在试飞它们的双翅，活跃着一批巨人。,”,38,二、,50,年代中后期一直到,70,年代博弈论发展的青年期,1954-1955,年提出了,“,微分博弈,”,（,Differential games,）的概念。,奥曼则在,1959,年提出了,“,强均衡,”,（,Strong equilibrium,）的概念。,“,重复博弈,”,（,Repeated games,）也是在,50,年代末开始研究的，这自然引出了关于重复博弈的,“,民间定理,”,（,Folk theorem,）。,1960,年（,Thomas C. Schelling,）引进了,“,焦点,”,（,Focal point,）的概念。,博弈论在进化生物学（,Evolutionary Biology,）中的公开应用也是在,60,年代初出现的。,39,塞尔腾,(,Selten,),1965,提出,“,子博弈完美纳什均衡,”,(,subgame perfect Nash equilibrium,),1975,年提出的,“,颤抖手均衡,”,(,Trembling hand perfect equilibrium,),海萨尼,(,Harsanyi,),1967-1968,三篇构造不完全信息博弈理论的系列论文，,“,贝叶斯纳什均衡,”,(,Bayesian Nash equilibrium,),。,海萨尼,1973,年提出关于,“,混合策略,”,的不完全信息解释，以及,“,严格纳什均衡,”,(,Strict Nash equilibrium,),。,70,年代,“,进化博弈论,”,（,Evolutionary game theory,）的重要发展，（,John Maynard Smith,）,1972,年引进,“,进化稳定策略,”,（,Evolutionarily stable strategy,，,ESS,）等。,“,共同知识,”,（,Common knowledge,）的重要性，因为奥曼,1976,年的文章引起广泛的重视。,40,三、,40,年代末到,70,年代末是博弈论发展的重要阶段,这个时期博弈理论仍然没有成熟，理论体系还比较乱，概念和分析方法很不统一，在经济学中的作用和影响还比较有限，但这个时期博弈论研究的繁荣和进展却是非常显著的。,对这一阶段博弈论研究的迅速发展，除了理论发展自身规律的作用以外，全球政治、军事、经济特定环境条件的影响（战争和冷战时期的军事对抗和威慑策略研究的需要，经济竞争、国际经济竞争的加剧），以及经济学理论发展本身的需要等，都起了重要的作用。正是因为有了这一阶段博弈论研究的繁荣发展，才有,80,、,90,年代博弈论的成熟和对经济学的博弈论革命。,41,1.4.4,博弈论的成熟及与主流经济学的融合,一、,80,、,90,年代是博弈论走向成熟的时期,1981,（,Elon Kohlberg,）,“,顺推归纳法,”,（,Forward induction,）,克瑞泼斯（,David M. kreps,）和威尔孙（,Robert Wilson,）,1982,年提出,“,序列均衡,”,（,Sequential equilibria,）,1982,年斯密（,John Maynard Smith,）出版了,进化和博弈论,（,）,1984,年由伯恩海姆（,B. D. Bernheim,）和皮尔斯（,D. G. Pearce,）提出,“,可理性化性,”,（,Rationalizability,）,海萨尼和塞尔腾,1988,年提出了在非合作和合作博弈中均衡选择的一般理论和标准，,1991,年弗得伯格（,D. Fudenberg,）和泰勒尔（,J. Tirole,）首先提出了,“,完美贝叶斯均衡,”,（,Perfext Bayesian equilibrium,）的概念,42,二、博弈论和经济学诺贝尔奖,1994,：非合作博弈：纳什,(,Nash,),、海萨尼（,Harsanyi,）、塞尔顿（,Selten,）,1996,：不对称信息激励理论：莫里斯（,Mirrlees,）和维克瑞（,Vickrey,）,2001,：,不完全信息市场博弈：阿克罗夫（,Akerlof,）（商品市场）、斯潘塞（,Spence,）（教育市场）、斯蒂格里兹（,Stiglitze,）（保险市场）,2002,：,实验经济学：史密斯（,Smith,），,心理经济学：卡尼曼（,Kahneman,）,43,1.5,博弈论在我国的应用,企业经营者的决策思路和工具。,政府的政策和管理思路，与个人、企业和地方博弈的意识。,社会经济问题的理论分析工具，解释经济中许多低效率现象的根源，找出各种经济问题的制度性、环境性原因，揭示各种经济行为和政策的效率意义等。,44,第二章完全信息静态博弈,本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策，且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。,45,本章分六节,2.1,基本分析思路和方法,2.2,纳什均衡,2.3,无限策略博弈分析和反应函数,2.4,混合策略和混合策略纳什均衡,2.5,纳什均衡的存在性,2.6,纳什均衡的选择和分析方法扩展,46,2.1,基本分析思路和方法,2.1.1,上策均衡,2.1.2,严格下策反复消去法,2.1.3,划线法,2.1.4,箭头法,47,2.1.1,上策均衡,上策,：不管其它博弈方选择什么策略，一博弈方的某个策略给他带来的得益始终高于其它的策略，至少不低于其他策略的策略,囚徒的困境中的“坦白”；双寡头削价中“低价”。,上策均衡,：一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，必然是该博弈比较稳定的结果,上策均衡不是普遍存在的,48,2.1.2,严格下策反复消去法,严格下策,：不管其它博弈方的策略如何变化，给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略,严格下策反复消去：,1,，,0,1,，,3,0,，,1,0,，,4,0,，,2,2,，,0,左,中,右,上,下,1,，,0,1,，,3,0,，,4,0,，,2,左,中,1,，,0,1,，,3,左,中,49,2.1.3,划线法,1,，,0,1,，,3,0,，,1,0,，,4,0,，,2,2,，,0,-5,，,-5,0,，,-8,-8,，,0,-1,，,-1,囚,徒,困,境,-1,，,1,1,，,-1,1,，,-1,-1,，,1,猜,硬,币,2,，,1,0,，,0,0,，,0,1,，,3,夫,妻,之,争,50,2.1.4,箭头法,1,，,0,1,，,3,0,，,1,0,，,4,0,，,2,2,，,0,-5,，,-5,0,，,-8,-8,，,0,-1,，,-1,囚,徒,困,境,-1,，,1,1,，,-1,1,，,-1,-1,，,1,猜,硬,币,2,，,1,0,，,0,0,，,0,1,，,3,夫,妻,之,争,51,2.2,纳什均衡,2.2.1,纳什均衡的定义,2.2.2,纳什均衡的一致预测性质,2.2.3,纳什均衡与严格下策反复消去法,52,2.2.1,纳什均衡的定义,策略空间：,博弈方的第个策略：,博弈方的得益：,博弈：,纳什均衡,：在博弈中，如果由各个博弈方的各一个策略组成的某个策略组合中，任一博弈方的策略，都是对其余博弈方策略的组合,的最佳对策，也即对任意都成立，则称为的一个纳什均衡,53,2.2.2,纳什均衡的一致预测性质,一致预测,：如果所有博弈方都预测一个特定博弈结果会出现，所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略，即没有哪个博弈方有偏离这个预测结果的愿望，因此预测结果会成为博弈的最终结果,只有纳什均衡才具有一致预测的性质,一致预测性是纳什均衡的本质属性,一致预测并不意味着一定能准确预测，因为有多重均衡，预测不一致的可能,54,2.2.3,纳什均衡与严格下策反复消去法,上策均衡肯定是纳什均衡，但纳什均衡不一定是上策均衡,命题,2.1,：在,n,个博弈方的博弈中，如果严格下策反复消去法排除了除之外的所有策略组合，那么一定是该博弈的唯一的纳什均衡,命题,2.2,：在,n,个博弈方的博弈中中，如果是的一个纳什均衡，那么严格下策反复消去法一定不会将它消去,上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的,55,2.3,无限策略分析和反应函数,2.3.1,古诺的寡头模型,2.3.2,反应函数,2.3.3,伯特兰德寡头模型,2.3.4,公共资源问题,2.3.5,反应函数的问题和局限性,56,2.3.1,古诺的寡头模型,寡头产量竞争,以两厂商产量竞争为例,2,2,2,1,2,6,q,q,q,q,-,-,=,57,4.5,，,4.5,5,，,3.75,3.75,，,5,4,，,4,不突破,突破,厂商,2,不突破,突破,厂,商,1,以自身最大利益为目标：各生产,2,单位产量，各自得益为,4,以两厂商总体利益最大：各生产,1.5,单位产量，各自得益为,4.5,两寡头间的囚徒困境博弈,58,2.3.2,反应函数,古诺模型的反应函数,(3,0),(6,0),(0,3),(0,6),古诺模型的反应函数图示,理性局限和古诺调整,59,2.3.3,伯特兰德寡头模型,价格竞争寡头的博弈模型,产品无差别，消费者对价格不十分敏感,60,2.3.4,公共资源问题,公共草地养羊问题,以三农户为例,n=3,，,c=4,61,合作：总体利益最大化,竞争：个体利益最大化,62,2.3.5,反应函数的问题和局限性,在许多博弈中，博弈方的策略是有限且非连续时，其得益函数不是连续可导函数，无法求得反应函数，从而不能通过解方程组的方法求得纳什均衡。,即使得益函数可以求导，也可能各博弈方的得益函数比较复杂，因此各自的反应函数也比较复杂，并不总能保证各博弈方的反应函数有交点，特别不能保证有唯一的交点。,63,2.4,混合策略和混合策略纳什均衡,2.4.1,严格竞争博弈和混合策略的引进,2.4.2,多重均衡博弈和混合策略,2.4.3,混合策略和严格下策反复消去法,2.4.4,混合策略反应函数,64,2.4.1,严格竞争博弈和混合策略的引进,一、猜硬币博弈,-1,，,1,1,，,-1,1,，,-1,-1,，,1,正面,反面,猜硬币方,盖,硬,币,方,正面,反面,（,1,）不存在前面定义的纳什均衡策略组合,（,2,）关键是不能让对方猜到自己策略,这类博弈很多，引出混合策略纳什均衡概念,65,二、混合策略、混合策略博弈和混合策略纳什均衡,混合策略,：在博弈中，博弈方的策略空间为，则博弈方以概率分布随机在其个可选策略中选择的,“,策略,”,，称为一个,“,混合策略,”,，其中对都成立，且,混合策略扩展博弈,：博弈方在混合策略的策略空间（概率分布空间）的选择看作一个博弈，就是原博弈的,“,混合策略扩展博弈）。,混合策略纳什均衡,：包含混合策略的策略组合，构成纳什均衡。,66,三、一个例子,该博弈无纯策略纳什均衡，可用混合策略纳什均衡分析,博弈方,1,的混合策略,博弈方,2,的混合策略,2,，,3,5,，,2,3,，,1,1,，,5,C,D,A,B,博弈方,2,博,弈,方,1,策略得益,博弈方,1,（,0.8,，,0.2,）,2.6,博弈方,2,（,0.8,，,0.2,）,2.6,67,四、齐威王田忌赛马,3,，,-3,1,，,-1,1,，,-1,1,，,-1,-1,，,1,1,，,-1,1,，,-1,3,，,-3,1,，,-1,1,，,-1,1,，,-1,-1,，,1,1,，,-1,-1,，,1,3,，,-3,1,，,-1,1,，,-1,1,，,-1,-1,，,1,1,，,-1,1,，,-1,3,，,-3,1,，,-1,1,，,-1,1,，,-1,1,，,-1,1,，,-1,-1,，,1,3,，,-3,1,，,-1,1,，,-1,1,，,-1,-1,，,1,1,，,-1,1,，,-1,3,，,-3,上中下,上中下,上中下,上中下,上中下,上中下,上,中,下,上,中,下,上,中,下,上,中,下,上,中,下,上,中,下,田忌,齐,威,王,得益矩阵,68,五、小偷和守卫的博弈,V,，,-D,-P,，,0,0,，,S,0,，,0,睡,不睡,偷,不偷,守卫,小,偷,加重对首位的处罚：短期中的效果是使守卫真正尽职,在长期中并不能使守卫更尽职，但会降低盗窃发生的概略,0,- D,- D,守卫,得益,(,睡,),S,Pt,小偷,偷的概率,1,69,V,，,-D,-P,，,0,0,，,S,0,，,0,睡,不睡,偷,不偷,守卫,小,偷,加重对小偷的处罚：短期内能抑制盗窃发生率,长期并不能降低盗窃发生率，但会是的守卫更多的偷懒,0,- P,- P,小偷,得益,(,偷,),V,Pg,守卫,睡的概略,1,70,2.4.2,多重均衡博弈和混合策略,一、夫妻之争的混合策略纳什均衡,2,，,1,0,，,0,0,，,0,1,，,3,时装,足球,时装,足球,丈夫,妻,子,夫妻之争,妻子的混合策略,丈夫的混合策略,夫妻之争博弈的混合策略纳什均衡,策略得益,博弈方,1,（,0.75,，,0.25,）,0.67,博弈方,2,（,1/3,，,2/3,）,0.75,71,二、制式问题,1,，,3,0,，,0,0,，,0,2,，,2,A,B,A,B,厂商,2,厂,商,1,制式问题,制式问题混合策略纳什均衡,A B,得益,厂商,1,：,0.4 0.6 0.664,厂商,2,：,0.67 0.33 1.296,72,三、市场机会博弈,-50,，,-50,100,，,0,0,，,100,0,，,0,进,不进,进,不进,厂商,2,厂,商,1,市场机会,进不进得益,厂商,1,：,2/3 1/3 0,厂商,2,：,2/3 1/3 0,73,2.4.3,混合策略和严格下策反复消去法,3,，,1,0,，,2,0,，,2,3,，,3,1,，,3,1,，,1,L,R,U,M,D,博弈方,2,博,弈,方,1,博弈方,2,采用纯策略,L,时，博弈方,1,采用混合策略,(1/2,1/2,0),的得益,博弈方,2,采用纯策略,R,时，博弈方,1,采用混合策略,(1/2,1/2,0),的得益,74,2.4.4,混合策略反应函数,猜硬币博弈,-1,，,1,1,，,-1,1,，,-1,-1,，,1,正面,反面,猜硬币方,正面,反面,猜硬币博弈,盖,硬,币,方,r,q,1,1,1/2,1/2,(r,1-r),：盖硬币方选择正反面的混合策略概率分布,(q,1-q),：猜硬币方选择正反面的混合策略概率分布,75,夫妻之争博弈,2,，,1,0,，,0,0,，,0,1,，,3,时装,足球,丈夫,时装,足球,妻,子,夫妻之争,r,q,1,1,1/3,1/3,(r,1-r),：丈夫的混合策略概率分布,(q,1-q),：妻子的混合策略概率分布,76,2.5,纳什均衡的存在性,纳什定理,：,在一个由,n,个博弈方的博弈中，如果,n,是有限的，且都是有限集,(,对,),，则该博弈至少存在一个纳什均衡，但可能包含混合策略。,教材,106,页证明。主要根据是布鲁威尔和角谷的不动点定理。,纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。,77,2.6,纳什均衡的选择和分析方法扩展,2.6.1,多重纳什均衡博弈的分析,2.6.2,共谋和防共谋均衡,78,2.6.1,多重纳什均衡博弈的分析,帕累托上策均衡,风险上策均衡,聚点均衡,相关均衡,79,一、帕累托上策均衡,（鹰鸽博弈）,这个博弈中有两个纯策略,纳什均衡，（战争，战争）,和（和平，和平），显然,后者帕累托优于前者，所,以，（和平，和平）是本,博弈的一个帕累托上策均衡。,-5,，,-5,-10,，,8,8,，,-10,10,，,10,战争,和平,国家,2,战争,和平,国,家,1,战争与和平,80,二、风险上策均衡,考虑、顾忌博弈方、其他博弈方可能发生错误等时，帕累托上策均衡并不一定是最优选择，需要考虑：风险上策均衡。下面就是两个例子。,9,，,9,8,，,0,0,，,8,7,，,7,L,R,博弈方,2,U,D,博,弈,方,1,风险上策均衡（,D,，,R,）,5,，,5,3,，,0,0,，,3,3,，,3,鹿,兔子,猎人,2,鹿,兔子,猎,人,1,猎鹿博弈,风险上策均衡（兔子，兔子）,81,三、聚点均衡,利用博弈设定以外的信息和依据选择的均衡,文化、习惯或者其他各种特征都可能是聚点均衡的依据,城市博弈（城市分组相同）、时间博弈（报出相同的时间）是聚点均衡的典型例子,82,四、相关均衡,5,，,1,4,，,4,0,，,0,1,，,5,L,R,博弈方,2,U,D,博,弈,方,1,相关均衡例子,三个纳什均衡,：,（,U,，,L,）、（,D,，,R,）,和混合策略均衡,（,1/2,，,1/2,），（,1/2,，,1/2,）,结果都不理想，不如（,D,，,L,）。,可利用聚点均衡（,天气，抛硬币）,，但仍不理想。,相关装置：,1,、各,1/3,概率,A,、,B,、,C,2,、博弈方,1,看到是否,A,，博弈方,2,看到是否,C,3,、博弈方,1,见,A,采用,U,，否则,D,；博弈方,2,见,C,采用,R,，否则,L,。,相关均衡要点：,1,、构成纳什均衡,2,、有人忽略不造成问题,83,一、多人博弈中的共谋问题,本博弈的纯策略纳什均衡：（,U,，,L,，,A,）、（,D,，,R,，,B,）,前者帕累托优于后者。博弈的结果会是什么呢？,（,U,，,L,，,A,）,有,共谋,(Coalition),问题：博弈方,1,和,2,同时偏离。,0,0,10,-5,-5,0,-5,-5,0,1,1,-5,L,R,U,D,博弈方,2,博,弈,方,1,博弈方,3,A,-2,-2,0,-5,-5,0,-5,-5,0,-1,-1,5,L,R,U,D,博弈方,2,博,弈,方,1,博弈方,3,B,2.6.2,共谋和防共谋均衡,84,二、防共谋均衡,如果一个博弈的某个策略组合满足下列要求：,（,1,）没有任何单个博弈方的,“,串通,”,会改变博弈的结果，即单独改变策略无利可图；,（,2,）给定选择偏离的博弈方有再次偏离的自由时，没有任何两个博弈方的串通会改变博弈的结果；,（,3,）依此类推，直到所有博弈方都参加的串通也不会改变博弈的结果。,称为,“,防共谋均衡,”,。,前面例子中：（,D,，,R,，,B,）是防共谋均衡,（,U,，,L,，,A,）不是防共谋均衡,85,第三章完全且完美信息动态博弈,本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈,。,这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。,86,本章分六节,3.1动态博弈的表示法和特点,3.2可信性和纳什均衡的问题,3.3子博弈和子博弈完美纳什均衡,3.4几个经典动态博弈模型,3.5有同时选择的动态博弈模型,3.6动态博弈分析的问题和扩展讨论,87,3.1,动态博弈的表示法和特点,3.1.1,阶段和扩展性表示,3.1.2,动态博弈的基本特点,88,3.1.1,阶段和扩展性表示,阶段：动态博弈中一个博弈方的一次选择行为,例子：仿冒和反仿冒博弈,A,B,B,A,不制止,制止,（,-2,，,5,）,（,2,，,2,）,（,10,，,4,）,（,5,，,5,）,不仿冒,（,0,，,10,）,仿冒,不制止,制止,仿冒,不仿冒,89,3.1.2,动态博弈的基本特点,策略是在整个博弈中所有选择、行为的计划,结果是上述,“,计划型,”,策略的策略组合，构成一条路径,得益对应每条路径，而不是对应每步选择、行为,动态博弈的非对称性,先后次序决定动态博弈必然是非对称的。,先选择、行为的博弈方常常更有利，有,“,先行优势,”,。,90,3.2,可信性和纳什均衡的问题,3.2.1,相机选择和策略中的可信性问题,3.2.2,纳什均衡的问题,3.2.3,逆推归纳法,91,3.2.1,相机选择和策略中的可信性问题,不同版本的开金矿博弈,分钱和打官司的可信性,乙,甲,（,0,，,4,）,（,2,，,2,）,（,1,，,0,）,不借,借,分,不分,开金矿博弈,不借,乙,甲,乙,借,不分,分,（,1,，,0,）,不打,打,（,0,，,4,）,（,1,，,0,）,（,2,，,2,）,有法律保障的开金矿博弈,分钱打官司都可信,乙,甲,乙,打,（,2,，,2,）,不分,分,不借,借,（,0,，,4,）,（,-1,，,0,）,不打,（,1,，,0,）,法律保障不足的开金矿博弈,分钱打官司都不可信,92,3.2.2,纳什均衡的问题,第三种开金矿博弈中，（不借-不打，不分）和（借-打，分）都是纳什均衡。但后者不可信，不可能实现或稳定。,结论,：纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中,可能,是不稳定的，不能作为预测的基础。,根源,：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题,93,3.2.3,逆推归纳法,定义,：从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，称为,“,逆推归纳法,”,。,逆推归纳法是动态博弈分析最重要、基本的方法。,乙,不借,借,（,1,，,0,）,甲,不分,分,（,0,，,4,）,（,2,，,2,）,94,3.3,子博弈和子博弈完美纳什均衡,3.3.1,子博弈,3.3.2,子博弈完美纳什均衡,95,3.3.1,子博弈,定义：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个,“,子博弈,”,。,乙,甲,不借,借,不分,分,（,1,，,0,）,（,0,，,4,）,（,2,，,2,）,乙,（,-1,，,0,）,96,3.3.2,子博弈完美纳什均衡,定义,：如果一个完美信息的动态博弈中，各博弈方的策略构成的一个策略组合满足，在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个,“子博弈完美纳什均衡”。,子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺，因此是真正稳定的。,逆推归纳法,是求完美信息动态博弈子博弈完美纳什均衡的基本方法。,97,3.4,几个经典动态博弈模型,3.4.1,寡占的斯塔克博格模型,3.4.2,劳资博弈,3.4.3,讨价还价博弈,3.4.4,委托人,代理人理论,98,3.4.1,寡占的斯塔克博格模型,先后选择产量的产量竞争博弈,把古诺模型改为厂商1先选择，厂商2后选择，而非同时选择即可。,2,2,2,1,2,6,q,q,q,q,-,-,=,产量得益,厂商,1 3,单位,4.5,厂商,2 1.5,单位,2.25,先行优势,99,3.4.2,劳资博弈,先由工会决定工资率，再由厂商决定雇用多少劳动力,R,L,0,W L,厂商的反应函数,R(L),斜率为,W,L,W,0,工会的误差异曲线,100,3.4.3,讨价还价博弈,三回合讨价还价,1,1,2,不接受，出,S,接受,不接受，出,S2,接受,出,S1,101,三回合讨价还价博弈结果的讨论,102,无限回合讨价还价,103,3.4.4,委托人,代理人理论,一、委托人,代理人关系,经济活动和社会活动中有很多委托人,代理人关系，有明显的，也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。,委托人,代理人关系的关键特征：不能直接控制，监督不完全，信息不完全，利益的相关性,委托人,代理人涉及问题：激励机制设计、机制设计理论，委托合同设计问题等,104,二、无不确定性的委托人,代理人模型,R(S)-w(S), w(S)-S,R(E)-w(E), w(E)-E,R(0),0,R(0),0,1,2,2,偷懒,努力,拒绝,接受,不委托,委托,代理人的选择,激励相容约束：,w(E)-E w(S)-S,w(E) w(S)+E-S,105,参与约束：,2,2,R(E)-w(E), w(E)-E,拒绝,接受,拒绝,接受,R(0),0,R(S)-w(S), w(S)-S,R(0),0,接受：,w(E)-E0,接受：,w(S)-S0,参与约束,106,委托人的选择,1,1,不委托,委托,委托,R(S)-w(S), w(S)-S,R(0),0,R(E)-w(E), w(E)-E,不委托,R(0),0,委托：,R(E)-w(E), R(0),不委托：,R(E)-w(E), R(0),不委托：,R(S)-w(S),0,不委托：,0.1*20-w(S) +0.9*10-w(S),0,不委托：,0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10-S),接受：,0.9*w(20)-E+0.1*w(10)-E0,委托：,0.9*20-w(20)+0.1*10-w(10)0,激励相容约束,促使代理人努力的激励相容约束、参与约束，以及委托人选择委托的条件,参与约束,对于委托人来说，就是要根据上述两个条件，以及,E、S,的值，选择最佳的工资水平,w(20),和,w(10),，,或者它们的差额,w(20),-,w(10),111,五、选择报酬和连续努力水平的委托人,代理人博弈,R, C,C(e) +,R(e),委托人希望的代理人努力水平,（满足参与约束）,112,店主和店员的问题,商店的利润，是均值为,0,的随机变量,店员的负效用，是店员的努力,机会成本为1,店主采用的报酬计算公式,店员的得益,店员期望得益为,店主的得益为,113,参与约束,：,当店员风险中性时符合其最大利益,店主选择下限代入得益公式得：,，期望得益为，易求得,令得，再代入参与约束得，,求数学期望得解得，,则店主的最优激励工资计算公式是,114,3.5,有同时选择的动态博弈模型,3.5.1,标准模型,3.5.2,间接融资和挤兑风险,3.5.3,国际竞争和最优关税,3.5.4 工资奖金制度,115,3.5.1,标准模型,博弈中有四个博弈方，分别称为博弈方,1,、博弈方,2,、博弈方,3,和博弈方,4,第一阶段是博弈方,1,和博弈方,2,的选择阶段，他们同时在各自的可选策略（行为）集合,和,中分别选择和,第二阶段是博弈方,3,和博弈方,4,的选择阶段，他们在看到博弈方,1,和博弈方,2,的选择和以后，同时在各自的可选策略（行为）集合,和,中分别选择和,各博弈方的得益都取决于所有博弈方的策略即博弈方,i,的得益是各个博弈方所选择策略的多元函数,116,3.5.2,间接融资和挤兑风险,下一阶段,1,，,1,1,，,1,1,，,1,不存,存款,客户,2,不存,存款,客,户,1,第一阶段,0.8,，,0.8,0.6,，,1,1,，,0.6,1.2,，,1.2,提前,到期,客户,2,提前,到期,客,户,1,第二阶段,（到期，到期）（存款，存款）,（提前，提前）（不存，不存）,1.2,，,1.2,第二阶段,建立信贷保证、保险制度，,对存款进行保护、保险的原因,117,非法集资问题,现代更容易引发金融、社会风险的主要是不正规的非法金融活动，如地下钱庄和非法集资等。因为非法金融活动常常通过恶意欺骗的手段吸引人们参加，用借新债还旧债的方法，而不是经营利润偿还到期资金，信用差、管理差而且缺乏保险措施，引起金融风险并引

展开阅读全文

经济博弈论复旦大学

最新文档