博弈论课件 第二章

上传人:e****s 文档编号:243719840 上传时间:2024-09-29 格式:PPT 页数:113 大小:913KB
返回 下载 相关 举报
博弈论课件 第二章_第1页
第1页 / 共113页
博弈论课件 第二章_第2页
第2页 / 共113页
博弈论课件 第二章_第3页
第3页 / 共113页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章,完全信息静态博弈,完全信息静态博弈:各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。,完全信息静态博弈是非合作博弈中最基本的类型,囚徒困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于完全信息静态博弈。,博弈有两种表述方法:,(1)策略型表述适合表示静态博弈,(2)扩展型表述适合表示动态博弈,本章主要内容,2.1 基本分析思路和方法,2.2 纳什均衡,2.3 无限策略博弈分析和反应函数,2.4 混合策略和混合策略纳什均衡,2.5 纳什均衡的存在性,2.6 纳什均衡的选择和分析方法扩展,2.1 基本分析思路和方法,2.1.1 上策均衡,2.1.2 严格下策反复消去法,2.1.3 划线法,2.1.4 箭头法,2.1.1 上策均衡,上策(Dominant strategy):,在某个博弈中,如果不管其他博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其他策略,至少不低于其他策略。,上策均衡( Dominant-strategy Equilibrium):,如果一个博弈方的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合为该博弈的一个上策均衡。,上策的均衡反应了所有博弈方的,绝对偏好,非常稳定,进行博弈分析时,首先判断各个博弈方是否都有上策,是否存在上策均衡。,由于博弈关系的相互依存性,上策均衡不是普遍存在的,体现了博弈理论的价值。,例1:囚徒困境,对于囚徒1,策略“坦白”的得益向量为(-5,0)、策略“不坦白”的得益向量为(-8,-1),显然,(-5,0)(-8,-1),所以“坦白”对于囚徒1来说是一个上策。,同理,对于囚徒2,策略“坦白”的得益,向量为 ,策略不坦白的得益向量为 ,,显然 ,,所以“坦白”对于囚徒2来说是一个上策。,那么(坦白,坦白)就是该博弈的一个上策均衡,这种,策略的组合是稳定的。,上策均衡不是普遍存在的。需要双方都存在上策。有些博弈就是不存在上策,如:猜硬币博弈,博弈的参与人都不存在上策,博弈也就不存在所谓的上策均衡。,2.1.2 严格下策反复消去法,思路和原理,严格下策(Strictly Dominated Strategy):,不管其他博弈方的策略如何变化,一个博弈方的某种策略给他带来的得益,总是比另一种策略给他带来的得益要小,则称前一种策略为相对于后一种策略的一个“严格下策”。,任何理性的博弈方都不会采用严格下策,严格下策反复消去法:,在策略之间,两两比较,意义上的“严格下策”,并把它们消去的方法,相当于排除法,把不可能采用的策略排除掉,缩小选择范围,同一博弈方的策略空间中,反复运用,,各个博弈方的策略空间上,交叉运用。,2.1.2 严格下策反复消去法,例一:,1,0,1,3,0,1,0,4,0,2,2,0,左,中,右,上,下,博弈方二,博弈方一,博弈的解,:(上,中),智猪博弈:,有两头非常聪明的猪(要不怎么叫智猪博弈呢),一大一小,共同生活在一个猪圈里。猪圈的一端有一个踏板,踏板连着开放饲料的机关,只要踏一下,在猪圈的另外一端的食槽就会出现10个单位食物。任何一头猪去踏这个踏板都会付出相当于两个单位食物的成本,每只猪都可以选择“踏”或“不踏”踏板。,情况一:同时踏,大猪8-2=6,小猪2-2=0,情况二:大猪踏,小猪等候,大猪6-2=4,小猪4,情况三:小猪踏,大猪等候,大猪10,小猪-2,情况四:都不踏,大猪0,小猪0,6, 0,4, 4,10, -2,0, 0,踏,不踏,踏,不踏,小猪,大,猪,智猪博弈,6, 0,4, 4,10, -2,0, 0,踏,不踏,踏,不踏,小猪,大,猪,博弈的解,:(踏,不踏),一方有上策,一方没有上策,现实中的智猪博弈,改革与制度锁定,小股东与大股东(大股东监督,小股东搭便车),广告便车(小酒馆开在大酒店旁边,小商场开在大商场旁边 ),技术创新便车(大公司开发,小公司仿造),公共品提供中的搭便车(富人修路,穷人受益),一个和尚挑水喝,两个和尚抬水喝,三个和尚没水喝(大家都想当“小猪”), ,2.1.2 严格下策反复消去法,课堂练习一:,1,3,1,2,0,1,6,4,0,2,6,5,A1,A2,A3,B2,B1,博弈方二,博弈方一,2.1.3 划线法,与上策分析法的情形类似,大部分博弈是不存在严格下策的。虽然与上策均衡分析法相比,严格下策反复消去法适应更多情况,但是仍然不能够满足博弈分析的要求,我们需要一种更普遍适用的博弈分析方法划线法。,2.1.3 划线法,思路和方法:,先找出自己针对其他博弈方每种策略或策略组合的最佳对策,即自己的可选策略中与其他博弈方的策略或组合配合,给自己带来最大得益的策略,然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的选择等,预测博弈的可能结果和确定自己的最优策略。,1,0,1,3,0,1,0,4,0,2,2,0,左,中,右,上,下,博弈方二,博弈方一,博弈的解,:(上,中),2.1.3 划线法,囚徒困境,-5, -5,0, -8,-8, 0,-1, -1,坦 白,不坦白,坦 白,不坦白,囚徒 2,囚,徒,1,猜硬币博弈,此博弈不存在确定性结果,没有策略组合是双方同时愿意接受的,我们不能预测这个博弈的结果。,-1, 1,1, -1,1, -1,-1, 1,正 面,反 面,猜硬币方,盖,硬,币,方,正 面,反 面,多重均衡,夫妻之争,2, 1,0, 0,0, 0,1, 3,看时装表演,看足球比赛,丈夫,妻,子,看时装表演,看足球比赛,多重均衡的问题,夫妻之争在,纯策略(参与人对任何一个特定行动的选择概率是1或0),意义上有两个具有稳定性的结果,哪一个结果出现都是合理的,具体选择哪一个不得而知。,但是,我们可以猜测到,这个博弈的结果会受到夫妻在家庭中的实际地位的影响,如果在家庭中,丈夫是强势的,那么,最后博弈的结果很可能是夫妇一起看足球,如果妻子是强势的,那么很可能夫妇二人一起看时装表演。,多重均衡问题,聚点(谢林),廉价磋商,学习与协调,相关均衡(奥曼),公平观念,公共资源的过度使用:公共地悲剧,现实生活中的例子:如免费校园网络的使用,免费道路的使用。,解决办法,消除或减弱公共物品的性质,如收费,发许可等。,100, 100,60, 120,120, 60,80, 80,1只,2只,牧民乙,牧,民,甲,1只,2只,学习博弈论,大家一定要记忆一些,基本的模型,。因为很多时候,我们总是基于已有的模型,对其做出修订来考察一些新的问题。完全创新的模型是很少见的,当我们记忆的模型多了,就很容易在分析问题时套用模型,并修订模型的条件来考察自己研究的问题。,其实大家学习西方经济学理论的时候,会发现它与大家曾接触的马克思主义经济学理论,以及国内一些逻辑思辩型的经济学研究范式一个很大不同就在于,它采取的是一种模型化的思维。我们学习西方经济学的时候,会发现始终在学习一些模型,因为模型是帮助我们简单地理解现实世界的有用工具。经济学中的数学模型,其实与生物课教学的塑料人体模型等在本质上并无不同。,2.1.4 箭头法(略),箭头法的基本思路:,对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头,到改变策略后的组合对应的得益数组。最后综合为每个策略组合的分析情况,形成对博弈结果的判断。,利用策略组合的稳定性为思路,对博弈模型的结果进行分析和预测。,箭头法与划线法效果相同,囚徒困境,从任意一个策略组合开始分析,这里从(不坦白,不坦白)这个策略组合开始:,博弈参与人得益的提高是改变策略的动机。,-8, 0,-5, -5,0, -8,-1, -1,坦 白,不坦白,坦 白,不坦白,囚徒 2,囚,徒,1,夫妻之争,2, 1,0, 0,0, 0,1, 3,看时装表演,看足球比赛,丈夫,妻,子,看时装表演,看足球比赛,猜硬币博弈:,-1, 1,1, -1,1, -1,-1, 1,正 面,反 面,猜硬币方,盖,硬,币,方,正 面,反 面,公共地的悲剧,100, 100,60, 120,120, 60,80, 80,1只,2只,牧民乙,牧,民,甲,1只,2只,2.2 纳什均衡,2.2.1 纳什均衡的定义,2.2.2 纳什均衡的一致预测性质,2.2.3 纳什均衡与严格下策反复消去法,2.2.1 纳什均衡的定义,博弈、博弈方的策略空间和得益的一般表示法,2.2.1 纳什均衡的定义,纳什均衡(Nash Equilibrium)定义,在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方i的策略s*,i,,都是对其余各个博弈方的组合 的最佳对策,也即,对任意 都成立,则称 为G的一个纳什均衡(Nash Equilibrium)。,直白地说,NE就是一组最优策略的组合,是每个参与人都 不想改变自身决策的一种状态。在该状态下参与人所采取的策略都是对于其他参与人的最优反应。,2.2.2 纳什均衡的一致预测性质,一致预测:,如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结构的愿望,因此这个预测结果最终真会成为博弈的结果。,“一致”的含义:,各博弈方的实际行为选择与他们的预测一致,而不是不同博弈方的预测相同、无差异。,只有纳什均衡才具有一致预测的性质;,一致预测性是纳什均衡的本质属性;,一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能。,纳什均衡的存在性问题,每一个有限博弈至少存在一个纳什均衡(纯策略或混合策略);,如果一个博弈存在两个纯策略纳什均衡,那么,一定存在第三个混合策略纳什均衡。,2.2.3 纳什均衡与严格下策反复消去法,上策均衡与纳什均衡的关系,上策均衡包含在纳什均衡范围之内,上策均衡肯定是纳什均衡,纳什均衡不一定是上策均衡,上策均衡是比纳什均衡更强、稳定性更高的均衡概念,上策均衡的普遍性比纳什均衡差,首先考察是否存在上策均衡,如不存在上策均衡再寻找纳什均衡,划线法和箭头法,是在可以用得益矩阵表示的博弈中寻找纳什均衡的方法,纳什均衡与严格下策反复消去法的关系,命题,命题,命题和命题保证了严格下策反复消去法和纳什均衡分析之间的,相容性,,保证了在进行纳什均衡分析之间先通过严格下策反复消去法简化博弈是,可行的,。,2.3 无限策略博弈分析和反应函数,2.3.1 古诺的寡头模型,2.3.2 反应函数,2.3.3 伯特兰德寡头模型,2.3.4 公共资源问题,2.3.5 反应函数的问题和局限性,2.3.1 古诺的寡头模型,假设条件:,博弈方:厂商1,厂商2,策略空间:选择各自产量,得益:各自的利润,厂商利润=收益-成本,双方的得益(利润)都取决于双方的策略(产量),由于双方有无限种可选策略,所以无法用得益矩阵表示该博弈,但纳什均衡的概念还是适用的,要找到一个策略组合(q*,1, q*,2,),满足其中q*,1,和q*,2,相互是对对方的最佳对策,就构成一个纳什均衡。,根据纳什均衡的定义,如果策略组合 是本博弈的纳什均衡,那么 必须是最大值问题,的解。,在两寡头产量博弈中,为了做效率评价,从两厂商总体利益最大化的角度考虑,两寡头间的囚徒困境博弈,,,, 5,5,,4, 4,2,2,厂商 2,厂,商,1,自由竞争的经济同样存在低效率问题,放任自流也不是最好的政策,说明了市场的管理、政府对市场的调控和监管是必要的,例子:石油输出国组织,2.3.2 反应函数划线法思路在连续策略中的推广,反应函数:,对于厂商2的每一个可能的产量,厂商1的最佳对策产量的计算公式,是厂商2 产量的一个连续函数,我们称这个连续函数为厂商1对厂商2的一个“反应函数”。,古诺模型的反应函数,(3,0),(0,3),(0,6),(6,0),(2,2),2.3.2 伯特兰德寡头模型,在两寡头价格博弈中,博弈方:厂商1,厂商2,策略空间:,得益:各自的利润,博弈双方的得益,两厂商对对方策略(价格)的反应函数(P,65,),100,100,20,150,150,20,70,70,高 价,低 价,高 价,低 价,寡头2,寡,头,1,双寡头的得益矩阵,90年代,彩电行业寡头垄断,9家占70%份额,1999年4月初,长虹突然降价,康佳、TCL、创维建立彩电联盟不降价,1999年4月20日晚,康佳突然降价,价格战开始蔓延,1996年到2000年彩电行业8次降价战,损失147亿,200亿,彩电行业价格战,2.3.4 公共资源问题,公共草地放牧问题,博弈方:n个农户,策略空间:可能选择的养羊数,农户的得益:,假设n=3,c=4,产出函数V=100-Q,总体利益最大的情况,比较:,100, 100,60, 120,120, 60,80, 80,1只,2只,牧民乙,牧,民,甲,1只,2只,每个利用公共资源的人,面临的囚徒困境,2.3.5 反应函数的问题和局限性,在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。,即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。,(a),(b),2.4 混合策略和混合策略纳什均衡,2.4.1 严格竞争博弈和混合策略的引进,2.4.2 多重均衡博弈和混合策略,2.4.3 混合策略和严格下策反复消去法,2.4.4 混合策略反应函数,2.4.1 严格竞争博弈和混合策略的引进,严格竞争博弈:,各博弈方的利益和偏好始终不一致 ,属于在纯策略上没有纳什均衡的博弈问题。,猜硬币博弈,博弈方必须保证自身策略选择的随机性,以及重视各个策略的概率分布,以防止其他博弈方猜到自己的策略,或利用自己对策略选择的偏好获利。,-1, 1,1, -1,1, -1,-1, 1,正 面,反 面,猜硬币方,盖,硬,币,方,正 面,反 面,混合策略(Mixed Strategies),混合策略扩展博弈,混合策略纳什均衡,例子,博弈方1的混合策略一定要使博弈方2选C和选D的期望得益相等,博弈方2的混合策略一定要使博弈方1选A和选B的期望得益相等,2, 3,5, 2,3, 1,1, 5,C,D,博弈方2,博,弈,方,1,A,B,原则一:随机,原则二:无机可乘,混合策略,期望得益,2, 3,5, 2,3, 1,1, 5,C,D,博弈方2,博,弈,方,1,A,B,策略 得益,博弈方1 (,),博弈方2 (,),C,D,A,0.80.8,0.80.2,B,0.20.8,0.20.2,猜硬币博弈,盖硬币方的混合策略应该使猜硬币方猜正和猜反的期望得益相等,猜硬币方的混合策略应该使盖硬币方盖正和盖反的期望得益相等,-1, 1,1, -1,1, -1,-1, 1,正 面,反 面,猜硬币方,盖,硬,币,方,正 面,反 面,p=q=1/2,期望得益=0,齐威王田忌赛马,3,-3,1,-1,1,-1,1,-1,-1,1,1,-1,1,-1,3,-3,1,-1,1,-1,1,-1,-1,1,1,-1,-1,1,3,-3,1,-1,1,-1,1,-1,-1,1,1,-1,,1,-1,3,-3,1,-1,1,-1,1,-1,1,-1,1,-1,-1,1,3,-3,1,-1,1,-1,1,-1,-1,1,1,-1,1,-1,3,-3,上中下,上下中,中上下,中下上,下上中,下中上,上,中,下,上,下,中,中,上,下,中,下,上,下,上,中,下,中,上,田 忌,齐,威,王,得益矩阵,齐威王期望得益:1,田忌期望得益:-1,小偷和守卫的博弈,V,-D,-P,0,0,S,0,0,睡,不睡,偷,不偷,守卫,小,偷,守卫得益(睡),小偷偷的概率,S,0,1,-D,-D,加重对守卫的处罚:短期中的效果是使守卫真正尽职,在长期中并不能使守卫更尽职,但会降低盗窃发生的概率,V,-D,-P,0,0,S,0,0,睡,不睡,偷,不偷,守卫,小,偷,小偷得益(偷),守卫睡的概率,0,1,V,-P,-P,加重对小偷的处罚:短期内能抑制盗窃发生率,长期并不能降低盗窃发生率,但会使守卫更多的偷懒,纳什均衡的,理性主义和群体行为,的两种解释,理性主义解释就是个体理性选择的策略均衡,而群体行为解释指的是在由大量个体组成的群体中,面临同样的博弈问题采用特定纯策略的频率(比例)不变。,按照这种群体行为的解释,小偷与守卫对混合策略的选择,可以分别理解为某个地区偷盗案件发生的频率与该地区所有守卫中偷懒和勤勉者的比例,混合策略纳什均衡就是上述频率和比例之间的平衡关系。,2.4.2 多重均衡博弈和混合策略,夫妻之争的混合策略纳什均衡,妻子的概率选择:使丈夫选择两种策略的期望得益相同,2, 1,0, 0,0, 0,1, 3,看时装表演,看足球比赛,丈夫,妻,子,看时装表演,看足球比赛,2.4.2 多重均衡博弈和混合策略,丈夫的概率选择:使妻子选择两种策略的期望得益相同,妻子的期望得益,丈夫的期望得益,2.4.2 多重均衡博弈和混合策略,制式问题,1, 3,0, 0,0, 0,2, 2,A,B,厂商2,厂,商,1,A,B,在引进技术、投资、开发产品等问题中,各自为政的行为常会导致低效率,2.4.2 多重均衡博弈和混合策略,市场机会博弈,-50,-50,100, 0,0, 100,0, 0,进,不进,厂商2,厂,商,1,进,不进,纯粹市场竞争不一定是高效率的,协调机制,例如:利益补偿机制,2.4.3 混合策略和严格下策反复消去法,在包括混合策略的情况下,严格下策反复消去法的结论仍然成立,任何博弈方不会采用严格下策,不管它们是纯策略还是混合策略,严格下策反复消去法不会消去任何纳什均衡,包括纯策略纳什均衡和混合策略纳什均衡,如果经过反复消去后留下的策略组合是惟一的,那么一定是纳什均衡,2.4.3 混合策略和严格下策反复消去法,博弈方2采用纯策略L时,博弈方1用上述混合策略的期望得益为:,博弈方2采用纯策略R时,博弈方1用上述混合策略的期望得益为:,博弈方2采用混合策略(q,1-q)时,博弈方1用上述混合策略的期望得益为:,3, 1,0, 2,0, 2,3, 3,1, 3,1, 1,L,R,U,M,D,博弈方2,博,弈,方,1,博弈方1采取混合策略:以概率(1/2,1/2,0)选择(U,M,D)时,与这个混合策略相比,D一定是博弈方1的严格下策!,2.4.3 混合策略和严格下策反复消去法,3, 1,0, 2,0, 2,3, 3,1, 3,1, 1,L,R,U,M,D,博弈方2,博,弈,方,1,3, 1,0, 2,0, 2,3, 3,U,M,L,R,博弈方2,博弈方1,3, 1,0, 2,0, 2,3, 3,2,, 3,1,, 1,L,R,U,M,D,博弈方2,博,弈,方,1,求混合策略应先剔除劣策略,李四,左,中,右,上,2,0,2,1,4,2,张三,中,3,4,1,2,2,3,下,1,3,0,2,3,0,2.4.4 混合策略反应函数,反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反应决策构成的函数,在纯策略的范畴内,反应函数是各博弈方选择的纯策略对其他博弈方纯策略的反应,在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是一方对另一方的概率分布的反应,同样也是一定的概率分布,2.4.4 混合策略反应函数,猜硬币博弈,正 反,盖硬币方:( r, 1-r),猜硬币方:( q, 1-q),q1/2时,r=0,r1/2时,q=1,r1/2时,q=0,r,q,0,1/2,1,r=R,1,(q),1/2,1,q=R,2,(r),2.4.4 混合策略反应函数,夫妻之争,时装 足球,妻子:( r, 1-r),丈夫:( q, 1-q),q1/3时,r=1,r3/4时,q=1,0,1/3,r,3/4,1,q,1,r=R,1,(q),q=R,2,(r),2.5 纳什均衡的存在性,纳什定理(Nash 1950),每一个有限博弈都至少有一个混合策略纳什均衡,2.6 纳什均衡的选择和分析方法扩展,2.6.1 帕累托和风险上策均衡,帕累托上策均衡,风险上策均衡,2.6.2 聚点和相关均衡,聚点均衡,相关均衡,2.6.3 共谋和防共谋均衡,多人博弈中的共谋问题,防共谋均衡,2.6.1 帕累托和风险上策均衡,帕累托上策均衡:,依据帕累托效率意义上的优劣关系,某一个纳什均衡给所有博弈方带来的利益都大于其他所有纳什均衡会带来的利益,博弈方选择的倾向性是一致的。,-5, -5,-10, 8,8, -10,10, 10,战争,和平,国家2,战争,和平,国,家,1,战争与和平,两个纯策略纳什均衡:,(战争,战争), (和平,和平),在帕累托效率意义上,(和平,和平)明显较好,构成一个,帕累托上策均衡。,如果两国的决策者都是理性的,那么两个国家之间就不应该会发生战争。,为什么还会有战争发生?,2.6.1 帕累托和风险上策均衡,风险上策均衡:,如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某一纳什均衡,则该纳什均衡就是一个风险上策均衡。,9, 9,8, 0,0, 8,7, 7,L,R,博弈方2,U,D,博,弈,方,1,风险上策均衡(D,R),明显地(U,L)为帕累托上策均衡,但是选择这个NE对双方都有很大风险,一旦对方偏离这个均衡,那么自身的得益损失是非常大的,相对于这种高风险,(D,R)就有了相对优势。,2.6.1 帕累托和风险上策均衡,猎鹿博弈,5, 5,3, 0,0, 3,3, 3,鹿,兔子,猎人2,鹿,兔子,猎,人,1,猎鹿博弈,风险上策均衡(兔子,兔子),猎鹿有风险,捕兔有保障,假如另一方选择猎鹿和抓兔的概率都是1/2,那么“猎鹿”的期望收益仅为,小于抓兔子的确定性收益3,因此(兔子,兔子)就是这个博弈的一个风险上策均衡。,2.6.1 帕累托和风险上策均衡,博弈方对风险上策均衡的选择倾向,有一种自我强化的机制。当部分或所有博弈方选择风险上策均衡的可能性增强时,任一博弈方选择帕累托上策均衡策略的期望得益都会进一步变小,这就使各博弈方更倾向于选择风险上策均衡,从而形成一种选择风险上策均衡的正反馈机制,使其出现的机会越来越大。,合作难,多人合作更难。,2.6.2 聚点和相关均衡,人们的决策选择受心理、习惯、文化、环境等多种因素影响。,聚点均衡:,在多重纳什均衡的博弈中,双方同时选择一个聚点构成的纳什均衡称为“聚点均衡”。,聚点均衡首先是纳什均衡,是多重纳什均衡中比较容易被选择的纳什均衡。,聚点均衡是利用博弈规则以外的特定信息选择的均衡,文化背景中的习惯或规范、共同的知识或者其他各种特征都可能是聚点均衡的依据。,2.6.2 聚点和相关均衡,报时博弈,博弈参与人:博弈方1、博弈方2;,策略:双方选择0点到24点的任意时间报时;,得益:2人报时间相同,获得100元;,报时不同,获得0元。,存在无穷多纳什均衡,且不存在效率上的优劣,选择整点(即聚点),虽然不能保证双方的选择一致,但至少能大大提高双方选择一致的概率。,2.6.2 聚点和相关均衡,城市博弈,上海、南京、长春、哈尔滨。,两人将以上四个城市分成两组,如果两人的分组相同,获得100元。,中国人,通常会(上海、南京)、(长春、哈尔滨),按南方和北方城市的特征分组。,地理常识,产生聚点。,2.6.2 聚点和相关均衡,2.相关均衡,人们在现实中遇到选择困难时,特别是在长期中反复遇到相似的选择难题时,通常会通过收集更多的信息,形成特定的机制和规则,也就是某种形式的制度安排等主动寻找出路。,2.6.2 聚点和相关均衡,相关均衡例子,5, 1,4, 4,0, 0,1, 5,L,R,博弈方2,U,D,博,弈,方,1,相关均衡例子,存在三个纳什均衡,其中:,两个是纯策略均衡: (U,L); (D,R),一个是混合策略均衡:,(1/2,1/2),(1/2,1/2),纯策略均衡虽然都能使双方得到6单位的得益总和,但是个人得益差距很大,很难形成自然妥协,“聚点”不适用。,若采用混合策略纳什均衡,因为有1/4的可能性遇到最不理想的(U,R),双方的期望得益只有,显然也不理想。,2.6.2 聚点和相关均衡,抛硬币解决,5, 1,4, 4,0, 0,1, 5,L,R,博弈方2,U,D,博,弈,方,1,相关均衡例子,存在三个纳什均衡,其中:,两个是纯策略均衡: (U,L); (D,R),一个是混合策略均衡:,(1/2,1/2),(1/2,1/2),由于避免(U,R)的出现符合双方的利益,可以使用抛硬币的解决方法:,正面1U,2L;反面1D,2R.,这样,两个纯策略均衡(U,L)(D,R)出现的概率均为1/2,排除了(U,R),期望得益为(5+1)/2=32.5,这要好于混合策略均衡。,2.6.2 聚点和相关均衡,信号装置解决方案,5, 1,4, 4,0, 0,1, 5,L,R,博弈方2,U,D,博,弈,方,1,相关均衡例子,存在三个纳什均衡,其中:,两个是纯策略均衡: (U,L); (D,R),一个是混合策略均衡:,(1/2,1/2),(1/2,1/2),发出相关信号的相关装置:,1、各1/3概率发出A,B,C三种信号,2、博弈方1只能看到是否A,,博弈方2只能看到是否C,3、博弈方1见A采用U,否则D;,博弈方2见C采用R,否则L。,首先排除,更好,但不是,纳什均衡,性质:,1、排除了(U,R),2、包含了(D,L),3、保证(U,L)(D,R)(D,L)各,以1/3概率出现,期望得,益达到(5+4+1)/3=3+1/3,3、该策略组合是纳什均衡,(具有稳定性),4、不影响原来均衡,(双方均可忽略这个信号),2.6.2 聚点和相关均衡,我们称双方根据上述相关装置选择策略构成的纳什均衡为“相关均衡”.,上述相关均衡虽然仍不能完全实现(D,L),但至少在具有稳定性的前提下部分实现,对提高博弈效率是有意义的.,问题:现实性问题。能否设置出上面那种机制?博弈方能否自觉采取那种机制?等等,2.6.3 共谋和防共谋均衡,在多人博弈中,如果部分博弈方通过某种形式的默契或串通形成小团体,可能得到比不串通时更大的利益,那么这些博弈方就有很强的相互串通,联合行动的动机。,通常的纳什均衡分析会遇到问题,具有稳定性的策略组合也不是一般意义上的纳什均衡。,2.6.3 共谋和防共谋均衡,小团体利益追求行为多人博弈中的共谋问题,0,0,10,-5,-5,0,-5,-5,0,1,1,-5,L,R,U,D,博弈方2,博,弈,方,1,博弈方3,A,-2,-2,0,-5,-5,0,-5,-5,0,-1,-1,5,L,R,U,D,博弈方2,博,弈,方,1,博弈方3,B,存在两个纯策略纳什均衡:,(U,L,A)、(D,R,B),从帕累托效率和风险上策的意义上,前者都优于后者,(0,0,10)(-1,-1,5),如果考虑到串谋的情况,结果会怎样?,NE,NE,各方独立,无共谋,理性,则该博弈的结果为:,(U,L,A),2.6.3 共谋和防共谋均衡,如果存在部分博弈方串谋:博弈方3选择策略A,那么博弈方1和博弈方2串谋选择(D,R,A)的时候,博弈方1和博弈方2分别得到1的得益,要大于(U,L,A)的得益0。,0,0,10,-5,-5,0,-5,-5,0,1,1,-5,L,R,U,D,博弈方2,博,弈,方,1,博弈方3,A,这样的话,以往的纳什均衡分析就不能解决这个博弈问题了,而且,帕累托上策均衡和风险上策均衡也不能解决这个问题,需要新的概念和思想。,2.6.3 共谋和防共谋均衡,共谋问题引出了“防共谋均衡”思想。防共谋均衡是两个以上博弈方的博弈中,博弈方之间在帕累托上策均衡中进行合作的思想的扩展。,2.6.3 共谋和防共谋均衡,防共谋均衡,如果一个博弈的某个策略组合满足以下要求:,(1)没有任何单个博弈方的串通会改变博弈的结果,即单独改变策略无利可图(这意味着该策略首先是一个纳什均衡);,(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;,(3)依次类推,直到所有博弈方都参加的串通也不会改变博弈的结果。,满足上述要求的均衡策略组合称为“防共谋均衡”。,防共谋均衡的目标就是要排除小团体联合行动给博弈结果带来的不稳定性,使得博弈分析的结果更加可靠。,2.6.3 共谋和防共谋均衡,(U,L,A),不是防共谋均衡,因为它受到小团体和局部串通行为威胁时是不稳定的。,对于纳什均衡(D,R,B),从帕累托效率的意义上明显不如(U,L,A),但他却是防共谋均衡。因为,给定偏离者还能继续偏离的约束,个人如何行为,或怎样串谋都不会增加他们的得益。(D,R,B)比(U,L,A)更具稳定性,更可能是博弈的结果。,由于(D,R,B)在帕累托效率上明显比(U,L,A)差,因此,这个博弈可以看作是更复杂的“囚徒困境”问题。,0,0,10,-5,-5,0,-5,-5,0,1,1,-5,L,R,U,D,博弈方2,博,弈,方,1,博弈方3,A,-2,-2,0,-5,-5,0,-5,-5,0,-1,-1,5,L,R,U,D,博弈方2,博,弈,方,1,博弈方3,B,NE,2.6.3 共谋和防共谋均衡,这里提到的防共谋均衡中讨论的博弈方之间的串通和联合行为均出于自愿自觉,是没有,强制力,的,与协议式的合作行为不同。,因此,防共谋均衡是非合作博弈的均衡概念,而不是合作博弈的概念。,第二章 复习,1.完全信息静态博弈,完全信息:所有博弈方对各方得益都了解,静态:同时或相当于于同时决策,2.博弈有两种表述方法,策略型表述适合表示静态博弈(得益矩阵),扩展型表述适合表示动态博弈(博弈树),第二章 复习,3.上策均衡,(1)上策:比其他所有策略都要好或至少不差的策略,(2)上策均衡:各博弈方上策的组合,稳定,绝对偏好,上策均衡:坦白,坦白,第二章 复习,4.严格下策反复消去法,(1)严格下策:相对概念,两两比较,严格劣于另一个策略的策略,比上策更具有普遍性。,(2)分析方法,(3)智猪博弈搭便车,第二章 复习,5.划线法,思路:找对于其他参与人的各种策略,自己最好的策略,第二章 复习,6.箭头法,思路:利用策略组合的,稳定性,,从参与人有改变策略的,“动机”,出发,对博弈模型的结果进行分析和预测。,-8, 0,-5, -5,0, -8,-1, -1,坦 白,不坦白,坦 白,不坦白,囚徒 2,囚,徒,1,第二章 复习,7.纳什均衡,(1)纳什均衡就是,具有,相互,是最优对策性质的,各博弈方策略组成的策略组合。,直白地说,纳什均衡就是一种每个参与人都不想改变自身策略的稳定状态。如:囚徒困境中的坦白,坦白。,(2)一致性:各博弈方的实际行为选择与他们的预测一致。,(3)进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的。,第二章 复习,8.无限策略博弈,一个博弈中至少有某些博弈方的策略有无限多个,只能用数集或函数来表示。,9.古诺寡头模型(1838),(1)无限策略博弈;,(2)两寡头产量,q,1,、q,2,博弈;,(3)使用纳什均衡思路求解均衡产出组合,(,q,1,*,q,2,*,),;,均衡产出,(,q,1,*,q,2,*,),,要满足各自利润最大化:,第二章 复习,(4)两寡头间的囚徒困境博弈,每个博弈方都有动机破坏合作的产量,以获得更高的个人收益,这将会使总体利益最大化的合作策略组合不突破,不突破变得不稳定,难以实现,即使实现,也难以维持。,4.5, 4.5,3.75, 5,5, 3.75,4, 4,不突破,突破,不突破,突破,厂商 2,厂,商,1,第二章 复习,10.反应函数划线法思路的推广,所谓“反应函数”,简单地说,就是对其他博弈参与人策略的一个最佳的 对策函数,使用的是划线法的思想。,两条反应函数的交点是由,相互对对方,的最佳反应策略构成的策略组合,是纳什均衡;,反应函数交点以外的其他点都仅仅是一方对另一方策略的最佳反应,而不是,“相互”,的最佳反应。,第二章 复习,11.反应函数求解纳什均衡的步骤,第一步 博弈分析,明确各博弈方得益;,第二步 各自效用最大化,求对决策变量的一阶偏导数,,并令其为零,得到反应函数;,第三步 求反应函数交点,即解方程组,得到纳什均衡。,第二章 复习,12.伯特兰德寡头模型(定价博弈)(1883),(1)由厂商1和厂商2自身效用最大化求得的两厂商反应函数分别为:,(2)求反应函数交点,得到纳什均衡,第二章 复习,13.公共资源问题,(1)公共放牧问题,重要假设:,每只羊的产出 是羊只总数Q的,减函数。,(2)农户数:n=3;,单位羊只养殖成本:c=4;,单位羊只产出函数:,(3)个体理性与集体理性的比较:,过度放牧,资源浪费,农户没有获得更好的效益。,仍然是一类囚徒困境问题。,第二章 复习,14.反应函数的问题与局限性,(1)得益函数不可导,无法求得反应函数;,(2)反应函数无交点或交点不唯一。,第二章 复习,15.严格竞争博弈,各博弈方的利益和偏好始终不一致 ,在通常策略上没有纳什均衡的博弈问题。,例子:猜硬币博弈。,16.博弈方采取混合策略的原则,(1)随机性;,(3)无偏好性。,第二章 复习,17.混合策略,18.混合策略扩展博弈,纯策略,P:混合策略,新纯策略,第二章 复习,19.混合策略纳什均衡,任何博弈方单独改变自己,随机选择各个纯策略的概率分布,即混合策略(非退化),,都不能给自己增加任何利益,也就是博弈方都没有动机改变自身混合策略的一种状态。,第二章 复习,20.混合策略纳什均衡的求解,原则:,各博弈方的混合策略使得其他博弈方的期望收益相等,不存在任何倾向性。,(1)严格竞争(无纯策略均衡)博弈的例子,猜硬币、田忌赛马;,小偷与守卫的博弈图解法,激励的悖论;,(2)多重均衡的例子,夫妻博弈、制式问题、市场机会博弈;,第二章 复习,21.混合策略和严格下策反复消去法,在包括混合策略的情况下,严格下策反复消去法的结论仍然成立。但是,并不是包括混合策略以后,博弈中一定会存在可以先行削去的纯策略严格下策。,22.混合策略反应函数,在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是一方对另一方的概率分布的反应,同样也是一定的,概率分布,。,例子:猜硬币博弈、夫妻之争。,第二章 复习,23.纳什定理(Nash 1950),每一个有限博弈都至少有一个混合策略纳什均衡。,第二章 复习,24.纳什均衡的选择和分析方法扩展,(1)帕累托和风险上策均衡,帕累托上策均衡:,依据帕累托效率意义上的优劣关系,某一个纳什均衡给所有博弈方带来的利益都大于其他所有纳什均衡会带来的利益,博弈方选择的倾向性是一致的。如:,和平,和平,风险上策均衡:,一旦对方偏离某个得益最高的均衡,那么自身的得益损失是非常大的,因此,双方会在风险与得益之间进行抉择,选择风险较小,得益比较高(不一定最高)的那个均衡策略,即,风险上策均衡,。启示:,合作难,多人合作更难。,第二章 复习,(2)聚点和相关均衡,聚点均衡:,聚点均衡是利用博弈规则以外的特定信息选择的均衡,文化背景中的习惯或规范、共同的知识或者其他各种特征都可能是聚点均衡的依据。,简单地说:常识产生聚点,聚点构成纳什均衡。,相关均衡:,人们在现实中遇到选择困难时,特别是在长期中反复遇到相似的选择难题时,通常会通过收集更多的信息,形成特定的机制和规则,也就是某种形式的制度安排等主动寻找出路。,例子:A、B、C信号装置。,第二章 复习,(3)共谋和防共谋均衡,多人博弈中的共谋问题:,在多人博弈中,如果部分博弈方通过某种形式的默契或串通形成小团体,可能得到比不串通时更大的利益,那么这些博弈方就有很强的相互串通,联合行动的动机。,防共谋均衡:,所有博弈方都参加的串通也不会改变博弈的结果,,排除了小团体联合行动给博弈结果带来的不稳定性。这里说讨论的博弈方之间的串通和联合行为均出于自愿自觉,是没有,强制力,的,与协议式的合作行为不同。防共谋均衡是非合作博弈的均衡概念,而不是合作博弈的概念。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 幼儿教育


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!