《博弈论》445页中英双语精品全套课件完整版

上传人:e****s 文档编号:243158180 上传时间:2024-09-17 格式:PPT 页数:445 大小:7.94MB
返回 下载 相关 举报
《博弈论》445页中英双语精品全套课件完整版_第1页
第1页 / 共445页
《博弈论》445页中英双语精品全套课件完整版_第2页
第2页 / 共445页
《博弈论》445页中英双语精品全套课件完整版_第3页
第3页 / 共445页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,博弈论,Game Theory,一、博弈Game,博弈论Game Theory,前言Preface,参与人:两人及两人以上;,行为:做出决策;,行为目标:收益最大化,环境条件:目标的实现不仅取决于自己,的行为,同时还取决于其他,人的行为,个人的最优选择,是其他人选择的函数,策略性的行为,分钱游戏与运输路线选择,博弈Game:,博弈是指代表不同利益主体的决策者,在一,定的环境条件和规那么下,同时或先后、一次,或屡次从各自允许选择的行动方案中加以选,择并实施,从而取得各自相应结果的活动。,美Roger B. Myerson一个博弈指的是涉及到,两个或更多个参与人的某个社会局势。,英Adam Smith博弈是个体参与人从各自的,动机出发生相互作用的一种状态。,博弈论Game Theory,对策论:,美Roger B. Myerson博弈论可以被定义,为是智能的理性决策者之间冲突与合作的,数学模型的研究。,美Robert Gibbonsis the study of multi-,person decision problems.,张维迎是研究决策主体的行为发生直接,相互作用 时候的决策以及这种决,策的均衡问题的,也就是说,当,一个主体,好比说一个人或 一个,企业的选择受到其他人、其他企,业选择的影响,而且反过来影响,到其他人、其他企业选择时的决,策问题和均衡问题。,张守一是研究聪明而又理智的决策者在,冲突或合作中的策略选择理论。,教材P5 博弈论就是系统研究各种各,样博弈中参与人的合理选择及其,均衡的理论。,关于“经济博弈论:,博弈论是研究人们在利益相互影响的格局,中的策略选择问题、是研究多人决策问题的理,论。而策略选择是人们经济行为的核心内容,,此外,经济学和博弈论的研究模式是一样的:,即强调个人理性,也就是在给定的约束条件下,追求效用最大化。可见,经济学和博弈论具,有内在的联系。在经济学和博弈论具有的这,种天然联系的根底上产生了经济博弈论。,将博弈的思想明确地应用于经济领域,始于古诺Cournot,1838、伯特兰德Bertrand,1883和艾奇沃斯 Edgeworth,1925等人关于两寡头的产量和价格垄断、产品交易行为的研究,他们通过对不同的经济行为方式和案例建立了相应的博弈论模型,为经济博弈论的开展提供了思想雏形和有益尝试。近半个多世纪以来,博弈论引起了众多经济学家的极大兴趣,使得博弈论在经济学中的应用模型越来越多。大约从20世纪80年代开始,博弈论逐渐成为主流经济学的一局部,甚至可以说成为微观经济学的根底张维迎,P8。,博弈论究竟是一门什么样的学科呢?有人,认为是经济学的一个分支,有人认为是数学的一个分支。我们把它看作是一种方法论,即它提供了一个观察问题的新视角、分析问题的新方法和解决问题的新思路;它的应用范围不仅包括经济学,像政治学、军事、外交、国际关系、公共选择、犯罪心理分析等都涉及博弈论。只不过从应用的成果来看,博弈论在经济学领域的应用最广泛、最成功,经济学家对博弈论的奉献也特别大,使得博弈论在经济学领域的应用无处不在:微观研究领域有交易机制的模型如讨价还价模型和拍卖模型;,在中观经济研究中,劳动力经济学和金融理,论都有关于企业要素投入品市场的博弈模型,即使在一个企业内部也存在博弈问题:工人之间会为同一个升迁时机勾心斗角,不同部门之间为争取公司的资金投入相互竞争;从宏观角度看,国际经济学中有关于国家间的相互竞争或相互串谋、选择关税或其他贸易政策的模型;至于产业组织理论更是大量应用博弈论的方法见Jean Tirole的?产业组织理论?。,二、博弈论的产生和开展,博弈思想的根本特征是参与人在追求自己,目标的过程中,不仅仅只是考虑自己能怎么,做,还必须要考虑其他参与人会怎么做;针,对其他参与人的行为,自己该实施哪个可行,的行动,才能使自己的目标函数最大化,也,就是说,在一个博弈格局中,每个参与人所,实施的行动都是策略性的行动。,知己知彼,百战不殆,产生与开展,教材P1-3 ?现代经济对策论?P6-7,冯诺依曼和摩根斯坦Von.neumann and morgenstern,冯 诺依曼是20世纪伟大的数学家之一,后者是德国人,1902年生,美国当代杰出经济学家。,?The theory of Games and Economic Behaviour?的产,生:二战期间,为了有效对抗法西斯,不仅是军人,连物,理学家、数学家,甚至经济学家都被发动起来,组成“运,筹研究班,共同研究作战方案,在作战中数学的合理性,得到了广泛运用,产生了种种理论。博弈论便是其中之一。,二战结束后,大局部理论研究都转向其他领域。博弈论那么,在摩根斯坦的劝说下,与冯合作成就了?The theory of,Games and Economic Behaviour?,即转到了经济领域。冷,战期间得到了政府的大力支持,博弈论不仅在经济领域,,而后在社会学、外交问题军事问题上都得到了应用。,因对博弈论研究作出杰出奉献而获诺贝尔经济,学奖的经济学家:,纳什(Nash): Nash-Equilibrium,塞尔藤(Selten):Subgame-Perfect Nash E-,海萨尼(Harsanyi) : Bayes-Nash Equilibrium,1994,维克利、莫里斯 1996,迈克尔斯宾斯(Spence): 1948年生于美国的新,泽西,1972年获哈佛大学博士头衔,现兼任美国,哈佛和斯坦福两所大学经济学教授。,乔治阿克尔洛夫:1940年生于美国的纽黑文,,1966年获美国麻省理工学院博士头衔,现为美国,加利福尼亚大学经济学教授。,约瑟夫斯蒂格利茨,1948年生于美国的印第安纳州,1967年获美国麻省理工学院博士头衔,曾任世界银行的首席经济学家,现任美国哥伦比亚大学经济学教授。,2001年三人同获诺贝尔经济学奖,分享1000万瑞典克郎94.3万美元的奖金。瑞典皇家科学院之所以把这崇高的荣誉给予这三位经济学家,是因为他们在现代信息经济学研究领域作出了突出的奉献,他们“开展并研究了市场信息不对称的问题,揭示了当代信息经济的核心。教材P192,阿克尔洛夫是最早发现信息不对称的学者之一。我们上街购物,几乎处处都能碰上假货:花了上千元买的“进口名牌服装,原来是国产的,只值几十元;“真皮皮鞋用的是人造革的料为什么假货愈 演愈烈?为什么假货在开展中国家特别猖獗?阿克尔洛夫答复说:“一家商场,一般是售货员比顾客更了解产品的质量,如果售货员把这种信息加以垄断,最后即使他提供越来越差的产品,顾客也不会知道。顾客的利益因而受到损害。只有买错,没有卖错阿克尔洛夫最大的奉献是解释了在开展中国家里,信贷市场信息的不对称导致了这些国家信,贷市场的过高利息。此外,阿克尔洛夫还把信,息不对称运用于解释各种社会问题,比方因为信,息不对称,医疗保险市场上,老年人、个体劳动,者的医疗保险利益得不到保障。,三、根本概念,1、参与人Players:一个博弈中的决策主体,他们各自的目的是通过选择行动策略以最大化自己的目标函数/效用水平/支付函数。他们可以是自然人或团体或法人,如企业、国家、地区、社团、欧盟、北约等。,那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人,而只能当做环境参数来处理。如指手划脚的看牌人、看棋人,企业的参谋等。,对参与人的决策来说,最重要的是必须有,可供选择的行动集策略集和一个很好定义的,支付函数。,虚拟参与人pseudo-player:指“自然,nature、“上帝 God,也即决定外生的随机,变量的概率分布的机制。“某事在人、成事在天,的“天;如出远门去旅游,可能很开心,也可能,很为难生病住医院,两者概率分布90%、,10%或98%与2%或其他,由上帝决定。,在以后的讨论中,我们记参与人为i,参与人,集合记为T,即T=1,2, , i , ,,n ,即该博弈中共有n个参与人;为了讨论的方便,,把某个参与人i之外的其他参与人称为的i对手,记为- i ; N代表自然。,*注意:,博弈理论家一般对参与人做两个根本的假设,参与人都是理性的和智能的,理性的rational?,1如果一个决策者在追逐其目标时能前后一致地做决策,就称他为,rational。Roger BMyerson (P2),2广义而言指的是一种行为方式,他同在给定条件或约束下最有效地实现预期目标相关。具体地讲,理性大致有以下三项,内容:1存在一组可供选择的备选或替代方,案;2每一种方案均对应着某种特定的预期,净收益或满足程度或目标实现程度;3人们,总是选择那个能够带来最大预期净收益的方案。,西蒙,1964,智能的intelligent?,当我们像博弈论专家那样分析一个博弈时,,如果参与人知道我们对此博弈所知道的一切,并能做出我们对此博弈所能做出的一切推断,,我们就说此博弈的参与人是智能的。Roger,BMyerson (P3),2、策略strategies :博弈中有两种策略概,念,一种为纯策略pure strategy , 简称策略,,指参与人在博弈中可以选择采用的行动ac-,tions or moves方案,是参与人在给定信息结,构的情况下的行动规那么,它规定参与人在什么,时候的什么情况下采取什么行动。因而一个策,略是参与人的一个“相机行动方案contingent,Action plan。如“人不犯我、“按第一套方,案行动、实施第二套方案 ,记参与人i,的一个策略为si,参与人i在一个博弈中的全部可,供选择的策略记为Si策略集strategy set,即si, Si , Si =s1 ,s2 , si , sn,表示参与,人i 在该博弈中共有n个可行的策略。,如果n个参与人每人从自己的Si中选择一个策略,si,那么向量s= s1,s2,si, sn是一个,策略组合(strategy profile),参与人i之外的其他参,与人的策略组合可记为s-i= s1,s2,si-1 ,si+1 , sn。,例如田忌的某个策略s,田忌,=上中下,或中下上,,等等;S,田忌,=上中下,上下中,中上下,中下上,,下上中,下中上,另一种策略概念是在纯策略根底上形成的,混合策略mixed strategy概念,参与人i的,混合策略pi是他的纯策略空间Si上的一种概率,分布,表示参与人实际进行决策时根据这种,概率分布在纯策略中随机选择加以实施。,Pi(si)表示Pi分配给纯策略si的的概率。如出门,要否带雨伞?天气预报说有时有雨。猜拳?,这是一个十分玄乎的概念,让人不容易理解,,它是一种不确定,采用这种策略的目的就是,让对方琢磨不透,实施时似乎由一架随机机,器在操作。随机策略randomized strategy,纯策略是混合策略的特例?,*注意:, 1、策略与行动是两个不同的概念,策略是,行动的规那么而不是行动本身。回忆“犯与不犯,的问题。在静态博弈中,由于参与人同时行动,,没有人能掌握他人的之前行动的信息,故没有,可针对的行动,从而策略的选择就变成了行动,的选择,即策略和行动是同一的。,行动集Ai ai, 2、作为一种行动规那么,策略必须是完备的,,就是说,策略要给出参与人在每一种可能想象,到的情况下的行动选择,即使参与人并不预期,这种情况会实际发生。“丑话说在前-,3、支付payoffs:参与人从各种策略组合中,获得的收益。收益往往采用效用utility概念。,它或者是一个特定策略组合下某个参与人得到的,确定效用水平,或者是期望效用水平。它是策略,组合的函数,所以也称支付函数,payoff function,记为ui(s),,ui(s)= ui(s1, s2 ,si , sn-1 , sn).,1:博弈的一个根本特征是一个参与人,的支付不仅取决于自己的策略选择,而且取决,于所有其他参与人的策略选择;是策略组合的,函数。,2:支付是参与人真正关心的东西,参与,人在博弈中的目标就是选择自己的策略以最大,化自己的支付函数。,*注意,一个博弈中,明确了以上三个概念,该博,弈的根本框架就形成了,故称为博弈的三个,根本要素。一个具体博弈界定,还须明确行动,的顺序和有关的信息。,4、行动的顺序the order of play:博弈,中参与人实施决策活动的顺序。同时或有先有,后。其他因素不变,但顺序不同,参与人的最,优选择就不同,博弈的结果也不同。事实上,,不同的顺序安排意味着不同的博弈。静态博弈,和动态博弈。,5、信息information:指一个博弈中参,与人有关该博弈的知识,如关于N的选择、其,他参与人的策略集、支付函数、行动时间等.,博弈论中关于信息的具体概念有:,信息集information set主要出现在,动态博弈中,可理解为参与人在特定时刻上对,有关变量的值的知识;一个参与人无法准确知,道的变量的全体属于一个信息集。买古董。,完美信息perfect information:指一个参与,人对其他参与人包括N的行动选择有准确了解的情况,即一个信息集只包含一个值。动态博弈的概念。,完全信息complete information:指N不首,先行动或N的初始行动被所有的参与人准确观察,到的情况,即没有事前的不确定性。完全信息,意味着各个参与人的支付函数是共同知识。,显然,不完全incomplete信息意味着不,完美imperfect信息。,共同知识common knowledge 是与信息,有关的一个重要概念。如听过某个老师的课,学生认识老师,但老师不一定就记住该学生,路上碰在一块了,学生会不会叫老师呢?也许,学生会以为老师不认识他,打招呼会把老师弄得莫名其妙。,解释一:共同知识指“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道。,解释二:如果每个参与人都知道某个事实,,每个参与人都知道每个参与人都知道它,如此等等,从而形如“每个参与人都知道)k每个参与人都知道它的语句对k=0,1,2,都是正确的,那我们就称这个事实为参与人中间的共同知识。,解释三:这是一个“由己及人,由人及己的无限推理过程,是k时的高阶知识,(每个人)k-1。一件事一旦在某个群体中成为,共同知识,那么从任何一个个体出发,他对这件事,的理解等等都已到达了完全的统一,不再有任何,层面的不确定性奥曼,1976。,在博弈论中,一般假定参与人的行动空间Ai,和行动顺序是共同知识。,*为了说明共同知识的重要性,引用一个寓,言故事。,故事发生在一个村庄,村里有100对夫妻,,他们都是地道的逻辑学家智能的;村里有,一些奇特的风俗:每天晚上,村里的男人们都,将点起篝火,绕圈围坐举行会议,议题是谈论,自己的妻子。在会议开始时,如果一个男人有,理由相信他的妻子对他总是守贞的,那么他就,在会议上当众赞扬她的美德。另一方面,如果,在会议之前的任何时间,只要他发现他妻子不,贞的证据,那他就会在会议上悲鸣怯哭,并企,求神灵严厉地惩罚她。再那么,如果一个妻子曾,有不贞,那她和她的情人会立即告知村里除她,丈夫之外所有的已婚男人奇异的传统风俗。所有这些传统和风俗都是村民的共同知识。,事实上,每个妻子都已对丈夫不忠。于是,每个丈夫都知道除自己妻子之外其他人的妻子,都是不贞的女子,因而每个晚上的会议上每个,男人都赞美自己的妻子。,这种状况持续了很多年,直到有一天来了,一位传教士。传教士参加了篝火会议,并听到,每个男人都在赞美自己的妻子,他站起来走到围坐圆圈的中心,大声地提醒说:“这个村子里,有一个妻子已经不贞了。在此后的99个晚上,,丈夫们继续赞美各自的妻子,但在第100个晚,上,他们全都悲鸣怯哭,并企求神灵严惩自己,的妻子。,*怎样理解这个故事?传教士究竟告诉了丈夫,们他们所不知道的什么?,首先注意到假设只有一个妻子不贞,她丈夫能够立刻知道这个不贞的女人就是自己的妻子,因为他丈夫知道没有另外的不贞女人,假设有的话他是知道的,所以在传教士访问后的第一个晚上这个丈夫就会哭;现在他没有哭,那就意味着确实存在一个女子不贞,由此,从“第一个晚上没有男人哭中可推断出:有两个女子已经不贞。在传教士走后的第二晚上,既然已推断出有两个女子不贞,而自己只知道一个,那另一个就是自己的妻子,那这个丈夫应该在“第二个晚上哭。第二个晚上“这个丈夫也没有哭,由此丈夫们推断出:已有三个女子不贞。,由归纳法可以证明,对于1和100之间的任意正,整数k,如果恰有k个妻子不贞,那么在传教士,走后的连续k-1个晚上,所有的丈夫照样各自称,赞自己的妻子,但在第k个晚上,k个不贞妻子,的丈夫会悲鸣怯哭,于是,在99个赞扬之夜过,后的第100个晚上,每个丈夫都知道一定有100,个不贞的妻子。不幸的是包括自己的妻子在内!,传教士究竟告诉了丈夫们什么?每个丈夫,都知道有99个不贞的妻子,故传教士所说的已经有一个女子不贞的话对任何人来说都不是什新闻。但“传教士对所有100个男人做了一个声明是common knowledge,从而这个传教士所声明的内容有一个妻子不贞也就成了100个男人之间的common knowledge。在传教士宣告之前,每个形如“每个丈夫知道)k有一个妻子不贞的判断对于k99都是正确的,但对于,K=100就不正确了。例如,假设从1到100对丈夫,们进行编号,那么1已经知道2已经知道3已经知,道99已经知道100的妻子是不贞的,但1,不知道2已经知道3已经知道99已经知道,100已经知道1的妻子是不贞的。因而从这个,寓言中引申出的含义是,从一个共同知识的,事实推出的结果与从例如只知道每个人,已经知道每个人已经知道的事实推出的结果,可以非常不同。,私人信息private information:指任何一,个他拥有但不是该博弈中所有参与人共同知识的,信息。,由于存在私人信息,便有了信息不对称的问,题。,四、博弈的分类,分类是一种深化认识的方法。博弈可以根据不同的标志从不同的角度进行多种分类。通过分类我们将对博弈有进一步的了解,同时对博弈理论的结构体系有初步的认识。教才14,、按参与人的多少分:,单人博弈和多人博弈,、按策略空间是否有限分:,有限策略博弈和无限策略博弈,、按各策略组合下参与人支付之和情况分:,零和博弈、常和博弈和变和博弈,、按参与人行动的顺序分:,静态博弈和动态博弈,、按信息是否完全分:,完全信息博弈和不完全信息博弈,、按信息是否完美分动态博弈:,完美信息动态博弈和不完美信息动态博弈,博弈理论体系的结构框架按下面博弈类型安排:,静态动态,完全信息完全信息完全信息,静态博弈动态博弈不完全信息不完全信息不完全信息,静态博弈动态博弈,五、本课程安排的特点,目前,博弈论的书籍较多,版本不同,内容结构安排各有千秋,有的详细,有的简练;有的注重纯理论的数学演绎,有的那么关注应用研究,等等。,This class is designed to introduce game,theory to those who will later construct (or at,least consume) game-theoretic models in applied,fields within economics.The exposition emphasizes,the economic applications of the theory at least,as mush the pure theory itself, for three reasons.,First, the applications help teach the theory ; formal arguments about abstract games also appear but play a lesser role . Second,the applications illustrate the process of model building the process of translating an informal description of a multi-person decision situation into a formal game-theoretic problem to be analyzed. Third,the variety of applications shows that similar issues arise in,different rent areas of economics, and that the,same game- theoretic tools can be applied in,each setting .In fact ,people who have not studied pure game theory also can understand the competitive situation just by knowing the applications.,Chapter 1,完全信息静态博弈,Static Games of Complete Information,In this chapter we consider games of the following simple form:,first, the players simultaneously choose actions; then, the players receive payoffs that depend on the combination of actions just chosen. Within the class of such static (or simultaneous-move) games,we restrict attention to games of complete information. That,is each players payoff function (the function that,determines the players payoff from the,combination of actions chosen by the players) is common knowledge among all the players.,教材P21,一、Normal-Form Representation,of Games and Nash Equilibrium,(一)Normal-Form Representation of Games,In the normal-form representation of a game ,each,player simultaneously chooses a strategy, and the,combination of strategies chosen by the players,determines a payoff for each player. We illustrate,the normal-form representation with a classical,exampleThe prisoners Dilemma.,Two suspects are arrested and charged with a crime. The police lack sufficient evidence to,convict the suspects, unless at least one confesses.The police hold the suspects in separate cells and explain the consequences,that will follow from the actions they could take.,If neither confesses then both will be convicted of,a minor offense and sentenced to one year in jail.,If both confess then both will be sentenced to,jail five years. Finally, if one confesses but the,other does not, then the confessor will be released,immediately but the other will be sentenced to,eight years in jailfive for the crime and a,further three for obstructing justice(干扰司法)。,囚徒,招认沉默,招认 5, -5 0, -8,囚徒,沉默 -8, 0 -1 , -1,囚徒的困境,We now turn to the general case. The normal-form,representation of a game specifies:,(1)the players,in the game;(2)the strategies available to each,player;(3)the payoff received by each player for,each combination of strategies that could be chosen,by the players.,Definition: The normal-form representation of an-n-player game specifies the players strategy spaces S,1, , S,n,and their payoff functions u,1, u,n,. We denote this game by G=S,1, ,S,n,;u,1, , u,n,.教材22,理解完全信息静态博弈时要本卷须知, Although we stated that in a normal-form game the players choose their strategies simultaneously , this does not imply that the parties necessarily act simultaneously :it suffices that each choose his or her action without knowledge of the others choices, as would be the case “the prisonersdilemma if the prisoners reached decisions at arbitrary times (在任意时间)while in their separate cells.,2 Here we may recognize complete,information as that each player know the,payoff functions of the others.,(二)Dominant-Strategy Equilibrium,Definition In the normal-form game G=S,1, ,S,n,; u,1, , u,n,let s,i,and s,i,be feasible strategies,for player i (i.e., s,i,and s,i,are members of S,i,).,Strategy s,i,is strictly dominated by strategy s,i,if,for each feasible combination of the others,strategies, is payoff from playing,s,i,is strictly,less than is payoff from playing s,i,. i.e.:,u,i,(s,1, , s,i-1, s,i, s,i+1, , s,n,),u,i,(s,1, , s,i-1, s,i,“, s,i+1, , s,n,),(DS),for each s,-i,= (s,1, , s,i-1, s,i+1, , s,n,) that can be,constructed from the other playersstrategy,Spaces S,1, , S,i-1, S,i+1, S,n,.,囚徒,招认沉默,招认 5, -5 0, -8,囚徒,沉默 -8, 0 -1 , -1,囚徒的困境,策略“沉默严格劣于策略“招认,博弈分析的目的:预测博弈的均衡结果,,即给定每个参与人都是理性的是共同知识,什么是每个参与人的最优策略?什么是所有参与人的最优策略组合?,*肯定性sure-thing或替代性substitution,公理:一个决策者在事件发生的偏好选项,胜于选项,并且在事件不发生时也,偏好选项胜于选项,那么就有,他,在知道事件无论是发生还是不发生之,前都应该偏好选项胜于选项。,“理性的参与人不会选择严格劣策略,“重复剔除严格劣策略iterated elimination of,strictly dominated strategies的思路:,首先,找出某个参与人的严格劣策略,并,把它从他的策略空间中剔除,重新构造一个已,不包含该严格劣策略的博弈;,其次,剔除新博弈中某个参与人的严格劣,策略;,重复上述过程,直到只剩下唯一的策略组,合。,我们认为这个唯一所剩的策略组合是稳定,的。,Definition In a normal-form game,if for each,player i , s,i,is is dominant strategy,than we call,the strategies profile (,s,1, , s,n,) the dominant-,strategy equilibrium.,参与人,左中右,上 1,0 1,2 0,1,参与人,下 0,3 0,1 2,0,策略组合上,中是均衡结局,将实现支付,1,2。,第一,第二,第三,参与人,左中右,上 , 4, 0 5, 3,参与人中 4, 0 0, 4 5, 3,下 3, 5 3, 5 6, 6,每个参与人都不存在严格劣策略,三纳什均衡,Definition In the n-player normal-form game,G=S1, , Sn; u1, , un, the strategies( s1*, sn* ),are a Nash equilibrium if,for each player i, si* is,(at least tied for 至少不劣于) player is best,response to the strategies specified for the n-1 other,players, ( s1*, sn-1* , sn+1* , sn* ):,ui( s1*, sn-1* , si* , sn+1* , sn* ), ui( s1*, sn-1* , si , sn+1* , sn* ),.(NE),for every feasible strategy si in Si; That is , si*solves,max ui( s1*, sn-1* , si, sn+1* , sn* ).,siSi,上述均衡概念是1951年由数学家约翰纳什,John Nash首先解释清楚的,所以将他所解释的均衡称为纳什均衡。,*对纳什均衡的理解:,1 If game theory is to provide a unique solution to a game-theoretic problem then the solution must be a Nash equilibrium, in the following sense.Suppose that game theory makes a unique prediction about the strategy each player will choose. In order for this prediction to be correct,it is necessary that each player be willing to choose the strategy predicted by the theory. Thus each players predicted strategy,must be that players best response to the strategies of the other players,.Such a prediction could be called,strategically stable or self-enforcing,because no,single player wants to deviate from his or her,Predicted strategy.We will call such a prediction,a Nash equilibrium.,- Robert Gibbons P8,2 为了理解纳什均衡的哲学含义,让我们,设想n个参与人在博弈之前协商达成一个协议,,规定每一个参与人选择一个特定的策略。我们,要问的一个问题是,给定其他参与人都遵守这,个协议,在没有外在强制的情况下,是否有任,何人有积极性不遵守这个协议?显然,只有当,遵守协议带来的效用大于不遵守协议时的效用,,一个人才会遵守这个协议。如果没有任何参与,人有积极性不遵守这个协议,我们说这个协议,是可以自动实施的self-enforcing,这个协,议就构成一个纳什均衡;否那么,它就不是一个,纳什均衡。张维迎 ,P68,3 纳什均衡是一种策略组合,使得每个参与,人的策略是对其他参与人策略的最优放应。,纳什均衡是博弈将会如何进行的“一致,consistent预测,这意指,如果所有参与人预,测特定纳什均衡会出现,那么没有参与人有动力,采用与均衡不同的行动。因此纳什均衡也只有,纳什均衡能具有性质使得参与人能预测到它,,预测到他们的对手也会预测到它,如此继续。与,之相反,任何固定的非纳什均衡如果出现就意味,着至少有一个参与人“犯了错,或者是对对手行,动的预测上犯了错,或者是给定那种预测在,最大化自己的收益时犯了错。,(Jean Tirole) P10,纳什均衡通过了一致预测检验并不就使得它们是好的预测,在一些博弈格局中如果认为可以获得精确预测那会过于轻率,由此我们想提请注意一个事实,博弈的最可能结果实际上取决于比标准式所提供的更多的信息。例如,可能希望知道参与人对于此类博弈具有多少经验,他们是否来自同一种文化因此而分县分享关于博弈将会如何进行的特定期望,以及如此等等。,(Jean Tirole) P10-11,A brute-force approach(一个最直接的方法) to,finding a games Nash equilibrium is simply,to check whether each possible combination,of strategies satisfies condition(NE) in the,definition.,In a two-player game ,this approach begins as,follows: for each player, and for each feasible,strategy for that player ,determine the other,players best response to each of that strategy.,划线法,画箭头法,参与人,左中右,上 , 4, 0 5, 3,参与人中 4, 0 0, 4 5, 3,下 3, 5 3, 5 6, 6,每个参与人都不存在严格劣策略,下,右是NE,将实现支付6,6,囚徒,招认沉默,招认 5, -5 0, -8,囚徒,沉默 -8, 0 -1 , -1,囚徒的困境,沉默,沉默帕累托优于招认,招认,有一头大猪和一头小猪住在同一个猪圈里,猪,圈的一侧放者猪食槽,另一侧安装着一个控制,食物供给的按钮。按一次按钮,有8个单位的,食物进槽,但需承担2个单位的本钱。偌大猪,小猪同时到达猪食槽,大猪吃到5个单位的食,物,小猪吃到3个单位的食物;假设大猪先到,,大猪吃7个单位的食物,小猪只能吃到1个单,位;假设小猪先到,小猪吃到4个单位食物,大,猪也吃到4个单位食物。,练习:,智猪博弈boxed pigs game,小猪,去按 等待,去按 3,1 2,4,大猪,等待 7,-1 0,0,大猪的收益外部化,小猪不劳而获,免费搭了,大猪的便车。,请列举“搭便车的现象,冲开水、搞卫生;股市上庄家与散户,20世纪70年代末80年代初,美国市场上私人标签private label的软饮料价格廉价、质量较差,因此占有较低的市场份额。可口可乐公司和百事可乐公司最初能容忍这些私人标签饮料的存在,因为它们是小猪,威胁有限。可是没过多久,一家主要的私人标签饮料供给商Cott公,司通过挑衅性的定价和较高的质量,从拥有较,低市场份额的地区品牌,成长为一个拥有三分,之一市场份额的、旗鼓相当的竞争者。此时,,可口可乐公司和百事可乐公司通过降低价格这,种进攻性的行动,使私人标签软饮料的市场份,额立即瓦解了。,小鸡博弈the game of chicken,设想汤姆和吉米是两个顽皮的小孩,他们在小,伙伴的煽动下要进行一场关于勇气的比赛:两,人分别从一条独木桥的两端冲向对方,谁退却,谁就是“小鸡。显然,如果两个人都向前冲,,那么两败俱伤,设支付水平为-2;如果一个勇进,而另一个退却,那么勇进者受到小伙伴的欢呼,,退却者受到嘲讽,设支付分别为4和-1;假设两人,同时退却,那么一起受到小伙伴的嘲笑,设支付,为0,因为两人一起受到嘲笑比起一人单独受到,嘲笑要好受些。,箭头法,吉米,退却 勇进,退却,汤姆,勇进,0,0,-1,4,4,-1,-2,-2,有两个均衡。实际会怎样?,可能之一:两兵相遇,勇者胜,四Iterated Elimination of strictly,Dominated strategies and Nash Equilibrium,Proposition A In a n-player normal-form,game G=S,1, , S,n,; u,1, , u,n, if iterated,elimination of strictly dominated strategies,eliminated all but the strategies ( s,1,*, s,n,*,),than these strategies are the unique Nash,equilibrium of the game.,占有策略均衡DE是NE,Proposition B In a n-player normal-form,game G=S,1, , S,n,; u,1, , u,n, if the,strategies ( s,1,*, s,n,*,),are a,Nash,equilibrium ,then they survive iterated,elimination of str,ictly dominated,strategies,.,属于NE的策略会不会被剔除掉?,二、无限策略博弈的解,和反响函数法,In this section we use the model to illustrate:,(a)the translation of an informal statement of a problem into a normal-form representation of a game;(b)the computations involved in solving for the games Nash equilibrium.,65,按竞争程度划分的市场类型就卖方来说;对于,买方而言,市场是竞争的,且每一单个买者对市,场价格影响程度较小:,A 完全竞争市场,B 寡头竞争市场,C 独家垄断市场 卡特尔,市场类型不同,厂商之间行为特怔不同,,A与C类型中,厂商的决策都是个体优化决,策,而B类型中寡头垄断竞争的本质就构成博弈,,他们都是理性的决策者,他们的行为既影响,一Cournot Model of Duopoly,自身,又影响对方。尽管两寡头由于垄断能给他们带来一些共同的利益,但是他们的根本利益并不是完全一致的。如果两寡头之间可以签定有约束力的协议,彼此之间达成合作,形成完全垄断,此时的博弈是一种合作博弈。然而在大多数情况下,彼此之间很难达成有约束力的协议,这样就是非合作博弈。,最早研究两寡头垄断竞争,并作出巨大奉献,的当推法国经济学家Cournot?财富理论的数学原理研究?,1838,他对寡头市场的极端形式两寡头垄断市场作了分析,研究了在静态条件下,完全相同产品市场中两家厂商的,竞争行为、反响函数和均衡结果,得出结论:,1、players:厂商1和厂商2 向市场提供无差异的同质的产品;面临的决策是 q,i,=?,q,i,Q,p u,i,, 博弈,标准式表述 P34,p是市场出清价格,是市场供给量Q的减函数:,p=p(Q)=a-Q=a-(qi + qj),2、策略:产出水平q,i,,策略集S,i,=q,i,: q,i,0,3、支付函数:,u,i,(s,i,s,j,)= u,i,(q,i,q,j,),= q,i,p cq,i,假定两厂商均无固定,本钱,只有常数边际,本钱c。,=q,i,a-(q,i,+q,j,) cq,i,=- q,i,2,+(a-c- q,j,) q,i,无限策略博弈NE的求解,按NE定义的条件,如果策略组合 qi* ,qj*,是NE,那么对于qj*, qi*是以下优化问题的解:,Max u,i,(q,i,,q,j,*,),q,i,S,i,=Max -,q,i,2,+(a-c-q,j,*,)q,i,q,i,S,i,d,u,i,d q,i,-2,q,i,+ (a-c-q,j,*,),令:-2q,i,+ (a-c-q,j,*,) = 0,得:q,i,*,= (a-c-q,j,*,) /2,于是有方程组:q,1,*,= (a-c-q,2,*,) /2,q,2,*,= (a-c-q,1,*,) /2,q,1,*,= q,2,*,= (a-c) /3,此时, u1*=u2*=a-c)2 /9,考虑关系式:q,i,*,= (a-c-q,j,*,) /2,无论qj是否最优,由 qi= (a-c-qj) /2决定的qi总是厂商i针对厂商j产出水平的最优反响;我们称关系式qi= (a-c-qj) /2为厂商i针对厂商j的策略的反响函数,并记为:qi*= Ri(qj)= (a-c-qj) /2.由此,NE qi* , qj* 必须是方程组:,q1= (a-c-q2) /2,q2= (a-c-q1) /2,的解。-反响函数法,对于无限策略博弈,其NE的求解主要是通过反,应函数,而反响函数那么由各个参与人的支付函,数优化求得,即: Ri(s-i) 来自于,Max ui( s1, sn-1, si , sn+1 , sn),siSi,下面用图解来说明该模型的NE是:,a-c/3,a-c/3,q,1,q,2,a-c,(a-c),2,(a-c)/2,a-c,R,2,(q,1,)=(a-c- q,1,)/2,R,1,(q,2,) =(a-c- q,2,)/2,(a-c),3,(a-c)/3,NE,0,如果两个寡头能联合起来从共同利益角度进行决策,那他们将会怎样?,古诺模型中,q1* = q2*= (a-c) /3,u1*=u2*=,a
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 幼儿教育


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!