第1讲囚徒困境及道德、文明、制度和

资源描述

教学目的对博弈论产生兴趣并初步了解博弈论教学大纲第 1 讲囚徒困境及道德、文明、制度和社会发展（完全信息静态博弈）第 2 讲许诺与威胁及胡萝卜和大棒（完全信息动态博弈）第 3 讲公共知识与不完全信息（不完全信息博弈）第 4 讲学习机制和有限理性第 5 讲你的权力有多大 -夏普里值（合作博弈）导论在经济学史上，曾经发生过三次重大的 “革命”，分别是“边际分析革命”、“凯恩斯革命与“博弈论革命”。博弈论与信息经济学的产生与发展引发了一场深刻的经济学革命，因为它代表着一种新概念、新方法和一种全新的思想。应用广泛：政治、经济、军事、外交、日常生活博弈论对社会福利的意义：制度设计博弈论对个人：做人做事都有启迪，避免鼠目寸光、注重长远利益和个人声誉以及合作精神。博弈论是很好的思维训练，它能提高思维能力和思维素养，因为博弈论研究策略的互动和利益依存，从而能够进行换位思考。萨缪尔森：你可以将一只鹦鹉训练成经济学，因为它所要学习的只有两个词：供给与需求。博弈论专家坎多瑞引申说：要成为现代经济学，这只鹦鹉必须再多学一个词，这个词就是“纳什均衡”。Stigilz 经济学：中国改革二个阶段，第一个阶段构建市场框架，第二个阶段是制度设计。我认为，博弈论对社会福利的意义正在于制度设计。1994 博弈论：对非合作博弈理论中的均衡问题进行了开创性分析约翰?豪尔绍尼美籍匈牙利裔 JohnC. Harsanyi ：不完全信息博弈分析原理、贝叶斯纳什均衡与混合策略、合作博弈问题。约翰？纳什美国John F. Nash：非合作博弈与纳什均衡、纳什讨价还价解、两人合作博弈、纳什程序。莱因哈德 ?泽尔滕德国Reinhard Selten ：子博弈完美纳什均衡、颤抖手均衡、博弈均衡的选择。1996 信息经济学：对不对称信息条件下的激励经济理论作出了基础性贡献詹姆斯?米尔利斯英国 James A. Mirrlees ：信息不对称问题、最优所得税结构与激励相容约束、“道德风险”与最优激励合同、信号筛选理论。威廉?维克里加拿大 William Vickrey：拍卖制度与资源配置、税制与最优所得税、边际成本与城市交通定价。2001 信息经济学：对不对称信息市场理论作出了贡献乔治?阿克洛夫美国 George A. Akerlof：、信息不对称与柠檬原理、效率工资、近似理性模型。迈克尔？斯彭斯美国A. Michael Spenee :斯彭斯劳动力市场模型的理论基础、斯彭斯的基本劳动力市场模型、斯彭斯的扩展劳动力市场模型。约瑟夫？斯蒂格利茨美国JosephE. Stiglitz :论风险问题、不对称信息经济理论、不对称信息市场分析、宏观经济学的微观基础。2005对博弈论的分析加深对冲突与合作的理解谢林冲突的策略奥曼公共知识长期重复博弈瑞典皇家科学院10月10日宣布，将2 0 0 5年诺贝尔经济学奖授予有以色列和美国双重国籍的罗伯特奥曼和美国人托马斯谢林，以表彰他们通过博弈理论分析增加了世人对合作与冲突的理解。在解析奥曼和谢林获奖原因时，经济学奖评委会主席表示：“为什么有些国家、团体和个人可以和平地解决冲突，而另一些国家、团体和个人却不断地被冲突困扰呢？感谢奥曼和谢林的研究，为这一自古以来困扰我们的问题带来启迪。”二、基础知识微积分、概率论、一定的逻辑推理能力三、博弈的基本假定理性的、智能的(绝顶聪明的)、博弈基本假定和博弈结构是公共知识四、博弈论与传统经济学传统经济学博弈论完全理性：新古典经济理论假定决策者是完全理性的，即决策者具有全部可供选择的机会和完整的知识，并且可以完全预料他们所作任何选择的结果。有限理性：在管理行为(1st 1947, 3rd 1976) 书中，西蒙对完全理性假设提出了质疑，他认为，决策者在作出决策时所拥有的信息往往是有限的、他们的计算能力和记忆能力等也存在某些局限，在这种情况下，最优方案的实现或者不可能、或者计算成本太高，使得决策者不得不满足于一个可以接受的、而不是最优的方案，为此提出了“满意化原则”。Zermelo (1913)表明在完全理性下象棋游戏没什么意思。参与人不同能力及不同洞察力的建模的研究极具挑战和吸引力。Selten (1975)引入“颤抖手均衡”概念。颤抖手均衡的基本意思是，在任何一个博弈中，每一参与人都有一定的可能性犯错误；一个战略组合，只有当它在允许所有参与人都可能错误时仍是每一参与人的最优战略的组合时，才是一个均衡。“看不见的手”是将追求个体利益的动机变为实现社会最大利益的手段。价格使个人理性和集体理性相一致；当不一致时，强调政府干预。个人追求自身最大利益的行为常常并不能导致实现社会的最大利益，也常常不能真正实现自身的最大利益。越来越注意到个人理性与集体理性的矛盾和冲突，解决冲突的办法不是否认个人理性，而是设计一种机制或制度安排，在满足个人理性的前提下达到集体理性，即IR和IC条件，这样的制度才是有效的。完全竞争：个人的力量是有限的，市场就像无形的手。寡头市场是例外。垄断和完全竞争是两个极端情况不完全竞争：人们之间的行为相互影响，产品不会是完全冋质的，市场经常体现为不完全竞争。寡头市场是博弈论研究的主要领域。寡头市场，多个竞争对手，策略互相影响完全信息不完全完全信息即不对称信息是普遍现象，如卖者对产品了解更多，但不了解买者的需求，而买者正好相反，典型的例子是旧车市场（逆向选择）和保险市场（道德风险）。不对称信息可导致市场萎缩甚至瘫痪。个人效用函数仅依赖于自己的选择，其他人的影响则由价格反映。人与人之间的关系通过价格间接发生。个人效用函数是所有人的策略的函数。人与人之间是直接的关系。宏、微观经济学是两门较为独立的科学。宏微观经济学出现融合现象，宏观经济理论是建立在微观基础上的，这些观点已逐渐得到接受。第1讲囚徒困境及道德、文明、制度和社会发展一、囚徒困境1.囚徒困境博弈基本要素：博弈方、策略、得益表示法：博弈矩阵、扩展型结果：均衡占优策略：均衡不是最优的2价格大战均衡不是最优的囚囚徒2坦白不坦白徒坦白1-5,50,-8不坦白-8, 0-1, -1可百事可乐低价高价口低价可3,36,1乐高价1,6,5,53#李冢家修3。1,1-1,3不修13,-100张修不修3.公共品的提供或利用两家悬殊不大：囚徒困境设有两户人家：张家和李家。需修一条路，修路成本为4。如果有路，对每家的福利为均衡不是最优的4.囚徒困境小结（公用地悲剧卜排队插队、森林坎伐、团队中的偷囚徒困境现象非常普遍，如哈定悲剧懒、学习竞赛等。其均衡非最优。从更深刻的意义上讲，囚徒困境模型动摇了传统社会学、经济学理论的基础，这是经济学的重大革命。传统经济学的鼻祖亚当斯密在其传世经典国民财富的性质和原因的研究中这样描述市场机制：当个人在追求他自己的私利时，市场的看不见的手会导致最佳经济后果。”这就是说，每个人的自利行为在看不见的手”的指引下，追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。简言之，在传统经济学中，个人理性与集体理性相一致。但是囚徒困境的结果，恰恰表明个人理性不能通过市场导致社会福利的最优。在一个集体里，有可能每个人的选择都是理性的，但对于整个集体来说其结果却不是理性的。二、走出囚徒困境道德、文明、制度在人类社会中存在群体行动的悲剧。这种悲剧是群体的而非个人的，不是个人命运遭受的不公平对待，而是群体在行动过程中所遭受的不可避免的集体性灾难。说群体悲剧是群体遭受的难以抗拒的灾难，一定程度上指群体受一个无情法则的支配。当人没有认识到集体行动的悲剧的时候，人可能无法克服这样的悲剧。而一旦人认识到集体面临的悲剧，人的道德感便可能使人超越人的经济理性而走向道德理性，集体面临的悲剧就可能被克服。1. 猴子的故事道德的产生生活中的博弈论余治国江雨燕博弈生存社会现象的博弈论解读潘天群亚当斯密在写完国富论与市场这只看不见的手”之后，转而又写了本道德情操论，专门论述个人道德与社会道德是维持市场经济的基本要素之一。亚当斯密告诉我们:最商业化的社会，也是最讲究道德的社会，比如 16 世纪时荷兰人就比英国人值得信赖，当时荷兰的商业比英国发达，反之亦然。人类道德的产生一般有两种解释:一是纯文化因素起作用，有些国家道德程度高，有些国家则低。如北欧人之间的道德感高于意大利人的道德感。二是宗教信仰的原因，怕上帝惩罚你，所以有宗教信仰的人道德感就要强于一般人。如在美国，教会的人道德感比较强，因为他们认为若不道德，将来会进地狱。在这种解释中，道德是外界强加于人们的，使人们不违约。而笔者主要想给出的是第二种解释，即博弈论是如何解释道德的。道德可以打破囚徒困境的难题，化解个人理性与社会群体理性的矛盾，维系整个社会经济体系的稳定与发展。关于这一点，我们来看一个猴群博弈的故事。近两年这个故事一直流传于中文网络各大论坛与社区。有一群猴子被关在笼子里。在笼子里的上方有一条绳子，绳子拴着一个香蕉，绳子连着一个机关，机关又与一个水源相连。猴子们发现了香蕉，有猴子跳上去够这个香蕉，当猴子够到时，与香蕉相连的绳子带动了机关，于是一盆水倒了下来，尽管够到香蕉的猴子吃到了香蕉，但其他猴子被淋湿了。这个过程一直重复着。猴子们发现，尽管有猴子吃到香蕉，但吃到香蕉的猴子是少数，而其余的大多数猴子都被淋湿。经过一段时间，有一伙猴子自觉地行动起来，当有猴子去抓香蕉时，它们便揍那个猴子。每当有猴子去取香蕉，就有其他的猴子因愤怒而自动地去撕咬那个猴子，久而久之，猴子们产生了合作，再也没有猴子敢去取香蕉了。在这个故事里，猴子间产生了“道德”。如果这群猴子构成一个社会，它们也繁衍下一代，它们会将它们的经历告诉下一代，渐渐地猴子们便认为取香蕉的后果对其他猴子不利，从而认为去取这个香蕉是 “不道德的”，它们也会自动地惩罚 “不道德的”猴子。当然这只是一个故事，但这个博弈故事却反映了人类的道德的产生过程。2. 文明新解和赏罚机制博弈生存社会现象的博弈论解读潘天群文明和文化是什么，一直是思想家思考的问题。 20世纪 80 年代弗洛伊德的精神分析理论开始在中国流行，他对人类文明的独特见解曾迷倒许多莘莘学子。他认为，文明是对人的本能的压抑，人的历史就是人的本能被压抑的历史。在他看来，人有“生的本能”和“死的本能”，前者称“性本能”或“爱的本能”，后者称“死亡本能”或“破坏本能”。本能的目的是满足，但是如果本能得到完全的满足，则没有了文明。人所追求的目标是各种需要的满足，而文明则是要人彻底抛弃这个目标的。因此在他看来，文明就是对本能的压抑与利用。而在社会学大师韦伯看来，文明是对人的贪欲的压抑，社会的各种组织理性化就是为了压制和利用人的贪欲。5由此可见，要解释文明就是要解释利己的个体是如何得到约束的。下面将从博弈论的角度提出一个新的文明观：文明其实就是对集体行动悲剧的克服。在囚徒困境中，每个囚徒选择的占优策略是坦白”如果对囚徒博弈在囚徒之间进行重复呢？试考虑这样一个非合作博弈：甲、乙两人博弈，两人各有两个策略。各策略下的支付矩阵如右图。该博弈重复两次。在第二阶段假设支付情况是这样的：当在第一阶段采取的是合作”策略时，将有额外的收益3；如果采取不合作”策略，则没有任何额外收益。即：在第二阶段额外的支付矩阵如右图。假设在第一阶段博弈双方知道这个两阶段博弈在各种策略下的结果，于是这个博弈可由上述两个矩阵相加得出：这两个阶段博弈其实是一阶段博弈。在这个博弈中（合作，合作）是纳什均衡，而这个结果就解开了囚徒困境。在这个例子中，奖惩矩阵是在参与者之间建立起来的。而一般来说，存在两种情况：一是参与者在博弈过程中自动建立起来的，这就是演进博弈研究的内容；第二种情况是乙不合作合作甲不合作1, 15, 01合作0, 54, 4乙不合作合作甲不合作0, 0 031合作3, 033乙不合作合作甲不合作1, 1531合作3, 57, 7#非博弈第三方强加于参与者之上的赏罚矩阵，从而调节博弈结果。文明就是这个赏罚机制的摆脱囚徒困境的这个方法对于社会有什么解释力呢？我们说, 建立，而道德与国家的目的就是建立这样的机制。3. 分粥游戏一一制度的形成生存博弈一现实社会中和策略竞争高志明有7人组成的小团体，每个人的地位平等，每个人自利。他们餐餐分食一锅粥，但没有量具。他们试验不同方法，发挥各自聪明才智，经过多次反复博弈，终于形成合理完善的分粥制度。第一种方法，指定一个人负责分粥事宜。大家很快发现，这个人为自己分的粥最多。于是又换一个人，结果总是主持分粥的人的碗里粥最多。“权力导致腐败，绝对权力导致绝对腐败”。每个人都为了得到分粥的特权不择手段，彼此尔虞我诈。第二种方法，大家轮流主持分粥，每人一天。这样每个人都有分粥的权利，也给予每个人为自己多分粥的机会。这样看起来似乎是平等了，但是每个人在一周中只有 1天吃得饱而且有剩余，其余6天却饥饿难捱。大家认为这种方法造成资源浪费，并且导致大家相互加倍报复，矛盾激化。第三种方法，大家选举一位信得过的人主持分粥。起初，这人尚能主持公道，可是不久他就开始为自己和溜须拍马的人多分一些粥。不能放任堕落和败坏风气，看来还得寻找新方法解决分粥问题。第四种方法，选举一个分粥委员会和一个监督委员会，形成监督和制约。公平基本做到了，但由于监督委员会常提出各种方案，分粥委员会又据理力争，等分粥完毕，粥早已凉了。可见，倘若制度效率不高，恐怕大家就要吃凉粥，有违制定制度的初衷。第五种方法，每个人轮流值日分粥，但是分粥的那个人要最后一个领粥。结果是，不论谁分粥，7只碗里的粥每次都一样多，就像用科学仪器量过一样。上面最后一种方法，正是利用了人的利己性达到利他性，从而实现公平分粥的目标。就这样经过反复博弈，聪明的人们终于找到了良好的制度，清晰且精妙，简洁且有效，从而构建了一个和谐社会。分粥游戏的一个简化版本是分蛋糕。一天，一位母亲买回一个蛋糕给两位孩子，她想，自己分得再均匀，吃到小块的孩子也会抱怨说分得不公平。于是，聪明的妈妈想出了一个办法，让他们自己分，但有一条规则：谁分谁后拿。结果可想而知，不再赘言。以上例子说明，通过“程序公正”保证“实体公正”。4. 重复博弈一一长期关系囚徒困境一旦从一次性博弈转变为重复博弈，情况会发生非常大的变化，博弈的结局也就是纳什均衡可能会完全不同。举个例子，大家都知道国外的黑手党组织严密，对待背叛者的惩罚非常残忍。一个黑手党成员告发别的黑手党成员，一定会被组织谋杀。我们假设囚徒困境故事发生在意大利，囚犯1和2都是黑手党成员。他们很可能宁愿被判处终生囚禁，也不愿意出狱之后被同伙干掉。值得注意的是，虽然黑手党成员之间并无签订合作协议，但他们之间相互约束力非常强。在重复囚徒困境中，并不是签订合作协议很困难，困难的是这个协议对博弈各方是否具有很强的约束力。如现实中的婚姻就是男女双方签订的一种协议，它具有一定约束力，因为一旦一方背叛婚姻，就会受到家庭的压力与社会舆论的谴责；但离婚率的攀升也说明婚姻的约束力有限。不管如何，在长期关系中，合约是联系人们的普遍方式，也是提高人们福利的重要手段。三、完全信息静态博弈F面根据均衡个数，举例说明完全信息静态博弈其它情形所反应的社会现象。1. 一个纳什均衡小猪大按等猪按5, 14, 4等19,-10,0公共品的提供:两家悬殊很大：搭便车（实际上，这不是囚徒困境，而是帕累托有效）智猪博弈：笼子里两只猪：大猪和小猪。笼子一头有按纽，另一头装食槽。按一下按纽就有10单位饲料输出到食槽。不论大猪还是小猪按按纽付出的劳动都相当于少吃2单位饲料，且当它按完按纽跑到食槽时，守候在食槽边坐享其成的另一头猪早已吃了不少。如果大猪先到，大猪吃到9单位，小猪7单位，小猪吃到3单位；如果小猪先到，则小大股东是大猪，小股东是小猪。只能吃到1单位；如果同时到达，大猪吃到猪可吃到4单位，大猪吃到 6单位。均衡为帕累托最优。智猪博弈典型例子是现代企业制度里的大股东和小股东, 大股东承担起监督职能，小股东搭便车坐享其成。2. 两个纳什均衡斗鸡博弈：敌退我进，敌进我退试想有两只公鸡遇到一起，每只公鸡有两个行动选择：一是退下来，一是进攻。如果一方退下来，而对方没有退下来，对方获得胜利，这只公鸡则很丢面子；如果对方也退下来，双方则打个平手；如果自己没退下鸡乙鸡前进后退甲前进-2, -21, -1后退-1, 1-1, -1来，而对方退下来，自己则胜利，对方则失败；如果两只公鸡都前进，那么则两败俱伤。因此，对每只公鸡来说，最好的结果是，对方退下来，而自己不退。支付矩阵如图。表中的数字的意思是：两者如果均选择前进”结果是两败俱伤，两者均获得-2的支付; 如果一方前进”，另外一方后退”，前进的公鸡获得1的支付，赢得了面子，而后退的公鸡获得-1的支付，输掉了面子，但没有两者均前进”受到的损失大；两者均后退”两者均输掉了面子，获得-1的支付。当然表中的数字只是相对的值。这个博弈有两个纳什均衡：一方前进，另一方后退。但关键是谁进谁退？一博弈，如果有惟一的纳什均衡点，那么这个博弈是可预测的，即这个纳什均衡点就是事先知道的惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点，则任何人无法预测出一个结果来。因此，我们无法预测斗鸡博弈的结果，即不能知道谁进谁退，谁输谁赢。一个凄美的故事麦吉的礼物“原地高天，堪叹古今情难尽；痴男怨女，可怜风月债难偿。”新婚不久的妻子和丈夫，很是穷困潦倒。除了妻子那一头美丽的金色长发，丈夫那一只祖传的金怀表，便再也没有什么东西可以让他们引以为傲了。虽然生活很累很苦，他们却彼此相爱至深。每个人关心对方都胜过丈妻子剪发保留夫卖怀表-2, -22, 2保留2, 20, 07关心自己。为了促进对方的利益，他们愿意奉献和牺牲自己的一切。话说明天就是圣诞节了，小两口都是身无余钱。为了让爱人过得好一点，每个人还是想悄悄准备一份礼物给对方。丈夫卖掉了心爱的怀表，买了一套漂亮发卡，去配妻子那一头金色长发。妻子剪掉心爱的长发，拿去卖钱，为丈夫的怀表买了表链和表袋。最后，至U了交换礼物的时刻，他们无可奈何地发现，自己如此珍视的东西，对方已作为礼物的代价而出卖了。花了惨痛代价换回的东西，竟成了无用之物。出于无私爱心的利他主义行为，结果却使得双方的利益同时受损。欧亨利在小说中写道：“聪明的人，送礼自然也很聪明。大约都是用自己有余的物事，来交换送礼的好处。然而，我讲的这个平平淡淡的故事里，两个住公寓的傻孩子，却是笨到极点，彼此为了对方，白白牺牲了他们屋檐下最珍贵的财富。”从这段文字看，欧亨利似乎并不认为这小两口是理性的。古巴导弹危机用斗鸡博弈来解释 20世纪60年代初发生在美苏两个超级大国之间的一场导弹危机，是最合适不过的了。二战结束后，形成了对峙的两个超级大国，美国和苏联。这两个超级大国是两个核心，在其周围有各自的盟友，它们一起组成了两大敌对的阵营。1962年赫鲁晓夫偷偷地将导弹U-2运送到加勒比海上的岛国古巴，卡斯特罗政权是苏联这个超级大国的盟友，是美国的敌人。苏联的目的是将导弹部署在美国的眼皮底下，以对付美国。然而苏联的行动被美国的飞机侦察到了，美国发现古巴建立了导弹发射场。此事震动美国，肯尼迪总统指责苏联，并发出严重警告，而苏联方面矢口否认。美国决定对古巴进行军事封锁，派遣了舰艇、空军及航空母舰，并集结了登陆部队。美国进入戒备状态，美苏之间的战争一触即发。面对美国的反应，苏联面临着是将导弹撤回国还是坚持部署在古巴的选择？而对于美国，则面临着是挑起战争还是容忍苏联的挑衅行为的选择？也就是说，这两只大公鸡”均在考虑采取进的策略还是退的策略？战争的结果当然是两败俱伤，而任何一方退下来(而对方不退)则是不光彩的事。结果是苏联将导弹从古巴撤了下来，做了丢面子的撤退的鸡”美国坚持了自己的策略，做了不退的鸡”当然，为了给苏联一点面子，同时也担心苏联坚持不退而发生美苏战争一一这是美国不愿意看到的，美国象征性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏两霸之间发生的最严重的一次危机。这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说，退下来的结果是丢了面子,但总比战争要好；对美国而言，既保全了面子，又没有发生战争。这就是这两只“大公鸡”博弈的结果。3. 无纯策略纳什均衡一一混合策略以下两例来自谢识予经济博弈论猜硬币对于无纯策略纳什均衡(但是一定存在混合策略)的博弈分析要点：盖方猜正方1, -1-1,1反1-1, 11, -1正反9a. 自己的策略选择不能预先被对方知道或猜到。b. 博弈方要避免自己的选择带有规律，必须具有随机性。c. 光具有随机性不够。选择每种行动的概率必须使得对方选择任何行动无差异。守卫和小偷一一激励的悖论博弈方：小偷和守卫策略：小偷偷或不偷仓库的东西；守卫睡或不睡(工作)得益:若小偷偷窃，守卫睡，则小偷偷得V赃物，守卫失职被解雇而产生 -D效用;若小偷未偷，小偷无得失，得益为0;守卫守卫未睡，则小偷被抓而坐牢 -P,守卫尽职0。守卫睡，有S正效用守卫未睡，0。没有纯策略纳什均衡。于是，设小偷的混合策略为 (Pt, 1-pt),守卫睡的期望得益：Pt?(- D)+(1- Pt )?S小偷偷不偷V , - D -P, 00, S 七*- 0小偷和守卫睡不睡守卫不睡的期望得益：0Pt?(-D) + (1- Pt)?S = 0Pt =守卫的得益决定了偷的概率。对守卫的激励如加重失职的处罚-D，在短期中使守卫少睡，小偷少偷，守卫又可多睡。这就产生了激励的悖论：对守卫的激励在长期中并不能使守卫少睡，但却使小偷偷的概率减少了。小偷的得益决定了守卫睡的概率。对小偷的惩罚如加重惩罚 -A在短期中使小偷少偷，守卫多睡，小偷又可多偷。这同样产生了激励的悖论：对小偷的惩罚加重在长期中并不能使小偷少偷，而是让守卫多睡了。四、博弈论相关基本概念博弈的类型根据参与者能否形成约束性的协议，以便集体行动，博弈可分为合作性博弈和非合作性博弈。纳什等博弈论专家研究得更多的是非合作性博弈。所谓合作性博弈是指参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟，其结果对联盟方均有利；而非合作性博弈是指参与者在行动选择时无法达成约束性的协议。人们分工与交换的经济活动就是合作性的博弈，而囚徒困境以及公共资源悲剧都是非合作性的博弈。博弈又分静态博弈和动态博弈。静态博弈指参与者同时采取行动，或者尽管参与者行动的采取有先后顺序，但后行动的人不知道先采取行动的人采取的是什么行动。动态博弈指参与者的行动有先后顺序，并且后采取行动的人可以知道先采取行动的人所采取的行动。从知识的拥有程度来看，博弈分为完全信息博弈和不完全信息博弈。信息是博弈论中重要的内容。完全信息博弈指参与者对所有参与者的策略空间及策略组合下的支付有完全的了解”否则是不完全信息博弈。严格地讲，完全信息博弈是指参与者的策略空间及策略组合下的支付，是博弈中所有参与者的公共知识”的博弈。对于不完全信息博弈，参与者所做的是努力使自己的期望支付或期望效用最大化。完全信息静态博弈的均衡概念是纳什均衡。纳什均衡可分为纯策略纳什均衡和混合策略纳什均衡。10

展开阅读全文

第1讲囚徒困境及道德、文明、制度和

最新文档