多样化实验教学之博弈游戏.ppt

上传人:tia****nde 文档编号:12732665 上传时间:2020-05-20 格式:PPT 页数:42 大小:365.81KB
返回 下载 相关 举报
多样化实验教学之博弈游戏.ppt_第1页
第1页 / 共42页
多样化实验教学之博弈游戏.ppt_第2页
第2页 / 共42页
多样化实验教学之博弈游戏.ppt_第3页
第3页 / 共42页
点击查看更多>>
资源描述
CHAP4博弈游戏,有趣的谜题,1序言,1.1人生处处皆博弈,博弈:一种策略的相互依存状况,你的选择将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。Gametheory的应用是信息经济学的主要组成之一人生是永不停息的博弈过程。人们每天从一早醒来就必须不断地作决定,我们日复一日决定早餐要吃什么,直到养成固定的饮食习惯;要不要到超市疯狂采购一番;要不要看场电影、散散步、买部车、把菜吃完、在转盘赌局里下红或是下黑,甚至读一本书不管有意无意,深思熟虑或一时冲动,你已经开始做某件事了这就是一个决定。还有更重大的:报考什么学校、选择什么专业、从事什么样的工作、怎样开展一项研究、如何打理生意、该和谁合作、做不做兼职、要不要辞掉工作、要不要竞争总裁的职位。甚至是要不要结婚、什么时候结婚、该和谁结婚、要不要孩子、怎样将孩子抚养成人等,这只不过是人生重大决策的几个例子。,1.2共同的因素,你并不是一个人在作决定,在一个毫无干扰的真空世界里作决定。相反,你的身边充斥着和你一样的决策者,他们的选择与你的选择相互作用。这种互动关系自然会对你的思维和行动产生重要的影响,而且别人的选择和决策直接影响着你的决策结果。鲁滨孙一个人沦落荒岛,做什么都是他自己说了算;可是等来了个“星期五”,他就要面对博弈问题了。,1.3有趣的比较说法,为了解释和理解博弈决策的相互影响,我们不妨设想一个石匠的决策和一个拳击手的决策会有什么区别。当石匠考虑怎样开凿石头的时候,他的“对象”原则上是被动的和中立的,不会对他表现策略对抗。然而,当一名拳击手打算攻击对方要害的时候,不仅他的每一步计划都会招致抵抗,而且他还面临对方主动的攻击。他必须设法克服这些抵抗和攻击。,1.4博弈论的概念,博弈论是由两位杰出的学者冯诺曼和摩根斯坦在上世纪中期创立的。用专业术语说,博弈论是:“研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡的问题”。为了自己,也为了与他人更好地合作,你需要学习一点博弈论的策略思维。正是因此,著名经济学家保罗萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”,1.5博弈和游戏,“博弈”这个词听起来高深莫测,其实它就是“游戏”的意思。更准确点说,是可以分出胜负的游戏。博弈论如果直译就是“游戏理论”。游戏各不相同,对游戏者的要求也不同。有些人长于思考性的游戏。不同的运动项目对决策智慧有不同程度的要求,例如在拳击或相扑这样按“重量级”来划分比赛等级的游戏中,聪明才智就不那么重要了。,玩游戏需要用到许多不同类型的技巧。其中一种是基本技巧,比如打篮球不能缺少的投篮能力、玩围棋游戏的时候还需要记住大量的“定式”(双方可以接受的变化,可称为围棋盘上的“均衡”)等。这些技巧一旦脱离了游戏,可能就没有多大用处了。但博弈论的策略思维则是另外一种技巧。策略思维从你的基本技巧出发,考虑的是怎样将这些基本技巧最大限度地发挥出来,这是具有普遍意义的原则,可以应用于生活的方方面面。有的游戏是两个对手,也有很多游戏是多人参加的。如果后果要由许多人共同承担,那么整个决策过程将会更加困难;因为你将面临不同成员与不同目标的排列组合。而在这类竞赛中,好的决策可以创造胜利。,1.6几个专业术语,博弈是一种策略的相互依存状况:你的选择,即策略,将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他们的选择称为行动。一个博弈当中的参与者的利益可能严格对立,一人所得永远等于另一人所失。这样的博弈称为零和博弈。不过,更常见的情况是,既有共同利益,也有利益冲突,从而可能出现导致共同受益或者共同受害的策略组合。在实践当中,博弈可能包含一些相继行动过程,也可能包含一些同步行动过程,因此须将技巧综合起来,灵活运用,思考和决定自己最佳行动应该是什么。,1.7公平来自博弈,博弈不一定是坏事,也未必不能取得好的结果。我们今天享受的丰富的物质生活,都是来源于自由市场的竞争同样也是博弈的结果。亚当斯密在1776年所发表的经典之作原富,其中关于自私行为与市场运作的两段,是经济学上被引用得最多的名言:“很多时候,一个人会需要兄弟朋友的帮助,但假如他真的要依靠他们的仁慈之心,他将会失望。倘若在需求中他能引起对方的利己之心,从而证明帮助他人是对自己有益的事,那么这个人的成功机会较大。任何人向他人提出任何形式的交易建议,都是这样想:给我所需要的,我就会给你所需要的这是每一个交易建议的含义;而我们从这种互利的办法中,所获的会比我们所需的更多。我们的晚餐不是得自屠夫、酿酒商人,或面包师傅的仁慈之心,而是因为他们对自己的利益特别关注。我们认为他们给我们供应,并非行善,而是为了他们的自利。”,1.8游戏需有规则,任何游戏都有自己的规则。生活这个博弈游戏自然也是,这就是法律、道德和各种成文或不成文的规章制度和惯例等。当然,这些规则也不是一成不变,它会随情况和人们的要求改变,但只要规则存在,你就必须服从它,否则就要大吃苦头。其实,那些企图通过非法手段获取利益的人具有某种“创新”精神他们试图在社会通行的规则之外另搞一套。社会的游戏规则固然是稳定的、安全的,可是来得太慢了。如果我能一下子弄到一大笔钱,为什么还要一分一分地挣?应该说,这种不劳而获的心理是普遍的,可是为什么它没有成为社会的普遍行为呢?银行大盗总有某些传奇色彩,可是研究人类行为的社会学家告诉我们:抢劫银行可能是最不划算的人类行为之一。其成功率之低、风险之大(包括漫长的法律追溯期)、潜在的不确定因素之多,简直令人怀疑还要做这事的人是否具备正常的理智。据一项统计:每1000起这类案件中,真正得手的只有110,而且抢到的钱也少得可怜:平均不到2000元。按照一位长期研究银行抢劫案的犯罪学专家的想法,银行大盗们不该被送进监狱,而是该被送进疯人院。,2“博弈游戏”理论背景的了解,2.1引言,个体对自身利益的追求会损害整体的利益。为进一步了解大量的具有这类性质的情况,需要有一个方法来表示这些情况的共同点,同时避免陷于每个情况的具体细节,即著名的“囚徒困境”游戏。启示:一只河蚌正张开壳晒太阳,不料,飞来了一只鹬鸟,张嘴去啄它的肉,河蚌急忙合起两张壳,紧紧地钳住鹬鸟的嘴巴。鹬鸟说:“今天不下雨,明天不下雨,就会有死蚌肉。”河蚌说:“今天不放你,明天不放你,就会有死鹬鸟。”谁也不肯松口。有一个渔夫看见了,便走过来把它们一起捉走了在对手的背后,往往还有更大的、共同的敌人。,2.2“囚徒困境”缘起,1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,他用两个囚犯的故事,将当时专家们正研究的一类博弈论问题,作了形象化的解释。从此以后类似的博弈问题便有了一个专门名称“囚徒困境”。借着这个故事和名称,“囚徒困境”广为人知,在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中,获得了极为广泛的应用。,2.3“囚徒困境”的故事,甲、乙两个人一起携枪准备作案,被警察发现抓了起来。警方怀疑,这两个人可能还犯有其他重罪,但没有证据。于是分别进行审讯,为了分化瓦解对方,警方告诉他们:如果主动坦白,可以减轻处罚;顽抗到底,一旦同伙招供,你就要受到严惩。如两人都坦白,那么所谓“主动交代”也就不那么值钱了,在这种情况下,两人还是要受到严惩,只不过比一人顽抗到底要轻一些。在这种情形下,两个囚犯都可以作出自己的选择:或者供出他的同伙,即与警察合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不是与警察合作。,这样就会出现以下几种情况(为了更清楚地说明问题,我们给每种情况设定具体刑期):如果两人都不坦白,警察会以非法携带枪支罪而将二人各判刑1年;如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;如果两人都招供,则两人都会因罪名各判10年。这两个囚犯该怎么办呢?是选择互相合作,还是互相背叛?,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果只判刑1年。但他们不得不仔细考虑对方可能采取什么选择。问题就这样开始了,甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。甲会推理:假如乙不招,我只要一招供,马上可以自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。无论乙招与不招,我的最佳选择都是招认。还是招了吧。自然,乙也同样精明,也会如此推理。最终选招了吧。,2.4趋利行为与实际后果,于是两人都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。照博弈论的说法,这是本问题的惟一平衡点:只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。而在别的点,比如两人都拒认的场合,都有一人可以通过单方面改变选择,来减少自己的刑期。也就是说,对方背叛,你也背叛将会更好些。这意味着,无论对方如何行动,如果你认为对方将合作,你背叛能得到更多;如果你认为对方将背叛,你背叛也能得到更多。你背叛总是好的。这是一个有些让人寒心的结论。,2.5集体最优与合作,为什么聪明的囚犯,却无法得到最好的结果?两个人都招供,对两个人而言并不是集体最优的选择。无论对哪个人来说,两个人都不招供,要比两个人都招供好得多。“囚徒困境”这个问题为我们探讨合作是怎样形成的,提供了极为形象的解说方式,产生不良结局的原因是因为:囚犯二人都基于自私的角度开始考虑,这最终导致合作没有产生。,2.6“困境”的形成,在这个游戏中,你将如何做呢?设想你认为对方将合作,你可以选合作,那么你将得到“对双方合作的奖励”。当然,你也可以选背叛,得到“对双方背叛的惩罚”。换言之,如果你认为对方合作,那么你背叛将能得到更多的好处。反过来,如果你认为对方将背叛,那么你也有两个选择,你选择合作,那么你就是“笨蛋”;你选择背叛,就会得到“对双方背叛的惩罚”。因此,对方背叛,你也背叛将会更好些。这就是说,无论对方如何行动,你背叛总是好的。到现在为止,你似乎知道该怎样做;但是,要知道相同的逻辑对另一个人也同样适用。因此,另一个人也将背叛而不管你如何做。这样,你们将是双方背叛,只能一起坐牢很久,这比你们双方合作所能得到的“奖励”(只需短期服刑)差很多。个体的理性导致双方得到的比可能得到的少,这就是“困境”。,2.7“囚徒困境”的启示,启示1:在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方所用策略之外的最好决策规则是不存在的。启示2:“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。在这些情形中,从个人的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果出现。,3一个游戏,游戏规则说明,假设每人都拥有一家企业,生产相同的产品,不考虑其他因素,现在大家有两种选择,必须决定自己应该:1,生产高质量商品来帮助维持较高价格;2,生产假货来通过别人所失换取自己所得。规则:,游戏规则说明:,参加的总人数是27人,即共27家企业;如全体企业都生产高质量产品,则,市场销售情况使他们各得1.08元;每个选择2的企业总比选择1的企业多得0.50元(现实意义,生产假货成本要比高质量商品低),具体体现为:每一个改选2的学生都会多得46美分,同时会使他的26个同学分别少得4美分,结果全班收入会少得58美分,选择2的人越多,则大家的总收益就会越少(假货太多,就会使市场混乱,产品信誉降低)。,你会怎么抉择?,游戏规则量化表示(数学转换)(1)人一开始都打算选择1,则,市场销售情况:1.08x27=29.16$(2)有一个人打算偷偷改变决定,选择2,则,市场销售情况:每一个改选2的学生都会多得46美分,同时会使他的26个同学分别少得4美分,结果全班收入会少得58美分。(3)假设有M人选择2,则,总收入29.16-0.58xM$,选择1的收入(29.16-0.58xM-0.5M)/27选择2的收入(29.16-0.58xM-0.5M)/27+0.5(4)由上述三点假设,可以得到:如全体企业都生产低质量产品,都生产假货,各得0.50元。,你会怎么抉择?,结果讨论一:,演练这个博弈的时候,不允许集体讨论的情况。,结果讨论二:,演练这个博弈的时候,允许一点讨论,以便达成“合谋”的情况。,启示1:,这些情景使我们回想起尤塞里安在约瑟夫海勒的小说第22条军规当中的境遇。故事的背景是:第二次世界大战胜利在望,可是为了给自己捞取功劳,一个飞行大队的指挥官没完没了地提高下属的任务定额,弄得所有人都人心惶惶。投弹手尤塞里安不想成为胜利前夕最后一批牺牲者,千方百计逃避执行任务。他的上级军官问:“可是,假如我方士兵都这么想呢(意思是“你不扛枪,我不扛枪,谁来保卫家”)?”可尤塞里安答道:“那我若是不这么想,岂不就成了一个大傻瓜?”,“囚徒困境”不仅可以解释政治、经济领域的竞争,在社会生活中也随处可见。我国的基础教育,就是“囚徒困境”。最近10多年来,应试教育的弊端已经为社会公认,目前要求“减负”的不仅是中小学生和学生家长,也是教育专家和教育管理部门,也可以说是全社会的呼声。教育管理部门这几年做了一系列的工作,但收效甚微。学校不断给学生增加负担是目前教育的实际状况。同样,大家普遍认为呆板僵化的应试教育扼杀了学生的创造性。无论是专家还是家长,都在呼吁改变应试教育的模式。但是无论你是否意识到教育有问题,你的小孩都必须接受这个教育。,启示2:学生与囚犯,如果没有改变整体性的教育体制,个别人、个别学校、个别地方单独改变都可能使其付出代价。每个家长都会这样想:尽管这种教育不好,但是其他小孩采取的是这种教育,衡量标准(如中考、高考)也是依据这种教育,我的小孩如不这样做,在竞争方面就会吃亏。因此,每个孩子和家长已不知不觉地进入一个囚徒困境。可以说,减负的状态是不稳定的,而“增负”的状态是稳定的均衡。原因就是,目前教育的博弈结构规定了各种行动或行为的收益或好处:获得高分的会进入好的初中、高中,进入好的初中、高中的学生可以考高分进入好的大学。而对于老师和学校来说,学生的升学率高意味着名利双收、饭碗牢靠;如果整个规则都倾向“增负”,“负”又如何减得下来?,从理论上说,摆脱“增负”的囚徒困境的惟一办法是改变教育的博弈结构,即改变博弈规则或游戏规则,让“全面发展”的学生获得更多的机会。可是要在实践中达到这个效果,却又困难重重,除了教育投入不足、师资水平不高等现实问题,最大的难点,是如何找到一个更科学、合理,同时又能保证公平的新的“游戏规则”。至少在现在,这还是个没有答案的问题。,启示3:管理的目的不是让每个人做到最好,而是避免内耗过多。,烟草商为何不反对禁止烟草广告?1971年,在“禁烟运动”的声势下,美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是,这一回财大气粗的烟草公司反应相当平静,并没有动用其庞大的社会资源和影响力阻止这个法律的通过。而且,后来的统计资料表明:尽管烟草广告因受到限制而减少,可是烟草公司的利润却提高了。你是否知道烟草公司为什么不反对、甚至可能还欢迎这项法律?因为这个禁令使他们从“囚徒困境”中解放了出来。,烟草行业同样竞争激烈,为了争夺市场,各大烟草公司都必须大做广告。为此,它们每年都要花费巨额广告费用,这无疑降低了它们的利润水平。也就是说,如果烟草公司都不做广告,它们的利润要更高。可是,如果其中一家公司不做广告,它的市场份额就会被其他公司抢走。这正是一个囚徒困境:你合作,对方不合作,你就吃亏了。在这种情况下,做广告就是优势策略。那么,烟草公司能否达成都不做广告的协议呢?不能,因为谁遵守协议,就很可能被对手耍弄。现在国家为它做了:法律起到了协议的作用,而政府承担了监督的成本,借用过去的一句话说,是“起到了阶级敌人想起而起不到的作用”,烟草公司又何乐不为呢?,你可能会说:广告不但有竞争的作用,也有开拓市场的作用,在这方面,烟草公司不是也有损失吗?当然如此。但是注意:这个法律是有限的,被禁止的只是电视广告,而不包括其他媒体;而且只禁止在美国做电视广告,而不包括其他国家。对于已经比较成熟的市场,像香烟这样的商品,广告的开拓作用是有限的。现在,美国烟草公司已经把开拓的目标放在了广大的国外市场。,“囚徒困境”确实揭示了自私对合作的破坏作用,但是正如“有一利必有一弊”这句话,“囚徒困境”给我们带来的也并不全是坏消息。在现实中,我们希望囚犯不能合作。如果两个危险的罪犯通过合作逃脱了法律制裁,一定会给社会造成更大的危害。同样,如果商家通过合谋控制物价,我们就不能享受合理的价格,这也会大大增加人们的消费成本,降低人们的生活水平。,启示4:一定是坏事吗?,从经济的角度来看,如果几个大企业联手或勾结起来形成对行业的垄断,谋求最大利润,那么它们结成的联盟称为“卡特尔”。卡特尔因为由自主的企业组成,所以很不稳定。以产量竞争来说,组成卡特尔,就要讨价还价,达成限制产量的协定,总产量因为协定的限制降低了,价格也就会上去,可能比结成卡特尔以前高出很多。这时候,谁要是偷偷地扩大产量,他可能占到很大的便宜。卡特尔联盟和组成联盟的成员之间的关系,不是上下级的关系,不是谁服从谁的关系。卡特尔的成员都是独立的经济主体,只不过为了利益关系走到一起来了。偷偷违反协议增加产量或提供优惠会捞到很大的便宜,这就促使一些成员违反协议。所以说,卡特尔本身就提供了瓦解卡特尔的激励。在人类经济活动中,除了石油输出国组织欧佩克一度比较成功以外,卡特尔成功的例子实在很少。欧佩克之所以比较成功,很大的原因在于它的最大的成员国沙特阿拉伯“自律”较严。,从政府管制的角度来看,卡特尔在许多情况下是非法行为。例如近年来的“家电”大战,电视、空调等价格一路下跌,残酷的价格战让家电企业吃不消,几年前,9家企业曾经一起协议制定最低价格,规定什么类型的家电至少要卖多少钱,不许把价格降到比协议规定的价格还低的水平,其目的无非是不要竞相降价,以免大家的利润都下降。这就是卡特尔行为。很快,国家计委就发出文件,指出该决议非法。这主要是不许企业联手抬高商品价格损害消费者的利益。发达国家对垄断现象和卡特尔现象的限制往往更加严厉。最典型的例子是20世纪80年代,经过多年的辩论和漫长的立法程序,美国把原来垄断电话通讯市场的ATT公司强行分割为几个公司。分割以后,由于公司之间的竞争,电话服务的价格很快就下降了一半,再加上竞争激励出来的技术进步,现在用电话卡从美国往中国打电话一分钟只要几美分。,从原则上说,政府鼓励企业之间的竞争,因为企业竞争会给广大消费者带来很大的好处。比如我国电话服务市场长期是垄断的,所以直到前几年,在我国许多地方,装一部电话不仅要花三四千元,而且还要排队等待不少时间才能装上。但是在许多发达国家,如果你要装电话,只需通知电话公司,马上就会给你装好,完全不用缴纳什么安装费。由于竞争,如果你把选择的电话服务从原来的公司撤出来转到另一家公司,新的公司还会给你奖励,比如说奖励你30分钟的国内长途电话费,再加一件T恤什么的。,现在,我国电话服务市场开放竞争,消费者固然马上得到实惠,服务水平也在明显上升。再如过去我国移动电话市场原来基本上是一家垄断,当时购置、使用一部移动电话的费用高达一两万元,是典型的“奢侈品”。后来打破了这一垄断,允许几家企业共同经营,移动电话的费用很快就降到千元左右,几乎成了人手一部的“必需品”。初看起来,鼓励竞争似乎对企业不利,使企业不容易赚钱。但只有这样,才能激励企业改善管理,开发技术,努力以较低的成本生产质量较好的产品。提高企业的市场竞争力。竞争力不是天生就有的,它本身就是竞争的结果。若不首先让我们的企业在国内市场好好竞争,他们在国际市场就不可能有强大的竞争力。,合作是可能的吗?人类的自私天性,使他们陷入“囚徒困境”难以自拔。社会生活和商业竞争中的许多逻辑都与这一困境密切相关。今天,世界各个国家在没有统一领导(联合国只是个协调机构)的情况下交往。因此,产生合作的必要条件就与国际政治的许多中心问题有关。最重要的就是安全困境:国家往往通过那些威胁到其他国家安全的手段来寻求自身的安全。这个问题体现在区域冲突和军备竞赛上。,结束语:关于“囚徒困境”,合作是可能的吗?合作中存在着一个根本问题,两个工业国家之间相互设置贸易壁垒便是一个很好的例子。由于自由贸易能给双方带来好处,因此,如果两个国家消除这些贸易壁垒都能受益。问题是,无论谁单方面采取行动消除自己一方的贸易壁垒,它都会发现自己处于不利于本国经济的贸易状态下。事实上,不论一个国家如何做,另一个国家保持它的贸易壁垒总是比较有利的。因此,每一个国家都有利益动机来保持贸易壁垒,尽管由此带来的结果比双方都合作差得多。,合作是可能的吗?这个根本问题就是:个体对自身利益的追求会损害整体的利益。结论1:在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方所用策略之外的最好决策规则是不存在的。结论2:“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。在这些情形中,从个人的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果出现。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!