最新博弈论课件(绪论和纳什均衡部分)

上传人:仙*** 文档编号:241464969 上传时间:2024-06-27 格式:PPT 页数:39 大小:1.44MB
返回 下载 相关 举报
最新博弈论课件(绪论和纳什均衡部分)_第1页
第1页 / 共39页
最新博弈论课件(绪论和纳什均衡部分)_第2页
第2页 / 共39页
最新博弈论课件(绪论和纳什均衡部分)_第3页
第3页 / 共39页
点击查看更多>>
资源描述
博 弈 论博弈论研究什么?博弈论研究什么?绪论 学学习选择 学会放弃学会放弃博弈论博弈论博弈博弈一词最早一词最早见于见于论语孟子论语孟子阳货第十七阳货第十七篇篇,子曰:,子曰:“饱食终日,无所用心,难矣饱食终日,无所用心,难矣哉!不有博弈者乎?为之,犹贤乎已。哉!不有博弈者乎?为之,犹贤乎已。”朱熹朱熹论语集注论语集注:“博,局戏也。弈,博,局戏也。弈,围棋也。围棋也。”新华字典、现代汉语新华字典、现代汉语词典、辞源等对博弈的词典、辞源等对博弈的解释,除了指六博和围解释,除了指六博和围棋外,也泛指赌博。棋外,也泛指赌博。甘肃出土:六博木俑甘肃出土:六博木俑*绪论 学学习选择 学会放弃学会放弃博弈论博弈论博弈论博弈论译译自自英文英文Game Theory。Game在在英文中的含义有英文中的含义有“游戏、运动及竞技比赛、游戏、运动及竞技比赛、运动会运动会”等,等,比如比如Olympic Games;还有还有“计谋、花招计谋、花招”的意思。的意思。在这类游戏活动中,一旦身体条件、技术水在这类游戏活动中,一旦身体条件、技术水平等因素既定以后,策略选择的好坏就是左右平等因素既定以后,策略选择的好坏就是左右游戏结果的关键因素。特别引起人们兴趣的是游戏结果的关键因素。特别引起人们兴趣的是参赛者之间在策略选择上具有参赛者之间在策略选择上具有相互依存性相互依存性,游,游戏的结果不仅取决于自身的策略选择,还取决戏的结果不仅取决于自身的策略选择,还取决于其他参赛者的策略选择。每位参赛者在做出于其他参赛者的策略选择。每位参赛者在做出自己的选择时必须充分考虑其他参赛者的选择。自己的选择时必须充分考虑其他参赛者的选择。Game Theory正是正是研究这类具有相研究这类具有相互依存性的策略选择问题的理论。互依存性的策略选择问题的理论。*绪论 学学习选择 学会放弃学会放弃博弈论博弈论为何要为何要研究具有相互依存性的策略选择问题?研究具有相互依存性的策略选择问题?首先,策略选择问题在我们每个人的首先,策略选择问题在我们每个人的日常生活、学习和工作会常常遇到。日常生活、学习和工作会常常遇到。其次,这类策略选择问题都有一个共其次,这类策略选择问题都有一个共性,就是相互性,就是相互依存性。依存性。在你做出选择的在你做出选择的同时别人也在进行选择,他们的选择与同时别人也在进行选择,他们的选择与你的选择相互影响、相互作用。你的选择相互影响、相互作用。具有相互依存性的策略选择问题不仅存在具有相互依存性的策略选择问题不仅存在于下棋、打牌及体育比赛等活动中,还广泛于下棋、打牌及体育比赛等活动中,还广泛地存在于人们的各种社会活动和日常生活中地存在于人们的各种社会活动和日常生活中。只要只要存在人的互动情况,就存在博弈问题。存在人的互动情况,就存在博弈问题。*绪论 学学习选择 学会放弃学会放弃博弈论博弈论博弈论的应用范围:博弈论的应用范围:博弈博弈论论政治政治经济法律法律军事军事外交外交经济经济19941994年年诺贝尔经济学学奖 德国柏林大学莱因哈德德国柏林大学莱因哈德赛尔腾因在非因在非合作博弈的均衡分析理合作博弈的均衡分析理论方面做出了开方面做出了开创性性贡献、献、对博弈博弈论和和经济学学产生了重生了重大影响大影响获奖。美国普林斯美国普林斯顿大学数学系教授大学数学系教授约翰翰纳什,因提出在非合作博弈理什,因提出在非合作博弈理论中起着核中起着核心作用的心作用的纳什均衡概念什均衡概念获奖。20052005年年诺贝尔经济学学奖 以美双重国籍以美双重国籍经济学家学家罗伯特伯特奥奥曼和美国曼和美国经济学家托学家托马斯斯谢林因在林因在博弈博弈论分析方面的研究分析方面的研究获奖。20072007年年诺贝尔经济学学奖 三位美国三位美国经济学家里奥尼德学家里奥尼德赫赫维茨、埃里克茨、埃里克马斯金、斯金、罗杰杰迈尔森以森以创立和立和发展机制展机制设计理理论方面方面的的贡献献获得得诺贝尔经济学学奖。*绪论 学学习选择 学会放弃学会放弃博弈论博弈论博弈论博弈论可以作为社会科学的一种一可以作为社会科学的一种一般分析方法,同时也是分析和说明我般分析方法,同时也是分析和说明我们日常生活中遇到的问题的学问。们日常生活中遇到的问题的学问。人人类社会中的博弈现象,与自然类社会中的博弈现象,与自然界中的很多自然现象相类似。界中的很多自然现象相类似。美国史密斯学院美国史密斯学院经济学助理教授詹经济学助理教授詹姆斯姆斯米勒在其著作中写到:米勒在其著作中写到:“不理解不理解博弈论的人,在与掌握博弈论的人相博弈论的人,在与掌握博弈论的人相处时,很容易就在战术上失去优势。处时,很容易就在战术上失去优势。”当代当代经济学全才保罗经济学全才保罗萨缪尔森也说过:萨缪尔森也说过:“要想在现代社会做一个有文化的人,你要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。必须对博弈论有一个大致的了解。”博弈论博弈论不仅影响着社会科学的不仅影响着社会科学的研究和发展,更重要的是它正改研究和发展,更重要的是它正改变着人们的思维习惯。变着人们的思维习惯。*绪论 学学习选择 学会放弃学会放弃博弈论博弈论博弈论的学习目的:博弈论的学习目的:初步初步认识博弈论的基本思想和认识博弈论的基本思想和典型问题,建立策略思维的意识,典型问题,建立策略思维的意识,了解策略思维的方法。了解策略思维的方法。更更重要的是不但要知道博弈论说了些重要的是不但要知道博弈论说了些什么,而且要学习运用博弈论的思想和什么,而且要学习运用博弈论的思想和方法分析现实生活中遇到的各种问题,方法分析现实生活中遇到的各种问题,把它当成分析和描述自己身边事情的有把它当成分析和描述自己身边事情的有效方法,提高观察问题、分析问题、解效方法,提高观察问题、分析问题、解决问题的能力。决问题的能力。无论无论你学到了多少博弈论的概念和方法,你学到了多少博弈论的概念和方法,当你真正面临一个具体问题时,都不能生当你真正面临一个具体问题时,都不能生搬硬套。解决问题的关键是开动自己的大搬硬套。解决问题的关键是开动自己的大脑,冷静地将各种理论、方法和具体情况脑,冷静地将各种理论、方法和具体情况综合起来思考,找出尽可能好的解决办法。综合起来思考,找出尽可能好的解决办法。*绪论 学学习选择 学会放弃学会放弃博弈论博弈论 博弈论研究博弈论研究什么什么从从我们身边说起我们身边说起研究具有相互依存研究具有相互依存性的策略选择问题性的策略选择问题 为何学习博弈论为何学习博弈论遵从社会活动规律遵从社会活动规律建立策略思维的意识建立策略思维的意识了解策略了解策略思维思维的方法的方法如何学习如何学习博弈论博弈论问题导向归纳提炼联系实际问题导向归纳提炼联系实际通过典型问题通过典型问题理解基本方法理解基本方法*囚徒困境囚徒困境博弈论博弈论囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认6961抵抵赖赖1393囚徒囚徒甲和囚徒乙甲和囚徒乙是参与博弈的两方,是参与博弈的两方,称为称为局中人局中人。甲甲和乙都各有两个选择,和乙都各有两个选择,称为称为行动行动或者或者策略策略。如果甲。如果甲选择选择了了抵赖抵赖、乙选择乙选择了了供认供认,称为一个称为一个对局对局或者或者策略组合策略组合,记记为为(抵赖抵赖,供认供认)。一一个对局下局中人的个对局下局中人的所得,即博弈的结果,所得,即博弈的结果,称为收益或者支付,放称为收益或者支付,放在一起称为收益矩阵。在一起称为收益矩阵。左下方为甲的收益,右左下方为甲的收益,右上方为乙的收益。上方为乙的收益。对局对局(抵赖抵赖,供认供认)的的结果记结果记为为(9,1 1)。*囚徒困境囚徒困境博弈论博弈论囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认6961抵抵赖赖1393 供认供认是是甲的上策甲的上策,供认,供认也也是乙的上策,(是乙的上策,(供认供认,供认供认)是一个上策均衡,)是一个上策均衡,双方的得益为双方的得益为(6,6)。博弈论中假设局中博弈论中假设局中人人都是理性人,都是理性人,就是就是局中人在博弈中总是局中人在博弈中总是以以自身利益最大化自身利益最大化为为决策的原则。决策的原则。相对来说相对来说,抵赖称为,抵赖称为甲甲的下策,抵赖也的下策,抵赖也是乙是乙的的下下策。下策不策。下策不应该使应该使用,删除后只剩下(用,删除后只剩下(供供认认,供认供认)一个策略组合,)一个策略组合,即为均衡策略组合。即为均衡策略组合。*囚徒困境囚徒困境博弈论博弈论囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认6961抵抵赖赖1393可以将供认看成可以将供认看成背叛背叛同伙的策略同伙的策略;抵赖是;抵赖是与与同伙合作的策略。同伙合作的策略。由于由于双方无法串供,也无法相信对方双方无法串供,也无法相信对方一定会与自己合作,所以只能从自身利一定会与自己合作,所以只能从自身利益最大化来选择,即选择背叛的策略。益最大化来选择,即选择背叛的策略。*价格价格竞争争博弈论博弈论 经济学中将市场分为四类:完全竞争、垄断竞经济学中将市场分为四类:完全竞争、垄断竞争、寡头垄断和完全垄断。争、寡头垄断和完全垄断。完全垄断指市场中只有一个卖家;完全竞争指完全垄断指市场中只有一个卖家;完全竞争指市场中有充分多个卖家和买家,任何人都不能单市场中有充分多个卖家和买家,任何人都不能单独影响市场价格,是理想的市场状态。在这两种独影响市场价格,是理想的市场状态。在这两种市场中人们都不必担心策略的相互作用。因为完市场中人们都不必担心策略的相互作用。因为完全垄断情况下只有一个卖方,没有竞争者;而在全垄断情况下只有一个卖方,没有竞争者;而在完全竞争情况下,一家公司不可能跟踪极其多的完全竞争情况下,一家公司不可能跟踪极其多的竞争者的所有行动。竞争者的所有行动。在现实中最多见的市场情况是寡头垄断和垄断在现实中最多见的市场情况是寡头垄断和垄断竞争竞争。其中寡头垄断往往出现在生产其中寡头垄断往往出现在生产高度集中的行业。如钢铁、石油、高度集中的行业。如钢铁、石油、汽车、飞机、家电等。寡头厂商汽车、飞机、家电等。寡头厂商为保持自身地位会采取种种排他为保持自身地位会采取种种排他措施,产生博弈问题。措施,产生博弈问题。当市场上只有几家公司时当市场上只有几家公司时,局中,局中人必须考虑自己的行动对竞争人必须考虑自己的行动对竞争对手对手可能产生的影响。可能产生的影响。同时也同时也要要分析竞分析竞争者争者可能做的事情。否则,危险便可能做的事情。否则,危险便会接踵而至。而博弈论正是擅长分会接踵而至。而博弈论正是擅长分析这一类问题的方法。析这一类问题的方法。*价格价格竞争争博弈论博弈论苏宁苏宁高价高价低价低价国国美美高高价价1200亿亿1500亿亿1200亿亿500亿亿低低价价500亿亿900亿亿1500亿亿900亿亿(低价,低价)也是(低价,低价)也是上策均衡,所以价格竞上策均衡,所以价格竞争是囚徒困境式的争是囚徒困境式的博弈。博弈。如果如果双方通过某种协议双方通过某种协议进行合作,共同采用高价进行合作,共同采用高价格,则称为合作博弈。否格,则称为合作博弈。否则称为非合作博弈。则称为非合作博弈。现代现代博弈论主要研究非合作博弈论主要研究非合作博弈。因为主导人们行为方式博弈。因为主导人们行为方式的主要还是个体理性而不是集的主要还是个体理性而不是集体理性,竞争是一切社会经济体理性,竞争是一切社会经济关系的根本基础,不合作是基关系的根本基础,不合作是基本的,合作是有条件和暂时的。本的,合作是有条件和暂时的。另外,合作博弈比非合作博弈另外,合作博弈比非合作博弈难度大,非合作博弈理论可以难度大,非合作博弈理论可以作为合作博弈理论的基础。作为合作博弈理论的基础。*囚徒困境的理解囚徒困境的理解博弈论博弈论显然,不论是从两个囚徒整体来看,还是从他显然,不论是从两个囚徒整体来看,还是从他们各自来看,两人都供认的结局都不如两人都抵们各自来看,两人都供认的结局都不如两人都抵赖的结局。由于这种结局具有必然性,虽然不理赖的结局。由于这种结局具有必然性,虽然不理想但又很难摆脱,所以称为囚徒困境。想但又很难摆脱,所以称为囚徒困境。囚徒困境模型同时揭示了两个矛盾:一个是个囚徒困境模型同时揭示了两个矛盾:一个是个体理性与团体理性之间的矛盾,从个体利益最大体理性与团体理性之间的矛盾,从个体利益最大化出发的行为往往不能实现团体的最大利益;另化出发的行为往往不能实现团体的最大利益;另一个是个体理性本身的内在矛盾,即使从个体利一个是个体理性本身的内在矛盾,即使从个体利益最大化出发的行为最终也不一定能真正实现个益最大化出发的行为最终也不一定能真正实现个体的最大利益,甚至会得到相当差的结果。体的最大利益,甚至会得到相当差的结果。*囚徒困境的理解囚徒困境的理解博弈论博弈论囚徒困境是很多社会现象的简单抽象,可以说囚徒困境是很多社会现象的简单抽象,可以说是理性的人类社会活动最形象的比喻。它准确地是理性的人类社会活动最形象的比喻。它准确地描述了人类社会中所存在的互相之间不信任和相描述了人类社会中所存在的互相之间不信任和相互防范的一面。在无法改变他人选择的情况下,互防范的一面。在无法改变他人选择的情况下,背叛常常是使自己避免风险的最好选择。背叛常常是使自己避免风险的最好选择。上述结论是在理性人假设之下得到的。理性人上述结论是在理性人假设之下得到的。理性人可以理解为广义上的利己之人。人是生而利己的,可以理解为广义上的利己之人。人是生而利己的,利他是后天习得的,其实也是一种利己的扩大化。利他是后天习得的,其实也是一种利己的扩大化。利己而不损人,利人而不损己。损人利己,长不利己而不损人,利人而不损己。损人利己,长不了,好不了;损己利人,多不了,也长不了。利了,好不了;损己利人,多不了,也长不了。利己心是推动社会发展的原动力。己心是推动社会发展的原动力。*军备竞赛博弈论博弈论前苏联前苏联扩军扩军裁军裁军美美国国扩扩军军2000亿亿 2000亿亿 8000亿亿裁裁军军8000亿亿0 0上策均衡:上策均衡:(扩军,扩军扩军,扩军)是囚徒困境式的博弈是囚徒困境式的博弈 扩军是两国的理性行为,扩军是两国的理性行为,但是结果却显得不理性。但是结果却显得不理性。*军备竞赛博弈论博弈论B国国扩军扩军小军备小军备零军备零军备A国国扩军扩军2000 1500 2000 1600 8000 小军小军备备1600 500 1500 500 9500 零军零军备备8000 9500 0 0删除下策,删除下策,可得到上策均衡:可得到上策均衡:(小军备,小军备小军备,小军备)上述博弈问题,都可以通过比较收益上述博弈问题,都可以通过比较收益的大小找出局中人的的大小找出局中人的上策上策,即局中人的,即局中人的最佳策略,从而推测出博弈的结果。这最佳策略,从而推测出博弈的结果。这种分析方法可称为种分析方法可称为上策分析法上策分析法。*公地悲公地悲剧博弈论博弈论公共公共资源利用、公共设施提供和公共环境保护资源利用、公共设施提供和公共环境保护等方面的问题也包含了众多的博弈问题。等方面的问题也包含了众多的博弈问题。这里所说的公共资源大家这里所说的公共资源大家都可以自由免费都可以自由免费利用,利用,但是随着人们的使用公共资源会逐渐减少。但是随着人们的使用公共资源会逐渐减少。这就是说,公共资源是那些具有这就是说,公共资源是那些具有非非排他性却不排他性却不具有非竞争性的物品。具有非竞争性的物品。政治经济学家政治经济学家们早就认识到,在人们完全从自们早就认识到,在人们完全从自利动机出发自由利用公共资源时,公共资源倾向利动机出发自由利用公共资源时,公共资源倾向于被过度利用、低效率使用和甚至浪费。于被过度利用、低效率使用和甚至浪费。牧民们在自由放牧的草地上牧民们在自由放牧的草地上放牧牛羊,放牧牛羊,并并自己自己决定决定放牧数量放牧数量。草原很大草原很大,但如果但如果牛羊牛羊过多过多,草地也会退化,草地也会退化、沙化。从沙化。从每一个每一个牧民牧民来看来看,多,多放牧牛羊是放牧牛羊是他们的上策他们的上策。如果每一。如果每一个牧民都这样做,草地上的牛羊必然会过量,个牧民都这样做,草地上的牛羊必然会过量,最终草地会变得寸草不生。最终草地会变得寸草不生。如果只有一两个人如果只有一两个人减少放牧量,情况也不减少放牧量,情况也不会改变多少。所以,不论是从长期考虑还是会改变多少。所以,不论是从长期考虑还是短期短期来看,牧民们都应该尽量增加来看,牧民们都应该尽量增加放牧放牧量,量,所以草原沙化是不可避免的所以草原沙化是不可避免的。只有牧民们都。只有牧民们都适量放牧才不会这样。但仅靠牧民自己无法适量放牧才不会这样。但仅靠牧民自己无法改变囚徒困境式的局面。改变囚徒困境式的局面。公地悲剧问题说明在公地悲剧问题说明在公共资源的利用、公公共资源的利用、公共设施的提供方面,政府的组织、协调和制共设施的提供方面,政府的组织、协调和制约是非常必要的,也是政府存在的主要理由约是非常必要的,也是政府存在的主要理由之一。之一。*注水注水简历博弈论博弈论写简历应该如实介绍还是夸大其词,也写简历应该如实介绍还是夸大其词,也是囚徒是囚徒困境式的博弈。困境式的博弈。不错不错优秀优秀出类出类拔萃拔萃旷世旷世奇才奇才*关税之关税之战博弈论博弈论两个国家,在进口关税上都有两种选择:两个国家,在进口关税上都有两种选择:提高关税,以保护本国同类商品。(背叛)提高关税,以保护本国同类商品。(背叛)降低关税,以利各自商品的流通。(合作)降低关税,以利各自商品的流通。(合作)当一国独自提高关税时,另一国也会做出同样当一国独自提高关税时,另一国也会做出同样反应,会引发关税战,两国商品均会失去对方的反应,会引发关税战,两国商品均会失去对方的市场,同时对本国经济也造成损害。市场,同时对本国经济也造成损害。除了关税战,还有多种多样的非关税战。如以除了关税战,还有多种多样的非关税战。如以保护环境、食品安全等名义,制定更高的环保标保护环境、食品安全等名义,制定更高的环保标准、技术标准和劳工标准,等。贸易保护的形式准、技术标准和劳工标准,等。贸易保护的形式和手段更加灵活多样,也更具隐蔽性。和手段更加灵活多样,也更具隐蔽性。*员工困境工困境博弈论博弈论一名苛刻的经理和手下数名员工。一名苛刻的经理和手下数名员工。如果所有员工都听从经理吩咐,则奖金等待遇如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都要超负荷工作;如果某人不一样,不过所有人都要超负荷工作;如果某人不听从吩咐,其他人听从吩咐,则此人下岗,其他听从吩咐,其他人听从吩咐,则此人下岗,其他人继续工作;如果所有人都不听从经理吩咐,则人继续工作;如果所有人都不听从经理吩咐,则经理下岗。经理下岗。由于员工之间信息不公开,都担心别人听话自由于员工之间信息不公开,都担心别人听话自己不听话而下岗,所以大家只能继续繁重的工作。己不听话而下岗,所以大家只能继续繁重的工作。*兴奋剂问题博弈论博弈论运动员运动员2使用兴奋剂使用兴奋剂不使用兴奋剂不使用兴奋剂运运动动员员1使用兴使用兴奋剂奋剂双方都有双方都有1/2机会机会获胜但健康受损获胜但健康受损落败落败获胜但健康受损获胜但健康受损 不使用不使用兴奋剂兴奋剂获胜但健康受损获胜但健康受损 双方都有双方都有1/2机会机会获胜获胜落败落败 大多数雇员都不会靠服用兴大多数雇员都不会靠服用兴奋剂来提升工作业绩,但他们奋剂来提升工作业绩,但他们却会牺牲家庭生活和休息来保却会牺牲家庭生活和休息来保住工作。住工作。*博弈模型构成小博弈模型构成小结博弈论博弈论囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认6961抵抵赖赖1393博弈模型的构成:局中人、策略、收益博弈模型的构成:局中人、策略、收益局中人局中人都都是理性人,是理性人,在博弈中总在博弈中总是以自身利是以自身利益最大化为益最大化为选择策略的选择策略的原则。原则。*一一个个博弈模博弈模型中型中至少有两至少有两个局中人。个局中人。每个每个局中人局中人都有多于一个都有多于一个的策略。的策略。每个每个局中人局中人的收益依赖于的收益依赖于所有局中人选所有局中人选定的策略,策定的策略,策略和收益具有略和收益具有相互依存性。相互依存性。将将所有对局所有对局下的收益排列下的收益排列成的矩阵称为成的矩阵称为收益矩阵。收益矩阵。囚徒困境博弈小囚徒困境博弈小结博弈论博弈论囚徒困境博弈的启示:囚徒困境博弈的启示:两个囚徒都是从自身利益最大化出发进行决两个囚徒都是从自身利益最大化出发进行决策,而最终得到的却是不理想、但又难以摆脱策,而最终得到的却是不理想、但又难以摆脱的结局。的结局。说明从个体利益最大化出发的行为往往不能说明从个体利益最大化出发的行为往往不能实现团体的最大利益,同时也不一定能真正实实现团体的最大利益,同时也不一定能真正实现个体的最大利益。现个体的最大利益。囚徒困境式博弈就是你处于这样一种两难中,囚徒困境式博弈就是你处于这样一种两难中,你觉得这样做不好,可是又不得不这样做。你你觉得这样做不好,可是又不得不这样做。你做了的结果又是两败俱伤。做了的结果又是两败俱伤。*上策均衡小上策均衡小结博弈论博弈论上策与上策均衡上策与上策均衡囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认6961抵抵赖赖1393如果如果一个策略下的一个策略下的所有收益都不小于其所有收益都不小于其它策略的收益,它策略的收益,则称称该策略策略为局中人的一局中人的一个个上策上策或或优势策略;策略;如果是如果是严格大于,格大于,则称称为严格上策或格上策或严格格优势策略。策略。如果如果一个博弈中所有一个博弈中所有局中人都有上策,则该局中人都有上策,则该博弈存在上策均衡。博弈存在上策均衡。相相对来来说,如果策略,如果策略A下下的收益均不大于策略的收益均不大于策略B下的下的收益,收益,则称策略称策略A是相是相对于于策略策略B的下策;的下策;如果是如果是严格格小于,小于,则称称为严格下策。格下策。下策不下策不应该使用,使用,删除后可以除后可以简化博弈化博弈问题。*上策均衡小上策均衡小结博弈论博弈论上策均衡反映了所有局中人的绝对偏好,因而上策均衡反映了所有局中人的绝对偏好,因而非常稳定。进行博弈分析时,可首先判断各局中非常稳定。进行博弈分析时,可首先判断各局中人是否都有上策,博弈中是否存在上策均衡。人是否都有上策,博弈中是否存在上策均衡。下策对于局中人来说是必然不选的,所以应该下策对于局中人来说是必然不选的,所以应该排除。通过不断删除下策,可以简化博弈问题。排除。通过不断删除下策,可以简化博弈问题。但是,在大部分博弈中,往往不存在局中人绝但是,在大部分博弈中,往往不存在局中人绝对偏好的上策,也不存在可以完全排除的下策。对偏好的上策,也不存在可以完全排除的下策。局中人的不同策略之间往往不存在局中人的不同策略之间往往不存在绝对的优劣关绝对的优劣关系系,只存在相对的、有条件的优劣关系。所以需,只存在相对的、有条件的优劣关系。所以需要引入其他的均衡概念。要引入其他的均衡概念。*情情侣博弈与博弈与纳什均衡什均衡博弈论博弈论例如:例如:女女拳拳击时装装男男拳拳击1020时装装1211(拳击拳击,拳击拳击)、(时装时装,时装时装)都是由都是由具有相对优势的策略构成的均衡,具有相对优势的策略构成的均衡,称为称为纳什均衡纳什均衡。*在在纳什均衡中,什均衡中,每个每个局中人的策局中人的策略都是略都是针对其他局中人其他局中人策略的策略的最佳最佳策略策略。纳什什均衡是非合作博弈理均衡是非合作博弈理论中最重要的一个均衡概念。中最重要的一个均衡概念。在纳什均衡策略组合下,任何一在纳什均衡策略组合下,任何一个局中人都不会单独改变自己的策个局中人都不会单独改变自己的策略,或者说都不愿意略,或者说都不愿意单独偏离单独偏离这个这个均衡。均衡。这意味着当出现的策略组合不是这意味着当出现的策略组合不是纳什均衡时,至少有一个局中人会纳什均衡时,至少有一个局中人会感到后悔。感到后悔。寻找找纳什均衡划什均衡划线法法博弈论博弈论例如:情侣博弈例如:情侣博弈女女拳击拳击时装时装男男拳拳击击1020时时装装1211囚徒乙囚徒乙供认供认抵赖抵赖囚囚徒徒甲甲供供认认6961抵抵赖赖1393例如:囚徒困境例如:囚徒困境 当当某某一一个个格格里里的的两两个个数数字字都都有有下下划划线线时时,说说明明其其对对应应的的策策略略分分别别是是两两个个人人都都愿愿意意选选的的,都都是是应应对对对对手手的的最最佳佳策策略略,所所以以构构成成纳什均衡。纳什均衡。情情侣侣博博弈弈有有两两个个纳纳什什均均衡衡,囚囚徒徒困困境境博博弈弈只只有有一个纳什均衡。一个纳什均衡。上上策策均均衡衡一一定定是是纳纳什什均均衡衡,但但纳纳什什均均衡衡不不一一定定是上策均衡。是上策均衡。*寻找找纳什均衡划什均衡划线法法博弈论博弈论例如:例如:*局中人乙局中人乙XY局局中中人人甲甲A0000B0101策略策略组合合(A,X)、(A,Y)、(B,X)结果都是果都是(0,0),但是,但是(A,Y)和和(B,X)都不是都不是纳什均衡,只有什均衡,只有(A,X)是是纳什均衡。什均衡。(B,Y)也是也是纳什均衡。什均衡。纳什均衡的特性什均衡的特性博弈论博弈论纳什均衡的力量来源于其纳什均衡的力量来源于其一致预测性一致预测性和和稳定性稳定性。若所有局中人都预测一个特定的博弈结果会出若所有局中人都预测一个特定的博弈结果会出现,而且都不会利用这种预测能力选择与预测结现,而且都不会利用这种预测能力选择与预测结果不一致的策略,即没有哪个局中人有偏离这个果不一致的策略,即没有哪个局中人有偏离这个预测结果的愿望,因此这个预测结果最终会成为预测结果的愿望,因此这个预测结果最终会成为博弈的结果,这种特性称为博弈的结果,这种特性称为一致预测性一致预测性。注意,这里所说的注意,这里所说的一致性一致性是指各局中人的实际是指各局中人的实际行为选择与他们的预测一致,而不是指各局中人行为选择与他们的预测一致,而不是指各局中人的预测或选择一致、无差异。的预测或选择一致、无差异。在具有一致预测性的均衡之下,局中人的决策在具有一致预测性的均衡之下,局中人的决策具有具有稳定性稳定性和和自我强制性自我强制性。*因此,在假设各局中人都有完全理性时,因此,在假设各局中人都有完全理性时,即不会犯错误的情况下,不可能预测任何即不会犯错误的情况下,不可能预测任何非纳什均衡是博弈的结果。虽然不能保证非纳什均衡是博弈的结果。虽然不能保证人们不犯错误,但是不能因为无法保证人人们不犯错误,但是不能因为无法保证人们不犯错误而舍弃纳什均衡概念。们不犯错误而舍弃纳什均衡概念。纳什均衡的特性什均衡的特性博弈论博弈论最后的归宿博弈说明,纳什均衡最后的归宿博弈说明,纳什均衡具有很好的具有很好的稳稳定性定性。乙乙abc甲甲A212230B322123C032222 纳什均衡也可以理解为是这样纳什均衡也可以理解为是这样一种策略组合,一种策略组合,这种组合这种组合由所有由所有局中人的最优策略局中人的最优策略组成。即给定组成。即给定其他人策略的情况下,没有任何其他人策略的情况下,没有任何一个局中人有积极性选择其他策一个局中人有积极性选择其他策略,从而没有任何人有积极性打略,从而没有任何人有积极性打破这种均衡,或者说纳什均衡是破这种均衡,或者说纳什均衡是一一种种僵局僵局,给定别人不动的情况给定别人不动的情况下,没有人有兴趣动下,没有人有兴趣动。如果谁想偏离纳什均如果谁想偏离纳什均衡另搞一套,利益角逐衡另搞一套,利益角逐的最终结果,还是会回的最终结果,还是会回到纳什均衡的位置。到纳什均衡的位置。*小王小王德德语法法语小小李李德德语4353法法语2524 情情侣博弈的博弈的应用用博弈论博弈论例如:例如:如如:同同一一行行业业内内的的两两家家公公司司选选择择行行业业标准的问题。标准的问题。如如:你你走走在在马马路路上上应应该该靠靠左左走走还还是是靠靠右走。右走。*情情侣博弈的博弈的应用用博弈论博弈论例如:鞋店与大脚女顾客例如:鞋店与大脚女顾客大脚女大脚女顾客客去普通鞋店去普通鞋店不去不去鞋鞋店店有大有大号鞋号鞋满意意0盈利盈利积压没有大没有大号鞋号鞋丢脸000鞋店鞋店可以通过广告打可以通过广告打破不好的均衡。在纳什破不好的均衡。在纳什均衡里,我们假定对手均衡里,我们假定对手的策略不变,但实际情的策略不变,但实际情况不完全如此。如果两况不完全如此。如果两个局中人都可以调正自个局中人都可以调正自己的策略,并改变对手己的策略,并改变对手的行动,就可以达到更的行动,就可以达到更好的均衡。好的均衡。*协调博弈博弈博弈论博弈论不难看出,类似情侣博弈这一类博弈中,合作不难看出,类似情侣博弈这一类博弈中,合作对局中人有利。而且,对局中人来说,隐瞒自己对局中人有利。而且,对局中人来说,隐瞒自己的行动或是对自己将如何打算说谎话都是不明智的行动或是对自己将如何打算说谎话都是不明智的。在这类博弈中,局中人需要彼此协调行动。的。在这类博弈中,局中人需要彼此协调行动。所以这一类博弈又称为所以这一类博弈又称为协调博弈协调博弈。在所有协调博弈中,局中人都希望你知道他会在所有协调博弈中,局中人都希望你知道他会做什么,以及履行自己所承诺的行为给自己带来做什么,以及履行自己所承诺的行为给自己带来的好处。的好处。在协调博弈中,成功的关键就在于公开、诚实在协调博弈中,成功的关键就在于公开、诚实和信任。和信任。*麦琪的礼物麦琪的礼物博弈论博弈论麦琪的礼物麦琪的礼物是美国著名文学家欧是美国著名文学家欧亨利的亨利的短篇小说。讲的是贫穷但恩爱的小两口,在圣诞短篇小说。讲的是贫穷但恩爱的小两口,在圣诞节前一天,妻子卖掉自己引以为傲的长发,为丈节前一天,妻子卖掉自己引以为傲的长发,为丈夫买了一条白金表链;而丈夫则卖掉祖传的珍贵夫买了一条白金表链;而丈夫则卖掉祖传的珍贵怀表,为妻子买下了她渴望已久的发梳。他们付怀表,为妻子买下了她渴望已久的发梳。他们付出自己最宝贵的东西,却送出了无用的礼物。出自己最宝贵的东西,却送出了无用的礼物。当然他们得到是不能用金钱衡量的比任何礼物当然他们得到是不能用金钱衡量的比任何礼物都宝贵的东西。但是如果他们事先能协调一下,都宝贵的东西。但是如果他们事先能协调一下,就会有更好地结局。就会有更好地结局。麦琪的礼物麦琪的礼物告诉告诉我们,我们,“惊喜惊喜”是奢是奢侈品,如果你还不富裕,你很可能享受不起。侈品,如果你还不富裕,你很可能享受不起。可供对比的是,在一些发达国家,人们在发可供对比的是,在一些发达国家,人们在发送邀请函的时候,往往会注明希望收到什么送邀请函的时候,往往会注明希望收到什么礼物,这样,就避免了送礼物的人为了带给礼物,这样,就避免了送礼物的人为了带给接受礼物的人接受礼物的人“惊喜惊喜”而导致礼物无用的情而导致礼物无用的情况。而这正是自利的行为带给双方效益最大况。而这正是自利的行为带给双方效益最大化的启示。化的启示。*大大规模模协调博弈博弈博弈论博弈论情侣博弈是两个人的博弈问题,而靠左走还是情侣博弈是两个人的博弈问题,而靠左走还是靠右走是很多人之间的博弈问题。网络效应就是靠右走是很多人之间的博弈问题。网络效应就是在很多人参与的博弈中出现的一种相互作用的结在很多人参与的博弈中出现的一种相互作用的结果。果。网络效应网络效应又称为又称为网络外部性网络外部性。以色列经济学家。以色列经济学家奥兹奥兹夏伊提出的定义是,夏伊提出的定义是,“当一种产品对用户当一种产品对用户的价值随着采用相同的产品、或可兼容产品的用的价值随着采用相同的产品、或可兼容产品的用户增加而增大时,就出现了网络外部性。户增加而增大时,就出现了网络外部性。”网络效应就是指产品价值随着购买这种产品及网络效应就是指产品价值随着购买这种产品及其兼容产品的消费者的数量增加而不断增加。其兼容产品的消费者的数量增加而不断增加。传媒业、通讯业等行业普遍存在网络效应。传媒业、通讯业等行业普遍存在网络效应。*网网络效效应博弈论博弈论信息信息产品存在着互联的内在需要,因为人们生产品存在着互联的内在需要,因为人们生产和使用它们的目的就是更好地收集和交流信息。产和使用它们的目的就是更好地收集和交流信息。这种需求的满足程度与这种需求的满足程度与网络的规模网络的规模密切相关。如密切相关。如果网络中只有少数用户,他们不仅要承担高昂的果网络中只有少数用户,他们不仅要承担高昂的运营成本,而且只能与数量有限的人交流信息和运营成本,而且只能与数量有限的人交流信息和使用经验使用经验。随着随着用户数量的增加,每名用户承担的成本将用户数量的增加,每名用户承担的成本将持续下降,同时信息和经验交流的范围得到扩大,持续下降,同时信息和经验交流的范围得到扩大,所有用户都可能从网络规模的扩大中获得更大的所有用户都可能从网络规模的扩大中获得更大的价值。此时,价值。此时,网络的价值网络的价值呈呈几何级数式的增长。几何级数式的增长。这种效应即被称为这种效应即被称为网络效应网络效应。*网网络效效应博弈论博弈论例如:例如:电话的电话的使用使用软件软件的的兼容性兼容性英语英语的的优越性优越性钞票的钞票的价值价值网络效应可以分为直接的网络效应网络效应可以分为直接的网络效应和间接的网络效应。比如传真设备之和间接的网络效应。比如传真设备之间就是直接的网络效应,而间就是直接的网络效应,而DVD播放播放器之间则是间接的网络效应。因为我器之间则是间接的网络效应。因为我买买DVD时不必考虑别人是否已经拥有。时不必考虑别人是否已经拥有。但拥有但拥有DVD的人越多,更多的的人越多,更多的DVD可可播放内容将被提供,我能播放的内容播放内容将被提供,我能播放的内容也会更多。因此,你购买也会更多。因此,你购买DVD会间接会间接提高我的播放器的价值。提高我的播放器的价值。在具有网络效应的产业中,在具有网络效应的产业中,“先下手为强先下手为强”和和“赢家通赢家通吃吃”是市场竞争的重要特征。是市场竞争的重要特征。*纳什均衡小什均衡小结博弈论博弈论纳什均衡是局中人的策略组合。在这个组合中,纳什均衡是局中人的策略组合。在这个组合中,给定所有其他人的选择,没有人对自己的策略感给定所有其他人的选择,没有人对自己的策略感到后悔,所以没有人想改变自己的策略。到后悔,所以没有人想改变自己的策略。在纳什均衡中,你不一定满意其他人的策略,在纳什均衡中,你不一定满意其他人的策略,但是,你的策略是应对对手策略的最佳策略。但是,你的策略是应对对手策略的最佳策略。寻找纳什均衡的划线法,依据的是策略之间的寻找纳什均衡的划线法,依据的是策略之间的相对优劣关系相对优劣关系。囚徒困境博弈只存在一个纳什均衡,情侣博弈囚徒困境博弈只存在一个纳什均衡,情侣博弈存在两个纳什均衡。存在两个纳什均衡。*
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!