管理经济学课件-第七章-博弈论与竞争策略

上传人:陈** 文档编号:252841933 上传时间:2024-11-20 格式:PPT 页数:26 大小:463.50KB
返回 下载 相关 举报
管理经济学课件-第七章-博弈论与竞争策略_第1页
第1页 / 共26页
管理经济学课件-第七章-博弈论与竞争策略_第2页
第2页 / 共26页
管理经济学课件-第七章-博弈论与竞争策略_第3页
第3页 / 共26页
点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第六章 博弈论与竞争策略,第一节 博弈论的基本概念,第,二节 完全信息静态博弈,第,三节 重复博弈和序列博弈,在现实经济社会,完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力,又面临很大的竞争压力。厂商之间具有相关性和依存性。因此,可以用博弈论的方法解释和说明厂商的竞争行为和策略。,博弈论,是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家:纳什(,Nash)、泽尔腾(Selten)和海萨尼(Harsanyi),他们都对博弈论在经济学中的应用作出了贡献。,70年代以来,博弈论已经发展成为现代经济学的基础重要基础之一,改变了传统经济学的结构,这,主要有,两个方面的原因:,1传统经济学着重研究市场机制和价格制度,分析完全竞争市场中的最优决策,不考虑决策者之间的相互影响。但是,现实经济运行中市场是,不完全竞争,的,行为主体之间的决策具有相互影响。,2完全竞争市场是以完全信息为条件的,这在现实经济运行中也难以保证。在,信息不对称,条件下,考虑行为主体相互影响的非价格制度可以用博弈论分析。,当然,应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外,关键是正确估计各参与者的策略空间和收益函数。,第一节 博弈论的基本概念,一,博弈论及其特点,1博弈和博弈论,博弈是指具有,不同利益和目标,的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。,博弈论(,Game Theory)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有,理性的,多个行为主体的决策和行动直接相互作用和影响时,事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。,2特点:,(1)参与者具有各自的目标:,(2)参与者都是理性行为者;,(3)参与者之间具有相关性;,(4)事态发展的结果取决于全部参与者的共同行为;,(5,),参与者要根据对其他参与者的判断决定自己的行动,因而是对策。,可见,博弈论是与优化论不同的决策理论。优化论是一种,单人决策理论,;博弈论所揭示的规律是一种,多人决策理论,。,二博弈论的基本概念,在博弈论中,,博弈的基本要素被概括为以下概念:,1),参与者,Players(,玩家):,即参加博弈过程的行为和决策主体,也是利益主体。在一个博弈中,最少要有两个参与者。,2),策略,Strategies,(战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的,策略空间,。,3),收益,Payoff(,支付、得益),和,收益函数,:收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。,4),结局,outcome(,结果):,指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。,5),均衡,Equilibrium(均势):指达到稳定的策略组合,或结局,。,6),博弈规则,:,指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。,例:,可口可乐与百事可乐(,参与者,)的价格决策,:,双方都可以保持价格不变或者提高价格(,策略,),博弈的目标和得失情况体现为利润的多少(,收益,),利润的大小取决于双方的策略组合(,收益函数,),博弈有四种策略组合,其,结局,是:,(1)如果双方都不涨价,各得利润10单位;,(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;,(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;,(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;,博弈的稳定状态有两个:都不涨价或者都涨价(,均衡,),均衡称为博弈的解,它是由,博弈规则,(即参与者采取什么策略会取得什么结局,市场的需求弹性、交叉价格弹性等)决定的,。,三博弈的表述方法,博弈一般用数学模型表达,分为标准和扩展模型两种。,1,.博弈的标准模型,包括三个要素:参与者、每个参与者可以选择的策略以及收益函数。,在两个参与者的有限博弈中,标准模型可以用,收益矩阵,表示。如上例的可乐价格博弈可以表示如下:,在收益矩阵中,包含了标准博弈模型的基本信息,表格中各组数字表示不同策略组合条件下的结局。在每个结局中,第一个数字代表参与者1 的收益,第二个数字代表参与者2的收益。,参与者2,百事可乐,参与者2,可口可乐,不涨价,涨价,不涨价 涨价,10,10 100,-30,-20,30 140,35,返回,2.博弈的扩展模型,包括五个要素:参与者、决策时点、策略空间、信息和收益函数。在简单的博弈中,扩展模型可以用,博弈树,表示。如上例的可乐价格博弈可表示如图下,:,不涨价,涨价,参与者1,可口可乐,10,10,100,-30,-20,30,140,35,不涨价,涨价,参与者2,百事可乐,不涨价,涨价,参与者2,百事可乐,博弈树一般用来分析动态博弈。在博弈过程中,从某一个决策点开始,参与者在已有行动的基础上开始选择,到博弈结束,称为“子博弈”。子博弈是相对的,从事态发展的历史来看,所有的博弈都是子博弈。,四博弈的分类,(1),合作博弈与非合作博弈,根据参与者之间能否通过谈判达成具有约束力的协议或合同来划分,。,可以达成协议的为,合作博弈,cooperative game,,,合作博弈强调集体理性和整体最优。,如买卖双方,讨价还价后成交。,不能,达成协议的为,非合作博弈,non-cooperative game,非,合作博弈强调个体理性和局部最优。,如寡头之间的竞争博弈,双方的利益和目标有冲突,难以达成可以实施的协议,双方都有欺骗和违约的冲动。,博弈论在经济学中的应用主要在非合作博弈领域。,(2),静态博弈与动态博弈,根据参与者选择策略的关系划分。,参与者同时或独立选择策略的博弈是,静态博弈,。,参与者按照一定的次序选择策略,后选择者了解先选择者的行动,这种博弈是,动态博弈,。,(3),完全信息博弈与不完全信息博弈,根据参与者对其他参与者的特征、策略空间、收益函数等信息的了解程度划分。,全部相互了解即为,完全信息博弈,,否则是,不完全信息博弈,。,第二节,完全信息,静态博弈,一囚徒的困境与纳什均衡,1,囚徒的困境,:假设有两个嫌疑犯作案后被抓获,并在不同的房间审讯。警察告诉他们,如果两人都坦白,各判刑8年;如果两人都抵赖,各判刑1年;如果其中一人坦白而另一人抵赖,坦白者释放,抵赖者判刑10年;这样,每个犯人就有两种策略,即坦白和抵赖。这个博弈的收益矩阵如下,囚徒1,坦白,抵赖,囚徒2,坦白 抵赖,-8,-8 0,-10,-10,0 -1,-1,在这个博弈中,(坦白,坦白)是博弈的解,即均衡结局。因为不管对方怎样行动,两个囚徒都会选择坦白。,囚徒的困境说明,个人理性(最优)与集体理性(最优)可能不一致。如寡头之间的广告投入、产量控制等。,2纳什均衡,在这个博弈中,出现了两个纳什均衡,参与者不能判断对方会采取什么策略,因而可能出现非均衡的结局(涨价,不涨价)和(不涨价,涨价);或者对双方不利的均衡(不涨价,不涨价)。因此,纳什均衡只说明均衡存在的可能,不能解释均衡的结果,。,纳什均衡,是指由所有参与者的最优策略组成的策略组合。在这种情况下,没有人可以从改变策略中得到好处,因而形成了一种均衡(僵局)。,一种制度或者协议要能够自动实行(即得到自觉遵守),必须满足纳什均衡的条件。,可以通过画圈的方法求解纳什均衡。即设定一个参与者的策略,然后把另一个参与者将会选择的策略可以带来的收益圈起来。如果收益矩阵中某个策略组合中的两个收益都被圈起来,则这个策略组合就是纳什均衡。,例如,,前述,可乐定价博弈收益矩阵可以确定有(涨价,涨价)和(不涨价,不涨价)两个纳什均衡。,二支配性策略,dominant strategy均衡,支配性策略均衡也称上策均衡或优势策略均衡。在博弈中,对有些参与者来说,不管对手采取什么策略,他的策略都保持不变。这种不取决于对手选择的最优策略称为支配性策略(上策或优势策略)。,当存在支配性策略时,可以首先确定支配性策略,然后确定对手的选择,从而得出博弈的均衡解。例如,两个寡头厂商的广告博弈收益矩阵如下:,参与者1,可口可乐,有广告,无广告,参与者2,百事可乐,有广告 无广告,10,5 15,0,6,8 20,6,在这个博弈中,百事可乐有一个支配性策略,即不管可口可乐是否有广告,他都会有广告。在此基础上,可口可乐必然也会有广告。博弈的结果就是(有广告,有广告)。这种均衡称为支配性策略均衡。它也是纳什均衡,但纳什均衡不一定是支配性策略。,三合作的诱惑,在类似囚徒的困境这样的博弈中,个体理性往往导致集体的非理性。在有多个纳什均衡的博弈中,参与者判断失误,或者某个参与者非理性行为,都会导致双方的严重损失。因此,存在着通过合作(共谋、勾结和串通)改善博弈结果的诱惑,这样可以是大家的收益都得到改善。,例如,在上述,广告博弈中,如果双方都不做广告,比都做广告收益高。但这种合作难以自动实现。,1对社会无害的合作,往往通过某些规则实现。,如香烟广告,交通规则,重复建设。,下图,列出了斗鸡博弈的收益矩阵。设两辆汽车同时到达一个十字路口,每个驾驶员都有,开,和,等,两种选择,博弈结果如下:,驾驶员1,开,等,驾驶员2,开 等,-8,-8 4,0,0,4 0,0,在这个博弈中,(开,等)和(等,开)是两个纳什均衡,但在完全信息静态博弈中,可能由于判断失误导致交通事故,或无谓地延误时间。因此通过交通规则引导博弈。,厂商1,脆,甜,厂商2,脆 甜,-5,-5 10,20,20,10 -8,-8,避免重复建设,例如,两个厂商进行产品开发博弈的收益矩阵。两个厂商同时开发一个市场(麦片),市场需要甜和脆两种产品,每个厂商只能生产其中一种产品。从收益矩阵可以看出,在理性行为条件下博弈的两个纳什均衡是(脆,甜)和(甜,脆)。但由于推出甜的厂商有较多利润,可能导致(甜,甜)的重复建设结果。因此,应该通过发布信息和政策引导。国外不允许厂商之间勾结分割市场,主要靠准确的市场信息。,2对社会有害的合作,设法制止,在囚徒的困境博弈中,如果两个囚徒可以互相协商,并形成攻守同盟,则罪犯得到好处,对社会不利。例如在寡头厂商的定价博弈中,勾结定高价对双方都有好处,但对社会不利,因此受到反垄断法的严密监控。,寡头厂商的价格博弈收益矩阵如下:,厂商1,高价,低价,厂商2,高价 低价,50,50 10,70,70,10 30,30,四最大最小策略,纳什均衡是建立在参与者理性行为基础上的,这就使参与者的决策时面临可能出现某些非理性行为的风险。为了降低风险,决策者可以采取,最大最小策略,以便降低风险,即在各种策略的最小收益中,选择具有最大收益的策略。其,代价是放弃最优策略。,下图,是一个产品开发博弈的收益矩阵。其中,按照理性行为会有两种纳什均衡,(无新产品,有新产品)以及(有新产品,无新产品)。但如果采取最大最小策略,两个企业都不推出新产品。,厂商1,无新品,有新品,厂商2,无新品 有新品,4,4 3,6,6,3 2,2,厂商2的最小收益 3 2,厂商1的最小收益,3 2,支配性策略,在有些情况下,为了避免陷入被动,采取最大最小策略十分必要。在下图的博弈中,乙方采取“右”是一个支配性策略。因为不管甲方选什么,乙方采取右的策略都比左的策略好,可以得到1的收益。在期望乙方采取右的情况下,甲方应该采取“下”,并得到2的收益。这样,支配性策略均衡为(下,右)。,如果甲方比较慎重,考虑到乙方可能不一定理性,或者可能故意捉
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!