博弈论与竞争策略课件(PPT 47页)

上传人:仙*** 文档编号:155603785 上传时间:2022-09-23 格式:PPTX 页数:48 大小:496.46KB
返回 下载 相关 举报
博弈论与竞争策略课件(PPT 47页)_第1页
第1页 / 共48页
博弈论与竞争策略课件(PPT 47页)_第2页
第2页 / 共48页
博弈论与竞争策略课件(PPT 47页)_第3页
第3页 / 共48页
点击查看更多>>
资源描述
博弈论与竞争策略 博弈论与竞争策略课堂游戏(一)o“幸存者幸存者”策略:移旗策略:移旗 在两个部落之间的地面插着21支旗,两个部落轮流移走这些旗。每个部落在轮到自己时,可以选择移走1支、2支或3支旗。(这里,0支旗代表放弃移走旗的机会,是不允许的;也不允许一次移走4支或4支以上的旗。)拿走最后1支旗的一组获胜,无论这支旗是最后1支,还是2支或3支旗中的一支。如果你先拿,你该如何做呢?博弈论与竞争策略课堂游戏(二)o 纸币拍卖纸币拍卖 我这有1块钱,下面请大家竞拍。出价最高的竞拍者可以自己所出价格获得这1块钱,但出价次高的竞拍者也要交出自己所报的数目,且什么都不会获得。你会为这1块钱出价多少呢?如果是100块呢?1万块呢?博弈论与竞争策略 “要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”保罗萨缪尔森博弈论与竞争策略 “博弈论”的英语原文是Game Theory,直译过来就是游戏论、运动论或竞赛论。什么叫博弈?博弈的英文为game,即“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。博弈论与竞争策略博弈论导论博弈与我们的生活o 周末了,带女朋友看球赛还是跟女朋友去听音乐会?o 母女博弈o 囚徒困境与价格战博弈论与竞争策略o 囚徒困境l案情描述案情描述 两犯罪嫌疑人囚徒两犯罪嫌疑人囚徒A A与囚徒与囚徒B B因犯非法持有枪械罪和被怀疑可能犯有一因犯非法持有枪械罪和被怀疑可能犯有一级谋杀罪被逮捕,检察官将他们分别关在两间牢房里进行审讯。检察官对级谋杀罪被逮捕,检察官将他们分别关在两间牢房里进行审讯。检察官对囚徒囚徒A A说,说,“我们的政策是我们的政策是坦白从宽,抗拒从严坦白从宽,抗拒从严;如果你坦白而他不;如果你坦白而他不坦白,那么你将被无罪释放,他将会因一级谋杀罪被判死刑;如果他坦白坦白,那么你将被无罪释放,他将会因一级谋杀罪被判死刑;如果他坦白而你不坦白,他将被无罪释放,而你将会因一级谋杀罪被判死刑;如果你而你不坦白,他将被无罪释放,而你将会因一级谋杀罪被判死刑;如果你们都坦白,你们都将会被轻判。们都坦白,你们都将会被轻判。”当然检察官对当然检察官对B B说的话也是完全一样。说的话也是完全一样。但实际上,如果两个人都坦白,却会因涉及更多的罪案而都被判无期。而但实际上,如果两个人都坦白,却会因涉及更多的罪案而都被判无期。而两人都不坦白,只能按非法持有枪械罪被分别判一年。两人都不坦白,只能按非法持有枪械罪被分别判一年。若你是囚徒若你是囚徒A A或或B B,你,你将如何选择呢?将如何选择呢?l个体理性与集体理性的冲突囚徒囚徒B囚徒囚徒A 坦白坦白拒不交待拒不交待 坦白坦白 拒不交待拒不交待无期,无期无期,无期死刑,释放死刑,释放释放,死刑释放,死刑一年,一年一年,一年囚徒1:坦白囚徒2:坦白博弈论与竞争策略博弈论导论现代博弈论简单发展史o 起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的博弈论与经济行为o 田忌赛马博弈论与竞争策略博弈论导论博弈论的五大要素(以情侣博弈为例)o 行动、策略、策略空间o 支付、得益 o 次序 o 博弈均衡 o 决策主体:参与人、博弈方 博弈论与竞争策略博弈论导论博弈的分类o 合作博弈、非合作博弈合作博弈、非合作博弈o 单人博弈、两人博弈、多人博弈单人博弈、两人博弈、多人博弈 o 有限博弈、无限博弈有限博弈、无限博弈o 零和博弈、常和博弈、变和博弈零和博弈、常和博弈、变和博弈o 静态博弈、动态博弈、重复博弈静态博弈、动态博弈、重复博弈(有限次(有限次-无限次)无限次)o 完全信息博弈、不完全信息博弈完全信息博弈、不完全信息博弈o 完美信息博弈、不完美信息博弈完美信息博弈、不完美信息博弈博弈论与竞争策略博弈论导论博弈的表示方法o 如果博弈参与人和策略有限,则可有如下两种形如果博弈参与人和策略有限,则可有如下两种形式表示一个博弈:式表示一个博弈:-1,11,-11,-1-1,1正 面反 面猜硬币方猜硬币方盖盖硬硬币币方方正 面反 面乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈博弈论与竞争策略博弈论导论o 每一个博弈都是一个你中有我,我中有你的情形,不同每一个博弈都是一个你中有我,我中有你的情形,不同的博弈参与者可以选择不同的行动,但由于相互作用,的博弈参与者可以选择不同的行动,但由于相互作用,一个博弈参与者的得益不仅取决于自己采取的行动,也一个博弈参与者的得益不仅取决于自己采取的行动,也取决于其他博弈参与者所采取的行动。博弈论的精髓在取决于其他博弈参与者所采取的行动。博弈论的精髓在于基于系统思维基础上的理性换位思考,即在选择你的于基于系统思维基础上的理性换位思考,即在选择你的行动时还是考虑你的得益,但是你应当用他人的得益去行动时还是考虑你的得益,但是你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。推测他人的行动,从而选择最有利于自己的行动。博弈论与竞争策略静态博弈求解:均衡分析-纳什均衡o相对优势策略(relatively dominant-strategy):n 一种策略-在对手选定某个策略条件下博弈参与人的优势策略。n 求解方法:相对优势策略标记法。o假设参与者1认为参与者2选择“A”,则他应选?参与者 2参与者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5博弈论与竞争策略o 参与者1应该选择“a”n 参与者1对“A”的最优反应是“a”.参与者 2参与者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5o 假设参与者2认为参与者1选择“a”,则参与者2应该选择“C”n 参与者2对“a”的最优反应是“C”.博弈论与竞争策略o 假设参与者1认为参与者2选择“B”,则参与者1应该选择“a”n 参与者1对“B”的最优反应是“a”.参与者 2参与者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5o 假设参与者2认为参与者1选择“b”,则参与者2应该选择“C”n 参与者2对“b”的最优反应是“C”.博弈论与竞争策略o 假设参与者1认为参与者2选择“C”,则参与者1应该选择“a”n 参与者1对“C”的最优反应是“a”.参与者 2参与者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5o 假设参与者2认为参与者1选择“c”,则参与者2应该选择“A”n 参与者2对“c”的最优反应是“A”.博弈论与竞争策略结果n“a”是参与者1对“C”的最优反应.n“C”是参与者2对“a”的最优反应.此结果被称为纳什均衡纳什均衡:在给定其他参与者策略情况下,没有一个参与者能通过单方面改变自己的策略而使自己的得益提高,从而没有人有积极性打破这种均衡。参与者 2参与者 1策略策略A AB BCCa a3 3,2 22 2,3 35 5,4 4b b2 2,1 11 1,2 23 3,3 3c c1 1,6 61 1,4 44 4,5 5博弈论与竞争策略关键点:o 纳什均衡 我所做的是:给定你所做的,我所做的是最好的;你所做的是:给定我所做的,你所做的是最好的博弈论与竞争策略静态,一次博弈的应用o 公司的广告(或价格)博弈策略不做广告做广告不做广告10,105,13做广告13,57,7默克肯德基纳什均衡纳什均衡博弈论与竞争策略o 彩电价格大战策略低价高价低价0,03,-1高价-1,31,1伯特兰德寡头垄断(同质产品,价格竞争)海信长虹纳什均衡纳什均衡博弈论与竞争策略o 智猪博弈 猪圈中有一头大猪一头小猪,猪圈一端有个按钮,每按一下猪圈另一端食槽中会有10个单位猪食进槽,但按一下会耗去相当于2单位猪食的成本。如果大猪先到食槽,大猪吃到9单位食物,小猪只能吃到1单位;如小猪先到,小猪吃4单位而大猪吃6单位;如果同时按并同时到食槽,则大猪吃7单位而小猪吃3单位食物。按等待按5,14,4等待9,-10,0小猪大猪纳什均衡纳什均衡博弈论与竞争策略o 性别之战-情侣博弈-协调博弈策略足球音乐会足球2,10,0音乐会0,01,2女男纳什均衡纳什均衡 一对恋人准备在周末晚上一起出去玩,男的喜欢看球赛,但女的比较喜欢听音乐会。当然,两个人都不愿意分开活动,不同的选择给他们带来的满足由下表:纳什均衡纳什均衡博弈论与竞争策略o 协调博弈策略220伏110伏220伏$100,$1000,0110伏0,0$100,$100企业B企业A此协调博弈有两个纳什均衡l 产业标准(软盘、CD的大小等)国家标准(电压、交通法等)博弈论与竞争策略l 回到囚徒困境回到囚徒困境l 是否有方法脱离这种困境,从而使博弈方(寡头垄断企业)协调和合作成功呢?l 若囚徒困境博弈重复进行下去?若囚徒困境博弈重复进行下去?在重复博弈中,囚徒的困境可以有合作的结果。在重复博弈中,囚徒的困境可以有合作的结果。囚徒囚徒B囚徒囚徒A 坦白坦白拒不交待拒不交待 坦白坦白 拒不交待拒不交待无期,无期无期,无期死刑,释放死刑,释放释放,死刑释放,死刑一年,一年一年,一年囚徒1:坦白囚徒2:坦白重复博弈重复博弈博弈论与竞争策略生活中的重复博弈生活中的重复博弈o 如果你去菜场买菜,当你对菜的质量、重量等有疑虑时,卖菜的阿姨常会讲:“你放心,我一直在这儿卖呢!”o 在车站和旅游点等人群流动性大的地方,不但商品和服务质量差,而且假货横行,因为商家和顾客间“没有下一次”。o 在公共汽车上,两个陌生人会为一个座位争吵,可如果他们相互认识,就会相互谦让。在社会联系紧密的人际关系中,人们普遍比较注意礼节和道德,因为他们需要长期交往,并且对未来的交往存在预期。博弈论与竞争策略重复博弈广告博弈o 两个企业(Kelloggs&General Mills)的经理想最大化利润o 策略是广告活动o 静态、一次博弈o 无限重复博弈o 有限重复博弈博弈论与竞争策略静态、一次广告博弈通用面粉通用面粉凯洛格凯洛格策略策略无广告无广告中等强度中等强度高强度高强度无广告无广告1212,12121 1,2020-1-1,1515中等强度中等强度2020,1 16 6,6 60 0,9 9高强度高强度1515,-1-19 9,0 02 2,2 2博弈论与竞争策略一次广告博弈的均衡纳什均衡纳什均衡通用面粉通用面粉凯洛格凯洛格策略策略无广告无广告中等强度中等强度高强度高强度无广告无广告1212,12121 1,2020-1-1,1515中等强度中等强度2020,1 16 6,6 60 0,9 9高强度高强度1515,-1-19 9,0 02 2,2 2n劣策略:不管其他参与人采取什么策略,都能导致最低收益的策略劣策略:不管其他参与人采取什么策略,都能导致最低收益的策略n理性参与人永远不会选择劣策略理性参与人永远不会选择劣策略n许多博弈中参与者都没有占优策略,但仍可能通过劣策略的重复剔许多博弈中参与者都没有占优策略,但仍可能通过劣策略的重复剔除进行分析,这种方法称劣策略重复剔除法除进行分析,这种方法称劣策略重复剔除法博弈论与竞争策略如果企业每年都进行这种一次博弈,并且永远进行下去,这时参与人可以对对手的“欺骗”行为进行惩罚或报复。在这种情况下,共谋起作用吗?o触发策略触发策略n“如果对手在过去没有做过广告,我就不做;一旦对手作广告,自此以后,我就用高强度的广告活动来惩罚他”o 事实上,只要对手在过去没有过“欺骗”行为,各个企业都会同意“合作”。因为欺骗行为会引发以后所有时期的惩罚。无限重复博弈博弈论与竞争策略假设General Mills采用了这种触发策略,Kelloggs的利润是多少呢?合作 =12+12/(1+i)+12/(1+i)2+12/(1+i)3+=12+12/i相当于每年年底得到¥12的永久年金欺骗 =20+2/(1+i)+2/(1+i)2+2/(1+i)3+=20+2/i通用面粉通用面粉凯洛格凯洛格策略策略无广告无广告中等强度中等强度高强度高强度无广告无广告1212,12121 1,2020-1-1,1515中等强度中等强度2020,1 16 6,6 60 0,9 9高强度高强度1515,-1-19 9,0 02 2,2 2博弈论与竞争策略Kellogg从欺骗行为中获得的好处:o 欺骗-合作=20+2/i-(12+12/i)=8-10/in 假设i=.05o 欺骗-合作=8-10/.05=8-200=-192o 欺骗没有好处.n 在无限次重复博弈中共谋是纳什均衡!通用面粉通用面粉凯洛格凯洛格策略策略无广告无广告中等强度中等强度高强度高强度无广告无广告1212,12121 1,2020-1-1,1515中等强度中等强度2020,1 16 6,6 60 0,9 9高强度高强度1515,-1-19 9,0 02 2,2 2博弈论与竞争策略关键点o 当博弈无限重复没有确定的“终结之日”时,共谋作为纳什均衡就能够维持下去o 这需要:n 有能力监督对手的行动n 有惩罚叛徒的能力和名声n 低利率n 在未来进行博弈的机会多 市场条件:厂商数目很少稳定的需求稳定的成本博弈论与竞争策略如果博弈有限重复进行,共谋起作用吗?有限重复博弈假设广告博弈被重复两次通用面粉通用面粉凯洛格凯洛格策略策略无广告无广告中等强度中等强度高强度高强度无广告无广告1212,12121 1,2020-1-1,1515中等强度中等强度2020,1 16 6,6 60 0,9 9高强度高强度1515,-1-19 9,0 02 2,2 2纳什均衡博弈论与竞争策略用逆向归纳法,结论是:不。o 在第二阶段,博弈是一次博弈,因此在这最后阶段,均衡是高强度的广告活动.o 由于每个人都知道第二阶段的结果,因此,第一阶段就变成了最后阶段.o 两个企业在两个时期的均衡策略都是高强度的广告活动.o 如果博弈重复已知的有限次数,同样的结果依然成立动态博弈求解:倒推法o 倒退法的逻辑基础:先行动的居中人在前面阶段选择行动时,必然会考虑后面行动局中人的会如何行动,因此,只有在博弈最后一个阶段的博弈方才不会受到后续阶段的牵制,才能做出明确的选择;但后面阶段博弈方的选择确定后,前一阶段博弈方的行动也就容易确定了。动态博弈纳什:倒推法男男女女球赛球赛球赛音乐音乐音乐(2,1)(0,0)(-1,-1)(1,2)先动优势-后动优势o 动态博弈中,博弈方行动有先有后,若博弈方先行动得益大于其后行动得益的情况,称为先动优势;后行动得益比先行动得益大的情况叫做后动优势o 先动优势:“先下手为强”,动态情侣博弈等o 后动优势:“谦让是福”、猜拳博弈、切蛋糕等o 先动优势并非先行动者得益大于后行动者得益,后动优势也并非后行动者得益大于先行动者得益。策略性行动o 回到之前的进入博弈:尽管在A犹豫是否要进入的阶段,B威胁说只要A进入,它就选择商战,但最终A选择进入时,B却会选择容忍,因此,其之前的威胁是不可信的。o 博弈研究局中人互动行为,博弈的结果取决于博弈各方的行动,因此,在博弈过程中,一些局中人为达到某种目的,往往采取策略性行动,即某些能影响对手行动的行为(诱使对手采取有利于自己的行动或阻止对手采取不利于自己的行动)。o 策略性行动要求:可观察性;不可逆性,否则无效。策略性行动o 策略性行动:承诺(commitment)、威胁(threat)和允诺(promise)承诺是一种无条件的策略性行动,如在B行动的阶段,A却对B说“在下阶段我将采取行动X”,这意味着未来阶段无论B如何行动,A都将采取行动X,A的行动是无条件的 威胁和允诺是条件依存的策略性行动,若A对B说,“除非你的行动符合我的条件,否则我将采取行动报复你”,这是威胁;若说,“如果你的行动符合我的条件,我将采取对你有利的行动”,则是允诺。o 策略性行动要求:可观察性;不可逆性,否则无效。策略性行动的例子o 承诺:(静态)情侣博弈中,男方可以先买好球赛的门票,然后再打电话给女方;当然,女方也可以采取策略性行动,比如女方故意不接男方电话(使男方的策略性行动不具可观察性),到最后约会时才出现。威胁:父母管教挑食的孩子,“若不吃青菜,就不许吃糖”允诺:为让孩子努力学习,“若考第一名,则奖励台电脑”o 每个威胁都会与一个隐含的允诺相关联,反之亦然。若好好复习,就能通过考试-(隐含,即言外之意)若不好好复习,则可能通不过o 威胁与允诺的区别在于,若威胁成功,则无需实施威胁的内容,因此是无成本的,而允诺是有成本的。策略性行动的可信性问题o 策略性行动是否可信,取决于此行动对博弈支付/得益的改变程度。o 为了使策略性行动可信,可以采取一些辅助行动,如:书面合作;声誉,等等o 如进入博弈中,为了使自己的威胁可信,可以建造、维护和运行一个额外的生产能力。博弈论与竞争策略动态博弈与倒推法举例:海盗分赃o 有五个海盗,劫掠了100两金子,需要分赃,盗亦有道,他们分赃的办法是抓阄。o 抓到阄的人,可以先提出一个分配方案,如果他的方案被一半以上的人同意,就照他的方案分金子,否则,他就要被杀掉。余下的人也照此办理。o 请问:如果你是第一个抓到阄的人,你会提出怎样的分配方案?(请仔细思考,否则有生命危险)博弈论与竞争策略海盗分赃o 我希望你们的答案是:“100两金子全归我”。o 当然,分析此问题有一个可以接受的假定:每个人都是理性的追求自己利益极大化的人。o 可能你会提出平均分配,每人20两,或者自己干脆不要,等等。但你利他行为就一定会有好报吗?o 不尽然,不管第一个人提出什么分配方案,即使是说:“100两金子全归我”,这个方案也一定会被一半以上的人同意,所以,你可以保证既得到全部金子,也不会被杀掉。o 为什么呢?博弈论与竞争策略海盗分赃o 动态博弈的均衡分析需要从最后的环节开始考虑。o 那就从抓到最后一个阄的人开始。对于这个人来说,他知道,当轮到他提方案的时候,其他人都已经死掉了,金子将全是他一个人的。所以,他利益最大化行为便是,不管前边谁(包括第一个人)提的任何方案,他都一概摇头,不同意。o 再看第四个人,他知道,不管自己提出什么方案,第五个人都不会同意,都会被杀掉,所以,他的利益最大化行为是,尽量不要轮到自己提方案。所以,不管前面的人(包括第一个人)提了怎样的方案,他都会表示同意。博弈论与竞争策略海盗分赃o 第三个人,知道第四和第五个人的选择策略,所以,他的利益最大化的方案是100两金子全归自己,即策略跟第五个人相同。这个方案,因为自己和第四个人同意,超过了此时的一半以上的人的同意,可以行得通,所以,不管前面的人(包括第一个人)提出什么样的方案,第三个人都会反对。o 第二个人,知道自己提什么方案,第三个人、第五个人都将反对,一旦轮到自己提,自己就死定了,所以,他的策略跟第四个人的策略相同,即同意前面人(包括第一个人)提出的任何方案,这是他的利益最大化行为。博弈论与竞争策略海盗分赃o 所以,不管第一个人提出怎样的方案,第二个人与第四个人都会同意,加上第一个人自己的票,就是三票,一半以上,可以通过。o 既然任何方案都可以通过,而第一个人又要追求自己利益的极大化,所以,他的方案是:100两金子全归自己。拓展:六个海盗分赃会如何?七个呢?更大的偶数或奇数呢?不学好博弈,当不好海盗!博弈论与竞争策略 站在别人的立场上想一想,就是为自己未来的遭遇着想 米兰昆德拉谢 谢 大 家!结语:博弈的真谛演讲完毕,谢谢观看!
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!