资源描述
,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,单击此处编辑母版标题样式,第五章 博弈论,(,Game Theory,),约翰,纳什,(John Nash),,生于,1928,年,6,月,13,日。任普林斯顿大学数学系教授。,1950,,约翰,纳什获得美国普林斯顿高等研究院的博士学位,他那篇仅仅,27,页的博士论文有一个重要发现,这就是后来被称为,“,纳什均衡,”,的博弈理论。,1994,年获得诺贝尔奖经济学奖。,对博弈论的重要贡献:均衡理论和议价模型。,第五章 博弈论,(,Game Theory,),课堂游戏,每位同学从,1100,中任意写一个数(不能商量),设全班学生所写数字的平均数为,m,,最接近于,2/3m,的同学期末成绩将被加上,10,分。如果这样的同学有多个,将平分这,10,分的成绩。,从这个游戏中你可以得到什么启发?,第五章 博弈论,(,Game Theory,),博弈论的几个常见模型,囚徒困境,智猪博弈,顶牛博弈,囚徒困境,警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯下的罪行,如果罪犯中至少有一人供认犯罪就能确定罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串通或者结成攻守联盟,并分别跟他们将清楚了他们的处境和面对的选择:如果他们两人中有一人坦白认罪则坦白者立即得到,释放,而另一人将重判,8,年徒刑。如果两人都坦白认罪,则他们将各判,5,年徒刑。当然两人都拒不认罪,则警察手上缺乏证据,那么他们会以较轻的妨碍公事各判,1,年徒刑。,囚徒困境,Prisoners Dilemma,-1,,,-1,-8,,,0,0,,,-8,-5, - 5,坦白,坦白,不坦白,不坦白,甲,乙,得益矩阵,矩阵中数字分别表示左局中人(博弈方)与上局中人在策略组合(局势)下的得益,1,、囚徒困境的纳什均衡,(坦白,坦白),2,、推翻了亚当,斯密的“看不见的手”理论,3,、从个体理性出发的行为不能导致个人利益的最大化,亦不能导致集体利益的最大化。,囚徒困境的应用,1,、价格战,可口可乐与百事可乐,中国移动与中国联通,蒙牛与伊利等,2,、考试博弈,3,、爱情博弈,智猪博弈,按钮,进食槽,猪圈里有两头猪,一只大猪,一只小猪。猪圈里的一头有一个猪食槽,另一头安装一个按钮,控制猪食的供给。按一下按钮就会有,10,个单位的猪食进槽,但是谁按按钮就需要付出,2,个单位的成本。若大猪先到,大猪吃到,9,个单位的猪食,小猪只能吃到,1,个单位的猪食。若同时到,大猪吃到,7,个单位,小猪吃,3,个单位;若小猪先到,大猪吃,6,个单位,小猪吃,4,个单位。,智猪博弈的应用,智猪博弈的纳什均衡为(大猪选择按按钮,小猪选择等待),在企业中,大企业就好比大猪,中小企业就好比是小猪。控制按钮可以比作技术创新,可以给企业带来收益。大企业资金雄厚,生产力大,有更多的能力进行技术创新,推出新产品后可以迅速占领市场获得高额利润。而小企业的最优选择就是等待,等大企业技术创新后,跟在大企业后,抢占市场份额,从这种创新中获得利益。,员工和企业也是一个,“,智猪博弈,”,过程,员工就是大猪,员工有两种选择,努力工作或者消磨时间。如果员工努力工作那么企业和员工都受益,如果员工敷衍工作,拿多少工资干多少活,那么最终会被企业辞退。员工只有行动才会受益,不行动则不受益或者受损。而企业可以选择物资奖励,也可以选择说教等待,物资奖励企业必先拿出部分资金作为奖励品,显然收益为负,而等待则不受损,即使辞退员工也可以有人填补空缺,让员工有危机感反而会促进员工的积极性。所以聪明的员工会选择努力工作引起领导注意而得到加薪。,顶牛博弈,设想在一条笔直的道路两端各有一个司机驾驶者自己的汽车开足马力向对方冲去。在这个过程中,谁胆怯躲避退让就被冠以胆小鬼的美名;谁毫不退让最终停在道路中间就被称为英雄。显然,双方如果都停在道路中央,结果将是灾难性的,但是如果双方都躲避退让,他们显然都是胆小鬼。如果一个勇往直前另一个退避让路,则前者就会非常荣耀并享有较高的满足感。,例:,古巴的导弹危机,思考,以上三个经典的博弈模型有什么不同?,对你有什么启发?,1,对策论的基本概念,对策模型的要素,局中人(博弈方):,局中人(,players,)是指参与竞争的各方,每方必须有独立的决策能力和承担风险的能力。而那些在竞争中,既不作决策,结局又和他的得失无关的人,就不能称为局中人。,策略集:,在对策问题中,局中人为了应对其他局中人的行动而采取的方案和手段称为该局中人的一个策略(,strategy,)。这里所说的策略必须是局中人选择的实际可行的通盘筹划的完整的行动方案,并非指竞争过程中某一步所采取的局部方案。,赢得及赢得函数:,局中人采用不同策略对策时,各方总是有得或有失,统称赢得(,payoff,)或得失。,田忌赛马,S,1,S,2,(,上中下,),(,上下中,),(,中上下,),(,中下上,),(,下上中,),(,下中上,),(,上中下,),3,,,-3,1,,,-1,1,,,-1,1,,,-1,-1,,,1,1,,,-1,(,上下中,),1,,,-1,3,,,-3,1,,,-1,1,,,-1,1,,,-1,-1,,,1,(,中上下,),1,,,-1,-1,,,1,3,,,-3,1,,,-1,1,,,-1,1,,,-1,(,中下上,),-1,,,1,1,,,-1,1,,,-1,3,,,-3,1,,,-1,1,,,-1,(,下上中,),1,,,-1,1,,,-1,1,,,-1,-1,,,1,3,,,-3,1,,,-1,(,下中上,),1,,,-1,1,,,-1,-1,,,1,1,,,-1,1,,,-1,3,,,-3,局中人,1,齐王的赢得矩阵,合作对策,非合作对策,静态对策,动态对策,多人对策,二人对策,零和对策,常和对策,变和对策,对策论,对策论的分类,二人有限零和对策(矩阵对策),对策分类中,研究最早、占有重要地位的是二人有限零和对策。二人有限零和对策需具备以下三个条件:,a,、有两个局中人;,b,、每个局中人的策略都是有限的;,c,、每一策略组合下,各局中人得益之和始终为零。,一个对策问题只要具备以上三个条件就称为二人有限零和对策,又叫做矩阵对策。,试举出几个矩阵对策的例子。,二人有限零和对策(矩阵对策),通常矩阵对策表示为,表示局中人为甲、乙两个人,各自的策略分别为,、,以及局中人甲的赢得矩阵为,A,。,【,例,】,甲、乙二人之间玩剪刀,石头,布游戏,输方付给赢方,1,元人民币,如若双方所出策略相同,例如都出剪刀,则得益均为零。试写出双方进行一次游戏时各局中人的策略集和局中人甲的赢得矩阵。,经典例题之攻城问题,甲乙两军对垒,甲有两个师的实力,乙有三个师的实力。甲为守城方,乙为攻城方。城堡有两个城门,如下图所示。,假设:,1,、甲、乙两军只可以整师调动;,2,、当两军兵力相等时,甲将获得胜利;,3,、每个师的战斗能力相同;,乙军从任何一个城门进入,均可以占领城池,获得胜利。,问:甲、乙谁获胜的可能性大?,A,城门,B,城门,1,矩阵对策的最优纯策略,对于对策问题,我们所关心的是一旦对策问题的三要素确定了,双方分别会出什么策略。在矩阵对策中,如若知道了局中人甲的赢得矩阵,我们就可以找出双方如何选择自己策略来对付对方,使得自己的收益最大或损失最小,这是下面我们要讨论的问题。,对策问题的解:最优纯策略和最优混合策略,2,矩阵对策的最优纯策略,为求出对策模型的解,首先需要对双方的对策条件作如下的假设:,(,1,)对策双方的行为是理智的,对策略的选择不存在任何侥幸心理;,(,2,)局中人选取策略的目标是收益最大或损失最小;,(,3,)局中人同时选取各自的行动策略,且不知道对方选取哪一个策略;,(,4,)对策中的有关规定和要求,局中人是知道的。,1,矩阵对策的最优纯策略,纯策略和混合策略的概念,有些对策问题双方会分别采取中的策略,这样的策略我们称为,纯策略,。,“田忌赛马”游戏中,我们知道如果田忌和齐王都可以随机选择策略,且双方都不会固定的选择其中的某一个策略,会按照一定的概率在其策略集中出策略,这种情况下,我们称为,混合策略,。,矩阵对策的简化,严格下策反复消去法,严格下策的定义:,如果在矩阵中存在两行,r,行与,s,行,,r,行的元素均大于,s,行的元素,即对一切,j=1,2,,,.,n,都有,a,rj,a,sj,,则称局中人甲的策略,s,是,r,的严格下策;同样如果在矩阵中存在两列,h,列与,k,列,,h,列的元素大于,k,列的元素,即对于一切,i=1,2,m,都有,a,ih,a,ik,,则称局中人乙的策略,k,是,h,的严格下策。,严格下策反复消去法:,通过在赢得矩阵中进行反复消去严格下策,可以对矩阵进行简化,而且不会消去矩阵对策的解。,矩阵对策的简化,严格下策反复消去法,【,例,】,利用严格下策反复消去法简化下面的矩阵,最大最小原则,【,例,】,某地区有甲、乙两家企业生产同种产品,采取相同的价格出售,为了提高市场份额,均采取作广告的方式扩大自己的销售量。甲和乙均有三种广告策略。甲企业所占的市场份额增加的百分数如下面矩阵所示:,最大最小原则,最大最小原则:,对于矩阵对策,G=S,1,,,S,2,,,S,3,,设,A,为局中人甲的赢得矩阵,,a,ij,为在纯局势(,i,,,j,)下局中人甲的损益值,对行中元素先取小后取大对应的局中人甲的策略为,r,;对列中元素先取大后取小,对应着局中人乙的策略为,s,,如果下面等式成立时,矩阵对策才存在最优纯策略,并把纯局势(,r,,,s,)称为对策在纯策略下的解,又称为对策的鞍点或平衡局势。把其值称之为对策的对策值。,最大最小原则,【,例,】,求解下面的矩阵对策,一般矩阵对策的解可以是不唯一的,当解不唯一时,解之间的关系具有下面两条性质:,(1),无差别性,对策值的唯一性,(2),可交换性,【,例,】,讨论,p,,,q,的取值范围,使下面的矩阵对策存在鞍点,行中取小,2,列中取大,10,由于该矩阵对策存在鞍点,所以需满足,因此需对,p,,,q,的值进行讨论,见下图,q=7,q=6,p=4,p=7,p,q,2,矩阵对策的最优混合策略,混合策略的概念,通过上节的讨论可知,求矩阵对策应先判断是否存在鞍点,但有些矩阵对策不存在鞍点,亦即对策没有平衡局势,例如田忌赛马中,按照“最大最小”原则可得:,此对策为没有鞍点的对策,或称对策在纯策略下没有解。,2,矩阵对策的最优混合策略,【,例,】,猜硬币游戏:,甲、乙两个儿童玩猜硬币游戏,甲手中拿着一枚硬币,把硬币盖在桌子上,让儿童乙猜是正面向上还是反面向上。如若猜对甲给你,1,元钱,猜错乙给甲,1,元钱。,2,矩阵对策的最优混合策略,猜硬币游戏的混合策略可以这么表示:,设甲出策略,1,(出正面向上)的概率为,x,(,0,x,1,),则出策略,2,(出正面向上)的概率为,1-x,。,设乙出策略,1,(猜正面向上)的概率为,y,(,0,y,1,),则出策略,2,(猜正面向上)的概率为,1-y,。,则(,x,,,y,)即可成为猜硬币游戏的混合策略,猜硬币游戏的解即是需求合适的,x,*,和,y,*,,使甲和乙都不会单独偏离这样的混合策略(,x,*,,,y,*,),x,y,1,1,0,0.5,0.5,期望值原则,局中人甲的混合策略为分别以,x,i,的概率出,i,,局中人乙的混合策略为分别以,y,j,的概率出,j,,其中,在求局中人甲的混合策略时,首先计算出当局中人甲分别以,x,i,的概率出,i,策略时,局中人乙出,j,的期望值:,联立方程组:,同理可得,分别求解上面两个方程组,即可求出最优混合策略。,【,例,】,两个局中人进行对策,规则是两人相互独立地各自从,1,、,2,、,3,这三个数字中任意选择一个数字写在纸上。如果两人所写的数字之和为偶数,则局中人乙付给局中人甲以数量为此和数的报酬。如果两人所写的数字之和为奇数,则局中人甲付给局中人乙以数量为此和数的报酬。试求出其最优策略。,图解法,但是如果(简化后的)赢得矩阵不是方阵,“期望值原则”就可能失效。就必须探讨新的解法 。,图解法求解矩阵对策,一般适用于赢得矩阵为,m2,或,2n,的对策问题,对于,m,和,n,都较大的对策问题就不适用了。,图解法,【,例,】,求解下面的矩阵对策 ,其中,图解法,【,例,】,某厂用三种不同的设备,1,、,2,、,3,分别加工三种不同的产品,1,、,2,、,3,时,单位时间内创造的价值由表给出。,1,2,3,1,3,-2,4,2,-1,4,2,3,2,2,6,第四节 矩阵对策的线性规划解法,对于矩阵对策,当局中人甲取纯策略,局中人乙希望局中人甲的赢得越少越好,其损失就越少。,当局中人乙取纯策略,局中人甲希望局中人乙的损失越大越好,其赢得就越多。,矩阵对策的线性规划解法,矩阵对策的最优混合策略可以由以下两个不等式组获得:,矩阵对策的线性规划解法,不妨设,V0,,,V,的值与赢得矩阵中各元素的值有关系,对于不等式组(一)来说,局中人甲希望,V,值越大越好。令,矩阵对策的线性规划解法,对于不等式组(二)来说,局中人乙希望,V,越小越好。令,矩阵对策的线性规划解法,【,例,】,利用线性规划方法求解赢得矩阵,矩阵对策的线性规划解法,在用线性规划模型求解矩阵对策时,,V,值不一定大于,0,,我们可以把矩阵,A,中的每一个元素都加上同样的一个足够大的正数,K,使得所得到的新的赢得矩阵,A,的每一个元素都非负。,定理:矩阵对策,G=S,1,,,S,2,,,A,和,G=S,1,,,S,2,,,A,的最优混合策略是相同的,而且,V=V-K.,矩阵对策的线性规划解法,【,例,】,甲、乙两个医疗器械厂生产同一种医疗器械,两个厂都想在经营管理上采取措施而获得更多的医疗市场销售份额,甲厂可以采取的措施有:(,1,)降低原医疗器械价格;(,2,)研制出新产品;(,3,)提高原医疗器械的质量。乙厂可以采取的措施有:(,1,)扩大原医疗器械的广告宣传力度;(,2,)增设维修网点,加强售后服务;(,3,)改进原医疗器械的性能。由于两个厂的财力有限,都只能采取一个措施通过预测两个厂各自采取不同的措施后所占的市场总份额变动情况如表所示(正值为甲厂所增加的市场占有份额,负值为甲厂所减少的市场份额),试求这两个医疗器械厂各自的最优策略。,1,2,3,1,3,-3,-1,2,-3,1,1,2,1,-1,-1,例,有甲、乙两只游泳队举行包括三个项目的对抗赛。这两只游泳队各有一名健将级队员(甲队为李,乙队为王),在这三个项目中成绩都非常突出,但规则要求他们每人只能参加两场比赛,每队的其他两名队员可参加全部比赛。已知各运动员的平均成绩(,s,)见下表。,甲,队,乙,队,A,1,A,2,李,王,B,1,B,2,100m,蝶泳,100m,仰泳,100m,蛙泳,59.7,67.2,74.1,63.2,68.4,75.5,57.1,63.2,70.3,58.6,61.5,72.6,61.4,64.7,73.4,64.8,66.5,76.9,假设各运动员在比赛中都发挥正常水平,又比赛第一名得,5,分,第二名得,3,分,第,3,名得,1,分,问教练员应决定让自己队健将参加哪两项比赛,使本队得分最多?(各对参加比赛名单互相保密,定下来之后不许变动),结论是:甲队李将参加仰泳比赛,并以各,0.5,的概率参加蛙泳和仰泳比赛;乙队王将参加蝶泳比赛,并以各,0.5,的概率参加仰泳和蛙泳比赛。,其它对策问题选介,【1】,有两架航班,甲有两个空位,乙有一个空位,将要有两位乘客先后到来,每个乘客愿意承受的最高价格为,a,,两个航班中每个乘客会选择价格更低的乘座,问航空公司如何定价?,【2】,在西部片中,我们经常能看到这样的故事:某个小镇上只有一个警察,他要负责整个镇的治安。我们假定,小镇的一头有一家酒馆,另一头有一家银行。再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察只能一次在一定地方巡逻而小偷也只能去一个地方,假定银行需要保护的财产价格为,2,万元,酒馆的财产价格为,1,万元。若警察在某地巡逻,而小偷也选择了去该地,就会被经常抓住;若警察没有巡逻的地方而小偷去了,则小偷偷盗成功。警察怎么选罗才能使效果最好?,其它对策问题选介,【,3】,考虑一个村庄有,n,个村民,每年夏天所有的村民都会在村庄公共草地上放牧。用,g,i,表示村民,i,放羊的头数,则村里羊的总头数为,G=g,1,+g,2,+g,n,。购买和照看一只羊的成本为,c,,,c,不随一户村民拥有的羊的数量而发生变化。当草地上羊的总数为,G,时,一个村民养一只羊的价值为,v(G),。由于一只羊要生存至少需要一定数量的青草,草地上可以放牧羊的总数有一个上限。还有由于最初的一些羊有足够的空间放牧,再加上一只不会对已经放养的羊产生太大的影响,但是当草地上放养羊的总数已经多到只能维生时,再增加一只羊就会对其他已经放养的羊带来极大的损害。春天来时,村民共同决定放养羊的数量。问村民们应该如何决定自己养羊的数量?,
展开阅读全文