第7讲博弈论混合策略课件

上传人:无*** 文档编号:241647654 上传时间:2024-07-12 格式:PPTX 页数:31 大小:940.75KB
返回 下载 相关 举报
第7讲博弈论混合策略课件_第1页
第1页 / 共31页
第7讲博弈论混合策略课件_第2页
第2页 / 共31页
第7讲博弈论混合策略课件_第3页
第3页 / 共31页
点击查看更多>>
资源描述
博弈论博弈论Game Theory蔡树彬13510646162(66162)科技楼14062第7讲 连续策略基本定义:划拳博弈支付均等化:小偷与守卫导数法:政府救助BR函数法:性别大战3划拳博弈划拳博弈锤剪包锤剪包0,01,-1-1,1-1,10,01,-11,-1-1,10,0121.写出1和2所有的最佳应对:BR1(锤2)=包1.2.在上面的矩阵里把相应的最佳应对画上圈,这个博弈有没有占优策略?有没有Nash均衡策略?3.使用箭头的方法再次寻找均衡4.假如是你来玩这个游戏,你将如何来玩这个游戏?4不存在Nash均衡,如何应对?假定对方是个高手,你愿意和他一局定胜负还是5局3胜?假定对方是个低手呢?假定5局3胜,对手“包包包包包”,你有什么策略获胜?假定5局3胜,对手“包包剪包包”,你有什么策略获胜?假定5局3胜,对手“包包锤剪包”,你有什么策略获胜?假定5局3胜,你知道对手会出3包1锤1剪,但是不知道顺序,你有什么策略获胜?假定3局2胜,你知道对手会出1包1锤1剪,但是不知道顺序,你有什么策略获胜?假定1局定胜负,你知道对手喜欢出包,你有什么策略获胜?假定1局定胜负,你知道对手随便乱出拳,你有什么策略获胜?5划拳博弈划拳博弈锤1剪2包3锤1剪2包30,01,-1-1,1-1,10,01,-11,-1-1,10,012取胜关键:不能让另一方猜到自己的策略 尽可能猜出对方策略6混合策略的提出利用生活经验不难知道,为了获胜,不能让对手知道自己利用生活经验不难知道,为了获胜,不能让对手知道自己要出什么,所以要用随机的方法来出拳,而且要等概率要出什么,所以要用随机的方法来出拳,而且要等概率(为什么?)(为什么?)在这个例子里,在这个例子里,A的策略是的策略是(1/3锤,锤,1/3剪,剪,1/3包包)这就引出了用概率来确定采用何种策略的方法,这就是混这就引出了用概率来确定采用何种策略的方法,这就是混合策略合策略(mixed strategies)概念的由来概念的由来在此之前所说的策略,实质上是以概率在此之前所说的策略,实质上是以概率1选取某个确定的选取某个确定的策略或行动,我们称之为纯策略策略或行动,我们称之为纯策略 (pure strategies)7混合策略的提出博弈博弈G=N,Ai,ui,i N参与人参与人i的纯策略构成的策略集合为的纯策略构成的策略集合为Si=Ai=si1,sik,参与人参与人i有有j个不同的策略个不同的策略混合策略:若参与人混合策略:若参与人i以概率分布以概率分布pi=(pi1,pik)在在其其k个可选策略中随机选择个可选策略中随机选择“策略策略”0pij 1,对于对于j=1,k都成立都成立 pi1+pik=1纯策略可看成特殊的混合策略纯策略可看成特殊的混合策略8混合策略意义下的相关表述混合策略空间:混合策略空间:(pi1,pik)(si1,sik)T混合策略意义下策略组合的表述混合策略意义下策略组合的表述x1 X1,xn Xn,其中,其中Xi,i=1,n表示参与人表示参与人i的混合策略空间,的混合策略空间,xi为参与人为参与人i的一个具体混合的一个具体混合策略策略9纳什均衡的存在性问题每一个有限博弈至少存在一个纳什均衡(纯策略或混合策略);如果一个博弈存在两个纯策略纳什均衡,那么,一定存在第三个混合策略纳什均衡10为什么要不能严打加大打击力度加大处罚力度(多判死刑)加大酒驾的惩罚力度猎虎行动11小偷和守卫的博弈小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷这个博弈的均衡是什么?概率是多大?加重对小偷的处罚会有什么结果?(增大P值)加重对守卫的处罚会有什么结果?(增大D值)12支付均等化如果对手猜出自己的行为,则自己必败为了不让对手猜出自己的行为,必须以一定概率选择纯策略该概率的选择使得每种纯策略带来的支付都相等,所以不会偏向任何一种策略13支付均等化小偷以的概率偷,守卫以的概率睡觉V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷14理解混合策略1。参与人随机做出某种行为(偷或者不偷)2.有许多参与人,每个人的行为是确定的,但是大家在一起表现出统计特征3.参与人是确定行为,但是对其他人来说是随机的。守卫随机抽取一人,并不能确定该人是偷还是不偷15V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒0-P-P小偷得益(偷)VPg 守卫睡的概率116V,-D-P,00,S0,0睡不睡偷不偷守卫守卫小小偷偷加重对守卫的处罚:短期效果是使守卫更尽职但长期中并不是使守卫更尽职,而是会降低盗窃发生的概率0-D-D守卫得益(睡)SPt 小偷偷的概率117如何使失窃率下降?加大对小偷的处罚只会一时改善治安长期作用是使监管者更懒惰加大对守卫的处罚短期使守卫更尽职长期是使偷窃率下降如何治理贪污?加大对贪官的处罚力度?加大对纪委的处罚力度不能头痛医头,脚痛医脚加大酒驾的惩处力度,只会使执法者更懒,不会制止酒驾要制止救驾,就要加大对警察的惩罚力度,使得警察增大查处的概率物价降不下来?不能只是处罚供应商,不能只是约谈。要加大对发改委的惩处力度(干不好就下去)引咎辞职18救助的困境被救助者在老家盖房子被救助者在老家盖房子汶川的救助物资现在都没用(救助款更不汶川的救助物资现在都没用(救助款更不知道到哪里去了)知道到哪里去了)郭美美事件郭美美事件救助会不会养懒汉?救助会不会养懒汉?为治疗某个病人的捐款常在治好病之后被为治疗某个病人的捐款常在治好病之后被人侵吞人侵吞19混合策略:政府以某个概率救济,贫民以某个概率失业20贫民必须以20%的概率迷惑政府2122均衡是(0.5,0.5),(0.2,0.8),如果偏离均衡,会怎么样?比如如果乐善好施的政府,其救助概率大于0.5,比如说0.6,会如何?贫民都游手好闲不是救助得越多越好,要有一个度饿不死,吃不饱是救济的要领利益高于道德(只要利益更高,人们就倾向于游手好闲,不劳而获)自私的基因农民和地主的区别23r:妻,时装:妻,时装q:夫,时装:夫,时装0 1/3 1图图1-19 1-19 性别战的图解法性别战的图解法1r=R1(q)q=R2(r)3/4这三个点的坐标为(0,0),(1/3,3/4),(1,1)。对应的)。对应的三个策略分别是:(足球,足球);丈夫、妻子分别三个策略分别是:(足球,足球);丈夫、妻子分别以以1/3、3/4的概率选择时装;(时装,时装)。的概率选择时装;(时装,时装)。BR法:性别大战2,10,00,01,3时 装足 球时装足球丈丈 夫夫妻妻子子夫妻之争夫妻之争 策略 期望得益妻 (0.75,0.25)0.67夫 (1/3,2/3)0.7524制式问题1,30,00,02,2ABAB厂商厂商2厂厂商商1制式问题制式问题 A B 得益厂商1:0.4 0.6 0.664厂商2:0.67 0.33 1.29625市场机会博弈-50,-50 100,00,1000,0进不 进进不进厂商厂商2厂厂商商1市场机会市场机会 进 不进 得益厂商1:2/3 1/3 0厂商2:2/3 1/3 0问题:你跟舍友打球(羽毛球、乒乓球),假设可以打远球、近球,你的击打策略是?请建模求解其他例子2627足球点球 守门员球员左右左50,5080,20右90,1020,80单号为球员,双号为守门员,选择你的策略1.选择纯策略2.选择混合策略3.如果守门员左边的扑球技巧提高,(50,50)-(30.70),他是否应该更多地往右边射门?28所有的运动都要使用混合策略篮球:三分远投还是内线攻击足球:近角、远角、高球、低球棒球:快球、慢球、曲线球、膝关节球打牌:诈叫兵者,诡道也。29你和对方比牌的大小(斗地主、赌神)你该如何下注?大牌下大注,小牌下小注行不行?有时候大牌下大注,有时候下小注,平均概率行不行?以多大概率下大注,多大概率下小注?结束语当你尽了自己的最大努力时,失败也是伟大的,所以不要放弃,坚持就是正确的。When You Do Your Best,Failure Is Great,So DonT Give Up,Stick To The End谢谢大家荣幸这一路,与你同行ItS An Honor To Walk With You All The Way演讲人:XXXXXX 时 间:XX年XX月XX日
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!