《博弈论混合策略》PPT课件.ppt

上传人:tia****nde 文档编号:12945065 上传时间:2020-06-04 格式:PPT 页数:30 大小:837KB
返回 下载 相关 举报
《博弈论混合策略》PPT课件.ppt_第1页
第1页 / 共30页
《博弈论混合策略》PPT课件.ppt_第2页
第2页 / 共30页
《博弈论混合策略》PPT课件.ppt_第3页
第3页 / 共30页
点击查看更多>>
资源描述
博弈论GameTheory,蔡树彬shubin13510646162(66162)科技楼1406,2,第7讲连续策略,基本定义:划拳博弈支付均等化:小偷与守卫导数法:政府救助BR函数法:性别大战,3,划拳博弈,锤,剪,包,锤,剪,包,0,0,1,-1,-1,1,-1,1,0,0,1,-1,1,-1,-1,1,0,0,1,2,1.写出1和2所有的最佳应对:BR1(锤2)=包1.2.在上面的矩阵里把相应的最佳应对画上圈,这个博弈有没有占优策略?有没有Nash均衡策略?3.使用箭头的方法再次寻找均衡4.假如是你来玩这个游戏,你将如何来玩这个游戏?,4,不存在Nash均衡,如何应对?假定对方是个高手,你愿意和他一局定胜负还是5局3胜?假定对方是个低手呢?假定5局3胜,对手“包包包包包”,你有什么策略获胜?假定5局3胜,对手“包包剪包包”,你有什么策略获胜?假定5局3胜,对手“包包锤剪包”,你有什么策略获胜?假定5局3胜,你知道对手会出3包1锤1剪,但是不知道顺序,你有什么策略获胜?假定3局2胜,你知道对手会出1包1锤1剪,但是不知道顺序,你有什么策略获胜?假定1局定胜负,你知道对手喜欢出包,你有什么策略获胜?假定1局定胜负,你知道对手随便乱出拳,你有什么策略获胜?,5,划拳博弈,锤1,剪2,包3,锤1,剪2,包3,0,0,1,-1,-1,1,-1,1,0,0,1,-1,1,-1,-1,1,0,0,1,2,取胜关键:不能让另一方猜到自己的策略尽可能猜出对方策略,6,混合策略的提出,利用生活经验不难知道,为了获胜,不能让对手知道自己要出什么,所以要用随机的方法来出拳,而且要等概率(为什么?)在这个例子里,A的策略是(1/3锤,1/3剪,1/3包)这就引出了用概率来确定采用何种策略的方法,这就是混合策略(mixedstrategies)概念的由来在此之前所说的策略,实质上是以概率1选取某个确定的策略或行动,我们称之为纯策略(purestrategies),7,混合策略的提出,博弈G=N,Ai,ui,iN参与人i的纯策略构成的策略集合为Si=Ai=si1,sik,参与人i有j个不同的策略混合策略:若参与人i以概率分布pi=(pi1,pik)在其k个可选策略中随机选择“策略”0pij1,对于j=1,k都成立pi1+pik=1纯策略可看成特殊的混合策略,8,混合策略意义下的相关表述,混合策略空间:(pi1,pik)(si1,sik)T混合策略意义下策略组合的表述x1X1,xnXn,其中Xi,i=1,n表示参与人i的混合策略空间,xi为参与人i的一个具体混合策略,9,纳什均衡的存在性问题,每一个有限博弈至少存在一个纳什均衡(纯策略或混合策略);如果一个博弈存在两个纯策略纳什均衡,那么,一定存在第三个混合策略纳什均衡,10,为什么要不能严打,加大打击力度加大处罚力度(多判死刑)加大酒驾的惩罚力度猎虎行动,11,小偷和守卫的博弈,小偷和守卫的博弈,这个博弈的均衡是什么?概率是多大?加重对小偷的处罚会有什么结果?(增大P值)加重对守卫的处罚会有什么结果?(增大D值),12,支付均等化,如果对手猜出自己的行为,则自己必败为了不让对手猜出自己的行为,必须以一定概率选择纯策略该概率的选择使得每种纯策略带来的支付都相等,所以不会偏向任何一种策略,13,支付均等化,小偷以的概率偷,守卫以的概率睡觉,14,理解混合策略,1。参与人随机做出某种行为(偷或者不偷)2.有许多参与人,每个人的行为是确定的,但是大家在一起表现出统计特征3.参与人是确定行为,但是对其他人来说是随机的。守卫随机抽取一人,并不能确定该人是偷还是不偷,15,加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒,16,加重对守卫的处罚:短期效果是使守卫更尽职但长期中并不是使守卫更尽职,而是会降低盗窃发生的概率,17,如何使失窃率下降?加大对小偷的处罚只会一时改善治安长期作用是使监管者更懒惰加大对守卫的处罚短期使守卫更尽职长期是使偷窃率下降如何治理贪污?加大对贪官的处罚力度?加大对纪委的处罚力度不能头痛医头,脚痛医脚加大酒驾的惩处力度,只会使执法者更懒,不会制止酒驾要制止救驾,就要加大对警察的惩罚力度,使得警察增大查处的概率物价降不下来?不能只是处罚供应商,不能只是约谈。要加大对发改委的惩处力度(干不好就下去)引咎辞职,18,救助的困境,被救助者在老家盖房子汶川的救助物资现在都没用(救助款更不知道到哪里去了)郭美美事件救助会不会养懒汉?为治疗某个病人的捐款常在治好病之后被人侵吞,19,混合策略:政府以某个概率救济,贫民以某个概率失业,20,贫民必须以20%的概率迷惑政府,21,22,均衡是(0.5,0.5),(0.2,0.8),如果偏离均衡,会怎么样?比如如果乐善好施的政府,其救助概率大于0.5,比如说0.6,会如何?贫民都游手好闲不是救助得越多越好,要有一个度饿不死,吃不饱是救济的要领利益高于道德(只要利益更高,人们就倾向于游手好闲,不劳而获)自私的基因农民和地主的区别,23,r:妻,时装,q:夫,时装,01/31图1-19性别战的图解法,1,r=R1(q),q=R2(r),3/4,这三个点的坐标为(0,0),(1/3,3/4),(1,1)。对应的三个策略分别是:(足球,足球);丈夫、妻子分别以1/3、3/4的概率选择时装;(时装,时装)。,BR法:性别大战,策略期望得益妻(0.75,0.25)0.67夫(1/3,2/3)0.75,24,制式问题,AB得益厂商1:0.40.60.664厂商2:0.670.331.296,25,市场机会博弈,进不进得益厂商1:2/31/30厂商2:2/31/30,问题:,你跟舍友打球(羽毛球、乒乓球),假设可以打远球、近球,你的击打策略是?请建模求解其他例子,26,27,足球点球,单号为球员,双号为守门员,选择你的策略选择纯策略选择混合策略如果守门员左边的扑球技巧提高,(50,50)-(30.70),他是否应该更多地往右边射门?,28,所有的运动都要使用混合策略篮球:三分远投还是内线攻击足球:近角、远角、高球、低球棒球:快球、慢球、曲线球、膝关节球打牌:诈叫兵者,诡道也。,29,你和对方比牌的大小(斗地主、赌神)你该如何下注?大牌下大注,小牌下小注行不行?有时候大牌下大注,有时候下小注,平均概率行不行?以多大概率下大注,多大概率下小注?,30,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!