混合策略纳什均衡概述56544

上传人:无*** 文档编号:244446989 上传时间:2024-10-04 格式:PPTX 页数:49 大小:631.76KB
返回 下载 相关 举报
混合策略纳什均衡概述56544_第1页
第1页 / 共49页
混合策略纳什均衡概述56544_第2页
第2页 / 共49页
混合策略纳什均衡概述56544_第3页
第3页 / 共49页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,博弈论第三章,第一讲 概念与方法,*,2024年10月4日,博弈论第三章,第一讲 概念与方法,1,社会福利博弈:无纳什均衡,流浪汉,寻找工作 游荡,救济,政府,不救济,3,,,2,-1,,,3,-1,,,1,0,,,0,你救济,他就游荡;你游荡,他就不救济,2024年10月4日,博弈论第三章,第一讲 概念与方法,2,社会福利博弈的特征,不存在纳什均衡,类似:父母与啃老族,回望:另一个,不正常,的博弈,情侣博弈,两个纳什均衡,2024年10月4日,博弈论第三章,第一讲 概念与方法,3,思考,如何分析,“,不存在,”,纳什均衡,或,存在多个纳什均衡,的博弈?,2024年10月4日,博弈论第三章,第一讲 概念与方法,4,第三章 混合策略纳什均衡,第一节 基本概念:混合策略与期望支付,2024年10月4日,博弈论第三章,第一讲 概念与方法,5,第一节 混合策略与期望支付,一、混合策略,(一)案例:小偷与守卫的猫鼠博弈,守卫,睡 不睡,偷,小偷,不偷,8,,,-2,-2,,,0,0,,,8,0,,,0,2024年10月4日,博弈论第三章,第一讲 概念与方法,6,小偷与守卫博弈,无纳什均衡,如何分析?,2024年10月4日,博弈论第三章,第一讲 概念与方法,7,第一节 混合策略与期望支付,一、混合策略,(二)混合策略,1.,表述,参与人,按照一定概率,,随机从策略组合中选择一种策略作为实际行动,随机行动的目的:使自己的行为不被对手预测,2024年10月4日,博弈论第三章,第一讲 概念与方法,8,混合策略,小偷的混合策略,以,p,的概率偷,(,p,,,1-p,),守卫的混合策略,以,q,的概率睡(,q,,,1-q,),2024年10月4日,博弈论第三章,第一讲 概念与方法,9,第一节 混合策略与期望支付,一、混合策略,(二)混合策略,2.,相对概念:纯策略,每个参与人的非随机性选择,纯粹行动计划,,p=100%,1-p=0,2024年10月4日,博弈论第三章,第一讲 概念与方法,10,第一节 混合策略与期望支付,一、混合策略,(二)混合策略,3.,数学刻画,给定博弈,G=,S,1,,,S,n,;u,1,u,n,以及参与人,i,的纯策略,S,i,=,s,i1,s,ik,概率分布,p,i,=,(,p,i1,p,ik,)为混合策略,其中:,0 p,ik,1,,,p,ik,=1,,,p,ik,=p,(,s,ik,),混合策略组合,p=,(,p,1,p,i,p,n,),2024年10月4日,博弈论第三章,第一讲 概念与方法,11,第一节 混合策略与期望支付,二、期望支付,(一)分析,1.,概率,(偷,睡)的概率:,pq,(偷,不睡)的概率:,p(1-q),(不偷,睡)的概率:,(1-p)q,(不偷,不睡)的概率,:,(1-p)(1-q),2024年10月4日,博弈论第三章,第一讲 概念与方法,12,第一节 混合策略与期望支付,二、期望支付,(一)分析,2.,期望支付,U,小偷,=8pq+,(,-2,),p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1),U,守卫,=,(,-2,),pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p),2024年10月4日,博弈论第三章,第一讲 概念与方法,13,第一节 混合策略与期望支付,二、期望支付,(二)数学刻画,2024年10月4日,博弈论第三章,第一讲 概念与方法,14,第一节 混合策略与期望支付,三、混合策略纳什均衡,给定策略式博弈,G=,S,1,,,S,n,;u,1,u,n,以及混合策略组合,p*=,(,p,1,*,p,i,*,p,n,*,),对于所有,i,和,p,i,i,,,i,i,的混合策略空间,如果有:,i,(p,i,*,p,-i,*),i,(p,i,p,-i,*),则:混合策略组合,p*=,(,p,1,*,p,i,*,p,n,*,)为,G,的混合策略纳什均衡,2024年10月4日,博弈论第三章,第一讲 概念与方法,15,第二节 研究方法:反应函数法,最佳反应函数曲线交叉法,一、案例:麦琪的礼物,Dela,剪发,q,保留(,1-q,),卖表,p,Jim,保留(,1-p,),-2,,,-2,2,,,2,2,,,2,0,,,0,2024年10月4日,博弈论第三章,第一讲 概念与方法,16,二、研究方法:反应函数法,二、期望支付,1.U,Jim,=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2p(1-3q)+2q,整理原则:一项含,p,,一项不含,p,2.U,Del,=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p,整理原则:一项含,q,,一项不含,q,2024年10月4日,博弈论第三章,第一讲 概念与方法,17,二、研究方法:反应函数法,三、反应函数,1.Jim,:,Dela,剪发的概率越小,,Jim,卖表越好,U,Jim,=2p(1-3q)+2q,2024年10月4日,博弈论第三章,第一讲 概念与方法,18,二、研究方法:反应函数法,三、反应函数,2.Dela,:,Jim,卖表的概率越小,,Dela,剪发越好,U,Del,=2q(1-3p)+2p,2024年10月4日,博弈论第三章,第一讲 概念与方法,19,二、研究方法:反应函数法,四、反应函数曲线,1.,交点(,1,,,0,),双方支付为,2,2.,交点(,0,,,1,),双方支付为,2,3.,交点(,1/3,,,1/3,),双方支付为,2/3,q,p,1,1/3,1/3,1,互相为对方着想,期望支付变小,2024年10月4日,博弈论第三章,第一讲 概念与方法,20,作业,利用反应函数法求解,“,社会福利博弈,”,是否需要调整数据?,可得出有关社会保障体系改革的结论?,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,21,友军博弈,英 国,支持巴顿 支持蒙帅,支持巴顿,美国,支持蒙帅,4,,,3,2,,,2,1,,,1,3,,,4,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,22,友军博弈特征,两个(多个)纳什均衡,问题:博弈的最终结果?,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,23,第三章 混合策略纳什均衡,第三节 多重纳什均衡的选择标准,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,24,第三节 多重纳什均衡的选择标准,一、帕累托优势标准:,得益更大,(一)案例:战争与和平,C,国,鹰战略 鸽战略,鹰战略,A,国,鸽战略,-5,,,-5,8,,,-10,-10,,,8,10,,,10,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,25,第三节 多重纳什均衡的选择标准,一、帕累托优势标准:得益更大,(二)纳什均衡的选择标准,帕累托优势标准,按照,支付大小,筛选纳什均衡,-5,,,-5,8,,,-10,-10,,,8,10,,,10,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,26,第三节多重纳什均衡的选择标准,二、风险优势标准:风险更小?,(一)案例:串通作弊博弈,学生乙,作弊 不作弊,作弊,学生甲,不作弊,9,,,9,0,,,8,8,,,0,7,,,7,帕累托优势?,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,27,第三节多重纳什均衡的选择标准,二、风险优势标准:风险更小,(二)分析:偏离损失比较法,1.,甲:,单独偏离均衡的,损失,(,1,)偏离,“,作弊,”,:,9-8=1,(,2,)偏离,“,不作弊,”,:,7-0=7,9,,,9,0,,,8,8,,,0,7,,,7,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,28,第三节多重纳什均衡的选择标准,二、风险优势标准:风险更小,(二)分析:偏离损失比较法,2.,乙:,单独偏离均衡的,损失,(,1,)偏离,“,作弊,”,:,9-8=1,(,2,)偏离,“,不作弊,”,:,7-0=7,9,,,9,0,,,8,8,,,0,7,,,7,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,29,第三节多重纳什均衡的选择标准,二、风险优势标准:风险更小,(二)分析:偏离损失比较法,3.,偏离损失比较,方法:偏离,“,作弊,”,的损失,VS,偏离,“,不作弊,”,的损失,11,77,9,,,9,0,,,8,8,,,0,7,,,7,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,30,第三节多重纳什均衡的选择标准,二、风险优势标准:风险更小,(二)分析:偏离损失比较法,4.,结论,(,1,)偏离(不作弊,不作弊)的损失更大:,49,(,2,)不偏离(不作弊,不作弊),9,,,9,0,,,8,8,,,0,7,,,7,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,31,第三节多重纳什均衡的选择标准,二、风险优势标准:风险更小,(三)纳什均衡的选择标准:风险优势标准,比较不同纳什均衡之间的风险状况,风险小的纳什均衡优先,9,,,9,0,,,8,8,,,0,7,,,7,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,32,第三节多重纳什均衡的选择标准,三、聚点均衡,(一)案例:城市分组博弈,参与人:甲 乙,策略:把上海、长春、南京、哈尔滨四个城市分成两组,每组,2,个城市,支付:甲乙分法相同,奖励,100,元;甲乙分法不同,奖励,0,元,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,33,第三节多重纳什均衡的选择标准,三、聚点均衡,(二)聚点均衡,1.,标准,使用社会文化习惯、博弈历史等信息达到均衡,1,、,10,、,66,、,888,2.,实质,规律性,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,34,第三节多重纳什均衡的选择标准,四、相关均衡,(一)案例:,“,地域连坐,”,下的产品质量博弈,企业乙,好产品 差产品,好产品,企业甲,差产品,4,,,4,-8,,,-2,-2,,,-8,-2,,,-2,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,35,第三节多重纳什均衡的选择标准,四、相关均衡,(二)相关均衡,参与人主动设计某种形式的选择机制,形成制度安排,从而确定最终均衡,“,三鹿,”,事件出现后,河北省其他食品企业以后如何做?,4,,,4,-8,,,-2,-2,,,-8,-2,,,-2,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,36,第三节多重纳什均衡的选择标准,五、抗共谋均衡,(一)案例:抽象的选择,乙,左 右,上,甲,下,乙,左 右,上,甲,下,0,,,0,,,10,-5,,,-5,,,0,-5,,,-5,,,0,1,,,1,,,-5,丙:,A,-2,,,-2,,,0,-5,,,-5,,,0,-5,,,-5,,,0,-1,,,-1,,,5,丙:,B,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,37,第三节多重纳什均衡的选择标准,五、抗共谋均衡,(二)共谋偏离(集体偏离)均衡的激励,1.,如果,集体偏离,(上,左,,A,),(,1,)起因:甲、乙集体偏离,选(下,右,,A,),(,2,)结果:甲的支付,01,,乙的支付,01,(,3,)结论:甲、乙有集体偏离的动机,(上,左,,A,)非抗共谋均衡,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,38,第三节多重纳什均衡的选择标准,五、抗共谋均衡,(二)共谋偏离(集体偏离)均衡的激励,2.,如果,集体偏离,(下,右,,B,),(,1,)若甲、乙集体偏离,选(上,左,,B,),-1-2,,,-1-2,(,2,)若甲、丙集体偏离,选(上,右,,A,),-1-5,,,50,(,3,)若乙、丙集体偏离,选(下,左,,A,),-1-5,,,50,(,4,)结论:缺乏集体偏离的激励,,(下,右,,B,)为,抗共谋均衡,2024年10月4日,博弈论第三章,第二讲多重纳什均
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!