混合策略纳什均衡概述

上传人:花里****1 文档编号:240757448 上传时间:2024-05-05 格式:PPT 页数:48 大小:603KB
返回 下载 相关 举报
混合策略纳什均衡概述_第1页
第1页 / 共48页
混合策略纳什均衡概述_第2页
第2页 / 共48页
混合策略纳什均衡概述_第3页
第3页 / 共48页
点击查看更多>>
资源描述
2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法1社会福利博弈:无纳什均衡社会福利博弈:无纳什均衡 流浪汉流浪汉 寻找工作寻找工作 游荡游荡 救济救济 不救济不救济3,2-1,3-1,10,0你救济,他就游你救济,他就游荡;你游荡,他荡;你游荡,他就不救济就不救济2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法2社会福利博弈的特征社会福利博弈的特征不存在纳什均衡不存在纳什均衡类似:父母与啃老族类似:父母与啃老族回望:另一个回望:另一个不正常不正常的博弈的博弈情侣博弈情侣博弈两个纳什均衡两个纳什均衡2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法3思考思考如何分析如何分析“不存在不存在”纳什均衡纳什均衡或或存在多个纳什均衡存在多个纳什均衡的博弈?的博弈?2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法4第三章第三章 混合策略纳什均衡混合策略纳什均衡第一节第一节 基本概念:混合策略与基本概念:混合策略与期望支付期望支付2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法5第一节第一节 混合策略与期望支付混合策略与期望支付一、混合策略一、混合策略(一)案例:小偷与守卫的猫鼠博弈(一)案例:小偷与守卫的猫鼠博弈 守卫守卫 睡睡 不睡不睡 偷偷 小偷小偷 不偷不偷8,-2-2,00,80,02024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法6小偷与守卫博弈小偷与守卫博弈无纳什均衡,如何分析?无纳什均衡,如何分析?2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法7第一节第一节 混合策略与期望支付混合策略与期望支付一、混合策略一、混合策略(二)混合策略(二)混合策略1.表述表述参与人参与人按照一定概率按照一定概率,随机从策略,随机从策略组合中选择一种策略作为实际行动组合中选择一种策略作为实际行动随机行动的目的:使自己的行为不被随机行动的目的:使自己的行为不被对手预测对手预测2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法8混合策略混合策略小偷的混合策略小偷的混合策略以以p的概率偷,(的概率偷,(p,1-p)守卫的混合策略守卫的混合策略以以q的概率睡(的概率睡(q,1-q)2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法9第一节第一节 混合策略与期望支付混合策略与期望支付一、混合策略一、混合策略(二)混合策略(二)混合策略2.相对概念:纯策略相对概念:纯策略每个参与人的非随机性选择每个参与人的非随机性选择纯粹行动计划,纯粹行动计划,p=100%,1-p=02024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法10第一节第一节 混合策略与期望支付混合策略与期望支付一、混合策略一、混合策略(二)混合策略(二)混合策略3.数学刻画数学刻画给定博弈给定博弈G=S1,,Sn;u1,un以及参以及参与人与人i的纯策略的纯策略Si=si1,sik概率分布概率分布pi=(pi1,pik)为混合策略)为混合策略其中:其中:0 pik 1,pik=1,pik=p(sik)混合策略组合混合策略组合p=(p1,pi,pn)2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法11第一节第一节 混合策略与期望支付混合策略与期望支付二、期望支付二、期望支付(一)分析(一)分析1.概率概率(偷,睡)的概率:(偷,睡)的概率:pq(偷,不睡)的概率:(偷,不睡)的概率:p(1-q)(不偷,睡)的概率:(不偷,睡)的概率:(1-p)q(不偷,不睡)的概率(不偷,不睡)的概率:(1-p)(1-q)2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法12第一节第一节 混合策略与期望支付混合策略与期望支付二、期望支付二、期望支付(一)分析(一)分析2.期望支付期望支付U小偷小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1)U守卫守卫=(-2)pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p)2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法13第一节第一节 混合策略与期望支付混合策略与期望支付二、期望支付二、期望支付(二)数学刻画(二)数学刻画2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法14第一节第一节 混合策略与期望支付混合策略与期望支付三、混合策略纳什均衡三、混合策略纳什均衡给定策略式博弈给定策略式博弈G=S1,,Sn;u1,un以及混合策略组合以及混合策略组合p*=(p1*,pi*,pn*)对于所有对于所有i和和pi i,ii的混合策略的混合策略空间空间如果有:如果有:i(pi*,p-i*)i(pi,p-i*)则:混合策略组合则:混合策略组合p*=(p1*,pi*,pn*)为)为G的混合策略的混合策略纳什均衡纳什均衡2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法15第二节第二节 研究方法:反应函数法研究方法:反应函数法最佳反应函数曲线交叉法最佳反应函数曲线交叉法一、案例:麦琪的礼物一、案例:麦琪的礼物 Dela 剪发剪发q 保留(保留(1-q)卖表卖表pJim 保留(保留(1-p)-2,-22,22,20,02024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法16二、研究方法:反应函数法二、研究方法:反应函数法二、期望支付二、期望支付1.UJim=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2p(1-3q)+2q整理原则:一项含整理原则:一项含p,一项不含,一项不含p2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p整理原则:一项含整理原则:一项含q,一项不含,一项不含q2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法17二、研究方法:反应函数法二、研究方法:反应函数法三、反应函数三、反应函数1.Jim:Dela剪发的概率越小,剪发的概率越小,Jim卖卖表越好表越好UJim=2p(1-3q)+2q2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法18二、研究方法:反应函数法二、研究方法:反应函数法三、反应函数三、反应函数2.Dela:Jim卖表的概率越小,卖表的概率越小,Dela 剪发越好剪发越好UDel=2q(1-3p)+2p2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法19二、研究方法:反应函数法二、研究方法:反应函数法四、反应函数曲四、反应函数曲线线1.交点(交点(1,0)双方支付为双方支付为22.交点(交点(0,1)双方支付为双方支付为23.交点(交点(1/3,1/3)双方支付为双方支付为2/3qp11/31/31互相为对方着互相为对方着想,期望支付想,期望支付变小变小2024年年5月月5日日博弈论第三章博弈论第三章第一讲第一讲 概念与方法概念与方法20作业作业利用反应函数法求解利用反应函数法求解“社会福利博弈社会福利博弈”是否需要调整数据?是否需要调整数据?可得出有关社会保障体系改革的结可得出有关社会保障体系改革的结论?论?2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡21友军博弈友军博弈 英英 国国 支持巴顿支持巴顿 支持蒙帅支持蒙帅 支持巴顿支持巴顿美国美国 支持蒙帅支持蒙帅4,32,21,13,42024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡22友军博弈特征友军博弈特征两个(多个)纳什均衡两个(多个)纳什均衡问题:博弈的最终结果?问题:博弈的最终结果?2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡23第三章第三章 混合策略纳什均衡混合策略纳什均衡第三节第三节 多重纳什均衡的选择标多重纳什均衡的选择标准准2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡24第三节第三节 多重纳什均衡的选择标准多重纳什均衡的选择标准一、帕累托优势标准:一、帕累托优势标准:得益更大得益更大(一)案例:战争与和平(一)案例:战争与和平 C国国 鹰战略鹰战略 鸽战略鸽战略 鹰战略鹰战略 A国国 鸽战略鸽战略-5,-58,-10-10,810,102024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡25第三节第三节 多重纳什均衡的选择标准多重纳什均衡的选择标准一、帕累托优势标准:得益更大一、帕累托优势标准:得益更大(二)纳什均衡的选择标准(二)纳什均衡的选择标准帕累托优势标准帕累托优势标准按照按照支付大小支付大小筛选纳什均衡筛选纳什均衡-5,-58,-10-10,810,102024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡26第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准二、风险优势标准:风险更小?二、风险优势标准:风险更小?(一)案例:串通作弊博弈(一)案例:串通作弊博弈 学生乙学生乙 作弊作弊 不作弊不作弊 作弊作弊学生甲学生甲 不作弊不作弊9,90,88,07,7帕累托优帕累托优势?势?2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡27第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准二、风险优势标准:风险更小二、风险优势标准:风险更小(二)分析:偏离损失比较法(二)分析:偏离损失比较法1.甲:甲:单独偏离均衡的单独偏离均衡的损失损失(1)偏离)偏离“作弊作弊”:9-8=1(2)偏离)偏离“不作弊不作弊”:7-0=7 9,90,88,07,72024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡28第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准二、风险优势标准:风险更小二、风险优势标准:风险更小(二)分析:偏离损失比较法(二)分析:偏离损失比较法2.乙:乙:单独偏离均衡的单独偏离均衡的损失损失(1)偏离)偏离“作弊作弊”:9-8=1(2)偏离)偏离“不作弊不作弊”:7-0=7 9,90,88,07,72024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡29第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准二、风险优势标准:风险更小二、风险优势标准:风险更小(二)分析:偏离损失比较法(二)分析:偏离损失比较法3.偏离损失比较偏离损失比较方法:偏离方法:偏离“作弊作弊”的损失的损失VS偏离偏离“不作弊不作弊”的损失的损失1177 9,90,88,07,72024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡30第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准二、风险优势标准:风险更小二、风险优势标准:风险更小(二)分析:偏离损失比较法(二)分析:偏离损失比较法4.结论结论(1)偏离(不作弊,不作弊)的损失)偏离(不作弊,不作弊)的损失更大:更大:49(2)不偏离(不作弊,不作弊)不偏离(不作弊,不作弊)9,90,88,07,72024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡31第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准二、风险优势标准:风险更小二、风险优势标准:风险更小(三)纳什均衡的选择标准:风险优(三)纳什均衡的选择标准:风险优势标准势标准比较不同纳什均衡之间的风险状况,比较不同纳什均衡之间的风险状况,风险小的纳什均衡优先风险小的纳什均衡优先 9,90,88,07,72024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡32第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准三、聚点均衡三、聚点均衡(一)案例:城市分组博弈(一)案例:城市分组博弈参与人:参与人:甲甲 乙乙策略:把上海、长春、南京、哈尔滨策略:把上海、长春、南京、哈尔滨四个城市分成两组,每组四个城市分成两组,每组2个城市个城市支付:甲乙分法相同支付:甲乙分法相同奖励奖励100元;元;甲乙分法不同甲乙分法不同奖励奖励0元元2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡33第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准三、聚点均衡三、聚点均衡(二)聚点均衡(二)聚点均衡1.标准标准使用社会文化习惯、博弈历史等信使用社会文化习惯、博弈历史等信息达到均衡息达到均衡1、10、66、8882.实质实质规律性规律性2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡34第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准四、相关均衡四、相关均衡(一)案例:(一)案例:“地域连坐地域连坐”下的产品下的产品质量博弈质量博弈 企业乙企业乙 好产品好产品 差产品差产品 好产品好产品企业甲企业甲 差产品差产品4,4-8,-2-2,-8-2,-22024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡35第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准四、相关均衡四、相关均衡(二)相关均衡(二)相关均衡参与人主动设计某种形式的选择机制,参与人主动设计某种形式的选择机制,形成制度安排,从而确定最终均衡形成制度安排,从而确定最终均衡“三鹿三鹿”事件出现后,河北省其他食品事件出现后,河北省其他食品企业以后如何做?企业以后如何做?4,4-8,-2-2,-8-2,-22024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡36第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准五、抗共谋均衡五、抗共谋均衡(一)案例:抽象(一)案例:抽象的选择的选择 乙乙 左左 右右 上上甲甲 下下 乙乙 左左 右右 上上甲甲 下下0,0,10-5,-5,0-5,-5,01,1,-5丙:丙:A-2,-2,0-5,-5,0-5,-5,0-1,-1,5丙:丙:B2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡37第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准五、抗共谋均衡五、抗共谋均衡(二)共谋偏离(集体偏离)均衡的激励(二)共谋偏离(集体偏离)均衡的激励1.如果如果集体偏离集体偏离(上,左,(上,左,A)(1)起因:甲、乙集体偏离,选(下,右,)起因:甲、乙集体偏离,选(下,右,A)(2)结果:甲的支付)结果:甲的支付01,乙的支付,乙的支付01(3)结论:甲、乙有集体偏离的动机,)结论:甲、乙有集体偏离的动机,(上,左,(上,左,A)非抗共谋均衡)非抗共谋均衡2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡38第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准五、抗共谋均衡五、抗共谋均衡(二)共谋偏离(集体偏离)均衡的激励(二)共谋偏离(集体偏离)均衡的激励2.如果如果集体偏离集体偏离(下,右,(下,右,B)(1)若甲、乙集体偏离,选(上,左,)若甲、乙集体偏离,选(上,左,B)-1-2,-1-2(2)若甲、丙集体偏离,选(上,右,)若甲、丙集体偏离,选(上,右,A)-1-5,50(3)若乙、丙集体偏离,选(下,左,)若乙、丙集体偏离,选(下,左,A)-1-5,50(4)结论:缺乏集体偏离的激励,)结论:缺乏集体偏离的激励,(下,右,(下,右,B)为)为抗抗共谋均衡共谋均衡2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡39猎鹿博弈:何为抗共谋均衡?猎鹿博弈:何为抗共谋均衡?乙乙 猎鹿猎鹿 打兔打兔 猎鹿猎鹿 甲甲 打兔打兔10,100,44,04,42024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡40金无足赤,人无金无足赤,人无完人完人人总是要犯错误人总是要犯错误的,所以要对别的,所以要对别人宽容人宽容2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡41经得起考验的纳什均衡经得起考验的纳什均衡在在其他参与人选择了错误策略其他参与人选择了错误策略的情况的情况下,某参与人仍能实现纳什均衡下,某参与人仍能实现纳什均衡他人不犯错误,他人不犯错误,你能实现最优;你能实现最优;他人犯错误,他人犯错误,你仍能实现最你仍能实现最优优2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡42第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准六、颤抖手精炼均衡六、颤抖手精炼均衡Trembling-hand perfect equilibrium(一)颤抖手(一)颤抖手某一参与人的某一参与人的非蓄意非蓄意错误错误博弈偏离均衡路径的原因博弈偏离均衡路径的原因一个人用手抓东西一个人用手抓东西时,手一颤抖,就时,手一颤抖,就可能抓不住他想抓可能抓不住他想抓的东西:非蓄意错的东西:非蓄意错误误2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡43第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准六、颤抖手精炼均衡六、颤抖手精炼均衡(二)颤抖手均衡(二)颤抖手均衡1.基本思想基本思想给定给定所有参与人均可能犯错误所有参与人均可能犯错误的情况的情况下,如果某一策略组合仍是每一个参下,如果某一策略组合仍是每一个参与人的最优策略组合,则实现颤抖手与人的最优策略组合,则实现颤抖手均衡均衡如何理解如何理解?2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡44第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准六、颤抖手精炼均衡六、颤抖手精炼均衡(二)颤抖手均衡(二)颤抖手均衡2.定义定义:mmistaken人博弈中,对于每一个博弈方人博弈中,对于每一个博弈方i,存,存在严格混合策略序列在严格混合策略序列 ,使下列条件,使下列条件得到满足:得到满足:(1)尽管每一个博弈方可能犯错误,但错尽管每一个博弈方可能犯错误,但错误收敛于零误收敛于零总有一天能成功总有一天能成功2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡45穿针引线穿针引线功夫不负有心人功夫不负有心人将一条线穿入针将一条线穿入针眼,手在不停颤眼,手在不停颤抖,不大可能一抖,不大可能一下子穿进去下子穿进去但如果试的次数但如果试的次数足够大,总是能足够大,总是能够成功够成功2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡46第三节多重纳什均衡的选择标准第三节多重纳什均衡的选择标准六、颤抖手精炼均衡六、颤抖手精炼均衡(二)颤抖手均衡(二)颤抖手均衡2.定义:定义:mmistaken人博弈中,对于每一个博弈方人博弈中,对于每一个博弈方i,存,存在严格混合策略序列在严格混合策略序列 ,使下列条件,使下列条件得到满足:得到满足:(2)对于任何可选择的混合策略)对于任何可选择的混合策略2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡47穿针引线穿针引线学会宽容学会宽容纳什均衡:每一个人都把线穿入针眼纳什均衡:每一个人都把线穿入针眼宽容:某参与人不能因为其他参与人宽容:某参与人不能因为其他参与人可能暂时无法把线穿进针眼而故意不可能暂时无法把线穿进针眼而故意不把线穿进针眼把线穿进针眼宽容是一宽容是一种美德种美德2024年年5月月5日日博弈论第三章博弈论第三章第二讲多重纳什均衡第二讲多重纳什均衡48本章作业本章作业P143-1461、7、11、19、20、21、22、24、25
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 金融资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!