混合策略纳什均衡概述56544

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,博弈论第三章,第一讲概念与方法,*,2024年10月4日,博弈论第三章,第一讲概念与方法,1,社会福利博弈：无纳什均衡,流浪汉,寻找工作游荡,救济,政府,不救济,3,，,2,-1,，,3,-1,，,1,0,，,0,你救济，他就游荡；你游荡，他就不救济,2024年10月4日,博弈论第三章,第一讲概念与方法,2,社会福利博弈的特征,不存在纳什均衡,类似：父母与啃老族,回望：另一个,不正常,的博弈,情侣博弈,两个纳什均衡,2024年10月4日,博弈论第三章,第一讲概念与方法,3,思考,如何分析,“,不存在,”,纳什均衡,或,存在多个纳什均衡,的博弈？,2024年10月4日,博弈论第三章,第一讲概念与方法,4,第三章混合策略纳什均衡,第一节基本概念：混合策略与期望支付,2024年10月4日,博弈论第三章,第一讲概念与方法,5,第一节混合策略与期望支付,一、混合策略,（一）案例：小偷与守卫的猫鼠博弈,守卫,睡不睡,偷,小偷,不偷,8,，,-2,-2,，,0,0,，,8,0,，,0,2024年10月4日,博弈论第三章,第一讲概念与方法,6,小偷与守卫博弈,无纳什均衡，如何分析？,2024年10月4日,博弈论第三章,第一讲概念与方法,7,第一节混合策略与期望支付,一、混合策略,（二）混合策略,1.,表述,参与人,按照一定概率,，随机从策略组合中选择一种策略作为实际行动,随机行动的目的：使自己的行为不被对手预测,2024年10月4日,博弈论第三章,第一讲概念与方法,8,混合策略,小偷的混合策略,以,p,的概率偷，（,p,，,1-p,）,守卫的混合策略,以,q,的概率睡（,q,，,1-q,）,2024年10月4日,博弈论第三章,第一讲概念与方法,9,第一节混合策略与期望支付,一、混合策略,（二）混合策略,2.,相对概念：纯策略,每个参与人的非随机性选择,纯粹行动计划，,p=100%,1-p=0,2024年10月4日,博弈论第三章,第一讲概念与方法,10,第一节混合策略与期望支付,一、混合策略,（二）混合策略,3.,数学刻画,给定博弈,G=,S,1,，,S,n,;u,1,u,n,以及参与人,i,的纯策略,S,i,=,s,i1,s,ik,概率分布,p,i,=,（,p,i1,p,ik,）为混合策略,其中：,0 p,ik,1,，,p,ik,=1,，,p,ik,=p,（,s,ik,）,混合策略组合,p=,（,p,1,p,i,p,n,）,2024年10月4日,博弈论第三章,第一讲概念与方法,11,第一节混合策略与期望支付,二、期望支付,（一）分析,1.,概率,（偷，睡）的概率：,pq,（偷，不睡）的概率：,p(1-q),（不偷，睡）的概率：,(1-p)q,（不偷，不睡）的概率,：,(1-p)(1-q),2024年10月4日,博弈论第三章,第一讲概念与方法,12,第一节混合策略与期望支付,二、期望支付,（一）分析,2.,期望支付,U,小偷,=8pq+,（,-2,）,p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1),U,守卫,=,（,-2,）,pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p),2024年10月4日,博弈论第三章,第一讲概念与方法,13,第一节混合策略与期望支付,二、期望支付,（二）数学刻画,2024年10月4日,博弈论第三章,第一讲概念与方法,14,第一节混合策略与期望支付,三、混合策略纳什均衡,给定策略式博弈,G=,S,1,，,S,n,;u,1,u,n,以及混合策略组合,p*=,（,p,1,*,p,i,*,p,n,*,）,对于所有,i,和,p,i,i,，,i,i,的混合策略空间,如果有：,i,(p,i,*,p,-i,*),i,(p,i,p,-i,*),则：混合策略组合,p*=,（,p,1,*,p,i,*,p,n,*,）为,G,的混合策略纳什均衡,2024年10月4日,博弈论第三章,第一讲概念与方法,15,第二节研究方法：反应函数法,最佳反应函数曲线交叉法,一、案例：麦琪的礼物,Dela,剪发,q,保留（,1-q,）,卖表,p,Jim,保留（,1-p,）,-2,，,-2,2,，,2,2,，,2,0,，,0,2024年10月4日,博弈论第三章,第一讲概念与方法,16,二、研究方法：反应函数法,二、期望支付,1.U,Jim,=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2p(1-3q)+2q,整理原则：一项含,p,，一项不含,p,2.U,Del,=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p,整理原则：一项含,q,，一项不含,q,2024年10月4日,博弈论第三章,第一讲概念与方法,17,二、研究方法：反应函数法,三、反应函数,1.Jim,：,Dela,剪发的概率越小，,Jim,卖表越好,U,Jim,=2p(1-3q)+2q,2024年10月4日,博弈论第三章,第一讲概念与方法,18,二、研究方法：反应函数法,三、反应函数,2.Dela,：,Jim,卖表的概率越小，,Dela,剪发越好,U,Del,=2q(1-3p)+2p,2024年10月4日,博弈论第三章,第一讲概念与方法,19,二、研究方法：反应函数法,四、反应函数曲线,1.,交点（,1,，,0,）,双方支付为,2,2.,交点（,0,，,1,）,双方支付为,2,3.,交点（,1/3,，,1/3,）,双方支付为,2/3,q,p,1,1/3,1/3,1,互相为对方着想，期望支付变小,2024年10月4日,博弈论第三章,第一讲概念与方法,20,作业,利用反应函数法求解,“,社会福利博弈,”,是否需要调整数据？,可得出有关社会保障体系改革的结论？,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,21,友军博弈,英国,支持巴顿支持蒙帅,支持巴顿,美国,支持蒙帅,4,，,3,2,，,2,1,，,1,3,，,4,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,22,友军博弈特征,两个（多个）纳什均衡,问题：博弈的最终结果？,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,23,第三章混合策略纳什均衡,第三节多重纳什均衡的选择标准,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,24,第三节多重纳什均衡的选择标准,一、帕累托优势标准：,得益更大,（一）案例：战争与和平,C,国,鹰战略鸽战略,鹰战略,A,国,鸽战略,-5,，,-5,8,，,-10,-10,，,8,10,，,10,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,25,第三节多重纳什均衡的选择标准,一、帕累托优势标准：得益更大,（二）纳什均衡的选择标准,帕累托优势标准,按照,支付大小,筛选纳什均衡,-5,，,-5,8,，,-10,-10,，,8,10,，,10,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,26,第三节多重纳什均衡的选择标准,二、风险优势标准：风险更小？,（一）案例：串通作弊博弈,学生乙,作弊不作弊,作弊,学生甲,不作弊,9,，,9,0,，,8,8,，,0,7,，,7,帕累托优势？,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,27,第三节多重纳什均衡的选择标准,二、风险优势标准：风险更小,（二）分析：偏离损失比较法,1.,甲：,单独偏离均衡的,损失,（,1,）偏离,“,作弊,”,：,9-8=1,（,2,）偏离,“,不作弊,”,：,7-0=7,9,，,9,0,，,8,8,，,0,7,，,7,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,28,第三节多重纳什均衡的选择标准,二、风险优势标准：风险更小,（二）分析：偏离损失比较法,2.,乙：,单独偏离均衡的,损失,（,1,）偏离,“,作弊,”,：,9-8=1,（,2,）偏离,“,不作弊,”,：,7-0=7,9,，,9,0,，,8,8,，,0,7,，,7,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,29,第三节多重纳什均衡的选择标准,二、风险优势标准：风险更小,（二）分析：偏离损失比较法,3.,偏离损失比较,方法：偏离,“,作弊,”,的损失,VS,偏离,“,不作弊,”,的损失,11,77,9,，,9,0,，,8,8,，,0,7,，,7,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,30,第三节多重纳什均衡的选择标准,二、风险优势标准：风险更小,（二）分析：偏离损失比较法,4.,结论,（,1,）偏离（不作弊，不作弊）的损失更大：,49,（,2,）不偏离（不作弊，不作弊）,9,，,9,0,，,8,8,，,0,7,，,7,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,31,第三节多重纳什均衡的选择标准,二、风险优势标准：风险更小,（三）纳什均衡的选择标准：风险优势标准,比较不同纳什均衡之间的风险状况，风险小的纳什均衡优先,9,，,9,0,，,8,8,，,0,7,，,7,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,32,第三节多重纳什均衡的选择标准,三、聚点均衡,（一）案例：城市分组博弈,参与人：甲乙,策略：把上海、长春、南京、哈尔滨四个城市分成两组，每组,2,个城市,支付：甲乙分法相同,奖励,100,元；甲乙分法不同,奖励,0,元,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,33,第三节多重纳什均衡的选择标准,三、聚点均衡,（二）聚点均衡,1.,标准,使用社会文化习惯、博弈历史等信息达到均衡,1,、,10,、,66,、,888,2.,实质,规律性,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,34,第三节多重纳什均衡的选择标准,四、相关均衡,（一）案例：,“,地域连坐,”,下的产品质量博弈,企业乙,好产品差产品,好产品,企业甲,差产品,4,，,4,-8,，,-2,-2,，,-8,-2,，,-2,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,35,第三节多重纳什均衡的选择标准,四、相关均衡,（二）相关均衡,参与人主动设计某种形式的选择机制，形成制度安排，从而确定最终均衡,“,三鹿,”,事件出现后，河北省其他食品企业以后如何做？,4,，,4,-8,，,-2,-2,，,-8,-2,，,-2,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,36,第三节多重纳什均衡的选择标准,五、抗共谋均衡,（一）案例：抽象的选择,乙,左右,上,甲,下,乙,左右,上,甲,下,0,，,0,，,10,-5,，,-5,，,0,-5,，,-5,，,0,1,，,1,，,-5,丙：,A,-2,，,-2,，,0,-5,，,-5,，,0,-5,，,-5,，,0,-1,，,-1,，,5,丙：,B,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,37,第三节多重纳什均衡的选择标准,五、抗共谋均衡,（二）共谋偏离（集体偏离）均衡的激励,1.,如果,集体偏离,（上，左，,A,）,（,1,）起因：甲、乙集体偏离，选（下，右，,A,）,（,2,）结果：甲的支付,01,，乙的支付,01,（,3,）结论：甲、乙有集体偏离的动机，（上，左，,A,）非抗共谋均衡,2024年10月4日,博弈论第三章,第二讲多重纳什均衡,38,第三节多重纳什均衡的选择标准,五、抗共谋均衡,（二）共谋偏离（集体偏离）均衡的激励,2.,如果,集体偏离,（下，右，,B,）,（,1,）若甲、乙集体偏离，选（上，左，,B,）,-1-2,，,-1-2,（,2,）若甲、丙集体偏离，选（上，右，,A,）,-1-5,，,50,（,3,）若乙、丙集体偏离，选（下，左，,A,）,-1-5,，,50,（,4,）结论：缺乏集体偏离的激励，,（下，右，,B,）为,抗共谋均衡,2024年10月4日,博弈论第三章,第二讲多重纳什均

展开阅读全文

混合策略纳什均衡概述56544

最新文档