第三章-第五节-演化博弈模型课件

上传人:风*** 文档编号:241697302 上传时间:2024-07-16 格式:PPT 页数:29 大小:887.46KB
返回 下载 相关 举报
第三章-第五节-演化博弈模型课件_第1页
第1页 / 共29页
第三章-第五节-演化博弈模型课件_第2页
第2页 / 共29页
第三章-第五节-演化博弈模型课件_第3页
第3页 / 共29页
点击查看更多>>
资源描述
第五节第五节 演化博弈模型演化博弈模型1第五节 演化博弈模型1一、演化博弈思想一、演化博弈思想o传统博弈理论的两个苛刻假设:传统博弈理论的两个苛刻假设:(1 1)完全理性()完全理性(2 2)完全信息)完全信息o与传统博弈理论不同,演化博弈理论并不要求参与人与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。是完全理性的,也不要求完全信息的条件。o演化博弈论(演化博弈论(Evolutionary Game TheoryEvolutionary Game Theory)把博弈理)把博弈理论分析和动态演化过程分析结合起来的一种理论。论分析和动态演化过程分析结合起来的一种理论。在方法论上,它不同于博弈论将重点放在静态均衡在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态的均衡。演和比较静态均衡上,强调的是一种动态的均衡。演化博弈理论源于生物进化论。化博弈理论源于生物进化论。2一、演化博弈思想传统博弈理论的两个苛刻假设:2o为什么将演化思想引入到博弈论中?为什么将演化思想引入到博弈论中?(1 1)博弈论对生物学的影响。博弈论的策略对应生)博弈论对生物学的影响。博弈论的策略对应生物学中的基因物学中的基因 ,博弈论的收益对应生物学中的,博弈论的收益对应生物学中的适应度。在生物学中应用的博弈论与经济学中的适应度。在生物学中应用的博弈论与经济学中的传统博弈论最大区别就是非完全理性的选择。传统博弈论最大区别就是非完全理性的选择。(2 2)演化化思想对社会科学的影响。例如,在市场)演化化思想对社会科学的影响。例如,在市场竞争中,我们不必要去理性的想那个策略才是最竞争中,我们不必要去理性的想那个策略才是最优的,最后能够在市场存活下来的企业,一定是优的,最后能够在市场存活下来的企业,一定是适应能力最强的公司。适应能力最强的公司。3为什么将演化思想引入到博弈论中?3 在演化博弈理论中,演化稳定策略在演化博弈理论中,演化稳定策略 (Evolutionary Stable(Evolutionary Stable Strategy,ESS)Strategy,ESS)和复制动态和复制动态(Replication Dynamics)(Replication Dynamics)是两个核是两个核心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。于是,博弈方在博弈的过程中需要不断进行学习,有过策略失于是,博弈方在博弈的过程中需要不断进行学习,有过策略失误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个稳定的策略。稳定的策略。复制动态实际上是描述某一特定策略在一个种群中被采用复制动态实际上是描述某一特定策略在一个种群中被采用的频数或频度的动态微分方程,可以用下式表示:的频数或频度的动态微分方程,可以用下式表示:4 在演化博弈理论中,演化稳定策略(Evolutiono当时间趋于无穷大时,博弈参与方策略选择行为是怎样的当时间趋于无穷大时,博弈参与方策略选择行为是怎样的?这就是演化博弈稳定性问题?这就是演化博弈稳定性问题,一个稳定状态必须对微小一个稳定状态必须对微小扰动具有稳健性才能称为演化稳定策略。也就是说,如果扰动具有稳健性才能称为演化稳定策略。也就是说,如果我们假定为演化稳定策略的稳定点,则该点除了本身必须我们假定为演化稳定策略的稳定点,则该点除了本身必须是均衡状态以外,还必须具有这样的性质:如果某些博弈是均衡状态以外,还必须具有这样的性质:如果某些博弈方由于偶然的错误偏离了它们,复制动态仍然会使方由于偶然的错误偏离了它们,复制动态仍然会使x x回复回复到到x*x*。在数学上,这相当于要求:当干扰使。在数学上,这相当于要求:当干扰使x x低于时低于时x*x*,dx/dtdx/dt必须大于必须大于0 0;当干扰使得;当干扰使得x x出现高于时出现高于时x*x*,dx/dtdx/dt必必须小于须小于0 0,这就要求这些稳定状态处于的导数必须小于,这就要求这些稳定状态处于的导数必须小于0 0。o演化稳定策略的影响因素分析演化稳定策略的影响因素分析 演化博弈关注的问题演化博弈关注的问题5当时间趋于无穷大时,博弈参与方策略选择行为是怎样的?这就是演二、复制动态中的对称博弈二、复制动态中的对称博弈 (一)签协议博弈(一)签协议博弈假设:群体中假设:群体中“Y”的比例为的比例为x,“N”的比例为的比例为1-x,对于对于甲甲Y Y:同意:同意N N:不同意:不同意设:群体比例的动态变化速度为设:群体比例的动态变化速度为当当x=0时,稳定;时,稳定;当当x0时,最终稳定于时,最终稳定于x*=1则:则:复制动态方程复制动态方程6二、复制动态中的对称博弈(一)签协议博弈假设:群体中“Y”图图1 1 签协议博弈的复制动态相位图签协议博弈的复制动态相位图x*=0,x*=1为稳定状态,此时,为稳定状态,此时,dx/dt=0但但x*=1为为ESS,即最终所有人都将选择,即最终所有人都将选择“Y”7图1 签协议博弈的复制动态相位图x*=0,x*=1为稳定状(二)一般两人对称博弈(二)一般两人对称博弈群体中采用群体中采用S1的比例为的比例为x,S2的比例为的比例为1-x,对于甲,对于甲当当F(x)=0时,时,复制动态稳定状态为:复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)则复制动态方程则复制动态方程F(x):8(二)一般两人对称博弈群体中采用S1的比例为x,S2的比例为稳定性定理稳定性定理若若x0;若若xx*,为使,为使xx*,应满足,应满足F(x)0.F(x)=dx/dt,t,则,则xF(x)=dx/dt,t,则,则x这意味着:这意味着:当当F(x*)0,x*为为ESS9稳定性定理若x0;F((三)协调博弈的复制动态和(三)协调博弈的复制动态和ESSESS当当F(x)=0时,时,x*=0,x*=1,x*=11/61为稳定状态为稳定状态复制动态方程复制动态方程F(x):图图2 2 协调博弈的协调博弈的复制动态相位图复制动态相位图可知,当可知,当F(0)0,F(1)0,则,则 x*=0和和x*=1为为ESS这意味着:这意味着:当初始当初始x11/61时,时,ESS 为为x*=1.10(三)协调博弈的复制动态和ESS当F(x)=0时,x*=0(四)鹰鸽博弈的复制动态和(四)鹰鸽博弈的复制动态和ESSESS令令x为采用为采用“鹰鹰”策略的群体比例策略的群体比例,1-x为采用为采用“鸽鸽”策略的群体比策略的群体比例例则复制动态方程则复制动态方程F(x):当当F(x)=0时,时,x*=0,x*=1,x*=v/c为稳定状态为稳定状态11(四)鹰鸽博弈的复制动态和ESS令x为采用“鹰”策略的群体比 假设假设v=2v=2,c=12c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)F(0)0,F(1)0,而,而F(1/6)0,则则ESS为:为:x*=1/6n 当冲突损失严重时,例如当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为时,两个种群发生战争的可能性为1/36;和平共处的;和平共处的可能性为可能性为25/36;一方霸道、一方忍让的可能性为;一方霸道、一方忍让的可能性为10/36。n 发生战争的可能性随着发生战争的可能性随着c/v比值的增加而降低,即:和平共处的可能性也随着增加。比值的增加而降低,即:和平共处的可能性也随着增加。12 假设v=2,c=12(表示种群间发生冲突导致的损失很大,假设假设v=8v=8,c=8c=8(表示种群间和平共(表示种群间和平共处所得到的收益等于两者冲突导致的损失)处所得到的收益等于两者冲突导致的损失)ESS:x*=1n 当当cv时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因在于当一方忍让时,另一方可获得更多收益。在于当一方忍让时,另一方可获得更多收益。n 这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。假设假设v=8v=8,c=4c=4(表示种群间和平共(表示种群间和平共处所得到的收益大于两者冲突导致的损失)处所得到的收益大于两者冲突导致的损失)ESS:x*=113 假设v=8,c=8(表示种群间和平共ESS:x*=1(四)蛙鸣博弈的复制动态和(四)蛙鸣博弈的复制动态和ESSESS令令x为采用为采用“鸣鸣”策略的群体比例策略的群体比例,1-x为采用为采用“不鸣不鸣”策略的群体策略的群体比例比例则复制动态方程则复制动态方程F(x):m、P为求偶成功的概率为求偶成功的概率 z为机会成本为机会成本(体力消耗、危险性等体力消耗、危险性等)满足:满足:m (0.5,1,mm-z01-Pm-z0ESS:x*=(m-z)/(1-P)n 在这种情况下,无论初始状况如何,最后总有在这种情况下,无论初始状况如何,最后总有(m-z)/(1-P)比例的雄蛙鸣叫。比例的雄蛙鸣叫。n 当个别雄蛙当个别雄蛙“搭便车搭便车”的收益大于群体雄蛙的收益大于群体雄蛙“鸣叫鸣叫”所获得的收益时,则总会存所获得的收益时,则总会存在搭便车在搭便车“不鸣叫不鸣叫”的雄蛙。的雄蛙。15 若(m-z)/(1-P)(0,1),即1-Pm-若若(m-z)/(1-P)mESS:x*=0n 显然,当机会成本小于收益时,所有的雄蛙将选择显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫不鸣叫”。n 当当“鸣叫鸣叫”的收益大于群体鸣叫而个别雄蛙的收益大于群体鸣叫而个别雄蛙“搭便车搭便车”的收益时,所有雄蛙都将鸣的收益时,所有雄蛙都将鸣叫。叫。若若(m-z)/(1-P)1,即,即m-z1-PESS:x*=116 若(m-z)/(1-P)mESS:x*=对称博弈:相似对称博弈:相似/相同群体中的演化博弈行为相同群体中的演化博弈行为 非对称博弈:不同群体间的演化博弈行为非对称博弈:不同群体间的演化博弈行为三、复制动态中的非对称博弈三、复制动态中的非对称博弈有两个群体:竞争者和在位者有两个群体:竞争者和在位者(一)一)市场阻入博弈市场阻入博弈17 对称博弈:相似/相同群体中的演化博弈行为三、复制动态中的非A:“进入进入”的群体比例为的群体比例为x “不进不进”的群体比例为的群体比例为1-xB:“打击打击”的群体比例为的群体比例为y “不打击不打击”的群体比例为的群体比例为1-y对对A而言:而言:则竞争者群体的复制动态方程则竞争者群体的复制动态方程FA(x):采用采用A表示竞争者,表示竞争者,B表示在位者表示在位者假设:假设:18A:“进入”的群体比例为x对A而言:则竞争者群体的复制动态方竞争者群体的复制动态方程:竞争者群体的复制动态方程:A:“进入进入”的群体比例为的群体比例为x “不进不进”的群体比例为的群体比例为1-xB:“打击打击”的群体比例为的群体比例为y “不打击不打击”的群体比例为的群体比例为1-y竞争者的群体复制动态相位图为:竞争者的群体复制动态相位图为:(b)y1/2ESS:x*=0(a)y=1/2x*0,1(c)y5/6ESS:x*=0(a)y=5/6x*0,1(c)y1/6ESS:y*=0(a)x=1/6y*0,1(c)x1/6ESS:y*=127B群体的复制动态方程:B的群体复制动态相位图为:A:采用“鹰A:“进入进入”的群体比例为的群体比例为x “不进不进”的群体比例为的群体比例为1-xB:“打击打击”的群体比例为的群体比例为y “不打击不打击”的群体比例为的群体比例为1-y最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例?当初始状态落在当初始状态落在A区域,区域,ESS为为x*=0,y*=1=1?当初始状态落在当初始状态落在D区域,区域,ESS为为x*=1,y*=0?当初始状态落在当初始状态落在B、C区域,为不稳定状态,区域,为不稳定状态,但可以确定最终大部分结果是落在但可以确定最终大部分结果是落在D区。区。!落在区域落在区域A A的概率为的概率为1/361/36,区域,区域D D的概率为的概率为25/3625/36。剩下的。剩下的10/3610/36的可能性中绝大部分也的可能性中绝大部分也会稳定在会稳定在D D区域。区域。28A:“进入”的群体比例为x最后,得到竞争者和在位者两群体复制谢谢大家!谢谢大家!29谢谢大家!29
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!