7-演化博弈详解

上传人:guoc****ang 文档编号:243045843 上传时间:2024-09-14 格式:PPT 页数:53 大小:215KB
返回 下载 相关 举报
7-演化博弈详解_第1页
第1页 / 共53页
7-演化博弈详解_第2页
第2页 / 共53页
7-演化博弈详解_第3页
第3页 / 共53页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,7,章 演化博弈,理性与经验,传统博弈理论,:,每个人都是理性的,并且理性和博弈结构是共同知识,;,每个人都在选择策略最大化自己的利益,;,只要知道博弈的结构,就可以预测均衡结果,;,但其他社会学家一直对理性人假设有所怀疑。,进化博弈,生物博弈是基因之间的博弈。,生物行为,(,策略,),是由基因决定的,基因的生存和繁殖由自然选择决定。最适合生存的基因不断繁衍,而不适合生存的基因被淘汰。,生物进化是一个自然选择的过程,;,最后可能导致一个稳定状态。,演化稳定策略,ESS: evolutionary stable strategies:,种群中可以持续存在的行为方式,;,静态,:,一个特定的行为方式被称为是演化稳定的,如果它的,种群不能被变异所成功侵入,;,或者说,任何,偏离行为的个体具有更低的生存能力,种群将会恢复到原来的状态,;,动态,:,假定初始状态存在多样的行为方式,随着时间的推移,如果,某个特定的行为方式能逐步主导整个种群,这个特定的行为方式就是,ESS;,ESS,与纳什均衡,ESS,一定是纳什均衡,但并非所有的纳什均衡都是,ESS;,演化过程可以帮助选择特定的纳什均衡,;,生物进化与社会演化,策略:,生物行为是基因决定的,个体没有选择性;,社会行为并不完全取决于基因,而是与社会环境、文化、教育、以及个体的经验等因素等有关,个体有选择性。,适应性,(fitness),:,基因的繁殖能力;总的或平均的报酬(,payoff),。,传递性:,基因遗传;成功的人将信息传输给朋友、同事;好的行为方式会被学习、模仿,。,人们也会有意识地通过,“,试错,”,的办法寻找好的策略,。,所以社会和教育机制更为重要,。,单元均衡与多元均衡,演化稳定状态可能只有一个策略(行为方式),也可能包含多个具有同样适应性的行为方式;,前者称为,单元均衡,;,后者称为,多元均衡,。,协调博弈:左撇子与右撇子,设想总人口中有两类人:一类人是左撇子;另一类人是右撇子;,任意挑选其中的一对进行博弈;,支付矩阵如下图所示;,注意:策略是先天决定的,参与者并不在两种策略之间选择。,左撇子与右撇子,左撇子,右撇子,左撇子,右撇子,1,,,1,0,,,0,0,,,0,1,,,1,谁最适合生存?,答案依赖于初始的人口分布。,假定总人口中有,x,的比例是左撇子,,1-x,的比例是右撇子。那么,左撇子的预期支付为:,x1+(1-x)0=x;,右撇子的预期支付:,x0+(1-x)1=1-x;,x(1-x) x1/2,三个均衡,如果,x1/2,,,左撇子更具生存能力,他们的比例将增加,直到,100%,;单元均衡;,如果,x2/3,物质型更适合生存,将演化成稳定均衡;,如果,x6x,x1/3,均衡,如果,x1/3, TFT,生存;稳定均衡;,如果,x6x,(4n-5)x1,x1/(4n-5),X,与,N,的关系,1/3,x,n,n=2,TFT,均衡,ALL-D,均衡,Robert Axelrod,Axelrod(1981,1984),著名的实验证明,在14种策略中,,TFT,是最成功的;,在第2个实验中,在62个策略中,,TFT,是最成功的。,合作社会会被破坏吗?,假定,TFT,长时间维持了社会的合作;人们可能变成,ALL-C,类型;此时,,ALL-D,入侵后,将可能蔓延很长时间,甚至导致整个社会进入非合作社会;,Eg,.,在某些国家容易行骗,TFT,:,动物界的合作,当一条大鱼进入一群小鱼的池塘时,一条或更多的小鱼将接近它侦探它是否有危险。这种掠夺侦察活动对这些侦探者是有风险的,但整个鱼群是有好处的:如果侵入者不是掠夺者或者不是特别饥饿,小鱼无须疏散。,每个个体都有很强的动机背叛,让其他鱼完成侦察;但是如果所有的鱼都背叛,就不可能获得侵入者的信息。而完全的合作可以最小化总的风险,因为如果不能集中与单个目标,入侵者将被迷惑。,Milinski,和,Dugatkin,独立地发现,鱼类确实在使用,TFT,:,当一对鱼接近入侵者时,如果一条想尾随在后,走在前面的鱼转身向后,等待另一条跟上,然后再并行前进。日复一日,孔雀鱼甚至可以记住其他同伙过去的表现。如果一次试验中一方背叛,另一方在第二天的试验中也会背叛。,孔雀鱼倾向于与过去表现出更具合作精神的鱼结伴而行。,鹰-鸽博弈,鹰,鸽,鹰,鸽,-1,,,-1,1,,,0,0,,,1,0.5,,,0.5,生存能力,假定鹰派的比例是,x,,,鸽派的比例是,1-x,;,鹰派的支付:,-x+(1-x)=1-2x;,鸽派的支付,: 0x+0.5(1-x)=0.5(1-x),;,1-2x0.5(1-x);,x1/3,均衡,如果,x1/3,,,鸽派占优势,;,不稳定,如果,x=1/3,,,同样的适应性;稳定;,稳定均衡是多元均衡;,图示,1,8,0,x=1,1/3,生存能力,-1,鹰派:,1-2x,鸽派,:0.5(1-X),二元均衡,鹰派和鸽派同时并存;,如果初始人口由单一类型构成,另一类型可以成功入侵,直到均衡;,自发秩序与产权制度,人类的行为并非完全由基因唯一决定;即使并非总是完全理性地计算,人们也必然要在不同的策略之间选择;,社会秩序是所有人行为选择的结果,但不是集中设计的,而是自发演化的结果;,产权制度:先占原则;,教室、图书馆占座位;,鹰-鸽博弈,鹰,鸽,鹰,鸽,-1,,,-1,1,,,0,0,,,1,0.5,,,0.5,A,B,三个纳什均衡,两个纯策略均衡:,(,A-,鹰,,B-,鸽);,(,A-,鸽,,B-,鹰);,一个混合策略均衡:(,1/3,2/3),仅仅,“,理性,”,不足以决定均衡。但有限理性并有一定经验和想象力的人们可以协调他们的行为。,信号与身份,如果两人完全一样,就没有办法选择特定的均衡;,假定存在某种显性的标记机制:在博弈开始之前,每个人收到一个信号:,A,或,B,;,概率是,1/3,;信号完全负相关;标记是共同知识;,规则:如果,A,,,选择,“,鹰,”,;如果,B,,,选择,“,鸽,”,;,每个人都有积极性遵守这个习惯(规则);,哪一个习惯(,convention),演化过程将给出习惯。,习惯可以是演化稳定的,即使他们是非帕累托效率的。,习惯如何开始演化?,一旦大部分人开始遵守一个习惯,这个习惯就会自我加强;在没有习惯的地方建立的行为规则最容易成为习惯;,最初的信念何来?一种可能是能使人们在一次博弈中无须交流就可以相互协调的力量;,习惯通过,“,类比,”,而扩散:如果共同的经验告诉我们一种特定习惯在一种情况下会被人们普遍遵守,这种习惯就成为类似情况下的模仿对象。,类比创造习惯,儒家的,“,家,”,与,“,国,”,;,先来后到;,产权规则:谁先占,谁所有;,领土的国际争端;,即使一开始不同的人有不同的习惯,随着时间的推移,人们趋向于最成功的规则;,遵守的人越多,越值得遵守。,从习惯到规范,习惯是已经建立起来的行为规则;,如果人们认为每个人都应该按照这样的规则行动,习惯就变成了规范,(norms);,转换机制:对别人认可的渴望,与对物质的渴望同样重要。,产权规则,产权规则一旦建立,每个人都会预期其他人会遵守这个规则;给定这样的预期,遵守它是每个人的利益所在。,给定自己遵守,每个人希望其他人也遵守;任何违反规则的行为都会被认为是一个,威胁,,引起,愤怒和不满,。,规则的其他受益者也会间接地感到威胁,因为他们也期待着靠这些规则保护自己的利益,所以会,同情直接的受害者,。,重男轻女,为什么妇女也,“,重男轻女,”,?,规范创造者,尽管习惯和规范是自然演化而来的,而非集体理性选择的结果,因而也不一定是帕累托有效的,但,规范创造者,在规范的演化中具有重要的作用 ;,规范创造者,的收益依赖于接受其推荐的规范的人数;遵守的人越多,说明越成功;,创造社会规范是一种风险活动,只有少数人愿意冒险行事。,典型人物:孔子。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!