第十四章 案例研究:自愿者的

上传人:仙*** 文档编号:252435731 上传时间:2024-11-15 格式:PPT 页数:36 大小:1.17MB
返回 下载 相关 举报
第十四章 案例研究:自愿者的_第1页
第1页 / 共36页
第十四章 案例研究:自愿者的_第2页
第2页 / 共36页
第十四章 案例研究:自愿者的_第3页
第3页 / 共36页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第十四章 案例研究:志愿者的困境,14.1,草原犬的困境,14.2,分析与练习,14.3,规范游戏,14.4,结果与改进,14.1,草原犬的困境,设想你是一只负责领地的放哨工作的草原犬。当有一天你看到一只捕食者正在靠近,这时候你有两种选择:发出警报(警醒同类)或者保持沉默。当你发出警报时,你帮助其他同类脱离险境,保证了它们的安全,与此同时你也是暴露了自己从而使自己成为猎物。对你而言,保持沉默更有利于自身安全,但是如果每个警卫都保持沉默,那么每个人都不再安全,包括你自己。那么当你看见一直捕猎者的时候该怎么做呢?,草原犬的困境,这个情节是志愿者困境的一个例子,是类似于在,102,页囚徒的困境中讨论的“囚徒的困境”的游戏。在“囚徒困境”中每个玩家有两个选择:配合管教或者逃跑。在志愿者困境中每个玩家也有两个选择:志愿者(正如在草原犬实例所说发出警报)或者睁一只眼闭一只眼(保持沉默)。如果一个玩家发出警报,则另一个玩家最好选择无视,但是如果两个玩家都选择无视,那么二者都要付出高昂的代价。,囚徒困境博弈,在“囚徒困境”博弈中,如果两个玩家都选择坦白则二者都相安无事;然后由于他们都无从知晓另一方的抉择,每个玩家都是独立去决定是否要抵赖的。,志愿者困境,在“志愿者困境”中,结局是否对双方都有利是不能立即知晓的。假设两个叫做,Alice,和,Bob,的玩家,如果,Alice,选择了警报,那么,Bob,最好选择忽视;如果,Alice,选择了忽视,那么,Bob,最好选择警报,这一切并没有为,Bob,提供一个在明确的最佳策略。同样,在,Alice,身上也得到相同的结:如果,Bob,选择警报那么,Alice,最好选择无视;如果,Bob,选择无视,那么她最好选择警报。,草原犬的实例,不是只有一种结果,正如在囚徒困境中一样,有两种一样好的结局:,Bob,选择警报并且,Alice,选择无视,或者:,Bob,选择无视并且,Alice,选择警报,在草原犬的领地不止两只哨兵,正如,Bob,和,Alice,的实例中所说的那样,一个玩家需要选择警报来使整个领地的同类收益,因此有许多好的结果,-,一个哨兵选择警报另一个则无视。,简要分析,如果一个哨兵一直去选择警报那么尽管有多倍的哨兵也没有意义。为了公平起见,我们允许哨兵来彼此之间随机可能性。为了最优值,每个玩家只要自愿者产生共同的优秀品质。,(,也就是说,每个后卫选择忽略一些概率,或志愿概率,1-,。为,的最优值是每个球员必要产生共同利益的自愿者。,),14.2,分析与练习,Marco Archetti,调查最佳,值在他的论文“志愿者的困境和社会集团的最优规模。”中已经涉及。在这里我们重申他的分析:每个玩家报警的可能性以及预期收益和他忽视的可能性和预期收益是相同的。但是在现实里报警的收益高于忽视收益玩家也许会报警多而忽视少;或者相反也即忽视收益高于报警收益。,最优几率的提出,最优机率取决于成本和收益的每一个选择。实际上,事实上,这两个人的最佳,2=C/A,(,c:,报警的成本;,a,:如果无人报警的总成本),最优几率论在草原犬困境中的应用,在草原犬的实例中,无人报警的损失最大而,2,小。如果你改让更多的草原犬去担任警卫的职责,就会有更多的玩家来分享报警成本,所以我们希望每个玩家选择无视的可能性增加。,事实上,,Archetti,提出:,n=21/,(,N-1,),由,n=21/,(,N-1,)拓展开,随着,N,的增加,正如随着玩家数目的增加每个玩家报警的时候少了很多,但是奇怪的是,增加这么多的警卫却并没有使领地变得更加安全。如果每个人都已最佳概率去报警除非你忽略的人是,N,,,N-1,,,2,,所以它不依赖于,N,的志愿者。如果你忽略的概率,氮,每个人都忽略的概率为,2N,且它随,N,的增加而增加。,代价惨重,这个结果是令人沮丧的,我们可以保证巨大损失的情况不会因为将整个集体的重担压在一个必须一直做志愿者的人身上而发生。我们可以为了公平起见通过要求每个人都按百分比来做一段时间的志愿者以此来分配重担,但是巨大损失的情况会随着分配重担的玩家的人数的增多而更加频繁的发生。,练习 一,阅读,en.wikipedia.org/wiki/Bystander_effect,.,I:海琴志愿者的困境.ppt,上提出的旁观反应,如果志愿者困境可以提供任何一点帮助给出旁观反应的解释。,练习二,高校有一个荣誉守则,要求学生举报作弊的实例。如果学生考试作弊,其他那些见证违规的学生面临着志愿者困境的同样的版本作为证人,你有两种选择:报告罪犯或忽略。如果你举报,你就保护了荣誉守则和高校的诚实和正直的文化的完整性,但你承担的成本包括紧张的关系和情感的不适。如果是别人作证那么你毫无压力和麻烦,但是如果每个人都对作弊现象无视,则会造成荣誉守则的完整性减少,如果作弊者没有受到惩罚,其他学生更可能去作弊。,练习二,下载并运行,/volunteersDilemma.py,,其中包含了志愿者的困境基本实现。没有人给定变量,N,所对应的,c,和,a,,编辑此代码来研究志愿者困境的代码实现,当你改变志愿者成本、无志愿者成本以及玩家数目大小的时候概率是怎么变化的?,练习二代码实现,14.3,规则游戏,在一些高校,作弊是司空见惯,学生举报作弊者;而在另一些学校,作弊很罕见并且更容易被举报和惩处,关于作弊者和举报者的或隐性或显性的规则就是社会规范。社会规范影响着每一个个体。如果你认为作弊很少被举报和惩处那么你就更容易作弊;但是个体同样也反作用于社会规范:如果很多人举报作弊那么就作弊的人也会变得更少。我们可以从上述事例的分析来延伸理解社会规范。,提出模型,我们的模型是基于由罗伯特,阿克塞尔罗德提出在遗传算法提出的“一个规范的演变促进方法”,(,www.jstor.org/stable/1960858,),遗传算法为自然演变定了性。我们创建一个具有不同属性的个体模型,以个体间相互作用的方式来检测他们的适当性。有着较高适当性的人更有可能繁殖,这样以来,随着时间的推移,人口的平均状况就有所提升。,属性介绍,在作弊实例中,相关的两个属性分别是:,胆量:,个人作弊的可能性,报复心:,个体举报作弊者的可能性,游戏介绍,玩家通过玩两个叫做“作弊与否”和“惩处与否”来进行互动,第一步,每个玩家决定是否作弊取决与胆量的大小,第二步,每个玩家决定是否举报作弊者取决于其报复心,这些赛局在每一代中玩儿好几次,所以每个玩家都有若干机会来作弊以及惩处作弊者。,适当性(,fitness,),每个玩家的适当性取决于他们在每一局中的表现,当一个玩家作弊,它的适合度就会通过加分形式来增加,但是其他人的适合度就会以减分形式来降低。每一个举报作弊者的人都会失去基础适合度分数并且使作弊者失去惩处适合度分数。在每一代的最后一局中,拥有最高适合度分数的玩家的下一代数目最多。每一代的子代个体以突变的形式来保持变化。,模拟结构的代码实现,for generations in range(many):,for steps in range(repetitions):,for person in persons:,cheat_or_not(),punish_or_not(),genetic_repopulation(),genetic_mutation(),Results,练习三,在这一节,我们会固定奖励值和惩处值以此来探索成本和惩处由此而生的效应。,programmer.PNG,然后以同样方法来探索惩处和奖励效应,随着另一个参数的固定,奖励值和惩处值应取多少来使实现好的结局的几率为,50%,、,70%,、,90%,?,14.4,结果与改进,每次运行随机抽取一代并且运行,300,代,模拟的参数是奖励,=3,,损害,=1,,惩罚,=2,,惩罚成本,=9,,最后我们计算平均胆量值和平均报复值。图,14-1,表示出了结果,每个点代表模拟结构的一次运行。,I:海琴volunteer result.PNG,14-1,胆量值,-,报复值图,B-V,图的分析,图,14-1,表示出了结果,每个点代表模拟结构的一次运行。,有两团很清楚的星团,一个是低胆量值另一个则是高胆量值。当胆量值较低平均报复值较为分散,说明报复值的影响不是很大,如果很少的人作弊,惩处的机会就会很少这样报复值对于适合度的影响就会很小。当胆量值很高报复值还是很低。,星团存在的原因,在低胆量值的星团中,平均适合度比较高,因此处于高胆量值星团的个体如果能够移动就会处于很好的状况,但是如果他们围绕高胆量值或者高报复值做单行道移动那么他们的适合度就会遭殃。所以高胆量值稳定性更好,这也是为什么这些星团存在的原因。,提高机遇,假设你在创办一所新的大学并且正在考虑你想要创造的学术文化,你也许更偏爱作弊罕见的学习环境,但是你的模型告诉你有两种别有着高作弊率和低作弊率的稳定结果。你该怎么做来提高实现低作弊率管理机制的可能性?,结局几率的可能因素,模拟的参数影响结局的可能性。在上一节中,参数奖励,=3,,损害,=1,,,=2,,惩罚成本,=9,。达到低作弊制度的概率为,50,左右。如果成立一个新的大学,你也许实在不喜欢那些概率,对于这些参数有最强影响力的就是成本代价,举报作弊者的成本和惩处成本以及被捉作弊的成本,图,14-2,表现了这些好的结果的几率是如何取决于这些参数的。,改变成本和惩处对结局的影响,提高好的结局的几率的方法,1.,降低成本,2.,提高惩处成本,具体实现分析,如果我们固定的惩罚值,=9,并且将成本降至,1,实现好的结局的几率为,80%,,为了达到同等可能性我们要固定成本值为,2,并且增加惩处至,11,。,尾声,哪个选项是更具吸引力取决于实际和文化因素。当然,我们必须小心,不要太认真采取这种模式。它是一个高度抽象的复杂的人类行为模型。然而,它提供了洞察到社会规范的出现和稳定的方法。,练习三,在这一节,我们会固定奖励值和惩处值以此来探索成本和惩处由此而生的效应。,game.py,然后以同样方法来探索惩处和奖励效应,随着另一个参数的固定,奖励值和惩处值应取多少来使实现好的结局的几率为,50%,、,70%,、,90%,?,练习四,在这一事例研究中的游戏是基于在游戏理论的奏效,只是一种为了分析遵循简单守则的代表的对于经济成本和收益的反应的一系列数学历年,你可以阅读更多的游戏理论在,I:海琴normal result.PNG,en.wikipedia.org/wiki/Game_theory.,谢谢欣赏,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!