完全信息静态博弈课件

上传人:20****08 文档编号:241294010 上传时间:2024-06-15 格式:PPTX 页数:46 大小:242.13KB
返回 下载 相关 举报
完全信息静态博弈课件_第1页
第1页 / 共46页
完全信息静态博弈课件_第2页
第2页 / 共46页
完全信息静态博弈课件_第3页
第3页 / 共46页
点击查看更多>>
资源描述
1完全完全信息静态博弈信息静态博弈博弈的基本概念纳什均衡纳什均衡应用混合策略和混合策略纳什均衡1完全信息静态博弈博弈的基本概念2伐木工人的决策和一个将军的决策有什么不同?木头没有反抗。将军的每一步计划都会引来抵抗,他必须克服这种抵抗。你!你的对手、竞争者都是聪明有主见的!2伐木工人的决策和一个将军的决策有什么不同?3社会科学研究策略性决策制定过程的分支称为 博弈论。严格讲,博弈论不是经济学的一个分支,它是一种方法,涉及到很多领域:实际上,博弈论是数学的一个分支。3社会科学研究策略性决策制定过程的分支称为博弈论。4策略故事妙手传奇给猫拴个铃铛多管齐下三思而后行4策略故事妙手传奇5引言博弈论诺贝尔经济学奖纳什(Nash)(1950-1951)泽尔腾(selten)(1965,1975)海萨尼(Harsanyi)(1967-1968)共同获得1994年诺贝尔经济学奖5引言博弈论6数学界的梵高数学界的梵高“疯子天才疯子天才”纳什纳什 6数学界的梵高“疯子天才”纳什7三位大师主要的贡献1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。因为在现实世界中,非合作博弈要比合作博弈普遍得多。7三位大师主要的贡献1950年和1951年纳什的两篇关于8Selten and Harsanyi泽尔腾(1965)将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念;以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”。而海萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(19671968)。总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型。8SeltenandHarsanyi泽尔腾(1965)将9诺贝尔经济学奖1968年,瑞典中央银行成立300周年,是为了纪念诺贝尔奖奖金提供者,设立诺贝尔经济学奖。1969年开始颁发。9诺贝尔经济学奖1968年,瑞典中央银行成立300周年,是为10从游戏到博弈游戏的特点:下棋,打牌,赌胜,田径,球类等等,共同的特点是 策略策略 策略的好坏决定游戏的结果游戏的特征:规则,结果,策略,策略和利益的依存性10从游戏到博弈游戏的特点:下棋,打牌,赌胜,田径,球类等等11什么是博弈论?博弈论:就是关于包含相互依存情况中理性行为的研究。相互依存:通常是指博弈中的任何一个局中人受到其他局中人的行为的影响,反过来,他的行为也影响到其他局中人。相互依存的另一个方面是局中人可以有某些共同的兴趣或利益所在。“理性行为”的说明:博弈论中的所谓理性,一般不是指道德标准。11什么是博弈论?博弈论:就是关于包含相互依存情况中理性行为12博弈三要素博弈方(局中人)-参与博弈但利益不完全一致者。有二人博弈与多人博弈之分。策略集-每个局中人都会有一系列的策略可选,称为对应于每个局中人的策略集。有限和无限个对策。得益-在每策略组合下每一局中人的得益情况,是选择策略的标准,称为得益函数或支付函数。12博弈三要素博弈方(局中人)-参与博弈但利益不完全一13博弈的关键局中人理性地采取或选择自己的策略行为,在相互制约相互影响的依存关系中,尽可能的提高自己的利益所得,这样,博弈论就是关于包含相互依存情况中理性行为的研究。相互依存 理性行为13博弈的关键局中人理性地采取或选择自己的策略行14博弈的四种分类情况完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈14博弈的四种分类情况完全信息静态博弈15博弈的分类及对应的均衡静态动态完全信息完全信息静态博弈;纳什均衡;Nash(1950)完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾(1965)不完全信息不完全信息静态博弈;贝叶斯纳什均衡;海萨尼(1967-1968)不完全信息动态博弈,精炼贝叶斯纳什均衡;泽尔腾(1975)Kreps,Wilson(1982),Fudenberg,Tirole(1991)15博弈的分类及对应的均衡静态动态完全完全信息静态博弈;完全16纳什均衡纳什均衡纳什均衡的定义纳什均衡的一致预测性纳什均衡与严格下策反复消去法16纳什均衡纳什均衡的定义17纳什均衡的定义各博弈方都不愿或不会单独改变自己策略的策略组合,只要这种策略组合存在且是唯一的,博弈就有绝对确定的解。这种各博弈方都不愿单独改变策略的策略组合就是博弈论中最重要的一个概念“纳什均衡”。17纳什均衡的定义各博弈方都不愿或不会单独改变自己策略18我们常用G表示一个博弈;如G有n个博弈方,每个博弈方的全部可选策略的集合我们称策略空间,分别用表示;用表示博弈方i的第j个策略,其中j可取有限个值(有限策略博弈),也可取无限个值(无限策略博弈);博弈方i的得益则用表示,是各博弈方策略的多元函数。n个博弈方的博弈G常写成18我们常用G表示一个博弈;如G有n个博弈方,每个博弈19定义在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方i的策略 ,都是对其余博弈方策略的组合 的最佳策略,即 对任意 都成立,则称 为G的一个“纳什均衡”。19定义在博弈20纳什均衡的一致预测性如果所有博弈方预测到一个特定的纳什均衡将会出现,那么,没有人有兴趣作不同的选择。纳什均衡的特征:博弈方预测到均衡,博弈方预测到其他博弈方预测到均衡,等等。一致性预测,并不意味着纳什均衡一定是一个好的预测。20纳什均衡的一致预测性如果所有博弈方预测到一个特定的21纳什均衡应用两个嫌犯受到指控,但除非至少一个招认,否则警方不能将二人判有罪。警察把二人分别带到不同的房间,告之后果:如果二人均不坦白,将被判入狱一年。如果双方均坦白,将被判入狱5年。如果一方坦白,另一方不坦白,坦白一 方立即释放,另一方判入狱8年。21纳什均衡应用两个嫌犯受到指控,但除非至少一个招认,22囚徒2囚徒1不坦白坦白不坦白1,18,0坦白0,85,522囚徒2不坦白坦白不坦白1,18,0坦白0,823囚徒困境说明了什么在(坦白、坦白)这个组合中,和都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡,也叫非合作均衡。囚徒困境反映了个个人人理理性性和和集集体体理理性性的的矛矛盾盾。如果和都选择不坦白,各判刑年,显然比都选择坦白各判刑年好得多。当然,和可以在被警察抓到之前订立一个“攻守同盟”,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定,显然最好的策略是双方都不坦白。23囚徒困境说明了什么在(坦白、坦白)这个组合中,和都不24囚徒困境的意义“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与不坦白策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。24囚徒困境的意义“囚徒的两难选择”有着广泛而深刻的意义25双寡头削价竞争寡头2高价 低价寡 高价头2低价100,10020,150150,2070,7025双寡头削价竞争寡头226对经典经济学的冲击“纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。国富论:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”26对经典经济学的冲击27从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。27从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:28研究囚徒困境问题的目的利用这种困境达到有利于社会的目的 政府在经济活动中的组织协调工作的必要性 避免囚徒困境28研究囚徒困境问题的目的利用这种困境达到有利于社会的目29混合策略纳什均衡混合策略混合策略博弈混合策略纳什均衡混合策略和严格下策反复消去法29混合策略纳什均衡混合策略30许多现实中决策问题构成的博弈中根本不存在具有稳定性的各博弈方都接受的纳什均衡策略组合如猜硬币博弈和齐威王田忌赛马,而另一些博弈却有多于一个的纳什均衡策略组合,如夫妻之争博弈。这两类博弈如果只进行一次,实际结果如何确实取决于机会和运气,如果多次独立反复进行这些博弈,这样博弈方决策的好坏就会从平均得益平均得益上反映出来,策略运用得当平均收益会较理想,至少是不吃亏,否则平均得益就会很差。30许多现实中决策问题构成的博弈中根本不存在具有稳定性31概念的引进31概念的引进32在这种博弈中各博弈方决策的第一个原则:自己的策略选择千万不能预先被另一方侦知或猜到。这就是说博弈方必须随机地选择策略随机地选择策略。其次,在本博弈中,如果盖硬币方虽然是随机决定出正面还是反面,但如果在总体上出正面多于出反面,即出正面的概率大于出反面的概率,则猜硬币方还是有机可乘。32在这种博弈中各博弈方决策的第一个原则:自己的策略选33设盖硬币方出正面的概率为p,则出反面的概率为1-p出正面多于出反面,即p1-p或p12。在这种情况下,如猜硬币方全猜正面,则他的期望得益:即平均来讲,猜硬币方一定是赢多输少。33设盖硬币方出正面的概率为p,则出反面的概率为1-p34双方都按照上述概率随机选择策略,即在本博弈中,博弈方的决策内容不是确定性的具体的策略,而是在一些策略中随机选择的概率分布,这样的决策我们称为“混合策略”。34双方都按照上述概率随机选择策略,即在本博弈中,博弈35定义在博弈 中;博弈方i的策略空间为 ,则博弃方i以概率分布 随机在其k个可选策略中选择的“策略”,称为一个“混合策略”,其中 都成立,且35定义在博弈36相对于这种以一定概率分布在一些策略中随机选择的混合策略,确定性的具体的策略我们称为“纯策略”,而我们原来意义上的纳什均衡,即任何博弈方都不愿单独改变策略的纯策略组成的策略组合现在可称为“纯策略纳什均衡”。当然,纯策略也可以看作混合策略的特例。36相对于这种以一定概率分布在一些策略中随机选择的混合策37纯策略可以看作,选择相应纯策略的概率为1,选择其余纯策略的概率为0的混合策略。混合策略可以看作纯策略的扩展。37纯策略可以看作,选择相应纯策略的概率为1,选择其余38引进了混合策略的概念以后,我们可将纳什均衡的概念扩大到包括混合策略的情况。对各博弈方的一个策略组合,不管它是纯策略组成的还是混合策略组成的,只要满足各博弈方都不会想要单独偏离它,我们就称之为一个纳纳什什均均衡衡。如果确实是一个严格意义上的混合策略组合构成的纳什均衡,称为“混混合合策策略略纳纳什什均均衡衡”。38引进了混合策略的概念以后,我们可将纳什均衡的概念扩大39猜硬币博弈中两博弈方都以(1/2,1/2)的概率分布随机选择正面和反面的混合策略组合,就是一个混合策略纳什均衡。期望得益:零和博弈!39猜硬币博弈中两博弈方都以(1/2,1/2)的概率分40应用例子40应用例子41本博弈中两博弈方决策的第一个原则是不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性。第二个原则是他们选择每种策略的概率一定要恰好使对方无机可乘。41本博弈中两博弈方决策的第一个原则是不能让对方知道或猜42设博弈方1选A的概率为pA,选B的概率为pB,博弃方2选C的概率为pC,选D的概率为pD。根据上述第二个原则,博弈方1选A和B的概率,一定要使博弈方2选C的期望得益和选D的期望得益相等,即:这是博弈方1的混合策略。42设博弈方1选A的概率为pA,选B的概率为pB,博弃方43同理,博弈方2的混合策略为博弈方1以(0.8,0.2)的概率随机选择A和B,博弈方2以(0.8,0.2)的概率随机选择C和D,由于这时谁都无法通过改变自己的混合策略(概率分布)而改善自己的得益(期望得益)、因此这样的混合策略组合是稳定的,是一个混合策略纳什均衡。43同理,博弈方2的混合策略为44该混合策略纳什均衡的期望结果(即双方的期望得益)分别为:44该混合策略纳什均衡的期望结果(即双方的期望得益)分别为45虽然单独一次博弈的结果可能是四组得益中的任何一组但是多次独立重复博弈的平均结果却应该是双方各得2.6。45虽然单独一次博弈的结果可能是四组得益中的任何一组但46混合策略和混合策略均衡的概念不仅可用在不存在纯策略纳什均衡的博弈问题中(这种问题各博弈方之间的利益总是有一定的对立性),在没有确定性结果的博弈、即存在多个纯策略纳什均衡的博弈(这种博弈中博弈方之间的利益有相当的一致性)中也可运用。46混合策略和混合策略均衡的概念不仅可用在不存在纯策略纳
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!