博弈中纯策略纳什均衡点课件

上传人:2127513****773577... 文档编号:240894501 上传时间:2024-05-16 格式:PPT 页数:163 大小:2.08MB
返回 下载 相关 举报
博弈中纯策略纳什均衡点课件_第1页
第1页 / 共163页
博弈中纯策略纳什均衡点课件_第2页
第2页 / 共163页
博弈中纯策略纳什均衡点课件_第3页
第3页 / 共163页
点击查看更多>>
资源描述
博弈论及其应用博弈论及其应用第2章 纳什均衡博弈论及其应用第2章 纳什均衡1博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)2主要内容:主要内容:2.1 2.1 基本概念基本概念 2.2 2.2 纳什均衡纳什均衡 2.3 2.3 混合策略纳什均衡混合策略纳什均衡 2.4 2.4 矩阵博弈矩阵博弈第2章 纳什均衡博弈论及其应用(汪贤裕)2主要内容:第2章 纳什2博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)32.1 基本概念 2.1.1 2.1.1 基本概念基本概念 2.1.2 2.1.2 占优均衡占优均衡 博弈论及其应用(汪贤裕)32.1 基本概念 23博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)42.1.1 基本概念 例例2.1.1 2.1.1 智猪博弈智猪博弈 例例2.1.2 2.1.2 夫妻爱好问题夫妻爱好问题 例例2.1.3 2.1.3 猜钱币游戏猜钱币游戏 完全信息静态博弈的三个基本要素完全信息静态博弈的三个基本要素 博弈论及其应用(汪贤裕)42.1.1 基本概念 4博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)5智猪博弈 猪圈里有两头猪,一头大猪,一头小猪。猪猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有一个食槽,另一边安装一个控制按圈的一边有一个食槽,另一边安装一个控制按钮,它能控制食料的供应。按一下按钮有钮,它能控制食料的供应。按一下按钮有8 8个个单位的食料进入猪食槽,但需要支付单位的食料进入猪食槽,但需要支付2 2个单位个单位的劳动成本。在吃食的过程中,若大猪先到,的劳动成本。在吃食的过程中,若大猪先到,大猪能吃大猪能吃7 7个单位的食料,小猪只能吃个单位的食料,小猪只能吃1 1个单位。个单位。若小猪先到,小猪能吃到若小猪先到,小猪能吃到4 4个单位的食料,大个单位的食料,大猪只能吃猪只能吃4 4个单位。若两只猪同时到,大猪吃个单位。若两只猪同时到,大猪吃5 5个单位,小猪吃个单位,小猪吃3 3个单位的食料。大猪和小猪个单位的食料。大猪和小猪都有两个策略,按或等待。都有两个策略,按或等待。博弈论及其应用(汪贤裕)5智猪博弈 猪圈里有两头5博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)6智猪博弈(续)两只猪在不同策略下的支付矩阵:两只猪在不同策略下的支付矩阵:大猪和小猪分别采取什么样的策略,且各自的收益分别为多少大猪和小猪分别采取什么样的策略,且各自的收益分别为多少?博弈论及其应用(汪贤裕)6智猪博弈(续)两只猪在不同策6博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)7夫妻爱好问题 OROR博弈论及其应用(汪贤裕)7夫妻爱好问题 7博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)8猜钱币游戏博弈论及其应用(汪贤裕)8猜钱币游戏8博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)9完全信息静态博弈三要素 局中人集合局中人集合 局中人集合即博弈参加人的集合。若给定局中人局中人集合即博弈参加人的集合。若给定局中人 ,则记,则记 策略集策略集 每个局中人每个局中人 有一个策略集有一个策略集S Si i ,策略集,策略集S Si i ,可以是有限集,也可以是有限集,也可以是无限集,当策略集是有限集时,我们记:可以是无限集,当策略集是有限集时,我们记:当每个局中人当每个局中人 选定一个策略选定一个策略s si i 后,形成一个策略组合后,形成一个策略组合 ,并称为一,并称为一个局势,记为:个局势,记为:我们也引入如下记号:我们也引入如下记号:显然,显然,也是一个局势,且也是一个局势,且 。支付函数支付函数 每个局中人有一个支付函数。是局势每个局中人有一个支付函数。是局势 s 的函数,是局中人在局势下的函数,是局中人在局势下所能得到的收益。当然,每个局中人都希望自己的尽可能大。所能得到的收益。当然,每个局中人都希望自己的尽可能大。博弈论及其应用(汪贤裕)9完全信息静态博弈三要素 局中9完全信息静态博弈三要素 完全信息静态博弈就是在上述三要素的基础上,分完全信息静态博弈就是在上述三要素的基础上,分 析各局中人为实现自身利益最大化的策略行为分析。析各局中人为实现自身利益最大化的策略行为分析。简记为简记为:博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)10完全信息静态博弈三要素 完全信息静态博弈就是在上述三要素的基10博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)112.1.2 占优均衡 定义定义2.1.1 2.1.1 严格占优策略严格占优策略 定义定义2.1.2 2.1.2 占优均衡占优均衡 定义定义2.1.3 2.1.3 重复剔除占优均衡重复剔除占优均衡 博弈论及其应用(汪贤裕)112.1.2 占优均衡 11博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)12定义2.1.1 严格占优策略 在博弈在博弈 中,若中,若 和和 是局中人是局中人 的两个的两个策略,对任意策略组合策略,对任意策略组合 都有:都有:(2.1.12.1.1)则称,局中人)则称,局中人 的策略的策略 严格占优策略严格占优策略 ,或称策略,或称策略 相对于相对于 是是严格劣策略严格劣策略。囚徒困境中、囚徒困境中、犯罪嫌疑人犯罪嫌疑人A A和和B B策略(承认)就是一个严策略(承认)就是一个严格占优策略。格占优策略。博弈论及其应用(汪贤裕)12定义2.1.1 严格占12博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)13定义2.1.2 占优均衡 在博弈在博弈 中,若每一个局中人中,若每一个局中人 都存在一个策略都存在一个策略 ,使得,使得 占优于占优于 中任何策略,那么策略组合中任何策略,那么策略组合 称为称为 的占优策略均衡,简称的占优策略均衡,简称占优均衡占优均衡。对应的。对应的 称为称为占优均衡结果占优均衡结果。博弈论及其应用(汪贤裕)13定义2.1.2 占优均衡13博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)14定义2.1.2 占优均衡(续)囚徒困境中严格占优均衡:囚徒困境中严格占优均衡:(承认,承认)(承认,承认)均衡结果博弈论及其应用(汪贤裕)14定义2.1.2 占优均衡14博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)15定义2.1.3 重复剔除占优均衡 在博弈在博弈 中,经过重复剔出严格劣策略后,中,经过重复剔出严格劣策略后,每个局中人每个局中人 只剩下一个唯一的策略:只剩下一个唯一的策略:那么,策略组合那么,策略组合 称为博弈称为博弈 的的重复剔除重复剔除占优均衡。占优均衡。对应对应 称为称为 的的重复剔除占优均衡结果重复剔除占优均衡结果。博弈论及其应用(汪贤裕)15定义2.1.3 重复剔除15博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)16定义2.1.3 重复剔除占优均衡(续)智猪博弈中重复剔除占优均衡智猪博弈中重复剔除占优均衡:(按,不按)(按,不按)均衡结果博弈论及其应用(汪贤裕)16定义2.1.3 重复剔除16博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)172.2 纳什均衡 2.2.1 2.2.1 纯策略纳什均衡纯策略纳什均衡 2.2.2 2.2.2 双矩阵博弈的划线法双矩阵博弈的划线法 2.2.3 2.2.3 无限策略的纯策略纳什均衡无限策略的纯策略纳什均衡博弈论及其应用(汪贤裕)172.2 纳什均衡 17博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)182.2.1 纯策略纳什均衡 定义定义2.2.1 2.2.1 纯策略纳什均衡点和均衡结果纯策略纳什均衡点和均衡结果 定理定理2.2.1 2.2.1 重复剔除占优均衡与纯策略纳什重复剔除占优均衡与纯策略纳什均衡均衡 纳什均衡点与多目标规划求解比较博弈论及其应用(汪贤裕)182.2.1 纯策略纳什均18博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)19纯策略纳什均衡点和结果 定义定义2.2.12.2.1 在在 人非合作博弈人非合作博弈 中,中,若有策略组合若有策略组合 ,使得每一个,使得每一个 ,对任意,对任意 都有都有 (2.2.12.2.1)则称则称 是是 的一个的一个纯策略纳什均衡点纯策略纳什均衡点,对应的,对应的 称为对应的称为对应的均衡结果。均衡结果。博弈论及其应用(汪贤裕)19纯策略纳什均衡点和结果 19博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)20纯策略纳什均衡点和结果 夫妻爱好博弈中纯策略纳什均衡点:夫妻爱好博弈中纯策略纳什均衡点:(足球,看足球)(足球,看足球)&(看芭蕾,看芭蕾)(看芭蕾,看芭蕾)均衡结果均衡结果博弈论及其应用(汪贤裕)20纯策略纳什均衡点和结果 20博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)21纯策略纳什均衡点和结果(续)猜钱币游戏中不存在纯策略纳什均衡点猜钱币游戏中不存在纯策略纳什均衡点。博弈论及其应用(汪贤裕)21纯策略纳什均衡点和结果(续21博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)22定理2.2.1 在在 人非合作博弈人非合作博弈 中:中:若,若,是是重复剔除占优均衡重复剔除占优均衡,则则 一定是一定是纯策略纳什均衡点纯策略纳什均衡点。博弈论及其应用(汪贤裕)22定理2.2.1 22博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)23定理2.2.1的证明证明:证明:用用反证法反证法。若若 是重复剔除占优均衡,但不是纯策略纳什均衡点。则有是重复剔除占优均衡,但不是纯策略纳什均衡点。则有 和和 ,使得使得 (2.2.22.2.2)那么在局中人那么在局中人 在对在对 的剔除过程中应有对任意的策略组合的剔除过程中应有对任意的策略组合 满足满足(2.2.12.2.1)式。这里策略组合当然也包括)式。这里策略组合当然也包括 ,即,即 因此(因此(2.2.22.2.2)式是不可能出现的,即()式是不可能出现的,即(2.2.22.2.2)式与剔除严格劣策略过程)式与剔除严格劣策略过程矛盾。矛盾。从而定理从而定理2.2.12.2.1成立。成立。博弈论及其应用(汪贤裕)23定理2.2.1的证明证明:23博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)24纳什均衡点与多目标规划求解比较在在n n人非合作博弈人非合作博弈 中,对每一个局中人中,对每一个局中人 ,都在,都在寻找自己的策略寻找自己的策略 使得自己的收益使得自己的收益 最大,但是局中最大,但是局中人人 单方面不能找到自己的最佳策略,其结果是相互影响的,是单方面不能找到自己的最佳策略,其结果是相互影响的,是由策略组合由策略组合 决定的。这就是一个有相互影响的多人决定的。这就是一个有相互影响的多人决策问题。有人可能这样设想:是否有一个局外人,将决策问题。有人可能这样设想:是否有一个局外人,将 个局中个局中人的收益最大作为人的收益最大作为 个目标的个目标的多目标规划问题多目标规划问题,即求:,即求:(2.2.32.2.3)纳什均衡点和上面的(纳什均衡点和上面的(2.2.32.2.3)的多目标规划的求解是两个不同)的多目标规划的求解是两个不同的概念。的概念。博弈论及其应用(汪贤裕)24纳什均衡点与多目标规划求解24博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)25纳什均衡点与多目标规划求解比较(续)囚犯困境是一个囚犯困境是一个2 2人非合作博弈人非合作博弈 两个局中人策略集两个局中人策略集 和支付和支付 函数函数 都表示在表都表示在表1.2.11.2.1中中图图2.2.1 2.2.1 囚犯困境中的局中人囚犯困境中的局中人 收益图收益图以囚徒困境为例以囚徒困境为例博弈论及其应用(汪贤裕)25纳什均衡点与多目标规划求解25博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)26纳什均衡点与多目标规划求解比较(续)各点代表不同策略组合下双方的收益:各点代表不同策略组合下双方的收益:A A点对应策略组合(承认,承认)点对应策略组合(承认,承认)B B点对应策略组合(承认,不承认)点对应策略组合(承认,不承认)C C点对应策略组合(不承认,不承认)点对应策略组合(不承认,不承认)D D点对应策略组合(不承认,承认)点对应策略组合(不承认,承认)B B点、点、C C点和点和D D点所代表的策略组合点所代表的策略组合 都是单人决策的多目标规划(都是单人决策的多目标规划(2.2.32.2.3)中的非劣解。中的非劣解。但策略组合(承认,承认)是唯一的纳什均衡点。但策略组合(承认,承认)是唯一的纳什均衡点。博弈论及其应用(汪贤裕)26纳什均衡点与多目标规划求解26博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)27纳什均衡点与多目标规划求解比较(续)结论:结论:(一)非合作博弈中的纳什均衡点,不可能用(一)非合作博弈中的纳什均衡点,不可能用(2.2.32.2.3)表示的多目标规划作为替代,双方有不同)表示的多目标规划作为替代,双方有不同的思想基础。的思想基础。(二)博弈论与多目标规划这类多人决策问题的(二)博弈论与多目标规划这类多人决策问题的差异,进一步显示出纳什均衡思想在博弈论中的差异,进一步显示出纳什均衡思想在博弈论中的重要地位。重要地位。博弈论及其应用(汪贤裕)27纳什均衡点与多目标规划求解27博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)282.2.2 双矩阵博弈的划线法 双矩阵博弈的定义双矩阵博弈的定义 纯策略纳什均衡的简单求解方法纯策略纳什均衡的简单求解方法划线法划线法 定理定理2.2.2 2.2.2 划线法与纯策略纳什均衡划线法与纯策略纳什均衡博弈论及其应用(汪贤裕)282.2.2 双矩阵博弈的28博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)29双矩阵博弈的定义在博弈中,若三要素的前两个要素满足:在博弈中,若三要素的前两个要素满足:只有只有两个局中人两个局中人,即,即 ;策略集有限策略集有限,即,即 ,此类博弈我们称为此类博弈我们称为双矩阵博弈双矩阵博弈。博弈论及其应用(汪贤裕)29双矩阵博弈的定义在博弈中,29双矩阵博弈称呼的由来(补充1)在双矩阵博弈中,对任意策略组合在双矩阵博弈中,对任意策略组合 ,记支付,记支付函数函数 ,将两个局中人的支付函数,将两个局中人的支付函数分别记为矩阵分别记为矩阵A A和矩阵和矩阵B B如下:如下:博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)30双矩阵博弈称呼的由来(补充1)在双矩阵博弈中,对30博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)31双矩阵博弈称呼的由来(补充2)(2.2.4)回到:划线法 定理2.2.2博弈论及其应用(汪贤裕)31双矩阵博弈称呼的由来(补充31划线法 (1)(1)对局中人对局中人1 1,在(,在(2.2.42.2.4)式)式 的每一行的每一行 中,找出对中,找出对方支付矩阵方支付矩阵B B中该行的最大元素中该行的最大元素 ,即即 并在并在 下划线。当下划线。当 不唯一时,均在下面划线。不唯一时,均在下面划线。(2)(2)对局中人对局中人2 2,在(,在(2.2.42.2.4)式每一列)式每一列 中,找出对方支付中,找出对方支付矩阵矩阵A A中该列的最大元素中该列的最大元素 即即 并在并在 下划线。当下划线。当 不唯一时,均在下面划线。不唯一时,均在下面划线。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)32划线法 对局中人1,在(2.2.4)式 的每一行 32划线法(续)(3)(3)若存在一对若存在一对 ,使得其两个元素,使得其两个元素 和和 下面都有划线,则下面都有划线,则 是纯策略纳什均衡点,是纯策略纳什均衡点,和和 是对应的纳什均衡结果。是对应的纳什均衡结果。(4)(4)若不存在满足(若不存在满足(3 3)的数对,则该博弈无纯策略)的数对,则该博弈无纯策略纳什均衡。纳什均衡。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)33划线法(续)若存在一对 ,使得其两个元素 33博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)34定理2.2.2 在双矩阵博弈在双矩阵博弈 中划线法的使用:中划线法的使用:(1)(1)若若 和和 同时得到划线,则同时得到划线,则 一定是一定是 的纯策略纳什均衡点。的纯策略纳什均衡点。(2)(2)若不存在能够同时得到划线的数对,则若不存在能够同时得到划线的数对,则 无纯无纯策略纳什均衡点。策略纳什均衡点。博弈论及其应用(汪贤裕)34定理2.2.2 在双矩阵博34博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)35定理2.2.2的证明设设 和和 都得到划线,则下面两式同时成立:都得到划线,则下面两式同时成立:(2.2.52.2.5)(2.2.62.2.6)是博弈的是博弈的纯策略纳什均衡点纯策略纳什均衡点。若不存在同时得到划线的数对,即不存在若不存在同时得到划线的数对,即不存在 同时满足同时满足(2.2.52.2.5)和()和(2.2.62.2.6)式,则博弈)式,则博弈 也就不存在纯策略纳也就不存在纯策略纳什均衡点。什均衡点。博弈论及其应用(汪贤裕)35定理2.2.2的证明设 35博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)362.2.3无限策略的纯策略纳什均衡 定理定理2.2.3 2.2.3 无限纯策略纳什均衡点存在性定理无限纯策略纳什均衡点存在性定理 无限策略纳什均衡点的求解思路无限策略纳什均衡点的求解思路 例例2.2.2 2.2.2 古诺模型古诺模型 例例2.2.3 2.2.3 伯川德双寡头垄断模型伯川德双寡头垄断模型 例例2.2.4 2.2.4 公共地的悲剧公共地的悲剧 例例2.2.5 2.2.5 豪泰林价格竞争模型豪泰林价格竞争模型博弈论及其应用(汪贤裕)362.2.3无限策略的纯策36博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)37定理2.2.3 在博弈在博弈 中,若局中人中,若局中人 的策略集的策略集 是有界闭区域,支付函数是有界闭区域,支付函数 对任意对任意 都是都是 的拟凹连续函数,则博弈的拟凹连续函数,则博弈 一定存在有纯策略纳什均衡点。一定存在有纯策略纳什均衡点。注:严格拟凹函数定义点击注:严格拟凹函数定义点击 博弈论及其应用(汪贤裕)37定理2.2.3 在博弈37博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)38严格拟凹函数定义 设设 是凸集是凸集 上的函数,对任意上的函数,对任意 及任意及任意 ,若有:,若有:(2.2.82.2.8)则则 为为 上的上的拟凹函数拟凹函数。若(若(2.2.82.2.8)式中不等号为严格不等号,则称)式中不等号为严格不等号,则称 为为 上的上的严格拟凹函数严格拟凹函数。博弈论及其应用(汪贤裕)38严格拟凹函数定义 设38无限策略纳什均衡点的求解思路当局中人当局中人 的收益函数的收益函数 都是都是 上的连续可微上的连续可微严格拟凹函数时,每个局中人都有一个最优反映函数严格拟凹函数时,每个局中人都有一个最优反映函数(点击(点击 )组成含)组成含 个未知数的个未知数的 个方程的方程组:个方程的方程组:(2.2.112.2.11)求解(求解(2.2.112.2.11)式得到博弈)式得到博弈 的一个纯策略纳什均衡点的一个纯策略纳什均衡点 注:博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)39无限策略纳什均衡点的求解思路当局中人 的收益函数 39博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)40反应函数的定义和求解 设设 是定义是定义2.2.22.2.2规定下的拟凹函数,有:规定下的拟凹函数,有:(2.2.9)称称 为局中人为局中人 在在 上最优的上最优的反应函数反应函数 博弈论及其应用(汪贤裕)40反应函数的定义和求解 40反应函数的定义和求解 当当 对任意对任意 是是 上的严格的拟凹函数时,上的严格的拟凹函数时,即只有一个元素。这时,最优反应函数为,即只有一个元素。这时,最优反应函数为:(2.2.10)若若 在闭区间在闭区间 上连续可微且对任上连续可微且对任意意 是严格拟凹函数,则令是严格拟凹函数,则令 可得最优反应可得最优反应函数:函数:博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)41反应函数的定义和求解 当 对任41博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)42例2.2.2 古诺模型 设市场有设市场有1 1、2 2两个寡头厂商,生产并销售同一两个寡头厂商,生产并销售同一种产品。厂商种产品。厂商1 1、2 2生产商品的数量分别为生产商品的数量分别为 和和 ,他们有,他们有不同的不变边际成本,分别为不同的不变边际成本,分别为 和和 ,无固定成本。市,无固定成本。市场的逆需求函数为场的逆需求函数为 一个正常数,即该产品的市场最高价格且一个正常数,即该产品的市场最高价格且 。市场需求情况和两厂商的成。市场需求情况和两厂商的成本和收益确定都是共同知识。两个厂商事前没有任何协本和收益确定都是共同知识。两个厂商事前没有任何协议和约定,同时分别决定生产的产量,以追求市场的最议和约定,同时分别决定生产的产量,以追求市场的最大利润(设厂商的生产产量没有限制,但大利润(设厂商的生产产量没有限制,但 )。)。博弈论及其应用(汪贤裕)42例2.2.2 古诺模型 42例2.2.2 古诺模型(续)该博弈中局中人为两个厂商,生产数量是他们的策略,该博弈中局中人为两个厂商,生产数量是他们的策略,即即 。厂商各自的利润函数:。厂商各自的利润函数:(2.2.122.2.12)(2.2.132.2.13)由(由(2.2.122.2.12)和()和(2.2.132.2.13)式可知,)式可知,对任何对任何 都是都是 的严格连续凹函数,的严格连续凹函数,对任何对任何 都是都是 的严格连的严格连续凹函数。续凹函数。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)43例2.2.2 古诺模型(续)该博弈中局中人为两个厂商,43博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)44例2.2.2 古诺模型(续)两个厂商都来确定产量以追求最大利润可以表示成:两个厂商都来确定产量以追求最大利润可以表示成:求求 和和 ,并且令,并且令 和和 有:有:(2.2.14)(2.2.15)博弈论及其应用(汪贤裕)44例2.2.2 古诺模型(续44例2.2.2 古诺模型(续)求解最优反应函数(求解最优反应函数(2.2.14)和和(2.2.15)组成的方组成的方程组:程组:(2.2.16)(2.2.17)组成该博弈的平衡局势,即纯策略纳什均组成该博弈的平衡局势,即纯策略纳什均衡点。均衡结果,分别为:衡点。均衡结果,分别为:。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)45例2.2.2 古诺模型(续)求解最优反应函数(2.2.45博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)46例2.2.2 古诺模型(续)该博弈的纯策略纳什均衡的意义该博弈的纯策略纳什均衡的意义 以厂商以厂商1 1为例,由为例,由 ,决定以边际利润等于边,决定以边际利润等于边际成本来确定生产量,才是最优的。但边际利润不仅与自己的际成本来确定生产量,才是最优的。但边际利润不仅与自己的产量产量 有关,也受到厂商有关,也受到厂商2 2的产量的产量 的影响。从反应函数可知,的影响。从反应函数可知,要满足边际成本等于边际利润,其产量要满足边际成本等于边际利润,其产量 与对方生产的产量与对方生产的产量 的关系必须满足(的关系必须满足(2.2.142.2.14)式。厂商)式。厂商2 2也是同样的,要满足边际也是同样的,要满足边际成本等于边际利润,其产量成本等于边际利润,其产量 与对方的生产产量必须满足与对方的生产产量必须满足(2.2.152.2.15)式。求解()式。求解(2.2.142.2.14)和()和(2.2.152.2.15)构成了纳什均衡。)构成了纳什均衡。博弈论及其应用(汪贤裕)46例2.2.2 古诺模型(续46博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)47例2.2.2 古诺模型(续)纳什均衡点和多目标规划中解概念的差异 1 以例2.2.2古诺模型为例,将有限策略放宽至无限 2 假设厂商1和厂商2有相同的不变边际成本,即 博弈论及其应用(汪贤裕)47例2.2.2 古诺模型(续47博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)48例2.2.2 古诺模型(续)将古诺模型中两厂商如何取得自己收益最大作为多目标将古诺模型中两厂商如何取得自己收益最大作为多目标规划问题:规划问题:(2.2.18)其中其中 和和 均由(均由(2.2.122.2.12)和()和(2.2.132.2.13)两式确定()两式确定()。)。博弈论及其应用(汪贤裕)48例2.2.2 古诺模型(续48博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)49例2.2.2 古诺模型(续)该多目标规划的非劣解由下图所示的直线段该多目标规划的非劣解由下图所示的直线段ABAB确定:确定:图图2.2.3 2.2.3 古诺模型的纳什均衡与多目标规划的关系古诺模型的纳什均衡与多目标规划的关系博弈论及其应用(汪贤裕)49例2.2.2 古诺模型(续49博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)50例2.2.2 古诺模型(续)上图中上图中D D点表示两厂商均生产点表示两厂商均生产 时双方的时双方的收益。收益。直线直线ABAB的确定的确定 若两厂商由一个垄断集团控制,则最优产量为下若两厂商由一个垄断集团控制,则最优产量为下式的最优解:式的最优解:博弈论及其应用(汪贤裕)50例2.2.2 古诺模型(续50博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)51例2.2.2 古诺模型(续)取取 ,求解上式,则当,求解上式,则当 时,时,有最值有最值 。也就是说,当厂商。也就是说,当厂商1 1采取策略采取策略 ,厂商,厂商2 2采取采取 ,而,而 时,厂商时,厂商1 1的收益的收益 和厂商和厂商2 2的收益的收益 满足满足 。这样,厂商。这样,厂商1 1和和厂商厂商2 2的收益的帕累托边界为直线段的收益的帕累托边界为直线段ABAB。对应多目标规。对应多目标规划(划(2.2.182.2.18)的非劣解为:)的非劣解为:,博弈论及其应用(汪贤裕)51例2.2.2 古诺模型(续51博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)52例2.2.2 古诺模型(续)多目标规划(多目标规划(2.2.182.2.18)的任何满意解都是依一定的)的任何满意解都是依一定的法则在非劣解中寻求满意解。而此时古诺模型的纳什均法则在非劣解中寻求满意解。而此时古诺模型的纳什均衡为:衡为:对应的收益为图对应的收益为图2.2.32.2.3的的C C点,即两厂商的收益点,即两厂商的收益分别是分别是 。纳什均衡点。纳什均衡点 是多是多目标规划(目标规划(2.2.182.2.18)中的劣解。)中的劣解。博弈论及其应用(汪贤裕)52例2.2.2 古诺模型(续52博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)53例2.2.2 古诺模型(续)结论结论 在策略集为无限时,纳什均衡点仍然不是多目标规在策略集为无限时,纳什均衡点仍然不是多目标规划中的非劣解。划中的非劣解。纳什均衡与多目标规划存在不同,是不可混淆的。纳什均衡与多目标规划存在不同,是不可混淆的。造成这种差别的原因在于,纳什均衡是多人决策,而多造成这种差别的原因在于,纳什均衡是多人决策,而多目标规划是单人决策。目标规划是单人决策。博弈论的一个最显著特征:博弈论的一个最显著特征:竞争环境下的多人决策竞争环境下的多人决策。博弈论及其应用(汪贤裕)53例2.2.2 古诺模型(续53博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)54伯川德双寡头垄断模型 考虑市场上有两个寡头厂商生产同一类型产品。考虑市场上有两个寡头厂商生产同一类型产品。厂商厂商1 1和厂商和厂商2 2分别选择价格分别选择价格 和和 。消费者对企业的产。消费者对企业的产品的需求为:品的需求为:其中其中0b1,即只限于企业,即只限于企业 的产品和企业的产品和企业 产品具有相互产品具有相互替代的情况。企业生产没有固定成本,并且边际成本为替代的情况。企业生产没有固定成本,并且边际成本为常数常数 ,。两个企业同时进行价格选择行动。另外企业两个企业同时进行价格选择行动。另外企业 的的策略策略 是所选价格是所选价格 ,也即每个企业的策略集,也即每个企业的策略集 。博弈论及其应用(汪贤裕)54伯川德双寡头垄断模型 54伯川德双寡头垄断模型(续)企业企业 选择价格选择价格 ,对手,对手 选择价格选择价格 ,企业的利润为:,企业的利润为:(2.2.20)对于企业对于企业1 1来说,若企业来说,若企业2 2选定的价格为选定的价格为 ,它确定自,它确定自己的价格己的价格 以追求最大利润以追求最大利润 对企业对企业1 1求求 并且令并且令 解得:解得:(2.2.21)博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)55伯川德双寡头垄断模型(续)企业 选择价格 55博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)56 伯川德双寡头垄断模型(续)同理,可得企业同理,可得企业2 2的最优价格的最优价格 (2.2.22)联立联立(2.2.21)(2.2.22)解方程组得:解方程组得:(2.2.23)均衡结果为:均衡结果为:(2.2.24)博弈论及其应用(汪贤裕)56 伯川德双寡头垄断模56博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)57例2.2.4 公共地的悲剧 考虑有相同情况的考虑有相同情况的 个牧民组成的某个牧民村,他们共同拥有一个牧民组成的某个牧民村,他们共同拥有一片草地。每年所有的牧民都会在共同的草地上放牧养羊。用片草地。每年所有的牧民都会在共同的草地上放牧养羊。用 表示牧表示牧民民 养羊的头数,则牧民村的养羊总头数为养羊的头数,则牧民村的养羊总头数为 。购。购买羊崽和照看一只羊的成本为买羊崽和照看一只羊的成本为c c,c c不随某一牧民拥有羊的树目的多少不随某一牧民拥有羊的树目的多少而变化。当草地上的羊的总头数为而变化。当草地上的羊的总头数为 时,牧民养的一只羊的价值为时,牧民养的一只羊的价值为 ,设,设 。当草地上羊的总头数。当草地上羊的总头数 较少时,每只羊有相对较多的较少时,每只羊有相对较多的空间,每只羊能吃到的草也丰盛些。而羊的总数空间,每只羊能吃到的草也丰盛些。而羊的总数 增加时,则正好相增加时,则正好相反,每只羊相对能吃到的草相对较少。并有当羊群总数反,每只羊相对能吃到的草相对较少。并有当羊群总数 达到一个极达到一个极限限 时,再增加一只羊将对已经牧养的羊带来损害。对一只羊的价时,再增加一只羊将对已经牧养的羊带来损害。对一只羊的价值值 的上述特征用公式表示,则为的上述特征用公式表示,则为:,。(2.2.25)博弈论及其应用(汪贤裕)57例2.2.4 公共地的悲剧57博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)58例2.2.4 公共地的悲剧(续)每年春天,每年春天,个牧民同时分别选择牧养羊的数量。假设其个牧民同时分别选择牧养羊的数量。假设其是连续的可分割的。牧民是连续的可分割的。牧民 的策略是选择在公共草地上牧养羊的策略是选择在公共草地上牧养羊的数量的数量 ,并有策略集,并有策略集 。当其他村民养羊。当其他村民养羊数为数为 时,牧民时,牧民 牧养牧养 只羊获得的收只羊获得的收益为:益为:现在要讨论的问题是:牧民现在要讨论的问题是:牧民 如何决定自己的牧养羊数如何决定自己的牧养羊数 ,以获得自己的最大收益,以获得自己的最大收益。(2.2.26)博弈论及其应用(汪贤裕)58例2.2.4 公共地的悲剧58博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)59例2.2.4 公共地的悲剧(续)这构成了一个这构成了一个 人非合作博弈的问题,需要求平衡局势,人非合作博弈的问题,需要求平衡局势,即纳什均衡。很明显,即纳什均衡。很明显,在任何在任何 时,都是时,都是 的凹函数。计的凹函数。计算算 并且并且令 ,得到:,得到:当当 是一个已知函数时,求解由上式给出的是一个已知函数时,求解由上式给出的 个方程和个方程和 个未知数,可以求得该体系的纯策略纳什均衡点,即平衡局个未知数,可以求得该体系的纯策略纳什均衡点,即平衡局势势 再代回到(再代回到(2.2.262.2.26)式,则有纳什均衡结果)式,则有纳什均衡结果。(2.2.27)博弈论及其应用(汪贤裕)59例2.2.4 公共地的悲剧59博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)60例2.2.4 公共地的悲剧(续)公共地的悲剧的意义公共地的悲剧的意义 将上面的将上面的 人非合作博弈的牧养羊纳什均衡结果与草地在非公共地的情况下,即人非合作博弈的牧养羊纳什均衡结果与草地在非公共地的情况下,即由社会计划管理者进行管理作对比研究。由社会计划管理者进行管理作对比研究。在在 个牧民分散独立决策牧养羊情况下,设个牧民分散独立决策牧养羊情况下,设 是第是第 个牧民的养羊数个牧民的养羊数 最优决策,最优决策,。由于。由于 个牧民是相同情况个牧民是相同情况,则则:令令 ,则由(,则由(2.2.272.2.27)式得:)式得:再将(再将(2.2.282.2.28)的)的 个方程加总,有:个方程加总,有:(2.2.29)(2.2.28)博弈论及其应用(汪贤裕)60例2.2.4 公共地的悲剧60博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)61例2.2.4 公共地的悲剧(续)若草地是由社会计划者管理,社会计划者选择草地的最优牧养量是若草地是由社会计划者管理,社会计划者选择草地的最优牧养量是 ,则,则 应该是下式的解:应该是下式的解:若上式的最优解为若上式的最优解为 ,则,则 应满足应满足 (边际收益等于边际成本),(边际收益等于边际成本),即:即:比较(比较(2.2.292.2.29)式和()式和(2.2.312.2.31)式,下面我们证明)式,下面我们证明 。由式(由式(2.2.292.2.29)和()和(2.2.312.2.31)式有:)式有:(2.2.30)(2.2.31)(2.2.32)博弈论及其应用(汪贤裕)61例2.2.4 公共地的悲剧61博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)62例2.2.4 公共地的悲剧(续)令令 由(由(2.2.322.2.32)式和()式和(2.2.252.2.25)式有:)式有:由(由(2.2.332.2.33)式和()式和(2.2.252.2.25)式得:)式得:由(由(2.2.342.2.34)和()和(2.2.352.2.35)有:)有:(2.2.33)(2.2.34)(2.2.35)(2.2.36)由于由于 个牧民是对称的,则他们分散养羊的总收益为:个牧民是对称的,则他们分散养羊的总收益为:,而社会计划管理者的养羊带来的总收益为,而社会计划管理者的养羊带来的总收益为:。博弈论及其应用(汪贤裕)62例2.2.4 公共地的悲剧62博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)63例2.2.4 公共地的悲剧(续)由于由于 是(是(2.2.302.2.30)式的最优解,则必有)式的最优解,则必有:(2.2.362.2.36)式表明,在均衡点时,)式表明,在均衡点时,个牧民牧养羊的个牧民牧养羊的总数超过社会最优条件下的牧养总数。并由(总数超过社会最优条件下的牧养总数。并由(2.2.372.2.37)式,式,个牧民养羊的总收益低于社会计划管理者的总收个牧民养羊的总收益低于社会计划管理者的总收益。由于每个牧民都只考虑自己的利益,并不管其行为益。由于每个牧民都只考虑自己的利益,并不管其行为对其他牧民带来的影响,致使公共草地被过度使用,并对其他牧民带来的影响,致使公共草地被过度使用,并且得不偿失。这就是经济学中的且得不偿失。这就是经济学中的“公共地的悲剧公共地的悲剧”。(2.2.37)博弈论及其应用(汪贤裕)63例2.2.4 公共地的悲剧63博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)64例2.2.5 豪泰林价格竞争模型 在古诺特模型中,产品是同质的。但在更多的实际问在古诺特模型中,产品是同质的。但在更多的实际问题中,不同的企业生产的产品是有差异的,替代弹性不题中,不同的企业生产的产品是有差异的,替代弹性不会是无限的,此时消费者对不同的产品有不同的偏好。会是无限的,此时消费者对不同的产品有不同的偏好。考虑产品差异的一种特殊的情况,即考虑产品差异的一种特殊的情况,即空间上的差异空间上的差异豪泰林模型豪泰林模型博弈论及其应用(汪贤裕)64例2.2.5 豪泰林价格64豪泰林价格竞争模型(续)假定有一个长度为假定有一个长度为1 1的线性城市,消费者均匀地分布在的线性城市,消费者均匀地分布在00,11区区间里,其分布函数的密度为间里,其分布函数的密度为1 1。假设有两个商店分别位于城市的。假设有两个商店分别位于城市的两端,商店两端,商店1 1位于处位于处 ,商店,商店2 2位于处位于处 ,他们出售物质,他们出售物质性能相同的产品。每个商店具有相同的单位产品成本为性能相同的产品。每个商店具有相同的单位产品成本为 。消。消费者购买商品的旅行成本与离商店的距离成正比例,单位距离的费者购买商品的旅行成本与离商店的距离成正比例,单位距离的成本为成本为 。所以住在的消费者如果去商店。所以住在的消费者如果去商店1 1去购买,要花费的旅去购买,要花费的旅行成本行成本 ;如果去商店;如果去商店2 2去购买,要花费的旅行成本去购买,要花费的旅行成本 。为方便讨论,再假定消费者都有单位的物质需求,即消费。为方便讨论,再假定消费者都有单位的物质需求,即消费1 1个个单位消费品。另外所有消费者都可能到两家商店购买,即他们都单位消费品。另外所有消费者都可能到两家商店购买,即他们都能获得消费剩余。能获得消费剩余。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)65豪泰林价格竞争模型(续)假定有一个长度为1的线性城市,消65豪泰林价格竞争模型(续)模型的建立模型的建立令令 为商店的商品为商店的商品 的价格的价格 ,商店,商店 的出价,即是它的策略,因而商店的出价,即是它的策略,因而商店 的策略集为的策略集为 ,。商店的收益函数商店的收益函数令令 为需求函数,为需求函数,。那。那么存在一点么存在一点 ,住在,住在 左边的消费者都将到商店左边的消费者都将到商店1 1去去购买,住在购买,住在 右边的消费者都将到商店右边的消费者都将到商店2 2去购买,我去购买,我们说住在们说住在 处的消费者在两个商店之间是无差异的。处的消费者在两个商店之间是无差异的。这里这里 应该满足:应该满足:(2.2.38)博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)66豪泰林价格竞争模型(续)模型的建立令 为商店的商品 66博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)67豪泰林价格竞争模型(续)解(解(2.2.382.2.38)式得需求函数分别为:)式得需求函数分别为:(2.2.39)(2.2.40)两商店利润函数分别为:两商店利润函数分别为:(2.2.41)(2.2.42)博弈论及其应用(汪贤裕)67豪泰林价格竞争模型(续)解67豪泰林价格竞争模型(续)商店选择自己的价格商店选择自己的价格 以最大化自己的利润。以最大化自己的利润。求求 并且令并且令 ,有最优反应函数如下:,有最优反应函数如下:(2.2.43)(2.2.44)(2.2.43)(2.2.44)式联立解方程组得:式联立解方程组得:(2.2.45)博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)68豪泰林价格竞争模型(续)商店选择自己的价格 以最大化自己68博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)69豪泰林价格竞争模型(续)即为纳什均衡点,对应的均衡结即为纳什均衡点,对应的均衡结果,即每个商店的均衡利润为:果,即每个商店的均衡利润为:博弈论及其应用(汪贤裕)69豪泰林价格竞争模型(续)69博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)702.3 混合策略纳什均衡 2.3.1 混合策略纳什均衡 2.3.2 混合策略纳什均衡点的存在性定理 2.3.3 双矩阵博弈的纳什均衡博弈论及其应用(汪贤裕)702.3 混合策略纳什均70博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)712.3.1 混合策略纳什均衡 定义定义2.3.1 2.3.1 混合策略混合策略 混合策略下混合策略下 人非合作博弈三要素人非合作博弈三要素 定义定义2.3.22.3.2混合策略纳什均衡点和均衡结果混合策略纳什均衡点和均衡结果博弈论及其应用(汪贤裕)712.3.1 混合策略纳什71博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)72混合策略的定义 对于每个对于每个 ,局中人,局中人 的纯策略集的纯策略集 。若局中人。若局中人 对每一对每一个纯策略个纯策略 以以 概率概率 进行选择,则进行选择,则 被称为局中人被称为局中人 的一个的一个混合策略混合策略。其中。其中 ,。博弈论及其应用(汪贤裕)72混合策略的定义 72混合策略的定义 局中人局中人 混合策略就是定义在其纯策略集混合策略就是定义在其纯策略集 上的一个上的一个概率分布。概率分布。局中人局中人 的的混合策略集混合策略集记为记为 :(2.3.12.3.1)记记 为博弈为博弈 的一个的一个混合策略组合混合策略组合。博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)73混合策略的定义 局中人 混合策略就是定义在其纯策略73博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)74混合策略下 n 人非合作博弈三要素(1)(1)局中人的集局中人的集 ;(2)(2)每个局中人每个局中人 有一个有一个混合策略的集混合策略的集 其中其中 满足(满足(2.3.12.3.1););(3)(3)每个局中人有一个每个局中人有一个支付函数支付函数 并设并设 是局中人是局中人 的支付函数的支付函数 在混合策略局势在混合策略局势 下得到的期望支付。下得到的期望支付。在在混混合合策策略略的的情情形形下下,一一个个 人人非非合合作作博博弈弈可可以以用用下下面面的的记记号来表示:号来表示:博弈论及其应用(汪贤裕)74混合策略下 n 人非合作博74博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)75混合策略纳什均衡点和均衡结果 设设 是是 人非合作博弈人非合作博弈 的一个混合策略局势。的一个混合策略局势。如果对于每一个如果对于每一个 和每个和每个 ,有,有 :,(2.3.22.3.2)则称则称 是是 (在混合策略下)的一个(在混合策略下)的一个混合策略纳什均衡点混合策略纳什均衡点,为对应的为对应的均衡结果均衡结果。为混合策略为混合策略 下局中人下局中人 的期望收益。的期望收益。博弈论及其应用(汪贤裕)75混合策略纳什均衡点和均衡结75博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)76 2.3.2 混合策略纳什均衡点的存在性定理 定理定理2.3.1 2.3.1 混合策略纳什均衡点的充分必要条件混合策略纳什均衡点的充分必要条件 定理定理2.3.2 2.3.2 混合策略纳什均衡点的存在性混合策略纳什均衡点的存在性博弈论及其应用(汪贤裕)76 2.3.2 混合策略纳76博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)77定理2.3.1 设设 是是 人非合作博弈。人非合作博弈。是是 的一个混的一个混合策略纳什均衡点的充分必要条件是:对于每个局中人合策略纳什均衡点的充分必要条件是:对于每个局中人 和每个纯策略和每个纯策略 ,有,有 (2.3.3)这里这里 是将局中人是将局中人 的混合策略的混合策略 换成一换成一个纯策略个纯策略 后的期望支付。后的期望支付。定理定理2.3.12.3.1证明证明博弈论及其应用(汪贤裕)77定理2.3.1 77博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)78定理2.3.1证明 必要性。必要性。显然成立。显然成立。充分性。充分性。设(设(2.3.32.3.3)式成立,即对于每个)式成立,即对于每个 有有 ,(2.3.4)设设 是局中人是局中人 的任意一个混合策略。(的任意一个混合策略。(2.3.42.3.4)中)中 个不等个不等式两端依次乘以式两端依次乘以 ,得到,得到 ,(2.3.5)对对 从从1 1到到 求和:求和:(2.3.6)(2.3.62.3.6)式中的左端就是)式中的左端就是 ,右端的和式等于,右端的和式等于 1 1。由此可知,由此可知,是是 的混合策略纳什均衡。的混合策略纳什均衡。博弈论及其应用(汪贤裕)78定理2.3.1证明 78博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)79定理2.3.2 每个每个 人非合作博弈人非合作博弈 必有必有混混合策略纳什均衡合策略纳什均衡博弈论及其应用(汪贤裕)79定理2.3.2 79博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)80定理2.3.2证明 证明:设证明:设 是是 的任意混合策略局的任意混合策略局势。对于每个势。对于每个 的每个纯策的每个纯策 ,定义定义 对于每个对于每个 ,定义,定义 (2.3.7)(2.3.8)博弈论及其应用(汪贤裕)80定理2.3.2证明 80博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)81定理2.3.2证明(续)Brouwer Brouwer 不不动点定理:定点定理:定义在有限在有限维欧欧式空式空间紧凸集凸集S S上上从从S S映入其本身的映入其本身的连续映射必有不映射必有不动点点。易知,易知,,所以所以 是局是局 中人中人 的一个混合策略。的一个混合策略。是是 的连续函数,所以的连续函数,所以 是是 的连续函数。根据的连续函数。根据 BrouwerBrouwer 不动点定理,存在不动点定理,存在不动点不动点 ,其中其中 ,使得,使得 (2.3.9)博弈论及其应用(汪贤裕)81定理2.3.2证明(续)81博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)82定理2.3.2证明(续)该不动点就是博弈该不动点就是博弈 的混合策略纳什均衡的证明的混合策略纳什均衡的证明 首先,对于任意的混合策略局势首先,对于任意的混合策略局势 ,每个局中人每个局中人 必有一个纯策略必有一个纯策略 ,使得,使得 ,且,且 因此,对于因此,对于 ,局中人,局中人 的策略的策略 中中必定包含一个必定包含一个 ,使得,使得 ,从而从而 。由(由(2.3.72.3.7)有:)有:。(2.3.10)博弈论及其应用(汪贤裕)82定理2.3.2证明(续)82定理2.3.2证明(续)其中其中 。由此可得。由此可得:。而由而由 的定义,所有的的定义,所有的 都是非负的,所以从上都是非负的,所以从上式可知,对于每个式可知,对于每个 ,。因此根据。因此根据(2.3.72.3.7)式,有)式,有 ,即即 。上式对于每个上式对于每个 成立。由定理成立。由定理2.3.12.3.1可知,可知,是是 的混合策略纳什均衡。的混合策略纳什均衡。对于上述局中人对于上述局中人 的策略的策略 ,由(,由(2.3.92.3.9)式有:)式有:定理2.3.2证明(续)对于上述局中人 的策略83博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)842.3.3 双矩阵博弈的纳什均衡 双矩阵博弈纳什均衡的求解双矩阵博弈纳什均衡的求解 例例2.3.1 2.3.1 含一个参数含一个参数 的的 双矩阵博弈双矩阵博弈 例例2.3.2 2.3.2 小偷与守卫的博弈小偷与守卫的博弈 博弈论及其应用(汪贤裕)842.3.3 84博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)85 双矩阵博弈纳什均衡的求解 存在策略占优时纳什均衡的求解存在策略占优时纳什均衡的求解 不存在策略占优时纳什均衡的求解不存在策略占优时纳什均衡的求解博弈论及其应用(汪贤裕)85 双矩85博弈论及其应用博弈论及其应用(汪贤裕)(汪贤裕)86存在策略占优时纳什均衡的求解 设双矩阵博弈局中人设双矩阵博弈局中人1 1,2 2的支付矩阵分别为的支付矩阵分别为 若若 ,或,或 ,则局中人,则局中人1 1有严格占优策略;有严格占优策略;若若 ,或,或 ,则局中人,则局中人2 2有严格占优策略。有严格占优策略。之后,采用重复剔除法,可得重复剔除占优均衡,之后,采用重复剔除法,可得重复剔除占优均衡,同时求得纳什均衡。同时求得纳什均衡。博弈论及其应用(汪贤裕)86存在策略占优时纳什均衡的求86存在策略占优时纳什均衡的求解 若若 ,则局中人,则局中人1 1的两个策略无差异,的两个策略无差异,
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!