资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2019/1/11,#,2024/11/18,1,6.1,静态贝叶斯博弈和贝叶斯纳什均衡,不完全信息的古诺模型,静态贝叶斯博弈的一般表示,海萨尼转换,贝叶斯纳什均衡,2023/9/1916.1 静态贝叶斯博弈和贝叶斯纳什均衡不,2024/11/18,2,6.1.1,不完全信息的古诺模型,定义:假定在古诺模型中,各个厂商对彼此的得益不是共识的,则该模型称为,“,不完全信息古诺模型,”,。由于模型中的两个厂商在信息方面是不平等,不对称的,因此有时也称其为,“,不对称信息的古诺模型,”,。,2023/9/1926.1.1 不完全信息的古诺模型定义:假,2024/11/18,3,6.1.1,不完全信息的古诺模型,描述:市场需求为,P(Q),a,Q,,其中,Q,为市场总产量,为两厂商产量,q,1,和,q,2,之和,即,Q,q,1,q,2,。厂商,1,的成本函数为,C,1,C,1,(,q,1,),C,1,q,1,,即无固定成本,边际成本为,C,1,,它是两个厂商都清楚的。而厂商,2,的成本函数却只有厂商,2,自己完全清楚,厂商,1,只知道有两种可能性,一种是,C,2,C,2,(,q,2,),C,H,q,2,概率为,另一种是,C,2,C,2,(,q,2,),C,L,q,2,,概率为,1,,而,C,H,C,L,也即,边际成本有高、低两种可能,。,2023/9/1936.1.1 不完全信息的古诺模型 描述,2024/11/18,4,6.1.1,不完全信息的古诺模型,厂商,2,在边际成本是较高的,C,H,时会选择较低的产量,而在边际成本为较低的,C,L,时会选择较高的产量。,厂商,1,在做出自己的产量决策时当然会考虑厂商,2,的这种行为特点。设厂商,1,的最佳产量为,q,1,*,,,厂商,2,的边际成本为,C,H,时的最佳产量为,q,2,*,(,C,H,),边际成本为,C,L,时的最佳产量为,q,2,*,(),根据上面的假设,,q,2,*,(,C,H,)满足下式:,2023/9/1946.1.1 不完全信息的古诺模型,2024/11/18,5,6.1.1,不完全信息的古诺模型,q,2,*,(,C,L,)满足:,q,1,*,满足:,即厂商,2,是在不同边际成本下分别根据,q,1,*,求出使自,己取得最大得益的产量。而厂商,1,则根据,q,2,*,(,C,H,),和,q,2,*,(,C,L,)及它们出现的概率求出使自己获得最,大期望得益的产量。,2023/9/1956.1.1 不完全信息的古诺模型q2*(,2024/11/18,6,6.1.1,不完全信息的古诺模型,上述三个最大值问题的一阶条件为:,解由这三个方程构成的方程组得:,2023/9/1966.1.1 不完全信息的古诺模型上述三个,2024/11/18,7,6.1.1,不完全信息的古诺模型,与完全信息古诺模型比较,完全信息古诺模型中的的产量,2023/9/1976.1.1 不完全信息的古诺模型与完全信,2024/11/18,8,6.1.2,静态贝叶斯博弈的一般表示,完全信息博弈的一般表达式为,为博弈方,i,的策略空间,即他的全体可选策略集合,而 为博弈方,i,的得益函数。在完全信息静态博弈中,一个博弈方的一个策略就是一次选择或一个行为,用 表示博弈方,i,的一个行为,而用 表示他的,行为空间,(全部可能的 构成的集合),则完全信息静态博弈可表达为,其中 为各博弈方都相互知道的,即当 确定后,就随之确定了,并且是公开的信息和知识。,2023/9/1986.1.2 静态贝叶斯博弈的一般表示完全,2024/11/18,9,6.1.2,静态贝叶斯博弈的一般表示,在静态贝叶斯博弈中,关于得益的信息是不公开的,如何表示这种特征呢?,将博弈中某些博弈方对其他博弈方,得益,的不了解,转化,成对这些博弈方,“,类型,”,的不了解,是一种,“,追根溯源,”,的方法。这里的类型是相应的博弈方自己清楚而他人无法肯定的私人内部信息、有关情况或数据等。,2023/9/1996.1.2 静态贝叶斯博弈的一般表示在静,2024/11/18,10,6.1.2,静态贝叶斯博弈的一般表示,用,t,i,表示博弈方,i,的类型,并用,T,i,表示博弈方,i,的,类型空间,(全部可能类型的集合),则 。用,u,i,(,a,1,a,n,t,i,)来表示博弈方,i,在策略组合(,a,1,,,a,n,)下的得益,因为这个得益函数中含有一个反应该博弈方类型的变量,t,i,,并且该变量的取值是博弈方,i,自己知道而其他博弈方并不清楚的,因为正好可以反应静态贝叶斯博弈中的信息不完全的特征。,2023/9/19106.1.2 静态贝叶斯博弈的一般表示用,2024/11/18,11,6.1.2,静态贝叶斯博弈的一般表示,静态贝叶斯博弈的一般表达式为:,G=A,1,,,A,n,;T,1,,,T,n,;u,1,,,u,n,其中,A,i,为博弈方,i,的行为空间(策略空间),,T,i,是博弈方,i,的类型空间,博弈方,i,的得益,u,i,=u,i,(a,1,,,,,a,n,t,i,),为策略组合,(a,1,,,,,a,n,),和类型,t,i,的函数。,2023/9/19116.1.2 静态贝叶斯博弈的一般表示静,2024/11/18,12,6.1.3,海萨尼转换,基本思路:将静态博弈转化为动态博弈,(,1,)假设有一个名为,“,自然,”,的博弈方,0,,该博弈方的作用是先为其他每个博弈方抽取他们的类型,抽取的这些类型构成类型向量,t,(,t,1,,,,,t,n,),其中 ,,i,=1,,,n,。,(,2,),“,自然,”,让每个博弈方知道到自己的类型,但却不让其他博弈方知道。,2023/9/19126.1.3 海萨尼转换基本思路:将静态,2024/11/18,13,6.1.3,海萨尼转换,(,3,)除了,“,自然,”,以外的其他博弈方同时从自己的行为空间中选择行动方案,a,1,,,,,a,n,.,(,4,)除了博弈方,0,即,“,自然,”,以外,其余博弈方各自取得收益,u,i,=u,i,(a,1,,,,,a,n,t,i,),其中,i,=1,2,.,,,n,.,这个博弈就是一个完全但不完美的动态博弈,不过它是带有,同时选择,的。,2023/9/19136.1.3 海萨尼转换(3)除了“自然,2024/11/18,14,6.1.3,海萨尼转换,(,1,)(,4,)所描述的是一个完全但不完美信息的有同时选择的动态博弈。但是,容易看出(,1,)(,4,)表达的博弈问题与一般不完全信息静态博弈,G=A,1,,,A,n,;T,1,T,n,;u,1,,,u,n,所表达的博弈问题是完全一样的。也就是说通过(,1,)和(,2,)引进的,“,自然,”,这个假设的博弈方,0,的行动(随机选择,n,个博弈方的类型),把一个,不完全信息静态博弈,(即静态贝叶斯博弈),转化,成了一个,完全但不完美信息的动态博弈,问题。此即所谓的,“,海萨尼转换,”,。,2023/9/19146.1.3 海萨尼转换(1)(4)所,2024/11/18,15,6.1.4,贝叶斯纳什均衡,定义,:,在静态贝叶斯博弈,中,博弈方,i,的一个策略是该博弈方自己的类型,t,i,的函数,S,i,(t,i,),其中,t,i,属于,T,i,.S,i,(t,i,),设定在自然抽取的博弈方,i,的类型为,t,i,的情况下,博弈方,i,从行动空间,A,i,中所选择的行动,a,i,.,2023/9/19156.1.4 贝叶斯纳什均衡定义:在静态,2024/11/18,16,6.1.4,贝叶斯纳什均衡,定义,:,在静态贝叶斯博弈,中,如果对任意博弈方,i,和他的每一种可能的类型,所选择的行动都能满足,则 就称为一个,(纯策略)贝叶斯纳什均衡,,即博弈中的任何一方都不会单独改变自己策略中的哪怕只是一种类型下的一个行动。,2023/9/19166.1.4 贝叶斯纳什均衡定义:在静,2024/11/18,17,6.2,混合策略和不完全信息,完全信息静态博弈中的混合策略是解决这种类型的博弈中不存在纯策略纳什均衡或存在多个相互没有绝对的优劣之分的纯策略纳什均衡时,相应的博弈方的决策选择问题的,.,海萨尼认为,:,完全信息静态博弈中的一个,混合策略博弈,几乎总是可以被解释为一个,有少量不完全信息的近似博弈的一个纯策略贝叶斯纳什均衡,.,2023/9/19176.2混合策略和不完全信息完全信息静态,2024/11/18,18,6.2,混合策略和不完全信息,例 夫妻之争的不完全信息的,“,近似博弈,”,假设夫妻俩虽然已经共同生,活了很长时间,但他们相互,对对方关于时装表演和足球,赛的喜爱程度并没有彻底的,了解,即相互对各种选择的,收益不完全确知。设具体的情况的收益矩阵如图所示,其中,t,w,、,t,h,分别相当于妻子和丈夫的类型且只有其本人知道。,夫,妻,时装足球,时装 足球,2+t,w,,,1,0,,,0,0,,,0,1,3+t,h,不完全信息夫妻之争,2023/9/19186.2混合策略和不完全信息例 夫妻之争,2024/11/18,19,6.2,混合策略和不完全信息,在此静态贝叶斯博弈中,博弈双方的,策略空间,为 ,双方的,类型空间服从均匀分布 (设双方选择临界值策略),设妻子的策略为:当 时,选择时装表演,否则选择足球;丈夫的策略为 时,选择足球,否则选择时装。所以妻子选时装和足球的概率分别为 ,丈夫的概率为 。,根据妻子和丈夫的分别选择时装和足球的期望得益可计算出妻子和丈夫分别选择时装和足球的概率在 的情况下,为,3/4,和,2/3,,而这也是完全信息夫妻之争博弈的混合策略均衡的随机选择的概率。,2023/9/19196.2混合策略和不完全信息在此静态贝叶,2024/11/18,20,6.3,暗标拍卖,典型的静态贝叶斯博弈,基本,原则,:,各投标人密封投标书投标,统一时间开标,标价最高者中标,万一出现标价相同的情况,则用抛硬币或类似的方法决定谁中标,.,模型描述,:,假定只有两个投标人,称其为博弈方,1,和博弈方,2.,设他们对拍品的的,估价,分别为,V,1,和,V,2,则博弈方,i,用价格,P,拍得拍品的得益为,V,i,-P.,设两博弈方的估价,V,1,V,2,是相互独立的,都是,0,1,上的标准均匀分布,各博弈方知道自己的估价和另一方估价的概率分布,.,另,假设两博弈方都是风险中性的,.,以上情况各博弈方都清楚,.,2023/9/19206.3 暗标拍卖典型的静态贝叶斯博弈,2024/11/18,21,6.3,暗标拍卖,典型的静态贝叶斯博弈,标准贝叶斯形式,:,1.,博弈方,i,的行为就是他的标价,b,i,且标价是非负的,因此其行为空间为 。如果考虑博弈方,i,在理智情况下决不会报出比自己对拍品的估价还要高的标价,则行为空间,A,i,=0,1.,2.,博弈方,i,的,类型即他的估价,V,i,类型空间为,T,i,=0,1,博弈方,i,的实际类型只有自己知道,另一方只知道他的类型,V,i,是,0,1,上的标准分布,.,3.,两博弈方对对方类型的判断就是,0,1,上的均匀分布,即对方的估价取,0,1,中任何数值的机会都是均等的,.,2023/9/19216.3 暗标拍卖典型的静态贝叶斯博弈,2024/11/18,22,6.3,暗标拍卖,典型的静态贝叶斯博弈,当,当,当,当,i=1,时,j=2,;当,i=2,时,j=1.,则,博弈方,i,的得益函数,2023/9/19226.3 暗标拍卖典型的静态贝叶斯博弈,2024/11/18,23,求解,:,1.,构建两博弈方的策略空间,.,博弈方,i,的策略空间为所有可能的函数关系,b,i,(v,i,),的集合,.,2.,贝叶斯纳什均衡,:,如果策略组合,b,1,(v,1,),b,2,(v,2,),是一个贝叶斯纳什均衡,则必须对每个博弈方,i,的每个类型 ,,b,i,(v,i,),都满足,:,6
展开阅读全文