完全信息动态博弈(博弈论张醒洲).ppt

资源描述

2009-03-09,张醒洲大连理工,1,完全信息动态博弈,Unit3-1,2009-03-09,张醒洲大连理工,2,第3章和第4章概要,2009-03-09,张醒洲大连理工,3,第3章概要,2009-03-09,张醒洲大连理工,4,简单类型的完全且完美信息博弈,两人博弈类型参与人1从可行集A1中选择一个行动a1；参与者2观察到a1并从可行集A2中选择行动a2；两人的收益分别为u1(a1,a2)和u2(a1,a2)。Ex.斯塔克尔贝里(1934)双寡头垄断模型Tool后向归纳法Anticipation后向归纳结果,2009-03-09,张醒洲大连理工,5,理论：后向归纳法,简单的完全且完美信息博弈(CPI)两个参与人，同时行动完全且完美信息举例：斯塔克尔贝里(1934)双寡头垄断模型为了使模型更加一般化,允许更长的行动序列（可以加入更多的参与人或允许参与人行动多于一次）一个例子.鲁宾斯坦的讨价还价博弈为解决简单类型的CPI,应用后向归纳法求解的过程如下：,2009-03-09,张醒洲大连理工,6,理论：后向归纳法（续）,第1步:分析第二阶段博弈参与人2的问题:对参与人1的行动a1选择最优的反应R2(a1),参与人2面临的最优化问题是:,即,2009-03-09,张醒洲大连理工,7,理论：后向归纳法（续）,请注意这个问题对两个参与人来说是一个共同知识。因此参与人1可以预测到参与人2对他的行动a1所做出的反应R2(a1)。第2步:分析第一阶段参与人1的问题:对参与人2的最优反应R2(a1)，选择最优的行动a1：,即,2009-03-09,张醒洲大连理工,8,理论：后向归纳法（续）,定义.简单的完全且完美信息博弈的后向归纳结果是(a1*,R2(a1*)。注意到后向归纳结果不包括不可置信的威胁参与人1预测到参与人2是理性的，也就是2会对1可能选择的A1中的任何行动a1作出最优反应R2(a1)；并且，参与人1认为参与人2不会选择不符合自身利益的行动。下面看一个例子,2009-03-09,张醒洲大连理工,9,后向归纳法内在的理性假定,一个两个人的三阶段博弈1.参与人1选择L或R，其中L使博弈结束，参与人1的收益为2，参与人2的收益为0；2.参与人2观测参与人1的选择。如果1选择R，则2选择选择L或R，其中L使博弈结束，两人的收益均为1；3.参与人1观察2的选择（并且回忆自己在第一阶段的选择），如果前两阶段的选择分别是R和R，则1可选择L或R，每一选择都将结束博弈，选择L是参与人1的收益为3，参与人2的收益为0；选择R时，1的收益是0，2的收益是2。,2009-03-09,张醒洲大连理工,10,后向归纳法内在的理性假定:一个两个人的三阶段博弈,计算后向归纳结果第1步参与人1会在博弈的第三阶段选择L”,2009-03-09,张醒洲大连理工,11,后向归纳法内在的理性假定:一个两个人的三阶段博弈,第2步参与人2在第二阶段选择L。,2009-03-09,张醒洲大连理工,12,后向归纳法内在的理性假定:一个两个人的三阶段博弈,第3步参与人1在第一阶段作出最优反应选择L后向归纳结果是(L,nothing,nothing),2009-03-09,张醒洲大连理工,13,后向归纳法内在的理性假定:一个两个人的三阶段博弈,为什么?思考：P1认为别人以为他是疯子,P2自聪明以为P1是疯子,但是P1真的不是疯子。结果是什么?,2009-03-09,张醒洲大连理工,14,斯塔克尔贝里双寡头垄断模型,斯塔克尔贝里(1934)提出一个双头垄断的动态模型，其中一个支配企业（领导者）首先行动，然后从属企业（追随者）行动。博弈的时间顺序如下：企业1选择产量q10；企业2观察到q1，然后选择产量q20;企业i的利润函数如下：其中P(Q)=aQ，是市场上的总产品Q=q1+q2时的出清价格，c是生产的边际成本，为一常数（固定成本为0）。,2009-03-09,张醒洲大连理工,15,斯塔克尔贝里双寡头垄断模型,求解后向归纳结果第1步计算企业2对企业1任意产量的最优反应，R2(a1)应满足由上式可得已知q1a-c.,2009-03-09,张醒洲大连理工,16,斯塔克尔贝里双寡头垄断模型,共同知识由于企业1也能像企业2一样解出企业2的最优反应，企业1就可以预测出如果他选择q1，企业2将会选择产量R2(q1)。那么，在博弈的第一阶段，企业1的问题可表示为由上式可得这就是斯塔克尔贝里双寡头垄断博弈的后向归纳结果。,2009-03-09,张醒洲大连理工,17,双寡头垄断博弈：静态vs.动态,古诺模型和斯塔克尔贝里模型的区别：q1是共同知识(能被企业2观察到)要点企业1知道企业2知道q1损害了企业2。,2009-03-09,张醒洲大连理工,18,序惯谈判,一个三阶段谈判模型鲁宾斯坦(1982)模型,2009-03-09,张醒洲大连理工,19,一个三阶段谈判模型,参与人1和2就一美元的分配进行谈判。他们轮流提出方案：首先参与人1提出一个分配方案，参与人2可以接受或拒绝；如果参与人2拒绝，就由参与人2提出分配建议，参与人1选择接受或拒绝；如此进行下去。一个条件一旦被拒绝，它就不再有任何约束力，并与博弈下面的进程不再相关。每一个条件都代表一个阶段，参与人都没有足够的耐心：他们对后面阶段得到的收益进行贴现，每一阶段的贴现因子为，这里01。,2009-03-09,张醒洲大连理工,20,一个三阶段谈判模型:时间顺序,(1a)在第一阶段开始时，参与人1建议他分走1美元的s1，留给参与人2的份额是1s1；(1b)参与人2接受或不接受这一条件（这种情况下，博弈结束，参与人1的收益为s1，参与人2的收益为1s1），或者拒绝这一条件（在这种情况下，博弈将继续进行，进入第二阶段）；(2a)在第二阶段的开始，参与人2提议参与人1分得1美元的s2，留给参与人2的份额是1s2(请注意在阶段t，st总是表示分给参与人1的，而不论是谁先提出的条件）；(2b)参与人1或者接受条件（这种情况下，博弈结束，参与人1的收益s2和参与人2的收益1s2都可立即拿到），或者拒绝这一条件（在这种情况下，博弈将继续进行，进入第三阶段）；(3)一旦进入第三阶段，参与人1得到美元的s，参与人2得到1-s，这里0s1。,2009-03-09,张醒洲大连理工,21,一个三阶段谈判模型,2009-03-09,张醒洲大连理工,22,一个三阶段谈判模型,后向归纳法步骤第1步参与者2的战略空间提议(s,1-s),提议(s2,1-s2)，这里s2s,解：对参与人2，如果他提议分配s2s给参与人1，则(1-s)1-s。因此参与人2的最优选择是提议(s,1-s）,2009-03-09,张醒洲大连理工,23,一个三阶段谈判模型,第2步：分析第1阶段参与人1的战略空间为提议(1-(1-s),(1-s),提议(s1,1-s1)这里1-s1s参与人1可以提议分配(1-s)给参与人2，参与人2接受这一条件，博弈在第1阶段结束。,2009-03-09,张醒洲大连理工,24,鲁宾斯坦谈判模型,在第3阶段如何确定s?鲁宾斯坦说，均衡收益是(1/(1+),/(1+)。,

展开阅读全文

完全信息动态博弈(博弈论张醒洲).ppt

最新文档