资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,School of Economics&Management,Tongji University,*,高级管理学,第八讲 博弈论初步,11/13/2024,1,School of Economics&Management,Tongji University,1囚徒困境和纳什均衡,囚徒困境(,prisoners dilemma,)博弈论的著名的例子,纳什均衡是博弈论的重要概念。囚徒困境说的是,两个嫌疑犯作案后被捕,起诉机构没有足够的证据证明他们抢劫了银行。所以,若犯人们不坦白,起诉者只能就非法持有武器罪起诉,判犯人有期徒刑,2,年。起诉者于是向犯人采取攻心战,说可以“坦白从宽、抗拒从严”。如果一人坦白,则坦白者从宽处理,判徒刑,1,年,抗拒者从严处理,判徒刑,12,年。如果两人都坦白,每人依法判徒刑,10,年。两个囚徒是坦白还是不坦白呢?,11/13/2024,2,School of Economics&Management,Tongji University,1.1囚徒困境,11/13/2024,3,School of Economics&Management,Tongji University,1.2 博弈均衡,博弈论假设博弈的参加者都是理性的,即在对手战略给定的条件下,每个参加者都会选择适当的战略来实现自己报酬的最大化(或损失最小化)。问题是博弈的一方不能控制另一方的决策。当参加者甲以最优战略对付乙的某个战略时,乙会发现原先的战略不是对付甲的实际战略的最佳战略,因而会改变其战略。要是乙改变了战略,参加者甲也要进行相应的改变。这样的改变行为会否停止?这里借用经济学常用的均衡概念,我们把博弈的稳定结果称为均衡,博弈的均衡也称为博弈的解。,均衡是指所有的参加者都不想改变战略的状态。,11/13/2024,4,School of Economics&Management,Tongji University,1.3 占优均衡,在一些特殊的博弈中,一个参加者的最优战略可能并不依赖于其他参加者的战略选择,也就是说,不论其他参加者选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”(,dominant strategy,)。,在上述的囚徒困境博弈中,每个囚徒可选择的战略有两种:坦白与不坦白。显然,不论另外一个囚犯选择什么战略,每个囚犯的最优战略都是“坦白”。例如,如果乙选择坦白,囚犯甲选择坦白时的报酬为,-10,,选择不坦白的报酬为,-12,,因而坦白比不坦白好;如果乙选择不坦白,甲坦白的报酬为,-1,,不坦白的报酬为,-2,,所以坦白还是比不坦白好。也就是说,“坦白”是囚犯甲的占优战略。由于对称性,“坦白”也是囚犯乙的占优战略。于是,(坦白,坦白)或(,-10,,,-10,)是囚徒困境博弈的占优均衡。,11/13/2024,5,School of Economics&Management,Tongji University,个人理性与集体理性,甲乙两人都寻求最好的结果,而得到的却是较糟的结果。这个例子说明,在多人决策的环境里,个人理性与集体理性经常是矛盾的,这种集体利益和个人利益的之间的,冲突被称为“囚徒困境”。,11/13/2024,6,School of Economics&Management,Tongji University,1.4 纳什均衡,纳什均衡是这样一种稳定状态,博弈的任何一方参加者都不会改变其战略,如果其他参加者都不改变战略的话。,依定义,任何占优战略均衡必定是纳什均衡,但纳什均衡却不一定是占优战略均衡,占优战略均衡是比较强的均衡概念。囚徒困境中的(坦白,坦白)就是纳什均衡。经济生活中的众多集体利益和个人利益的之间的冲突带来的非帕累托有效状态都是纳什均衡。,11/13/2024,7,School of Economics&Management,Tongji University,纳什均衡(严格的定义),11/13/2024,8,School of Economics&Management,Tongji University,完全信息静态博弈的几个著名博弈,智猪博弈(boxed pigs),猪圈里有两头猪,一头大猪,一头小猪,猪圈的一头有个猪食槽,另一头安装一个 按钮,控制着猪食的供应。按一下按钮会有10单位的猪食进槽,但谁按按钮谁就要付2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。,11/13/2024,9,School of Economics&Management,Tongji University,标准型支付矩阵,11/13/2024,10,School of Economics&Management,Tongji University,性别,战,战(battleofthesexes),12/21/2022,11,SchoolofEconomics&Management,TongjiUniversity,市场,进,进入,阻,阻挠,博,博弈,12/21/2022,12,SchoolofEconomics&Management,TongjiUniversity,2动,态,态博,弈,弈,静态,博,博弈,,,,即,博,博弈,各,各方,同,同时,行,行动,,,,但,是,是经,济,济生,活,活中,许,许多,情,情形,是,是动,态,态博,弈,弈,,也,也就,是,是指,博,博弈,参,参加,者,者的,行,行动,有,有先,后,后顺,序,序,,又,又叫,序,序贯,博,博弈,。,。,12/21/2022,13,SchoolofEconomics&Management,Tongji University,2.1,完,完全信,息,息动态,博,博弈的,分,分类,博弈总,的,的可以,分,分为完,全,全信息,的,的博弈,(,(即博,弈,弈参加,者,者的收,益,益函数,是,是共同,知,知识的,博,博弈),和,和不完,全,全信息,博,博弈(,博,博弈中,的,的一些,参,参加者,不,不知道,其,其它参,加,加者的,收,收益函,数,数)。完全信,息,息动态,博,博弈又分为,完,完全且,完,完美信,息,息(,completeandperfectinformation,)的动,态,态博弈,和,和完全,但,但不完,美,美信息,博,博弈两,类,类。前,者,者是指,在,在博弈,进,进行的,每,每一步,当,当中,,要,要选择,行,行动的,参,参加者,都,都知道,这,这一步,之,之前博,弈,弈进行,的,的整个,过,过程;,后,后者是,指,指在博,弈,弈的某,些,些阶段,,,,要选,择,择行动,的,的参加,者,者并不,知,知道在,这,这一步,之,之前博,弈,弈进行,的,的整个,过,过程,12/21/2022,14,SchoolofEconomics&Management,Tongji University,2.2,子博弈,完,完美纳,什,什均衡,(,(SPNE),一个子,博,博弈是,全,全部博,弈,弈的一,部,部分,,当,当全部,博,博弈进,行,行到任,何,何一个,阶,阶段,,到,到此为,止,止的进,行,行过程,已,已经称,为,为博弈,参,参加各,方,方的共,同,同知识,,,,而其,后,后尚未,开,开始进,行,行的部,分,分就是,一,一个子,博,博弈。,如,如果博,弈,弈参加,者,者的战,略,略在每,一,一子博,弈,弈中都,构,构成纳,什,什均衡,,,,我们,称,称此纳,什,什均衡,是,是子博,弈,弈完美,纳,纳什均,衡,衡(subgameperfectNash equilibrium)(Selten,1965),。,。,所有动态博,弈,弈的中心问,题,题是可信任,性,性,所以不,可,可置信的威,胁,胁被研究较,多,多,子博弈,完,完美纳什均,衡,衡(,SPNE,)是不含不,可,可置信的威,胁,胁的。子博,弈,弈完美纳什,均,均衡可以用,逆,逆向归纳法,(,(,backwards-induction,)找出,12/21/2022,15,School ofEconomics&Management,TongjiUniversity,几种著名的,动,动态博弈,Stackelbeg,模,模型,Hotelling模,型,型(地点模,型,型),12/21/2022,16,School ofEconomics&Management,TongjiUniversity,3,重复博弈:,特,特殊的动态,博,博弈,同一博弈重,复,复多次,称,为,为重复博弈,(,(,repeated game,),其中,的,的每一次博,弈,弈称为“阶,段,段博弈”(,stagegame,),事实上,它,它是动态博,弈,弈的一种特,殊,殊情况。它,的,的均衡状况,可,可能与一次,性,性博弈不同,,,,被研究最,多,多的重复博,弈,弈还是囚徒,困,困境博弈。,12/21/2022,17,SchoolofEconomics&Management,TongjiUniversity,例,子,子:,古,古,诺,诺,产,产,量,量,博,博,弈,弈,12/21/2022,18,SchoolofEconomics&Management,TongjiUniversity,作,为,为,囚,囚,徒,徒,困,困,境,境,的,的,一,一,个,个,例,例,子,子,,,,,其,其,占,占,优,优,战,战,略,略,均,均,衡,衡,的,的,结,结,局,局,双,双,方,方,都,都,增,增,加,加,产,产,量,量,,,,,它,它,们,们,的,的,报,报,酬,酬,各,各,为,为,900,。,如,如,果,果,它,它,们,们,能,能,合,合,作,作,,,,,共,共,同,同,压,压,缩,缩,产,产,量,量,,,,,则,则,可,可,以,以,实,实,现,现,各,各,自,自,1000,的,报,报,酬,酬,。,。,它,它,们,们,都,都,想,想,合,合,作,作,,,,,但,但,是,是,又,又,怕,怕,被,被,欺,欺,骗,骗,,,,,于,于,是,是,就,就,此,此,陷,陷,入,入,“,“,囚,囚,徒,徒,困,困,境,境,”,”,。,。,关,关,键,键,是,是,在,在,一,一,次,次,性,性,博,博,弈,弈,中,中,,,,,被,被,欺,欺,骗,骗,之,之,后,后,就,就,无,无,法,法,报,报,复,复,了,了,,,,,当,当,然,然,也,也,无,无,法,法,建,建,立,立,公,公,司,司,的,的,声,声,誉,誉,。,。,重,重,复,复,博,博,弈,弈,下,下,的,的,情,情,形,形,就,就,会,会,发,发,生,生,变,变,化,化,。,。,因,因,为,为,博,博,弈,弈,的,的,其,其,它,它,参,参,加,加,者,者,过,过,去,去,行,行,动,动,的,的,历,历,史,史,是,是,可,可,以,以,观,观,测,测,得,得,到,到,的,的,,,,,一,一,个,个,参,参,加,加,者,者,可,可,以,以,使,使,自,自,己,己,在,在,某,某,个,个,阶,阶,段,段,博,博,弈,弈,的,的,战,战,略,略,选,选,择,择,依,依,赖,赖,于,于,其,其,它,它,参,参,加,加,者,者,过,过,去,去,的,的,行,行,动,动,历,历,史,史,。,。,这,这,样,样,企,企,业,业,就,就,可,可,以,以,报,报,复,复,和,和,建,建,立,立,合,合,作,作,的,的,声,声,誉,誉,,,,,合,合,作,作,发,发,生,生,的,的,原,原,因,因,在,在,于,于,公,公,司,司,的,的,长,长,远,远,利,利,益,益,。,。,12/21/2022,19,SchoolofEconomics&Management,TongjiUniversity,在,重,重,复,复,博,博,弈,弈,里,里,,,,,参,参,加,加,者,者,每,每,个,个,阶,阶,段,段,都
展开阅读全文