资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第四章,序,序贯决策博,弈,弈,序贯决策博,弈,弈:局中人,做,做出策略选,择,择时知道对,手,手的策略选,择,择。,A、B、C,三,三人决斗,,每,每人有2颗,子,子弹,每次,发,发一枪。,A、B、C,的,的命中概率,分,分别为0.4、0.6,、,、0.8。,问题:(1,),)假如三个,人,人同时开枪,,,,决一死战,,,,一枪后谁,最,最后活下来,的,的机会大一,些,些?,(2)三人,依,依次发射,,两,两轮后对决,结,结束。,分析这场博,弈,弈中A的最,优,优策略。,故事一模型,B(60%,),),A:40%,C(80%,),),实 验:,海,海 盗,分,分 宝,五个海盗抢,到,到100颗,宝,宝石,他们,决,决定按如下,方,方法来分配:先抽签决,定,定顺序(1,,,,2,3,4,5);,然,然后先由1,号,号提出分配,方,方案,其余,的,的人进行表,决,决,当且仅,当,当半数和超,过,过半数的人,同,同意时,则,按,按1号所提,方,方案分配,,否,否则将1号,扔,扔进大海喂,鲨,鲨鱼,当1,号,号方案被否,决,决,则由2,号,号提出分配,方,方案,其余,的,的人进行表,决,决,以此类,推,推,假定这,些,些海盗都是,理,理性人,问,第,第一个海盗,应,应提出怎样,的,的分配方案,才,才能获得通,过,过并使自己,的,的收益最大,?,?,本章讨论动,态,态博弈,所,有,有博弈方都,对,对博弈过程,和,和得益完全,了,了解的完全,且,且完美信息,动,动态博弈。,这,这类博弈也,是,是现实中常,见,见的基本博,弈,弈类型。由,于,于动态博弈,中,中博弈方的,选,选择、行为,有,有先后次序,,,,因此在表,示,示方法、利,益,益关系、分,析,析方法和均,衡,衡概念等方,面,面,都与静,态,态博弈有很,大,大区别。本,章,章对动态博,弈,弈分析的概,念,念和方法,,特,特别是子博弈完美,均,均衡和逆推,归,归纳法作系,统,统介绍,并,介,介绍各种经,典,典的动态博,弈,弈模型。,主要内容,1、,序贯博弈的,定,定义和表示,方,方法,2、寻找序,贯,贯博弈纳什,均,均衡的“箭,头,头排除确定,法,法”(旧版,教,教材上称为,虚,虚线排除确,定,定法),3、寻找序,贯,贯博弈纳什,均,均衡的“倒,推,推法”,4、先动优,势,势和后动优,势,势,5、“倒推,法,法”的缺陷,一、序贯博,弈,弈的定义和,表,表示方法,假如某个垄,断,断企业一年,可,可以赚10,亿,亿元的利润,,,,假定别的,企,企业为了进,入,入该行业需,要,要投资4亿,元,元。当新的,企,企业准备进,入,入时,原有,垄,垄断企业有,两,两种决策,(1),“容忍”,,但,但利润要变,为,为5亿元。,这,这时新的企,业,业可以得5,亿,亿,减去4,亿,亿投资,仍,有,有1亿。,(2)“抵,抗,抗”,例如,降,降低价格,,企,企业的利润,变,变为2亿元,,,,且新的企,业,业也只得2,亿,亿,但减去,投,投资,亏损2亿。,谁先动?潜,在,在进入者,,简,简称“进入,者,者”,如何表示该,博,博弈?,分析“进入,者,者”和“垄,断,断者”的纯,策,策略。,博 弈 树,用博弈树来,表,表示序贯博,弈,弈。,它描述了博,弈,弈参与人的,一,一个序贯决,策,策过程,从,博,博弈数的根,开,开始,到末,端,端点结束。,拥有初始决,策,策节点的局,中,中人先做出,决,决策,他的,决,决策引出博,弈,弈树的棱,,而,而棱的末端,将,将是下一个,局,局中人做出,决,决策,依此,类,类推。,进入障碍博,弈,弈,进入者,进入,不进,垄断者,容忍,抵抗,容忍,抵抗,(1,5),(-2,2,),),(0,10,),),(0,4),垄断者,a,b,c,a是初始,决,决策节点,,,,也称博,弈,弈树的根,;,;b,c,分,分别是上,决,决策节点,和,和下决策,节,节点,“进入者,”,”和“垄,断,断者”的,纯,纯策略,“进入者,”,”的有,两,两个纯策,略,略:进入,和,和不进入,“垄断者,”,”的有四,个,个纯策略,:,:bc,不管你怎,样,样,我总,是,是容忍,容忍,,,,容忍,不管你怎,样,样,我总,是,是对抗,对抗,,,,对抗,你进我对,抗,抗,你不,进,进我忍,对抗,,,,容忍,你进我忍,,,,你不进,我,我对抗,容忍,,,,对抗,注:花括,号,号第一项,表,表示垄断,者,者在上决,策,策节点b,,,,即进入,者,者选择进,入,入时他要,选,选择的行,动,动,第二,项,项表示垄,断,断者在下,决,决策节点c,即进,入,入者选择,不,不进入时,他,他要选择,的,的行动。,假设垄断,企,企业的老,板,板交给你,这,这样的策,略,略:对,抗,抗,容忍,你明,白,白应该如,何,何行动吗,?,?,策略就是,一,一个完整,的,的行动计,划,划,使得,你,你可以把,它,它交给另,外,外一个人,,,,让他知,道,道如何代,表,表你去执,行,行这个策,略,略。,什么是计,划,划:“如,果,果对手选A,我将,采,采取行动X,如果,,我将,采,采取行动,。”,行动与策,略,略,在同时决,策,策博弈中,,,,行动就,是,是策略。,但在序贯,决,决策博弈,中,中,行动,是,是指每一,个,个决策点,上,上局中人,的,的决策变,量,量或行动,的,的具体抉,择,择。策略,就,就是一个,完,完整的行,动,动计划。,策略组合,该博弈有,八,八种可能,的,的策略组,合,合:,(进,入,入,,(,(上)容,忍,忍,(下,),)容忍,),),(进,入,入,,(,(上)对,抗,抗,(下,),)对抗,),),(进,入,入,,(,(上)对,抗,抗,(下,),)容忍,),),(进,入,入,,(,(上)容,忍,忍,(下,),)对抗,),),(不,进,进,,(,(上)容,忍,忍,(下,),)容忍,),),(不,进,进,,(,(上)对,抗,抗,(下,),)对抗,),),(不,进,进,,(,(上)对,抗,抗,(下,),)容忍,),),(不,进,进,,(,(上)容,忍,忍,(下,),)对抗,),),支 付,进入者纯,策,策略与垄,断,断者的“,计,计划型”,策,策略形成,策,策略组合,,,,构成一,条,条路径。,支付对应每条,路,路径,而不是,对,对应每步选择,、,、行为。,支付向量,中,中,数字,的,的排列按,局,局中人的,出,出场顺序,出,出现。(,进,进入者,,垄,垄断者),八种策略,组,组合对应,的,的支付,(进,入,入,,(,(上)容,忍,忍,(下,),)容忍,),),(,(1,5,),),(进,入,入,,(,(上)对,抗,抗,(下,),)对抗,),),(,(-2,2),(进,入,入,,(,(上)对,抗,抗,(下,),)容忍,),),(,(-2,2),(进,入,入,,(,(上)容,忍,忍,(下,),)对抗,),),(,(1,5,),),(不,进,进,,(,(上)容,忍,忍,(下,),)容忍,),),(,(0,10),(不,进,进,,(,(上)对,抗,抗,(下,),)对抗,),),(,(0,4,),),(不,进,进,,(,(上)对,抗,抗,(下,),)容忍,),),(,(0,10),(不,进,进,,(,(上)容,忍,忍,(下,),)对抗,),),(,(0,4,),),二、寻找,序,序贯博弈,的,的纳什均,衡,衡,例如:如,图,图所示的,情,情侣博弈,,,,分析该,博,博弈的纳,什,什均衡?,男,足球,芭蕾,女,足球,芭蕾,足球,芭蕾,(2,1,),),(0,0,),),(-1,-1),(1,2,),),男方和女,方,方的纯策,略,略,男方有两,个,个纯策略,:,:足球和,芭,芭蕾,女方有四,个,个纯策略,:,:,芭蕾,,芭,芭蕾,不管,你,你怎样,,我,我总是芭,蕾,蕾,足球,,足,足球,不管,你,你怎样,,我,我总是足,球,球,足球,,芭,芭蕾,你选,择,择什么,,我,我就选择,什,什么,芭蕾,,足,足球,你选,择,择什么,,我,我不选择,什,什么,八种策略,组,组合,纳,什,什均衡在,哪,哪,该博弈有,八,八种可能,的,的策略组,合,合:,(足,球,球,,(,(上)足,球,球,(下,),)足球,),),(足,球,球,,(,(上)足,球,球,(下,),)芭蕾,),),(足,球,球,,(,(上)芭,蕾,蕾,(下,),)足球,),),(足,球,球,,(,(上)芭,蕾,蕾,(下,),)芭蕾,),),(芭,蕾,蕾,,(,(上)足,球,球,(下,),)足球,),),(芭,蕾,蕾,,(,(上)足,球,球,(下,),)芭蕾,),),(芭,蕾,蕾,,(,(上)芭,蕾,蕾,(下,),)足球,),),(芭,蕾,蕾,,(,(上)芭,蕾,蕾,(下,),)芭蕾,),),用箭头排,除,除确定法,寻,寻找纳什,均,均衡,将以上策,略,略在博弈,书,书中用粗,线,线表示。,将存在单,独,独改变激,励,励的策略,用,用箭头标,示,示。方法,如,如下:,(1)找,到,到第二阶,段,段两根粗,线,线所对应,的,的支付。,(2)比,较,较这两个,支,支付前面,的,的数字,,如,如果大的,数,数字所对,应,应的那条,“,“树枝”,是,是细的,,则,则男方存,在,在单独偏,离,离的动机,,,,则男方,的,的策略选,择,择用箭头,标,标示。,(3)比,较,较男方选,择,择的树枝,对,对应女方,选,选择所获,得,得支付(,这,这两个支,付,付后面的,数,数字).,其,其中对应,第,第一阶段,“,“树枝”,是,是细的那,个,个数字可,以,以不再考,虑,虑,因为,男,男方没选,这,这个方向,。,。它是“,虚,虚”的。,(4)因,此,此只在男,方,方选的那,个,个“树丫,”,”上进行,比,比较女方,的,的支付,,如,如果大的,数,数字对应,的,的“树枝,”,”是细的,,,,则女方,的,的策略选,择,择“树枝,”,”用箭头,标,标示。(P142),虚线排除,确,确定法的,缺,缺陷,该方法可,以,以找到纳,什,什均衡,,但,但找不到,博,博弈的最,终,终结果。,均衡是策,略,略的组合,,,,而结果,则,则是行动,的,的组合。(P143),因此,我,们,们一般用,倒,倒推法(Backwards Induction),来,来寻找序,贯,贯博弈的,结,结果。,三、寻找,序,序贯博弈,的,的结果,倒推法,从动态博,弈,弈的最后,一,一个阶段,博,博弈方的,行,行为开始,分,分析,逐,步,步倒推回,前,前一个阶,段,段相应博,弈,弈方的行,为,为选择,,一,一直到第,一,一个阶段,的,的分析方,法,法,称为,“,“倒推法,”,”或者,“,“逆推归,纳,纳法”。,倒推法是动态博弈,分,分析最重,要,要、基本,的,的方法。,步骤:,从博弈的,最,最后一个,阶,阶段开始,分,分析,通,过,过比较最,后,后一个参,与,与决策的,局,局中人的,支,支付,推,断,断他或她,的,的选择,,从,从而将他,不,不会选的,策,策略,“,“枝桠”,砍,砍掉,从,而,而回到上,一,一个阶段,,,,比较该,阶,阶段参与,决,决策的局,中,中人的支,付,付,将他,或,或她不会,选,选的策略,砍,砍掉,依,此,此类推,男,足,球,球,芭,蕾,蕾,女,足,球,球,芭,蕾,蕾,足,球,球,芭,蕾,蕾,(2,1),(0,,,,0),(-1,,,,-1),(1,2),倒,推,推,法,法,:,(,(1,),),在,在,上,上,面,面,一,一,个,个,枝,枝,桠,桠,上,上,,,,,由,于,于,最,最,后,后,一,一,阶,阶,段,段,是,是,女,女,方,方,做,做,决,决,策,策,,,,,因,因,此,此,比,比,较,较,女,女,方,方,的,的,支,支,付,付1,和,和0,,,,,将,将0,所,所,对,对,应,应,的,的,芭,芭,蕾,蕾,策,策,略,略,砍,砍,掉,掉,,,,,没,没,砍,砍,掉,掉,的,的,打,打,上,上,箭,箭,头,头,。,。
展开阅读全文