资源描述
,决策理论与方法,第,*,页,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,Click to edit Master title style,第,*,页,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,Click to edit Master title style,决策理论与方法,第,*,页,第,*,页,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,Click to edit Master title style,*,决策理论,与,与方法,(,DecisionMakingTheory and Methods,),决策理论,与,与方法,编写组,教育部高,等,等学校管,理,理科学与,工,工程类学,科,科专业教,学,学指导委,员,员会推荐,教,教材,第四章,动,动态决,策,策分析,学习目的,了解多阶,段,段决策、,序,序贯决策,的,的概念及,特,特点;,掌握动态,规,规划与决,策,策树方法,及,及其在多,阶,阶段决策,、,、序贯决,策,策中的应,用,用。,本讲内容,4.1,动态决策,的,的基本原,理,理,4.2,多属性决,策,策,4.1,多阶段决,策,策问题的,提,提出,4.1.1,动态规划,概,概述,规划问题,的,的最终目,的,的就是确,定,定各决策,变,变量的取,值,值,以使,目,目标函数,达,达到极大,或,或极小。,在,在线性规,划,划和非线,性,性规划中,,,,决策变,量,量都是以,集,集合的形,式,式被一次,性,性处理的,;,;然而,,有,有时我们,也,也会面对,决,决策变量,需,需分期、,分,分批处理,的,的多阶段,决,决策问题,。,。,所谓多阶,段,段决策问,题,题是指这,样,样一类活,动,动过程:,它,它可以分,解,解为若干,个,个互相联,系,系的阶段,,,,在每一,阶,阶段分别,对,对应着一,组,组可供选,取,取的决策,集,集合,即,构,构成过程,的,的每个阶,段,段都需要,进,进行一次,决,决策。将,各,各个阶段,的,的决策综,合,合起来构,成,成一个决,策,策序列,,称,称为一个,策,策略。显,然,然,由于,各,各个阶段,选,选取的决,策,策不同,,对,对应整个,过,过程可以,有,有一系列,不,不同的策,略,略。当过,程,程采取某,个,个具体策,略,略时,相,应,应可以得,到,到一个确,定,定的效果,,,,采取不,同,同的策略,,,,就会得,到,到不同的,效,效果。多,阶,阶段的决,策,策问题,,就,就是要在,所,所有可能,采,采取的策,略,略中选取,一,一个最优,策,策略,以,便,便得到最,佳,佳的效果,。,。动态规,划,划同前面,介,介绍过的,各,各种优化,方,方法不同,,,,它不是,一,一种算法,,,,而是考,察,察问题的,一,一种途径,。,。动态规,划,划是一种,求,求解多阶,段,段决策问,题,题的系统,技,技术,可,以,以说它横,跨,跨整个规,划,划领域(,线,线性规划,和,和非线性,规,规划)。,当,当然,由,于,于动态规,划,划不是一,种,种特定的,算,算法,因,而,而它不像,线,线性规划,那,那样有一,个,个标准的,数,数学表达,式,式和明确,定,定义的一,组,组规则,,动,动态规划,必,必须对具,体,体问题进,行,行具体的,分,分析处理,。,。在多阶,段,段决策问,题,题中,有,些,些问题对,阶,阶段的划,分,分具有明,显,显的时序,性,性,动态,规,规划的“,动,动态”二,字,字也由此,而,而得名。,动态规,划,划的主,要,要创始,人,人是美,国,国数学,家,家贝尔,曼,曼。,20,世纪,40,年代末,50,年代初,,,,当时,在,在兰德,公,公司从,事,事研究,工,工作的,贝,贝尔曼,首,首先提,出,出了动,态,态规划,的,的概念,。,。,1951,年贝尔,曼,曼首先,提,提出了,动,动态规,划,划中解,决,决多阶,段,段决策,问,问题的,最,最优化,原,原理,,并,并给出,了,了许多,实,实际问,题,题的解,法,法。,1957,年贝尔,曼,曼出版,了,了他的,第,第一部,著,著作,动态规,划,划,,标志,着,着运筹,学,学这一,重,重要分,支,支的诞,生,生。该,著,著作成,为,为当时,唯,唯一的,进,进一步,研,研究和,应,应用动,态,态规划,的,的理论,源,源泉。,1961,年贝尔,曼,曼出版,了,了他的,第,第二部,著,著作,,并,并于,1962,年同杜,瑞,瑞佛思,合,合作出,版,版了第,三,三部著,作,作。在,贝,贝尔曼,及,及其助,手,手们致,力,力于发,展,展和推,广,广这一,技,技术的,同,同时,,其,其他一,些,些学者,也,也对动,态,态规划,的,的发展,作,作了巨,大,大的贡,献,献,其,中,中最值,得,得一提,的,的是爱,尔,尔思和,梅,梅特顿,。,。爱尔,思,思先后,于,于,1961,年和,1964,年出版,了,了两部,关,关于动,态,态规划,的,的著作,,,,并于,1964,年同尼,母,母霍思,尔,尔、威,尔,尔德一,道,道创建,了,了处理,分,分支、,循,循环性,多,多阶段,决,决策系,统,统的一,般,般性理,论,论。梅,特,特顿提,出,出了许,多,多对动,态,态规划,后,后来发,展,展有着,重,重要意,义,义的基,础,础性观,点,点,并,且,且对明,晰,晰动态,规,规划路,径,径的数,学,学性质,作,作出了,巨,巨大的,贡,贡献。,动态规,划,划从创,立,立到现,在,在,50,多年来,,,,无论,在,在工程,技,技术、,企,企业管,理,理还是,在,在工农,业,业生产,及,及军事,等,等部门,都,都有着,广,广泛的,应,应用,,并,并取得,了,了显著,的,的效果,。,。在管,理,理方面,,,,动态,规,规划可,用,用于资,源,源分配,问,问题、,最,最短路,径,径问题,、,、库存,问,问题、,背,背包问,题,题、设,备,备更新,问,问题、,最,最优控,制,制问题,等,等等,,所,所以动,态,态规划,是,是现代,管,管理学,中,中进行,科,科学决,策,策不可,缺,缺少的,工,工具。,动态规,划,划的优,点,点在于,,,,它把,一,一个多,维,维决策,问,问题转,化,化为若,干,干个一,维,维最优,化,化问题,,,,而对,一,一维最,优,优化问,题,题一个,一,一个地,去,去解,,这,这种方,法,法是许,多,多求极,值,值方法,所,所做不,到,到的,,它,它几乎,优,优于所,有,有现存,的,的优化,方,方法。,除,除此之,外,外,动,态,态规划,能,能求出,全,全局极,大,大或极,小,小,这,一,一点也,优,优于其,他,他优化,方,方法。,需,需要指,出,出的是,,,,动态,规,规划是,求,求解最,优,优化问,题,题的一,种,种方法,,,,是解,决,决问题,的,的一种,途,途径,,而,而不是,一,一种算,法,法。在,前,前面我,们,们学习,了,了用单,纯,纯形法,解,解线性,规,规划问,题,题,凡,是,是具有,线,线性规,划,划问题,那,那样统,一,一的数,学,学模型,都,都可以,用,用单纯,形,形法去,求,求解,,而,而,动态规,划,划问题,的,的求解,却,却没有,统,统一的,方,方法(,类,类似于,单,单纯形,法,法)。,因,因此在,用,用动态,规,规划求,解,解最优,化,化问题,中,中,必,须,须对具,体,体问题,具,具体分,析,析,针,对,对不同,的,的问题,,,,使用,动,动态规,划,划最优,化,化原理,和,和方法,,,,建立,起,起与其,相,相应的,数,数学模,型,型,然,后,后再用,动,动态规,划,划方法,去,去求解,。,。根据,动,动态规,划,划这些,特,特点,,要,要求我,们,们在学,好,好动态,规,规划的,基,基本原,理,理和方,法,法的同,时,时,还,应,应具有,丰,丰富的,想,想象力,,,,只有,这,这样才,能,能建好,模,模型求,出,出问题,的,的最优,解,解。,4.1,动态决,策,策的基,本,本原理,4.1.1,动态规,划,划,动态规,划,划(,dynamic Programming,,,DP,)是解,决,决多阶,段,段决策,过,过程最,优,优化的,一,一种方,法,法,其,基,基本思,路,路是将,多,多阶段,决,决策过,程,程转化,为,为一系,列,列相互,关,关联的,单,单阶段,问,问题,,并,并依次,求,求解。,DP,是离散,系,系统最,优,优化的,一,一种有,效,效工具,,,,目前,动,动态规,划,划已广,泛,泛用于,工,工业、,农,农业、,工,工程技,术,术、资,源,源、环,境,境、经,济,济、社,会,会等领,域,域。,4.1,动态决,策,策的基,本,本原理,4.1.1,动态规,划,划,例,4-1-1,最优线,路,路问题,。,。由水,源,源地向,城,城市的,输,输水线,路,路需通,过,过,3,个控制,点,点,每,个,个控制,点,点均有,两,两个可,选,选方案,,,,每段,线,线路的,输,输水费,用,用如下,图,图所示,。,。选出,一,一条输,水,水线路,,,,使得,总,总输水,费,费用最,小,小。,4.1,动态决,策,策的基,本,本原理,4.1.1,动态规,划,划,最优性,原,原理(,theprinciple of optimality,)也称,为,为,Bellman,原理,,是,是,R.Bellman,提出的,DP,的基本,原,原理,,其,其表述,为,为:“,一,一个过,程,程的最,优,优策略,具,具有这,样,样的性,质,质,即,无,无论初,始,始状态,和,和初始,决,决策如,何,何,对,于,于由前,面,面的决,策,策所形,成,成的状,态,态来说,,,,其后,各,各阶段,的,的决策,序,序列必,定,定构成,相,相应子,过,过程的,最,最优策,略,略”。,4.1,动态决,策,策的基,本,本原理,4.1.2,决策树,决策树,(decisiontree),就是将,决,决策过,程,程各个,阶,阶段之,间,间的结,构,构绘制,成,成一张,箭,箭线图,,,,每个,决,决策或,事,事件(,即,即自然,状,状态),都,都可能,引,引出两,个,个或多,个,个事件,,,,导致,不,不同的,结,结果。,决策树,的,的构成,有,有四个,要,要素:,1),决策结,点,点;,2),方案枝,;,;,3),状态结,点,点;,4),概率枝,。,。,4.1,动态决,策,策的基,本,本原理,4.1.2,决策树,方案枝,方案枝,决策结 点,概率枝,概率枝,状态结点,概率枝,概率枝,概率枝,状态结点,概率枝,4.1,动态决,策,策的基,本,本原理,4.1.2,决策树,决策树,法,法的决,策,策程序,如,如下:,1),绘制树,状,状图,,根,根据已,知,知条件,排,排列出,各,各个方,案,案和每,一,一方案,的,的各种,自,自然状,态,态。,2),将各状态概,率,率及损益值,标,标于概率枝,上,上。,3),计算各方案,期,期望值并将,其,其标于该方,案,案对应的状,态,态结点上。,4),进行剪枝,,比,比较各个方,案,案的期望值,,,,并标于方,案,案枝上,将,期,期望值小的,(,即劣等方案,剪,剪掉,),所剩的最后,方,方案为最佳,方,方案。,4.2,多阶段决策,多阶段决策,有,有以下三个,特,特点,,第一,决策,者,者需要做出,时,时间上有先,后,后之别的多,个,个决策;,第二,前一,次,次决策的选,择,择将直接影,响,响到后一次,决,决策,后一,次,次决策的状,态,态取决于前,一,一次决策的,结,结果;,第三,决策,者,者关心的是,多,多次决策的,总,总结果,而,不,不是各次决,策,策的即时后,
展开阅读全文