第十六章随机决策分析方法

资源描述

编号：时间：2021年x月x日书山有路勤为径，学海无涯苦作舟页码：第35页共35页第十六章随机性决策分析方法人们在日常生活和工作中经常会遇到一些与随机因素有关、后果不确定，而又必须做出判断和决定的问题.这类问题称为随机性决策问题.任何一个随机性决策问题都包含两个方面的内容，即决策人所采取的行动方案（简称决策）和问题的自然状态（简称状态），而且具有两个基本特点：后果的不确定性和后果的效用.所谓后果的不确定性，主要是由于问题的随机性，使得问会出现什么状态是不确定的，所以对策人做出的某种决策以后会出现什么后果也是不确定的.而效用是后果价值的量化，由于不确定性，无论决策人采用什么策略，都可能会遇到事先不能完全预料的后果，这要承担一定的风险，不同的决策人对待风险的态度会不同.因而，同样的后果对不同的策略人产生的效用也会不同.即使在没有风险的情况下，不同的决策人对待各种后果也有不同的偏好，为此，在进行定量分析之前，就应该确定出所有后果的效用.只有这样，人们才能比较各种策略的优劣，根据自己的喜好来选择最佳的决策方案.在决策分析中，后果的不确定性和对于后果赋予的效用是两个关键性的问题.为此，对于状态的不确定性主要用主观概率来表示，而后果的效用则用效用理论来研究.16.1 随机性决策问题的基本概念16.1.1 主观概率随机性决策问题的后果的不确定性，主要是由状态的不确定性所引起的.状态的不确定性，往往不能通过在相同条件下的大量重复试验来确定其概率分布（此称客观概率）是有区别的.主观概率是决策人进行决策分析的依据，虽然他与客观概率有本质的区别，但在定义概率方面有不同之处，同样遵循客观概率应该遵循的若干假设、公理和性质等，因此，适用于客观概率的所有的逻辑推理方法均适用于主观概率.这里仅给出主观概率所服从的基本假设（或称公理系统）：（1）设为一非空集合，其元素可以是某种试验或观察的结果,也可以是自然的状态.将这些元素记作抽象的点,因而有（2）设F是中的一些子集A所构成的集合,F满足下列条件:1）2）如果,则;3）如果可列多个,则它们的并集.（3）设是定义在上的实值集函数,如果它满足下列条件,就称为上的(主观或客观)概率测度,或简称概率,这些条件是1）对于每个,有2）3）如果可列多个,，则这里称点为基本事件, 中的集称为事件, 是全体事件的集合, 称为事件的(主观或客观)概率,三元总体称为(主观或客观)概率空间.设定主观概率的方法主要有:主观先验分布法、无信息先验分布法、极大熵(极大平均信息量)先验分布法和利用过去数据设定先验分布法等.16.1.2 效用函数在随机性决策问题中,后果的不确定性是有状态的不确定性引起的.所以，在研究后果的效用时要充分考虑后果的不确定性.设决策人在选择某一行动时,决策问题可能的个后果为后果可能发生的概率分别是且用表示所有后果的概率分布,并记则称为展望.所有展望构成的集合记为,可以验证关于凸线性组合是封闭的,即如果而且则有.对于任意两个展望,都存在一定的优先关系,即对于决策人可以认为优于,或与无差异，或不优于三种情况,将这三种关系分别记为和.这种优先关系反映了决策人对各种后果的偏好程度.定义16.1 设是定义在展望上的实值函数,且满足（1）它和在上的优先关系一致,即如果对于所有，有当且仅当;（2）它在上是线性的,即如果，而且则那么称是定义在展望上的效用函数.如果,则就是表示以概率选择的期望效用.效用是决策人在有风险的情况下对后果的偏好的量化,因此,其中包含有决策人对于一个不确定事件可能冒风险的态度,又称这种效用为基数效用.如果所研究的事件是确定的事件,并不受自然状态的影响,类似地可以定义一个效用来表示决策人对确定事件的各种后果的偏好程度.对于这类事件,决策人无需承担风险,相应的效用与基数效用有所不同,在此称之为序数效用.定义16.2 设为所有确定事件的后果的集合, 是定义在上的实值函数,如果对于任意的有,当且仅当,则称是定义在上的序数效用函数.基数效用和序数效用的主要区别是:基数效用在正线性变换下是唯一的,而序数效用在保序变换下是唯一的.正线性变换: .保序变换：,对任意为严格的单调增加函数. 16.2 效用函数理论16.2.1 效用与风险的关系实际中很多的决策问题都涉及经济效益，对于这类问题，在后果不确定的情况下，决策人的决策往往是效益和风险并存，但对不同的决策人对待风险的态度一般是不同的，通常可分为三种态度，即厌恶型、中立型和喜好型.假设决策人面对一种风险的情况有1/2的机会得不到任何盈利，也有1/2的机会盈利元，即他的期望盈利为元.如果决策人认为冒此风险的期望盈利只等价于比它低的不冒风险的盈利，则对待风险的态度为厌恶型的.否则对待风险的态度为喜好型的.如果决策人认为这和不冒任何风险的另一行为盈利元等价，则对待风险的态度是中立型的.这三种不同的态度可以反映在效用函数上就是凹（上凸）函数，线性函数和凸（下凸）函数.如图16-1.(a)(b)(c)图16-1 三种不同的效用函数曲线由图16-1（a）是风险厌恶型的效用函数，即有；由图16-1（b）是风险中立型的效用函数，即有；由图16-1（c）是风险喜好型的效用函数，即有；实际中，很多的情况效用函数的曲线呈型，即在后果的范围内，决策人对待风险的态度往往会从厌恶风险改变为喜好风险.如图16-2.图16-2（a）反映了决策人的财产从小到大，对待风险的态度从喜好到厌恶的改变.图16-2（b）反映了决策人的财产随着从损失到盈利的增加，对待风险的态度会从喜好到厌恶的变化.这是最常用的效用函数.u(x)aoxoxu(x)(a)(b)图16-2 两类S型效用函数曲线16.2.2 损失函数与风险函数有的时候不要效用函数，而是用损失函数来做决策分析.记损失函数为，它表时示一个决策问题当状态为，决策人的行动为时所产生的后果使决策人所受的损失.损失函数可以为正，也可以为负，它反映决策人获得的利益，后果效用越大，则损失越小.由此可以用效用函数来定义损失函数，即令实际中，在有些问题上为了使损失函数总是为非负的，也可以定义损失函数为在效用理论中，我们说明了期望效用能够合理的表示在风险情况下决策人的偏好，因此，期望损失也必然是决策人在风险情况下遭受损失的一个正确测度.16.2.3 随机函数与效用函数随机决策分析是在一定的条件下，用期望效用来表示一个随机事件效用的一种方法.在有价证券问题的研究中，又提出另外一种在一定的风险情况下制定决策的方法，称为随机优势法.假设问题的效用函数为，其自变量表示财富（为一随机变量）。实际中的问题总是有，且在上有界，对于这种效用函数可以分为以下几类：1 递增效用函数实际中，一般要求财富的效用函数是的非递减函数，即意味着当财富增加时，它的效用总不会减少.通常是随着的增加是严格递增的，而且是有界的.为此，我们假设：（1）对于任意，当时有；（2）在上连续，且有界，即存在使；（3）在上一次可微，且在内有. 记此类效用函数为，即这中类型的效用函数仅能反映出财富与风险的关系，但不能反映出决策人对待风险的态度.因此中既可包含厌恶的效用函数，也可包含喜好风险和风险中立的效用函数.为此，还可以进一步分类.2 递增的凹效用函数这种效用函数是递增的，故设，而且是严格凹的，即在上具有二阶连续有界的导数.记为实际中常用的类函数有幂函数：对数函数：指数函数：根据风险和效用函数的关系，当存在，且时，定义对待风险态度的局部测度为即是效用函数的曲率测度，可以证明：如果，则决策人的财产为时，他是厌恶风险的.如果，则决策人的财产时，他是风险中立的.如果，则决策人财产为时，他是追求风险的，而且愈大，他愈厌恶（或追求）风险.3 递增的厌恶风险的效用函数实际中，多数决策人对小额盈亏的态度是随着财富的积累而变化的，他们的财富积累愈多，对小额盈亏所冒风险的厌恶程度愈小.因此，我们假设是的非递增的函数，则可以得到一类效用函数，记为即是的一个子类. 由于当时，是非递增的。要使，即则故因此，类函数存在的必要条件是但不是充分条件.上面给出了适应于不同情况的效用函数的基本形式，实际中需要依据具体问题的性质，来选用合适的效用函数，对问题进行研究.16.3 DVD在线租赁问题数学模型16.3.1 问题提出随着信息时代的到来,电子商务已成为一个重要的商业途径.在线DVD租赁就是其中一种典型的经营方式，但在实际的经营过程中还是存在很多问题.下面我们从复杂的现实情况中考虑一个典型的情景. 鉴于业务量的考虑，网站有必要采用会员制度，顾客需缴纳一定数量的月费成为会员. 会员对哪些DVD有兴趣，只要在线提交订单，网站就能立即了解他们的需求，并通过快递的方式尽可能满足要求.会员提交的订单内容包括他对哪几张DVD感兴趣，对不同的DVD的偏爱度，用数字表示.这些DVD是基于其偏爱程度排序的.网站会根据手头现有的DVD数量和会员的订单进行分发.每个会员每个月租赁次数不得超过2次，每次获得3张DVD.会员看完3张DVD之后，只需要将DVD放进网站提供的信封里寄回（邮费由网站承担），就可以继续下次租赁.1、由于DVD的更新速度很快，网站必须时常更新现有产品，因此在现有会员中随机抽取1000个会员进行调查，以得知愿意观看不同DVD的人数（表1.1给出了其中5种DVD的数据）.虽然网站规定每位会员每月只能借两次DVD，但从历史数据显示，60%的会员每月租赁DVD两次，而另外的40%只租一次.现在我们假设网站现有10万个会员，并已经知道会员对DVD的需求，以及会员每月订DVD的规律.问题是应该至少准备多少张，才能保证希望看到该DVD的会员中至少50%在一个月内能够看到？如果要求保证在三个月内至少95%的会员能够看到呢？表1.1 对1000个会员调查的部分结果DVD名称DVD1DVD2DVD3DVD4DVD5愿意观看的人数200100502510 2、尽可能多的满足会员是经营中的一大目标，但每个会员对不同DVD的偏爱度是大相径庭的，虽然他们都对该DVD下了订单，但最后得到该张DVD收到的效果差别很大，所以还要考虑会员满意度的问题.表1.2列出了网站中20种DVD的现有张数和当前需要处理的100位会员的在线订单.如何对手中已有的DVD进行分配，以使所有会员的满意度和达到最大？表1.2 现有DVD张数和当前需要处理的会员的在线订单（表格格式示例）DVD编号D001D002D003D004DVD现有数量812210会员在线订单C00010020C00021090C00030600C00040000C00055000D001D020表示20种DVD, C0001C0100表示100个会员，会员的在线订单用数字1,2,表示，数字越小表示会员的偏爱程度越高，数字0表示对应的DVD当前不在会员的在线订单中. 3、在实际的经营过程中，不可能像刚才讨论的两个问题这么简单，我们不可能将顾客的满意率与他们的满意度割裂开来分开研究，可以说这是两个问题是相互牵制的关系.假设表1.2中DVD现有数量全部为0.作为网站经营管理人员，如何决定每种DVD的购买量，以及如何对这些DVD进行分配，才能使一个月内95%的会员得到他想看的DVD，并且满意度最大呢？只有弄清楚这个问题，我们才能初步的对DVD在线租赁问题有个认识. 16.3.2 问题分析问题一类似于“货物存储问题（Inventory problem）”，基本思路是跟踪DVD在一个月（三个月）内的流动情况，目标是计算出DVD的流转次数，然后再结合满意率要求得出所需准备的DVD数量.问题二类似于“分配问题”或“指派问题（Assignment problem）”，我们可以对偏爱度进行适当的处理以满足我们的要求.0-1规划是处理该问题的最佳方法，因此如何使用这一方法将是研究问题二的关键.问题三看似是问题一与问题二的结合（存贮+分配），但实际要复杂得多.它综合考虑一个月内DVD的购买、分配方案，是一个多目标线性规划.从经济效益看，在保证95%以上会员一个月内看到想看的DVD的情况下，希望购买尽量少的DVD，从社会效应看，则要尽可能多地考虑让总的满意度最大.这时，可以将多目标规划变为单目标规划，以求得一个经济与社会效益的综合最优.由于问题三牵涉到两次分配，而对会员满意率的理解又有多种解释，因此目标及约束函数会和问题一、问题二有很大差别.而问题三的模型又可从当前满意度最大和一段时间内满意度最大两个角度来考虑.16.3.3 假设条件 1.对1000名会员的调查足以反映10万名会员对于各种DVD的需求及喜好；2.所有会员提交订单的时间是随机的；3.一个月的天数为30天；4.会员中有60%的会员每月租赁DVD两次，40%的会员每月租赁DVD一次；5.会员只有在需要再次租赁DVD时，才会将上次租赁的DVD归还；6.会员临近两次借的DVD种类不会重复；7.每位会员每月至少租赁1次；8.会员本次提交后没得到该DVD，则他下次仍要看该DVD，且偏爱度不变；9.每类租赁出的DVD有60%在每月租赁2次的会员中，40%在每月租赁1次的会员中；10.公司收到订单时不知道此会员在一个月内会借一次或两次.在实际建模中还会遇到其他问题，比如问题一中可以淡化会员每次借三张的条件，即会员每次借的DVD数量不固定；问题二中不考虑多次分配的问题；问题三中对顾客满意率的不同理解.因此，我们将在以下讨论具体问题时再给出.16.3.4 模型建立与数值求解参数与变量说明：第时间节点上第种DVD的可分配量；：所有会员中愿意观看第种DVD的人的概率；：所有会员中每月借2次的人的概率；：需要满足的会员比例；：会员总数；：所考虑的时间跨度，即月份数；：第个会员对第种DVD的偏爱程度；：第个会员对第种DVD的满意度；：分配变量，表示第个会员得到第种DVD，否则为0；：网站第种DVD的现有数量.其余特殊的变量将在后面的讨论中具体说明.问题一：悲观情况估计一个月假设DVD1其购买量为，从表1可以认为想看DVD1的有2万人，而会员一个月借1次或借2次是随机的，这就可能出现极端的情况，即第一次分配时正好所有1类会员都分配到了DVD1，我们把这种情况称为悲观情况.则的一部分首先被会员总数40%的1类会员借走了，而且在该月不会归还.那么，为了保证至少有50%的会员在一个月内能看到该DVD，则DVD1总的购买量应满足：同理，设为愿意看第种DVD的人的概率，可从表1中将愿意看该DVD的人数除以总人数可获，则5种DVD的购买量为:DVD名称DVD1DVD2DVD3DVD4DVD5购买量9000450022501125450问题一：悲观情况估计三个月从“一月情况”，我们可以推广到“三月情况”.如果，则每次分配都将只能由每月借一次的会员的到DVD，这样三个月中DVD1的流动量就仅为，为了保证至少有50%的会员在一个月内能看到该DVD，那么此时DVD1总的购买量应该满足同理，对于其余4种DVD的购买量有，为保证三个月内至少95%的会员看到他想看的DVD，每种DVD的购买量为：DVD名称DVD1DVD2DVD3DVD4DVD5购买量633431671584792317 问题一：均值情况估计现实中，每天都会有订单提交，也有DVD归还，而且都是服从参数为的普哇松分布.考虑平均情况，认为：60%的会员15天归还DVD，40%的会员一个月归还，即对于每张DVD有60%的可能15天流通一次，40%的可能30天流动一次.假设所有会员在每个月的某天（不妨为1号）提交订单，那些2类会员也集中在15号归还并提交下一份订单，则可以发现上述的简化是普哇松分布的平均情况.因此，在处理时可以不考虑每个会员的具体租赁、归还的时间，而只考虑每个月两次的分配方案，即1号和15号的分配方案. 同时，在DVD租赁出去后，对于某种DVD，是均匀的分布在1类会员和2类会员中，即在15号，该DVD将有60%归还.我们用下图表示租赁情况，每块代表长度为15天的时段，上方的箭头表示该时刻借出的数量，下方表示归还的数量.则初始时刻有张可用于分配第二次第四次第六次第一次租赁第三次第五次对于“一月情况”，仅观察上图中的前两段.在分配时，每张DVD都有60%的可能被分配给一月个借2次的会员，40%的可能分配给每月借1次的.在初始时刻会将所有DVD借出，因此，即表示网站对的购买量，而问题目标则是要求出的最小值，以达到效益的最优. 由假设可知，第1个月月中有的归还，另外40%仍在会员中，这时网站可将的借出.则与有如下关系：这样就可以计算在一个月中的流通量即一个月内DVD的流通量为月初购买量的1.6倍，称这个“1.6”为“一月流通系数”.那么DVD一个月最小购买量可通过以下公式来计算：由表1得到1000人中愿意观看每种DVD的概率分别为：由于这1000人为10万人的子样本, 也可表示10万人中愿意观看每种DVD的概率.则表示10万人中愿意观看第种DVD的人.经计算，各种DVD的最少月初购买量为：DVD名称DVD1DVD2DVD3DVD4DVD5购买量625031251563782313总的最少购买量S=12033问题一：均值情况估计三月该情况需要考虑6个时段，而且各个时段节点互相影响.在“一月情况”中已经知道与之间的关系：在第3个时间点，会有张DVD归还.观察张DVD的组成，第1个时间点有40%的DVD分配给了1类会员，则在第3个时间点归还，数量为.而对于第2个时间点中收回的部分DVD同样有60%的可能分配给2类会员，40%的可能分配给1类会员，因此在第3个时间点，会有60%的人归还，数量为.则第3个时间点收回的来源于两个部分，分别为第1时间点借给“一类会员” 的DVD以及第2个时间点借给“二类会员”的DVD.所以有.三个月内6 DVD租出数如下：第一次：第二次：第三次：第四次：第五次：第六次：由此，可以得出一个通用的递推公式：通过上面的递推公式就可以建立与“一月情况”相似的模型：经计算，各种DVD的最少月初购买量为DVD名称DVD1DVD2DVD3DVD4DVD5购买量423221161058529212总的最少购买量S=8147.由上面的递推公式可得“三月情况”中DVD的流通量：式中“4.49” 为“三月流通系数”.问题一：理论证明事实上，不必认为所有人都在1号来借DVD.以DVD1为例，设某种DVD一个月内被看到1次的概率为0.4，被看到2次的概率为0.6，则其服从分布：为使想看该DVD的会员中至少50%在一个月内能够看到，即要成立的概率尽可能大，不妨取：由于是独立同分布的，且的数量很大，有中心极限定理知，近似服从正态分布.将其化为标准正态分布即为：查表并求解得：同理也可推出其他解，由此证明了均值情况下的估计是完全可行的.问题一：一般情况推广在上面的基础中，我们把模型推广到范围更广的现实经济生活中.假设通过问卷调查分析推算出任意客户群体的借阅分布情况，设为2类会员的概率，为需要满足的会员比例，为所考虑的时间跨度，即月份数，为会员总数，则可得到下面更一般的带约束的线性规划模型（这里人设DVD种类为5种）：16.3.5 问题二的模型与求解问题二是在现有一定数量DVD的前提下，如何分配以使会员总的满意度最大.这与“分配问题”或“指派问题（Assignment problem）”有很多相同点.我们可以通过一些变化来使求解“分配问题”的模型能运用于该问题. 我们把问题二中“100个会员对DVD的需求” 理解为“需要完成的100项任务”，“20种DVD数量”理解为“有个人可以承担这些任务”，“会员对于不同DVD的偏爱度”理解为“不同人去完成不同工作的效率”，通过类比就能把分配问题的模型运用到问题二中了. 分配问题最常用的方法是0-1型整数规划.在具体使用前，还需要将每个会员对不同DVD的偏爱度转化为满意度.因为我们的目标是总体满意度最大.从表1.2中可以看到：会员的在线订单用数字表示，数字越小表示会员的偏爱程度越高，数字0表示对应的DVD当前不在会员的在线订单中.通过观察我们用一个大于9的固定数值来减偏爱数,把这个差值作为满意度.问题二:参数定义 1、设矩阵为偏爱度矩阵，矩阵中的元素为表1.2中的偏爱数，表示第个会员对的偏爱数.越小表示会员的满意程度越高，为1时最高，为0时表示客户没有下订单.于是就得到了偏爱度矩阵.2、设矩阵为满意度矩阵，矩阵中的元素为满意度，表示第个会员对第的满意度. 可通过如下算法获得：通过矩阵就能应用0-1规划进行求解.3、令为分配变量，表示第个会员得到；表示未分配给第个会员.由此得到我们要求的分配矩阵为：4、令表示的现有数量，则有数量矩阵.5、令表示所有会员满意度的总和，我们的目标就是求出其最大值.问题二:模型建立 1.因为表1.2中的数字0意义特殊，不直接与满意度产生关系.0代表该DVD没有出现在订单中，即会员不需要看该DVD.从分配费用考虑，避免把该DVD分配给会员.根据的定义，不妨认为：，则时，也等于0，即避免了上述情况的发生.2.由于一次最多只能借3张，那么就有：，又分配给各会员的数量肯定不超过现有数量，所以：.由以上分析可得问题二的模型：用LINGO 数学软件实现对此题0-1规划模型的求解.问题二:模型改进-约束条件改进根据上述模型的求解，我们发现有些会员没有分配到3张DVD，即他们的需要没能被满足.从网站的社会效益考虑，这样的情况会导致网站客户的流失.所以希望在满足所有会员都能借到3张DVD的前提下，再通过会员总满意度最大来决定分配方案.这就需要对上面的模型做一些改进.我们可以将改为，则得到模型问题二:模型改进-约束条件改进以上修改，约束条件加强了，可能导致模型无可行解.事实上通过LINGO 程序也发现该模型无解.因为约束条件中规定了不能分配给会员不要的DVD，而会员每次都被分到3张，则网站至少有300张DVD，而现仅有303张，只比最低限度多3张，则当某DVD需求较大时就会供不应求.所以要放宽条件1，才能找到最优解.最优值在第165次迭代后得到.以上两个模型的结果是相同的，由于约束条件的放宽，后一个模型的迭代次数较少，则在说明每个会员一次能借到3张DVD不会影响会员整体满意度，而且从模拟结果看，改进后的对原有分配策略影响不大.问题二:模型改进-满意度定义改进以上的讨论都是基于用一个固定数去减会员偏爱数作为满意度来分析的.但存在一定的不合理性.比如，当看到了最想看的DVD时，心理上满足是非常大的，但若仅仅得到了第二想看的DVD，那样满足感会大打折扣，而如果仅得到了第三想看得DVD，满足感会更低，但与仅获得第二想看的DVD相比，也许失落感并不会如没有获得第一想看的DVD那么大.所以，如果只是简单得把会员订单中的DVD进行了相同差别的处理，无法表示出会员的真实满意度差别.所以我们想到了用偏爱数的倒数来表示会员的满意度，对满意度矩阵的元素重新定义：把新定义的满意度代入上述模型中，并由LINGO 程序计算，最优值在第54次迭代后得到.我们对分配策略的分析发现，该结果与上一个模型相比并没有太大的变动，这是因为两种满意度的定义其实质是一样的.16.3.6 问题三的模型与求解在现实的网站经营中需要综合考虑问题一、二，这就需要我们进一步讨论问题三的模型，它需要考虑两次分配方案，但我们可以简化为仅考虑当前时间点下如何用最小的DVD购买来满足95%的会员并找出最佳分配方案使会员总满意度最大.那么如何将这两个目标同时放入一个目标函数呢，最简单的方法就是相加.由问题二知道，目标是使所有会员满意度总和尽可能地大，而且每种DVD数量是固定的，但问题三中DVD的购买量是自己定的，因此设置一个新的变量表示当前需要购买的数量，则表示总的购买数量，而且从盈利角度考虑总的购买数量越小越好.所以我们可以将目标函数定如下：问题三:等权情况（会员总体满意度与DVD购买量权重相等）针对“使一个月内95%的会员得到想看的DVD”的要求，可以参照问题一的处理方法，从表1.2中统计出原意观看的人数占全体会员比例.结果如下：DVD名称 DVD1DVD2DVD3DVD4DVD5DVD6DVD7DVD8DVD9DVD10愿意观看人数53374634374242484151占全体会员比例0.530.370.460.340.370.420.420.480.410.51DVD名称 DVD11DVD12DVD13DVD14DVD15DVD16DVD17DVD18DVD19DVD20愿意观看人数48414345524143454431占全体会员比例0.480.410.430.450.520.410.430.450.440.31由问题一的流通量可得. 由于网站可自由决定其DVD的购买量，则有.为了计算上的方便直观，我们选择用10减会员偏爱数来定义会员满意度.并建立模型.最优值在第85次迭代后得到:Z=1878.问题三:不等权情况（会员总体满意度与DVD购买量权重不相等）如果不考虑会员总体满意度与DVD购买量之间的权重差异，这会导致其中某个目标对整个函数的影响被过分夸大，所以有必要进行标准化.先来看的最大值和最小值.对于当前的分配，最理想的是每位会员都得到了最想看的3张DVD，此时就达到了最大值.通过表1.2的统计我们得到最大值为 . 最差情况就是会员得到了3张没有出现在订单中的DVD，此时达到最小值0.再来看的最大值和最小值.由“每位会员每次分配到3张DVD”和“一个月内95%的会员得到想看的DVD”的约束，则由计算出各种DVD最小购买量，相加得的最小值522.只要某DVD出现在订单中，就应将其购入，也就是说保证会员可以拿到他想看的任何一张DVD，则会员在一个月中的满意率为100%.此时，统计各种DVD的购买量并相加得的最大值为864.问题三:不等权情况（会员总体满意度与DVD购买量权重不相等）我们取和的最大值及最小值的平均数1200和693来确定各自权重.因此，它们的权重分别为和.建立带权重的模型：同样用LINGO 程序对其进行求解，最优值在第116次迭代后得到Z=688.43，DVD购买总量为532张.比较两个模型的计算结果，发现DVD的购买量和分配策略没有发生变化，这是由于和的数量级相差并不大.问题三:综合最佳方案以上的决策是基于当前时刻的考虑.事实上，60%的DVD会面临二次分配，考虑所有会员在一个月内总的满意度就需要对二次分配进行分开考虑.在此我们假设：不要求会员每次借DVD都必须被分配到3张，但分配到的必须是在其订单中的.而每次只有拿到3张的会员才能算满意.由于要对二次分配进行讨论，所以需要设置两个新的变量：1、：第一次分配的分配变量，表示第一次分配时第位会员得到了表示第一次分配时第位会员未得到2、：第二次分配的分配变量，表示第二次分配时第位会员得到了表示第二次分配时第位会员未得到因此在等权情况下目标函数应为：问题三:综合最佳方案约束条件 1假设会员在这一个月不会两次借相同的DVD，则可以表示为2每次分配每位会员最多得到3张DVD，即，.3第一次分配时最多只能分配出新购入的DVD，则.4考虑前后两次分配的关系，平均情况下，可以近似的认为每种DVD每次都有60%借给2类会员，40%借给1类会员.所以有：不等式右边表示网站在第二次分配时可用于分配的数量.5因为规定在一个月中必须有95%的会员被满足要求，所以DVD总的数量需大于1.60.951003+1.60.051002=472，相应的约束条件为: .问题三:综合最佳方案权重设置对于理想情况是两次分配都给会员最想看的3张DVD，而且会员不想看已经看过的DVD，则一个中月获得的最大满意度为9+8+7+6+5+4=39，以60%的2类会员记，一个月所有会员最大满意度为100*(9+8+7)+60*(6+5+4)=3200;而最差的情况是每次会员都只得到了不在其订单中的DVD，或没得到DVD，则有：对于的最大、最小值取值方法和上次讨论的一样，计算得到分别为864和472.同样取中间值来确定权重，分别得到的权重为，的权重为.问题三:综合最佳方案模型综合上述分析，得到“最佳方案”的模型：用LINGO 程序求解，最优值在第2482次迭代后得到Z=815.6966，DVD购买总量为472.16.3.7 模型评价问题一我们分别对悲观情况估计和平均情况估计进行讨论，并且用概率的理论证明了结果的正确性.问题二我们在原始0-1模型的基础上做了多次改进，对会员每次得到的DVD数量做了严格限制，得出的结论是会员总的满意度没有变化；对满意度的定义做了改进，并发现对分配策略的影响也不是很大.在问题三中我们将问题一与问题二的要求结合在一起进行考虑，将两个目标加权后放在一个目标函数中进行讨论.从相对简单的“当前情况最佳方案”进行研究，并将问题分为等权与不等权两种情况进行讨论.然后我们对分配的全过程综合进行考虑，并建立了一个综合模型，经LINGO程序求解后得到了“综合最佳方案”.从两种模型的DVD购买量来看，“当前情况最佳方案”所需购买的DVD数量大于“一月综合最佳方案”所需购买的DVD数量，这是由于后一模型考虑了DVD的循环使用，降低了DVD的所需的储备量.第十七章多目标决策分析方法实际中，许多决策问题都属于多目标决策问题，特别是工程系统和社会系统等领域，大量的决策问题都有多个目标，具有两个和两个以上目标的决策问题统称为多目标决策问题.例如，一家公司（或企业）要确定下一年度的投资组合方案问题，在可供选择的多个候选方案中，往往是收益与风险并存，而且收益越高，风险也就越.如何选择合适的投资组合方案，是收益最高风险最小呢？这显然是一个双目标的决策问题.又例如，在人才的选拔使用、招聘录用、选优评奖等活动中，由于每个人都有不同的特长、优势和劣势，组织部门总是要综合考虑各方面的情况，作出决策使得各方面的条件优势最大，劣势最小.多目标决策问题的最主要的特点是各目标间的矛盾性和不可公度性.所谓目标间的矛盾性是指如果试图采用某一种方案去改进一个目标的值，则可能会使另一个目标的值变劣.而目标间的不可公度性是指各目标间一般没有统一的度量标准，因而不能直接进行比较，由于目标间的矛盾性和不可公度性，则不可能将多目标的问题直接归并为单目标的问题来解决.如何克服目标间的矛盾，在不可公度的目标间建立一种可以度量的指标（即效用函数）来求解多目标决策问题，这就是本章多目标决策分析方法要研究解决的问题.17.1 多目标决策分析的基本概念17.1.1 多目标决策问题1.多目标决策问题的解决过程多目标决策问题的求解过程主要可分为四个步骤：第一步：问题的构成，即对所需要解决的实际问题进行分析，明确问题中的主要因素、界限和所处的环境等，从而确定问题的目标集.第二步：建立模型，根据第一步的结果，建立起问题的一个适宜模型.第三步：对模型进行分析和评价，即对各种可行的方案进行比较，从而可以对每一个目标标定一个（或几个）属性（称为目标函数），这些属性的值可作为才用某方案时各个目标的一种度量.第四步：确定实施方案，即依据每一个目标的属性值和预先规定的决策规则比较个可行方案，按优劣次序将所有的方案排序，从而确定出最好的实施方案.2.多目标决策问题的基本要素任何一个多目标决策问题都包含有五个基本要素：决策单元、目标集、属性集、决策情况和决策规则.决策单元是指制定决策的人，可以是一个人，也可以是一群人.目标事故关于决策人被研究问题的“要求”或“愿望”，决策人可以有若干个不同的目标，即构成一个目标集.通常情况下，目标集可以表示为一个递阶结构.属性是实现目标程度的一个度量，即每一个目标都可以设定一个或若干个属性，即构成一个属性集.目标属性是可度量的，它反映了特定目标达到目的的程度.决策情况是指决策问题的结构和决策的环境，即说明决策问题的决策变量、属性，以及度量决策变量与属性的标度、决策变量与属性之间的因果关系等.决策规则是指用于排列方案优劣次序的规则，而方案的优劣是依据所有目标属性的值来衡量的.3.多目标决策问题的数学模型设为方案集，它是决策变量的集合，表示目标函数.对每一个给定的方案,由目标函数可以确定每一个属性,的值.实际中，方案可以是有限的，也可以是有限的，也可以是无限的.在这里我们假设决策变量的所有约束都能用不等式表示出来，即其中均为决策变量的实际函数.则方案（又称决策空间中的可行域）可以表示为 . 于是，一般的多目标决策问题的数学模型可以表示为 ()其中(decision rule)表示决策规则，即上式的意义是运用决策规则依据属性，的值在中选择一个最好的方案.例如，如果设有一个确定的无限个方案的多目标决策问题，其属性集为，目标集为，方案集为，决策规则为如果有某方案能使所有属性都能达到最优（最大或最小），则可选择这个方案，即决策问题的解.否则，可选择一个非劣解,使能最好的满足决策人的要求.求解多目标决策问题的非劣解，即求向量最优化问题（）的解.所得非劣解（非劣方案）集为,即可能是单元素集，也可以是多元素集.如果是多元素集，则说明非劣解是不惟一的，决策人可根据自己的偏好选择他认为最好的方案.选择方案的方法主要是依据决策人的“偏好结构”，一般偏好结构可用效用函数来表示，即用函数来表示非劣方案的效用，故问题转化为求解的问题.17.1.2 多属性效用函数多属性效用函数理论是单属性效用理论的推广，效用理论可分为确定型的和不确定型的两种情形.对确定型的效用函数通用定义为价值函数，对于更多的不确定型的情况，一般都是根据问题的实际意义来定义相应的效用函数.1. 常用确定型的价值函数对于确定型的效用函数通常定义为价值函数，最常用的是加性价值函数.设分别表示个属性所有可能值的集合，为属性集，即.对于某一个确定的方案,对应属性向量，其中，表示对应于方案的第个属性的取值.为了方便，也称为方案，并用表示第个属性的价值函数.如果一偏好结构的价值函数能用加性表示时，则，其中为标度常数，且.实际上，我们可以证明：如果每一个独立于其他的属性，则价值函数可以用加性表示，即式成立.进一步还可以引入价值函数的拟加性形式和乘法形式等.2.不确定型的效用函数对于确定型的问题，一个方案只产生一个后果，而对于不确定的情况则不然.在上一章随机性决策分析方法研究单目标决策中，我们知道，很多情况一个方案的后果不仅取决与这个方案，还依赖于自然状态，而自然状态也是不确定的，往往不受决策人控制.现在将随机性决策分析的理论推广到多目标决策问题，即不确定情况下的多属性效用理论.由于后果是多属性的，类似于确定型效用函数的情况，对于决策人采取任一个行动方案的后果记为,为后果集.其中（属性）表示第个属性的值.对于任一后果集以概率出现，为此，我们可以定义展望来表示次不确定事件.定义展望为 .所有展望的集合记作 (展望集).对于任何一个后果集每个展望都有相应的概率分布,把与相关联的展望记作.由于后果的多属性的不确定性，我们可以视每一个属性为一个随机变量，并有相应的边缘概率分布.如果把后果的效用函数记作，而把条件效用函数记作.由此，我们可以给出下面的定义.定义 17.1设是属性集中的任何正常子集，且.如果对于中的任意两个展望和，他们对应的联合概率分别为和，并且当时有（二者无差异）.则称子集为价值独立的.定义中的和均表示子集上的边缘概率分布，即说明在上的任何两个展望无差异关系不仅依赖于其边缘分布，而且依赖于其联合分布，并有下面的定理.定理17.1 如果定义在上的个属性效用函数为，对于任意的，有当且仅当，则效用函数可以表示为加性形式当且仅当在属性集上价值独立性成立. 类似地，在一定的条件下，也可以引入效用函数拟加形式和乘法形式.17.2 多目标决策问题的非劣解由于对目标决策问题客观存在这两个基本特点：目标间的矛盾性和目标间的不可公度性.因此，多目标决策问题一般不存在通常定义下的最优解.即不存在满足约束条件，又能是所有的属性分别达到各自的最优值.于是，一般情况下，只能来寻求问题的非劣解.17.2.1 非劣解的概念求解多目标决策非劣解的问题，即是在决策空间的可行域中求解多目标优化（或向量优化）问题或.问题的非劣解也称为有效解，或帕雷托最优解.如果一个多目标决策问题为一多属性的极大化问题，则问题可以为对于决策人来说，一定喜好每个属性都有极大值的方案，这种偏好可以为这里意味着且至少存在一个使，式称为单调性条件.于是，我们可以给出非劣解的定义.定义17.2 设是问题的一个可行解，如果不存在其它的可行解使成立，即，且至少存在一个使成立.则称为问题的一个非劣解.17.2.1非劣解的求解方法如何求多目标决策问题的非劣解呢？在这里我们主要介绍最常用的加权法和约束法.1. 加权法加权法是求解非劣解的一种最传统的方法，即对于向量优化问题中的目标函数进行加权，变换为如下的数量优化问题亦即为一个非线性规划划问题.根据非线性规划问题的库恩塔克（Kuhn-Tucker）条件可得可行解为非劣解的必要条件为实际上，可以证明：当权值时，则问题的最优解是问题的非劣解，但当至少有一个时，则问题的最优解不惟一，这些最优解可能会是问题的劣解.现在的问题是如何来选取合适的权值？关于权值的取法可能容易同决策人对各属性的偏好联系在一起，如果用来表示决策人的偏好程度，则所得的解是最佳调和解（即决策人最有可能选用的解），但未必是问题的非劣解.因此，我们在研究非劣解时，不考虑决策人的偏好，即权值不具有任何价值意义，仅仅作为寻求非劣解的参数来考虑. 一般情况下，可以证明：对于给的一个权向量，如果数量化问题有最优解，当为的惟一解，或时，则是问题的一个非劣解.即意味着无论目标函数和可行域是否为凸的，只要适当地选取权向量总能得到问题的一些非劣解.相反地，如果目标函数和可行域为凸的，则对于任何确定的非劣解，总能找带权向量使是问题的最优解.换言之，如果目标函数和可行域的凸性条件成立，则问题的所有非劣解都能从求解问题得到.但是，对于给定的非劣解，对应的全向量不一定是惟一的.2. 约束法约束法是寻求非劣解的另一种常用的直观方法.对于多目标决策问题，首先根据决策人的偏好任意选择一个属性.例如，第个属性，要求，然后考虑求约束问题（线性或非线性问题）的最优解.在一定条件下，问题的最优解就是原问题的非劣解.其中与无关的常数，其要求条件就是保证有解. 一般情况下，求解的问题，可以通过相应的库恩-塔克条件实现，即 17.3 多目标群决策问题的解前面所研究的多目标决策问题，我们总是假设决策人是一个人，但在实际中许多决策问题可能会涉及多个人（一群人）的利益，该人群中每一个成员都有权参与问题决策方案的选择.如何综合这个群中各个成员的利益使之形成群的意见，最后制订出决策方案，这是一类非常重要的群决策问题.17.3.1 多目标群决策的数学模型多目标群决策问题的一般数学模型如下：设有一决策群包含有个决策人，其中第个决策人有个目标分别为（方案集）.在这个决策问题中，第个决策人的最优决策可归结为求优化问题： (17.10)其中进一步，如果假设每一个决策人都有相应的多属性效用函数则对第个决策人的目标就是选择合适的方案使其效用函数达到最大，即（17.10）式等价为对于决策群中的个决策人来说都会企图使自己的效用函数达到最大，因此，群决策问题也可以表示为（17.11）如果记维向量则（17.11）式就可以表示为特别地，如果决策群中的每个人的目标都是一致的，即共同的目标函数为则问题为（17.12）17.3.2 多目标群决策问题的求解方法多目标群决策问题是非常复杂的，如果不是试图寻求最佳的调和解，只求非劣解和帕雷托最优解，则问题可以作为一个两级优化问题来解决.第一级优化是选择合适的方案使对每一个决策人都是非劣的，即不存在另一个方案使任何一个决策人的某一个目标函数值得到改进，则又不损害其他的目标函数值.第二级优化是选择合适的方案对于决策群为帕雷托最优，即不存在另一方案对群中的某一个成员产生更大的效用，而不降低其他成员的效用.这两级优化问题必须同时求解，实际中，具体的实现是非常困难的，主要表现在进行群的价值判断时要进行人与人之间的效用比较，这种比较通常难以实现，并随着目标数目的增多，困难也随之增加.另一种将多目标群决策问题（17.12）化为二级优化问题的方法可以回避上述方法中要进行人与人之间的效用比较的困难.而是首先将个决策人的目标作为个子系统，分别寻求决策方案使他们各自的目标达到最优，即求个子系统的优化问题：这样所得到的个决策方案一般不会完全重合，因此，不能形成统一的群最优决策.然后，设想在个决策人之上还有一个总协商人，按照某种优化原则来协调个决策人之间的矛盾.这样就形成了一个两级递阶系统的优化问题，即子系统优化级和协调优化级.目前，这种方法对于单目标的群决策问题和某些特殊的多目标群决策问题已得到了应用，而对于一般的多目标决策问题还处于理论研究阶段.17.3.3 同目标的群决策问题的解法下面我们就个决策人有相同的个目标，其目标函数（属性）为于是问题可以表示为 (17.13)其中表示问题的属性向量，Y为方案集X在目标函数的空间中的映射的像集（属性集）. 下面我们按照“多数规则”：如果是问题的一个解，则不存在另外的使决策群中有一半以上的人认为，所有这样的解的全体构成的集合记作，称为多数核.即如果把限制在对应的非劣解的集内，可以用17.2节中的约束法求非劣解，则由此可以求得属性为其他属性的函数，即，将其代入（17.13）式中有 (17.14) 如果仍记，相应的属性集为，即此处的,则将问题（17.14）与（17.13）相比较，变量的个数减少了一个，从而使问题简化了，这样可以继续做下去.如果我们已求得一个或多个和使即得到了问题的多数核.实际上，可以证明：当决策人数为奇数时，多数核只有一点；当决策人数为偶数时，多数核将是一个点集.并且，当时，在一定的条件下，多目标群决策问题的多数核是存在的.17.4 股份制公司的综合投资问题17.4.1 问题的提出对于股份制公司（或企业）而言，每年都要召开股东大会，研究确定下一年度的投资方案，使其利用有限的资金获取最大的投资收益和最小的风险.对于每一个股东，将会根据自己的利益在可能的投资方案中总是选择对自己有利的方案，董事会将综合各股东的意见和所持股份做出最后的投资决策方案.这是一类非常有代表性的问题，一般的问题可以描述如下：设某股份公司（或企业）有个股东，每个股东所持古风的比例分别为公司计划投入万元资金用于下一年度个预选项目的投资，对任何一个投资项目都是风险与收益并存，并且风险随着收益的增加而增大.实际中，每个项目的收益和风险都与一些不确定的因素有关（即可视为随机变量），其期望值分别为.董事会规定，如果确定投资某一个项目，则该项目至少投资万元.现

展开阅读全文

第十六章 随机决策分析方法

最新文档

第十六章随机决策分析方法