资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,4.1,引言,4.2,模拟结果统计分析面临的问题,4.3,终态模拟的输出分析,4.4,稳态模拟的输出分析,4.5,多方案模拟输出的比较,第,4,章 模拟结果的统计分析,什么是输出分析?,为什么要进行输出分析?,输出分析的两种状态,系 统,(结构数量是确定的),(结构参数是随机的),输 入,(参数是随机的),输 出,?,确定的输入激励一个确定的系统,得到的输出就是一个确定的输出。通过一次确定的模拟便可得出解。,随机的输入激励一个随机的系统,得到的输出是,?,输出的表达形式如何?需要经过多少次的模拟才能说明输出结果?,输出分析的目的在于预测一个系统的性能,或比较两个或多个不同系统设计的性能。估计系统的性能参数,以及性能参数估计的有效范围。用模拟统计得到的,作为观察值的估计量。统计得到的方差,S2,就是估计量的偏差范围。或确定出达到给定精度所需的观察次数。,在离散事件模拟中,大多数模拟输出数据呈现出自相关的特征,即:前面的输出往往会影响到后面的输出数据。,如:库存系统中的初期库存、生产系统中的初始状态、排队系统中初始排队状态和初始服务状态等。,4.1,引言,4.1,引言,-,输出状态,终态模拟就是指在某个持续时间,T,E,之内系统的模拟,这里,E,是停止模拟的一个指定的事件,这样被模拟系统在指定初始条件下于时刻,0“,打开”,并在停止时刻,TE“,闭合”。终态系统常被用来研究系统的固有特性,研究系统在初始条件作用下的响应。,非终态系统是指系统在持续循环运行时间内,前一时间结束的模拟结果影响到后一时间的模拟条件。非终态系统是连续运行的系统,至少在很长一段时期内运行。稳态系统模拟常被用来研究系统对外界条件变化的响应能力。通常稳态系统的响应与系统的初始状态无关。,暂态(终 态),稳态(非终态),4.1,引言,-,例题,选择终态,/,稳态模拟,例如,考虑对企业中一条流水线进行模拟,如果我们的模拟目的是为了了解该流水线从完好状态开始到第一次出现故障的间隔时间的分布,那么我们就应采用终态模拟方式;,如果我们希望了解的是由该流水线生产的产品的合格率,则应该采用非终态模拟方式。,4.1,引言,-,过渡状态与稳定状态,在模拟模型的上述两种运行方式下,模拟系统都可能经历两种不同的状态,即,过渡状态,(Transient State),和,稳定状态,(Steady State),在对模拟模型的输出进行统计分析时,应该分清采样数据是在当模拟系统处于过渡状态时采集的,还是在稳定状态时采集的。,对于一个离散事件模拟系统,假设,s(t,),是,t,时刻系统所处的状态,,P,s,(t,),是在时刻,t,系统处于状态,s,的概率。如果有,t,0,满足:,则我们称当,tt,0,时系统处于稳定状态,而在,tt,0,系统处于过渡状态。,当系统处于稳定状态时,,系统处于某一个状态的概率是不变的,,但系统仍然可以从一个状态变到另一个状态,4.2,面临的问题,由于在离散事件模拟模型中往往有许多随机变量,从而模拟的输出亦是随机变量,因此直接使用模拟模型的输出结果就有可能对实际系统作出错误的结论。,例:,现考虑一个,M/M/1,排队系统,此时顾客的到达间隔时间与服务员的服务时间均服从指数分布,假设到顾客达间隔时间的均值为,6,分钟,服务员服务时间的均值为,4,分钟。从排队论的理论分析,该排队系统的平均排队时间应为,Wq,8,分钟。下表给出的是,10,次模拟的结果,(,每次模拟时间为,10,天,即,14400,分钟,),模拟次数,1,2,3,4,5,6,7,8,9,10,平均值,到达顾客数,2501,2334,2342,2454,2315,2391,2402,2312,2366,2367,2378.4,平均排队时间,9.89,5.93,7.39,8.11,5.55,7.61,8.17,8.17,10.40,4.22,7.74,相对误差,%,23.63,-25.87,-7.63,1.38,-30.63,-4.88,2.13,2.13,30.00,-22.25,-3.25,如果我们简单地接受一次模拟运行的结果,那么得出的结论与实际情况就会有很大的偏差。,4.2,面临的问题,对从一个随机系统中获得的样本进行统计分析时,最常用的方法是点估计和区间估计。假设系统中获得的样本为,x1,x2,xn,,样本均值的点估计 与样本方差的点估计,s,2,分别定义为:,可以证明当,x,i,为独立同分布随机变量时,和,s,2,分别是,和,2,的无偏估计,而且样本量,n,越大,对,估计的精度就越高,4.2,面临的问题,在实际应用中,人们还希望知道 和,之间的差异程度,这种差异程度一般采用区间估计的方法来表示。区间估计给出了以为 中心的一个区间,而该区间以概率,(,或置信度,)1-,包含,,,称之为显著水平,(0,1),区间估计的建立方法按样本方差,2,是否已知而不同,在进行点估计和区间估计时,对样本都有一定的要求,至少样本应满足独立同分布,特别当真实的样本方差,2,未知时,对样本母体均值作区间估计还要求母体是正态分布。,4.2,面临的问题,从系统模拟过程中获得的采样数据一般都不满足这些条件,主要有以下几点原因:,(1),模拟初始条件的影响,初始条件决定了模拟模型在开始运行时模拟系统所处的系统状态。初始系统状态对模拟系统前期的行为有很大的影响,因此在模拟前期得到的采样数据会有很大的偏差。,特别是在终态模拟方式下,如果终态事件发生时,系统还没有达到稳定状态,那么采集的数据与真实情况的偏差会很大。,4.2,面临的问题,例:,考虑一个,M/M/1,排队系统的模拟模型,假设顾客的平均到达率为,12,人,/,小时,单位顾客的平均服务速度为,0.075,小时,/,人,即服务强度为,0.9,。假定模拟开始时已有的等待服务的顾客数作为系统的初始状态,我们希望通过模拟,确定在不同初始状态下,系统在,1,小时时的平均排队长度,以及在,0,初始状态下,系统在不同时刻时的平均排队长度。这是一个终态模拟问题。,首先,对每一个固定的初始状态,我们进行,100,次重复模拟,以确定在该初始状态条件下,系统在,1,小时时的平均排队长度。模拟的结果如下表所示。,初始状态,0,1,2,3,4,5,6,7,8,9,10,11,12,平均排队长度,2.10,3.13,3.34,4.48,4.75,5.89,4.33,7.47,8.40,9.09,9.99,11.22,11.93,4.2,面临的问题,其次,我们假定模拟开始时,系统内等待服务的顾客数均为,0,,进行,1000,次模拟以确定在不同时刻,系统的平均排队长度。下图给出了模拟的结果。这个系统的平均排队长度的理论值为,8.1,,,从图中我们可以看到,如果初始状态为,0,,则大约在,30,小时以后,也就是说大约有,1230,360,个顾客到达后,系统才进入稳定状态。,4.2,面临的问题,(2),样本之间相关性的影响,从模拟系统中得到的数据构成了一个时间序列,而该时间序列是一种具有自相关特性的随机过程。,例如,在模拟一个排队系统时,如果性能测度指标是顾客的平均排队时间,此时很显然相邻顾客的排队时间之间有着密切的关系,即如果前一个顾客的排队时间较长,则后一个顾客的排队时间较长的概率就比较大,在模拟结果的统计分析中,为了能够使用经典统计分析中的常用方法,应该采用恰当的数据采样方法,并对采样数据作必要的预处理,以适应模拟输出结果统计分析的需要。,4.3,终态模拟的输出分析,在终态模拟方式下,为了使采样数据,x,i,具有独立性并具有相同的均值,一般采用,重复模拟的方法,,即在相同的初始条件下,对模拟模型进行重复运行。,每次运行时要求采用不同的随机数发生器或者对同一随机数发生器采用不同的随机数种子,以满足采样数据独立性以及同均值的要求。,一般,,x,i,的选取按照进行系统模拟的目的来确定,例如,就排队系统而言,如果希望了解前,m,个顾客的平均排队时间,,x,i,就可以采用第,i,次模拟过程中前,m,个顾客排队时间的平均值;,如果感兴趣的是某一时刻系统中顾客的排队长度,则,x,i,可以采用第,i,次模拟过程中在该时刻系统中排队长度的观察值。,4.3,终态模拟的输出分析,1.,重复模拟方法,假如对模拟模型进行了,n,次独立的运行,获得了,n,个互相独立的样本,通常就可以直接采用统计方法给出样本样本均值的点估计与区间估计。,2.,获得预定模拟精度下估计的方法,随着重复模拟次数,n,的增加,样本均值的方差将变小,从而系统性能测度指标均值的点估计的精度将会提高;,随着重复运行的次数,n,的增加,置信区间将变小,从而区间估计的精度也将提高。,但是,无限制地增加重复模拟的次数将会大大地增加模拟的时间与费用。因此,希望找到在给定精度下最少模拟运行次数的确定方法。,4.3,终态模拟的输出分析,概率意义下定义的模拟精度,(1),绝对精度,模拟的绝对精度为,,是指在显著水平,下,置信区间的半宽不大于,的概率为,1-,,即,假设 是达到绝对模拟精度,的最少运行次数,则有,4.3,终态模拟的输出分析,(2),相对精度,所谓模拟的相对精度为,,是指在显著水平,下,置信区间的半宽与样本均值之比不大于,的概率为,1-,,即,假设是达到相对模拟精度,的最少运行次数,则有,4.3,终态模拟的输出分析,在实际应用中,精度参数,和,可由分析者根据实际要求确定。,例如,在排队系统中,如果要求平均排队时间的估计值的偏差不超过,1,分钟,则,就可取,1,分钟;,如果要求平均排队时间的估计值的偏差不超过样本均值的,10,,则可以取,为,10,。,为了确定达到一定精度的最少模拟运行次数,必须预先知道样本标准差和样本均值,样本标准差和样本均值是要通过模拟得到的。,因此,在实际应用时,先对系统作,n,0,次重复独立模拟,确定样本标准差,s,和样本均值的近似值,4.4,稳态模拟的输出分析,在模拟系统达到,稳定状态,时才进行数据的采样,主要问题,(1),必须找到确定模拟系统是否已达到稳定态的方法,为了消除模拟初始条件对模拟过程中采样值的影响,可以将模拟运行划分为“预热”,阶段,0,T,0,和数据采集阶段,T,0,T,E,。这里,T,0,的选取应使得系统在,T,0,以后的状态具有稳态代表性,实际中往往是通过试运行来确定,T,0,。,(2),系统在达到稳定状态以前的过渡阶段可能很长,为了使系统尽快到达稳定状态,我们应尽量使模拟运行的初始条件,(,系统状态变量的初始设定,),符合稳态条件的要求。,4.4,稳态模拟的输出分析,输出分析方法,(1),重复运行法,与在终态模拟方式下所采用的重复模拟方法有相同的基本思想。对模拟模型在相同的初始条件下作,n,次运行,每次采用不同的随机数流,数据采样只在采集阶段,T,0,T,E,之间进行,即舍弃过渡阶段,0,T,0,之间的统计数据。,(2),批平均值法,采用重复模拟方法,必须在每次模拟过程中经过预热阶段,此外由于每次模拟中系统处于过渡状态的时间长短不同,从而造成在采集的数据或多或少地受到初始状态的影响。,在批平均值方法中,将模拟模型作一次长时间的运行,将样本采集阶段划分为,n,个采集区间,(,即批区间,),,然后以这些批区间上的采样值的平均值所构成的样本,来估计系统的稳态性能测度。,4.4,稳态模拟的输出分析,(3),再生点方法,在批均值方法中,对批区间采用了等间隔划分的方法,由于在每批的采集的初始点系统所处的状态并不相同,因此相邻批平均值之间不能保证独立性。,再生点方法采用模拟过程中系统状态的再生点来进行分批,系统状态的再生点是指系统模拟过程中的时刻点,t,1,t,2,这些时刻点与系统在这些时刻点上的状态具有以下性质:,(1),两个相邻时刻点的间隔时间,d,i,=t,i,-t,i-1,是独立同分布的;,(2),系统在这些时刻点上具有相同的状态值;,(3),系统在时刻点,t,i,以后的行为只与,t,i,时刻系统所处的状态有关,而与,t,
展开阅读全文