《输入数据分析》PPT课件

上传人:wuli****0220 文档编号:245017039 上传时间:2024-10-07 格式:PPT 页数:44 大小:573KB
返回 下载 相关 举报
《输入数据分析》PPT课件_第1页
第1页 / 共44页
《输入数据分析》PPT课件_第2页
第2页 / 共44页
《输入数据分析》PPT课件_第3页
第3页 / 共44页
点击查看更多>>
资源描述
,*,一、输入数据的收集,第八章 输入数据分析,二、分布的识别,三、参数估计,四、拟合度检验,五、相关性分析,?,模型的输入数据哪里来?,输入数据分析,生产仿真结果的准确性,生产模型的准确建立,仿真数据的准确性,输入数据是仿真模型的动力,GIGO,(,garbage in garbage out,),系统名称,典型的输入数据,排队系统,顾客到达的间隔时间,顾客被服务时间的分布,自动化物流系统,货物到达间隔时间,装载时间,卸载时间,生产系统,作业到达的间隔时间,作业类型的概率,每种作业每道工序服务时间的分布,可靠性系统,生产无故障作业时间,系统的仿真依靠这些原型系统的运行数据,缺乏这些数据的实验和实验值的提取,仿真也就毫无意义。,收集原始数据,基本统计分布的辨识,参 数 估 计,拟合度检验,可信否?,否,是,是输入数据分析的基础,需要分析的经验,对收集的方法、数据需要做预先的设计和估算。因此这是一个关键的、细致的工作。,通过统计的数学手段(计数统计、频率分析、直方图制作等),得出统计分布的假设函数(如:正态分布、负指数分布、,Erlang,分布等),根据统计特征,计算确定系统的假设分布参数。,运用统计分布的检验方法,对假设的分布函数进行可信度检验。通常采用的是,2,检验。,正确输入数据,一、输入数据的收集,做好仿真计划,详细规划仿真所需要收集的数据,在收集数据过程中要注意分析数据,数据的均匀组合,收集的数据要满足独立性的要求,数据自相关性的检验,根据问题的特征,进行仿真的前期研究。分析影响系统的关键因素。从相关事物的观察入手,尽量收集相关的数据。为此可以事先设计好调研表格,并注意不断完善和修改调研方式,使收集的数据更符合仿真对象的数据需要。,数据的收集与仿真的试运行是密切相关的,应当是边收集数据、边进行仿真的试运行。然而系统仿真是一项专业性很强的工作,要正确认识“仿真”的含义,抓住仿真研究的关键,避免求全、求精。确信所收集的数据足以确定仿真中的输入分量,而对仿真无用或影响不显著的数据就没有必要去多加收集。,针对仿真所收集的各个数据需要进行相关性检验。为了确定在两个变量之间是否存在相关。要建立两个变量的散布图。通过统计方法确定相关的显著性。,尽量把均匀数据组合在一组里。校核在相继的时间周期里以及在相继日子内的一时间周期里的数据的均匀性。当校核均匀性时,初步的检验是看一下分布的均值是相同。,考察一个似乎是独立的观察序列数据存在自相关的可能性。自相关可能存在于相继的时间周期或相继的顾客中。例如,第,i,个顾客的服务时间与,(,i+n,),个顾客的服务时间相关。,数据收集过程中的注意事项,二、分布的识别,直方图,1,直方图的构造方法如下:,取,值,区,间,划,分,水,平 区,坐 间,标 标,轴 注,的,计 区,算 间,确 内,定 的,每 发,一 生,数,垂,直 标,坐 注,标 频,轴 数,上,绘 上,制 的,各 发,个 生,区 频,间 数,绘,制,直,方,图,直方图分组区间数量的选取,1,分组区间的组数依赖于观察次数以及数据的分散或散布的程度。,一般分组区间组数近似等于样本量的平方根。即:,如果区间太宽(,m,太小),则直方图太粗或呈短粗状,这样,它的形状不能良好地显示出来。,如果区间太窄,则直方图显得凹凸不平不好平滑,合适的区间选择(,m,值)是直方图制作,分布函数分析的基础。,二、分布的识别,二、分布的识别,离散数据,汽车数量,(p215),连续数据,电子元器件寿命,(p217),三、参数估计,样本均值和样本方差,(p221),1,设某一个随机过程,X,,其,n,个抽样样本为,x,1,,,x,2,,,,,x,n,,该样本的均值为,该样本的方差为,如果离散数据已按频数分组,则,k,是,X,中不相同数值的个数即分组数,,f,i,是,X,中数值,X,j,的观察频数,参数估计量,(p222),2,分 布,参 数,建议使用的估计量,泊松,指数,在(,0,,,b,)上的均匀分布,正态,,,仿真中常用的一些分布参数建议值,三、参数估计,?,理论分布和实际分布的差异程度?,拟合度检验,四、拟合度检验,k,=6,E,i,是在该分组区间的期望频数。每一分组区间的期望频数是,E,i,=,n p,i,,,这里,p,i,是理论值,是对应第,i,个分组区间的假设概率。,2,拟合度检验,式中,O,i,是在第i个分组区间的观察频数。O,i,=n,i,/n,可以证明:,0,2,近似服从具有自由度,f,=,k,-,s,-,1,的,2,分布。,这里,s,表示由采样统计量所估计的假设分布的参数个数。,假设检验:,H,0,:随机变量,X,服从参数是由参数估计给出的分布假设,。,H,1,:,随机变量,X,不确认,若,2,太大则拒绝,H,0,,若拟合是好的,则期望值,2,很小。,拟合程度的判定,四、拟合度检验,首先划分区间,定义,k,值,计算各组的观察频数,计算,0,查阅,2,表,得到,如果 ,则拒绝,H,0,拟合度检验步骤,指定拟合度的检验,我们可以根据拟合度检验的要求,设定一个拟合度的显著性指数,,根据设定的,显著性指数,以及,2,分布的自由度数,f,=,k,-,s,-,1,,可以查,2,表得到,,,f,2,。,如果 则检验未通过,,H,0,不成立。,如果 则检验通过,,H,0,成立。,在应用这个检验时,如果期望的频数太小,将对检验的有效性有所影响。一般情况下区间的个数,k,宜在,3040,以下,并能使最小期望频数,E,i,5,。如果,E,i,值太小,可以把它和相邻分组区间的期望频数相合并,对应的,O,i,值也应该合并起来,同时每当合并一个单元,,k,值应该减去,1,。,四、拟合度检验,四、拟合度检验,注意:,(,1,)被检验的分布离散,除非必须合并相邻分组区间以满足最小期望频数的需要,否则随机变量的每个值应该是一个分组区间,(,2,),被检验的分布连续,连续分布分组区间数量的推荐值,样本容量,20,50,100,100,分组区间个数,k,不使用,2,检验,510,1020,五、输入数据分析例题,1,p215,在,5,分钟周期内的到达数,每个周期的到达数,频度,每个周期的到达数,频度,0,12,6,7,1,10,7,5,2,19,8,5,3,17,9,3,4,10,10,3,5,8,11,1,收集数据,1,分布辨识,2,五、输入数据分析例题,1,分布辨识,2,五、输入数据分析例题,1,参数估计,3,五、输入数据分析例题,1,拟合度检验,4,五、输入数据分析例题,1,假设:,泊松分布的概率质量函数:,五、输入数据分析例题,1,对于,=3.64,,不同,x,值的概率从概率质量函数得到:,x,i,观测频度,Oi,期望频度,Ei,0,12,2.6,7.87,1,10,9.6,2,19,17.4,0.15,3,17,21.1,0.80,4,10,19.2,4.41,5,8,14.0,2.57,6,7,8.5,0.26,7,5,4.4,11.62,8,5,2.0,9,3,0.8,10,3,0.3,1,0.1,合计,100,100,27.68,22,12.2,17,7.6,五、输入数据分析例题,1,计算出:,在显著性水平,=0.05,下,查表得出,(p409),:,五、输入数据分析例题,1,电子元件寿命记录,79.919,6.769,144.695,0.624,7.004,3.081,59.899,2.633,5.38,31.764,6.20E-02,1.192,17.967,3.148,1.005,1.961,34.76,9.10E-02,7.078,1.147,5.845,5.009,9.003,23.96,0.219,3.027,18.387,0.941,0.59,3.217,6.505,0.141,0.878,1.928,14.382,2.10E-02,43.565,3.371,0.3,1.008,1.30E-02,24.42,2.157,2.00E-03,2.336,0.123,0.433,7.579,0.543,4.562,五、输入数据分析例题,2,p216,假设:,令,k=8,,则每个区间,p=0.125,具有相等概率,2,的检验,五、输入数据分析例题,2,五、输入数据分析例题,2,分组区间,观测频度,Oi,期望频度,Ei,0,1.590),19,6.25,26.01,1.590,3.425),10,6.25,2.25,3.425,5.595),3,6.25,0.81,5.595,8.252),6,6.25,0.01,8.252,11.677),1,6.25,4.41,11.677,16.503),1,6.25,4.41,16.503,24.755),4,6.25,0.81,24.755,),6,6.25,0.01,合计,50,50,39.6,五、输入数据分析例题,2,计算出:,在显著性水平,=0.05,下,查表得出:,五、输入数据分析例题,2,六、相关性分析,系统运行过程中,随机变量有多个,如激励存在多种因素的影响;系统参数的变化等。这些随机变量之间可能是独立的,也有可能是相互有牵连的,牵连程度的强弱有所不同。需要进行相关性分析。,相关性分析的目的,:更好地了解系统以及系统随机变量的关联性,更正确地把握问题的关键。,六、相关性分析,协方差和相关系数,1,协方差和相关系数是,X,1,和,X,2,之间线性相关程度的度量,设,X,1,和,X,2,是两个随机变量,令,分别是,X,i,的均值和方差。,X,1,和,X,2,的协方差的定义为,六、相关性分析,相关系数,越接近于,-1,或,1,,,X,1,和,X,2,之间的线性关系就越强,六、相关性分析,样本协方差,相关系数,提前期,6.5,4.3,6.9,6.0,6.9,6.9,5.8,7.3,4.5,6.3,需求量,103,83,116,97,112,104,106,109,92,96,六、相关性分析,例题,9.20,:令,X,1,表示工业机器人交货的平均提前期,,X,2,表示年需求量。下面的数据是过去,10,年的需求量和提前期:,计算得到:,六、相关性分析,因此,提前期和需求量有很强的依赖性,单变量线性回归,2,假设要估计在自变量,x,与一个因变量,y,之间的相关性。设在,y,与,x,之间真实相关是线性关系,这里观察值,y,是随机变量。而,x,是数学变量。那么在给定,x,的值之下,,y,的期望值假设是,式中:,0,为一未知常数,是,x,取零时,y,的值;,1,为斜率,即,x,变化一个单位所引起的,y,的变化,也是一个待定的未知常数。,六、相关性分析,假设,y,的每一个观察值可用下式表示,y,=,0,+,1,x,+,式中,是均值为,0,,方差为,2,的随机误差。,假设存在,n,对观察值,(,x,i,,,y,i,),,,i,=1,,,2,,,,,n,,通常采用最小二乘法来估计上式中的,y,i,。设,y,i,=,0,+,1,x,i,+,i,i,=1,,,2,,,,,n,,,则,i,=,y,i,-,0,-,1,x,i,假设,是不相关的随机变量。,六、相关性分析,随机变量,偏差,的平方和为,(,最小二乘法函数形式,),为了使,L,(偏差)极小,可求出 和 ,并置它们为,0,,从而可,以得到,0,、,1,的线性代数方程,既有:,六、相关性分析,回归显著性检验,2,检验统计量的构造方法,1,的均方误差:,在,x,i,处观测值,y,i,与回归值,y,i,之间的误差为,均方误差值为,也称为回归的剩余方差,它是,误差方差的无偏估计量。,六、相关性分析,构造检验统计量,服从自由度为,n-,2,的,t,分布。,设定一个显著性水平,,当,时,,x,、,y,是显著相关。,六、相关性分析,提前期,6.5,4.3,6.9,6,6.9,6.9,5.8,7.3,4.5,6.3,需求量,103,83,116,97,112,104,106,109,92,96,六、相关性分析,计算出:,六、相关性分析,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!