资源描述
,数据的统计处理和解释,正态样本离群值的判断和处理1、Grubbs检验法2、Dixon检验法,数据的统计处理和解释,数据的统计处理和解释(包括12个国标),正态样本离群值的判断和处理,已知标准差,未知标准差,Nair检测法,离群值1,Grubbs,Dixon,偏度-峰度法,Dixon,主要内容出自GB/T4883-2008数据的统计处理和分析正态样本离群值的判断和处理一部分文件引用自GB/T4882-2001数据的统计处理和解释正态性检验范围:适用于来自正态分布的样本,数据的统计处理和解释,说明:这两个方法及引用术语均来自国家标准,一:术语和定义离群值outlier样本中的一个或几个观测值,他们离开其它观测值较远,暗示他们可能来自不同的总体检出水平detectionlevel为检出离群值而指定的统计检验的显著性水平,用表示。除非约定,值应为0.05注1:用统计的方法检验测定值之间是否存在显著性差异,从而判定结果或分析方法的可靠性,这一过程称为显著性检验。注2:在显著性检验中,将具有显著性差异的测定值在随机误差分布中出现的概率(小概率)称为显著性水平(水准)用表示,即这些测定值位于一定置信度所对应的随机误差界限之外。注3:在置信区间内包含真值的概率称为置信度(置信水平)用P表示。注4:置信度和显著性水平的关系:P=1-,数据的统计处理和解释,统计离群值statisticaloutlier在剔除水平下统计检验为显著的离群值剔除水平deletionlevel为检出离群值是否高度离群而指定的统计检验的显著性水平,用*表示,除非约定,*值应为0.01歧离值straggler在检出水平下显著,但在剔除水平下不显著的离群值,数据的统计处理和解释,二:符号和缩略语n样本量样本平均值检验离群值所使用的显著水平,简称检出水平*检验统计离群值所使用的显著水平,简称剔除水平(*G1-(n)时,判定xi为离群值,否则判未发现xi是离群值。b:下侧判断当GnG1-(n)时,判定x1为离群值,否则判未发现x1是离群值。c:双侧判断当GnGn且GnG1-/2(n)时,判定xi为离群值;当GnGn且GnG1-/2(n)时,判定x1为离群值;否则判断未发现离群值。,数据的统计处理和解释,质量,数据的统计处理和解释,4、统计离群值的判断(单侧)A、当检出Xi或X1为离群值时,确定剔除水平*B、查附表1,G1-*(n),当GnG1-*(n)时,判断Xi为统计离群值,否则,Xi为歧离值,判断X1为统计离群值,否则X1为歧离值,数据的统计处理和解释,当GnG1-*(n)时,否则,数据的统计处理和解释,5、统计离群值的判断(双侧)A、当检出Xi或X1为离群值时,确定剔除水平*B、查附表1,G1-*/2(n),当GnG1-/2*(n)时,判断X1为统计离群值,否则,X1为歧离值,判断Xi为统计离群值,否则Xi为歧离值,数据的统计处理和解释,当GnG1-/2*(n)时,否则,数据的统计处理和解释,使用Grubbs法检验的实例.临时文件soybeanmeal-November2007.xls,数据的统计处理和解释,Dixon检验法:,Dn=r10=,Dn=r10=,Dn=r11=,Dn=r21=,Dn=r22=,Dn=r11=,Dn=r21=,Dn=r22=,数据的统计处理和解释,Dixon检验法确认检出水平,在附表2中查出临界值D1-(n)。当DnD1-(n)时,判定Xn为离群值当DnD1-(n)时,判定X1为离群值否则二者都判未发现离群值。附表2相见GB/T4883-2008单侧Dixon检验的临界值表,这里将不再列举。,数据的统计处理和解释,Dixon检验法:统计离群值的判断(单侧)A、当检出Xn或X1为离群值时,确定剔除水平*B、查附表3,D1-*(n)Dixon检验法:统计离群值的判断(双侧)略,当DnD1-*(n)时,判断X1为统计离群值,否则,X1为歧离值,判断Xn为统计离群值,否则Xn为歧离值,数据的统计处理和解释,当DnD1-*(n)时,否则,数据的统计处理和解释,数据的统计处理和解释,因篇幅有限,将不再列举后面的表。详细信息见GB/T4883-2008,数据的统计处理和解释,Thankyou!,总体:研究对象的全体为总体。其具有:同质性、大量性、差异性。(有限和无限总体)样本:从总体中抽取部分个体所组成的集合称为样本。具有:代表性、客观性、随机性。,
展开阅读全文