SPSS的非参数检验课件

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第七章,非参数检验,7.1 关于非参数的一些常识,经典统计的多数检验都假定了总体的背景分布。,但在总体未知时，如果假定的总体和真实总体不符，那么就不适宜用通常的检验。,这时如果利用传统的假定分布已知的检验，就会产生错误甚至灾难。,非参数检验,(nonparametric testing),是在总体分布未知或知之甚少的情况下，利用样本数据对总体分布形态等进行推断的方法。,非参数检验在总体分布未知时有很大的优越性。它总是比传统检验安全。,在总体分布形式已知时，非参数检验不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况，非参数检验无法拒绝。,但非参数统计在总体未知时效率要比传统方法要高，有时要高很多。是否用非参数统计方法，要根据对总体分布的了解程度来确定。,SPSS中的非参数检验方法主要涉及以下方面：,单样本非参数检验,两独立样本非参数检验,多独立样本非参数检验,两配对样本非参数检验,多配对样本非参数检验,7.2单样本的非参数检验,总体分布的卡方检验,卡方检验可以根据样本数据，推断总体分布与期望分布或某一理论分布是否存在显著差异，通常适于多项分类值总体分布的分析。,H,0,：,样本来自的总体分布与期望分布或某一理论分布无显著差异。,理论依据,如果从一个随机变量,X,中随机抽取若干个观察样本，这些观察样本落在,X,的,k,个互不相交的子集中的观察频数服从一个多项分布，这个多项分布当,k,趋于无穷时近似服从卡方分布。,卡方统计量,Pearson,卡方：,如果的概率,p,值小于显著性水平,，则应拒绝,H,0,；,否则，不拒绝,H,0,。,例子,医学家研究心脏病人猝死人数与日期的关系时发现，一周,之中星期一心脏病人猝死者较多，其他日子则基本相当。,每天的比例近似为：,2.8:1:1:1:1:1:1,。现收集到心脏病人死亡,日期的样本数据，需要推断其总体分布是否与上述理论分布,相吻合。,例:,今有 3 人组成的品茶专家组，对A、B两种不同牌号的茶进行 6 种不同味道的检验。凡专家认为优者被记录下来，如下表。不同牌号的茶提供给专家品尝是随机的。两种不同牌号的茶哪个更好？,H,0,：,F,(,x,)为二项分布,二项分布检验,现实中很多数据的取值是二值的，例如产品分为合格和不合格等等。,将这样的二值分别用0和1表示，如进行n次相同的实验，则出现两类（1或0）的次数可以用离散型随机变量,X,表示。如,X,值为1的概率为,p,，则,X,为0的概率,q,为1-,p,，形成二项分布。,通过样本数据检验样本来自的总体是否服从指定的概率值为,p,的二项分布。,H,0,：,样本来自的总体与指定的二项分布无显著差异。,二项分布检验,小样本：精确检验方法,大样本：近似检验方法,如果算得概率,p,值小于显著性水平,，则应拒绝,H,0,；,否则，不拒绝,H,0,。,例子,产品合格率检验,单样本K-S检验,利用样本数据推断样本来自的总体是否服从某一理论分布。适用于探索连续型随机变量的分布。,H,0,：,样本来自的总体与指定的理论分布（正态分布、均匀分布、指数分布和泊松分布等）无显著差异。,例子,收集储户调查的样本数据，分析储户总体一次存（取）款金额的分布是否服从正态分布。,基本思路,在零假设成立的前提下，计算各样本观测值在理论分布中,出现的理论累计概率值,F,(,x,),；,计算各样本观测值的实际累计概率值,S,(,x,),；计算实际累计,概率值与理论累计概率值的差,D,(,x,),；,计算差值序列中的最大绝对值差，即,D,=,max,(,|,S,(,x,i,) -,F,(,x,i,),|),。,通常由于实际累计概率为离散值，,D,修正为,D,=,max,(,max,(|,S,(,x,i,) -,F,(,x,i,) |),max,(|,S,(,x,i-,1,) -,F,(,x,i-,1,) |) ),。,D,统计量也称为,K-S,统计量。,在小样本下，零假设成立时，,D,统计量服从,Kolmogorov,分布；,在大样本下，零假设成立时，,D,统计量近似服从,K,(,x,),分布；,如概率,p,值小于显著性水平,则应拒绝,H,0,；否则不拒绝,H,0,。,警告,经常有人在Kolmogorov-Smirnov检验中，当检验不能拒绝总体分布为某分布时，来“接受”或“证明”该样本来自该分布。这是错误的。,比如我们有由1、2、3、4、5五个数目组成的数据，我们分别检验该数据是否是正态分布、均匀分布、Poisson分布或指数分布。结果归纳为下表,Kolmogorov-Smirnov单样本分布检验,零假设的分布（渐近双边检验的）,p,-值,正态分布1.000,均匀分布0.988,Poisson分布1.000,指数分布0.806,根据此表，没有足够证据来拒绝任何一个零假设。难道我们可以随意“接受”该总体为其中任一个分布吗？,例：,公共交通设施适合性的研究公共汽车到达时间是否服从正态分布。,7.2.4 关于随机性的游程检验,(run test),游程检验方法是检验一个取两个值的变量的这两个值的出现是否是随机的。假定下面是由0和1组成的一个这种变量的样本：,0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0,其中相同的,0,（或相同的,1,）在一起称为一个游程（单独的,0,或,1,也算）。,这个数据中有,4,个,0,组成的游程和,3,个,1,组成的游程。一共是,R,=7,个游程。其中,0,的个数为,m,=15,，而,1,的个数为,n,=10,。,关于随机性的游程检验（,run test,）,出现0和1的的这样一个过程可以看成是参数为某未知,p,的Bernoulli试验。但在给定了,m,和,n,之后，在0和1的出现是随机的零假设之下，,R,的条件分布就和这个参数无关了。根据初等概率论，,R,的分布可以写成（令,N=m+n,）,关于随机性的游程检验（,run test,）,于是就可以算出在零假设下有关,R,的概率，以及进行有关的检验了。利用上面公式可进行精确检验；也可以利用大样本的渐近分布和利用,Monte Carlo,方法进行检验。,当然，游程检验并不仅仅用于只取两个值的变量，它还可以用于某个连续变量的取值小于某个值及大于该值的个数（类似于,0,和,1,的个数）是否随机的问题。看下面例子。,关于随机性的游程检验（,run test,）,例 (run2.sav): 从某装瓶机出来的30盒化妆品的重量如下（单位克）,71.6 71.0 71.8 70.3 70.5 72.9 71.0 71.0 70.1 71.8 71.9 70.3 70.9 69.3 71.2 67.3 67.6 67.7 67.6 68.1 68.0 67.5 69.8 67.5 69.7 70.0 69.1 70.4 71.0 69.9,为了看该装瓶机是否工作正常，首先需要验证是否大于和小于中位数的个数是否是随机的（零假设为这种个数的出现是随机的）。,如果把小于中位数的记为,0,，否则记为,1,，上面数据变成下面的,0,1,序列,1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0,实际计算时，用不着这种变换，计算机会自动处理这个问题的。,7.3 两独立样本的非参数检验,7.3.1 曼-惠特尼U(Mann-Whitney U) 检验,用于对两总体分布的比较判断。,H,0,：两组独立样本来自的两总体分布无显著差异,基本步骤：,将两组样本数据(,X,1,X,2,X,m,)和(,Y,1,Y,2,Y,n,) 混合并按升幂排序，得到每个数据各自的秩,R,i,。,记第一个样本观测值的秩的和为,W,X,而第二个样本秩的和为,W,Y,。对秩分别求平均，对两个平均秩的差距比较。如果相差甚远，则此时零假设可能是不成立的。,计算(,X,1,X,2,X,m,)每个秩优先于(,Y,1,Y,2,Y,n,) 每个秩的个数,U,1,，以及(,Y,1,Y,2,Y,n,)每个秩优先于(,X,1,X,2,X,m,)每个秩的个数,U,2,，比较,U,1,和,U,2,。如果相差较大，则应怀疑零假设的真实性。,依据计算Wilcoxon W统计量和曼-惠特尼U统计量。,基本步骤（续）：,Wilcoxon,W,为：如果,m,n,Wilcoxon,W,=,W,Y,；如果,m,=,n,，则Wilcoxon,W,为第一个变量所在样本组的,W,值。,曼-惠特尼U统计量为：,U,=,W,-1/2,k,(,k,+1)，,k,为,W,对应样本组的样本个数。小样本下，,U,服从曼-惠特尼分布；大样本下，,U,近似服从正态分布，计算方法是：,在小样本下，依据,U,统计量的概率,p,值进行决策；在大样本下，则依据,Z,统计量的概率,p,值进行决策。,两样本分布的,Kolmogorov-Smirnov,检验,假定有分别来自两个独立总体的两个样本。要想检验它们背后的总体分布相同的零假设，可以进行两独立样本的,Kolmogorov-Smirnov,检验。原理完全和单样本情况一样。只不过把检验统计量中零假设的分布换成另一个样本的经验分布即可。,假定两个样本的样本量分别为,n,1,和,n,2,，用,S,1,(,X,),和,S,2,(X),分别表示两个样本的累积经验分布函数。再记,D,j,S,1,(X,j,)-S,2,(X,j,),。近似正态分布的检验统计量为,7.3.3,两样本,Wald-Wolfowitz,游程检验,Wald-Wolfowitz,游程检验（,Wald-Wolfowitz runs test,）和,Kolmogorov-Smirnov,检验都是看两样本代表的总体分布是否类似。但是方法不一样。,和单样本的游程问题类似。,Wald-Wolfowitz,游程检验把两个样本混合之后，按照大小次序排列，同样本的观测值在一起的为一个游程。,可以由游程个数,R,看出两个样本在排序中是否随机出现。,7.3.4,极端反应检验,基本思想,将一组样本作为控制样本，另一组样本作为实验样本。以控制样本作为对照，检验实验样本相对于控制样本是否出现极端反应。,如有极端反应，则认为两总体分布存在显著差异。,分析过程,将两组样本混合按升序排序,求出控制样本的最小秩,Q,min,和最大秩,Q,max,，并计算跨度（Span）：,S,=,Q,max,-,Q,min,+1,为消除样本数据中极端值对分析结果的影响，在计算跨度之前按比例去除控制样本中靠近两端的部分样本值，然后在求跨度，得到截头跨度。,针对跨度或截头跨度计算,H,检验统计量，即：,几种检验的比较,若研究的是两个祥本是否代表位置（集中趋势）有差异的总体，应选择对这种差异最敏感的检验方法。如,U,检验，,K-S,检验（单侧）。在,样本容量较大或测量层次较低,时，可以采用,U,检验，它是专门揭示位置是否有差异的检验。如果,样本容量非常小，或者同分秩较多,，不便于应用,U,检验时，,K-S,检验比,U,检验稍为有效一些。如果研究的是两个样本是否代表任一方面有差异的总体，,如位置、离散度、偏斜度等等，可以选用,K-S,检验（双侧）、游程检验。若,被评价的总体是连续分布,的，可选用游程检验或,K- S,检验。一般来说，,K-S,检验要比游程检验更有效，当数据不满足连续性假定时，它仍然可以适用，只是得到的,P,值将比应得到的稍大些，也就是说犯第,l,类错误的概率会稍稍增大。,7.4.1 Brown-Mood,中位数检验,在有数个独立样本的情况，希望知道它们的中位数是否相等。,零假设是,这些样本所代表的总体的中位数相等。,备选假设,是这些中位数不全相等。,假定有,k,个总体，,n,i,为第,i,个样本量；把所有样本量之和记为,N,。,先把从这个,k,个总体来的样本混合起来排序，找出它们的中位数。,再计算每个总体中,小于,该中位数的观测值个数,O,1,i,，,i,=1,k,，和每个总体中,大于,该中位数的观测值个数,O,2,i,，,i,=1,k,。这样就形成了一个由元素,O,ij,组成的,2,k,表,。其列总和为,n,i,，,i,=1,k,。,7.4 多个独立样本的非参数检验,两个行总和为各样本小于总中位数的观测值总和：,R,1,O,11,+,O,12,+,O,1,k,及各样本大于总中位数的观测值总和,R,2,O,21,+,O,22,+,O,2,k,。,用Pearson,c,2,统计量，即,其中,7.4.2 Kruskal-Wallis,多个样本的秩和检验,检验目的是看多总体位置参数是否一样。,假定有,k,个总体。先把从这个,k,个总体来的样本混合起来排序，记各个总体观测值的秩之和为,R,i,，,i,=1,k,。显然如果这些,R,i,很不相同，就可以认为它们位置参数相同的零假设不妥（备选假设为各个位置参数不全相等）。,注意这里所说的位置参数是在下面意义上的,q,i,；由于它在分布函数,F,i,(,x,),中可以和变元,x,相加成为,F,(,x+,q,i,),的样子，所以称,q,i,为位置参数。,形式上，假定这些样本有连续分布,F,1,F,k,，,零假设为,H,0,：,F,1,=,F,k,，,备选假设为,H,a,：,F,i,(,x,)=,F,(,x,+,q,i,),，,i,=1,k,，这里,F,为某连续分布函数，而且这些参数,q,i,并不相等。,Kruskal-Wallis,检验统计量为,（,R,上面一杠表示平均）,公式中,n,i,为第,i,个样本量，而,N,为各个样本量之和（总样本量）。,如果观测值中有大小一样的数值，这个公式会有稍微的变化。,这个统计量在位置参数相同的零假设下有渐近的自由度为,k-,1的,c,2,分布。,Kruskal-Wallis,检验仅仅要求各个总体变量有相似形状的连续分布。,例子：四种不同类型治疗的有效性是否有显著不同。,7.4.3 Jonckheere-Terpstra,多样本的秩检验,H,0,：多个独立样本来自的多个总体的分布无显著性差异。,和两独立样本的曼-惠特尼U检验类似，计算一组样本的观察值小于其他组样本的观察值的个数。用U,ij,表第,i,组观察值小于第,j,组观察值的个数，在J-T统计量的定义为：,大样本下，J-T统计量近似服从正态分布，检验统计量为：,7.5 两配对样本的非参数检验,McNemar检验,符号检验,Wilcoxon符号秩检验,解决的问题是一样的。零假设都为：两配对样本来自的两总体的分布无显著差异。,McNemar检验和符号检验都是采用二项分布检验的方法,Wilcoxon符号秩检验的基本思想,按照符号检验的方法，分别用第二组样本的各个观察值减去第一组对应样本的观察值。差值为正记为正号，为负记为负号，并同时保存差值数据；,将差值变量按升序排序，并求出差值变量的秩；,分别计算正号秩总和,W,+,和负号秩总和,W,-,；,零假设成立前提下，,小样本：W=min（,W,+,W,-,）服从Wilcoxon符号秩分布,大样本：,7.6多配对样本的非参数检验,Friedman检验,CochranQ检验,Kendall协同系数检验,

展开阅读全文

SPSS的非参数检验课件

最新文档