统计学非参数检验PPT实用版课件

上传人:58****5 文档编号:243129143 上传时间:2024-09-16 格式:PPT 页数:91 大小:810.50KB
返回 下载 相关 举报
统计学非参数检验PPT实用版课件_第1页
第1页 / 共91页
统计学非参数检验PPT实用版课件_第2页
第2页 / 共91页
统计学非参数检验PPT实用版课件_第3页
第3页 / 共91页
点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,统计学非参数检验,统计学非参数检验,方法的回顾,单个因素(两水平)的作用评价:两组比较,完全随机设计下的单因素两组比较,匹配设计的两组比较,单个因素(多水平)的作用评价:多组比较,完全随机设计下的单因素多水平比较,两个因素的分析问题,无交互作用、有交互作用,单因素两组比较:,t,检验,完全随机两组均数比较的,t,检验(独立,t,检验),匹配设计下两组均数比较的,t,检验(匹配,t,检验),单因素多组比较:方差分析,完全随机设计下的多组均数比较,局限性,t,检验,独立,t,检验要求:正态、方差相等(或不相等)、个体独立,匹配,t,检验要求:差值正态、个体独立,方差分析,单因素多水平比较方差分析要求:正态、方差相等、个体独立,未解决问题,两组性别结构是否相同?,疗效用痊愈、显效、有效、无效四级分类法进行评价时,两组或多组如何比较?,如何检验样本数据来自的总体服从正态分布?,总体不是正态分布,小样本情况下,如何检验总体的集中趋势?,有6名歌手参加比赛,4名评委进行评判打分,推断评委的评判标准是否一致,参数检验:,样本被视为从分布族的某个参数族抽取出来的总体的代表,而未知的仅仅是总体分布具体的参数值,推断问题就转化为对分布族的若干个未知参数的估计问题,用样本对这些参数做出估计或者进行某种形式的假设检验,这类推断方法称为参数方法。,非参数检验,(,nonparametric tests,),又称为任意分布检验(,distribution- free test,),它不考虑研究对象总体分布具体形式,也不对总体参数进行统计推断,仅仅依赖于数据观测值的相对大小,(,秩,),等,而是通过检验样本所代表的总体分布形式是否一致来得出统计结论。,Wilcoxon符号秩检验结果(2),把 的正负号加到相应的秩上;,(数据文件:家庭月收入.,计算差值绝对值的秩 。,以下情况下应当首选非参数方法,Mann-Whitney U,每个数据都减去零假设中的中位数,记录其差值的符号。,疗效用痊愈、显效、有效、无效四级分类法进行评价时,两组或多组如何比较?,对总体假定较少,有广泛的适用性,结果稳定性较好。,Wilcoxon符号秩检验,检验中涉及的数据为定类或定序数据。,k是样本分类的个数,表示实际观察到的频数,表示理论频数。,用于两个独立样本的Wlicoxon秩和检验,Wilcoxon符号秩检验,Wilcoxon符号秩检验结果(1),对定类变量用c2统计量进行统计显著性检验,129,双侧检验的p值为0.,在K-S检验中如果使用的是小样本,则根据渐进分布计算p值的误差会增大。,非参数统计的名字中的“非参数(nonparametric)”意味着其方法不涉及描述总体分布的有关参数;,它被称为,“,和分布无关,”,(distributionfree),是因为其推断方法和总体分布无关;不应理解为与所有分布(例如有关秩的分布)无关,对总体假定较少,有广泛的适用性,结果稳定性较好。,假定较少,不需要对总体参数的假定,与参数结果接近,针对几乎所有类型的数据形态。,容易计算,在计算机盛行之前就已经发展起来。,非参数检验的优点,可能会浪费一些信息,特别当数据可以使用参数模型的时候,大样本手算相当麻烦,一些表不易得到,非参数检验的弱点,已知总体分布类型,对未知参数进行统计推断,依赖于特定分布类型,比较的是参数,参数检验,(,parametric test,),非参数检验,(,nonparametric test,),对总体的分布类型不作严格要求,不受分布类型的影响,比较的是总体分布位置,优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料,(,如等级资料,或含数值,“,50mg”,等,),缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低,;样本含量较大时,两者结论常相同,非参数检验的特点,非参数检验不需要严格假设条件,因而比参数检验有更广泛的适用面。,非参数检验几乎可以处理包括定类数据和定序数据在内的所有类型的数据,而参数检验通常只能用于定量数据的分析。,在参数检验和非参数检验都可以使用的情况下,非参数检验的功效(,power,)要低于参数检验方法。,以下情况下应当首选非参数方法,参数检验中的假设条件不满足,从而无法应用。例如总体分布为偏态或分布形式未知,且样本为小样本时。,检验中涉及的数据为定类或定序数据。,所涉及的问题中并不包含参数,如判断某样本是否来自正态分布等,,判断某样本是否为随机样本,。,常用的非参数检验方法,用于单个样本的,c,2,拟合优度检验、,K-S,拟合优度检验、中位数的符号检验,用于两个匹配样本的,Wilcoxon,符号秩检验,用于两个独立样本的,Wlicoxon,秩和检验,用于多个独立样本的,Kruskal-Wallis,检验。,计算差值绝对值的秩 。,如果消费者对3种材料的偏好程度是无差异的,也就是说消费者对材料的偏好服从均匀分布,则理论上来说,调查120名消费者,偏好每种材料的人数应该是相等的,也就是40人。,由于收入一般是右偏分布,因此不适合用t检验进行分析。,独立t检验要求:正态、方差相等(或不相等)、个体独立,H0:观察频数与期望频数一致,它被称为“和分布无关”(distributionfree),是因为其推断方法和总体分布无关;,多个独立样本的Kruskal-Wallis检验,如果消费者对3种材料的偏好程度是无差异的,也就是说消费者对材料的偏好服从均匀分布,则理论上来说,调查120名消费者,偏好每种材料的人数应该是相等的,也就是40人。,单击对话框中的“精确”,选中弹出对话框中的“精确”,单击“继续”、“确定”,原假设成立时,检验统计量S服从二项分布。,SPSS K-S检验中检验统计量Z的计算,250,自由度为2,相应的p值(渐近显著性)为0.,样本被视为从分布族的某个参数族抽取出来的总体的代表,而未知的仅仅是总体分布具体的参数值,单因素多组比较:方差分析,Kruskal-Wallis检验是Wlicoxon秩和检验的推广,用来对多个总体的中位数进行比较。,H1:观察频数与期望频数不一致,疗效用痊愈、显效、有效、无效四级分类法进行评价时,两组或多组如何比较?,一种饮料的容器材料可以选择玻璃、塑料或者金属。,缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;,以下情况下应当首选非参数方法,第六章 非参数检验,非参数检验概述,非参数检验、特点及应用,单样本的非参数检验,两个样本和多个样本的非参数检验,单样本的非参数检验,c,2,拟合优度检验,K-S,拟合优度检验,中位数的符号检验,分类数据,检验,分布,对中位数的推断,c,2,统计量,用来测定,定,类变量之间的相关程度,c,2,统计量的分布与自由度有关;,c,2,统计量描述了观察值与期望值的接近程度,拟合优度检验(,goodness of fit test,),用,c,2,统计量进行统计显著性检验的重要内容之一;,依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异,从而达到对分类变量进行分析的目的。,1912,年,4,月,15,日,豪华巨轮泰坦尼克号与冰山相撞沉没。当时船上共有,2208,人,其中男性,1738,人,女性,470,人。,海难发生后,幸存者共,718,人,其中男性,374,人,女性,344,人,以显著性水平为,0.1,检验存活状况与性别是否有关?,提出零假设和备择假设,H,0,:观察频数与期望频数一致,H,1,:观察频数与期望频数不一致,计算期望频数,男性的期望频数 ,女性为,153,人,计量,c,2,统计量,查表 (自由度为类别数,-1,),做出判断:决绝原假设,认为存活状况与性别显著相关,一种饮料的容器材料可以选择玻璃、塑料或者金属。,为了比较消费者对包装材料的偏好,抽样调查了120名消费者发现,最喜欢玻璃、塑料和金属容器的分别有55、25和40人。,根据调查结果,能否认为消费者对3种材料的偏好程度是无差异的(显著性水平a=0.05)?,分析,如果消费者对,3,种材料的偏好程度是无差异的,也就是说消费者对材料的偏好服从均匀分布,则理论上来说,调查,120,名消费者,偏好每种材料的人数应该是相等的,也就是,40,人。,各组观测到的人数与理论人数(期望值)之间的差异应该都是由于抽样的随机性造成的,因此不应该太大。,如果二者之间的差异特别大,则说明我们所作的假设(消费者对,3,种材料的偏好程度是无差异的)很可能不成立。,检验统计量,k,是样本分类的个数,表示实际观察到的频数,表示理论频数。观察频数与期望频数越接近,则,c,2,值越小。根据皮尔逊定理,当,n,充分大时,,c,2,统计量渐近服从于,k-1,个自由度的,c,2,分布。,软件操作:数据录入,软件操作:方法设定,选择“分析”,“非参数检验”,“卡方”,在弹出的对话框中将“材料”设定为检验变量;单击对话框中的“精确,”,,选中弹出对话框中的“精确”,单击“继续”、“确定”,软件操作:结果分析(1),观察数,期望数,残差,1.00,55,40.0,15.0,2.00,25,40.0,-15.0,3.00,40,40.0,.0,总数,120,软件操作:结果分析(2),材料,卡方,11.250,df,2,渐近显著性,.004,精确显著性,.003,点概率,.000,多数非参数检验明显地或隐含地利用了秩的性质;,数据中有相同的数值,称为结。,k是样本分类的个数,表示实际观察到的频数,表示理论频数。,当时船上共有2208人,其中男性1738人,女性470人。,检验能否认为总体中儿童每周看电视的时间服从正态分布(显著性水平a=0.,两个样本和多个样本的非参数检验,我们用Wilcoxon秩和检验来比较两个总体的中位数。,如果两个总体具有相似的分布形状,并且中位数相同,那么由m个x、n个y组成的m十nN个观察值可以被看作来自同一总体的一个随机样本。,统计量W的统计分布可以精确推导出来,c2拟合优度检验、K-S检验、中位数的符号检验及Wilcoxon符号秩检验,Wilcoxon符号秩检验结果(2),由于p值很小,所以有理由拒绝原假设,即认为这四个专业起薪的中位数不全相等。,缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;,在非正态总体小样本的情况下,如果要对总体分布的位置进行推断,由于t检验不适用,也可使用符号检验的方法。,选中“符号检验”,取消选择“Wilcoxon”,单击 “确定”,在两个独立样本的t检验不适用时,Wlicoxon秩和检验可以作为一种替代的非参数检验方法使用。,一种饮料的容器材料可以选择玻璃、塑料或者金属。,c2拟合优度检验、K-S检验、中位数的符号检验及Wilcoxon符号秩检验,观察频数与期望频数越接近,则c2值越小。,匹配设计下两组均数比较的t检验(匹配t检验),针对几乎所有类型的数据形态。,结果分析(3),结论:计算出的,c,2,统计量的值为,11.250,,自由度为,2,,相应的,p,值(渐近显著性)为,0.004,,小于,a,=0.05,。所以检验的结论是拒绝总体中消费者对,3,种材料的偏好程度无差异的零假设。,特别说明,大样本、每个单元中的期望频数大于等于,5,时可以使用,c,2,分布。,小样本时应该按照精确方法计算得到的,p,值得出结论。,c,2,检验也可以按照同样的思想对正态分布或者任何想象的其他分布进行检验,但主要用于对定性变量的检验。另外,,c,2,检验也可以用于对两个总体分布的比较。,单样本的非参数检验,c,2,拟合优度检验,对定类变量用,c,2,统计量进行统计显著性检验,K-S,拟合优度检验,中位数的符号检验,检验,分布,单样本,K-S,检验,检验总体分布是否为理论分布(正态、,Possion,、均匀、指数),是以两位苏联数学家,Kolmogorov,和,Smirnov,命名的,全称为,Kolmogorov- Smirnov,检验。,通过对两个分布差异的分析确定能否认为样本的观察值来自所设定的理论分布总体。,定义 ,显然若对每一个,x,值来说,如果经验分布函数与特定分布函数的拟合程度很高,则有理由认为样本数据来自具有该理论分布的总体。,检验统计量:,根据检验统计量的精确分布或渐进分布,可以计算出假设检验的,p,值,从而得出检验的结论。,SPSS K-S检验中检验统计量Z的计算,SPSS K-S检验中p值的计算,有,100,名儿童每周看电视时间的数据(数据文件:电视时间,.sav,)。检验能否认为总体中儿童每周看电视的时间服从正态分布(显著性水平,a=0.05,)。,这里,K-S,检验的零假设和备择假设为:,H,0,:总体中儿童每周看电视的时间服从正态分布。,H,1,:总体中儿童每周看电视的时间不服从正态分布。,在,SPSS,软件中打开数据文件,选择“分析”,“非参数检验”,“,1,样本,K-S”,,在弹出的对话框中将“时间”设定为检验变量;检验分布为默认的“常规”(正态分布)。单击 “确定”,时间,N,100,正态参数,a,b,均值,27.191,标准差,8.3728,最极端差别,绝对值,.096,正,.096,负,-.039,Kolmogorov-Smirnov Z,.960,渐近显著性,(,双侧,),.315,根据皮尔逊定理,当n充分大时, c2统计量渐近服从于k-1个自由度的c2分布。,统计量W的统计分布可以精确推导出来,当时船上共有2208人,其中男性1738人,女性470人。,根据皮尔逊定理,当n充分大时, c2统计量渐近服从于k-1个自由度的c2分布。,H1:观察频数与期望频数不一致,结中数字的秩为它们所占位置的平均值,多数非参数检验明显地或隐含地利用了秩的性质;,独立t检验要求:正态、方差相等(或不相等)、个体独立,如果二者之间的差异特别大,则说明我们所作的假设(消费者对3种材料的偏好程度是无差异的)很可能不成立。,对总体的分布类型不作严格要求,检验能否认为总体中儿童每周看电视的时间服从正态分布(显著性水平a=0.,H1:观察频数与期望频数不一致,两个样本和多个样本的非参数检验,用来测定定类变量之间的相关程度,单因素多组比较:方差分析,在两个独立样本的t检验不适用时,Wlicoxon秩和检验可以作为一种替代的非参数检验方法使用。,非参数检验,根据样本数据能否认为总体中家庭月收入的中位数等于5000元(显著性水平a=0.,检验结论,相应的,p,值(渐近显著性)为,0.315,。由于,0.315,大于,0.05,,所以在,5%,的显著性水平下不能拒绝原假设,也就是说根据样本数据不能认为总体分布是非正态的。,注意这里并不能得出总体服从正态分布的严格结论。总体服从正态分布的结论可能犯第二类错误(取伪错误),这个概率是未知的,在有些情况下可能会很大。,特别声明,在,K-S,检验中如果使用的是小样本,则根据渐进分布计算,p,值的误差会增大。这时应该通过相应的设定要求软件输出精确检验的,p,值,根据精确检验的,p,值得出检验结论。,K-S,检验也可以用于对两个总体分布是否一致的检验。,单样本的非参数检验,c,2,拟合优度检验,对定类变量用,c,2,统计量进行统计显著性检验,K-S,拟合优度检验,检验总体分布形态,中位数的符号检验,对中位数的推断,单样本中位数的检验,秩,符号检验,Wilcoxon,符号秩检验,秩(,rank,),是指全部观察值按某种顺序排列的位序;,通常是将数据按照升幂排列之后,每个观测值的位置,秩次在一定程度上反映了等级的高低。,下面一行,R,i,就是上面一行数据,X,i,的秩。,数据中有相同的数值,称为结。结中数字的秩为它们所占位置的平均值,X,i,15,9,17,3,17,8,5,13,7,19,R,i,7,5,8.5,1,8.5,4,2,6,3,10,A,组:, 、,、,+,、,+,、,+,、,+,、,+,、,+,、,+,、,+,、,+,、,+,- + + + + + + + + + +,1 2 3 4 5 6 7 8 9 10 11 12,1 2 4.5 4.5 4.5,4.5 8.5 8.5 8.5 8.5 11.5 11.5,平均秩次,=,(,3+6)/2=4.5,利用秩的大小进行推断就避免了不知道背景分布的困难。这也是非参数检验的优点。,多数非参数检验明显地或隐含地利用了秩的性质;但也有一些非参数方法没有涉及秩的性质。,符号检验(,sign test,),在非正态总体小样本的情况下,如果要对总体分布的位置进行推断,由于,t,检验不适用,也可使用符号检验的方法。,在数据呈偏态分布的情况下,我们可能对总体的中位数更感兴趣,希望对总体的中位数作出推断,这时可以使用符号检验的方法。,例,6.3,在某地区随机调查了,60,个家庭的月收入。 (数据文件:家庭月收入,.sav,)。根据样本数据能否认为总体中家庭月收入的中位数等于,5000,元(显著性水平,a,=0.05,)?,符号检验的基本思想:,每个数据都减去零假设中的中位数,记录其差值的符号。,计算正、负符号的个数(差值为,0,的不计算在任何一个中),当原假设为真时二者应该很接近;若两者相差太远,就有理由拒绝原假设。,检验统计量,原假设成立时,检验统计量,S,服从二项分布。,根据二项分布计算得到,p,值,从而得出检验的结论。,当正号和负号个数之和大于,25,时,可以按照正态分布进行近似计算。,例,6.3,在某地区随机调查了,60,个家庭的月收入。 (数据文件:家庭月收入,.sav,)。根据样本数据能否认为总体中家庭月收入的中位数等于,5000,元(显著性水平,a,=0.05,)?,在,SPSS,中打开数据文件。为了对中位数进行检验,先在,SPSS,中生成一个新的变量,Median,,取值为,5000,:单击“转换”,“计算变量”,在弹出的对话框中按照图,6-3,进行设置,单击确定。,选择“分析”,“非参数检验”,“,2,个相关样本”,在弹出的对话框中将“,Median”,和“家庭月收入”设定检验的一对变量;选中“符号检验”,取消选择“,Wilcoxon”,,单击 “确定”,用正态分布进行近似计算时,,Z,统计量的值为,-0.129,,双侧检验的,p,值为,0.897,。由于,p,值大于,0.05,,检验的结论是不能拒绝原假设,即没有充分证据证明中位数不等于,5000,。,特别声明,如果样本量较小,则需要使用软件输出的精确检验的,p,值进行推断,在小样本时,如果要求进行精确检验,,SPSS,会自动按照二项分布进行概率计算。,Wilcoxon,符号秩检验,符号检验只用到差值的符号,而对差值数值的大小未能考虑,因而失去了部分信息。,Wilcoxon,符号秩检验既考虑差值的符号,又考虑差值的大小,因此在所需的假设条件满足时其功效比符号检验高。,Wilcoxon,符号秩检验,计算差值绝对值的秩 。,将差值绝对值从小到大排序,其位次就是的秩(,rank,),等于,0,值不参与排序。,分别计算出差值序列中正数的秩和,W+,以及负数的秩和,W-,。,显然,如果零假设成立,,W+,与,W-,应该比较接近。如果二者过大或过小,则说明零假设不成立。,将正数的秩和或者负数的秩作为检验统计量,根据其统计分布计算,p,值,从而可以得出检验的结论。,前提假设:样本点来自连续对称总体分布,Wilcoxon,符号秩检验,计算 ,将其按照大小排序,得到 的秩;,把 的正负号加到相应的秩上;,计算,计算检验统计量,做出判断,,W,太小时,决绝零假设,第六章 非参数检验,非参数检验概述,非参数检验、特点及应用,单样本的非参数检验,c,2,拟合优度检验、,K-S,检验、中位数的符号检验及,Wilcoxon,符号秩检验,两个样本和多个样本的非参数检验,两个样本和多个样本的非参数检验,两个匹配样本的,Wilcoxon,符号秩检验,两个独立样本的,Wlicoxon,秩和检验,多个独立样本的,Kruskal-Wallis,检验,匹配样本的非参数检验,如果,t,检验的假设条件不满足,,t,检验就不适用了。符号检验和,Wilcoxon,符号秩检验都可以用做替代的检验方法。,用样本数据中对应的数值相减得到新的序列 :,零假设:差值总体的中位数,=0,;,备择假设:差值总体的中位数,0,。,例6.4 从实施适时管理(JIT)的企业中随机抽取10家进行效益分析,得到它们在实施JIT前后三年的平均资产报酬率(数据文件: JIT管理.sav)。在5的显著性水平下企业在实施JIT前后的资产报酬率是否有显著差异?,在,SPSS,软件中打开数据文件,选择“分析”,“非参数检验”,“,2,个相关样本”,在弹出的对话框中将“,JIT,后”和“,JIT,前”设定检验的一对变量;选中“,Wilcoxon”,和“符号检验”。由于这里样本量很小,我们要求进行精确检验:单击对话框中的“精确,”,,选中弹出对话框中的“精确”,单击“继续”、“确定”,符号检验结果(1),N,JIT,前,- JIT,后,负差分,a,7,正差分,b,3,结,c,0,总数,10,符号检验结果(2),结论:,不能,拒绝零假设 ,没有证据表明小于企业在实施JIT前后的资产报酬率有显著变化,JIT,前,- JIT,后,精确显著性(双侧),.344,a,精确显著性(单侧),.172,点概率,.117,Wilcoxon符号秩检验结果(1),N,秩均值,秩和,JIT,前,- JIT,后,负秩,7,a,4.36,30.50,正秩,3,b,8.17,24.50,结,0,c,总数,10,Wilcoxon符号秩检验结果(2),JIT,前,- JIT,后,Z,-.307,a,渐近显著性,(,双侧,),.759,精确显著性(双侧),.787,精确显著性(单侧),.394,点概率,.020,两个独立样本的,Wlicoxon,秩和检验,在两个独立样本的,t,检验不适用时,,Wlicoxon,秩和检验可以作为一种替代的非参数检验方法使用。,这一检验可以用来对两个总体的中位数进行检验。,基本原理,如果两个总体具有相似的分布形状,并且中位数相同,那么由,m,个,x,、,n,个,y,组成的,m,十,n,N,个观察值可以被看作来自同一总体的一个随机样本。,将全部,x,和,y,从小到大排序确定每个数值的秩,然后计算,m,个,x,的秩的和,W,x,、,n,个,y,的秩的和,W,y,。,由于抽样的随机性,,x,、,y,应较均匀地分布在混合排列的样本中。,如果零假设成立,在样本量相同的情况下两个秩和应该比较接近;样本量不同的情况下平均秩和的平均秩应该比较接近。否则就说明两个总体的中位数是不相等的。,由于对称性,两个秩和,W,x,、,W,y,都可以用作,Wilcoxon,秩和检验的检验统计量。,SPSS,软件中使用的是平均秩较小的一组的秩和。,统计量,W,的统计分布可以精确推导出来,在样本量较大时(,m,和,n,都不小于,10,)可以用正态分布来进行近似。,得到,p,值之后,再通过比较,p,值和,a,的大小得出结论。,相关说明,由于,Wilcoxon,秩和检验与,Mann,和,Whitney,提出的,U,检验完全等价,因此这种方法也被称为,Wlicoxon-Mann-Whitney,检验,或者,Mann-Whitney U,检验。,在样本量较小时,应当使用精确检验的结果,严格来说用,Wilcoxon,秩和检验对中位数进行假设检验,需要假定两个总体分布有类似的形状才能得出可靠的结论。,例6.5 已知某企业职工的收入调查中20名本科毕业生和15名研究生的月收入(元) (数据文件:本科研究生收入.sav) ,试比较本科生和研究生的收入水平(显著性水平a=0.05)。,分析,由于收入一般是右偏分布,因此不适合用,t,检验进行分析。我们用,Wilcoxon,秩和检验来比较两个总体的中位数。,检验的零假设和备择假设如下:,H0,:本科和研究生月收入的中位数相等;,H1,:本科和研究生月收入的中位数不相等。,在,SPSS,软件中打开数据文件,选择“分析”,“非参数检验”,“,2,个独立样本”,在弹出的对话框中将“月收入”设定为检验变量,“学历”设定为分组变量,然后单击“定义组”,按照“学历”的取值进行设定,然后单击“继续”,检验类型使用默认“,Mann-Whitney U”,,单击 “确定”,结果分析:,学历,N,秩均值,秩和,月收入,本科,20,13.55,271.00,研究生,15,23.93,359.00,总数,35,根据精确检验的,p,值,在显著性水平大于,0.002,时我们应该拒绝原假设,结论是本科与研究生的收入的中位数不相等。,月收入,Mann-Whitney U,61.000,Wilcoxon W,271.000,Z,-2.967,渐近显著性,(,双侧,),.003,精确显著性,2*,(单侧显著性),.002,a,多个独立样本的,Kruskal-Wallis,检验,Kruskal-Wallis,检验是,Wlicoxon,秩和检验的推广,用来对多个总体的中位数进行比较。,在单因素方差分析模型不适用于所研究的问题时,,Kruskal-Wallis,往往是一种可以替代的非参数检验方法。,基本原理,Kruskal-Wallis,检验也是根据秩和来构造检验统计量的。将所有样本的数据合在一起,从小到大排序得到每个数值的秩,然后计算各样本的秩和以及平均秩。,如果各组没有显著性差异,则各组的平均秩应该趋于相等;如果各组的平均秩相差较大,则各组中位数有显著性差异的可能性较大。,检验统计量,基本原理:,当样本组数,k,,每组样本样本容量,n,i,不是很小时,检验统计量,H,的抽样分布近似服从自由度为,k-1,的,c,2,分布。,在,k,=3,,,n5,时,用,c,2,分布近似的误差较大,应该使用精确检验方法,如果,p,值小于显著性水平,a,,则拒绝零假设,说明,k,个总体中位数之间存在显著差异,例,5.1,用单因素方差分析的方法对,4,个专业的平均起薪进行了比较分析(数据文件起薪,1.xls,)。由于不确定总体是否服从正态分布,请使用,Kruskal-Wallis,检验比较四个专业毕业生的起薪是否有显著差异。,H0,:,四个专业起薪的中位数都相等;,H1,:,四个专业起薪的中位数不全相等。,在,SPSS,软件中打开数据文件,选择“分析”,“非参数检验”,“,k,个独立样本”,在弹出的对话框中将“起薪”设定为检验变量,“专业”设定为分组变量,然后单击“定义组”,按照“专业”的取值进行设定,然后单击“继续”,检验类型使用默认“,Kruskal-Wallis H”,,单击 “确定”,结果分析(1),专业,N,秩均值,起薪,1,6,17.50,2,6,17.25,3,6,9.42,4,6,5.83,总数,24,结论:,p,值为,0.006,。由于,p,值很小,所以有理由拒绝原假设,即认为这四个专业起薪的中位数不全相等。,起薪,卡方,12.316,df,3,渐近显著性,.006,特别说明,在样本量较小时,应当使用精确检验的结果,根据,c,2,分布进行近似会有较大的误差。,严格来说用,Kruskal-Wallis,检验对多个总体的中位数进行假设检验,需要假设多个总体分布有类似的形状才能得出可靠的结论。,第六章 非参数检验,非参数检验概述,非参数检验、特点及应用,单样本的非参数检验,c,2,拟合优度检验、,K-S,检验、中位数的符号检验及,Wilcoxon,符号秩检验,两个样本和多个样本的非参数检验,匹配样本的,Wilcoxon,符号秩检验、两个独立样本的,Wilcoxon,秩和检验,多个独立样本的,Kruskal-Wallis,检验,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!