专题:分组数据的统计分析

上传人:痛*** 文档编号:246110266 上传时间:2024-10-12 格式:PPT 页数:32 大小:822.50KB
返回 下载 相关 举报
专题:分组数据的统计分析_第1页
第1页 / 共32页
专题:分组数据的统计分析_第2页
第2页 / 共32页
专题:分组数据的统计分析_第3页
第3页 / 共32页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,统计学原理专题,专题:分组数据的统计分析,分析方法选择的依据,需要哪种分析方法:描述或推论,拥有哪类样本:概率样本与非概率样本,测量尺度:定距,/,定比,定序,定类,何种比较:集中趋势,变异性,形状,比例,相关性,结果呈现方式:表,图,统计摘要,分组方式:单组或与已知值对比,两组,多组,分组独立性:独立样本,配对样本,正态性:因变量是否满足正态分布,方差齐性:各组因变量方差是否相同,自变量数量:多个自变量的独立影响,偏影响,检验,1,:两个相关样本,1.,符号检验,对于配对样本,检验两个组的对应样本之差,计算取,+,号和取,-,号的频数,进行符号检验。,可以进行双侧检验和单侧检验。,2,、,Wilcoxon,符号秩检验,符号秩检验与符号检验的原理相同,但增加了对差值大小的检验,因此判断能力更强,考察以下数据,24.3 25.8 25.4 24.8 25.2 25.1 25.0 25.5,能否认为其中位数是,25,?,建立原假设,H0,:数据中位数为,25,计算下表,编号,数值,的秩,D,的符号,1,24.3,-0.7,0.7,6,2,25.8,0.8,0.8,7,+,3,25.4,0.4,0.4,4,+,4,24.8,-0.2,0.2,2.5,5,25.2,0.2,0.2,2.5,+,6,25.1,0.1,0.1,1,+,7,25.0,0,0,8,25.5,0.5,0.5,5,+,计算所有,+,号的秩和,T,+,=19.5,,所有,-,号的秩和,T,-,=8.5,查表得,P-level=0.211,,不能拒绝原假设,即无法否认中位数为,25,。,在,N,足够大时,对于两个相关样本的情况,可以计算二者之差,然后建立原假设,检验二者之差的中位数为,0,,在此基础上进行,Wilcoxon,符号秩检验。,检验,2,:两个独立样本,1,、,Mann-Whitney-Wilcoxon,检验,译作:曼,-,惠特尼,-,威尔克森检验,有时简作“曼,-,惠特尼,U,检验”。,检验目的在于判断两个独立样本是否为同分布。,对于两个独立样本,X,和,Y,,假定其样本量分别为,m,和,n,,将其进行混合,并进行排列,计算各自的秩和。,在一次实验中,获得实验组和对照组结果如下,实验组,(X),:,8,,,12,,,18,对照组,(Y),:,6,,,9,,,11,,,13,建立原假设,H0,:两个独立样本同分布,进行混合排序,计算,X,和,Y,的秩和均为,14,。,构造统计量,在,m,n,10,的条件下,可以查表获得其显著性。,M,和,n,均大于,10,时,数据,6,8,9,11,12,13,18,秩,1,2,3,4,5,6,7,组别,Y,X,Y,Y,X,Y,X,2,、,Wald-Wolfowitz,游程检验,H0,:两个独立样本同分布,或者二者有相同的中位数。,将两组数据进行混合排列,观察所产生的序列的游程数,U,。,在原假设成立的情况下,两个样本高度混合,游程数较多。如果游程数偏少,则表明二者的中位数不同。,在,m+n20,时,,U,近似服从于正态分布。,3,、两样本的,2,检验,对于两个定类尺度的样本,假定划分为,R,个组,则各组的理论频数可以按下列公式计算,构造统计量,若两总体同分布,,Q,服从于,r-1,个自由度的卡方分布,4,、两样本的,Kolmogorov-Smirnov,检验,对于两个定序以上尺度的样本,计算,建立原假设,H0,:两个样本同分布,在假设下,,D,值应当很小。当,D,值超过指定的边界值时,拒绝原假设。,检验,3,:,K,个相关样本,1,、,Cochran Q,检验,用于检验,K,个组的某些定类测量结果是否存在差异。,观察一个口味调查的例子:对,18,名受访者进行四种饮料,(,热牛奶,酸奶,果汁,可乐,),的偏好调查,得到数据如下,消费者,热牛奶,酸奶,果汁,可乐,合计,(,Y,),1,1,0,0,1,2,2,0,0,1,0,1,3,0,0,1,1,2,4,1,1,0,0,2,5,1,0,1,0,2,6,0,1,0,0,1,7,0,0,0,1,1,8,0,1,0,0,1,9,0,1,1,0,2,10,1,1,1,0,3,11,0,0,1,0,1,12,0,0,1,0,1,13,1,0,0,1,2,14,1,1,0,0,2,15,1,1,0,0,2,16,0,1,0,0,1,17,1,0,0,1,2,18,0,0,0,1,1,合计,(,X,),8,8,7,6,29,建立原假设,H0,:,K,个样本间无明显差异,构造统计量,在样本量,N,比较大时,,Q,服从于,K-1,个自由度的卡方分布。,2.,Friedman,检验,检验,K,个样本是否来自于同一个总体,与,Cochran Q,检验一样,,Friedman,检验也要求样本是配对样本,即在,K,个不同条件下的同一组样本作出的反应。,Friedman,检验主要针对定序数据。,构造,Q,服从于,K-1,个自由度的卡方分布,学生组,电视教学,课堂讲授,课堂讨论,1,1,3,2,2,1,2,3,3,2,3,1,4,3,2,1,5,2,1,3,6,1,3,2,7,1,2,3,8,2,3,1,9,2,1,3,10,2,1,3,11,1,3,2,12,1,3,2,13,1,2,3,14,1,3,2,15,1,2.5,2.5,16,1,2,3,17,1,2,3,18,1,2,3,合计(,),25,40.5,42.5,数据:将,54,名学生分成,18,个组,每组,3,名学生,分别接受电视教学、课堂讲授和课堂讨论三种教学方法。学习后进行测试,根据分数计算三种方法的秩如下。,计算,Q=10.8,,,2,个自由度的卡方值为,5.99,,拒绝原假设,即认为三种教学方法存在差异性。,检验,4,:,K,个独立样本,1,、,Kruskol-Wallis,检验,译作“克拉夏尔,-,瓦里斯检验”,也可称为“克氏检验”,是对两个独立样本的,Mann-Whitney-Wilcoxon,检验的推广。,假设有,K,个总体,各自的连续累积分布函数分别为,F,i,(x),。,建立原假设,将,K,个样本进行混合,其秩和为,N(N+1)/2,,平均每个值的秩为,(N+1)/2,考察第,J,个样本,其实际秩和为,R,j,,理论秩和为,n,j,(N+1)/2,。,在原假设成立的情况下,实际秩和与理论秩和的差异应当很小。构造统计量,H,服从,K-1,个自由度的卡方分布。,2.K,个样本的,2,检验,建立原假设,H0,:,K,个样本同分布,将,K,个样本分布为,r,个组,每组计算期望频数和理论频数。,统计量,Q,服从于,(k-1)(r-1),个自由度的卡方分布,检验,5,:两个样本的相关分析,1,、等级相关,计算斯皮尔曼等级相关系数,(Spearman coefficient of rank correlation),。,将两个样本按观察数据的顺序进行配对,分别计算每个数据的秩,将两组样本的秩分别记录为,U,和,V,。,如果两个测度完全一致,则,U,与,V,的差异应当为,0,。,计算,D,U,V,的平方和,该值越大,表明相关性越差。,2,、,Kendall,秩相关,对于,n,个配对样本,先将样本,X,的秩按自然顺序排列,然后将,Y,的秩与,X,的秩相对应,从而得到,Y,的一个秩排列顺序。,计算,Y,的秩序情况,得到“一致对”的数量,U,和“非一致对”的数量,V,。,利用上述三个公式之一,可以计算出秩相关系数,T,,取值在,-1,至,+1,之间。,K=U-V,,,T,为希腊字母,的大写,发音为,Tao,。,Kendall,秩相关中的“一致对”也称协同对,(Concordant),,,意思为满足下列条件的数对:,协同对的数量减去不协同对的数量得到的,K,值在大样本条件下有,3.,偏秩相关,偏秩相关是检验当存在第三组样本量时,前两组样本之间的相关系数独立于第三组样本的情况。,该相关系数的取值范围也在,-1,至,+1,之间,但其抽样分布至今未知,因此难以进行显著性检验。,检验,6,:,K,个样本的相关分析,1,、完全秩评定的,Kendall,协和系数,Kendall Coefficient of Concordance for Complete Rankings,。,数据:,3,名消费者对,6,个品牌的电冰箱质量评定的秩如下,消费者,品牌,A,品牌,B,品牌,C,品牌,D,品牌,E,品牌,F,1,1,6,3,2,5,4,2,1,5,6,4,2,3,3,6,3,2,5,4,1,秩和,(,R,j,),8,14,11,11,11,8,各品牌秩和的期望值为,k(n+1)/2,,在各组呈正相关的情况下,秩和,R,j,的离散程度较大。特别是,当各组的秩评定严格相等的时候,秩和表现为如下序列:,k,,,2k,,,3k,,,,,jk,。,构造统计量,定义,Kendall,完全秩评定协和系数为,该系数取值为,0-1,,取值为,0,时,表示,K,组秩不相关,2.,Kendall,不完全秩评定协和系数,假定有,K,个样本,每组含有,n,个观察值,但每组观察值评定的秩为,m,,,mn,,此为不完全秩评定。,考虑评定次数,的影响,建立以下平衡关系,构造协和系数,3.,Friedman,检验和多重比较,Friedman,检验:,Friedmans Two-way analysis of variance by ranks,。用于检验,K,组秩之间的联系。,例如:,针对同一种疾病的,n,种处理,建立如下原假设:,其中,,j,表示第,j,种处理的平均结果,定义列秩和的离散平方和为,构造统计量,Q,服从,n-1,个自由度的卡方分布,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!