资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,简单相关与回归,第,10,章 非参数检验,SPSS,应用,华中科技大学公共卫生学院,流行病学与卫生统计学系,蒋红卫,jhwccc,内容,简单相关分析,Pearson,相关,Spearman,相关,Wilcoxon,符号秩检验,简单回归分析,相关分析简介,在医学科学研究中,常常要分析两个变量之间的关系,身高和体重,年龄和血压,体温和脉搏,药物剂量和疗效,涉及到研究两个变量的相互关系。,相关,回归,积差相关系数,又称,Pearson,相关系数:定量描述线性相关程度好坏的常用指标,只适用于两变量呈线性相关时。,特点,相关系数,r,是一个无单位的量值,且,-1 r 0,为正相关,,r 0,为负相关;,r,越接近于,1,,说明相关性越好;越接近于,0,,相关性越差。,Spearman,等级相关系数:当数据不满足条件双变量正态时。,连续变量的相关指标(最常见),有序变量的相关指标,Gamma,统计量:描述有序分类变量数据联系强度的指标,以下指标都是基于,Gamma,统计量衍生出来的。,Kendalls Tau-b,:反映两个有序分类变量的一致性。,Kendalls Tau-c,: 对,Kendalls Tau-b,进行了校正,名义变量的相关指标,列联系数:基于,2,值得出,Phi and Cramers V,:也是基于,2,值得出,Lambda,系数:用于反映自变量对因变量的预测效果,不确定系数,其他相关指标,Eta,Kappa,值,OR,、,RR,等,分类变量,实际上,在,Crosstabs,过程的,statistics,子对话框中提供了非常整齐的相关分析指标体系,四格表的关联分析,例,1,研究吸烟方式与慢性气管炎的关系。数据如下,试分析两种属性间的关联性。,吸烟方式,慢性气管炎,合计,有,无,自卷吸烟,22,53,75,过滤嘴,15,110,125,合计,37,163,200,四格表的关联分析,先要回答两种方法是否存在着关联,直接作非配对四格表的卡方检验,再回答二者的关联程度,列联系数,SPSS,基本操作,SPSS,基本操作,SPSS,基本操作,SPSS,基本操作,SPSS,基本操作,配对四格表的关联分析,例,2,研究两种检验方法检验沙门氏菌的关系。数据如下,试分析两种方法间的关联性。,甲法,乙法,合计,+,+,80,10,90,31,11,42,合计,111,21,132,配对四格表的关联分析,分析与非配对四格表相同,先要回答两种方法是否存在着关联,直接作非配对四格表的卡方检验,再回答二者的关联程度,列联系数,SPSS,基本操作,与非配对四格表相同,R*C,表的关联分析,(,构成比,),例,3,探讨不同职业与胃病类型的关联性。数据如下,问职业类型与胃病类型有无关联?,职业,胃病,合计,浅表型胃炎,慢性胃炎,胃溃疡,干部,80,48,4,132,工人,52,62,12,126,司机,20,22,10,52,合计,152,132,26,310,R*C,表的关联分析,与四格表关联分析相同,R*C,表的关联分析,(,双向无序,),例,4,探讨,ABO,血型与,MN,血型有无关联性?,ABO,MN,合计,M,N,MN,O,85,100,150,335,A,56,78,120,254,B,98,132,170,400,AB,23,25,6,54,合计,262,335,446,1043,R*C,表的关联分析,与四格表关联分析相同,连续型变量,Bivariate,过程:最常用,Partial,过程:专门进行偏相关分析,Distances,过程:一般不单独使用,而用于因子分析、聚类分析和多维尺度分析的预分析,动物编号,1,2,3,4,5,6,7,8,9,10,进食量,feed,820,780,720,867,690,787,934,679,639,820,体重增量,weight,165,158,130,180,134,167,186,145,120,158,进食量和体重增量的数据,例,5,例,5,某医院研究某种代乳粉的营养价值是用大白鼠做试验,得大鼠进食量和体重增量间的关系的原始数据如下,试分析两者有无直线相关关系。,两变量间存在线性相关趋势,没有发现明显的异常值,散点图,SPSS,操作,选入希望进行相关分析的变量,选择相关分析指标,相关系数,Spearman,等级相关系数,利用上述对话框可以计算秩相关系数,即,spearman,相关系数,对原始数据分布不作要求,利用两变量的秩次关系作线性相关分析,适用范围更广,但效能也较低。,选入希望进行相关分析的变量,选择相关分析指标,相关系数,Kendall,等级相关系数,上述对话框可用于计算,kendalls,等级相关系数,适用于两变量均为有序分类的情况,选入希望进行相关分析的变量,选择相关分析指标,相关系数,问题,大家可以发现,对相同的数据,秩相关系数和等级相关系数的绝对值均比积差相关系数小,为什么?,这是由于在秩变换或数据按有序分类处理时损失信息所导致的。,方差协方差矩阵,计算各变量的方差协方差矩阵,计算方差协方差矩阵,方差协方差矩阵,偏相关分析,前面介绍的相关分析是分析两个计量资料间的关系,在计算积差相关系数、,Spearman,相关系数和,Kendalls,相关系数的时候,都没有考虑第三方的影响,这就导致可能对事物的解释出现偏差。,下面以一个例子对此作进一步的说明,例,6,例,6,某地,29,名,13,岁男童身高(,x1,cm,)、体重(,x2,kg,)及肺活量的实测数据。试计算其简单相关系数。当体重固定时,计算身高与肺活量的偏相关系数,并做假设检验。,偏相关,选择需要在偏相关分析时进行控制的变量。,偏相关分析,偏相关分析,选择,Zero-order correlations,复选框,则可以给出包括协变量在内所有变量两两相关的系数阵,简单回归分析,例,7(,例,5,续,),,进一步作回归分析,计算进食量与体重增量之间的回归方程。,与相关分析类似,在回归分析之前首先要考虑的问题是两变量是否存在某种趋势,通过前面的,散点图,已经得到了肯定的结论,因此直接进行回归分析。,两变量间存在线性相关趋势,没有发现明显的异常值,散点图,SPSS,基本操作,选择,应变量,选择,自变量,SPSS,基本操作,小结,SPSS,中“,Analyze”/“,Discriptive,Statistics”,菜单主要用于分类变量的相关分析。,SPSS,中“,Analyze”/“Correlate”,菜单主要用于连续型变量的相关分析。,Bivariate,Partial,Distance,45,谢谢大家!,
展开阅读全文