资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,直线相关与回归分析,1,直线相关分析,直线相关分析是研究两个连续性变量间线性相关的方向及相关密切程度的统计方法。资料要求X、Y均为随机变量,且服从双变量正态分布。,2,相关系数用以说明两个变量间线性关系的密切程度及方向的统计指标。,3,相关系数没有单位,取值范围是-1,r,1。r值为正,为正相关;,r,值为负,为负相关。,r,的绝对值越接近于1,表示两变量相关关系越密切;反之,越接近于0,两变量越差。,4,例 研究者研究大白鼠进食量(g)体重增量(g)间的关系如下表, 分析两者之间有无相关关系。linear1.sav,5,散点图显示两变量间存在线性关系,未发现离群值,6,相关分析:SPSS操作,Analyze,Correlation,Bivariate,Variable: feed 、weight,Correlation coefficient: Pearson,OK,7,相关系数r=0.940, P0.01。进食量与体重增加量存在较强的正相关关系 。,8,秩相关分析,用于不服从双变量正态分布的资料;总体分布未知;,原始数据用等级表示的资料。,9,例:欲研究年龄与限制性端粒片段长短的相关关系。Corr1.sav,10,等级相关分析:SPSS操作,Analyze,Correlation,Bivariate,Variable: age 、trf,Correlation coefficient: Spearman,OK,11,秩相关系数rs=-0.748, P0.01。年龄与限制性端粒片段长短存在负相关,相关程度较高。,12,偏相关分析,控制其它变量的作用后, 两个变量之间的相关关系。,控制了第三个因素的影响后,第一、第二因素的相关系数。,13,例:儿童血红蛋白与血清各种元素见的资料见linear2.sav,14,两两变量的简单相关系数,15,控制铁后各变量之间的相关系数。,16,直线回归分析,直线回归是研究两变量(X、Y)间的数量依存关系的一种统计方法。其分析的任务是确定一条直线回归方程,保证各实测点距回归直线的纵向距离的平方和最小。,17,直线回归方程的理论模型:,直线回归方程的一般表达式:,18,a,表示直线在Y轴上的截距,即当X=0时Y的值。,b,为回归系数, 即回归直线的斜率。,b,的统计学意义是,X,每增加(减)一个单位,Y平均改变,b,个单位。,19,适用条件:,线性,独立,正态,等方差,20,回归系数的假设检验:,t,检验及方差分析,回归拟和指标:,决定系数,21,例,大白鼠进食量(g)体重增量(g)资料为例, 分析两者之间有回归关系。linear1.sav,22,Spss回归分析,Analyze,regression,linear,Dependent: weight,Independent: feed,OK,23,相关系数0.94, 决定系数0.883, 校正决定系数0.868,24,模型的方差分析表,回归模型F=60.197,P0.01,模型有统计学意义。,25,回归参数的估计值及检验结果。,变量回归系数t检验,t7.759,P0.01。,回归方程weight=-17.357+0.222feed,26,残差的直方图 显示残差满足正态性要求,27,残差的P-P图显示残差满足正态性要求,28,残差的散点图显示残差等方差,29,
展开阅读全文