《直线相关与回归》PPT课件.ppt

上传人:za****8 文档编号:15507622 上传时间:2020-08-14 格式:PPT 页数:64 大小:2.17MB
返回 下载 相关 举报
《直线相关与回归》PPT课件.ppt_第1页
第1页 / 共64页
《直线相关与回归》PPT课件.ppt_第2页
第2页 / 共64页
《直线相关与回归》PPT课件.ppt_第3页
第3页 / 共64页
点击查看更多>>
资源描述
1,第九章 双变量回归与相关,环境与公共卫生学院 叶晓蕾,2,资料特点:每个观察对象有两个变量。,概念,3,类似上例的问题: 年龄-身高; 肺活量-体重; 药物剂量-动物死亡率,双变量资料,统计资料,单变量资料:X 双变量资料:X,Y 多变量资料:X1,X2,XK,Y,4,相关与回归是研究两个或多个变量之间相互关系的一种分析方法。,数据结构,5,两变量(X,Y),无关系,有关系,函数关系,相关(回归)关系,圆周长: y = 2r,直线关系,曲线关系,直线相关与回归,曲线拟合,6,回归:是研究变量之间在数量上依存关系的一种方法。 相关:是研究随机变量之间相互联系密切程度和方向的方法。 直线相关与回归:只涉及两个变量,而且分析是否呈直线关系,是回归和相关分析中最简单的一种。又称简单相关和回归。,概念:,7,直线相关与回归的一般步骤:,绘制散点图,直线相关分析,直线回归分析,求相关系数,相关系数假设检验,结论,求回归系数和截距,列出回归方程,回归系数假设检验,8,一、直线回归(linear regression),1. 直线回归方程,:应变量Y的平均估计值 a:截距(intercept) b:回归系数(regression coefficient),注意直线回归方程与函数方程的不同,9,应用条件 线性(linear)、独立性(independent)、正态性(normal)、等方差(equal variance)“LINE”。 线性自变量与应变量的关系是线性的。用散点图判断。 独立性任意两个观察值互相独立。 正态性在任意的自变量X的取值处,应变量y均服从正态分布。 等方差在任意的自变量X的取值处,应变量y的方差均相同。,10,11,例1,12,20名糖尿病人的血糖水平与胰岛素水平的散点图,SPSS,13,回归直线的求法 原理(最小二乘法),各散点距离回归直线的纵向距离(残差)平方和为最小而得到直线。,14,计算:,回归直线必通过点,15,16,17,18,19,3. 直线回归的假设检验 即推断总体回归系数 ()是否为零,即:SS总=SS回归+SS残余,剩余或残差(residual),(1)方差分析,20,查附表3,F0.01(1,18)=8.28 P 0.01 (2)检验 = (b 0)/ b =n-2,21,(-0.4585 - 0)/0.0699 = - 6.56 = 18,t0.01(18) = 2.878 P 0.01 F = t2=(-6.56)2 = 43.03,22,23,4. 直线回归中的区间估计,(1)总体回归系数的区间估计:,例:上例中,b=-0.4585,Sb=0.0699,t0.05,18=2.101 的95%可信区间:,24,25,26,(2) 的估计:,即总体中当X为某定值X0的条件下Y的均数。,27,即:11.9182.1010.3396= ( 11.08, 12.76 ),例:用 例1所求直线回归方程,试计算当X0= 15 mU/L时, 的95%可信区间。,28,的(1)可信区间图,29,(3)个体Y值的预测区间(容许区间):,即总体中当X为某定值X0时,个体Y值的波动范围。,注意:SY并非是样本观察值Y的标准差,30,个体Y值的(1)容许区间图,31,例: 例1中,当X=15,求个体Y值的预测区间(=0.05)。,32,5. 直线回归方程的应用 (1)预测: 即把预报因子(自变量X)代入回归方程对预报量(应变量Y)进行估计。 1)点预测: 2)区间预测:,33,区间预测: 当X是已知时,按一定概率估计应变量所在范围。 可按求个体Y值预测区间方法计算。,34,例:例1资料中,当胰岛素浓度X=15mU/L时,试估计血糖浓度(=0.05)。,35,(2)控制: 指当要求应变量Y在一定范围内波动时,如何控制自变量X的取值。 例 :已知血糖正常范围为(4.446.66 mmol/L),在前例资料的基础上,问欲将血糖水平控制在正常范围内时,血中胰岛素应维持在什么范围内(=0.05) ?,36,解得:X( 33.95, 38.79)mU/L,37,38,39,40,1. 相关系数(, r) 表示两变量直线相关的密切程度和方向。 相关系数波动范围: -1 r 1 (1)密切程度: |r| 1,相关越密切; |r| 0,相关越弱。 r=1或 -1,称完全相关; r=0, 称零相关,表示不存在直线相关关系,但不排除存在某种曲线关系的可能性。 (2)方向: r 0, 正相关; r 0, 负相关。,二、直线相关(linear correlation),41,42,2. 相关分析的步骤 (1)绘制散点图观察两变量间是否呈直线趋势,20名糖尿病人的血糖水平与胰岛素水平的散点,43,(2)计算相关系数,计算例1资料的相关系数,Pearson 相关系数 积差法相关系数,44,3. 相关系数的假设检验,例1 资料: H0: = 0 ; H1: 0;=0.05,查表得:P 0.01 (结果同回归系数检验),c,t 检验,查表法:P.719 r界值表。,45,三、应用直线回归时注意事项 1)应有实际意义; 2)分析前应绘制散点图; 3)用残差图考察数据是否符合模型假设条件 4)应在实际回归范围内绘制回归直线; 5)结果的解释及正确应用,46,47,残差分析模型诊断,通常以标准化残差(standardized residual)为纵坐标,以 为横坐标,作残差图。,48,49,A,B,C,D,E,F,残差呈随机分布,残差不满足方差齐性条件,存在非线性关系,有异常点,50,四、等级相关(秩相关 rank correlation ),1. 适用于下列资料: (1)不服从双变量正态分布的资料(如二项分布); (2)总体分布型未知; (3)原始数据是用等级表示。 2. 等级相关系数(rs)意义 不用原始数据计算,而是根据数值大小的秩次进行计算。其意义同直线相关系数。,51,3. 等级相关系数的计算 (1)按直线相关系数公式计算,只是用秩次代替原始观察值。,(2)Spearman公式法:,52,例 为研究饮水中氟含量与氟中毒患病率之间的关系,测定了9个居民点井水中的氟含量X(mg/L),并同时通过体检得到这些居民点中常住居民的氟中毒患病率Y(%),资料如下表:,53,54,4. 等级相关系数的假设检验,H0: s = 0 ; H1: s 0;=0.05,(1)查表法:n 50时,查rs界值表(P.721)进行假设检验。 查表得:rs 0.001(9) = 0.933, P0.001,55,(2) 计算法:,以=9-2=7查t界值表,得P0.001,SPSS,56,双变量资料的相关分析方法选择,直线相关(Pearson相关)双变量正态 等级相关(Spearman相关)非双变量正态或等级资料。 X2检验分类资料或等级资料,57,讨 论 题,1. 某地防疫站用碘剂局部注射治疗219例地方性甲状腺肿,结果如下表,问患者年龄与疗效有无关联?,地方性甲状腺肿患者各年龄组疗效观察结果,58,两变量之间不呈直线而是呈曲线关系时,要用适当的曲线方程来描述两变量间的关系。 1. 曲线的类型 如指数曲线、幂曲线、多项式曲线、生长曲线等。,五、曲线配合(曲线拟合),59,60,61,2. 曲线配合的基本步骤,(1)绘制散点图; (2)根据两变量间相关变化的曲线类型选择适当的曲线方程; (3)用计算机有关统计软件进行拟合; (4)根据配合适度指标(常用决定系数R2)来确定最优方程。,62,例 在一次麻疹流行中,调查了某小学各班级麻疹曾患率X(%)与发病率 Y(%)资料如下:,3. 曲线配合的实例,63,64,
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!