医学统计学第五章线性回归课件

上传人:29 文档编号:251940780 上传时间:2024-11-11 格式:PPT 页数:42 大小:1.04MB
返回 下载 相关 举报
医学统计学第五章线性回归课件_第1页
第1页 / 共42页
医学统计学第五章线性回归课件_第2页
第2页 / 共42页
医学统计学第五章线性回归课件_第3页
第3页 / 共42页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第五章 线性相关与线性回归分析,1.相关分析原理,2.Bivariate过程,3.回归分析原理,4.Regression过程,5.1 一元相关与回归,5.2 多元回归方程,5.3 logistic回归,第五章 线性相关与线性回归分析1.相关分析原理2.,1,例,测某地10名三岁儿童的体重,X,(kg)与体表面积,Y,(10,1,m,2,),,体重,11.0,11.8,12.0,12.3,13.1,13.7,14.4,14.9,15.2,16.0,体表,5.283,5.299,5.358,5.602,5.292,6.014,5.830,6.102,6.075,6.411,判断X和Y是否是线性相关的。,例 测某地10名三岁儿童的体重X(kg)与体表面积Y,2,5.1 相关分析原理,1.直线相关:,(1)两个变量均服从正态分布,总体相关系数,:,样本相关系数:,r绝对值愈接近1,两个变量样本间的线性相关越密切,r绝对值越接近0,两个变量样本的线性相关越不密切,性质:,Pearson简单相关分析,5.1 相关分析原理1.直线相关:总体相关系数:样本相关系,3,相关系数的检验,原假设,则:,(),(2)如果不服从正态分布,则应考虑变量变换,或采用,等级相关来分析。,Spearman等级相关,Kendall 等级相关,注:列联表可用“Crosstabs 过程”中的“Contingency Coefficient”,计算Pearson列联相关系数,相关系数的检验原假设,4,2.曲线相关:两变量存在相关趋势,但非线性,而是呈某种可能的,曲线趋势。一般都先将变量变换,再将趋势变换为直,线来分析,或者采用曲线回归方法来分析。,5.2 Bivariate过程,例 某次体检中抽取12名学生的体重和血压,现通过相,关分析过程来观测学生的体重与血压是否相关?,体重,68,48,56,60,83,56,62,59,77,58,血压,95,98,87,96,110,155,135,128,113,168,目的,:检验,问题:,两变量数据是否服从正态分布?(需提前进行),是,Pearson相关分析,否,数据转换或进行等级相关分析,2.曲线相关:两变量存在相关趋势,但非线性,而是呈某种可能的,5,实现步骤:,1.将数据录入SPSS并整理加工,定义变量,输入数据,保存,weight:体重;pressure:血压;,保存为:“体重与血压,.sav”,实现步骤:1.将数据录入SPSS并整理加工定义变量,6,2.正态性检验,:Analyze,|Descriptive Statistics,|Explore(探索性),可以认为体重值、血压值服从正态分布。,2.正态性检验:Analyze|Descriptive,7,【Variables框】用于选,入需要进行相关分析的,变量,至少需要选入两个。,【Correlation Coefficients,复选框组】用于选择需要,计算的相关分析指标。,【Flag significant correlations】用于确定是否在结果中用星号,标记有统计学意义的相关系数,一般选中。此时P0.05的系数,值旁会标记一个星号,P0.9,R,2,r,2,一元线性回归方程中:,越接近于1,回归效果越好。,校正决定系数,1M,S,剩,/M,S,总,决定系数R2SS回/SS总1SS剩/SS总 0R2,14,例,测某地10名三岁儿童的体重,X,(kg)与体表面积,Y,(10,1,m,2,),,体重,11.0,11.8,12.0,12.3,13.1,13.7,14.4,14.9,15.2,16.0,体表,5.283,5.299,5.358,5.602,5.292,6.014,5.830,6.102,6.075,6.411,做体表Y关于体重X的回归方程。,做散点图,建立回归方程并检验,实现步骤:,保存为:“体重与体表,.sav”,x:体重;y:体表;,1.将数据录入SPSS并整理加工,定义变量,输入数据,保存,例 测某地10名三岁儿童的体重X(kg)与体表面积Y(1,15,医学统计学第五章线性回归课件,16,2.利用,Scatter/Dot命令做散点图,菜单“Graphs”|“Legacy Dialogs”|“Scatter/Dot”,点击“simple,scatter”,命令,点击“Define”按钮。,将“体重x”变量,选入“X Axis”框,,将“体表y”选入“Y,Axis”框中,点击,“OK”按钮输出结果。,2.利用Scatter/Dot命令做散点图菜单“Graphs,17,医学统计学第五章线性回归课件,18,(2)正态性检验,:Analyze,|Descriptive Statistics,|Explore(探索性),(2)正态性检验:Analyze|Descriptive,19,3.Regression过程,菜单 “Analyze”|“,Regression,”|“,linear,”命令,将“体表y”选入,【Dependent框】;,将“体重x”选入,【Independent(s),框】中,点击,“Statistics”按,钮,Enter,强迫进入,Stepwise,逐步回归,Remove,只出不进,Backward,向后剔除,只出不进,Forward,向前选择,只进不出,3.Regression过程菜单 “Analyze”|,20,【Model fit】输出复相关系数R,其平方 ,校正决定系数,和标准差,以及方差分析表。,选择“Estimates”、“Confidence interval”、“Model fit”、“Descriptives”,点击“continue”返回。,【Estimates】,输出有关回归,系数和相关测量,【Confidence,interval】输,出回归系数95%,的置信区间,【Descriptives】,描述性统计量,【Model fit】输出复相关系数R,其平方 ,,21,点击“OK”按钮输出结果,点击“OK”按钮输出结果,22,分析:给出了体表和体重的均数和标准差情况。,分析:此表给出了体重和体表的相关系数阵和P值。,结果输出和讨论:,分析:给出了体表和体重的均数和标准差情况。分析:此表给出了体,23,分析:R=0.918(即相关系数r),决定系数,校正的决定系数为0.823,估计值的标准误差为0.17434,分析:R=0.918(即相关系数r),决定系数校正的决定系数,24,分析:可见回归平方和 为1.301,剩余平方和,为0.243,F=42.798,P=0.0000.05,拒绝原假设,认,为是线性相关的,即回归方程有意义。,分析:可见回归平方和 为1.301,剩余平方和为0.,25,分析:非标准化系数 ,,t统计量分别为5.616和6.542,其P值分别为0.001和,0.000,均小于0.005,有显著性意义。,其回归方程为,分析:非标准化系数 ,t统计量,26,多元线性回归分析,研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析。,多元线性回归模型是一元线性回归模型的扩展,,其基本原理与一元线性回归模型类似,在计算上,更为复杂,一般需借助计算机来完成。,是偏回归系数,多元线性回归分析 研究在线性相关条件下,两,27,编号,载脂蛋白AI(mg/dl),载脂蛋白B(mg/dl),载脂蛋白E(mg/dl),载脂蛋白C(mg/dl),高密度脂蛋白(mg/dl),1,173,106,7.0,14.7,62,2,139,132,6.4,17.8,43,3,198,112,6.9,16.7,81,4,118,138,7.1,15.7,39,5,139,94,8.6,13.6,51,6,175,160,12.1,20.3,65,7,131,154,11.2,21.5,40,8,158,141,9.7,29.6,42,有研究认为血清中高密度脂蛋白降低是引起动脉硬化的,一个重要原因,现测量了30名被怀疑患有动脉硬化的就,诊患者的载脂蛋白A、载脂蛋白B、载脂蛋白E、载脂,蛋白C和高密度脂蛋白中的胆固醇含量,资料见表,,分析四种载脂蛋白对高密度脂蛋白中胆固醇含量的影响。,编号载脂蛋白AI(mg/dl)载脂蛋白B(mg/dl),28,9,158,137,7.4,18.2,56,10,132,151,7.5,17.2,37,11,162,110,6.0,15.9,70,12,144,113,10.1,42.8,41,13,162,137,7.2,20.7,56,14,169,129,8.5,16.7,58,15,129,138,6.3,10.1,47,16,166,148,11.5,33.4,49,17,185,118,6.0,17.5,69,18,155,121,6.1,20.4,57,19,175,111,4.1,27.2,74,20,136,110,9.4,26.0,39,21,153,133,8.5,16.9,65,22,110,149,9.5,24.7,40,23,160,86,5.3,10.8,57,24,112,123,8.0,16.6,34,91581377.418.256101321517.517.,29,25,147,110,8.5,18.4,54,26,204,122,6.1,21.0,72,27,131,102,6.6,13.4,51,28,170,127,8.4,24.7,62,29,173,123,8.7,19.0,85,30,132,131,13.8,29.2,38,实现步骤:,x1:载脂蛋白AI;X2:载脂蛋白B;X3:载脂蛋白E,X4:载脂蛋白C;y:胆固醇含量。,1.将数据录入SPSS并整理加工,定义变量,输入数据,保存,251471108.518.454262041226.121,30,医学统计学第五章线性回归课件,31,2.正态性检验:,Analyze,|Descriptive Statistics,|Explore(探索性),2.正态性检验:Analyze|Descriptive,32,医学统计学第五章线性回归课件,33,3.Regression过程,菜单 “Analyze”|“,Regression,”|“,linear,”命令,将“y”选入,【Dependent框】;,将“x1、x2、x3、x4选入,【Independent(s),框】中,在methods中选择,“stepwise”。,点击“Statistics”按钮,3.Regression过程菜单 “Analyze”|,34,选择“Estimates”、“Confidece interval”、“Model fit”、“Descriptives”,点击“continue”返回。,选择“Estimates”、“Confidece inte,35,【Options钮】选择进入或排除,变量的显著水平,此处因为是stepwise(逐步回归),所以entry填0.10,Removal填0.15.点击continue回到主对话框。,点击“OK”按钮,【Options钮】选择进入或排除此处因为是stepwise,36,结果输出和讨论:,结果输出和讨论:,37,医学统计学第五章线性回归课件,38,医学统计学第五章线性回归课件,39,医学统计学第五章线性回归课件,40,其回归方程为,分析:非标准化系数 ,,标准化回归方程为,其回归方程为分析:非标准化系数,41,作业,测某地10名三岁儿童的体重,X,(kg)与体表面积,Y,(10,1,m,2,),,体重,11.0,11.8,12.0,12.3,13.1,13.7,14.4,14.9,15.2,16.0,体表,5.283,5.299,5.358,5.602,5.292
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!