多元线性回归与多元逐步回归

上传人:沈*** 文档编号:241999755 上传时间:2024-08-09 格式:PPT 页数:36 大小:946.54KB
返回 下载 相关 举报
多元线性回归与多元逐步回归_第1页
第1页 / 共36页
多元线性回归与多元逐步回归_第2页
第2页 / 共36页
多元线性回归与多元逐步回归_第3页
第3页 / 共36页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,多元线性回归与多元逐步回归,例 子,一个应变量与多个自变量间的关系,儿童身高与年龄、性别的关系,肺活量与年龄、性别、身高、体重,以及胸围的呼吸差等因素的关系,多元线性回归,如构成线性依存关系,第一节 多元线性回归第二节多元逐步回归第三节 多元线性回归的本卷须知,第一节 多元线性回归 multiple linear regression,多元线性回归的数据格式,一、多元线性回归方程,(multiple linear regression equation),常数项,表示当所有自变量为0时,应变量Y的总体平均值的估计值,表示除以外的其它自变量固定不变,的情况下,每改变一个测量单位时,所引起的应变量,Y,的平均改变量,bj为偏回归系数partial regression coefficient),两个自变量与应变量的散点图,两个自变量与应变量的拟合面,b,j,为,x,j,方向的斜率,1.求偏回归系数,b,j,及,b,0,根据最小二乘法(method of least square)原理求出,b,j,即,得到,b,j,2.例 子,例11.1 20名糖尿病人的血糖、胰岛素及生长素的测定值列于下表中,试建立血糖对于胰岛素及生长素的二元线性回归方程,。,对于本例有:,采用最小二乘法即可求出常数项,b,0,和偏回归系数,b,1,、,b,2,。其中,对表11-2的数据资料由SAS统计软件可得到如下表11-3的主要结果。,由此得到回归方程为,二、回归方程的假设检验,其中:,自由度为,总,n,1,,回归,k,,,剩余,n,k,1,X,2,X,1,Y,Model SS,Total SS,Residual SS,由表11-4可知,,F,21.54,,P,0.05。从而,拒绝,H,0,可以认为,和,不全为0,即所求回归方程有统计学意义。,H,0,:,H,1,:,和,不全为0,对表11-3的数据资料,由SAS统计软件可得到如下表11-4的模型检验结果。,偏回归系数的检验,1F检验,j,=1,2,k,之中,,U,为,X,j,的偏回归平方和,即,U,=,SS,回归,SS,回归(-,j,),F,j,服从,F,(1,n-k-1),分布,F,检验表,方程内,自变量,平方和,F,P,SS,回归,SS,回归,-,SS,回归,(-j),SS,残差,X1,X2,116.6,46.025,X2,66.275,50.352,18.598,0.05,在,0.05水平上,可以认为胰岛素对血糖的线性回归关系有统计学意义,而生长素对血糖的线性回归关系无统计学意义。所以应剔除,X,2,只建立,X,1与,Y,的线性回归方程。,(2),t,检验,j,=1,2,k,,,P=,0.0005;,在,0.05水平下,认为血糖与胰岛素的线性回归关系,有统计学意义,而与生长素的线性回归关系无统计学意义。,结论与,F,检验一致,。,,。,三、标准化回归系数standardized partial regression coefficient),式中,,S,j,及,S,y,分别为自变量,X,j,及因变量,Y,的标准差。,可以利用标准化偏回归系数的大小,来反映各自变量的奉献大小。,复相关系数 multiple correlation coefficient又称多元相关系数或全相关系数,表示回归方程中的全部自变量 X共 同对应变量Y的相关密切程度。复相关系数取值总为正值,在0与1之间,简记为R。如果只有一个自变量,此时,四、,复相关系数与决定系数,2决定系数(coefficient of determination 复相关系数的平方又称决定系数,记为 ,用以反映线性回归方程能在多大程度上解释应变量Y的变异性。,回归方程的拟合程度越好,残差平方和就越小,决定系数 越接近1,决定系数 越接近1,第二节多元逐步回归 multiple stepwise regression,1.多元逐步回归的根本思想,多元逐步回归multiple stepwise regression,有三种筛选自变量的方法:,1向后法Backward selection 先建立一个全因素的回归方程,然后每次剔除一个偏回归平方和最小且无统计学意义的自变量,直到不能剔除时为止,此法的计算量大,有时不能实现。,2向前法forward selection 方程由一个自变量开场,每次引入一个偏回归平方和最大,且具有统计学意义的自变量,由少到多,直到无具有统计意义的因素可以引入为止。用此法建立的方程有时不够精炼。,3.逐步法stepwise selecfion 取上述两种方法的优点,在向前引入每一个新自变量之后都要重新对前已选入的自变量进展检查,以评价其有无继续保存在方程中的价值。为此引入和剔除交替进展,直到无具有统计学意义的新变量可以引入也无失去其统计学意义的自变量可以剔除时为止。,每一步只引入或剔除一个自变量。自变量是否被引入或剔除那么取决于其偏回归平方和的F检验或校正决定系数。,如方程中已引入了(m-1)个自变量,在此根底上考虑再引入变量Xj。记引入Xj 前方程即含m个自变量的回归平方和为SS回归,残差为SS残差;之前含(m-1)个自变量不包含Xj 方程的回归平方和为SS回归(-j),那么Xj 的偏回归平方和为 U=SS回归SS回归(-j),检验统计量为:,F,j,服从,F,(1,n-m,-1),分布,如果FjF(1,n-m-1),那么 Xj选入方程;否那么,不入选。,从方程中剔除无统计学作用的自变量,过程那么相反,但检验一样。,3.多元逐步回归的检验水平,在进展逐步回归前,首先应确定检验水平,以作为引入或剔除变量的标准。检验水平可以根据具体情况而定,一般可将 F 值定在 为0.05、0.10或0.20水平上。对于回归方程的选入和剔除水平往往选择,选入剔除。,选择不同的F 值(或水平),其回归方程的结果可能不一致,一般可选不同的F 值(或值)作调试。至于何种结果是正确的,必须结合医学的实际意义来确定。,4.,多元逐步回归事例,对例11.2采用逐步法筛选自变量,选入水准为 0.10,剔除水准为0.15,SAS 软件计算过程及相应结果见表11-8至,表11-11。,多元逐步回归方程为:,第三节多元线性回归的本卷须知,1.应用条件,1 线性依存关系 应变量与自变量间具有线性依存关系。,2 正态性 应变量原那么上是连续型可测正态变量,其预测值与实际观测值的差值即残差服从正态分布,当样本量较大时可以忽略正态性的要求。,3独立性 观察单位之间是独立的,即应变量的观测值相互独立。,2.样本含量,一般应使样本量是自变量个数的 5 倍以上。,3.自变量的数量化 注意名义变量的数量化。,4.筛选自变量的检验水平 要考虑入选变量的实际意义。5.多重共线性 可采用主成分分析或因子分析等方法构建新的自变量后再进展多元线性回归来消除多重共线性。,谢 谢!,谢谢!,汇报结束,谢谢大家,!,请各位批评指正,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!