spss多元回归分析案例讲解

上传人:xx****x 文档编号:243397261 上传时间:2024-09-22 格式:PPT 页数:30 大小:151KB
返回 下载 相关 举报
spss多元回归分析案例讲解_第1页
第1页 / 共30页
spss多元回归分析案例讲解_第2页
第2页 / 共30页
spss多元回归分析案例讲解_第3页
第3页 / 共30页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS多元线性回归模型建立基于逐步回归法,1,多元线性回归模型,回归:区别相关。因变量对解释变量的依赖关系,意义在于通过已知后者的值去预测前者的均值。,线性:用于研究一种特殊的关系,即用直线或多维直线描述其依赖关系。,多元:解释变量大于等于两个。,建立一个模型: Y =,0,+,1,X,1,+,2,X,2,+,.,+,i,X,i,确定一些标准,判断进入的变量,和得出对应的系数。,2,简要回顾一些计量经济学知识,T检验,F检验。都是对于系数为0假设检验。,T检验针对的假设是某一个系数为0。分布。,F检验针对的假设是所有的回归系数均为0.总显著性检验。分布。,Sig.值significance即eviews中的p值。小于设置的显著性水平如0.05,则拒绝原假设,统计量显著。,R,2、,调整R,2,指标揭示拟合程度。随着进入模型的变量个数增加, R,2,不断增大,同时代价是残差自由度的减少,意味着估计和预测可靠性低 。,3,举例说明,本例给出的是某企业职员调查的数据。共有样本量474.所给变量共有6个:当前工资、初始工资、工作种类、过去经验、受雇时间、受教育程度。,准备建立一个以当前工资为因变量,其他变量为自变量的回归方程。,判断哪些变量进入方程,并且给出对应系数。,4,1、选变量,要建立一个模型首先要选择变量,解释变量和因变量之间要有一定的关系。,方法:散点图直接判断相关性和偏相关性系数。,所要判断的变量:初始工资、工作种类、过去经验、受雇时间、受教育程度,5,散点图检验线性关系,散点图可以很直观地判断是否存在线性关系。,操作:Graphs-Legacy Dialogs-Scatter/Dot-Simple Scatter,6,结论:当前工资,和初始工资存在,线性关系。,7,偏相关系数检验线性关系,各因素之间有相互作用,仅仅看每个自变量分别和因变量之间觉得相关系数不能反映出各个变量之间的真实情况。,检验偏相关系数,控制其他的变量对两个变量相关关系的影响。,由偏相关系数和对应T值可以判断,这些变量和因变量的有关,可以建立一个以它们为自变量的回归模型。,8,偏相关系数检验线性关系,操作:Analyze-Correlate-Partial Correlation,选择分析变量:当前工资、受教育程度,选择控制变量:其他变量,结论:T值的显著性水平为0,拒绝当前工资和受教育程度不相关的假设。偏相关系数为0.161.变量和因变量是相关的。,其他分析变量操作同,初步判断得出变量均可进入模型。,9,10,2、选数据,我们建立回归模型是在若干假定前提之下的, 即对数据是有要求的。因变量数据的要求。,(1)是否满足“残差的方差齐性”要求,方法:散点图,操作在后面做回归模型建立时一同分析。,11,PP图检验正态性,(2)因变量数据是否满足正态性要求,方法:PP图。所有点聚集在直线上,则说明该变量的数据分布是服从于所要检测的分布的,12,PP图检验正态性,操作:Analyze-Descriptive Statistics-,P-Pplots,检验变量:当前工资,检验分布:正态分布Normal,结论:满足正态性假设要求,13,14,3、进行回归,介绍回归方法:,Enter:强行进入法。所有变量直接全部进入模型。只有一个模型。,向前回归:根据自变量对因变量的贡献率,首先选择一个贡献率最大的自变量进入,一次只加入一个进入模型。然后,再选择另一个最好的加入模型,直至选择所有符合标准者全部进入回归。,15,向后回归:将自变量一次纳入回归,然后根据标准删除一个最不显著者,再做一次回归判断其余变量的取舍,直至保留者都达到要求。逐步回归Stepwise:是向前回归法和向后回归法的结合。,首先按自变量对因变量的贡献率进行排序,按照从大到小的顺序选择进入模型的变量。每将一个变量加入模型,就要对模型中的每个变量进行检验,剔除不显著的变量,然后再对留在模型中的变量进行检验。直到没有变量可以纳入,也没有变量可以剔除为止。,16,进行回归操作,进行回归操作:Analyze-Regression-Linear选择自变量和因变量,选择回归方法: Stepwise,17,设置操作,Statistics:,系统默认选项:1、Estimates(输出回归系数,标准化回归系数,回归系数为0的假设T值等),2、 Model fit(要引入模型的和要从模型中剔除的变量, 每一步模型R,2,调,整R,2 、,ANOVA方差分析表。,18,设置操作,Plots制图,检查方差齐性,,Y:ZRESID(标准化残差),X:ZPRED(标准化预测值),19,残差的方差齐性,分析依据:如果,它的大部分都落,在( - 3, 3) 范围之,内, 就可以认为,它满足这个条件。,20,21,逐步回归中不在方程中变量,一、判断模型中各个要进入变量的系数显著性:,1、注释中是模型已有的变量,表中是排除在回归方程外变量。,2、举例分析第一步:,方程中已有的(第一个进入)变量是初始工资,还有4个未进入模型。在这个方程的基础上,如果4个变量中每一个单独进入这个方程,会形成一个新的二元解释变量方程,这个二元方程的统计量结果如表。通过判断Partial Correlation绝对值来确定哪个是贡献率最大的,从而这个变量先进入模型。,3、第3 列是针对每一个变量前面的系数为零的假设的t 检验值, 第四列给出了这个检验结果。从中可以看出,sig.值均0.05。故拒绝系数为零的假设, 即每一个变量都对因变量有贡献,所以都不剔除。,4、结论:第二个进入方程的变量是0.372的职务分类。,22,23,分析 ANOVA表,二、判断每一步模型总显著性,1、方差分析表显示了回归拟合过程中每一步的方差分析结果。,2、F值的Sig.值均0.05,不影响。其他的系数的显著性水平为0. 000, 它们都0. 05, 故属于小概率事件, 即拒绝回归系数为零的假设, 即每个回归方程都有意义。,28,y=-15038.574+1.365X,1,+5859.585X,2,-19.553X,3,+154.698X,4,+539.642X,5,注释:X,1,初始工资、X,2,工作种类、X,3,过去经验、X,4,受雇时间、X,5,受教育程度,注意:B( 偏回归系数) , 有一个缺点就是单位数量级不一致时, 对它的比较毫无意义。,如:初始工资的单位为1, 而工作种类的单位为1 000 , 显然这时工作种类前面的回归系数可能很小。,故对它需要进行改进, 这就是Beta 系数。把所有变量都事先进行标准化,消除偏回归系数带来的数量单位的影响。,29,谢谢观看,30,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!