资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,精品,*,第九讲 回归分析的SPSS实现,精品,线性回归分析,被解释变量和各个解释变量各对应一个spss变量,一元线性回归和多元线性回归分析的功能菜单是集成到一起的,数据:高校科研研究,.data,精品,一、描绘散点交互图,基本步骤,Graphs-interactive-Scatterplot,Assign Variable-y=课题数;x=高级职称人数,Fit-Method-选择Regression,OK,精品,精品,二、用Linear Regression分析,Analyze-Regression-Linear,选择被解释变量进入Dependent框-课题数,选择一个或多个解释变量进入Independent(s)框,METHOD-Enter; stepwise;-,单击Statistics,选择全部核选框,单击Plots,选择”Histogram”核选框和”Normal probality plot”,选择”ZPRED”输入到”Y”;选择”SRESID”输入到”X”;,OK,精品,(一)立项课题数多元线性回归分析结果(enter策略),结果一:模型综述表,结果说明:1)调整后的R,2,=0.939,因此模型的拟和优度较高; 模型的F检验达到了0.00的极显著水平.说明模型的线性关系较显著,具有较强的解释能力2)D.W值=1.838接近于2,说明模型的序列相关性不强.,精品,结果二:模型方差分析表,结果说明: 模型的F检验值=61.532,对应的概率值P=0.00,远小于0.01的极显著水平,应该拒绝回归系数为零的原假设,即认为回归系数不同时为零,被解释变量与解释变量全体的线性关系是显著的,可以建立线性模型.,精品,结果三:系数分析表,精品,结果说明:,1)由于回归方程:课题立项数=-35.313+0.698投入人年数+-,2)变量的显著性检验:只有“投入人年数”达到了0.003的极显著水平,其他变量都不显著,说明除了 “投入人年数”外,其他变量都与课题立项数没有显著的线性关系。,3)多重共线性检验:容忍度(tolerance)越接近于0,多重共线性越强;方差膨胀因子(VIF)越大,一般大于等于10时,说明解释变量Xi 与其余解释变量之间有较强的多重共线性。,4)结论:由于模型保留了一些不应保留的变量,该模型不可用;从容忍度和方差膨胀因子看,“投入高级职称人数”与其他解释变量之间多重共线性严重。再重新建模,应考虑提出该变量。,精品,结果四:相关系数矩阵表,精品,结果五:多重共线性检验表,结果说明:1)特征根是诊断解释变量间是否存在多重共线性的另一种有效的方法.2)如果某一个特征根能够刻画某解释变量方差的较大部分比例,(0.7以上),同时有刻画了另一个变量的方差的较大部分,则表明这两个解释变量之间存在较强的线性相关关系.3)第 7个特征根既能解释“投入人年数”方差的84%,又能解释“投入高级职称人数”方差的98%,同时还能解释专著数“的44%,因此有理由认为这三个变量间存在多重共线性。4)因此应重新建立回归模型,精品,(一)立项课题数多元线性回归分析结果(backward策略),结果一:模型综述表,精品,方差分析,精品,回归系数,精品,多重共线性检验,精品,剔除的变量,精品,曲线估计,常见的曲线模型: 二次曲线;对数曲线(logarithmic);复合函数(compound);幂函数(Power)等例如:人均消费支出和教育.data要求:分析教育支出和消费支出的关系,精品,常见的曲线模型,二次曲线(Quadratic): y=,0,+,1,x+,2,x,2,复合曲线(Compound): y=,0,1,x,增长曲线(Growth): y=e,0+1x,对数曲线(Logarithmic): y=,0,+,1,ln(x),指数曲线(Exponential): y=,0,e,1x,幂函数(Power): y=,0,x,1,逆函数(Inverse) : y=,0,+,1,/x,精品,基本步骤,1)Analyze-Regression-Curve estimation,2)选择被解释变量进入Dependent框-教育支出,3)选择消费支出进入Independent(s)框;如果选择time参数,则表示解释变量为时间,4)Models-选择几种模型 复合函数、幂函数等,5)选择 Plots models选项绘制回归线;选择Display ANOVA table输出各个模型的方差分析表和回归系数的显著性检验,精品,MODEL: MOD_2.,Dependent variable. x5 Method. CUBIC,Listwise Deletion of Missing Data,Multiple R .99711,R Square .99422,Adjusted R Square .99230,Standard Error 32.23848,Analysis of Variance:,DF Sum of Squares Mean Square,Regression 3 1610303.3 536767.78,Residuals 9 9353.9 1039.32,F = 516.46087 Signif F = .0000,- Variables in the Equation -,Variable B SE B Beta T Sig T,x2 .075378 .069194 .579897 1.089 .3043,x2*2 -1.987684665861E-05 1.3446E-05 -1.685204 -1.478 .1734,x2*3 2.596263004613E-09 7.7924E-10 2.112252 . .,(Constant) -41.313805 97.204131 -.425 .6808,精品,Dependent variable. x5 Method. POWER,Listwise Deletion of Missing Data,Multiple R .97687,R Square .95428,Adjusted R Square .95012,Standard Error .26578,Analysis of Variance:,DF Sum of Squares Mean Square,Regression 1 16.217387 16.217387,Residuals 11 .777033 .070639,F = 229.58009 Signif F = .0000,- Variables in the Equation -,Variable B SE B Beta T Sig T,x2 1.845988 .121832 .976871 15.152,.0000,(Constant) 3.5781705054E-05 3.7164E-05 .963 .3563,精品,复合函数的拟和效果更好。因此应选择复合函数,精品,练习,人均消费支出和教育.data,要求:,1)分析教育支出和人均可支配收入的关系,2)分析在外就餐支出和人均可支配收入的关系,精品,练习,数据:温度与产卵数,要求:,找出一个较佳的回归函数,并做简要的分析,精品,
展开阅读全文