资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第八章,回 归 分 析,“回归”最早由英国生物学家高尔顿提出。他在对人体遗传特征的实验研究中发现,父母的身高与子女的身高有一定的关系,高的父母其子女也高,但平均来看,却不如他们的父母高;矮的父母其子女也矮,但平均来看,也不如他们的父母矮。他把这种遗传身高趋向于平均的现象称为“回归”,并作为统计概念加以应用,现如今统计学中“回归”的概念已经扩展了,主要是指变量之间的依存关系。,回归分析和相关分析都是对客观事物数量依存关系的分析,在理论和方法上具有一致性。只有存在相关关系的变量才能进行回归分析,相关程度越高,回归测定的结果越可靠。但是回归分析和相关分析也存在区别,,回归分析与相关分析的区别,相关分析中,变量,x,变量,y,处于平等的地位;回归分析中,变量,y,称为因变量,处在被解释的地位,,x,称为自变量,用于预测因变量的变化,相关分析中所涉及的变量,x,和,y,都是随机变量;回归分析中,因变量,y,是随机变量,自变量,x,可以是随机变量,也可以是非随机的确定变量,相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量,x,对,变量,y,的影响大小,还可以由,回归方程,进行预测和控制,回归模型的类型,回归模型,非线性回归,线性回归,一元回归,多元回归,一元回归,多元回归,第一节 线性回归分析,原理介绍,对于具有线性关系的多个变量,可以用一条线性方程来表示它们之间的关系,y,=,b,0,+,b,1,x,一元回归方程,多元回归方程,简化矩阵形式,最小二乘法,二、,判定系数,r,2,回归平方和占总离差平方和的比例,反映回归直线的拟合程度,取值范围在, 0 , 1 ,之间,r,2,1,,,说明回归方程拟合的越好;,r,2,0,,,说明回归方程拟合的越差,判定系数等于相关系数的平方,即,r,2,(,r,),2,三、回归方程的,F,检验,F,检验是用来考察模型中回归变量,X1,,,X2,,,,,X,P,是否对变量,Y,起到解释作用,即,若原假设,H0,成立,则说明,Y,没有受到这些变量中任何一个影响,此时,回归方程就没有意义。,构造,F,检验统计量,r2,为回归方程的判定系数。在,H0,成立的条件下,统计量,F,服从自由度为(,p,n-p-1,)的,F,分布,对于给定的显著性水平,查临界值如果则拒绝原假设,H0,,认为回归方程显著,.,四、回归系数的,t,检验,对于多元线性回归,回归方程通过了显著性检验,只说明,Y,与回归变量(,X1,,,X2,,,,,XP,)”整体上”线性相关关系显著,并不能说明每一个回归变量与,Y,都是线性相关关系,为此还要对每个回归系数进行显著性检验,也就是说,在多元回归分析中,F,检验和,T,检验不是等价的,二者的作用是不同,所以,二者缺一不可。建立假设,H0:,H1:,在,H0,成立的条件下,使用,t,检验统计量,对给定的显著性水平,查临界值,若,则拒绝原假设,H0,,即认为回归变量,Xi,线性显著。,一元线性回归的操作步骤,例:,SY-9,数据文件,通过回归分析,找出合适的线性回归方程。,1,、打开数据文件,单击,Analyze,Regression,Linear,打开,Linear,对话框如图所示。,选择回归分析方法,有强行进入法,(Enter),,消去法,(Remove),,向前选择法,(Forward),,向后剔除法,(Backward),及逐步回归法,(Stepwise),选入一个筛选变量,利用右侧的,RULE,按钮建立一个筛选条件,只有满足条件的记录才能进入回归分析。,选入一个变量,他的取值作为每条记录的标签,选入权重变量,进行加权最小二乘法,选入回归分析的因变量,Y.,选入回归分析的自变量,X.,Estimates,(,系统默认,):,输出回归系数的相关统计量:包括回归系数,回归系数标准误、标准化回归系数、回归系数检验统计量(,t,值)及相应的检验统计量概率的,P,值(,sig,)。本例中只选择此项。,Confidence intervals,:,输出每一个非标准化回归系数,95,的置信区间。,Covariance matrix,:,输出协方差矩阵。,模型拟合及拟合效果有关选择项。,Model fit,是默认项。能够输出复相关系数,R,、,R2,及,R2,修正值,估计值的标准误,方差分析表。,R squared change:,引入或剔除一个变量时,,R2,的变化。,Descriptives,:,基本统计描述。,Part and Partial correlations,:相关系数及偏相关系数。,Collinearity,diagnostics,:共线性诊断。主要对于多元回归模型,分析各自变量的之间的共线性的统计量:包括容忍度和方差膨胀因子、特征值,条件指数等。,Durbin-Watson,:,D.W,检验,.,Casewise,diagnostics:,奇异值诊断,有两个选项:,Outliers outside( )standard deviations:,奇异值判据,默认项标准差,3,。,All case,输出所有观测量的残差值。,在左上角的源变量框中,选择,Dependent,进入,X,(或,Y,)轴变量框,选择其它变量进入,Y,(或,X,)轴变量框,除因变量外,其客观存在变量依次是:,ZPRED:,标准化预测值,,ZRESID:,标准化残差,,DRESID:,剔除残差,,ADJPRED:,修正后预测值,,SRESID,学生化残差,,SDRESID:,学生化剔除残差。,Standardized Residual Plots,栏,标准化残差图类型,有选择项:,Histogram:,标准化残差直方图,Normal probability plot,标准化残差序列的正态分布概率图,.,Produce all partial plots,依次绘制因变量和所有自变量的散布图,Stepping Method Criteria,栏,设置变量引入或剔除模型的判别标准。,Use probability of F:,采用,F,检验的概率为判别依据。,Use F value:,采用,F,值作为检验标准。,Include constant in equation,回归方程中包括常数项。,Missing Values,缺失值的处理方式。本例中选择系统默认项。,1,判断文件六中“企业固定资产原值”与“增加值”的相关关系,若相关请拟合一元直线回归方程,并对结果进行分析说明。,2,判断文件八中“居民可支配收入”与“消费性支出”的相关关系,若相关请拟合一元直线回归方程,并对结果进行分析说明。,3,在文件九中以“人均娱乐教育文化服务支出”为因变量进行多元线性回归分析,并对结果进行分析说明。,4,在文件十中以“满意度”为因变量进行多元线性回归分析,并对结果进行分析说明。,5,在文件十一中以“财政收入”为因变量进行多元线性回归分析,并对结果进行分析说明。,
展开阅读全文