信息分析与决策Chapert4-5 回归分析3-1

上传人:biao****biao 文档编号:243095652 上传时间:2024-09-15 格式:PPTX 页数:39 大小:1.37MB
返回 下载 相关 举报
信息分析与决策Chapert4-5 回归分析3-1_第1页
第1页 / 共39页
信息分析与决策Chapert4-5 回归分析3-1_第2页
第2页 / 共39页
信息分析与决策Chapert4-5 回归分析3-1_第3页
第3页 / 共39页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2011/4/11,#,第四章,样本,数据的统计分析,回归分析,3-1,回归分析概述,回归分析,(Regression),是一种应用极为广泛的统计分析方法,成功应用在金融,经济,管理等领域。它用于,分析事物之间的统计关系,,,侧重考察变量之间的变化规律,,并通过,回归模型,形式描述和反映这种关系。,回归分析概述,线性回归分析,Linear Regression,是研究一个,因变量,和,一个或多个自变量之间是否存在某种线性关系,的统计学方法。若自变量的个数为,1,,则为,一元线性回归分析,。若为,n(n1),为,多元回归分析,。在,SPSS,中两种分析是整合在一起处理的。,回归分析概述,1.,线性回归分析的数学模型,线性回归分析是基于,最小二乘法,Least Square Method,原理,的统计分析方法。,假设收集到,n,对数据,x,i,y,i,(i=1,2,n),x,i,认为是来自于随机变量,X,的一组样本值,,y,i,认为是来自于,Y,的一组样本值。,探讨,Y,和,X,在统计意义下的相互关系。,y,4-3-1,性,回归分析,4-3-1,性,回归分析,4-3-1,性,回归分析,4-3-1,性,回归分析,4-3-1,性,回归分析,x,4-3-1,性,回归分析,回归分析概述,4-3-1,性,回归分析,4-3-1,性,回归分析,4-3-1,性,回归分析,4-3-1,性,回归分析,4-3-1,性,回归分析,x,y,4-3-1,性,回归分析,观察,(x,i,y,i,),的散点图,,y,和,x,呈现出显著地线性关系,则可考虑建立随机变量,X,与,Y,之间的线性回归模型。,X,和,Y,分别称为,解释变量,Independent Varibles,和,被解释变量,Depentdent Varibles,。,回归分析概述,一元线性回归的数学模型,y = a + bx +,y,的变化由两部分解释:,x,的变化,引起,y,的线性变化部分,即,y = a +,bx,其他,随机因素,引起的,y,的变化部分,回归分析概述,一元线性回归的数学模型,y =,a,+,b,x +,a -,回归常数,b -,回归系数, -,随机误差,回归模型的建立要满足随机误差的数学期望为,0,,随机误差的方差为一个,特定的常数,,即,E(,) = 0, var() =,.,如果对回归模型求期望值,则有,E(y) = a + bx,回归分析概述,进行线性回归分析的前提是根据给定的,数据对,估计线性方程的,未知参数,a(Constant),和,b(Coeficient),,利用最小二乘法得到参数的,无偏估计,,,设,为利用样本得到的,a,和,b,的估计值,则有,一元线性回归方程在二维平面上表示为一条直线,回归直线。表示,x,变化引起的,y,的变化的估计值。,回归分析概述,2.,回归方程的统计检验,我们利用最小二乘法获得回归系数及相应的回归方程。至于,x,和,y,之间是否真有如回归模型所描述的关系,,或者说采用所得的回归模型去拟合实际数据,是否有足够好的近似,。还需得到进一步的判明。,回归分析概述,对回归模型描述实际数据的近似程度,即对所得的回归模型的可信程度进行检验。包括,回归方程的显著性检验,回归方程的拟合优度检验,,,回归系数的显著性检验,,,残差分析,等。,回归分析概述,回归方程,的,显著性检验,检验被解释变量,Y,与解释变量,X,之间的,线性关系是否显著,,用线性模型来描述它们之间的关系是否恰当,即,进行整体回归效果,的检验。,回归分析概述,回归方程的显著性检验,采用方差分析的方法。对于,SST=SSA+SSE,的方差分析形式,研究,y,的,SST,中模型可解释部分,SSA,相对于随机误差部分,SSE,是否占较大的比例。,若,所占比例较大,,则表示,y,与,x,全体的线性关系明显,,利用线性模型反映与的关系式恰当的。,反之,,利用线性模型反映与的关系并不恰当。,回归分析概述,整体,回归效果检验采用的,F,统计量,F =,=, F(k-1,n-1),F,越大越好。当计算出的统计值,f,(,k-1,n-k,),,就,表示回归效果是好的,,在,水平上,已解释方差明显大于未解释方差。,回归分析概述,回归方程的拟合优度检验,拟合优度检验样本数据点聚集在回归线周围的密集程度,,从而,评价回归方程对样本数据的代表程度。,统计量为,R,2,统计量,称为,判定系数,=,=1-,可见,R,2,=SSA/SST=1-SSE/SST,反映的是回归方程所能解释的变差的比例。,1-R,2,则体现了被解释变量总变差中回归方程所无法解释的比例。,回归分析概述,调整的判定系数,对于多元线性回归返程的拟合优度检验采用调整的判定系数。定义,Adjusted R,2,= 1-,其中,n-p-1,n-1,分别是,SSE,和,SST,的自由度,,Adjusted R,2,本质上也是拟合优度检验基本思路的体现。,回归分析概述,对于一元线性回归,,R,2,也是,y,与,x,简单,相关系数,R,的平方,R =,|R|,越接近,1,表明,y,与,x,的关系的线性关系越,强,若为,1,则完全线性相关,若为,0,则全无线性相关。,回归分析概述,当,R,较大时,我们才可以用回归直线来近似的描述,y,和,x,的相关关系。但,R,大到什么程度,才可以适用回归直线来描述,y,与,x,的关系达到足够好的近似程度呢,?,回归分析概述,利用,R,的大小进行,相关性检验,。取相关系数的临界值,r,为相关性检验的标准。,为显著性水平,。,检验,:若,相关系数统计量,r r,(,等价判断为,r,的对应概率,p,),,相关性通过,即可用回归模型去拟合实际数据,用线性模型近似描述,x,与,y,直接的关系,。,回归分析概述,回归系数的显著性检验,主要目的是研究回归方程中的,每个解释变量与被解释变量之间是否存在显著地线性关系,,即研究解释变量能否有效地解释被解释变量的线性变化,他们,能否保留在线性回归方程中,。,回归分析概述,一元线性回归系数,b,的,T,检验,假设,H,0,: b = 0,备择假设,H,1,:,b,0,统计量,: T =,t(n-k),其中,=,为,的无偏估计,反映了回归方程无法解释,y,变动的程度。,回归分析概述,对,回归系数,t,统计量的显著性检验,,决定了相应的变量能否作为解释变量进入回归方程,。当,b=0,假设成立,意味着,x,的变化不会引起,y,的线性变化,,x,无法解释,y,,它们之间不存在,线性关系,x,不能进入回归模型,。,在一元线性回归分析中,,回归方程显著性检验,和,回归系数显著性检验,的作用是相同的,两者可以相互替代。,线性回归分析实例,Ex1:,一元回归示例,研究我国,31,个省市自治区的人均食品支出。变量“,人均食品出,”对“,人均收入,”的依存关系。,此问题的回归方程为,人均食品支出,= a + b *,人均收入,+,线性回归分析实例,数据,: “CH10,回归人均食品支出,”,SPSS,的分析步骤:,Step-1,:,Analyzeregression linear,Step-2:,人均收入,Independent,自变量,人均食出,Dependent,因变量,线性回归分析实例,Step-3,:按,Statistics,默认项,系统输出,回归系数,其标准差,统计量,t,及其双尾检验的,p,值。,系统输出每个回归系数的,95%,的置信区间。,SPSS,默认输入项,,输出判定系数,调整的判定系数,回归方程的标准误差,回归方程显著,F,检验的方差分析表。,线性回归,分析实例,Step-4:,点击,Continue,返回主对话框,Step-5: OK,Step-6:,结果分析,Step-7:,在输出窗口按“,File,”菜单保存,,可将回归结果存成,(*.spo),文件,线性回归,分析实例,Report-1: Model Summary,预测变量,Predictiors :,人均收入,给,出了两个变量之间的相关系数,R -,这里为,简单相关系数,R Square -,判定系数,R,2,Adjusted R Square -,调整判定系数,Std. Error of the Estimate -,回归的标准误差,线性回归,分析实例,方差分析表,ANOVA(F,检验表,),自由度,F,统计量,回归项,残差项,F,统计项对应的概率值,F = 162.035,,,Sig = .000 0.05,,接受,H0,假设检验,即常数项在,5%,的显著性水平上与,0,无显著差异。自变量“人均收入”通过检验,(p=0.0000.05),,即其相应系数,b,显著异于,0,。 因此该回归方程最好采用标准回归方程,即,人均食品支出,= 0.921*,人均收入,。,线性回归,分析实例,多元回归分析,在多元回归分析中,由于被解释变量会受众多因素的共同影响,需要由多个解释变量解释,于是会出现如下问题:,多个变量是否都能够进入模型,解释变量应以怎样的策略和顺序进入方程,方程中多个解释变量之间是否存在多重共线性等等。,线性回归,分析实例,Ex2.,我国,31,个省市自治区的“,人均食品支出,”对“,人均收入,”,“,粮食单价,”的依赖关系。,建立多元回归方程,人均食品,支出,= a + b,1,人均收入,+ b,2,粮食单价,+,线性回归分析实例,SPSS,操作同,Ex1,多个自变量,选择变量的进入方法为,Enter,Enter,:,自变量强行,进入模式,即所有的自变量均一次性进入整个模型。,线性回归分析实例,结果分析:,*,拟合优度检验结果,(Model Summary),在,多元线性回归分析中,参考调整的,R,2,比,R,2,更能够准确地反映回归方程对样本数据的拟合程度。,调整的判定系数,R,2,,反映回归效果的好坏,线性回归分析实例,多元回归方程显著性检查,H,0,:各个偏回归系数与,0,同时无显著差异。,若同时为,0,,则说明各个,x,i,的变化不会引起,y,的线性变化,所有,x,无法解释,y,的线性变化,,y,与,x,的全体不存在线性关系。,线性回归分析实例,多元回归方程显著性检查,统计量,F,与,调整的,R,2,有如下对应关系,F=,其中,p,为解释变量的个数。可见,拟合优度越高,回归方程的显著性检验也会越显著。反之亦然。,线性回归分析实例,回归方程显著性检查,反映回归的效果,,F,的对应概率值,p,=0.000 0.05 ,即,a,与,0,无显著差异,人均收入:,p = 0.000 0.05 , b1,与,0,有显著差异,通过检验,粮食平均单价:,p = 0.007 0.005,与,0,有显著差异,通过检验,则采用标准系数得到的回归方程为,人均食品支出,= 0.767*,人均收入,+ 0.243 *,粮食平均单价,线性回归分析实例,多元线性模型中,,回归方程显著性检验,与,回归系数显著性检验的作用,不尽相同。,回归方程显著性检验只能检验所有偏回归系数是否同时为,0,.,通过回归方程显著性检验并不能保证回归方程中不存在不能较好解释说明,y,的,x,i,.,回归系数显著性正是为此对每个偏回归系数是否为,0,进行逐一考察,。两种检验各有作用,不能互相替代。,课后练习,利用,SPSS,分析 “土地问题”,采用,Enter,策略分析方法。,问题提出:土地问题是当今世界重大的经济问题,人口和经济发展都和土地之间存在着密不可分的联系。人口数,粮食总产量和粮食作物面积是影响土地面积的重要因素。某地区的基本数据如下表,用多元线性回归,分析土地面积与人口,粮食总产量及粮食作物面积的之间的量化关系,。,课后练习,时间,/,年,1990,1991,1992,1993,1994,1995,1996,1997,1998,序号,1,2,3,4,5,6,7,8,9,人口数,(,万人,),4.1,4.5,3.7,3.6,5.4,5.1,3.2,3.9,4.5,粮食总产量,(,万吨,),2.6,2.8,2.4,2.4,2.7,2.5,2,2.6,2.8,粮食作物面积,(,万公顷,),3.8,4,3.6,3.3,3.8,3.7,3,3.7,4.2,土地面积,(,万公顷,5.1,5.5,4.8,4.6,5.2,5,4.3,4.9,5.7,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!