资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第三章回归分析预测法,回归分析概述,回归分析与相关分析,回归模型种类,一元线性回归分析,相关系数,显著性检验,一回归的含义,。,回归:研究自变量与因变量之间的关系形式的分析方法,目的在于根据自变量来估计和预测因变量的平均值,二 回归分析与相关分析,1 函数关系。,2 相关关系.,a,现象间确实存在数量关系。,b,现象间数量依存关系不是确定的,有一定随机性。,相关分析,是研究两个或两个以上随机变量之间相互,依存关系的紧密程度。,回归分析,是研究某一随机变量与其他一个或几个普通,变量之间的数量变动的关系。,相关分析研究的都是随机变量,且不分自变量与因变量;回归分析要定出自变量与因变量,且自变量是确定的普遍变量。实践中,一般先进行相关分析,由相关系数决定是否进行回归分析。,相关分析与回归分析的主要作用:,1 通过对数量关系的研究分析,深入认识现象之间的相互,依存关系;,2 通过回归模型进行预测和预报;,3 用于补充缺少的资料。,三 回归模型的种类,1根据回归模型自变量的多少,分为一元回归模型和多元回归模型。,2根据回归模型是否线性,分为线性和非线性回归模型。,3根据回归模型是否带虚拟变量,分为普通回归模型和带虚拟变量回归模型。,一元线性回归预测法,一 一元线性回归模型,Yi=a+bXi+,i.I=1,2,3,n,N(0,),y(a+bx,),=a+bXi,a,和,b,为回归系数。,二 OLS估计,最小平方法思想,是通过数学模型,配合一条较为理想的趋势线。这条趋势线必须满足以下两点要求:1原数列的观察值与模型的估计值的离差平方和为最小,2原数列的观察值与模型的估计值的离差总和为零。公式如下:,Yi =最小值,(Yi )=0,Yi代表原数列的观察值;,代表模型的估计值。,根据最小平方法的要求,即:,Q=(Yi-)=(Yi-a-bxi),分别对a和b求偏导,并令其等于零。那么有:,-2Yi-a-bXi=0;-2(Yi-a-bXi)Xi=0,整理后可求出:,b=(nXi*Yi-XiYi)/nXi-(Xi),a=Yi/n-bXi/n,X,X,X,X,X,X,Y,Y,Y,Y,Y,Y,(,a)r=+1,(,b)r,接近于+1,(,c)r,逐渐变小,(,d)r=0,(,e)r,接近于-1,(,f)r=-1,三 相关系数,1 离差平方和的分解,观察值的取值大小是上下波动的,这种现象称为变差,原因有两个:受自变量变动的影响,即,x,取值的不同其他因素的影响。为了分析这两方面的影响,需对总变差进行分解。,总变差=(,Yi-,),其可分解为,,(,Yi-,)+(,-,)=(Yi-,),其中(,Yi-,),表示剩余变差,,(,-,),表示回归变差。,2 可决系数R,R=回归变差/总变差;R=(-)/(Yi-),,3 根据可决系数可以求出相关系数R,当R=0称为零相关,当R=1称为完全相关,当0|R|1称为普通相关.,四 显著性检验,最常用的显著性检验是相关系数检验法,步骤如下:,1 按公式计算相关系数,2根据回归模型的自由度和给定的显著性水平,查出临界值,3判别。假设R大于等于临界值,相关关系显著,否那么,不显著,不能用已建立的回归模型进行预测。,在过去的10个月中,一家钢铁厂的某部门用电量与钢产量有关,具体数据如下:,(,a),画出散点图,观察电力消耗与产量之间的关系。,(,b),计算确定性系数和相关系数。,(,c),求出上述数据的最优拟合线,,a,和,b,的值各代表什么意义?,(,d),如果一个月要生产2000吨钢,该厂将需要多少电量?,产量百吨,用电,百瓦,2 4 6 8 10 12 14,100,80,60,40,20,
展开阅读全文