第二十二章 回归分析

上传人:fgh****35 文档编号:245164957 上传时间:2024-10-07 格式:PPT 页数:28 大小:493.50KB
返回 下载 相关 举报
第二十二章 回归分析_第1页
第1页 / 共28页
第二十二章 回归分析_第2页
第2页 / 共28页
第二十二章 回归分析_第3页
第3页 / 共28页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二十二章 回归分析,第一节,一元线性回归,第二节 多元线性回归,第四节 自回归,第三节 可线性化的曲线回归,回归分析,通过一个变量或一些变量的变化,解释另一变量的变化,变量之间的关系是因果关系。,回归分析的主要步骤:,(,1,)根据理论和对问题的分析判断,将变量分,为自变量和因变量。,(,2,)模拟回归模型,描述变量间的关系,(,3,)对回归模型进行统计检验,(,4,)利用回归模型去估计、预测因变量。,第一节 一元线性回归,一、相关与回归的区别与联系,二、一元线性回归模型,三、回归系数与相关系数,四、回归估计标准差,五、回归方程的显著性检验,一、相关分析与回归分析的区别与联系,联系,相关分析是回归分析的基础和前提,回归分析则是相关分析的,深入和继续。,区别,(,1,)在相关分析中不划分自变量和因变量(没有因果关系),变量之间的关系是对等的;在回归分析中,则必须根据研究对象的性质和研究分析的目的,对变量进行自变量和因变量的划分(有因果关系),变量之间的关系是不对等的。,(,2,)在相关分析中所有的变量都是随机变量;在回归分析中,自变量是给定的,因变量是随机的。,(,3,)相关分析变量之间是对等的,相关系数是惟一的。回归分析中,对于互为因果的两个变量,(,如人的身高与体重,商品的价格与需求量,),,则有可能存在多个回归方程。,二、一元线性回归(,Simple Linear Regression,)模型,回归直线方程又称一元线性回归方程,其表达形式为:,参数,a,,,b,的值用最小二乘法求得:,【,例,22-1,】,某地区,10,个同类企业生产性固定资产价值与工业增加值资料如表,22-1,,求工业增加值关于固定资产价值的回归方程。,表,221,直线回归分析计算表,企业,x,y,x,2,xy,1,2,3,4,5,6,7,8,9,10,3,3,5,6,6,7,8,9,9,10,15,17,25,28,30,36,37,42,40,45,9,9,25,36,36,49,64,81,81,100,45,51,125,168,180,252,296,378,360,450,合计,66,315,490,2305,计算过程在,EXCEL,工作表上完成。计算结果见书,247,页,三、回归系数与相关系数的关系,回归系数与相关系数两者可互相推算,【,例,22-2】,见书,247,页、,248,页(,计算过程在,EXCEL,工作表上完成),四、回归估计标准误差,回归方程的计算值,yc,与实际值,y,存在着差距,这差距用估计标准误差(用表示)来表示。,估计标准误差是衡量回归直线代表性大小的统计分析指标,它说明观察值围绕着回归直线的变化程度或分散程度。,(一)估计标准误差的计算,估计标准误差计算原理与标准差基本相。定义公式:,为自由度,【,例,22-2,】,仍用例,22-,估计的回归方程,计算其估计平均误差。,解:利用表,22-,的最后一行,计算:,结果表明估计标准差是,140,万元。,(二)估计标准误差与相关系数的关系,估计标准误差与相关系数在数量上也存在着换算关系:,五、回归方程的显著性检验,(一)判定系数,回归分析表明,因变量,y,的实际值(观察值)有大有小、上下波动,对每一个观察值来说,波动的大小可用总离差,( ),来表示。总离差产生的原因有两个方面:一是受自变量,x,变动的影响;二是受其它因素的影响(包括观察或实验中产生的误差的影响)。,n,个观察值总的波动大小用总离差平方和 表示。,或,判定系数 是一个回归直线与样本观测值拟合优度判定的指标。,的值总在,0,和,1,之间。,一个线性回归模型如果充分利用了,x,的信息,则 越大,拟合优度就越好;反之,如 不大,说明模型中给出的,x,对,y,的信息还不够充分,应进行修改,使,x,对,y,的信息得到充分利用。,(二),T,检验,在回归分析中,我们最关心的是因变量,y,和自变量,x,之间到底有无,真正的关系,即需对总体参数,b,作出某种假设,以便利用样本估计量 来,判断这种假设能否接受。其步骤如下:,(,1,)提出零假设、备择假设:,H,0,:,b,= 0 H,1,:,b,0,当,x,与,y,有线性关系时,b,0,,当,x,与,y,没,有线性关系时,b,= 0,。,(,2,)构造统计量并计算,(,3,)确定显著性水平,并查 统计表,确定拒绝域。,取 ,查,(,4,)判定:计算结果表明 ,则拒绝原假设,即,X,作为,Y,的解释变量作用是显著的。,第二节 多元线性回归,一、二元线性回归,二、多元线性回归,三、多元线性回归的检验,设因变量 受自变量 的影响,则因变量,Y,倚自变量,的二元线性回归方程的基本形式为:,式中: 是 的回归估计值, 是对应于的回归系数,,是常数项。,求解二元线性回归方程的方法仍然是最小二乘法。令:,一、二元线性回归模型的建立,按最小平方法的基本要求,通过对每个回归系数求偏导数,并令其等于,0,,便可得下列正规方程组:,二、多元回归方程的建立,设因变量 受 等,k,个自变量的影响,则因变量倚各个自变量的多元线性回归方程的基本形式为:,式中: 是的 回归估计值, 是对应于各个变量 的回归系数, 是常数项。 求解多元线性回归方程的常用方法仍然是最小平方法。按最小平方法的基本要求,通过对每个回归系数求偏导数,并令其等于,0,,便可得下列,k+1,个正规方程组成的方程组:,三、多元线性回归模型的检验,1,、拟合程度的评价,在多元线性回归分析中,总平方和的分解公式依然成立。 为了判断一般线性模型(非一元线性模型)与数据的拟合程度,需要计算一个与,R,2,等价的多重决定系数,R,2,。,用自由度去修正多重决定系数。,2,、,t,检验,一旦拟合了多元回归模型,就希望知道模型中的各个自变量的重要性,其方法就是对与自变量密切联系的参数作,t,检验。,假设 , ,,统计量 服从,t,分布,故称,t,检验。,在显著水平,下,当 (临界值)时,拒绝原假设,即相应自变量对因变量影响显著。,如果不能拒绝原假设,可能自变量与因变量之间没有关系,也可能它们之间有关系但不是线性关系而是曲线关系,所以这时我们只能说没有充分证据认为它们之间存在线性关系。,为第,i,个参数估计值的标准差。,3,、,F,检验,对回归系数进行整体检验,4,、估计,如果进行点估计,可直接利用求多元回归方程的估计值,计算所有自变量值都给定的估计值或的预测值。,如果是区间估计,需要了解抽样分布的标准差,.,用样本的标准差去估计总体的标准差的计算公式为,例,22-4,中,,第三节 可线性化的曲线回归,【,例,22-7】,某商店商品销售额和流通费率的数据资料如表,22,7,所示。试分析销售额与流通费率的关系,并建立流通费率对销售额的回归方程。,表,22-7,某商店,1996-2006,年商品销售额与流通率统计资料,年份 商店销售额,x,(万元) 流通费率,y,(,%,),1996 10.5 6.5,1997 12.5 5.0,1998 14.5 4.2,1999 16.5 3.5,2000 18.5 3.0,2001 19.5 2.5,2002 22.5 2.4,2003 24.5 2.3,2004 25.5 2.2,2005 26.5 2.1,2006 28.5 2.0,解:作散点图,其数学模型为: 可变型为:,第一步,计算,第二步,计算 和 :,第三步,计算:,第四步,计算:,第五步,计算,a,和,b,的值:,流通费率(,%,),0,2,4,6,8,0,10,20,30,销售额(万元),非线性判定系数,由表,227,资料列表计,=0.9776,。计算结果表明,销售额与流通费率之间存在高度双曲线相关。,对同一个问题进行模型的确定,在实际应用中,如果变化趋势不是非常明显可采用不同的模型分别进行拟合,然后比较模型各自的残差平方和,残差平方和越小,回归模型越好,另外再结合判定系数的比较。,四、自回归,在时间序列中, 与 呈线性相关, 与 可建立一元线性自回归模型 (又称简单自回归模型)。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 营销创新


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!