回归分析的基本思想及其初步应用(5)

上传人:痛*** 文档编号:245289822 上传时间:2024-10-08 格式:PPT 页数:22 大小:966.50KB
返回 下载 相关 举报
回归分析的基本思想及其初步应用(5)_第1页
第1页 / 共22页
回归分析的基本思想及其初步应用(5)_第2页
第2页 / 共22页
回归分析的基本思想及其初步应用(5)_第3页
第3页 / 共22页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第一章 统计案例,1.1,回归分析的基本思想及其初步应用,线性回归模型,y=,bx+a+e,增加了随机误差项,e,,因变量,y,的值由自变量,x,和随机误差项,e,共同确定,即,自变量,x,只能解析部分,y,的变化,。,在统计中,我们也把自变量,x,称为,解析变量,,因变量,y,为,预报变量,。,我们可以用,相关指数,R,2,来刻画回归的效果,其计算公式是,显然,,R,2,的值越大,说明残差平方和越小,也就是说模型拟合效果越好。,R,2,越接近,1,,表示回归的效果越好(因为,R,2,越接近,1,,表示解析变量和预报变量的线性相关性越强)。,如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较,R,2,的值来做出选择,即,选取,R,2,较大的模型作为这组数据的模型,。,总的来说:,相关指数,R,2,是度量模型拟合效果的一种指标。,在线性模型中,它,代表自变量刻画预报变量的能力,。,1,、残差,数据点和它在回归直线上相应位置的差异 称为相应于点(,x,i,,,y,i,) 的,残差,。,例:编号为,6,的女大学生,计算随机误差的效应(残差),2,、残差平方和,把每一个残差所得的值平方后加起来,用数学符号表示为:,称为,残差平方和,在例,1,中,残差平方和约为,128.361,。,编号,1,2,3,4,5,6,7,8,身高,/cm,165,165,157,170,175,165,155,170,体重,/kg,48,57,50,54,64,61,43,59,残差,-6.373,2.627,2.419,-4.618,1.137,6.627,-2.883,0.382,我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数,据,,或体重估计值等,这样作出的图形称为,残差图,。,表,1-4,列出了女大学生身高和体重的原始数据以及相应的残差数据。,使用公式 计算残差,残差图的制作及作用。,坐标纵轴为残差变量,横轴可以有不同的选择;,若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;,对于远离横轴的点,要特别注意。,身高与体重残差图,异常点,错误数据,模型问题,几点说明:,第一个样本点和第,6,个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。,另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。,用身高预报体重时,需要注意下列问题:,1,、回归方程只适用于我们所研究的样本的总体;,2,、我们所建立的回归方程一般都有时间性;,3,、样本采集的范围会影响回归方程的适用范围;,4,、不能期望回归方程得到的预报值就是预报变量的精确值。,事实上,它是预报变量的可能取值的平均值。,这些问题也使用于其他问题。,一般地,建立回归模型的基本步骤为:,(,1,)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量。,(,2,)画出确定好的解析变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)。,(,3,)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程,y=,bx+a,),.,(,4,)按一定规则估计回归方程中的参数(如最小二乘法)。,(,5,)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等。,练习,1,在一段时间内,某中商品的价格,x,元和需求量,Y,件之间的一组数据为:,求出,Y,对,x,的回归直线方程,并说明拟合效果的好坏。,价格,x,14,16,18,20,22,需求量,Y,12,10,7,5,3,解:,练习,1,在一段时间内,某中商品的价格,x,元和需求量,Y,件之间的一组数据为:,求出,Y,对的回归直线方程,并说明拟合效果的好坏。,价格,x,14,16,18,20,22,需求量,Y,12,10,7,5,3,列出残差表为,0.994,因而,拟合效果较好。,0,0.3,-0.4,-0.1,0.2,4.6,2.6,-0.4,-2.4,-4.4,练习,2,关于,x,与,y,有如下数据:,有如下的两个线性模型:,(,1,) ;(,2,),试比较哪一个拟合效果更好。,x,2,4,5,6,8,y,30,40,60,50,70,选用模型(,1,)的拟合效果更好,练,:,某种产品的广告费支出,x,与销售额,y,之间有如表所示数据,:,零件数,X,2,4,5,6,8,加工时间,y(,分钟,),30,40,60,50,70,(1),求,x,y,之间的相关系数,;,(2),求线性回归方程,;,案例,2,一只红铃虫的产卵数,y,和温度,x,有关。现收集了,7,组观测数据列于表中:,(,1,)试建立产卵数,y,与温度,x,之间的回归方程;并预测温度为,28,o,C,时产卵数目。,(,2,)你所建立的模型中温度在多大程度上解释了产卵数的变化?,温度,x,o,C,21,23,25,27,29,32,35,产卵数,y,/,个,7,11,21,24,66,115,325,非线性回归问题,假设线性回归方程为 :,=,bx+a,选 模 型,由计算器得:线性回归方程为,y=,19.87,x,-463.73,相关指数,R,2,=,r,2,0.864,2,=0.7464,估计参数,解:选取气温为解释变量,x,,产卵数,为预报变量,y,。,选变量,所以,一次函数模型中温度解释了,74.64%,的产卵数变化。,探索新知,画散点图,0,50,100,150,200,250,300,350,0,3,6,9,12,15,18,21,24,27,30,33,36,39,方案,1,分析和预测,当,x,=28,时,,y =,19.8728-463.73 93,一元线性模型,y=bx,2,+a,变换,y=,bt+a,非线性关系 线性关系,方案,2,选用,y=bx,2,+a,,还是,y=bx,2,+cx+a,?,产卵数,气温,如何求,a,、,b,?,t=x,2,二次函数模型,方案,2,解答,平方变换,:,令,t=x,2,,产卵数,y,和温度,x,之间二次函数模型,y=bx,2,+a,就转化为产卵数,y,和温度的平方,t,之间线性回归模型,y=,bt+a,温度,21,23,25,27,29,32,35,温度的平方,t,441,529,625,729,841,1024,1225,产卵数,y,/,个,7,11,21,24,66,115,325,作散点图,并由计算器得:,y,和,t,之间的线性回归方程为,y=,0.367,t,-202.543,,相关指数,R,2,=0.802,将,t=x,2,代入线性回归方程得:,y=,0.367,x,2,-202.543,当,x,=28,时,,,y,=0.367,28,2,-202.5485,,且,R,2,=0.802,,,所以,二次函数模型中温度解释了,80.2%,的产卵数变化。,t,变换,y=,bx+a,非线性关系 线性关系,产卵数,气温,指数函数模型,方案,3,方案,3,解答,温度,x,o,C,21,23,25,27,29,32,35,z=,lny,1.946,2.398,3.045,3.178,4.190,4.745,5.784,产卵数,y,/,个,7,11,21,24,66,115,325,x,z,当,x=28,o,C,时,,y 44,,,指数回归模型中温度解释,了,98.5%,的产卵数的变化,由计算器得:,z,关于,x,的线性回归方程,为,对数变换:在 中两边取常用对数得,令 ,则,就转换为,z=,bx+a,.,相关指数,R,2,=0.98,最好的模型是哪个,?,产卵数,气温,产卵数,气温,线性模型,二次函数模型,指数函数模型,比一比,函数模型,相关指数,R,2,线性回归模型,0.7464,二次函数模型,0.80,指数函数模型,0.98,最好的模型是哪个,?,作业:,在,7,块并排的、形状大小相同的实验田上进行施,肥量对水稻产量影响的试验,得到如下一组表所示,的数据(单位:,kg,),施化肥量,x,15,20,25,30,35,40,45,水稻产量,y,330,345,365,405,445,450,455,(1),以,x,为解释变量,,y,为预报变量,作出散点图,(2),求,y,与,x,之间的回归方程,并求施肥量为,28kg,时,的水稻产量的预报值,(3),计算各组残差,并计算残差平方和,(4),求,R,2,,并说明残差变量对产量影响有多大?,练习,3,假设关于某设备的使用年限,x,和所支出的维修费用,y,(万元),有如下的统计资料。,使用年限,x,2,3,4,5,6,维修费用,y,2.2,3.8,5.5,6.5,7.0,若由资料知,y,对,x,呈线性相关关系。试求:,(,1,)线性回归方程 的回归系数 ;,(,2,)求残差平方和;,(,3,)求相关系数 ;,(,4,)估计使用年限为,10,年时,维修费用是多少?,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!