回归分析的基本思想及其初步应用ppt课件

上传人:94****0 文档编号:252637609 上传时间:2024-11-18 格式:PPT 页数:39 大小:553.66KB
返回 下载 相关 举报
回归分析的基本思想及其初步应用ppt课件_第1页
第1页 / 共39页
回归分析的基本思想及其初步应用ppt课件_第2页
第2页 / 共39页
回归分析的基本思想及其初步应用ppt课件_第3页
第3页 / 共39页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,1.1,回归分析的基本思想及其初步应用,1.1回归分析的基本思想及其初步应用,1,数学必修,第二章 统计,2.1,随机抽样,2.2,用样本估计总体,2.3,变量间的相关关系,数学必修第二章 统计,2,问题,1,:正方形的面积,y,与正方形的边长,x,之间的,关系,是,y,=,x,2,确定性关系,变量之间的两种关系,问题1:正方形的面积y与正方形的边长x之间的关系是y=,3,10 20 30 40 50,500,450,400,350,300,施化肥量,x,15 20 25 30 35 40 45,水稻产量,y,330 345 365 405 445 450 455,x,y,施化肥量,水稻产量,问题,2,:某水田水稻产量,y,与施肥量,x,之间是否有一个确定性的关系?,非确定性关系,-,相关关系,10 20 30,4,两个变量的关系,不相关,相关关系,(非确定性关系),函数关系(确定性关系),线性相关,非线性相关,问题,1,:两个变量间的关系有哪些呢?,相关关系:,对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。,两个变量的关系不相关 相关关系函数关系(确定性关系)线,5,对具有相关关系的两个变量进行统计分析的方法叫,回归分析,.,步骤,:(,1,)画出两个变量的散点图,(,2,)求回归直线方程,(,3,)利用回归直线方程进行预报,对具有相关关系的两个变量进行统计分析的方法,6,例,1,从某大学中随机选出,8,名女大学生,其身高和体重数据如下表:,编号,1,2,3,4,5,6,7,8,身高,165,165,157,170,175,165,155,170,体重,48,57,50,54,64,61,43,59,求根据女大学生的身高预报体重的回归方程,并预报一名身高为,172,的女大学生的体重,.,例1 从某大学中随机选出8名女大学生,其身高和体重数据如下表,7,解:,1,、选取身高为自变量,x,,体重为因变量,y,,作散点图:,59,43,61,64,54,50,57,48,体重,/kg,170,155,165,175,170,157,165,165,身高,/cm,8,7,6,5,4,3,2,1,编号,解:1、选取身高为自变量x,体重为因变量y,作散点图:594,8,由散点图可知,身高和体重有比较好的线性相关关系,设回归直线方程为,由,最小二乘法,公式得,所以回归方程为,对于身高,172cm,的女大学生,可以预报其体重为,由散点图可知,身高和体重有比较好的线性相关关系,设回归直线方,9,1.,确定变量;,2.,作散点图,判断相关关系;,3.,设回归方程;,4.,求回归方程,:(,最小二乘法,),5.,根据回归方程作出预报,.,解答步骤:,1.确定变量;2.作散点图,判断相关关系;3.设回归方程;4,10,用最小二乘法,求线性回归方程步骤:,(,1,)求,(,2,)求,(,3,)把(,1,)(,2,)带入公式即可,用最小二乘法求线性回归方程步骤:(1)求(2)求(3)把(1,11,编号,1,2,3,4,5,6,7,8,x,身高,165,165,157,170,175,165,155,170,y,体重,48,57,50,54,64,61,43,59,编号12345678x身高16516515717017516,12,回归分析的基本思想及其初步应用ppt课件,13,练习:活页练习,P55,、,7,7,下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量,x,(,吨,),与相应的生产能耗,y,(,吨标准煤,),的几组对照数据:,(1),请画出上表数据的散点图;,(2),请根据上表提供的数据,用最小二乘法求出,y,关于,x,的线性回归方程;,(3),已知该厂技改前,100,吨甲产品的生产能耗为,90,吨标准煤试根据,(2),求出的线性回归方程,预测技巧后生产,100,吨甲产品比技改前少消耗多少吨标准煤,(,参考数值:,32.5,43,54,64.5,66.5),x,3,4,5,6,y,2.5,3,4,4.5,练习:活页练习P55、7 7下表提供了某厂节能降耗技术改造,14,解:,(1),如下图,解:(1)如下图,15,(2),(2),16,(3),根据回归方程预测,现在生产,100,吨产品消耗的标准煤的数量为,0.7100,0.35,70.35,,故耗能减少了,90,70.35,19.65(,吨,/,标准煤,),讲评:活页练习,P55,、,1,2,3,5,,,课后练习报纸第五版随堂练习 回归分析,1,2,4,5,,,(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数,17,探究:身高为,172cm,的女大学生的体重一定是,60.316kg,吗?如果不是,你能解析一下原因吗?,答:用这个回归方程不能给出每个身高为,172cm,的女大,学生的体重的预测值,只能给出她们平均体重的估计值。,回归方程,对于身高,172cm,的女大学生,可以预报其体重为,探究:身高为172cm的女大学生的体重一定是60.316kg,18,由于所有的样本点不共线,而只是散布在某一直线的附近,所以身高和体重的关系可以用,线性回归模型,来表示:,其中,a,和,b,为模型的未知参数,,e,称为随机误差,.,由于所有的样本点不共线,而只是散布在某一直线的附近,所以身高,19,函数模型与“回归模型”的关系,函数模型:因变量,y,完全由自变量,x,确定,回归模型:预报变量,y,完全由解释变量,x,和随机误差,e,确定,函数模型与“回归模型”的关系函数模型:因变量y完全由自变量x,20,注:,e,产生的主要原因:,(1),所用确定性函数不恰当;,(2),忽略了某些因素的影响;,(3),观测误差。,思考,1,:,产生随机误差项e的原因是什么?,思考2,:,在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应如何研究随机误差呢?,e=y-(bx+a),注:e 产生的主要原因:思考1:产生随机误差项e的原因是什么,21,结合例,1,除了身高影响体重外的其他因素是不可测量的,不能希望有某种方法获取随机误差的值以提高预报变量的估计精度,但却可以估计预报变量观测值中所包含的随机误差,这对我们查找样本数据中的错误和模型的评价极为有用,因此在此我们引入残差概念。,结合例1除了身高影响体重外的其他因素是不可测量的,不,22,随机误差,e,的估计量,样本点:,相应的随机误差为:,随机误差的估计值为:,称为相应于点 的,残差,.,随机误差e的估计量样本点:相应的随机误差为:随机误差的估计值,23,思考3,:如何发现数据中的错误?如何衡量随机模型的拟合效果?,(1),我们可以通过分析发现原始数据中的可疑数据,判断建立模型的拟合效果。,思考3:如何发现数据中的错误?如何衡量随机模型的拟合效果?(,24,残差图的制作和作用:,制作:坐标纵轴为残差变量,横轴可以有不同的选择,.,横轴为编号:可以考察残差与编号次序之间的关系,常用于调查数据错误,.,横轴为解释变量:可以考察残差与解释变量的关系,常用于研究模型是否有改进的余地,.,作用:判断模型的适用性若模型选择的正确,残差图中的点应该分布在以横轴为中心的带形区域,.,残差图的制作和作用:,25,下面表格列出了女大学生身高和体重的原始数据以及相应的残差数据。,编号,1,2,3,4,5,6,7,8,身高,/cm,165,165,157,170,175,165,155,170,体重,/kg,48,57,50,54,64,61,43,59,残差,-6.373,2.627,2.419,-4.618,1.137,6.627,-2.883,0.382,下面表格列出了女大学生身高和体重的原始数据以及相应的残差数据,26,残差图的制作及作用。,坐标纵轴为残差变量,横轴可以有不同的选择;,若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域,;,对于远离横轴的点,要特别注意,。,身高与体重残差图,异常点,错误数据,模型问题,几点说明:,第一个样本点和第,6,个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。,另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。,残差图的制作及作用。身高与体重残差图异常点 错误数据,27,显然,,R,2,的值越大,说明残差平方和越小,也就是说模型拟合效果越好。,在线性回归模型中,,R,2,表示解析变量对预报变量变化的贡献率。,R,2,越接近,1,,表示回归的效果越好(因为,R,2,越接近,1,,表示解析变量和预报变量的,线性相关性越强),。,如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较,R,2,的值,来做出选择,即选取,R,2,较大的模型作为这组数据的模型。,(,2,)我们可以用相关指数,R,2,来刻画回归的效果,其计算公式是,显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果,28,一般地,建立回归模型的基本步骤为:,(,1,)确定研究对象,明确哪个变量是解析变量,哪个变量是预报变量。,(,2,)画出确定好的解析变量和预报变量的散点图,观察它们之间的关系,(如是否存在线性关系等)。,(,3,)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程,y=bx+a,),.,(,4,)按一定规则估计回归方程中的参数(如最小二乘法)。,(,5,)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性,等等),过存在异常,则检查数据是否有误,或模型是否合适等。,问题五:归纳建立回归模型的基本步骤,一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪,29,问题六:若两个变量呈现非线性关系,如何解决?,(分析例,2,),例,2,一只红铃虫的产卵数,y,和温度,x,有关。现收集了,7,组观测数据列于表中:,温度,x,o,C,21,23,25,27,29,32,35,产卵数,y,/,个,7,11,21,24,66,115,325,(,1,)试建立产卵数,y,与温度,x,之间的回归方程;并预测温度为,28,o,C,时产卵数目。,(,2,)你所建立的模型中温度在多大程度上解释了产卵数的变化?,问题六:若两个变量呈现非线性关系,如何解决?例2 一只红,30,选变量,解:选取气温为解释变量,x,,产卵数,为预报变量,y,。,画散点图,假设线性回归方程为,:,=bx+a,选 模 型,分析和预测,当,x,=28,时,,y=,19.8728-463.73 93,估计参数,由计算器得:线性回归方程为,y=,19.87,x,-463.73,相关指数,R,2,=,r,2,0.864,2,=0.7464,所以,一次函数模型中温度解释了,74.64%,的产卵数变化。,0,50,100,150,200,250,300,350,0,3,6,9,12,15,18,21,24,27,30,33,36,39,当,x,=28,时,,y=,19.8728-463.73 93,方法一:一元函数模型,选变量 解:选取气温为解释变量x,产卵数 画散点图假设线,31,产卵数,气温,变换,y=bx+a,非线性关系 线性关系,对数,方法,二,:指数函数模型,产卵数气温,32,温度,x/,21,23,25,27,Z=lny,1.946,2.398,3.405,3.178,产卵数,y/,个,7,11,21,24,29,32,35,4.190,4.745,5.784,66,115,325,由计算器得:,z,关于,x,的线性回归方程,相关指数 因此,y,关于,x,的非线性回,归方程为,当,x=28,时,,y 44,,指数回归模型中温度解释
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!