高中数学 第三章 统计案例 1 回归分析(课时1)课件 新人教B版选修2-3.ppt

上传人:xt****7 文档编号:3178918 上传时间:2019-12-06 格式:PPT 页数:26 大小:426KB
返回 下载 相关 举报
高中数学 第三章 统计案例 1 回归分析(课时1)课件 新人教B版选修2-3.ppt_第1页
第1页 / 共26页
高中数学 第三章 统计案例 1 回归分析(课时1)课件 新人教B版选修2-3.ppt_第2页
第2页 / 共26页
高中数学 第三章 统计案例 1 回归分析(课时1)课件 新人教B版选修2-3.ppt_第3页
第3页 / 共26页
点击查看更多>>
资源描述
3.1回归分析的基本思想及其初步应用(第一课时),1通过典型案例的探究,进一步了解回归分析的基本思想、方法及其初步应用2让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用,通过使用转化后的数据,求相关指数,运用相关指数进行数据分析、处理的方法3从实际问题中发现已有知识的不足,激发好奇心,求知欲,通过寻求有效的数据处理方法,开拓学生的思路,培养学生的探索精神和转化能力,通过案例的分析使学生了解回归分析在实际生活中的应用,增强数学取之生活,用于生活的意识,提高学习兴趣,本节课通过必修3熟悉有例题回顾线性相关关系知识,通过实际问题中发现已有知识的不足,引出随机误差、残差、残差分析的概念,进而运用残差来进行数据分析,通过例题讲解掌握用残差分析判断线性回归模型的拟合效果。掌握建立回归模型的步骤。本节内容学生内容不易掌握,通过知识整理与比较引导学生进行区分、理解。通过对典型案例的探究,练习进行巩固了解回归分析的基本思想方法和初步应用,从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:怎样根据一名女大学生的身高预报她的体重,并预报一名身高为172cm的女大学生的体重?,根据必修32.3变量相关关系解决这个问题的方法:1.先判断是两个变量是否具有线性相关关系(1)作散点图,如图所示(见课本P82:图3.1-1),2.根据线性回归的系数公式,求回归直线方程0.849x-85.712,3.由线性回归方程可以估计其位置值为60.316(千克)左右。,具有较好的线性相关关系,性质:回归直线一定过样本中心点.,(2)计算相关系数,这些点并不都在同一条直线上,上述直线并不能精确地反映x与y之间的关系,y的值不能完全由x确定,它们之间是统计相关关系,y的实际值与估计值之间存在着误差,因此,在统计学中设它们的线性回归模型为:,其中a,b为模型的未知参数,e为y与bx+a之间的误差,称它为随机误差,它是随机变量。且,线性回归模型完整表达式为,x称为变量,y称为变量.,解释,预报,线性回归模型中随机误差的主要来源:线性回归模型中的预报值与真实情况y引起的误差;观测与计算(用代替ba)产生的误差;省略了一些因素的影响(如生活习惯等)产生的误差.,在线性回归模型中,e为用bx+a的预报真实值y的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差?,称相应于点的残差,坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,残差图中的点应该分布在以横轴为中心的带形区域;对于远离横轴的点,要特别注意。,身高与体重残差图,残差的作用,1.通过残差表或残差图发现原始数据中的可疑数据,通过残差来判断模型拟合的效果这种分析工作称为残差分析.,通过残差表或残差图判断模型拟合的效果是直观判断,如何精确判断模型拟合的效果?,引入参数R2,来精确该画模型拟合效果,对于己获取的样本数据,在上式子中是定值,越小,即残差平方和越小,R2越大,说明模型拟合效果越好。,引入例中参数R2计算得约为0.64说明女大学生体重差异有百分之六十四是由身高引起的.,知识点线性回归分析1.对线性回归模型的三点说明(1)非确定性关系:线性回归模型y=bx+a+e与确定性函数y=bx+a相比,它表示y与x之间是统计相关关系(非确定性关系),其中的随机误差e提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a,b的工具.,(2)线性回归方程中,的意义是:以为基数,x每增加1个单位,y相应地平均增加个单位.(3)线性回归模型中随机误差的主要来源线性回归模型与真实情况引起的误差;观测与计算产生的误差;省略了一些因素的影响产生的误差.,2.线性回归模型的模拟效果(1)残差图法:观察残差图,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.,(2)残差的平方和法:一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好.(3)R2法:R2的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.,3.相关系数与R2(1)R2是相关系数的平方,其变化范围为0,1,而相关系数的变化范围为-1,1.(2)相关系数可较好地反映变量的相关性及正相关或负相关,而R2反映了回归模型拟合数据的效果.(3)当|r|接近于1时说明两变量的相关性较强,当|r|接近于0时说明两变量的相关性较弱,而当R2接近于1时,说明线性回归方程的拟合效果较好.,【微思考】(1)残差与我们平时说的误差是一回事儿吗?提示:这两个概念在某程度上具有很大的相似性,都是衡量不确定性的指标,二者的区别是:误差与测量有关,误差可以衡量测量的准确性,误差越大表示测量越不准确;残差与预测有关,残差大小可以衡量预测的准确性,残差越大表示预测越不准确.,(2)R2与原来学过的相关系数r有区别吗?提示:它们都是刻画两个变量之间的的相关关系的,区别是R2表示解释变量对预报变量变化的贡献率,其表达式为R2=1-;相关系数r是检验两个变量相关性的强弱程度,其表达式为,建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)(4)按一定规则(如最小二乘法)估计回归方程中的参数(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,或残差呈现不随机的规律性等)若存在异常,则检查数据是否有误,或模型是否合适等,为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:,(1)作出散点图并求线性回归方程;(2)求出R2;(3)进行残差分析,作残差分析时,一般从以下几个方面予以说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄,解答(1)散点图如图,(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系规律方法当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面,1.判一判(正确的打“”,错误的打“”)(1)残差平方和越小,线性回归方程拟合效果越好.()(2)在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上.()(3)R2越接近于1,线性回归方程的拟合效果越好.(),2.做一做(请把正确的答案写在横线上)(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系为.(2)在残差分析中,残差图的纵坐标为.(3)如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于,解释变量和预报变量之间的相关系数R等于.,正相关,残差,0,1或-1,3.已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:,求y对x的回归直线方程,并说明回归模型拟合效果的好坏,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!