高中数学 3.1 回归分析的基本思想及其初步应用(三)课件 新人教A版选修2-3 .ppt

上传人:xt****7 文档编号:5519177 上传时间:2020-01-31 格式:PPT 页数:25 大小:668KB
返回 下载 相关 举报
高中数学 3.1 回归分析的基本思想及其初步应用(三)课件 新人教A版选修2-3 .ppt_第1页
第1页 / 共25页
高中数学 3.1 回归分析的基本思想及其初步应用(三)课件 新人教A版选修2-3 .ppt_第2页
第2页 / 共25页
高中数学 3.1 回归分析的基本思想及其初步应用(三)课件 新人教A版选修2-3 .ppt_第3页
第3页 / 共25页
点击查看更多>>
资源描述
3 1回归分析的基本思想及其初步应用 三 高二数学选修2 3第三章统计案例 比 数学3 中 回归 增加的内容 数学 统计画散点图了解最小二乘法的思想求回归直线方程y bx a用回归直线方程解决应用问题 选修2 3 统计案例引入线性回归模型y bx a e了解模型中随机误差项e产生的原因了解相关指数R2和模型拟合的效果之间的关系了解残差图的作用利用线性回归模型解决一类非线性回归问题正确理解分析方法与结果 复习回顾 2 数据点和它在回归直线上相应位置的差异是随机误差的效应 称为残差 3 对每名女大学生计算这个差异 然后分别将所得的值平方后加起来 用数学符号表示为 称为残差平方和 它代表了随机误差的效应 4 两个指标 1 类比样本方差估计总体方差的思想 可以用作为的估计量 越小 预报精度越高 2 我们可以用相关指数R2来刻画回归的效果 其计算公式是 R2 1 说明回归方程拟合的越好 R2 0 说明回归方程拟合的越差 表3 2列出了女大学生身高和体重的原始数据以及相应的残差数据 在研究两个变量间的关系时 首先要根据散点图来粗略判断它们是否线性相关 是否可以用回归模型来拟合数据 5 残差分析与残差图的定义 然后 我们可以通过残差来判断模型拟合的效果 判断原始数据中是否存在可疑数据 这方面的分析工作称为残差分析 我们可以利用图形来分析残差特性 作图时纵坐标为残差 横坐标可以选为样本编号 或身高数据 或体重估计值等 这样作出的图形称为残差图 残差图的制作及作用1 坐标纵轴为残差变量 横轴可以有不同的选择 2 若模型选择的正确 残差图中的点应该分布在以横轴为心的带形区域 3 对于远离横轴的点 要特别注意 身高与体重残差图 几点说明 第一个样本点和第6个样本点的残差比较大 需要确认在采集过程中是否有人为的错误 如果数据采集有错误 就予以纠正 然后再重新利用线性回归模型拟合数据 如果数据采集没有错误 则需要寻找其他的原因 另外 残差点比较均匀地落在水平的带状区域中 说明选用的模型计较合适 这样的带状区域的宽度越窄 说明模型拟合精度越高 回归方程的预报精度越高 例1在一段时间内 某中商品的价格x元和需求量Y件之间的一组数据为 求出Y对的回归直线方程 并说明拟合效果的好坏 解 例1在一段时间内 某中商品的价格x元和需求量Y件之间的一组数据为 求出Y对的回归直线方程 并说明拟合效果的好坏 列出残差表为 0 994 因而 拟合效果较好 0 0 3 0 4 0 1 0 2 4 6 2 6 0 4 2 4 4 4 例2关于x与y有如下数据 有如下的两个线性模型 1 2 试比较哪一个拟合效果更好 6 注意回归模型的适用范围 1 回归方程只适用于我们所研究的样本的总体 样本数据来自哪个总体的 预报时也仅适用于这个总体 2 模型的时效性 利用不同时间段的样本数据建立的模型 只有用来对那段时间范围的数据进行预报 3 建立模型时自变量的取值范围决定了预报时模型的适用范围 通常不能超出太多 4 在回归模型中 因变量的值不能由自变量的值完全确定 正如前面已经指出的 某个女大学生的身高为172cm 我们不能利用所建立的模型预测她的体重 只能给出身高为172cm的女大学生的平均体重的预测值 7 一般地 建立回归模型的基本步骤为 案例2一只红铃虫的产卵数y和温度x有关 现收集了7组观测数据列于表中 1 试建立产卵数y与温度x之间的回归方程 并预测温度为28oC时产卵数目 2 你所建立的模型中温度在多大程度上解释了产卵数的变化 画散点图 假设线性回归方程为 bx a 选模型 所以 二次函数模型中温度解释了74 64 的产卵数变化 探索新知 方案1 当x 28时 y 19 87 28 463 73 93 一元线性模型 奇怪 93 66 模型不好 方案2 问题3 合作探究 t x2 二次函数模型 方案2解答 平方变换 令t x2 产卵数y和温度x之间二次函数模型y bx2 a就转化为产卵数y和温度的平方t之间线性回归模型y bt a 作散点图 并由计算器得 y和t之间的线性回归方程为y 0 367t 202 54 相关指数R2 r2 0 8962 0 802 将t x2代入线性回归方程得 y 0 367x2 202 54当x 28时 y 0 367 282 202 54 85 且R2 0 802 所以 二次函数模型中温度解释了80 2 的产卵数变化 产卵数 气温 指数函数模型 方案3 合作探究 对数 方案3解答 当x 28oC时 y 44 指数回归模型中温度解释了98 5 的产卵数的变化 由计算器得 z关于x的线性回归方程为z 0 118x 1 665 相关指数R2 r2 0 99252 0 985 最好的模型是哪个 线性模型 二次函数模型 指数函数模型 比一比 最好的模型是哪个 这些问题也使用于其他问题 涉及到统计的一些思想 模型适用的总体 模型的时间性 样本的取值范围对模型的影响 模型预报结果的正确理解 小结 什么是回归分析 内容 从一组样本数据出发 确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验 并从影响某一特定变量的诸多变量中找出哪些变量的影响显著 哪些不显著利用所求的关系式 根据一个或几个变量的取值来预测或控制另一个特定变量的取值 并给出这种预测或控制的精确程度 回归分析与相关分析的区别 相关分析中 变量x变量y处于平等的地位 回归分析中 变量y称为因变量 处在被解释的地位 x称为自变量 用于预测因变量的变化相关分析中所涉及的变量x和y都是随机变量 回归分析中 因变量y是随机变量 自变量x可以是随机变量 也可以是非随机的确定变量相关分析主要是描述两个变量之间线性关系的密切程度 回归分析不仅可以揭示变量x对变量y的影响大小 还可以由回归方程进行预测和控制 练习假设关于某设备的使用年限x和所支出的维修费用y 万元 有如下的统计资料 若由资料知 y对x呈线性相关关系 试求 1 线性回归方程的回归系数 2 求残差平方和 3 求相关系数 4 估计使用年限为10年时 维修费用是多少 解 1 由已知数据制成表格 所以有
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!