2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt

上传人:xt****7 文档编号:5700551 上传时间:2020-02-05 格式:PPT 页数:48 大小:1.26MB
返回 下载 相关 举报
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt_第1页
第1页 / 共48页
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt_第2页
第2页 / 共48页
2019年高考数学二轮复习 专题七 概率统计 7.1 统计与统计案例课件 文.ppt_第3页
第3页 / 共48页
点击查看更多>>
资源描述
专题七概率统计 7 1统计与统计案例 命题热点一 命题热点二 命题热点三 命题热点四 频率分布直方图的应用 思考 观察频率分布直方图能得到哪些信息 例1某公司为了解用户对其产品的满意度 从A B两地区分别随机调查了40个用户 根据用户对产品的满意度评分 得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表 A地区用户满意度评分的频率分布直方图 命题热点一 命题热点二 命题热点三 命题热点四 B地区用户满意度评分的频数分布表 命题热点一 命题热点二 命题热点三 命题热点四 1 作出B地区用户满意度评分的频率分布直方图 并通过直方图比较两地区满意度评分的平均值及分散程度 不要求计算出具体值 给出结论即可 B地区用户满意度评分的频率分布直方图 命题热点一 命题热点二 命题热点三 命题热点四 2 根据用户满意度评分 将用户的满意度分为三个等级 估计哪个地区用户的满意度等级为不满意的概率大 说明理由 命题热点一 命题热点二 命题热点三 命题热点四 解 1 B地区用户满意度评分的频率分布直方图通过两地区用户满意度评分的频率分布直方图可以看出 B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值 B地区用户满意度评分比较集中 而A地区用户满意度评分比较分散 命题热点一 命题热点二 命题热点三 命题热点四 2 A地区用户的满意度等级为不满意的概率大 记CA表示事件 A地区用户的满意度等级为不满意 CB表示事件 B地区用户的满意度等级为不满意 由直方图得P CA 的估计值为 0 01 0 02 0 03 10 0 6 P CB 的估计值为 0 005 0 02 10 0 25 所以A地区用户的满意度等级为不满意的概率大 命题热点一 命题热点二 命题热点三 命题热点四 命题热点一 命题热点二 命题热点三 命题热点四 对点训练1某大学艺术专业400名学生参加某次测评 根据男女学生人数比例 使用分层抽样的方法从中随机抽取了100名学生 记录他们的分数 将数据分成7组 20 30 30 40 80 90 并整理得到如下频率分布直方图 命题热点一 命题热点二 命题热点三 命题热点四 1 从总体的400名学生中随机抽取一人 估计其分数小于70的概率 2 已知样本中分数小于40的学生有5人 试估计总体中分数在区间 40 50 内的人数 3 已知样本中有一半男生的分数不小于70 且样本中分数不小于70的男女生人数相等 试估计总体中男生和女生人数的比例 解 1 根据频率分布直方图可知 样本中分数不小于70的频率为 0 02 0 04 10 0 6 所以样本中分数小于70的频率为1 0 6 0 4 所以从总体的400名学生中随机抽取一人 其分数小于70的概率估计为0 4 命题热点一 命题热点二 命题热点三 命题热点四 2 根据题意 样本中分数不小于50的频率为 0 01 0 02 0 04 0 02 10 0 9 分数在区间 40 50 内的人数为100 100 0 9 5 5 所以总体中分数在区间 40 50 内的人数估计为400 20 3 由题意可知 样本中分数不小于70的学生人数为 0 02 0 04 10 100 60 所以样本中分数不小于70的男生人数为60 30 所以样本中的男生人数为30 2 60 女生人数为100 60 40 男生和女生人数的比例为60 40 3 2 所以根据分层抽样原理 总体中男生和女生人数的比例估计为3 2 命题热点一 命题热点二 命题热点三 命题热点四 用样本的数字特征估计总体 思考1 样本有哪些数字特征 这些数字特征反映了样本数据的什么情况 思考2 茎叶图刻画数据有哪些优点及不足 命题热点一 命题热点二 命题热点三 命题热点四 例2为比较甲 乙两地某月14时的气温状况 随机选取该月中的5天 将这5天中14时的气温数据 单位 制成如图所示的茎叶图 考虑以下结论 甲地该月14时的平均气温低于乙地该月14时的平均气温 甲地该月14时的平均气温高于乙地该月14时的平均气温 甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差 甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差 其中根据茎叶图能得到的统计结论的编号为 A B C D 答案 解析 命题热点一 命题热点二 命题热点三 命题热点四 题后反思1 样本的数字特征主要有 中位数 众数 平均数 标准差 方差 中位数 平均数 众数反映了这组数据的集中程度 反映了样本数据的总体水平 而标准差 方差反映这组数据的波动情况 标准差或方差越大 波动越大 2 茎叶图刻画数据的优点 1 所有数据信息都可由茎叶图看到 2 茎叶图便于记录和表示 能反映数据在各段上的分布情况 3 茎叶图刻画数据的不足 茎叶图不能直接反映总体的分布情况 这就需要通过茎叶图给出的数据求出数据的数字特征 进一步估计总体情况 命题热点一 命题热点二 命题热点三 命题热点四 对点训练2某市为了考核甲 乙两部门的工作情况 随机访问了50名市民 根据这50名市民对这两部门的评分 评分越高表明市民的评价越高 绘制茎叶图如下 1 分别估计该市的市民对甲 乙两部门评分的中位数 2 分别估计该市的市民对甲 乙两部门的评分高于90的概率 3 根据茎叶图分析该市的市民对甲 乙两部门的评价 命题热点一 命题热点二 命题热点三 命题热点四 解 1 由所给茎叶图知 50名市民对甲部门的评分由小到大排序 排在第25 26名的是75 75 则样本中位数为75 所以该市的市民对甲部门评分的中位数的估计值是75 50名市民对乙部门的评分由小到大排序 排在第25 26名的是66 68 则样本中位数为 所以该市的市民对乙部门评分的中位数的估计值是67 2 由所给茎叶图知 50名市民对甲 乙部门的评分高于90的比率分别为 故该市的市民对甲 乙部门的评分高于90的概率的估计值分别为0 1 0 16 命题热点一 命题热点二 命题热点三 命题热点四 3 由所给茎叶图知 市民对甲部门的评分的中位数高于对乙部门的评分的中位数 而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差 说明该市市民对甲部门的评价较高 评价较为一致 对乙部门的评价较低 评价差异较大 注 利用其他统计量进行分析 结论合理的也可 命题热点一 命题热点二 命题热点三 命题热点四 回归方程的求法及回归分析 思考 两个变量具备什么关系才能用线性回归方程来预测 如何判断两个变量具有这种关系 例3某公司为确定下一年度投入某种产品的宣传费 需了解年宣传费x 单位 千元 对年销售量y 单位 t 和年利润z 单位 千元 的影响 对近8年的年宣传费xi和年销售量yi i 1 2 8 数据作了初步处理 得到下面的散点图及一些统计量的值 命题热点一 命题热点二 命题热点三 命题热点四 命题热点一 命题热点二 命题热点三 命题热点四 1 根据散点图判断 y a bx与y c d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型 给出判断即可 不必说明理由 2 根据 1 的判断结果及表中数据 建立y关于x的回归方程 3 已知这种产品的年利润z与x y的关系为z 0 2y x 根据 2 的结果回答下列问题 当年宣传费x 49时 年销售量及年利润的预报值是多少 当年宣传费x为何值时 年利润的预报值最大 命题热点一 命题热点二 命题热点三 命题热点四 命题热点一 命题热点二 命题热点三 命题热点四 命题热点一 命题热点二 命题热点三 命题热点四 题后反思当两个变量之间具有相关关系时 才可通过线性回归方程来估计和预测 对两个变量的相关关系的判断有两个方法 一是根据散点图 具有很强的直观性 直接得出两个变量是正相关或负相关 二是计算相关系数法 这种方法能比较准确地反映相关程度 相关系数的绝对值越接近1 相关性就越强 命题热点一 命题热点二 命题热点三 命题热点四 对点训练3 2018全国 文18 下图是某地区2000年至2016年环境基础设施投资额y 单位 亿元 的折线图 命题热点一 命题热点二 命题热点三 命题热点四 为了预测该地区2018年的环境基础设施投资额 建立了y与时间变量t的两个线性回归模型 根据2000年至2016年的数据 时间变量t的值依次为1 2 17 建立模型 30 4 13 5t 根据2010年至2016年的数据 时间变量t的值依次为1 2 7 建立模型 99 17 5t 1 分别利用这两个模型 求该地区2018年的环境基础设施投资额的预测值 2 你认为用哪个模型得到的预测值更可靠 并说明理由 解 1 利用模型 该地区2018年的环境基础设施投资额的预测值为 30 4 13 5 19 226 1 亿元 利用模型 该地区2018年的环境基础设施投资额的预测值为 99 17 5 9 256 5 亿元 命题热点一 命题热点二 命题热点三 命题热点四 2 利用模型 得到的预测值更可靠 理由如下 i 从折线图可以看出 2000年至2016年的数据对应的点没有随机散布在直线y 30 4 13 5t上下 这说明利用2000年至2016年的数据建立的线性模型 不能很好地描述环境基础设施投资额的变化趋势 2010年相对2009年的环境基础设施投资额有明显增加 2010年至2016年的数据对应的点位于一条直线的附近 这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势 利用2010年至2016年的数据建立的线性模型 99 17 5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势 因此利用模型 得到的预测值更可靠 命题热点一 命题热点二 命题热点三 命题热点四 ii 从计算结果看 相对于2016年的环境基础设施投资额220亿元 由模型 得到的预测值226 1亿元的增幅明显偏低 而利用模型 得到的预测值的增幅比较合理 说明利用模型 得到的预测值更可靠 以上给出了2种理由 答出其中任意一种或其他合理理由均可得分 命题热点一 命题热点二 命题热点三 命题热点四 独立性检验 思考 独立性检验有什么用途 例4某高校共有学生15000名 其中男生10500名 女生4500名 为调查该校学生每周平均体育运动时间的情况 采用分层抽样的方法 收集300名学生每周平均体育运动时间的样本数据 单位 h 命题热点一 命题热点二 命题热点三 命题热点四 1 应收集多少名女生的样本数据 2 根据这300个样本数据 得到学生每周平均体育运动时间的频率分布直方图 如图 其中样本数据的分组区间为 0 2 2 4 4 6 6 8 8 10 10 12 估计该校学生每周平均体育运动时间超过4h的概率 命题热点一 命题热点二 命题热点三 命题热点四 3 在样本数据中 有60名女生的每周平均体育运动时间超过4h 请完成每周平均体育运动时间与性别列联表 能否在犯错误的概率不超过0 05的前提下认为该校学生每周平均体育运动时间与性别有关系 命题热点一 命题热点二 命题热点三 命题热点四 解 1 300 90 所以应收集90名女生的样本数据 2 由频率分布直方图得1 2 0 100 0 025 0 75 所以该校学生每周平均体育运动时间超过4h的概率的估计值为0 75 3 由 2 知 300 0 75 225 人 则有225人每周平均体育运动时间超过4h 75人每周平均体育运动时间不超过4h 因为样本数据中有210份是关于男生的 90份是关于女生的 所以每周平均体育运动时间与性别列联表如下 每周平均体育运动时间与性别列联表 命题热点一 命题热点二 命题热点三 命题热点四 结合列联表可算得 所以 能在犯错误的概率不超过0 05的前提下认为该校学生的每周平均体育运动时间与性别有关系 命题热点一 命题热点二 命题热点三 命题热点四 题后反思利用独立性检验 能够帮助我们对日常生活中的实际问题作出合理的推断和预测 独立性检验就是考察两个分类变量是否有关系 并能较为准确地给出这种判断的可信度 具体做法是根据公式计算随机变量的观测值k k值越大 说明 两个变量有关系 的可能性越大 命题热点一 命题热点二 命题热点三 命题热点四 对点训练4海水养殖场进行某水产品的新 旧网箱养殖方法的产量对比 收获时各随机抽取了100个网箱 测量各箱水产品的产量 单位 kg 其频率分布直方图如下 旧养殖法 命题热点一 命题热点二 命题热点三 命题热点四 新养殖法 命题热点一 命题热点二 命题热点三 命题热点四 1 记A表示事件 旧养殖法的箱产量低于50kg 估计A的概率 2 填写下面列联表 并根据列联表判断是否有99 的把握认为箱产量与养殖方法有关 3 根据箱产量的频率分布直方图 对这两种养殖方法的优劣进行比较 附 命题热点一 命题热点二 命题热点三 命题热点四 解 1 旧养殖法的箱产量低于50kg的频率为 0 012 0 014 0 024 0 034 0 040 5 0 62 因此 事件A的概率估计值为0 62 2 根据箱产量的频率分布直方图得列联表 由于15 705 6 635 故有99 的把握认为箱产量与养殖方法有关 命题热点一 命题热点二 命题热点三 命题热点四 3 箱产量的频率分布直方图表明 新养殖法的箱产量平均值 或中位数 在50kg到55kg之间 旧养殖法的箱产量平均值 或中位数 在45kg到50kg之间 且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高 因此 可以认为新养殖法的箱产量较高且稳定 从而新养殖法优于旧养殖法 规律总结 拓展演练 1 对于频率分布表和频率分布直方图 在计数和计算时一定要准确 在绘制小长方形时 宽窄要一致 通过频率分布表和频率分布直方图可以对总体作出估计 2 茎叶图 频率分布表和频率分布直方图都是用来描述样本数据的分布情况的 茎叶图由所有样本数据构成 没有损失任何样本信息 可以随时记录 而频率分布表和频率分布直方图则损失了样本的一些信息 必须在完成抽样后才能制作 3 若x1 x2 xn的平均数为 方差为s2 则ax1 b ax2 b axn b的平均数为 方差为a2s2 规律总结 拓展演练 4 利用频率分布直方图求众数 中位数与平均数时 应注意这三者的区分 1 最高的长方形的中点即众数 2 中位数左边和右边的直方图的面积是相等的 3 平均数是频率分布直方图的 重心 等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和 5 回归分析是处理变量相关关系的一种数学方法 主要解决 1 确定特定量之间是否有相关关系 如果有就找出它们之间贴近的数学表达式 2 根据一组观察值 预测变量的取值及判断变量取值的变化趋势 3 求出线性回归方程 6 根据K2的值可以判断两个分类变量有关的可信程度 规律总结 拓展演练 1 某城市为了解游客人数的变化规律 提高旅游服务质量 收集并整理了2014年1月至2016年12月期间月接待游客量 单位 万人 的数据 绘制了下面的折线图 根据该折线图 下列结论错误的是 A 月接待游客量逐月增加B 年接待游客量逐年增加C 各年的月接待游客量高峰期大致在7 8月D 各年1月至6月的月接待游客量相对于7月至12月 波动性更小 变化比较平稳 答案 解析 规律总结 拓展演练 2 如图所示的茎叶图记录了甲 乙两组各5名工人某日的产量数据 单位 件 若这两组数据的中位数相等 且平均值也相等 则x和y的值分别为 A 3 5B 5 5C 3 7D 5 7 A 解析甲组数据为56 62 65 70 x 74 乙组数据为59 61 67 60 y 78 若两组数据的中位数相等 则65 60 y 所以y 5 又两组数据的平均值相等 所以56 62 65 70 x 74 59 61 67 65 78 解得x 3 规律总结 拓展演练 3 已知一组数据4 7 4 8 5 1 5 4 5 5 则该组数据的方差是 答案0 1 解析这组数据的平均数为 4 7 4 8 5 1 5 4 5 5 5 1 方差为 4 7 5 1 2 4 8 5 1 2 5 1 5 1 2 5 4 5 1 2 5 5 5 1 2 0 1 规律总结 拓展演练 4 某险种的基本保费为a 单位 元 继续购买该险种的投保人称为续保人 续保人本年度的保费与其上年度出险次数的关联如下 随机调查了该险种的200名续保人在一年内的出险情况 得到如下统计表 规律总结 拓展演练 1 记A为事件 一续保人本年度的保费不高于基本保费 求P A 的估计值 2 记B为事件 一续保人本年度的保费高于基本保费但不高于基本保费的160 求P B 的估计值 3 求续保人本年度平均保费的估计值 规律总结 拓展演练
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!