2019年高考数学总复习 6.3.1 统计与统计案例课件 理.ppt

上传人:xt****7 文档编号:5701912 上传时间:2020-02-05 格式:PPT 页数:39 大小:1.73MB
返回 下载 相关 举报
2019年高考数学总复习 6.3.1 统计与统计案例课件 理.ppt_第1页
第1页 / 共39页
2019年高考数学总复习 6.3.1 统计与统计案例课件 理.ppt_第2页
第2页 / 共39页
2019年高考数学总复习 6.3.1 统计与统计案例课件 理.ppt_第3页
第3页 / 共39页
点击查看更多>>
资源描述
6 3统计与概率大题 1 统计图表 1 在频率分布直方图中 各小矩形的面积表示相应各组的频率 各小矩形的高 各小矩形面积之和等于1 2 茎叶图 当数据是两位数时 用中间的数字表示十位数 两边的数字表示个位数 当数据是三位数 前两位相对比较集中时 常以前两位为茎 第三位 个位 为叶 其余类推 2 样本的数字特征 1 众数 是指出现次数最多的数 体现在频率分布直方图中 是指高度最高的小矩形的宽的中点的横坐标 2 中位数是指从左往右小矩形的面积之和为0 5处的横坐标 5 平均数反映了数据取值的平均水平 标准差 方差描述了一组数据围绕平均数波动的大小 标准差 方差越大 数据的离散程度越大 越不稳定 3 变量间的相关关系 1 如果散点图中的点从整体上看大致分布在一条直线的附近 那么我们说变量x和y具有线性相关关系 2 线性回归方程 若变量x与y具有线性相关关系 有n个样本数据 正相关 当r 0时 表示两个变量负相关 r 越接近1 表明两个变量相关性越强 当 r 接近0时 表明两个变量几乎不存在相关性 4 独立性检验对于取值分别是 x1 x2 和 y1 y2 的分类变量X和Y 其样本频数列联表是 5 概率的基本性质及常见概率的计算 1 随机事件的概率 0 P A 1 必然事件的概率是1 不可能事件的概率是0 2 若事件A B互斥 则P A B P A P B 3 若事件A B对立 则P A B P A P B 1 4 两种常见的概率模型 古典概型的特点 有限性 等可能性 6 相互独立事件同时发生的概率 P AB P A P B 7 超几何分布中的概率 在含有M件次品的N件产品中 任取n件 其中恰有X件次品 则P X k k 0 1 2 m 其中m min M n 且n N M N n M N N 6 二项分布一般地 在n次独立重复试验中 事件A发生的次数为X 设每次试验中事件A发生的概率为p 则P X k pkqn k 其中0 p 1 p q 1 k 0 1 2 n 称X服从参数为n p的二项分布 记作X B n p 且E X np D X np 1 p 7 离散型随机变量的分布列 期望 方差 1 设离散型随机变量X可能取的不同值为x1 x2 xi xn X取每一个值xi i 1 2 n 的概率P X xi pi 则称下表 为离散型随机变量X的分布列 2 E X x1p1 x2p2 xipi xnpn为X的均值或数学期望 3 D X x1 E X 2 p1 x2 E X 2 p2 xi E X 2 pi xn E X 2 pn叫做随机变量X的方差 4 均值与方差的性质 E aX b aE X b E E E D aX b a2D X 6 3 1统计与统计案例 考向一 考向二 考向三 相关关系的判断及回归分析例1 2018全国 理18 下图是某地区2000年至2016年环境基础设施投资额y 单位 亿元 的折线图 考向一 考向二 考向三 为了预测该地区2018年的环境基础设施投资额 建立了y与时间变量t的两个线性回归模型 根据2000年至2016年的数据 时间变量t的值依次为1 2 17 建立模型 30 4 13 5t 根据2010年至2016年的数据 时间变量t的值依次为1 2 7 建立模型 y 99 17 5t 1 分别利用这两个模型 求该地区2018年的环境基础设施投资额的预测值 2 你认为用哪个模型得到的预测值更可靠 并说明理由 考向一 考向二 考向三 解 1 利用模型 该地区2018年的环境基础设施投资额的预测值为 2 利用模型 得到的预测值更可靠 理由如下 考向一 考向二 考向三 i 从折线图可以看出 2000年至2016年的数据对应的点没有随机散布在直线y 30 4 13 5t上下 这说明利用2000年至2016年的数据建立的线性模型 不能很好地描述环境基础设施投资额的变化趋势 2010年相对2009年的环境基础设施投资额有明显增加 2010年至2016年的数据对应的点位于一条直线的附近 这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势 利用2010年至2016年的数据建立的线性模型 99 17 5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势 因此利用模型 得到的预测值更可靠 考向一 考向二 考向三 解题心得在求两变量相关系数和两变量的回归方程时 由于r和的公式比较复杂 求它的值计算量比较大 为了计算准确 可将这个量分成几个部分分别计算 这样等同于分散难点 各个攻破 提高了计算的准确度 ii 从计算结果看 相对于2016年的环境基础设施投资额220亿元 由模型 得到的预测值226 1亿元的增幅明显偏低 而利用模型 得到的预测值的增幅比较合理 说明利用模型 得到的预测值更可靠 以上给出了2种理由 答出其中任意一种或其他合理理由均可得分 考向一 考向二 考向三 对点训练1下表是某校高三一次月考5个班级的数学 物理的平均成绩 1 一般来说 学生的物理成绩与数学成绩具有线性相关关系 根据上表提供的数据 求两个变量x y的线性回归方程 2 从以上5个班级中任选两个参加某项活动 设选出的两个班级中数学平均分在115分以上的个数为X 求X的分布列和数学期望 考向一 考向二 考向三 考向一 考向二 考向三 独立性检验的综合问题例2海水养殖场进行某水产品的新 旧网箱养殖方法的产量对比 收获时各随机抽取了100个网箱 测量各箱水产品的产量 单位 kg 其频率分布直方图如下 旧养殖法新养殖法 考向一 考向二 考向三 1 设两种养殖方法的箱产量相互独立 记A表示事件 旧养殖法的箱产量低于50kg 新养殖法的箱产量不低于50kg 估计A的概率 2 填写下面列联表 并根据列联表判断是否有99 的把握认为箱产量与养殖方法有关 3 根据箱产量的频率分布直方图 求新养殖法箱产量的中位数的估计值 精确到0 01 考向一 考向二 考向三 解 1 记B表示事件 旧养殖法的箱产量低于50kg C表示事件 新养殖法的箱产量不低于50kg 由题意知P A P BC P B P C 旧养殖法的箱产量低于50kg的频率为 0 012 0 014 0 024 0 034 0 040 5 0 62 故P B 的估计值为0 62 新养殖法的箱产量不低于50kg的频率为 0 068 0 046 0 010 0 008 5 0 66 故P C 的估计值为0 66 因此 事件A的概率估计值为0 62 0 66 0 4092 考向一 考向二 考向三 2 根据箱产量的频率分布直方图得列联表 由于15 705 6 635 故有99 的把握认为箱产量与养殖方法有关 考向一 考向二 考向三 3 因为新养殖法的箱产量频率分布直方图中 箱产量低于50kg的直方图面积为 0 004 0 020 0 044 5 0 340 5 故新养殖法箱产量的中位数的估计值为 解题心得有关独立性检验的问题解题步骤 1 作出2 2列联表 2 计算随机变量K2的值 3 查临界值 检验作答 考向一 考向二 考向三 对点训练2 2018全国 理18 某工厂为提高生产效率 开展技术创新活动 提出了完成某项生产任务的两种新的生产方式 为比较两种生产方式的效率 选取40名工人 将他们随机分成两组 每组20人 第一组工人用第一种生产方式 第二组工人用第二种生产方式 根据工人完成生产任务的工作时间 单位 min 绘制了如下茎叶图 1 根据茎叶图判断哪种生产方式的效率更高 并说明理由 考向一 考向二 考向三 2 求40名工人完成生产任务所需时间的中位数m 并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表 3 根据 2 中的列联表 能否有99 的把握认为两种生产方式的效率有差异 考向一 考向二 考向三 解 1 第二种生产方式的效率更高 理由如下 由茎叶图可知 用第一种生产方式的工人中 有75 的工人完成生产任务所需时间至少80分钟 用第二种生产方式的工人中 有75 的工人完成生产任务所需时间至多79分钟 因此第二种生产方式的效率更高 由茎叶图可知 用第一种生产方式的工人完成生产任务所需时间的中位数为85 5分钟 用第二种生产方式的工人完成生产任务所需时间的中位数为73 5分钟 因此第二种生产方式的效率更高 由茎叶图可知 用第一种生产方式的工人完成生产任务平均所需时间高于80分钟 用第二种生产方式的工人完成生产任务平均所需时间低于80分钟 因此第二种生产方式的效率更高 考向一 考向二 考向三 由茎叶图可知 用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多 关于茎8大致呈对称分布 用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多 关于茎7大致呈对称分布 又用两种生产方式的工人完成生产任务所需时间分布的区间相同 故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少 因此第二种生产方式的效率更高 以上给出了4种理由 考生答出其中任意一种或其他合理理由均可得分 考向一 考向二 考向三 列联表如下 所以有99 的把握认为两种生产方式的效率有差异 考向一 考向二 考向三 依据统计数据求事件发生的概率例3某公司为了解用户对其产品的满意度 从A B两地区分别随机调查了20个用户 得到用户对产品的满意度评分如下 A地区 6273819295857464537678869566977888827689B地区 7383625191465373648293486581745654766579 1 根据两组数据完成两地区用户满意度评分的茎叶图 并通过茎叶图比较两地区满意度评分的平均值及分散程度 不要求计算出具体值 给出结论即可 考向一 考向二 考向三 2 根据用户满意度评分 将用户的满意度从低到高分为三个等级 记事件C A地区用户的满意度等级高于B地区用户的满意度等级 假设两地区用户的评价结果相互独立 根据所给数据 以事件发生的频率作为相应事件发生的概率 求C的概率 考向一 考向二 考向三 解 1 两地区用户满意度评分的茎叶图如下 通过茎叶图可以看出 A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值 A地区用户满意度评分比较集中 B地区用户满意度评分比较分散 考向一 考向二 考向三 2 记CA1表示事件 A地区用户的满意度等级为满意或非常满意 CA2表示事件 A地区用户的满意度等级为非常满意 CB1表示事件 B地区用户的满意度等级为不满意 CB2表示事件 B地区用户的满意度等级为满意 则CA1与CB1独立 CA2与CB2独立 CB1与CB2互斥 C CB1CA1 CB2CA2 P C P CB1CA1 CB2CA2 P CB1CA1 P CB2CA2 P CB1 P CA1 P CB2 P CA2 考向一 考向二 考向三 解题心得1 直接法 正确分析复杂事件的构成 将复杂事件转化为几个彼此互斥的事件的和事件或几个相互独立事件同时发生的事件或一独立重复试验问题 然后用相应概率公式求解 2 间接法 当复杂事件正面情况比较多 反面情况比较少 则可利用其对立事件进行求解 即 正难则反 对于 至少 至多 等问题往往也用这种方法求解 考向一 考向二 考向三 对点训练3A B C三个班共有100名学生 为调查他们的体育锻炼情况 通过分层抽样获得了部分学生一周的锻炼时间 数据如下表 单位 小时 1 试估计C班的学生人数 2 从A班和C班抽出的学生中 各随机选取一人 A班选出的人记为甲 C班选出的人记为乙 假设所有学生的锻炼时间相互独立 求该周甲的锻炼时间比乙的锻炼时间长的概率 考向一 考向二 考向三 3 再从A B C三个班中各随机抽取一名学生 他们该周的锻炼时间分别是7 9 8 25 单位 小时 这3个新数据与表格中的数据构成的新样本的平均数记为 1 表格中数据的平均数记为 0 试判断 0和 1的大小 结论不要求证明 解 1 由题意知 抽出的20名学生中 来自C班的学生有8名 根据分层抽样方法 C班的学生人数估计为100 40 2 设事件Ai为 甲是现有样本中A班的第i个人 i 1 2 5 事件Cj为 乙是现有样本中C班的第j个人 j 1 2 8 考向一 考向二 考向三 设事件E为 该周甲的锻炼时间比乙的锻炼时间长 由题意知 E A1C1 A1C2 A2C1 A2C2 A2C3 A3C1 A3C2 A3C3 A4C1 A4C2 A4C3 A5C1 A5C2 A5C3 A5C4 因此P E P A1C1 P A1C2 P A2C1 P A2C2 P A2C3 P A3C1 P A3C2 P A3C3 P A4C1 P A4C2 P A4C3 P A5C1 P A5C2 P A5C3 P A5C4 3 1 0
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!