2019届高考数学二轮复习专题四概率与统计1.4.1统计统计案例课件文.ppt

上传人:xt****7 文档编号:5682523 上传时间:2020-02-05 格式:PPT 页数:94 大小:1.04MB
返回 下载 相关 举报
2019届高考数学二轮复习专题四概率与统计1.4.1统计统计案例课件文.ppt_第1页
第1页 / 共94页
2019届高考数学二轮复习专题四概率与统计1.4.1统计统计案例课件文.ppt_第2页
第2页 / 共94页
2019届高考数学二轮复习专题四概率与统计1.4.1统计统计案例课件文.ppt_第3页
第3页 / 共94页
点击查看更多>>
资源描述
第一讲统计 统计案例 热点题型1随机抽样 感悟经典 典例 1 某企业在甲 乙 丙 丁四个城市分别有150个 120个 190个 140个销售点 为了调查产品的质量 需从这600个销售点中抽取一个容量为100的样本 记这项调查为 在丙城市有20个特大型销售点 要从 中抽取8个调查 记这项调查为 则完成 这两项调查宜采用的抽样方法依次为 A 分层抽样法 系统抽样法B 分层抽样法 简单随机抽样法C 系统抽样法 分层抽样法D 简单随机抽样法 分层抽样法 2 为了调研雄安新区的空气质量状况 某课题组对雄县 容城 安新3县空气质量进行调查 按地域特点在三县内设置空气质量观测点 已知三县内观测点的个数分别为6 y z 依次构成等差数列 且6 y z 6成等比数列 若用分层抽样的方法抽取12个观测点的数据 则容城应抽取的数据个数为 A 8B 6C 4D 2 联想解题 1 看到调查 需从600个样本中抽取 想到用分层抽样 看到调查 样本容量较小 想到用简单随机抽样 2 利用三县内观测点的个数分别为6 y z 依次构成等差数列 且6 y z 6成等比数列 求出y z 根据分层抽样的定义建立比例关系即可 规范解答 1 选B 四个城市销售点数量不同 个体存在差异比较明显 选用分层抽样 丙城市特大销售点数量不多 使用简单随机抽样即可 故选B 2 选C 因为三县内观测点的个数分别为6 y z 依次构成等差数列 且6 y z 6成等比数列 所以所以y 12 z 18 若用分层抽样抽取12个观测点 则容城应该抽取的数据个数为 12 4 规律方法 1 简单随机抽样需满足的条件 1 被抽取的样本总体的个体数有限 2 逐个抽取 3 是不放回抽取 4 是等可能抽取 2 系统抽样的求解思路系统抽样又称 等距抽样 所以依次抽取的样本对应的号码就组成一个等差数列 首项就是第1组所抽取的样本号码 公差为间隔数 根据等差数列的通项公式就可以确定每一组所要抽取的样本号码 但有时也不是按一定间隔抽取的 3 分层抽样的关注点为了保证每个个体被抽到的可能性是相同的 这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比 对点训练 1 我校三个年级共有24个班 学校为了了解同学们的心理状况 将每个班编号 依次为1到24 现用系统抽样方法 抽取4个班进行调查 若抽到编号之和为48 则抽到的最小编号为 A 2B 3C 4D 5 解析 选B 系统抽样的抽取间隔为 6 设抽到的最小编号x 则x 6 x 12 x 18 x 48 所以x 3 2 福利彩票 双色球 中红球的号码可以01 02 03 32 33这33个二位号码中选取 小明利用如图所示的随机数表选取红色球的6个号码 选取方法是从第1行第9列和第10列的数字开始从左到右依次选取两个数字 则第四个被选中的红色球号码为 A 12B 33C 06D 16 解析 选C 第1行第9列和第10列的数字为63 从左到右依次选取两个数字 依次为17 12 33 06 则第四个被选中的红色球号码为06 提分备选 1 某工厂生产A B C三种不同型号的产品 其数量之比依次是3 4 7 现在用分层抽样的方法抽出样本容量为n的样本 样本中A型号产品有15件 那么n等于 A 50B 60C 70D 80 解析 选C 根据分层抽样的定义和方法 可得 解得n 70 2 采用系统抽样方法从1000人中抽取50人做问卷调查 为此将他们随机编号为1 2 1000 适当分组后在第一组采用简单随机抽样的方法抽到的号码为8 抽到的50人中 编号落入区间 1 400 的人做问卷A 编号落入区间 401 750 的人做问卷B 其余的人做问卷C 则抽到的人中 做问卷C的人数为 A 12B 13C 14D 15 解析 选A 由1000 50 20 故由题意可得抽到的号码构成以8为首项 以20为公差的等差数列 且此等差数列的通项公式为an 8 n 1 20 20n 12 由751 20n 12 1000 解得38 2 n 50 6 再由n为正整数可得39 n 50 且n Z 故做问卷C的人数为12 热点题型2用样本估计总体 感悟经典 典例 1 某城市公交公司为了更精准地服务于民 统计了某线路的10个车站上车的人数如下 70 60 60 60 50 40 40 30 30 10 则这组数据的众数 中位数 平均数的和为 A 170B 165C 160D 150 2 2018 广东六校三模 随着社会的发展 终身学习成为必要 工人知识要更新 学习培训必不可少 现某工厂有工人1000名 其中250名工人参加过短期培训 称为A类工人 另外750名工人参加过长期培训 称为B类工人 从该工厂的工人中共抽查了100名工人 调查他们 的生产能力 此处生产能力指一天加工的零件数 得到A类工人生产能力的茎叶图 左图 B类工人生产能力的频率分布直方图 右图 1 问A类 B类工人各抽查了多少工人 并求出直方图中的x 2 求A类工人生产能力的中位数 并估计B类工人生产能力的平均数 同一组中的数据用该组区间的中点值作代表 联想解题 1 看到求众数 中位数 平均数 想到按照定义去求解 2 看到茎叶图 频率分布直方图 想到茎叶图的特点和由频率分布直方图求平均数的方法 规范解答 1 选D 这10个数的众数为60 中位数为 45 平均数为所以这组数据的众数 中位数 平均数的和为60 45 45 150 2 1 由茎叶图知A类工人中抽查人数为25名 所以B类工人中应抽查100 25 75 名 由频率分布直方图得 0 008 0 02 0 048 x 10 1 得x 0 024 2 由茎叶图知A类工人生产能力的中位数为122 由 1 及频率分布直方图 估计B类工人生产能力的平均数为 115 0 008 10 125 0 020 10 135 0 048 10 145 0 024 10 133 8 规律方法 1 众数 中位数 平均数与直方图的关系 1 众数为频率分布直方图中最高矩形的底边中点的横坐标 2 中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标 3 平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之积的和 2 方差的计算与含义计算方差首先要计算平均数 然后再按照方差的计算公式进行计算 方差和标准差是描述一个样本和总体的波动大小的特征数 标准差大说明波动大 对点训练 1 2018 黔东南州二模 甲乙两名同学6次考试的成绩统计如图 甲乙两组数据的平均数分别为标准差分别为 甲 乙则 A 乙C 甲 甲 乙 解析 选C 由图可知 甲同学除第二次考试成绩略低于乙同学 其他次考试都远高于乙同学 可知 图中数据显示甲同学的成绩比乙同学稳定 故 甲 乙 2 2018 泸州二模 如图是2017年第一季度五省GDP情况图 则下列陈述中不正确的是 A 2017年第一季度GDP总量和增速由高到低排位均居同一位的省只有1个B 与去年同期相比 2017年第一季度五个省的GDP总量均实现了增长C 去年同期河南省的GDP总量不超过4000亿元D 2017年第一季度GDP增速由高到低排位第5的是浙江省 解析 选A 因为由图中数据可知2017年第一季度GDP总量和增速由高到低排位均居同一位的省 江苏都是第一位 河南都是第4位 所以A不正确 与去年同期相比 2017年第一季度五个省的GDP总量均实现了增长 去年同期河南省的GDP总量不超过4000亿元 2017年第一季度GDP增速由高到低排位第5的是浙江省 所以B C D都是正确的 提分备选 1 某赛季 甲 乙两名篮球运动员都参加了11场比赛 他们每场比赛得分的情况用如图所示的茎叶图表示 则甲 乙两名运动员的中位数分别为 A 19 13B 13 19C 20 18D 18 20 解析 选A 由茎叶图知甲的分数是6 8 9 15 17 19 23 24 26 32 41 共有11个数据 中位数是最中间一个19 乙的数据是5 7 8 11 11 13 20 22 30 31 40 共有11个数据 中位数是最中间一个13 2 某次知识竞赛中 四个参赛小队的初始积分都是100分 在答题过程中 各小组每答对1题都可以使自己小队的积分增加5分 若答题过程中四个小队答对的题数分别是4道 7道 7道 2道 则四个小组积分的方差为 A 50B 75 5C 112 5D 225 解析 选C 由已知得四个小组积分分别为 120 135 135 110 所以四个小组积分的平均值为 120 135 135 110 125 所以四个小组积分的方差为 s2 120 125 2 135 125 2 135 125 2 110 125 2 112 5 热点题型3线性回归分析与独立性检验 感悟经典 典例 1 2018 厦门二模 为了解学生的课外阅读时间情况 某学校随机抽取了50人进行统计分析 把这50人每天阅读的时间 单位 分钟 绘制成频数分布表 如下表所示 若把每天阅读时间在60分钟以上 含60分钟 的同学称为 阅读达人 根据统计结果中男女生阅读达人的数据 制作出如图所示的等高条形图 1 根据抽样结果估计该校学生的每天平均阅读时间 同一组数据用该区间的中点值作为代表 2 根据已知条件完成下面的2 2列联表 并判断是否有99 的把握认为 阅读达人 跟性别有关 附 参考公式K2 其中n a b c d 临界值表 2 2018 湖北八校二诊 近年来 某地区积极践行 绿水青山就是金山银山 的绿色发展理念 2012年年初至2018年年初 该地区绿化面积y 单位 平方公里 的数据如下表 1 求y关于t的线性回归方程 2 利用 1 中的回归方程 预测该地区2022年年初的绿化面积 并计算2017年年初至2022年年初 该地区绿化面积的年平均增长率约为多少 附 回归直线的斜率与截距的最小二乘法估计公式分别为lg3 0 477 lg2 0 301 100 0352 1 084 联想解题 1 看到2 2列联表 想到独立性检验的计算公式 及判断是否有关 2 看到线性回归 想到代入回归系数公式求回归直线方程 规范解答 1 1 该校学生的每天平均阅读时间为 1 6 6 12 15 4 12 6 4 4 52 分钟 2 由频数分布表得 阅读达人 的人数是11 7 2 20人 根据等高条形图得2 2列联表 K2的观测值k 4 327 由于4 327 6 635 故没有99 的把握认为 阅读达人 跟性别有关 2 1 4 4 3 0 5 2 3 线性回归方程为 0 5t 2 3 2 将2022年年号11代入 预测绿化面积为7 8平方公里 设年平均增长率为x 则 1 x 5 5lg 1 x lg x 1 0 084 所以年平均增长率约为8 4 规律方法 1 对两个变量的相关关系的判断有两个方法一是根据散点图 具有很强的直观性 直接得出两个变量是正相关或负相关 二是计算相关系数法 这种方法能比较准确地反映相关程度 2 回归直线方程 x 必过样本点中心 3 利用独立性检验 进行合理推断和预测的关注点独立性检验就是考查两个分类变量是否有关系 并能较为准确地给出这种判断的可信度 K2 或 2 值越大 说明 两个变量有关系 的可能性越大 对点训练 1 2018 芜湖一模 某城市随机抽取一年 365天 内100天的空气质量指数API的监测数据 结果统计如下 记某企业每天由空气污染造成的经济损失S 单位 元 空气质量指数API为x 当0 x 100时 企业没有造成经济损失 当100300时造成的经济损失为2000元 1 试写出S x 的表达式 2 在本年内随机抽取一天 试估计该天经济损失超过350元的概率 3 若本次抽取的样本数据有30天是在供暖季 其中有12天为重度污染 完成下面2 2列联表 并判断能否有99 的把握或在犯错误的概率不超过0 01的前提下认为该市本年空气重度污染与供暖有关 解析 1 S x 2 设 在本年内随机抽取一天 该天经济损失S超过350元 为事件A 由 1 知 x 200 频数为38 则P A 0 38 3 根据以上数据得到如下2 2列联表 则计算可得K2的观测值 所以有99 的把握或在犯错误的概率不超过0 01的前提下认为该市本年空气重度污染与供暖有关 2 某厂生产不同规格的一种产品 根据检测标准 其合格产品的质量y g 与尺寸x mm 之间近似满足关系式y c xb b c为大于0的常数 按照某项指标测定 当产品质量与尺寸的比在区间内时为优等品 现随机抽取6件合格产品 测得数据如下 根据测得数据作了初步处理 得相关统计量的值如下表 1 根据所给统计量 求y关于x的回归方程 2 已知优等品的收益z 单位 千元 与x y的关系为z 2y 0 32x 则当优等品的尺寸x为何值时 收益z的预报值最大 精确到0 1 附 对于样本 vi ui i 1 2 n 其回归直线u b v a的斜率和截距的最小二乘估计公式分别为 解析 1 由题意得y c xb lny ln c xb lnc lnxb 所以lny blnx lnc 所以ln 3 05 ln 4 1 所以ln ln ln 3 05 0 5 4 1 1 lny lnx 1 y e 所以y关于x的回归方程为y e 2 由 1 得 令当时取最大 所以x 72 3mm时 收益预报值最大 提分备选 为了解某地区某种农产品的年产量x 单位 吨 对价格y 单位 千元 吨 和利润z的影响 对近五年该农产品的年产量和价格统计如表 1 求y关于x的线性回归方程 x 2 若每吨该农产品的成本为2千元 假设该农产品可全部卖出 预测当年产量为多少时 年利润z取到最大值 保留两位小数 参考公式 解析 所以所以y关于x的线性回归方程为 2 z x 8 69 1 23x 2x 1 23x2 6 69x 所以x 2 72时 年利润z最大 数据分析 用样本估计总体问题中的数学素养 相关链接 用样本估计总体问题中需要对所给样本信息进行整理分析 然后转化到对总体数据的整体把握 这就需要我们有着迅速处理信息的能力以及转化与化归的思想 典例 某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段 下表为10名学生的预赛成绩 其中有三个数据模糊 在这10名学生中 进入立定跳远决赛的有8人 同时进入立定跳远决赛和30秒跳绳决赛的有6人 则 A 2号学生进入30秒跳绳决赛B 5号学生进入30秒跳绳决赛C 8号选手进入30秒跳绳决赛D 9号选手进入30秒跳绳决赛 规范解答 选B 进入立定跳远决赛的学生是1到8号 由同时进入两项决赛的有6人可知 1号到8号恰有6人进入30秒跳绳决赛 在1号到8号的30秒跳绳决赛成绩中 3 6 7号学生的成绩高于1 4 5号学生 1号和5号成绩相同 所以1 3 5 6 7号学生必进入30秒跳绳决赛 通关题组 2018 茂名一模 已知药用昆虫的产卵数y与一定范围内的温度x有关 现收集了该种药用昆虫的6组观测数据如下表 经计算得 线性回归模型的残差平方和其中xi yi分别为观测数据中的温度和产卵数 i 1 2 3 4 5 6 1 若用线性回归模型 求y关于x的回归方程 x 精确到0 1 2 若用非线性回归模型求得y关于x的回归方程为且相关指数R2 0 9522 试与 1 中的回归模型相比 用R2说明哪种模型的拟合效果更好 用拟合效果好的模型预测温度为35 时该种药用昆虫的产卵数 结果取整数 附 一组数据 x1 y1 x2 y2 xn yn 其回归直线的斜率和截距的最小二乘估计为相关指数 解析 1 依题意 n 6 所以y关于x的线性回归方程为 2 利用所给数据 得 线性回归方程的相关指数 因为0 9398 0 9522 因此 回归方程比线性回归方程拟合效果更好 由 得温度x 35 时 又因为e8 0605 3167 所以所以当温度x 35 时 该种药用昆虫的产卵数估计为190个
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!