全国通用版2019高考数学二轮复习专题三概率与统计第3讲统计与统计案例学案理.doc

上传人:tian****1990 文档编号:3399637 上传时间:2019-12-13 格式:DOC 页数:21 大小:722KB
返回 下载 相关 举报
全国通用版2019高考数学二轮复习专题三概率与统计第3讲统计与统计案例学案理.doc_第1页
第1页 / 共21页
全国通用版2019高考数学二轮复习专题三概率与统计第3讲统计与统计案例学案理.doc_第2页
第2页 / 共21页
全国通用版2019高考数学二轮复习专题三概率与统计第3讲统计与统计案例学案理.doc_第3页
第3页 / 共21页
点击查看更多>>
资源描述
第3讲统计与统计案例考情考向分析1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.2.在概率与统计的交汇处命题,以解答题中档难度出现热点一抽样方法1简单随机抽样特点是从总体中逐个抽取适用范围:总体中的个体数较少2系统抽样特点是将总体平均分成几部分,按事先确定的规则在各部分中抽取适用范围:总体中的个体数较多3分层抽样特点是将总体分成几层,分层进行抽取适用范围:总体由差异明显的几部分组成例1(1)某学校在高一新生入学后为了解学生的体质情况,决定从该校的1 000名高一新生中采用系统抽样的方法抽取50名学生进行体质分析,已知样本中第一个号为007号,则抽取的第10个学生的编号为()A107 B097 C207 D187答案D解析根据题意组距为20,则抽取学生的编号组成以7为首项,20为公差的等差数列,其通项公式为an720(n1),a10720187.(2)已知某高级中学高一、高二、高三学生人数分别为880,860,820,现用分层抽样的方法从该校抽调128人,则在高二年级中抽调的人数为_答案43解析由题意可知,在高二年级中抽调的人数为12843.思维升华(1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例跟踪演练1(1)(2018福州检测)为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样 B按性别分层抽样C按年龄段分层抽样 D系统抽样答案C解析我们常用的抽样方法有:简单随机抽样、分层抽样和系统抽样,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大了解某地区的“微信健步走”活动情况,按年龄段分层抽样,这种方式具有代表性,比较合理(2)(2018永州模拟)现从已编号(150)的50位同学中随机抽取5位了解他们的数学学习状况,用每部分选取的号码间隔一样的系统抽样方法所选取的5位同学的编号可能是()A5,10,15,20,25B3,13,23,33,43C1,2,3,4,5D2,10,18,26,34答案B解析由系统抽样方法的概念可知,抽取5位,必须每层都有,则每10个里面有1个,所以符合要求的编号可能是3,13,23,33,43.热点二用样本估计总体1频率分布直方图中横坐标表示组距,纵坐标表示,频率组距.2频率分布直方图中各小长方形的面积之和为1.3利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即众数(2)中位数左边和右边的小长方形的面积和相等(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和例2(1)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为()A11 B3 C9 D17答案C解析设没记清的数为x,若x2,则这列数为x,2,2,2,4,5,10,平均数为,中位数为2,众数为2,所以222,得x11;若2x乙,乙比甲成绩稳定,应选乙参加比赛Bx甲x乙,甲比乙成绩稳定,应选甲参加比赛Cx甲x乙,甲比乙成绩稳定,应选甲参加比赛Dx甲x乙,乙比甲成绩稳定,应选乙参加比赛答案D解析由茎叶图可知,甲的平均数是x甲82,乙的平均数是x乙87,所以乙的平均数大于甲的平均数,即x甲6.635,因此在犯错误的概率不超过0.01的前提下,可以认为数学优秀与物理优秀有关思维升华(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(,),应引起关注(2)独立性检验问题,要确定22列联表中的对应数据,然后代入公式求解K2即可跟踪演练3(2018河南省中原名校质检)下表为2014年至2017年某百货零售企业的线下销售额(单位:万元),其中年份代码x年份2013.年份代码x1234线下销售额y95165230310(1)已知y与x具有线性相关关系,求y关于x的线性回归方程,并预测2019年该百货零售企业的线下销售额;(2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调査平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了55位男顾客、50位女顾客(每位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有10人、女顾客有20人,能否在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?参考公式及数据:,K2,nabcd.P(K2k0)0.150.100.050.0250.0100.005k02.0722.7063.8415.0246.6357.879解(1)由题意得2.5,200,x30,xiyi2 355,所以71,所以200712.522.5,所以y关于x的线性回归方程为71x22.5.由于2 0192 0136,所以当x6时,71622.5448.5,所以预测2019年该百货零售企业的线下销售额为448.5万元(2)由题意可得22列联表如下:持乐观态度持不乐观态度总计男顾客104555女顾客203050总计3075105故K2的观测值k6.109,由于6.1095.024,所以可以在犯错误的概率不超过0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关真题体验1(2017山东改编)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为_答案3,5解析甲组数据的中位数为65,由甲、乙两组数据的中位数相等得y5.又甲、乙两组数据的平均值相等,(5665627470x)(5961676578),x3.2(2017山东改编)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其线性回归方程为x.已知xi225,yi1 600,4.该班某学生的脚长为24,据此估计其身高为_答案166解析xi225,xi22.5.yi1 600,yi160.又 4, 160422.570.线性回归方程为 4x70.将x24代入上式,得 42470166.3(2016全国改编)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中A点表示十月的平均最高气温约为15 ,B点表示四月的平均最低气温约为5 .下列叙述不正确的是_(填序号)各月的平均最低气温都在0 以上;七月的平均温差比一月的平均温差大;三月和十一月的平均最高气温基本相同;平均最高气温高于20 的月份有5个答案解析由题意知,平均最高气温高于20 的有七月,八月,故不正确4(2017江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取_件答案18解析,应从丙种型号的产品中抽取30018(件)押题预测1某公司为了解用户对其产品的满意度,从甲、乙两地分别随机调查了10个用户,将满意度的分数绘成茎叶图,如图所示设甲、乙两地的满意度分数的平均数分别为甲,乙,中位数分别为m甲,m乙,则()A.甲m乙 B.甲乙,m甲m乙C.甲乙,m甲m乙 D.甲乙,m甲乙中位数分别为m甲75,m乙73,所以m甲m乙2某校为了解高三学生寒假期间的学习情况,抽查了100名学生,统计他们每天的平均学习时间,绘制成频率分布直方图,如图所示,则这100名学生中学习时间在6至10小时之间的人数为_押题依据频率分布直方图多以现实生活中的实际问题为背景,对图形的理解应用可以考查学生的基本分析能力,是高考的热点答案58解析由题图知,(0.040.12x0.140.05)21,解得x0.15,所以学习时间在6至10小时之间的频率是(0.150.14)20.58,所求人数为1000.5858.3某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程x,并在坐标系中画出回归直线;(3)试预测加工10个零件大约需要多少小时?(注:, )押题依据线性回归分析在生活中具有很强的应用价值,是高考的一个重要考点解(1)散点图如图(2)由表中数据得iyi52.5,3.5,3.5,54, 0.7,3.50.73.51.05,0.7x1.05,回归直线如图所示(3)将x10代入线性回归方程,得0.7101.058.05,故预测加工10个零件大约需要8.05小时A组专题通关1(2018云南省曲靖市第一中学质量监测)我校高三8个学生参加数学竞赛的得分用茎叶图表示,其中茎为十位数,叶为个位数,则这组数据的平均数和方差分别是()A91,9.5 B91,9 C92,8.5 D92,8答案A解析由题意,根据茎叶图,可得平均数(28069085154203)91,方差s2(8891)2(8591)2(9391)2769.5.2(2018衡水金卷信息卷)A地的天气预报显示,A地在今后的三天中,每一天有强浓雾的概率为30%,现用随机模拟的方法估计这三天中至少有两天有强浓雾的概率:先利用计算器产生09之间整数值的随机数,并用0,1,2,3,4,5,6表示没有强浓雾,用7,8,9表示有强浓雾,再以每3个随机数作为一组,代表三天的天气情况,产生了如下20组随机数:402978191925273842812479569683231357394027506588730113537779则这三天中至少有两天有强浓雾的概率近似值为()A. B. C. D.答案D解析由随机数表可知,满足题意的数据为978,479,588,779,据此可知,这三天中至少有两天有强浓雾的概率近似为P.3(2018黄山模拟)在吸烟与患肺癌这两个分类变量的独立性检验的计算中,下列说法正确的是()A若K2的观测值k6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺癌B由独立性检验可知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺癌C若从随机变量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误D以上三种说法都不正确答案C解析独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释结合所给选项可得若从随机变量中求出在犯错误的概率不超过0.01的前提下认为吸烟与患肺癌有关系,是指有1%的可能性使得判断出现错误4(2018昆明质检)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标“搜索指数”越大,表示网民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高下图是2017年9月到2018年2月这半年中,某个关键词的搜索指数变化的走势图根据该走势图,下列结论正确的是()A这半年中,网民对该关键词相关的信息关注度呈周期性变化B这半年中,网民对该关键词相关的信息关注度不断减弱C从网民对该关键词的搜索指数来看,去年10月份的方差小于11月份的方差D从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值答案D解析根据走势图可知,这半年中,网民对该关键词相关的信息关注度不呈周期性变化,A错;这半年中,网民对该关键词相关的信息关注度增减不确定,B错;从网民对该关键词的搜索指数来看,去年10月份的搜索指数的稳定性小于11 月份的搜索指数的稳定性,所以去年10月份的方差大于11 月份的方差,C错;从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值,D正确5(2018广州海珠区综合测试)下列说法中正确的是()相关系数r用来衡量两个变量之间线性关系的强弱,|r|越接近于1,相关性越弱;回归直线x一定经过样本点的中心(,);随机误差e满足E(e)0,其方差D(e)的大小用来衡量预报的精度;相关指数R2用来刻画回归的效果,R2越小,说明模型的拟合效果越好A B C D答案D解析线性相关系数r是衡量两个变量之间线性关系强弱的量,|r|越接近于1,这两个变量线性相关关系越强,|r|越接近于0,线性相关关系越弱,错误;回归直线x一定通过样本点的中心,正确;随机误差e是衡量预报精确度的一个量,它满足E(e)0,正确;相关指数R2用来刻画回归的效果,R2越大,说明模型的拟合效果越好,不正确,故选D.6(2018上海黄浦区模拟)已知某市A社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是_答案140解析根据题意可得抽样比为,则这次抽样调查抽取的人数是(450750900)2 100140.7(2018河北衡水中学模拟)用系统抽样法(按等距离的规则)从160部智能手机中抽取容量为20的样本,现将这160部智能手机随机地从001160编号,按编号顺序平均分成20组:001008号,009016号,017024号,153160号,若第9组与第10组抽出的号码之和为140,则第1组中抽取的号码是_答案002解析由系统抽样法知,抽取的容量为20的样本的编号可视为公差为8的等差数列,设首项为a1,又a9a10140,2a1178140,a12,第1组中抽取的号码是002.8某班40名学生参加普法知识竞赛,成绩都在区间40,100内,其频率分布直方图如图所示,则成绩不低于60分的人数为_答案30解析由题意可得40(0.0150.0300.0250.005)1030,则成绩不低于60分的人数为30.9某设备的使用年数x与所支出的维修总费用y的统计数据如下表:使用年数x (单位:年)23456维修总费用y (单位:万元)1.54.55.56.57.5根据上表可得线性回归方程为1.4x.若该设备维修总费用超过12万元就报废,据此模型预测该设备最多可使用_年答案8解析因为4,5.1,故代入线性回归方程可得5.11.440.5,所以线性回归方程为 1.4x0.5,当y12时,解得x8.9.10(2018全国)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表;超过m不超过m总计第一种生产方式第二种生产方式总计(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2,nabcd.P(K2k0)0.0500.0100.001k03.8416.63510.828解(1)第二种生产方式的效率更高理由如下:()由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80 min;用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高()由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min;用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高()由茎叶图可知,用第一种生产方式的工人完成生产任务平均所需时间高于80 min;用第二种生产方式的工人完成生产任务平均所需时间低于80 min.因此第二种生产方式的效率更高()由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少因此第二种生产方式的效率更高(2)由茎叶图知m80.列联表如下:超过m不超过m总计第一种生产方式15520第二种生产方式51520总计202040(3)因为K2106.635,所以有99%的把握认为两种生产方式的效率有差异B组能力提高11某公司有30名男职员和20名女职员,公司进行了一次全员参与的职业能力测试,现随机询问了该公司5名男职员和5名女职员在测试中的成绩(满分为30分),可知这5名男职员的测试成绩分别为16,24,18,22,20,5名女职员的测试成绩分别为18,23,23,18,23,则下列说法一定正确的是()A这种抽样方法是分层抽样B这种抽样方法是系统抽样C这5名男职员的测试成绩的方差大于这5名女职员的测试成绩的方差D该测试中公司男职员的测试成绩的平均数小于女职员的测试成绩的平均数答案C解析根据抽样方法的特点,可知这种抽样既不是分层抽样,也不是系统抽样,故A,B是错误的;由这5名男职员和5名女职员的测试成绩得不出该公司男职员和女职员的测试成绩的平均数,故D是错误的;根据公式,可以求得这5名男职员的测试成绩的方差为s8,5名女职员的测试成绩的方差为s6,所以C正确故选C.12某青少年成长关爱机构为了调查所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线l.根据图中数据,下列对该样本描述错误的是()A据样本数据估计,该地区青少年身高与年龄成正相关B所抽取数据中,5 000名青少年平均身高约为145 cmC直线l的斜率的值近似等于样本中青少年平均身高每年的增量D从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l上答案D解析在给定范围内,随着年龄增加,年龄越大身高越高,故该地区青少年身高与年龄成正相关,故A正确;用样本数据估计总体可得平均数大约是145 cm,故B正确;根据直线斜率的意义可知,斜率的值近似等于样本中青少年平均身高每年的增量,故C正确;各取一人具有随机性,根据数据作出的点只能在直线附近,不一定在直线上,故D错误13为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得线性回归方程为0.85x0.25.由以上信息,可得表中c的值为_.天数x34567繁殖数量y(千个)2.5344.5c答案6解析5,代入线性回归方程,得0.8550.25,解得c6.14(2018泉州质检)某工厂有两台不同机器A和B生产同一种产品各10万件,现从各自生产的产品中分别随机抽取20件,进行品质鉴定,鉴定成绩的茎叶图如下所示:该产品的质量评定标准规定:鉴定成绩达到90,100)的产品,质量等级为优秀;鉴定成绩达到 80,90)的产品,质量等级为良好;鉴定成绩达到60,80)的产品,质量等级为合格将这组数据的频率视为整批产品的概率(1)从等级为优秀的样本中随机抽取两件,记X为来自B机器生产的产品数量,写出X的分布列,并求X的期望;(2)完成下列22列联表,以产品等级是否达到良好以上(含良好)为判断依据,判断能不能在误差不超过0.05的情况下,认为B机器生产的产品比A机器生产的产品好;A机器生产的产品B机器生产的产品总计良好以上(含良好)合格总计(3)已知优秀等级产品的利润为12元/件,良好等级产品的利润为10元/件,合格等级产品的利润为5元/件,A机器每生产10万件的成本为20万元,B机器每生产10万件的成本为30万元该工厂决定:按样本数据测算,两种机器分别生产10万件产品,若收益之差达到5万元以上,则淘汰收益低的机器,若收益之差不超过5万元,则仍然保留原来的两台机器你认为该工厂会仍然保留原来的两台机器吗?附:(1)独立性检验计算公式:K2,nabcd.(2)临界值表:P(K2k0)0.250.150.100.050.025k01.3232.0722.7063.8415.024解(1)由茎叶图可知,样本中优秀的产品有2件来自A机器,3件来自B 机器,所以X的可能取值为0,1,2,P(X0)0.1,P(X1)0.6,P(X2)0.3.X的分布列为X012P0.10.60.3所以E(X)00.110.620.31.2.(2)由已知可得,22列联表为A机器生产的产品B机器生产的产品总计良好以上(含良好)61218合格14822总计202040K23.6365,所以该工厂不会仍然保留原来的两台机器,应该会卖掉A机器,同时购买一台B机器
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!