全国通用版2019版高考数学一轮复习第十八单元统计与统计案例学案理.doc

上传人:tian****1990 文档编号:5426816 上传时间:2020-01-29 格式:DOC 页数:55 大小:1.42MB
返回 下载 相关 举报
全国通用版2019版高考数学一轮复习第十八单元统计与统计案例学案理.doc_第1页
第1页 / 共55页
全国通用版2019版高考数学一轮复习第十八单元统计与统计案例学案理.doc_第2页
第2页 / 共55页
全国通用版2019版高考数学一轮复习第十八单元统计与统计案例学案理.doc_第3页
第3页 / 共55页
点击查看更多>>
资源描述
全国通用版2019版高考数学一轮复习第十八单元统计与统计案例学案理三种抽样方法类别共同点各自特点相互联系适用范围简单随机抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等从总体中逐个抽取总体中的个数较少系统抽样将总体均分成几部分,按事先确定的规则,在各部分抽取在起始部分抽样时,采用简单随机抽样总体中的个数比较多分层抽样将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或系统抽样总体由差异明显的几部分组成频率分布直方图和茎叶图(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图2频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线3茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便1在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的,且样本容量为80,则中间一组的频数为()A0.25 B0.5C20 D16解析:选D设中间一组的频数为x,依题意有,解得x16.2.某学生在8次测试中,数学成绩的茎叶图如图,则这8次成绩的中位数是()A86 B87C87.5 D88.5解析:选A由茎叶图得到8个数的大小顺序依次是78,79,83,85,87,88,89,96,中间的两个数为85,87,所以中位数为86. 清易错1易把直方图与条形图混淆两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的2易忽视频率分布直方图中纵轴表示的应为.3在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义1某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:50,60),60,70),70,80),80,90),90,100,则图中a的值为()A0.006 B0.005C0.004 5 D0.002 5解析:选B由题意知,a0.005,故选B.2.(xx郑州检测)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值_.解析:由茎叶图可知甲的数据为27,30m,39,乙的数据为20n,32,34,38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m3.由此可以得出甲的平均数为33,所以乙的平均数也是33,所以33,解得n8,所以.答案:样本的数字特征过双基1众数、中位数、平均数数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,xn,那么这n个数的平均数平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s表示,s .(2)方差:标准差的平方s2s2(x1)2(x2)2(xn)2,其中xi(i1,2,3,n)是样本数据,n是样本容量,是样本平均数1对于一组数据xi(i1,2,3,n),如果将它们改变为xiC(i1,2,3,n),其中C0,则下列结论正确的是()A平均数与方差均不变B平均数变,方差保持不变C平均数不变,方差变 D平均数与方差均发生变化解析:选B依题意,记原数据的平均数为,方差为s2,则新数据的平均数为C,即新数据的平均数改变;新数据的方差为(x1C)(C)2(x2C)(C)2(xnC)(C)2s2,即新数据的方差不变2样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其方差为()A. B.C. D2解析:选D依题意得m51(0123)1,样本方差s2(1202122222)2,即所求的样本方差为2.310名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则a,b,c的大小关系为()AabcBbcaCcab Dcba解析:选D依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此aba.4某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生1号2号3号4号5号甲班67787乙班67679若以上两组数据的方差中较小的一个为s2,则s2_.解析:由数据表可得乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s2(10010).答案:变量间的相关关系、统计案例过双基1变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关2两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线(2)回归方程为x,其中, .(3)通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法(4)相关系数:当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系通常|r|大于0.75时,认为两个变量有很强的线性相关性3独立性检验假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:y1y2总计x1ababx2cdcd总计acbdabcdK2(其中nabcd为样本容量)1如图是根据x,y的观测数据(xi,yi)(i1,2,10)得到的散点图,可以判断变量x,y具有线性相关关系的图是()A BC D解析:选D若变量x,y具有线性相关关系,那么散点就在某条直线附近,从左上到右下,或从左下到右上,故选D.2已知变量x,y取值如表所示:x01456y1.3m3m5.67.4画散点图分析可知:y与x线性相关,且求得回归方程为x1,则m的值(精确到0.1)为()A1.5 B1.6C1.7 D1.8解析:选C由题意知,3.2代入回归方程x1可得4.2,则4m4.25(1.35.67.4)6.7,解得m1.675,则精确到0.1后m的值为1.7.3为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下22列联表:理科文科男1310女720已知P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到K2的观测值k4.844.则认为选修文科与性别有关系出错的可能性为_解析:K2的观测值k4.844,这表明小概率事件发生根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案:5%清易错1易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系2回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(,)点,可能所有的样本数据点都不在直线上设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:选D由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确又线性回归方程必过样本中心点(,),因此B正确由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确当某女生的身高为170 cm时,其体重估计值是58.79kg,而不是具体值,因此D不正确.一、选择题1(xx邯郸摸底)某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查已知高二被抽取的人数为13,则n()A660B720C780 D800解析:选B由已知条件,抽样比为,从而,解得n720.2已知变量x与y正相关,且由观测数据算得样本平均数3,3.5,则由该观测数据算得的线性回归方程可能为()A.0.4x2.3 B.2x2.4C.2x9.5 D.0.3x4.4解析:选A依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A、B,知A正确3从编号为001,002,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为()A480 B481C482 D483解析:选C根据系统抽样的定义可知样本的编号成等差数列,令a17,a232,则d25,所以725(n1)500,所以n20,最大编号为72519482.4根据如下样本数据:x234567y4.12.50.50.52.03.0得到的回归方程为x,则()A.0,0 B.0,0C.0 D. 0,6.635,有99%以上的把握认为“生育意愿与城市级别有关”8从甲、乙两个城市分别随机抽取14台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图),设甲、乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则()A.甲m乙 B.甲乙,m甲乙,m甲m乙 D. 甲乙,m甲m乙解析:选A由题意得甲24.3,乙24.4,即甲m乙,故选A.二、填空题9某中学采用系统抽样方法,从该校高一年级全体800名学生中抽50名学生做牙齿健康检查现将800名学生从1到800进行编号已知从3348这16个数中取的数是39,则在第1小组116中随机抽到的数是_解析:间隔数k16,即每16人抽取一个人由于392167,所以第1小组中抽取的数为7.答案:710某车间需要确定加工零件的加工时间,进行了若干次试验根据收集到的数据(如表): 零件数x/个1020304050加工时间y/分钟6268758189由最小二乘法求得回归直线方程0.67x,则的值为_解析:(1020304050)30, (6268758189)75, 回归直线方程0.67x过样本中心点(,),750.673054.9. 答案:54.911已知甲、乙、丙三类产品共有1 200件,且甲、乙、丙三类产品的数量之比为345,现采用分层抽样的方法抽取60件进行质量检测,则乙类产品抽取的件数为_解析:由题意可知,乙类产品抽取的件数为6020.答案:2012某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得K23.918,经查临界值表知P(K23.841)0.05.则下列结论中,正确结论的序号是_有95%的把握认为“这种血清能起到预防感冒的作用”;若某人未使用该血清,那么他在一年中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为5%.解析:K23.9183.841,而P(K23.814)0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆答案:三、解答题13某地区xx年至xx年农村居民家庭人均纯收入y(单位:千元)的数据如表: 年份xxxxxxxxxxxxxx年份代号x1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于x的线性回归方程; (2)利用(1)中的回归方程,分析xx年至xx年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2019年农村居民家庭人均纯收入. 附:回归直线的斜率和截距的最小二乘法估计公式分别为:,(其中,为样本平均值). 解:(1)由题意,得(1234567)4,(2.93.33.64.44.85.25.9)4.3,(xi)(yi)(3)(1.4)(2)(1)(1)(0.7)010.520.931.614,(xi)2(3)2(2)2(1)20212223228,所以0.5,4.30.542.3, 所以y关于x的线性回归方程为0.5x2.3.(2)因为0.50,所以xx年至xx年该地区农村居民家庭人均纯收入逐年增加, 平均每年增加0.5千元, 因为2019的年份代号是x9,所以代入(1)中的回归方程,可得0.592.36.8, 所以预测该地区2019年农村居民家庭人均纯收入为68千元14(xx唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m名学生进行体育测试根据体育测试得到了这m名学生的各项平均成绩(满足100分),按照以下区间分为七组:30,40),40,50),50,60),60,70),70,80),80,90),90,100,并得到频率分布直方图(如图)已知测试平均成绩在区间30,60)内有20人(1)求m的值及中位数n;(2)若该校学生测试平均成绩小于n,则学校应适当增加体育活动时间根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06,则m(0.020.020.06)20,解得m200.由直方图可知,中位数n位于70,80)内,则0.020.020.060.220.04(n70)0.5,解得n74.5.(2)设第i(i1,2,3,4,5,6,7)组的频率和频数分别为pi和xi,由图知,p10.02,p20.02,p30.06,p40.22,p50.40,p60.18,p70.10,则由xi200pi,可得x14,x24,x312,x444,x580,x636,x720,故该校学生测试平均成绩是(35x145x255x365x475x585x695x7)7474.5,所以学校应该适当增加体育活动时间高考研究课(一)随机抽样全国卷5年命题分析考点考查频度考查角度系统抽样未考查分层抽样5年1考抽样方法的选择系统抽样典例将参加夏令营的600名学生编号为:001,002,600.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A营区,从301到495在B营区,从496到600在C营区,则三个营区被抽中的人数依次为()A26,16,8B25,17,8C25,16,9 D24,17,9解析依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(kN*)组抽中的号码是312(k1)令312(k1)300,得k,因此A营区被抽中的人数是25;令300312(k1)495,得s.由此可以说明,甲、乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀方法技巧(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征 即时演练1设样本数据x1,x2,x20的均值和方差分别为1和8,若y2x3,则y1,y2,y20的均值和方差分别是()A5,32B5,19C1,32 D4,35解析:选Ayi2xi3,232135,方差s222832.2为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h)试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:061.22.71.52.81.82.22.33.23.5252.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:321.71.90.80.92.41.22.61.31.4160.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得(0.61.21.21.51.51.82.22.32.32.42.52.62.72.72.82.93.03.13.23
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!