资源描述
2019-2020年高考数学一轮复习第十章统计与统计案例学案理本节主要包括2个知识点:1.随机抽样;2.用样本估计总体.突破点(一)随机抽样 1简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:抽签法和随机数法2系统抽样在抽样时,将总体分成均衡的几个部分,然后按照事先确定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样)3分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样4三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样均为不放回抽样,且抽样过程中每个个体被抽取的机会相等从总体中逐个抽取是后两种方法的基础总体中的个数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分中抽取在起始部分抽样时采用简单随机抽样元素个数很多且均衡的总体抽样分层抽样将总体分成几层,分层按比例进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成1判断题(1)简单随机抽样是一种不放回抽样()(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关()(3)系统抽样在起始部分抽样时采用简单随机抽样()(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平()(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关()答案:(1)(2)(3)(4)(5)2填空题(1)利用简单随机抽样从含有8个个体的总体中抽取一个容量为4的样本,则总体中每个个体被抽到的概率是_解析:总体个数为N8,样本容量为M4,则每一个个体被抽到的概率为P.答案:(2)老师在班级50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的学生进行作业检查,这种抽样方法是_解析:因为抽取学号是以5为公差的等差数列,故采用的抽样方法应是系统抽样答案:系统抽样(3)某公司共有1 000名员工,下设若干部门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为_解析:,x50.答案:50(4)某学校高一、高二、高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_名学生解析:设应从高二年级抽取x名学生,则.解得x15.答案:15简单随机抽样1抽签法的步骤第一步,将总体中的N个个体编号;第二步,将这N个号码写在形状、大小相同的号签上;第三步,将号签放在同一不透明的箱中,并搅拌均匀;第四步,从箱中每次抽取1个号签,连续抽取k次;第五步,将总体中与抽取的号签的编号一致的k个个体取出2随机数法的步骤第一步,将个体编号;第二步,在随机数表中任选一个数开始;第三步,从选定的数开始,按照一定抽样规则在随机数表中选取数字,取足满足要求的数字就得到样本的号码例1(1)总体由编号为01,02,19,20的20个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B07 C02D01(2)下列抽取样本的方式不属于简单随机抽样的有_从无限多个个体中抽取100个个体作为样本盒子里共有80个零件,从中选出5个零件进行质量检验在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里从20件玩具中一次性抽取3件进行质量检验某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛解析(1)由题意知前5个个体的编号为08,02,14,07,01.(2)不是简单随机抽样因为不满足总体的有限性不是简单随机抽样因为它是放回抽样不是简单随机抽样因为这是“一次性”抽取,而不是“逐个”抽取不是简单随机抽样因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样答案(1)D(2)系统抽样系统抽样的步骤例2(1)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A50B40C25D20(2)将高一(九)班参加社会实践编号为1,2,3,48的48名学生,采用系统抽样的方法抽取一个容量为4的样本,已知5号,29号,41号学生在样本中,则样本中还有一名学生的编号是_解析(1)由系统抽样的定义知,分段间隔为25.故选C.(2)根据系统抽样的概念,所抽取的4个样本的编号应成等差数列,因为在这组数中的间距为412912,所以所求的编号为51217.答案(1)C(2)17易错提醒用系统抽样法抽取样本,当不为整数时,取k,即先从总体中用简单随机抽样的方法剔除(Nnk)个个体,且剔除多余的个体不影响抽样的公平性分层抽样进行分层抽样的相关计算时,常利用以下关系式巧解:(1);(2)总体中某两层的个体数之比样本中这两层抽取的个体数之比例3(1)(xx南昌模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200 人、高三n人中,抽取81人进行问卷调查已知高二被抽取的人数为30,那么n()A860B720C1 020D1 040(2)(xx江苏高考)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取_件(3)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).篮球组书画组乐器组高一4530a高二151020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为_解析(1)根据分层抽样方法,得8130,解得n1 040.故选D.(2)本题考查分层抽样方法及用样本估计总体从丙种型号的产品中抽取的件数为6018.(3)由题意知,解得a30.答案(1)D(2)18(3)30方法技巧分层抽样的解题策略(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样(4)抽样比.1.某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法:1,2,3,100;001,002,100;00,01,02,99;01,02,03,100.其中正确的序号是()AB CD解析:选C根据随机数法编号可知,编号位数不统一2.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()Ap1p2p3Bp2p3p1Cp1p3,因此可看出A药的疗效更好(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好方法技巧茎叶图问题的求解策略(1)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图数据求出样本数据的数字特征,进一步估计总体情况样本的数字特征(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差),分析稳定情况(2)若给出图形,一方面可以由图形得到相应的样本数据,计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性比较方差(标准差)的大小考法(一)与频率分布直方图交汇命题例3某城市100户居民的月平均用电量(单位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图(1)求直方图中x的值;(2)求月平均用电量的众数和中位数解(1)由(0.0020.009 50.0110.012 5x0.0050.002 5)201,得x0.007 5,直方图中x的值为0.007 5.(2)月平均用电量的众数是230.(0.0020.009 50.011)200.450.5,月平均用电量的中位数在220,240)内,设中位数为a,则(0.0020.009 50.011)200.012 5(a220)0.5,解得a224,即中位数为224.方法技巧频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和考法(二)与茎叶图交汇命题例4(1)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.4,则x,y的值分别为()A.7,8B5,7 C8,5D7,7(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为_解析(1)甲组数据的中位数为17, 故y7,乙组数据的平均数为17.4,解得x7.(2)由图可知去掉的两个数是87,99,所以879029129490x917,解得x4.s2(8791)2(9091)22(9191)22(9491)22.答案(1)D(2)易错提醒在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义考法(三)与优化决策问题交汇命题例5甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数8.38.88.88.7方差s23.53.62.25.4从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是()A甲B乙 C丙D丁解析由题目表格中数据可知,丙平均环数最高,且方差最小,说明成绩好,且技术稳定,选C.答案C方法技巧利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征1.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的,且样本容量为80,则中间一组的频数为()A0.25B0.5 C20D16解析:选D设中间一组的频数为x,依题意有,解得x16.2考点二(xx山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B5,5C3,7D5,7解析:选A由两组数据的中位数相等可得6560y,解得y5,又它们的平均值相等,所以56626574(70x)(5961676578),解得x3.3考点一为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为123,第1小组的频数为6,则报考飞行员的学生人数是()A36B40 C48D50解析:选C由题知,题图中从左到右的前3个小组的频率之和为1(0.0370.013)50.75.又图中从左到右的前3个小组的频率之比为123,所以第1小组的频率为0.750.125,所以报考飞行员的学生人数是48.4.考点三考法(二)如图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A84,4.84B84,1.6 C85,1.6D85,4解析:选C依题意,所剩数据的平均数是80(4367)85,所剩数据的方差是3(8485)2(8685)2(8785)21.6.5考点三考法(三)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是_解析:甲乙9,s(910)2(98)2(99)2(99)2(99)2,s(910)2(910)2(97)2(99)2(99)2s,故甲更稳定答案:甲6考点三考法(一)(xx安徽黄山二模)全世界越来越关注环境保护问题,某监测站点于xx年1月某日起连续n天监测空气质量指数(AQI),数据统计如下表:空气质量指数(g/m3)0,50(50,100(100,150(150,200(200,250空气质量等级优良轻度污染中度污染重度污染天数2040m105(1)根据所给统计表和频率分布直方图中的信息求出n,m的值,并完成频率分布直方图;(2)由频率分布直方图,求该组数据的平均数与中位数解:(1)0.00450,n100,2040m105100,m25.0.008;0.005;0.002;0.001.由此完成频率分布直方图,如图:(2)由频率分布直方图得该组数据的平均数为250.00450750.008501250.005501750.002502250.0015095,0,50)的频率为0.004500.2,50,100)的频率为0.008500.4,中位数为505087.5.全国卷5年真题集中演练明规律1(xx全国卷)为评估一种农作物的种植效果,选了n块地作试验田这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()Ax1,x2,xn的平均数Bx1,x2,xn的标准差Cx1,x2,xn的最大值Dx1,x2,xn的中位数解析:选B标准差能反映一组数据的稳定程度故选B.2(xx全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了xx年1月至xx年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在7,8月D各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析:选A根据折线图可知,xx年8月到9月、xx年10月到11月等月接待游客量都在减少,所以A错误由图可知,B、C、D正确3(xx全国卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中A点表示十月的平均最高气温约为15 ,B点表示四月的平均最低气温约为5 .下面叙述不正确的是()A各月的平均最低气温都在0 以上B七月的平均温差比一月的平均温差大C三月和十一月的平均最高气温基本相同D平均最高气温高于20 的月份有5个解析:选D由图形可得各月的平均最低气温都在0 以上,A正确;七月的平均温差约为10 ,而一月的平均温差约为5 ,故B正确;三月和十一月的平均最高气温都在10 左右,基本相同,C正确;故D错误4(xx全国卷)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样B按性别分层抽样C按学段分层抽样D系统抽样解析:选C由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行分层抽样,排除B和D.故选C.5(xx全国卷)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85,95)95,105)105,115)115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)如图所示:(2)质量指标值的样本平均数为800.06900.261000.381100.221200.08100.质量指标值的样本方差为s2(20)20.06(10)20.2600.381020.222020.08104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0380.220.080.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定 课时达标检测 小题对点练点点落实对点练(一)随机抽样1某学校为了了解某年高考数学的考试成绩,在高考后对该校1 200名考生进行抽样调查,其中有400名文科考生,600名理科考生,200名艺术和体育类考生,从中抽取120名考生作为样本,记这项调查为;从10名家长中随机抽取3名参加座谈会,记这项调查为,则完成,这两项调查宜采用的抽样方法依次是()A分层抽样法,系统抽样法B分层抽样法,简单随机抽样法C系统抽样法,分层抽样法D简单随机抽样法,分层抽样法解析:选B在中,文科考生、理科考生、艺术和体育类考生会存在差异,采用分层抽样法较好;在中,抽取的样本个数较少,宜采用简单随机抽样法2某校高三年级共有学生900人,编号为1,2,3,900,现用系统抽样的方法抽取一个容量为45的样本,则抽取的45人中,编号落在481,720的人数为()A10B11 C12D13解析:选C系统抽样,是抽多少人就把总体分成多少组,于是抽样间隔就是用总体数量除以样本容量:20.于是落在481,720内的人数为12,故选C.3某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A93B123 C137D167解析:选C初中部的女教师人数为11070%77,高中部的女教师人数为150(160%)60,该校女教师的人数为7760137,故选C.4高三(3)班共有学生56人,座号分别为1,2,3,56,现根据座号,用系统抽样的方法,抽取一个容量为4的样本已知3号、17号、45号同学在样本中,那么样本中还有一个同学的座号是()A30B31 C32D33解析:选B由系统抽样的特点,得到样本中的座号形成一个以3为首项,公差为17314的等差数列,则第三个座号是171431.故选B.5假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,799进行编号,如果从随机数表第8行第7列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号_(下面摘取了随机数表第7行至第9行)844217533157245506887704744767217633502583921206766301637859169556671998105071751286735807443952387933211234297864560782524207443815510013429966027954解析:找到第8行第7列的数开始向右读,第一个数785,符合条件,第二个数916,舍去,第三个数955,舍去,第四个数667,符合条件,这样依次读出结果故答案为:785,667,199,507,175.答案:785,667,199,507,1756一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车A轿车B轿车C舒适型100150z标准型300450600按类型用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆,则z的值为_解析:由题意可得,解得z400.答案:4007(xx湖北重点中学适应模拟)某校高三年级共有30个班,学校心理咨询室为了了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为75,则抽到的最小的编号为_解析:系统抽样的抽取间隔为6,设抽到的最小编号为x,则x(6x)(12x)(18x)(24x)75,所以x3.答案:3对点练(二)用样本估计总体1为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设所得分数的中位数为me,众数为m0,平均值为,则()Amem0Bmem0Cmem0Dm0me解析:选D由图可知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分中位数为第15,16个数(分别为5,6)的平均数,即me5.5;5出现的次数最多,故m05;(324351066738292102)305.97.于是得m0me0)的方差为8,则a的值为()A1B.C2D4解析:选C根据方差的性质可知,a228,故a2.4(xx湖北黄冈质检)已知数据x1,x2,x3,xn是某市n(n3,nN*)个普通职工的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入xn1,则这(n1)个数据中,下列说法正确的是()A年收入平均数可能不变,中位数可能不变,方差可能不变B年收入平均数大大增大,中位数可能不变,方差变大C年收入平均数大大增大,中位数可能不变,方差也不变D年收入平均数大大增大,中位数一定变大,方差可能不变解析:选B数据x1,x2,x3,xn是某市n(n3,nN*)个普通职工的年收入,xn1为世界首富的年收入,则xn1远大于x1,x2,x3,xn,故这(n1)个数据中,年收入平均数大大增大;中位数可能不变,也可能稍微变大;由于数据的集中程度受到xn1的影响比较大,更加离散,则方差变大5为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差其中根据茎叶图能得到的统计结论的编号为()ABCD解析:选B甲29,乙30,甲s乙故可判断结论正确.6.五一期间,某淘宝店趁势推出了“抢红包”的促销活动已知每人有5次抢红包的机会,每次可得到1元至30元不等的红包甲、乙二人在这5次抢红包活动中获得的红包金额的茎叶图如图所示若甲5次获得的红包金额的均值为x1,乙5次获得的红包金额的均值为x2,则x1x2_.解析:由茎叶图可知,甲获得的红包金额分别为1,2,12,20,30,乙获得的红包金额分别为1,2,5,10,30,所以甲获得的红包金额的均值x113,乙获得的红包金额的均值x29.6,所以x1x2139.63.4.答案:3.47从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)直方图中x的值为_;(2)在这些用户中,用电量落在区间100,250)内的户数为_解析:(1)由频率分布直方图总面积为1,得(0.001 20.002 420.003 6x0.006 0)501,解得x0.004 4.(2)用电量在100,250)内的频率为(0.003 60.004 40.006 0)500.7,故所求户数为1000.770.答案:(1)0.004 4(2)708已知x是1,2,3,x,5,6,7这七个数据的中位数且1,2,x2,y这四个数据的平均数为1,则y的最小值为_解析:由题意12x2y4,所以yx21.由中位数定义知,3x5,所以yx21.当x3,5时,函数yx21与y均为增函数,所以yx21在3,5上为增函数,所以min8.答案:大题综合练迁移贯通1(xx湖北四校联考)某班级准备从甲、乙两人中选一人参加某项比赛,已知在一个学期10次考试中,甲、乙两人的成绩(单位:分)的茎叶图如图所示你认为选派谁参赛更合适?并说明理由解:根据茎叶图可知,甲的平均成绩甲89,乙的平均成绩乙89,甲、乙的平均成绩相等又甲成绩的方差s(7989)2(8489)2(8589)2(8789)2(8789)2(8889)2(9389)2(9489)2(9689)2(9789)230.4,乙成绩的方差s(7589)2(7789)2(8589)2(8889)2(8989)2(8989)2(9589)2(9689)2(9789)2(9989)260.6,故甲成绩的方差小于乙成绩的方差,因此选派甲参赛更合适2随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷现从使用A和B两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:(1)试估计使用A款订餐软件的50个商家的“平均送达时间”的众数及平均数;(2)根据以上抽样调查数据,将频率视为概率,回答下列问题:能否认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%?如果你要从A和B两款订餐软件中选择一款订餐,你会选择哪款?说明理由解:(1)依题意可得,使用A款订餐软件的50个商家的“平均送达时间”的众数为55.使用A款订餐软件的50个商家的“平均送达时间”的平均数为150.06250.34350.12450.04550.4650.0440.(2)使用B款订餐软件“平均送达时间”不超过40分钟的商家的比例估计值为0.040.200.560.8080%75%.故可以认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%.使用B款订餐软件的50个商家的“平均送达时间”的平均数为150.04250.2350.56450.14550.04650.023540,所以选B款订餐软件3我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由解:(1)由频率分布直方图可知,月均用水量在0,0.5)中的频率为0.080.50.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.040.080.5a0.200.260.5a0.060.040.021,解得a0.30.(2)由(1)知100位居民每人的月均用水量不低于3吨的频率为0.060.040.020.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 0000.1236 000.(3)因为前6组的频率之和为0.040.080.150.200.260.150.880.85,而前5组的频率之和为0.040.080.150.200.260.730.85,所以2.5x3.由0.30(x2.5)0.850.73,解得x2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准第二节 统计案例本节主要包括2个知识点:1.回归分析;2.独立性检验.突破点(一)回归分析1变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关2两个变量的线性相关回归直线从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线回归方程回归方程为x,其中, 最小二乘法通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法相关系数当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常|r|大于0.75时,认为两个变量有很强的线性相关性1判断题(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系()(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值()(4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得回归方程2.352x147.767,则气温为2 时,一定可卖出143杯热饮()答案:(1)(2)(3)(4)2填空题(1)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,大小关系为_解析:由相关系数的定义以及散点图所表达的含义可知r2r40r3r1.答案:r2r40r3r1(2)两个变量y
展开阅读全文