资源描述
第三节统计图表、数据的数字特征、用样本估计总体考纲传真1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题1统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、象形统计图、茎叶图等2数据的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫作这组数据的众数中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数平均数:样本数据x1,x2,xn的平均数(x1x2xn)(2)方差和标准差方差:s2.标准差:s(x1)2(x2)2(xn)2其中xn是样本数据的第n项,n是样本容量,是平均数标准差的单位与原始测量单位相同,在统计中,通常用标准差来刻画数据的离散程度3频率分布直方图与频率分布折线图(1)频率分布直方图:每个小矩形的宽度为xi(分组的宽度),高为,小矩形的面积恰为相应的频率fi,我们称这样的图形为频率分布直方图(2)频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加上一个区间,从所加的左边区间的中点开始,用线段依次连接频率分布直方图中各个矩形的顶端中点,直至右边所加区间的中点就得到频率分布折线图4用样本估计总体通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征1频率分布直方图的3个结论(1)频率分布直方图中相邻两横坐标之差xi称为组距,纵坐标,频率组距.(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比(3)小长方形的高,所有小长方形高的和为.2平均数、方差的公式推广(1)若数据x1,x2,xn的平均数为,那么mx1a,mx2a,mx3a,mxna的平均数是ma.(2)数据x1,x2,xn的方差为s2.数据x1a,x2a,xna的方差也为s2;数据ax1,ax2,axn的方差为a2s2.基础自测1(思考辨析)判断下列结论的正误(正确的打“”,错误的打“”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(2)一组数据的方差越大,说明这组数据越集中. ()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()答案(1)(2)(3)(4)2(教材改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A4B8C12D16B设频数为n,则0.25,n328.3(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A91.5和91.5B91.5和92C91和91.5D92和92A这组数据由小到大排列为87,89,90,91,92,93,94,96,中位数是91.5,平均数91.5.4某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为35,40),40,45),45,50),50,55),55,60,由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有_人48由频率分布直方图可知45岁以下的教师的频率为5(0.0400.080)0.6,所以共有800.648(人)5已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_0.15个数的平均数5.1,所以它们的方差s2(4.75.1)2(4.85.1)2(5.15.1)2(5.45.1)2(5.55.1)20.1.茎叶图的应用1(2019成都检测)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为 ()A117B118C118.5D119.5B22次考试中,所得分数最高的为98,最低的为56,所以极差为985642,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为4276118.2(2019泉州质检)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则nm的值是 ()A5 B6 C7 D8B由甲组学生成绩的平均数是88,可得88,解得m3.由乙组学生成绩的中位数是89,可得n9,所以nm6,故选B.规律方法茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一(2)重复出现的数据要重复记录,不能遗漏(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小样本的数字特征及应用1(2019济南一中质检)2018年2月20日,摩拜单车在济南推出“做文明骑士,周一摩拜单车免费骑”活动为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为 ()A9 B4 C3 D2B由茎叶图得该组数据的平均数(8789909193)90.方差为(8790)2(8990)2(9090)2(9190)2(9390)24.2甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则 ()甲乙A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差C甲的平均数是6,中位数是6,极差是4,方差是2;乙的平均数是6,中位数是5,极差是4,方差是,故选C3甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是_甲甲乙9,s(910)2(98)2(99)2(99)2(99)2,s(910)2(910)2(97)2(99)2(99)2s,故甲更稳定规律方法(1)众数、中位数、平均数及方差的意义平均数与方差都是重要的数字特征,是对总体的一种简明地描述;平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小(2)在计算平均数、方差时可利用平均数、方差的有关结论频率分布直方图及应用考法1求样本的频率、频数【例1】(2019石家庄检测)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A56 B60 C120 D140D由直方图可知每周自习时间不少于22.5小时的频率为(0.160.080.04)2.50.7,则每周自习时间不少于22.5小时的人数为0.7200140.故选D考法2频率分布直方图与样本的数字特征的综合【例2】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查通过抽样,获得了某年100位居民每人的月均用水量(单位:吨)将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数解(1)由频率分布直方图可知:月均用水量在0,0.5)内的频率为0.080.50.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1(0.040.080.210.250.060.040.02)0.5a0.5a,解得a0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.060.040.020.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 0000.1236 000.(3)设中位数为x吨因为前5组的频率之和为0.040.080.150.210.250.730.5,又前4组的频率之和为0.040.080.150.210.480.5,所以2x2.5.由0.50(x2)0.50.48,解得x2.04.故可估计居民月均用水量的中位数为2.04吨规律方法1.频率、频数、样本容量的计算方法(1)组距频率;(2)频率,样本容量,样本容量频率频数2频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和易错警示:1.频率分布直方图的纵坐标是,而不是频率,切莫与条形图混淆2制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确 (1)为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A64 B54 C48 D27B前两组中的频数为100(0.050.11)16.因为后五组频数和为62,所以前三组为38.所以第三组频数为22.又最大频率为0.32的最大频数为0.3210032.所以a223254.(2)某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是50,60),60,70),70,80),80,90),90,100若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分;若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在50,90之外的人数分数段50,60)60,70)70,80)80,90xy11213445解估计这次语文成绩的平均分550.05650.4750.3850.2950.0573.所以这100名学生语文成绩的平均分为73分分别求出语文成绩在分数段50,60),60,70),70,80),80,90的人数依次为0.051005,0.410040,0.310030,0.210020.所以数学成绩分数段在50,60),60,70),70,80),80,90的人数依次为5,20,40,25.所以数学成绩在50,90之外的人数有100(5204025)10(人)1(2018全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A设新农村建设前经济收入的总量为x,则新农村建设后经济收入的总量为2x.建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D正确2(2017全国卷)为评估一种农作物的种植效果,选了n块地作试验田这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()Ax1,x2,xn的平均数Bx1,x2,xn的标准差Cx1,x2,xn的最大值Dx1,x2,xn的中位数B因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差故选B.3(2017全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在7,8月D各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳A对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确故选A4(2016全国卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中A点表示十月的平均最高气温约为15 ,B点表示四月的平均最低气温约为5 .下面叙述不正确的是()A各月的平均最低气温都在0 以上B七月的平均温差比一月的平均温差大C三月和十一月的平均最高气温基本相同D平均最高气温高于20 的月份有5个D对于选项A,由图易知各月的平均最低气温都在0 以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10 ,所以C正确;对于选项D,平均最高气温高于20 的月份有七月、八月,共2个月份,故D错误- 11 -
展开阅读全文