资源描述
第三节 用样本估计总体,【知识梳理】 1.常用统计图表 (1)频率分布表的画法: 第一步:求_,决定组数和组距,组距=_; 第二步:_,通常对组内数值所在区间取左闭右开 区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.,极差,分组,(2)频率分布直方图:反映样本频率分布的直方图.如图: 横轴表示样本数据,纵轴表示_,每个小矩形的 面积表示样本落在该组内的_.,频率,(3)茎叶图的画法: 第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按_次序排成 一列,写在左(右)侧; 第三步:将各个数据的叶依次写在其茎的右(左)侧.,大小,2.样本的数字特征 (1)众数、中位数、平均数,大小,顺序,最中间,(2)标准差、方差 标准差:表示样本数据到平均数的一种平均距离, 一般用s表示, s=_.,方差:标准差的平方s2叫做方差. s2=_,其中 xi(i=1,2,3,n)是_,n是_, 是_.,样本数据,样本容量,样本平均数,【特别提醒】 1.频率分布直方图中纵轴表示的应为 2.在绘制茎叶图时,易遗漏重复出现的数据,重复出现 的数据要重复记录,同时不要混淆茎叶图中茎与叶的 含义.,【小题快练】 链接教材 练一练 1.(必修3P100A组T1改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为 ( ) A.4 B.8 C.12 D.16 【解析】选B.频数=320.25=8.,感悟考题 试一试 2.(2015重庆高考)重庆市2013年各月的平均气温()数据的茎叶图如图:,则这组数据的中位数是 ( ) A.19 B.20 C.21.5 D.23 【解析】选B.由中位数的概念可知,该组数据按从小到大顺序排列的第6和第7个数据的平均数即为要求的中位数,为20.,3.(2016合肥模拟)某校为了了解教科研工作开展状 况与教师年龄之间的关系,将该校不小于35岁的80名教 师按年龄分组,分组区间为35,40),40,45),45,50), 50,55),55,60),由此得到 频率分布直方图如图,则这80 名教师中年龄小于45岁的有 _人.,【解析】由频率分布直方图可知45岁以下的教师的频率为5(0.040+0.080)=0.6,所以共有800.6=48(人). 答案:48,4.(2016天津模拟)甲、乙两人在10天中每天加工零 件的个数用茎叶图表示如图,中间一列的数字表示零件 个数的十位数,两边的数字表示零件个数的个位数,则 这10天甲、乙两人日加工零件的平均数分别为 _和_.,【解析】由茎叶图可知甲的平均数为 乙的平均数为 答案:24 23,考向一 数字特征的计算与应用 【典例1】(1)(2015安徽高考)若样本数据x1,x2, x10的标准差为8,则数据2x1-1,2x2-1,2x10-1的标准 差为 ( ) A.8 B.15 C.16 D.32,(2)(2015广东高考)某工厂36名工人的年龄数据如下表.,用系统抽样法从36名工人中抽取容量为9的样本,且 在第一分段里用随机抽样法抽到的年龄数据为44,列 出样本的年龄数据; 计算中样本的平均值和方差; 36名工人中年龄在 -s与 +s之间有多少人?所占 的百分比是多少(精确到0.01%)?,【解题导引】(1)应用标准差、方差公式和性质计算标 准差. (2)根据年龄数据求出工人编号,再由系统抽样的特 点求出样本编号后再求对应的年龄数据;根据中的 数据直接利用公式计算;先求出 -s与 +s的值,再 求出年龄在 -s与 +s之间的人数,最后计算所占的百 分比.,【规范解答】(1)选C.样本数据x1,x2,x10的标准差 s=8,则s2=64,而样本数据2x1-1,2x2-1,2x10-1的方 差为2264,所以其标准差为 =16.,(2)由题条件知所抽样本编号是一个首项为2,公差为4的等差数列,故其所有样本编号依次为2,6,10,14,18, 22,26,30,34,对应样本的年龄数据依次为44,40,36, 43,36,37,44,43,37.,由知可得其样本的平均值为 方差为: s2= (44-40)2+(40-40)2+(36-40)2+(43-40)2+(36- 40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2 = 42+02+(-4)2+32+(-4)2+(-3)2+42+32+(-3)2=,由知s= 所以 所以年龄在 -s与 +s之间的共有23人, 所占百分比为: 100%63.89%.,【母题变式】 1.若本例题(2)中条件不变,求年龄在30,40)的频率? 【解析】年龄在30,40)的工人有16人,因此年龄在 30,40)的频率是,2.若本例题(2)中条件不变,求工人年龄的中位数. 【解析】将工人年龄按由小到大排序得: 27,31,33,34,34,36,36,37,37,37,38,38,38,39,39, 39,39,40,40,40,41,41,42,42,42,42,43,43,43,43, 44,44,45,45,49,53,其中第18,19个为40,40,因此工 人年龄的中位数为40.,【规律方法】众数、中位数、平均数、方差的意义及常用结论 (1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.,(2)方差的简化计算公式:s2= 或写成s2= 即方差等于原数据 平方的平均数减去平均数的平方.,(3)平均数、方差的公式推广 若数据x1,x2,xn的平均数为 ,那么mx1+a, mx2+a,mx3+a,mxn+a的平均数是m +a. 数据x1,x2,xn的方差为s2. ()数据x1+a,x2+a,xn+a的方差也为s2; ()数据ax1,ax2,axn的方差为a2s2.,【变式训练】(2016开封模拟)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:,则7个剩余分数的方差为 ( ),【解析】选B.根据茎叶图,去掉1个最低分87,1个最 高分99, 则 87+94+90+91+90+(90+x)+91=91, 所以x=4. 所以s2= (87-91)2+(94-91)2+(90-91)2+(91-91)2 +(90-91)2+(94-91)2+(91-91)2=,【加固训练】 1.(2014陕西高考)某公司10位员工的月工资(单位: 元)为x1,x2,x10,其均值和方差分别为 和s2,若从 下月起每位员工的月工资增加100元,则这10位员工下 月工资的均值和方差分别为 ( ) A. ,s2+1002 B. +100,s2+1002 C. ,s2 D. +100,s2,【解析】选D.样本数据x1,x2,x10的均值 (x1+x2+x10), 方差s2=,新数据x1+100,x2+100,x10+100的均值 (x1+100+x2+100+x10+100) = (x1+x2+x10)+100= +100, 新数据x1+100,x2+100,x10+100的方差 s2= (x1+100- -100)2+(x2+100- -100)2+ (x10+100- -100)2 = (x1- )2+(x2- )2+(x10- )2=s2.,2.(2016揭阳模拟)甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如表所示:,从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是 ( ) A.甲 B.乙 C.丙 D.丁 【解析】选C.由题目表格中数据可知,丙平均环数最高,且方差最小,说明技术稳定,且成绩好.,3.(2016天津模拟)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则 ( ),A.甲成绩的平均数小于乙成绩的平均数 B.甲成绩的中位数等于乙成绩的中位数 C.甲成绩的方差小于乙成绩的方差 D.甲成绩的极差小于乙成绩的极差,【解析】选C.由题意可知,甲的成绩为4,5,6,7,8,乙的 成绩为5,5,5,6,9.所以甲、乙成绩的平均数均为6,A错; 甲、乙成绩的中位数分别为6,5,B错;甲、乙成绩的方 差分别为s甲2= (4-6)2+(5-6)2+(6-6)2+(7-6)2+(8- 6)2=2,s乙2= (5-6)2+(5-6)2+(5-6)2+(6-6)2+(9- 6)2= C对;甲、乙成绩的极差均为4,D错.,考向二 茎叶图及其应用 【典例2】(1)(2016内江模拟)某中学高三从甲、乙 两个班中各选出7名学生参加数学竞赛,他们取得的成 绩(满分100分)的茎叶图如图,其中甲班学生成绩的众 数是85,乙班学生成绩的中位 数是83,则x+y的值为_.,(2)(2016福州模拟)某大学为调查来自南方和北方的大学生的身高差异,从2013级的年龄在18-19岁之间的大学生中随机抽取了来自南方和北方的大学生各10名,测量得他们的身高(单位:cm)如下: 南方:158,170,166,169,180,175,171,176,162,163. 北方:183,173,169,163,179,171,157,175,178,166.,画出题中两组数据的茎叶图,并根据茎叶图对来自南方 和北方的大学生的身高进行比较,写出两个统计结论. 【解题导引】(1)根据甲中出现次数最多的数为85,乙 中第4个数为83求解. (2)把百位与十位当茎,个位当叶作出茎叶图.统计结论 可从平均身高、中位数、整齐性等方面考虑.,【规范解答】(1)由甲班学生成绩的众数是85,所以x=5.乙班学生成绩的中位数是83,所以y=3,所以x+y=5+3=8. 答案:8,(2)题中两组数据的茎叶图如图所示:,统计结论:北方大学生的平均身高大于南方大学生的平均身高;南方大学生的身高比北方大学生的身高更整齐;南方大学生的身高的中位数是169.5,北方大学生的身高的中位数是172;南方大学生的身高基本上是对称的,而且大多数集中在均值附近,北方大学生的身高分布较分散.,【易错警示】解答本例题(1)会出现以下错误: 由甲班学生成绩的众数是85,所以x=85.乙班学生成绩的中位数是83,所以y=83,所以x+y=85+83=168.导致该错误的原因是,忽视了x,y只表示成绩的个位数字.,【规律方法】茎叶图中的三个关注点 (1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.,【变式训练】(2016西安模拟)一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如图所示.据此估计两个班成绩的中位数的差的绝对值为( ) A.8 B.5 C.4 D.2,【解析】选D.甲、乙两班成绩按大小顺序排列,处在最中间的数分别为87,89,故它们之差的绝对值是2.,【加固训练】 1.(2016咸阳模拟)如图是某 大学自主招生面试环节中,七位 评委为某考生打出的分数的茎 叶统计图,去掉一个最高分和一个最低分后,所剩数据 的平均数和众数依次为 ( ) A.85,84 B.84,85 C.86,84 D.84,86,【解析】选A.由图可知,去掉一个最高分和一个最低 分后,所剩数据为84,84,84,86,87.所以平均数为 =85,众数为84.,2.(2016郑州模拟)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( ),A.甲 B.乙 C.甲、乙相等 D.无法确定,【解析】选A.从茎叶图上可以观察到甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小.,考向三 频率分布直方图 【考情快递】,【考题例析】 命题方向1:求频率或频数 【典例3】(2015湖北高考)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示.,(1)直方图中的a=_. (2)在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为_.,【解题导引】利用频率和为1,求得a,由消费金额在区间0.5,0.9内的频率,求得消费金额在区间0.5,0.9内的购物者的人数.,【规范解答】由频率分布直方图及频率和等于1可得 0.20.1+0.80.1+1.50.1+20.1+2.50.1+a 0.1=1,解得a=3,消费金额在区间0.5,0.9内的频率 为0.20.1+0.80.1+20.1+30.1=0.6,所以消费 金额在区间0.5,0.9内的购物者的人数为0.6 10000=6000. 答案:(1)3 (2)6000,命题方向2:求样本的数字特征 【典例4】(2015广东高考)某城市100户居民的月 平均用电量(单位:度),以160,180),180,200), 200,220),220,240),240,260),260,280), 280,300分组的频率分布直方图如图.,(1)求直方图中x的值. (2)求月平均用电量的众数和中位数. (3)在月平均用电量为220,240),240,260), 260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户? (本题源自A版必修3P65探究),【解题导引】(1)利用频率和为1,求出x. (2)根据中位数前面的频率之和为0.5求解. (3)先求出各组用户的户数,再求出抽取比例后求解.,【规范解答】(1)由(0.002+0.0095+0.011+0.0125+x +0.005+0.0025)20=1得: x=0.0075,所以直方图中x的值是0.0075.,(2)月平均用电量的众数是 =230. 因为(0.002+0.009 5+0.011)20=0.450.5, 所以月平均用电量的中位数在220,240)内, 设中位数为a, 由(0.002+0.009 5+0.011)20+0.012 5(a-220)=0.5 得:a=224, 所以月平均用电量的中位数是224.,(3)月平均用电量为220,240)的用户有0.012520 100=25户, 月平均用电量为240,260)的用户有0.007520100 =15户, 月平均用电量为260,280)的用户有0.00520100 =10户,月平均用电量为280,300的用户有0.002520100 =5户, 抽取比例= 所以月平均用电量在220,240)的用户中应抽取25 =5户.,【技法感悟】 1.频率、频数、样本容量的计算方法 (1) 组距=频率. (2) =频率, =样本容量,样本容量 频率=频数.,2.利用频率分布直方图估计样本的数字特征的思路 (1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值. (2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.,(3)众数:在频率分布直方图中,众数是最高矩形的底边中点的横坐标. 易错提醒:制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.,【题组通关】 1.(2016石家庄模拟)根据中华人民共和国道路交 通安全法规定:车辆驾驶员血液酒精浓度在20 80mg/100 mL(不含80)之间,属于酒后驾车,处暂扣一个 月以上三个月以下驾驶证,并处200元以上500元以下罚 款;血液酒精浓度在80mg/100 mL(含80)以上时,属醉酒,驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款. 据法制晚报报道,2015年8月15日至8月28日,全国查处酒后驾车和醉酒驾车共28800人,如图是对这28800人血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为_人.,【解析】由频率分布直方图可知血液酒精浓度在80mg/100 mL(含80)以上的频率为10(0.01+0.005)=0.15,所以其人数为288000.15=4320. 答案:4320,2.(2016漳州模拟)为了解学生课外阅读的情况,随机统计了n名学生的课外阅读时间,所得数据都在50,150中,其频率分布直方图如图所示.已知在50,75)中的频数为100,则n的值为_.,【解析】由图知 =0.00425,所以n=1000. 答案:1000,3.(2016郑州模拟)某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是50,60),60,70),70,80),80,90),90,100.,(1)求图中a的值. (2)根据频率分布直方图,估计这100名学生语文成绩的平均分. (3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在50,90)之外的人数.,【解析】(1)由频率分布直方图知(0.04+0.03+0.02+2a)10=1,因此a=0.005. (2)550.05+650.4+750.3+850.2+950.05=73. 所以这100名学生语文成绩的平均分为73分.,(3)分别求出语文成绩在分数段50,60),60,70),70,80),80,90)的人数依次为0.05100=5,0.4100=40,0.3100=30,0.2100=20.,所以数学成绩分数段在50,60),60,70),70,80), 80,90)的人数依次为5,20,40,25. 所以数学成绩在50,90)之外的人数有100-(5+20+40+25) =10(人).,
展开阅读全文