资源描述
10.2统计及统计案例考纲解读考点内容解读要求高考示例常考题型预测热度1.抽样方法1.理解随机抽样的必要性和重要性2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法2017江苏,3;2015北京,4;2015湖南,2选择题、填空题、解答题2.统计图表了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点2017课标全国,3;2017北京,17;2016北京,173.样本的数字特征1.理解样本数据标准差的意义和作用,会计算数据标准差2.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想4.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题2017课标全国,2;2017山东,8;2016课标全国,19;2016四川,16;2016江苏,4;2015重庆,4;2015山东,6;2014课标,184.变量间的相关性1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程2017课标全,19;2016课标全,18;2015湖北,4;2015课标,195.独立性检验了解独立性检验的基本思想、方法及其简单应用,能通过计算判断两个变量的相关程度2017课标全,19;2014安徽,17;2013福建,19分析解读从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)10=0.9,分数在区间40,50)内的人数为100-1000.9-5=5.所以总体中分数在区间40,50)内的人数估计为4005100=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)10100=60,所以样本中分数不小于70的男生人数为6012=30.所以样本中的男生人数为302=60,女生人数为100-60=40,男生和女生人数的比例为6040=32.所以根据分层抽样原理,总体中男生和女生人数的比例估计为32.五年高考考点一抽样方法1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1 800青年教师1 600合计4 300A.90B.100C.180D.300答案C2.(2015湖南,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是()A.3B.4C.5D.6答案B3.(2015四川,3,5分)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A.抽签法B.系统抽样法C.分层抽样法D.随机数法答案C4.(2014湖南,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2p3B.p2=p3p1C.p1=p319时,y=3 800+500(x-19)=500x-5 700,所以y与x的函数解析式为y=3 800,x19,500x-5 700,x19(xN).(4分)(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(5分)(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800元,20台的费用为4 300元,10台的费用为4 800元,因此这100台机器在购买易损零件上所需费用的平均数为1100(3 80070+4 30020+4 80010)=4 000(元).(7分)若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000元,10台的费用为4 500元,因此这100台机器在购买易损零件上所需费用的平均数为1100(4 00090+4 50010)=4 050(元).(10分)比较两个平均数可知,购买1台机器的同时应购买19个易损零件.(12分)5.(2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解析(1)由频率分布直方图可知:月均用水量在0,0.5)的频率为0.080.5=0.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5a+0.5a,解得a=0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12,由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 0000.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.730.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.480.5,所以2x2.5.由0.50(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.6.(2014课标,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85,95)95,105)105,115)115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解析(1)(2)质量指标值的样本平均数为x=800.06+900.26+1000.38+1100.22+1200.08=100.质量指标值的样本方差为s2=(-20)20.06+(-10)20.26+00.38+1020.22+2020.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.教师用书专用(717)7.(2015重庆,4,5分)重庆市2013年各月的平均气温()数据的茎叶图如下:0891258200338312则这组数据的中位数是()A.19B.20C.21.5D.23答案B8.(2014陕西,9,5分)某公司10位员工的月工资(单位:元)为x1,x2,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.x,s2+1002B.x+100,s2+1002C.x,s2D.x+100,s2答案D9.(2015广东,12,5分)已知样本数据x1,x2,xn的均值x=5,则样本数据2x1+1,2x2+1,2xn+1的均值为.答案1110.(2013湖北,12,5分)某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4则(1)平均命中环数为;(2)命中环数的标准差为.答案(1)7(2)211.(2013辽宁,16,5分)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为.答案1012.(2015广东,17,12分)某城市100户居民的月平均用电量(单位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户?解析(1)由已知得,20(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.(2)由题图可知,面积最大的矩形对应的月平均用电量区间为220,240),所以月平均用电量的众数的估计值为230;因为20(0.002+0.009 5+0.011)=0.450.5,所以中位数在区间220,240)内.设中位数为m,则20(0.002+0.009 5+0.011)+0.012 5(m-220)=0.5,解得m=224.所以月平均用电量的中位数为224.(3)由题图知,月平均用电量为220,240)的用户数为(240-220)0.012 5100=25,同理可得,月平均用电量为240,260),260,280),280,300的用户数分别为15,10,5.故用分层抽样的方式抽取11户居民,月平均用电量在220,240)的用户中应抽取112525+15+10+5=5(户).13.(2014课标,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:甲部门乙部门4979766533211098877766555554443332100665520063222034567891059044812245667778901123468800113449123345011456000(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解析(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.14.(2014广东,17,13分)某车间20名工人年龄数据如下表:年龄(岁)工人数(人)191283293305314323401合计20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解析(1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21.(2)这20名工人年龄的茎叶图如下:123498889990000011112220(3)这20名工人年龄的平均数x=120(191+283+293+305+314+323+401)=30,故方差s2=1201(19-30)2+3(28-30)2+3(29-30)2+5(30-30)2+4(31-30)2+3(32-30)2+1(40-30)2=120(121+12+3+0+4+12+100)=12.6.15.(2014湖南,17,12分)某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),其中a,a分别表示甲组研发成功和失败;b,b分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.解析(1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为x甲=1015=23;方差s甲2=1151-23210+0-2325=29.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为x乙=915=35;方差s乙2=1151-3529+0-3526=625.因为x甲x乙,s甲20,b0,b0C.a0,b0D.a0答案A3.(2017课标全国,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得x=116i=116xi=9.97,s=116i=116(xi-x)2=116(i=116xi2-16x2)0.212,i=116(i-8.5)218.439,i=116(xi-x)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,16.(1)求(xi,i)(i=1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,n)的相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2.0.0080.09.解析(1)由样本数据得(xi,i)(i=1,2,16)的相关系数为r=i=116(xi-x)(i-8.5)i=116(xi-x)2i=116(i-8.5)2=-2.780.2121618.439-0.18.由于|r|0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入(1)中的回归方程,得y=0.59+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.8.(2013重庆,17,13分)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=110xi=80,i=110yi=20,i=110xiyi=184,i=110xi2=720.(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y=bx+a中,b
展开阅读全文