资源描述
统计及统计案例探考情 悟真题【考情探究】考点内容解读5年考情预测热度考题示例考向关联考点抽样方法理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本2019课标全国,6,5分系统抽样2018课标全国,14,5分分层抽样统计图表了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点2017课标全国,3,5分认识折线图2018课标全国,3,5分认识扇形统计图2018课标全国,19,12分用频率分布直方图解决实际问题平均数样本的数字特征理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征,并给出合理的解释;会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题2017课标全国,2,5分理解方差或标准差2019课标全国,4,5分用样本估计总体2019课标全国,17,12分用频率分布直方图估计数字特征频率分布直方图2019课标全国,19,12分频数分布表及数字特征变量间的相关性会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系;了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程2016课标全国,18,12分相关系数与回归方程折线统计图2017课标全国,19,12分相关系数数字特征独立性检验了解独立性检验的基本思想、方法及其简单应用,能通过计算判断两个变量的相关程度2019课标全国,17,12分独立性检验用频率估计概率2017课标全国,19,12分频率分布直方图与独立性检验用频率估计概率2018课标全国,18,12分茎叶图与独立性检验样本的数字特征分析解读从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义、频率分布直方图、平均数、方差的计算、识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的竖直方向的长度=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.破考点 练考向【考点集训】考点一抽样方法1.(2019河南部分省示范性高中1月份联考,7)某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校2400名学生中抽取30人进行调查.现将2400名学生随机地从12400编号,按编号顺序平均分成30组(180号,81160号,23212400号),若第3组与第4组抽出的号码之和为432,则第6组抽到的号码是()A.416B.432C.448D.464答案A2.(2018安徽安庆一中、山西太原五中等五省六校(K12联盟)期末联考,3)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于()A.12B.18C.24D.36答案D考点二统计图表1.(2019广东东莞第二次调研考试,3)有24名投资者想到某地投资,他们年龄的茎叶图如图所示,先将他们的年龄从小到大编号为124号,再用系统抽样方法抽出6名投资者,邀请他们到实地进行考察.其中年龄不超过55岁的人数为()3940112551366778889600123345A.1B.2C.3D.4答案B2.(多选题)(2020届山东夏季高考模拟,9)下图为某地区2006年2018年地方财政预算内收入、城乡居民储蓄年末余额折线图.根据该折线图可知,该地区2006年2018年()A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大答案AD考点三样本的数字特征1.(2018湖北华师一附中月考,3)某人到甲、乙两市各7个小区调查空置房情况,将调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为()A.4B.3C.2D.1答案B2.(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则()A.x=4,s22C.x4,s24,s22答案A考点四变量间的相关性1.(2018河南焦作四模,3)已知变量x和y的统计数据如下表:x34567y2.5344.56根据上表可得回归直线方程为y=bx-0.25,据此可以预测当x=8时,y=()A.6.4B.6.25C.6.55D.6.45答案C2.(2018湖南张家界三模,4)已知变量x,y之间的线性回归方程为y=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误的是()x681012y6m32A.变量x,y之间成负相关关系B.可以预测,当x=20时,y=-3.7C.m=4D.该回归直线必过点(9,4)答案C考点五独立性检验(2018贵州六校12月联考,18)海南大学某餐饮中心为了解新生的饮食习惯,在全校新生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”?(2)已知在被调查的北方学生中有5名中文系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.P(K2k0)0.100.050.010k02.7063.8416.635附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).答案(1)将22列联表中的数据代入公式计算,得K2=100(6010-2010)270308020=100214.762.由于4.7623.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.(2)从5名中文系学生中任取3人的所有可能结果所组成的基本事件空间=(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3),其中ai表示喜欢甜品的学生,i=1,2,bj表示不喜欢甜品的学生,j=1,2,3.由10个基本事件组成,且这些基本事件的出现是等可能的.用A表示“3人中至多有1人喜欢甜品”这一事件,则A=(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3).事件A由7个基本事件组成,因而P(A)=710.炼技法 提能力【方法集训】方法1解与频率分布直方图有关问题的方法1.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30.根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D2.(2020届广西桂林十八中模拟,18)某家电公司销售部门共有200名销售员,每年部门对每名销售员都有1400万元的年度销售任务.已知这200名销售员去年完成的销售额在区间2,22(单位:百万元)内,现将其分成5组:第1组、第2组、第3组、第4组、第5组对应的区间分别为2,6),6,10),10,14),14,18),18,22),并绘制出频率分布直方图,如图.(1)若用分层抽样的方法从这200名销售员中抽取容量为25的样本,求a的值和样本中完成年度任务的销售员人数;(2)从(1)中样本内完成年度任务的销售员中随机选取2名,奖励海南三亚三日游,求获得此奖励的2名销售员在同一组的概率.答案(1)(0.02+0.08+0.09+2a)4=1,a=0.03.样本中完成年度任务的人数为2000.03=6.(2)样本中完成年度任务的销售员中,第4组有3人,记这3人分别为A1,A2,A3;第5组有3人,记这3人分别为B1,B2,B3,从这6人中随机抽取2名,所有的基本事件为A1A2,A1A3,A1B1,A1B2,A1B3,A2A3,A2B1,A2B2,A2B3,A3B1,A3B2,A3B3,B1B2,B1B3,B2B3,共15个,获得此奖励的2名销售员在同一组的基本事件分别为A1A2,A1A3,A2A3,B1B2,B1B3,B2B3,共6个,故所求概率为615=25.方法2样本的数字特征的求解及其应用1.(2015山东,6,5分)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图.考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.B.C.D.答案B2.(2018四川德阳模拟,13)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(10分制)的频数分布直方图如图所示,如果得分的中位数为a,众数为b,平均数为c,则a、b、c中的最大者是.答案c方法3回归直线方程的求解与运用1.(2020届河南南阳第一中学模拟,1)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线y=-15x+1上,则这组样本数据的样本相关系数为()A.-1B.1C.-15D.15答案A2.(2018湘东五校12月联考,18)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x()1011131286就诊人数y222529261612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月数据的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据求出y关于x的线性回归方程y=bx+a;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?参考公式:b=i=1nxiyi-nxyi=1nxi2-nx2=i=1n(xi-x)(yi-y)i=1(xi-x)2,a=y-bx;参考数据:1125+1329+1226+816=1092,112+132+122+82=498.答案(1)设抽到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,所以P(A)=515=13.(2)由题表中数据求得x=11,y=24,由公式求得b=187,则a=y-bx=-307,所以y关于x的线性回归方程为y=187x-307.(3)由(2)知,当x=10时,y=1507,1507-222,当x=6时,y=787,787-122.706,所以据此列联表判断,在犯错误的概率不超过0.10的前提下,认为网购迷与年龄不超过40岁有关.(2)由频数分布直方图知,超级网购迷共有10人,记其中年龄超过40岁的2名市民为A、B,其余8名市民记为c、d、e、f、g、h、m、n,现从10人中任取2人,基本事件有AB、Ac、Ad、Ae、Af、Ag、Ah、Am、An、Bc、Bd、Be、Bf、Bg、Bh、Bm、Bn、cd、ce、cf、cg、ch、cm、cn、de、df、dg、dh、dm、dn、ef、eg、eh、em、en、fg、fh、fm、fn、gh、gm、gn、hm、hn、mn,共有45种,其中至少有1名市民年龄超过40岁的基本事件有AB、Ac、Ad、Ae、Af、Ag、Ah、Am、An、Bc、Bd、Be、Bf、Bg、Bh、Bm、Bn,共17种,故所求的概率P=1745.【五年高考】A组统一命题课标卷题组考点一抽样方法1.(2019课标全国,6,5分)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生答案C2.(2018课标全国,14,5分)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.答案分层抽样考点二统计图表1.(2018课标全国,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A2.(2017课标全国,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A3.(2015课标,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D4.(2018课标全国,19,12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)答案(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.20.1+10.1+2.60.1+20.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150(0.051+0.153+0.252+0.354+0.459+0.5526+0.655)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2=150(0.051+0.155+0.2513+0.3510+0.4516+0.555)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)365=47.45(m3).考点三样本的数字特征1.(2019课标全国,4,5分)西游记三国演义水浒传和红楼梦是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过西游记或红楼梦的学生共有90位,阅读过红楼梦的学生共有80位,阅读过西游记且阅读过红楼梦的学生共有60位,则该校阅读过西游记的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8答案C2.(2017课标全国,2,5分)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,xn的平均数B.x1,x2,xn的标准差C.x1,x2,xn的最大值D.x1,x2,xn的中位数答案B3.(2019课标全国,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).答案本题主要考查频率分布直方图的含义,以及用频率分布直方图估计样本的数字特征,通过实际问题的应用考查学生的运算求解能力,考查了数学运算的核心素养,体现了应用意识.(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为20.15+30.20+40.30+50.20+60.10+70.05=4.05.乙离子残留百分比的平均值的估计值为30.05+40.10+50.15+60.35+70.20+80.15=6.00.4.(2019课标全国,19,12分)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组-0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:748.602.答案本题考查了统计的基础知识、基本思想和方法,考查学生对频数分布表的理解与应用,考查样本的平均数,标准差等数字特征的计算方法,以及对现实社会中实际数据的分析处理能力.(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y=1100(-0.102+0.1024+0.3053+0.5014+0.707)=0.30,s2=1100i=15ni(yi-y)2=11002(-0.40)2+24(-0.20)2+5302+140.202+70.402=0.0296,s=0.0296=0.02740.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.考点四变量间的相关性1.(2017课标全国,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得x=116i=116xi=9.97,s=116i=116(xi-x)2=116(i=116xi2-16x2)0.212,i=116(i-8.5)218.439,i=116(xi-x)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,16.(1)求(xi,i)(i=1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(x-3s,x+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(i)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ii)在(x-3s,x+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(xi,yi)(i=1,2,n)的相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2.0.0080.09.答案(1)由样本数据得(xi,i)(i=1,2,16)的相关系数为r=i=116(xi-x)(i-8.5)i=116(xi-x)2i=116(i-8.5)2=-2.780.2121618.439-0.18.由于|r|3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.2.(2018课标全国,18,12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表;超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k)0.0500.0100.001k3.8416.63510.828.答案(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.(2)由茎叶图知m=79+812=80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2=40(1515-55)220202020=106.635,所以有99%的把握认为两种生产方式的效率有差异.3.(2017课标全国,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量50kg箱产量50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:P(K2k)0.0500.0100.001k3.8416.63510.828,K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).答案(1)旧养殖法的箱产量低于50kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表:箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg到55kg之间,旧养殖法的箱产量平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.B组自主命题省(区、市)卷题组考点一抽样方法1.(2015湖南,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是()A.3B.4C.5D.6答案B2.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案18考点二统计图表1.(2015湖北,14,5分)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示.(1)直方图中的a=;(2)在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为.答案(1)3(2)60002.(2017北京,17,13分)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:20,30),30,40),80,90,并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.答案(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)10=0.9,分数在区间40,50)内的人数为100-1000.9-5=5.所以总体中分数在区间40,50)内的人数估计为4005100=20.(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)10100=60,所以样本中分数不小于70的男生人数为6012=30.所以样本中的男生人数为302=60,女生人数为100-60=40,男生和女生人数的比例为6040=32.所以根据分层抽样原理,总体中男生和女生人数的比例估计为32.考点三样本的数字特征1.(2017山东,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7答案A2.(2019江苏,5,5分)已知一组数据6,7,8,8,9,10,则该组数据的方差是.答案533.(2018江苏,3,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.8999011答案904.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.答案0.1考点四变量间的相关性1.(2015湖北,4,5分)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关答案C2.(2015重庆,17,13分)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程y=bt+a;(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.附:回归方程y=bt+a中,b=i=1ntiyi-ntyi=1nti2-nt2,a=y-bt.答案(1)列表计算如下:itiyiti2tiyi11515226412337921448163255102550153655120这里n=5,t=1ni=1nti=155=3,y=1ni=1nyi=365=7.2.又ltt=i=1nti2-nt2=55-532=10,lty=i=1ntiyi-nty=120-537.2=12,从而b=ltyltt=1210=1.2,a=y-bt=7.2-1.23=3.6,故所求回归方程为y=1.2t+3.6.(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为y=1.26+3.6=10.8(千亿元).C组教师专用题组考点一抽样方法1.(2015湖北,2,5分)我国古代数学名著数书九章有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石答案B2.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1800青年教师1600合计4300A.90B.100C.180D.300答案C3.(2014四川,2,5分)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是()A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案A4.(2014重庆,3,5分)某中学有高中生3500人,初中生1500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A.100B.150C.200D.250答案A5.(2014广东,6,5分)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为()A.50B.40C.25D.20答案C6.(2014湖南,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()A.p1=p2p3B.p2=p3p1C.p1=p319时,y=3800+500(x-19)=500x-5700,所以y与x的函数解析式为y=3800,x19,500x-5700,x19(xN).(4分)(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(5分)(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800元,20台的费用为4300元,10台的费用为4800元,因此这100台机器在购买易损零件上所需费用的平均数为1100(380070+430020+480010)=4000(元).(7分)若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000元,10台的费用为4500元,因此这100台机器在购买易损零件上所需费用的平均数为1100(400090+450010)=4050(元).(10分)比较两个平均数可知,购买1台机器的同时应购买19个易损零件.(12分
展开阅读全文