资源描述
第一讲统计、统计案例(40分钟70分)一、选择题(每小题5分,共25分)1.(2018抚顺二模)下面给出的是某校高三(2)班50名学生某次测试数学成绩的频率分布折线图,根据图中所提供的信息,则下列结论正确的是A.成绩是50分或100分的人数是0B.成绩为75分的人数为20C.成绩为60分的频率为0.18D.成绩落在6080分的人数为29【解析】选D.把频率分布直方图各个小长方形上边的中点用线段连接起来,就得到频率分布折线图,为了方便看图,习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右端点没有实际意义,所以A,B,C都是错误的,成绩落在6080分的频率为(0.040+0.018)10=0.58,成绩落在6080分的人数为0.5850=29,所以D是正确的.2.(2018河南实验中学一模)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则()A.x=4,s22C.x4,s24,s22【解析】选A.由平均数、方差的计算公式可得x=74+48=4,s2=2782.3.(2018梧州一模)若6名男生和9名女生身高(单位:cm)的茎叶图如图,则男生的平均身高与女生身高的中位数分别为()A.181, 166B.181, 168 C.180, 166D.180, 168【解析】选B.男生身高的数据为173,176,178,180,186,193,所以平均数为x=173+176+178+180+186+1936=181,女生身高的数据为162,163,166,167,168, 170,176,184,185,所以中位数为168.4.(2018衡水中学一模)如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强【解析】选B.由散点图可知去掉D(3,10)后,y与x的相关性增强,所以相关系数变大,相关指数变大,残差平方和变小,所以A,C,D都是正确的,B是错误的.5.(2018东北五校联考)下列命题:在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好;两个变量相关性越强,则相关系数的绝对值就越接近于1;在回归直线方程=-0.5x+2中,当解释变量x每增加一个单位时,预报变量平均减少0.5个单位;对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.其中正确命题的个数是()A.1个B.2个C.3个D.4个【解析】选C.根据相关系数的意义,都是正确的,根据回归直线方程的系数的意义,是正确的,根据独立性检验的意义,当随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越小,所以是错误的.所以正确命题的个数是3.二、填空题(每小题5分,共15分)6.有100件产品编号从00到99,用系统抽样方法从中抽取5件产品进行检验,分组后每组按照相同的间隔抽取产品,若第5组抽取的产品编号为91,则第2组抽取的产品编号为_.【解析】因为要从100件产品中抽取5件,所以分成20组,每组抽一个,第5组抽取的产品编号是91,所以第2组抽取的产品编号为91-320=31.答案:317.(2018蚌埠二模)已知由样本数据点集合(xi,yi)|i=1,2,.n求得的回归直线方程为=1.5x+0.5,且x=3.现发现两个数据点(1.1,2.1)和(4.9,7.9)误差较大,去除后重新求得的回归直线l的斜率为1.2,那么,当x=2时,y的估计值为_.【解析】将x=3代入=1.5x+0.5得y=5.所以样本中心点为(3,5),由数据点(1.1,2.1)和(4.9,7.9)知:1.1+4.92=3,2.1+7.92=5,故去除这两个数据点后,样本中心点不变.设新的回归直线方程为=1.2x+b,将样本中心点坐标代入得:b=1.4,所以,当x=2时,y的估计值为3.8.答案:3.88.下图为国家统计局发布的2015年以来我国季度工业产能利用率的折线图.说明:在统计学中,同比是指本期统计数据与上一年同期统计数据相比较,例如2016年第二季度与2015年第二季度相比较;环比是指本期统计数据与上期统计数据相比较,例如2015年第二季度与2015年第一季度相比较.根据上述信息,有以下结论:2016年第三季度和第四季度环比都有提高;2017年第一季度和第二季度环比都有提高2016年第三季度和第四季度同比都有提高2017年第一季度和第二季度同比都有提高请把正确结论的序号填写在_上.【解析】根据环比的意义,正确,根据同比的意义,2016年第三季度同比是降低的,所以错误,正确.所以正确结论的序号为.答案:三、解答题(每小题10分,共30分)9.某种产品的宣传费支出x与销售额y(单位:万元)之间有如下对应数据:x24568y3040605070(1)画出散点图.(2)求回归直线方程.【解析】(1)根据表中所列数据可得散点图如图所示:(2)计算得:x=255=5,y=2505=50,i=15xi2=145,i=15xiyi=1 380.于是可得= i = 15xiyi-5xyi = 15xi2-5x2 = 1 380-5550145-552 = 6.5,=y-x=50-6.55=17.5,因此,所求回归直线方程是=6.5x+17.5.10.(2018广元一模)某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的课外体育锻炼平均每天运动的时间(单位:分钟)进行调查,将收集的数据分成0,10),10,20),20,30),30,40),40,50),50,60)六组,并作出频率分布直方图(如图),将日均课外体育锻炼时间不低于40分钟的学生评价为“课外体育达标”.(1)请根据直方图中的数据填写下面的22列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关?(2)在0,10),40,50)这两组中采取分层抽样,抽取6人,再从这6名学生中随机抽取2人参加体育知识问卷调查,求这2人中一人来自“课外体育达标”和一人来自“课外体育不达标”的概率.附加公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)【解析】(1)由题意得“课外体育达标”人数:200(0.02+0.005)10=50,则不达标人数为150,所以列联表如下:课外体育不达标课外体育达标合计男603090女9020110合计15050200所以K2=200(6020-3090)21505090110=200336.0616.635所以在犯错误的概率不超过0.01的前提下没有理由(或不能)认为“课外体育达标”与性别有关.(2)由题意在0,10),40,50)分别有20人,40人,则采取分层抽样在0,10)抽取的人数为:20660=2人,在40,50)抽取的人数为:40660=4人,0,10)抽取的人为A,B,在40,50)抽取的人为a,b,c,d,从这6人中随机抽取2人的情况为:AB,Aa,Ab,Ac,Ad,Ba,Bb,Bc,Bd,ab, ac,ad,bc,bd,cd共15种,2人中一人来自“课外体育达标”和一人来自“课外体育不达标”共有:Aa,Ab, Ac,Ad,Ba,Bb,Bc,Bd共8种,11.“双十一”已经成为网民们的网购狂欢节,某电子商务平台对某市的网民在今年“双十一”的网购情况进行摸底调查,用随机抽样的方法抽取了100人,其消费金额t(百元)的频率分布直方图如图所示:(1)求网民消费金额t的平均值和中位数t0.(2)把下表中空格里的数填上,能否有90%的把握或在犯错误的概率不超过0.1的前提下认为网购消费与性别有关.男女合计tt0tt0252550tt0203050合计4555100K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100(2530-2520)245555050=100991.016.635,因此在犯错误的概率不超过0.01的前提下(有99%的把握)认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖者男生为A,B,C,D,女生为E,F,则任取两个有AB, AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种.其中一男一女有AE,AF,BE,BF,CE,CF,DE,DF,共8种.故抽出一男一女的概率是P=815.
展开阅读全文