资源描述
变量间的相关关系、统计案例建议用时:45分钟一、选择题1(2019泉州模拟)在下列各图中,两个变量具有相关关系的是()(1)(2)(3)(4)A(1)(2)B(1)(3)C(2)(4)D(2)(3)D(1)是函数关系,(4)不具有相关关系,排除A,B,C,故选D.2(2019肇庆模拟)如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程yb1xa1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程yb2xa2,相关系数为r2.则()A0r1r21B0r2r11C1r1r20D1r2r10D根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,且点(10,21)是离群值;方案一中,没剔除离群值,线性相关性弱些,成负相关;方案二中,剔除离群值,线性相关性强些,也是负相关所以相关系数1r2r10.故选D.3(2019石家庄二模)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的()A样本中的女生数量多于男生数量B样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C样本中的男生偏爱两理一文D样本中的女生偏爱两文一理D由条形图知女生数量多于男生数量,有两理一文意愿的学生数量多于有两文一理意愿的学生数量,男生偏爱两理一文,女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故选D.4对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i1,2,8),其线性回归方程是x,且x1x2x3x82(y1y2y3y8)6,则实数的值是()A.B.C.D.B依题意可知样本点的中心为,则,解得.5(2019中原六校联考)某医疗所为了检查新开发的流感疫苗对甲型H1N1流感的预防作用,把1 000名注射疫苗的人与另外1 000名未注射疫苗的人半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算得P(26.635)0.01,则下列说法正确的是()A这种疫苗能起到预防甲型H1N1流感的有效率为1%B若某人未使用疫苗则他在半年中有99%的可能性得甲型H1N1流感C有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”D有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”C因为P(26.635)0.01,这说明假设不合理的程度为99%,即这种疫苗不能起到预防甲型H1N1流感的作用不合理的程度约为99%,所以有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”,故选C.二、填空题6(2019湖南衡阳联考)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:甲乙丙丁r0.820.780.690.85m106115124103则_同学的试验结果体现A,B两变量有更强的线性相关性丁r越大,m越小,线性相关性越强7某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如下表),由最小二乘法求得回归方程0.67x54.9.零件数x/个1020304050加工时间y/min62758189现发现表中有一个数据看不清,请你推断出该数据的值为_68由30,得0.673054.975.设表中的“模糊数字”为a,则62a758189755,即a68.8某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得23.918,经查临界值表知P(23.841)0.05.则下列结论中,正确结论的序号是_有95%的把握认为“这种血清能起到预防感冒的作用”;若某人未使用该血清,那么他在一年中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为5%.23.9183.841,而P(23.841)0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”要注意我们检验的假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆三、解答题9经调查,3个成年人中就有一个高血压,那么什么是高血压?血压多少是正常的?经国际卫生组织对大量不同年龄的人群进行血压调查,得出随年龄变化,收缩压的正常值变化情况如表所示年龄x2832384248525862收缩压y (单位:mm Hg)114118122127129135140147其中,x17 232,xiyi47 384.(1)请画出表中数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(,的值精确到0.01)(3)若规定,一个人的收缩压为标准值的0.91.06倍,则为血压正常人群;收缩压为标准值的1.061.12倍,则为轻度高血压人群;收缩压为标准值的1.121.20倍,则为中度高血压人群;收缩压为标准值的1.20倍及以上,则为高度高血压人群一位收缩压为180 mmHg的70岁的老人,属于哪类人群?解(1)画出表中数据的散点图如图所示(2)45,129,0.91,1290.914588.05,回归直线方程0.91x88.05.(3)根据回归直线方程的预测,年龄为70岁的老人标准收缩压为0.917088.05151.75(mgHg),1.19,且1.121.191.20,收缩压为180 mmHg的70岁老人属于中度高血压人群10(2019清华大学附中三模)手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性、300名男性)进行调查,对手机进行评分,评分的频数分布表如下:女性用户分值区间50,60)60,70)70,80)80,90)90,100频数2040805010男性用户分值区间50,60)60,70)70,80)80,90)90,100频数4575906030(1)完成下列频率分布直方图,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);(2)把评分不低于70分的用户称为“评分良好用户”,能否有90%的把握认为是否是评分良好用户与性别有关?参考公式及数据:2,其中nabcd.P(2k)0.100.050.010.001k2.7063.8416.63510.828解(1)女性用户和男性用户的频率分布直方图分别如下图所示:女性用户男性用户由图可得女性用户的波动小,男性用户的波动大(2)由题可得22列联表如下:女性用户男性用户合计评分良好用户140180320不是评分良好用户60120180合计200300500则25.2082.706,所以有90%的把握认为是否是评分良好用户与性别有关1(2019衡水中学调研)已知变量x,y之间的线性回归方程为0.7x10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误的是()x681012y6m32A变量x,y之间呈负相关关系B可以预测,当x20时,3.7Cm4D该回归直线必过点(9,4)C由0.70,得变量x,y之间呈负相关关系,故A正确;当x20时,0.72010.33.7,故B正确;由表格数据可知(681012)9,(6m32),则0.7910.3,解得m5,故C错;由m5,得4,所以该回归直线必过点(9,4),故D正确故选C.2(2019大连模拟)在对具有线性相关的两个变量x和y进行统计分析时,得到如下数据:x4m81012y12356由表中数据求得y关于x的回归方程为0.65x1.8,则(4,1),(m,2),(8,3)这三个样本点中落在回归直线下方的有()A1个B2个C3个D0个B由表中数据,得(4m81012),(12356)3.4,代入回归方程0.65x1.8中,得3.40.651.8,计算得出m6.所以x4时,0.6541.80.81,点(4,1)在回归直线0.65x1.8上方;x6时,0.6561.82.12,点(6,2)在回归直线0.65x1.8下方;x8时,0.6581.83.43,点(8,3)在回归直线0.65x1.8下方综上,(4,1),(6,2),(8,3)这三个样本点中落在回归直线下方的有2个故选B.3针对时下的“韩剧热”,某校团委对“学生性别和喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有_人P(2k)0.0500.0100.001k3.8416.63510.82818设男生人数为x,由题意可得列联表如下:喜欢韩剧不喜欢韩剧总计男生x女生总计若有95%的把握认为是否喜欢韩剧和性别有关,则k3.841,即k3.841,解得x12.697.因为各部分人数均为整数,所以x是18的倍数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有18人4(2019莆田二模)某芯片公司为制定下一年的研发投入计划,需了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响该公司对历史数据进行对比分析,建立了两个函数模型:yx2,yext,其中,t均为常数,e为自然对数的底数现该公司收集了近12年的年研发资金投入量xi和年销售额yi的数据,i1,2,12,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值令uix,viln yi(i1,2,12),经计算得如下数据: (xi)2 (yi)220667702004604.20(ui)2 (ui)(yi) (vi)2 (xi)(vi)3 125 00021 5000.30814(1)设ui和yi的相关系数为r1,xi和vi的相关系数为r2,请从相关系数的角度,选择一个拟合程度更好的模型;(2)()根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);()若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少亿元附:相关系数r,回归直线x中斜率和截距的最小二乘估计公式分别为:,;参考数据:308477,9.486 8,e4.499 890.解(1)由题意,r10.86,r20.91,则|r1|r2|,因此从相关系数的角度,模型yext的拟合程度更好(2)()先建立v关于x的线性回归方程,由yext,得ln ytx,即vtx,由于0.0180.02,t4.200.018203.84,所以v关于x的线性回归方程为0.02x3.84,所以ln 0.02x3.84,则e0.02x3.84;()下一年销售额y需达到90亿元,即y90,代入e0.02x3.84,得90e0.02x3.84,又e4.499890,所以4.499 80.02x3.84,所以x32.99,所以预测下一年的研发资金投入量约是32.99亿元1(多选题)独立性检验中,为了调查变量X与变量Y的关系,经过计算得到P(26.635)0.01,表示的意义是()A有99%的把握认为变量X与变量Y没有关系B有1%的把握认为变量X与变量Y有关系C有99%的把握认为变量X与变量Y有关系D有1%的把握认为变量X与变量Y没有关系CD独立性检验中,由P(K26.635)0.01,它表示的意义是:有1%的把握认为变量X与变量Y没有关系,D正确;即有99%的把握认为变量X与变量Y有关系,C正确故选CD.2已知由一组样本数据确定的回归直线方程为1.5x1,且2,发现有两组数据(2.2,2.9)与(1.8,5.1)误差较大,去掉这两组数据后,重新求得回归直线的斜率为1,那么当x4时,y的估计值为_6已知2,则1.5214,由题意知去掉两组数据后中心没变,设重新求得的回归直线方程为xb,将样本点的中心(2, 4)代入得b2,因而当x4时,y的估计值为6.
展开阅读全文