资源描述
课时分层作业 五十六变量间的相关关系与统计案例一、选择题(每小题5分,共25分)1.(2018新乡模拟)下列四个选项中,关于两个变量所具有的相关关系描述正确的是()A.圆的面积与半径具有相关性B.纯净度与净化次数不具有相关性C.作物的产量与人的耕耘是负相关D.学习成绩与学习效率是正相关【解析】选D.对于A,圆的面积与半径是确定的关系,是函数关系,不是相关关系,A错误;对于B,一般地,净化次数越多,纯净度就越高,所以纯净度与净化次数是正相关关系,B错误;对于C,一般地,作物的产量与人的耕耘是一种正相关关系,所以C错误;对于D,学习成绩与学习效率是一种正相关关系,所以D正确.2.(2018邯郸模拟)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有效果的图形是()【解析】选D. 选项D中不服药样本中患病的频率与服药样本中患病的频率差距最大.3.已知变量x,y之间具有线性相关关系,其回归方程为=-3+x,若xi=17,yi=4,则的值为()A.2B.1C.-2D.-1【解析】选A.依题意知,=1.7,=0.4,而直线=-3+x一定经过点(,),则-3+1.7=0.4,解得=2.【变式备选】(2018威海模拟)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg【解析】选D.由回归方程为=0.85x-85.71知随x的增大而增大,所以与x具有正的线性相关关系,由最小二乘法建立的回归方程的过程知=x+=x+-,所以回归直线过样本点的中心(,),利用回归方程可以预测估计但不能作断定,所以D不正确.4.(2018重庆模拟)某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线L.根据图中数据,下列对该样本描述错误的是()A.据样本数据估计,该地区青少年身高与年龄成正相关B.所抽取数据中,5 000名青少年平均身高约为145 cmC.直线L的斜率的值近似等于样本中青少年平均身高每年的增量D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线L上【解析】选D.由图知该地区青少年身高与年龄成正相关,A选项描述正确;由图中数据得5 000名青少年平均身高为=145 cm,B选项描述正确;由回归直线L的斜率定义知C选项描述正确;对于D选项中5种年龄段各取一人的身高数据不一定能代表所有的平均身高,所以D选项描述不正确.5.(2018洛阳模拟)通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男女总计愿意走斑马线402060愿意走人行天桥203050总计6050110由K2=算得K2的观测值k=7.8.附表:P(K2k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A.在犯错误的概率不超过0.01的前提下认为“选择过马路的方式与性别有关”B.在犯错误的概率不超过0.01的前提下认为“选择过马路的方式与性别无关”C.在犯错误的概率不超过0.001的前提下,认为“选择过马路的方式与性别有关”D.在犯错误的概率不超过0.001的前提下,认为“选择过马路的方式与性别无关”【解析】选A.因为K2的观测值k7.86.635,所以在犯错误的概率不超过0.01的前提下认为“选择过马路的方式与性别有关”.【变式备选】(2018安庆模拟)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1 成绩性别不及格及格总计男61420女102232总计163652表2 视力 性别好差总计男41620女122032总计163652表3 智商 性别偏高正常总计男81220女82432总计163652表4 阅读量 性别丰富不丰富总计男14620女23032总计163652A.成绩B.视力C.智商D.阅读量【解析】选D.因为k1=,k2=,k3=,k4=,则有k4k2k3k1,所以阅读量与性别关联的可能性最大.二、填空题(每小题5分,共15分)6.下面是22列联表: y1y2总计x1a2163x2222547总计b46110则表中a=_ ,b=_. 【解析】因为a+21=63,所以a=42.又a+22=b,所以b=64. 答案:42647.为了研究某种细菌在特定环境下,随时间变化繁殖情况,得如下实验数据,计算得回归直线方程为=0.85x-0.25.由以上信息,得到下表中c的值为_ .天数t(天)34567繁殖个数y(千个)2.5344.5c【解题指南】求出横坐标和纵坐标的平均数,写出样本中心点,把样本中心点代入线性回归方程,得到关于c的方程,解方程即可.【解析】因为=(3+4+5+6+7)=5,=(2.5+3+4+4.5+c)=.所以这组数据的样本中心点是(5,),把样本中心点代入回归直线方程=0.85x-0.25,所以=0.855-0.25,所以c=6.答案:68.在西非“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表: 感染未感染总计服用104050未服用203050总计3070100P(K2k0)0.100.050.025k02.7063.8415.024参照附表,在犯错误的概率不超过_的前提下,认为“小动物是否被感染与服用疫苗有关”.【解析】由题意算得,K2=4.7623.841,参照附表,可得:在犯错误的概率不超过0.05的前提下,认为“小动物是否被感染与服用疫苗有关”.答案:0.05三、解答题(每小题10分,共20分)9.(2018重庆模拟)第96届(春季)全国糖酒商品交易会于2017年3月23日至25日在四川举办,展馆附近一家四川特色小吃店为了研究参会人数与本店所需原材料数量的关系,在交易会前查阅了最近5次交易会的参会人数x(万人)与店铺所用原材料数量y(袋),得到如下数据:第一次第二次第三次第四次第五次参会人数x(万人)11981012原材料y(袋)2823202529(1)请根据所给五组数据,求出y关于x的线性回归方程=x+.(2)若该店现有原材料12袋,据悉本次交易会大约有13万人参加,为了保证原材料能够满足需要,则该店应至少再补充原材料多少袋?(参考公式:=,=-)【解析】(1)由数据,求得=10,=25,(xi-)(yi-)=13+(-1)(-2)+(-2)(-5)+0+24=23,(xi-)2=12+(-1)2+(-2)2+02+22=10,由公式,求得=2.3,=-=2,y关于x的线性回归方程为=2.3x+2.(2)由x=13,得=31.9,而31.9-12=19.920,所以,该店应至少再补充原材料20袋.10.(2018洛阳模拟)某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)(1)根据以上数据完成下列22列联表.主食蔬菜主食肉类总计50岁以下50岁以上总计(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?并写出简要分析.附:K2=,n=a+b+c+d.P(K2k0)0.0500.0100.001k03.8416.63510.828【解题指南】(1)把握22列联表的意义,准确填入数据.(2)将数据代入随机变量K2的计算公式进行计算,与临界值比较并得出结论.【解析】(1)22列联表如下:主食蔬菜主食肉类总计50岁以下481250岁以上16218总计201030(2)因为K2的观测值k=106.635,所以能在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.1.(5分)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴,y轴的单位长度相同),用回归直线方程=x+近似地刻画其相关关系,根据图形,以下结论最有可能成立的是 ()A.线性相关关系较强,的值为1.25B.线性相关关系较强,的值为0.83C.线性相关关系较强,的值为-0.87D.线性相关关系较弱,无研究价值【解析】选B.由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B.2.(5分)(2018汕头模拟)某厂家为了解销售轿车台数与广告宣传费之间的关系,得到如表统计数据表:根据数据表可得回归直线方程=x+,其中=2.4,=-,据此模型预测广告费用为9万元时,销售轿车台数为()广告费用x(万元)23456销售轿车y(台)3461012A.17B.18C.19D.20【解析】选C.根据表中数据,计算=(2+3+4+5+6)=4,=(3+4+6+10+12)=7,且回归直线方程为=2.4x+,所以=-=7-2.44=-2.6,所以回归方程为=2.4x-2.6;当x=9时,=2.49-2.6=19,即据此模型预测广告费用为9万元时,销售轿车台数为19.3.(5分)2017年某市进行了“经常使用共享单车与年龄关系”的调查,得下面22列联表:年轻人非年轻人总计经常使用单车用户10020120不常使用单车用户602080总计16040200则得到的K2=_(小数点后保留一位).【解析】根据表中数据,计算K2的观测值k=2.1.答案:2.1【误区警示】独立性检验中统计量K2的观测值k的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.4.(12分)(2018长春模拟)为了打好脱贫攻坚战,某贫困县农科院针对玉米种植情况进行调研,力争有效地改良玉米品种,为农民提供技术支援.现对已选出的一组玉米的茎高进行统计,获得茎叶图如图(单位:厘米),设茎高大于或等于180厘米的玉米为高茎玉米,否则为矮茎玉米.(1) 完成22列联表,并判断是否可以在犯错误概率不超过0.01的前提下,认为抗倒伏与玉米矮茎有关?P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828(K2=,其中n=a+b+c+d)(2)为了改良玉米品种,现采用分层抽样的方法从抗倒伏的玉米中抽出5株,再从这5株玉米中选取2株进行杂交试验,选取的植株均为矮茎的概率是多少?【解析】(1)根据统计数据作出22列联表如下:抗倒伏易倒伏总计矮茎15419高茎101626总计252045K2=7.2876.635,因此可以在犯错误的概率不超过0.01的前提下,认为抗倒伏与玉米矮茎有关.(2)分层抽样后,高茎玉米有2株,设为A,B,矮茎玉米有3株,设为a,b,c,从中取出2株的取法有AB,Aa,Ab,Ac,Ba,Bb,Bc,ab,ac,bc,共10种,其中均为矮茎的选取方式有ab,ac,bc共3种,因此选取的植株均为矮茎的概率是.5.(13分)(2018汕头模拟)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:使用年数x234567售价y201286.44.43z=ln y3.002.482.081.861.481.10下面是z关于x的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明.(2)求y关于x的回归方程并预测某辆A型号二手车当使用年数为9年时售价约为多少?(,小数点后保留两位有效数字).(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?参考公式:回归方程=x+中斜率和截距的最小二乘估计公式分别为:=,=-.r=.参考数据:xiyi=187.4,xizi=47.64,=139,4.18,=13.96,=1.53,ln 1.460.38,ln 0.711 8-0.34.【解析】(1)由题意,计算=(2+3+4+5+6+7)=4.5,=(3+2.48+2.08+1.86+1.48+1.10)=2,且xizi=47.64,4.18,=1.53,所以r=.=-0.99;所以z与x的相关系数大约为0.99,说明z与x的线性相关程度很高.(2)利用最小二乘估计公式计算=-0.36,所以=-=2+0.364.5=3.62,所以z与x的线性回归方程是=-0.36x+3.62,又z=ln y,所以y关于x的回归方程是=e-0.36x+3.62;令x=9,解得=e-0.369+3.621.46,即预测某辆A型号二手车当使用年数为9年时售价约1.46万元.(3)当0.711 8时,e-0.36x+3.620.711 8=eln 0.711 8=e-0.34,所以-0.36x+3.62-0.34,解得x11,因此预测在收购该型号二手车时车辆的使用年数不得超过11年.
展开阅读全文