资源描述
第11讲回归分析与独立性检验1(2016年河南开封一模)下列说法错误的是()A当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B在线性回归分析中,相关系数r的值越大,变量间的相关性越强C在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好2(2015年湖北)已知变量x和y满足关系y0.1x1,变量y与z正相关下列结论正确的是()Ax与y负相关,x与z负相关Bx与y正相关,x与z正相关Cx与y正相关,x与z负相关Dx与y负相关,x与z正相关3为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机选取了60名高中生,通过问卷调查,得到以下数据:项目作文成绩优秀作文成绩一般合计课外阅读量较大221032课外阅读量一般82028合计303060由以上数据,计算得出K29.643.根据临界值表,以下说法正确的是()A没有充足的理由认为课外阅读量较大与作文成绩优秀有关B有0.5%的把握认为课外阅读量较大与作文成绩优秀有关C有99.5%的把握认为课外阅读量较大与作文成绩优秀有关D有99.9%的把握认为课外阅读量较大与作文成绩优秀有关4(2016年重庆)已知变量x,y的取值如下表所示:x456y867若y与x线性相关,且线性回归方程为x2,则的值为()A1 B. C. D.5甲、乙、丙、丁四名同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A,B两变量有更强的线性相关性()A甲 B乙 C丙 D丁6(2015年福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x /万元8.28.610.011.311.9支出y/万元6.27.58.08.59.8根据上表可得回归直线方程x ,其中0.76,.据此估计,该社区一户收入为15万元的家庭年支出为()A11.4万元 B11.8万元C12.0万元 D12.2万元7(2017年陕西西安质检)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法得回归直线方程0.68x54.6,表中有一个数据模糊不清,请你推断该数据的值为()零件个数x/个1020304050加工时间y/min62758189A.68 B68.2 C70 D758(2015年北京)高三年级267名学生参加期末考试,某班37名学生的语文成绩、数学成绩与总成绩在全年级中的排名情况如图X9111,甲、乙、丙为该班三名学生图X9111从这次考试成绩看,(1)在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是_;(2)在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是_9(2015年重庆)随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款(年底余额)如下表.年份20102011201220132014时间代号t12345储蓄存款y/千亿元567810(1)求y关于t的回归方程t;(2)用所求回归方程预测该地区2015年(t6)的人民币储蓄存款附:回归方程t中: 10(2017年广东广州一模)某企业生产的某种产品被检测出其中一项质量指标存在问题该企业为了检查生产该产品的甲,乙两条流水线的生产情况,随机地从这两条流水线上生产的大量产品中各抽取50件产品作为样本,测出它们的这一项质量指标值若该项质量指标值落在(195,210内,则为合格品,否则为不合格品下表是甲流水线样本的频数分布表,图X9112是乙流水线样本的频率分布直方图甲流水线样本的频数分布表质量指标值频数(190,1959(195,20010(200,20517(205,2108(210,2156乙流水线样本频率分布直方图图X9112(1)根据图X9112,估计乙流水线生产产品该质量指标值的中位数;(2)若将频率视为概率,某个月内甲、乙两条流水线均生产了5000件产品,则甲、乙两条流水线分别生产出不合格品约多少件?(3)根据已知条件完成下面22列联表,并回答是否有85%的把握认为“该企业生产的这种产品的质量指标值与甲、乙两条流水线的选择有关”?甲生产线乙生产线合计合格品不合格品合计附:K2(其中nabcd为样本容量)P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828第11讲回归分析与独立性检验1B解析:根据相关关系的概念知A正确;当r0时,r越大,相关性越强,当r0时,r越大,相关性越弱,故B不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好,二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C,D正确故选B.2A解析:因为变量x和y满足关系y0.1x1,其中0.10),则将y0.1x1代入即可得zk(0.1x1)b0.1kx(kb)所以0.1k0.所以x与z负相关故选A.3C4A解析:由表格,得5,7.代入线性回归方程得752.解得1.故选A.5D解析:在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,拟合的效果越好,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的线性相关性6B解析:由已知得10(万元),8(万元),故80.76100.4.所以回归直线方程为0.76x0.4,该社区一户收入为15万元的家庭年支出为0.76150.411.8(万元)故选B.7A解析:设表中有一个模糊看不清数据为m,由表中数据,得30,由最小二乘法求得回归方程0.68x54.6,将30,代入回归直线方程,得m68.故选A.8(1)乙(2)数学解析:(1)由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙(2)由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学9解:(1)列表计算如下:itiyittiyi11515226412337921448163255102550153655120这里n5,3,7.2.又lntn25553210,lnyyin120537.212.从而1.2,7.21.233.6.故所求回归方程为1.2t3.6.(2)将t6代入回归方程可预测该地区2015年的人民币储蓄存款为1.263.610.8(千亿元)10解:(1)设乙流水线生产产品的该项质量指标值的中位数为x,因为048(0.0120.0320.052)50.5(0.0120.0320.0520.076)50.86,所以(0.0120.0320.052)50.076(x205)0.5, 解得x.(2)由甲、乙两条流水线各抽取的50件产品可得,甲流水线生产的不合格品有15件, 则甲流水线生产的产品为不合格品的概率为p甲, 乙流水线生产的产品为不合格品的概率为p乙(0.0120.028)5, 于是,若某个月内甲、乙两条流水线均生产了5000件产品,则甲、乙两条流水线生产的不合格品件数分别为50001500,50001000.(3)22列联表:甲生产线乙生产线合计合格品354075不合格品151025合计5050100则K21.3.因为1.32.072,所以没有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”
展开阅读全文