山东省齐河县高考数学三轮冲刺 专题 回归分析及独立性检验练习(含解析).doc

上传人:tian****1990 文档编号:6326465 上传时间:2020-02-22 格式:DOC 页数:12 大小:2.41MB
返回 下载 相关 举报
山东省齐河县高考数学三轮冲刺 专题 回归分析及独立性检验练习(含解析).doc_第1页
第1页 / 共12页
山东省齐河县高考数学三轮冲刺 专题 回归分析及独立性检验练习(含解析).doc_第2页
第2页 / 共12页
山东省齐河县高考数学三轮冲刺 专题 回归分析及独立性检验练习(含解析).doc_第3页
第3页 / 共12页
点击查看更多>>
资源描述
回归分析及独立性检验一、选择题(本大题共12小题,共60分)1. 设某中学的高中女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,3,n),用最小二乘法近似得到回归直线方程为y=0.85x-85.71,则下列结论中不正确的是( )A. y与x具有正线性相关关系B. 回归直线过样本的中心点(x.,y.)C. 若该中学某高中女生身高增加1cm,则其体重约增加0.85kgD. 若该中学某高中女生身高为160cm,则可断定其体重必为50.29kg(正确答案)D【分析】本题考查了回归分析与线性回归方程的应用问题,是基础题目.根据回归分析与线性回归方程的意义,对选项中的命题进行分析、判断正误即可【解答】解:由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,A正确;由线性回归方程必过样本中心点(x.,y.),因此B正确;由线性回归方程中系数的意义知,x每增加1cm,其体重约增加0.85kg,C正确;当某女生的身高为160cm时,其体重估计值是50.29kg,而不是具体值,因此D错误故选:D2. 为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y=bx+a,已知i=110xi=225,i=110yi=1600,b=4,该班某学生的脚长为24,据此估计其身高为( )A. 160 B. 163 C. 166 D. 170(正确答案)C解:由线性回归方程为y=4x+a,则x.=110i=110xi=22.5,y.=110i=110yi=160,则数据的样本中心点(22.5,160),由回归直线方程样本中心点,则a=y-4x=160-422.5=70,回归直线方程为y=4x+70,当x=24时,y=424+70=166,则估计其身高为166,故选C由数据求得样本中心点,由回归直线方程必过样本中心点,代入即可求得a,将x=24代入回归直线方程即可估计其身高本题考查回归直线方程的求法及回归直线方程的应用,考查计算能力,属于基础题3. 为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.08.59.8据上表得回归直线方程y=bx+a,其中b=0.76,a=y-bx,据此估计,该社区一户收入为15万元家庭年支出为( )A. 11.4万元 B. 11.8万元 C. 12.0万元 D. 12.2万元(正确答案)B解:由题意可得x=15(8.2+8.6+10.0+11.3+11.9)=10,y=15(6.2+7.5+8.0+8.5+9.8)=8,代入回归方程可得a8-0.7610=0.4,回归方程为y=0.76x+0.4,把x=15代入方程可得y=0.7615+0.4=11.8,故选:B由题意可得x-和y-,可得回归方程,把x=15代入方程求得y值即可本题考查线性回归方程,涉及平均值的计算,属基础题4. 下列说法错误的是( )A. 回归直线过样本点的中心(x.,y.)B. 两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C. 在回归直线方程y=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量y平均增加0.2个单位D. 对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小(正确答案)D解:A.回归直线过样本点的中心(x.,y.),正确;B.两个随机变量相关性越强,则相关系数的绝对值越接近1,因此正确;C.在线性回归方程y=0.2x+0.8中,当x每增加1个单位时,预报量平均增加0.2个单位,正确;D.对分类变量X与Y的随机变量K2的观测值k来说,k越大,“X与Y有关系”可信程度越大,因此不正确综上可知:只有D不正确故选:D利用线性回归的有关知识即可判断出本题考查了线性回归的有关知识,考查了推理能力,属于基础题5. 某产品的广告费用x与销售额y的统计数据如下表: 广告费用x(万元)2345销售额y(万元)27394854根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( )A. 65.5万元 B. 66.2万元 C. 67.7万元 D. 72.0万元(正确答案)A解:x.=2+3+4+54=3.5,y.=27+39+48+544=42,数据的样本中心点(3.5,42)在线性回归直线上,回归方程y=bx+a中的b为9.4,42=9.43.5+a,a=9.1,线性回归方程是y=9.4x+9.1,广告费用为6万元时销售额为9.46+9.1=65.5,故选A首先求出所给数据的平均数,得到样本中心点,根据线性回归直线过样本中心点,求出方程中的一个系数,得到线性回归方程,把自变量为6代入,预报出结果本题考查线性回归方程的求法和应用,是一个基础题,本题解答关键是利用线性回归直线必定经过样本中心点6. 观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是( )A. B. C. D. (正确答案)D解:在频率等高条形图中,aa+b与cc+d相差很大时,我们认为两个分类变量有关系,四个选项中,即等高的条形图中x1,x2所占比例相差越大,则分类变量x,y关系越强,故选D在频率等高条形图中,aa+b与cc+d相差很大时,我们认为两个分类变量有关系,即可得出结论本题考查独立性检验内容,使用频率等高条形图,可以粗略的判断两个分类变量是否有关系,但是这种判断无法精确的给出所的结论的可靠程度7. 某小卖部销售一品牌饮料的零售价x(元/瓶)与销量y(瓶)的关系统计如下: 零售价x(元/瓶)3.03.23.43.63.84.0销量y(瓶)504443403528已知x,y的关系符合线性回归方程y=bx+a,其中b=-20,a=y-bx.当单价为4.2元时,估计该小卖部销售这种品牌饮料的销量为( )A. 20 B. 22 C. 24 D. 26(正确答案)D解:x=3.0+3.2+3.4+3.6+3.8+4.06=216=3.5;y=50+44+43+40+35+286=40,a=40-(-20)3.5=110,回归直线方程为:y=bx+a=-20x+110,当x=4.2时,y=-204.2+110=26,故选:D利用平均数公式计算平均数x,y,利用b=-20求出a,即可得到回归直线方程,把x=4.2代入回归方程求出y值本题考查回归方程的求法,考查学生的计算能力,运算要细心8. 为考察A、B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )A. 药物A、B对该疾病均没有预防效果B. 药物A、B对该疾病均有显著的预防效果C. 药物A的预防效果优于药物B的预防效果D. 药物B的预防效果优于药物A的预防效果(正确答案)C解:根据两个表中的等高条形图知,药物A实验显示不服药与服药时患病的差异较药物B实验显示明显大,药物A的预防效果优于药物B的预防效果故选:C根据两个表中的等高条形图看药物A的预防效果优于药物B的预防效果本题考查了等高条形图的应用问题,是基础题9. 下列说法错误的是( )A. 回归直线过样本点的中心(x.,y.)B. 两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C. 对分类变量X与Y,随机变量K2的观测值越大,则判断“X与Y有关系”的把握程度越小D. 在回归直线方程y=0.2x+0.8中,当解释变量x每增加1个单位时预报变量y平均增加0.2个单位(正确答案)C解:A.回归直线过样本点的中心(x.,y.),正确;B.两个随机变量相关性越强,则相关系数的绝对值越接近1,因此正确;C.对分类变量X与Y的随机变量K2的观测值k来说,k越大,“X与Y有关系”可信程度越大,因此不正确;D.在线性回归方程y=0.2x+0.8中,当x每增加1个单位时,预报量平均增加0.2个单位,正确综上可知:只有C不正确故选:C利用线性回归的有关知识即可判断出本题考查了线性回归的有关知识,考查了推理能力,属于中档题10. 在利用最小二乘法求回归方程y=0.67x+54.9时,用到了如表中的5组数据,则表格a中的值为( ) x1020304050y62a758189A. 68 B. 70 C. 75 D. 72(正确答案)A解:由题意可得x=15(10+20+30+40+50)=30,y=15(62+a+75+81+89),因为回归直线方程y=0.67x+54.9,过样本点的中心点,所以15(a+307)=0.6730+54.9,解得a=68 故选A由题意回归直线方程y=0.67x+54.9,过样本点的中心点,即可得a的值本题考查线性回归方程,利用回归直线过样本点的中心点是解决问题的关键,属基础题11. 如表提供了某厂节能降耗改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程为y=0.7x+0.35,则下列结论错误的是( ) x 3 45 6 y 2.5t 44.5 A. 线性回归直线一定过点(4.5,3.5)B. 产品的生产能耗与产量呈正相关C. t的取值必定是3.15D. A产品每多生产1吨,则相应的生产能耗约增加0.7吨(正确答案)C解:x.=14(3+4+5+6)=184=4.5,则y.=0.74.5+0.35=3.5,即线性回归直线一定过点(4.5,3.5),故A正确,0.70,产品的生产能耗与产量呈正相关,故B正确,y.=14(2.5+t+4+4.5)=3.5,得t=3,故C错误,A产品每多生产1吨,则相应的生产能耗约增加0.7吨,故D正确故选:C根据回归直线的性质分别进行判断即可本题主要考查命题的真假判断,根据回归直线的性质分别进行判断是解决本题的关键.比较基础12. 已知x,y的取值如表所示,若y与x线性相关,且y=0.5x+a,则a=( ) x0134y2.24.34.86.7A. 3.5 B. 2.2 C. 4.8 D. 3.2(正确答案)A解:由图表知,x.=2,y.=4.5,代入y=0.5x+a,得.5=0.52+a,解得a=3.5故选:A由图表求得x.=2,y.=4.5,代入回归直线方程得答案本题考查线性回归方程,关键是明确线性回归直线恒过样本中心点,是基础题二、填空题(本大题共4小题,共20分)13. 给出下列命题:线性相关系数r越大,两个变量的线生相关性越强;反之,线性相关性越弱;由变量x和y的数据得到其回归直线方程l:y=bx+a,则l一定经过点P(x.,y.);从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;在回归直线方程y=0.1x+10中,当解释变量x每增加一个单位时,预报变量y增加0.1个单位;其中真命题的序号是_ (正确答案)解:线性相关系数|r|越大,两个变量的线性相关性越强,故不正确;由变量x和y的数据得到其回归直线方程l:y=bx+a,则l一定经过点P(x.,y.),故正确;从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样不是分层抽样,故不正确;可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故正确;在回归直线方y=0.1x+10中,当解释变量x每增加一个单位时,预报变量y平均增加0.1个单位,故正确故答案为:线性相关系数|r|越大,两个变量的线性相关性越强;回归直线方程l:y=bx+a,一定经过样本中心点;从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样系统抽样;可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好;在回归直线方y=0.1x+10中,当解释变量x每增加一个单位时,预报变量y平均增加0.1个单位本题考查独立性检验,考查分层抽样方法,考查线性回归方程,考查判断两个相关变量之间的关系,是一个综合题目,这种题考查的知识点比较多,需要认真分析14. 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如表): 零件数x(个)1020304050加工时间y(分钟)6268758189由最小二乘法求得回归方程 y=0.67x+a,则a的值为_ (正确答案)54.9解:由题意,计算x=15(10+20+30+40+50)=30,y=15(62+68+75+81+89)=75,且回归直线方程 y=0.67x+a的图象过样本中心点(x,y),所以a=75-0.6730=54.9故答案为:54.9根据回归直线方程y=0.67x+a的图象过样本中心点(x,y),求出平均数代入方程即可求出a的值本题考查了回归直线方程的图象过样本中心点的应用问题,是基础题目15. 如图是一组数据(x,y)的散点图,经最小二乘法计算,得y与x之间的线性回归方程为y=bx+1,则b=_(正确答案)0.8解:由散点图得:x.=14(0+1+3+4)=2,y.=14(0.9+1.9+3.2+4.4)=2.6,将(2,2.6)代入y=bx+1,解得:b=0.8,故答案为:0.8求出样本点的中心,代入回归方程求出系数b的值即可本题考查了回归方程,考查样本点的中心,是一道基础题16. 对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,8),其回归直线方程是y=13x+a,且x1+x2+x3+x8=2(y1+y2+y3+y8)=8,请估算x=3时,y= _ (正确答案)76解:x1+x2+x3+x8=2(y1+y2+y3+y8)=8,x.=1,y.=12,样本中心点的坐标为(1,12),代入回归直线方程得,12=13+a,a=16x=3时,y=1+16=76故答案为:76求出横标和纵标的平均数,写出样本中心点,把样本中心点代入线性回归方程,得到关于a的方程,解方程即可本题考查线性回归方程,解题的关键是线性回归直线一定过样本中心点,这是求解线性回归方程的步骤之一三、解答题(本大题共3小题,共40分)17. 某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制了频率分布直方图(如图所示),规定80分及以上者晋级成功,否则晋级失败 晋级成功晋级失败合计男16女50合计()求图中a的值;()根据已知条件完成下面22列联表,并判断能否有85%的把握认为“晋级成功”与性别有关?()将频率视为概率,从本次考试的所有人员中,随机抽取4人进行约谈,记这4人中晋级失败的人数为X,求X的分布列与数学期望E(X)(参考公式:k2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d) P(K2k0)0.400.250.150.100.050.025k00.7801.3232.0722.7063.8415.024(正确答案)解:()由频率分布直方图各小长方形面积总和为1,可知(2a+0.020+0.030+0.040)10=1,解得a=0.005;()由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25,所以晋级成功的人数为1000.25=25(人),填表如下: 晋级成功晋级失败合计男163450女94150合计2575100假设“晋级成功”与性别无关,根据上表数据代入公式可得K2=100(1641-349)2257550502.6132.072,所以有超过85%的把握认为“晋级成功”与性别有关;()由频率分布直方图知晋级失败的频率为1-0.25=0.75,将频率视为概率,则从本次考试的所有人员中,随机抽取1人进行约谈,这人晋级失败的概率为0.75,所以X可视为服从二项分布,即XB(4,34),P(X=k)=C4k(34)k(14)4-k(k=0,1,2,3),故P(X=0)=C40(34)0(14)4=1256,P(X=1)=C41(34)1(14)3=364,P(X=2)=C42(34)2(14)2=54256,P(X=3)=C43(34)3(14)1=108256,P(X=4)=C44(34)4(14)0=81256,所以X的分布列为 X01234P(X=k)12563645425610825681256数学期望为E(X)=434=3,或(E(X)=12560+3641+542562+1082563+812564=3).()由频率和为1,列出方程求a的值;()由频率分布直方图求出晋级成功的频率,计算晋级成功的人数,填写列联表,计算观测值,对照临界值得出结论;()由频率分布直方图知晋级失败的频率,将频率视为概率,知随机变量X服从二项分布,计算对应的概率值,写出分布列,计算数学期望;本题考查了频率分布直方图与独立性检验和离散型随机变量的分布列、数学期望的应用问题,是中档题18. 近年来,手机已经成为人们日常生活中不可缺少的产品,手机的功能也日趋完善,已延伸到了各个领域,如拍照,聊天,阅读,缴费,购物,理财,娱乐,办公等等,手机的价格差距也很大,为分析人们购买手机的消费情况,现对某小区随机抽取了200人进行手机价格的调查,统计如下:年龄 价格5000元及以上3000元-4999元1000元-2999元1000元以下45岁及以下122866445岁以上3174624()完成关于人们使用手机的价格和年龄的22列联表,再判断能否在犯错误的概率不超过0.025的前提下,认为人们使用手机的价格和年龄有关?()如果用分层抽样的方法从样本手机价格在5000元及以上的人群中选择5人调查他的收入状况,再从这5人中选3人,求3人的年龄都在45岁及以下的概率附K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2k)0.050.0250.0100.001k3.8415.0246.63510.828(正确答案)解:()22列联表3000元及以上3000元以下合计45岁及以下407011045岁以上207090合计60140200K2=200(4070-7020)211090601404.7145.024,在犯错误的概率不超过0.025的前提下,认为人们使用手机的价格和年龄有关;()样本手机价格在5000元及以上的人共15人,用分层抽样的方法选择5人,45岁及以下的抽取4人,45岁以上的抽取1人,从这5人中选3人,有C53=10种情况,3人的年龄都在45岁及以下,有4种情况,3人的年龄都在45岁及以下的概率为410=25()由题中数据可得22列联表,计算K2,从而与临界值比较,即可得到结论;()样本手机价格在5000元及以上的人共15人,用分层抽样的方法选择5人,45岁及以下的抽取4人,45岁以上的抽取1人,从这5人中选3人,有C53=10种情况,3人的年龄都在45岁及以下,有4种情况,即可求出3人的年龄都在45岁及以下的概率本题考查概率的计算,考查独立性检验知识,考查学生的计算能力,属于中档题19. 在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在S市的A区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格.记x表示在各区开设分店的个数,y表示这x个分店的年收入之和 x(个) 2 3 4 5 6 y(百万元) 2.5 3 4 4.5 6()该公司已经过初步判断,可用线性回归模型拟合y与x的关系,求y关于x的线性回归方程y=bx+a;()假设该公司在A区获得的总年利润z(单位:百万元)与x,y之间的关系为z=y-0.05x2-1.4,请结合()中的线性回归方程,估算该公司应在A区开设多少个分店时,才能使A区平均每个分店的年利润最大?参考公式:y=bx+a,b=i=1nxiyi-nxyi=1nxi2-nx2=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a=y.-bx.(正确答案)解:()x.=4,y.=4,b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=8.510=0.85,a=y.-bx.=4-40.85=0.6,y关于x的线性回归方程y=0.85x+0.6()z=y-0.05x2-1.4=-0.05x2+0.85x-0.8,A区平均每个分店的年利润t=zx=-0.05x-0.8x+0.85=-0.01(5x+80x)+0.85,x=4时,t取得最大值,故该公司应在A区开设4个分店时,才能使A区平均每个分店的年利润最大()求出回归系数,可得y关于x的线性回归方程;()求出A区平均每个分店的年利润,利用基本不等式,可得结论本题考查回归方程,考查基本不等式的运用,正确求出回归方程是关键
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!