资源描述
课时规范练54相关性、最小二乘估计与统计案例基础巩固组1.(2018福建莆田模拟,3)设一个线性回归方程y=3+1.2x,当变量x每增加一个单位时,则y的变化情况正确的是()A.y平均增加约1.2个单位B.y平均增加约3个单位C.y平均减少约1.2个单位D.y平均减少约3个单位2.(2018黑龙江模拟十,6)下列表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归直线方程为y=0.8x-155,后因某未知原因使第5组数据的y值模糊不清,此位置数据记为m(如下表所示),则利用回归方程可求得实数m的值为()x196197200203204y1367mA.8.3B.8.2C.8.1D.83.(2018广东佛山二模,5)某同学用收集到的6组数据对(xi,yi)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l的方程为y=bx+a,相关系数为r.现给出以下3个结论:r0;直线l恰好过点D;b1.其中正确结论是()A.B.C.D.4.(2018辽南协作校一模,3)根据如下样本数据得到回归直线方程y=bx+a,其中a=10.5,则当x=6时,y的估计值是()x4235y49263954A.57.5B.61.5C.64.5D.67.55.(2018黑龙江仿真模拟十一,5)某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:使用智能手机不使用智能手机总计学习成绩优秀4812学习成绩不优秀16218总计201030附表:P(2k0)0.100.050.010k02.7063.8416.635经计算2=10,则下列选项正确的是()A.有99%的把握认为使用智能手机对学习有影响B.有99%的把握认为使用智能手机对学习无影响C.有95%的把握认为使用智能手机对学习有影响D.有95%的把握认为使用智能手机对学习无影响6.(2018河南洛阳质检,13)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟订的价格进行试销,得到如下数据.单价x/元456789销量y/件908483807568由表中数据求得线性回归方程y=-4x+a,则x=10元时预测销量为件.7.(2018河南商丘模拟,19)已知具有线性相关关系的两个变量x,y之间的几组数据如下表所示:x246810y3671012(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a,并估计当x=20时,y的值;(2)将表格中的数据看作五个点的坐标,则从这五个点中随机抽取2个点,求恰有1个点落在直线2x-y-4=0右下方的概率.参考公式:b=i=1nxiyi-nx yi=1nxi2-n(x)2,a=y-bx.综合提升组8.(2018河北保定一模,3)已知具有线性相关的变量x,y,设其样本点为Ai(xi,yi)(i=1,2,8),回归直线方程为y=x+a,若OA1+OA2+OA8=(6,2),(O为原点),则a=()A.B.-C.D.-9.(2018安徽合肥一中最后1卷,文13)为了研究某班学生的脚长x(单位:cm)和身高y(单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y=bx+a.已知i=110xi=225,i=110yi=1 600,b=4.该班某学生的脚长为24 cm,据此估计其身高为 cm.10.(2018安徽蚌埠一模,文19)某图书公司有一款图书的历史收益率(收益率=利润每本收入)的频率分布直方图如图所示:(1)试估计平均收益率;(用区间中点值代替每一组的数值)(2)根据经验,若每本图书的收入在20元的基础上每增加x元,对应的销量y(万本)与x(元)有较强线性相关关系,从历史销售记录中抽样得到如下5组x与y的对应数据:x元2530384552销量y万本7.57.16.05.64.8据此计算出的回归方程为y=10.0-bx.求参数b的估计值;若把回归方程y=10.0-bx当作y与x的线性关系,x取何值时,此产品获得最大收益?求出该最大收益.11.(2018山东日照5月校际联考,19)为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是:“盲拍”,即所有参与竞拍的人都要网络报价一次,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加2018年5月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的数据,统计了最近5个月参与竞拍的人数(见下表):月份2017.122018.012018.022018.032018.04月份编号t12345竞拍人数y(万人)0.50.611.41.7 (1)由收集数据的散点图发现,可用线性回归模型拟合竞拍人数y(万人)与月份编号t之间的相关关系.请用最小二乘法求出y关于t的线性回归方程:y=bt+a,并预测2018年5月份参与竞拍的人数.(2)某市场调研机构从拟参加2018年5月份车牌竞拍人员中,随机抽取了200人,对他们的拟报价价格进行了调查,得到如下频数分布表和频率分布直方图:报价区间(万元)1,2)2,3)3,4)4,5)5,6)6,7)7,8)频数1030a60302010求a,b的值及这200位竞拍人员中报价大于5万元的人数;若2018年5月份车牌配额数量为3 000,假设竞拍报价在各区间分布是均匀的,请你根据以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价.参考公式及数据:y=bx+a,其中b=i=1nxiyi-nx yi=1nxi2-nx2,a=y-bx;i=15ti2=55,i=15tiyi=18.8.创新应用组12.(2018黑龙江哈尔滨三中一模,10)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,哈三中积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:年份(届)2014201520162017学科竞赛获省级一等奖及以上学生人数x51495557被清华、北大等世界名校录取的学生人数y10396108107根据上表可得回归方程y=bx+a中的b为1.35,我校2018届同学在学科竞赛中获省级一等奖以上学生人数为63人,据此模型预报我校今年被清华、北大等世界名校录取的学生人数为()A.111B.115C.117D.12313.(2018湖北七校联盟2月联考,19)已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度x(单位:),对某种鸡的时段产蛋量y(单位:t)和时段投入成本z(单位:万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度xi和产蛋量yi(i=1,2,7)的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.i=17(xi-x)217.4082.303.6140i=17(ki-k)2i=17(xi-)(yi-)i=17(xi-)(ki-)9.72 935.135.0其中ki=ln yi,k=17i=17ki.(1)根据散点图判断,y=bx+a与y=c1ec2x哪一个更适宜作为该种鸡的时段产蛋量y关于鸡舍时段控制温度x的回归方程类型?(给判断即可,不必说明理由)(2)若用y=c1ec2x作为回归方程模型,根据表中数据,建立y关于x的回归方程;(3)已知时段投入成本z与x,y的关系为z=e-2.5y-0.1x+10,当时段控制温度为28 时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?附:对于一组具有有线性相关关系的数据(i,vi)(i=1,2,3,n),其回归直线v=u+的斜率和截距的最小二乘估计分别为=i=1n(ui-u)(vi-v)i=1n(ui-u)2,=v-ue-2.5e-0.75ee3e70.080.472.7220.091 096.63 参考答案课时规范练54相关性、最小二乘估计与统计案例1.A令x=a,y=3+1.2a,令x=a+1,则y=3+1.2(a+1)=4.2+1.2a,所以当变量x每增加一个单位时,则y平均增加约1.2个单位,故选A.2.D由题意可得:x=196+197+200+203+2045=200,y=1+3+6+7+m5=17+m5,回归方程过样本中心点,则:17+m5=0.8200-155,解得m=8,故选D.3.A由题图可知这些点分布在一条斜率大于零的直线附近,所以为正相关,即相关系数r0;因为x=0+1+2+3+5+76=3,y=1.5+2+2.3+3+5+4.26=3,所以回归直线l的方程必过点(3,3),即直线l恰好过点D.因为直线l斜率接近于AD斜率,而kAD=3-1.53=126. 635,据此结合独立性检验的思想可知:有99%的把握认为使用智能手机对学习有影响,故选A.6.66由已知得x= (4+5+6+7+8+9)=132,y= (90+84+83+80+75+68)=80,a=80+4132=106,当x=10时,y=106-40=66,故答案为66.7.解 (1)x= (2+4+6+8+10)=6,y= (3+6+7+10+12)=7.6,i=15xi2=4+16+36+64+100=220,i=15xiyi=6+24+42+80+120=272,b=i=15xiyi-5x yi=15xi2-5(x)2=272-567.6220-562=4440=1.1,a=7.6-61.1=1,回归直线方程为y=1.1x+1,故当x=20时,y=23.(2)可以判断,落在直线2x-y-4=0右下方的点满足2x-y-40,故符合条件的点的坐标为(6,7),(8,10),(10,12),共有10种取法,满足条件的有6种,所以P=610=35.8.B因为OA1+OA2+OA8=(x1+x2+x8,y1+y2+y8)=(8x,8y)=(6,2),所以8x=6,8y=2x=,y=,因此=+a,即a=-,故选B.9.166由i=110xi=225,i=110yi=1 600,利用平均值公式求得x=22.5,y=160,b=4,a=160-422.5=70,从而当x=24时,y=424+70=166,故答案为166.10.解 (1)区间中值依次为:0.05,0.15,0.25,0.35,0.45,0.55,取值的估计概率依次为:0.1,0.2,0.25,0.3,0.1,0.05,故平均收益率为0.050.10+0.150.20+0.250.25+0.350.30+0.450.10+0.550.05=0.275.(2)x=25+30+38+45+525=1905=38,y=7.5+7.1+6.0+5.6+4.85=315=6.2,将(38,6.2)代入y=10-bx,得b=10.0-6.238=0.10.设每本图书的收入是20+x元,则销量为y=10-0.1x,则图书总收入为f(x)=(20+x)(10-0.1x)=200+8x-0.1x2=360-0.1(x-40)2(万元),当x=40时,图书公司总收入最大为360万元,预计获利为3600.275=99万元.11.解 (1)易知=1+2+3+4+55=3,y=0.5+0.6+1+1.4+1.75=1.04,b=i=15tiyi-5t yi=15ti2-5t2=18.8-531.0455-532=0.32,a=y-b=1.04-0.323=0.08,则y关于t的线性回归方程为y=0.32t+0.08,当t=6时,y=2.00,即2018年5月份参与竞拍的人数估计为2万人.(2)由a200=0.20解得a=40.由频率和为1,得(0.052+0.10+2b+0.20+0.30)1=1,解得b=0.15,200位竞拍人员报价大于5万元的人数为(0.05+0.10+0.15)200=60人.2018年5月份实际发放车牌数量为3 000,根据竞价规则,报价在最低成交价以上人数占总人数比例为3 00020 000100%=15%;又由频率分布直方图知竞拍报价大于6万元的频率为0.05+0.10=0.15,所以,根据统计思想(样本估计总体)可预测2018年5月份竞拍的最低成交价为6万元.12.C由题意得x=51+49+55+574=53,y=103+96+108+1074=103.5.数据的样本中心点在线性回归直线上,y=bx+a中的b为1.35,103.5=1.3553+a,即a=31.95,线性回归方程是y=1.35x+31.95.2018届同学在学科竞赛中获省级一等奖以上学生人数为63人,今年被清华、北大等世界名校录取的学生人数为1.3563+31.95=117,故选C.13.解 (1)y=c1ec2x适宜.(2)由y=c1ec2x得ln y=c2x+ln c1,令ln y=k,c2=,=ln c1,由图表中的数据可知=35140=14,=-34,k=14x-34,y关于x的回归方程为y=ex4-34=0.47ex4.(3)当x=28时,由回归方程得y=0.471 096.63=515.4,z=0.08515. 4-2.8+10=48.432.即鸡舍的温度为28 时,鸡的时段产量的预报值为515.4,投入成本的预报值为48.432.
展开阅读全文