高三文科数学通用版二轮复习:第1部分 专题3 突破点8 回归分析、独立性检验 Word版含解析

上传人:仙*** 文档编号:40258027 上传时间:2021-11-15 格式:DOC 页数:11 大小:423.50KB
返回 下载 相关 举报
高三文科数学通用版二轮复习:第1部分 专题3 突破点8 回归分析、独立性检验 Word版含解析_第1页
第1页 / 共11页
高三文科数学通用版二轮复习:第1部分 专题3 突破点8 回归分析、独立性检验 Word版含解析_第2页
第2页 / 共11页
高三文科数学通用版二轮复习:第1部分 专题3 突破点8 回归分析、独立性检验 Word版含解析_第3页
第3页 / 共11页
点击查看更多>>
资源描述
高考数学精品复习资料 2019.5突破点8回归分析、独立性检验提炼1变量的相关性(1)正相关:在散点图中,点散布在从左下角到右上角的区域(2)负相关:在散点图中,点散布在从左上角到右下角的区域(3)相关系数r:当r>0时,两变量正相关;当r<0时,两变量负相关;当|r|1且|r|越接近于1,相关程度越高,当|r|1且|r|越接近于0,相关程度越低提炼2线性回归方程方程x称为线性回归方程,其中,.(,)称为样本中心点提炼3独立性检验(1)确定分类变量,获取样本频数,得到列联表(2)求观测值:k.(3)根据临界值表,作出正确判断如果kk,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”回访1变量的相关性1(20xx·全国卷)根据下面给出的2004年至我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()图8­1A逐年比较,减少二氧化硫排放量的效果最显著B我国治理二氧化硫排放显现成效C.以来我国二氧化硫年排放量呈减少趋势D以来我国二氧化硫年排放量与年份正相关D对于A选项,由图知从到二氧化硫排放量下降得最多,故A正确对于B选项,由图知,由到矩形高度明显下降,因此B正确对于C选项,由图知从以后除稍有上升外,其余年份都是逐年下降的,所以C正确由图知以来我国二氧化硫年排放量与年份负相关,故选D.2(20xx·全国卷)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A1B.0C.D.1D样本点都在直线上时,其数据的估计值与真实值是相等的,即yii,代入相关系数公式r1.3(20xx·全国卷)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值图8­2 (xi)2 (wi)2 (xi)(yi) (wi)(yi)46.65636.8289.81.61 469108.8表中wi,wwi.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为,.解(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型.2分(2)令w,先建立y关于w的线性回归方程由于68, 56368×6.8100.6,4分所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668.6分(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.6×0.24966.32.8分根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.10分所以当6.8,即x46.24时,取得最大值故年宣传费为46.24千元时,年利润的预报值最大12分回访2独立性检验4(20xx·辽宁高考)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:图8­3将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055合计解由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:非体育迷体育迷合计男301545女451055合计75251004分将2×2列联表中的数据代入公式计算,得k3.030.因为3.030<3.841,所以没有理由认为“体育迷”与性别有关.10分热点题型1回归分析题型分析:高考命题常以实际生活为背景,重在考查回归分析中散点图的作用、回归方程的求法和应用,难度中等在一次抽样调查中测得样本的5组数据,得到一个变量y关于x的回归方程模型,其对应的数值如下表:x0.250.5124y1612521(1)试作出散点图,根据散点图判断,yabx与ym哪一个适宜作为变量y关于x的回归方程模型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立变量y关于x的回归方程;(3)根据(2)中所求的变量y关于x的回归方程预测:当x3时,对应的y值为多少?(保留四位有效数字)解(1)作出变量y与x之间的散点图,如图所示, 2分由图可知变量y与x近似地呈反比例函数关系,那么ym适宜作为变量y关于x的回归方程模型.4分(2)由(1)知ym适宜作为变量y关于x的回归方程模型,令t,则yktm,由y与x的数据表可得y与t的数据表如下:t4210.50.25y1612521 6分作出y与t的散点图,如图所示 8分由图可知y与t近似地呈线性相关关系又1.55,7.2,iyi94.25,21.312 5,所以k4.134 4,mk7.24.134 4×1.550.8,所以y4.134 4t0.8,所以y关于x的回归方程为y0.8.10分(3)由(2)得y关于x的回归方程是y0.8,当x3时,可得y0.82.178.12分1正确理解计算,的公式和准确的计算,是求线性回归方程的关键其中线性回归方程必过样本中心点(,)2在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值变式训练1(20xx·石家庄二模)为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:x12345y7.06.55.53.82.2(1)求y关于x的线性回归方程x;(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z取到最大值?(保留两位小数)参考公式:,.解(1)3,5,2分i15,i25,iyi62.7,55,解得1.23,8.69,4分所以8.691.23x.6分(2)年利润zx(8.691.23x)2x1.23x26.69x,10分所以当x2.72,即年产量为2.72吨时,年利润z取得最大值.12分热点题型2独立性检验题型分析:尽管全国卷在近几年未在该点命题,但其极易与分层抽样、古典概型等知识交汇,是潜在的命题点之一,须引起足够的重视(20xx·河南省名校期中)微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商)为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,其中每天玩微信超过6小时的用户列为“微信控”,否则称其为“非微信控”,调查结果如下:微信控非微信控总计男性262450女性302050总计5644100(1)根据以上数据,能否有60%的把握认为“微信控”与“性别”有关?(2)现从调查的女性用户中按分层抽样的方法选出5人赠送营养面膜1份,求所抽取5人中“微信控”和“非微信控”的人数;(3)从(2)中抽取的5人中再随机抽取2人赠送200元的护肤品套装,求这2人中至少有1人为“非微信控”的概率参考公式:K2,其中nabcd.参考数据:P(K2k0)0.500.400.250.050.0250.010k00.4550.7081.3233.8415.0246.635解题指导计算k下结论求“微信控”及“非微信控”人数求得概率解(1)由列联表可得k0.649 35<0.708,2分所以没有60%的把握认为“微信控”与“性别”有关.3分(2)依题意可知,所抽取的5位女性中,“微信控”有5×3(人),“非微信控”有5×2(人).5分(3)记5人中的“微信控”为a,b,c,“非微信控”为D,E,则所有可能的基本事件为(a,b),(a,c),(a,D),(a,E),(b,c),(b,D),(b,E),(c,D),(c,E),(D,E),共10种,8分其中至少有1人为“非微信控”的基本事件有(a,D),(a,E),(b,D),(b,E),(c,D),(c,E),(D,E),共7种,10分所以这2人中至少有1人为“非微信控”的概率为.12分求解独立性检验问题时要注意:一是2×2列联表中的数据与公式中各个字母的对应,不能混淆;二是注意计算得到k之后的结论变式训练2某高校共有学生15 000人,其中男生10 500人,女生4 500人为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”附:K2,P(K2k0)0.100.050.0100.005k02.7063.8416.6357.879解(1)300×90,所以应收集90位女生的样本数据.2分(2)由频率分布直方图得12×(0.1000.025)0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.5分(3)由(2)知,300位学生中有300×0.75225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表:男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计210903008分结合列联表可算得k4.762>3.841.10分所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.12分
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!