2019-2020年高考数学一轮复习第9章统计与统计案例9.3变量间的相关关系与统计案例学案理.doc

上传人:tian****1990 文档编号:2666124 上传时间:2019-11-28 格式:DOC 页数:27 大小:775KB
返回 下载 相关 举报
2019-2020年高考数学一轮复习第9章统计与统计案例9.3变量间的相关关系与统计案例学案理.doc_第1页
第1页 / 共27页
2019-2020年高考数学一轮复习第9章统计与统计案例9.3变量间的相关关系与统计案例学案理.doc_第2页
第2页 / 共27页
2019-2020年高考数学一轮复习第9章统计与统计案例9.3变量间的相关关系与统计案例学案理.doc_第3页
第3页 / 共27页
点击查看更多>>
资源描述
2019-2020年高考数学一轮复习第9章统计与统计案例9.3变量间的相关关系与统计案例学案理知识梳理1相关关系与回归方程(1)相关关系的分类正相关:从散点图上看,点散布在从左下角到右上角的区域内,如图1;负相关:从散点图上看,点散布在从左上角到右下角的区域内,如图2.(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线(3)回归方程最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法回归方程:两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn),其回归方程为x,则,.其中,是回归方程的斜率,是在y轴上的截距,xi,yi,(,)称为样本点的中心说明:回归直线x必过样本点的中心(,),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据(4)样本相关系数r,用它来衡量两个变量间的线性相关关系当r0时,表明两个变量正相关;当r0.75时,认为两个变量有很强的线性相关关系2独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量(2)列联表:列出两个分类变量的频数表,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为22列联表y1y2总计x1ababx2cdcd总计acbdabcd构造一个随机变量K2,其中nabcd为样本容量(3)独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验诊断自测1概念思辨(1)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示()(2)通过回归方程x可以估计和观测变量的取值和变化趋势()(3)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大()(4)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀()答案(1)(2)(3)(4)2教材衍化(1)(必修A3P94A组T3)某种产品的广告费用支出x(单位:万元)与销售额y(单位:万元)之间有如下的对应数据:x24568y3040605070由最小二乘法得到线性回归直线方程x,则此直线一定经过点()A(5,60) B(5,50) C(6,50) D(8,70)答案B解析回归直线样本点的中心为(,),而(24568)5,(3040605070)50,所以回归直线一定经过点(5,50)故选B.(2)(选修A12P96T2)通过随机询问72名不同性别的大学生在购买食物时是否看生产日期,得到如下列联表:女男总计读生产日期162844不读生产日期20828总计363672则有_的把握认为性别与是否读生产日期有关答案99.5%解析由表中数据得k8.4167.879,所以可知有99.5%的把握认为性别与是否读生产日期有关3小题热身(1)设回归方程为35x,则变量x增加一个单位时 ()Ay平均增加3个单位 By平均减少5个单位Cy平均增加5个单位 Dy平均减少3个单位答案B解析因为5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位故选B.(2)(xx西安模拟)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如下表),由最小二乘法求得回归方程0.67x54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为_答案68解析由30,得0.673054.975.设表中的“模糊数字”为a,则62a758189755,a68.题型1相关关系的判断对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图;对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图,由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关散点分布向右上升为正相关,反之为负相关答案C解析题图的散点分布在斜率小于0的直线附近,y随x的增大而减小,故变量x与y负相关;题图的散点分布在斜率大于0的直线附近,u随v的增大而增大,故变量u与v正相关,故选C.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A,B两变量有更强的线性相关性()A甲 B乙 C丙 D丁考查r的取值与1的关系答案D解析在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两个变量有更强的线性相关性,故选D.方法技巧判定两个变量正、负相关性的方法1画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关见典例1.2相关系数:r0时,正相关;r0时,正相关;0,故xx年至xx年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元将xx年的年份代号t9代入(1)中的回归方程,得0.592.36.8,故预测该地区xx年农村居民家庭人均纯收入为6.8千元角度2非线性回归模型的应用(xx全国卷)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值表中wi,wi.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为, .(1)散点图趋势是曲线,推断ycd适宜;(2)将非线性回归方程ycd用换元法w转化为线性回归方程ycdw,进而求解解(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程由于68,563686.8100.6,所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668.(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.60.24966.32.根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.所以当6.8,即x46.24时,取得最大值故年宣传费为46.24千元时,年利润的预报值最大方法技巧1利用线性回归方程时的关注点(1)正确理解计算,的公式和准确的计算是求线性回归方程的关键(2)回归直线方程x必过样本点中心(,)(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测见角度1典例2非线性回归方程的求法(1)根据原始数据(x,y)作出散点图(2)根据散点图选择恰当的拟合函数(3)作恰当的变换,将其转化成线性函数,求线性回归方程(4)在(3)的基础上通过相应变换,即可得非线性回归方程见角度2典例冲关针对训练(xx全国卷)下图是我国xx年至xx年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测xx年我国生活垃圾无害化处理量附注:参考数据:yi9.32,tiyi40.17, 0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为:, .解(1)由折线图中数据和附注中参考数据得4, (ti)228,0.55, (ti)(yi)tiyiyi40.1749.322.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系(2)由1.331及(1)得0.103,1.3310.10340.92.所以,y关于t的回归方程为0.920.10t.将xx年对应的t9代入回归方程得0.920.1091.82.所以预测xx年我国生活垃圾无害化处理量约为1.82亿吨题型3独立性检验(xx广州测试)某企业生产的某种产品被检测出其中一项质量指标存在问题该企业为了检查生产该产品的甲、乙两条流水线的生产情况,随机从这两条流水线上生产的大量产品中各抽取50件产品作为样本,测出它们的这一项质量指标值若该项质量指标值落在(195,210内,则为合格品,否则为不合格品下表是甲流水线样本的频数分布表,下图是乙流水线样本的频率分布直方图(1)根据上图,估计乙流水线产品的该项质量指标值的中位数;(2)若将频率视为概率,某个月内甲、乙两条流水线均生产了5000件产品,则甲、乙两条流水线分别生产出不合格品约多少件?(3)根据已知条件完成下面的22列联表,并回答能否有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”?附:K2(其中nabcd)解(1)设乙流水线产品的该项质量指标值的中位数为x,因为0.48(0.0120.0320.052)50.5(0.0120.0320.0520.076)50.86,所以(0.0120.0320.052)50.076(x205)0.5,解得x.(2)由甲、乙两条流水线各抽取50件产品可得,甲流水线生产的不合格品有15件,则甲流水线生产的产品为不合格品的概率为,乙流水线生产的产品为不合格品的概率为(0.0120.028)5.所以某个月内甲、乙两条流水线均生产了5000件产品,则甲、乙两条流水线生产的不合格品件数分别为50001500,50001000.(3)22列联表:甲流水线乙流水线合计 合格品354075不合格品151025 合计5050100则K21.3,因为1.36.635,所以能在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关(3)这种说法不正确能在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关,是这个论断成立的可能性大小的结论,与是否有“99%的亲属的饮食习惯与年龄有关”无关1(xx山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系设其回归直线方程为x.已知 i225, i1600,4.该班某学生的脚长为24,据此估计其身高为()A160 B163 C166 D170答案C解析 i225, i22.5. i1600, i160.又4,160422.570.回归直线方程为4x70.将x24代入上式得42470166.故选C.2(xx福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程x,其中0.76,.据此估计,该社区一户年收入为15万元家庭的年支出为()A11.4万元 B11.8万元C12.0万元 D12.2万元答案B解析由统计数据表可得10.0,8.0,则8.00.7610.00.4,所以回归直线方程为0.76x0.4,当x15时,0.76150.411.8,故估计年收入为15万元家庭的年支出为11.8万元故选B.3(xx江西南城一中、高安中学联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表非一线城市一线城市总计愿生 45 2065不愿生13 2235总计5842100由K2,得K29.616.参照下表,P(K2k0)0.0500.0100.001k03.8416.63510.828正确的结论是()A在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C有99%以上的把握认为“生育意愿与城市级别有关”D有99%以上的把握认为“生育意愿与城市级别无关”答案C解析K29.6166.635,有99%以上的把握认为“生育意愿与城市级别有关”,故选C.4(xx广东广州检测)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()A成绩 B视力 C智商 D阅读量答案D解析K2,令m,则K82m,同理,Km(4201216)21122m,Km(824812)2962m,Km(143062)24082m,KKKK,则与性别有关联的可能性最大的变量是阅读量,故选D.重点保分 两级优选练A级一、选择题1四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()A B C D答案D解析由回归直线方程x,知当0时,y与x正相关;当0时,y与x负相关一定错误故选D.2对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()Ar2r40r3r1 Br4r20r1r3Cr4r20r3r1 Dr2r40r1r3答案A解析易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则r2r40r3b,a B.b,aC.a D.b,a答案C解析,代入公式求得,而b2,a2,a,故选C.二、填空题11x和y的散点图如图所示,则下列说法中所有正确命题的序号为_x,y是负相关关系;在该相关关系中,若用yc1ec2x拟合时的相关指数为R,用x拟合时的相关指数为R,则RR;x,y之间不能建立线性回归方程答案解析在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故正确;由散点图知用yc1ec2x拟合比用x拟合效果要好,则RR,故正确;x,y之间可以建立线性回归方程,但拟合效果不好,故错误12(xx赣州模拟)在一组样本数据(x1,y1),(x2,y2),(x6,y6)的散点图中,若所有样本点(xi,yi)(i1,2,6)都在曲线ybx2附近波动经计算xi11,yi13,x21,则实数b的值为_答案解析令tx2,则曲线的回归方程变为线性的回归方程,即ybt,此时,代入ybt,得b,解得b.13某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得K23.918,经查对临界值表知P(K23.841)0.05.对此,四名同学作出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,则他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是_(把你认为正确的命题的序号都填上)p(綈q);(綈p)q;(綈p綈q)(rs);(p綈r)(綈qs)答案解析由题意,得K23.918,P(K23.841)0.05,所以,只有第一位同学的判断正确,即有95%的把握认为“这种血清能起到预防感冒的作用”所以p真,q假,r假,s假由真值表知为真命题14有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下的列联表:优秀非优秀总计甲班10b乙班c30总计已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是_列联表中c的值为30,b的值为35;列联表中c的值为15,b的值为50;根据列联表中的数据,若在犯错误的概率不超过0.025的前提下,能认为“成绩与班级有关系”;根据列联表中的数据,若在犯错误的概率不超过0.025的前提下,不能认为“成绩与班级有关系”答案解析由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20,b45,错误;根据列联表中的数据,得到K26.15.024,因此在犯错误的概率不超过0.025的前提下认为“成绩与班级有关系”故正确,错误B级三、解答题15(xx湖南百所重点中学诊断)已知某企业近3年的前7个月的月利润(单位:百万元)如下面的折线图所示:(1)试问这3年的前7个月中哪个月的月平均利润较高?(2)通过计算判断这3年的前7个月的总利润的发展趋势;(3)试以第3年的前4个月的数据(如下表),用线性回归的拟合模式估计第3年8月份的利润月份1234利润y(单位:百万元)4466相关公式:.解(1)由折线图可知5月和6月的平均利润最高(2)第1年前7个月的总利润为123567428(百万元),第2年前7个月的总利润为255455531(百万元),第3年前7个月的总利润为446676841(百万元),所以这3年的前7个月的总利润呈上升趋势0.8,52.50.83,0.8x3,当x8时,0.8839.4.估计第3年8月份的利润为9.4百万元 16(xx全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧养殖法新养殖法(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量50 kg箱产量50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01)K2.解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”由题意知P(A)P(BC)P(B)P(C)旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.0680.0460.0100.008)50.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.620.660.4092.(2)根据箱产量的频率分布直方图得列联表箱产量6.635,故有99%的把握认为箱产量与养殖方法有关(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.0040.0200.044)50.340.5,故新养殖法产量的中位数的估计值为5052.35(kg)
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!