资源描述
2022年高三数学大一轮复习 11.3变量间的相关关系、统计案例教案 理 新人教A版 xx高考会这样考考查线性回归的基本思想和简单应用复习备考要这样做1.理解散点图和相关关系的概念;2.注意线性回归方程在实际问题中的应用1 两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线2 回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法(2)回归方程方程 x 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中 , 是待定参数.3 回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中(,)称为样本点的中心(3)相关系数当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常|r|大于0.75时,认为两个变量有很强的线性相关性难点正本疑点清源1 相关关系与函数关系的区别相关关系与函数关系不同函数关系中的两个变量间是一种确定性关系例如正方形面积S与边长x之间的关系Sx2就是函数关系相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系例如商品的销售额与广告费是相关关系两个变量具有相关关系是回归分析的前提2 对回归分析的理解回归分析是处理变量相关关系的一种数学方法,它主要解决三个问题:(1)确定两个变量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式,否则求出的回归方程没有意义;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程1 已知x、y的取值如下表:x0134y2.24.34.86.7从所得的散点图分析,y与x线性相关,且 0.95x ,则 _.答案2.6解析因为回归直线必过样本点的中心(,),又2,4.5,代入 0.95x ,得 2.6.2 (xx辽宁)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程: 0.254x0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元答案0.254解析由题意知0.254(x1)0.321(0.254x0.321)0.254.3 (xx湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是 ()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案D解析由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确又线性回归方程必过样本点的中心(,),因此B正确由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确4 对于回归分析,下列说法错误的是 ()A在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B线性相关系数可以是正的或负的C回归分析中,如果r21或r1,说明x与y之间完全线性相关D样本相关系数r(1,1)答案D解析由定义可知相关系数|r|1,故D错误5 已知变量x,y具有线性相关关系,测得一组数据如下:(2,30),(4,40),(5,60),(6,50),(8,70),若它们的回归直线的斜率为6.5,则在这些样本点中任取一点,它在回归直线上方的概率为()A. B. C. D.答案A解析由题意可知, 6.5,5,50,则 17.5,所以线性回归方程为 6.5x17.5,将样本数据代入线性回归方程检验可知,只有两点(5,60),(8,70)在回归直线上方,所以所求概率为.题型一两个变量间的相关关系例15个学生的数学和物理成绩如下表:学生学科ABCDE数学8075706560物理7066686462画出散点图,并判断它们是否具有相关关系思维启迪:将每个学生的数学成绩和物理成绩分别作为点的横坐标和纵坐标,作散点图,然后根据散点图判断两个变量是否存在相关关系解以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示由散点图可知,各组数据对应点大致在一条直线附近,所以两者之间具有相关关系,且为正相关探究提高判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关性,是不是存在线性相关关系,是正相关还是负相关,相关关系是强还是弱对变量x,y有观测数据(xi,yi) (i1,2,10),得散点图(1);对变量u、v有观测数据(ui,vi) (i1,2,10),得散点图(2)由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关答案C解析由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2)可知,各点整体呈递增趋势,u与v正相关题型二线性回归方程例2(xx福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求线性回归方程x,其中20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)思维启迪:根据回归直线过样本点中心来求线性回归方程,然后利用回归方程求最大利润解(1)由于(88.28.48.68.89)8.5,(908483807568)80,又20,所以80208.5250,从而线性回归方程为20x250.(2)设工厂获得的利润为L元,依题意得Lx(20x250)4(20x250)20x2330x1 00020(x8.25)2361.25.当且仅当x8.25时,L取得最大值故当单价定为8.25元时,工厂可获得最大利润探究提高回归直线过样本点中心(,)是一条重要性质;利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势(xx广东)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为_;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为_答案0.50.53解析小李这5天的平均投篮命中率0.5,可求得小李这5天的平均打篮球时间3.根据表中数据可求得 0.01, 0.47,故线性回归方程为 0.01x0.47,将x6代入得6号打6小时篮球的投篮命中率约为0.53.统计中的数形结合思想典例:(12分)某地10户家庭的年收入和年饮食支出的统计资料如表所示:年收入x(万元)24466677810年饮食支出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系;(2)如果某家庭年收入为9万元,预测其年饮食支出审题视角可以画出散点图,根据图中点的分布判断家庭年收入和年饮食支出的线性相关性规范解答解(1)由题意,知年收入x为解释变量,年饮食支出y为预报变量,作散点图如图所示3分从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系4分因为6,1.83,406,35.13,iyi117.7,所以0.172,1.830.17260.798.从而得到线性回归方程为0.172x0.798.8分(2)0.17290.7982.346(万元)所以家庭年收入为9万元时,可以预测年饮食支出为2.346万元12分温馨提醒(1)在统计中,用样本的频率分布表、频率分布直方图、统计图表中的茎叶图、折线图、条形图,去估计总体的相关问题,以及用散点图判断相关变量的相关性等都体现了数与形的完美结合借助于形的直观,去统计数据,分析数据,无不体现了数形结合的思想(2)本题利用散点图分析两变量间的相关关系,充分体现了数形结合思想的应用(3)本题易错点为散点图画的不准确,导致判断错误.方法与技巧1 求回归方程,关键在于正确求出系数 , ,由于 , 的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误(注意线性回归方程中一次项系数为 ,常数项为 ,这与一次函数的习惯表示不同)2 回归分析是处理变量相关关系的一种数学方法主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程失误与防范1 回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义2 根据回归方程进行预报,仅是一个预报值,而不是真实发生的值A组专项基础训练(时间:35分钟,满分:57分)一、选择题(每小题5分,共20分)1 相关系数度量()A两个变量之间线性相关关系的强度B散点图是否显示有意义的模型C两个变量之间是否存在因果关系D两个变量之间是否存在关系答案A解析相关系数来衡量两个变量之间线性相关关系的强弱2 (xx陕西)设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()A直线l过点(,)Bx和y的相关系数为直线l的斜率Cx和y的相关系数在0到1之间D当n为偶数时,分布在l两侧的样本点的个数一定相同答案A解析因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B、C错误D中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以D错误根据线性回归直线一定经过样本点中心可知A正确3 (xx山东)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得线性回归方程 x 中的 为9.4,据此模型预报广告费用为6万元时销售额为()A63.6万元 B65.5万元C67.7万元 D72.0万元答案B解析,42,又 x 必过(,),429.4 , 9.1.线性回归方程为 9.4x9.1.当x6时, 9.469.165.5(万元)4 (xx课标全国)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A1 B0 C. D1答案D解析样本点都在直线上时,其数据的估计值与真实值是相等的,即yii,代入相关系数公式r1.二、填空题(每小题5分,共15分)5 某市居民xxxx年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份xxxxxxxxxx收入x11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_线性相关关系答案13正解析把xxxx年家庭年平均收入按从小到大顺序排列为11.5,12.1,13,13.3,15,因此中位数为13(万元),由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系6 在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是_的(有关,无关)答案有关解析由观测值k27.63与临界值比较,我们有99.9%的把握说打鼾与患心脏病有关6 下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据:x3456y2.5t44.5根据上表提供的数据,求出y关于x的线性回归方程为 0.7x0.35,那么表中t的值为_答案3解析样本点中心是(,),即.因为线性回归方程过该点,所以0.74.50.35,解得t3.三、解答题(共22分)8 (10分)某企业上半年产品产量与单位成本资料如下:月份产量(千件)单位成本(元)127323723471437354696568且已知产量x与成本y具有线性相关关系(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少?(3)假定产量为6 000件时,单位成本为多少元?解(1)n6,3.5,71,x79,xiyi1 481, 1.82, 711.823.577.37,线性回归方程为 x 1.82x77.37.(2)因为单位成本平均变动 1.820,则x增大时,y也相应增大;若r0,表示两个相关变量正相关,x增大时,y也相应增大,故正确;r0.75,所以y与x有很强的线性相关关系(2) 0.728 6, 8.250.728 612.50.857 5,所求线性回归方程为 0.728 6x0.857 5.(3)要使 100.728 6x0.857 510,所以x14.901 915.所以机器的转速应控制在15转/秒以下
展开阅读全文