资源描述
2019-2020年高中数学第2章统计2.4线性回归方程名师导航学案苏教版必修3三点剖析 一、变量之间的关系 在实际问题中,变量之间的关系有两类: 一类是确定性关系,变量之间的关系可以用函数表示.例如,正方形的面积S与边长a之间就是确定性关系,可以用函数S=a2表示. 在实际问题中,变量之间的关系除了确定性的函数关系之外,还有一种非确定性的关系.例如:商品销售收入与广告支出经费之间的关系.我们不可否认商品销售收入与广告支出经费之间有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品的质量、居民的经济状况等因素有关.再如:粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食的产量就越高.但是,施肥量并不是决定粮食产量的唯一因素,因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.又如人的身高和体重之间的关系、人的年龄和血压之间的关系等,这些变量之间存在着密切的关系,但它不能由一个变量的数值精确地确定另一个变量的数值.像这种自变量取一定值时,因变量的取值带有一定随机性,这样的两个变量之间的关系,我们称之为相关关系.从某种意义上讲,函数关系可以看作是一种理想的关系模型,而相关关系则是一种非常普遍的关系.研究和学习相关关系不仅可以使我们能够处理更为广泛的数学问题,还可以使我们对函数关系的认识上升到一个新的高度.在现实生活中,存在大量的相关关系,所以,寻找变量之间的相关关系很有必要.在此,统计在其中发挥着非常重要的作用.在相关关系中,变量的关系不是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过试验),在对数据进行统计分析,发现其中的规律,才能对它们之间的关系作出判断. 二、散点图 在考虑相关关系中的两个量的关系时,为了对变量之间的关系有一个大致的了解,我们通常将变量所对应的点描出来,这些点就组成了具有相关关系的变量之间的一组数据的图形,通常称这种图为变量之间的散点图. 通过具有相关关系的两个量的散点图我们可以对这两个变量间的关系有一个大致的了解.例如:在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg).施化肥量x15202530354045水稻产量y330345365405445450455将表中的各对数据在平面直角坐标系中描点,即可得到该组数据的散点图,如图6-12所示:图6-12 由图可发现,图中的各点大致分布在一条直线的附近. 三、最小二乘法、线性回归方程 1最小二乘法 由施化肥量对水稻产量影响的试验所得到的散点图可发现,图中的各点,大致分布在一条直线y=a+bx的附近.故可用一个线性函数近似表示施化肥量和水稻产量之间的关系.这种线性关系可以用多种方法来进行刻画,那么用什么样的线性关系刻画会更好一些呢? 有一个非常直观的想法,一个好的线性关系要保证这条直线与所有点都近. 如果有n个点:(x1,y1),(x2,y2),(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:y1-(a+bx1)2+y2-(a+bx2)2+yn-(a+bxn)2 使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法. 2线性回归方程通过收集现实生活中两个有关联的变量的数据作出散点图,如果所有的散点分布成或近似成一条直线,我们说这两个变量有线性关系(否则就说两个变量不具有线性关系),然后运用最小二乘法的思想,用一条直线来拟合两个变量之间的关系:y=a+bx.要求所有点相对于该直线的偏差的平方和尽可能达到最小.我们把y=a+bx称作线性回归方程,其中 求线性回归方程的一般步骤:(1)根据两组数据计算(2)代入(*)计算求a、b的值; (3)代入y=a+bx. 一般情况下,求线性回归方程可借助计算器和计算机来完成.问题探究 问题1:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:人体的脂肪含量与年龄之间的关系年龄23273941454950脂肪9.517.821.225.927.526.328.2年龄53545657586061脂肪29.630.231.430.833.535.234.6 根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?探究:观察表中数据,大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.为了确定这一关系的细节,我们需要进行数据分析.我们假设人的年龄影响体内脂肪含量,于是,按照习惯,以x轴表示年龄,以y轴表示脂肪含量,得到相应的散点图(如图6-13所示).图6-13 从散点图我们可以看出,年龄越大,体内脂肪含量越高,图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论. 经计算可得到回归直线的回归方程为=0.577x-0.448问题2:一般地,(x,y)的n组观察数据:xx1x2x3xnyy1y2y3yn的回归直线的方程为y=a+bx,则直线y=a+bx恒过的定点是什么? 探究:由线性回归方程的推导,可知方程的系数a、b满足条件:.由此不难发现,点(,)的坐标满足直线y=a+bx的方程.所以,由点与直线的位置关系可得点(,)在直线y=a+bx上,即直线y=a+bx恒过点(,).这里=,=.精题精讲例1有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度/-504712151923273136热饮杯数15615013212813011610489937654 (1)画出散点图; (2)从散点图中发现的气温与热饮销售杯数之间的关系的一般规律; (3)求回归方程; (4)如果某天的气温是2,预测这天卖出的热饮杯数.思路解析根据所给数据,作出散点图,判断散点是否在一条直线附近;如果散点在一条直线附近,用公式(*)求出a、b,写出线性回归方程.答案:(1)散点图如图6-14所示:图6-14 (2)从图中看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少. (3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式(*)求出回归方程的系数. 利用计算器容易求得回归方程=-2352x+147767 (4)当x=2时,=143063因此,某天的气温为2时,这天大约可以卖出143杯热饮.例2为研究某市家庭年平均收入与年平均生活支出的关系,该市统计调查队随机调查了10个家庭,得数据如下:i(家庭编号)12345678910xi(收入)(千元)0.81.11.31.51.51.82.02.22.42.8yi(支出)(千元)0.71.01.21.01.31.51.31.72.02.5 求回归直线方程.思路解析利用公式(*)求出a、b,写出线性回归方程.答案:列表.i12345678910xi0.81.11.31.51.51.8222.42.8yi0.71.01.21.01.31.51.31.72.02.5xiyi0.561.101.561501952.702603404.807.00xi20.641.211.692.252.253.244.004.005.767.84yi20.491.01.441.001.692.251.692.894.06.25故可求得 b=0.833,a=0.013 回归直线方程为y=0.833x0.013例3随机调查了某地区10个商店的建筑面积x(km2)与年销售额y(百万元)的样本如下:x(面积)4.06067.240920788.4y(销售额)3.5254.83.5305124.556 (1)求y关于x的线性回归方程; (2)若线性关系存在,那么对于一个拥有10 000m2的商店来说,它的年销售额为多少?思路解析利用公式(*)求出a、b,写出线性回归方程.答案:(1)列表.i12345678910xi46067.240920788.4yi3.5254.83.5305124.556xiyi141 50028.825.21 2004524031.54050.4xi2163 6003651.841 60081400496470.56yi212.2562523.0412.259002514420.252536 =169.6=16.96,= 99.3=9.93 =3 174.9,=5 968.4,=1 822.79 y=0.48x+1.75 (2)当x=10时,y=6.55 年销售额约为655万元.绿色通道 本题反映了生活中普遍存在的商店的面积与年销售额之间的联系,并根据已有的数据得出线性回归方程. 这是一类日常生活中经常出现的问题.商店的面积与年销售额之间存在着线性相关的关系,根据相关的数据我们求出它们之间线性回归方程.利用该方程得出的年销售额也只是一种估计.
展开阅读全文