资源描述
一条直线一条直线距离的平方和距离的平方和1回归直线回归直线如果两个变量散点图中点的分布从整体上看大致在如果两个变量散点图中点的分布从整体上看大致在 .附近,那么称这两个变量之间具有线性相关关系,这条直线叫作附近,那么称这两个变量之间具有线性相关关系,这条直线叫作回归直线回归直线2最小二乘法最小二乘法求线性回归方程求线性回归方程ybxa时,使得样本数据的点到它的时,使得样本数据的点到它的 最小的方法叫作最小二乘法其中最小的方法叫作最小二乘法其中a,b的值由以下的值由以下公式给出:公式给出: a,b是线性回归方程的系数是线性回归方程的系数 核心必知核心必知 1任给一组数据,我们都可以由最小二乘法得出线性任给一组数据,我们都可以由最小二乘法得出线性回归方程吗?回归方程吗?提示:用最小二乘法求回归直线的方程的前提是先判断所给数据具有线性相关关系(可利用散点图判断)否则求出的线性回归方程是无意义的2线性回归方程是否经过一定点?线性回归方程是否经过一定点?提示:线性回归方程恒过定点( x ,y ) 问题思考问题思考 讲一讲讲一讲 1.下表是某旅游区游客数量与平均气温的对比表:下表是某旅游区游客数量与平均气温的对比表:若已知游客数量与平均气温是线性相关的,求线性回归若已知游客数量与平均气温是线性相关的,求线性回归方程方程平均气温平均气温)410131826数量数量202434385064自主解答x706353, y23061153,x21x22x261161001693246761 286,x1y1x2y2x6y620963401338185026643 474. 练一练练一练 1某研究机构对高三学生的记忆力某研究机构对高三学生的记忆力x和判断力和判断力y进行统进行统计分析,得下表数据:计分析,得下表数据:已知记忆力已知记忆力x和判断力和判断力y是线性相关的,求线性回归方是线性相关的,求线性回归方程程x681012y2356 讲一讲讲一讲 2.某种产品的广告费支出某种产品的广告费支出x(单位:百万元单位:百万元)与销售额与销售额y(单位:单位:百万元百万元)之间有如下对应数据:之间有如下对应数据: (1)画出散点图;画出散点图;(2)求线性回归方程;求线性回归方程;(3)预测当广告费支出为预测当广告费支出为7百万元时的销售额百万元时的销售额x24568y3040605070用线性回归方程估计总体的一般步骤:用线性回归方程估计总体的一般步骤:(1)作出散点图,判断散点是否在一条直线附近;作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求出如果散点在一条直线附近,用公式求出a、b并写出线性并写出线性回归方程;回归方程;(3)根据线性回归方程对总体进行估计根据线性回归方程对总体进行估计练一练练一练 2假设关于某设备的使用年限假设关于某设备的使用年限x和所支出的维修费用和所支出的维修费用y(单位:万元单位:万元)有如下的统计资料:有如下的统计资料:若由资料知若由资料知y对对x呈线性相关关系,试求:呈线性相关关系,试求:(1)回归方程回归方程ybxa的系数的系数a,b;(2)使用年限为使用年限为10年时,试估计维修费用是多少年时,试估计维修费用是多少使用年限使用年限x23456维修费用维修费用y2.23.85.56.57.0解:(1)列表如下:i12345xi23456yi2.23.85.56.57.0 xiyi4.411.422.032.542.0 x2i49162536x4, y5,5i1x2i90,5i1xiyi112.3b5i1xiyi5 xy5i1x2i5 x2112.3545905421.23,a yb x51.2340.08.(2)回归方程是 y1.23x0.08,当 x10 时,y1.23100.0812.38(万元),即估计使用 10 年时维修费用是 12.38 万元.有人统计了同一个省的有人统计了同一个省的6个城市某一年的人均国民生产个城市某一年的人均国民生产总值总值(即人均即人均GDP)和这一年各城市患白血病的儿童数量,如和这一年各城市患白血病的儿童数量,如下表:下表:(1)画出散点图,并判定两个变量是否具有线性相关关画出散点图,并判定两个变量是否具有线性相关关系;系;(2)通过计算可得两个变量的线性回归方程为通过计算可得两个变量的线性回归方程为y23.25x102.25,假如一个城市的人均,假如一个城市的人均GDP为为12万元,那么可以断万元,那么可以断言,这个城市患白血病的儿童一定超过言,这个城市患白血病的儿童一定超过380人,请问这个断人,请问这个断言是否正确?言是否正确?人均人均1086431患白血病的儿患白血病的儿童数童数351312207175132180错解错解(1)根据表中数据画散点图,如图所示,从图根据表中数据画散点图,如图所示,从图可以看出,虽然后可以看出,虽然后5个点大致分布在一条直线的附近,但第个点大致分布在一条直线的附近,但第一个点离这条直线太远,所以这两个变量不具有线性相关一个点离这条直线太远,所以这两个变量不具有线性相关关系关系(2)将将x12代入代入y23.25x102.25,得,得y23.2512102.25381.25380, 所以上述断言是正确的所以上述断言是正确的错因错因在第在第(1)问中,是否具有线性相关关系,要看问中,是否具有线性相关关系,要看大部分点、主流点是否分布在一条直线附近,个别点是不大部分点、主流点是否分布在一条直线附近,个别点是不影响影响“大局大局”的,所以可断定这两个变量具有线性相关关的,所以可断定这两个变量具有线性相关关系在第系在第(2)问中,问中,381.25只是一个估计值,由它不能断言只是一个估计值,由它不能断言这个城市患白血病的儿童一定超过这个城市患白血病的儿童一定超过380人如果这个城市的人如果这个城市的污染很严重,有可能人数远远超过污染很严重,有可能人数远远超过380,若这个城市的环境,若这个城市的环境保护的很好,则人数就有可能远远低于保护的很好,则人数就有可能远远低于380.正解正解(1)根据表中数据画散点图,如错解图所示,根据表中数据画散点图,如错解图所示,从图可以看出,在从图可以看出,在6个点中,虽然第一个点离这条直线较远,个点中,虽然第一个点离这条直线较远,但其余但其余5个点大致分布在这条直线的附近,所以这两个变量个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系具有线性相关关系(2)将将x12代入代入y23.25x102.25,得,得y23.2512102.25381.25380,即便如此,但因,即便如此,但因381.25只是一个估计只是一个估计值,会受其他情况的影响,所以不能断言这个城市患白血值,会受其他情况的影响,所以不能断言这个城市患白血病的儿童一定超过病的儿童一定超过380人人1已知 x 与 y 之间的一组数据:x0123y1357则 y 与 x 的线性回归方程 ybxa 必过点()A(2,2)B(1.5,0)C(1,2)D(1.5,4)2工人工资工人工资y(元元)随劳动生产率随劳动生产率x(千元千元)变化的回归直线方变化的回归直线方程为程为y80 x50,则下列判断正确的是,则下列判断正确的是()A劳动生产率为劳动生产率为1 000元时,工资为元时,工资为130元元B劳动生产率提高劳动生产率提高1 000元时,工资约提高元时,工资约提高80元元C劳动生产率提高劳动生产率提高1 000元时,工资约提高元时,工资约提高130元元D当月工资当月工资210元时,劳动生产率为元时,劳动生产率为2 000元元解析:回归直线的斜率为解析:回归直线的斜率为80,所以,所以x每增加每增加1个单位,个单位,y约约增加增加80,即劳动生产率提高,即劳动生产率提高1 000元时,工资提高约元时,工资提高约80元元答案:答案:B3(福建高考改编福建高考改编)已知已知x与与y之间的几组数据如下表:之间的几组数据如下表: 假设根据上表数据所得线性回归直线方程为假设根据上表数据所得线性回归直线方程为ybxa,若某同学根据上表中的前两组数据若某同学根据上表中的前两组数据(1,0)和和(2,2)求得的直线方程求得的直线方程为为ybxa,则以下结论正确的是,则以下结论正确的是()Abb,aa Bbb,aa Cba Dbb,aax123456 y0213345某单位为了了解用电量某单位为了了解用电量y度与气温度与气温x之间的关系,随之间的关系,随机统计了某机统计了某4天的用电量与当天气温,并制作了对照表:天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程由表中数据得线性回归方程ybxa中中b2,预测当,预测当气温为气温为4 时,用电量的度数约为时,用电量的度数约为_气温气温)1813101用电量用电量243438646下表提供了某厂节能降耗技术改造后,生产甲产品过下表提供了某厂节能降耗技术改造后,生产甲产品过程中记录的产量程中记录的产量x(吨吨)与相应的生产能耗与相应的生产能耗y(吨标准煤吨标准煤)的几组对照的几组对照数据:数据:(1)请画出上表中数据的散点图;请画出上表中数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出请根据上表提供的数据,用最小二乘法求出y关于关于x的线的线性回归方程性回归方程ybxa;(3)已知该厂技改前已知该厂技改前100吨甲产品的生产能耗为吨甲产品的生产能耗为90吨标准吨标准煤试根据煤试根据(2)求出的线性回归方程,预测生产求出的线性回归方程,预测生产100吨甲产品的吨甲产品的生产能耗比技改前降低多少吨标准煤生产能耗比技改前降低多少吨标准煤(参考数值:参考数值:32.5435464.566.5)x3456y2.5344.5解:(1)散点图如图所示
展开阅读全文