人教版 高中数学选修23 教学案3.1 回归分析的基本思想及其初步应用

上传人:仙*** 文档编号:42146612 上传时间:2021-11-24 格式:DOC 页数:13 大小:452.50KB
返回 下载 相关 举报
人教版 高中数学选修23 教学案3.1 回归分析的基本思想及其初步应用_第1页
第1页 / 共13页
人教版 高中数学选修23 教学案3.1 回归分析的基本思想及其初步应用_第2页
第2页 / 共13页
人教版 高中数学选修23 教学案3.1 回归分析的基本思想及其初步应用_第3页
第3页 / 共13页
点击查看更多>>
资源描述
2019 人教版精品教学资料高中选修数学回归分析的基本思想及其初步应用预习课本预习课本 P8089,思考并完成以下问题思考并完成以下问题1什么是回归分析?什么是回归分析?2什么是线性回归模型?什么是线性回归模型?3求线性回归方程的步骤是什么?求线性回归方程的步骤是什么?新知初探新知初探1回归分析回归分析(1)回归分析回归分析回归分析是对具有回归分析是对具有相关关系相关关系的两个变量进行统计分析的一种常用方法的两个变量进行统计分析的一种常用方法(2)回归方程的相关计算回归方程的相关计算对于两个具有线性相关关系的变量的一组数据对于两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)设其回设其回归直线方程为归直线方程为ybxa,其中,其中a,b是待定参数,由最小二乘法得是待定参数,由最小二乘法得b错误错误!错误错误!,aybx(3)线性回归模型线性回归模型线性回归模型线性回归模型ybxae,E e 0,D e 2,其中,其中 a,b 为模型的未知参数,通常为模型的未知参数,通常 e 为为随机变随机变量量,称为,称为随机误差随机误差x 称为称为解释解释变量,变量,y 称为称为预报预报变量变量点睛点睛对线性回归模型的三点说明对线性回归模型的三点说明(1)非确定性关系:线性回归模型非确定性关系:线性回归模型 ybxae 与确定性函数与确定性函数 yabx 相比,它表示相比,它表示 y与与 x 之间是统计相关关系之间是统计相关关系(非确定性关系非确定性关系),其中的随机误差其中的随机误差 e 提供了选择模型的准则以及在提供了选择模型的准则以及在模型合理的情况下探求最佳估计值模型合理的情况下探求最佳估计值 a,b 的工具的工具(2)线性回归方程线性回归方程ybxa中中a,b的意义是的意义是:以以a为基数为基数,x 每增加每增加 1 个单位个单位,y 相应地相应地平均增加平均增加b个单位个单位2线性回归分析线性回归分析(1)残差残差:对于样本点对于样本点(xi,yi)(i1,2,n)的随机误差的估计值的随机误差的估计值 eiyiyi称为相应于称为相应于点点(xi,yi)的残差,的残差,错误错误!(yiyi)2称为残差平方和称为残差平方和(2)残差图残差图:利用图形来分析残差特性利用图形来分析残差特性,作图时纵坐标为作图时纵坐标为残差残差, 横坐标可以选为样本编横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图号,或身高数据,或体重的估计值等,这样作出的图形称为残差图(3)R21错误错误!越接近越接近 1,表示回归的效果越好,表示回归的效果越好小试身手小试身手1判断下列命题是否正确判断下列命题是否正确(正确的打正确的打“”“”,错误的打,错误的打“”“”)(1)残差平方和越小,残差平方和越小, 线性回归方程的拟合效果越好线性回归方程的拟合效果越好()(2)在画两个变量的散点图时,在画两个变量的散点图时, 预报变量在预报变量在 x 轴上,解释变量在轴上,解释变量在 y 轴上轴上()(3)R2越小,越小, 线性回归方程的拟合效果越好线性回归方程的拟合效果越好()答案:答案:(1)(2)(3)2从散点图上看,点散布在从左下角到右上角的区域内,从散点图上看,点散布在从左下角到右上角的区域内, 两个变量的这种相关关系两个变量的这种相关关系称为称为_答案:答案:正相关正相关3在残差分析中,在残差分析中, 残差图的纵坐标为残差图的纵坐标为_答案:答案:残差残差4 如果发现散点图中所有的样本点都在一条直线上如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于则残差平方和等于_,解解释变量和预报变量之间的相关系数等于释变量和预报变量之间的相关系数等于_答案:答案:01 或或1求线性回归方程求线性回归方程典例典例某研究机构对高三学生的记忆力某研究机构对高三学生的记忆力 x 和判断力和判断力 y 进行统计分析,得下表数据进行统计分析,得下表数据x681012y2356(1)请画出上表数据的散点图;请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出请根据上表提供的数据,用最小二乘法求出 y 关于关于 x 的线性回归方程的线性回归方程 ybxa;(3)试根据求出的线性回归方程,预测记忆力为试根据求出的线性回归方程,预测记忆力为 9 的同学的判断力的同学的判断力解解(1)散点图如图:散点图如图:(2)错误错误!iyi6283105126158,x68101249,y235644,错误错误!2i6282102122344b158494344492142007,aybx407923,故线性回归方程为故线性回归方程为y07x23(3)由由(2)中线性回归方程知,当中线性回归方程知,当 x9 时,时,y079234,故预测记忆力为,故预测记忆力为 9 的的同学的判断力约为同学的判断力约为 4求线性回归方程的三个步骤求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系(2)求回归系数:若存在线性相关关系,则求回归系数求回归系数:若存在线性相关关系,则求回归系数(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明写方程:写出线性回归方程,并利用线性回归方程进行预测说明活学活用活学活用某工厂某工厂 18 月份某种产品的产量与成本的统计数据见下表:月份某种产品的产量与成本的统计数据见下表:月份月份12345678产量产量(吨吨)5660616470758082成本成本(万元万元)130136143149157172183188以产量为以产量为 x,成本为,成本为 y(1)画出散点图;画出散点图;(2)y 与与 x 是否具有线性相关关系?若有,求出其回归方程是否具有线性相关关系?若有,求出其回归方程解:解:(1)由表画出散点图,如图所示由表画出散点图,如图所示(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为从上图可看出,这些点基本上散布在一条直线附近,可以认为 x 和和 y 线性相关关系线性相关关系显著,下面求其回归方程,首先列出下表显著,下面求其回归方程,首先列出下表xiyix2ixiyi1561303136728026013636008160361143372187234641494096953657015749001 099067517256251 290078018364001 464088218867241 54165481 258382028 7645计算得计算得x685,y15725b错误错误!8 764.586.85157.25382.0286.8522217,aybx157252217685539,故线性回归方程为故线性回归方程为y2217x539回归分析回归分析题点一:线性回归分析题点一:线性回归分析1在一段时间内,某种商品的价格在一段时间内,某种商品的价格 x 元和需求量元和需求量 y 件之间的一组数据为:件之间的一组数据为:x1416182022y1210753求出求出 y 对对 x 的回归直线方程,并说明拟合效果的程度的回归直线方程,并说明拟合效果的程度解:解:x15(1416182022)18,y15(1210753)74错误错误!2i1421621822022221 660,错误错误!iyi14121610187205223620,可得回归系数可得回归系数b错误错误!6205187.41 6605182115所以所以a7411518281所以回归直线方程:所以回归直线方程:y115x281列出残差表:列出残差表:yiyi003040102yiy4626042444则则错误错误!(yiyi)203,错误错误!(yiy)2532R21错误错误!0994所以回归模型的拟合效果很好所以回归模型的拟合效果很好题点二:非线性回归分析题点二:非线性回归分析2为了研究某种细菌随时间为了研究某种细菌随时间 x 变化繁殖个数变化繁殖个数 y 的变化,收集数据如下的变化,收集数据如下时间时间 x/天天123456繁殖个数繁殖个数 y612254995190(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;(2)求求 y 与与 x 之间的回归方程之间的回归方程解:解:(1)散点图如图所示:散点图如图所示:(2)由散点图看出样本点分布在一条指数函数由散点图看出样本点分布在一条指数函数 y1c1ec2x 的周围,于是令的周围,于是令 zln y,则,则x123456z179248322389455525由计算器算得,由计算器算得,z069x1112,则有,则有ye069x1112(1)当两个变量已明显呈线性相关关系时当两个变量已明显呈线性相关关系时,则无需作散点图则无需作散点图,就可直接求回归直线方程就可直接求回归直线方程,否则要先判定相关性再求回归方程判断拟合效果的好坏需要利用否则要先判定相关性再求回归方程判断拟合效果的好坏需要利用 R2确定,确定,R2越接近越接近 1,说明拟合效果越好说明拟合效果越好(2)非线性回归方程的求法非线性回归方程的求法根据原始数据根据原始数据(x,y)作出散点图;作出散点图;根据散点图,选择恰当的拟合函数;根据散点图,选择恰当的拟合函数;作恰当的变换,将其转化成线性函数,求线性回归方程;作恰当的变换,将其转化成线性函数,求线性回归方程;在在的基础上通过相应的变换,即可得非线性回归方程的基础上通过相应的变换,即可得非线性回归方程层级一层级一学业水平达标学业水平达标1在对两个变量在对两个变量 x,y 进行线性回归分析时,有下列步骤:进行线性回归分析时,有下列步骤:对所求出的回归直线方程作出解释;对所求出的回归直线方程作出解释;收集数据收集数据(xi,yi),i1,2,n;求线性回归方程;求线性回归方程;求相关系数;求相关系数;根据所搜集的数据绘制散点图根据所搜集的数据绘制散点图如果根据可行性要求能够作出变量如果根据可行性要求能够作出变量 x,y 具有线性相关的结论具有线性相关的结论,则在下列操作顺序中正则在下列操作顺序中正确的是确的是()ABCD解析:解析:选选 D对两个变量进行回归分析时,首先收集数据对两个变量进行回归分析时,首先收集数据(xi,yi),i1,2,n;根;根据所搜集的数据绘制散点图据所搜集的数据绘制散点图观察散点图的形状观察散点图的形状,判断线性相关关系的强弱判断线性相关关系的强弱,求相关系数求相关系数,写出线性回归方程写出线性回归方程,最后依据所求出的回归直线方程作出解释最后依据所求出的回归直线方程作出解释;故正确顺序是故正确顺序是,故选故选 D2有下列说法:有下列说法:在残差图中在残差图中,残差点比较均匀地落在水平的带状区域内残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适说明选用的模型比较合适;R2来刻画回归的效果,来刻画回归的效果,R2值越大,说明模型的拟合效果越好;值越大,说明模型的拟合效果越好;比较两个模型的拟合效果,比较两个模型的拟合效果, 可以比较残差平方和的大小,残差平方和越小的模型可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好拟合效果越好其中正确命题的个数是其中正确命题的个数是()A0B1C2D3解析解析:选选 D选用的模型是否合适与残差点的分布有关选用的模型是否合适与残差点的分布有关; 对于对于, R2的值越大的值越大,说明残差平方和越小,说明残差平方和越小, 随机误差越小,则模型的拟合效果越好随机误差越小,则模型的拟合效果越好3下图是根据变量下图是根据变量 x,y 的观测数据的观测数据(xi,yi)(i1,2,10)得到的散点图,由这些散得到的散点图,由这些散点图可以判断变量点图可以判断变量 x,y 具有相关关系的图是具有相关关系的图是()ABCD解析解析:选选 D根据散点图中点的分布情况根据散点图中点的分布情况,可判断可判断中的变量中的变量 x,y 具有相关的关系具有相关的关系4 (重庆高考重庆高考)已知变量已知变量 x 与与 y 正相关正相关, 且由观测数据算得样本平均数且由观测数据算得样本平均数x3,y3 5,则由该观测数据算得的线性回归方程可能为则由该观测数据算得的线性回归方程可能为()Ay04x23By2x24Cy2x95Dy03x44解析解析: 选选 A依题意知依题意知, 相应的回归直线的斜率应为正相应的回归直线的斜率应为正, 排除排除 C, D 且直线必过点且直线必过点(3,3 5)代入代入 A,B 得得 A 正确正确5为了解某社区居民的家庭年收入与年支出的关系为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区随机调查了该社区 5 户家庭户家庭,得得到如下统计数据表:到如下统计数据表:收入收入 x(万元万元)8286100113119支出支出 y(万元万元)6275808598根据上表可得回归直线方程根据上表可得回归直线方程ybxa,其中其中b076,a ybx据此估计据此估计,该社该社区一户年收入为区一户年收入为 15 万元家庭的年支出为万元家庭的年支出为()A114 万元万元B118 万元万元C120 万元万元D122 万元万元解析:解析:选选 B由题意知,由题意知,x8.28.610.011.311.9510,y6.27.58.08.59.858,a80761004,当当 x15 时,时,y0761504118(万元万元)6以下是某地区的降雨量与年平均气温的一组数据:以下是某地区的降雨量与年平均气温的一组数据:年平均气温年平均气温()1251128412841369133312741305年降雨量年降雨量(mm)542507813574701432464根据这组数据可以推断根据这组数据可以推断, 该地区的降雨量与年平均气温该地区的降雨量与年平均气温_相关关系相关关系 (填填“具有具有”或或“不具有不具有”)解析:解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系画出散点图,观察可知,降雨量与年平均气温没有相关关系答案:答案:不具有不具有7在一组样本数据在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等不全相等)的散点图中,若所有样本点的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线都在直线 y12x1 上,则这组样本数据上,则这组样本数据的样本相关系数为的样本相关系数为_解析:解析:根据样本相关系数的定义可知,根据样本相关系数的定义可知, 当所有样本点都在直线上时,当所有样本点都在直线上时, 相关系数为相关系数为 1答案:答案:18下列说法正确的命题是下列说法正确的命题是_(填序号填序号)回归直线过样本点的中心回归直线过样本点的中心(x,y);线性回归方程对应的直线线性回归方程对应的直线ybxa至少经过其样本数据点至少经过其样本数据点(x1,y1),(x2,y2),(xn,yn)中的一个点;中的一个点;在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高;在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高;在回归分析中,在回归分析中,R2为为 098 的模型比的模型比 R2为为 080 的模型拟合的效果好的模型拟合的效果好解析:解析:由回归分析的概念知由回归分析的概念知正确,正确,错误错误答案:答案:9某工厂为了对新研发的一种产品进行合理定价某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试将该产品按事先拟定的价格进行试销,得到如下数据:销,得到如下数据:单价单价 x(元元)8828486889销量销量 y(件件)908483807568(1)求回归直线方程求回归直线方程ybxa,其中,其中b20,aybx;(2)预计在今后的销售中,销量与单价仍然服从预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是中的关系,且该产品的成本是 4 元元/件,为使工厂获得最大利润,该产品的单价应定为多少元?件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本利润销售收入成本)解:解:(1)x16(8828486889)85,y16(908483807568)80,从而从而ay20 x802085250,故故y20 x250(2)由题意知,由题意知, 工厂获得利润工厂获得利润z(x4)y20 x2330 x1 00020 x334236125,所以当所以当 x334825 时时,zmax36125(元元)即当该产品的单价定为即当该产品的单价定为 825 元时,工厂获得最大利润元时,工厂获得最大利润10关于关于 x 与与 y 有以下数据:有以下数据:x24568y3040605070已知已知 x 与与 y 线性相关,由最小二乘法得线性相关,由最小二乘法得b65,(1)求求 y 与与 x 的线性回归方程;的线性回归方程;(2)现有第二个线性模型:现有第二个线性模型:y7x17,且,且 R2082若与若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由解:解:(1)依题意设依题意设 y 与与 x 的线性回归方程为的线性回归方程为y65xax2456855,y3040605070550,y65xa经过经过(x,y),50655a,a175,y 与与 x 的线性回归方程为的线性回归方程为y65x175(2)由由(1)的线性模型得的线性模型得 yiyi与与 yiy的关系如下表:的关系如下表:yiyi0535106505yiy201010020所以所以错误错误!(yiyi)2(05)2(35)2102(65)2052155错误错误!(yiy)2(20)2(10)2102022021 000所以所以 R211错误错误!11551 0000845由于由于 R210845,R2082 知知 R21R2,所以所以(1)的线性模型拟合效果比较好的线性模型拟合效果比较好层级二层级二应试能力达标应试能力达标1在建立两个变量在建立两个变量 y 与与 x 的回归模型中的回归模型中,分别选择分别选择 4 个不同模型个不同模型,求出它们相对应求出它们相对应的的R2如表,则其中拟合效果最好的模型是如表,则其中拟合效果最好的模型是()模型模型1234R2067085049023A模型模型 1B模型模型 2C模型模型 3D模型模型 4解析解析:选选 B线性回归分析中线性回归分析中,相关系数为相关系数为 r,|r|越接近于越接近于 1, 相关程度越大相关程度越大; |r|越小越小,相关程度越小,故其拟合效果最好相关程度越小,故其拟合效果最好 故选故选 B2如果某地的财政收入如果某地的财政收入 x 与支出与支出 y 满足线性回归方程满足线性回归方程 ybxae(单位单位:亿元亿元),其其中中b08,a2,|e|05,如果今年该地区财政收入为,如果今年该地区财政收入为 10 亿元,则年支出预计不会超过亿元,则年支出预计不会超过()A10 亿亿B9 亿亿C105 亿亿D95 亿亿解析:解析:选选 Cx10 时,时,y08102e10e,又又|e|05,y1053某咖啡厅为了了解热饮的销售量某咖啡厅为了了解热饮的销售量 y(个个)与气温与气温 x()之间的关系,随机统计了某之间的关系,随机统计了某 4 天天的销售量与气温,并制作了对照表:的销售量与气温,并制作了对照表:气温气温()1813101销售量销售量(个个)24343864由表中数据由表中数据,得线性回归方程得线性回归方程y2xa当气温为当气温为4 时时,预测销售量约为预测销售量约为()A68B66C72D70解析:解析:选选 Ax14(1813101)10,y14(24343864)40,40210a,a60,当,当 x4 时,时,y2(4)60684甲、乙、丙、丁甲、乙、丙、丁 4 位同学各自对位同学各自对 A,B 两变量进行回归分析,分别得到散点图与残两变量进行回归分析,分别得到散点图与残差平方和差平方和错误错误!(yiyi)2如下表:如下表:甲甲乙乙丙丙丁丁散点图散点图残差平方和残差平方和115106124103哪位同学的试验结果体现拟合哪位同学的试验结果体现拟合 A,B 两变量关系的模型拟合精度高两变量关系的模型拟合精度高()A甲甲B乙乙C丙丙D丁丁解析:解析:选选 D根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小差平方和越小(对于已经获取的样本数据对于已经获取的样本数据,R2的表达式中的表达式中错误错误!(yiy)2为确定的数为确定的数,则残差则残差平方和越小平方和越小,R2越大越大),由回归分析建立的线性回归模型的拟合效果越好由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁由试验结果知丁要好些故选要好些故选 D5在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线 yebxa的周围,令的周围,令zln y,求得回归直线方程为,求得回归直线方程为z025x258,则该模型的回归方程为,则该模型的回归方程为_解析:解析:因为因为z025x258,zln y,所以,所以 ye025x258答案:答案:ye025x2586调查了某地若干户家庭的年收入调查了某地若干户家庭的年收入 x(单位:万元单位:万元)和年饮食支出和年饮食支出 y(单位:万元单位:万元),调查,调查显示年收显示年收入入 x 与年饮食支与年饮食支出出 y 具有线性相关关系具有线性相关关系, 并由调查数据得并由调查数据得到到 y 对对x 的回归直线方程的回归直线方程:y0254x0321由回归直线方程可知,家庭年收入每增加由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均万元,年饮食支出平均增加增加_万元万元解析:解析:以以 x1 代代 x,得,得y0254(x1)0321,与,与y0254x0321 相减可得相减可得,年饮食支出平均增加年饮食支出平均增加 0254 万元万元答案:答案:02547下表是某年美国旧轿车价格的调查资料下表是某年美国旧轿车价格的调查资料使用年数使用年数12345678910平均价格平均价格(美元美元)2 6511 9431 4941 087765538484290226204观察表中的数据,试问平均价格与使用年数间存在什么样的关系?观察表中的数据,试问平均价格与使用年数间存在什么样的关系?解:解:设设 x 表示轿车的使用年数,表示轿车的使用年数,y 表示相应的平均价格,作出散点图表示相应的平均价格,作出散点图由散点图可以看出由散点图可以看出 y 与与 x 具有指数关系,具有指数关系,令令 zln y,变换得,变换得x12345678910z7883757273096991664062886182567054215318作出散点图:作出散点图:由图可知各点基本上处于一直线,由表中数据可求出线性回归方程:由图可知各点基本上处于一直线,由表中数据可求出线性回归方程:z81660298x因为旧车的平均价格与使用年数具有指数关系因为旧车的平均价格与使用年数具有指数关系,其非线性回归方程为其非线性回归方程为ye81660298x8某公司利润某公司利润 y(单位:千万元单位:千万元)与销售总额与销售总额 x(单位:千万元单位:千万元)之间有如下对应数据:之间有如下对应数据:x10151720252832y113182262733(1)画出散点图;画出散点图;(2)求回归直线方程;求回归直线方程;(3)估计销售总额为估计销售总额为 24 千万元时的利润千万元时的利润解:解:(1)散点图如图:散点图如图:(2)列下表,并利用科学计算器进行有关计算列下表,并利用科学计算器进行有关计算i1234567xi10151720252832yi113182262733x21,y21错误错误!2i3 447,错误错误!iyi3463于是于是b346.37212.13 44772120104a210104210084,因此回归直线方程为因此回归直线方程为y0104x0084(3)当当 x24 时,时,y01042400842412(千万元千万元)
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!