线性回归方程(1)分析课件

上传人:txadgkn****dgknqu... 文档编号:241568166 上传时间:2024-07-05 格式:PPT 页数:30 大小:430.93KB
返回 下载 相关 举报
线性回归方程(1)分析课件_第1页
第1页 / 共30页
线性回归方程(1)分析课件_第2页
第2页 / 共30页
线性回归方程(1)分析课件_第3页
第3页 / 共30页
点击查看更多>>
资源描述
2.3 变量间的相关关系变量间的相关关系2.3 变量间的相关关系1 有些教师常说:有些教师常说:“如果你的数学成绩好,那如果你的数学成绩好,那么你的物理学习就不会有什么大问题么你的物理学习就不会有什么大问题”按照这种按照这种说法,似乎学生的物理成绩与数学成绩之间也存说法,似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系在着某种关系。你如何认识它们之间存在的关系?物理成绩物理成绩 数学成绩数学成绩 学习兴趣学习兴趣 学习时间学习时间 其他因素其他因素结论:变量之间除了函数关系外,还有结论:变量之间除了函数关系外,还有 。问题引入:问题引入:有些教师常说:“如果你的数学成绩好,那么你的物理学习2思考:考察下列问题中两个变量之间的关系:思考:考察下列问题中两个变量之间的关系:(1 1)商品销售收入与广告支出经费;)商品销售收入与广告支出经费;(2 2)粮食产量与施肥量;)粮食产量与施肥量;(3 3)人体内的脂肪含量与年龄;)人体内的脂肪含量与年龄;(4 4)圆的面积与半径;)圆的面积与半径;(5 5)匀速直线运动中的时间与路程)匀速直线运动中的时间与路程。思考:考察下列问题中两个变量之间的关系:3(1 1)函数关系:)函数关系:当自变量取值一定时,因变量取值由它唯一确定当自变量取值一定时,因变量取值由它唯一确定 正方形面积正方形面积S S与其边长与其边长x x之间的函数关系之间的函数关系S=xS=x2 2 ,一块农田的水稻产量与施肥量之间的关系一块农田的水稻产量与施肥量之间的关系 。1.1.两变量之间的关系两变量之间的关系(2)相关关系:)相关关系:当自变量取值一定时,因变量的取值带有一定的随机当自变量取值一定时,因变量的取值带有一定的随机性性对自变量边长的每一个确定值,都有唯一确定的面积的值对自变量边长的每一个确定值,都有唯一确定的面积的值与之对应。与之对应。确定关系确定关系水稻产量并不是由施肥量唯一确定,在取值上带有随机性水稻产量并不是由施肥量唯一确定,在取值上带有随机性不确定关系不确定关系(1)函数关系:正方形面积S与其边长x之间的函数关系S4(1 1)相关关系与函数关系的异同点:)相关关系与函数关系的异同点:相同点:均是指两个变量的关系相同点:均是指两个变量的关系 不同点:不同点:函数关系是一种确定的关系函数关系是一种确定的关系 相关关系是一种非确定关系;相关关系是一种非确定关系;函数关系是一种因果关系,而相关关系不一定是因果关函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是随机关系系,也可能是随机关系.(2)函数关系与相关关系之间有着密切联系:)函数关系与相关关系之间有着密切联系:在一定的条件下可以相互转化在一定的条件下可以相互转化.而对于具有线性相关关系而对于具有线性相关关系的两个变量来说,当求得其回归直线方程后,又可以用一的两个变量来说,当求得其回归直线方程后,又可以用一种确定性的关系对这两个变量间的取值进行估计:种确定性的关系对这两个变量间的取值进行估计:(1)相关关系与函数关系的异同点:(2)函数关系与相关关系之51.下列关系中下列关系中,是带有随机性相关关系的是是带有随机性相关关系的是 .正方形的边长与面积的关系正方形的边长与面积的关系;水稻产量与施肥量之水稻产量与施肥量之间的关系间的关系;人的身高与年龄之间的关系人的身高与年龄之间的关系;降雪量与降雪量与交通事故发生之间的关系交通事故发生之间的关系.2.下列两个变量之间的关系哪个不是函数关系()下列两个变量之间的关系哪个不是函数关系()A角度和它的余弦值角度和它的余弦值B.正方形边长和面积正方形边长和面积C正边形的边数和它的内角和正边形的边数和它的内角和 D.人的年龄和身高人的年龄和身高D1.下列关系中,是带有随机性相关关系的是 6根据上述数据,人体的脂肪含量和年龄之间有怎样的关根据上述数据,人体的脂肪含量和年龄之间有怎样的关系?系?在一次对人体的脂肪含量和年龄关系的?在一次对人体的脂肪含量和年龄关系的?探究一根据上述数据,人体的脂肪含量和年龄之间有怎样的关系?在7 下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点,称该图为各个点,称该图为散点图散点图.如图:如图:O202530 35 4045 505560 65年龄年龄脂肪含量脂肪含量5101520253035401 1、散点图:将样、散点图:将样本中本中n n个数据点个数据点(xixi,yi)yi)(i i1 1,2,n n)描在)描在平面直角坐标系中,平面直角坐标系中,以表示具有相关关以表示具有相关关系的两个变量的一系的两个变量的一组数据的图形叫做组数据的图形叫做散点图散点图.下面我们以年龄为横轴,脂肪含量为纵轴建立直8由散点图支持了我们从数据表中得出如下结论:由散点图支持了我们从数据表中得出如下结论:a.a.如果所有的样本点如果所有的样本点都落在某一函数曲线上都落在某一函数曲线上,就用,就用 该该函数函数来描述变量之间的关系。来描述变量之间的关系。b.b.如果所有的样本点都落在如果所有的样本点都落在某一函数曲线附近某一函数曲线附近,变,变量之间就有量之间就有相关关系相关关系。c.c.如果所有的样本点都落在如果所有的样本点都落在某一直线附近某一直线附近,变量之,变量之间就有间就有线性相关关系线性相关关系。由散点图支持了我们从数据表中得出如下结论:a.如果所有的9 从刚才的散点图发现:年龄越大,体内脂肪含量从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从越高,点的位置散布在从左下角到右上角左下角到右上角的区域的区域.称称它们成它们成正相关正相关.但有的两个变量的相关,如下图所示:但有的两个变量的相关,如下图所示:如高原含氧量与海拔高度如高原含氧量与海拔高度的相关关系,海平面以上,的相关关系,海平面以上,海拔高度越高,含氧量越少海拔高度越高,含氧量越少.作出散点图发现,它作出散点图发现,它们散布在从们散布在从左上角到右下角左上角到右下角的区域内。又如汽车的载重的区域内。又如汽车的载重和汽车每消耗和汽车每消耗1 1升汽油所行升汽油所行使的平均路程,称它们成使的平均路程,称它们成负负相关相关.O 从刚才的散点图发现:年龄越大,体内脂肪含量越高105 5个学生的数学和物理成绩如下表个学生的数学和物理成绩如下表:画出散点图画出散点图,解:解:数学成绩数学成绩由散点图可见,两者之间具有正相关关系。由散点图可见,两者之间具有正相关关系。5个学生的数学和物理成绩如下表:画出散点图,解:数学成绩由散11有一个同学家开了一个小卖部,他为了研究气有一个同学家开了一个小卖部,他为了研究气温对热饮销销售的影响,经过统计,得到一个温对热饮销销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:卖出的热饮杯数与当天气温的对比表:摄氏温度摄氏温度 26 18 13 10 4 -1 热饮杯数热饮杯数 20 24 34 38 50 64(1)(1)画出散点图;画出散点图;(2)(2)从散点图中发现气温与热饮销售杯数之间关从散点图中发现气温与热饮销售杯数之间关系的一般规律;系的一般规律;有一个同学家开了一个小卖部,他为了研究气温对热饮销销售的影响12解解:(1):(1)散点图散点图(2)(2)气温与热饮杯数成负相关气温与热饮杯数成负相关,即气温越高,卖出即气温越高,卖出去的热饮杯数越少。去的热饮杯数越少。温度温度热饮杯数热饮杯数解:(1)散点图(2)气温与热饮杯数成负相关,即气温越高,13散散点点图图回归直线:如果散点图中点的分布回归直线:如果散点图中点的分布从从整体整体上看上看大致在大致在一条直线附近,我们就称这两个变量之间具有一条直线附近,我们就称这两个变量之间具有线性相线性相关关系关关系,这条直线就叫做,这条直线就叫做回归直线回归直线。这条回归直线的方程,简称为回归方程这条回归直线的方程,简称为回归方程。散点图回归直线:如果散点图中点的分布从整体上看大致在一条直线141.1.回归方程被样本数据惟一确定,各样本点大致回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近分布在回归直线附近.对同一个总体,不同的样本对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有数据对应不同的回归直线,所以回归直线也具有随机性随机性.2.2.对于任意一组样本数据,利用上述公式都可以求对于任意一组样本数据,利用上述公式都可以求得得“回归方程回归方程”,如果这组数据不具有线性相关关,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的系,即不存在回归直线,那么所得的“回归方程回归方程”是没有实际意义的是没有实际意义的.因此,对一组样本数据,应先因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归作散点图,在具有线性相关关系的前提下再求回归方程方程.1.回归方程被样本数据惟一确定,各样本点大致分布在回归直线附15方案一:采用测量的方法:先画一条直线,测方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。斜率和截距,就得到回归方程。如何具体的求出回归方程?如何具体的求出回归方程?方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,16方案二、在图中选取两点画直线,使得直线两方案二、在图中选取两点画直线,使得直线两侧的点的个数基本相同。侧的点的个数基本相同。我们应该如何具体的求出这个回归方程呢?我们应该如何具体的求出这个回归方程呢?方案二、在图中选取两点画直线,使得直线两侧的点的个数基本相同17方案三、在散点图中多取几组点,确定几条直方案三、在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率平均数,将这两个平均数作为回归方程的斜率和截距。和截距。我们应该如何具体的求出这个回归方程呢?我们应该如何具体的求出这个回归方程呢?方案三、在散点图中多取几组点,确定几条直线的方程,分别求出各18设已经得到具有线性相关关系的变量的一组数据:设已经得到具有线性相关关系的变量的一组数据:(x x1 1,y y1 1),(),(x x2 2,y y2 2),),(,(x xn n,y yn n)设所求的回归直线方程为设所求的回归直线方程为Y=bx+aY=bx+a,其中其中a a,b b是待定是待定的系数。当变量的系数。当变量x x取取x x1 1,x x2 2,x xn n时,可以得到时,可以得到 Y Yi i=bx=bxi i+a+a(i=1i=1,2 2,n n)它与实际收集得到的它与实际收集得到的y yi i之间偏差是之间偏差是 y yi i-Y-Yi i=y=yi i-(bx-(bxi i+a)+a)(i=1i=1,2 2,n n)(x1,y1)(x2,y2)(xi,yi)yi-Yiy x这样,用这这样,用这n n个偏差的和来刻画个偏差的和来刻画“各点与此直线的整体偏差各点与此直线的整体偏差”是比较合适的。是比较合适的。上述三种方案均有一定的道理,但可靠性不强,我们上述三种方案均有一定的道理,但可靠性不强,我们回到回归直线的回到回归直线的定义定义。设已经得到具有线性相关关系的变量的一组数据:(x1,y1)(19(yi-Yi)的最小值的最小值ni=1|yi-Yi|的最小值的最小值ni=1(yi-Yi)2的最小值的最小值ni=1Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2当当a,b取什么值时,取什么值时,Q的值最小,即总体偏差最小的值最小,即总体偏差最小(xi-x)()(yi-y)ni=1b=(xi-x)ni=1a=y-bx(yi-Yi)的最小值ni=1|yi-Yi|的最小值ni20计算回归方程的斜率和截距的一般公式:计算回归方程的斜率和截距的一般公式:其中,其中,b是回归方程的斜率,是回归方程的斜率,a是截距。是截距。注:对具有线性相关关系的两个变量,其回归直线一定注:对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心通过样本点的中心其中,b是回归方程的斜率,a是截距。注:对具有线性相关关系的21求样本数据的线性回归方程,可按下列步骤进行:求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均数第一步,计算平均数 ,第二步,求和第二步,求和 ,第三步,计算第三步,计算 第四步,写出回归方程第四步,写出回归方程 求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均22例例1 1:假设某设备的使用年限x(年)和所支出的维修费用y(万元)有如下统计资料:由资料知 y对 x呈线性关系,试求:(2)估计使用年限是10年时,维修费用估计是多少?例1:假设某设备的使用年限x(年)和所支出的维修费用y(万元23解解:(1)制表:制表:解:(1)制表:24(2)回归直线方程是(2)估计使用年限是10年时,维修费用估计是多少?答:估计使用10年时,维修费用估计是12.4万元。(2)回归直线方程是(2)估计使用年限是10年时,维修费用估25练习练习某种产品是的广告费支出某种产品是的广告费支出x x(单位:百万元)(单位:百万元)与销售额与销售额y y(单位:百万元)之间有如下对(单位:百万元)之间有如下对应数据应数据(1 1)画出散点图;)画出散点图;(2 2)如果)如果x x与与y y具有相关关系,求回归具有相关关系,求回归直线方程,并说明直线方程,并说明b b的意义的意义练习某种产品是的广告费支出x(单位:百万元)与销售额y(单位26解(1)散点图如图所示:1735910305080销售额(百万元)广告费(百万元)(2)由散点图可知:X与Y具有相关关系故可得故可得:所求回归直线方程为b表示广告每增加100万元,销售量平均增加650元解(1)散点图如图所示:1735910305080销售额(百271.230.08巩固练习巩固练习:2对于回归方程对于回归方程 当当x=28x=28时时,y,y的估计值是的估计值是3901.230.08巩固练习:2对于回归方程 283 3线性回归方程表示的直线线性回归方程表示的直线 必定过必定过()().4 4设有一个回归方程设有一个回归方程,变量变量x x 增加增加1 1个单位个单位长度时,变量长度时,变量y y()()平均增加平均增加2.52.5个单位长度个单位长度 平均增加平均增加0.50.5个单位长度个单位长度平均减少平均减少2.52.5个单位长度个单位长度 平均减少平均减少0.50.5个单位长度个单位长度DC3线性回归方程表示的直线 29课堂总结课堂总结1 1、两种相关关系:正相关、负相关、两种相关关系:正相关、负相关2 2、线性回归方程、线性回归方程:回归直线所在方程的斜率与截距的一般公式回归直线所在方程的斜率与截距的一般公式:课堂总结回归直线所在方程的斜率与截距的一般公式:30
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!