线性回归方程课件

上传人:风*** 文档编号:242637675 上传时间:2024-08-30 格式:PPT 页数:46 大小:951.60KB
返回 下载 相关 举报
线性回归方程课件_第1页
第1页 / 共46页
线性回归方程课件_第2页
第2页 / 共46页
线性回归方程课件_第3页
第3页 / 共46页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,线性回归方程,30 八月 2024,线性回归方程,1,问题提出,1.,函数是研究两个变量之间的依存关系的一种数量形式,.,对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系,.,问题提出1.函数是研究两个变量之间的依存关系的一种数量形式.,2,2.,在中学校园里,有这样一种说法:,“如果你的数学成绩好,那么你的物理学习就不会有什么大问题,.”,按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?,2.在中学校园里,有这样一种说法:“如果你的数学成绩好,那么,3,3.,我们不能通过一个人的数学成绩是多少就准确地断定其物理成绩能达到多少,学习兴趣、学习时间、教学水平等,也是影响物理成绩的一些因素,但这两个变量是有一定关系的,它们之间是一种不确定性的关系,.,类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义,.,3.我们不能通过一个人的数学成绩是多少就准确地断定其物理成绩,4,知识探究(一):,变量之间的相关关系,思考,1:,考察下列问题中两个变量之间的关系,:,(,1,)商品销售收入与广告支出经费;,(,2,)粮食产量与施肥量;,(,3,)人体内的脂肪含量与年龄,.,这些问题中两个变量之间的关系是函数关系吗?,知识探究(一):变量之间的相关关系思考1:考察下列问题中两个,5,思考,2,:,“名师出高徒”,可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?,思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就,6,思考,3:,上述两个变量之间的关系是一种非确定性关系,称之为,相关关系,那么相关关系的含义如何?,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系,.,思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关,7,1,、球的体积和球的半径具有( ),A,函数关系,B,相关关系,C,不确定关系,D,无任何关系,2,、下列两个变量之间的关系不是,函数关系的是 ( ),A,角的度数和正弦值,B,速度一定时,距离和时间的关系,C,正方体的棱长和体积,D,日照时间和水稻的亩产量,A,D,练,:,1、球的体积和球的半径具有( )2、下列两个变,8,知识探究(二):散点图,【,问题,】,在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,:,其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数,.,年龄,23,27,39,41,45,49,50,脂肪,9.5,17.8,21.2,25.9,27.5,26.3,28.2,年龄,53,54,56,57,58,60,61,脂肪,29.6,30.2,31.4,30.8,33.5,35.2,34.6,知识探究(二):散点图 【问题】在一次对人体脂肪含量和年龄关,9,思考,1:,对某一个人来说,他的体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性,.,观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?,年龄,23,27,39,41,45,49,50,脂肪,9.5,17.8,21.2,25.9,27.5,26.3,28.2,年龄,53,54,56,57,58,60,61,脂肪,29.6,30.2,31.4,30.8,33.5,35.2,34.6,思考1:对某一个人来说,他的体内脂肪含量不一定随年龄增长而增,10,思考,2:,为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象,.,以,x,轴表示年龄,y,轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?,年龄,23,27,39,41,45,49,50,脂肪,9.5,17.8,21.2,25.9,27.5,26.3,28.2,年龄,53,54,56,57,58,60,61,脂肪,29.6,30.2,31.4,30.8,33.5,35.2,34.6,思考2:为了确定年龄和人体脂肪含量之间的更明确的关系,我们需,11,思考,3,:,上图叫做,散点图,,你能描述一下散点图的含义吗?,在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图,.,思考3:上图叫做散点图,你能描述一下散点图的含义吗? 在平面,12,思考,4:,观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?,思考4:观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什,13,思考,5,:,在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为,正相关,.,一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?,思考5:在上面的散点图中,这些点散布在从左下角到右上角的区域,14,思考,6,:,如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?,一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域,.,一般情况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性,.,思考6:如果两个变量成负相关,从整体上看这两个变量的变化趋势,15,知识探究(一):回归直线,思考,1:,一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?,知识探究(一):回归直线 思考1:一组样本数据的平均数是样本,16,思考,2:,在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?,这些点大致分布在一条直线附近,.,思考2:在各种各样的散点图中,有些散点图中的点是杂乱分布的,17,思考,3:,如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有,线性相关关系,这条直线叫做,回归直线,.,对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心吗?,思考3:如果散点图中的点的分布,从整体上看大致在一条直线附近,18,思考,4:,对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?,思考4:对一组具有线性相关关系的样本数据,你认为其回归直线是,19,思考,5:,在样本数据的散点图中,能否用直尺准确画出回归直线?借助计算机怎样画出回归直线?,思考5:在样本数据的散点图中,能否用直尺准确画出回归直线?借,20,知识探究(二):回归方程,在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为,回归方程,.,对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计,.,知识探究(二):回归方程 在直角坐标系中,任何一条直线都有相,21,思考,1,:,回归直线与散点图中各点的位置应具有怎样的关系?,整体上最接近,思考1:回归直线与散点图中各点的位置应具有怎样的关系? 整体,22,思考,2:,对于求回归直线方程,你有哪些想法?,思考2:对于求回归直线方程,你有哪些想法?,23,(x,1,,,y,1,),(x,2,,,y,2,),(x,i,,,y,i,),(x,n,,,y,n,),可以用 或 ,,其中,.,思考,3,:,对一组具有线性相关关系的样本数据:,(x,1,,,y,1,),,,(x,2,,,y,2,),,,,,(x,n,,,y,n,),,设其回归方程为 可以用哪些数量关系来刻画各样本点与回归直线的接近程度?,(x1, y1)(x2,y2)(xi,yi)(xn,yn)可,24,思考,4,:,为了从整体上反映,n,个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?,(x,1,,,y,1,),(x,2,,,y,2,),(x,i,,,y,i,),(x,n,,,y,n,),思考4:为了从整体上反映n个样本数据与回归直线的接近程度,你,25,思考,5,:,根据有关数学原理分析,当,时,总体偏差 为最小,这样,就得到了回归方程,这种求回归方程的方法叫做,最小二乘法,.,回归方程,中,,a,,,b,的几何意义分别是什么?,思考5:根据有关数学原理分析,当,26,思考,6,:,利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为,,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的,回归值,.,若某人,37,岁,则其体内脂肪含量的百分比约为多少?,20.9%,思考6:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据,27,某小卖部为了了解热茶销售量与气温,之间的关系,随机统计并制作了某,6,天,卖出热茶的杯数与当天气温的对照表:,气温,/,0,C,26,18,13,10,4,-1,杯数,20,24,34,38,50,64,如果某天的气温是,-5,0,C,,你能根据这些,数据预测这天小卖部卖出热茶的杯数吗,?,实例探究,某小卖部为了了解热茶销售量与气温气温/0C261,28,为了了解热茶销量与,气温的大致关系,我们,以横坐标,x,表示气温,,纵坐标,y,表示热茶销量,,建立直角坐标系,.,将表,中数据构成的,6,个数对,表示的点在坐标系内,标出,得到下图。,你发现这些点有什么规律?,A,B,C,D,E,F,0,x,y,10,20,30,40,50,60,5,15,25,35,-5,今后我们称这样的图为,散点图,(scatterplot).,为了了解热茶销量与你发现这些点有什么规律?ABCDEF0x,29,选择怎样的直线近似地表示热茶销量与气,温之间的关系,?,我们有多种思考方案,:,(1),选择能反映直线变化的两个点,例如取,(,2,)取一条直线,使得位于该直线一侧和,另一侧的点的个数基本相同;,(,3,)多取几组点,确定几条直线方程,再分,别算出各条直线斜率、截距的平均值,作为,所求直线的斜率、截距;,(4),尽可能使这些点都分布在一条直线的附近。,怎样的直线最好呢,?,这两点的直线;,选择怎样的直线近似地表示热茶销量与气 (2)取一条直线,使,30,建构数学,1.,最小平方法:,用方程为,的点,应使得该直线与散点图中的点最接近。,那么,怎样衡量直线,与图中六,个点的接近程度呢?,的直线拟合散点图中,我们将表中给出的自变量,带入直线方程,得到相应的六个值:,的,六个,值,它们与表中相应的实际值应该越接近越好,.,建构数学 1.最小平方法:的点,应使得该直线与散点图中的点最,31,所以,我们用类似于估计平均数时的,思想,考虑,离差,的平方和,把,a,看作常数,那么,Q,是关于,b,的二次函数,当,Q,取最小值,同理把,b,看作常数,那么,Q,是关于,a,的二次函数,当,Q,取最小值,所以,我们用类似于估计平均数时的 把a看作常数,那么Q是,32,解得,当,x=-5,时,热茶销量约为,66,杯,线性相关关系,:,像这样能用直线方程,近似表示的相关关系叫做,线性相关关系,.,解得当x=-5时,热茶销量约为66杯线性相关关系:近似表示的,33,线性回归方程:,一般地,设有,n,个观察数据如下:,当,a,b,使,就称为 拟合,这,n,对数据的,线性回归方程,.,方程所表示的直线称为,回归直线,,,a,b,称为,回归系数,取得最小值时,线性回归方程:当a,b使,34,x,x,1,x,2,x,3,x,n,y,y,1,y,2,y,3,y,n,仿照前面的算法,可得线性回归方程,的回归系数,a,b,为,x x1 x2 x3 xn,35,(,y,i,-Y,i,)的最小值,n,i=1,|,y,i,-Y,i,|,的最小值,n,i=1,的最小值,当,a,,,b,取什么值时,,Q,的值最小,即总体偏差最小,(yi-Yi)的最小值ni=1|yi-Yi|的最小值ni,36,2.,三点,(3,10),(7,20),(11,24),的,线性回归方程是,( ),D,11.69,2.三点(3,10),(7,20),(11,24)的D11.,37,二、求线性回归方程,例,2,:观察两相关变量得如下表:,x,-1,-2,-3,-4,-5,5,3,4,2,1,y,-9,-7,-5,-3,-1,1,5,3,7,9,求两变量间的回归方程,解,1,:,列表:,i,1,2,3,4,5,6,7,8,9,10,-1,-2,-3,-4,-5,5,3,4,2,1,-9,-7,-5,-3,-1,1,5,3,7,9,9,14,15,12,5,5,15,12,14,9,计算得,:,二、求线性回归方程例2:观察两相关变量得如下表:x-1-2-,38,所求回归直线方程为,y=x,小结:求线性回归直线方程的步骤:,第一步:列表 ;,第二步:计算 ;,第三步:代入公式计算,b,a,的值;,第四步:写出直线方程。,所求回归直线方程为 y=x小结:求线性回归直线方程的步骤,39,阅读课本,P73,例,1,EXCEL,作散点图,利用线性回归方程解题步骤:,1,、先画出所给数据对应的散点图;,2,、观察散点,如果在一条直线附近,则说明所给量具有线性相关关系,3,、根据公式求出线性回归方程,并解决其他问题。,阅读课本P73例1EXCEL作散点图利用线性回归方程解题步骤,40,练习:第,75,页练习,2,散点图,2,练习:第75页练习2散点图2,41,()如果,x=3,e=1,分别求两个模型中,y,的值;,()分别说明以上两个模型是确定性,模型还是随机模型,3.,我们考虑两个表示变量,x,与,y,之间的关系,的模型,,为误差项,模型如下:,模型:,y=6+4x;,模型:,y=6+4x+e.,()如果x=3,e=1,分别求两个模型中()分别说明以上,42,解,(1),模型:,y=6+4x=6+4,3=18;,模型:,y=6+4x+e=6+4,3+1=19.,(2),模型中相同的,x,值一定得到相同的,y,值,.,所以是确定性模型;模型中相同,的,x,值,因 不同,且 为误差项是随,机的,所以模型,2,是随机性模型,.,解 (1)模型:y=6+4x=6+43=18;模型:y,43,C,线性相关与线性回归方程,C线性相关与线性回归方程,44,写在最后,成功的基础在于好的学习习惯,The foundation of success lies in good habits,45,写在最后成功的基础在于好的学习习惯45,谢谢聆听,学习就是为了达到一定目的而努力去干,是为一个目标去战胜各种困难的过程,这个过程会充满压力、痛苦和挫折,Learning Is To Achieve A Certain Goal And Work Hard, Is A Process To Overcome Various Difficulties For A Goal,谢谢聆听Learning Is To Achieve A C,46,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!