第7章相关与回归分析--课件

上传人:29 文档编号:242025956 上传时间:2024-08-10 格式:PPT 页数:58 大小:965.79KB
返回 下载 相关 举报
第7章相关与回归分析--课件_第1页
第1页 / 共58页
第7章相关与回归分析--课件_第2页
第2页 / 共58页
第7章相关与回归分析--课件_第3页
第3页 / 共58页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,ppt课件,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,ppt课件,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,ppt课件,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,ppt课件,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,ppt课件,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,ppt课件,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,ppt课件,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,ppt课件,*,第,7,章 相关与回归分析,1,ppt课件,第7章 相关与回归分析1ppt课件,第一节,数据的相关分析,2,ppt课件,第一节 数据的相关分析2ppt课件,(一)双变量相关关系的含义,一、双变量相关关系的含义和种类,函数关系,相关关系,现象之间确定性的,数量依存关系,现象之间非确定性的,数量依存关系,3,ppt课件,(一)双变量相关关系的含义一、双变量相关关系的含义和种类函数,(二)双变量相关关系的种类,一、双变量相关关系的含义和种类,相关关系的种类,相关方向,正相关和负相关,相关形式,线性相关和,非线性相关,相关程度,完全相关、不完全相关和不相关,4,ppt课件,(二)双变量相关关系的种类一、双变量相关关系的含义和种类相关,【,例,7-1】,歌乐音响设备商店于,2014,年,79,三个月份中,连续,10,周使用了周末电视广告来提高商店的销售额。商店经理想调查这段时间内播出的广告次数和店内销售额之间是否存在某种关系。,问题:如果该经理将这项工作交给你,你该怎样做呢?,二、双变量相关关系的测度方法,5,ppt课件,【例7-1】歌乐音响设备商店于2014年79三,(一)相关表法,1.,编制原始数据表如下,表,7-1,立体声音响设备商店的原始数据,二、双变量相关关系的测度方法,6,ppt课件,(一)相关表法二、双变量相关关系的测度方法6ppt课件,2.,将原始数据表编制成相关表,表,7-2,立体声音响设备商店的广告次数与销售额相关表,二、双变量相关关系的测度方法,7,ppt课件,2.将原始数据表编制成相关表二、双变量相关关系,(二)相关图法,二、双变量相关关系的测度方法,图,7-1,立体声音响设备商店数据散点图,8,ppt课件,(二)相关图法 二、双变量相关关系的测度方法图7-1 立,(三)相关系数法,相关系数,是用以衡量两变量间线性相关关系情况下,相关方向和密切程度的相对数。,二、双变量相关关系的测度方法,9,ppt课件,(三)相关系数法二、双变量相关关系的测度方法9ppt课件,1.,相关系数的计算,样本相关系数的定义公式,二、双变量相关关系的测度方法,(7.1),10,ppt课件,1.相关系数的计算二、双变量相关关系的测度方法(7.1)10,11,ppt课件,11ppt课件,样本数据的简捷公式,总体数据的相关系数,12,ppt课件,样本数据的简捷公式总体数据的相关系数12ppt课件,7-2,根据表,7-2,相关数据,利用样本数据计算相关系数。,13,ppt课件,7-2 根据表7-2相关数据,利用样本数据计算相关系数。,2.,相关系数的应用,a.,相关系数的取值范围,的取值在,-1,和,1,之间,即,b.,正负相关的判断,当,0,时为正相关;当,0,时为负相关。,14,ppt课件,2.相关系数的应用14ppt课件,c.,相关密切程度的判断,当 时,相关关系越密切,当,说明,X,与,Y,之间完全相关,即函数关系;当 时,相关关系越不密切,当,=0,,说明,X,与,Y,之间不存在直线相关关系,但也许存在非线性相关关系。,15,ppt课件,c.相关密切程度的判断15ppt课件,在做具体判断时,有几个数量标准:,,称为微弱相关。一般情况下,将其视为没有线性相关关系;,0.3,,称为低度相关;,0.5,,称为显著相关;,0.8,,称为高度相关。,16,ppt课件,在做具体判断时,有几个数量标准:16ppt课件,计算结果表明,歌乐立体音响设备商店在过去,10,周内,周末所做的广告次数与下一周的销售额之间存在着,高度,线性,正相关,关系。,对上面计算结果的统计分析,17,ppt课件,计算结果表明,歌乐立体音响设备商店在过去10周内,第二节 简单线性回归模型,18,ppt课件,第二节 简单线性回归模型 18ppt课件,只涉及两个变量(一个自变量和一个因变量)之间关系的回归分析称为,简单回归分析,。,两个变量之间的关系大约呈一条直线的简单回归分析称为,简单线性回归分析,。,19,ppt课件,只涉及两个变量(一个自变量和一个因变量)之间,用回归分析可以预测运行一条商业航空线的成本吗?,如果可以,那么哪些变量与这一成本有关呢?,一、从一个实际问题入手,20,ppt课件,用回归分析可以预测运行一条商业航空线的成本吗,飞机运行成本,飞机型号,飞行距离,乘客数量,行李或货物重量,天气状况,21,ppt课件,飞机运行成本飞机型号飞行距离乘客数量行李或货物重量天气状况,为了减少自变量个数,我们做如下假定:,飞机类别,波音,737,飞机,飞行距离,500,公里,航线,可比,而且在每年的相同季节,在这种条件下,可以用,乘客数,来预测飞行的成本吗?,22,ppt课件,为了减少自变量个数,我们做如下假定:22p,表,7-3,是每年相同季节波音,737,飞机在,12,条,500,公里的不同航线不同乘客数时的飞行成本。我们用这些数据以乘客数作为自变量构造模型来预测成本。,23,ppt课件,表7-3是每年相同季节波音737飞机在12条,24,ppt课件,24ppt课件,(,7.4,),二、回归模型和回归方程,:因变量(随机变量),:自变量(给定变量),:参数,:误差项(随机变量),含义为说明在 中不能被 和 之间线性关系解释的变异性。,25,ppt课件,(7.4)二、回归模型和回归方程:因变量(随机变量):,在有关 假设中,有一个假设就是的期望值或均值等于,0,,即,(,7.5,),如果简单线性回归模型满足了这个条件,那么就意味着 的均值或期望值就是一个线性函数。,描述 的均值与 的关系如何的方程称为,回归方程,。,26,ppt课件,在有关 假设中,有一个假设就是的期望值或均值等于0,在简单线性回归中,1.,回归方程的图形是一条直线(如图,7.3,所示);,(,7.6,),27,ppt课件,在简单线性回归中(7.6)27ppt课件,28,ppt课件,28ppt课件,3.,:斜率(回归系数);,2.,:的截距;,的含义:当自变量 给定一个具体变动值时,因变量,平均,变化的量。,29,ppt课件,3.:斜率(回归系数);2.:的,30,ppt课件,30ppt课件,31,ppt课件,31ppt课件,估计回归方程,就是用样本统计量作为参数的估计值所建立的回归方程。,三、估计回归方程,(,7.7,),:的估计值,:的估计值,:的估计值,32,ppt课件,估计回归方程 就是用样本统计量作为参数的估计值所,33,ppt课件,33ppt课件,最小平方法,,也称,最小二乘法,,是将回归模型的方差之和最小化,以得到一系列方程,从这些方程中解出模型中需要的参数的一种方法。,四、,最小平方法,34,ppt课件,最小平方法,也称最小二乘法,是将回归模型的方差之和最,(一)画散点图,以初步观察成本与乘客数量之间是否呈回归直线。,35,ppt课件,(一)画散点图,以初步观察成本与乘客数量之间是否呈回归直线。,(二)建立估计回归方程,(,7.8,),最小平方法运用样本数据求出 和 的值,使得因变量的实际观察值 与其估计值 之差的平方和最小,即,(,7.9,),36,ppt课件,(二)建立估计回归方程(7.8)最小平方,(,三,),估计回归方程斜率和截距的计算公式,(,7.11,),37,ppt课件,(三)估计回归方程斜率和截距的计算公式(7.11)37ppt,38,ppt课件,38ppt课件,39,ppt课件,39ppt课件,40,ppt课件,40ppt课件,(四)将 和 的计算结果代入式(,7.8,)有:,计算结果表明,在其他条件相同情况下,,12,条航线上波音,737,飞机各条航线每次飞行时每增加,1,名乘客,将会使飞行成本平均增加,40.70,元。,结论:,41,ppt课件,(四)将 和 的计算结果代入式(7.8)有:,*Y=4.48,千元二者差,0.061,千元或,61,元。,42,ppt课件,*Y=4.48千元二者差0.061千元或61元。42p,测定系数,估计标准误差,五、一元线性回归方程的评价,43,ppt课件,测定系数五、一元线性回归方程的评价43ppt课件,(一)测定系数,回归直线与各观测数据的接近程度称为回归直线的,拟合优度,。,度量回归直线的拟合优度最常用的指标是,测定系数,,(又称,可决系数,、,判定系数,)。,该指标是建立在对总离差平方和进行分解的基础之上的。,44,ppt课件,(一)测定系数44ppt课件,离差分解图,x,y,y,离差分解图,45,ppt课件,离差分解图xyy离差分解图45ppt课件,两端平方后求和有,离差平方和的分解,总离差平方和,(,SST,),回归平方和,(,SSR,),残差平方和,(,SSE,),(,7.12,),(,7.13,),(,7.14,),46,ppt课件,两端平方后求和有离差平方和的分解总离差平方和回归平方和残,R,2,的取值范围是,0,,,1,。,R,2,越接近于,1,,表明回归平方和占总离差平方和的比例越大,回归直线与各观测点越接近,回归直线的拟合程度就越好。,在一元线性回归中,相关系数,r,的平方等于判定系数,符号与自变量,x,的系数一致。因此可以根据回归结果求出相关系数。,决定系数的取值,47,ppt课件,R2的取值范围是0,1。决定系数的取值,1.,残差,残差,是因变量的观察值,y,和因变量的估计值 之间的偏差。,例如,上面的例子,,(,7.15,),48,ppt课件,1.残差 例如,上面的例子,(7.15)48ppt,表,7-5,残差计算表,49,ppt课件,表7-5残差计算表49ppt课件,残差平方的总和称为,误差平方和,(,SSE,)。,2.,误差平方和,(,7.16,),SSE,的值是用估计回归方程估计样本中因变量的值时所产生误差的一种测度。,50,ppt课件,残差平方的总和称为误差平方和(SSE)。2.误差平方,因变量的值与其均值之间离差的平方和,称为,总离差平方和,(,SST,)。,3.,总离差平方和,(,7.17,),51,ppt课件,因变量的值与其均值之间离差的平方和称为总离差平方,因变量的值与其估计值之间离差的平方和称为,回归平方和,(,SSR,)。,4.,回归平方和,(,7.18,),52,ppt课件,因变量的值与其估计值之间离差的平方和称为回归平方和,表,7-6,计算表,例如;,飞行成本案例中各种有关数据计算如下,53,ppt课件,表7-6 计算表 例如,由表,7-6,计算结果可知,,SSE=0.31434,,,SSR=2.79775,,,SST=3.11209,,,则,54,ppt课件,由表7-6计算结果可知,54ppt课件,这就是说,在一条商业航线上一架波音,737,飞机飞行成本的方差中有,89.9%,可以被乘客数目说明或预测,换句话说,飞行成本,Y,的方差中不能由,X,或回归方程解释的有,10.1%,。,55,ppt课件,这就是说,在一条商业航线上一架波音737飞机飞行成,估计标准误,:,是对各观测数据在回归直线周围分散程度的一个度量值,它是对误差项,的标准差,的估计。,估计标准误反映了用估计的回归方程拟合因变量,Y,时平均误差的大小。,各观测数据越靠近回归直线,,s,y,就越小,回归直线对各观测数据的代表性就越好。,与,R,2,不同的是,估计标准误是一个有单位的平均数。,(二)估计标准误,(,7.19,),56,ppt课件,估计标准误:是对各观测数据在回归直线周围分,在飞行成本的案例中:,sse=0.31414 n=12,【,统计分析,】,计算结果表明,在,12,条商业航线上,每架波音,737,飞机在飞行,500,公里和其他条件相同情况下,其飞行成本与它们的平均飞行成本平均相差,117.3,元。,57,ppt课件,在飞行成本的案例中:【统计分析】计算结果表明,在12条商业航,计算结果表明,波音,737,飞机在相同季节,12,条航线上,乘客数量与运行成本之间存在线性高度的正相关关系。,58,ppt课件,计算结果表明,波音737飞机在相同季节12条航线上,,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!