相关分析与回归分析课件

上传人:无*** 文档编号:244582815 上传时间:2024-10-05 格式:PPT 页数:49 大小:2.04MB
返回 下载 相关 举报
相关分析与回归分析课件_第1页
第1页 / 共49页
相关分析与回归分析课件_第2页
第2页 / 共49页
相关分析与回归分析课件_第3页
第3页 / 共49页
点击查看更多>>
资源描述
,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,相关分析和回归分析,学习目标,掌握,相关分析,及,回归分析,的相关概念和思想;,会计算,相关系数,;,能解决一元回归分析的,参数估计问题。,重 难 点,重点:,相关分析,及,回归分析,的相关概念和思想,一元线性回归分析,最小二乘法,难点:,回归系数的参数估计,利用,相关与回归分析技术,改进民航服务质量降低服务成本,引入,据网友爆料,,4,月,11,日上午浦东机场有旅客擅自闯入机场滑行道 造成多架外航飞机堵在后面不能移动。红圈中为浦东机场上的拦机者。,航空公司,编号,航班正点率(),x,投诉次数(次),y,1,81.8,21,2,76.6,56,3,76.6,85,4,75.7,68,5,73.8,74,6,72.2,93,7,71.2,72,8,70.8,122,9,91.4,18,10,68.5,125,10,家航空公司航班正点率与顾客投诉次数数据,相关分析,一、相关关系和函数关系,函数关系是指现象之间存在着,确定性,的严格的,依存,关系。在这种关系下,,当个或一一组变量取一定的数值时,另一个变量就有一个确定的数值与之相对应,这种关系可以用一个数学表达式反映出来,。,函数关系,相关关系是指现象之间确实存在着的,但其数量表现又是,不确定、不规则,的一种,相互依存,关系。在这种关系下,当一个或一组变量取一定的数值时,与之相对应的另一个变量的数值是不能确定的,只是按照某种规律在一定范围内变化。这种关系不能用严格的函数式来表示。,相关关系,二、相关关系的种类,1.,按照相关关系涉及的变量(或因素)的多少,可以分为,单相关、复相关和偏相关。,2.,按照变量之间相互关系的表现形式的不同,可以分为,线性相关和非线性相关,。,3.,按照变量之间的相互关系的方向不同,可以分为,正相关和负相关,。,4.,按照变量之间的相关程度、可以分为,完全相关、不完全相关和不相关。,三、相关分析的主要内容,1.,确定现象之间有无相关关系,以及相关关系的表现形式,2.,确定相关关系的密切程度,常见的相关分析工具:,相关表,相关图:,散点图,相关系数,四、相关分析的测定,年份,2000,2001,2002,2003,2004,2005,2006,全员劳动生产率,(元,/,人),X,3813,4582,5524,8161,9274,10291,10812,平均工资,(元,/,人),y,779,830,1030,1261,1473,1592,1942,表,8-5,:某企业劳动生产率与平均工资情况,相关表,相关图,相关图,完全正相关 不完全正相关 不相关,完全负相关 不完全负相关 曲线相关,相关系数,我们虽然可以通过相关表和相关图,定性给出两个变量之间相关关系,但是对于相关关系的具体的密切程度则无法度量,为此我们给出了相关系数,,定量研究,这两个变量之间的相关关系。,相关系数,X,和,Y,之间的相关系数公式:,xy,的协方差,x,的标准差,y,的标准差,xy,的协方差,x,的方差,y,的方差,积差法,化简的公式,:,相关系数的特点,相关系数的取值在,-1,与,1,之间。,|r|,越大,表明变量间线性相关关系越强。,当,r,=0,时,表明,X,与,Y,没有,线性相关关系。,当,0|r|0,表明,X,与,Y,为,正相关,;,若,r0,表明,X,与,Y,为,负相关,。,当,|r|=1,时,表明,X,与,Y,完全线性相关,:,若,r=1,,称,X,与,Y,完全正线性,相关;,若,r=-1,,称,X,与,Y,完全负线性,相关。,密切程度的判断,相关系数一般的判断标准是:,|r|0.3称为,微弱相关,;,0.3,|r|0.5称为,低度相关,;,0.5,|r|0.8称为,显著相关,;,0.8,|r|1称为,高度相关,;,|r|=1称为,完全相关,。,-1 0 1,完全负相关 不相关 完全正相关,不完全负相关 不完全正相关,微弱相关,低度,相关,低度,相关,显著相关,显著相关,高度,相关,高度,相关,-1 -0.8 -0.5 -0.3 0.3 0.5 0.8 1,相关系数分类图,年份,x,y,x,2,y,2,xy,2000,3813,779,14538969,606841,2970327,2001,4582,830,20994724,688900,3803060,2002,5524,1030,30514576,1060900,5689720,2003,8161,1261,66601921,1590121,10291021,2004,9274,1473,86007076,2169729,13660602,2005,10291,1592,105904681,2534464,16383272,2006,10812,1942,116899344,3771364,20996904,合计,52457,8907,441461291,12422319,73794906,例子:,P192,表,8-7,x,:全员劳动生产率,y,:平均工资,答:劳动生产率与平均工资之间存在着高度正线,性相关。,练习题,企业编号,固定资产价值x,总产值y,1,318,524,2,910,1019,3,200,638,4,409,815,5,415,913,6,502,928,7,314,605,8,1210,1516,9,1022,1219,10,1225,1624,下表给出了某局各企业固定资产价值和总产值的相关数据,请计算固定资产价值和总产值之间的关系。,例:某局各企业固定资产和总产值统计表,企业编号,固定资产价值,x,总产值,y,1,318,524,101124,274576,166632,2,910,1019,828100,1038361,92790,3,200,638,40000,407004,127600,4,409,815,167281,664225,333335,5,415,913,172225,833569,378895,6,502,928,252004,861184,465856,7,314,605,98596,366025,189970,8,1210,1516,1464100,2298256,1934360,9,1022,1219,1044484,1485961,1245818,10,1225,1624,1500525,2637376,1989400,合计,6525,9801,5668539,10866577,7659156,解:根据上表资料可得:,两者呈高度正相关。,使用相关系数的注意事项:,X,和,Y,是相互对称的随机变量,所以,相关系数,只反映,变量间的线性相关程度,不能说明非线性相关关系。,相关系数,不能,确定变量的,因果关系,,也,不能,说明相关关系具体接近于哪条直线。,线性回归,想一想,相关系数能确定变量的因果关系吗?能说明相关关系具体接近于哪条直线吗?,答:不能,为明确变量间联系的具体数量规律,需要进行回归分析。,只有两个变量的回归称为,简单回归分析,或者,一元回归分析,。简单回归分析将变量X和Y区分为,自变量,和,因变量,。,一、“回归”的概念,回归的,古典意义,:,高尔顿遗传学的回归概念,父母身高与子女身高的关系,:,无论高个子或低个子的子女,都有向人的平均身高回归的趋势,回归的现代意义,一个因变量对若干解释变量依存关系的研究,回归的目的,(实质),:,由固定的自变量去估计因变量的平均值,样本,总体,自变量固定值,估计因变量平均值,二、一元线性回归模型,回归数学模型:,该模型表明当x取某个数值时,y并不必然表现为一个确定的值,而是在f(x)附近波动,但其平均数在大量观察下趋向于确定的值f(x)。,一元线性回归,真实值:,y,i,=a+bx,i,+,i,预测值:,i,=a+bx,i,散点图,一元线性回归模型:,其中:,a,为,截距,,,b,为直线斜率,也叫做,y,对,x,的,回归系数,。它表示每变动一个单位所引起的的边际变动量;,i,称,残差,(也称为回归误差或预测误差),表示除x外的其它次要因素形成的随机扰动。当样本容量较大时,正负干扰可相互抵消,所以可认为,i,的均值为0。,回归分析的主要任务是:,1,、确定回归系数,a,b,2,、判断回归方程是否合理,回归系数的最小二乘估计,最小二乘法,的基本思想:,想一想:为什么不可以取,i,或,|,i,|,?,希望所估计 的偏离实际观察值 的残差 越小越好。,可以取残差平方和 作为衡量 与 偏离程,度的指标。,即选择,a,、,b,使得,经过推导可得:,注:,一般先求b,再求a,回归直线经过点,e,i,与x,i,、y,i,之间无相关关系,x,y,回归直线,L,经过重心,(),则有,:,TSS=RSS+ESS,【,例,8-5】,根据例,8-3,资料:,则直线回归方程:,请解释一下回归系数,a,b,的经济学含义,练习题,企业编号,固定资产价值x,总产值y,1,318,524,2,910,1019,3,200,638,4,409,815,5,415,913,6,502,928,7,314,605,8,1210,1516,9,1022,1219,10,1225,1624,以总产值,y,为因变量,固定资产价值,x,为自变量,建立回归直线方程,y=a+bx,。请进行参数估计。,9.2.4,估计标准误差,(,standard error of the estimate,),因变量实际值与理论值,离差的平均值,计算原理与能够反映平均数代表性大小的标准差基本相同,定义公式为:,计算公式:,=,S=,9.2.5,判定系数,(coefficient of determination),用 表示,用来测定回归方程拟合数据的好坏程度,范围在,0,与,1,之间,越大,,线性回归效果就越好,r,越大,回归直线代表性大,r,越小,回归直线代表性小,小,大,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!