资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第五章,相关分析与回归分析,第五章 相关分析与回归分析,1,第一节 变量间的相关关系,一、相关关系的概念,(注意相关关系与函数关系的区别),(一)函数关系,它,反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映出来。,例,如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。,第一节 变量间的相关关系一、相关关系的概念(注意相关关系与函,2,(函数关系),(1)是一一对应的确定关系,(2)设有两个变量,x,和,y,,变量,y,随变量,x,一起变化,并完全依赖于,x,,当变量,x,取某个数值时,,y,依确定的关系取相应的值,则称,y,是,x,的函数,记为,y,=,f,(,x,),,其中,x,称为自变量,,y,称为因变量,(3)各观测点落在一条线上,x,y,(函数关系)(1)是一一对应的确定关系xy,3,(函数关系),函数关系的例子,某种商品的销售额(,y,)与销售量(,x,)之间的关系可表示为,y,=,p x,(,p,为单价),圆的面积(S)与半径之间的关系可表示为,S,=,r,2,企业的原材料消耗额(,y,)与产量(,x,1,)、单位产量消耗(,x,2,)、原材料价格(,x,3,)之间的关系可表示为,y,=,x,1,x,2,x,3,(函数关系)函数关系的例子,4,(二)相关关系,它,反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个明显特点:,1.,现,象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;,2.,现,象之间的这种依存关系是不严格的,即无法用数学公式表示。,(二)相关关系 它反映着现象之间的数量上不严格的依存关,5,(二)相关关系的情况,1.,受干扰的因果关系,,,如:汽车的行驶里程与耗油量,二者成正比,但受道路、风速、驾驶特点等因素影响,使这一明显的因果关系产生了波动,从而体现出非决定性的关系;,2.,同一原因的诸多结果之间的关系,如:人的体重与裤长,它们都基本取决于身高,呈正相关关系,但二者直接不存在因果关系;,3.,因果关系不同而局部出现相同走势,,,如:我国近年来的“吸烟人数”与GDP成正相关关系,这两个变量基本上互相独立,在一段时间出现相同的走向,只能形成局部的解释,而无法找出因果关系。,(二)相关关系的情况1.受干扰的因果关系,2.同一原因的诸,6,在,具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用X表示;发生对应变化的变量称因变量,一般用y表示。,在具有相互依存关系的两个变量中,作为根据的变量称自变量,7,相关关系的例子,商品的消费量(y)与居民收入(x)之间的关系,商品的消费量(y)与物价(x)之间的关系,商品销售额(y)与广告费支出(x)之间的关系,粮食亩产量(y)与施肥量(x,1,)、降雨量(x,2,)、温度(x,3,)之间的关系,收入水平(y)与受教育程度(x)之间的关系,父亲身高(y)与子女身高(x)之间的关系,相关关系的例子,8,(相关关系),(1)变量间关系不能用函数关系精确表达;,(2)一个变量的取值不能由另一个变量唯一确定;,(3)当变量,x,取某个值时,变量,y,的取值可能有几个;,(4)各观测点分布在直线周围。,x,y,(相关关系)(1)变量间关系不能用函数关系精确表达;,9,二、相关关系的种类,二、相关关系的种类,10,1.,按,相关关系的性质来分,可分为:正相关和负相关,正相关,是指两相关现象变化的方向是一致的。,负相关,是指两相关现象变化的方向是相反的。,1.按相关关系的性质来分,可分为:正相关和负相关正相关,11,2.,按,相关关系的形式来分,可分为:线性相关和非线性相关,线性相关,是指两个相关现象之间,当自变量X的数值发生变动时,因变量y随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。,非线性相关,是指两个相关现象之间,当自变量X的数值发生变动时,因变量y也随之发生变动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。,2.按相关关系的形式来分,可分为:线性相关和非线性,12,3.,按,相关关系涉及的因素多少来分,可分为:单相关、复相关和偏相关,。,在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为,偏相关,。,二因素之间的相关关系称,单相关,,即只涉及一个自变量和一个因变量,。,三个或三个以上因素的相关关系称,复相关,,或多元相关,即涉及二个或二个以上的自变量和因变量,。,3.按相关关系涉及的因素多少来分,可分为:单相关、复相关和偏,13,第二节 简单线性相关分析,一、相关表和相关图,第二节 简单线性相关分析 一、相关表和相关图,14,某市1998年 2005年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。,序号,年份,工资性现金支出(万元)x,城镇储蓄存款余额(万元)y,1,1998,500,120,2,1999,540,140,3,2000,620,150,4,2001,730,200,5,2002,900,280,6,2003,970,350,7,2004,1050,450,8,2005,1170,510,例1,某市1998年 2005年的工资性现金支出与城镇储蓄存款,15,统计学原理第5章-相关分析与回归分析-课件,16,企业按销售额分组(万元),流通费用率(%),4以下,9.65,4,8,7.68,8,12,7.25,12,16,7.00,16,20,6.86,20,24,6.73,24,28,6.64,28,32,6.60,32,36,6.58,例2,企业按销售额分组(万元)流通费用率(%)4以下9.65 4,17,(二)相关图:又称散点图。将x置于横轴上,y,置于纵轴上,将(x,y)绘于坐标图上。,用来反映两变量之间相关关系的图形。,(二)相关图:又称散点图。将x置于横轴上,y置于纵轴上,将,18,二、相关系数,相,关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号r表示。,二、相关系数 相关系数是在直线相关条件下,表明两,19,r的测定方法:,r的测定方法:,20,仍以上例1资料计算:,序,号,年,份,x,(万元),y,(万元),1,1998,500,120,-310,-155,96100,24025,48050,2,1999,540,140,-270,-135,72900,18225,36450,3,2000,620,150,-190,-125,36100,15625,23750,4,2001,730,200,-80,-75,6400,5625,6000,5,2002,900,280,90,5,8100,25,450,6,2003,970,350,160,75,25600,5625,12000,7,2004,1050,450,240,175,57600,30625,42000,8,2005,1170,510,360,235,129600,55225,84600,合计,6480,2200,-,-,432400,155000,253300,仍以上例1资料计算:序年xy11998 500120-31,21,经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。,经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着,22,对r的解释如下:(即r的特点),(1),r,取正值或负值决定于分子协方差;,(2),r,的绝对值,在0与1之间;,(3),r,的绝对值大小,可说明现象之间相关关系的紧密程度。,对r的解释如下:(即r的特点)(1)r取正值或负值决定于分,23,2.简捷法,2.简捷法,24,资料计算如下:,序号,年份,x(万元),y(万元),x,2,y,2,xy,1,1998,500,120,250000,14400,60000,2,1999,540,140,291600,19600,75000,3,2000,620,150,384400,22500,93000,4,2001,730,200,532900,40000,146000,5,2002,900,280,810000,78400,252000,6,2003,970,350,940900,122500,339500,7,2004,1050,450,1102500,202500,472500,8,2005,1170,510,1368900,260100,596700,合计,6480,2200,5681200,760000,2035300,资料计算如下:序号年份x(万元)y(万元)x2y2xy11,25,统计学原理第5章-相关分析与回归分析-课件,26,三、简单线性相关分析的特点,通过对r的计算方法的讨论,可看出二个明显特点:,2.,相,关关系中只能计算出一个相关系数r。,1.,相,关关系中,两个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个变量都是随机变量;,三、简单线性相关分析的特点 通过对r的计算方法的讨论,可看出,27,第三节 一元线性回归分析,在,回归分析中,两个变量之间的回归称为简单回归,两个以上变量之间的回归称为复回归。无论是简单回归还是复回归,数学模型均有线性(直线)回归和非线性(曲线)回归之分。,第三节 一元线性回归分析 在回归分析中,两个变量之间的回,28,一、回归分析的概念,回归分析,是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。,一、回归分析的概念 回归分析是指对具有相关关系的现象,根据,29,二、回归分析的方法,(一)简单直线回归分析,简,单直线回归方程的一般形式为:,y,c,=a+bx,y,c,因变量的估计值;,x 自变量;,a 回归直线在y轴上的截距;,b 回归直线的斜率,称回归系数,表明x每增加,一个单位,因变量y,c,的平均变化值,b0,x与y为正相关,b0,x与y为负相关,二、回归分析的方法(一)简单直线回归分析简单直线回归方程的,30,a、b的确定:,在,简单直线回归方程中,a、b为待定系数,常用最小平方法来确定,即(y-y,c,),2,=最小值。,a、b的确定:在简单直线回归方程中,a、b为待定系数,,31,简单直线回归方程建立的步骤为:,确,定自变量x和因变量y;,计,算x,2,、xy、x、y、x,2,、xy;,代,入公式,先求b,再求a。,简单直线回归方程建立的步骤为:确定自变量x和因变量y;,32,仍用上例1资料得到:,y,c,=-199.5+0.5858x,表明该市工资性现金支出每增加1万元,储蓄存款余额就增加0.5858万元。,仍用上例1资料得到:,33,举例说明b(回归系数)在经济管理中的作用:,某企业的某种产品月产量与单位成本的关系呈直线关系,用直线回归方程表示是:,y,c,=77.36-1.818x,其中,,x表示月产量(千件),y表示单位成本(元);,a=77.36(元),表示生产这种产品在单位成本方面的条件;,b=-1.818,表示月产品每增加1000件,单位成本平均降低1.818元。,举例说明b(回归系数)在经济管理中的作用:某企业的某种产品,34,简单直线回归分析的主要特点:,1.,直,线回归分析时,要根据研究目的,在两个变量之间确定哪个是自变量,哪个是因变量。,2.,在,两个现象互为根据的情况下,可以有两个回归方程:,y,c,=a+bx 称y倚x回归直线,x,c,=c+dy 称x倚y回归直线,简单直线回归分析的主要特点:1.直线回归分析时,要根据,35,三、估计标准误差,(一)、估计标准误差的概念和作用,估计
展开阅读全文