第7章--相关与回归分析讲课教案课件

上传人:txadgkn****dgknqu... 文档编号:241591256 上传时间:2024-07-07 格式:PPT 页数:100 大小:837.79KB
返回 下载 相关 举报
第7章--相关与回归分析讲课教案课件_第1页
第1页 / 共100页
第7章--相关与回归分析讲课教案课件_第2页
第2页 / 共100页
第7章--相关与回归分析讲课教案课件_第3页
第3页 / 共100页
点击查看更多>>
资源描述
第7章-相关与回归分析第7章-相关与回归分析学习目标学习目标1 1、了解相关关系的概念、种类以及相关分析与回归分析的区别、了解相关关系的概念、种类以及相关分析与回归分析的区别及联系,明确相关与回归分析的任务与程序;及联系,明确相关与回归分析的任务与程序;2 2、掌握相关系数的概念及常用计算公式;了解相关性的检验、掌握相关系数的概念及常用计算公式;了解相关性的检验、相关系数的取值范围及相关关系密切程度的判断标准;相关系数的取值范围及相关关系密切程度的判断标准;3 3、掌握一元线性回归的基本原理,熟练应用最小二乘法求估计、掌握一元线性回归的基本原理,熟练应用最小二乘法求估计的回归方程,理解参数的经济含义,利用回归方程进行预测;的回归方程,理解参数的经济含义,利用回归方程进行预测;4 4、了解多元线性回归分析的基本方法;、了解多元线性回归分析的基本方法;5 5、了解估计标准误差的计算方法与应用。、了解估计标准误差的计算方法与应用。学习目标1、了解相关关系的概念、种类以及相关分析与回归分析的7.1 相关关系概述相关关系概述q函数关系函数关系q相关关系相关关系7.1 相关关系概述函数关系函数关系函数关系1.1.是一一是一一对应的确定关系对应的确定关系2.2.设设有有两两个个变变量量 x 和和 y,变变量量 y 随随变变量量 x 一一起起变变化化,并并完完全全依依赖赖于于 x ,当当变变量量 x 取取某某个个数数值值时时,y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y 是是 x 的的函函数数,记记为为 y =f(x),其其中中 x 称为自变量,称为自变量,y 称为因变量称为因变量3.3.各各观测点落在一条线上观测点落在一条线上 x xy y函数关系是一一对应的确定关系xy函数关系函数关系(几个例子几个例子)n某某种种商商品品的的销销售售额额y y与与销销售售量量x x之之间间的的关关系系可可表示为表示为 y y=px px(p p 为单价为单价)n圆圆的的面面积积S S与与半半径径R R之之间间的的关关系系可可表表示示为为S S=R R2 2 n企企业业的的原原材材料料消消耗耗额额y y与与产产量量x x1 1 、单单位位产产量量消消耗耗x x2 2 、原原材材料料价价格格x x3 3之之间间的的关关系系可可表表示示为为 y y=x x1 1 x x2 2 x x3 3 函数关系(几个例子)某种商品的销售额y与销售量x之间的关系可相关关系相关关系(correlation)1.1.变变量量间间关关系系不不能能用用函函数数关关系精确表达。系精确表达。2.2.一一个个变变量量的的取取值值不不能能完完全全由另一个变量唯一确定。由另一个变量唯一确定。3.3.各观测各观测点分布在直线周围。点分布在直线周围。x xy y相关关系(correlation)变量间关系不能用函数关系精相关关系相关关系(几个例子几个例子)n父亲身高父亲身高x x 与子女身高与子女身高y y之间的关系之间的关系n收入水平收入水平y y与受教育程度与受教育程度x x之间的关系之间的关系n粮粮食食单单位位面面积积产产量量y y与与施施肥肥量量x x1 1 、降降雨雨量量x x2 2 、温度、温度x x3 3之间的关系之间的关系n商品的消费量商品的消费量y y与居民收入与居民收入x x之间的关系之间的关系n商品销售额商品销售额y y与广告费支出与广告费支出x x之间的关系之间的关系相关关系(几个例子)父亲身高x 与子女身高y之间的关系7.2 一元线性相关分析一元线性相关分析7.2 一元线性相关分析7.2 一元线性相关分析一元线性相关分析7.2.1 7.2.1 相关关系的描述与测度相关关系的描述与测度7.2.2 7.2.2 相关系数的显著性检验相关系数的显著性检验7.2 一元线性相关分析7.2.1 相关关系的描述与测度7.2.1 相关关系的描述与测度相关关系的描述与测度q相关分析要解决的问题相关分析要解决的问题q变量之间变量之间是否存在是否存在是否存在是否存在关系?关系?q变量之间的关系变量之间的关系强度和方向强度和方向强度和方向强度和方向如何?如何?q样本所反映的变量之间的关系能否样本所反映的变量之间的关系能否代表总体代表总体代表总体代表总体变量之间的关系?变量之间的关系?q为解决这些问题,在进行相关分析时,对总体为解决这些问题,在进行相关分析时,对总体有以下两个主要假定有以下两个主要假定q两个变量之间是线性关系两个变量之间是线性关系q两个变量都是随机变量两个变量都是随机变量7.2.1 相关关系的描述与测度相关分析要解决的问题主要内容主要内容q相关关系的描述与测度相关关系的描述与测度散散点图点图q相关关系的描述与测度相关关系的描述与测度相关系数相关系数主要内容相关关系的描述与测度散点图散点图散点图q描述变量间的相关性描述变量间的相关性最简单最直观最简单最直观最简单最直观最简单最直观的方法就是的方法就是画出两个变量的散点图。画出两个变量的散点图。q散点图显示了同一个个体上度量到的两个数量散点图显示了同一个个体上度量到的两个数量变量之间的关系。其中一个变量的值在横轴上变量之间的关系。其中一个变量的值在横轴上标示,两一个变量的值在纵轴上标示,点的位标示,两一个变量的值在纵轴上标示,点的位置由该个体两个变量的值决定。置由该个体两个变量的值决定。q散点图能描述两变量间的大致关系,直观地看散点图能描述两变量间的大致关系,直观地看出变量之间关系出变量之间关系形式形式形式形式、方向方向方向方向和和强弱强弱强弱强弱。散点图描述变量间的相关性最简单最直观的方法就是画出两个变量的散点图散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关散点图(scatter diagram)非线性相关(曲线相关)非线性相关(曲线相关).相关关相关关系种类系种类单相关(一元相关)单相关(一元相关)复相关(多元相关)复相关(多元相关)线性相关(直线相关)线性相关(直线相关)正相关正相关负相关负相关完全相关(函数关系)完全相关(函数关系)相关(不完全相关)相关(不完全相关)不相关不相关(一(一)按相关关按相关关系涉及的系涉及的变量多少变量多少 (二(二)按相关按相关的形式的形式.(三(三)按相关的方向按相关的方向 (直线相关)(直线相关).(四(四)按相关按相关 的程度的程度.相关关系的种类相关关系的种类结合散点图理解结合散点图理解结合散点图理解结合散点图理解非线性相关(曲线相关).相关关系种类单相关(一散点图散点图(例题分析例题分析)【例例1 1】一一家家大大型型商商业业银银行行在在多多个个地地区区设设有有分分行行,其其业业务务主主要要是是进进行行基基础础设设施施建建设设、国国家家重重点点项项目目建建设设、固固定定资资产产投投资资等等项项目目的的贷贷款款。近近年年来来,该该银银行行的的贷贷款款额额平平稳稳增增长长,但但不不良良贷贷款款额额也也有有较较大大比比例例的的增增长长,这这给给银银行行业业务务的的发发展展带带来来较较大大压压力力。为为弄弄清清不不良良贷贷款款形形成成的的原原因因,管管理理者者希希望望利利用用银银行行业业务务的的有有关关数数据进行定量分析,以便找出控制不良贷款的办法。据进行定量分析,以便找出控制不良贷款的办法。散点图(例题分析)【例1】一家大型商业银行在多个地区设有分行散点图散点图(不良贷款与其他变量的散点图不良贷款与其他变量的散点图)散点图(不良贷款与其他变量的散点图)相关系数相关系数通过散点图可以初步判断变量之间是否存在相通过散点图可以初步判断变量之间是否存在相关关系,但不能准确反映变量之间的关系密切程度,关关系,但不能准确反映变量之间的关系密切程度,因此可以计算相关系数来因此可以计算相关系数来准确度量相关关系准确度量相关关系准确度量相关关系准确度量相关关系。1.1.相相关关系系数数是是度度量量变变量量之之间间关关系系强强度度和和方方向向的的一个统计量。一个统计量。2.2.对对两两个个变变量量之之间间线线性性相相关关的的度度量量称称为为简简单单相相关系数。关系数。相关系数通过散点图可以初步判断变量之间是否存在相关关系,但不相关系数相关系数(correlation coefficient)qqPearsonPearsonPearsonPearson相关系数相关系数相关系数相关系数:线性相关,常用于数量型:线性相关,常用于数量型数据。数据。qSpearmanSpearman等级相关系数:秩相关,常用于定序等级相关系数:秩相关,常用于定序数据,也可以用于数量性数据。数据,也可以用于数量性数据。1.1.若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称为总体相关系数,记为称为总体相关系数,记为 2.2.若若相相关关系系数数是是根根据据样样本本数数据据计计算算的的,则则称称为样本相关系数,简称为相关系数,记为为样本相关系数,简称为相关系数,记为 r相关系数(correlation coefficient)P.样本相样本相关系数关系数 样本相关系数的计算公式样本相关系数的计算公式或化简为或化简为.样本相关系数 样本相关系数的计算公式或化简相关系数的意义相关系数的意义1 1:r 的取值范围的取值范围是是-1,1-1,1q|r|=1 1,为完全相关为完全相关qr=1 1,为完全正相关,为完全正相关qr=-1-1,为完全负正相关,为完全负正相关q r=0,不存在不存在线性线性线性线性相关关系相关关系q-1-1r0 0,为负相关为负相关q0 0r1 1,为正相关为正相关q|r|越越趋趋于于1 1表表示示关关系系越越强强;|r|越越趋趋于于0 0表表示示关关系越弱系越弱相关系数的意义1:r 的取值范围是-1,1相关系数的相关系数的取值及其意义的图解取值及其意义的图解-1.0+1.00-0.5+0.5完全负相关完全负相关完全负相关完全负相关无线性相关无线性相关无线性相关无线性相关完全正相关完全正相关完全正相关完全正相关负相关程度增加负相关程度增加负相关程度增加负相关程度增加r正相关程度增加正相关程度增加正相关程度增加正相关程度增加相关系数的取值及其意义的图解-1.0+1.00-0.5+0.相关系数的经验解释相关系数的经验解释1.1.|r|0.80.8时,可视为两个变量之间高度相关时,可视为两个变量之间高度相关2.2.0.50.5|r|0.80.8时,可视为中度相关时,可视为中度相关3.3.0.30.3|r|0.50.5时,视为低度相关时,视为低度相关4.|r|0.3 t t,拒绝,拒绝H H0 0 若若 t t =7.5344t t(25-2)=2.069(25-2)=2.069,拒拒绝绝H H0 0,不不良良贷贷款与贷款余额之间存在着显著的正线性相关关系款与贷款余额之间存在着显著的正线性相关关系 相关系数的显著性检验(例题分析)对不良贷款与贷款余额之间7.3 一元线性回归分析一元线性回归分析7.3 一元线性回归分析主要内容主要内容7.3.1 7.3.1 一元线性回归模型一元线性回归模型7.3.2 7.3.2 一元线性回归方程的建立一元线性回归方程的建立7.3.3 7.3.3 一元线性回归方程的检验一元线性回归方程的检验7.3.4 7.3.4 利用回归方程进行预测(点估利用回归方程进行预测(点估计)计)主要内容7.3.1 一元线性回归模型什么是回归分析什么是回归分析q回归分析就是对具有相关关系的多个变量之间回归分析就是对具有相关关系的多个变量之间的数量变化进行数量测定,配合一定的数学方的数量变化进行数量测定,配合一定的数学方程模型,以便由自变量的数值对因变量的可能程模型,以便由自变量的数值对因变量的可能值进行估计或预测的一种统计方法。值进行估计或预测的一种统计方法。q回归分析是研究一个回归分析是研究一个被解释变量(又称应变量被解释变量(又称应变量被解释变量(又称应变量被解释变量(又称应变量或因变量或因变量或因变量或因变量)对一个或多个)对一个或多个解释变量(自变量)解释变量(自变量)解释变量(自变量)解释变量(自变量)之间的统计依赖关系;其目的是通过后者的已之间的统计依赖关系;其目的是通过后者的已知的数值去估计和预测前者的值。知的数值去估计和预测前者的值。什么是回归分析回归分析就是对具有相关关系的多个变量之间的数量趋向中间高度的回归趋向中间高度的回归回回归归这这个个术术语语是是由由英英国国著著名名统统计计学学家家Francis Francis GaltonGalton在在1919世世纪纪末末期期研研究究孩孩子子及及其其父父母母的的身身高高时时提提出出来来的的。GaltonGalton发发现现身身材材高高的的父父母母,他他们们的的孩孩子子身身材材也也高高。但但这这些些孩孩子子平平均均起起来来并并不不像像他他们们的的父父母母那那样样高高。对对于于比比较较矮矮的的父父母母情情形形也也类类似似:他他们们的的孩孩子子比比较较矮矮,但但这这些些孩孩子子的的平平均均身身高高要要比比他他们们的的父父母母的的平平均均身身高高高高。GaltonGalton把把这这种种孩孩子子的的身身高高向向平平均均值值靠靠近近的的趋趋势势称称为为一一种种回回归归效效应应,而而他他发发展展的的研研究究两两个个数数值值变变量量的的方方法法称称为回归分析为回归分析趋向中间高度的回归回归这个术语是由英国著名统计学家Franc回归分析与相关分析的区别回归分析与相关分析的区别1.1.相相关关分分析析中中,变变量量 x 变变量量 y 处处于于平平等等的的地地位位;回回归归分分析析中中,变变量量 y 称称为为因因变变量量,处处在在被被解解释释的的地地位位,x 称为自变量,用于预测因变量的变化。称为自变量,用于预测因变量的变化。2.2.相相关关分分析析中中所所涉涉及及的的变变量量 x 和和 y 都都是是随随机机变变量量;回回归归分分析析中中,因因变变量量 y 是是随随机机变变量量,自自变变量量 x 是是非非随随机的确定变量。机的确定变量。3.3.相相关关分分析析主主要要是是描描述述两两个个变变量量之之间间线线性性关关系系的的密密切切程程度度;回回归归分分析析不不仅仅可可以以揭揭示示变变量量 x 对对变变量量 y 的的影影响大小,还可以由回归方程进行预测和控制响大小,还可以由回归方程进行预测和控制。回归分析与相关分析的区别相关分析中,变量 x 变量 y 处于回归分析回归分析的种类的种类按照回归按照回归线的形状线的形状按自变量按自变量的个数的个数多元回归多元回归非线性(曲线)回归非线性(曲线)回归线性(直线)回归线性(直线)回归线性(直线)回归线性(直线)回归回归模型的类型回归模型的类型一元回归一元回归一元回归一元回归回归分析的种类按照回归线的形状按自变量的个数多元回归非线性(7.3.1 7.3.1 一元线性回归模型一元线性回归模型7.3.1 一元线性回归模型一元线性回归一元线性回归1.1.涉及涉及一个一个一个一个自变量的回归自变量的回归2.2.因因变量变量y与自变量与自变量x之间为之间为线性线性线性线性关系关系q被被预预测测或或被被解解释释的的变变量量称称为为因因变变量量(dependent variable)(dependent variable)(dependent variable)(dependent variable),用,用y表示表示q用用来来预预测测或或用用来来解解释释因因变变量量的的一一个个或或多多个个 变变 量量 称称 为为 自自 变变 量量(independent(independent(independent(independent variable)variable)variable)variable),用,用x表示表示 一元线性回归涉及一个自变量的回归一元线性回归模型一元线性回归模型一元线性一元线性回归模型可表示为回归模型可表示为 y y=+1 1 1 1 x x +qy 是是 x 的线性函数的线性函数(部分部分)加上误差项加上误差项q线线性性部部分分反反映映了了由由于于 x 的的变变化化而而引引起起的的 y 的的变化变化q误差项误差项 是随机变量是随机变量q反反映映了了除除 x 和和 y 之之间间的的线线性性关关系系之之外外的的随随机机因因素素对对 y 的影响的影响q是不能由是不能由 x 和和 y 之间的线性关系所解释的变异性之间的线性关系所解释的变异性q 0 和和 1 称为模型的参数称为模型的参数q变量要求:变量要求:y数值型数据数值型数据 x数值型数据数值型数据一元线性回归模型一元线性回归模型可表示为 y=b0一元线性回归模型一元线性回归模型(基本假定基本假定)1.1.误差误差项项是一个期望值为是一个期望值为0 0的随机变量,即的随机变量,即E()=0(零均值)零均值)零均值)零均值)。对于一个给定的。对于一个给定的 x 值,值,y 的期望值为的期望值为 E(y)=0+1 x2.2.误误差差项项是是一一个个服服从从正正态态分分布布的的随随机机变变量量,且且相相互互独独立立。即即N(0,2)(正态性)(无自相关)(正态性)(无自相关)(正态性)(无自相关)(正态性)(无自相关)独独立立性性意意味味着着对对于于一一个个特特定定的的 x 值值,它它所所对对应应的的与与其其他他 x 值所对应的值所对应的不相关不相关对对于于一一个个特特定定的的 x 值值,它它所所对对应应的的 y 值值与与其其他他 x 所所对对应的应的 y 值也不相关值也不相关3.3.对对于所有的于所有的 x 值,值,的方差的方差2 都相同都相同(同方差)(同方差)(同方差)(同方差)一元线性回归模型(基本假定)1.误差项是一个期望值为回归方程回归方程(regression equation)1.1.描描述述 y 的的平平均均值值或或期期望望值值如如何何依依赖赖于于 x 的的方方程程称称为回归方程为回归方程2.2.一元一元线性回归方程的形式如下线性回归方程的形式如下 E(y)=0+1 x方程的图示是一条直线,也称为直线回归方程方程的图示是一条直线,也称为直线回归方程 0 0是回归直线在是回归直线在 y y 轴上的截距轴上的截距;1 1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表表表示示示示当当当当 x x x x 变变变变动动动动一一一一个单位时,个单位时,个单位时,个单位时,y y y y 的平均变动值的平均变动值的平均变动值的平均变动值回归方程(regression equation)描述 y估计的回归方程估计的回归方程3.3.一元线性回归中估计的回归方程为一元线性回归中估计的回归方程为2.2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中的的未未知参数知参数 和和 ,就得到了,就得到了估计的回归方程估计的回归方程1.1.总总体体回回归归参参数数 和和 是是未未知知的的,必必须须利利用用样样本数据去估计本数据去估计其其中中:是是估估计计的的回回归归直直线线在在 y y 轴轴上上的的截截距距,是是直直线线的的斜斜率率,它它表表示示对对于于一一个个给给定定的的 x x 的的值值,是是 y y 的的估估计计值值,也也表表示示 x x 每每变变动动一一个个单单位位时时,y y 的的平平均均变动值变动值 估计的回归方程一元线性回归中估计的回归方程为用样本统计量 7.3.2 7.3.2 一元线性回归方程的建立一元线性回归方程的建立7.3.2 一元线性回归方程的建立最小二乘估计最小二乘估计1.1.使因变量的观察值与估计值之间的离差平方和达使因变量的观察值与估计值之间的离差平方和达到最小来求得到最小来求得 和和 的方法。即的方法。即2.2.用用最最小小二二乘乘法法拟拟合合的的直直线线来来代代表表x x与与y y之之间间的的关关系与实际数据的离差比其他任何直线都小。系与实际数据的离差比其他任何直线都小。最小二乘估计使因变量的观察值与估计值之间的离差平方和达到最小Karl Gauss的最小化图x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi iKarl Gauss的最小化图xy(xn,yn)(x1 最小二乘法最小二乘法(和和 的计算的计算公式公式)根根根根据据据据最最最最小小小小二二二二乘乘乘乘法法法法,可可可可得得得得求求求求解解解解 和和和和 的的的的公公公公式式式式如下如下如下如下最小二乘法(和 的计算公式)根据最小二乘.月份产量(千件)单位成本(元件)123456234345737271736968 (1 1)计算相关系数,说明产量与单位成本相关关系)计算相关系数,说明产量与单位成本相关关系 的密切程度。的密切程度。(2 2)配合单位成本与产量的直线回归方程,并解释)配合单位成本与产量的直线回归方程,并解释 回归系数的经济含义。回归系数的经济含义。(3 3)当产量为)当产量为60006000件时,试问单位成本为多少元?件时,试问单位成本为多少元?(4 4)计算估计标准误。)计算估计标准误。【例【例3 3】某企业某产品产量与单位成本资料如下:某企业某产品产量与单位成本资料如下:.月份产量(千件)单位成本(元件)12.月份产量(千件)单位成本(元件)12345623434 57372717369 68合计2121426426 4 4 9 9 16 16 9 9 16 16 2525146 146 216 216 284 284 219 219 276 276 3403407979 14811481解:解:(2 2)配合单位成本与产量的简单直线回归方程为:)配合单位成本与产量的简单直线回归方程为:.月份产量(千件)单位成本(元件)12.单位成本与产量的直线回归方程为:单位成本与产量的直线回归方程为:b:回归系数。回归系数。它表示产量每增加它表示产量每增加10001000件,单位成本平均降低件,单位成本平均降低1.821.82元。元。(3 3)当产量为)当产量为60006000件时,则单位成本为:件时,则单位成本为:.单位成本与产量的直线回归方程为:b:估计方程的求法估计方程的求法(例题分析例题分析)【例例4】某某公公司司11年年来来销销售售收收入入(万万元元)和和广广告告费费(万万元元)进进行行调调查查,得得到到资资料料如如下下,试试拟拟和和销销售售收收入入与与广广告告费费的的回回归方程。归方程。年销售收入年销售收入40405858333365658080808056563030333390907272广告费用广告费用13131414121220202828262618181212121230302222估计方程的求法(例题分析)【例4】某公司11年来销售收入(万估计方程的求法估计方程的求法(例题分析例题分析)年销售收入年销售收入y y40405858333365658080808056563030333390907272广告费用广告费用x x13131414121220202828262618181212121230302222估计方程的求法(例题分析)年销售收入y40583365808.广告费用与年销售收入的线性回归方程为:广告费用与年销售收入的线性回归方程为:自变量的回归系数表示当广告费每增加自变量的回归系数表示当广告费每增加1 1万元,万元,年销售收入平均增加年销售收入平均增加3.003.00万元。万元。.广告费用与年销售收入的线性回归方程为7.3.3 7.3.3 一元线性回归方程的检验一元线性回归方程的检验7.3.3 一元线性回归方程的检验1 1、回归模型的拟和优度和标准误差、回归模型的拟和优度和标准误差2 2、回归系数显著性的检验、回归系数显著性的检验3 3、回归方程显著性的检验、回归方程显著性的检验1、回归模型的拟和优度和标准误差1 1、回归模型的拟合优度和标准误差、回归模型的拟合优度和标准误差1、回归模型的拟合优度和标准误差变变 差差1.1.因因变变量量 y y 的的取取值值是是不不同同的的,y y 取取值值的的这这种种波波动动称为称为变差变差变差变差。变差来源于两个方面:。变差来源于两个方面:q由于自变量由于自变量 x x 的取值不同造成的;的取值不同造成的;q除除 x x 以以外外的的其其他他因因素素(如如x x对对y y的的非非线线性性影影响、测量误差等响、测量误差等)的影响。的影响。2.2.对对一一个个具具体体的的观观测测值值来来说说,变变差差的的大大小小可可以以通通过过该实际观测值与其均值之差该实际观测值与其均值之差 来表示。来表示。变 差因变量 y 的取值是不同的,y 取值的这种波动称为变误差的分解误差的分解(图示图示)x xy yy y误差的分解(图示)xyy误差平方和的分解误差平方和的分解(三个平方和的关三个平方和的关系系)SST=SSR+SSE总平方和总平方和总平方和总平方和(SSTSST)回归平方和回归平方和回归平方和回归平方和(SSRSSR)残差平方和残差平方和残差平方和残差平方和(SSESSE)误差平方和的分解(三个平方和的关系)SST=SSR 误差平方和的分解误差平方和的分解(三个平方和的意三个平方和的意义义)1.1.1.1.总平方和总平方和总平方和总平方和(SSTSSTSSTSSTtotal sum of squares)total sum of squares)total sum of squares)total sum of squares)q反反映映因因变变量量的的 n 个个观观察察值值与与其其均均值值的的总总离离差差平平方和。方和。2.2.2.2.回回回回 归归归归 平平平平 方方方方 和和和和(SSRSSRSSRSSRsum sum sum sum of of of of squares squares squares squares of of of of regression)regression)regression)regression)q反反映映自自变变量量 x 的的变变化化对对因因变变量量 y 取取值值变变化化的的影影响响,或或者者说说,是是由由于于 x 与与 y 之之间间的的线线性性关关系系引引起的起的 y 的取值变化,也称为可解释的平方和的取值变化,也称为可解释的平方和3.3.3.3.残差平方和残差平方和残差平方和残差平方和(SSESSESSESSEsum of squares of error)sum of squares of error)sum of squares of error)sum of squares of error)q反反映映除除 x 以以外外的的其其他他因因素素对对 y 取取值值的的影影响响,也也称为不可解释的平方和或剩余平方和称为不可解释的平方和或剩余平方和误差平方和的分解(三个平方和的意义)总平方和(SSTto判定系数(拟和优度)判定系数(拟和优度)R2 1.1.回归平方和回归平方和占总离差平方和的比例占总离差平方和的比例2.2.反映回归直线的拟合程度反映回归直线的拟合程度3.3.取值范围在取值范围在 0,1 0,1 之间之间4.4.R R2 2 1 1,说明回归方程拟合的越好;,说明回归方程拟合的越好;R R2 20 0,说明回,说明回归方程拟合的越差归方程拟合的越差5.5.判定系数等于相关系数的平方,即判定系数等于相关系数的平方,即R R2 2r r2 2判定系数(拟和优度)R2 回归平方和占总离差平方和的比例反映判定系数判定系数(例例题分析分析)q【例例5】计计算算产产量量对对成成本本回回归归的的判判定定系系数数,并并解解释释其意义其意义 q 判判判判定定定定系系系系数数数数的的的的实实实实际际际际意意意意义义义义是是:在在成成本本取取值值的的变变差差中中,有有82.64%82.64%可可以以由由产产量量与与成成本本之之间间的的线线性性关关系系来来解解释释,或或者者说说,在在成成本本取取值值的的变变动动中中,有有82.64%82.64%是由产量所决定的。是由产量所决定的。判定系数(例题分析)【例5】计算产量对成本回归的判定系数,判定系数判定系数(例例题分析分析)q【例例6】计计算算不不良良贷贷款款对对贷贷款款余余额额回回归归的的判判定定系系数数,并解释其意义并解释其意义 q 判判判判定定定定系系系系数数数数的的的的实实实实际际际际意意意意义义义义是是:在在不不良良贷贷款款取取值值的的变变差差中中,有有71.16%71.16%可可以以由由不不良良贷贷款款与与贷贷款款余余额额之之间间的的线线性性关关系系来来解解释释,或或者者说说,在在不不良良贷贷款款取取值的变动中,有值的变动中,有71.16%71.16%是由贷款余额所决定的。是由贷款余额所决定的。判定系数(例题分析)【例6】计算不良贷款对贷款余额回归的判估计标准误差估计标准误差1.1.实际观察值与回归估计值误差平方和的均方根实际观察值与回归估计值误差平方和的均方根2.2.反映实际观察值在回归直线周围的分散状况反映实际观察值在回归直线周围的分散状况3.3.对对误误差差项项 的的标标准准差差 的的估估计计,是是在在排排除除了了x对对y的线性影响后,的线性影响后,y随机波动大小的一个估计量随机波动大小的一个估计量4.4.反反映用估计的回归方程预测映用估计的回归方程预测y时预测误差的大小时预测误差的大小 5.5.计算公式为计算公式为注:例题的计算结果为注:例题的计算结果为1.9799估计标准误差实际观察值与回归估计值误差平方和的均方根注:例题2、回归方程显著性的检验、回归方程显著性的检验1.1.检验自变量与因变量之间的线性关系是否显著检验自变量与因变量之间的线性关系是否显著2.2.将将回回归归均均方方(MSRMSR)同同残残差差均均方方(MSEMSE)加加以以比比较较,应应用用F F检验来分析二者之间的差别是否显著检验来分析二者之间的差别是否显著均均方方回回归:回回归平平方方和和SSRSSR除除以以相相应的的自自由由度度(自自变量的个数量的个数k k)均均方方残残差差:残残差差平平方方和和SSESSE除除以以相相应的的自自由由度度(n n-k k-1)-1)2、回归方程显著性的检验检验自变量与因变量之间的线性关系是否线性关系的检验线性关系的检验(检验的步骤检验的步骤)1.1.提出提出假设假设qH0:1=0 H1 1:1 1 0 0 2.2.计算检验统计量计算检验统计量F F3.3.确定显著性水平确定显著性水平,并根据分子自由度,并根据分子自由度1 1和分母和分母自由度自由度n n-2-2找出临界值找出临界值F F 4.4.作出决策:若作出决策:若F F F F ,拒绝拒绝H H0 0;若若F F F F ,拒绝拒绝H H0 0,线性关系显著,线性关系显著线性关系的检验(例题分析)提出假设确定显著性水平=0.线性关系的检验线性关系的检验(方差分析表方差分析表)Excel Excel 输出的方差分析表输出的方差分析表线性关系的检验(方差分析表)Excel 输出的方差分析表3 3、回归系数显著性的检验、回归系数显著性的检验3.3.在在一一元元线线性性回回归归中中,等等价价于于线线性性关关系系的的显显著著性检验性检验4.4.采用采用t t检验检验1.1.检检验验 x x 与与 y y 之之间间是是否否具具有有线线性性关关系系,或或者者说说,检检验验自自变变量量 x x 对对因因变变量量 y y 的的线线性性影影响响是是否否显显著著2.2.理论基础是回归系数理论基础是回归系数 的抽样分布的抽样分布3、回归系数显著性的检验在一元线性回归中,等价于线性关系的显回归系数显著性的检验回归系数显著性的检验(样本统计量样本统计量 的分布的分布)1.1.是是是是根根根根据据据据最最最最小小小小二二二二乘乘乘乘法法法法求求求求出出出出的的的的样样样样本本本本统统统统计计计计量量量量,它它它它有有有有自自自自己己己己的分布的分布的分布的分布2.2.的的的的分布具有如下性质分布具有如下性质分布具有如下性质分布具有如下性质 分布形式:正态分布分布形式:正态分布分布形式:正态分布分布形式:正态分布 数学期望:数学期望:数学期望:数学期望:标准差:标准差:标准差:标准差:由由由由于于于于 未未未未知知知知,需需需需用用用用其其其其估估估估计计计计量量量量s s s se e e e来来来来代代代代替替替替得得得得到到到到 的的的的估估估估计计计计的的的的标准差标准差标准差标准差回归系数显著性的检验(样本统计量 的分布)是根回归系数显著性的检验回归系数显著性的检验(检验步检验步骤骤)1.1.提出假设提出假设qH0 0:1 1=0(=0(没有线性关系没有线性关系)qH1 1:1 1 0(0(有线性关系有线性关系)2.2.计算检验的统计量计算检验的统计量3.确定显著性水平确定显著性水平,并进行决策,并进行决策 t t,拒绝,拒绝H0;t t,不拒绝,不拒绝H0回归系数显著性的检验(检验步骤)提出假设 确定显著性水平回归系数显著性的检验回归系数显著性的检验(例题分析例题分析)对例题对例题3 3的回归系数进行显著性检验的回归系数进行显著性检验(0.050.05)1.1.提出假设提出假设qH0 0:1 1=0 =0 qH1 1:1 1 0 0 2.2.计算检验的统计量计算检验的统计量3.3.t t=-4.37-=-4.37=7.533515t t=2.201=2.201,拒拒绝绝H H0 0,表表明明不不良良贷贷款与贷款余额之间有显著的线性关系款与贷款余额之间有显著的线性关系回归系数显著性的检验(例题分析)对例题1的回归系数进行显回归系数显著性的检验回归系数显著性的检验(例题分析例题分析)qqP P P P 值的应用值的应用值的应用值的应用P P=0.000000=0.000000=10.1t t=2.201=2.201,拒拒绝绝H H0 0,表表明明销销售售收收入入与与广告费用之间有显著的线性关系。广告费用之间有显著的线性关系。2、回归系数显著性的检验 对回归系数进行显著性检验(03、判定系数、判定系数 q计计算算广广告告费费用用对对销销售售收收入入回回归归的的判判定定系系数数,并并解解释其意义释其意义 q 判判判判定定定定系系系系数数数数的的的的实实实实际际际际意意意意义义义义是是:在在销销售售收收入入的的变变差差中中,有有91.9%91.9%可可以以由由广广告告费费用用与与销销售售收收入入之之间间的的线线性性关关系系来来解解释释,或或者者说说,在在销销售售收收入入变变动动中中,有有91.9%91.9%是是由由广广告告费费用用所所决决定定的的。所所以以模模型型拟拟和和较较好。好。3、判定系数 计算广告费用对销售收入回归的判定系数,并解释其4 4、估计并预测、估计并预测可以估计,当投入可以估计,当投入1515万元的广告费用,销售万元的广告费用,销售收入为收入为46.4646.46万元。万元。4、估计并预测可以估计,当投入15万元的广告费用,销售收入为7.3.4 7.3.4 利用回归方程进行预测利用回归方程进行预测7.3.4 利用回归方程进行预测点估计点估计2.2.点估计值有点估计值有ny y 的的平均值平均值的点估计的点估计ny y 的的个别值个别值的点估计的点估计3.3.在点估计条件下,平均值的点估计和个别值的在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同的点估计是一样的,但在区间估计中则不同1.1.对对于于自自变变量量 x x 的的一一个个给给定定值值x x0 0 ,根根据据回回归归方程得到因变量方程得到因变量 y y 的一个估计值的一个估计值点估计2.点估计值有对于自变量 x 的一个给定值x0,根 y 的平均值的点估计的平均值的点估计n在在前前面面的的例例子子中中,假假如如我我们们要要估估计计贷贷款款余余额额为为100100亿亿元元时时,所所有有分分行行不不良良贷贷款款的的平平均均值值,就就是是平平均值的点估计均值的点估计 。根据估计的回归方程得。根据估计的回归方程得 y 的平均值的点估计在前面的例子中,假如我们要估计贷款余7.4 多元线性回归分析多元线性回归分析7.4 多元线性回归分析多元回归模型多元回归模型1.1.一个因变量与两个及两个以上自变量的回归一个因变量与两个及两个以上自变量的回归2.2.描描述述因因变变量量 y 如如何何依依赖赖于于自自变变量量 x1,x2,xk 和和误差项误差项 的方程,称为多元回归模型的方程,称为多元回归模型3.3.涉涉及及 k 个自变量的多元回归模型可表示为个自变量的多元回归模型可表示为 0 0,1 1,2 2 ,k k是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 y y 是是x x1,1,,x x2 2,x xk k 的的线线性性函函数数加加上上误误差差项项 包包含含在在y y里里面面但但不不能能被被k k个个自自变变量量的的线线性性关关系系 所解释的变异性所解释的变异性多元回归模型一个因变量与两个及两个以上自变量的回归 0 多元回归模型多元回归模型(基本假定基本假定)1.1.误误差差项项是是一一个个期期望望值值为为0的的随随机机变变量量,即即E()=0)=0(零均值)(零均值)(零均值)(零均值)2.2.对对于于自自变变量量x1,x2,xk的的所所有有值值,的的方方差差 2都相同都相同(同方差)(同方差)(同方差)(同方差)3.3.误误差差项项是是一一个个服服从从正正态态分分布布的的随随机机变变量量,即即N(0,2),且相互独立且相互独立(正态性)(无自相关)(正态性)(无自相关)(正态性)(无自相关)(正态性)(无自相关)4.自变量见不存在较强的相关性自变量见不存在较强的相关性(无多重共线性)。(无多重共线性)。(无多重共线性)。(无多重共线性)。多元回归模型(基本假定)误差项是一个期望值为0的随机变量多元回归方程多元回归方程1.1.描描述述因因变变量量 y 的的平平均均值值或或期期望望值值如如何何依依赖赖于于自自变量变量 x1,x2,xk的方程的方程2.2.多多元线性回归方程的形式为元线性回归方程的形式为 E(y)=0+1 x1+2 x2+k xk 1 1,2 2,k k称为偏回归系数称为偏回归系数 i i 表表示示假假假假定定定定其其其其他他他他变变变变量量量量不不不不变变变变,当当 x xi i 每每变变动动一个单位时,一个单位时,y y 的平均变动值的平均变动值多元回归方程描述因变量 y 的平均值或期望值如何依赖于自变量估计的多元回的方程估计的多元回的方程 是是 估计值估计值 是是 y 的估计值的估计值1.1.用样本统计量用样本统计量 估计回归方程中的估计回归方程中的 参数参数 时得到的方程时得到的方程2.2.由最小二乘法求得由最小二乘法求得3.3.一般形式为一般形式为估计的多元回的方程 参数的最小二乘法参数的最小二乘法(例题分析例题分析)【例例8 8】某某公公司司老老板板认认为为每每周周总总收收入入(千千元元)与与广广告告费费用用(千千元元)有有关关,并并想想对对总总收收入入进进行行预预测测,现现有有由由8 8周周数数据据组组成成的的一一个个样样本本,根根据据数数据进行分析,你能得出哪些有用的结论?据进行分析,你能得出哪些有用的结论?周总收入电视广告费用报纸广告费用周总收入电视广告费用报纸广告费用9651.59533.390229442.39541.59434.29232.59432.5参数的最小二乘法(例题分析)【例8】某公司老板认为每周总收入多元线性回归的主要内容多元线性回归的主要内容q参数估计(最小二乘法)参数估计(最小二乘法)q判定系数(修正的判定系数)判定系数(修正的判定系数)q回归方程显著性的检验回归方程显著性的检验q回归系数显著性的检验回归系数显著性的检验多元线性回归的主要内容参数估计(最小二乘法)判定系数判定系数1.1.回归平方和占总平方和的比例回归平方和占总平方和的比例2.2.计算公式为计算公式为3.3.因因变变量量取取值值的的变变差差中中,能能被被估估计计的的多多元元回回归归方方程程所解释的比例所解释的比例 判定系数回归平方和占总平方和的比例修正的判定系数修正的判定系数1.1.用样本量用样本量n n和自变量的个数和自变量的个数k k去修正去修正R R2 2得到得到 2.2.计算公式为计算公式为3.3.避免增加自变量而高估避免增加自变量而高估 R R2 24.4.意义与意义与 R R2 2类似类似5.5.数值小于数值小于R R2 2 Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析修正的判定系数用样本量n和自变量的个数k去修正R2得到 线性关系检验线性关系检验1.1.检检验验因因变变量量与与所所有有自自变变量量之之间间的的线线性性关关系系是是否否显显著,也被称为著,也被称为总体的显著性检验总体的显著性检验2.2.检检验验方方法法是是将将回回归归均均方方(MSRMSR)同同残残差差均均方方(MSEMSE)加加以以比比较较,应应用用 F F 检检验验来来分分析析二二者者之之间间的的差差别别是是否否显著显著q如如果果是是显显著著的的,因因变变量量与与自自变变量量之之间间存存在在线线性性关关系,即至少有一个自变量对系,即至少有一个自变量对y y线性影响是显著的。线性影响是显著的。q如如果果不不显显著著,因因变变量量与与自自变变量量之之间间不不存存在在线线性性关关系系线性关系检验检验因变量与所有自变量之间的线性关系是否显著,也线性关系检验线性关系检验1.1.提出提出假设假设qH0:1 2 k=0 线性关系不显著线性关系不显著qH1:1,2,k至少有一个不等于至少有一个不等于02.2.计算检验统计量计算检验统计量F F3.3.确定显著性水平确定显著性水平 和分子自由度和分子自由度k k、分母自由度、分母自由度n-n-k k-1-1找出临界值找出临界值F F 4.4.作出决策:若作出决策:若F F F F ,拒绝,拒绝H H0 0 Excel Excel 输输输输出结果的分析出结果的分析出结果的分析出结果的分析线性关系检验提出假设2.计算检验统计量F确定显著性水平回归系数的检验回归系数的检验1.1.线线性性关关系系检检验验通通过过后后,对对每每一一个个自自变变量量都都要单独进行检验要单独进行检验2.2.应用应用 t t 检验统计量检验统计量回归系数的检验线性关系检验通过后,对每一个自变量都要单独进行回归系数的检验回归系数的检验(步骤步骤)1.1.提出假设提出假设qH0 0:i i=0 (=0 (自变量自变量 xi 与与 因变量因变量 y 没有线性没有线性关系关系)qH1 1:i i 0 (0 (自变量自变量 xi 与与 因变量因变量 y有线性关系有线性关系)2.2.计算检验的统计量计算检验的统计量 t t3.3.确定显著性水平确定显著性水平,并进行决策,并进行决策 t t t t ,拒绝,拒绝H H0 0;t t t t ,不拒绝,不拒绝H H0 0回归系数的检验(步骤)提出假设 确定显著性水平,并进行决策本章小结本章小结1.1.相关关系的概念和分析方法。相关关系的概念和分析方法。2.2.简单线性相关方法(散点图和相关系数);简单线性相关方法(散点图和相关系数);3.3.回归模型、回归方程与估计的回归方程回归模型、回归方程与估计的回归方程4.4.利用最小二乘法估计回归系数利用最小二乘法估计回归系数5.5.回归分析中的显著性检验(回归分析中的显著性检验(F F检验和检验和t t检验)检验)6.6.回归方程的评价回归方程的评价(判定系数和标准误差)判定系数和标准误差)7.7.估计和预测估计和预测本章小结相关关系的概念和分析方法。结结 束束结 束THANKS此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!