第8章SPSS的相关和线性回归课件

上传人:痛*** 文档编号:241647834 上传时间:2024-07-12 格式:PPT 页数:70 大小:1.10MB
返回 下载 相关 举报
第8章SPSS的相关和线性回归课件_第1页
第1页 / 共70页
第8章SPSS的相关和线性回归课件_第2页
第2页 / 共70页
第8章SPSS的相关和线性回归课件_第3页
第3页 / 共70页
点击查看更多>>
资源描述
相关分析相关分析线性回归分析线性回归分析提纲提纲相关分析相关分析偏相关分析偏相关分析回归分析回归分析曲线估计曲线估计4321一、一、相关相关分析分析一一.变量相关的概念变量相关的概念二二.相关系数及其计算相关系数及其计算变量间的关系变量间的关系函数关系函数关系1.是一一对应的确定关系是一一对应的确定关系 设设有有两两个个变变量量 x 和和 y,变变量量 y 随随变变量量 x 一一起起变变化化,并并完完全全依依赖赖于于 x,当当变变量量 x 取取某某个个数数值值时时,y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y 是是 x 的的函函数数,记记为为 y=f(x),其其中中 x 称为自变量,称为自变量,y 称为因变量称为因变量2.各观测点落在一条线上各观测点落在一条线上 x xy y 函数关系的例子函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为 y=p x (p 为单价)圆的面积(S)与半径之间的关系可表示为 S=R2 企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1 x2 x3 相关关系的例子相关关系的例子商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系变量间的关系变量间的关系相关关系相关关系 1.变变量量间间关关系系不不能能用用函函数数关关系系精确表达精确表达 2.一一个个变变量量的的取取值值不不能能由由另另一一个变量唯一确定个变量唯一确定 3.当当变变量量 x 取取某某个个值值时时,变变量量 y 的取值可能有几个的取值可能有几个4.各观测点分布在直线周围各观测点分布在直线周围 x xy y相关关系和函数关系的联系相关关系和函数关系的联系函数关系在实际中往往通过相关关系表现出来函数关系在实际中往往通过相关关系表现出来相关关系常常要使用函数关系的形式来表现,以相关关系常常要使用函数关系的形式来表现,以便找到相关关系的一般数量表现形式便找到相关关系的一般数量表现形式相关关系的类型相关关系的类型相关关系相关关系非线性相关非线性相关线性相关线性相关正正相相关关正正相相关关负负相相关关负负相相关关完全相关完全相关不相关不相关相关关系的图示相关关系的图示不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关相关关系的测度相关关系的测度相关系数相关系数1.对变量之间关系密切程度的度量对变量之间关系密切程度的度量2.对对两两个个变变量量之之间间线线性性相相关关程程度度的的度度量量称称为为简简单单相关系数相关系数3.若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称称为为总体相关系数,记为总体相关系数,记为4.若若是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关关系系数,记为数,记为 r 相关系数的计算相关系数的计算 样本相关系数的计算公式样本相关系数的计算公式或化简为相关系数取值及其意义相关系数取值及其意义1.r 的取值范围是的取值范围是-1,12.|r|=1,为完全相关为完全相关r=1,为完全正相关,为完全正相关r=-1,为完全负正相关,为完全负正相关3.r=0,不存在不存在线性相关线性相关关系关系4.-1 r0,为负相关为负相关5.0t,拒绝,拒绝H0 若若 t=64.9809t t(13-2)=2.201(13-2)=2.201,拒绝,拒绝H H0 0,人,人均消费金额与人均国民收入之间的相关关系显著均消费金额与人均国民收入之间的相关关系显著相关分析相关分析SPSS操作操作案例案例为研究高等院校人文社会科学研究中立项课题数受为研究高等院校人文社会科学研究中立项课题数受哪些因素的影响,收集到某年哪些因素的影响,收集到某年31个省市自治区部分个省市自治区部分高校有关社科研究方面的数据,研究高校有关社科研究方面的数据,研究立项课题数立项课题数(当年)(当年)与与投入的具有高级职称的人年数(上年)投入的具有高级职称的人年数(上年)、发表的论文数(上年)发表的论文数(上年)之间是否具有较强的线性关之间是否具有较强的线性关系。系。思路思路1、绘制、绘制散点图散点图,直观展现变量之间的统计关系,直观展现变量之间的统计关系图形图形旧对话框旧对话框散点散点矩阵分布矩阵分布选取相应变量到选取相应变量到“矩阵变量矩阵变量”中中2、计算、计算相关系数相关系数,以数值的方式反映变量间线性,以数值的方式反映变量间线性相关的强弱程度相关的强弱程度分析分析相关相关双变量双变量选择参加相关系数的变量到选择参加相关系数的变量到“变量变量”中中选择计算哪种相关系数选择计算哪种相关系数练习练习1利用利用SPSS软件完成软件完成【例例8.1】二、偏相关分析二、偏相关分析1、分析、分析相关相关偏相关偏相关2、选择参与分析的变量、选择参与分析的变量3、选择一个或多个控制变量、选择一个或多个控制变量偏相关分析也称净相关分析,在偏相关分析也称净相关分析,在控制其他变量控制其他变量的线性影响的的线性影响的条件下条件下分析两变量间的线性相关分析两变量间的线性相关,所采用的工具是偏相关系,所采用的工具是偏相关系数(净相关系数)。数(净相关系数)。三、回归分析三、回归分析线性回归模型线性回归模型回归参数的最小二乘估计回归参数的最小二乘估计回归方程的拟合优度检验回归方程的拟合优度检验回归方程的显著性检验回归方程的显著性检验回归系数的显著性检验回归系数的显著性检验知知识识点点回回顾顾什么是回归分析?什么是回归分析?1.从从一一组组样样本本数数据据出出发发,确确定定变变量量之之间间的的数数学学关系式关系式2.对对这这些些关关系系式式的的可可信信程程度度进进行行各各种种统统计计检检验验,并并从从影影响响某某一一特特定定变变量量的的诸诸多多变变量量中中找找出出哪哪些变量的影响显著,哪些不显著些变量的影响显著,哪些不显著3.利利用用所所求求的的关关系系式式,根根据据一一个个或或几几个个变变量量的的取取值值来来预预测测或或控控制制另另一一个个特特定定变变量量的的取取值值,并给出这种预测或控制的精确程度并给出这种预测或控制的精确程度回归分析与相关分析的区别回归分析与相关分析的区别1.相相关关分分析析中中,变变量量 x 变变量量 y 处处于于平平等等的的地地位位;回回归归分分析析中中,变变量量 y 称称为为因因变变量量,处处在在被被解解释释的的地地位,位,x 称为自变量,用于预测因变量的变化称为自变量,用于预测因变量的变化2.相相关关分分析析中中所所涉涉及及的的变变量量 x 和和 y 都都是是随随机机变变量量;回回归归分分析析中中,因因变变量量 y 是是随随机机变变量量,自自变变量量 x 可可以是随机变量,也可以是非随机的确定变量以是随机变量,也可以是非随机的确定变量3.相相关关分分析析主主要要是是描描述述两两个个变变量量之之间间线线性性关关系系的的密密切切程程度度;回回归归分分析析不不仅仅可可以以揭揭示示变变量量 x 对对变变量量 y 的影响大小,还可以由回归方程进行预测和控制的影响大小,还可以由回归方程进行预测和控制 回归模型与回归方程回归模型与回归方程回归模型回归模型1.回答回答“变量之间是什么样的关系?变量之间是什么样的关系?”2.方程中运用方程中运用因变量因变量(响应变量响应变量)被预测的变量被预测的变量自变量自变量(解释变量解释变量)用于预测的变量用于预测的变量3.主要用于预测和估计主要用于预测和估计回归模型的类型回归模型的类型一个自变量一个自变量一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型多元回归多元回归一元回归一元回归线性回线性回归归非线性非线性回归回归线性回线性回归归非线性非线性回归回归一元线性回归模型一元线性回归模型1.当当只只涉涉及及一一个个自自变变量量时时称称为为一一元元回回归归,若若因因变变量量 y 与与自自变变量量 x 之之间间为为线线性性关关系系时时称称为为一一元元线线性回归性回归2.对对于于具具有有线线性性关关系系的的两两个个变变量量,可可以以用用一一个个线线性方程来表示它们之间的关系性方程来表示它们之间的关系3.描描述述因因变变量量 y 如如何何依依赖赖于于自自变变量量 x 和和误误差差项项 的方程称为的方程称为回归模型回归模型一元线性回归模型一元线性回归模型 对对于于只只涉涉及及一一个个自自变变量量的的简简单单线线性性回回归归模模型型可可表示为表示为 y=0+1 x+e模型中,模型中,y 是是 x 的线性函数加上误差项的线性函数加上误差项线性部分反映了由于线性部分反映了由于 x 的变化而引起的的变化而引起的 y 的变化的变化误差项误差项 是随机变量是随机变量反反映映了了除除 x 和和 y 之之间间的的线线性性关关系系之之外外的的随随机机因因素素对对 y 的影响的影响是不能由是不能由 x 和和 y 之间的线性关系所解释的变异性之间的线性关系所解释的变异性 0 和和 1 称为模型的参数称为模型的参数基本假定基本假定1.误误差差项项是是一一个个期期望望值值为为0的的随随机机变变量量,即即E()=0。对于一个给定的对于一个给定的 x 值,值,y 的期望值为的期望值为 E(y)=0+1 x2.对于所有的对于所有的 x 值,值,的方差的方差2 都相同都相同3.误误差差项项是是一一个个服服从从正正态态分分布布的的随随机机变变量量,且且相相互互独立。即独立。即N(0,2)独独立立性性意意味味着着对对于于一一个个特特定定的的 x 值值,它它所所对对应应的的与与其他其他 x 值所对应的值所对应的不相关不相关对对于于一一个个特特定定的的 x 值值,它它所所对对应应的的 y 值值与与其其他他 x 所所对应的对应的 y 值也不相关值也不相关回归方程回归方程1.描描述述 y 的的平平均均值值或或期期望望值值如如何何依依赖赖于于 x 的的方方程程称为称为回归方程2.简单线性回归方程的形式如下简单线性回归方程的形式如下 E(y)=0+1 x方程的图示是一条直线,因此也称为直线回归方程方程的图示是一条直线,因此也称为直线回归方程 0是回归直线在是回归直线在 y 轴上的截距,是当轴上的截距,是当 x=0 时时 y 的期望值的期望值 1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表示示当当 x 每每变变动动一一个个单单位位时,时,y 的平均变动值的平均变动值估计估计(经验经验)的回归方程的回归方程3.简单线性回归中估计的回归方程为简单线性回归中估计的回归方程为其其中中:是是估估计计的的回回归归直直线线在在 y y 轴轴上上的的截截距距,是是直直线线的的斜斜率率,它它表表示示对对于于一一个个给给定定的的 x x 的的值值,是是 y y 的的估估计计值,也表示值,也表示 x x 每变动一个单位时,每变动一个单位时,y y 的平均变动值的平均变动值 2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中的的未未知知参参数数 和和 ,就得到了,就得到了估计的回归方程估计的回归方程1.总总体体回回归归参参数数 和和 是是未未知知的的,必必需需利利用用样样本本数数据去估计据去估计参数参数 0 和和 1 的最小二乘估计的最小二乘估计最小二乘法最小二乘法图例图例x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i最小二乘法最小二乘法1.使因变量的观察值与估计值之间的离差平方和使因变量的观察值与估计值之间的离差平方和达到最小来求得达到最小来求得 和和 的方法。即的方法。即2.用用最最小小二二乘乘法法拟拟合合的的直直线线来来代代表表x与与y之之间间的的关系与实际数据的误差比其他任何直线都小关系与实际数据的误差比其他任何直线都小 和和 的计算公式的计算公式 根据最小二乘法的要求,可得求解 和 的标准方程如下估计方程的求法估计方程的求法实例实例 【例】根根据据例例8.1中中的的数数据据,配配合合人人均均消消费金额对人均国民收入的回归方程费金额对人均国民收入的回归方程 根据根据 和和 的求解公式得的求解公式得 人均消费金额对人均国民收入的回归方程为人均消费金额对人均国民收入的回归方程为y=54.22286+0.52638 x 回归方程的显著性检验回归方程的显著性检验1、拟合优度的检验、拟合优度的检验2、线性关系的检验、线性关系的检验3、回归系数的检验、回归系数的检验离差平方和的分解离差平方和的分解1.因因变变量量 y 的的取取值值是是不不同同的的,y 取取值值的的这这种种波波动动称称为为变差变差。变差来源于两个方面。变差来源于两个方面由于自变量由于自变量 x 的取值不同造成的的取值不同造成的除除 x 以以外外的的其其他他因因素素(如如x对对y的的非非线线性性影影响响、测测量量误误差等差等)的影响的影响2.对对一一个个具具体体的的观观测测值值来来说说,变变差差的的大大小小可可以以通通过过该实际观测值与其均值之差该实际观测值与其均值之差 来表示来表示图示图示x xy yy y 离差分解图离差分解图三个平方和的关系三个平方和的关系2.两端平方后求和有1.从图上看有从图上看有SST=SSR+SSE总变差平方和总变差平方和(SSTSST)回归平方和回归平方和(SSRSSR)残差平方和残差平方和(SSESSE)图示图示x xy yy y 离差分解图离差分解图拟合优度检验拟合优度检验判定系数判定系数 r2 1.回归平方和占总离差平方和的比例2.反映回归直线的拟合程度反映回归直线的拟合程度3.取值范围在取值范围在 0,1 之间之间4.r2 1,说明回归方程拟合的越好;,说明回归方程拟合的越好;r20,说明回归方程拟合的越差,说明回归方程拟合的越差5.判定系数等于相关系数的平方,即判定系数等于相关系数的平方,即r2(r)2拟合优度检验拟合优度检验估计标准误差估计标准误差 Sy1.实际观察值与回归估计值离差平方和的均方根实际观察值与回归估计值离差平方和的均方根2.反映实际观察值在回归直线周围的分散状况反映实际观察值在回归直线周围的分散状况3.从另一个角度说明了回归直线的拟合程度从另一个角度说明了回归直线的拟合程度4.计算公式为计算公式为注:上例的计算结果为14.94967814.94967814.94967814.949678线性关系的检验线性关系的检验1.检验自变量和因变量之间的线性关系是否显著检验自变量和因变量之间的线性关系是否显著2.具具体体方方法法是是将将回回归归离离差差平平方方和和(SSR)同同剩剩余余离离差差平平方方和和(SSE)加加以以比比较较,应应用用F检检验验来来分分析析二二者者之之间间的差别是否显著的差别是否显著如果是显著的,两个变量之间存在线性关系如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系如果不显著,两个变量之间不存在线性关系检验的步骤检验的步骤1.提出假设H0:线性关系不显著:线性关系不显著2.计算检验统计量计算检验统计量F3.确定显著性水平确定显著性水平,并根据分子自由度,并根据分子自由度1和分和分母自由度母自由度n-2找出临界值找出临界值F 4.作出决策:若作出决策:若F F ,拒绝拒绝H0;若若F t t,拒绝,拒绝,拒绝,拒绝H H0 0;t t =65.0758t t=2.201=2.201,拒拒拒拒绝绝绝绝H H0 0,表表表表明明明明人人人人均均均均收收收收入入入入与人均消费之间有线性关系与人均消费之间有线性关系与人均消费之间有线性关系与人均消费之间有线性关系对前例的回归系数进行显著性检验(0.05)1、一元线性回归分析案例、一元线性回归分析案例现有现有1997-2013年某地区全社会固定资产投资总额年某地区全社会固定资产投资总额NINV和国内生产总值和国内生产总值GDP两个指标的年度数据。试两个指标的年度数据。试研究研究NINV和和GDP的数量关系,并建立全社会的数量关系,并建立全社会NINV和和GDP的线性回归方程。的线性回归方程。思路和主要步骤思路和主要步骤绘制散点图绘制散点图计算相关系数计算相关系数线性回归分析线性回归分析1、分析、分析回归回归线性线性2、选择被解释变量(因变量)、选择被解释变量(因变量)3、选择解释变量(自变量)、选择解释变量(自变量)练习练习1完成上例,并对输出结果进行解释完成上例,并对输出结果进行解释2、多元线性回归分析案例、多元线性回归分析案例利用利用“高校科研研究高校科研研究”数据,分析数据,分析立项课题数立项课题数(X5)与与投入人年数(投入人年数(X2)、投入高级职称的人投入高级职称的人年数(年数(X3)、投入科研事业费(投入科研事业费(X4)、专著数专著数(X6)、论文数(论文数(X7)、获奖数(获奖数(X8)之间的线之间的线性关系性关系主要步骤主要步骤1、分析、分析回归回归线性线性2、选择被解释变量(因变量)、选择被解释变量(因变量)3、选择解释变量(自变量)、选择解释变量(自变量)4、选择回归分析中解释变量的筛选策略、选择回归分析中解释变量的筛选策略5、练习练习2完成上例,尽量解释输出结果完成上例,尽量解释输出结果四、曲线估计四、曲线估计1、SPSS中的本质线性模型中的本质线性模型1、SPSS中的本质线性模型中的本质线性模型1、SPSS中的本质线性模型中的本质线性模型2、案例:教育支出分析、案例:教育支出分析根据根据1988-2012年全国人均消费性支出和教育支年全国人均消费性支出和教育支出的数据,对居民家庭教育支出和消费性支出之出的数据,对居民家庭教育支出和消费性支出之间的关系进行研究。间的关系进行研究。主要步骤主要步骤1、分析、分析回归回归曲线估计曲线估计2、选择被解释变量、选择被解释变量3、选择解释变量、选择解释变量4、选择模型、选择模型练习练习3完成上例完成上例3、案例:、案例:居民在外就餐费用分析和预测居民在外就餐费用分析和预测根据根据1991-2012年居民在外就餐的数据,对居民年居民在外就餐的数据,对居民未来在外就餐的趋势进行分析和预测。未来在外就餐的趋势进行分析和预测。主要步骤主要步骤首先绘制就餐费用的序列图首先绘制就餐费用的序列图图形图形旧对话框旧对话框线图线图曲线估计曲线估计1、分析、分析回归回归曲线估计曲线估计2、选择被解释变量、选择被解释变量3、选择解释变量、选择解释变量4、选择模型、选择模型5、“保存保存”按钮:指定按钮:指定“保存变量保存变量”和和“预测个案预测个案”练习练习4完成上例完成上例
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!