统计学期末复习重点第6章相关分析与回归分析.ppt

上传人:zhu****ei 文档编号:3525626 上传时间:2019-12-17 格式:PPT 页数:41 大小:272KB
返回 下载 相关 举报
统计学期末复习重点第6章相关分析与回归分析.ppt_第1页
第1页 / 共41页
统计学期末复习重点第6章相关分析与回归分析.ppt_第2页
第2页 / 共41页
统计学期末复习重点第6章相关分析与回归分析.ppt_第3页
第3页 / 共41页
点击查看更多>>
资源描述
第六章相关分析与回归分析,本章结构,相关分析,相关关系与函数关系函数关系;变量之间存在着严格确定的依存关系相关关系:变量之间存在一定的依存关系,但又不是确定的和严格依存的,相关关系的种类,1、按相关方向分为:正相关和负相关2、按相关程度分为:完全相关、不完全相关和不相关3、按相关形式分为:线性相关(直线相关)和非线性相关(曲线相关)4、按所研究的变量的多少分为:单相关(A与B)、复相关(A与B、C、D)和偏相关(B、C不变A与D)5、按相关系数分为:r=1,完全相关;0.8r1,高度相关;0.5r0.8,显著相关;0.3r0.5,低度相关;0r0.3,微弱相关;r0,不相关;,涵义利用一个指标来反映现象间相互依存关系的密切程度。用相关系数r来表示。特点可以了解现象间的相关方向和程度相关分析中所涉及的现象间地位是平等的,不存在自变量与因变量之分。,相关分析,相关表和相关图,(一)相关表将某一变量的若干数值按从小到大顺序排列,再列出与其相关的另一个变量的对应数值,现从某班同学中抽取10位同学期末考试的数学与统计学成绩资料如表6-2所示表6-2数学与统计学成绩将数学成绩按从小到大的顺序排列,可编制相关表如表6-3所示表6-3数学与统计学成绩相关表,例1,(二)相关图,又称散点图以直角坐标系的横轴代表自变量X,纵轴代表因变量Y将两个变量相对应的变量值用坐标点描绘出来用于反映两变量之间相关关系的图形,根据表6-3绘制相关图,散点图,相关系数单相关系数的含义单相关分析是对两个变量之间的线性相关程度进行分析对两个变量之间线性相关强度的度量称为单相关系数总体相关系数是反映两变量之间线性相关程度的一种特征值,表现为一个常数,记为若相关系数是根据样本数据计算的,则称为样本相关系数,记为r,相关系数的计算,积差法公式:简捷公式:,单相关系数的特点(1)r只是对x与y的线性相关关系的度量。(2)0r1;(3)r=0时,x与y没有线性关系;(4)0r1,x与y存在一定的线性关系;(5)r1,x与y完全线性相关;,例万象集团公司下属公司1月份的销售总额与利润总额的资料如表6-4所示。试问该公司的销售总额与利润总额之间是否存在相关关系,相关系数计算表,单相关系数的检验,(1)建立假设。原假设:H0:=0对立假设:H1:0(2)计算相关系数的t值(3)确定临界值(4)进行判断,根据例6-1,当0.05时,r0.9261,试问该公司的销售收入与利润总额之间是否存在显著的线性相关关系?,回归分析,回归分析涵义根据相关关系的具体形态,选择一个恰当的数学模型,来近似地表达现象间的变化关系。特点变量间地位不平等,自变量与因变量之间存在因果关系。可以反映现象间的具体形态,并且从一个变量的变化可以推出另一个变量的变化。在建立回归模型时,自变量必须是给定的。,相关分析与回归分析的关系,相关分析与回归分析的联系:第一,两者都是研究现象之间相关关系的方法。第二,相关分析依靠回归分析表明现象数量相关的具体形式;回归分析需要依靠相关分析来表明现象数量变化的相关程度,相关分析与回归分析的关系,区别:1、相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;2、相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制;3、相关分析中x、y均为随机变量;回归分析中只有y为随机变量,自变量作为研究时给定的非随机变量,一元线性回归模型,总体回归函数从一个总体看,反映两个变量依存关系的线性回归模型可表示为:其中,和是未知参数,又叫回归系数,是随机误差项,又称随机干扰项,反映未列入方程的其他各种因素对Y的影响,上式表明:在X值给定的条件下,Y的期望值是X的严密的线性函数。Y的实际观测值并不一定位于该直线上,只是散布在该直线周围。各实际观测点与总体回归线垂直方向的间隔,称为随机误差项,误差项的标准假定假定1:误差项是一个期望值为0的随机变量,即假定2:对于所有的X值,误差项的方差为常数2假定3:误差项之间不存在自相关关系,其协方差为0假定4:误差性是一个服从正态分布的随机变量,且独立,即N(0,2)假定5:自变量是给定的变量,与随机误差项线性无关满足以上标准假定的一元线性模型,称为标准的一元线性回归模型,样本回归函数样本一元线性回归模型可表示为:实际观测到的因变量值,并不完全等于如果用i表示两者之差,即有:,样本回归函数与总体回归函数的区别与联系:区别:第一,总体回归线是未知的,只有一条;样本回归线是根据样本数据拟合的,可以是多条第二,总体回归函数中和是未知的参数,表现为常数;样本回归函数中和是随机变量,其具体数值由所抽取的样本观测值决定第三,总体回归函数中的是与未知的总体回归线之间的距离,是不可直接观测;样本回归函数中的是与样本回归线之间的距离,可以计算出具体的数值,一元线性回归模型的估计,(一)回归参数的估计最小二乘法通过使残差平方和为最小来估计回归系数根据最小二乘法:,对Q分别求对应于和的偏导数得:根据上述方程组可得:,例根据例6-1的资料。拟合直线回归方程。,标准误差的估计,反映理论模型误差的大小在一元线性回归模型中,残差必须满足以下两个约束条件:即的无偏估计S2为:,估计标准误差的自由度,1.估计标准误差的自由度之所以是n-2,原因是在计算估计标准误差时,必须先求出和,这两个估计值就是附加给估计标准误差的两个约束条件,因此在计算SSE时,只有n-2个独立的观测值,而不是n个2.一般而言,在有k个自变量的多元回归中,自由度则为n-k3.一般的规律是:自由度=n-待估参数的个数,注意:S越小表明实际观测点与所拟合的样本回归线的离差程度越小,即回归线具有较强的代表性;反之,S越大表明实际观测点与所拟合的样本回归线的离差程度越大,即回归线的代表性较差S经过简化,其计算公式为:,一元线性回归模型的检验,回归模型检验的种类1、理论意义检验:主要涉及参数估计值的符号和取值区间2、一级检验:又称统计学检验,是利用统计学中的抽样理论来检验样本回归方程的可靠性,具体又分为拟合程度评价和显著性检验3、二级检验:又称经济计量学检验,对标准线性回归模型的假定条件能否得到满足进行检验,具体包括序列相关检验、异方差检验、多重共线性检验等,回归方程的拟合优度评价,回归直线在一定程度上描述了自变量与因变量之间的数量关系,利用这一方程,可根据自变量的取值来估计或预测因变量的取值。回归直线对数据的拟合优度:样本观测值聚集在样本回归线周围的紧密程度,通常用判定系数来度量回归模型的拟合优度,判定系数的定义判定系数是建立在对总离差平方和进行分解的基础上。可以分解为两部分:一部分是因变量的理论回归值与其样本均值的离差,它可以看成是能够由回归直线解释的部分,称为可解释离差另一部分是实际观测值与理论回归值的离差,它是不能由回归直线加以解释的残差,将总离差方程的两边平方,并对所有n个点求和,有:即:SST=SSR-SSESST是总离差平方和;SSR是由回归直线可以解释的那一部分离差平方和,称为回归平方和,反映自变量X的变化对因变量Y取值变化的影响;SSE是用回归直线无法解释的离差平方和,称为残差平方和,反映除X以外的其他因素对Y取值的影响,也称为不可解释平方和或剩余平方和,各个样本观测点与样本回归直线靠的越紧,SSR在SST中所占的比例就越大,并将这一比例定义为判定系数,即:判定系数是对回归模型拟合程度的综合度量,判定系数越大,模型拟合程度越高;判定系数越小,则模型对样本的拟合程度越差,2、判定系数的特性:(1)判定系数具有非负性(2)判定系数的取值范围为01(3)判定系数是样本观测值的函数(4)在一元线性回归模型中,判定系数是单相关系数的平方,回归点公式区间预测公式,一元线性回归模型的预测,非线性回归模型抛物线型采用差量法,如果xt接近于常数,y2t的绝对值也接近于常数时,变量y与x之间的关系表现为抛物线型。其公式为:采用最小平方法分别对a、b、c求偏导,并进行整理后得如下标准方程组:,指数型当曲线随着x值的增加而弯曲上升,趋于+;曲线随着x值的增加而弯曲下降趋于0,则变量x与y呈指数型。其公式为:采取线性化手段,两端取对数得:,根据最小二乘法,按直线形式的常数确定方法,得到标准方程如下:,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!