数学第8章相关回归分析

上传人:无*** 文档编号:181412469 上传时间:2023-01-13 格式:PPT 页数:43 大小:549.24KB
返回 下载 相关 举报
数学第8章相关回归分析_第1页
第1页 / 共43页
数学第8章相关回归分析_第2页
第2页 / 共43页
数学第8章相关回归分析_第3页
第3页 / 共43页
点击查看更多>>
资源描述
内内 容容 目目 录录 第一章 统计学导论 第二章 统计调查 第三章 统计整理 第四章 综合指标 第五章 动态数列 第六章 统计指数 第七章 抽样推断 第八章 相关回归分析 第八章第八章相关回归分析相关回归分析内内 容容 提提 要要v本章内容 第一节 相关分析 第二节 回归分析v本章重点 相关系数的计算及回归方程的建立v本章难点 相关系数的计算及回归方程的建立v具体要求 理解相关分析的有关概念、特点等。掌握相关系数的计算及回归方程的建立内内 容容 提提 要要5单击此处编辑母版副标题样式第一节第一节 相相 关关 分分 析析一、相关分析概述 (一)相关关系的概念 广义的相关关系就是指社会经济现象中普遍存在的依存关系和制约关系。这一点可以从唯物辩证法的高度去理解。而且社会经济现象之间的这种依存制约关系通常都可以通过数量关系表现出来。但统计所指的不是广义的相关关系,而是狭义的相关关系。狭义的相关关系是指现象之间确实存在的,而关系数值不固定的相互依存关系。从广义的相关关系概念出发,社会经济现象普遍存在的依存制约关系可以区分为两大类型。一是函数关系,即现象之间存在着严格的关系值确定的依存关系。函数关系的特点如下:1、在这种关系中,对于某一变量的每一个数值,都有另一个变量的确定值与之相对应。2、这种关系一般都可以用一个数学表达式反映出来。【参书中169面例子】二是相关关系,即前面所指的狭义相关关系。这种关系也就包括书中170面所讲到的因果关系(单向因果和双向因果)和关联关系(同因异果和异果同因)。此相关关系才是统计上所指的相关关系。相关关系的特点如下:1、它是指现象之间确实存在着数量上的相互依存关系。对具有这样关系的两个变量,要能区分自变量和因变量。2、现象之间的数量依存关系的具体关系值不是固定的,即自变量与因变量之间并非一一对应。【参书中例子】相关关系和函数关系有区别也有联系:1、实际现象中,函数关系往往通过相关关系表现出来。2、在研究相关关系时,常常使用函数关系的形式来表现,它是相关分析的工具。(二)相关关系的种类 1、按相关关系涉及的因素多少划分 (1)一元(单)相关:两个因素之间的相关。(2)多元(复)相关:三个及三个以上因素之间的相关。2、按相关关系变化的方向划分 (1)正相关:变量的变动方向一致(同增同减)。(2)负相关:变量的变动方向相反(一增一减)。3、按相关关系的表现形态划分 (1)线性(直线)相关:在坐标图上两个变量对应的散布点近似地呈直线形式。(2)非线性(曲线)相关:在坐标图上两个变量对应的散布点近似地呈某种曲线形式。xyyx例:线性相关线性相关非线性相关非线性相关4、按相关的程度划分 (1)完全相关:即变量之间存在函数关系。(2)不完全相关:即狭义上的相关关系。(3)不相关:即变量相互独立,互不影响。(三)相关分析的主要内容 相关分析亦可从广义和狭义两方面理解,从广义上来说,相关分析包括:1、狭义相关分析:仅研究变量或现象之间关系的紧密程度及方向。2、回归分析:即用数学式子表现自变量和因变量之间的相关关系。相关和回归既有区别又有联系,本节上述内容是把二者合在一起讨论,下面将分开讨论。二、简单线性相关分析 即:线性单相关分析或直线相关分析 (一)相关关系的一般判断:即初步定性分析现象之间有无相关关系。若有,即可采用相关表、相关图和计算相关系数的方法进一步精确定量分析。(二)相关了解相关关系的形式和程度。表:用于初步 1、简单相关表 2、分组相关表 (1)单变量分组相关表 (2)双变量分组相关表 (二)相关图:相关表上资料的图示化。其图形的表现形式有很多种。以上相关表和相关图对相关关系的分析是初步的,不精确的,没有也不能从数量上表现相关关系的密切程度。(三)相关系数的计算和应用 1、含义:相关系数是一个用于从定量方面测定两个变量之间线性相关程度和方向的最重要的指标。即用于线性单相关(简单线性相关或直线相关)的测定。2、相关系数的计算:(1)基本计算公式(“积差法”公式)yxxyr2两个变量数列的协方差 自变量y数列的标准差 自变量x数列的标准差 相关系数式中:xyyxr2 由nyyxxnyynxxxyyx)()()(222222)()()(yyxxyyxxryxxy相关系数的基本计算公式可变化为:(2)积差法相关系数的简捷计算公式)()(yxyxyxxyyyxxyxyxxyxynynxnnyxnyxxyyxnynxxnyxy222)()()(yyxxyyxxryxxy.已知:已知:因为:因为:nyxxy.即:即:)(yyxx 222xxxx)2()(222xxxxxx222)(2nxnnxxnxx22)(nxxxx222)()(:即nyyyy222)()(同理:同理:.把式代入式,即可得到积差法相关系数的简捷计算公式:22)()()(yyxxyyxxryxxynyynxxnyxxy2222)()(2222)()(yynxxnyxxyn利用此公式不用计算x和y的平均值,直接用x和y的值计算即可 3、相关系数的特点及应用 (1)相关系数的取值范围为:(2)当为正值时,两变量呈正相关;当为负值时,两变量呈负相关。(3)相关系数的绝对值愈大,表示两变量之间相关程度愈密切;1为完全正相关;1为完全负相关。(4)相关系数的绝对值愈小,愈接近0,表示两变量之间相关程度愈低,当 0时,两变量完全没有直线相关。111rr(5)线性相关的一般判断准则:低度相关微弱相关5.03.03.0rr高度相关显著相关18.08.05.0rr 使用此原则的前提条件是计算相关系数的原始根据要比较多,否则相关系数的可信程度会降低。以上相关系数的计算等内容可参书181182页的例子或下面的例子。例 为了解营业员每人月平均销售额(万元)和利润率(%)之间的关系,特从100家商店中随机抽取10家,得到如下资料,试计算样本相关系数。商商店店 A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 平平均均 销销售售额额 6 6 5 5 8 8 1 1 4 4 7 7 6 6 3 3 3 3 7 7 利利润润率率 12.6 10.4 18.5 3.0 8.1 16.3 12.3 6.2 6.6 16.8 计算过程如下:人均销售额人均销售额 x x利润率利润率(%)y yx x2 2y y2 2xyxy6 65 58 81 14 47 76 63 33 37 712.612.610.410.418.518.53.03.08.18.116.316.312.312.36.26.26.66.616.816.83636252564641 11616494936369 99 94949158.76158.76108.16108.16342.25342.259.009.0065.6165.61265.69265.69151.29151.2938.4438.4443.5643.56282.24282.2475.675.652.052.0148.0148.03.03.032.432.4114.1114.173.873.818.618.619.819.8117.6117.65050110.8110.82942941465.001465.00654.9654.9 因此:228.11014651050294108.110509.654102222)()(yynxxnyxxynr987.036.23734401009 人均销售额与利润率之间存在着高度的正相关关系。10,9.654,1465294,8.110,5022nxyyxyx24单击此处编辑母版副标题样式第二节第二节 回回 归归 分分 析析一、回归分析概述 1、概念:回归分析就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。关于回归方程(回归模型)和回归曲线(配合曲线)回归方程:回归分析中建立的反映变量间相关关系的数学表达式。回归曲线:根据回归方程配合得到的曲线,其表现形式有直线和曲线等。2、回归分析与相关分析的比较 (1)回归和相关都是研究两个变量相互关系的分析方法。但相关分析是研究两个变量之间相关的方向和相关的密切程度,它不能指出两变量相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化关系。而回归分析则是通过一定的数学方程来反映变量之间相互关系的具体形式,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法。(2)相关分析既可以研究因果关系的现象也可以研究共变的现象,不必确定两变量中谁是自变量,谁是因变量。而回归分析是研究两变量具有因果关系的数学形式,因此必须事先确定变量中自变量与因变量的地位。(3)在相关分析中计算相关系数的两变量是对等的,改变两变量的地位并不影响相关系数的数值。在回归分析中因变量是随机的,自变量是可控制的解释变量,不是随机变量,二者地位不对等。因此回归分析只能用自变量来估计因变量,而不允许由因变量来推测自变量。(4)回归分析和相关分析都属于广义的相关分析,二者是互相补充、密切联系的。相关分析需要回归分析来表明现象数量相关的具体形式,而回归分析则应该建立在相关分析的基础上。依靠相关分析表明现象的数量变化具有密切相关,进行回归分析求其相关的具体形式才有意义。在相关程度很低的情况下,回归函数的表达式代表性就很差。3、回归分析的种类 (1)按自变量的多少分 简单(一元)回归:自变量只有一个。例 y=a+bx 一元回归方程 复(多元)回归:自变量为2个或2个以上。例 y=y=0 0+1 1x x1 1+2 2x x2 2+n nx xn n (2)按回归方程式的特征分 线性回归:因变量为自变量的线性函数。例 y=a+bx 一元线性回归方程 非线性回归:因变量为自变量的非线性函数。例指数函数回归方程 aeybx 4、回归分析的步骤(内容)(1)确定自变量和因变量;例粮食产量(y)施肥量(x);消费支出(y)国民收入(x);(2)确定回归方程;(3)统计检验;(4)预测或控制。例 消费与收入的回归方程:y=a+bx=200+0.15x 已知 x确定y:估计或预测 已知y确定x:控制二、简单线性回归分析 即:一元线性回归分析或直线回归分析 (一)简单线性回归分析的特点 简单线性回归分析是回归分析中最简单最基本的一种,因此前面“回归分析与相关分析的比较”中涉及到的回归分析的特点同样适用于它。其它的特点有:1、在简单回归分析中,自变量只有一个,所拟合的回归方程实际上就是直线方程。2、在现象互为根据的情况下,可以有两个回归方程y倚x的方程和x倚y的方程。(二)直线回归方程的确定 建立直线回归方程是直线回归分析中最为关键最为重要的事情,其根本的任务就是设法在分散的具有线性关系的相关点之间配合一条最优的直线,以表明两变量之间具体的变动关系,并可以据以进行预测等。那么如何来建立或者说找到一条这样的直线呢?首先:用作相关图或计算相关系数的办法确定变量间是不是确实存在大致的线性相关关系。【参下面例子】假如有以下资料:某企业上半年产品产量与单位成本的资料月份 产量(千件)单位成本(元)123456234345737271736968 以产量为自变量,单位成本为因变量拟合直线回归方程。作相关图:75706560 x产量y单位成本132654 从相关图上可以看出产量与单位成本间存在相关关系 计算相关系数:月份 产量(千件)x单位成本(元)yx2y2xy1234562343457372717369684916916255329 51845041532947614624146216284219276340合计2142679302681481 因此:9091.0)426302686)(21796(4262114816显然说明产量和单位成本之间存在显然说明产量和单位成本之间存在高度负相关高度负相关。2222)()(yynxxnyxxynr 第二步就是拟合直线方程:已知产量和单位成本之间存在高度的相关关系,那么我们完全可以先把直线回归方程的一般形式写出来,即bxayc式中:a是直线的截距;b是直线的斜率,即回归系数;yc表示因变量y的估计值。a和b是方程中待定的参数,只要确定了参数就可确定方程的具体形式,因此参数的确定是关键的关键。确定参数的方法主要用的是“最小二乘法”。最小二乘法(最小平方法)求参数ab:1、最小二乘法的原理:使拟合的直线上的点到实际值点的距离平方和最小,即所谓的yc到y的“离差平方和最小”,yc为拟合曲线上据以推算的估计值,y为实际值。75706560 x产量y单位成本132654例如:拟合直线拟合直线实际值实际值 2、参数计算公式的具体推导过程(离差平方和最小)由min)(2cyyQ0)()(20)1)(2xbxaybQbxayaQ(2)(1)整理得2xbxaxyxbnaymin)()(22bxayyyQc由极值定理,令:xbyna式由)1(nxbnya将a代入(2)式得:2xbxnxbnyxynxxbnyxxy22)(22)(xbnxbnyx nxxnyxxyb22)(22)(xxnyxxyn由b可得a为:222)(xxnxyxyxa或者用公式nxbnya求a的值也可。由前面的例子:月份 产量(千件)x单位成本(元)yx2y2xy1234562343457372717369684916916255329 51845041532947614624146216284219276340合计214267930268148182.1)(22 xxnyxxynb37.77nxbnya回归方程为:77.371.82 75706560 x产量y单位成本13265477.371.82 a=77.37即是回归方程与y轴的纵截距;b=1.82,即回归系数为负值,表明产量和单位成本呈负相关,回归直线向右下倾斜;它也表明产量每增加1千件,单位成本降低1.82元,即产量越大单位成本越低。77.37看图:理解:当然由回归方程,我们即可预测当产量变化时,相对应的单位成本的值。假定产量为6千件时,单位成本为多少元?已知:x=6,代入回归方程 77.371.82 中,得 77.371.82666.45(元)即:产量为6千件时,单位成本为66.45元。同理,可以预测当产量为6.5、8、8.2千件等等时的单位成本。
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!