应用统计学-第八章相关与回归分析-学生版课件

上传人:沈*** 文档编号:241913769 上传时间:2024-08-04 格式:PPT 页数:69 大小:818.96KB
返回 下载 相关 举报
应用统计学-第八章相关与回归分析-学生版课件_第1页
第1页 / 共69页
应用统计学-第八章相关与回归分析-学生版课件_第2页
第2页 / 共69页
应用统计学-第八章相关与回归分析-学生版课件_第3页
第3页 / 共69页
点击查看更多>>
资源描述
1-1-1 1经济类管理类经济类管理类基础课程基础课程第八章第八章 相关与回归分析相关与回归分析统计学第八章第八章 相关与回归分析相关与回归分析PowerPoint统计学统计学1-1-2 2经济类管理类经济类管理类基础课程基础课程开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论分析人员发现股票价格和裙子长度相一致分析人员发现股票价格和裙子长度相一致纽约纽约时装的秋季集中展示会暗示股票的时装的秋季集中展示会暗示股票的秋季回落吗?据六大股市指示器秋季回落吗?据六大股市指示器“下摆指示下摆指示器器”所示,当裙子的下摆变短,则股票会涨所示,当裙子的下摆变短,则股票会涨起来,当裙长接近地面时,股票就会下跌。起来,当裙长接近地面时,股票就会下跌。从路上那些及踝长裙来判断,在从路上那些及踝长裙来判断,在1010月的某个月的某个时候股票会有所下跌,而此时正是这种端庄时候股票会有所下跌,而此时正是这种端庄的时装充斥大街的时候。的时装充斥大街的时候。开篇案例:道琼斯下摆理论分析人员发现股票价格和裙子长度相一致开篇案例:道琼斯下摆理论分析人员发现股票价格和裙子长度相一致1-1-3 3经济类管理类经济类管理类基础课程基础课程开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论“我不会把我所有的股市判断都立足于这种理我不会把我所有的股市判断都立足于这种理论,但这是一种有趣的相关关系。论,但这是一种有趣的相关关系。”审慎安全审慎安全公司技术分析主任拉尔夫阿坎泊拉说道。公司技术分析主任拉尔夫阿坎泊拉说道。在喧啸的二十世纪在喧啸的二十世纪2020年代,短的宽平下垂的裙年代,短的宽平下垂的裙装风行一时。装风行一时。3030年代的长式时装宣告了熊市的年代的长式时装宣告了熊市的到来。与此相似,在到来。与此相似,在6060年代,股票的上涨与超年代,股票的上涨与超短迷你裙的流行相吻合。只是在短迷你裙的流行相吻合。只是在7070年代才让位年代才让位于石油危机、通货膨胀和更加保守的裙长。甚于石油危机、通货膨胀和更加保守的裙长。甚至至“查理的天使查理的天使”也穿着长裙。也穿着长裙。开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论“我不会把我所有的股市判断都立足于这我不会把我所有的股市判断都立足于这1-1-4 4经济类管理类经济类管理类基础课程基础课程开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论那么在飞速发展的那么在飞速发展的8080年代怎么样的呢?妇女职年代怎么样的呢?妇女职业装是宽肩配以短小的裙子。在业装是宽肩配以短小的裙子。在19871987年股票狂年股票狂跌,裙摆也在不断变长。到了今天,极端疯狂跌,裙摆也在不断变长。到了今天,极端疯狂的牛市也使裙子越变越短的牛市也使裙子越变越短还要开衩。还要开衩。阿坎泊拉先生摒除了女式的时装是一种领导或阿坎泊拉先生摒除了女式的时装是一种领导或是一个指示器,说时装的下摆是随股票变化的是一个指示器,说时装的下摆是随股票变化的“因为当人们赚钱的时候就会有一些放荡,这因为当人们赚钱的时候就会有一些放荡,这是心理方面的因素。是心理方面的因素。”开篇案例:道琼斯下摆理论那么在飞速发展的开篇案例:道琼斯下摆理论那么在飞速发展的80年代怎么样的呢?年代怎么样的呢?1-1-5 5经济类管理类经济类管理类基础课程基础课程开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论当最近在美国和欧洲举行的秋季时装展示会当最近在美国和欧洲举行的秋季时装展示会上众多品牌如乔治奥上众多品牌如乔治奥阿马尼、拉尔夫阿马尼、拉尔夫劳劳伦和奥斯卡伦和奥斯卡德德拉拉兰塔以长裙、长裙装兰塔以长裙、长裙装为特色时,对股票来讲情况又变糟了。为特色时,对股票来讲情况又变糟了。新的下摆外观与华尔街上发生的某些事相似新的下摆外观与华尔街上发生的某些事相似已经被预言了。从已经被预言了。从19951995年至年至19971997年,股票有年,股票有3 3年涨幅大于年涨幅大于2020个百分点。但是类似的走势却个百分点。但是类似的走势却没有延至第四年。没有延至第四年。开篇案例:道琼斯下摆理论当最近在美国和欧洲举行的秋季时装展示开篇案例:道琼斯下摆理论当最近在美国和欧洲举行的秋季时装展示1-1-6 6经济类管理类经济类管理类基础课程基础课程开篇案例:道琼斯下摆理论开篇案例:道琼斯下摆理论理查德麦克凯博,墨里尔&林奇公司的市场分析负责人甚至预言今年的某些时候,股票价格会下降25个百分点。但是理查德麦克凯博不承认这与裙摆有任何相互关系,“我从没有把它当作股市指示器”他说道,并强调他决不是个专看女人裙子的人。开篇案例:道琼斯下摆理论理查德开篇案例:道琼斯下摆理论理查德麦克凯博,墨里尔麦克凯博,墨里尔&林奇公司的林奇公司的1-1-7 7经济类管理类经济类管理类基础课程基础课程第十章第十章 相关与回归分析相关与回归分析第一节第一节 相关分析相关分析 第二节第二节 一元线性回归分析一元线性回归分析第三节第三节 多元线性回归分析多元线性回归分析第四节第四节 可线性化的非线性回归分析可线性化的非线性回归分析第十章第十章 相关与回归分析第一节相关与回归分析第一节 相关分析相关分析 1-1-8 8经济类管理类经济类管理类基础课程基础课程学习目标学习目标1.掌握相关系数的含义、计算方法和应用掌握相关系数的含义、计算方法和应用2.掌握一元线性回归的基本原理和参数的最掌握一元线性回归的基本原理和参数的最小二乘估计方法小二乘估计方法3.掌握回归方程与回归系数的显著性检验掌握回归方程与回归系数的显著性检验4.了解多元线性回归分析和可线性化的非线了解多元线性回归分析和可线性化的非线性回归分析性回归分析5.用用 Excel 进行回归分析进行回归分析学习目标学习目标1.掌握相关系数的含义、计算方法和应用掌握相关系数的含义、计算方法和应用1-1-9 9经济类管理类经济类管理类基础课程基础课程第一节第一节 相关分析相关分析一一.变量相关的概念变量相关的概念二二.相关系数及其计算相关系数及其计算第一节第一节 相关分析一相关分析一.变量相关的概念变量相关的概念1-1-1010经济类管理类经济类管理类基础课程基础课程变量相关的概念变量相关的概念变量相关的概念变量相关的概念1-1-1111经济类管理类经济类管理类基础课程基础课程小调查小调查1.我的工作量,我的月收入2.你的月收入,你的月支出小调查我的工作量,我的月收入小调查我的工作量,我的月收入1-1-1212经济类管理类经济类管理类基础课程基础课程变量间的关系变量间的关系(函数关系)(函数关系)1.是一一对应的确定关系是一一对应的确定关系2.设设有有两两个个变变量量 x x 和和 y y,变变量量 y y 随随变变量量 x x 一一起起变变化化,并并完完全全依依赖赖于于 x x ,当当变变量量 x x 取取某某个个数数值值时时,y y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y =f f(x x),其其中中 x x 称为自变量,称为自变量,y y 称为因变量称为因变量3.各观测点落在一条线上各观测点落在一条线上 x xy y变量间的关系变量间的关系(函数关系)是一一对应的确定关系(函数关系)是一一对应的确定关系1-1-1313经济类管理类经济类管理类基础课程基础课程变量间的关系变量间的关系(函数关系)(函数关系)函数关系的例子某某种种商商品品的的销销售售额额(y y)与与销销售售量量(x x)之之间间的的关关系可表示为系可表示为 y y=p p x x(p p 为单价为单价)圆圆的的面面积积(S)(S)与与半半径径之之间间的的关关系系可可表表示示为为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额(y y)与与产产量量(x x1 1)、单单位位产产量量消消耗耗(x x2 2)、原原材材料料价价格格(x x3 3)之之间间的的关关系系可可表示为表示为y y=x x1 1 x x2 2 x x3 3 变量间的关系变量间的关系(函数关系)(函数关系)函数关系的例子函数关系的例子1-1-1414经济类管理类经济类管理类基础课程基础课程变量间的关系变量间的关系(相关关系)(相关关系)1.变变量量间间关关系系不不能能用用函函数数关关系精确表达系精确表达2.一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定一个变量唯一确定3.当当变变量量 x x 取取某某个个值值时时,变变量量 y y 的取值可能有几个的取值可能有几个4.各各观观测测点点分分布布在在一一条条线线周周围围 x xy y变量间的关系变量间的关系(相关关系)变量间关系不能用函数关系精确表达(相关关系)变量间关系不能用函数关系精确表达1-1-1515经济类管理类经济类管理类基础课程基础课程变量间的关系变量间的关系(相关关系)(相关关系)相关关系的例子商品的消费量商品的消费量(y y)与居民收入与居民收入(x x)之间的关系之间的关系商品销售额商品销售额(y y)与广告费支出与广告费支出(x x)之间的关系之间的关系收入水平收入水平(y y)与受教育程度与受教育程度(x x)之间的关系之间的关系父亲身高父亲身高(y y)与子女身高与子女身高(x x)之间的关系之间的关系变量间的关系变量间的关系(相关关系)(相关关系)相关关系的例子相关关系的例子1-1-1616经济类管理类经济类管理类基础课程基础课程相关关系的例子相关关系的例子中国移动通信市场的竞争中国移动通信市场的竞争今年以来,有两个迹象表明中国移动通信行业竞今年以来,有两个迹象表明中国移动通信行业竞争加剧。一是市场竞争从对增量用户的竞争争加剧。一是市场竞争从对增量用户的竞争转向对存量用户的争夺。转向对存量用户的争夺。20012001年,移动和联年,移动和联通每月净增用户的走势表现出相当强的趋同通每月净增用户的走势表现出相当强的趋同性,基本上是随着季节因素同上同下。但从性,基本上是随着季节因素同上同下。但从今年前九个月的数据来看,两家运营商每月今年前九个月的数据来看,两家运营商每月净增用户的升降表现出很强的负相关性,这净增用户的升降表现出很强的负相关性,这表明总增量用户的增长放缓,移动和联通对表明总增量用户的增长放缓,移动和联通对存量用户的竞争加剧。据不完全统计,存量用户的竞争加剧。据不完全统计,CDMACDMA新增用户中,有新增用户中,有50%-60%50%-60%是中国移动的是中国移动的“全全球通球通”用户。二是手机补贴方式大规模推出。用户。二是手机补贴方式大规模推出。相关关系的例子相关关系的例子中国移动通信市场的竞争今年以来,有两个迹中国移动通信市场的竞争今年以来,有两个迹1-1-1717经济类管理类经济类管理类基础课程基础课程相关关系的类型相关关系的类型相关关系相关关系非线性相关非线性相关线性相关线性相关正正相相关关正正相相关关负负相相关关负负相相关关完全相关完全相关不相关不相关相关关系的类型相关关系非线性相关线性相关正相关正相关负相关负相关关系的类型相关关系非线性相关线性相关正相关正相关负相关负1-1-1818经济类管理类经济类管理类基础课程基础课程相关关系的图示相关关系的图示(相关分析的图示法)(相关分析的图示法)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关相关关系的图示相关关系的图示(相关分析的图示法)(相关分析的图示法)1-1-1919经济类管理类经济类管理类基础课程基础课程相关系数及其计算相关系数及其计算相关系数及其计算相关系数及其计算1-1-2020经济类管理类经济类管理类基础课程基础课程相关关系的测度相关关系的测度(相关系数)(相关系数)1.对变量之间关系密切程度的度量2.对两个变量之间线性相关程度的度量称为简单相关系数3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,记为 r相关关系的测度相关关系的测度(相关系数)对变量之间关系密切程度的度量(相关系数)对变量之间关系密切程度的度量1-1-2121经济类管理类经济类管理类基础课程基础课程相关关系的测度相关关系的测度(相关系数)(相关系数)样本相关系数的计算公式或表示为:相关关系的测度相关关系的测度(相关系数)(相关系数)样本相关系数的计算公式或表示样本相关系数的计算公式或表示1-1-2222经济类管理类经济类管理类基础课程基础课程相关关系的测度相关关系的测度(相关系数取值及其意义)(相关系数取值及其意义)1.r r 的取值范围是的取值范围是 -1,1-1,12.|r r|=1|=1,为完全相关为完全相关n nr r=1=1,为完全正相关,为完全正相关n nr r=-1=-1,为完全负正相关,为完全负正相关3.r r=0=0,不存在不存在线性线性相关相关关系相关关系相关4.-1-1 r r00,为负相关为负相关5.0 0 t t,拒绝,拒绝H H0 0 若若 t t =11.3t t(31-2)=2.045(31-2)=2.045,拒绝,拒绝H H0 0,邮政业务收邮政业务收入和社会消费品零售总额之间入和社会消费品零售总额之间的相关关系显著的相关关系显著相关系数的显著性检验相关系数的显著性检验(实例)(实例)对前例计算的相关系数进行对前例计算的相关系数进行1-1-2828经济类管理类经济类管理类基础课程基础课程第二节第二节 一元线性回归一元线性回归一一.一元线性回归模型一元线性回归模型二二.参数的最小二乘估计参数的最小二乘估计三三.回归方程的显著性检验回归方程的显著性检验第二节第二节 一元线性回归一一元线性回归一.一元线性回归模型一元线性回归模型1-1-2929经济类管理类经济类管理类基础课程基础课程什么是回归分析什么是回归分析?(内容)(内容)(内容)(内容)1.从一组样本数据出发,确定变量之间的数学关系式2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度什么是回归分析什么是回归分析?(内容)从一组样本数据出发,确定变量之间的(内容)从一组样本数据出发,确定变量之间的1-1-3030经济类管理类经济类管理类基础课程基础课程趋向中间高度的回归回归这个术语是由英国著名统计学家回归这个术语是由英国著名统计学家Francis GaltonFrancis Galton在在1919世纪末期研究孩子及他们的父母的身高时提世纪末期研究孩子及他们的父母的身高时提出来的。出来的。GaltonGalton发现身材高的父母,他们的孩子发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。母的平均身高高。GaltonGalton把这种孩子的身高向中把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析。的研究两个数值变量的方法称为回归分析。趋向中间高度的回归回归这个术语是由英国著名统计学家趋向中间高度的回归回归这个术语是由英国著名统计学家Franc1-1-3131经济类管理类经济类管理类基础课程基础课程回归分析回归分析回归分析回归分析(Regression Analysis)(Regression Analysis)与与与与相关分析相关分析相关分析相关分析(Correlation Analysis)(Correlation Analysis)的区别的区别的区别的区别1.相相关关分分析析中中,变变量量 x x 变变量量 y y 处处于于平平等等的的地地位位;回回归归分分析析中中,变变量量 y y 称称为为因因变变量量,处处在在被被解解释释的的地地位,位,x x 称为自变量,用于预测因变量的变化称为自变量,用于预测因变量的变化2.相相关关分分析析中中所所涉涉及及的的变变量量 x x 和和 y y 都都是是随随机机变变量量;回回归归分分析析中中,因因变变量量 y y 是是随随机机变变量量,自自变变量量 x x 可可以是随机变量,也可以是非随机的确定变量以是随机变量,也可以是非随机的确定变量3.相相关关分分析析主主要要是是描描述述两两个个变变量量之之间间线线性性关关系系的的密密切切程程度度;回回归归分分析析不不仅仅可可以以揭揭示示变变量量 x x 对对变变量量 y y 的影响大小,还可以揭示变量之间确切的关系的影响大小,还可以揭示变量之间确切的关系回归分析回归分析(Regression Analysis)与与相关分相关分1-1-3232经济类管理类经济类管理类基础课程基础课程回归模型的类型回归模型的类型一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归回归模型的类型一个自变量两个及两个以上自变量回归模型多元回归回归模型的类型一个自变量两个及两个以上自变量回归模型多元回归1-1-3333经济类管理类经济类管理类基础课程基础课程回归模型与回归方程回归模型与回归方程回归模型与回归方程回归模型与回归方程1-1-3434经济类管理类经济类管理类基础课程基础课程回归模型回归模型1.回答“变量之间是什么样的关系?”2.方程中运用n n1 1 个数量的因变量个数量的因变量(被解释变量、非独立变量被解释变量、非独立变量)l l被预测的变量被预测的变量n n1 1 个或多个数量的或分类的自变量个或多个数量的或分类的自变量 (解释变量、解释变量、独立变量独立变量)l l用于预测的变量用于预测的变量3.主要用于预测和估计回归模型回答回归模型回答“变量之间是什么样的关系?变量之间是什么样的关系?”1-1-3535经济类管理类经济类管理类基础课程基础课程一元线性回归模型一元线性回归模型(Simple Linear Regression Model)(Simple Linear Regression Model)(概念要点)(概念要点)(概念要点)(概念要点)1.当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归2.对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系3.描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型一元线性回归模型一元线性回归模型(Simple Linear Regres1-1-3636经济类管理类经济类管理类基础课程基础课程一元线性回归模型一元线性回归模型(概念要点)(概念要点)对于只涉及一个自变量的简单线性回归模型可表示为 y=0 0+1 1 x+e en n模型中,模型中,y y 是是 x x 的线性函数的线性函数(部分部分)加上误差项加上误差项n n线性部分反映了由于线性部分反映了由于 x x 的变化而引起的的变化而引起的 y y 的变化的变化n n误差项误差项 是随机变量是随机变量l l反反映映了了除除 x x 和和 y y 之之间间的的线线性性关关系系之之外外的的随随机机因因素素对对 y y 的影响的影响l l是不能由是不能由 x x 和和 y y 之间的线性关系所解释的变异性之间的线性关系所解释的变异性n n 0 0 和和 1 1 称为模型的参数称为模型的参数一元线性回归模型一元线性回归模型(概念要点)(概念要点)对于只涉及一个自变量的简对于只涉及一个自变量的简1-1-3737经济类管理类经济类管理类基础课程基础课程一元线性回归模型一元线性回归模型(基本假定)(基本假定)1.误误差差项项 是是一一个个期期望望值值为为0 0的的随随机机变变量量,即即E E()=0)=0。对对于于一一个个给给定定的的 x x 值值,y y 的的期期望望值值为为E E (y y)=)=0 0+1 1 x x2.对于所有的对于所有的 x x 值,值,的方差的方差 2 2 都相同都相同3.误误差差项项 是是一一个个服服从从正正态态分分布布的的随随机机变变量量,且且相相互独立。即互独立。即 N N(0,(0,2 2)n n独独立立性性意意味味着着对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 与其他与其他 x x 值所对应的值所对应的 不相关不相关n n对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 y y 值值与与其其他他 x x 所所对应的对应的 y y 值也不相关值也不相关一元线性回归模型一元线性回归模型(基本假定)误差项(基本假定)误差项是一个期望值为是一个期望值为0的随机的随机1-1-3838经济类管理类经济类管理类基础课程基础课程回归方程回归方程(概念要点)(概念要点)1.描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程回归方程2.简单线性回归方程的形式如下 E(y)=0+1 x方程的图示是一条直线,因此也称为直线回归方程方程的图示是一条直线,因此也称为直线回归方程 0 0是是回回归归直直线线在在 y y 轴轴上上的的截截距距,是是当当 x x=0=0 时时 y y 的的期期望值望值 1 1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表示示当当 x x 每每变变动动一个单位时,一个单位时,y y 的平均变动值的平均变动值回归方程回归方程(概念要点)描述(概念要点)描述 y 的平均值或期望值如何依赖于的平均值或期望值如何依赖于1-1-3939经济类管理类经济类管理类基础课程基础课程估计估计的的(样本样本)回归回归方程方程3.简单线性回归中估计的回归方程为简单线性回归中估计的回归方程为其其中中:是是估估计计的的回回归归直直线线在在 y y 轴轴上上的的截截距距,是是直直线线的斜率,表示的斜率,表示 x x 每变动一个单位时,每变动一个单位时,y y 的平均变动值的平均变动值 2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中的的未未知知参参数数 和和 ,就就得得到到了了估估计计的的回回归归方方程程(样样本本回回归方程)归方程)1.总总体体回回归归参参数数 和和 是是未未知知的的,必必需需利利用用样样本本数数据去估计据去估计估计的估计的(样本样本)回归方程简单线性回归中估计的回归方程为其中:回归方程简单线性回归中估计的回归方程为其中:1-1-4040经济类管理类经济类管理类基础课程基础课程回归模型与回归方程回归模型与回归方程3.估计的(样本)回归方程为估计的(样本)回归方程为4.估计的(样本)回归模型估计的(样本)回归模型2.一元线性回归方程一元线性回归方程1.一元线性回归模型一元线性回归模型y y=0 0 0 0+1 1 1 1 x x+e e e eE(y)E(y)=0 0 0 0+1 1 1 1 x xy y回归模型与回归方程估计的(样本)回归方程为一元线性回归方程一回归模型与回归方程估计的(样本)回归方程为一元线性回归方程一1-1-4141经济类管理类经济类管理类基础课程基础课程参数参数 0 和和 1 的最小二乘估计的最小二乘估计参数参数 0 和和 1 的最小二乘估计的最小二乘估计1-1-4242经济类管理类经济类管理类基础课程基础课程最小二乘法最小二乘法(概念要点)(概念要点)1.使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即2.用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小最小二乘法最小二乘法(概念要点)使因变量的观察值与估计值之间的离差(概念要点)使因变量的观察值与估计值之间的离差1-1-4343经济类管理类经济类管理类基础课程基础课程最小二乘法最小二乘法(图示)(图示)x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)最小二乘法最小二乘法(图示)(图示)xy(xn,yn)(x1,y1)1-1-4444经济类管理类经济类管理类基础课程基础课程最小二乘法最小二乘法(图示)(图示)x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i最小二乘法最小二乘法(图示)(图示)xy(xn,yn)(x1,y1)1-1-4545经济类管理类经济类管理类基础课程基础课程最小二乘法最小二乘法(和和的计算公式的计算公式)根据最小二乘法的要求,可得求解 和 的标准方程如下最小二乘法最小二乘法(和和 的计算公式)的计算公式)根据最小二根据最小二1-1-4646经济类管理类经济类管理类基础课程基础课程估计方程的求法估计方程的求法(实例)(实例)【例例】根据数据,利用最小二乘法建立邮政业务收入对社会消费品零售总额的回归方程估计方程的求法估计方程的求法(实例)(实例)【例】根据数据,利用最小【例】根据数据,利用最小1-1-4747经济类管理类经济类管理类基础课程基础课程估计方程的求法估计方程的求法(实例)(实例)邮政业务收入对社会消费品零售总额的回归方程为:邮政业务收入对社会消费品零售总额的回归方程为:结论:结论:随着社会消费品零售总额的增加随着社会消费品零售总额的增加,邮政业务收入也增加邮政业务收入也增加,在不在不考虑其他因素情况下考虑其他因素情况下,社会消费品零售总额每增加社会消费品零售总额每增加1亿元亿元,邮邮政业务收入平均增加政业务收入平均增加93.50万元万元 估计方程的求法估计方程的求法(实例)邮政业务收入对社会消费品零售总额的回(实例)邮政业务收入对社会消费品零售总额的回1-1-4848经济类管理类经济类管理类基础课程基础课程估计估计(经验经验)方程方程估计估计(经验经验)方程方程1-1-4949经济类管理类经济类管理类基础课程基础课程估计方程的求法估计方程的求法(Excel的输出结果)的输出结果)估计方程的求法估计方程的求法(Excel的输出结果)的输出结果)1-1-5050经济类管理类经济类管理类基础课程基础课程回归方程的显著性检验回归方程的显著性检验回归方程的显著性检验回归方程的显著性检验1-1-5151经济类管理类经济类管理类基础课程基础课程离差平方和的分解离差平方和的分解1.因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面n n由于自变量由于自变量 x x 的取值不同造成的的取值不同造成的n n除除 x x 以以外外的的其其他他因因素素(如如x x对对y y的的非非线线性性影影响响、测量误差等测量误差等)的影响的影响2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示离差平方和的分解因变量离差平方和的分解因变量 y 的取值是不同的,的取值是不同的,y 取值的这种波取值的这种波1-1-5252经济类管理类经济类管理类基础课程基础课程离差平方和的分解离差平方和的分解(图示)(图示)x xy yy y 离差分解图离差分解图离差平方和的分解离差平方和的分解(图示)(图示)xyy离差分解图离差分解图1-1-5353经济类管理类经济类管理类基础课程基础课程离差平方和的分解离差平方和的分解(三个平方和的关系)(三个平方和的关系)2.两端平方后求和有1.从图上看有SST=SSR+SSE总变差平方和总变差平方和(SSTSST)回归平方和回归平方和(SSRSSR)残差平方和残差平方和(SSESSE)离差平方和的分解离差平方和的分解(三个平方和的关系)(三个平方和的关系)2.两端平方两端平方1-1-5454经济类管理类经济类管理类基础课程基础课程离差平方和的分解离差平方和的分解(三个平方和的意义)(三个平方和的意义)1.总离差平方和总离差平方和(SST)n n反映因变量的反映因变量的 n n 个观察值与其均值的总离差个观察值与其均值的总离差2.回归离差平方和回归离差平方和(SSR)n n反反映映自自变变量量 x x 的的变变化化对对因因变变量量 y y 取取值值变变化化的的影影响响,或或者者说说,是是由由于于 x x 与与 y y 之之间间的的线线性性关关系系引引起的起的 y y 的取值变化,也称为可解释的平方和的取值变化,也称为可解释的平方和3.剩余离差(残差)平方和剩余离差(残差)平方和(SSE)n n反反映映除除 x x 以以外外的的其其他他因因素素对对 y y 取取值值的的影影响响,也也称为不可解释的平方和或剩余平方和称为不可解释的平方和或剩余平方和离差平方和的分解离差平方和的分解(三个平方和的意义)总离差平方和(三个平方和的意义)总离差平方和(SST1-1-5555经济类管理类经济类管理类基础课程基础课程样本决定系数(可决系数)样本决定系数(可决系数)(判定系数(判定系数 r2)1.回归平方和占总离差平方和的比例2.反映回归直线的拟合程度3.取值范围在 0,1 之间4.r2 1,说明回归方程拟合的越好;r20,说明回归方程拟合的越差5.判定系数等于相关系数的平方,即r2(r)2样本决定系数(可决系数)样本决定系数(可决系数)(判定系数(判定系数 r2)回归平方和占)回归平方和占1-1-5656经济类管理类经济类管理类基础课程基础课程样本决定系数(可决系数)样本决定系数(可决系数)(举例判定系数(举例判定系数 r2)【例】求邮政业务收入对社会消费品零售总额回归的可决系数。可决系数为0.8148,也可以说邮政业务收入的总离差中归因于其与社会消费品零售总额之间直线关系的比例为81.48%样本决定系数(可决系数)样本决定系数(可决系数)(举例判定系数(举例判定系数 r2)【例】)【例】1-1-5757经济类管理类经济类管理类基础课程基础课程回归方程的显著性检验回归方程的显著性检验(线性关系的检验线性关系的检验)1.检验自变量和因变量之间的线性关系是否显著2.具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著 如果是显著的,两个变量之间存在线性关系如果是显著的,两个变量之间存在线性关系 如果不显著,两个变量之间不存在线性关系如果不显著,两个变量之间不存在线性关系回归方程的显著性检验回归方程的显著性检验(线性关系的检验(线性关系的检验)检验自变量和因变)检验自变量和因变1-1-5858经济类管理类经济类管理类基础课程基础课程回归方程的显著性检验回归方程的显著性检验(检验检验的步骤)的步骤)1.提出假设n nH H0 0:线性关系不显著:线性关系不显著2.计算检验统计量F3.确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 4.作出决策:若FF,拒绝H0;若F t t,拒绝,拒绝H H0 0;t t =11.296t t=2.045=2.045,拒拒绝绝H H0 0,表表明明邮邮政政业业务务收收入入和和社会消费品零售总额社会消费品零售总额之间有显著线性关系之间有显著线性关系对前例的回归系数进行显著性检验(0.05)回归系数的显著性检验回归系数的显著性检验(实例)提出假设(实例)提出假设 t=11.2961-1-6767经济类管理类经济类管理类基础课程基础课程回归系数的显著性检验回归系数的显著性检验(Excel输出的结果)输出的结果)回归系数的显著性检验回归系数的显著性检验(Excel输出的结果)输出的结果)1-1-6868经济类管理类经济类管理类基础课程基础课程本章小结本章小结1.相关系数与相关分析相关系数与相关分析2.一一元元线线性性回回归归模模型型、回回归归方方程程与与估估计计的的(样本)回归方程、样本回归模型(样本)回归方程、样本回归模型3.回归方程与回归系数的显著性检验回归方程与回归系数的显著性检验4.用用Excel 进行回归分析进行回归分析本章小结相关系数与相关分析本章小结相关系数与相关分析1-1-6969经济类管理类经济类管理类基础课程基础课程结结 束束结结 束束
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!