第九章相关与回归课件

上传人:91274****mpsvz 文档编号:252924658 上传时间:2024-11-24 格式:PPT 页数:61 大小:590.23KB
返回 下载 相关 举报
第九章相关与回归课件_第1页
第1页 / 共61页
第九章相关与回归课件_第2页
第2页 / 共61页
第九章相关与回归课件_第3页
第3页 / 共61页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第九章 线性回归,第九章 线性回归,1,已知高考成绩与大一成绩相关,并能用高考成绩预测大一成绩.现有11人的高考数学成绩与大学高数成绩,请根据以下数据预测高考成绩为110分的学生,高数成绩95%的可能会为多少?,1,2,3,4,5,6,7,8,9,10,11,X,130,95,104,120,98,110,130,120,100,125,95,Y,95,86,82,90,74,86,96,88,76,92,70,?,已知高考成绩与大一成绩相关,并能用高考成绩预测大一成绩,2,主要内容,第一节:线性回归模型的建立方法,第二节:回归模型的检验与估计,第三节:回归方程的应用,主要内容第一节:线性回归模型的建立方法,3,线性回归模型的建立方法,线性回归模型的建立方法,4,一、回归分析的概念,是根据一个已知变量来预测另一个变量平均值的统计方法。,是在相关分析的基础上,将变量之间的具体变动关系模型化,求出关系方程式的方法.,一、回归分析的概念是根据一个已知变量来预测另一个变量平均值的,5,回归分析的种类,一元回归,(简单回归),多元回归,(,复回归,),线性回归,非线性回归,一 元线性回归,Simple Linear regression,按自变量的 个数,按回归曲线的形态,回归分析的种类一元回归(简单回归)多元回归(复回归)线性回归,6,二、相关分析与回归分析,联系:,理论和方法一致,,确定变量之间是否存在关系是两者的共同起点。,大小方向一致:,无相关就无回归,相关程度越高,回归越好;相关系数和回归系数方向一致,可以互相推算。,相关分析是回归分析的基础和前提。回归分析是相关分析的深入和继续.,二、相关分析与回归分析联系:,7,区别,方向不同,:,回归有自变量和因变量的区分,相关无因变量和自变量的区分。,大小变化,不同:,相关分析只能计算出变量间的相关系数,改变x和y 的地位不影响相关系数的数值;回归分析则不同,可以根据研究目的不同分别建立两个不同的回归方程。,区别方向不同:回归有自变量和因变量的区分,相关无因变量和自变,8,变量要求不同,:,相关分析中x、y均为随机变量,回归分析中y为随机变量,x可以是随机变量也可以不是随机变量,一般假定为非随机变量,。,作用不同,:,相关分析测定相关程度和方向,回归分析进行预测和控制。,变量要求不同:相关分析中x、y均为随机变量,回归分析中y为随,9,三、回归模型、回归方程与回归系数,回归模型,:用来近似地表达变量间平均变化关系的数学模型,。,回归方程:,描述两变量函数关系的方程,三、回归模型、回归方程与回归系数回归模型:用来近似地表达变量,10,一元线性回归方程的几何意义,截距,斜率,截距a,表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;,回归系数b,表明自变量x每变动一个单位,因变量y平均变动b个单位。,一元线性回归方程的几何意义截距斜率截距a 表示在没有自变量x,11,回归系数,y 对x的回归系数,x对y的回归系数,回归系数y 对x的回归系数x对y的回归系数,12,一元线性回归方程的可能形态,b,为正,b,为负,b,为0,一元线性回归方程的可能形态b为正b为负b为0,13,四、回归模型建立方法,根据已知两变量的数据求回归方程,如果两变量之间存在直线关系,则两变量可以拟合直线模型。,四、回归模型建立方法根据已知两变量的数据求回归方程,如果两变,14,回归模型的建立步骤,将a与b值代入方程式,得到回归方程。,根据资料作散点图,直观判断有无线性关系,设直线方程式为,计算a与b值,回归模型的建立步骤 将a与b值代入方程式,得到回归方程。根据,15,计算a与b值的方法,平均数法、最小二乘法、极大似然估计法。但平均数法只用于粗略估计两变量之间的简单线性关系,而极大似然估计要求正态分布,而最小二乘法对分布没有要求。,计算a与b值的方法 平均数法、最小二乘法、极大似然估计法。但,16,最小二乘法,使因变量的观察值与估计值之间的离差平方和达到最小来求得a值和b值的方法,用最小二乘法拟合的直线来代表,x,与,y,之间的关系与实际数据的误差比其他任何直线都小。,它的原理是使用误差平方和最小,。,最小二乘法使因变量的观察值与估计值之间的离差平方和达到最小,17,x,y,(,x,n,y,n,),(,x,1,y,1,),(,x,2,y,2,),(,x,i,y,i,),e,i,=,y,i,-,y,i,最小二乘法,(图示),xy(xn , yn)(x1 , y1)(,18,基本数学要求:,基本数学要求:,19,整理后,有:,整理后,有:,20,原始数据,原始数据,21,【例1】,下表中10对数据是为确定其心理量与物理量之间的关系而作的实验结果。假设两者呈线性关系,试以这10对数据建立该心理量与物理量的回归方程。,被试,1,2,3,4,5,6,7,8,9,10,心理(Y),1,2,3,3,4,5,6,7,8,9,物理(X),0,2,1,5,4,2,6,2,5,7,解:设,【例1】下表中10对数据是为确定其心理量与物理量之间的关系而,22,回归方程为:,答:所求的回归方程为,回归方程为:答:所求的回归方程为,23,回归与相关的关系,?,回归与相关的关系?,24,课堂练习,请根据例一的数据,用相关法建立回归方程,课堂练习请根据例一的数据,用相关法建立回归方程,25,五、线性回归的基本假设,线性关系假设,:图示法。,正态性假设,:与某一X值对应的一组Y值构成变量Y的一个子总体,所有子总体都服从正态分布,各子总体方差均相等。经由回归方程所分离的误差项e也呈正态分布,其平均数为0,。,五、线性回归的基本假设 线性关系假设:图示法。正态性假设:,26,一元线性回归模型的假定,一元线性回归模型的假定,27,独立性假设,。,某一X值对应的一组Y值和另一个X值对应的一组Y值之间没有关系,彼此独立。其二是误差项独立,即不同的X所产生的误差之间应相互独立,误差项也与自变量X相互独立。,误差等分散性假设,。,特定X水平的误差,除了应呈随机化的常态分布,其变异量也应相等,称为误差等分散性。,独立性假设。某一X值对应的一组Y值和另一个X值对应的一组Y值,28,第二节:线性回归模型的检验与估计,第二节:线性回归模型的检验与估计,29,一、回归模型的有效性检验,二、回归系数的有效性检验,一、回归模型的有效性检验,30,回归模型的有效性检验就是对求得的回归方程进行显著性检验,看是否真实地反映了变量间线性关系。,回归方程的总体检验判定通常使用方差分析的思想与方法。,回归模型的有效性检验就是对求得的回归方程进行显著性检验,看,31,回归方程的总体检验,误差平方和,回归平方和,总平方和,回归方程的总体检验误差平方和回归平方和总平方和,32,平方和与自由度的分解,平方和与自由度的分解,33,回归方程方差分析表,变异来源,自由度,平方和,均方,F,回归,1,残差,N-2,总计,N-1,回归方程方差分析表变异来源自由度平方和均方F回归1残差N-2,34,【2】对例1数据所建立的回归方程进行检验,【2】对例1数据所建立的回归方程进行检验,35,第九章相关与回归课件,36,变异来源,自由度,平方和,均方,F,回归,1,31.755,31.755,6.63,*,残差,8,38.345,4.793,总计,9,70.1,表,2,方差分析表,答:所建立的回归方程显著,或者说X与Y变量之间有显著的线性关系。,变异来源自由度平方和均方F回归131.75531.7556.,37,二、回归系数的有效性检验,的抽样分布,二、回归系数的有效性检验 的抽样分布,38,(二)回归系数的标准误,(二)回归系数的标准误,39,【例3】,对例一建立的回归方程的回归系数进行显著性检验。,解:,答:回归系数0.81是显著的,因而回归方程显著。,【例3】对例一建立的回归方程的回归系数进行显著性检验。解:答,40,三、测定系数,测定系数,是指回归平方和在总平方和中所占比例,也就是Y变量能用另一个变量来解释的部分,。,三、测定系数测定系数是指回归平方和在总平方和中所占比例,也就,41,测定系数意义,回归平方和占总离差平方和的比例,反映回归直线的拟合程度,取值范围在 0 , 1 之间,,说明回归方程拟合得越好;,,说明回归方程拟合得越差,判定系数等于相关系数的平方,即,测定系数意义回归平方和占总离差平方和的比例,42,(二)测定系数与相关系数的区别,判定系数无方向性,相关系数则有方向,其方向与样本回归系数 b 相同;,判定系数说明变量值的总离差平方和中可以用回归方程解释的比例,相关系数只说明两变量间关联程度及方向;,相关系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值,。,(二)测定系数与相关系数的区别判定系数无方向性,相关系数则有,43,第三节:回归方程的应用,一、预测的意义,预测是将已知变量值作为自变量代入相应的回归方程而推算出另一个变量的估计值及置信区间统计方法。,第三节:回归方程的应用一、预测的意义,44,点估计,将X值代入回归方程,直接计算得到的值作为Y变量的点预测值。,点估计将X值代入回归方程,直接计算得到的值作为Y变量的点预测,45,【例4】:,下表是20名工作人员的智商和某一次技术考试成绩,根据这个结果求出考试成绩对智商的回归方程。如果有一个为工作人员的智商为120,请估计若他参加考试,将会得多少分?可能在什么区间?(数据见书379),【例4】:下表是20名工作人员的智商和某一次技术考试成绩,,46,,,,,设,,设,47,代入回归方程,则,将,答:如果智商为120的技术人员参加此次考试,将得80.5分。,代入回归方程,则将答:如果智商为120的技术人员参加此次考试,48,区间估计,区间估计,49,1)预测的标准误,1,1)预测的标准误1,50,2)预测的置信区间,2)预测的置信区间,51,【例5】请计算例4的置信区间,答:如果智商为120的技术人员参加此次考试,得分有95%的可能在92.142468.8576之间。,【例5】请计算例4的置信区间答:如果智商为120的技术人员参,52,三、回归分析过程,绘制散点图、判断有无线性关系,建立回归方程,回归方程显著性检验、测定系数,计算回归分析标准误,预测,三、回归分析过程 绘制散点图、判断有无线性关系,53,四、回归分析要注意的问题,是一种分析因果关系的方法,但不是用回归的方法计算的就是因果关系。要分析一个事物的因果关系只能借助实验设计。,一种回归模型只有在当初抽取样本的同一范围内应用才有效,如果范围变了,则应当另建回归模型。,若变量之间不存在相关关系,不要刻意去寻求两变量间的某种关系,这样毫无意义。,四、回归分析要注意的问题是一种分析因果关系的方法,但不是用回,54,课堂练习,从某班随机抽取10名学生,测量其智力水平与数学成就测验的成绩,现有一名学生智商分数为120的学生没有参加成就测验,请根据智商预测其成就测验的分数可能为多少?,被试,1,2,3,4,5,6,7,8,9,10,智商X,95,104,120,98,110,130,120,100,125,95,成绩Y,75,82,90,74,86,96,88,76,92,70,课堂练习 从某班随机抽取10名学生,测量其智力水平与数学成就,55,1、假设有线性关系,2、建立回归方程,设,1、假设有线性关系设,56,回归方程:,回归方程:,57,3)回归方程显著性检验,3)回归方程显著性检验,58,第九章相关与回归课件,59,4)预测,答:智商为120的学生参加成就测验的得分有95%的可能在85.4593.73之间。,智商为140的呢?,4)预测答:智商为120的学生参加成就测验的得分有95%的可,60,本章重点,名词解释:判定系数、回归系数,回归与相关的联系与区别、判定系数与相关系数的区别,回归模型的建立与检验,本章重点名词解释:判定系数、回归系数,61,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!