简单线性回归--课件

上传人:沈*** 文档编号:241713998 上传时间:2024-07-17 格式:PPT 页数:45 大小:773KB
返回 下载 相关 举报
简单线性回归--课件_第1页
第1页 / 共45页
简单线性回归--课件_第2页
第2页 / 共45页
简单线性回归--课件_第3页
第3页 / 共45页
点击查看更多>>
资源描述
简简 单单 线线 性性 回回 归归统计中心教研室统计中心教研室统计中心教研室统计中心教研室1PPT课件壹壹贰贰叁叁肆肆伍伍线线 性性 回回 归归线性回归的应用线性回归的应用残残 差差 分分 析析非线性回归非线性回归SASSAS实际操作实际操作2PPT课件 回归回归 是设法找出变量是设法找出变量之间在数量上的依存变化关系,之间在数量上的依存变化关系,用函数表达式表达出来,这个用函数表达式表达出来,这个表达式称之为表达式称之为 回归方程回归方程。3PPT课件 当两个变量之间存在准确、严格的直线关系时,当两个变量之间存在准确、严格的直线关系时,可以用可以用Y=a+bXY=a+bX表示两者之间的函数关系。表示两者之间的函数关系。其中我们把被估计或被预测的变量称之为其中我们把被估计或被预测的变量称之为因变量因变量或或反应变量反应变量常用常用Y Y(dependent variabledependent variable)表示,表示,Y Y所依所依存的变量称之为存的变量称之为自变量自变量(independent variableindependent variable),或,或称称解释变量解释变量(explanatory variableexplanatory variable)或或预测因子预测因子(predictorpredictor),常用,常用X X表示。表示。但是实际生活中,受其他因素干扰,许多双变量但是实际生活中,受其他因素干扰,许多双变量之间并不是严格的函数关系,不能用函数准确表示,之间并不是严格的函数关系,不能用函数准确表示,这时我们称这种关系为这时我们称这种关系为回归关系回归关系,用直线方程式表,用直线方程式表示的这种关系叫做示的这种关系叫做回归直线回归直线或或线性回归线性回归。4PPT课件线性回归方程:线性回归方程:a a :截距截距(intercept)(intercept),直线与,直线与Y Y轴交点的纵坐标。轴交点的纵坐标。X=0X=0时,时,Y Y的估计值;的估计值;a a的单位与的单位与Y Y相同;相同;X X有可能为零,有可能为零,a a才有实际意义。才有实际意义。b b :斜率斜率(slope)(slope),回归系数,回归系数(regression coefficient)(regression coefficient)。意义:意义:X X每改变一个单位,每改变一个单位,Y Y平均改变平均改变b b个单位。个单位。b0 b0,Y Y随随X X的增大而增大(减少而减少)的增大而增大(减少而减少)斜上;斜上;b0 b0,Y Y随随X X的增大而减小(减少而增加)的增大而减小(减少而增加)斜下;斜下;b=0 b=0,Y Y与与X X无直线关系无直线关系 水平。水平。b b越大,表示越大,表示Y Y随随X X变化越快,直线越陡峭。变化越快,直线越陡峭。5PPT课件 回归参数的计算原理:回归参数的计算原理:最小二乘法则,既保证各个实最小二乘法则,既保证各个实测点到回归直线的纵向距离的平方和最小,并使计算出测点到回归直线的纵向距离的平方和最小,并使计算出回归方程最能代表实测数据所反映出的直线趋势。回归方程最能代表实测数据所反映出的直线趋势。(220页页)因为直线一定经过因为直线一定经过“均数均数”点点6PPT课件线性回归模型的适用条件:线性回归模型的适用条件:(L I N E)(L I N E)1 1、因变量因变量Y Y与自变量与自变量X X呈线性关系呈线性关系;2 2、每个个体观察值之间相互独立每个个体观察值之间相互独立;3 3、在一定范围内,任意给定在一定范围内,任意给定X X值,其对应的随机变值,其对应的随机变 量量Y Y均服从正态分布均服从正态分布;4 4、在一定范围内,不同的在一定范围内,不同的X X值所对应的随机变量值所对应的随机变量Y Y 的方差相等。的方差相等。注意:回归直线的适用范围一般以样本数据中的自变量注意:回归直线的适用范围一般以样本数据中的自变量 取值范围为限,若无充分理由证明超过自变量的取值范围为限,若无充分理由证明超过自变量的 取值范围还是直线,应该避免外延(既不要超过取值范围还是直线,应该避免外延(既不要超过 样本数据的自变量取值范围计算值)。样本数据的自变量取值范围计算值)。7PPT课件总体回归系数总体回归系数的统计推断:的统计推断:b0b0原因:原因:由于抽样误差引起,总体回归系数由于抽样误差引起,总体回归系数=0=0 存在回归关系,总体回归系数存在回归关系,总体回归系数 0 0(一)(一)t t 检验检验公式公式 ,n2Sb为回归系数的标准误为回归系数的标准误8PPT课件(二)回归方差分析(二)回归方差分析基本原理见下图基本原理见下图,任意点任意点p(X,Y)p(X,Y)到水平线到水平线Y=Y=的距离的距离Y-Y-可分成两段:可分成两段:第一段长度为(第一段长度为(Y-Y-),是),是p p点到回归直线的纵向距离点到回归直线的纵向距离,即前述的实测值,即前述的实测值Y Y与其估计值与其估计值 之差,称之为残差。之差,称之为残差。第二段长度为(第二段长度为(-),是估计值),是估计值 与均数与均数 之差。之差。它的大小与回归系数它的大小与回归系数b b有关,有关,l b ll b l越大,越大,-越大;反之越大;反之亦然。亦然。9PPT课件X X10PPT课件11PPT课件利用方差分析的基本原理,我们建立利用方差分析的基本原理,我们建立H H0 0:=0=0,H H1 1:00的假设,并构造检验统计量为的假设,并构造检验统计量为F F为:为:12PPT课件13PPT课件14PPT课件15PPT课件统计量F服从自由度为 的F分布。16PPT课件17PPT课件例例11-1 11-1 在某地一项膳食调查中,调查对象为在某地一项膳食调查中,调查对象为1414名名40-40-6060岁的中年健康妇女,测得每人的基础代谢(岁的中年健康妇女,测得每人的基础代谢(kj/dkj/d)与体重(与体重(kgkg)的数据,见表)的数据,见表10-1.10-1.据此数据如何判断据此数据如何判断这两变量间有无关联?(这两变量间有无关联?(194194页)页)18PPT课件一、曲线直线化一、曲线直线化1.1.绘制原始数据绘制原始数据X X与与Y Y的散点图,观察散点分布形态类似的散点图,观察散点分布形态类似于何种常用函数类型于何种常用函数类型;2.2.按照所选定的函数进行相应适宜的变量变换,得到按照所选定的函数进行相应适宜的变量变换,得到 Y Y和和X;X;3.3.绘制变换后数据绘制变换后数据XX与与YY的散点图,观察散点分布形态的散点图,观察散点分布形态是否呈线性趋势,从而确定曲线类型,否则重复是否呈线性趋势,从而确定曲线类型,否则重复1 1、2 2步步直至满足散点分布呈线性趋势直至满足散点分布呈线性趋势;4.4.作作YY关于关于XX的线性回归方程并进行假设检验的线性回归方程并进行假设检验;5.5.根据第根据第2 2步的变量变换式进行反变换,得到原始数据步的变量变换式进行反变换,得到原始数据X X与与Y Y的曲线方程。的曲线方程。19PPT课件例例11-6 11-6 某研究者用免疫球蛋白某研究者用免疫球蛋白A A(IgAIgA,ug/mlug/ml)的不)的不同浓度做火箭电泳,测得电泳高度(同浓度做火箭电泳,测得电泳高度(mmmm)如表)如表11-411-4所所示。试用合适的回归模型描述火箭电泳高度随示。试用合适的回归模型描述火箭电泳高度随IgAIgA变化变化的规律。(的规律。(229229页)页)20PPT课件注意:注意:当涉及对因变量当涉及对因变量Y实施非线性变换时,因为最小实施非线性变换时,因为最小二乘原则只保证变换后的二乘原则只保证变换后的Y的残差平方和最小,并不能的残差平方和最小,并不能保证原变量保证原变量Y的残差平方和也最小,所以在这种情况下,的残差平方和也最小,所以在这种情况下,建议使用统计软件来完成非线性拟合。建议使用统计软件来完成非线性拟合。二、非线性回归二、非线性回归 当不能通过变量变换的方法使曲线直线化或直接进当不能通过变量变换的方法使曲线直线化或直接进行曲线拟合时,需利用非线性最小二乘估计的原则,采行曲线拟合时,需利用非线性最小二乘估计的原则,采用迭代计算获得非线性回归模型方程。用迭代计算获得非线性回归模型方程。21PPT课件六、残差分析六、残差分析残差分析残差分析旨在通过残差分布深入了解资料是否符合旨在通过残差分布深入了解资料是否符合回归模型假设(如正态性、等方差),尤其在识别回归模型假设(如正态性、等方差),尤其在识别离群点方面,有着重要的意义。离群点方面,有着重要的意义。残差就是观测值残差就是观测值Y Y与回归估计值与回归估计值YY之差:之差:e=Y-e=Y-202-33。离群点离群点。22PPT课件实验实验11-3 11-3 离群点对回归结果的影响离群点对回归结果的影响 变量变量X X和和Y Y具有线性具有线性回归关系,观察某一数据点改变对回归关系的影响回归关系,观察某一数据点改变对回归关系的影响23PPT课件六、线性回归的应用六、线性回归的应用一、统计预测一、统计预测所谓预测就是将预报因子或自变量所谓预测就是将预报因子或自变量X X代入回归方程对预代入回归方程对预报量或因变量报量或因变量Y Y进行估计。进行估计。、Y Y的总体均数的置信区间的总体均数的置信区间、个体个体Y Y值得预测区间值得预测区间(1-1-)置信带的意义是:)置信带的意义是:在满足线性回归的假设条在满足线性回归的假设条件下,可以认为真实的回归直线落在两条弧形曲线所件下,可以认为真实的回归直线落在两条弧形曲线所形成区带内,其置信度为形成区带内,其置信度为1-1-。在相同置信度下,个体值预测带的曲线要比回归线置在相同置信度下,个体值预测带的曲线要比回归线置信带的曲线离回归直线更远。信带的曲线离回归直线更远。二、统计控制二、统计控制利用回归方程进行逆估计,即若要求因变量利用回归方程进行逆估计,即若要求因变量Y Y在一定数在一定数值范围内变化,可以通过控制自变量值范围内变化,可以通过控制自变量X X的取值来实现。的取值来实现。24PPT课件25PPT课件实验11-4 总体回归线置信带模拟实验 已知变量X和Y有线性关系,X服从正太分布N(170,22),Y服从正太分布N(0.6X+70,22).将500条线分别重叠绘制在一起,观察这些样本回归线的分布形态;绘制1条样本回归线、总体回归的95%置信带和1条总体回归线,观察置信带是否包含总体回归线;重复20次,统计出置信带包含总体回归线的比例26PPT课件直线回归与相关直线回归与相关的应用注意事项的应用注意事项 要有实际意义要有实际意义 不能任意不能任意“外延外延”绘制散点图绘制散点图 27PPT课件区区 别:别:六、直线回归与相关的区别与联系六、直线回归与相关的区别与联系 1.1.资资 料:料:X X、Y Y服从双变量正态分布服从双变量正态分布 Y Y正态随机变量,正态随机变量,X X为选定变量为选定变量 回归回归2.2.应应 用:用:回归回归 由一个变量值推算另一个变量值由一个变量值推算另一个变量值 相关相关 只反映两变量间互依关系只反映两变量间互依关系 相关相关3.3.回归系数有单位回归系数有单位,相关系数无单位相关系数无单位28PPT课件联联 系:系:六、直线回归与相关的区别与联系六、直线回归与相关的区别与联系 29PPT课件30PPT课件31PPT课件32PPT课件33PPT课件34PPT课件35PPT课件36PPT课件37PPT课件38PPT课件39PPT课件40PPT课件41PPT课件42PPT课件43PPT课件44PPT课件谢谢观赏WPS OfficeMake Presentation much more funWPS官方微博kingsoftwps45PPT课件
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!