用SAS作回归分析ppt课件

上传人:钟*** 文档编号:5856279 上传时间:2020-02-09 格式:PPT 页数:21 大小:492KB
返回 下载 相关 举报
用SAS作回归分析ppt课件_第1页
第1页 / 共21页
用SAS作回归分析ppt课件_第2页
第2页 / 共21页
用SAS作回归分析ppt课件_第3页
第3页 / 共21页
点击查看更多>>
资源描述
回归分析中SAS的使用 1 1 回归分析计算 PROCREGDATA 数据集名 MODEL应变量 自变量 RUN PROCREGDATA 数据集名 MODEL应变量 自变量名列 pcliclmRUN 2 2 回归线作图 PROCREGDATA 数据集名 MODEL应变量 自变量 pcliclmr PLOTy变量 x变量 选项 RUN 利用plot语句可以绘制与拟合数据有关散点图 回归线和置信曲线 预测区间曲线 3 回归线作图 PROCREGDATA 数据集名 MODEL应变量 自变量 pcliclmr PLOTy变量 x变量 选项 RUN y变量和x变量可以是应变量 自变量和其它与回归分析有关的变量 p predicted 预测值r residual 余差U95 L95 预测值置信限U95M L95M 预测均值置信限 选项 conf95作预测均值置信曲线pred95作预测值置信曲线overlay将语句中规定的图迭置在一幅图上AICCPMSESSE在图上显示相应的统计量 4 3 逐步回归分析计算 变量选择 PROCREGDATA 数据集名 MODEL应变量 自变量名列 pcliclmrselection stepwiseslentry 0 05slstay 0 05details RUN 5 4 回归诊断 例外值 outliers 或异常作用点的检查从已拟合回归的数据中分析线性模型的假定是否被破坏 应变量的均值是否是独立变量的线性函数 是否需要对变量进行变换或拟合曲线回归余差 residuals 是否同方差 不相关 正态分布独立变量间是否存在线性关系 仅多元有 考察余差散点图是进行回归诊断的必要步骤 6 回归诊断 7 回归诊断 回归分析的余差值是回归诊断的重要工具 利用余差可以考察余差和预测值的散点图也可以检验余差分布的正态性 8 回归诊断 模型合适 应改曲线模型 不等方差 观测值不独立 9 回归诊断生成余差 在PROCREG的model语句加上选项p 就会输出预测值和相应的余差 PROCREGDATA 数据集名 MODEL应变量 自变量 p PLOTy变量 x变量 选项 RUN 利用plot语句plotr p 就可得到余差 预测散点图 其中可以把p值换成自变量x 就得到相应的散点图 10 回归诊断识别异常观测值 在PROCREG的model语句加上选项r 就会输出与预测值和余差有关的一些统计量 他们可用于识别异常数据 outlier 及其影响 PROCREGDATA 数据集名 MODEL应变量 自变量 r RUN PredictValue预测值StdErrPredict预测值标准差Residual余差StdErrPredict余差标准差StudentResidualstudent化的余差 2 1012余差显著性图Cook sDCook sD统计量其中D是距离的缩写 11 回归诊断余差分布正态性 有了余差的数据 就可对其运用图形方法或正式的分布正态性的检验在INSIGHT中可直接对数据表中的预测余差变量进行分析在PROCREG可利用下列语句用图形分析余差分布正态性 PROCREGDATA 数据集名graphics MODEL应变量 自变量 PLOTnqq student nqq r RUN 12 回归诊断识别有影响的观测 CookD统计量度量一个观测从分析中剔除时参数估计值的变化对一个观测值其CookD统计量的值超过4 n时 n为样本容量 这个观测存在反常效应 其中4 n只是经验 没有统一的标准 13 回归诊断识别有影响的观测 Dffitsi度量第i个观测对预测值的影响 第i个观测的预测值 用排除第i个观测的回归对第i个观测的预测值 第i个观测的预测值的标准差 是为了把数据标准化 其中Dffits越大越好 D是different和fit的缩写说明 p为模型中参数的个数 n为样本容量 其中 14 回归诊断识别有影响的观测 ProcREG的Model语句加选项r可获得CookD统计量 ProcREG的Model语句加选项influence可获得Dffits等反映观测值影响的统计量 PROCREGDATA 数据集名 MODEL应变量 自变量 rinfluence RUN 15 选项influence生成的统计量 Hatdiag 帽子矩阵 可以把杠杆点找出来 用的较多 Dbet 表示某个点删除前后统计量的变化 16 五 影响点诊断 procregdata e4 modely1 x1 x4 influencer run 其中选项influence同上一页 R主要给出Cook distance 前面已有 17 六 共线性诊断 共线性 collinearity multicollinearity 问题是指独立变量间存在线性关系1 变量间的线性关系会隐蔽变量的显著性2 也会增加参数估计的方差3 产生不稳定的模型只有拟合多元回归才会发生这一问题共线性的诊断可使用方差膨胀因子 条件指数和方差比例 18 回归诊断共线性诊断 VIF 方差膨胀因子 VIF 是对由于共线性而引起的参数估计量的方差增加的一个相对度量 Rr2是Xr关于模型中其它独立变量回归的R2 一般采用VIF 10表明存在共线性问题 ProcREG的Model语句加选项VIF 19 回归诊断共线性诊断 条件指数和方差比例 条件指数 conditionindex 和方差比例 varianceproportion 联合使用可确认存在线性关系的变量组条件指数 hi lmax li 1 2 在10 30间为弱相关在30 100间为中度相关大于100表明有强相关大的条件指数伴随方差比例 0 5可确认有共线性的独立变量子集 ProcREG Model语句加选项collin或collinoint 20 回归分析计算 PROCREGDATA 数据集名 MODEL应变量 自变量名列 pcliclmrvifinfluencecollin PLOTy变量 x变量 选项 RUN 作图变量 r student nqq 21
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!