回归分析_赵秀丽

上传人:c****d 文档编号:242868218 上传时间:2024-09-10 格式:PPT 页数:25 大小:169KB
返回 下载 相关 举报
回归分析_赵秀丽_第1页
第1页 / 共25页
回归分析_赵秀丽_第2页
第2页 / 共25页
回归分析_赵秀丽_第3页
第3页 / 共25页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,统计分析、数据挖掘与商业智能应用研究小组,单击此处编辑母版标题样式,简介:,Regeression节点生成线性回归模型。该模型根据输入变量估计预测输出变量的最佳现行方程。回归方程代表一条直线或者平面,其预测值与真实输出值的离差最小。这是一种非常常用的用于概括数据并作出预测的统计方法。,*,统计分析、数据挖掘与商业智能应用研究小组,单击此处编辑母版标题样式,要求:,只有数值型变量可用于回归模型。,必须只有一个“OUT”变量和一个以上的“IN”变量,变量方向为“Both”或者“None”的变量将被忽略,同样被忽略的还有非数值型变量。,*,统计分析、数据挖掘与商业智能应用研究小组,单击此处编辑母版标题样式,优点,回归模型相对简单,并为生成的预测给出易于解释的数学方程。由于回归建模是一种比较成熟的统计方法,回归模型的特性易于理解。而且,回归模型训练起来也非常快;线性回归节点提供自动选择变量的方法以删除方程中不显著的输出变量。,*,统计分析、数据挖掘与商业智能应用研究小组,线性回归,*,统计分析、数据挖掘与商业智能应用研究小组,线性回归分析,报告人:赵秀丽,指导教师:谢邦昌,日期:2007年11月6日,1,线性回归模型,Regression 节点生成线性回归模型。,该模型是根据输入变量估计预测输出变量的最佳线性方程。回归方程代表一条直线或者平面,其预测值与真实输出值的离差最小,这是一种非常常用的用于概括数据并作出预测的统计方法。,2,要 求,要求:,只有数值型变量可用于回归模型。,必须只有一个“OUT”变量和一个以上的“IN”变量。,变量方向为“Both”或“None”的变量将被忽略;同样被忽略的有非数值型变量。,3,线性回归模型的优点,优点:,回归模型相对简单,并为生成的预测给出易于解释的数学方程。,由于回归建模一个比较成熟的统计方法,回归模型的特性容易理解。,而且回归模型训练起来也非常快。,线性回归节点提供自动选择变量的方法以删除方程中的不显著的输入变量。,4,线性回归节点模型选项,线性回归节点模型选项(如图),model name:,指定要产生的模型名称;,Method:,指定建立回归模型的方法 ;,Include constant in equation,:,方程中包括常,数,.,5,建立回归模型的方法,方法(1):进入法(Enter),这是预设的方法,将所有的变量直接选入方程,在建模中没有变量选择。,6,建立回归模型的方法,方法(2): 逐步节选法,(,Stepwise),即逐步回归变量选择方法一步一步建立方程。初始模型是最可能简单的模型,方程中没有一个输入变量。在每一步,对未进入方程的变量进行评估,如果这些变量中最好的变量能显著增强模型的预测效果,则添加该变量进入方程。此外,已经存在于防城中的变量将被重新评估,以决定其是否可被从方程中除去而不显著减损方程的效果,如果可以,则将被除去。随后,重新进行该步骤,添加或除去其他变量。在没有变量可添加到方程以改进方程,也没有变量可被除去而不显著减损方程时,生成最终模型。,7,建立回归模型的方法,方法(3): 后退法(,Backwards),后退法变量选择与逐步回归变量选择的,相似之处,都是逐步建立模型。,不同之处,是后退法下最初的模型包括所有的输入变量作为预测变量,变量只能被剔出模型而不能被添加到模型。对模型几乎没有贡献的变量被一个一个的剔除出模型,知道剩下的每一个变量都显著影响模型预测效果,此时生成最终的模型。,8,建立回归模型的方法,方法(4): 前进法(,Forwards),前进法本质上与后退法相反。,前进法下最初模型是没有任何输入变量的最简化模型,变量只能被添加到模型中而不能被剔除。在每一步,检验尚未进入模型的输入变量对模型的改进程度,对模型改进程度最大的变量进入模型,在没有变量可添加到模型或者最后的备选变量对模型没有多大改进时,生成最终模型。,9,方程中包含常数,(,Include constant in equation),该选项决定是否在最终方程中包含常数项。,在大多数情况下,应选择该选项。如使用者有先验知识,只要预测变量为零时输出变量总是为零,则该选项很有用。,10,线性回归节点高级选项,高级选项可以使使用者调整建模进程;,要使用高级选项,将,Expert,项目中的模式项(Mode) 中设置为,Expert,。,11,线性回归节点高级选项,Mode,Missing values,Singularity tolerance,Stepping,Output,12,线性回归节点高级选项,遗漏值(,Missing values,):,在预设设置下,线性回归节点只使用模型中所有变量均有有效值的记录。如果有大量遗漏值,使用者可能会发现这种方法提出了太多的记录,使使用者没有足够的资料生成一个好的模型。在这种情况下可能取消选择,Only use complete records 选项。Clementine会尝试用尽可能多,的信息来估计回归模型,包括有些变量有遗漏值的记录。但是,在某些情况下,以这种方式使用不完整记录在估计回归方程时会引起计算问题。,13,线性回归节点高级选项,奇异值容许度,(,Singularity tolerance,),:,这一选项允许使用者指定某一变量独立于模型中其他变量的最小方差比率。,14,线性回归节点高级选项,逐步方式(,Stepping):,这些选项允许控制逐步筛选法、前进法、后退法中变量进入和剔除的准则。(如果选择了,Enter,法,则按钮不可用)。要了解更详细的情况,参见“线性回归节点逐步选项”。,15,线性回归节点高级选项,输出(,Output):,这些选项允许要求在该节点生成的模型的高级输出中所出现的附加统计量。要了解更详细的情况,参见“回归节点输出选项”。,16,线性回归节点逐步选项,选择两个准则中的一个作为前进中的准则,然后确定使用者需要的临界值。,注意:两个准则之间具有返乡关系。变量对模型越重要,P值越小,F值越大。,17,线性回归节点逐步选项,Use probability of F,(使用,F,的概率,),:,该选项允许指定基于每个变量的关联统计概率,(,associated p value,),作为选择准则。只有当,P,值比,Entry,值小时变量才会添加到模型,也只有当P值比,Removal,值大时变量才会被剔除。,Entry,值必须比,Removal,值小。,18,线性回归节点逐步选项,Use F value(,使用,F,值):,該该选项允许指定基于每个变量的F统计量作为选择准则。,F,值是对每个变量对模型的贡献的度量。只有当F值比,Entry,值大时变量才会添加到模型,也只有当,F,值比,Removal,值小时变量才会被剔除。,Entry,值必须比,Removal,值大。,19,线性回归节点输出选项,选择在生成的线性回归模型的高级输出中的使用所,想要的输出项。要观察高级输出,浏览生成模型并点,Advanced,。要了解更多的信息,参见生成模型,章的“线性回归方程高级输出”。,20,线性回归节点输出选项,模型拟合优度(,Model fit):,模型拟合概要,包括拟合优度(,R2),。它表示输出变量方差中能够被输入变量解释的比例。,R2改变量(R squared change):,逐步回归、前进法、后退法等估计方法中每一步的,R2改变量。,21,线性回归节点输出选项,选取准则(,Selection criteria):,估计建模过程每一步模型所包含的信息内容的统计量,用以帮助评估模型的改进程度。统计量包括赤池信息量(,A,kaike,I,nformation,C,riterion),、阿米米亚预测准则(,A,memiya,P,rediction,C,riterion),、马洛斯预测准则,(,M,allows,P,rediction,C,riterion),和施瓦茨贝叶斯准则(,S,chwarz,B,ayesian,C,riterion),。,22,线性回归节点输出选项,叙述统计量(Descriptives):,输入和输出字段的基本叙述统计量。,部分相关系数和偏相关系数,(Part and Partial correlations):,辅助决定每个输入变量对模型重要性及对模型的独特贡献的统计量。,多重共线性诊断(Collinearity diagnostics):,辅助判别多余输入变量问题的统计量。,23,线性回归节点输出选项,回归系数(Regression coefficients):,回归系数相关统计量:,(1)、Confidence interval(信赖区间)。方程中每个回归系数的95信赖区间。,(2)、Covariance matrix(协方差矩阵)。输入变量的协方差矩阵。,24,线性回归节点输出选项,残差 (Residuals):,残差统计量,或说预测值与真实值之间的差异.,DurbinWatson(DW统计量)。,对自相关的DW检验。该检验检测,样本,顺序对回归模型的影响,,样本,顺序可能使回归模型无效。,25,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!