资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,*,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,*,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,应用商务统计线性回归,案例介绍,背景、目标、变量和分析,2,案例背景,目前中国的资本市场逐渐成熟,投资于股市成为众多企业乃至个人的重要理财方式。因此利用上市公司当年的公开的财务指标对起来年盈利状况予以预测就成为投资人最重要的决策依据。,本案例随机抽取深市和沪市2002年和2003年各500个样本,对上市公司的净资产收益率return on equity, ROE进展预测。,3,案例目标与变量,目标:盈利预测,因变量:下一年的净资产收益率ROE,自变量:当年的财务信息,样本容量:2002年500;2003年500,4,自变量,ROEt: 当年净资产收益率,ATO: 资产周转率asset turnover ratio,LEV: 债务资本比率debt to asset ratio反映公司根本债务状况,PB: 市倍率price to book ratio反映公司预期未来成长率,ARR: 应收账款/主营业务收入account receivable over total income反映公司的收入质量,5,自变量,PM: 主营业务利润/主营业务收入profit margin反映公司利润状况,GROWTH: 主营业务增长率sales growth rate反映公司已实现的当年增长率,INV: 存货/资产总计inventory to asset ratio反映公司的存货状况,ASSET: 对数资产总计log-transformed asset反映公司的规模,6,对模型的进一步分析,哪个自变量在预测方面最有用?,哪个自变量是最重要的?,如何使用模型进展预测?,7,描述分析,获得对数据的整体性认识,8,读取数据,在SPSS中翻开数据文件,在R环境下将数据读入系统并显示,使用如下语句:,9,数据的概括性度量,SPSS,:,Analyze Descriptive Statistics Explore,R,语句:,10,变量间相关性分析,SPSS,:,Analyze, Correlate Bivariate,R,语句:,11,SPSS,:,Graph Scatter,R,语句:,plot(a1$ROEt,a1$ROE),12,模型的建立,模型、假设和参数估计,13,模型形式与假设,线性回归模型,模型假设,独立性假设,同方差假设,正态性假设,14,参数估计,模型,:,最小二乘估计量:,方差估计量:,15,拟合优度,总平方和,残差平方和,R-Square,16,参数估计的软件实现,SPSS,:,Analyze Regression Linear,R,语句:,lm1=lm(ROEROEt+ATO+PM+LEV+GROWTH+PB+ARR+INV+ASSET,data=a1), summary(lm1),17,18,显著性检验,19,F,检验,假设,检验统计量,拒绝域,20,T,检验,假设,检验统计量,拒绝域,21,22,显著性检验的结论,从,F,检验的结果看,模型的线性关系是显著的。,从,T,检验的结果看,,ROEt,和,LEV,两个变量通过了检验,,GROWTH,变量在显著性水平降至时也可以通过检验,因此这三个变量与因变量的线性关系较为显著。,注意,这不说明应该删除其它变量!,23,模型的诊断,异方差性、非正态性、异常值,24,同方差性检验,25,同方差性检验,26,同方差性检验,27,同方差性检验,28,正态性检验,假设 , 并且,那么有,29,正态性检验,进一步可以得到,以与,所以在正态性假设下,残差 与 应该成线性关系。,30,正态性检验,Q-Q,图,残差,:,将残差排序,:,Y:,X:,31,32,33,将上面的方法应用于本案例,目标,1,:检验模型是否符合三个假设,目标,2,:找出异常值,SPSS,实现方法:以预测值为,X,轴,残差为,Y,轴画散点图;画,Q-Q,图,R,语句:,par(mfrow=c(2,2)#,设置画图为,2x2,的格式,plot(lm1,which=c(1:4),#,画出,lm1,中对应于模型检验的,4,张图,包括残差图、,QQ,图和,Cook,距离图,检验发现,47,号数据为异常值,需要将其消除,语句:,a1=a1(-47),34,35,36,37,38,多重共线性,含义与检验,39,什么是多重共线性?,如果存在如下回归方程,能不能把它变成下面这样,如果对这个方程进展回归会发生什么事?,40,第一个例子,假设有两个变量x1和x2,用最小二乘法得到如下参数估计量。,41,42,43,44,第二个例子,假设有三个变量x1、x2和x3,用最小二乘法得到如下参数估计量。,45,46,方差膨胀因子,定义下面的回归形式为辅助回归,令 为辅助回归的判定系数,那么方差膨胀因子为:,它反映了在多大程度上第i个自变量所包含的信息被其他自变量覆盖,47,方差膨胀因子,R,语句:,所有的,VIF,值都小于,10,且接近,1,,所以没有多重共线性问题。,48,变量的选择,49,AIC,和,BIC,AIC方法比较保守,其中p为自变量个数,与RSS成反比。,使AIC到达最小的模型是最优的,BIC相对不那么保守,因此保存的变量可能会比较少。,50,51,52,预测,53,预测值与置信区间,54,数据准备,以2003年数据为检验数据,可以用如下方法对数据进展准备,55,预测,56,汇报完毕,谢谢大家,!,请各位批评指正,57,谢谢观赏,
展开阅读全文