统计学原理 第9章 相关与回归

上传人:紫** 文档编号:240701198 上传时间:2024-05-01 格式:PPT 页数:24 大小:441KB
返回 下载 相关 举报
统计学原理 第9章 相关与回归_第1页
第1页 / 共24页
统计学原理 第9章 相关与回归_第2页
第2页 / 共24页
统计学原理 第9章 相关与回归_第3页
第3页 / 共24页
点击查看更多>>
资源描述
第九章第九章 相关与回归相关与回归n社会经济现象之间的数量社会经济现象之间的数量关系可分为:关系可分为:函数关系和函数关系和相关关系相关关系。n函数关系函数关系反映着现象之间反映着现象之间严格的依存关系。严格的依存关系。n相关关系相关关系反映着现象之间反映着现象之间不确定、不严格的依存关不确定、不严格的依存关系。系。相关关系的分类相关关系的分类n1 1、单相关(简单相关关系,两、单相关(简单相关关系,两变量)与复相关(多元相关,变量)与复相关(多元相关,三个及三个以上变量)三个及三个以上变量)n2 2、正相关(同向变动)和负相、正相关(同向变动)和负相关(反向变动)关(反向变动)n3 3、完全相关、不完全相关、不、完全相关、不完全相关、不相关相关n4 4、线性相关与非线性相关、线性相关与非线性相关相关回归分析的步骤相关回归分析的步骤n1 1、进行相关关系的定性分析;、进行相关关系的定性分析;n2 2、确定回归方程;、确定回归方程;n3 3、计算相关系数或相关指数,对回归方程、计算相关系数或相关指数,对回归方程变量之间的相关性进行显著性检验;变量之间的相关性进行显著性检验;n4 4、利用回归方程进行推算和预测;、利用回归方程进行推算和预测;n5 5、对推算和预测作出置信区间估计。、对推算和预测作出置信区间估计。直线相关直线相关n(一)相关图(一)相关图正相关图负相关图n(二)相关系数(二)相关系数n相关系数相关系数R R:它是直线相关分析中用来衡量两个它是直线相关分析中用来衡量两个变量之间相关程度的重要指标。变量之间相关程度的重要指标。(1 1)相关系数的取值范围)相关系数的取值范围1 1 R 1R 1(2 2)R=0R=0,称零相关称零相关(3 3)R R=1=1,称完全相关称完全相关(4 4)当当0 0R R1 1,称普通相关称普通相关(二)回归分析(二)回归分析n一、模型判别一、模型判别n图图示示法法是是将将数数据据在在坐坐标标轴轴上上以以散散点点图图或或折折线线图图的的形形式式画画出出来来,以以显显示示数数据据的的变变化化趋趋势势,通通过过观观察察选选择择预预测测模型的方法。模型的方法。n 如如果果数数据据的的分分布布近近似似直直线线形形状状,就就配配合合直直线线模模型型进进行行预测。预测。n 如如果果数数据据的的分分布布不不属属于于直直线线型型的的,则则应应仔仔细细观观察察其其分分布布是是否否近近似似于于某某一一曲曲线线(如如抛抛物物线线、双双曲曲线线、指指数数曲曲线、线、S S曲线等),然后配合相应的曲线模型进行预测。曲线等),然后配合相应的曲线模型进行预测。简单直线回归模型简单直线回归模型设设y y为因变量,为因变量,x x为自变量,为自变量,y y与与x x之间存在之间存在某种线性关系某种线性关系 y yi i=a+=a+bxbxi i 其中:其中:a a、b b称回归系数,称回归系数,y y为预测目为预测目标,标,x x 为影响因素(可控制或预先给定)为影响因素(可控制或预先给定)。二、参数估计二、参数估计OLSOLS估计即采用最小平方法来估计模型的参数。估计即采用最小平方法来估计模型的参数。最小平方法的中心思想:是通过数学模型,配合最小平方法的中心思想:是通过数学模型,配合一条较为理想的趋势线。这条趋势线必须满足下列一条较为理想的趋势线。这条趋势线必须满足下列两点要求两点要求:(1 1)原数列的观察值与模型的估计值的离差平方和为最小;)原数列的观察值与模型的估计值的离差平方和为最小;(2 2)原数列的观察值与模型的估计值的离差总和为零。)原数列的观察值与模型的估计值的离差总和为零。用公式表示为:用公式表示为:n根据最小平方法的要求得到参数估计式为:根据最小平方法的要求得到参数估计式为:可得预测回归方程为可得预测回归方程为:n三、三、相关性的相关性的显著性检验显著性检验 原假设原假设H H0 0 :a=b=0a=b=0 备择假设备择假设H H1 1:a a、b b不全为零不全为零 (1)(1)计算相关系数计算相关系数R R;(2 2)根据回归模型的自由度(根据回归模型的自由度(n-mn-m)和给定显著和给定显著性水平性水平 值,从相关系数表中查出临界值值,从相关系数表中查出临界值R R (n-mn-m)。)。(3 3)判别:若判别:若R R R R (n-mn-m),表明两表明两变量之间线性相关关系显著,检验通过,模型变量之间线性相关关系显著,检验通过,模型可用于预测;若可用于预测;若R R R R (n-mn-m),),表明两表明两变量之间线性相关关系不显著,检验不通过,变量之间线性相关关系不显著,检验不通过,模型不能用于预测。模型不能用于预测。t t 检验检验 t t 检验是通过检验是通过 t t 统计量对所求回归模型的统计量对所求回归模型的每一个系数逐一进行检验每一个系数逐一进行检验 原假设原假设H H0 0:a=0a=0或或b b =0=0 备择假设备择假设H H1 1:a a 0 0或或b b 0 0 判别:若判别:若t ttt /2/2(m-1m-1)拒绝原假设拒绝原假设H H0 0 ,样本回归系数是显著的。反之不显著。样本回归系数是显著的。反之不显著。估计标准误差估计标准误差n估计标准误差:也称剩余标准差,他是剩余估计标准误差:也称剩余标准差,他是剩余变差的平均数的方根。反映观测值与估计值变差的平均数的方根。反映观测值与估计值之间的平均离差程度。之间的平均离差程度。四、进行预测四、进行预测1 1、点估计:、点估计:2 2、区间估计:、区间估计:nP248P248例题例题9-19-1可线性化的曲线回归可线性化的曲线回归n双曲线模型双曲线模型 y yi i=1 1+2 2(1/x1/x)+i in二次曲线模型二次曲线模型 y yi i=1 1+2 2x xi i+3 3x xi i2 2+i in对数模型对数模型 y yi i=1 1+2 2lnxlnxi i+i in三角函数模型三角函数模型 y yi i=1 1+2 2sinxsinxi i+I In指数模型指数模型 y=y=ababx x n幂函数模型幂函数模型 y=y=axaxb bn案例:随着人们收入的提高,越来越多的案例:随着人们收入的提高,越来越多的家庭开始购买汽车,下面是我国家庭开始购买汽车,下面是我国19851985年到年到20032003年汽车销售量的资料。请根据以下资年汽车销售量的资料。请根据以下资料料n(1 1)作相关性分析。)作相关性分析。n(2 2)作回归分析。)作回归分析。n(3 3)对未来三年的汽车销售量做预测。)对未来三年的汽车销售量做预测。n我国我国19851985至至20032003年汽车销售量资料年汽车销售量资料(1 1)相关性分析)相关性分析SPSS操作步骤:Correlate Birariate结果:Pearson Correlation=0.978皮尔逊相关系数=0.978在显著性水平为0.01的情况下,汽车销售量与时间密切相关。(2 2)回归分析)回归分析n绘制散点图,确定回归方程的类型。绘制散点图,确定回归方程的类型。nSPSSSPSS操作步骤:操作步骤:n1 1、点击、点击Graphs Scatter Graphs Scatter n2 2、选择选择SimpleSimple,单击单击DefineDefine进入对话框;进入对话框;n3 3、将销售量、将销售量y y选入选入Y AxisY Axis,年次年次x x选入选入X AxisX Axis;n4 4、单击单击OKOK。(2 2)回归分析)回归分析结论:可以配合直线模型。(2 2)回归分析)回归分析n拟合回归模型并进行预测分析。拟合回归模型并进行预测分析。nSPSSSPSS操作步骤:操作步骤:n1 1、点击、点击Analyze Regression LinearAnalyze Regression Linear;n2 2、将销售量将销售量y y选入选入dependentdependent,年次年次x x选入选入independentindependent;n3 3、单击单击SaveSave进入保存对话框:进入保存对话框:n在在Predicted ValuesPredicted Values中的中的UnstandardizedUnstandardized前的前的 中打中打,n在在Prediction IntervalPrediction Interval中的中的IndividualIndividual前的前的 中打中打。n4 4、单击、单击ContinueContinue,单击单击OKOK。(2 2)回归分析)回归分析结果:结果:设设y y是是销售量,销售量,x x是年次是年次 回归模型:回归模型:Y=5.161+12.478x Y=5.161+12.478x R=0.978 R R=0.978 R2 2=0.956=0.956 标准误差标准误差=15.56651=15.56651 模型显著性检验模型显著性检验 查相关系数表得查相关系数表得R R 0.050.05(17)=0.457(17)=0.457 R=0.978 R=0.978 模型回归效果显著,可用于预测。模型回归效果显著,可用于预测。(3 3)预测)预测未来三年的预测值与未来三年的预测值与95%95%的置信区间是:的置信区间是:年份年份 预测值预测值 预测区间预测区间20042004 254.73254.73(218.33 218.33,291.12291.12)20052005 267.20267.20(230.27 230.27,304.14304.14)20062006 279.68279.68(242.16 242.16,317.20317.20)本章的重点是直线相关与简单直线相关回归分析的计算,难点是曲线相关的计算。
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 商业管理 > 营销创新


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!