相关分析与回归分析课件

上传人:494895****12427 文档编号:242535296 上传时间:2024-08-27 格式:PPT 页数:26 大小:277.71KB
返回 下载 相关 举报
相关分析与回归分析课件_第1页
第1页 / 共26页
相关分析与回归分析课件_第2页
第2页 / 共26页
相关分析与回归分析课件_第3页
第3页 / 共26页
点击查看更多>>
资源描述
,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第四章 相关分析与回归分析,4.1 简单相关分析,4.2 回归分析,4.3 非线性回归,.,第四章 相关分析与回归分析.,1,变量之间的关系?,函数关系:变量间确定的对应关系,相关关系:变量间某种非确定的依赖关系,相关分析:,寻找变量间相关关系的规律,回归分析:,借助于相应的函数描述上述规律,.,变量之间的关系?.,4.1 简单相关分析,一、相关分析的基本概念,二、用INSIGHT模块作相关分析,三、用“分析家”作相关分析,.,4.1 简单相关分析 一、相关分析的基本概念.,3,一、相关分析的基本概念,1. 散点图,散点图是描述变量之间关系的一种直观方法。,一组观测数据(,x,i,,,y,i,),,i,=1,2,n ,用坐标的横轴代表自变量,X,,纵轴代表因变量,Y,,,每个数据(,x,i,,,y,i,)在坐标系中用一个点表示,,从,散点图可以直观地看出变量之间的关系形态及关系强度。,.,一、相关分析的基本概念.,(a) (b) (c) (d),线性相关:,如果变量之间的关系近似地表现为一条直线,如图 (a)和(b);,非线性相关或曲线相关:,如果变量之间的关系近似地表现为一条曲线,如图(c);,完全不相关:,如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图(d)。,.,(a) (b),2. 相关系数,相关系数是对,变量之间关系密切程度,的度量。,1) 总体相关系数,:根据总体全部数据计算,,其中,COV,(,X,,,Y,)为变量,X,和,Y,的协方差,,D,(,X,)和,D,(,Y,)分别为,X,和,Y,的方差。,.,2. 相关系数.,2) 样本相关系数,(简称,相关系数,):根据样本数据,计算的,,一般情况下,总体相关系数,是未知的,通常是将样本相关系数,r,作为,的近似估计值。,.,2) 样本相关系数(简称相关系数):根据样本数据 .,相关系数,r,有如下性质:,取值范围:1 r 1,,0 r 1,表明X与Y之间存在,正线性相关,关系,,1 r 0,表明X与Y之间存在,负线性相关,关系。,r = 1, 完全正线性相关关系;,r = 1,完全负线性相关关系;,r = 0, 不存在线性相关关系。,| r | 0.8,高度相关;,0.5 | r | 0.8,中度相关;,0.3 | r | 0.5,低度相关;,| r | 0.3,相关程度极弱,可视为不相关。,.,相关系数r 有如下性质: | r | 0.8,高度相关,3. 相关系数的显著性检验,即检验总体相关系数是否显著为0,,通常采用费歇尔(Fisher)提出的t分布检验。,检验步骤:,1) 提出假设:假设样本是从一个不相关的总体中抽出的,即,H,0,:,= 0;H,1,:, 0,.,3. 相关系数的显著性检验.,1) 提出假设:假设样本是从一个不相关的总体中抽出的,即,H,0,:,= 0;H,1,:, 0,2) 由样本计算检验统计量:,p,= P|,t,| |,t,0,| = 2P,t, |,t,0,|,3) 进行决策:,p ,,拒绝原假设,H,0,;,p,,不能拒绝原假设,H,0,。,.,1) 提出假设:假设样本是从一个不相关的总体中抽出的,即.,4. 置信椭圆,可以生成两类置信椭圆:,均值置信椭圆:,预测两变量均值的置信区域;,预测值置信椭圆:,预测两变量分布个别观测值的置信区域。,关于预测值置信椭圆的两点说明:,1),作为置信曲线:,数据以设定的百分率(,置信水平,)落入的椭圆区域;,2),作为相关性指标:,椭圆为圆表明两个变量不相关,;,拉长的椭圆椭圆长短轴之比来衡量相关的程度。,.,4. 置信椭圆.,二、用INSIGHT模块作相关分析,【例4-1】,一家大型商业银行在多个地区设有分行,其业务主要是,进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款,。,近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。,为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。,表4-1,是该银行所属的25家分行2002年的有关业务数据。,.,二、用INSIGHT模块作相关分析.,问题:(1),不良贷款是否与贷款余额、应收贷款、贷款项目的多少、固定资产投资等因素有关?,(2),如果有,是一种什么样的关系?关系强度如何?,分行编号,不良贷款(亿元)Y,各项贷款余额(亿元)x1,本年累计应收贷款(亿元)x2,贷款项目个数(个)x3,本年固定资产投资额(亿元)x4,1,0.9,67.3,6.8,5,51.9,2,1.1,111.3,19.8,16,90.9,3,4.8,173.0,7.7,17,73.7,4,3.2,80.8,7.2,10,14.5,5,7.8,199.7,16.5,19,63.2,20,6.8,139.4,7.2,28,64.3,21,11.6,368.2,16.8,32,163.9,22,1.6,95.7,3.8,10,44.5,23,1.2,109.6,10.3,14,67.9,24,7.2,196.2,15.8,16,39.7,25,3.2,102.2,12.0,10,97.1,表4-1 某商业银行2002年的主要业务数据,.,问题:(1) 不良贷款是否与贷款余额、应收贷款、贷款项目的多,二、用INSIGHT模块作相关分析,1. 制作散点图,将表4-1中数据存放在数据集Mylib.bldk中,。,1) 在INSIGHT模块中,打开数据集Mylib.bldk;,2) 选择菜单“Analyze”“Scatter Plot (Y X)”;,3) 选定Y变量:Y;选X变量:x1、x2、x3、x4;,4) 单击“OK”按钮,得到变量的分析结果。,.,二、用INSIGHT模块作相关分析.,1.不良贷款(Y)与x1、x2、x3、x4之间都具有一定的线性关系。,2. Y 与x1的线性关系比较密切,,与x4之间的关系最不密切。,.,1.不良贷款(Y)与x1、x2、x3、x4之间都具有一定的线,2. 相关系数计算,1) 在INSIGHT模块中,打开数据集Mylib.bldk;,2) 选择菜单“Analyze(分析)”,“Multivariate (Y X)(多变量)”;,3)选定Y变量:Y; 选X变量:x1、x2、x3、x4;,4) 单击“OK”按钮,得到分析结果。,.,2. 相关系数计算.,结果显示,各变量的统计量和相关(系数)矩阵,,相关矩阵,:不良贷款Y与贷款余额(x1)的相关系数最大,与固定资产投资额(x4)的相关系数最小。,.,结果显示各变量的统计量和相关(系数)矩阵,.,5),检验各总体变量的相关系数是否为零,选择菜单:“Tables”“CORR p-values”,得到相关系数为零的原假设的p值,如图所示。,基于这些,p值,,,拒绝原假设,H,0,: = 0,,即不良贷款与其他几个变量之间均存在着显著的正相关关系。,.,5) 检验各总体变量的相关系数是否为零.,3. 置信椭圆,6) 选择菜单:“Curves”“Scatter Plot Cont Ellipse”,“Prediction:95”,得到不良贷款与其他几个变量的散点图及预测值的置信椭圆。,Y和x1之间有最强的相关性。,.,3. 置信椭圆Y和x1之间有最强的相关性。.,三、用“分析家”作相关分析,【例4-2】,通常用,单位面积的营业额Y,来评价商业中心经营好坏,它是单位时间内(通常为一年)的营业额与经营面积的比值。,影响因素:,单位小时车流量,x1、,日人流量,x2、,居民年平均消费额,x3、,消费者对商场的环境,x4、,对设施满意度,x5,、对商品的丰富程度的满意度评分,x6。,x1、x2:同时对几个商业中心进行实地观测得到的。,x3x5:通过随机采访顾客而得到的平均值数据。,表4-2,为从某市随机抽取的20个商业中心有关指标的数据,试据此说明变量间的相关程度。,.,三、用“分析家”作相关分析.,表4-2 20个商业中心有关指标的数据,商业中心编号,单位面积年营业额(万元/平方米)Y,每小时机动车流量(万辆)x1,日人流量 (万人)x2,居民年消费额(万元)x3,对商场环境满意度x4,对商场设施满意度x5,对商品丰富程度满意度x6,1,2.5,0.51,3.90,1.94,7,9,6,2,3.2,0.26,4.24,2.86,7,4,6,3,2.5,0.72,4.54,1.63,8,8,7,4,3.4,1.23,6.98,1.92,6,10,10,5,1.8,0.69,4.21,0.71,8,4,7,6,0.9,0.36,2.91,0.62,5,6,5,15,2.6,1.04,5.53,1.30,10,7,9,16,2.7,1.18,5.98,1.28,8,7,9,17,1.4,0.61,1.27,1.48,6,7,1,18,3.2,1.05,5.77,2.16,7,10,9,19,2.9,1.06,5.71,1.74,6,9,9,20,2.5,0.58,4.11,1.85,7,9,6,将表4-2数据保存在数据集Mylib.jyzk中。,.,表4-2 20个商业中心有关指标的数据商业中心编号单位面积,1. 相关分析的设置,1) 在“分析家”中打开数据集Mylib.jyzk;,2) 选择主菜单“Statistics”“Descriptive(描述性统计)”“Correlations(相关)”,,在“Correlations”对话框,设置分析变量及内容。,.,1. 相关分析的设置 .,2. 结果分析,首先给出各个变量的描述性统计量,包括观测总数、各变量的均值及标准差等。,然后给出变量的相关系数矩阵,原假设,H,0,: = 0,的检验结果,即p值。,.,2. 结果分析.,分析:,(1),Y与x3、x2接近高度相关;,Y与x1、x4、x5为低度相关;Y与x6中度相关。,(2),Y与x3、x2、x6、x5,,p ,= 0.05,,接受,H,0,。,.,分析: (1) Y与x3、x2接近高度相关;.,3. 置信椭圆,在分析家窗口的项目管理器中,,依次双击“,Scatter Plots,”下的“,Confidence ellipse:Y,X1”“Confidence ellipse:Y,X6”,项,,得到各变量与单位面积营业额的散点图。,.,3. 置信椭圆.,Y与x1、x2、x3、x4、x5、x6的散点图及置信椭圆,单位面积营业额Y与各指标均,呈正相关,关系。,居民年消费额(x3)与Y的相关关系较强,置信椭圆较扁长;,顾客对商场设施的满意度(x4)与Y的相关程度较小,置信椭圆接近于圆。,.,Y与x1、x2、x3、x4、x5、x6的散点图及置信椭圆,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!