SPSS第十四讲偏相关性分析

上传人:pia****nwu 文档编号:245084093 上传时间:2024-10-07 格式:PPT 页数:44 大小:669KB
返回 下载 相关 举报
SPSS第十四讲偏相关性分析_第1页
第1页 / 共44页
SPSS第十四讲偏相关性分析_第2页
第2页 / 共44页
SPSS第十四讲偏相关性分析_第3页
第3页 / 共44页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,本作品采用,知识共享署名,-,非商业性使用,2.5,中国大陆许可协议,进行许可。,专业交流,模板超市,设计服务,NordriDesign,中国专业,PowerPoint,媒体设计与开发,本作品的提供是以适用知识共享组织的公共许可(简称“,CCPL”,或“许可”)条款为前提的。本作品受著作权法以及其他相关法律的保护。对本作品的使用不得超越本许可授权的范围。,如您行使本许可授予的使用本作品的权利,就表明您接受并同意遵守本许可的条款。在您接受这些条款和规定的前提下,许可人授予您本许可所包括的权利。,查看全部,统计软件,第十四讲,偏相关分析,第十四讲,偏相关分析,第一部分,Excel,与,SPSS,方式对比,第二部分 偏相关分析的概念,第三部分 偏相关分析的,SPSS,过程,第四部分 距离分析,相关分析的,Excel,方式,例:一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,管理者希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。,下表就是该银行所属的25家分行2002年的有关业务数据。,散点图,Spss结果比较,偏相关分析,在多变量的情况下,变量之间的相关关系是很复杂的。因此,多元相关分析除了要利用上一讲的简单相关系数外,还要计算偏相关系数。,在对其他变量的影响进行控制的条件下,衡量多个变量中某两个变量之间的线性相关程度的指标称为,偏相关系数,。,偏相关系数与简单相关系数区别,在计算简单相关系数时,:只需要掌握两个变量的观测数据,并不考虑其他变量对这两个变量可能产生的影响。,在计算偏相关系数时,:需要掌握多个变量的数据,一方面考虑多个变量相互之间可能产生的影响,一方面又采用一定的方法控制其他变量,专门考察两个特定变量的净相关关系。,变量,1,变量,2,关系,变量,1,变量,2,关系,变量,3,控制,例:,在现实经济生活中,由于收入和价格常常都有不断提高的趋势,如果不考虑收入对需求的影响,仅仅利用需求和价格的时间序列数据去计算简单相关系数,就有可能得出价格越高需求越大的错误结论。,价格,需求量,收入水平,上升,未知,上升还是,下降呢?,关系?,偏相关分析的公式表达,在偏相关中,根据固定变量数目的多少,可分为零阶偏相关、一阶偏相关、,、,(p-1),阶偏相关。零阶偏相关就是简单相关。如果用下标,0,代表,Y,,下标,1,代表,X1,,下标,2,代表,X2,,则变量,Y,与变量,X1,之间的一阶偏相关系数为:,r,01.2,是剔除,X2,的影响之后,,Y,与,X1,之间的偏相关程度的度量。,r,01,,,r,02,,,r,12,分别是,Y,,,X1,,,X2,两两之间的相关系数。,如果增加变量,X3,,则变量,Y,与,X1,的二阶偏相关系数为:,依此类推变量,Y,与,Xi,的,p-1,阶偏相关系数为:,第四部分 偏关分析的,SPSS,过程,SPSS,中相关分析可以通过,Analyze,菜单进行(,Correlate,),,Correlate,菜单如图所示。,选择其中第二个子菜单进入到偏相关分析界面(,Partial,),第一步:录入数据,打开偏相关分析对话框。,第二步:将对话框中左侧的变量列表框中选择两个变量,作为相关变量,移入,Variables,列表框中;选择一个控制变量移入,Controlling for,列表框中,第三步:选择检验类型。,变量窗口,显著性检验:,双尾检验(默认),单尾检验(相关方向明显时),显示相关系数时,显示实际的显著性概率,相关变量,控制变量,第四步:打开,OPTION,选项框。,均值与标准差,即显示每个变量的均值、标准差和非缺失值的例数,显示零阶相关矩阵,即,Pearson,相关矩阵,仅剔除当前分析的两个变量值是缺失值的个案,剔除带有缺失值的所有个案,已知有某河流的一年月平均流量观测数据和该河流所在地区当年的月平均雨量和月平均温度观测数据,如表所示。试分析温度与河水流量之间的相关关系。,相关分析的命令语句,结果分析,一、描述性统计量,表中给出了个变量的均值、标准差和变量的非缺失值例数。,相关系数,在月平均雨量作为控制变量的条件下,月平均流量和月平均气温间的偏相关为,0.365,,概率,p,值为,0.270,,在显著性水平为,0.05,的条件下,月平均流量和月平均气温呈的正相关关系,说明月平均流量和月平均气温的有线性影响但影响有限。,解释,看上去得到了两个相反的结论,为什么呢?,距离分析,一、距离分析的概念,距离分析,是对观测量之间或变量之间相似或不相似程度的一种测度,是计算一对变量之间或一对观测量之间的广义的距离。这些相似性或距离测度可以用于其它分析过程,例如因子分析、聚类分析等。,在距离分析过程中,主要利用变量间的,相似性测度,(,Similarities,)和,不相似性测度,(,Dissimilarities,)度量两者之间的关系,有多像,OR,有多不像?,不相似性测度,对定距型变量间距离描述的统计量,主要有:,欧式距离(,Euclidean distance,),欧式距离的平方(,Squared Euclidean distan-ce,),契比雪夫距离(,Chebychev,),绝对值距离(,Block,),闵可夫斯基距离(,Minkowski,)等。,对定序型变量之间距离的描述,主要有:,卡方不相似测度(,Chi-Square measure,),Phi,方不相似测度(,Phi-Square measure,),对二值变量之间的距离描述,主要有:,欧氏距离(,Euclidean distance,),平方欧氏距离(,Squared Euclidean distance,),Lane and Williams,不相似性测度(,Lane and Williams,)等。,相似性测度,两变量之间可以定义相似性测度统计量,用来对两变量之间的相似性进行数量化描述。针对定距型变量,主要有:,Peason,相关系数,夹角余弦距离等。,对于二值变量的相似性测度主要包括:,简单匹配系数(,Simple matching,),Jaccard,相似性指数(,Jaccard,),Hamann,相似性测度(,Hamann,)等,20,余种。,相似性或不相似性测度还可用与其它模块,例如:因子分析、聚类分析以及多维尺度分析的进一步分析,以助于分析复合数据集。,Kulczynski 1,:,Kulczynski,型配对系数,分母为总数与配对数之差,分子为非配对数,分子与分母的权重相同;,Kulczynski 2,:,Kulczynski,平均条件概率;,Sokal and Sneath 4,:,Sokal and Sneath,条件概率;,Hamann,:,Hamann,概率;,Lambda,:,Goodman-Kruskai,相似测量的,值;,Anderbergs D,:以一个变量状态预测另一个变量状态;,Yules Y,:,Yule,综合系数,属于,22,四格表的列联比例函数;,Yules Q,:,Goodman-Kruskal,值,属于,22,四格表的列联比例函数。,Ochiai,:,Ochiai,二分余弦测量;,Sokal and Sneath 5,:,Sokal and Sneath,型相似测量;,Phi 4 point correlation,:,Pearson,相关系数的平方值;,Dispersion,:,Dispersion,相似测量。,二值变量的相似性测度选项,Russell and Rao,:以二分点乘积为配对系数;,Simple matching,:以配对数与总对数的比例为配对系数;,Jaccard,:相似比例,分子与分母中的配对数与非配对数给予相同的权重;,Dice,:,Dice,配对系数,分子与分母中的配对数给予加倍的权重;,Rogers and Tanimoto,:,Rogers and Tanimoto,配对系数,分母为配对数,分子为非配对数,非配对数给予加倍的权重;,Sokal and Sneath 1,:,Sokal and Sneath,型配对系数,分母为配对数,分子为非配对数,配对数给予加倍的权重;,Sokal and Sneath 2,:,Sokal and Sneath,型配对系数,分子与分母均为非配对数,但分子给予加倍的权重;,Sokal and Sneath 3,:,Sokal and Sneath,型配对系数,分母为配对数,分子为非配对数,分子与分母的权重相同;,已知有我国六城市,2004,年各月的日照时数数据如表所示。请分析各城市日照数是否近似。,执行,【Analyze】/【Correlate】/【Distances】,命令,弹出,【Distances】,对话框,变量列表,选择变量,个案(观测量)标识变量,计算距离选项:,个案距离,计算个案间的距离;,变量距离,计算变量之间的距离,度量方式,等距间隔数据选项,计数数据选项,二值数值选项,转换转换选项,转换测度选项,结果解读,取值越大说明近似程度越低,反之亦然,例:测得,30,名,13,岁男童的身高、体重、肺活量的数据。对身高、体重和肺活量进行变量距离分析。,编号,身高,体重,肺活量,1,135.1,32,1570,2,139.9,30.4,2000,3,163.6,46.2,2750,4,146.5,33.5,2500,5,156.2,37.1,2750,6,156.4,35.5,2000,7,167.8,41.5,2750,8,149.7,31,1500,编号,身高,体重,肺活量,9,145,33,2500,10,148.5,37.2,2250,11,165.5,49.5,3000,12,135,27.6,1250,13,153.3,41,2750,14,152,32,1750,15,160.5,47.2,2250,16,153,47.2,1750,距离分析命令语句,PROXIMITIES,身高 体重 肺活量,/VIEW=VARIABLE,/MEASURE=CORRELATION,/STANDARDIZE=NONE.,结果分析,距离分析的相似性矩阵,也就是,Pearson,相关系数矩阵。从表中可以看出,,3,个变量之间,身高和体重的相关系数最大,为,0.735,,体现出两者之间具有更紧密的关系。比较而言,身高和肺活量之间的,Pearson,相关系数最小,两者之间的相似性测度也最小,体现出两者之间关系更远一些。,实例二 对飞机叶片的个案距离分析,利用三种不同的仪器对飞机的,10,只叶片半径分别进行了测量,下表给出了测试结果。现对,10,只叶片进行距离分析,。,10,只叶片的,3,次测量数据,第一次测量,38.32,38.16,38.19,37.94,38.22,37.73,37.57,37.63,38.07,38.47,第二次测量,38.44,38.07,37.98,38.16,37.88,37.94,37.88,37.82,38.25,38.13,第三次测量,37.76,38.28,37.85,37.82,38.32,37.54,37.51,37.88,37.98,38.63,步骤,将三次测量变量移入变量列表,选择“,Bewteen cases”,其余选择默认值。,命令语句为:,PROXIMITIES,第一次 第二次 第三次,/VIEW=CASE,/MEASURE=EUCLID,/STANDARDIZE=NONE.,距离分析的相似性矩阵,上表是个案距离分析的不相似矩阵。由于操作中利用默认选项选择距离统计量,所以这里的距离测度为,Euclidean,距
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!