实验九典型相关分析

上传人:痛*** 文档编号:72064398 上传时间:2022-04-07 格式:DOC 页数:14 大小:374.06KB
返回 下载 相关 举报
实验九典型相关分析_第1页
第1页 / 共14页
实验九典型相关分析_第2页
第2页 / 共14页
实验九典型相关分析_第3页
第3页 / 共14页
点击查看更多>>
资源描述
课时授课计划课次序号: 22一、课题:实验九 典型相关分析 二、课型:上机实验三、目的要求:1.掌握典型相关分析的理论与方法、模型的建立与显著性检验;2.掌握利用典型相关分析的SAS过程解决有关实际问题.四、教学重点:典型相关分析的SAS过程.教学难点:相关分析的理论与方法、模型的建立与显著性检验.五、教学方法及手段:传统教学与上机实验相结合六、参考资料:应用多元统计分析,高惠璇编,北京大学出版社,2005;使用统计方法与SAS系统,高惠璇编,北京大学出版社,2001;多元统计分析(二版),何晓群编,中国人民大学出版社,2008;应用回归分析(二版),何晓群编,中国人民大学出版社,2007;统计建模与R软件,薛毅编著,清华大学出版社,2007.七、作业:4.9 4.10八、授课记录:授课日期班次九、授课效果分析:实验九 典型相关分析(Canonical Correlation Analysis) (2学时)一、实验目的和要求 能利用原始数据与相关矩阵、协主差矩阵作相关分析,能根据SAS输出结果选出满足要求的几个典型变量二、实验内容 1.典型相关分析的SAS过程PROC CANCORR过程基本语句:PROC CANCORR ;VAR variables;WITH variables;RUN;说明:此过程输入数据可以是原始数据,也可以是相关系数矩阵或协方差矩阵,输出结果包含相关系数矩阵、典型相关系数、典型变量的系数、典型变量对之间的相关性检验的F统计量值、自由度、p值、典型变量与原始变量的相关系数等(1)proc cancorr语句的:l OUT=SAS 数据集创建含原始数据和典型相关变量得分(观测值)的SAS集l OUTSTAT=SAS 数据集创建含原始变量的样本均值、样本标准差、样本相关系数阵、典型相关系数和典型变量的标准化和非标准化系数等SAS集l CORR(或C)打印原始变量的样本相关系数矩阵l NCAN=m规定要求输出的典型变量对个数,默认为两组变量个数较小者l EDF=n-1针对输入原始数据集为样本相关系数矩阵或样本协方差矩阵,借此选项指定样本容量为观测个数减1输入为原始观测数据时,省略此项l all所有输出项l noprint不输出分析结果l short只输出典型相关系数和多元分析统计数l simple简单统计数l vname=变量名为var语句的变量定义名称l vprefix=前缀名为var语句的典型变量定义前缀l wname=变量名为with语句的变量定义名称l wprefix=前缀名为with语句的典型变量定义前缀(2)VAR variablesVAR后列出进行相关分析的第一组变量名称(3)WITH variablesWITH后列出进行相关分析的第二组变量名称var与with语句经常同proc cancorr语句一起使用其他语句类似corr过程2. 典型相关分析步骤两组随机变量,取值 组观测数据 , 标准化样本 样本相关系数矩阵 为总体相关系数矩阵的估计样本典型相关分析步骤:(1)求()的特征值 (2)求和对应的正交单位化特征向量和(3)第k对典型相关变量为,其中 样本典型相关系数为, (4)典型相关系数的显著性检验 统计量 检验值为 若,拒绝依次就进行检验,若对某个,检验值首次满足,则认为只有前对典型变量显著相关,选取前对即可注意:利用样本协方差矩阵,分析方法一样不需要对数据标准化处理3.实例分析例4.6 为研究空气温度与土壤温度的关系,考虑六个变量日最高土壤温度; 日最低土壤温度; 日土壤温度积分值; 日最高气温; 日最低气温; 日气温曲线积分值观测了天,数据如表4.7,做典型相关分析解:(1)建立输入数据集,程序如下:data examp4_6;input x1-x3 y1-y3;cards;85 59 151 84 65 14786 61 159 84 65 14983 64 152 79 66 14283 65 158 81 67 14788 69 180 84 68 16777 67 147 74 66 13178 69 159 73 66 13184 68 159 75 67 13489 71 195 84 68 16191 76 206 86 72 16991 76 206 88 73 17694 76 211 90 74 18794 75 211 88 72 17192 70 201 58 72 17187 68 167 81 69 15483 68 162 79 68 14987 66 173 84 69 16087 68 177 84 70 16088 70 169 84 70 16883 66 170 77 67 14792 67 196 87 67 16692 72 199 89 69 17194 72 204 89 72 18092 73 201 93 72 18693 72 206 93 74 18894 72 208 94 75 19995 73 214 93 74 19395 70 210 93 74 19695 71 207 96 75 19895 69 202 95 76 20296 69 173 84 73 17391 69 168 91 71 17089 70 189 88 72 17995 71 210 89 72 17996 73 208 91 72 18297 75 215 92 74 19696 69 198 94 75 19295 67 196 96 75 19594 75 211 93 76 19892 73 198 88 74 18890 74 197 88 74 17894 70 205 91 72 17595 71 209 92 72 19096 72 208 92 73 18995 71 208 94 75 19496 71 208 96 76 202;run;(2) 调用典型相关分析cancorr过程菜单操作方法为,选择Globals/SAS/Assist/Data analysis/multivariate/canonical correlation analysis(典型相关分析)菜单命令编程方法如下:proc cancorr data=examp4_6 corr; /*调用相关分析过程,打印样本相关系数矩阵*/var x1-x3; /* 第一组变量x1-x3*/with y1-y3; /* 第二组变量y1-y3*/run;由SAS proc cancorr过程求得样本相关系数矩阵SAS 系统 10:24 Sunday, November 2, 2008 14 The CANCORR Procedure Correlations Among the Original Variables Correlations Among the VAR Variables(变量x1-x3的相关系数矩阵) x1 x2 x3 x1 1.0000 0.5705 0.8751 x2 0.5705 1.0000 0.7808 x3 0.8751 0.7808 1.0000 Correlations Among the WITH Variables(变量y1-y3的相关系数矩阵) y1 y2 y3 y1 1.0000 0.6705 0.7850 y2 0.6705 1.0000 0.9324 y3 0.7850 0.9324 1.0000 Correlations Between the VAR Variables and the WITH Variables变量x1-x3与y1-y3的相关系数矩阵 y1 y2 y3 x1 0.7136 0.8400 0.9143 x2 0.3796 0.6809 0.5907 x3 0.6256 0.8185 0.8695变量间高度相关。 SAS 系统 10:24 Sunday, November 2, 2008 15 The CANCORR Procedure Canonical Correlation Analysis典型相关分析的一般结果 Adjusted Approximate Squared Canonical Canonical Standard Canonical Correlation Correlation Error Correlation 典型相关系数 校正的典型相关系数 近似的标准误 典型相关系数平方 1 =0.927857 0.922345 0.020733 =0.860919 2 =0.562181 0.539833 0.101958 =0.316047 3 =0.165974 . 0.144965 =0.027547(3)检验各对典型变量是否显著相关 表4.8 各对典型变量相关性检验结果 Eigenvalues of Inv(E)*H Test of H0: The canonical correlations in the = CanRsq/(1-CanRsq) 即 current row and all that follow are zero Likelihood Approximate Eigenvalue Difference Proportion Cumulative Ratio F Value Num DF Den DF Pr F 各对相关系 相邻两特 特征值占 特征值占方差 似然比 值 数特征值 征值之差 方差比例 比例累计值 1 6.1901 5.7280 0.9266 0.9266 0.09250440 17.98 9 97.5 F 统计方法 F值 检验p值 Wilks Lambda 0.09250440 17.98 9 97.5 .0001 Pillais Trace 1.20451366 9.39 9 126 .0001 Hotelling-Lawley Trace 6.68047081 29.18 9 59.755 .0001 Roys Greatest Root 6.19005360 86.66 3 42 F 1 108.9112 99.0575 0.9118 0.9118 0.00049778 141.58 9 58.56 .0001 2 9.8536 9.1696 0.0825 0.9943 0.05471158 40.94 4 50 F Wilks Lambda 0.00049778 141.58 9 58.56 .0001 Pillais Trace 2.30494685 28.74 9 78 .0001 Hotelling-Lawley Trace 119.44881991 309.86 9 34.667 .0001 Roys Greatest Root 108.91116421 943.90 3 26 .0001 NOTE: F Statistic for Roys Greatest Root is an upper bound. SAS 系统 2008年08月01日 星期五 下午09时25分34秒 3 The CANCORR Procedure Canonical Correlation Analysis Raw Canonical Coefficients for the VAR Variables V1 V2 V3 x1 0.006674773 0.0352304459 -0.054341051 x2 0.0318235747 -0.012479334 -0.005196029 x3 -0.002099295 0.0125781113 0.0592150232 Raw Canonical Coefficients for the WITH Variables W1 W2 W3 y1 0.0286177622 -0.030407375 -0.066162702 y2 0.0008426431 0.0456854586 -0.048655023 y3 0.0060022012 0.0139185651 0.116965176 SAS 系统 2008年08月01日 星期五 下午09时25分34秒 4 The CANCORR Procedure 标准化数据典型相关分析 Canonical Correlation Analysis Standardized Canonical Coefficients for the VAR Variables V1 V2 V3 x1 0.1489 0.7857 -1.2120 x2 0.9770 -0.3831 -0.1595 x3 -0.0520 0.3116 1.4671 Standardized Canonical Coefficients for the WITH Variables W1 W2 W3 y1 0.8575 -0.9111 -1.9825 y2 0.0193 1.0463 -1.1143 y3 0.1454 0.3371 2.8332给出的三个特征值 , 第一特征根贡献率,选一对就可以。也说明,两组变量高度相关。第一对典型变量主要高学历、低学历加权与网络调查差异。主要艺术家、部门主管、发行部门加权。第一对典型变量主要表现高低学历打分与艺术家部门主管打分的关系。网络调查占比例小。第一组(高学历)打分高,则第二组打分也高。说明二者具有高度的一致性。特别是高学历的打分和专家打分高度一致,第一对典型相关系数为第二、第三对典型变量及典型相关系数主要低学历、网络和高学历打分差异主要发行部门、部门主管和艺术家打分的差异。第二对变量主要表现低学历与发行部门打分的关系。低学历打分高,则发行部门打分高。低学历占人群比例高,发行部门打分主要看是否符合大众口味。 SAS 系统 2008年08月01日 星期五 下午09时25分34秒 5 The CANCORR Procedure Canonical Structure Correlations Between the VAR Variables and Their Canonical Variables V1 V2 V3 x1 0.3325 0.9248 -0.1847 x2 0.9933 -0.1008 0.0566 x3 0.3827 0.7530 0.5352 Correlations Between the WITH Variables and Their Canonical Variables W1 W2 W3 y1 0.9970 -0.0647 -0.0435 y2 0.5710 0.8112 -0.1258 y3 0.9222 0.2738 0.2731 Correlations Between the VAR Variables and the Canonical Variables of the WITH Variables W1 W2 W3 x1 0.3310 0.8812 -0.1177 x2 0.9888 -0.0961 0.0361 x3 0.3809 0.7175 0.3411 Correlations Between the WITH Variables and the Canonical Variables of the VAR Variables V1 V2 V3 y1 0.9924 -0.0616 -0.0277 y2 0.5684 0.7730 -0.0802 y3 0.9180 0.2609 0.1
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!