第九章 对应分析1

上传人:痛*** 文档编号:244595976 上传时间:2024-10-05 格式:PPT 页数:39 大小:1.17MB
返回 下载 相关 举报
第九章 对应分析1_第1页
第1页 / 共39页
第九章 对应分析1_第2页
第2页 / 共39页
第九章 对应分析1_第3页
第3页 / 共39页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Ma,Xin, North China Electric Power University,第九章 对应分析,Correspondence Analysis,列联表(,contingency table,)分析,对应分析的基本思路,对应分析的理论推导,对应分析的,SPSS,实现,一、列联表分析,列联表,contingency table,用来描述定类尺度和定序尺度数据的各种状态或是相关关系,从上表可以得到的信息:不同年龄顾客对公司产品的偏好、所有顾客整体评价、顾客结构、年龄结构与偏好的相关关系,两变量列联表的一般形式,频数,频率表:,边缘概率,边缘概率,联合概率:特性,A,第,i,种状态与特性,B,第,j,种状态出现的概率,两变量间相关关系的检验,如果变量,A,和,B,是独立的,则应有,检验假设:,如果拒绝原假设,我们希望进一步了解两变量各种状态之间的关系对应分析,例:手机消费者产品偏好研究,列联表分析例:,收入水平与,PDA,analyzedescriptive,statistics ,crosstab,显示频数分布柱形图,控制变量,/,分层变量,Cell:,单元格输出内容,显示观测频数,显示频率,显示行百分比,显示列百分比,显示总百分比,Statistics:,2,检验,列联表分析例:,收入水平与,PDA,频率表,: row,随着收入的水平的提高,拥有,PDA,的人数增多,频率表:,total,检验:不同收入水平拥有,PDA,数量上的差异是否来自于纯随机性?,检验结果:拒绝原假设,两变量间有显著相关性,控制第三变量,:,受教育水平,通常受教育水平越高,工资越高,收入与,PDA,的相关性实质上主要来自于受教育水平与,PDA,的相关性,受教育水平与,PDA:,控制收入水平,二、对应分析的基本思路,:,对行元素与列元素提取主成分,Row Profile Matrix,Column Profile Matrix,Principal Coordinates,Can we put them on the same axes?,Principal Correspondence Analysis,一个实例:郑州潜在手机顾客偏好调查,手机潜在用户:,7,个特征属性,4,个年龄特征“,18-25,岁”、“,26-35,岁”、“,36-45,岁”、“,46-55,岁”,3,个文化程度特征“初中以下”、“高中,/,中专”和“大学及以上”。,手机:,7,个特征属性,“待机时间长”、“大显示屏”、“操作简单”、“外观时尚”、“功能强”、“价格合理”和“信号接收好”。,研究人员希望通过对应分析发现不同特征属性的手机潜在顾客对手机属性特征的偏好。,表一 潜在用户调研基础数据:行元素、列元素均为七维空间中的点,计算惯量,确定维度:行、列均简化到二维空间,各维度的惯量、奇异值,六个非零特征根,累积方差贡献,(,1,)各类别在行维度上的得分(投影),计算行、列在各维度的得分(投影),各水平样本数占总数比例,两主成分的变量共同度,(,2,)各类别在列维度上的得分(投影),计算行、列在各维度的得分(投影),对应分析图(定位图):行、列主成分得分放在一张图中,外观时尚,功能强,大显示屏,价格合理,接收信号好,待机时间长,操作简单,18-25,岁,初中以下,46-55,岁,高中,/,中专,大学及以上,26-35,岁,36-45,岁,(,1,)“初中及以下”学历:“操作简单”。 (,2,)年龄“,18-25”,青年: “外观时尚” (,3,)年龄“,46-55”,之间、“高中,/,中专”学历:“大屏显示”。 (,4,)年龄“,26-45”,之间: “待机时间长”和“信号接收好”。,三、对应分析的理论推导,数据规格化:,行截面:,R,p,中的,n,个点,列截面:,R,n,中的,p,个点,数据规格化,-,续,行截面:概率加权坐标向量,样品间欧式距离,加权欧式距离,不同指标间数量级差异会开来困扰,间的欧式距离,可以看成点 :,行截面提取主成分,变换后的行截面矩阵为,P,r,的协方差阵为,:,列截面提取主成分:与行截面类似有,根据矩阵知识可知,,r,=ZZ,和,c,=ZZ,有完全相同的非零特征根,设为,1, ,2, ,p,设,1,r,为对应,1, ,r,的,r,的特征向量,则有,:,两边左乘,Z:,(,Z,j,),即为对应,j,的,c,的特征向量,这建立了,R,型因子分析与,Q,型因子分析的关系,且因,r,和,c,有相同非零特征根,因此提取公因子数和累积方差贡献都相同,四、对应分析的,SPSS,实现,analyzedata,reductioncorrespondence,analysis,定义变量取值范围,模型:,提取因子数,主要分析行列变量的联系,输出统计量,列联表,行变量之因子载荷、方差贡献等,频数的行百分比,输出图形,行列变量对应图,行变量载荷图,行变量各分类因子载荷图,例:,收入水平与学历,总惯量,非零特征根,累积方差贡献,2,统计量及其,p,值,2,=n,.,总惯量,显著:列联表行列之间有较强的相关性,边缘概率,因子得分,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!