第1章 多元统计分析的应用和多元统计数据的图表示法

上传人:fgh****35 文档编号:245190259 上传时间:2024-10-07 格式:PPT 页数:30 大小:1.41MB
返回 下载 相关 举报
第1章 多元统计分析的应用和多元统计数据的图表示法_第1页
第1页 / 共30页
第1章 多元统计分析的应用和多元统计数据的图表示法_第2页
第2页 / 共30页
第1章 多元统计分析的应用和多元统计数据的图表示法_第3页
第3页 / 共30页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,赵世,舜,数学,楼,426,第一章多元统计分析的应用和 多元统计数据的图表示法,第一节,引言,第二节,轮廓图,第三节,雷达图,第四节,散布图矩阵,第一节 引言,什么是多元统计分析,用于的领域,如何处理数据,什么样的方法,第一节 引言,什么是多元统计分析,高维数据,降维,分类,变量间的相互关系,统计推断,第一节 引言,用于的领域,教育,服饰,医学,经济,气象,农业,环境,社会科学,地址,文学,第一节 引言,如何处理数据,第一节 引言,什么样的方法,第二节,轮廓图,图表示法,众所周知,图形是我们直观了解、认识数据的一种可视化手段。如果能将所研究的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图等就是我们常用的二维平面图示方法。虽然三维数据也可以用三维图形来表示,但观测三维数据却存在一定的难度,而且在许多实际问题中,多变量数据的维数通常又都大于,3,,那么如何用图形直观表现三维以上的数据呢?自上世纪,70,年代以来,多变量数据的可视化分析研究就一直是人们关注的一个问题。,从研究的成果来看,主要可以分为两类,:,一类是使高维空间的点与平面上的某种图形对应,这种图形能反映高维数据的某些特点或数据间的某些关系;,另一类是对多变量数据进行降维处理,在尽可能多地保留原始信息的原则下,将数据的维数降为,2,维或,1,维,然后再在平面上表示。例如后面将要介绍的主成分分析方法、因子分析方法、多维尺度法等就属于此类方法。,下表是我国华北地区,5,个省市,2003,年城镇居民家庭平均每人全年消费性支出的六项指标数据考虑微机的普及应用,图形的制作则通过电脑实现。轮廓图、矩阵散点图在,SPSS,中制作,雷达图则在,EXCEL,中实现。,表 华北,5,省市城镇居民家庭消费性支出,第二节 轮廓图,轮廓图是将多个样品观测数据以折线的方式表示在平面图中的一种多变量可视化图形。轮廓图用线段的升降来表示变量的大小,常用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。,轮廓图的作图原理如下:,(,1,)作平面坐标系,横坐标取,p,个点,表示,p,个变量,纵坐,标表示变量取值。,(,2,)对给定的样品观测值,在,p,个点的纵坐标上标出相应的,变量取值。,(,3,)将表示,p,个变量取值的点连接成一条折线,即得到了表,示一个样品观测数据的折线,,n,次观测可绘出,n,条折 线,构成多变量轮廓图。,在,SPSS,中作轮廓图的方法如下:,(,1,)将原始数据输入,SPSS,中。把不同地区当成变量,而把支出指标当成观测。,作轮廓图时的数据组织形式,(,2,)选择菜单项,GraphsLine,,打开,Line Charts,对话框,如图。在对话框上方的三个选项用于选择轮廓图的形式,由于是这里是多变量作图,所以选择,Multiple,。在对话框下面的三个选项中选择,Value of individual cases,。单击,Define,按钮,打开,Define Multiple Line,对话框。,Line Charts,对话框,(,3,)在,Define Multiple Line,对话框中,将代表不同地区的,5,个变量移入,Lines Represent,列表框中,将代表支出指标的变量(,variable,)移入,Variable,框中。单击,OK,按钮,即可作出如图所示的轮廓图。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省则几乎每项支出都是最低的。,Define Multiple Line,对话框,轮廓图,第五节 雷达图,雷达图是一种较为常用的多变量可视化图形。在雷达图中,每个变量都有它自己的数值轴,每个数值轴都是从中心向外辐射。由于图形就好像雷达荧光屏上的图像,故称其为雷达图。又像蜘蛛网,所以也称蛛网图。,雷达图的作图方法:,(,1,)作一圆,并按变量的个数,p,将圆周分成,p,等分。,(,2,)连接圆心和各分点,将这,p,条半径连线依次定义为各变量的坐标轴,并标以适当的刻度。,(,3,)对给定的一次观测值,将每个变量值分别标在相应的坐标轴上,把,p,个点相连就形成了一个,p,边形,,n,次观测值就可画出,n,个,p,边形。,例如,根据前表中的数据,调用,EXCEL,图表向导,即可制作出如图,1,7,所示的雷达图。图,1,画出了北京、天津和河北的雷达图,从图可以看出,三省市消费支出结构有较大差异。北京人均消费支出的各项指标都高,对应面积最大的六边形,其次是天津,在三个省市中面积最小的是河北,天津在居住支出方面与北京较为接近,而在衣着和交通、通讯支出方面则与河北接近。其他支出方面三地存在较大差异。利用雷达图的形状、面积大小,可以对样品进行初始分类分析。,为了加强雷达图的效果,在雷达图中适当的分配坐标轴是很重要的,具体的分配办法要结合分析的问题而定。例如可将要对比的指标分布在左、右或上、下方,以便于对比分析。,当观测次数,n,较大和指标较多时,画出的雷达图线段太多,图形的效果会很差。为了获得较好的可视化效果,在一张雷达图上可以画几个样品观测数据,甚至一张雷达图只画一个样品观测数据。如图,1,7,所示,对这些图进行比较分析,也可了解其特点。,图,1,图,2,图,3,图,4,图,5,图,6,图,7,第四节 散点图分析法,散点图又称散布图,它是以点的分布反映变量之间相关关系的可视化方法。矩阵散点图则是一种反映多个变量之间相关关系的二维散点图。,利用,SPSS,制作矩阵散点图的步骤如下:,(,1,)在,SPSS,中按图,11.6,的形式组织数据,即把支出指标当成变量,而把不同地区当成观测。,图,11.6,作散点图时的数据组织形式,(,2,)选择菜单项,GraphsScatter,,打开,Scatter plot,对话框,如图,11.7,。该对话框用于选择散点图的形式。选定,Matrix,,即矩阵散点图,单击,Define,按钮,打开,Scatter plot Matrix,对话框,如图,11.8,。,图,11.7 Scatter plot,对话框,图,11.8 Scatter plot Matrix,对话框,(,3,)在打开的,Scatter plot Matrix,对话框中,将食品、衣着、居住三个变量移入,Matrix Variables,列表框中,将标志变量,region,移入,Label Cases by,列表框中。,(,4,)点击,OK,按钮,得到如图,11.9,所示的矩阵散点图。,从图,11.9,可以看出,河北、山西、内蒙古在居住和食品消费支出方面与北京、天津相比较低,食品与居住支出变量之间存在一定的线性关系。天津在衣着支出方面较低,与最低的河北接近,与最高居住支出形成鲜明对比。北京则除在居住支出方面低于天津外,其他方面支出均高于华北其他省市。内蒙古则在衣着支出方面仅次于北京,显示出某种特殊消费特征。,矩阵散点图,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 营销创新


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!