资源描述
2024/4/11中国人民大学六西格玛质量管理研究中心1第九章第九章 多变量的图表示法多变量的图表示法 目录 上页 下页 返回 结束 9.1 9.1 散点图矩阵散点图矩阵 9.2 9.2 脸谱图脸谱图 9.3 9.3 雷达图与星图雷达图与星图 9.4 9.4 星座图星座图 2024/4/11中国人民大学六西格玛质量管理研究中心2第九章第九章 多变量的图表示法多变量的图表示法 目录 上页 下页 返回 结束 图形是对资料进行探索性研究的重要工具,当人们在运图形是对资料进行探索性研究的重要工具,当人们在运用其它统计方法对所得资料进行分析之前,往往习惯于把各用其它统计方法对所得资料进行分析之前,往往习惯于把各资料在一张图上画出来,以直观地反映资料的分布情况及各资料在一张图上画出来,以直观地反映资料的分布情况及各变量之间的相关关系。当变量较少时,可以采用直方图、条变量之间的相关关系。当变量较少时,可以采用直方图、条形图、饼图、散点图或是经验分布的密度图等方法,对于变形图、饼图、散点图或是经验分布的密度图等方法,对于变量个数少于量个数少于3的情况,这样做是简单而有效的。而当变量个数的情况,这样做是简单而有效的。而当变量个数为为3时,虽然仍可以做三维的散点图,但这样做已经不是很方时,虽然仍可以做三维的散点图,但这样做已经不是很方便,当变量个数大于便,当变量个数大于3时,就不能用通常的方法作图了。自时,就不能用通常的方法作图了。自20世纪七十年代以来,统计学家研究发明了很多多维变量的图世纪七十年代以来,统计学家研究发明了很多多维变量的图表示方法,以借助图形来描述多元资料的统计特性,使图形表示方法,以借助图形来描述多元资料的统计特性,使图形直观、简洁的优点延伸到多变量的研究中去。本章主要介绍直观、简洁的优点延伸到多变量的研究中去。本章主要介绍散点图矩阵、脸谱图、雷达图等多变量的图表示法的基本思散点图矩阵、脸谱图、雷达图等多变量的图表示法的基本思想及作图方法。想及作图方法。2024/4/11中国人民大学六西格玛质量管理研究中心3第九章第九章 多变量的图表示法多变量的图表示法 目录 上页 下页 返回 结束 因为对资料的图表示法只是以一种直观的方式因为对资料的图表示法只是以一种直观的方式再现资料,不同的研究者习惯的资料显示方式可能再现资料,不同的研究者习惯的资料显示方式可能会有很大不同,因此,不同于其它统计方法,大部会有很大不同,因此,不同于其它统计方法,大部分图表示法都没有非常严格的画图方法,研究者可分图表示法都没有非常严格的画图方法,研究者可以根据自己的习惯设定某些规则以更方便地揭示资以根据自己的习惯设定某些规则以更方便地揭示资料之间的联系。故此,本章对各种图表示方法原则料之间的联系。故此,本章对各种图表示方法原则上只给出作图的思想及思路,而不对严格的数学公上只给出作图的思想及思路,而不对严格的数学公式作过多说明。式作过多说明。2024/4/11中国人民大学六西格玛质量管理研究中心49.1 9.1 散点图矩阵散点图矩阵 目录 上页 下页 返回 结束 散点图矩阵是借助两变量散点图的作图方法,它可以看散点图矩阵是借助两变量散点图的作图方法,它可以看作是一个大的图形方阵,其每一个非主对角元素的位置上是作是一个大的图形方阵,其每一个非主对角元素的位置上是对应行的变量与对应列的变量的散点图。而主对角元素位置对应行的变量与对应列的变量的散点图。而主对角元素位置上是各变量名,这样,借助散点图矩阵可以清晰地看到所研上是各变量名,这样,借助散点图矩阵可以清晰地看到所研究多个变量两两之间的相关关系。由此也可以看出,散点图究多个变量两两之间的相关关系。由此也可以看出,散点图矩阵方法还不是真正意义上的多变量作图方法,它研究的仍矩阵方法还不是真正意义上的多变量作图方法,它研究的仍是两两变量之间的相关关系,而不能直接反映多个变量之间是两两变量之间的相关关系,而不能直接反映多个变量之间的关系,借助它来对资料分类也是比较困难的;然而,因其的关系,借助它来对资料分类也是比较困难的;然而,因其直观,简单,容易理解,散点图矩阵还是越来越受到了广大直观,简单,容易理解,散点图矩阵还是越来越受到了广大实际工作者的喜爱,很多统计软件也加入了作散点图矩阵的实际工作者的喜爱,很多统计软件也加入了作散点图矩阵的功能。下面我们举例说明如何用功能。下面我们举例说明如何用SPSS软件作散点图矩阵对资软件作散点图矩阵对资料进行分析。料进行分析。2024/4/11中国人民大学六西格玛质量管理研究中心59.1 9.1 散点图矩阵散点图矩阵 目录 上页 下页 返回 结束 例例9.1 以以SPSS软件自带的软件自带的world95.sav资料为例,该资料共资料为例,该资料共有有26个变量个变量109条观测,是条观测,是1995年世界年世界109个国家和地区的基个国家和地区的基本发展情况的资料。选择该数据如下几个变量作图:本发展情况的资料。选择该数据如下几个变量作图:density(每平方公里人口数)、(每平方公里人口数)、lifeexpf(女性预期寿命)、(女性预期寿命)、lifeexpm(男性预期寿命)、(男性预期寿命)、babymort(婴儿死亡率)、(婴儿死亡率)、gdp_cap(GDP是总资产的倍数)、是总资产的倍数)、calories(每日摄入热量)(每日摄入热量)打开资料集打开资料集world95.sav,依次点选,依次点选GraphsScatter进入进入Scatterplot对话框;选中对话框;选中Matrix(矩阵矩阵)左侧的图标,点击左侧的图标,点击Define按钮,进入按钮,进入Scatterplot Matrix对话框,依次选择上面对话框,依次选择上面五个变量,点击五个变量,点击OK键运行,则生成如下图形:键运行,则生成如下图形:2024/4/11中国人民大学六西格玛质量管理研究中心69.1 9.1 散点图矩阵散点图矩阵 目录 上页 下页 返回 结束 输出结果输出结果9.1:2024/4/11中国人民大学六西格玛质量管理研究中心79.1 9.1 散点图矩阵散点图矩阵 目录 上页 下页 返回 结束 由散点图矩阵可以看到,每平方公里人口数与其它由散点图矩阵可以看到,每平方公里人口数与其它各变量的相关性均不明显,男性的预期寿命,女性的预期各变量的相关性均不明显,男性的预期寿命,女性的预期寿命及婴儿死亡率三个变量之间有明显的线性相关系,而寿命及婴儿死亡率三个变量之间有明显的线性相关系,而GDP是总资产的倍数与上面三个变量存在着某种曲线相是总资产的倍数与上面三个变量存在着某种曲线相关关系。由此可以看出其它变量之间的相关关系,在此不关关系。由此可以看出其它变量之间的相关关系,在此不再赘述。另外,再赘述。另外,SPSS软件还有一些选项可以帮助我们由软件还有一些选项可以帮助我们由散点图矩阵得到更多信息,资料集散点图矩阵得到更多信息,资料集world95.sav中变量中变量religion的含义是主要的宗教信仰,在的含义是主要的宗教信仰,在Scatterplot Matrix对话框中将对话框中将religion变量选作标记变量(选入变量选作标记变量(选入set markers by)框中,则在输出的散点图矩阵中,不同宗)框中,则在输出的散点图矩阵中,不同宗教信仰的国家以不同的颜色画出,借此可以作更详细的分教信仰的国家以不同的颜色画出,借此可以作更详细的分析,此处不再详述。析,此处不再详述。2024/4/11中国人民大学六西格玛质量管理研究中心89.1 9.1 散点图矩阵散点图矩阵 目录 上页 下页 返回 结束 另外,有些统计软件(如另外,有些统计软件(如 Statistica 软件)提软件)提供的画散点图矩阵的模块同时在主对角线上可以供的画散点图矩阵的模块同时在主对角线上可以画出相应变量的直方图,这样就在散点图矩阵上画出相应变量的直方图,这样就在散点图矩阵上提供了更多的信息,即同时能通过该图了解各变提供了更多的信息,即同时能通过该图了解各变量的分布情况。对于量的分布情况。对于Statistica软件的用法这里不软件的用法这里不做过多说明,对于上面的资料,用做过多说明,对于上面的资料,用Statistica软件软件作散点图矩阵得到结果如下:作散点图矩阵得到结果如下:2024/4/11中国人民大学六西格玛质量管理研究中心99.1 9.1 散点图矩阵散点图矩阵 目录 上页 下页 返回 结束 输出结果输出结果9.2:2024/4/11中国人民大学六西格玛质量管理研究中心109.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 2024/4/11中国人民大学六西格玛质量管理研究中心119.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 脸谱图分析法的基本思想是由脸谱图分析法的基本思想是由1518个指针决个指针决定脸部特征,若实际资料变量更多将被忽略(有新的定脸部特征,若实际资料变量更多将被忽略(有新的画图方法取消了脸的对称性并引入更多脸部特征从而画图方法取消了脸的对称性并引入更多脸部特征从而最多可以用最多可以用36个变量来画脸谱),若实际资料变量较个变量来画脸谱),若实际资料变量较少则脸部有些特征将被自动固定。统计学曾给出了几少则脸部有些特征将被自动固定。统计学曾给出了几种不同的脸谱图的画法,而对于同一种脸谱图的画法,种不同的脸谱图的画法,而对于同一种脸谱图的画法,将变量次序重新排列,得到的脸谱的形状也会有很大将变量次序重新排列,得到的脸谱的形状也会有很大不同。此处我们不对脸谱的各个部位与原始变量的数不同。此处我们不对脸谱的各个部位与原始变量的数学关系作过多探讨,而只说明其作图的思想及软件实学关系作过多探讨,而只说明其作图的思想及软件实现方法。现方法。2024/4/11中国人民大学六西格玛质量管理研究中心129.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 按照按照H.Chernoff 于于1973年提出的画法,采用年提出的画法,采用15个指标,个指标,各指标代表的面部特征为:各指标代表的面部特征为:1表示脸的范围,表示脸的范围,2表示脸的形状,表示脸的形状,3表示鼻子的长度,表示鼻子的长度,4表示嘴的位置,表示嘴的位置,5表示笑容曲线,表示笑容曲线,6表示表示嘴的宽度,嘴的宽度,711分别表示眼睛的位置,分开程度,角度,形分别表示眼睛的位置,分开程度,角度,形状和宽度,状和宽度,12表示瞳孔的位置,表示瞳孔的位置,1315分别表示眼眉的位置,分别表示眼眉的位置,角度及宽度。这样,按照各变量的取值,根据一定的数学函角度及宽度。这样,按照各变量的取值,根据一定的数学函数关系,就可以确定脸的轮廓、形状及五官的部位、形状,数关系,就可以确定脸的轮廓、形状及五官的部位、形状,每一个样本点都用一张脸谱来表示。而脸谱容易给人们留下每一个样本点都用一张脸谱来表示。而脸谱容易给人们留下较为深刻的印象,通过对脸谱的分析,就可以直观地对原始较为深刻的印象,通过对脸谱的分析,就可以直观地对原始资料进行归类或比较研究。资料进行归类或比较研究。2024/4/11中国人民大学六西格玛质量管理研究中心139.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 例例9.2以我国以我国35个上市公司的八大评价指标为例说明个上市公司的八大评价指标为例说明(数据数据略略)见参考文献见参考文献20。SPlus软件收入了脸谱图的作图方法,软件收入了脸谱图的作图方法,下面我们举例说明如何用下面我们举例说明如何用SPlus软件画脸谱图。软件画脸谱图。SPlus画画脸谱图的方法非常简单,只要调用脸谱图的方法非常简单,只要调用faces函数就可以实现了。函数就可以实现了。将前面的资料的数字部分输入将前面的资料的数字部分输入SPlus,并令文件名为,并令文件名为gongsi.sdd,在命令窗口调用下面的函数:,在命令窗口调用下面的函数:faces(data.matrix(gongsi),fill=T,which=1:8,head=Faces of 35 ompanies,ncol=5,scale=T,byrow=T)回连运行就可以生成回连运行就可以生成35个公司的脸谱图,每一个公司用一个公司的脸谱图,每一个公司用一张脸谱表示出来,但是,此时生成的脸谱图不好与公司名对应,张脸谱表示出来,但是,此时生成的脸谱图不好与公司名对应,可将可将35个公司名放入一个向量个公司名放入一个向量a中,然后在上面的命令中加入中,然后在上面的命令中加入选项选项labels=a,即可生成如下脸谱图:,即可生成如下脸谱图:2024/4/11中国人民大学六西格玛质量管理研究中心149.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 输出结输出结果果9.3:2024/4/11中国人民大学六西格玛质量管理研究中心159.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 对对faces函数的子选项作简要说明,因为完整函数的子选项作简要说明,因为完整的脸谱图共需的脸谱图共需15个变量,而此处只有八个变量,个变量,而此处只有八个变量,Fill=T是指将由后七个变量决定的脸的部位画在相是指将由后七个变量决定的脸的部位画在相应的中央位置,应的中央位置,which=1:8是指用资料集是指用资料集gongsi的前八列画脸谱图,的前八列画脸谱图,head指定图的标题,指定图的标题,ncol确确定输出时每列输出脸谱图的个数,定输出时每列输出脸谱图的个数,scale=T指在画指在画脸谱图时将各变量都变换到脸谱图时将各变量都变换到(0,1)之间,之间,byrow=T是指输出时脸谱图列行排列,这有助于我们将脸是指输出时脸谱图列行排列,这有助于我们将脸谱图与相应的公司名对应起来。谱图与相应的公司名对应起来。2024/4/11中国人民大学六西格玛质量管理研究中心169.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 脸谱图给人的感觉形象直观,容易留下较深刻的印象,脸谱图给人的感觉形象直观,容易留下较深刻的印象,可以根据脸谱图来对各公司的运营能力进行比较,比如根据可以根据脸谱图来对各公司的运营能力进行比较,比如根据脸的范围(净资产收益率)来看,方正科技,清华同方,粤脸的范围(净资产收益率)来看,方正科技,清华同方,粤电力,深南电,金丰投资等公司处于较高水平,而象渝开发,电力,深南电,金丰投资等公司处于较高水平,而象渝开发,粤宏远,寰岛实业等公司明显处于较低水平,类似可以对其粤宏远,寰岛实业等公司明显处于较低水平,类似可以对其他指标进行分析。利用脸谱图,还可以直观地对各个公司进他指标进行分析。利用脸谱图,还可以直观地对各个公司进行归类。由上图看来,方正科技、深南电、深能源、中兴通行归类。由上图看来,方正科技、深南电、深能源、中兴通讯、粤电力、清华同方、金丰等公司大致可以归为一类,穗讯、粤电力、清华同方、金丰等公司大致可以归为一类,穗恒运、长城计算机、永鼎光缆、宏图高科大致可以归为一类,恒运、长城计算机、永鼎光缆、宏图高科大致可以归为一类,富龙热力、韶能股分、惠天热电、大连热电、华银电力、长富龙热力、韶能股分、惠天热电、大连热电、华银电力、长春经开、新黄浦、辽房天、三木集团、青鸟华光、海星科技、春经开、新黄浦、辽房天、三木集团、青鸟华光、海星科技、龙电股分等公司可以归为一类,龙电股分等公司可以归为一类,剩余的公司大体可以归为一剩余的公司大体可以归为一类。此处不再详述。类。此处不再详述。2024/4/11中国人民大学六西格玛质量管理研究中心179.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 在利用脸谱图工具对观测进行比较分析时,值在利用脸谱图工具对观测进行比较分析时,值得注意的一点是脸谱的形状受各变量次序的影响很得注意的一点是脸谱的形状受各变量次序的影响很大,在本例中如果把八个指标的次序换一下,得到大,在本例中如果把八个指标的次序换一下,得到的脸谱图就会有很大不同。而且,根据脸谱图对各的脸谱图就会有很大不同。而且,根据脸谱图对各公司的归类有很大的主观性,因为不同的人所关注公司的归类有很大的主观性,因为不同的人所关注的脸的部位有很大不同,如有些人对脸的胖瘦比较的脸的部位有很大不同,如有些人对脸的胖瘦比较在意,而有的人对五官的印象特别深,因此对同样在意,而有的人对五官的印象特别深,因此对同样的脸谱图,不同的人可能得到不同的结论,在实际的脸谱图,不同的人可能得到不同的结论,在实际分析中,该方法必须与聚类,相关等定量分析相结分析中,该方法必须与聚类,相关等定量分析相结合才能得到比较合理可信的结论。合才能得到比较合理可信的结论。2024/4/11中国人民大学六西格玛质量管理研究中心189.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 例例93 表表9-1是五大钢铁公司反映经营状况的八是五大钢铁公司反映经营状况的八大指标,为了比较国内钢铁公司与韩国蒲项大指标,为了比较国内钢铁公司与韩国蒲项钢铁公司的差距,下面做出韩国蒲项钢铁公钢铁公司的差距,下面做出韩国蒲项钢铁公司、宝钢、鞍钢、武钢、首钢五家钢铁公司司、宝钢、鞍钢、武钢、首钢五家钢铁公司的脸谱图。的脸谱图。2024/4/11中国人民大学六西格玛质量管理研究中心199.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 表9-1:项目项目宝钢宝钢鞍钢鞍钢武钢武钢首钢首钢浦项浦项负债保障率负债保障率2.892.892.952.952.342.341.851.853.123.12长期负债倍数长期负债倍数5.165.169.159.156.076.072.632.636.966.96流动比率流动比率1.311.311.831.831.161.162.222.222.12.1资产利润率资产利润率21.7121.7117.3417.3424.7724.7711.8911.8925.3425.34收入利润率收入利润率23.1723.1711.3311.3319.5519.557.67.622.2822.28成本费用利润率成本费用利润率30.2330.2312.7612.7624.8124.818.058.0528.5228.52净利润现金比率净利润现金比率1.791.790.90.91.71.71.091.091.31.3三年资产平均增长率三年资产平均增长率1.481.487.287.2863.363.311.7611.7613.1813.18三年销售平均增长率三年销售平均增长率20.0720.0729.1929.1952.8852.8818.7718.7724.1624.16三年平均资本增长率三年平均资本增长率11.0411.0410.510.548.9548.957.637.6317.5117.512024/4/11中国人民大学六西格玛质量管理研究中心209.2 9.2 脸谱图脸谱图 目录 上页 下页 返回 结束 2024/4/11中国人民大学六西格玛质量管理研究中心219.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 一、雷达图一、雷达图2024/4/11中国人民大学六西格玛质量管理研究中心229.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 EXCEL软件提供了画雷达图的功能,它适软件提供了画雷达图的功能,它适合于观测数较少的情形,这时可以方便地把各观合于观测数较少的情形,这时可以方便地把各观测画到一张图里面,便于对各指标进行对比,但测画到一张图里面,便于对各指标进行对比,但是,当观测数比较多时,画到一张雷达图里面就是,当观测数比较多时,画到一张雷达图里面就不太容易看出各观测之间的接近程度,用不太容易看出各观测之间的接近程度,用EXCEL当然也可以对每一个观测画一张雷达图,但此时当然也可以对每一个观测画一张雷达图,但此时转差率已经很低了。转差率已经很低了。S-Plus软件也收入了雷达图软件也收入了雷达图的画法,下面我们举例说明雷达图的画法。的画法,下面我们举例说明雷达图的画法。2024/4/11中国人民大学六西格玛质量管理研究中心239.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 例例9.4资料仍取我国资料仍取我国35个上市公司的资料。常见的个上市公司的资料。常见的EXCEL就可画出很漂亮的雷达图。用就可画出很漂亮的雷达图。用EXCEL画雷达画雷达图的方法,比如仅对深能源和深南电两公司画雷达图,图的方法,比如仅对深能源和深南电两公司画雷达图,方法如下:方法如下:在在EXCEL窗口中,输入资料格式如下:窗口中,输入资料格式如下:公司公司简称称净资产收益率收益率%总资产报酬率酬率%资产负债率率%总资产周周转率率流流动资产周周转率率已已获利利息倍数息倍数销售增售增长率率%资本本积累率累率%深能深能源源16.8512.35 42.32 0.37 1.78 7.18 45.73 54.54 深南深南电2215.30 46.51 0.76 1.77 15.67 48.11 19.41 2024/4/11中国人民大学六西格玛质量管理研究中心249.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 用鼠标选中该部分资料,依次点选插入用鼠标选中该部分资料,依次点选插入图表,进入图表向导对话框,在标准类型中选图表,进入图表向导对话框,在标准类型中选择雷达图,在子图表类型中先择第二项资料点择雷达图,在子图表类型中先择第二项资料点雷达图,点下一步按钮,可以看到产生雷达图雷达图,点下一步按钮,可以看到产生雷达图的示意图,系列产生默认是行,对本例资料,的示意图,系列产生默认是行,对本例资料,若不是行,则应改为行。点击下一步,进入图若不是行,则应改为行。点击下一步,进入图表选项对话框,在此可以对雷达图的有关设置表选项对话框,在此可以对雷达图的有关设置进行重新设定,点击完成则生成如下雷达图:进行重新设定,点击完成则生成如下雷达图:2024/4/11中国人民大学六西格玛质量管理研究中心259.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 输出结果输出结果9.4:2024/4/11中国人民大学六西格玛质量管理研究中心269.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 EXCEL提供了很强的图形再编辑功能,对产生的提供了很强的图形再编辑功能,对产生的雷达图可以进行各种编辑修改以使其更为友好,此处雷达图可以进行各种编辑修改以使其更为友好,此处不再详细说明。根据此雷达图,可以对深能源与深南不再详细说明。根据此雷达图,可以对深能源与深南电的运营能力进行分析,深能源的资本积累率远高于电的运营能力进行分析,深能源的资本积累率远高于深南电,深南电的已获利息倍数要高于深能源,两公深南电,深南电的已获利息倍数要高于深能源,两公司的其余指针大体相似。司的其余指针大体相似。对五大钢铁公司反映经营状况的八大指标我们可以对五大钢铁公司反映经营状况的八大指标我们可以做出韩国蒲项钢铁公司与国内宝钢、鞍钢、武钢、首做出韩国蒲项钢铁公司与国内宝钢、鞍钢、武钢、首钢四家钢铁公司之间的雷达图。钢四家钢铁公司之间的雷达图。2024/4/11中国人民大学六西格玛质量管理研究中心279.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 2024/4/11中国人民大学六西格玛质量管理研究中心289.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 2024/4/11中国人民大学六西格玛质量管理研究中心299.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 2024/4/11中国人民大学六西格玛质量管理研究中心309.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 2024/4/11中国人民大学六西格玛质量管理研究中心319.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 二、星图二、星图 星图的形状与雷达图很相似,甚至有的文献把两星图的形状与雷达图很相似,甚至有的文献把两者看成一回事。者看成一回事。S-Plus软件可以一次生成多个观测的软件可以一次生成多个观测的星图,每一个观测生成一张星图,对上面的星图,每一个观测生成一张星图,对上面的35个公司个公司的资料,调用的资料,调用stars函数就可以方便地生成各个公司的函数就可以方便地生成各个公司的星图。星图。如果数据文件已建立,直接调用如果数据文件已建立,直接调用stars函数如下:函数如下:stars(data.matrix(gongsi),full=T,scale=T,radius=T,type=l,labels=a,head=Stars of 35 Companies,ncol=5)则生成如下星图:则生成如下星图:2024/4/11中国人民大学六西格玛质量管理研究中心329.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 输出结输出结果果9.5:2024/4/11中国人民大学六西格玛质量管理研究中心339.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 对对stars函数作简要说明,函数作简要说明,Full=T,是指定每,是指定每一个星图都包括一个整圆,若此项选为一个星图都包括一个整圆,若此项选为F,则每一,则每一个星图仅只包括上边半圆,个星图仅只包括上边半圆,scale=T,指对每一个,指对每一个指针都转换到范围指针都转换到范围0,1,即最大取值为,即最大取值为1,最小,最小的取值为的取值为0,其它取值均转换为,其它取值均转换为01之间的数。之间的数。Radius=T指画出每一变量取值的半径,取指画出每一变量取值的半径,取F时将不时将不画出,画出,type=“1”指的对每一星图仅画出线(半径)指的对每一星图仅画出线(半径)而不画出各点,若要仅画出点或线与点都画出则应而不画出各点,若要仅画出点或线与点都画出则应分别将分别将type设为设为“p”和和“b”,labels与与head分分别指定图的标题及各公司星图的标签,别指定图的标题及各公司星图的标签,ncol指定输指定输出时每一列输出的星图个数。出时每一列输出的星图个数。2024/4/11中国人民大学六西格玛质量管理研究中心349.3 9.3 雷达图与星图雷达图与星图 目录 上页 下页 返回 结束 S-Plus所作星图各半径与原指标的对应关所作星图各半径与原指标的对应关系为:从右边起,水平的半径为第一指针,逆系为:从右边起,水平的半径为第一指针,逆时针旋转,星图的各半径分别对应第二、第三时针旋转,星图的各半径分别对应第二、第三等各个指标,根据星图各条半径的长短,可以等各个指标,根据星图各条半径的长短,可以很容易地判断对应指标在各公司中的相对水平,很容易地判断对应指标在各公司中的相对水平,以此来分析各公司的运营能力。同时也可以利以此来分析各公司的运营能力。同时也可以利用星图来对各公司进行归类分析,与脸谱图相用星图来对各公司进行归类分析,与脸谱图相比,星图所受各指针排列次序的影响要更小,比,星图所受各指针排列次序的影响要更小,受人的主观影响也较小。此处略去根据星图对受人的主观影响也较小。此处略去根据星图对各公司的比较研究。各公司的比较研究。2024/4/11中国人民大学六西格玛质量管理研究中心359.4 9.4 星座图星座图 目录 上页 下页 返回 结束 所谓星座图,就是将所有样本点都点在一个所谓星座图,就是将所有样本点都点在一个半圆里面,就象天文学中表示的星座的图像,根半圆里面,就象天文学中表示的星座的图像,根据样本点的位置以直观地对各样本点之间的相关据样本点的位置以直观地对各样本点之间的相关性进行分析。利用星座图可以方便地对样本点进性进行分析。利用星座图可以方便地对样本点进行分类,在星座图上比较靠近的样本点比较相似,行分类,在星座图上比较靠近的样本点比较相似,可以分为一类,相距较远的点则说明相应样本点可以分为一类,相距较远的点则说明相应样本点的差异性较大。的差异性较大。星座图的基本画图方法为:星座图的基本画图方法为:2024/4/11中国人民大学六西格玛质量管理研究中心369.4 9.4 星座图星座图 目录 上页 下页 返回 结束 2024/4/11中国人民大学六西格玛质量管理研究中心379.4 9.4 星座图星座图 目录 上页 下页 返回 结束 2024/4/11中国人民大学六西格玛质量管理研究中心389.4 9.4 星座图星座图 目录 上页 下页 返回 结束 2024/4/11中国人民大学六西格玛质量管理研究中心399.4 9.4 星座图星座图 目录 上页 下页 返回 结束 4根据星座图上点的位置及路径判断各样本点之间根据星座图上点的位置及路径判断各样本点之间的接近程度,并进而可以对样本点进行归类分析。的接近程度,并进而可以对样本点进行归类分析。在实际工作中,人们往往去掉各样本点的路径部分而仅在实际工作中,人们往往去掉各样本点的路径部分而仅保留其在星座图上的位置,并根据各点位置的接近程度保留其在星座图上的位置,并根据各点位置的接近程度分析样本点之间的接近程度。目前常用的统计软件均没分析样本点之间的接近程度。目前常用的统计软件均没有直接生成星座图的模块,但是,画星座图实际上非常有直接生成星座图的模块,但是,画星座图实际上非常简单。按照上面的方法,对数据进行规格化,对每一个简单。按照上面的方法,对数据进行规格化,对每一个变量赋予适当的权重,然后以(变量赋予适当的权重,然后以(9.4)式各点的路径作为)式各点的路径作为在星座图中的坐标,然后画出各点的散点图,则画出的在星座图中的坐标,然后画出各点的散点图,则画出的散点图实际上就是星座图。这里不再详细说明。上面散点图实际上就是星座图。这里不再详细说明。上面35个上市公司的数据按此方法可以得到如下星座图:个上市公司的数据按此方法可以得到如下星座图:2024/4/11中国人民大学六西格玛质量管理研究中心409.4 9.4 星座图星座图 目录 上页 下页 返回 结束 2024/4/11中国人民大学六西格玛质量管理研究中心419.4 9.4 星座图星座图 目录 上页 下页 返回 结束 由上图各公司在星座图中的接近程度,就可以直观地对由上图各公司在星座图中的接近程度,就可以直观地对各公司进行分类,可以考虑把各公司进行分类,可以考虑把35个公司分成四类,如图所示:个公司分成四类,如图所示:方正科技、寰岛实业可单独成类,长城电脑、深能源方正科技、寰岛实业可单独成类,长城电脑、深能源A、深南、深南电电A、中兴通讯、清华同方、粤电力、中兴通讯、清华同方、粤电力A可以归为一类,其他公可以归为一类,其他公司可以归为一类,此种归类与上面根据其它多变量图表示法得司可以归为一类,此种归类与上面根据其它多变量图表示法得到的归类是有区别的。因此,在实际工作中应用这此方法时,到的归类是有区别的。因此,在实际工作中应用这此方法时,建议多种方法结合使用并且应于宣分析方法结合才能得到比较建议多种方法结合使用并且应于宣分析方法结合才能得到比较可信的结论。另外,此图还存在一个困难,就是不好将各个点可信的结论。另外,此图还存在一个困难,就是不好将各个点与相应的公司对应起来,实际上,可以根据需要在生成星座图与相应的公司对应起来,实际上,可以根据需要在生成星座图时同时画出各点的标签,此处出于图形清晰的考虑没有生成。时同时画出各点的标签,此处出于图形清晰的考虑没有生成。此外,对于大部分软件来讲,当图形生成之后,只要将鼠标在此外,对于大部分软件来讲,当图形生成之后,只要将鼠标在相应的点上稍作停留,就会显示出该点对应的观测信息。相应的点上稍作停留,就会显示出该点对应的观测信息。2024/4/11中国人民大学六西格玛质量管理研究中心429.4 9.4 星座图星座图 目录 上页 下页 返回 结束 除本章介绍的几种方法外,多变量的图表示法还有塑像图、除本章介绍的几种方法外,多变量的图表示法还有塑像图、轮廓图、树形图等,这几种方法也是对每一个观测生成一张图,轮廓图、树形图等,这几种方法也是对每一个观测生成一张图,图形的不同部分则表示观测不同指标的取值,有兴趣的读者可图形的不同部分则表示观测不同指标的取值,有兴趣的读者可以参阅文献以参阅文献11。总体说来,多变量的图表示法使资料呈现方。总体说来,多变量的图表示法使资料呈现方式更直观,更形象,借助这些工具可以使研究者对资料有较深式更直观,更形象,借助这些工具可以使研究者对资料有较深的印象,同时利用这些作图方法,可以帮助研究者对资料进行的印象,同时利用这些作图方法,可以帮助研究者对资料进行探索性分析,有助于进行更为专业的定量分析,形成合理结论。探索性分析,有助于进行更为专业的定量分析,形成合理结论。但是,多变量的图表示法只能是给人一种大概的印象,利用它但是,多变量的图表示法只能是给人一种大概的印象,利用它来形成结论还很是不够,实际中必须结合其它统计分析方法并来形成结论还很是不够,实际中必须结合其它统计分析方法并结合所分析的具体问题,综合定量分析与定性分析,才能得到结合所分析的具体问题,综合定量分析与定性分析,才能得到较为合理可信的结论。较为合理可信的结论。2024/4/11中国人民大学六西格玛质量管理研究中心43
展开阅读全文