资源描述
第7章,基本统计分析,本章内容,SPSS 统计分析功能概述,SPSS 数值分析过程,基本统计分析概述,7.1 一维频数分布表Frequencies,7,.2 描述统计分析过程Descriptives,7.3 探索分析 Explore,7.4 多维频数分布表(交叉表,列联表),7.5 OLAP报告摘要表OLAP Cubes,补充:Reports的其他分析过程,练习题,SPSS 统计分析功能概述,有了数据,可以利用SPSS的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键。,SPSS有数字分析和作图分析两类方法,SPSS 数值分析过程,SPSS 数值统计分析过程均在Analyze菜单中,包括:,a、,基本统计分析:,Reports,Descriptive Statistics,b、,均值比较与检验:,Compare Means,d、,方差分析:,ANOVA Models,b、,相关分析:,Correlate,e、,回归分析,:,Regression,f、,聚类与判别,:,Classify,g、,因子分析,:,Data Reduction,h、,非参数检验,:,Nonparametric Tests,等等,基本统计分析概述,基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。,在SPSS的Analyze菜单中包括了一系列统计分析过程。其中Reports和Descriptive Statistics命令项中包括的功能是对单变量的描述统计分析。,Descriptive Statistics包括的统计功能有:,Frequencies:,频数分析,Descriptives,:,描述统计量分析,Explore:,探索分析,Crosstabs,:,多维频数分布交叉表(列联表),Reports,包括的统计功能有:,OLAP Cubes:OLAP,报告摘要表,Case Summaries:,观测量列表,Report Summaries in Row:,行形式输出报告,Report Summaries in Columns:,列形式输出报告,7.1 一维频数分布表Frequencies,1、了解变量的取值分布情况对整体把握数据的特征是非常有利的。,2、求分类(定类、定序)变量的频数和作Bar图,3、求定距变量(连续变量)的分布情况和作直方图Histogram 比Descriptives 多百分位,在Statistics选项,(见Excel第三章 数据描述与分析),和 Format选项),4、对连续变量进行分组(recode)后再求频数,如老中青(35,60)的比例,文化程度(中学、大学及以上)的人数及比例等,5、Analyze+Descriptive Statistics+Frequencies,6、例子p105-106:,对1991年美国社会调查情况数据(data07-01)进行统计处理。分析不同年龄(age变量)和最高受教育年限(educ变量)各水平的频数分布情况。,7,.2 描述统计分析过程Descriptives,1、功能:了解数据的基本统计特征和对指定的变量值进行标准化处理(标准化后的新变量的均值为0,标准差为1,目的是为了消除各变量间变量值在数量级上的差异,从而增强数据间的可比性)。,2、描述统计分析过程通过平均值(Mean)、,算术和(Sum)、标准差(Std Dev)、最大值(Maximum)、最小值(Minimum)、方差(Variance)、范围(Range)、平均数标准误(S.E.Mean)等统计量对变量进行描述。,3、一般是求定距变量的描述统计量,从中分析差异性(max,min),4、Analyze+Descriptive Statistics+Descriptives,5、例子:1985年美国联邦调查局对50个州各种犯罪情况调查的数据(data07-02)进行描述统计分析,50个州总的情况,不同地区region的情况(2种方法:Split File+Descriptives,第8章的Means),7.3 探索分析 Explore,1.,考察数据的奇异性和分布特征,奇异性:数据的过大或过小(找出、分析原因、是否剔除),分布特征:数据是否来自正态分布总体,考察方法:统计量和统计图形(箱图、茎叶图(频数、茎和叶)、方差齐次性检验,S,pread vs,level,图),2.一般,是,考察,定距变量,3.,Analyze,+Descriptive Statistics+Explore,因(分析)变量(,Dependent List):,定距变量,分组变量(,Factor List):,分类变量,标识变量(,Label Cases by):,为方便查找输出观测量如,id,4.,例子,p112:,考察,银行数据(,data07-03),中的不同性别的工资情况,7.4 多维频数分布表(交叉表,列联表),二维或多维交叉频数表(列联表),分析事物(变量)之间的相互影响和关系,Analyze,+Descriptive Statistics+Crosstabs,行变量(,Row):,需分类变量,列变量(,Column):,需分类变量,分层变量(,Layer):,条件(若有,需分类变量),Statistics,选项:,Chi-square,复选项及其四种检验结果,Correlations,复选项:相关系数,例子:,银行数据(,data07-03),中:如求男女的民族分布情况,可得到白种人多,男性多的结论(注意,cell,选项,一般选频数和百分比),如求每一工种的男女分布情况(人数),P118:1991,年美国社会调查情况数据(,data07-01):,男女对生活的认识。,7.5 OLAP报告摘要表OLAP Cubes,OLAP(Online Analytical Processing)在线分析处理过程以分组变量为基础,计算各组的总计、均值和其他统计量。而输出的报告摘要则是指每个组中,所包含,的各种变量的统计信息。,Analyze+Reports+OLAP Cubes,Summary Variables:,要进行统计汇总的数值型变量,Grouping Variables:,分组变量(分类变量),,注意:此分组变量在实际的运算过程中并不发挥分组的功能,而是确定进入统计的观测量的范围。如选择数学成绩作为摘要分析变量,而性别作为分组变量,要计算数学平均成绩,则结果中显示的并不是男生的数学平均成绩和女生的数学平均成绩,而是所有男女生观测量的数学成绩的总平均值。即,所有性别有值(,非,Missing Value),的,Case,,才参与分析计算,Statistics,选项:,Sum,和、,Number of Cases,观测量数目、,Mean,均值、,Median,中位数、,Maximum,最大等等,例子,p122:,1991,年美国社会调查情况数据(,data07-01):,对不同种族,race,的孩子,childs,和教育,educ,情况进行报告摘要分析。,补充:,Reports的其他分析过程,Reports的其他分析过程有:,Case Summaries:,观测值摘要分析,Report Summaries in Row:,行形式输出报告,Report Summaries in Columns:,列形式输出报告,Case Summaries:观测量列表,察看或打印所需要的变量值,Analyze,+Reports+,Case Summaries,Variables:,要显示的变量名,Grouping Variables:,分组变量(分类变量),结果显示:多行或单行,行形式输出报告,Summary,按行,如:sum、mean、max、min、count、std dev、variance、percentage(above,below,inside)等,菜单:,Analyze,+Reports+Report Summaries in Rows,Data Column:,报告变量,Break Column:,分组变量及其,Summary(,多个交叉,),Report:,可对全部数据进行描述统计(,Grand Total),Display Cases:,是否显示每一个观测量,列形式输出报告,Summary,按列,如:sum、mean、max、min、count、std dev、variance、percentage(above,below,inside)等,菜单:,Analyze,+Reports+Report Summaries in Columns,Data Column:,报告变量,一一对应的,Summary,Insert Total:,汇总列,可汇总两列或多列的信息,Break Column:,分组变量,(,多个交叉,)及,Subtotal,Report:,可对全部数据进行描述统计(,Grand Total),练习题,关于计算机课程教学情况的调查.DOC,请用Word提交分析报告,包括:,用什么命令(如Frequencies,Descriptive)和分析的变量,结果(表格或图形),结果分析,
展开阅读全文