4第四章_基本统计分析

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章基本统计分析,一、,SPSS,统计分析功能概述,1,、,SPSS,数值分析过程,2,、,SPSS,图形分析过程,1,、,SPSS,数值分析过程,Descriptive Statistics,Compare means,General linear model,Correlate,Regression,Loglinear,Classify,Data reduction Scale,Nonparametric tests,Survival,Multiple response,基本统计分析功能包括：,1,、报告分析（,Report,）,2,、,描述性统计分析（,Descriptive Statistics,）,二、基本统计分析功能,（一）报告分析（,Report,）,1,、,OLAP,在线分析处理过程,2,、,Case Summaries,观测值摘要分析过程,3,、摘要报告分析过程,(1)Report Summaries in Rows,行形式摘要报告,(2),Report Summaries in Column,列形式摘要报告,按,AnalyzeReportsOLAP Cubes,顺序单击打开如下对话框：,摘要变量框：进入此框变量为数值型变量,分层变量框：,进入此框变量为数值型或字符型变量,1,、,OLAP,（,在线分析处理过程）,可选择的统计量,:,Sum,总和,Number of Cases,观测量数目,Mean,均值,Standard Deviation,标准差,Percent of Total Sum,占总和的百分比,Percent of Total N,占观察量总数的百分比,Medina,中位数,Grouping Median,分组中位数,Std.Error of Mean,均值标准误,Minimum,最小值,Maximum,最大值,Range,范围,First,首值,Last,尾值,Variance,方差,Skewness,偏度,Std.Error of Skewness,偏,度的标准误,Kurtosis,峰度,Std.Error of Kurtosis,峰度的标准误,Harmonic Mean,调和均数,Geometric Mean,几何均数,标题对话框,输入统计量的标题,输入注解,这些注解将显示在统计量输出栏的下面,请看演示分析,30,名少儿身高数据,1,、操作步骤：,1,）按,AnalyzeReportsOLAP Cubes,顺序单击打开,OLAP Cubes,对话框,2,）打开数据文件“,sy-1,学生成绩,.sav,”,，,将,math,变量选入,Summary Variable,框中，将,sex,变量作为分组变量选入,Grouping Variable,框中；,3,）单击,Statistics,按钮，在,Statistics,框中选择,Sum,、,Mean,、,Median,项作为要输出的统计量；,4,）单击,Title,按钮，在,Title,框中输入“数学成绩分层报告”，单击,Continue,返回；单击,OK,2,、,输出结果及分析,表,4-3,观测量摘要,表,4-2,说明观测量的一些基本情况，包括总个数、有效值个数和缺省值个数。,表,4-3,是分层报告，输出了总和、均值和中位数。,2,、观测值摘要分析过程,一、主要功能,计算指定变量的分组统计量，分组变量可能是一个，也可以有多个。如是多个，则将所有水平进行交叉组合。每个组中，变量值可以显示或不显示。,二、观察值摘要分析,1,）按,AnalyzeReportsCase Summaries,顺序单击打开,Case Summaries,对话框,。,可在参数框中输入数值，该数值表示分析过程只对前几个观测值进行,带有缺省值的观测值不被显示,在列出观测值的同时，显示观测值的序号,可选择一个或多个变量进入此框,分组变量可是数值型或短字符型变量。,图,4-5 Summarize CASES,对话框,见图,4-6,2,、观测值摘要分析过程,输入脚注,在输出结果中显示各分组统计量的标题,在分析过程中剔除带有缺失值的观测量,键入一个字符以便在输出结果中标记缺失值,输入标题,三、例题分析,:,将表,4-1,资料,(,数据文件为“,少儿身高,.sav,”),进行观测值摘要分析,。,Options,对话框,1,）打开,Case Summaries,对话框,2,）,打开数据文件“,少儿身高,.sav,”,，,将,height,变量选入,Variable,框中，作为摘要分析的变量，将,sex,和,grade,变量选入,grouping,框中作为分组变量。,3,）清除,Display cases,复选框。,4,）单击,Statistics,按钮，在,Statistics,框中选择,Number of cases,、,Mean,、,Median,项作为要输出的统计量；单击,Continue,返回。,5,）单击,OK,1,、操作步骤,表,4-4,观测量处理摘要,表,4-4,说明观测量的总个数、有效值个数和缺省值个数以及各占的百分比。,2,、输出结果及分析,分组统计量,表,4-5,分三部分，,1,、男生的基本统计量，,2,、女生的基本统计量,3,、男女生的基本统计量，每部分包括分年级进行的统计和总的统计，这就是交叉分组。,一、主要功能,把观测量的统计结果用一种简单扼要的表格打印出来有助于更好的把握数据特征。,二、行形式摘要报告,1,）按,AnalyzeReportsReport Summaries in Rows,顺序，打开,Summaries in Rows,对话框。,3,、摘要报告分析过程,将要分析的变量选入此框，每选一个变量进入框内，则需单击,Format,按钮，打开,Format,对话框,，设置该变量输入格式。,进入该框中的变量作为分组变量，可有多个。选中变量后激活,Summary,、,Options,、,Layout,、,Titles,。,输出一个单独的观测量列表。,只输出报告的第一页,Summarize in Rows,对话框,输入变量的列标题，不输入则将输出变量的标签或名称,选择列标题对齐的方式,选择变量值所处的位置,以缩进的形式输出，可输入缩进数值；,变量值位于列中央,键入列宽数值，如不设列宽，则：,如输出数值标签，则列宽为数值标签中的最长者；,如输出变量值，则列宽为变量所定义的宽度；,如设置了列标题，则列宽为标题的最长者；,如未设置列标题，则列宽为输出的变量标签的最长者；,选择输出的内容：,将输出变量值,将输出变量标签,Format,对话框,输出列变量之和。,输出列变量的均值,。,输出列变量中的最小值。,输出列变量中的最大值。,输出列变量中观测量的数目。,输出列变量中高于,Value,框中设定值的观测量占总数的百分比,输出列变量中低于,Value,框中设定值的观测量占总数的百分比,输出列变量中位于,Low,和,Hight,框中设定值的观测量占总数的百分比,输出标准差。,输出输出峰度,。,输出方差。,输出偏度,。,Summary,对话框,Report,栏,的,Option,对话框,进行缺失值和输出页码的设置：,剔除带有缺失值的观测量,输入一个代表系统的和用户的缺失值字符,设置报告的起始页码,可进行页面设置：,可输入分组变量间的间距行数（不超过,20,）,每个分组变量都在新的一页输出,在新的一页输出下一个分组变量，并接着上一页的页码输出下一页的页码,输入设置分组标题和报告内容之间的间距，最多可插入,20,行空白,Break Column,中的,Options,对话框,所输数值表示报告的每一页输出从第几行开始,所输数值表示报告的每一页输出在第几行结束,规定每一页输出的左边间距,规定每一页输出的右边间距,选择报告输出内容的对齐方式,设置页面的标题、脚注和页面的距离：,设置标题与报告的距离,设置注脚与报告的距离,决定分组变量显示的位置：,所有的分组变量值均位于第一列，激活,Indent an each break,参数框,在此框中设置分类变量值缩进的位置。默认为,2,空格,设置列标题的输出格式：,在标题下添加下划线,设置列标题下的空白行（默认为,2,）,选择列标题的对齐方式,设置分组变量的显示位置：,显示在统计量的上一行,显示于统计量的同一行，并覆盖统计量标题,设置分组变量与统计量之间的空白行数,Report,栏的,Layout,对话框,按,Next,进入下一行的设置,按,Previous,返回上一行,对齐方式,选择特殊变量的值作为标题与注脚,在此对话框可规定标题与注脚的输出内容和格式,可设置最多,10,行,Report,栏的,Titles,对话框,三、列形式摘要报告,列形式与行形式摘要报告不同在于，行变量为分组变量值，列变量为进行分析的变量。,按,AnalyzeReportsReport Summaries in Column,顺序，打开,Summaries in Column,对话框,。,Summaries in Column,对话框,将要分析的变量选入此框，每选一个变量进入框内，则需单击,Format,按钮，打开,Format,（见,下图）对话框，设置该变量输入格式。,1,、,Data Columns,栏,1,）,Summary,对话框与行形式基本同，不同是只能选择一个统计量,2,）,Format,对话框与行形式同,3,）,Insert Total,按钮,按,Summary,按钮，出现,Summary,对话框,Insert Total,按钮的,Summary,对话框,选择要计算和的变量将其移入右边变量框，至少挑选,2,个变量。,在,Summaries in Column,对话框中单击,Insert Total,按钮，新增,Total,变量，,1,）,Options,对话框,2,）,Format,对话框与“行形式”同,3,）,Sort Sequence,拦：确定分组变量升降排序规则,4,）,Data are already sorted,复选框，已将分组变量排序,Break Columns,栏,中的,Options,对话框,显示每一类分组变量小计结果，在,Label,框中键入分组变量的标签,在此栏中设置页面：,输入不超过,20,分组变量间的间距行数,每个分组变量都在新的一页输出,在新的一页输出下一个分组变量，并接着上一页顺序编写页码,在此栏中设置小计前的空白行数,3,、,Preview,复选框,:,只输出报告的第一页，便于用户预览,4,、,Report,栏,Options,如下图,Layout,对话框与“行形式”同,Titles,对话框与“行形式”同,Options,对话框,在每一页的底部显示该列的总和，在,Label,框中键入标签,剔除带有缺失值的观测量,输入一个代表系统和用户的缺失值的字符,设置报告的起始页,将表,4-1,资料（数据文件“少儿身高,.sav”,）,进行分析：先做行形式报告输出，再做列形式报告输出。,1,、单个分组变量的行形式报告,按,AnalyzeReportsReport Summaries in Rows,顺序，打开,Summaries in Rows,对话框。,挑,height,变量进入,Data,框，,grade,变量进入,Break,框。,单击,Break Columns,栏的,Summary,按钮，打开,Summary Lines for grade,对话框，选中,Sum of Values,、,Number of Cases,复选框，再按,Continue,返回,Summaries in Rows,对话框。,选中,Display cases,复选框。单击,Titles,按钮，打开,Titles,对话框，在标题栏的,Center,框中输入标题“少儿身高分组统计”，再按返回。单击“,OK”,完成，输出结果见表,46,。,三、例题分析,观测量分组报告,少儿身高分组统计,年级身高,- -,四年级,121.40,134.10,135.80,135.50,133.40,140.30,120.90,141.40,Mean 132.85,N 8,五年级,131.50,132.60,140.40,137.40,128.20,129.00,129.30,132.70,130.10,139.70,133.00,124.00,138.80,138.60,MEAN 133.24,N 14,六年级,129.20,136.00,132.20,140.90,136.70,137.50,125.40,137.50,Mean 134.42,N 8,列出了按年级分组后的观测量表,打开,Summaries in Rows,对话框，挑,height,变量进入,Data,框，,sex,、,grade,变量进入,Break,框。,选中,Break,栏中的,sex,变量，单击,Summary,按钮，打开,Summary Lines for sex,对话框，选中,Mean of Values,、,Number of Cases,、,Minimum Value,和,Maximum Value,复选框，再按,Continue,返回。,选中,Break,栏中的,grade,变量，单击,Summary,按钮，选中,Mean of Values,、,Number of Cases,复选框，再按,Continue,返回。,单击“,OK”,完成，输出结果见表。,2,、两个分组变量的行形式报告,少儿身高分组统计,性别年级身高,- - -,男四年级,Mean 131.70,N 4,五年级,Mean 132.63,N 7,六年级,Mean 134.57,N 4,Mean 132.90,Minimum 121.40,Maximum 140.90,N 15,女四年级,Mean 134.00,N 4,五年级,Mean 133.84,N 7,六年级,Mean 134.27,N 4,Mean 134.00,Minimum 129.90,Maximum 141.40,N 15,Grand Total,Std.Dev 5.70,Ketosis .29,Skewness .63,表分为,3,部分：,1.,男生统计量表：各年级的均值和个数，全体男生的均值、个数、最大值和最小值；,2.,女生统计量表：各年级的均值和个数，全体女生的均值、个数、最大值和最小值；,3.,全体的统计量：标准差、偏度和峰度。,多分组统计量,(,行形式,),3,、两个分组变量的列形式报告,打开,Summaries in Columns,对话框，挑,height,变量进入,Data,框，单击,Summary,按钮,选中,Mean of Values,再按,Continue,返。,先后挑选,sex,、,grade,变量进入,Break,框。单击,Report,栏中的,Options,对话框，选中,Display grand total,复选框，再按,Continue,返回。,单击,Titles,按钮，打开,Titles,对话框，在标题栏,的,Center,框中输入标题“少儿身高分组统计”，再按,Continue,返回。单击“,OK”,完成，输出结果见下表。,少儿身高分组统计,Page,身高,性别年级,Mean,_ _ _,男,4 133.4,5 131.3,6 134.6,女,5 134.0,Grand Total 133.5,表分为,3,部分：,1.,男生的均值表，按各年级算出均值；,2.,女生的均值表，按各年级算出均值；,3.,全体的均值。,多分组均值表,(,列形式,),(,二）描述性统计分析（,Descriptive Statistics,）,1,、,Frequencies,频数分析表,2,、,Descriptive,描述性统计分析过程,3,、,Explore,探索分析过程,4,、,Crosstabs,列,联表分析过程,1,、频数分析表,一、主要功能,可对数据按组进行归类整理，形成变量不同水平的频数分布表和图形，对数据的分布趋势进行初步分析。,二、频数分析,1,）按,AnalyzeDescriptive StatisticFrequencies,顺序，打开,Frequencies,对话框如图。,选择一个或多个变量右移入,Variable,（,s,）,框。,按,Statistics,按钮，打开,Statistics,对话框,显示频数分布表,按,Chart,按钮，打开,Chart,对话框,按,Format,按钮，打开,Format,对话框,Frequences,主对话框,输出百分位数：,输出四分位数，显示,25%,、,50%,、,75%,的百分位数；,将数据平均分为所设定的相等等份，可输入,2100,的整数，如键入,4,则输出第,25,、,50,、,75,百分位数,自定义百分位数，可输入,0100,的整数。,输入值后：,按,Add,：,输入值后按此键，可反复操作键入多个百分位数；,按,Remove,：,删除已键入的数值,按,Change,：,重新输入新数,离差栏,分布参数栏,在计算百分位数值和中位数时，假设数据已分组，且用各组的组中值代替各组数据,中心趋势栏,输出统计量对话框,Chart,对话框,不输出任何图形，为默认,输出条形图，各条高度代表变量各分类的频数,输出圆图，圆图中各块的数值表示各分类变量的频数,输出直方图，此图仅适用于区间型数值变量。选择此项后，还可选择,With normal curve,，,画出的直方图带有正态曲线,只有选择了条形图和圆图项才有效，决定纵轴表示的统计量,纵轴表示频数图,纵轴表示百分比,Format,对话框,控制频数表输出的分类数量。默认为,10,多变量框中可设定多变量表格输出的格式,设置频数表输出的格式,选择频数表中排列顺序,按变量升序排列，此为默认,按变量降序排列,按变量各种取值发生的频数的升序排列,按变量各种取值发生的频数的降序排列,1,、具体步骤,按,AnalyzeDescriptive StatisticFrequencies,顺序，打开,Frequencies,对话框。打开数据文件“,公司职员统计表,.sav,”,，,挑年龄、受教育年限两个变量进入,Variable,框。选中,Display frequency tables,复选框，要求输出频数分布表。,单击,Statistics,按钮，选择要输出的统计量。,单击,Chart,按钮，选择,Histogram,项，输出直方图，并选择,With normal curve,复选框，输出正态曲线。,单击,Format,按钮，选,Ascending,项。单击“,OK”,完成。,2,、输出结果及分析,结果如下表、图,直方图,血清蛋白含量的统计表,职员受教育年限的,频数分布表,一、主要功能：,调用此过程对变量进行描述性统计分析，计算均值、标准差、全距和均值标准误差等，并可将原始数据转换成,Z,分数。,二、描述统计量分析,按,Analyze Descriptive Statistics Descriptives,顺序单击，打开,Descriptives,主对话框。如图,选一个或多个变量移入,如选中此框，将对,Variables,框中选择的变量进行标准化产生相应的,Z,分值，并作为新变量保存到数据窗口，其变量名在原变量名前加,z,。,Descriptive,对话框,2,、描述性统计分析过程,Options,对话框,基本统计量,当,Variables,框中有多个变量时，此框确定其输出顺序：,按,Variables,框中的排列顺序输出,按各变量的字母顺序输出,按均值的升序排列,按均值的降序排列,分布,三、例题分析,已知,20,个初生婴儿的体重数据如下表，对其进行描述统计。,2770,2915,2795,2995,2860,2970,3087,3126,3125,4654,2272,3503,4218,3418,3921,2669,3707,2310,2573,3881,20,个初生婴儿的体重（,g,）,1,、操作步骤：,打开数据文件“婴儿体重,.sav”,。,打开,Descriptives,主对话框，选定变量,t,进入,Variable,栏中。,选中,Save standardized values as variables,复选框，要求计算变量的,z,值，并保存结果到当前数据集中。,单击,Options,按钮，选中,Mean,、,Std.Deviation,、,Minimum,、,Maximum,、,Variance,项。,2,、,输出结果及分析,婴儿体重的描述统计量,这时打开原数据集，可看到多了一列,zt,，,这是,t,的,z,分数，如下图所示：,保存了,z,分数的数据集,一、主要功能：,调用此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。剔除奇异值和错误数据。探索分析过程将提供在分组和不分组的情况下常用的统计量与图形。,二、探索分析,按,Analyze-Descriptive Statistics-Explore,顺序单击，打开,Explore,主对话框。如图,3,、探索分析过程,选择一个或多个变量进入,Dependent,框,作为因变量，单击,OK,可获得因变量的一系列基本统计量和图形。,此作为分组变量，可以是字符变量，对因变量的分析将按该变量的观测值进行分组分析。可有多个分组变量，这时会按多个变量的交叉组合进行分组。,该框中的变量作为标识符，在输出诸如异常值时，用该变量进行标识，只允许有一个标识符。,可同时输出基本统计量和图形,只输出基本统计量,只输出图形,Explore,主对话框,输出基本统计量,均值的置信区间，可键入,199%,的任意值，根据该值算出置信区间的上下限。,给出中心趋势的最大拟然比的稳健估计量，当数据分布均匀，且两尾较长，或当数据中存在极端值时，可给出比均值或中位数更合理的估计。,输出最大和最小的,5,个数，且在输出窗口中加以标明。,输出,5%,、,10%,、,25%,、,50%,、,75%,、,90%,和,95%,的百分位数。,Statistics,对话框,只有指定分组变量才有效，可输出分布,水平图，同时输出回归直线斜率以及对方差的,Levenes,检验,不输出分布,水平图,对每组数据产生一个中位数与四分位范围的自然对数散点图，同时在满足每组中数据方差相等的条件下对数据进行幂变换的估计。,根据在,Power,参数框中指定的变换对原始数据进行变换。,不对数据进行转换,Explore,栏中,Plots,对话框,在此对话框中可选择要输出的统计图形及其参数。,只有在主对话框中指定了一个以上变量时，,Boxplot,栏才有效。在该栏选择盒形图的输出方式：,每一个因变量生成一个盒形图,所有因变量生成一个盒形图,不显示任何盒形图,生成茎叶图，为默认,生成直方图,输出正态概率和离散正态概率图，同时输出,K-S,统计量中的,Liliefors,显著水平检验，如果观测数不超过,20,，将用,W-S,统计量代替,K-S,。,确定缺失值的处置：,因变量或分组变量中带有缺失值的观测量都将在分析过程中被剔除。,在分析过程中根据分组变量产生的组中带缺失值的观测量都将被剔除。,分组变量的缺失值被单独分为一组，输出频数时将标出缺失组。,Explore,栏中,Options,对话框,三、例：下表为,30,名,10,岁少儿的身高（,cm,）,数据，对其进行探索分析,编号,身高,编号,身高,编号,身高,男,女,男,女,男,女,1,131.5,132.7,6,135.5,137.5,11,132.2,124.0,2,137.4,133.0,7,121.4,141.4,12,129.0,140.3,3,128.2,139.7,8,129.2,138.8,13,132.6,130.1,4,136.0,125.4,9,135.4,120.9,14,140.9,133.4,5,140.4,138.6,10,135.8,137.5,15,129.3,136.7,1,、操作步骤：,打开,Explore,主对话框，打开数据文件“,Explore,分析,.sav,”,选变量,height,进入,Dependent List,栏中，选,sex,变量进入,Factor List,栏中；,在,Display,栏中选择,Both,项；,打开,Statistics,对话框，选中,Descriptives,、,M-estimation,、,Outliers,复选项，单击,Continue,返回；要求计算变量的,z,值，并保存结果到当前数据集中。,打开,Plot,对话框，选择,Boxplots,栏中的,Factor levels together,项，选择,Descriptives,栏内的,Stem-and-leaf,复选项，选择,Spread vs level with levene Test,栏中的,Power estimation,项，单击,Continue,返回。单击,OK,2,、,输出结果及分析,输出结果如下表,观测量摘要表,M,估计量表,少儿身高的分组描述统计量,少儿身高的极端值,方差一致性检验,HIGHT Stem-and-Leaf Plot for,SEX= 1,Frequency Stem & Leaf,1.00 12 . 1,4.00 12 . 8999,3.00 13 . 122,5.00 13 . 55567,2.00 14 . 00,Stem width: 10.00,Each leaf: 1 case(s),少儿身高的茎叶图,少儿身高的盒形图,结果分析,表,4-13,摘要性地说明了数据的基本情况，包括总数、有效值数目和缺失值数。,表,4-14,是按性别分组后的统计量表，上半部分是男生，下半部分是女生的。,表,4-15,下面的,a,、,b,、,c,、,d,分别表示四种加权常数，此表的结果是使用四种不同的方法计算出的,M,估计量的结果。,表,4-16,显示分组后少儿身高的极端值分布，最大值和最小值各取,5,个。,表,4-17,是方差的一致性检验，零假设是分组后的方差为相等的。表中四行是依据不同的统计量得到的检验，分别是基于均值、基于中位数与调整后的自由度和基于调整后的均值。由于其显著值均大于,0.05,，不能否定零假设，即可以认为男生和女生的身高的方差是无差异的。,茎叶图从左到右分为三部分：频数、茎和叶、茎是整数部分，叶是小数部分，,Stem width,表示茎宽。每行的茎和叶组成的数字再乘以茎宽，即得到实际数据的近似值，实际数据中与该近似值靠近的值的个数即为频数表示的个数。,盒形图各部分的含义：,方箱是盒形图的主体，上下边为四分位数，中心粗线为中位数，变量的,50%,的观测值落在这一区域中。,方箱上下两条纵向直线是触须线，触须线外的两端线为本体的最大值和最小值。本体指除奇异值外的变量值。,奇异值用“,0”,表出，本例中无奇异值。,4,、列联表分析过程,主要功能：,调用列联表分析过程可进行计数资料和某些等级资料的列联表分析，一个行变量和一个列变量可组成一个二维列联表，如再加一个控制变量则可组成一个三维列联表。而多个行、列、控制变量就可组成一个复杂的多维列联表。在分析中可对二维和多维列联表资料进行统计描述和,x,2,检验，并计算相应的百分数指标。此外，还可计算四格表确切概率（,Fishers Exact Test,），,且有单双侧（,One-Tail,、,Two-Tail,）、,对数拟然比检验（,Likelihood Ratio,）,以及线性关系的,Mantel-,Haenszel,x,2,检验。,4,、列联表分析过程,列联表分析程序,按,Analyze-Descriptive Statistics-,Crosstabs,顺序打开,Crosstabs,主对话框。如图,该框中的变量作为分布表中的行变量，必须是数值型或字符型等分类变量。,该框中的变量作为控制变量，决定频数分布表中的层，可有多个控制变量，如要增加新的控制变量，按,Next,键，要修改以前的变量按,Previous,键,显示每一组中各变量的分类条形图。,只输出统计量，不输出多维列联表。,Crosstabs,对话框,进行行和列变量相互独立的假设检验，有多种检验法。（注,）,进行相关系数的检验，有两项结果显示：,Pearson,相关系数和,Spearman,相关系数,适用于定类变量的统计量：,基于卡方检验基础上对相关性的检验,用来描述相关性,当用自变量预测因变量时，此系数反映这种预测降低错误的比率。,显示不确定系数，表示用一个变量来预测其他变量时降低错误的比率,适用于定序变量：,Gamma,系数反映两个有序变量间的对称相关性。,是,Gamma,检验的非对称推广。,对有序变量和秩变量相关性的非参数检验。,与,Kendalls tau-c,相似,适用于定序变量：,用于检验相关性,用于检验两个评估人对同一对象的评估是否具有一致系。,检验某事件发生和某因子之间的关系,进行两个相关的二值变量的非参数检验,进行一个二值因素变量和一个二值响应变量的独立性检验。,Crosstabs,的,Statistics,对话框,Crosstabs,的,Cell Display,对话框,选择在列联表中输出的统计量，包括观测量数、百分比、残差,输出观测量的实际数量,如果行和列变量在统计上是独立的或不相关的，那么会在单元格中输出期望的观测值的数量。,输出单元格中观测量的数目占整行全部观测量数目的百分比,输出单元格中观测值的数目占整列全部观测量数目的百分比,输出单元格中观测量的数目占全部观测量数目的百分比,计算非标准化残差,计算标准化残差,计算调整后残差,Table Format,对话框,决定各行的排列顺序：,各行的排列按升序,各行的排列按降序,三、例,为了探讨吸烟与慢性支气管炎有无关系，调查了,339,人，情况如下,：,吸烟和慢性支气管炎调查表,患,慢性支气管炎,未患慢性支气管炎,吸烟,43,162,不,吸烟,13,121,输入数据：变量,h,为采得的数据；变量,x,为是否吸烟：,1,为吸烟，,2,为不吸烟；变量,n,为是否患病：,1,为患病，,2,为不患病。数据文件名为“,Crosstab.sav,”,。,在,Data,菜单中选,Weight Cases,项，打开,Weight Cases,对话框。,Weight Cases by,再将变量,h,选入,Frequence Variable,框，单击,OK,完成加权。,按,Analyze-Descriptive Statistics-Crootabs,顺序打开,Crootabs,主对话框。将,x,变量选入,Row,框作为行变量，将,n,变量选入,Column,框作为列变量。,打开,Statistics,对话框，选中,Chi-squareContingency coefficient,和,Phi and CramersV,复选框，单击,Continue,返回。,单击,Cell,按钮，打开,Cell display,对话框，选中,observed,和,Expected,复选框，单击,Continue,返回；单击,OK,。,1,、操作步骤,统计摘要表，列出观测量有效值个数、缺失值个数和总的个数。,从列联表中可看出，吸烟人中患病者有,43,人，比期望值,33.9,大，不吸烟人中患病者只有,13,人，比期望值,22.1,小。,2,、,输出结果及分析,输出结果如表：,吸烟与患病统计摘要表,吸烟与患病列联表,卡方检验,卡方检验表，从表中可看出，,Chi-Square,值为,7.469,，显著值为,0.0060.05,，应否定零假设，即认为吸烟与患慢性支气管炎是不独立的。由于使用卡方检验要求每个单元格频数不少于,5,，当条件不满足时，还可用,Fisher,精确检验。其双侧检验显著值为,0.007,。,对称性检验表，通过度量对称性来得到有效的观测个数，本例为,339,。,对称性检验表,

展开阅读全文

4第四章_基本统计分析

最新文档