资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第六章 双变量的统计分析之,二,均值比较与检验,主要内容,MEANS,过程,单一样本T检验,(One-Sample T Test),独立样本T检验,(Independent-Sample T Test),配对样本T检验,(Paired-Sample T Test),方差分析(,One-Way ANOVA),MEANS过程,一、Means过程,该过程实际上更倾向于对样本进行描述,可以对需要比较的各组计算描述指标,包括均值、标准差、总和、观测量数、方差等一系列单变量统计量。,二、完全窗口分析,按AnalyzeCompare MeansMeans顺序,打开Means主对话框(如图6-1)。,图61 Means主对话框,该框的变量为因变量,即用于分析的变量。,该框的变量为自变量,必须至少有一个变量,单击此按钮,进入下一层,返回则按Previous按钮。,见图62,Statistics框:供选择的统计量,Statistics for First Layer复选框:,Anova table and eta:进行分组变量的单因方差分析并计算eta 统计量。,Test for linearity:产生第一层最后一个变量的R和R,2,。,图62 Options 对话框,Cell Statistics框:,选入的描述统计量,默认为均值、样本数、标准差。,三、例题分析,某医生测得如下血红蛋白值(g%),用Means过程对其做基本的描述性统计分析。,表5-1血红蛋白值(g%),编号,性别,年龄,血红蛋白值,编号,性别,年龄,血红蛋白值,编号,性别,年龄,血红蛋白值,1,1,18,13.66,15,1,16,10.88,29,1,16,7.88,2,1,18,10.57,16,1,18,9.65,30,1,18,12.35,3,1,16,12.56,17,2,16,8.36,31,1,16,13.65,4,2,17,9.87,18,1,18,11.66,32,2,16,9.87,5,2,17,8.99,19,2,18,8.54,33,2,18,10.09,6,2,17,11.35,20,2,17,7.78,34,2,18,12.55,7,1,17,14.56,21,2,16,11.36,35,1,18,16.04,8,1,16,12.40,22,1,16,12.78,36,1,18,13.78,9,2,16,8.05,23,1,18,15.09,37,1,17,11.67,10,1,18,14.03,24,2,18,8.67,38,1,17,10.98,11,2,18,12.83,25,2,17,8.56,39,2,16,8.78,12,1,16,15.50,26,2,18,12.56,40,1,16,11.35,13,2,18,12.25,27,2,17,11.56,14,2,17,10.06,28,1,16,14.67,1、操作步骤,1)打开数据文件“,Means过程.sav,”。,2)按顺序Analyze Compare Means Means打开主对话框。,3)单击Option,打开Options对话框,选择统计项目。,4)单击OK完成。,选hb,sex,按Next,进入layer 2of 2,选age,图63 在主对话框选送变量,图64 第二层变量框,选择统计项目,按此,按钮,复选此2项,第一层次分组选择计算方差分析和线性检验,图65 Options对话框,表61 观测量摘要表,表61 是观测量摘要表,观测量总个数为40,其中有效值为40个、无效值0。,2.结果及分析,表62 分组描述统计量,表62 分三部分:第一、二部分先按性别分组,再按年龄分组计算观测值合计、均数、标准差、方差和个数;第三部分只按年龄分组,最后一行为合计。,表64 按年龄分组的描述统计量,表63 按性别分组的描述性统计量,血红蛋白*性别,血红蛋白*年龄,表63、4是将sex和age一起放在layer 1of 1中,分别计算男、女(不作年龄分组)。年龄分三组(不作性别分组)的观测值合计、均数、标准差、方差和个数。,表65 方差分析表,表65是方差分析表,共6列:第一列方差来源:组间的、组内的、总的方差;第二列为平方和;第三列为自由度;第四列为均方;第五列为F值;第六列为F统计量的显著值,显著值小于0.05,所以性别对血红蛋白值有显著影响。,表66 eta统计量,表66是eta统计量表,,统计量表明因变量和自变量之间联系的强度,0.567的值处于中等水平,,2,是因变量中不同组间差异所解释的方差比,是组间平方和与总平方和之比,即由64.5256除以 200.787得到。,表67 按年龄分组的方差分析表,表67是将年龄作为第一层自变量得到的方差分析表,Linearity是假设因变量均值是第一层自变量值的线性函数,Deviation from Linearity是不能由线性模型解释的部分。,表68 按年龄分组的eta统计量,表68是将年龄作为第一层自变量得到的eta统计量表,R和R,2,测度线性拟合的良好度,R是观测值与预测值之间的相关系数,。,一、简介,用于检验单个变量的均值与假设检验值(给定的常数)之间是否存在差异。,二、完全窗口分析,按AnalyzeCompare MeansOne-Sample T Test顺序,打开One-Sample T Test主对话框(如图5-1),一、单一样本T检验,图6-6 One-Sample T Test主对话框,图6-7 Options对话框,Test Variables框:用于选取需要分析的变量,Test Value:输入已知的总体均值,默认0,Confidence Interval:输入置信区间,一般取90、95、99等。,Missing Values:,在检验变量中含有缺失值的观测将不被计算。,在任何一个变量中含有缺失值的观测都将不被计算,三、例题分析,仍以表5-1的资料来说明。已知另一地区16-18岁的少年血红蛋白平均值为11.657g%,检验这一地区16-18岁少年血红蛋白值是否与另一地区的平均值相等。,1、操作步骤,1)按AnalyzeCompare MeansOne Sample T Test顺序,打开主对话框。(打开数据文件,“,Means过程.sav,”。),2)将变量hb选入 Test Variable框。,3)在Test Value中输入 11.657,后单击OK。,2、结果分析,表5-9 单个样本统计量,表5-9 是血红蛋白值的观测量个数、均值、标准差和均值的标准误等统计量。,表5-10 单个样本检验,从表5-10可看出,t 值为-0.592,自由度39,显著值为0.558,样本均值与检验值的差为-0.2122,该差值95%的置信区间是0.93790.5134。,一、简介,用于检验对于两组来自独立总体的样本,其独立总体的均值或中心位置是否一样。如果两组样本彼此不独立,应使用配对T检验(Paired-Sample T Test)。如果分组不止一个,应使用One-Way ANOVA 过程进行单变量方差分析。如果想比较的变量是分类变量,应使用Crosstabs功能。,独立样本T检验还要求总体服从正态分布,如果总体明显不服从正态分布,则应使用非参数检验过程(Nonparametric test),二、完全窗口分析,按AnalyzeCompare MeansIndependent-Sample T Test顺序,打开Independent-Sample T Test主对话框(如图5-10),二、独立样本T检验,图510 独立样本T检验主对话框,图511 Define Groups 主对话框,从源变量框中选取要作检验的变量。,为分组变量,只能有一个。,分别输入分组变量的取值条件,如1为男,2为女等。,输入分界点值,如体重60公斤等。,在检验变量中含有缺失值的观测将不被计算。,在任何一个变量中含有缺失值的观测都将不被计算,输入置信区间,一般取90、95、99等。,图5-9 Independent-Sample T Test的Options对话框,三、例题分析,仍以表5-1的资料来说明。,1、操作步骤,1)按AnalyzeCompare Means Independent-Sample T Test顺序,打开主对话框。打开数据文件“,Means过程.sav,”。,2)将变量hb选入 Test Variable框。,3)在sex选入Grouping Variable框中作为检验变量。,4)打开Define Groups对话框,在Group1输入1,Group2输入2,单击Continue,再单击OK。,2、结果分析,表5-11 是血红蛋白值的观测量个数、均值、标准差和均值的标准误等统计量。,表5-11 分组统计量,表5-12 独立样本T检验结果,从表5-12可看出,Equal variances assumed 行是假设方差相等进行的检验,当方差相等时考察这一行的结果;Equal variances not assumed行是假设方差不等进行的检验,当方差不等时考察这一行的结果。在Levenes Test for Equality of Variance列中,显著值为 0.5440.15,可认为方差是相等的,所以应考察第一行的结果。可看出,显著值为 0.0000.05,所以认为均值是不等的。,一、简介,用于检验两个相关的样本是否来自具有相同均值的总体。,二、完全窗口分析,1、主对话框,按AnalyzeCompare MeansPaired-Sample T Test顺序,打开Paired-Sample T Test主对话框(如图5-1),三、配对样本T检验,从源变量框中选取成对变量移入。,所选变量。,同图59,图510 Paired-Sample T Test 对话框,三、例题分析,某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白鼠按性别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料,一段时期后测定其肝中维生素A含量(,mol/L)如下,现在想知道饲料中缺乏维生素E对鼠肝中维生素A含量有无影响。,大白鼠配对编号,肝中维生素A含量(,mol/L),正常饲料组,维生素E缺乏组,1,37.2,25.7,2,20.9,25.1,3,31.4,18.8,4,41.4,33.5,5,39.8,34.0,6,39.3,28.3,7,36.1,26.2,8,31.9,18.3,表5-12 配对样本T检验数据,1、操作步骤,1)输入数据并定义变量名:正常饲料组测定值为x1,维生素E缺乏饲料组测定值为x2(数据文件“,饲料(配对T检验).sav,”。),2)按AnalyzeCompare MeansPaired-Sample T Test 顺序,打开主对话框。,3)单击变量x1,再单击x2,将x1,x2送入Variables框。,左下方Current Selections框中出现Variable1、Variable2,4)单击OK。,2、输出结果及分析,表5-13 配对样本T检验描述统计量,表5-13可看出,变量x1的均数、标准差、标准误分别为34.750、6.649、2.351,变量x2的均数、标准差、标准误分别为26.238、5.821、2.058。,表5-14 配对样本T检验相关性,表5-14可看出,本例共有8对观测值,相关系数为0.586,相关系数的显著性检验表明显著值为0.127。,表5-15 配对样本T检验结果,表5-16说明变量x1、x2两两相减的差值均数、标准
展开阅读全文