SPSS统计分析第四章均值比较与T检验.ppt

上传人:sh****n 文档编号:6414532 上传时间:2020-02-25 格式:PPT 页数:44 大小:1.07MB
返回 下载 相关 举报
SPSS统计分析第四章均值比较与T检验.ppt_第1页
第1页 / 共44页
SPSS统计分析第四章均值比较与T检验.ppt_第2页
第2页 / 共44页
SPSS统计分析第四章均值比较与T检验.ppt_第3页
第3页 / 共44页
点击查看更多>>
资源描述
第四章均值比较与T检验 统计分析常常采取抽样研究的方法 即从总体中随机抽取一定数量的样本进行研究来推论总体的特性 由于总体中的每个个体间均存在差异 即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同 由此可以得出这样的认识 均值不相等的两个样本不一定来自均值不同的总体 能否用样本均数估计总体均数 两个变量均数接近的样本是否来自均值相同的总体 换句话说 两个样本某变量均值不同 其差异是否具有统计意义 能否说明总体差异 这是各种研究工作中经常提出的问题 这就要进行均值比较 对来自正态总体的两个样本进行均值比较常使用T检验的方法 T检验要求两个被比较的样本来自正态总体 两个样本方差相等与不等时使用的计算t值的公式不同 进行方差齐次性检验使用F检验 对应的零假设是 两组样本方差相等 p值小于0 05说明在该水平上否定原假设 方差不齐 否则两组方差无显著性差异 F值的计算公式是 F S12 较大 S22 较小 进行均值比较及检验的过程 MEANS过程Ttest过程单一样本T检验独立样本的T检验配对样本的T检验单因素方差分析 一 MEANS过程 MEANS过程计算指定变量的综合描述统计量 当观测量按一个分类变量分组时 MEANS过程可以进行分组计算 例如要计算学生的平均身高 SEX变量把学生按性别分为男 女生两组 MEANS过程可以分别计算男 女生平均身高 用于形成分组的变量应该是其值数量少且能明确表明其特征的变量 使用MEANS过程求若干组的描述统计量 目的在于比较 因此必须分组求均值 这是与Descriptives过程不同之处 MEANS过程的基本功能是分组计算指定变量的描述统计量 包括均值 标准差 总和 观测量数 方差等一系列单变量描述统计量 还可以给出方差分析表和线性检验结果 Mean过程的数据文件要求 至少有一个连续变量 一个分类变量 离散变量 对连续变量求其基本描述统计量 分类变量用来分组 以27个学生的身高为例说明操作步骤 data11 01 变量no编号 sex性别 age年龄 h身高 w体重 ANOVAtableandeta 输出第一层控制变量给出的方差分析表和eta统计值 和 2 统计量表明因变量和自变量之间联系的强度 2是组间平方和与总平方和之比 Testforlinearity 线性检验 输出R和R2 只有在控制变量有基本的控制级 且自变量有三个水平以上时才能选用 对第一层变量的方差分析结果 身高 年龄 方差分析的变量信息 说明是分析不同年龄的身高均值间是否存在显著性差异 SumofSquares 偏差平方和 df 自由度 Meansquare 均方 F 方差值 sig P值 BetweenGroups 组间偏差平方和 由两部分组成 Linearity是由因变量与控制变量之间的线性关系引起的 Deviationfromlinearity不是由因变量与控制变量之间的线性关系引起的 WithinGroups 组内偏差平方和 各组内的变异相对于组均值的变异 Total 偏差平方和的总和 为组间偏差平方和与组内偏差平方和之和 线性检验结果 R是因变量身高的观测值与预测值之间的的相关系数 R值越接近1表明回归方程的预测性越好 Eta 即 值 0 1 说明因变量与自变量之间的联系程度 EtaSquared 2为组间偏差平方和与偏差平方和总和之比 练习题 已知97个被调查幼儿的体健资料并建立了CHILD sav数据文件 试按性别 X2 对身高 X5 与体重 X4 做平均数分析 CHILD sav数据文件在SP11DATA文件夹下 二 Ttest过程 1 单一样本T检验 One sampleTTest 检验单个变量的均值是否与给定的常数 一般为理论值 标准值或经过大量观察所得的稳定值等 之间存在差异 样本均数与总体均数之间的差异显著性检验属于单一样本T检验 举例 已知某地区12岁男孩平均身高为142 3cm 1973年某市测量120名12岁男孩身高资料 分析该市12岁男孩的身高与该地区平均身高有无明显差异 建立数据库 data11 02 Confidenceinterval 95 置信区间项 可以自定义 MissingValues 选择对缺失值的处理方法Excludecasesanalysisbyanalysis 带有缺失值的观测值当它与分析有关时才被剔除 Excludecaseslistwise 剔除所有列在Test Grouping矩形框中的变量带缺失值的项 身高基本描述统计量 单样本T检验分析结果 95 ConfidenceIntervaloftheDifference 差值的95 置信区间 95 的置信区间 均值 1 96标准误 根据上表95 置信区间是143 048 1 96 0 531即142 0 144 1之间 由此推出 改范围与总体均数之差为142 0 142 3 144 1 142 3 即表中 0 304和1 800的含义 实际上样本均值与总体均值142 3之间的差值落在 0 301 1 800之间的占95 的范围包括0 由此得出样本均数与总体均数无显著性差异 也就是样本均数与总体均数之差与0无显著性差异 练习题 已知某水样中含CaCO3的真值为20 7mg L 现用某方法重复测定该水样11次CaCO3的含量 mg L 为 20 99 20 41 20 10 20 00 20 91 22 60 20 99 20 41 20 00 23 00 22 00 问该方法测得的均值是否偏高 2 IndependentSampleTtest 独立样本T检验 独立样本的T检验用于检验是否两个不相关的样本来自具有相同均值的总体 必须注意使用这种检验的条件是必须具有来自两个不相关组 非配对 的观测量 其均值必须是对你想在两组中都计算的变量的综合测度 如果分组样本彼此不独立 例如测量的是研究对象用药前后某项指标 要求比较用药前后某项指标均值是否有显著性差异 应该使用配对T检验的功能 PairedSampleTtest 如果分组不止两个 应该使用One WayANOV过程进行单变量方差分析 如果你试图比较的变量明显不是正态分布的 则应该考虑使用一种非参数检验过程 Nonparametrictest 如果想比较的变量是分类变量 应该使用Crosstabs功能 Usespecialvalues 按分组变量的值进行分组Cutpoint 当分组变量为连续变量时 选择该选项后 在后面的矩形框中输入一个连续变量值 将观测量分为大于该值和小于该值的两个组 检验在这两个组之间进行 比较其因变量在两组的均数间是否有显著性差异 Confidenceinterval 95 置信区间项 可以自定义 MissingValues 选择对缺失值的处理方法Excludecasesanalysisbyanalysis 带有缺失值的观测值当它与分析有关时才被剔除 Excludecaseslistwise 剔除所有列在Test Grouping矩形框中的变量带缺失值的项 例题一 现有银行雇员工资为例 检验男女雇员现工资是否有显著差异 一个是要比较salary变量的均值 另一个是gender变量作为分水平变量 data09 03 分析变量的简单描述性统计量 左第一栏为分析变量标签和分类变量标签N观测量数目Mean均值Std Deviation标准差Std ErrorMean标准误 独立样本T检验结果 Levene sTestforEqualityofVariances 方差齐性检验结果 F方差值119 669Sig P值为0 t testforEqualityofMeans为T检验结果栏t t值 df 自由度 Sig 显著性概率即P值 MeanDifference 两组均值之差 表现平均当前工资女性低于男性15409 86元 Std ErrorDifference 差值的标准误为131 40 95 ConfidenceIntervaloftheDifference 差值的95 置信区间 在12816 7 18003 0之间 不包括0即两组均值之差与0有显著性差异 例题二 有29名13岁男生的身高 体重 肺活量数据 试分析大于等于155cm的与身高小于155cm的两组男生的体重和肺活量均值是否有显著差异 无效假设H0 身高大于等于155cm的与身高小于155cm的两组男生的体重平均值在99 水平上具有显著差异 身高大于等于155cm的与身高小于155cm的两组男生的肺活量平均值在99 水平上无显著差异 在options框中 confidence输入99 练习题 某克山病区测得11例急性克山病患者与13名健康人的血磷值如下 患者 2 60 3 24 3 73 3 73 4 32 5 18 4 73 5 58 5 78 6 40 6 53健康人 1 67 1 98 1 98 2 33 2 34 2 50 3 60 3 73 4 14 4 17 4 57 4 82 5 78问该地区急性克山病患者与健康人的血鳞值是否不同 三 配对样本T检验 配对样本T检验 PairedSampleTtest 用于检验两个相关的样本是否来自具有相同均值的总体 这种相关的或配对的样本常常来自这样的实验结果 在实验中被观测对象在实验前后均被观测 两个变量可以是beforeafter 配对分析的测度也不是必须来自同一个观测对象 一对可以两者组合而成 进行配对样本的T检验要求被比较的两个样本有配对关系 要求两个样本均来自正态总体 而且均值是对于检验有意义的描述统计量 均值的配对比较是比较常见 见以下几个例子 同一窝实验用白鼠按性别 体重相同的配对 再随机分到实验组和对照组 分别喂加入海藻的饲料和普通饲料 三个月后 分别将每对白鼠置于水中 测量其到溺死前的游泳时间 比较两组白鼠游泳时间均值 从而比较两种饲料对抗疲劳的作用 同一组高血压病人在进行体育疗法前后 测量其血压 每个病人在体育疗法前后的血压测量值构成观测量对 可以求这组病人体育疗法前后血压平均值 进行配对T检验 分析体育疗法对降血压的疗效 在研究人体各部位体温是否有差别 一个人的两个部位的温度构成一对数据 测量若干人的同样两个部位的温度数据 可以比较这两个部位平均温度是否有显著性差异 使用配对t检验 配对样本T检验实际上是先求出每对测量值之差值 对差值求均值 检验配对变量均值之间差异是否显著 其实质检验的假设实际上是差值的均值与零均值之间差异的显著性 如果差值均值与O均值无显著性差异说明配对变量均值之间无显著性差异 配对样本T检验与独立样本T检验均使用T TEST过程 但调用该过程的菜单不同 对数据文件结构的要求不同和所使用的命令语句也有区别 进行配对样本T检验的数据文件中一对数据必须作为同一个观测量中两个变量值 例题一 现以体育疗法治疗高血压的数据 pretreat 治疗前舒张压 mmHg posttreat 治疗后舒张压 mmHg 要求判断体育疗法对降低血压是否有疗效 data11 03 治疗前后舒张压的单变量描述统计量 变量名标签 列出配对变量的变量标签 对数为1 均值 分别给出治疗前后的舒张压均值 119 50 102 50观察量数目标准差 10 069 11 1118标准误 3 184 3 516 配对变量之间的相关性 Correlation 相关系数 0 599 Sig 为不相关的概率 0 067 相对于治疗前后舒张压的相关系数为0的假设成立概率为0 067大于0 05 可以得出结论治疗前后舒张压没有明显的线性关系 T检验结果 Mean 均值之间的差值 17 00 Std Deviation 差值的标准误 9 534 95 的置信区间 10 18 23 82 T值 5 639 df 自由度 Sig 显著性概率 0 例题二 12名排球运动员用新训练方法进行训练 训练前后分别测试6项技术指标 试分析新训练方法对6项技术的提高是否有效 data11 04 手形控制训练前后变量对 bhand ahand 睁眼力量控制训练前后变量对 bcfc1 acfc1 闭眼力量控制训练前后变量对 bcfc2 acfc2 准确性训练前后变量对 bacur aacur 左手用力感训练前后变量对 bfoc1 afoc1 右手用力感训练前后变量对 bfocr afocr 练习题 10例矽肺患者经治疗前后的血红蛋白量见下表 问治疗对血红蛋白量有无作用
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!