《SPSS数据分析教程》--非参数检验.ppt

上传人:xin****828 文档编号:6291706 上传时间:2020-02-21 格式:PPT 页数:47 大小:1.97MB
返回 下载 相关 举报
《SPSS数据分析教程》--非参数检验.ppt_第1页
第1页 / 共47页
《SPSS数据分析教程》--非参数检验.ppt_第2页
第2页 / 共47页
《SPSS数据分析教程》--非参数检验.ppt_第3页
第3页 / 共47页
点击查看更多>>
资源描述
SPSS数据分析教程 非参数检验 本章学习目标 了解非参数检验和参数检验的区别掌握各种非参数检验及其应用条件掌握单样本非参数检验方法及其结果的解释掌握独立样本非参数检验方法及其结果的解释掌握相关样本非参数检验方法及其结果的解释 6 1非参数检验简介 参数检验方法检验的内容是总体分布的某些参数 例如均值 方差 比率等 非参数检验主要用于不考虑被研究对象的总体分布 或对总体的分布不做任何事先的假定的检验 非参数检验的内容不是总体分布的某些参数 而是检验总体某些有关的性质 例如总体的分布位置 分布形状之间的比较 或者各样本所在总体是否独立等 非参数检验方法的优点 稳健性 因对总体分布的约束条件放宽 从而对一些离群值或极端值不至于太敏感 使用范围广 对数据的度量标准 或测量测度 无约束 定序数据 定量数据都可 部分数据缺失也可 小样本 分布未知样本 数据污染样本 混杂样本等都可以应用非参数方法 非参数检验的应用范围 参数检验方法的条件不满足 例如样本来自的总体不服从正态分布 T检验不适用 必须应用非参数方法来比较两个总体的中心趋势 研究定类变量和定序变量之间的关系 SPSS非参数检验 新的用户界面统一了方法的选择 根据样本的个数来组织方法 非参数统计过程仍然保留了SPSS18以前的非参数检验的界面 称为 旧对话框 它的输出仍然为传统的表格方式展现检验结果 同时可以选择输出描述性统计量和四分位数 而新用户界面下没有 在非参数检验过程的对话框和帮助文档中 把以前熟悉的变量 Variable 称为字段 field 6 2单样本非参数检验 SPSS的单样本非参数检验方法包括 二项 分布 检验卡方检验Kolmogorov Smirnov检验Wilcoxon符号检验游程检验 卡方检验 卡方检验是一种常用的对总体分布进行检验的非参数检验方法 其基本功能是通过样本的频数分布来推断总体是否服从某种理论分布或者某种假设分布 这种检验过程是通过分析实际的频数与理论的频数之间的差别或者说吻合程度来完成的 例如 医生研究心脏病人猝死人数与日期的关系 检验现在的人口结构和十年前是否一样 血型是否和人的性格有关系 现代社会中受过高等教育 高中毕业 初中毕业 小学毕业和文盲的比例是否为3 6 10 2 1等问题都可以通过卡方检验来实现 卡方检验的原理 1 卡方检验的原假设是 H0样本来自的总体的分布与假设的分布 又称期望分布或者理论分布 无显著差异 卡方检验的基本思想是 如果从一个随机变量X所在的总体中随机抽取若干个观察样本 这些观察样本落在X的k个互不相交的子集中的观测频数服从一个多项分布 这个多项分布当k趋于无穷时近似服从卡方分布 卡方检验的原理 2 如果变量X有k个互不相交的子集 在成立的条件下 变量值落在第i个子集的频数设为 设实际观测到的第i个子集的频数为 则有以下Pearson卡方统计量 卡方检验的原理 3 卡方统计量服从自由度为k 1的卡方分布 如果卡方值较大 则说明期望频数与观测频数分布差距较大 没有证据支持原假设 反之 卡方值较小 说明期望频数与观测频数比较接近 不能拒绝原假设的论断 卡方检验例子 数据文件dischargedata sav记录了某医院每天的病人流量 医院管理者需要了解是否一周中每天的病人流量是相同的 Discharg列为日均病人流量 原假设 星期一到星期六 星期日每天的病人流量是相等的 SPSS实现卡方检验 选择 分析 非参数检验 单样本 在设置标签上 选择 比较观察可能性和期望可能性 在字段标签上 选择变量 day 选项设置 检验结果分析 聚类条形图显示检验字段每个类别的观察频率和假设频率 悬停在条形上将在工具提示中显示观察频率和假设频率及其差别 残差 观察和假设条形中的可见区别表明检验字段可能没有假设的分布 实例分析 人员结构的调动 某公司经营多年 形成了一套成熟的企业文化和管理体系 例如 根据多年的运营经验 经理层 监察员 办事员三种职务类别人员比例大约在15 5 80为宜 这样运行效率最高 目前公司进行人事调整 公司人员结构发生变化 有员工担心人事调整是否已经导致职务类型比例失调 请利用数据6 2 1来解决该问题 二项式检验 SPSS的二项式检验也是非参数检验方法的一种 它适用于对二分类变量的拟合优度检验 其基本功能是通过样本的频数分布来推断总体是否服从特定二项分布 这种检验过程是通过分析实际的频数与理论的频数之间的差别或者说吻合程度来完成的 例如 现代社会男 女的比例是否为1 01 1 工厂的次品率是否为1 等都可以通过二项式检验完成 实例分析 最新医学研究经验表明 目前我国20岁以上成人糖尿病患病率达10 数据6 2 2给出了随机抽取的200名河南省某地区20岁以上成人糖尿病患病情况 试用二项式检验方法研究该地区20岁以上成人糖尿病患病率是否低于一般概率 K S检验 K S检验是利用样本数据推断样本来自的总体是否与某一理论分布有显著差异 它是拟合优度检验的方法之一 一般比卡方检验更精确 适用于探索连续型随机变量的分布 K S检验的基本思想 根据样本数据和用户的指定构造理论分布 查看分布表得到相应的理论累计概率分布函数 利用样本数据计算各样本点的累计概率 得到经验累计概率分布函数 计算这两个函数在相同变量点上的差值 得到差值序列 K S检验主要对差值序列进行研究 SPSS的K S检验可以检验四种理论分布 正态分布 均匀分布 泊松分布和指数分布 K S检验可以检验某个班级的某科的成绩是否与正态分布有显著差异 某地区新生婴儿的体重是否与正态分布有显著差异 某商店顾客的到来是否与泊松分布有显著差异等等 单样本K S检验的原假设为 样本来自的总体与指定的理论分布无显著差异 Wilcoxon符号秩检验 Wilcoxon符号秩检验用于检验样本所来自的总体的中位数和所给的值是否有显著区别 该检验适用于连续型数据 或者尺度数据 它把观测值和原假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量 Wilcoxon符号秩检验的原假设为 样本所来自的总体的中位数等于给定的数值 游程检验 游程检验用于检验某一变量的两个值的出现顺序是否随机 对于连续型变量的随机性检验也可以转化为只有两个取值的分类变量的随机性的检验 游程检验通过对样本观测值的分析 用来检验该样本所来自的总体序列是否为随机序列 又称为白噪声序列 它也可以用来检验一个样本的观测值之间是否相互独立 游程检验的原假设为 总体中变量值的出现是随机的 实例分析 企业盈亏预测 已知某企业过去20年的盈亏情况为00001111111000111111 其中 0表示亏损 1表示盈利 现根据财务统计预测今年该企业盈利 请问这个结果对企业明年的经营状况有无影响 实例分析2 数据6 2 5给出了某纺织厂连续15天试得的28号梳棉棉条的棉结杂质粒数的数据 试用游程检验方法研究该纺织厂的生产情况是否正常 6 3独立样本非参数检验 独立样本非参数检验使用一个或多个非参数检验方法来识别两个或更多个组间的差别 对于两个分布未知的总体 或者两个总体的分布不服从正态时 我们无法应用T检验来比较两个总体 可以转而应用非参数的方法来比较两个总体的中心位置的差异 独立样本是指样本来自的总体相互独立 独立样本包括两个独立样本或者两个以上的独立样本 SPSS提供的独立样本非参数检验的方法有 两个独立样本分布的比较Mann WhitneyUKolmogorov SmimovWald WolfowitzK个独立样本分布的比较Kruskal WallisJonckheere Terpstra比较全矩Mosesextremereaction比较各组的中位数Mediantest 独立样本检验举例 一个公司把他们的销售代表随机分到三个不同的组中 进行不同的培训 两个月后对销售进行考察 我们想通过非参数检验比较不同组别的销售代表考试得分是否有显著性差异 这里 不同组别的考试得分是相互独立的 因此为独立样本数据 我们采用独立样本非参数检验 相关样本非参数检验 当比较一个总体的两个不同测量的差别时 如果这两个测量的分布未知 或者它们所来自的总体明显不服从正态分布时 配对的T检验不再适用 我们需要应用非参数的方法 SPSS相关样本非参数检验使用一个或多个非参数检验识别两个或更多相关字段间的差别 应用范围 每个记录对应于有两个或更多相关测量值存储在数据集中单独字段中的给定受试人 例如 如果每个受试人的体重以定期间隔测量并存储在如节食前体重 中间体重和节食后体重这样的字段中 则可使用样本相关非参数检验分析节食计划的有效性研究 这些字段为 相关 相关样本的非参数检验是配对T检验的推广 SPSS中的实现 SPSS相关样本的非参数检验对话框和单样本的非参数检验一样有三个选项卡 在 目标 选项卡上指定目标 在 字段 选项卡上指定字段分配 在 设置 选项卡上指定专家设置 相关样本检验举例 数据文件healthplans sav记录了某公司雇员对四种不同医疗保险计划的评价 每个雇员对每一种医疗保险方案给出从 非常不喜欢 到 非常喜欢 四种不同评价中的一种 我们想检验公司雇员对不同医疗保险计划的喜好程度是否有显著差别 该数据为同一个雇员的四种不同评价 为相关样本数据 因此采用相关样本非参数检验 设置字段 选择相应检验方法 在 设置 选项卡中选择 Friedman按秩二因素ANOVA K样本 并且在多重比较中的下拉框中选择 逐步降低 结果分析 可直观看出 PPO计划2 HMO计划1 HMO计划2 可划分在同一子集中 同样地 HMO计划1 HMO计划2 PPO计划1 也可划分在同一子集中 同一颜色用来表示同一子集 动手练习 细菌污水处理厂的微生物生态系统中最重要的组成部分 水资源管理工程师认为在某个指定工厂收集的污水样本中活性细菌的百分数的中位数为40 如果活性细菌的百分数的中位数大于40 则应该调整污水处理过程 数据Water sav记录了含有10个污水样品的随机样本中活性细菌的百分数 在显著性水平为5 的条件下 该样本提供了充分证据表明污水样本中活性细菌的百分数的中位数大于40吗 集体项目
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!