《假设检验基础》PPT课件.ppt

上传人:za****8 文档编号:6413463 上传时间:2020-02-25 格式:PPT 页数:65 大小:573.50KB
返回 下载 相关 举报
《假设检验基础》PPT课件.ppt_第1页
第1页 / 共65页
《假设检验基础》PPT课件.ppt_第2页
第2页 / 共65页
《假设检验基础》PPT课件.ppt_第3页
第3页 / 共65页
点击查看更多>>
资源描述
假设检验的推断原理 假设检验 Hypothesistest 假设检验的基本步骤 t检验和Z检验 两样本总体方差齐性检验 正态性检验 假设检验是统计推断的另一重要内容 正是应用统计推断的理论和方法 人们才能顺利地通过有限的样本信息去把握总体特征 实现抽样研究的目的 一 假设检验的推断原理 假设检验是对所估计的总体首先提出一个假设 假设样本来自同一总体 然后通过样本数据去推断是否拒绝 通过概率 这一假设 如果拒绝 认为该样本很可能不是来自同一总体 总体之间有差异 否则 认为该样本很可能来自同一总体 总体之间无差异 让我们先看一个例子 例 大量研究显示北方农村儿童前囟门闭合平均月龄为14 1月 某研究人员从东北某县抽取36名儿童 得囟门闭合月龄均值为14 3月 标准差为5 08月 问该县儿童前囟门闭合月龄是否大于一般儿童 对差别的可能原因分析 东北某县儿童囱门闭和月龄的总体均数与北方一般儿童的均数相等 差异是由抽样误差引起的 提示东北某县儿童是北方一般儿童总体的一部分 东北某县儿童囱门闭和月龄的总体均数与北方一般儿童的均数不相等 差异可能是由地域等环境因素引起的 提示东北某县儿童与北方一般儿童是两个不同的总体 由上面的例子可以看出 需要检验两个方面 与一般儿童相同 均数之间的差别主要是由于抽样误差所致 抽样误差影响的可能性大 其它因素影响的可能性小 大于一般儿童 是由于该区这个环境条件的影响 抽样误差影响的可能性小 那么 如何进行判断呢 统计上就是以抽样误差发生的可能性 也就是以小概率事件发生来判断 假设检验 通过对假设作出取舍抉择来达到解决问题的目的A 东北某县儿童囱门闭和月龄的总体均数与北方一般儿童的均数相等无差异假设 零假设H0 nullhypothesis B 东北某县儿童囱门闭和月龄的总体均数与北方一般儿童的均数不相等对立假设 备择假设H1 alternativehypothesis 证明A还是证明B 在H0成立的条件下 均数之间的差异是由抽样误差引起的 有规律可循 在H1成立的条件下 均数间的不同包含种种未知情形 无规律可循 故从H0成立的角度出发 寻求其成立的概率 变量值 月龄 X服从正态分布 且为小样本 假定H0成立 样本均数服从t 分布 则在H0成立的前提下 当前t值出现的概率有多大 如何给出这个量的界限 小概率事件在一次试验中基本上不会发生 从附表2中查出在显著性水平 0 05 双侧 自由度为35所对应的t界值 即为拒绝域与接受域的界限 如果计算出的t统计量大于相应的t界值 则落在拒绝域中 该统计量出现的概率小于5 为小概率事件 2 030 2 030 接受域 拒绝域 拒绝域 常取 的选择要根据实际情况而定 通常取0 05 检验水准的概念 在假设检验中 称预先规定的小概率值为检验水准 也称为显著性水准 用表示 这里所依据的逻辑是 如果H0是成立的 那么衡量差异大小的某个统计量落入区域拒绝域是个小概率事件 如果该统计量的实测值落入拒绝域 也就是说 H0成立下的小概率事件发生了 那么就认为H0不可信而否定它 否则我们就不能否定H0 只好接受它 1 建立检验假设 确定检验水准 H0 零假设 无效假设 是与研究假设有关的 被推断特征某种确定的关系 H1 备择假设 对立假设 是被推断总体特征的另一种关系或状况 与H0既有联系又互相对立 检验水准 将小概率事件具体化 即规定概率不超过就是小概率 2 根据试验设计 资料类型 统计方法的条件选择检验方法 计算相应的统计量 3 确定P值 下结论 假设检验的基本步骤 4 做统计推断 根据P值大小 在两个假设之间进行二者取一的选择 规则是 如果P 0 05 意味着在H0设定的前提下发生了 支持H1的 小概率事件 怀疑H0的真实性 即推测实际情况应为H1 从而做出拒绝H0 接受H1的推断结论 如果P 0 05 按照事先确定的标准 在H0的前提下没有发生 支持H1的 小概率事件 因而没有充足的理由对H0提出怀疑 于是做出不拒绝H0的推断结论 无论做出哪一种推断结论 都面临着发生判断错误的风险 这就是假设检验的两类错误 P值的概念 指从H0规定的总体中随机抽样抽得等于或大于 或等于或小于 现有样本统计量的概率 t检验 t test 单个样本t检验配对样本t检验两独立样本t检验t检验中的注意事项假设检验中两类错误 t检验 studentt检验 它以t分布为基础 是计量资料中最常用的假设检验的方法 包括单样本t 两独立样本t和配对样本t检验 学习时 要熟悉每种t检验它所对应的实验设计 适用条件 注意事项 理论上 t检验的应用条件是样本来自正态分布的总体 两样本均数比较时 还要求两总体方差齐同 在实际工作中 与上述条件略有偏离 只要其分布为单峰且近似对称分布 也可应用 当样本含量比较大时 可用u检验 单样本t检验 Onesamplet test 试验设计一组样本均数 代表未知总体均数 与已知总体均数 一般为理论值 标准值或经过大量观察所得稳定值等 的比较 应用条件 样本来自正态分布的总体且为随机样本 例 根据大量调查 已知健康成年男子的脉搏均数为72次 分 某医生在某山区随机调查30名健康男子 求得脉搏均数为74 2次 分 标准差为6 5次 分 能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数 建立检验假设 确定检验水准 确定检验方法 计算统计量 确定P值 下结论 查附表2 t界值为2 045 统计量小于界值 则P 0 05 接受H0 差异无统计学意义 尚不能认为该山区成年男子脉搏数与一般男子相同 配对样本t检验 Paireddesignt test 试验设计配对设计将受试对象按照某些重要特征 主要是非处理因素 配成对子 每对中的两个受试对象随机分配到两处理组 特点控制较多的个体变异 可比性好 常用于个体变异较大的资料 类型将受试对象配成特征相近的对子 随机接受两种处理 同一受试对象或同一份样品分成两份 随机分别接受不同处理 同一受试对象处理前后的结果比较 12名儿童分别用两种结核菌素的皮肤浸润反应结果 mm 配对设计下的数据具有一一对应的特征 人们关心的变量是对子的效应差值而不是各自的效应值 把两种处理后的数据之差看作处理效果的一个样本 假定这种差值服从正态分布 那么其总体均数为0 即表明该处理没有作用 问题转化为单组完全随机化设计资料总体均数为零的检验 应用条件 差值服从正态分布 建立检验假设 确定检验水准 计算统计量 3 确定P值 下结论 假设检验的步骤 两种方法对乳酸饮料中脂肪含量的测定结果 两独立样本t检验 Twoindependentsamplet test 试验设计完全随机设计将受试对象完全随机地分配到两组中 分别接受不同的处理 或者从两个总体完全随机地抽取一部分个体进行研究 目的 比较两总体均数是否相同 特点设计简单易行 常用于个体变异较小 同质性较好的资料 应用条件 两样本含量较小 n 60 两样本来源于正态分布的总体 两总体方差相同 即方差齐性 独立样本 方差齐性时 方差齐性检验 homogeneityofvariancetest 查附表3F界值表 附表3 两样本所属总体方差不等时 例 某妇产科医院的研究者探索孕妇在孕期补充钙制剂对血清骨钙素 ng ml 的影响 选取孕妇的年龄 基础骨钙素值接近 孕周在26 28周的30名孕妇 随机分成两组 每组15人 试验组孕妇补充选定的某种钙制剂 对照组孕妇采用传统膳食 产后40 50天内测定两组孕妇血清骨钙素的改变值 产前与产后骨钙素的差值 如下表 9 493 4 127 例3 某口腔科测得长春市13 16岁居民男性20人恒牙初期腭弓深度均值为17 15mm 标准差为1 59mm 女性34人均值为16 92mm 标准差为1 42mm 根据这份数据可否认为该市13 16岁居民腭弓深度有性别差异 若方差不齐 且不想用t 检验 则可以进行数据转换 达到方差齐性 再用t检验也可以 也可以用非参数检验方法 这里 当样本含量较大时 t分布临界值接近Z分布临界值 可用1 96或1 645来代替 这就是所谓的Z检验 四 两样本总体方差齐性检验 两总体方差是否齐同 要进行F检验 检验统计量为F 例 某研究人员将已诱导糖尿病模型的20只大鼠随机分为两组 一组用硫酸氧钒治疗 DV组 另一组作对照观察 D组 12周后测大鼠血糖含量 mmol L 结果为 DV组12只 样本均数6 5mmol L 标准差1 34mmol L D组8只 样本均数13 7mmol L 标准差4 21mmol L 两组数据变异度是否相同 注意到方差的统计学意义 是对两个总体的变异程度是否相同作推断 因此 它还可以用于处理另外一类问题 例 将同一瓶液样分成20份 随机分成两组 每组10份 用不同的方法分别检测液样中某物质的含量 mmol L 结果两种方法测得样本均数差异没有统计学意义 样本标准差分别为1 02与0 56 试问两法检测稳定性是否相同 完全随机设计两样本几何均数比较的t检验 基本思想 某些资料不服从正态分布 两样本所代表的总体方差也可能不齐 但进行变量变换后 对数变换 则服从正态分布 相应的两总体方差也可能具有齐性 数据变换后两组间的关系并没有改变 正态性检验 进行t检验的各种资料 必须满足符合正态分布的总体 若不能满足该条件 就不能进行t检验 正态概率纸法 以变量量纲的刻度 组段 为横坐标 以概率单位 相应频率转换 为纵坐标 将数据在直角坐标平面描点 为正态概率纸法 如果数据服从正态分布 所描出的散点 尤其是中间的点 沿一直线分布 P P图法 以样本的实际累计频率作为横坐标 以按照正态分布规律计算的相应的理论累计概率作为纵坐标 把样本点在直角坐标平面中 所得到的点图就是P P图 如果资料服从正态分布 样本点应围绕第一象限的对角线散布 Q Q图法 以样本的实际分位数 PX 作为横坐标 以按照正态分布规律计算的相应的理论分位数作为纵坐标 把样本点在直角坐标平面中 所得到的点图就是Q Q图 如果资料服从正态分布 样本点应围绕第一象限的对角线散布 目前流行的统计学软件主要提供P P图或Q Q图 直方图法 统计检验法 W检验 S S ShapiroandM B Wilk 统计量为W值 D检验 D Agostino 统计量为D值 矩法峰度与偏度检验 皮尔逊拟合优度检验等 也可以用于正态性检验 正态性检验法 在SPSS中可实现 推荐 经验法 均数大于2倍以上的标准差 25例正常人TL 6资料的P P图 t检验中应注意的事项 假设检验的前提是要有严密的抽样研究设计选用的假设检验方法应符合其应用条件正确理解差别有无统计意义结论不能绝对化假设检验与可信区间的关系 假设检验中单侧检验与双侧检验 1 699 假设检验与可信区间的关系 可信区间具有假设检验的主要功能可信区间可提供假设检验没有提供的信息假设检验提供区间估计所不能提供的信息 例 根据大量调查 已知健康成年男子的脉搏均数为72次 分 某医生在某山区随机调查30名健康男子 求得脉搏均数为74 2次 分 标准差为6 5次 分 能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数 用区间估计的方法 由于95 区间估计包含了健康成年男子的脉搏均数72 故可以认为该山区30名成年男子脉搏的总体均数与健康成年男子的脉搏均数来源于同一总体 两者的总体均数相等 与假设检验的结果是相同的 由于假设检验是根据有限的样本信息对总体作推断 不论做出哪一种推断结论都有可能发生错误 这就是假设检验的两类错误 假设检验的两类错误 类错误 如果实际情况与H0一致 仅仅由于抽样的原因 偶然性 使得统计量的观察值落到拒绝域 t值较大 从而实际上成立的H0遭到拒绝 导致推断结论错误 这样的错误称为 类错误 类错误 如果实际情况与H0不一致 也仅仅是抽样的原因 使得统计量的观察值落到接受域 从而实际上不成立的H0未被拒绝 则导致了另一种推断错误 这样的错误称为 类错误 两类错误的关系 犯 类错误的概率不会超过检验水准 犯 类错误的概率用 表示 因为在H0不成立时 检验统计量的精确分布往往难以确定 所以在多数情况下准确估计 的数值比较困难 因此 类错误的概率是未知的 P 对于某一具体的检验来说 当样本容量n一定时 越小 越大 越大 越小 在实际应用中 往往通过 去控制 在样本量确定时 如果要减小 就把 取大一些 若要同时减小I型错误 和II型错误 唯一办法就是增大样本含量 假设检验的功效 1 称为假设检验的功效 powerofatest 其意义是 当所研究的总体与H0确有差别 而满足H1时 按检验水平 能够识别的概率 如果1 0 90 则意味着H0当成立时 理论上在每100次抽样中 在 的检验水准上平均有90次能识别它 一般情况下对同一检验水准 不变 功效大的检验方法更可取 本章总结 conclusion
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!