资源描述
第八章 假设检验的概念及 t检验 总体 样本 抽取部分观察单位 统计量 参 数 统计推断 统计推断 statistical inference 如:样本均数 样本标准差 S 样本率 P 如:总体均数 总体标准差 总体率 X 内容: 1. 参数估计 (estimation of parameters) 包括:点估计与 区间估计 2. 假设检验 ( test of hypothesis) 实例 通过以往大规模调查,已知某地一般新生 儿的头围均数为 34.50cm。 为研究某矿区 新生儿的发育状况,现从该地某矿区随机 抽取新生儿 55人,测得其头围均数为 33.89cm, 问该矿区新生儿的头围总体均 数与一般新生儿头围总体均数是否不同? 假设检验的步骤及有关概念 总体间差异: 1. 个体差异,抽样误差所致; 2. 总体间固有差异 判断差别属于哪一种情况的统计学检验,就是 假设检验 。 小概率思想 : P0.05( 或 P (0.05) 样本差别无统 计学意义 假设检验 (test of hypothesis):,事先对总体的特征作 出某种假设 ,通过分析 样本 数据,判断该样本信息是否 支持这种假设,最后作出拒绝或不拒绝这种假设的取舍 抉择。此方法称作假设检验 。 1、建立假设与确定检验水准( ) H0: 1 2 无效假设( null hypothesis) H1: 1 2 备择假设( alternative hypothesis) 检验水准( level of a test): =0.05( 双侧 ) 2、选定方法和计算统计量: 根据统计推断目的、设计、资料组数、样本含量、等 选择方法。如两组小样本比较用 t检验、大样本比较 u 检验、方差齐性检验用 F检验。 3、确定 P值,作出判断 P(0.05) 样本差别有统计学意义; P (0.05) 样本差别无统计学意义 P值: 指在 H0成立的假设前提下,出现当前检验统计 量以及更极端情况的概率。 假设检验的步骤 1.差异来源 该矿区新生儿总体均数与一般新生儿头围总体 均数相同 该矿区新生儿总体均数与一般新生儿头围总体 均数不同 H0: = 0 34.50 , H1: 0 34.50 单凭一份样本不可能证明哪一个正确,可考虑 样本资料和哪一个假设有较大的矛盾来决定拒绝 哪一个假设。一般考察样本资料是否与 H0有较大 的矛盾 分析思路 2. H0成立时会怎样? 所得 u值因样本而 异,但其绝对值多数情况下落在 0附近。 u的分布规律可由 u界值表查出 3.当前状况如何,发生的可能性( P值)有 多大? n=55, =33.89, 0 =34.50 得 u=-2.273 n X u 0 0 X 99.1 0 拒绝域 接受域 拒绝域 P值 系指在 H0成立的假设前提下,出现当 前检验统计量以及更极端情况的概率。 查 u界值表,当前 u值以外的双侧尾部面积 介于 0.05和 0.02之间 4.决策 决策者需要事先规定一个可以忽略的 小概率值 。 如取 0.05,那么上述 P值可认 为很小。即 H0成立时,几乎不可能出现当 前的状况。 )2 7 3.2( uP 于是,面临两种抉择,一是认为 H0是成立的, 而当前的极端情况又恰好偶然发生了;二是 怀疑 H0的正确性,从而接受 H1。 通常选择后 者。本例,可认为该矿区新生儿总体均数与 一般新生儿头围总体均数不同。 例 8-2: 1995年,某地 20岁应征男青年平 均身高为 168.5cm。 2003年在当地 20岁 应征男青年中随机抽取 85人,平均身高 为 171.2cm, 标准差为 5.3cm, 问这两年 身高是否不同。 解: 总体方差一般未知,当样本含量足够 大时,用 S作为 的估计值。 1 建立假设,确定检验水准 H0: 168.5, H1: 168.5 0.05 2 计算统计量 u 3 确定 P值,下结论 查 u界值表, 4.70 u 0.001/2=3.2905,得 P u 0.001/2=3.2905,得 P 0.001,按照 0.05水准,拒绝 H0, 接 受 H1, 可认为试验组和对照组退热天数的 总体均数不等,疗效不同。试验组比对照 组平均退热天数短。 1- 2 的 95可信区间为 -3.3 -1.3天 型错误和 型错误 由样本推断的结果 真实结果 拒绝 H0 不拒绝 H0 H0成立 型错误 a 推断正确 (1 a ) H0不成立 推断正确( 1 b) 型错误 b ( 1 b) 即 把握度 ( power of a test):两总 体确有差别,被检出有差别的能力 ( 1 a) 即 可信度 ( confidence level):重复 抽样时,样本区间包含总体参数( ) 的百分数 对于一般的假设检验 , a定为 0.05( 或 0.01) , b的大小 取决于 H1。 通常情况下 , 比较总体间有 无差异并不知道 , 即 H1不明确 , b值的 大小无法确定 , 也就是说 , 对于一般的 假设检验 , 我们并不知道犯 型错误的 概率 b有多大 。 通常情况下 型错误未知 a b 减少(增加) I型错误 ,将会 增加(减少) II型错误 增大 n 同时降低 a 与 b a 与 b 间的关系 假设检验注意事项 ( 1)可比性 (随机性抽样、分组,资料具有均衡性和 可比性 ) ( 2)正确选用假设检验方法 ( 3) “ 差别 ” 的实际意义 (正确理解差别有统计学意 义的涵义。 有统计学意义指:样本来自不同的总体, 而并非指差别很大,不能说明差别的大小 .当专业上 和统计学上都有 “ 显著性意义 ” 时,才有实用价 值。 ) . ,05.03200 ,3200,96.12 )22( 1 1.0 )( 1 , ;2,3.10;2,4.10: 21 222 1 2 1 21 21 2 2 1 1 但无大的实际意义 结论就可得到 故只要可求得令 例 Pnnn nu n ss n xx unnn sxsx 假设检验注意事项 (4)判断结论时不能绝对化 (原因是存在着两类错误 写出精确 P值:若对同一研究内容, A研究的结果 P=0.002,B研究的结果 P=0.04,虽结果均为拒绝 H0,但 A结 果更为可信 . ( 5)单侧检验与双侧检验 ( 6)报告结果应写出统计量值、具体 P值(单侧时应注明); 95 CI既能说明差别的大小,也具有检验的作用,建议 使用 。 (可信区间与假设检验均为统计推断方法,可信区 间可以检验差值大小,假设检验可精确表示相关事件的 概率。统计结果同时报告检验统计量、 P值和可信区间更 值得提倡。 ) 第十章 t检验( t test) t检验,亦称 student t检验( Students t test), 主要用于样本含量较小( 例如 n0.05 , 按 = 0.05 水 准 , 不 拒 绝 H 0 , 两 者 的 差 别 无 统 计 学 意 义 附表 2 t界值表 二、配对资料的比较 两种情况 : 1.随机配对设计 (randomized paired design)是将受试对象按某些混杂因素(如性 别、年龄、窝别等) 配成对子 ,每对中的两个个体随 机分配给两种处理(如处理组与对照组); 2.或者 同 一受试对象 作两次不同的处理 (自身对照 )。 优点 :配对设计 减少了个体差异 。 特点: 资料成对,每对数据不可拆分。 计算出各对 子 差值 d 的均数 d 。当 比较 组 间 效果相 同时, d 的总体均数 d 0 ,故可将配对 设计资料的假 设检验视为样 本均数 d 与总体均 数 d =0 的比较,所用 方法 称 为配对 t 检验 ( p a i r e d t - te s t )方法 。 1, / | n nS d S d t dd d 表 3-4 两法测定 12份尿铅含量的结果 尿铅含量( mol/l ) 样品号 简便法 常规法 差值( d ) 2 d 1 2 .4 1 2 .8 0 - 0 .3 9 0 .1 5 2 1 2 2 .9 0 3 .0 4 - 0 .1 4 0 .0 1 9 6 3 2 .7 5 1 .8 8 0 .8 7 0 .7 5 6 9 4 3 .2 3 3 .4 3 - 0 .2 0 0 .0 4 0 0 5 3 .6 7 3 .8 1 - 0 .1 4 0 .0 1 9 6 6 4 .4 9 4 .0 0 0 .4 9 0 .2 4 0 1 7 5 .1 6 4 .4 4 0 .7 2 0 .5 1 8 4 8 5 .4 5 5 .4 1 0 .0 4 0 .0 0 1 6 9 1 2 .0 6 1 1 .2 4 0 .8 2 0 .6 7 2 4 10 1 .6 4 1 .8 3 - 0 .1 9 0 .0 3 6 1 11 1 .0 6 1 .4 5 - 0 .3 9 0 .1 5 2 1 12 0 .7 7 0 .9 2 - 0 .1 5 0 .0 2 2 5 合 计 - - 1 .3 4 2 .6 3 1 4 表 3-3 两法测定 12份尿铅含量的结果 1. 建 立 假 设 、 确 定 检 验 水 准 H 0 : 0 d H 1 : 0 d ( 双 侧 检 验 ) = 0 . 0 5 2. 计 算 检 验 统 计 量 112.01234.1 d , 34.1d , 6314.2 2 d , 475.0 112 12/34.16314.2 1 /)( 222 n ndd S d 111121,817.0 12/475.0 112.0 / | n nS d t d 3. 查 相 应 界 值 表 , 确 定 P 值 , 下 结 论 。 查 表 201.2 11,2/05.0 t , 11,2/05.0 tt , P 0 . 0 5 , 按 = 0 . 0 5 水 准 , 不 拒 绝 H 0 , 两 种 方 法 的 测 量 结 果 差 值 无 统 计 学 意 义 。 三、两样本均数的比较 完全随机设计 (completely random design) : 把受试 对象完全随机分为两组,分别给予不同处理,然后比较独 立的两组样本均数。各组对象数不必严格相同。 目的 :比较两总体均数是否相同。 条件:假定资料来自正态总体, 12= 22 计算公式: )11( 21 2 - 21 nnSS cXX 2- )1-()1-( 1-1- /)(-/)(- 21 2 22 2 11 21 2 2 2 2 21 2 1 2 12 nn SnSn nn nXXnXXS c 2-1-1-,- 2121 - 21 21 nnnnS XXt XX 其中,均数差的标准误 实 例 例 3 - 9 白 血 病 组 )( 1 X : 1 2 .3 13 .2 13 .7 15. 2 15. 4 15. 8 1 6. 9 正 常 组 )( 2 X : 1 0.8 11 .6 12 .3 12 .7 13 .5 13 .5 14 .8 问 正 常 鼠 和 白 血 病 鼠 脾 脏 中 DNA 平 均 含 量 ( mg/g ) 是 否 不 同 ? 解 : 本 例 : 1 n = 7 , 1 X =1 4.6 4 , 1 S = 1. 62 , 2 n = 7 , 2 X =1 2. 74 , 2 S = 1. 33 1. 建 立 假 设 、 确 定 检 验 水 准 。 H 0 : 21 H 1 : 21 =0 .0 5 2. 计 算 检 验 统 计 量 。 22 2 ( 7 1 ) 1.62 ( 7 1 ) 1.33 2.20 772 c S 12 2 12 | | 14.6 4 12.7 4 | 2.39 1 1 1 1 ( ) 2.20 ( ) 77 c XX t S nn , 12277 3. 查 相 应 界 值 , 确 定 P 值 , 下 结 论 。 查 表 179.2 12,2/05.0 t , 0.0 5 / 2 , 12 tt , P 0 . 0 5 , 按 = 0 . 0 5 水 准 , 不 拒 绝 H 0 , 两 组 总 体 方 差 的 差 别 无 统 计 学 意 义 , 尚 不 能 认 为 两 组 总 体 方 差 不 等 。 若 两 总 体 方 差 不 等 , 即 2221 时 , 1. 近 似 t 检 验 ( s e p a r a t e v a r i a n c e e s t i m a t i o n t - t e s t ) t 检 验 2. 采 用 数 据 变 换 3. 非 参 数 检 验 Y log (X+a) Y Y x Y p1sin 方差齐性检验 附 表 3 F 界 值 表 ( 方 差 齐 性 检 验 用 , 双 侧 界 值 ) P =0.05 分 子 的 自 由 度 , 1 分 母 自 由 度 2 1 2 3 4 5 6 7 8 1 64 8 800 864 900 92 2 937 948 95 7 2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 t检验的类型 样本均数与总体均数比较的 t检验 (单组设计) ( one sample t test) 配对设计定量资料的 t检验 ( paired t-test) 成组设计定量资料的 t检验 ( two sample t test) 小 结 三个概念 1 独立性 :指一批实验数据彼此之间是互 相独立的。例如测得不同学生的身高、不 同学生的考试成绩。 2 正态性:是指每个影响因素各水平组的定 量资料来自于正态或近似正态分布的总体。 3 方差齐性:指每个影响因素各水平组的总 体方差应当相等。 一 单组设计的特点及应满足的前提条件 1 设计特点:对一组同质的受试对象不按任何 其它因素分组,直接观测或给予一种特定处 理后观测这些受试对象某种或多种指标的取 值。 2 已知 总体均数 0一般为理论值、标准值或经 大量观察所得的稳定值。 3 前提条件:样本数据满足正态或近似正态分 布。 4 统计量的计算: 1, / | 00 ndf nS x S x t x 二 配对设计的特点及应满足的前提条件 1 设计特点: A 随机配对设计 (randomized paired design)是将受试对象按某些混杂因素(如性别、 年龄、窝别等)配成对子,每对中的两个个体随机 分配给两种处理(如处理组与对照组 ); B.或者同 一受试对象作两次不同的处理 (自身对照 )。 优点: 配对设计减少了个体差异。 资料成对,每对数据 不可拆分。 2 前提条件:成对数据间的差值满足正态或近 似正态分布。 3 统计量的计算: 1, / | ndf nS d S d t d d d d 三 成组设计的特点及资料应满足的前提条件 1 设计特点: 完全随机设计 (completely random design) : 把受试对象完全随机分为两组,分别给 予不同处理,然后比较两组样本均数。两组数据是 独立的,两组对象数不必严格相同。 2 前提条件:两组数据间是互相独立的、两组 数据分别服从正态或近似正态分布、两组资 料所对应的总体方差相等。 3 统计量的计算: )(2 )1()1( 21 21 21 2 22 2 11 21 nn nn nn SnSn XXt 五、资料不满足正态与方差齐时进行检验 之对策 1 对数变换:常用于数据呈正偏态分布,较 小数据多,较大数据少。 2 平方根变换:常用于服从 Poisson分布的 资料,算术均数 =方差。 3 倒数变换:常用在数据呈极严重的正偏态 分布,变换后可使特大数据变小,资料近 似正态。 对策 五、资料不满足正态与方差齐时进行 检验之对策 4 平方根反正弦 常用于百分率数据 (如白血病患者的淋巴细胞转化率,脑电图 波的变化率等) 5 当数据有负数时,作对数或平方根变换可对 原始数据相加一个常数使其变为正数。 6 近似 t检验 (separate variance estimation t-test) t检验 7 非参数检验 -秩和检验 p1s in 对策 两 均 数 比 较 样本与总体 单样本 t检验 配对 配对 t检验 方差齐性 变量变化 两 样 本 t检验 两样本 t检验 差值呈正态 秩和检验 指标呈正态 分析思 路 讨论题 1 要比较一组肺结核病人治疗前后的淋巴细胞与白细胞总数 的百分比 , 以评价治疗效果 , 可用 ( ) A c2检验 B t检验 C 配对 c2检验 D 配对 t检验 2 对两样本均数进行假设检验时 , P值越小 , 说明 ( ) A 两总体均数有差别的可能性越大 B 两总体均数有差别的可能性越小 C 两总体均数相差越大 D 两总体均数越小 3 两组数据中的每个变量值减同一常数后做两个均数差别的 t 检验 ( ) A t值不变 B t值变小 C t值变大 D t值不能确定 )(2 )1()1( 21 21 21 2 22 2 11 21 nn nn nn SnSn XXt
展开阅读全文