假设检验的概念及.ppt

资源描述

第八章假设检验的概念及 t检验总体样本抽取部分观察单位统计量参数统计推断统计推断 statistical inference 如：样本均数样本标准差 S 样本率 P 如：总体均数总体标准差总体率 X 内容： 1. 参数估计 (estimation of parameters) 包括：点估计与区间估计 2. 假设检验（ test of hypothesis) 实例通过以往大规模调查，已知某地一般新生儿的头围均数为 34.50cm。为研究某矿区新生儿的发育状况，现从该地某矿区随机抽取新生儿 55人，测得其头围均数为 33.89cm，问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同？假设检验的步骤及有关概念总体间差异： 1. 个体差异，抽样误差所致； 2. 总体间固有差异判断差别属于哪一种情况的统计学检验，就是假设检验。小概率思想 : P0.05（或 P (0.05) 样本差别无统计学意义假设检验 (test of hypothesis):,事先对总体的特征作出某种假设 ,通过分析样本数据，判断该样本信息是否支持这种假设，最后作出拒绝或不拒绝这种假设的取舍抉择。此方法称作假设检验。 1、建立假设与确定检验水准（） H0: 1 2 无效假设（ null hypothesis） H1: 1 2 备择假设（ alternative hypothesis）检验水准（ level of a test）： =0.05( 双侧 ) 2、选定方法和计算统计量：根据统计推断目的、设计、资料组数、样本含量、等选择方法。如两组小样本比较用 t检验、大样本比较 u 检验、方差齐性检验用 F检验。 3、确定 P值，作出判断 P(0.05) 样本差别有统计学意义； P (0.05) 样本差别无统计学意义 P值：指在 H0成立的假设前提下，出现当前检验统计量以及更极端情况的概率。假设检验的步骤 1.差异来源该矿区新生儿总体均数与一般新生儿头围总体均数相同该矿区新生儿总体均数与一般新生儿头围总体均数不同 H0： = 0 34.50 ， H1： 0 34.50 单凭一份样本不可能证明哪一个正确，可考虑样本资料和哪一个假设有较大的矛盾来决定拒绝哪一个假设。一般考察样本资料是否与 H0有较大的矛盾分析思路 2. H0成立时会怎样？所得 u值因样本而异，但其绝对值多数情况下落在 0附近。 u的分布规律可由 u界值表查出 3.当前状况如何，发生的可能性（ P值）有多大？ n=55, =33.89, 0 =34.50 得 u=-2.273 n X u 0 0 X 99.1 0 拒绝域接受域拒绝域 P值系指在 H0成立的假设前提下，出现当前检验统计量以及更极端情况的概率。查 u界值表，当前 u值以外的双侧尾部面积介于 0.05和 0.02之间 4.决策决策者需要事先规定一个可以忽略的小概率值。如取 0.05，那么上述 P值可认为很小。即 H0成立时，几乎不可能出现当前的状况。 )2 7 3.2( uP 于是，面临两种抉择，一是认为 H0是成立的，而当前的极端情况又恰好偶然发生了；二是怀疑 H0的正确性，从而接受 H1。通常选择后者。本例，可认为该矿区新生儿总体均数与一般新生儿头围总体均数不同。例 8-2： 1995年，某地 20岁应征男青年平均身高为 168.5cm。 2003年在当地 20岁应征男青年中随机抽取 85人，平均身高为 171.2cm，标准差为 5.3cm，问这两年身高是否不同。解：总体方差一般未知，当样本含量足够大时，用 S作为的估计值。 1 建立假设，确定检验水准 H0： 168.5， H1： 168.5 0.05 2 计算统计量 u 3 确定 P值，下结论查 u界值表， 4.70 u 0.001/2=3.2905,得 P u 0.001/2=3.2905,得 P 0.001,按照 0.05水准，拒绝 H0，接受 H1，可认为试验组和对照组退热天数的总体均数不等，疗效不同。试验组比对照组平均退热天数短。 1- 2 的 95可信区间为 -3.3 -1.3天型错误和型错误由样本推断的结果真实结果拒绝 H0 不拒绝 H0 H0成立型错误 a 推断正确 (1 a ) H0不成立推断正确（ 1 b）型错误 b （ 1 b）即把握度（ power of a test):两总体确有差别，被检出有差别的能力（ 1 a）即可信度（ confidence level):重复抽样时，样本区间包含总体参数（）的百分数对于一般的假设检验， a定为 0.05（或 0.01）， b的大小取决于 H1。通常情况下，比较总体间有无差异并不知道，即 H1不明确， b值的大小无法确定，也就是说，对于一般的假设检验，我们并不知道犯型错误的概率 b有多大。通常情况下型错误未知 a b 减少（增加） I型错误，将会增加（减少） II型错误增大 n 同时降低 a 与 b a 与 b 间的关系假设检验注意事项（ 1）可比性 (随机性抽样、分组，资料具有均衡性和可比性 ) （ 2）正确选用假设检验方法（ 3） “ 差别 ” 的实际意义 (正确理解差别有统计学意义的涵义。有统计学意义指：样本来自不同的总体，而并非指差别很大，不能说明差别的大小 .当专业上和统计学上都有 “ 显著性意义 ” 时，才有实用价值。 ) . ,05.03200 ,3200,96.12 )22( 1 1.0 )( 1 , ;2,3.10;2,4.10: 21 222 1 2 1 21 21 2 2 1 1 但无大的实际意义结论就可得到故只要可求得令例 Pnnn nu n ss n xx unnn sxsx 假设检验注意事项 (4）判断结论时不能绝对化 (原因是存在着两类错误写出精确 P值：若对同一研究内容， A研究的结果 P=0.002,B研究的结果 P=0.04,虽结果均为拒绝 H0,但 A结果更为可信 . （ 5）单侧检验与双侧检验（ 6）报告结果应写出统计量值、具体 P值（单侧时应注明）； 95 CI既能说明差别的大小，也具有检验的作用，建议使用。 (可信区间与假设检验均为统计推断方法，可信区间可以检验差值大小，假设检验可精确表示相关事件的概率。统计结果同时报告检验统计量、 P值和可信区间更值得提倡。 ) 第十章 t检验（ t test） t检验，亦称 student t检验（ Students t test），主要用于样本含量较小（例如 n0.05 ，按 = 0.05 水准，不拒绝 H 0 ，两者的差别无统计学意义附表 2 t界值表二、配对资料的比较两种情况： 1.随机配对设计 (randomized paired design)是将受试对象按某些混杂因素（如性别、年龄、窝别等）配成对子，每对中的两个个体随机分配给两种处理（如处理组与对照组）； 2.或者同一受试对象作两次不同的处理 (自身对照 )。优点：配对设计减少了个体差异。特点：资料成对，每对数据不可拆分。计算出各对子差值 d 的均数 d 。当比较组间效果相同时， d 的总体均数 d 0 ，故可将配对设计资料的假设检验视为样本均数 d 与总体均数 d =0 的比较，所用方法称为配对 t 检验（ p a i r e d t - te s t ）方法。 1, / | n nS d S d t dd d 表 3-4 两法测定 12份尿铅含量的结果尿铅含量（ mol/l ）样品号简便法常规法差值（ d ） 2 d 1 2 .4 1 2 .8 0 - 0 .3 9 0 .1 5 2 1 2 2 .9 0 3 .0 4 - 0 .1 4 0 .0 1 9 6 3 2 .7 5 1 .8 8 0 .8 7 0 .7 5 6 9 4 3 .2 3 3 .4 3 - 0 .2 0 0 .0 4 0 0 5 3 .6 7 3 .8 1 - 0 .1 4 0 .0 1 9 6 6 4 .4 9 4 .0 0 0 .4 9 0 .2 4 0 1 7 5 .1 6 4 .4 4 0 .7 2 0 .5 1 8 4 8 5 .4 5 5 .4 1 0 .0 4 0 .0 0 1 6 9 1 2 .0 6 1 1 .2 4 0 .8 2 0 .6 7 2 4 10 1 .6 4 1 .8 3 - 0 .1 9 0 .0 3 6 1 11 1 .0 6 1 .4 5 - 0 .3 9 0 .1 5 2 1 12 0 .7 7 0 .9 2 - 0 .1 5 0 .0 2 2 5 合计 - - 1 .3 4 2 .6 3 1 4 表 3-3 两法测定 12份尿铅含量的结果 1. 建立假设、确定检验水准 H 0 ： 0 d H 1 ： 0 d （双侧检验） = 0 . 0 5 2. 计算检验统计量 112.01234.1 d ， 34.1d ， 6314.2 2 d ， 475.0 112 12/34.16314.2 1 /)( 222 n ndd S d 111121,817.0 12/475.0 112.0 / | n nS d t d 3. 查相应界值表，确定 P 值，下结论。查表 201.2 11,2/05.0 t , 11,2/05.0 tt ， P 0 . 0 5 ，按 = 0 . 0 5 水准，不拒绝 H 0 ，两种方法的测量结果差值无统计学意义。三、两样本均数的比较完全随机设计 (completely random design) ：把受试对象完全随机分为两组，分别给予不同处理，然后比较独立的两组样本均数。各组对象数不必严格相同。目的 :比较两总体均数是否相同。条件：假定资料来自正态总体， 12= 22 计算公式： )11( 21 2 - 21 nnSS cXX 2- )1-()1-( 1-1- /)(-/)(- 21 2 22 2 11 21 2 2 2 2 21 2 1 2 12 nn SnSn nn nXXnXXS c 2-1-1-,- 2121 - 21 21 nnnnS XXt XX 其中，均数差的标准误实例例 3 - 9 白血病组 )( 1 X ： 1 2 .3 13 .2 13 .7 15. 2 15. 4 15. 8 1 6. 9 正常组 )( 2 X ： 1 0.8 11 .6 12 .3 12 .7 13 .5 13 .5 14 .8 问正常鼠和白血病鼠脾脏中 DNA 平均含量（ mg/g ）是否不同？解：本例： 1 n = 7 ， 1 X =1 4.6 4 ， 1 S = 1. 62 ， 2 n = 7 ， 2 X =1 2. 74 ， 2 S = 1. 33 1. 建立假设、确定检验水准。 H 0 ： 21 H 1 ： 21 =0 .0 5 2. 计算检验统计量。 22 2 ( 7 1 ) 1.62 ( 7 1 ) 1.33 2.20 772 c S 12 2 12 | | 14.6 4 12.7 4 | 2.39 1 1 1 1 ( ) 2.20 ( ) 77 c XX t S nn ， 12277 3. 查相应界值，确定 P 值，下结论。查表 179.2 12,2/05.0 t , 0.0 5 / 2 , 12 tt ， P 0 . 0 5 ，按 = 0 . 0 5 水准，不拒绝 H 0 ，两组总体方差的差别无统计学意义，尚不能认为两组总体方差不等。若两总体方差不等，即 2221 时， 1. 近似 t 检验 ( s e p a r a t e v a r i a n c e e s t i m a t i o n t - t e s t ) t 检验 2. 采用数据变换 3. 非参数检验 Y log (X+a) Y Y x Y p1sin 方差齐性检验附表 3 F 界值表（方差齐性检验用，双侧界值） P =0.05 分子的自由度， 1 分母自由度 2 1 2 3 4 5 6 7 8 1 64 8 800 864 900 92 2 937 948 95 7 2 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 3 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 4 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 5 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 7 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 8 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 t检验的类型样本均数与总体均数比较的 t检验（单组设计）（ one sample t test）配对设计定量资料的 t检验（ paired t-test）成组设计定量资料的 t检验（ two sample t test）小结三个概念 1 独立性：指一批实验数据彼此之间是互相独立的。例如测得不同学生的身高、不同学生的考试成绩。 2 正态性：是指每个影响因素各水平组的定量资料来自于正态或近似正态分布的总体。 3 方差齐性：指每个影响因素各水平组的总体方差应当相等。一单组设计的特点及应满足的前提条件 1 设计特点：对一组同质的受试对象不按任何其它因素分组，直接观测或给予一种特定处理后观测这些受试对象某种或多种指标的取值。 2 已知总体均数 0一般为理论值、标准值或经大量观察所得的稳定值。 3 前提条件：样本数据满足正态或近似正态分布。 4 统计量的计算： 1, / | 00 ndf nS x S x t x 二配对设计的特点及应满足的前提条件 1 设计特点： A 随机配对设计 (randomized paired design)是将受试对象按某些混杂因素（如性别、年龄、窝别等）配成对子，每对中的两个个体随机分配给两种处理（如处理组与对照组）； B.或者同一受试对象作两次不同的处理 (自身对照 )。优点：配对设计减少了个体差异。资料成对，每对数据不可拆分。 2 前提条件：成对数据间的差值满足正态或近似正态分布。 3 统计量的计算： 1, / | ndf nS d S d t d d d d 三成组设计的特点及资料应满足的前提条件 1 设计特点：完全随机设计 (completely random design) ：把受试对象完全随机分为两组，分别给予不同处理，然后比较两组样本均数。两组数据是独立的，两组对象数不必严格相同。 2 前提条件：两组数据间是互相独立的、两组数据分别服从正态或近似正态分布、两组资料所对应的总体方差相等。 3 统计量的计算： )(2 )1()1( 21 21 21 2 22 2 11 21 nn nn nn SnSn XXt 五、资料不满足正态与方差齐时进行检验之对策 1 对数变换：常用于数据呈正偏态分布，较小数据多，较大数据少。 2 平方根变换：常用于服从 Poisson分布的资料，算术均数 =方差。 3 倒数变换：常用在数据呈极严重的正偏态分布，变换后可使特大数据变小，资料近似正态。对策五、资料不满足正态与方差齐时进行检验之对策 4 平方根反正弦常用于百分率数据（如白血病患者的淋巴细胞转化率，脑电图波的变化率等） 5 当数据有负数时，作对数或平方根变换可对原始数据相加一个常数使其变为正数。 6 近似 t检验 (separate variance estimation t-test) t检验 7 非参数检验 -秩和检验 p1s in 对策两均数比较样本与总体单样本 t检验配对配对 t检验方差齐性变量变化两样本 t检验两样本 t检验差值呈正态秩和检验指标呈正态分析思路讨论题 1 要比较一组肺结核病人治疗前后的淋巴细胞与白细胞总数的百分比，以评价治疗效果，可用（） A c2检验 B t检验 C 配对 c2检验 D 配对 t检验 2 对两样本均数进行假设检验时， P值越小，说明（） A 两总体均数有差别的可能性越大 B 两总体均数有差别的可能性越小 C 两总体均数相差越大 D 两总体均数越小 3 两组数据中的每个变量值减同一常数后做两个均数差别的 t 检验（） A t值不变 B t值变小 C t值变大 D t值不能确定 )(2 )1()1( 21 21 21 2 22 2 11 21 nn nn nn SnSn XXt

展开阅读全文

假设检验的概念及.ppt

最新文档