资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2,检验,2,检验是英国统计学家,Pearson,提出的一种以,2,分布为理论基础,用途非常广泛的假设检验方法。下面介绍常用的几种,2,检验方法。,2检验,1.,四格表,(2*2,列联表,),资料的,2,检验,先看一个例子:某医生用,A,、,B,两种药物治疗急性下呼吸道感染,,A,药治疗,74,例,有效,68,例,,B,药治疗,63,例,有效,52,例,结果见下表。问两种药的有效率是否有差别?,处 理,有效例数,无效例数,合 计,有效率(,%,),A,药,68,6,74,91.89,B,药,52,11,63,82.54,合 计,120,17,137,87.59,1.四格表(2*2列联表)资料的2检验处 理有效例数无效例,这是一个假设检验问题。这里要检验的是两个样本率所代表的两个总体率是否相等,即检验如下的假设:,H,0,:,1,2,对于这种两样本率的检验,我们总可以将资料整理为如下格式:,+,合计,I,A,11,A,12,n,1,II,A,21,A,22,n,2,合计,n,1,n,2,n,由于这个表格中只有中间四个数是起决定作用的,其余的数均可由这四个数计算出来,故这个表格又称为四格表。,这是一个假设检验问题。这里要检验的是,为了检验这个假设,我们先计算出合并阳性率:,p,c,=n,1,/n(,合并阴性率:,1,p,c,=n,2,/n),。,并称:,T,ij,=n,i,(n,j,/n),为理论数,而称,A,ij,为实际数。,如果,H,0,成立,我们假设两个总体率相等,且等于合并率,即,H,0,:,1,2,p,c,则可求出四个格子所对应的理论数:,T,ij,=n,i,(n,j,/n),+,合计,I,A,11,(,T,11,),A,12,(,T,12,),n,1,II,A,21,(,T,21,),A,22,(,T,22,),n,2,合计,n,1,n,2,n,而称,A,ij,为实际数,为了检验这个假设,我们先计算出合并阳性率:pc=n,我们要检验的假设实际上是:,H,0,:,1,2,p,c,Pearson,给出了如下的统计量:,Pearson,还证明了当,N(40),充分大时,如上定义的卡方统计量近似地服从自由度为,(r-1)(c-1),的卡方分布。于是,可利用这个卡方统计量来对上述假设进行检验。,由于这个统计量涉及到理论数,T,,一般应先计算,T,的值,然后再计算卡方值。,(Ex9.2),这个统计量反映的是实际数与理论数之间的差异,如果,H,0,成立,则这个差异不应该很大。因此,如果这个差异大到一定程度,即可认为,H,0,不成立。,我们要检验的假设实际上是:Pearso,例,9-2,将病情相似的,169,名消化道溃疡患者随机分成两组,分别用洛赛克与雷尼替丁两种药物治疗,,4,周后疗效见表,9-2,。问两种药物治疗消化道溃疡的愈合率有无差别?,表,9-2,两种药物治疗消化道溃疡,4,周后疗效,处理,愈合,未愈合,合计,愈合率,(%),洛赛克,64(57.84),21(27.16),85,75.29,雷尼替丁,51(57.16),33(26.84),84,60.71,合计,115,54,169,68.05,例9-2 将病情相似的169名消化道溃疡患者随机分成两组,3,确定,P,值,做出推断,本例为,2,*,2,表,故自由度为,(2-1)(2-1)=1,然后,查卡方界值表,,2,0.05,1,=3.84,。本例,2,=4.13 3.84=,2,0.05,1,可知,P 0.05,。在,=0.05,水平上拒绝,H0,,两样本频率的差异具有统计学意义。因为洛赛克的愈合率为,75.29%,,雷尼替丁的愈合率为,60.71%,,可以认为洛赛克的愈合率比雷尼替丁的愈合率高。,3确定P值,做出推断,四格表资料卡方检验的专用公式,为了便于计算,可先将四格表改写为如下形式:,+,合计,I,a,b,a+b,II,c,d,c+d,合计,a+c,b+d,n,于是,卡方统计量可改写为:,四格表资料卡方检验的专用公式+合计Iaba+bIIcdc+,注意:,上述公式应满足的条件是:,n,40,且所有,T,5,。,当,n,40,,但若有一个理论数,1T 5,时,用下面的校正公式计算卡方值:,当,n 40,或 有一个理论数,T 1,时,则可采用确切概率法。,注意:当n 40 或 有一个理论数 T 1时,则,药物,疗效,合计,有效率(,%,),有效,无效,甲,28,2,30,93.33,乙,合计,12,4,16,75.00,40,6,46,86.96,例,两种药物治疗白色葡萄球菌败血症疗效的试验结果见,下表,问两种药物的疗效有无差别?,两种药物治疗白色葡萄球菌败血症的有效率,H,0,:,1,2,p,c,两种药物的有效率无差别,检验水准:,=0.05,计算检验统计量:,先计算最小理论数,T22=16,*,6/46=2.0940,,故用连续性校正公式计算,2,值:,药物疗效合计有效率(%)有效无效甲 2823093.33乙,查,2,界值表,得,2,0.05,1,=3.84,,于是,,P0.05,。故按,=0.05,的水准,不拒绝,H,0,,尚不能认为两种药物的有效率有差别。,查2界值表,得20.05,1=3.84,于是,P0.0,交叉分类,2*2,表的关联性分析,四格表资料的卡方检验还可用于关联性分析,例,为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿,82,例,若把该院儿科所有消化不良的患儿视为一个总体的话,则该,82,例患儿可看作是一份随机样本。对每个个体分别观察腹泻与否和喂养方式两种属性,结果见下表。试分析两种属性的关联性。,喂养方式,腹 泻,合 计,有,无,人工,30,10,40,母乳,合计,17,25,42,47,35,82,这里,实际上是用两个率的检验来推断两个定性变量之间的关联性。,交叉分类2*2表的关联性分析喂养方式腹 泻合 计有无人工3,H,0,:喂养方式与腹泻之间相互独立。,检验水准:,=0.05,计算检验统计量:,本例最小理论数,T,12,=40,*,35/82=17.055,,且总例数,n40,,故直接计算,2,值:,查,2,界值表,得,2,0.05,1,=3.84,,于是,,P 40,时,可用下式:,其检验假设为:当b+c 40时,可用下式:,甲法,乙法,合计,+,+,25,2,27,合计,11,15,26,36,17,53,例,用两种不同的方法对,53,例肺癌患者进行诊断,结果见,下表,问两种方法的检测结果有无差别?,两种方法诊断肺癌的检测结果,H,0,:两种检测方法的总体检出率相同。,检验水准:,=0.05,计算检验统计量:,本例,b=2,,,c=11,,,b+c40,,故采用下式计算,2,值:,甲法乙法合计+25 227111526361753例,查,2,界值表,得,2,0.05,1,=3.84,,于是,,P0.05,。故按,=0.05,的水准,拒绝,H,0,,可以认为两种方法的阳性检出率不同。,查2界值表,得20.05,1=3.84,于是,P0.0,4.,行*列表资料的,2,检验,四格表只涉及到两个率的比较,对于多个率的比较,则需要用到如下形式的表格,即行*列表的资料:,1,2,k,合计,I,A,11,A,12,A,1k,n,1,II,A,21,A,22,A,2k,n,2,S,A,s1,A,s2,A,sk,n,s,合计,n,1,n,2,n,k,n,这时,需要比较多个率,即需要检验如下的假设:,H,0,:,1,=,2,=,k,4.行*列表资料的2检验12k合计IA11A12A1k,其检验统计量仍为:,穴位,治愈数,未愈数,合计,治愈率(,%,),后溪穴,80,18,98,81.6,人中穴,20,20,40,50.0,腰痛穴,合计,24,38,62,38.7,124,76,200,62.0,例 某医院用三种穴位针刺治疗急性腰扭伤,结果见下表,试比较三种穴位针刺效果有无差别。,针刺不同穴位治疗急性腰扭伤的治愈率,其检验统计量仍为:穴位治愈数未愈数合计治愈率(%)后溪穴 8,H,0,:,1,=,2,=,3,三组治愈率相等,H,1,:,1,、,2,、,3,三组治愈率不全相等,检验水准:,=0.05,计算检验统计量:,查,2,界值表,得,2,0.05,2,=5.99,,于是,,P0.05,。故按,=0.05,的水准,拒绝,H,0,,可以认为三组治愈率不全相等。,H0:1=2=3 三组治愈率相等查2界值表,,多个样本率之间的多重比较,在上例中,如果我们希望进一步了解究竟是哪些比较组之间的治愈率不相等,这就需要进行多个率之间的两两比较。,一般地,在进行多个样本率的比较时,如果检验结果为拒绝,H,0,,即认为多个总体率之间存在差异。为了进一步了解哪两个总体率不同,就需要进行两两比较或称多重比较。若将行*列表拆分为多个,2,*,k,表分别进行比较,则将会增大犯,I,类错误的概率。,例如有,4,个比较组(,4,个样本率的比较)需进行两两比较,则需拆分成,6,个,2,*,k,表来进行比较,即需作,6,次检验,每次检验的水准为,=0.05,,于是:,多个样本率之间的多重比较,第,1,次比较时不犯一类错误的概率为:,1-0.05,前,2,次比较均不犯一类错误的概率为:,(1-0.05),2,6,次比较均不犯一类错误的概率为:,(,1-0.05),6,于是,,6,次比较中至少有一次犯一类错误的概率为:,1-,(,1-0.05),6,=0.26,这个概率远大于,0.05,。因此,需要对检验水准,进行调整,其调整原则是:,对于,k,个比较组时,需要比较的次数为:,k(k-1)/2,;,对于各实验组与一个共用对照组比较时,需要比较的次数为:,k-1,。,第1次比较时不犯一类错误的概率为:1-0.05于是,6次比较,穴位,治愈数,未愈数,合计,治愈率(,%,),后溪穴,80,18,98,81.6,人中穴,20,20,40,50.0,腰痛穴,合计,24,38,62,38.7,124,76,200,62.0,例,某医院用三种穴位针刺治疗急性腰扭伤,结果见,下,表,,试比较三种穴位针刺效果有无差别。,针刺不同穴位治疗急性腰扭伤的治愈率,经前面的检验已知,三组治愈率不全相等。现在的问题是三组中究竟哪些组之间的总体治愈率不相等?为了解决这个问题,,可将上表拆分为以下三个表格:,穴位治愈数未愈数合计治愈率(%)后溪穴 8018 9881.,穴位,治愈数,未愈数,合计,治愈率(,%,),后溪穴,80,18,98,81.6,人中穴,20,20,40,50.0,腰痛穴,合计,24,38,62,38.7,124,76,200,62.0,例,某医院用三种穴位针刺治疗急性腰扭伤,结果见,下,表,,试比较三种穴位针刺效果有无差别。,针刺不同穴位治疗急性腰扭伤的治愈率,可将上表拆分为以下三个表格:,穴位治愈数未愈数合计治愈率(%)后溪穴 8018 9881.,穴位,治愈数,未愈数,合计,后溪穴,80,18,98,腰痛穴,合计,24,38,62,104,56,160,穴位,治愈数,未愈数,合计,人中穴,20,20,40,腰痛穴,合计,24,38,62,44,58,102,表,2,表,3,穴位,治愈数,未愈数,合计,后溪穴,80,18,98,人中穴,20,20,40,合计,100,38,138,表,1,穴位治愈数未愈数合计后溪穴 8018 98腰痛穴 2438,H,10,:表,1,中两个对比组的总体治愈率相等,H,20,:表,2,中两个对比组的总体治愈率相等,H,30,:表,3,中两个对比组的总体治愈率相等,检验水准:,=0.05,本例为三个实验组间的两两比较,其调整的检验水准为:,计算检验统计量:,由表,1,,
展开阅读全文