卡方检验-研究生

上传人:小**** 文档编号:243695366 上传时间:2024-09-29 格式:PPT 页数:64 大小:304KB
返回 下载 相关 举报
卡方检验-研究生_第1页
第1页 / 共64页
卡方检验-研究生_第2页
第2页 / 共64页
卡方检验-研究生_第3页
第3页 / 共64页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2,检验,(,Chi-square test,),(,3,学时),吴成秋公共卫生学院卫生统计学教研室,2,检验的应用,1.,推断两个,(,多个,),总体率或构成比之间是否有差别,2.,多个样本率间的多重比较,3.,两个分类变量之间有无关联性,4.,频数分布拟合优度检验,一、,2,检验的基本思想,例,7-1,某医生用两种疗法治疗前列腺癌,出院后随访,3,年,甲疗法治疗,86,例。乙疗法治疗,95,例,结果见下表。问两种疗法治疗前列腺癌病人的,3,年生存率是否有差别?,表,10-7,甲乙两种疗法治疗前列腺癌的,3,年生存率,处 理 生存数 死亡数 合 计 生存率,(%),甲疗法,a,52(,46.09,),b,34(,39.91,),(a+b),86 60.47,乙疗法,c,45(,50.91,),d,50(,44.09,),(c+d),95 47.37,合 计,(a+c),97,(,b+d,),84,(n),181 53.59,表中 为基本数据,称为实际频数,用,A,R,.,C,表示,表中 是根据,A,计算得到的,称为理论频数,,用,T,R,.,C,表示。该资料称为,四格表资料,。,52,34,45,50,46.09,39.91,50.91,44.09,若假设两种疗法治疗前列腺癌病人的,3,年生存率相同,即,H,0,:,1,=,2,=,53.59%,,,则,T,1,.,1,=8697/181=,46.09,T,1,.,2,=8684/181=,39.91,T,2,.,1,=9597/181=,50.91,T,2,.,2,=9584/181=,44.09,T,R,.,C,=,n,R,n,c,n,2,=,(A,T),2, = (R1)(C1), = (21)(21)=1,T,假如,H,0,:,1,=,2,成立,则,A,、,T,不会相差太大,那么,2,会小;,(A,与,T,的差别是由抽样误差所致,),反之若检验假设,H,0,不成立, 则,A,、,T,会相差很大,那么,2,会大,;(,抽样误差不能引起,A,与,T,如此大的差别,),判断结果,根据自由度,的大小查,2,界值表,当,2,2,时,,P,,,拒绝,H,0,,,接受,H,1,当,2,2,时,,P,,,不拒绝,H,0,.,2,反映了实际频数与理论频数的吻合程度,(一)、四格表的一般公式,二、一般四格表的,2,检验,2,=,(A,T),2, = (R1)(C1),T,以例,10-7,为例做,2,检验,H,0,:,1,=,2,即两种疗法治疗前列腺癌的,3,年生存率相同,H,1,:,1,2,即两种疗法治疗前列腺癌的,3,年生存率不相同,=0.05,T,1,.,1,=8697/181=,46.09,T,1,.,2,=8684/181=,39.91,T,2,.,1,=9597/181=,50.91,T,2,.,2,=9584/181=,44.09,2,=,(A,T),2,=,(52-46.09),2,+,(34-39.91),2,+,(45-50.91),2,+,(50-44.09),2,=3.11,=(2,1) (2,1)=1,查,2,界值表得,2,0.05,1,=3.84,2,0.05,。按,=,0.05,的水准,不拒绝,H,0,,,还不能认为,两种疗法治疗前列腺癌的,3,年生存率,不相同。,T,44.09,50.91,39.91,46.09,(,二,),、四格表的专用公式,当,n40,,,T5,时,用,2,=,(adbc),2,n,(ab)(cd)(ac)(bd),a,、,b,、,c,、,d,为四格表的实际频数,(a,b),,,(c,d),,,(a,c),,,(b,d),是四格表周边的合计数,n=a,b,c,d,为总的样本含量,对例,10-7,的计算,2,=,=3.11,(5250-3445),2,181,(86959784),显然,计算结果与前相同,但该法避免了计算理论数的麻繁,(,三,),、四格表的校正公式,1.,2,检验的应用条件,(1),当,n40,且,T5,时,,,用,2,检验的基本公式或四格表的专用公式;当,P,时,改用四格表的确切概率法。,(2),当,n40,时但有,1T,5,时,,用四格表,2,的校正公式或用四格表的确切概率法,(3),当,n,40,时,或,T,1,时,,用四格表的确切概率法,2.,四格表,2,的校正公式,2,=,(A,T0.5),2,T,2,=,(ad,bc,n/2),2,n,(ab)(cd)(ac)(bd),例,7-2,某医师用两种疗法治疗心绞痛,结果如表,10-10,,问两种疗法的疗效有无差别?,表,10-10,两种疗法治疗心绞痛的效果率,组 别 有效 无效 合计 有效率(,%,),甲疗法,23 6 (4.42) 29 79.31,乙疗法,27 3 30 90.00,合 计,50 9 59 84.75,H,0,:,1,=,2,即两种疗法的疗效相等,H,1,:,1,2,即两种疗法的疗效不等,=0.05,T=299/59=4.42,(,计算,行合计和列合计均为最小,的理论数,),c,2,= =0.61,=1,查,2,界值表得, P0.05,。按,=0.05,的水准不拒绝,H,0,,,尚,不能认为两种两种疗法的疗效不等,.,( 233627 59/2),2,59,2930509,三、配对四格表资料的,2,检验,配对四格表资料的,2,检验,是对配对设计研究所获得的资料为计数资料进行比较。,配对设计包括:,同一批样品用两种不同的处理方法,观察对象根据配对条件配成对子,同一对子内的不同个体分别接受不同的处理,在病因或危险因素的研究中,将病人和对照按配对条件配成对子,研究是否存在某种病因或危险因素。,观察的结果只有阳性、阴性两种可能,清点成对资料时只有四种情况:,a,:甲,+,乙,+,b,:甲,+,乙,-,c,:甲,-,乙,+,d,:甲,-,乙,-,列成下面四格表,适用于配对设计的计数资料,配对资料的结果有,甲 乙 结果, ,a, ,b, ,c, ,d,乙法 合 计,甲 法 ,a b a,b,c d c,d,合计,a,c b,d n,配对设计的计数资料,2,=(bc),2,/(bc),=1, (bc) 40,c,2,= ( bc 1),2,/(bc), =1 (bc) 40,例 对,120,名确诊的乳腺癌病人,分别用甲乙两种方法来检测,甲方法检出阳性率为,60%,,乙方法检出阳性率为,50%,,甲乙一致检出阳性率为,35%,,问甲乙两方法检出阳性率有无差别?,表: 两种方法的检测结果,甲方法,乙方法,合 计,+ ,+,合 计,42(a) 30(b),18(c) 30(d),72,(a+b),48 (c+d),60 (a+c) 60(b+d),120 (a+b+c+d),H,0,:B=C (,1,=,2,),H,1,:B,C (,1,2,),=0.05,b,c= 30,18=4840,2,=(30,18),2,/(30,18)=3.0,=1,,,查,2,界值表得,P0.05,。按,=0.05,水准,不拒绝,H,0,还不能认为两种方法的检验结果不同。,配对四格表资料的关联性检验,(P761),H,0,:两种方法无关,(,无一致性,),H,1,:两种方法有关,(,有一致性,),=0.05,2,两种方法检测结果的相关系数,r,r,必定等于,kappa,检验的,kappa,值,K0.75,一致性好,0.40k 0.75,一致性较好,K0.40,一致性差,例,73,某实验室分别用乳胶凝集法和免疫荧光法对,58,名可疑系统红斑狼疮患者血清中抗体进行测定,结果见表,73,。问两种方法的检验结果有无差别,?,表,73,两种方法的检测结果,免疫荧光法,乳胶凝集法,合计,+ ,+,合计,11(a) 12(b) 2 (c) 3(d),23,35,13 45,58,H,0,:B=C,H,1,:B=C,=0.05,b,c=12,4=1440,c,2,=( 12,2,1),2,/(12,2)=5.79,=1,,查,2,界值表得,0.01P0.025,。按,=0.05,水准拒绝,H,0,接受,H,1,认为两种方法的检验结果不同,免疫荧光法的阳性检出率较高。,四、行,列表资料的,2,检验,可以用于多个率及多个构成比资料的比较和双向无序分类资料关联性检验。,其基本数据有三种情况:,1,、多个样本率比较。有,R,行,2,列,,称为,R2,表,2,、两个样本的构成比比较,有,2,行,C,列,,称为,2C,表,3,、多个样本的构成比比较,以及双向无序分类资料关联性检验,有,R,行,C,列,,称为,RC,表,行列表检验的专用公式,2,=n(A,2,/n,R,n,C,1), = (R,1)(C,1),(,一,),多个样本率的比较,例,7-6,某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表,7-8,。问三种疗法的有效率有无差别?,表,7-8,三种疗法有效率的比较,疗 法 有效 无效 合计 有效率(,%,),物理疗法组,199 7 206 96.60,药物治疗组,164 18 182 90.11,外用药膏组,118 26 144 81.94,合 计,481 51 532 90.41,H,0,:,1,=,2,=,3,,即,三种疗法的有效率相等,H,1,:,三种疗法的有效率不全相等,=0.05,2,=532(199,2,/206481,7,2,/20651,26,2,/14451,1),=21.04,= ( 3,1)( 2,1) = 2,查,2,界值表,:,得,P0.005.,按,=0.05,拒绝,H,0,,,接受,H,1,,,可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。,(,二,),样本构成比的比较,例,7-7,某医师在研究血管紧张素转化酶,(ACE),基因,I/D,多态与,2,型糖尿病肾病,(DN),的关系时,将,249,例,型糖尿病患肾病分为两组,资料见表,7,9,。问两组,型糖尿病患者的,ACE,基因型总体分布有无差别?,表,7-9 DN,组与无,DN,组,型糖尿病患者,ACE,基因型分布,组 别,DD I D I I,合计,DN,组,无,DN,组,合 计,42(37.8) 48(43.3) 21(18.9) 111,30(21.7) 72(52.2) 36(26.1) 138,72(28.9) 120(48.2) 57(22.9) 249,H,0,:两组,2,型,糖尿病患者,ACE,基因型的总体构成比相同,H,1,:,两组,2,型糖尿病患者,ACE,基因型的总体构成比不同,=0.05,按公式(,710,)计算,2,=249(42,2,/11172,48,2,/111120,36,2,/13857,1),=7.91, = (2,1) (3,1)=2,查,2,界值表得,0.01,P0.025,。,按,=0.05,拒绝,H,0,接受,H,1,,,认为,DN,与无,DN,的,2,型糖尿病患者的,ACE,基因型分布不同。,(,三,),双向无序分类资料的关联性检验,例,7-8,测得某地,5801,人的,ABO,血型和,MN,血型结果如表,7-10,,问两种血型系统之间是否有关联?,表,7-10,某地,5801,人的血型,ABO,血型,MN,血型 合 计,M N MN,O 431 490 902 1823,A 388 410 800 1598,B 495 587 950 2032,AB 137 179 32 348,合计,1451 1666 2684 5801,H,0,:两种血型系统间无关联,H,1,:两种血型系统间有关联,=0.05,2,=58014322/(1823,1451),4902/(1823,1666),322/(348,2684),1=213.16, = (4,1)(3,1)=6,查,2,界值表得,P0.005,。按,=0.05,拒绝,H,0,,接受,H,1,,认为两种血型系统间有关联。,若需进一步分析关系的密切程度时,可计算,Pearson,列联系数,C C,取值范围在,0,1,之间。,0,表示独立:,1,表示完全相关; 愈接近于,0,,关系愈不密切, 愈接近于,1,,关系愈密切。,(,四,),、行,列表资料检验的注意事项,1,、理论频数,T,不应太小;,不宜有,1/5,以上的格子,1T5,;,不宜有一个格子的,T1,若出现上述情况,处理的方法有:,(1),最好是增加样本的含量,(,继续观察,),,使,T,增加,(2),根据专业知识,考虑能否删去,T,太小的行或列,或,T,太小的行间或列间,进行合理的合并,组别 痊愈 好转 无效 恶化 死亡,甲,T 1 T0,,,须,计算满足,D,i,D,*,和,P,i,P*,条件的各种组合下四格表的累计概率。,若,D*t,(u,) P,t(u),t(u)=t,(u,) P=,-t,-t 0 t +,t,/2,/2,P/2,二、检验步骤,1,、计算现有样本的,D*,和,P*,及各组合下四格表的,D,i,2,、,计算满足,D,i,D,*,条件的各组合下四格表的累计概率,P,i,3,、,计算同时满足,D,i,66,和,P,i,P*,条件的四格表的累计概率,P=P,1,P,2,P,3,P,4,P,5,P,10, 0.1210,表,7-5,例,7-4,的,Fisher,确切概率法,i,四格表组合,D,i,=ad,bc,Pi,a b c d,1 0 22 9 2,198 0.00000143,2 1 21 8 3,165 0.00009412,3 2 20 7 4,132 0.00197656,4 3 19 6 5,99 0.01844785,5* 4 18 5 6,66* 0.08762728*,6 5 17 4 7,33,7 6 16 3 8 0,8 7 15 2 9 33,9 8 14 1 10 66 0.09120390,10 9 13 0 11 99 0.01289752,例,7-5,某单位研究胆囊线癌、线瘤的,P,53,基因表达,对同期手术切除的胆囊线癌、线瘤标本各,10,份,用免疫组化法检测,P,53,基因,资料见表,7-6,。问胆囊线癌和胆囊线瘤的,P,53,基因表达阳性率有无差别?,表,7-6,胆囊线癌和胆囊线瘤的,P,53,基因表达,病种 阳性 阴性 合计,胆囊线癌,6 4 10,胆囊线瘤,1 9 10,合 计,7 13 20,H,0,:,1,=,2,H,1,:,1,2,=0.05,本例,a,b=c,d=10,,,四格表内各种组合以,i=4,和,i=5,的组合为中心呈对称分布。,表,7-7,例,7-5,的,Fisher,确切概率计算表,i,四格表组合,D,i,=ad,bc,Pi,a b c d,1 0 10 7 3 -70,2 1 9 6 4 -50,3 2 8 5 5 -30,4 3 7 4 6 -10,5 4 6 3 7 10,6 3 5 2 8 30,7 * 2 4 1 9 50*,0.02708978*,8 7 3 0 10 70 0.00154799,1,、计算现有样本的,D*,和,P*,及各组合下四格表的,D,i,2,、,计算满足,D,i,50,条件的各组合下四格表的累计概率,P,i,3,、,计算同时满足,D,i,50,和,P,i,P*,条件的四格表的累计概率,P=2,(P7,P8) 0.057P0.05,按,=0.05,检验水准不拒绝,H,0,,,尚不能认为胆囊线癌 与胆囊线瘤的,P,53,基因表达阳性率不等。,频数分布拟合优度的,2,检验,1,、频数分布拟合优度检验:是一种推断某种现象的频数分布是否符合某一理论分布的假设检验方法,2,、,2,值反映了实际频数和理论频数的吻合程度,因此,,2,检验可用于频数分布拟合优度检验,可推断一个资料的频数分布是否符合正态分布、二项分布、,Poisson,分布、负二项分布等。,3,、步骤,例,7-12,观察某克山病区克山病患者的空间分布情况,调查者将该区划分为,279,个取样单位,统计各取样单位历年的累计病例数,资料如表,7-15,,问此资料是否符合,Poisson,分布?,取样单位内病例数,(x),观察频数,(A),概率,P(x,),理论频数,(T),0,26,0.0854,23.8,0.20,1,51,0.2102,58.6,0.99,2,75,0.2585,72.1,0.12,3,63,0.2120,59.1,0.26,4,38,0.1304,36.4,0.07,5,17,0.0641,17.9,0.05,6,5,0.0263,7.3,0.36,7,3,0.0092,2.6,8,1,0.0039,1.1,279(n),1.0000,279.0,2.05(,2,),表,7-15 Poisson,分布的拟合与检验,(A-T)2,T,解:,n=279, ,fx,=686, fx,2,=2342,x = ,fx/n,=686/279=2.46,s,2,=fx,2,-(fx),2,/n/(n-1),=(2342-686,2,)/279/(279-1)=2.36,H,0,:本资料服从,poisson,分布,H,1,:本资料服从,poisson,分布,=0.10,按照,Poisson,的理论求,P(x,),和理论频数,T,x,=,P(x),n,,及,2,,,结果见上表。,=2.46,2,=,2.05,,,P,0.75,按,=0.10,的水准不拒绝,H,0,,认为该资料服从,poisson,分布,P(x,)=,e,-,X,X!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!