资源描述
医学医学统计学卡方学卡方检验医学统计学卡方检验 是是现现代代统统计计学学的的创创始始人人之之一一,英英国国统统计计学学家家Karl Pearson于于1900年年提提出出的的一一种种具具有有广广泛泛用用途途的的假假设设检检验验方方法法。常常用用于于推推断断两两个个总总体体率率(或或构构成成比比)之之间间有无差别。有无差别。2 2 检验检验 是现代统计学的创始人之一,英国统计学家Karl Pea四格表四格表资料的料的检验2四格表资料的 检验2实际频数(实际频数(actual frequency,A):):a、b、c、d理论频数(理论频数(theoretical frequency,T )基本思想基本思想实际频数(actual frequency,A):a、b、c假设假设H0:A=B=,即,即A组与组与B组治疗的总体有效率相组治疗的总体有效率相等等A A组:理论有效者组:理论有效者=(a+b)(a+c)/n=(a+b)(a+c)/n;理论无效者理论无效者=(a+b)(b+d)/n=(a+b)(b+d)/nB B组:理论组:理论有效者有效者=(c+d)(a+c)/n=(c+d)(a+c)/n;理论无效者理论无效者=(c+d)(b+d)/n=(c+d)(b+d)/nTRC为第为第R行第行第C列的理论频数,列的理论频数,nR为相应行的合计,为相应行的合计,nC为相应列的合计。为相应列的合计。假设H0:A=B=,即A组与B组治疗的总体有效率相等A 2 2值反映了实际频数与理论频数的吻合程度。值反映了实际频数与理论频数的吻合程度。若假设成立,若假设成立,实际频数与理论频数的差值较小,实际频数与理论频数的差值较小,2 2值也较小;值也较小;若假设不成立,实际频数与理论频数的差值较大,若假设不成立,实际频数与理论频数的差值较大,2 2值也较大。值也较大。2值反映了实际频数与理论频数的吻合程度。2 2检验的自由度检验的自由度 自由度取决于可以自由取值的基本格子数,而不是自由度取决于可以自由取值的基本格子数,而不是样本含量。样本含量。2 2值的大小取决于值的大小取决于 的个数多少,即的个数多少,即自由度的大小。自由度的大小。愈大,愈大,2 2值也越大。值也越大。对于四格表资料对于四格表资料(=1)(=1),计算一个理论值,计算一个理论值T TRCRC后,后,其他其他3 3个理论值可用周边合计数减去相应的理论值个理论值可用周边合计数减去相应的理论值T T得得出。出。2检验的自由度 自由度取决于可以自由取值的基本格子数2 2检验的自由度检验的自由度2检验,根据自由度检验,根据自由度和检验水和检验水准查表得准查表得2 2界值。界值。当当确定后,确定后,2 2分布曲线下右侧尾部的面积为分布曲线下右侧尾部的面积为时,时,横轴上相应的横轴上相应的2 2值记作值记作 。当当确定后,确定后,2 2值越大,值越大,P P值越小。值越小。2检验的自由度2检验,根据自由度和检验水准查表得2 两样本率比较时,当总例数两样本率比较时,当总例数n40且所有格子的且所有格子的T5时,可用四格表资料的专用公式计算时,可用四格表资料的专用公式计算四格表资料四格表资料2 2检验的专用公式检验的专用公式 两样本率比较时,当总例数n40且所有格子的T5时【例例】某医生欲比较用甲、乙两种药物治疗动脉硬化的某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治疗疗效,甲药治疗71例,有效例,有效52例,例,乙药治疗乙药治疗42例,有例,有效效39例。问两种药物的有效率是否有差别?例。问两种药物的有效率是否有差别?【例】某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治设设H H0 0:1 1=2 2,即,即两药有效率相同;两药有效率相同;H H1 1:1 12 2 =0.05=0.05n40,Tmin5 ,则,则P0.05,拒绝拒绝H H0 0,接受,接受H H1 1,故认为甲、乙两药的疗效不同,乙药,故认为甲、乙两药的疗效不同,乙药疗效要好于甲药。疗效要好于甲药。设H0:1=2,即两药有效率相同;H1:1 2 2分布是一种连续性分布,而计数资料属离散性分布,分布是一种连续性分布,而计数资料属离散性分布,由此得到的统计量也是不连续的。为改善由此得到的统计量也是不连续的。为改善2 2统计量分布统计量分布的连续性,英国统计学家的连续性,英国统计学家Yates FYates F建议将实际频数和理论建议将实际频数和理论频数之差的绝对值减去频数之差的绝对值减去0.50.5以作校正。以作校正。四格表资料四格表资料2 2检验的校正公式检验的校正公式 2分布是一种连续性分布,而计数资料属离散性分布,由此在实际工作中,对于四格表资料,通常规定:在实际工作中,对于四格表资料,通常规定:四格表资料四格表资料2 2检验的校正公式检验的校正公式T5T5,且,且n40n40时,直接计算时,直接计算2 2值,用基本公式或专用值,用基本公式或专用公式;公式;1T51T5,且,且n40n40时,用连续性校正公式(时,用连续性校正公式(continuity continuity correction correction),或),或四格表资料的四格表资料的FisherFisher确切概率法确切概率法;T1T1或或n40n40,用四格表资料的,用四格表资料的FisherFisher确切概率法。确切概率法。在实际工作中,对于四格表资料,通常规定:四格表资料2检验的【例例】某医生研究比较某医生研究比较A、B两种药物对急性细菌性肺炎两种药物对急性细菌性肺炎的疗效,甲药治疗的疗效,甲药治疗42例,有效例,有效40例,例,乙药治疗乙药治疗22例,例,有效有效16例。问两种药物的疗效差别有无统计学意义?例。问两种药物的疗效差别有无统计学意义?用校正公式,用校正公式,2 2=4.79=4.79;错用基本公式,;错用基本公式,2 2=6.69=6.69。【例】某医生研究比较A、B两种药物对急性细菌性肺炎的疗效,甲四格表资料的四格表资料的FisherFisher确切概率法确切概率法 当当T1T1或或n40n40,四格表资料,四格表资料2 2检验结检验结果可能会有偏性,需采用果可能会有偏性,需采用FisherFisher确切检确切检验进行分析。该法由验进行分析。该法由R.A.FisherR.A.Fisher提出,提出,且直接计算概率,因此也叫且直接计算概率,因此也叫FisherFisher确切确切概率检验(概率检验(FisherFishers exact s exact probability testprobability test)。四格表资料的Fisher确切概率法 当T1或n40,医学统计学卡方检验培训ppt课件【例例】某医生用新旧两种药物治疗某病患者某医生用新旧两种药物治疗某病患者27人,治疗人,治疗结果见表。问两种药物的疗效有无差别?结果见表。问两种药物的疗效有无差别?组别治愈数未愈数合计治愈率(%)旧药2141612.5新药381127.3合计5222718.5设设H H0 0:1 1=2 2,即,即两药疗效相同;两药疗效相同;H H1 1:1 12 2 =0.05=0.05计算各组合概率计算各组合概率 在四格表周边合计数不变的条件下,共有在四格表周边合计数不变的条件下,共有“周边合周边合计数中最小数计数中最小数+1”中组合。中组合。【例】某医生用新旧两种药物治疗某病患者27人,治疗结果见表。确定确定P值,作出结论值,作出结论 原样本四格表对应的概率为原样本四格表对应的概率为P3=0.245262,小于或,小于或等于等于P P3 3的四格表为的四格表为i=1,2,3,6,故双侧检验,故双侧检验P值为值为 P=PP=P1 1+P+P2 2+P+P3 3+P+P6 6=0.370=0.370 0.05 0.05,不拒绝,不拒绝H H0 0。左侧概率为左侧概率为P=PP=P1 1+P+P2 2+P+P3 3=0.316=0.316,右侧概率为,右侧概率为P=PP=P3 3+P P4 4+P+P5 5+P+P6 6=0.929=0.929,故单侧检验,故单侧检验P P值为值为0.3160.316。确定P值,作出结论 原样本四格表对应的概率为P3=0配配对四格表四格表资料的料的检验2配对四格表资料的 检验2 计数资料的配对设计常用于两种检验方法、培养方法、计数资料的配对设计常用于两种检验方法、培养方法、诊断方法的比较。诊断方法的比较。特点是对样本中各观察单位分别用两种方法处理,然特点是对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果,整理为后观察两种处理方法的某两分类变量的计数结果,整理为 一致:一致:a(+)和)和 d(-);不一致:);不一致:b(甲(甲+,乙乙-)和)和 c(甲(甲-,乙,乙+)。)。概概 述述 计数资料的配对设计常用于两种检验方法、培养方法、诊断配对四格表资料的配对四格表资料的2 2检验,又称为检验,又称为McNemar test检检验。验。由于该检验只考虑了不一致的情况(由于该检验只考虑了不一致的情况(b与与c),而未),而未考虑样本含量考虑样本含量n及一致结果(及一致结果(a与与d)。因此,当)。因此,当n很大且很大且两法一致率较高(即两法一致率较高(即a与与d数值较大),数值较大),b与与c的数值相对的数值相对较小时,即使检验结果有统计学意义,但实际意义并不大。较小时,即使检验结果有统计学意义,但实际意义并不大。概概 述述配对四格表资料的2检验,又称为McNemar test检验【例例】用两种血清学方法对用两种血清学方法对100例肝癌患者进行检测,有例肝癌患者进行检测,有关检测结果见表。问两种血清学方法检测结果有无差别关检测结果见表。问两种血清学方法检测结果有无差别?甲法甲法乙法乙法合计合计+-+503282-15 318合计合计6535100H0:b=c,两种方法检出率相同;,两种方法检出率相同;H1:bc;=0.05 ,则,则P0.05,拒绝,拒绝H0,接受,接受H1【例】用两种血清学方法对100例肝癌患者进行检测,有关检测结RC列列联表表资料的料的检验2RC列联表资料的 检验2 行行列表资料的列表资料的2 2检验,用于多个样本率的比较、检验,用于多个样本率的比较、两个或多个构成比的比较。两个或多个构成比的比较。基本数据为:基本数据为:多个样本率比较时,有多个样本率比较时,有R行行2列;列;两个样本构成比比较时,有两个样本构成比比较时,有2行行C列;列;多个样本构成比比较时,有多个样本构成比比较时,有R行行C列。列。概概 述述 行列表资料的2检验,用于多个样本率的比较、两个或【例例】某研究者欲比较甲、乙、丙某研究者欲比较甲、乙、丙3家医院住院病人院家医院住院病人院内感染情况,随机抽查同一时期各医院住院病人院内感内感染情况,随机抽查同一时期各医院住院病人院内感染情况结果见表。试比较三家医院院内感染率有无差别。染情况结果见表。试比较三家医院院内感染率有无差别。【例】某研究者欲比较甲、乙、丙3家医院住院病人院内感染情况,设设H H0 0:三家医院院内感染率相同:三家医院院内感染率相同;H H1 1:感染率不同;感染率不同;=0.05=0.05 ,则,则P0.05,拒绝拒绝H H0 0,接受,接受H H1 1,故可认为甲、乙、丙三家医院院内感,故可认为甲、乙、丙三家医院院内感染率总体有差别。染率总体有差别。设H0:三家医院院内感染率相同;H1:感染率不同;多个样本率间多重比较多个样本率间多重比较 进行多个样本率比较时,如果拒绝进行多个样本率比较时,如果拒绝H H0 0,多个样,多个样本率间差异有统计学意义,表明至少有某两个率之本率间差异有统计学意义,表明至少有某两个率之间有差异。为了获得哪两个率之间有差异,需要进间有差异。为了获得哪两个率之间有差异,需要进行多个率的两两比较。行多个率的两两比较。多个样本率间多重比较 进行多个样本率比较时,如果拒绝H多个样本率间多重比较多个样本率间多重比较采用采用Bonferroni法进行多个样本率的两两比较,步骤如下:法进行多个样本率的两两比较,步骤如下:对需要比较的行对需要比较的行列表资料进行列表资料进行2 2分割,变成多个四格分割,变成多个四格表;表;对每个四格表进行对每个四格表进行2 2检验;检验;采用(采用(=/比较次数比较次数 )计算调整的水准,其中)计算调整的水准,其中为事先确定的水准;为事先确定的水准;以以调整作为检验检验水准,作出结论。调整作为检验检验水准,作出结论。多个样本率间多重比较采用Bonferroni法进行多个样本率【例例】某医院用三种穴位针刺治疗急性腰扭伤,结果见某医院用三种穴位针刺治疗急性腰扭伤,结果见表。试比较表。试比较三种穴位针刺效果三种穴位针刺效果有无差别。有无差别。穴位治愈数未愈数合计后溪穴801898人中穴202040腰痛穴243862合计12476200穴位治愈数未愈数合计后溪穴801898人中穴202040合计10038138穴位治愈数未愈数合计后溪穴801898腰痛穴243862合计10456160穴位治愈数未愈数合计人中穴202040腰痛穴243862合计4458102【例】某医院用三种穴位针刺治疗急性腰扭伤,结果见表。试比较三 ,故可认为后溪穴与,故可认为后溪穴与人中穴、后溪穴与腰痛穴治愈率之间有统计学意义,而人人中穴、后溪穴与腰痛穴治愈率之间有统计学意义,而人中穴与腰痛穴治愈率之间无统计学意义。中穴与腰痛穴治愈率之间无统计学意义。设设H H0 0:任意两个对比组的总体治愈率相等:任意两个对比组的总体治愈率相等;H H1 1:总体总体治愈率不等;治愈率不等;=0.05=0.05 若把人中穴针刺治疗急性腰扭伤设为对照组,另两若把人中穴针刺治疗急性腰扭伤设为对照组,另两组为试验组,则组为试验组,则设设H H0 0:各试验组与对照组的总体治愈率相等:各试验组与对照组的总体治愈率相等;H H1 1:总总体治愈率不等;体治愈率不等;=0.05=0.05 ,故可认为后溪穴与人中穴治愈率之间有统计学意义,而,故可认为后溪穴与人中穴治愈率之间有统计学意义,而腰痛穴与人中穴治愈率之间无统计学意义。腰痛穴与人中穴治愈率之间无统计学意义。若把人中穴针刺治疗急性腰扭伤设为对照组,另两组为试验行行列表列表 2 2检验注意事项检验注意事项a、若有、若有1/5以上的格子出现以上的格子出现1T51T5,则,则增大样本含量,以达到增大理论频数的目的;增大样本含量,以达到增大理论频数的目的;结合专业,删去理论频数太小的格子对应的行或列;结合专业,删去理论频数太小的格子对应的行或列;结合专业,将理论频数太小的行或列与性质相近的行结合专业,将理论频数太小的行或列与性质相近的行或列合并;或列合并;用双向无序用双向无序RC表资料的表资料的Fisher确切概率法。确切概率法。行列表 2检验注意事项a、若有1/5以上的格子出现1T行行列表列表 2 2检验注意事项检验注意事项b、多个样本率比较,若统计推断为、多个样本率比较,若统计推断为拒绝拒绝H H0 0,接受,接受H H1 1,只能认为各总体率或构成比之间总的来说有差别。若要只能认为各总体率或构成比之间总的来说有差别。若要进一步了解哪两者之间有差别,可用卡方分割法,或者进一步了解哪两者之间有差别,可用卡方分割法,或者调整检验水准。调整检验水准。c、对于单向有序的、对于单向有序的RC表资料,在比较各处理组的效表资料,在比较各处理组的效应有无差别时,应该用秩和检验。应有无差别时,应该用秩和检验。行列表 2检验注意事项b、多个样本率比较,若统计推断为拒
展开阅读全文