研究生统计学第七章卡方检验

上传人:xiao****017 文档编号:16343475 上传时间:2020-09-26 格式:PPT 页数:49 大小:663KB
返回 下载 相关 举报
研究生统计学第七章卡方检验_第1页
第1页 / 共49页
研究生统计学第七章卡方检验_第2页
第2页 / 共49页
研究生统计学第七章卡方检验_第3页
第3页 / 共49页
点击查看更多>>
资源描述
第七章 2 检验(chi-square test),桂 立 辉 新乡医学院公共卫生学院,第七章 2 检验,卡方检验( 2检验,chi-square test) ,在分类资料中的应用: 推断两个或多个总体率(或构成比)之间有无差别? 两分类变量间有无相关关系; 检验频数分布的拟合优度。,第七章 2 检验,四格表资料的2检验 配对四格表资料的2检验 四格表资料的Fisher确切概率法 行列表资料的2检验 多个样本率间的多重比较 有序分组资料的线性趋势检验 频数分布拟合优度的2检验,第一节 四格表资料的2检验一、2检验的基本思想,表6-1 两种类型胃溃疡内科疗法治疗结果比较,一、2检验的基本思想,2检验理论公式:,理论公式,一、2检验的基本思想,表6-1 两种类型胃溃疡内科疗法治疗结果比较 (理论值的计算),三、 四格表2检验的校正公式,四格表2 检验的应用条件是: 所有T5,且n40; 当有140 时,需进行连续性校正; 当有T1,或n40 时,需采用四格表确切概率法。 2分布是由正态分布派生出来的连续性分布。2界值表就是根据这种连续性分布计算出来在给定自由度条件下,2分布概率密度函数曲线下右侧尾部面积为时对应的2值,记作2, 。分类资料是间断性的,由此计算的2值不连续,尤其是=1的四格表,求出的概率P值可能偏小,故四格表2检验要有一定的条件限制。,三、 四格表2检验的校正公式,表6-3 两种药物治疗白色葡萄球菌败血症结果比较,三、 四格表2检验的校正公式,例6.4 H0: 1= 2 H1: 12 =0.05 查表得: 20.05(1)=3.84,P0.05 按=0.05水准不拒绝H0, 本例若不校正, 2 = 5.24,结论相反。,三、 四格表2检验的校正公式,对于四格表资料的连续性校正,统计学家有不同的意见。一般认为总例数n较少,理论数T较小时校正的意义较大,而n和T过小时不宜用2检验。但也有人认为所有的四格表2检验宜一律校正。不校正2值偏高,而校正后有时偏低,有可能矫枉过正。故当2检验所得的P值接近于检验水准时,最好改用四格表确切概率法。,第二节 配对四格表资料的2检验,22列联表即配对四格表,同配对数值变量资料一样,配对资料的整理与分析都应以“对子”作为基本分析单元,不能将对子拆开来分析。对于配对分类变量资料,每个对子可能是下列4种情况之一:,第二节 配对四格表资料的2检验,表6-7 两种试剂检验结果比较,第二节 配对四格表资料的2检验,(一)关联性分析 H0:甲、乙两试剂的检验结果无关系 H1:甲、乙两试剂的检验结果有关系 =0.05,查表得: 20.05(1)=3.84,P0.05 Pearson列联系数(P)=0.1887,第二节 配对四格表资料的2检验,(二)差别性分析,查表得:20.005(1)=7.88,P0.005 结论:按=0.05水准拒绝H0,接受H1 ,可以认为两种方法检验结果不一致。,第二节 配对四格表资料的2检验,(二)差别性分析,采用理论公式计算: 如果B=C,则b、c的理论值为: T=(b+c)/2= (10+31)/2 =20.5,,=k-1=2-1=1。 结论相同。,第二节 配对四格表资料的2检验,(二)差别性分析,如b+c40,应作连续性校正:,第三节 四格表资料的Fisher精确概率法,当四格表中若有理论频数1或n40时,宜用四格表确切概率法(exact probabilities in 22 table)亦称 Fishers精确概率法。本法已不属2检验的范畴,但可作为四格表2检验的补充。 基本思想:在四格表的四个周边合计不变的条件下,直接计算表内四个数据的种种组合之概率(Pi),并求出总概率P=Pi。,Fisher精确概率法,例6.9 某研究者将39例病型、病情、性别相同,年龄相近的患者随机分为2组,分别给予新疗法和传统疗法治疗并观察疗效,结果见下表,问两种疗法疗效有无差别? 表6-8 新疗法和传统疗法疗效的比较,Fisher 精确概率法,首先列出在周边合计不变的条件下所有的可能组合(最小周边合计数+1),分别计算出各种组合的治愈率差值(Di)和概率(Pi)。,Fisher 精确概率法,Fisher 精确概率法,累计概率的计算因单、双侧检验而异: 单侧检验:若P1-P2=D,取Di D的各种组合的累积概率作为单侧P 值;若P1-P2= -D,取DiD的各种组合的累积概率作为单侧P 值。 双侧检验:若| P1-P2 | =D,取Di D的各种组合的累积概率作为双侧检验P 值;若a+b=c+d,或a+c=b+d时, 四格表的全部组合对称,则只需计算一侧再乘以2即为双侧检验的累积概率。,Fisher 精确概率法,本例D=31.84%,采用双侧检验 H0: 1= 2 H1: 1 2 =0.05 取Di D的各种组合的累积概率:,按=0.05水准拒绝H0 ,可以认为两组疗效有差别。即新疗法疗效优于传统疗法。,实际数为0时直接计算概率法,若n40,当出现实际数为0时,符合超几何分布,可采用下列公式直接计算概率:,式中:P 为概率,n 为两组的总例数,f 为“0”现象对应组(即阳性组)的合计数,r 为“0”现象对应组的阳性数。,实际数为0时直接计算概率法,例6.10 调查2种饮用水水源伤寒杆菌污染情况,结果见下表,问两种饮用水水源伤寒杆菌污染情况有无差别? 表6-9 两种饮用水水源伤寒杆菌污染情况的比较,实际数为0时直接计算概率法,H0: 1= 2 H1: 1 2 =0.025,按=0.025水准拒绝H0 ,可以认为两种水源污染情况有差别。即井水污染率低于塘水。,第四节 行列表资料的2检验,前述四格表是RC表的简单形式,即22表,当R2和/或C2时称RC表。 RC表资料的2检验有下列几种情况: 多个样本率或构成比的比较: R2表 两个构成比的比较: 2C表 多个构成比的比较: RC表 双向无序分类资料的关联性检验: RC表,第四节 行列表资料的2检验,RC表资料的2检验的公式可采用前述理论公式,也可以采用专用公式,即:,一、多个样本率的比较,表6-4 3组受试者EBV-VCA-IgA抗体阳性率比较,一、多个样本率的比较,H0: 1= 2 = 3 H1: 各i不等或不全相等 =0.05,查表得: 20.005(2)=10.60,P0.005 按=0.05水准拒绝H0,接受H1 ,二、样本构成比的比较,表6-5 甲乙两医院病例的脑梗死部位比较,二、样本构成比的比较,H0: 两医院病例脑梗死部位的总体构成比相同 H1:两医院病例脑梗死部位的总体构成比不同或不全相同 =0.05,查表得: 20.005(2)=10.60,P0.005 按=0.05水准拒绝H0,接受H1 ,三 双向无序分类资料的关联性检验,例 7-8 测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联? 表7-10 某地5801人的血型,三 双向无序分类资料的关联性检验,H0:两种血型系统间无关联 H1:两种血型系统间有关联 =0.05,查表得: 20.005(6)=18.55,P0.005 按=0.05水准拒绝H0,接受H1 ,三 双向无序分类资料的关联性检验,为进一步说明两变量间关系的密切程度,可计算Pearson列联系数(C )。计算公式: 该系数取值范围01,越接近于1,说明两变量关系越密切;越接近于0,说明两变量关系越不密切。 本例C=0.1883,说明ABO血型与MN血型间虽有关联,但关系并不太密切。,四、行列表2检验的注意事项,1. 2检验要求理论频数不宜太小,否则将导致偏性。一般认为行列表资料中不宜有1/5以上的格子理论数小于5,或有一个格子理论数小于1。处理方法: (1) 最好的方法是增加样本例数,以增大理论频数。 (2) 进行合理的合并,即将理论频数小的格子与所在行或列性质相近的邻近格子合并。 (3) 删除理论频数太小的行和列。 后两种方法将损失一定的信息并影响样本的随机性。,四、行列表2检验的注意事项,当多个样本率(或构成比)比较的2检验。结论为拒绝H0,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别。若要进一步解决此问题,需采用多重比较方法。常用分析方法有: 调整检验水准或检验界值法 2值分割法 可信区间(Scheffe可信区间)法,四、行列表2检验的注意事项,3. 有序分类变量的RC表的统计处理:当效应按强弱(优劣)分为若干个级别,试验结果整理为单向或双向有序RC表, 2检验只能说明各处理组的效应在构成比上有无差异,如将任意两行(或列)调换位置,检验结果不变,不能反映其有序(半定量)特征。对此类资料,应根据其研究目的和分类资料类型选用适宜的检验方法。,第五节 多个样本率间的多重比较,多个样本率比较的2 检验,如推断结论为差别有统计学意义,并非每两个总体率间的均有差别。如需要进一步推断哪些两总体率间有差别,应采用相应的多重比较方法。如直接采用四格表2检验进行两两比较,将会增大发生I型统计学错误的概率。 多个样本率间多重比较方法有多种:,第五节 多个样本率间的多重比较,样本率多重比较的方法按算法的不同,可划分为4类: 调整界值表法:杜养志法(Du)和罗文海法(Lno)。 调整检验水准法:单步调整的方法有Bonferroni法(Bon)和Sidak法;逐步调整的方法有Step-down Bonferroni法(StepB)、Step-down Sidak法(StepS)、Step-up Hochberg法(Hoch)、Step-upHommel法(Hommel)、Step-up Rom法(Rom)和Benjamini-Hochberg法(B-H)。 基于检验的方法:SNK法、Scheffe-Marascui-10法(Scheffe)、Scheffe-Cohen法(Cohen)、Scheffe-Seaman法(Seaman)、Levy法和Ryan法。 基于重复抽样的方法:Bootstrap和Permutafion抽样方法。 钱俊. 样本率多重比较方法的模拟研究.中国卫生统计,2009,26(2),2分割法,实例 某省三个地区花生黄曲霉毒素B1污染率比较,2分割法,2分割计算表,一、基本思想,需对检验水准做适当调整。 1. k 个样本率的两两比较 需进行 次检验,故检验水准 为: 2. 多个实验组与同一个对照组的比较,一、基本思想,因重新估计的 通常很小,普通2界值表无法查到。,二、多个实验组间的两两比较,表7-8 三种疗法有效率的比较,2=21.04,P0.005,表7-12 三种疗法有效率的两两比较,三、多个实验组与同一个对照组的比较,表7-8 各实验组与对照组(药物治疗组)的比较,再见!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!