资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2,检验(chi square test):,以,2,分布和拟合优度检验为理论依据,,用于分类资料的假设检验。,1、两个或多个样本率的比较;,2、两组构成比资料的比较;,3、分类资料的相关分析。,第十一章,2,检 验,第一节 独立样本列联表资料的,2,检验,一、,2,检验的基本思想:,1、例题:某研究者欲比较甲、乙两药治疗小儿上消化道出血的效果,将90名患儿随机分为两组,一组采用甲药治疗,另一组采用乙药治疗,一个疗程后观察结果,见表11.1。问两药治疗小儿上消化道出血的有效率是否有差别?,表11.1 甲、乙两药治疗小儿上消化道出血的效果,组 别 治疗例数 有效例数 有效率(%),甲 药 45 27 60.00,乙 药 45 40 88.89,合 计 90 67 74.44,2、,计算公式,式中,A,为实际数,,T,为理论频数。,理论频数T是根据假设来确定的理论值。假设两组患者总体有效率相同(,1,=,2,),且等于合计的愈合率74.44%。,则:,甲、乙两药治疗的患者理论有效例数分别为:,T,11,=4574.44%=4567/90=33.5,T,21,=4574.44%=4567/90=33.5,同理,假设两组患者总体无效率相同,并等于合计的无效率25.56%。,洛赛克和雷尼替丁患者理论未愈合例数分别为:,T,12,=4525.56%=4523/90=11.5,T,22,=4525.56%=4523/90=11.5,将上述计算用符号表示为:,3,、,2,值的意义:,卡方值反映了实际频数与理论频数的吻合程度。,如果Ho成立,则实际频数和理论频数之差一般不会很大,,出现小的卡方值的概率是很大的(P);,如果Ho不成立,则实际频数和理论频数之差就很大,出现,小的卡方值的概率是很小的(P)。,当n不够大,且T,2,0.05,1,,P0.05,作推断结论:,按=0.05,因P0.05,拒绝Ho,接受H,1,,可认为两种药物治疗小儿上消化道出血的有效率不同,乙药的有效率高于甲药。,7,、四格表资料卡方检验的专用公式:,用基本公式计算卡方值时,需先求出各理论频数,运算时很不方便。经过简单的数学推导,可得四格表中计算卡方值得专用公式:,8、四格表资料卡方检验校正公式:,当n40,T5时,可用四格表卡方检验基本公式或专用公,式;,当n40,5T1时,需对卡方值进行校正;,当n40或T1时,不能用卡方检验,改用四格表确切概率计,算法。,例题:某研究欲比较甲、乙两药治疗下呼吸道感染的疗效,将66例下呼吸道感染者随机等分为两组,进行随机双盲对照试验,结果见表11.3。两组纳入分析的病例数分别为32和33人。问两药治疗下呼吸道感染的有效率有无差异?,建立假 设:,Ho:,1,=,2,,H,1,:,1,2,,=0.05,计算统计量:本例中甲药组治疗无效时对应的格子,其理论频数T12=4.925,故应计算校正的卡方值。,2,=3.14,确定P值:,=(2-1)(2-1)=1,,2,0.05,1,=3.84,2,0.05,作推断结论:按=0.05,因P0.05,不拒绝Ho,尚不能认为两种药物治疗下呼吸道感染的有效率不同。,二、RC列联表的2检验,1、计算公式,此式还可用于不须校正的四格表资料的卡方检验。,2、多个样本率的比较:,例11.3某研究者欲比较A、B、C 3种方案治疗轻、中度高血压的疗效,将年龄在5070岁的240例轻、中度高血压患者随机等分为3组,分别采用3种方案治疗。一个疗程后观察疗效,结果见表11.4。问3种方案治疗轻、中度高血压的有效率有无差别?,表11.4 3种方案治疗轻、中度高血压的效果,组 别 治疗例数 有效例数 有效率(%),A 80 74 92.50,B 80 58 72.50,C 80 71 88.75,合 计 240 203 84.58,3、两个或多个样本频率分布的比较:,例11.4为了解新型农村合作医疗对于农村贫困居民住院服务利用的影响,某研究在经济条件相似的甲、乙两个国家级贫困县(其中甲县2006年已开展新型农村合作医疗,乙县2006年尚未开展)分别进行抽样调查,得到2006年应住院未住院原因,见表11.5。问甲、乙两县应住院未住院原因构成是否不同?,表11.5甲、乙两县应住院未住院原因构成,县 别 经济困难 没有必要 没有时间 其他 合计,甲 293 10 17 13 333,乙 282 9 9 6 306,合 计 575 19 26 19 639,2、假设检验方法:,(1)建立假设:,Ho:,甲、乙两县应住院未住院原因的总体构成相同,H,1,:,甲、乙两县应住院未住院原因的总体构成不同,=0.05,(2)计算统计量:,2,=4.17,(3)确定P值:,=(2-1)(4-1)=2,,2,0.05,3,=7.81,2,0.05,(4)作推断结论:,按=0.05,因P0.05,不拒绝Ho,尚不能认为甲、乙两县应住院未住院原因的总体构成不同。,1、计算,2,值时,必须用绝对数,而不能用相对数,因为,2,值,的大小与频数大小有关。,2,、,2,检验的条件 ,2,检验中如有1/5以上格子的理论数5或有,一个理论数5,或,5T1,,且,n40,时,方可用,2,检验,;,5、用专用公式进行四格表资料,2,检验,首先要计算最小理论,数。如大于5,方可将实际数直接代入,如果出现小于5、大,于1,且n40,需计算校正,2,值;,三、,2,检验的注意事项,例11.5 对例11.3 3种方案治疗轻、中度高血压的有效率作进一步的两两比较。,多个样本率比较的列联表资料经两两分割,可整理成多个四格表的形式。为保证假设检验时犯I型错误的总的概率不变,必须重新规定每次比较的检验水准为:,式中,本例中=0.05,m=3,则,对比组,有效,无效,合计,2,P,值,A,74,6,80,0.017,11.082,0.05,C,71,9,80,合计,145,15,160,B,58,22,80,0.017,6.762,40),(适用于b+c40),4、假设检验:,1、建立假设,Ho:两种方法的检测结果相同,(B=C),H,1,:两种方法的检测结果不同,(BC),=0.05,2、计算统计量:(b+c)=(25+4)=29,2,0.05,1,,P0.05,4、作出推断结论:,按=0.05水准,因P,2,0.05,3,,P0.05,(4)作出推断结论:,按=0.05水准,因P0.05,拒绝Ho,接受H,1,,差异有统计学意义,认为两种方法诊断骶髂关节病变分级的概率分布不同。,第三节 拟合优度检验,1、定义:,拟合优度检验是根据样本的频率分布检验其,总体分布是否等于某个给定的理论分布。,2、,2,值的计算公式:,=k-1,3,、例题:,例11.8 400个单位容积内的细菌计数结果见表11.12第(1)、(2)列。问该单位容积内的细菌计数是否服从Poisson分布?,(1)建立假设:,H,o,:每单位容积内的细菌计数服从Poisson分布,H,1,:每单位容积内的细菌计数不服从Poisson分布,=0.05,(2)计算统计量:,实际频数Ai:为各组段的频数,分别为35、68、112 4,理论频数T,i,:T,i,=nP,i,,,计算得其值分别33.2、82.6 5.6,(3)确定P值:=k-1-s=8-1-1=6,,0.1,6,=10.64,2,0.1,(4)作推断结论:按=0.05水准,因P0.1,不拒绝Ho,可认为该单位容积内的细菌计数服从Poisson分布。,第四节 线性趋势的2检验,一、计算公式:,二、例题:,例11.9 为了解某市中学生的吸烟状况,抽样调查了891名中学生,结果见表11.13,问,该市中学生吸烟率是否有随年级增加而增高的趋势?,年级,调查人数,(,n,),吸烟人数,(,t,),吸烟率,(%),分数,(,Z,),tZ,nZ,nZ,2,初一,144,17,11.81,1,17,144,144,初二,148,19,12.84,2,38,296,592,初三,135,25,18.52,3,75,405,1215,高一,157,41,26.11,4,164,628,2512,高二,168,55,32.74,5,275,840,4200,高三,139,72,51.80,6,432,834,5004,合计,891,229,1001,3147,13667,表11.13 某市不同年级中学生吸烟率,三,、假设检验:,1、,建立检验假设,确定检验水准,H,0,:,该市中学生吸烟率无随年级增加而增高的趋势,H,1,:,该市中学生吸烟率有随年级增加而增高的趋势,=0.05,2、,计算统计量:,2,=75.788,,,=1,3、,确定,P,值,作出统计推断,:,按=0.05水准,拒绝Ho,接受H,1,,可以认为该市中学生吸烟率有随年级增加而增高的趋势。,第五节 四格表的Fisher确切概率法,四格表Fisher确切概率法的适用于四格表中理论频数小于1或,n,40的情况,或当其它检验方法所得的概率,P,接近检验水准时。,
展开阅读全文