计数资料的统计推断

上传人:xian****hua 文档编号:245132288 上传时间:2024-10-07 格式:PPT 页数:38 大小:231.50KB
返回 下载 相关 举报
计数资料的统计推断_第1页
第1页 / 共38页
计数资料的统计推断_第2页
第2页 / 共38页
计数资料的统计推断_第3页
第3页 / 共38页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,分类变量资料的统计推断,熊伟,第二节 分类变量资料的统计推断,一,.,率的抽样误差和标准误,率的抽样误差:由于随机抽样造成的样本率和总体率之间以及各样本率之间存在的差异。,率的抽样误差用率的标准误来表示:,二,.,总体率的估计:,一、点值估计:,p,二、区间估计:,按照一定的概率(可信度)估计总体率(,)所在的范围(区间)。,1,、近似正态分布法:,条件:,np,且,n,(,1,p,)均大于,5,,此时样本率,p,近似正态分布,可用正态分布曲线下的区间面积规律来估计,。,公式:,例1:,某医院用复方当归注射液静脉滴注治疗脑动脉硬化症,188,例,其中显效,83,例,试估计复方当归注射液显效率的,95%,和,99,的可信区间。,n=188,p=83/188=0.4415,95,CI,为:,99,CI,为:,2,、查表法:,n50,,,p,或,1-p,接近于,0,或,1,,,np,或,n,(,1-p,),5,时,可用查表法。,例:,从某校随机抽取,26,名学生,发现有,4,名感染沙眼,试 求该校沙眼感染率的,95,可信区间。,本例,n,26,x,4,,查附表得其,95,CI,为(,0.04,,,0.35,)。,三,.,样本率与总体率比较的,u,检验:,应用条件:样本含量足够大;样本率,p,或者,1-p,均不太小时,此时,样本率的分布近似正态分布,样本率与总体率的比较,两样本率的比较:,(一)样本率和总体率的比较,例,2,:根据以往经验,一般胃溃疡患者有,20%,发生胃出血症状。现某医院观察,65,岁以上溃疡病人,304,例,有,31.6%,发生胃出血症状,问老年胃溃疡患者是否较容易胃出血?,:,=0.2,:,0.2,单侧,,拒绝 ,接受 ,差别有统计学意义。可认为老年人胃溃疡出血率较一般胃溃疡患者更易出血。,(二)两个率的比较的,u,检验,例,3,:某医院观察,65,岁以上溃疡病人,100,例,有,20,例发生胃出血症状,观察,20-65,岁的胃溃疡患者,100,例有,12,例发生胃出血症状。问老胃溃疡患者是否较中年患者容易胃出血?,H,0,:,1,2,H,1,:,1,2,单,=,0.05,本例:,n,1,=100,,,x,1,=12,,,p,1,=0.12,;,n,2,=100,,,x,2,=20,,,p,2,=0.2,合并率,查,u,界值表,得,P,0.05,,按双侧,=0.05,水平不拒绝,H,0,,差别无统计学意义,尚不能认为老年患者和中年患者的胃溃疡出血率有差别。,第三节 卡方检验,2,检验,(Chi-square test),,英国人,K.Pearson,(,1857-1936,)是现代统计学的创始人之一,于,1900,年提出的一种具有广泛用途的统计方法,可用于,两个或多个率间的比较,构成比的比较,计数资料的关联度分析,拟合优度检验等等。,本章仅限于介绍,两个和多个率或构成比,比较的,2,检验。,一、卡方检验的基本思想,(1),疗法,死亡,生存,合计,病死率,(%),盐酸苯乙双胍,26(,a,),178(,b,),204(,a,+,b,),12.75(,p,1,),安慰剂,2(,c,),62(,d,),64(,c,+,d,),3.13(,p,2,),合 计,28(,a+c,.,),240(,b+d,.,),268(,a,+,b,+,c,+,d=n,),10.45(,p,c,),例,1,两种疗法的心血管病病死率的比较,22,表或四格表,(fourfold table),实际频数,A,(actual frequency),(,a,、,b,、,c,、,d,),理论频数,T,(,theoretical frequency),(,H,0,:,1,=,2,=p,c,):,a,的理论频数,(,a,+,b,),p,c,=(,a,+,b,)(,a+c,.,)/,n,=n,R,n,C,/n=21.3,b,的理论频数,(,a,+,b,)(1-,p,c,)=(,a,+,b,)(,b+d,.,)/,n,=n,R,n,C,/n=182.7,c,的理论频数,(,c,+,d,),p,c,=(,c,+,d,)(,a,+c)/,n,=n,R,n,C,/n=6.7,d,的理论频数,(,c,+,d,)(1-,p,c,)=(,c,+,d,)(,b+d,.,)/,n,=n,R,n,C,/n=57.3,疗法,死亡,生存,合计,盐酸苯乙双胍,26(,21.3,),178(,182.7,),204,安慰剂,2(,6.7,),62(,57.3,),64,合 计,28,240,268,四格表资料的卡方检验的自由度为,1,卡方检验的自由度的计算公式:,一、卡方检验的基本思想,(2),各种情形下,理论与实际偏离的总和即为卡方值(,chi-square value,),它服从自由度为,的卡方,分布,。,卡方检验的基本思想:,检验,A,与,T,之间的差异,如果,A,与,T,之间差异越大,则计算出来的,2,值就越大,查,2,界值表得出的,P,值就越小,如果小于了,0.05,,则拒绝,H,0,假设。,3.84,7.81,12.59,P,0.05,的临界值,2,分布,(,chi-square distribution,),2,检验的基本公式,上述,基本公式,由,Pearson,提出,因此软件上常称这种检验为,Peareson,卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行,列表”。,二、四格表专用公式(,1,),为了不计算理论频数,T,可由,基本公式,推导出,,直接由各格子的实际频数(,a,、,b,、,c,、,d,)计算卡方值,的公式:,二、四格表专用公式(,2,),2,(,1,),u,2,2.1949,2,4.82,(,n40,,所有,T,5,时,),疗法,死亡,生存,合计,病死率,(%),盐酸苯乙双胍,26(,a,),178(,b,),204(,a,+,b,),12.75(,p,1,),安慰剂,2(,c,),62(,d,),64(,c,+,d,),3.13(,p,2,),合 计,28(,a+c,.,),240(,b+d,.,),268(,a,+,b,+,c,+,d=n,),10.45(,p,c,),三、连续性校正公式(,1,),2,分布是一连续型分布,而行,列表资料属离散型分布,对其进行校正称为连续性校正,(correction for continuity),又称,Yates,校正(,Yates correction,)。,当,n,40,,而,1,T,5,时,用,连续性校正,公式,当,n,40,或,T,1,时,用,Fisher,精确,检验,(Fisher exact test),校正公式,:,三、连续性校正公式(,2,),因为,1,T,5,,且,n,40,时,所以应用连续性校正,2,检验,四、配对四格表资料的,2,检验,例,5.,某研究室用甲、乙两种血清学方法检查,410,例确诊的鼻咽癌患者,得结果如下表,问两种方法的检出率有无差别?,两种血清学检验结果,乙法 合 计,甲法 ,261(a)110(b)371,8(c)31(d)39,合计,269 141 410,配对四格表资料的,2,检验也称,McNemar,检验(,McNemars test,),H,0,:两种方法的总体检查率相同,即,B,C,H,1,:两种方法的总体检查率不同,即,BC,=0.05,配对四格表资料的,2,检验公式推导,五、行,列(,R,C,)表资料的,2,检验,前述四格表,即,22,表,是最简单的一种,R,C,表形式。因为其基本数据有,R,行,C,列,故通称行,列表或,R,C,列联表(,contingency table,),简称,R,C,表。,R,C,表的计算举例,例,3.,将,133,名尿路感染患者随机分为,3,组,分别接受甲乙丙三种疗法,一个疗程后观察其疗效,结果如下,问,3,种疗法的尿培养阴转率有无差别。,疗法 阴转人数 阳性人数 合计 阴转率(),甲,30 14 44 68.2,乙,9 36 45 20.0,丙,32 12 44 72.7,合计,71 62 133 53.4,基本公式 通用公式,R,C,表的,2,检验通用公式,代入基本公式,可推导出:,自由度,=,(行数,1,)(列数,1,),R,C,表的计算举例,例,3.,将,133,名尿路感染患者随机分为,3,组,分别接受甲乙丙三种疗法,一个疗程后观察其疗效,结果如下,问,3,种疗法的尿培养阴转率有无差别。,疗法 阴转人数 阳性人数 合计 阴转率(),甲,30 14 44 68.2,乙,9 36 45 20.0,丙,32 12 44 72.7,合计,71 62 133 53.4,1,、建立假设,确定检验水准,H,0,:,3,种疗法的阴转率相同,即,1,2,3,H,1,:,3,种疗法的阴转率不全相同,即,1,,,2,,,3,不同或不全相同,0.05,2,、计算统计量,3,、确定,P,值,做出统计推断,查,2,界值表,得,P,0.005,,按,0.05,水准拒绝,H,0,,接受,H,1,,差别有统计学意义,故认为,3,种疗法对尿路感染疗效不全相同。,例,4.,随机选择,239,例胃、十二指肠疾病患者和,187,例健康输血员,其血型分布见下表,问胃、十二指肠疾病患者与健康输血员血型分布有无差别。,分组,A B AB O,合计,胃、十二指肠,疾病患者,47 66 20 106 239,健康输血员,52 54 19 62 187,合计,99 120 39 168 426,1,、建立假设,确定检验水准,H,0,:胃、十二指肠疾病患者与健康输血员血型分布的构成比相同,H,1,:胃、十二指肠疾病患者与健康输血员血型分布的构成比不同,0.05,2,、计算统计量,3,、确定,P,值,做出统计推断,查,2,界值表,得,P,0.05,,按,0.05,水准,不拒绝,H,0,差别无统计学意义,尚不能认为胃、十二指肠疾病患者与健康输血员血型分布的构成比不同。,R,C,表,2,检验的应用注意事项,1.,对,RC,表,若较多格子(,1/5,)的理论频数小于,5,或有一个格子的理论频数小于,1,,则易犯第一类错误。,出现某些格子中理论频数过小时怎么办?,(,1,),增大样本含量,(最好!),(,2,),删去该格所在的行或列,(丢失信息!),(,3,)根据,专业知识,将该格所在行或列与别的行或列,合并,。(丢失信息!甚至出假象),R,C,表,2,检验的应用注意事项,2.,多组比较时,若效应有强弱的等级,如,+,,,+,,,+,,最好采用后面的非参数检验方法。,2,检验只能反映其构成比有无差异,不能比较效应的平均水平。,3.,行列两种属性皆有序时,可考虑趋势检验或等级相关分析。,4,、,当多个样本率(或构成比)比较的卡方检验,结论为拒绝,H,0,假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。,若想进一步了解哪两者的差别有统计学意义,可用,2,分割法。,2,分割法是利用,2,值的,可加性原理,,把,RC,表分割为若干个分割表,这些分割表的自由度之和等于原,RC,表的自由度,其,2,值之和十分接近原表的,2,值。分割的方法是按最近的原则,把阳性率(或构成比)相差不大的样本分割出来,计算其,2,值。当差别无统计学意义时,就把它们合并为一个样本,再把它与另一较接近的样本比较,如此进行下去直至结束。,例,3.,将,133,名尿路感染患者随机分为,3,组,分别接受甲乙丙三种疗法,一个疗程后观察其疗效,结果如下,问,3,种疗法的尿培养阴转率有无差别。,疗法 阴转人数 阳性人数 合计 阴转率(),甲,30 14 44 68.2,乙,9 36 45 20.0,丙,32 12 44 72.7,合计,71 62 133 53.4,对于,例,3,:,3,种疗法尿路感染患者的阴转率的分析
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!