资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第十六章,分类变量资料的统计描述,率的抽样误差与区间估计,掌握,常用相对数(率、构成比、比)。率和比的区别,率的抽样误差和总体率的区间估计。,熟悉,应用相对数的注意事项、率的标准化法(直接法)。,了解,:常见的医学相对数指标,率的标准化法(间接法)。,第一节 相对数常用指标,一、率,(rate),说明,又称频率指标,说明某现象发生的频率或强度。,K,为比例基数,常用百分率,(%),、千分率、万分率等表示,。,统计中常用的率的指标:发病率、患病率、死亡率、病死率、感染率等,例:某研究组调查了城镇,25,岁以上居民高血压患病率,城镇,调查人数,高血压人数,患病率(,%,),北方,8450,976,11.55,南方,10806,1052,9.74,二、构成比:,又称构成指标,说明某一事物内部各组成部分所占的比重或分布,常以百分数表示。,构成比的两个特性,各组成部分的相对数之和为,100%,;,某一部分所占比重增大,其它 部分会相应地减少 。,年龄组(岁)(,1,),人口数,(,2,),癌肿病人数(,3,),构成比()(,4,),30,633000,19,1.3,30,570000,171,11.4,40,374000,486,32.6,50,143000,574,38.5,60,30250,242,16.2,总计,1750250,1492,100.0,构成比的两个特性,各组成部分的相对数之和为,100%,;,某一部分所占比重增大,其它 部分会相应地减少 。,年龄组(岁)(,1,),人口数,(,2,),癌肿病人数(,3,),构成比()(,4,),患病率(,1/10,万)(,5,),30,633000,19,1.3,3.0,30,570000,171,11.4,30.0,40,374000,486,32.6,129.9,50,143000,574,38.5,401.4,60,30250,242,16.2,800.0,总计,1750250,1492,100.0,85.2,三、相对比,是,A,、,B,两个有关联指标之比,说明,A,为,B,的若干倍或百分之几。两个指标可以是性质相同,也可以是性质不同。,第二节 应用相对数的注意事项,一、,计算相对数时,分母不宜过小,即应有足够例数。,二、构成比与率是意义不同的两个统计指标,分析时不能以构成比代替率 。,三、对观察单位数不等的几个率,不能直接相加求其平均率。,四、资料的对比应注意可比性:即除了研究因素外,其余的重要影响因素应相同或相近。,五、率的标准化,六、率,的比较要进行假设检验,第三节 率的标准化,一、标准化的意义和基本思想,率的标准化法,:就是在一个指定的标准构成条件下进行率的对比的方法。,标准化率,:用标准化法加以校正后的率称为标准化率,简称标化率,(standardized rate),例,年龄,甲校,乙校,检查人数,病人数,患病率,(%),检查人数,病人数,患病率,(%),35,236,16,6.78,478,33,6.90,45,375,27,7.20,379,28,7.39,55,384,38,9.90,235,24,10.21,65-80,402,59,14.38,157,24,15.29,合计,1397,140,10.02,1245,109,8.37,why?,二、标准化的计算,1.,方法选择,直接法:有被观察人群各年龄组率的资料,(p,i,),2.,标准的选择,直接法:选择标准人口构成,(N,i,),查阅文献选取有代表性、较稳定、数量较大的作为标准,选取各组的各层例数的合计作为标准构成,任选一组作为标准构成,3.,公式计算标化率,直接法:,直接法标化率计算表,年龄,标准组人口数,甲校,乙校,原患病率,(%)p,i,预期患病数,N,i,p,i,患病率,(%) p,i,预期患病数,N,i,p,i,35,714,6.78,48,6.90,49,45,754,7.20,54,7.39,56,55,619,9.90,61,10.21,63,65-80,559,14.38,82,15.29,85,合计,2646,10.02,245,8.37,253,甲校高血压标化率,p=245/2646=9.26,乙校高血压标化率,p=253/2646=9.56,简而言之,直接法使用,标准人口数,、,实际率,来计算标化率;,医学中常用的相对数指标,1.,死亡率,2.,年龄别死亡率,3.,死因别死亡率,4.,发病率,5.,患病率,6.,病死率,7.,治愈率,率的抽样误差和,总体率的估计,率的标准误,率的标准误表示率的抽样,误差大小,.,P,为率的标准误,,为总体阳性率。当,未知时,常以样本率,P,来估计,则,例,:,某镇随机抽取,329,人作血清登革热血凝抑制抗体反应检验,得阳性率,8.81%,,求此阳性率的抽样误差?,n=329, p=0.0881,二,.,总体率的可信区间,正态近似法,当,n,足够大,且,np,与,n(1-p),均大于,5,时,,p,的抽样分布逼近正态分布,则总体率的可信区间为:,95,:,P,1.96S,P,99,:,P,2.58S,P,例,:求上例登革热抗体阳性率的,95%,可信区间,P,1.96S,0.0881,1.96,0.0156,95%,可信区间为:,(,0.0575,,,0.1187,),2.,查表法:,当样本例数,n,较小,如,n50,,,特别是,p,很接近,0,或,1,时,按二项分布原理确定总体,率的可信区间,可直接查表。,率的假设检验,-,正态近似法,样本率与总体率的比较,目的是推断该样本所代表的未知总体率,与已知的总体率,0,是否相等。,应用条件:,或,(1-,),不太小,,n,足够大,p,为样本率,,为总体率,u,值、,p,值与统计结论与假设检验中的,u,检验一致。,例,:根据以往经验,一般胃溃疡患者有,20%,发生胃出血症状。现某医院观察,65,岁以上溃疡病人,304,例,有,31.6%,发生胃出血症状,问老年胃溃疡患者出血是否与一般人群不一样?,H,0,:=,0,H,1,:,0,=0.05,本例,,n=304,p=0.316, ,0,=0.2,u=5.061.96,,,P50,,,则,例,:,某山区小学男生,80,人,其中肺吸虫感染,23,人,感染率为,28.75%,;女生,85,人,感染,13,人,感染率,15.29%,,问男女生的肺吸虫感染率有无差别?,H,0,:,1,=,2,H,1,:,1,2,=0.05,本例,,n,1,=80,,,X,1,=23,,,p,1,=0.2875,n,2,=85,,,X,2,=13,,,p,2,=0.1529,u=2.111.96,,,p0.05,,按,=0.05,水准拒绝,H,0,,,接受,H,1,,,故可认为男女生的肺吸虫感染率差别有显著性。,
展开阅读全文