资源描述
相对数 二项分布Relative Number&Binomial DistributionMedical statistics医学统计学主要内容分类资料的特点相对数常用的相对数相对数应用的注意事项率的标准化二项分布二项分布的概率及定义二项分布的模型二项分布的性质二项分布的图形二项分布的应用条件二项分布的应用2分类资料的特点分类资料的特点离散性,变量仅取有限的几个值;资料不含有次序的信息;举例血型(A、B、O、AB)人群中某病发生与否(发生、不发生)3在计数资料中,各组的观察数称绝对在计数资料中,各组的观察数称绝对数。数。绝对数反映某事物的实际水平,是进绝对数反映某事物的实际水平,是进一步作统计分析、制定卫生工作计划、一步作统计分析、制定卫生工作计划、工作总结及医学科学研究中的基础数工作总结及医学科学研究中的基础数据,如某地某病的发病人数据,如某地某病的发病人数。但绝对数不宜直接作出比较但绝对数不宜直接作出比较4老年性白内障普查老年性白内障普查 年龄年龄组组检查检查人数人数白内障白内障例数例数患病率患病率(%)患病人数患病人数构成比(构成比(%)40-5606812.1415.1850-44112929.2528.7960-29613545.6130.1370-1499765.1021.6580-221986.364.24合计合计146844830.5299.995相相对对数数是是两两个个有有联联系系的的指指标标的的比比,计计数数资资料料的的统统计计描描述述主主要要是相对数(是相对数(relativenumber)。)。6常用的相对数:率率(Rate),又称频率指标,说明某现象发生的频率和强度。常用常用%、1/万、万、1/10万等作单位万等作单位率的结果常以保留率的结果常以保留1-2位整数为宜位整数为宜7常用的相对数:比比(Ratio),又称相对比,是A,B两个有关指标之比,说明A为B的若干倍或百分之几。两个相比的指标可以性质相同,如时间比、性别两个相比的指标可以性质相同,如时间比、性别比;也可性质不同,如医院的门诊人数与病床数比;也可性质不同,如医院的门诊人数与病床数之比之比两个相比的指标可以是绝对数也可以是相对数两个相比的指标可以是绝对数也可以是相对数8常用的相对数:构成比构成比(Proportion),又称构成指标,说明一种事物内部各组成部分所占的比重或分布。9常用相对数 I某病发病率某病患病率10常用相对数 II性别比 男性数/女性数*100%出生 10020岁 9850岁 9860岁 9570岁 8580岁 6811常用相对数 III体质指数(BMI)体重/身高2(kg/m2)低体重 18.0正常 18.0超重 24.0肥胖 28.012常用相对数 IV血型 O型 205 40.03%A型 112 22.09%B型 150 29.59%AB型 40 7.89%507 100.00%13常用相对数 V14某单位45岁以上员工冠心病患者数及其相对数 BMI分组人数冠心病患者数各组与第一组患者数之比各组患者数构成(%)各组冠心病 患病率(%)(1)(2)(3)(4)(5)(6)20212103.104.7220661575.7017.658.6224112012512.5038.7011.162682511211.2034.6713.5828102191.905.8818.63合计2920323100.0011.0615应用相对数的注意事项分母不能太小;区分率和构成比;合并率的计算不是直接求率的均数;两个合并率的对比需要注意可比性。同质两者的内部构成比假设检验16三三.应用相对数注意事项应用相对数注意事项1计算相对数的分母不宜太小计算相对数的分母不宜太小 如:某人用某方法治疗患某疾病的病人2人,有效2人,不能记有效率为100%172.分析时不能以构成比代替率分析时不能以构成比代替率例例某某产产院院拟拟分分析析畸畸形形儿儿与与母母亲亲分分娩娩年年龄龄的的关关系系,得得以以下下资资料料,据据此此得得出出结结论论:“母母亲亲分分娩娩年年龄龄在在24-29岁岁时时,畸畸形形儿儿最最多多,占占总总数数的的92.2%,符符合合一般规律。一般规律。”母亲年龄母亲年龄212324252627282930313233计计畸形儿数畸形儿数121419241819133111116%0.861.712.116.420.715.516.411.22.60.860.860.86100.0183对对观观察察单单位位不不等等的的几几个个率率,不不能能直直接接相相加加求其平均率求其平均率 如从某地抽查了300名成年人,其中:男性100人,某病患病率为20%,女性200人,患病率为14%,则此地男女合计的患病率为:(20+28)/300=16%194资料的对比应注意可比性资料的对比应注意可比性5对率的比较应作假设检验对率的比较应作假设检验20率的标准化率的标准化1.标准化法的意义标准化法的意义消除混杂因素的影响消除混杂因素的影响.21某市甲乙两院各科出院和治愈人数 科室甲 院乙 院出院人数治愈人数 治愈率(%)出院人数 治愈人数 治愈率(%)内科87629533.6732910431.61外科30529295.7470265793.59妇科56449287.2359150184.77儿科32930191.4926323388.59合计2074138066.541885149579.3122率的标准化法率的标准化法(standardization method of rate),即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,调整后的率为标准化率,简称标化率(standard rate),或调整率(adjusted rate)。23标准组的选择由于内部构成不同,造成了现在的矛盾结果。因此,要反映真实差别,需要用统一的标准组。这里我们选择两组的合计作为标准组。24率的标准化法实质:加权平均,以标准组各组构成比作为权重系数25率的标准化法科室标准组人数Ni甲 院标准人口构成比Ni/N原治愈率pi (%)内科12050.30440.336710.25外科10070.25440.957424.36妇科11550.29170.872325.44儿科5920.14950.914913.68合计39591.000073.7326率的标准化法科室标准组人数Ni乙 院标准人口构成比Ni/N原治愈率pi (%)内科12050.30440.31619.62外科10070.25440.935923.81妇科11550.29170.847724.73儿科5920.14950.885913.24合计39591.000071.4027标准化法的注意事项选取不同的标准组,得到的标准化率是不一样的;标准化率是相对的,其作用仅在于比较,并不表示实际水平;标准化率不代表总体率,也不能完全代替分组比较。28率的标准化法(选择甲作标准)科室标准组人数Ni甲 院标准人口构成比Ni/N原治愈率pi (%)内科8760.42240.336714.22外科3050.14710.957414.08妇科5640.27190.872323.72儿科3290.15860.914914.51合计20741.000066.5329率的标准化法(选择甲作标准)科室标准组人数Ni乙 院标准人口构成比Ni/N原治愈率pi (%)内科8760.42240.316113.35外科3050.14710.935913.77妇科5640.27190.847723.05儿科3290.15860.885914.05合计20741.000064.2230粗率与标准化率的实质粗率与标准化率的实质粗粗率率实实际际上上是是各各组组率率的的加加权权平平均均,权权重重系数为各组的例数占总例数的构成比系数为各组的例数占总例数的构成比若若率率较较高高的的组组例例数数较较多多,则则粗粗率率就就显显得得较大较大为为了了解解决决两两权权重重系系数数不不等等的的问问题题,直直接接法法标标准准化化实实际际上上仍仍是是各各组组率率的的加加权权平平均均,只是采用统一的权重只是采用统一的权重选用的权重不同,标准化率也有所不同选用的权重不同,标准化率也有所不同31二项分布(二项分布(binomialdistribution)1概念概念抛抛一一枚枚均均匀匀硬硬币币,正正面面朝朝上上的的出出现现次次数数X:X01P0.50.5X的的分分布布称称作作为为二二点点分分布布,如如果果将将此此试试验验重重复复若若干干次次,如如10次次,正正面面朝朝上上的的出出现现次数次数X可以为可以为0,1,2,1032从一个人群中随机抽样,假定已知这个人群中某病的患病率为0.10,则随机抽出一人,患病人数的分布服从二点分布,X 0 1 p 0.9 0.133将此过程重复若干次,如n次,即抽取了n人,则患病人数的分布即为二项分布。X 0 1 2 3 n p?34设小白鼠接受某种毒物一定剂量时,其死亡率为=80,则对于每只小白鼠而言,其死亡概率为=0.8,生存概率为1-=0.2。若每组各用三只小白鼠(分别计为甲、乙、丙),对每只鼠独立做实验,故各鼠的实验结果(生存或死亡)是互不影响的。观察每组小白鼠存亡情况,如果计算生与死的顺序,则共有8种排列方式;如果只计生存与死亡的数目,则只有4种组合方式。35三只小白鼠存亡的排列和组合方式及其概率的计算 所有可能结果每种结果的概率死亡数生存数不同死亡数的概率甲、乙、丙XnX生 生 生0.20.20.2=0.008030.008生 生 死0.20.20.8=0.032生 死 生0.20.80.2=0.032120.096死 生 生0.80.20.2=0.032生 死 死0.20.80.8=0.128死 生 死0.80.20.8=0.128210.384死 死 生0.80.80.2=0.128死 死 死0.80.80.8=0.512300.5121.0001.00036(0.2+0.8)3=(0.2)3+3(0.2)2(0.8)+3(0.2)(0.8)2+(0.8)3 三生 二生一死 一生二死 三死 0.008 0.096 0.384 0.51237二项分布的定义从阳性率为的总体中随机抽取含量为n的样本,恰有X例阳性的概率为:X=0,1,2,n 则称X服从参数为n和的二项分布(Binomial Distribution),记为:XB(n,)。其中参数 n由实验者确定,而常常是未知的。38用以描述具有两种可能结局的事件生存 or 死亡成功 or 失败男 or 女James Bernoulli(16541705)39二项分布的模型考虑一系列彼此独立的随机试验,每次试验只有两个可能发生的结果(“成功”或“失败”)。且每种结果发生的可能性是一定的。那么这n次试验中成功或者失败的次数服从二项分布。(没有“排列”的意义,而体现了“组合”的意义)40二项分布的模型一个口袋里事先装有10个小球,5个红色,5个黑色,每次从中摸取一个球,记录颜色后不再放入口袋,重复5次。一个口袋里事先装有10个小球,5个红色,5个黑色,每次从中摸取一个球,记录颜色后放入口袋,重复5次。一个口袋里事先装有10000个小球,5000个红色,5000个黑色,每次从中摸取一个球,记录颜色后不再放入口袋,重复50次。41二项分布的性质:均数和方差若XB(n,),则42二项分布的性质:率的标准差若XB(n,),则43二项分布的性质:累积概率累计概率(cumulative probability)从阳性率为的总体中随机抽取n个个体,则最多有k例阳性的概率:最少有k例阳性的概率:=0,1,2,k,n。44递推公式45【例3.6】据以往经验,用某药治疗小儿上呼吸道感染、支气管炎,有效率为85,今有5个患者用该药治疗,问:至少3人有效的概率为多少?最多1人有效的概率为多少?46至少3人有效的概率:P(X 3)=P(3)+P(4)+P(5)P(X3)=0.1381780.3915050.443705 =0.973388最多1人有效的概率为:P(X1)P(0)+P(1)47二项分布的图形48二项分布的图形当=0.5时,分布对称;当 0.5,分布呈偏态;当0.5时分布呈负偏态;特别是当n值不是很大时,偏离0.5愈远,分布愈偏。随着n的增大,二项分布逐渐逼近正态分布。如=0.30,n=5和n=10时,图形呈偏态,当n=30时,图形已接近正态分布。一般地说,如果n且n(1-)大于5时,常可用正态近似原理处理二项分布问题。49二项分布的应用条件每一次试验必然出现两种互相对立的结果之一;每种结果都有相同的可能性出现,即某事件出现的概率不变;n个观察对象的结果互相独立。50某乡有人口5000人,已知血吸虫粪检阳性率下降至5%左右,血防站准备进行一次血吸虫感染率的普查,拟先将每10人粪便作为一个初筛的混合样本,混合样本血吸虫卵阴性,则该10人均作阴性;混合样本阳性,再对该混合样本的10人粪便逐人复查。问此法比一般的逐人粪便检查会减少多大的工作量?5152
展开阅读全文