第五讲 计数资料的统计描述

上传人:痛*** 文档编号:244402984 上传时间:2024-10-04 格式:PPT 页数:30 大小:368KB
返回 下载 相关 举报
第五讲 计数资料的统计描述_第1页
第1页 / 共30页
第五讲 计数资料的统计描述_第2页
第2页 / 共30页
第五讲 计数资料的统计描述_第3页
第3页 / 共30页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,计数资料的统计描述,复习,统计描述,集中趋势:算术均数、几何均数、中位数,离散趋势:极差、四分位间距、方差、标准差、变异系数,统计推断,参数估计,假设检验,点估计,区间估计:,注意与参考值范围的区别和各自的应用,单个资料的,t,检验,配对资料的,t,检验,成组资料的,t,检验,多组资料,方差分析,注意假设检验的基本思想和注意事项,计量资料,统计描述,相对数:率、构成比、相对比,统计推断,计数资料,参数估计:点估计和区间估计,假设检验:检验,第一节 相对数,(Relative number),相对数的概念:,两个有联系的(数值)指标之比。,相对数的种类,:,比,:,1.,构成比,2.,相对比,3.,率,1.,率,(Rate),概念,:也称频率指标,全体观察单位中某种现象发生的频率或强度。,计算公式,:发生某种现象的观察单位数,可能发生某种现象的观察单位数,K,:,100%,(,1000,),例如:发病率、患病率、死亡率、病死率等。,注意,:不受其它指标的影响;各率相互独立,其之和不为,1,(如是则属巧合);,K,病名,平均人口数,人数,死亡率(,1/10,万),高血压,172665,40,23.2,冠心病,172665,11,6.4,恼卒中,172665,253,146.5,风心病,172665,38,22.0,某地某年四种常见心血管病死亡率,2.,构成比,(Proportion),概念,:也叫构成指标,是指,某一事物内部各组成部分所占的比重或分布。,计算公式,:某一组成部分的观察单位数,同一事物各组成部分的观察单位总数,例如:疾病和死亡顺位等,注意:各组成部分的构成比之和为,100%,某一部分比重增大,则其它部分相应减少。,100%,学历,人数,构成比(,%,),本科,99,0.14,大专,1248,1.74,中专,53521,72.65,无学历,18763,25.47,合计,73667,100.00,某地,1992,年护理人员学历构成,构成比与率的区别,构成比各构成部分比重之和应为,100%,,某已构成部分的增减会影响其他部分构成比相应减少或增加,而某一部分率的变化并不影响其他部分的率,且其平均率不能简单地将其各率相加后平均求得,P=(x1+x2+x3)/(n1+n2+n3),正确,P=(P1+P2+P3)/3,错误,3.,相对比,(Ratio),概念,:是指两个有联系的指标之比,描述二者的相对水平,是对比的最简单形式。,计算公式,:,A,、,B,两个指标,,A/B,(,或,100%,),若干倍或百分之几。,例如:性别比、,CV,、,相对危险度,(RR),等。,注意:,A,、,B,性质可以相同,也可以不同,第二节 应用相对数时的注意事项,1,、分析时不能以(构成)比代(替)率,2,、计算相对数时分母不能太小,3,、总率(平均率)的计算,:,不能直接相加求和,4,、资料的可比性:两个率要在相同的条件下进行,.,研究方法相同、研究对象同质、观察时间相等、地区、民族、年龄、性别等。,5,、,样本资料的比较应作假设检验,第三节 标准化法,什么是标准化,?,为什么要进行标,(,准,),化,?,内部结构不同的两组对象进行比较:例如,A,组病情严重者多,,,B,组病情较轻的多,但要比较两种不同方法的治疗效果,结果会怎样?,治疗分 组,旧疗法,新疗法,治疗人数,痊愈人数,治愈率,%,治疗人数,痊愈人数,治愈率,%,成人组,100,50,50.0,200,100,50.0,儿童组,200,20,10.0,100,10,10.0,合计,300,70,23.3,300,110,36.7,两种疗法疗效比较,从表,中的合计看,新疗法的治愈率比旧疗法高。但分别观察成人组和儿童组的治愈率相同。其合计的差别之所以大,是由于两种疗法的选择的样本人群年龄构成不同。新疗法成人所占比例高,而成人的治愈率高,造成总率较旧法高。要正确比较两法的疗效,需,按照统一标准进行校正,然后进行比较。,标准化的原因,:,当两组资料进行比较时,如果其内部不同小组率有明显差别,而且各小组内部构成也明显不同,直接比较不合理,需要进行标准化后再进行比较。,标准化的,思想,:,按照统一标准进行校正,以消除由于构成不同对总率的影响,使算得的标化率有可比性。,标准化法,(Standardization method),标准化率的,计算,1.,选择标准,:任意一组、两组之和、有代表性的人口,2.,计算标准化率,p,:,直接法,:,已知标准组年龄别人口数时:,p=,N,i,p,i,/N,已知标准组年龄别人口构成时:,p=,(,N,i,/N,),p,i,间接法,:p=,P,r,/,n,i,p,i,=P,SMR,SMR,:标准化死亡比,是对原总死亡率的校正,治疗分组,标准治疗人 数,旧疗法,新疗法,原治预率,%,预期治预人数,原治预率,%,预期治预人数,成人组,100,50.0,50,50.0,50,儿童组,200,10.0,20,10.0,20,合计,300,23.3,70,36.7,70,新旧两种疗法的标准化治预率,注意事项,1.,标准不同得到的标化值不同,2.,内部各小组比较时,可不标化,3.,标化后的数值不再反映实际水平,小 结,构成比,相对比,率,标准化:标准化法的目的是消除混杂因素对结果的影响,重点和难点:以比代率和标准化问题,两地总死亡率比较,结合专业知识考虑有混杂因素(如年龄),无 同,年龄与死亡率有关?两地人口年龄构成相同?,有 不同,已知条件,(,1,)两地各年龄组死亡率,p,i,(无,明显交叉)(,1,)两地各年龄组人数,n,i,及死亡总数,r,(,2,),标准组各年龄组人数,N,i,或构成比,N,i,/N,(,2,),标准组各年龄组死亡率,p,i,及,总死亡率,P,直接法:标化率,p,=,间接法:,SMR=,标化率,p,标准化思路图,第四节 二项分布及其应用,二项分布是一种离散型的概率分布,是指在只能产生两种可能结果之一如阳性、阴性的,n,次独立重复实验中,当每次实验的阳性概率保持不变时,出现阳性的次数,,x=0,,,1,,,2n,的一种概率分布,B,(,n,),概率函数:,二项分布的条件,每次实验结果只能是两个互斥结果之一,相同的实验条件下,每次实验中事件,A,的发生具有相同的概率,(非,A,概率为,1-,),各次实验独立,实验结果互不影响,二项分布图形与正态近似性,二项分布图取决于,n,和,,高峰在,=n,处,当接近,0.5,时,图形呈对称分布,当越远离,0.5,时,越不对称,当,n,,只要,不太靠近,0,或,1,,(特别是当,nP,和,n,(,1-P,),都大于,5,时),二项分布近似于正态分布,二项分布图形,第五节 率的抽样误差与可信区间,一、率的抽样误差与标准误,二、总体率的可信区间,一、率的抽样误差与标准误,从总体率为,的二项分布总体中随机抽取样本含量为,n,的样本,其阳性观察结果,x,以,p,=,x/n,表示,抽样误差大小为:,如果总体率,未知,用样本率,p,估计,标准误的计算,二、总体率的可信区间,1.,正态分布法;,当,n,足够大,且,n p,和,n,(,1,-p,)均大于,5,时,,p,的抽样分布逼近正态分布。其可信区间为:,双侧:,(,p-Z,/2,S,p,p,+,Z,/2,S,p,),(,Z,0.05/2,=1.96,),单侧:,p-Z,S,p,或,p,+,Z,S,p,(,Z,0.05,=1.645,),如例,6-1,的,p,=0.1410,,,S,p=0.0125,,该例的总体率双侧,95%,可信区间为(,0.1410-1.96,0.0125,,,0.1410+1.96,0.0125,),=,(,0.1165,,,0.1655,),即该地,4060,岁成年男子高血压总体患病率的,95%,可信区间为,11.65%16.55%,。,注意:如果计算获得的可信区间下限小于,0%,,上限大于,100%,,则将下限直接定为,0%,,上限直接定为,100%,。,2.,查表法,n,50,,且,p,接近,0,或,1,的资料时采用,例,6-2,某新药的毒理研究中,用,20,只小白鼠作急性毒性实验,死亡,3,只,估计该药急性致死率的,95%,可信区间。,从附表,7,(根据二项分布原理制成)查得,在,n,=20,与,X,=3,纵列交叉处的数值为,3,38,,即该药急性致死率的,95%,可信区间为,3%,38%,。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!