第三章平均数与标准差(卫生统计学,余金明)

上传人:痛*** 文档编号:244050413 上传时间:2024-10-02 格式:PPT 页数:25 大小:123KB
返回 下载 相关 举报
第三章平均数与标准差(卫生统计学,余金明)_第1页
第1页 / 共25页
第三章平均数与标准差(卫生统计学,余金明)_第2页
第2页 / 共25页
第三章平均数与标准差(卫生统计学,余金明)_第3页
第3页 / 共25页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章 平均数与标准差,第一节 算术均数和几何均数,数值变量资料的统计描述:集中趋势,central tendency,和离散趋势,tendency of dispersion,平均数,average,:,说明一组观察值,(,变量值,),的集中趋势、中心位置或平均水平。,(,a measure of location,a measure of central tendency,a mean or an average,),平均数种类:算术均数,arithmetic mean,、,几何均数,geometric mean,、,中位数,median,、,众数,mode,、调和均数,harmonic mean,H,一、算术均数,简称均数,mean,。,统计表示:总体的参数用,希腊字母,表示,样本的统计量用,拉丁字母,表示,用,表示总体均数,用,表示样本均数,(,一,),不分组资料均数的计算法,:,直接计算,为避免过于复杂,在求和的范围可看清时对,sigma,不记上下标,(dummy suffix),,对,x,也不加下标,The mean is the sum of the observations divided by the number of observations.,(,二,),分组资料的均数计算法:频数表法,P20,例,3-2,,步骤:,1,、分组和编制频数分布表,frequency distribution table,1),找出观察值中,最大值,、,最小值,和,极差,range,2),按极差大小决定组段数、组段和组距,class interval,:,8,15,组,常用极差的,1/10,取整作组距,组段下限和上限,low limit and upper limit,应界限分明,无交叉,从下限开始不包括上限,第一组段包括最小,最后组段包括最大观察值,3),列表划记,tallying,:见,P20,表,3-2,。频数表可绘成直方图,histogram,2,、加权法,weighting method,x,为组中值,class mid-value(midpoint)=,本组下限与相邻较大组段的下限相加除以,2,k,为组数,f,为各组的频数,又称权数,weight,f,各,组频数之总和,fx,为各组组中值与频数乘积之和,计算实例见,P21,3,、简捷法,short-cut method,1),在频数表的基础上,以与最大频数相对应的组中值为假定均数,x,0,assumed origin,2),列出简捷法计算均数用表,,d,为各组组中值减去假定均数后除以组距,i,,,假定均数对应,d,为,0,,向上依次为,-1,,,-2,,,向下依次为,1,,,2,,,3),将各行,f,值与,d,值 相乘得,df,,,再求,df,4),求均数,*,:,可以任何一组组中值为假定均数,结果一致,但设在频数最大组或其附近时,计算较简便。计算机更方便,二、几何均数,geometric mean,,,简记为,G,1),资料偏态分布,少数数据过分偏大,,(,各观察值间呈等比关系,),,原始数据进行对数变换后为对称分布,如平均潜伏期、平均抗体滴度等资料,2),公式,P22,例,3-3,,计算抗体滴度的几何均数;该方法计算出的,G,通常偏小,可在计算反对数前,+(,lgd,)/2,3),几何均数的应用,几何均数常用于等比资料,观察值不能有,0,观察值不能同时有正值和负值,若全为负先把负号除掉,最后结果前加负号,第二节 中位数和百分位数,一、,median,用,M,表示,:,把变量值按大小顺序排列,居于中间位置的那个数值就是,M,适用于:偏态或分布不明的资料,对称分布时接近均数,偏态分布时更合理,(,一,),未分组资料,:P23,例,3-4,,例,3-5,(,二,),分组资料:按频数表计算,M,公式:,L,中位数所在组的下限,W,中位数所在组的宽度,f,中位数所在组的频数,(,例数,),n,总频数,C,中位数所在组的前一组的累计频数,cumulative frequency,用累计频数,百分数,法寻找中位数所在的组段:累计频数刚大于,n/2,的组段,用内插法,linear interpolation,求中位数,将,W,等分为,f,份,从,C,至,n/2,的数值长为,(W/f)*(n/2 C),L值,累计频数,C,n/2,二、百分位数,percentile,:,指将,n,个观察值从小到大依次排列,再把它分成,100,等份,对应于,r,%,位的数值即为第,r,百分位数。通常用,P,r,表示。中位数即第,50,百分位数,(,一,),不分组资料的计算方法,P,r,=x,r%(n+1),当,n,为,150,时计算第,5,百分位数,5%(150+1)=7.55,个变量值,如第,7,个变量为,15,,第,8,个变量为,17,,用内插法求,x,7.55,=15+0.55(17-15)=16.1,,,P,5,为,16.1,(,二,),分组资料的计算方法,percentile is estimated by linear interpolation as,(,三,),要计算多个百分位数时亦用图解法:,y axis is cumulative relative frequency,x axis is observation(incubation period).see Figure 3-2,P25,中位数和百分位数的应用,1),中位数常用于描述偏态分布资料的集中位置,反映位次居中的观察值的水平,只受居中变量值波动的影响,对称分布时与均数相同,2),百分位数用于描述观察值在某百分位位置时的水平,多个百分位数结合应用可更全面描述分布特征,3),百分位数常用于确定医学参考值范围,(reference ranges,正常值范围,),4),分布中部的百分位数相当稳定,具有较好的代表性,但靠近两端的百分位数只有在样本数足够大时才较稳定。,第三节 标准差,standard deviation,一、标准差的意义:,SD,是表示一套变量值离散程度的指标,均数与标准差结合,能全面反映一套变量值的分布情况。,SD is a measure of,variation,scatter,spread or dispersion,.,离散程度 离均差,x-x,考虑正负值变为离均差的平方 考虑观察值的个数则除以,n,,,为方差,variance,,,考虑到,V,是观察单位的平方,故开方得,SD,由公式可见,当各变量值愈接近均数时,标准差越小,当各观察值远离均数时,标准差越大,所以标准差能说明变量值的离散程度。,二、不分组资料的标准差的计算,用代数的方法将上述公式简化为,P27,表,3-8,计算实例,三、离均差平方和的简化计算,离均差平方和,sum of squares about the mean,简记为,l,xx,,,即,离均差平方和或离均差积和,sum of products,计算时,当原始数据比较大时,计算可以减一个数可除一个数,进行简化。,三条规则:,1,、原始数据减一个数或加一个数时,离均差平方和或积和数值不变,2,、原始数据除以一个数,a,,,则简化值算出的离均差平方和要乘上一个,a,2,才是原有的离均差平方和,3,、离均差积和在计算时如将两变量之一,(,如,x),,,除以一个数,a,时,则求得之离均差积和要乘以一个,a,,,才是原始数据的离均差积和;如,y,也同时除以一个数字,b,,,则求得的离均差积和要同时乘以,ab,四、分组资料的标准差计算,公式:,计算实例见,P29,表,3-11,五、标准差的应用,1,、表示变量值的离散程度,2,、概括地估计变量值的频数分布,3,、应用于求正常值范围,normal range,4,、,计算标准误,5,、质量控制,1,、表示变量值的离散程度,均数相近,单位相同时,标准差大表示变量值分布较分散,反之亦然。,比较度量衡单位不同或均数相差悬殊的多组资料的变异度时,需改用变异系数,coefficient of variation,,,CV,表示标准差与均数之比,P29-30,例,3-7,,,8,2,、正态分布,normal(Gaussian)distribution,直方图,histogram,:,横轴表示变量值的大小,以各长方块面积代表频数,,P30,图,3-3,,当观察例数逐渐增多,组距细分时变一条光滑的曲线,形状近似正态曲线,正态曲线:呈对称的钟型,在均数处最高,两侧逐渐低下,两端在无穷远处与底线相靠,正态分布的两个参数:正态总体的均数和标准差,(,和,),。,通常用,N(,),表示,正态曲线的函数式,density function,:,正态曲线下面积分布规律:,:占全部曲线下面积的,68.27%,1.64,:,占全部曲线下面积的,90.90%,1.96,:,占全部曲线下面积的,95.00%,2.58,:,占全部曲线下面积的,99.00%,3,、正常值,(,参考值,reference value),范围:医学上常把绝大多数,(90%,95%,99%),正常人的某指标值范围称为该指标的正常值范围。资料近似正态或经变量变换后符合正态分布时可用上述面积规律来估计,95,正常值范围,偏态资料可用百分位数法。,正常人并非完全健康的人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。,按实际需要确定上下限或仅上限或仅下限。双侧:,1.64,1.96,2.58;,单侧:,1.28,1.64,2.33,4,、质量控制:为了控制实验中的检测误差,常以均数加减,2,个标准差作为上、下警戒值,以均数加减,3,个标准差作为上、下控制值。,5,、标准正态分布,标准化变换:,若,x,服从正态分布,N(,),,,由则,u,服从均数为,0,,标准差为,1,的正态分布,称为标准正态分布。,u(,外文资料用,z,表示,),称为标准正态离差,the standardized deviate(or z-value),可以借助标准正态表估计任意,(x1,x2),范围内的频数比例,(,附表,3,1,,标准正态分布表,),
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!