资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2024/11/27,西安医学院公共卫生系,定量数据的统计描述,2024/11/27,西安医学院公共卫生系,一、频数分布,频数表:描述计量资料的频数分布,反映观察值的分布规律,2024/11/27,西安医学院公共卫生系,频数表,(医学统计学,P,8,),表,2-2,某地,140,名正常男子红细胞数的频数表,红细胞数,(,10,12,/L,),划记 组中值 频数 频率,(,%,),3.80 3.90 2 1.4,4.00 4.10 6 4.3,4.20 4.30 11 7.9,.,5.806.00 5.90 1 0.7,2024/11/27,西安医学院公共卫生系,1.,频数表的编制:,找最大值、最小值,求极差,按极差大小决定组段数、组段、组距,一般设,10-15,个组段,常用极差的,1/10,取整作组距,要求:第一组段包括最小值,最后一个组段包括最大值,每个组段的起点称,下限,(,low limit,),终点称,上限,(,upper limit,),对于连续性资料,各组段从下限开始,,不包括本组段上限。,最末一个组段应同时写出其下限和上限。,列表划记,求频数(,f,),2024/11/27,西安医学院公共卫生系,例:某地,40,例中年健康男子血清总胆固醇,值(,mmol/L,)测定结果如下:,4.77 3.37 6.14 3.95 3.56 4.23 4.31,4.71 4.56 4.37 5.39 6.30 5.21,7.22,5.54 3.39 5.18 5.77 4.79 5.12 5.20,5.10 4.70 4.74 4.38 4.89 6.25 5.32,4.50 4.63 3.61 4.44 4.47 3.40 3.91,2.70,4.60 4.09 5.96 5.48,1,)编制频数分布表并绘制直方图,2,)估计其频数分布的类型,3,)计算均数 、标准差,S,、变异系数,CV,4,)计算中位数,M,,并与 比较。,2024/11/27,西安医学院公共卫生系,表,2,某地,40,例健康成年男子血清胆固醇值的频数表,组段 划记 频数,2.70 1,3.20 4,3.70 4,4.20 10,4.70 9,5.20 6,5.70 3,6.20 2,6.70 0,7.207.70 1,合计,40,2024/11/27,西安医学院公共卫生系,直方图,P9,图,2-1,更直观的反映频数分布的类型。,2024/11/27,西安医学院公共卫生系,直方图,2024/11/27,西安医学院公共卫生系,2.,频数分布的两个特征:集中趋势、离散趋势,3.,频数分布的类型:对称分布,偏态分布 正偏态,负偏态,不同类型的分布,应采用相应的统计分析方法,4.,频数表的用途,:,作为陈述资料的形式,反映分布特征、分布类型;,便于以后的计算指标及统计分析处理;,便于发现可疑值,及时查正;,当样本含量较大时,可用各组段的频率作为概率的估计值。,2024/11/27,西安医学院公共卫生系,二、集中趋势的描述,平均数(,average,),是描述一组观察值的集中位置或平均水平的统计指标,常作为一组数据的代表值用于分析和组间比较,常用的有:均数、几何均数、中位数等,2024/11/27,西安医学院公共卫生系,1.,算术均数(,arithmetic mean,),简称均数,总体均数用,表示,样本均数用,表示,反映一组观察值在数量上的平均水平,2024/11/27,西安医学院公共卫生系,(,1,)计算方法,直接法,:,式中,希腊字母,(,读作,sigma),表示求和;,X,1,,,X,2,,,,,X,n,为各观察值;,n,为样本含量,即观察值的个数。,2024/11/27,西安医学院公共卫生系,加权法:频数表资料或相同观察值较多时,式中,,X,1,,,X,2,,,,,X,k,与,f,1,,,f,2,,,,,f,k,分别为频数表资料中各组段的组中值和相应组段的频数,(,或相同观察值与其对应的频数,),。,2024/11/27,西安医学院公共卫生系,(,2,)均数的两个重要特性,各离均差的总和等于零,离均差的平方和小于各观察值,X,与任何数,a,(而,a,均数)之差的平方和,即均数是一组观察值最理想的代表值,(,3,),均数的应用,:,最适用于对称分布,特别是正态分布资料,不适于偏态分布资料,2024/11/27,西安医学院公共卫生系,2.,几何均数(,geometric mean,),G,用于滴度、细菌计数等等比资料,(明显偏态)集中趋势的描述,反,映其平均增减的倍数。,2024/11/27,西安医学院公共卫生系,(,1,)计算方法,直接法 或,加权法:相同观察值的个数较多时,2024/11/27,西安医学院公共卫生系,(,2,),应用于,:,等比资料如抗体的平均滴度、平均发展速度人口的几何增长(增长速度);或用于对数正态分布资料。,*注意,观察值不能有零,观察值不能同时有正值和负值,同一组资料几何均数小于均数,2024/11/27,西安医学院公共卫生系,3.,中位数、百分位数,中位数(,median,,,M,)是将一组观察值从小,到大排列,位次居中的观察值。,百分位数(,percentile,),位置指标,,Px,,将,总体或样本的全部观察值分为两部分,,理论上有,x%,的观察值比它小,有,(,100-x,),%,的观察值比它大。,P,50,分位数即是中位数,2024/11/27,西安医学院公共卫生系,(,1,)计算方法,*,1,)直接由原始数据计算中位数,先按大小排序,n,为奇数时,n,为偶数时,式中下标 、为有序数列的位次。,、为相应位次的观察值。,2024/11/27,西安医学院公共卫生系,2,)用频数表计算,M,和,Px,步骤:按所分组段,由小到大计算,累计频数和累计频率;,按下式求,M,、,Px,式中,fx,为,Px,所在组段频数,i,为该组段的组距,L,为其下限,f,L,为小于,L,各组段的累计频数,2024/11/27,西安医学院公共卫生系,(,2,),中位数和百分位数的应用,:,1,),中位数常用于描述偏态分布资料的集中位置,,反映位次居中的观察值的水平。只受居中变量值波动的影响。,对末端无确定数据的分布,,不能直接求均数和几何均数时,,可求中位数,。在对称分布资料中,中位数与均数在理论上数值是相同的。,2,)百分位数用于描述样本或总体观察值序列在某百分位位置的水平。最常用的是,P,50,、,P,5,、,P,95,等,2024/11/27,西安医学院公共卫生系,3,),百分位数,常用于确定医学参考值范围(正常值范围),习惯上是确定只包括,95%,(或,90%,、,99%,等)的人的界值。,双侧参考值范围,P,2.5,P,97.5,(如血压、心率),单侧参考值范围,P,95,或,P,5,(如尿铅,/,汞、血铅),可用于任何分布的资料,特别是非特定分布的资料,如非正态分布资料。,4,)一般,分布中部的百分位数相对稳定,代表性好,而两端的只在,n,足够大时才较稳定,当样本例数,n,不够多时,不宜取太近两端的百分位数。,2024/11/27,西安医学院公共卫生系,小结,定量数据集中趋势的描述常用,均数、几何均数、中位数,均数,适用于对称分布的资料,几何均数,适用于等比资料或对数正态分布资料,中位数,可用于任何分布的资料,但原则上适合用均数或几何均数的资料,不采用中位数来描述其集中趋势。,后面内容直接删除就行,资料可以编辑修改使用,资料可以编辑修改使用,资料仅供参考,实际情况实际分析,主要经营:,课件设计,文档制作,,网络软件设计、图文设计制作、发布广告等,秉着以优质的服务对待每一位客户,做到让客户满意!,致力于数据挖掘,合同简历、论文写作、,PPT,设计、计划书、策划案、学习课件、各类模板等方方面面,打造全网一站式需求,感谢您的观看和下载,The user can demonstrate on a projector or computer,or print the presentation and make it into a film to be used in a wider field,
展开阅读全文