资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,本科生卫生学(5),*,正态分布和参考值范围的估计,医学统计学,供研究生用,第四节 正态分布,(normal distribution),正态分布的概念和特征,正态分布,正态分布的两个参数,正态曲线下面积分布规律,标准正态分布,标准正态分布与标准化变换,标准正态分布表,正态分布的应用,估计频数分布,制定参考值范围,质量控制,统计方法的基础,一、正态分布,(一)正态分布的图形,例:某地7岁男童身高的频数分布,正态分布图形特点,正态分布,频数分布是中间(靠近均数)频数多,两边频数少,且左右对称。,正态曲线,呈钟型:两头低中间高,左右对称,若指标X的频数分布图接近正态分布曲线,则初步判断该指标服从正态分布。,正态分布的概率密度函数:,为总体均数,为标准差,,记为:,XN(,m,s,),记为:XN(,m,s,),如某年某地7岁男孩的身高X服从均数为121(cm)、标准差为5(cm)的正态分布,可记为X N(,122,5,),(二),正态分布的两个参数,m,描述了正态分布的集中趋势位置。,s描述正态分布的离散程度。,s越小,曲线越瘦高,分布越集中;反之,.,二、正态曲线下面积的分布规律,F(X)为正态变量X的分布函数,即对概率密度函数求积分,正态曲线下面积的分布规律-续,(-1,+1)的面积占总面积的68.27%,(-1.96,+1.96)的面积占总面积的,95.00,%,(-2.58,+2.58)的面积占总面积的,99.00,%,三、标准正态分布,标准正态分布与标准化变换,标准正态分布表,标准化变换:,u,变换,这样可将所有不同均数和标准差的资料都转换为,均数为0,标准差为1,的分布,即,标准正态分布,。,标准正态分布的累计函数,标准正态分布图形,-3 -2 -1 0 1 2 3,标准正态分布表,(,P803附表1),把标准正态分布曲线下的面积编制成工具表,列出标准正态曲线下从-到u范围内的面积F(u)值。,而且F(u)F(u)。,-到u=-0.50范围内的面积:,F(-0.5)=0.3085,-到u=0.50 范围内的面积为多少呢,F(0.5)=1-F(-0.5)1-0.3085=0.6915,-3 -2 -1 0 1 2 3,标准正态分布面积分布规律,-到u=-2.58范围内的面积:0.0049,-到u=-1.96范围内的面积:0.0250,-到u=0.00范围内的面积:0.5000,(-1,1)的面积占总面积的68.27%,(-1.96,1.96)的面积占总面积的,95.00%,(-2.58,2.58)的面积占总面积的,99.00%,-3 -2 -1 0 1 2 3,标准正态分布,求曲线下任意(X,1,X,2,)范围内的面积,例 u1-1.50,u2-0.31,欲求标准正态曲线下(-1.50,-0.31)范围内的面积。,(-,,u1),的面积,F(-1.50)=0.0668;,(-,u2),的面积,F(-0.31)0.3783。,则(-1.50,-0.31),的面积,D=F(u2)-F(u1)0.3783-0.0668 O.3115。,对于非标准正态分布,求曲线下任意(X,1,X,2,)范围内的面积,例 Mean121.95,s4.72,n=110,估计界于,116.5119.0,范围内,7,岁男童的比例,(2),估计界于,116.5119.0,范围的男童人数。,u1=(116.5-121.95)/4.72=-1.15;,u2=(119.0-121.95)/4.72=-0.63。,F(-1.15)=0.1251;F(-0.63)=0.2643。,(1)0.2643-0.1251=13.92%;,(2)11013.92%=15。,正态分布的特征,正态曲线呈钟型,在横轴的上方,均数位置最高;,正态分布以均数为中心,左右对称;,正态分布有两个参数,即均数和标准差;,标准正态分布的均数为,0,,标准差为,1,;,正态曲线在,1,各有一拐点;,正态分布的面积分布有一定的规律性。,正态分布的应用,估计频数分布,制定参考值范围,质量控制,统计方法的基础,估计频数分布,若某项研究得出某地婴儿出生体重均数为3200克,标准差为350克,,估计该地当年低体重儿所占的比例。,U=(2500-3200)/350=-2,查标准正态表得:,F,(-2)=0.0228,估计该地当年低体重儿所占的比例为2.28%,例,出生体重低于,2500,克为低体重儿。,第五节 医学参考值范围的制定,reference ranges亦称,正常值范围,绝大多数正常人某指标测定值所在的范围,绝大多数:90%、,95%,、99%等等。,正常人是指排除了影响所研究指标的疾病和有关因素的同质人群。,应遵循一定步骤确定参考值范围。,计算方法有正态分布法和百分位数法。,一、确定参考值范围基本步骤,从正常人总体中抽取足够含量的样本;n 100,控制测量误差下进行准确而统一的测定;,判定是否需要分组;有无年龄、性别差异等?,确定取单侧还是双侧范围值:红细胞?肺通气量?尿铅?,选定适当的百分界限;,对资料进行正态性检验;,计算参考值范围。,正常人与病人的分布有重叠,减少假阳性可选用95%或99%:鉴定诊断。,减少假阴性可选用80%或90%:筛选可疑者。,正常人和病人的分布重叠较多,需要确定可疑范围。,如 舒张压,=90mmHg 且=95mmHg:高血压,参考值范围的确定,方法:,正态近似法,百分位数法,95%参考值(正常值)范围,正态近似法 百分位数法,双侧,1.96s P,2.5,P,97.5,单侧下限,-1.64s P,5,单侧上限,+1.64s P,95,例1:,某地农村1999年130名14岁女孩身高资料(cm)均数为143.08,标准差为6.58。求该地14岁女孩身高的95%参考值范围。,下限为:143.08 1.96 6.58=130.18(cm),上限为:143.08+1.96 6.58=155.98(cm),该地14岁女孩身高的95%参考值范围为130.2156.0(cm)。,二、正态近似法,例2,:,某地调查110名健康成年男性的第一秒肺通气量的均数为4.2(L),标准差为0.7(L)。请据此估计该地成年男子第一秒肺通气量的95%参考值范围。,下限为:,4.2-1.640.7=3.052(L),该地成年男性的第一秒肺通气量95%参考值范围为:不低于3.052(L)。,参考值范围 :3.052(L),三、百分位数法,200名血铅频数表及P,95,计算表,组段,频数f,累计频数,f,累计频率(%),3,36,36,18.5,8 ,39,75,37.5,12,47,122,61.0,18,20,152,76.0,23,18,170,85.0,28,16,186,93.0,33,3,189,94.0,38,7,196,98.0,43,1,197,98.5,48,1,198,99.0,53,1,199,99.5,5862,1,200,100.0,SPSS下的正态性检验,正态性检验有两大类:,图示法和计算法。,SPSS下可以采用图示法中的概率图进行正态性检验;,概率图,(probability-probability plot,P-P plot)或,分位数图,(quantile-quantile plot,Q-Q plot);,如果散点图几乎在一条直线上,可认为该资料服从正态分布。,正态性检验的计算法,矩法(method of moment):对偏度和峰度进行检验。,偏度(skewness):反映分布的对称情况。,峰度(kurtosis):反映分布的尖峭程度。,分别用偏度系数,r,1,(coefficient of skewness),和峰度系数,r,2,(coefficient of kurtosis)表示。,正态分布时:,偏度系数r,1,=0;峰度系数r,2,=0,非正态分布时:,R,1,0 正偏态;r,1,0 尖峭峰;r,2,0 平阔峰,作业 p3132,三、,计算分析题,题 1.2.3.,要求:,*不必抄题目,只写明页数和题号,*能用spss计算的均用spss计算,*写出主要的命令和结果,如:weight case,frequencies,
展开阅读全文