资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,医学统计学,正态分布与医学参考值范围,卫生部“十二五”规划教材,正态分布,概 述,Gauss,正态分布(,normal,distribution,),,是,一种连续型随机变量常见而重要的分布。,它首先由莫阿弗尔于,1733,年提出。之后高斯对其进一步研究,使正态分布广为人知。,A.de Moivre,某地,7,岁男童身高频数分布图,某地,7,岁男童身高频数分布图,正态曲线,正态曲线(,normal curve,),是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。,如果随机变量,X,的分布服从概率密度函数,和概率分布函数,称连续型随机变量,X,服从正态分布,记为,XN,(,2,),。,为,圆周率,,e,为自然对数的,底,值,,,为总体标准差,,,为总体均数。,正态分布的特征,1,、,正态分布是单峰分布,以,X,=,为中心,,左右完全对称,正态曲线以,X,轴为渐近线,两端与,X,轴不相交。,2,、,正态曲线在,X=,处有最大值,其值为 ;,X,越远离,,,f(X),值越小,在,X=,处有拐点,呈现钟形,。,正态分布的特征,3,、,正态分布完全由参数,和,决定。,是位置参数,,决定正态曲线在,X,轴上的位置,。在,一定时,,增大,曲线沿横轴向右移动;,较小,曲线沿横轴向左移动。,是形状参数,,,决定正态曲线的分布形态,。,越大,曲线的形状越“矮胖”,表示数据分布越分散;,越小,曲线的形状越“瘦高”,表示数据分布越集中。,正态分布的特征,正态曲线下面积分布规律,1,、服从正态分布的随机变量在某一区间上的曲线下面积与其在同一区间上取值的概率相等。,2,、曲线下的总面积为,1,或,100%,,以,为,中心左右两侧面积各占,50%,,越靠近,处曲线下面积越大,两边逐渐减少。,正态曲线下面积分布规律,3,、所有的,正态曲线,,在,左右,的任意个标准差,范围内面积相同。,一些特殊情况,在,范围内的面积约为,68.27%,,在,1.96,范围内的面积约为,95.00%,,在,2.58,范围内的面积约为,99.00%,。,标准正态分布,对任意一个服从,N,(,2,),分布的随机变量,X,,经,变换都可以转为,=0,、,=1,的标准正态分布(,standard normal distribution,),也称随机变量的标准化变换(,standardized transformation,)。,z,的概率密度函数为,分布函数为,标准正态分布的应用,实际应用中,经,z,变换可把求解任意一个正态分布曲线下面积的问题,转化成标准正态分布,曲线,下相应面积,的,问题。,欲求,服从标准正态分布的随机变量在区间,(-,z)(z,0),上曲线下的面积,可直接查表;对,(z,0),可根据对称性算得,计算公式为:,(z),=1,(,-z,),z,在,区间,(,z,1,z,2,),取值概率的计算公式为:,P(z,1,z,z,2,)=,(z,2,),(z,1,),【,例,】,由,160,名,7,岁男孩身高测量的数据算得样本均数为,122.6cm,、样本标准差为,4.8cm,。已知身高数据服从正态分布,试估计该地当年,7,岁男孩身高介于,119cm,到,125cm,范围所占的比例。,z,1,=(119,122.6)/4.8=-0.75,z,2,=(125,122.6)/4.8=0.5,查标准正态分布表,(z,1,)=(-0.75)=0.2266,(z,2,)=(0.5)=1,(-0.5)=1,0.3085=0.6915,(z,2,),(z,1,)=0.6915,0.2266=0.4649,7,岁男孩身高介于,119cm,到,125cm,范围所占的比例为,46.49%,正态分布的应用,制定,医学参考值,范围,质量控制,正态分布是很多统计方法,的理论基础,医学参考值范围,医学参考值范围(,reference value range,),指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。,医学参考值范围,习惯上是包含,95%,的参照总体的范围。,概 述,制订的注意事项,a,、抽取足够例数的同质“正常人”样本,“正常人”的定义,样本量(,n120,),随机化。,b,、确定具有实际意义的统一测量标准,指标的测量方法等要有规定,控制测量误差。,c,、根据指标的性质确定是否要分组,根据实际情况、专业知识。,d,、根据指标含义决定单、双侧范围,单侧下限,过低异常;单侧上限,过高异常;双侧,过高、过低均异常。,制订的注意事项,e,、选择适当的百分范围,绝大多数人,一般,80%,、,90%,、,95%,、,99%,;,减少误诊,取较大范围;减少漏诊,取较小范围。,f,、估计参考值范围,根据资料分布类型:正态分布法、百分位数法。,估计方法,适用对象,参考值,范围,双 侧,单 侧,只有下限,只有上限,正态分布法,正态或近似正态分布的资料,90,1.64,-1.28,+1.28,95,1.96,-1.64,+1.64,99,2.58,-2.33,+2.33,百分位数法,大样本偏态分布的资料,90,P,5%,P,9,5%,P,10%,P,90%,95,P,2.5%,P,97.,5%,P,5%,P,95%,99,P,0.5%,P,99.,5%,P,1%,P,99%,计算方法,【,例,】,已知成年女子血清总蛋白含量近似服从正态分布。现为确定成年女子血清,总蛋白,含量参考值范围,在某地抽取“正常”成年女子,200,人,测量其血清总蛋白含量值,计算得均数,74.2g/L,,标准差,3.6,g/L,。试估计该地,成年女子血清总蛋白,含量的,95%,参考,值,范围。,下限为 ,1.96S=74.2,1.963.6=67.144,上限为 ,1.96S=74.2,1.963.6=81.256,该,地成年女子血清总蛋白含量的,95%,参考值,范围是,67.144g/L81.256g/L,。,
展开阅读全文