正态分布及其应用 (2)

上传人:xiao****1972 文档编号:247424255 上传时间:2024-10-18 格式:PPT 页数:41 大小:882.50KB
返回 下载 相关 举报
正态分布及其应用 (2)_第1页
第1页 / 共41页
正态分布及其应用 (2)_第2页
第2页 / 共41页
正态分布及其应用 (2)_第3页
第3页 / 共41页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,医学统计学,王友洁,email,正态分布及其应用,Normal distribution,主要内容,正态分布的概念及其特征,标准正态分布,医学参考值范围及其制定,一 正态分布,(normal distribution),某地,140,名正常男子红细胞数的频数表,红细胞数,频 数,频 率(%),累积频率(%),3.80,2,1.4,1.4,4.00,6,4.3,5.7,4.20,11,7.9,13.6,4.40,25,17.9,31.5,4.60,32,22.9,54.4,4.80,27,19.3,73.7,5.00,17,12.1,85.8,5.20,13,9.3,95.1,5.40,4,2.9,98.0,5.60,2,1.4,99.4,5.80,6.00,1,0.7,100.0,合计,140,-,100.0,140,名正常男子红细胞计数的直方图,频数,f,红细胞数X,频率密度,频率/组距,直方图形状相同,使各直方的面积相应于频率,其和为1(100%),某地成年男子红细胞数的分布逐渐接近正态分布示意图,一、正态分布(Normal Distribution),频率密度,正态分布的概念,又称为Gauss分布(Gaussian distribution)。,当原始数据的频数分布图的观察人数逐渐增加且组段不断分细时,图中的直条就不断变窄,其顶端则逐渐接近于一条光滑的曲线。,这条曲线形态呈钟形,两头低、中间高,左右对称,近似于数学上的正态分布,。在处理资料时,我们就把它看成是,正态分布。,正态分布曲线的数学函数表达式,如果随机变量X的分布服从概率密度函数,则称X服从正态分布,记作,X,N,(,2,),为X的总体均数,,2,为总体方差,正态分布有两个参数: 和 , 分别表示均数和标准差。,二、正态分布的特征,钟型曲线,以为中心,左右完全对称,两端与X轴永不相交,在X=处,,f,(,X,)取最大值,X越远离,,f,(,X,)越小。,曲线下面积分布有规律,X轴与正态曲线所夹面积恒等于1或100%;,区间的面积为68.3%,区间1.96的面积为95%,区间2.58的面积为99%.,两个参数决定位置和变异:和,图3-2 正态分布曲线下的面积,图3-3 三种不同均值的正态分布,两个参数决定位置和变异,是位置(即平均水平) 参数,决定分布曲线在横轴的偏倚位置,是变异参数,决定分布曲线的形态,图3-4 三种不同标准差的正态分布,正态分布是一个分布族,对应于不同的参数,和,会产生不同位置、不同形状的正态分布。,s,m,为了应用方便, 令:,二、标准正态分布,(,Standard Normal Distribution,),对任何参数的正态分布,都可以通过一个简单的变量变换 化成,和 的,标准正态分布,。通常,,可以利用标准正态分布表求出与原始变量,X,有关的概率值。此变换也称为标准化变换,或称 Z或u变换,图,3-5,标准正态分布及曲线下面积,标准正态分布Z的概率密度函数为,即将X,N,(,2,)的正态分布转化为Z,N,(0,1,2,)的标准正态分布,Z称为标准正态变量,其分布函数为,根据上述公式制成附表1,欲求一定区间标准正态分布曲线下的面积只需查表即可,且,(z)=1-,(-z),(z),例:已知X服从均数为标准差为的正态分布,试估计:(1)X取值在区间1.96内的概率;(2)X取值在区间2.58内的概率。,求X取值在相应区间内的概率,首先要确定区间两端点所对应的Z值,查表,得,(-1.96)=0.025, 则Z取值在(-1.96,1.96)的概率为0.95,即X取值在区间1.96内的概率为0.95。,95%,99%,例3-1:正常成年男子的红细胞计数近似服从正态分布,假设均值为4.7810,12,/L,标准差为0.3810,12,/L,试估计红细胞数在410,12,/L以下所占的比例。,先将4(10,12,/L)变换为相应的,值,即,于是问题就转化成为求标准正态分布Z值小于-,2.05,概率。查附表1得(-2.05)=0.202,表明成年男子的红细胞数低于4,10,12,/L的人约占总体的2%。,求出在4 10,12,/L5.5 10,12,/L范围内所占的比例,即求P(4.0X5.5),例3-2 上节课的例题中已计算出101名正常成年女子的血清总胆固醇均数为4.03mmol/L,标准差为0.659mmol/L。试估计该单位:正常成年女子血清总胆固醇在4.00mmol/L以下者占正常女子总人数的百分比;在4.005.00mmol/L之间者占正常女子总人数的百分比;在5.00mmol/L以上者占正常女子总人数的百分比。,由于此例样本含量较大,可用样本均数、标准差代替总体均数和标准差,查附表1得,(-0. 05)=?,如何求(1.47)?,三、正态分布的应用,正态分布除了可估计频数分布外,还是许多统计方法的基础,并可应用于质量控制及制定医学参考值范围。,一、基本概念,医学参考值:,通常指包括绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种生理生化指标常数。,医学参考值范围:,由于存在个体差异,生物医学数据并非常数而在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。,主要目的:用于临床疾病诊断。,第三节 医学参考值范围,(Reference Value Range),通常使用的医学参考值范畴有:90%,95%和99%。,最常用的是95%参考值范围。,确定,95%参考值范围示意图,二、医学参考值范围的制定方法,(一)选择一定数量的参照样本,选择参照样本必须要考虑可能影响所要制定参考值范围指标的各种疾病及干扰因素,将这些人排除在外。例如在制定血清谷丙转氨酶活性正常值时,选取正常人的条件为肝、肾、心、脑、肌肉等无器质性疾患,近期无特殊用药史等。同时可能需要考虑性别、年龄、民族、地理位置等因素。样本含量一般要较大,如,n,120。,(二),对选定的参照样本进行准确的测定,为保证原始数据可靠,要严格控制检测误差,包括分析仪器的灵敏度、试剂的纯度、操作技术及标准的掌握等,同时必须对测量条件做出统一的规定和说明,如临床化验参考值范围的制定,应对收集样本时的环境和生理条件(温度、季节、体育活动强度、饮食、妊娠等),收集、转运和储藏样品的方法及时间有明确的规定。,(三),决定取单侧范围还是双侧范围值,有些指标如白细胞数过高或过低均属异常(a) ,故其参考值范围需要分别确定下限和上限,称作双侧。有些指标如24小时尿糖含量仅在过高(b)、肺活量仅在过低时为异常(c),只需确定其上限或下限,称作单侧参考值范围。,(,a)白细胞数参考值范围,(b)24小时尿糖参考值范围,(c)肺活量参考值范围,(四),选择适当的百分范围,参考值,的百分,范围,应根据,资料的性质和研究目的,选择,它与诊断阈值有确定的关系。百分,范围,的不同将导致不同的假阳性率和假阴性率。,正常人和病人数据分布重叠,(五),估计参考值范围的界限,参考值范围估计,主要,有百分位数法和正态分布法。,1.百分位数法:适用于任何分布类型的资料,尤其是偏态分布资料,要求样本含量比正态分布法要多(不低于100)。,计算公式:,双侧1-参考值范围:P,/2,P,100-/2,单侧1-参考值范围: P,或P,100-,双侧95%医学参考值范围是( P,2.5,,P,97.5,),单侧范围是P,95,以下(如人体有害物质如血铅)或P,5,以上(如肺活量),百分范围(%),单 侧,双 侧,下限,上限,下限,上限,95,P,5,P,95,P,2.5,P,97.5,99,P,1,P,99,P,0.5,P,99.5,参考值范围所对应的百分位数,为该地区50岁60岁女性高血脂诊断与治疗提供参考依据,试估计血清甘油三脂含量的95%单侧参考值范围。,甘油三脂,频数,累积频数,累积频率(%),0.10,27,27,4.3,0.40,169,196,31.1,0.70,167,363,57.6,1.00,94,457,72.5,1.30,81,538,85.4,1.60,42,580,92.1,1.90,28,608,96.5,2.20,14,622,98.7,2.50,4,626,99.4,2.80,3,629,99.8,3.10,1,630,100.0,合计,630,-,-,百分范围(%),单 侧,双 侧,下限,上限,下限,上限,95,P,5,P,95,P,2.5,P,97.5,99,P,1,P,99,P,0.5,P,99.5,即95%单侧参考值范围为小于2.098mmol/L。,2.正态分布法,首先要对资料进行正态性检验,且要求样本含量足够大(n100)。计算公式如下:,双侧1-参考值范围:,单侧1-参考值范围:,百分范围(%),单 侧,双 侧,下限,上限,下限,上限,95,99,参考值范围所对应的正态分布区间,参考值范围(%),单侧,双侧,80,0.84,1.28,90,1.28,1.64,95,1.64,1.96,99,2.33,2.58,Z界值表,若已算得某地正常成年男子红细胞数的均数为4.7810,12,/L,标准差为0.3810,12,/L, 试估计该地成年男子红细胞数的95%参考值范围。,下限:,上限:,小 结,1.,标准差与均数结合能够完整地描述一个正态分布,。对任何参数的正态分布,都可以通过一个简单的变量变换化成标准正态分布。,2.利用正态分布可以很容易地确定其数值出现在任意指定范围内的概率,。,3.医学参考值范围指“正常,参照人群”,的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。,主要用,作划分正常人与异常人的界线,。,4,.,医学参考值范围的制定,需要按照一定步骤进行,。实际中最好结合正常人和病人的数据分布特点,权衡假阳性和假阴性的比例,选择一个适当的百分范围,,,最常用的百分界限是95%。,5.,参考值范围估计的方法有多种,其中最基本的有百分位数法和正态分布法。,正态法的优点是结果较稳定,但对资料要求严格;,百分位数法,适合于任何分布类型的资料,但要求大样本。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!