资源描述
资料仅供参考,不当之处,请联系改正。第九章数值变量资料的统计分析第九章数值变量资料的统计分析第一节第一节 数值型资料的统计描述数值型资料的统计描述第二节第二节 正态分布和参考值范围的估计正态分布和参考值范围的估计第三节第三节 数值型资料的统计推断数值型资料的统计推断第四节第四节 t检验和检验和u检验检验第五节第五节 方差分析方差分析1 1第九章数值变量资料的统计分析1资料仅供参考,不当之处,请联系改正。terminologystatistical descriptionstatistical description统计描述统计描述统计描述统计描述statistical inferencestatistical inference统计推断统计推断统计推断统计推断parameter estimationparameter estimation参数估计参数估计参数估计参数估计Frequency distributionFrequency distribution频数分布频数分布频数分布频数分布frequency tablefrequency table频数表频数表频数表频数表arithmetic Mean,averagearithmetic Mean,average算术平均值算术平均值算术平均值算术平均值standard deviationstandard deviation标准差标准差标准差标准差variancevariance方差方差方差方差rangerange极差,全距,范围极差,全距,范围极差,全距,范围极差,全距,范围geometric meangeometric mean几何平均值几何平均值几何平均值几何平均值medianmedian中位数中位数中位数中位数normal distributionnormal distribution正态分布正态分布正态分布正态分布reference rangereference range参考值范围参考值范围参考值范围参考值范围2 2 资料仅供参考,不当之处,请联系改正。统计分析包括统计分析包括统计描述统计描述和和统计推断统计推断两大部分。两大部分。l统计描述统计描述(statistical description)是用统计指标、统是用统计指标、统计表和统计图描述资料的分析规律及其数量特征;计表和统计图描述资料的分析规律及其数量特征;l统计推断统计推断(statistical inference)包括总体参数估计和包括总体参数估计和假设检验两个内容。假设检验两个内容。参数估计参数估计:是用样本统计量估计总体参数所在范围。是用样本统计量估计总体参数所在范围。假设检验假设检验:是利用样本的实际资料来检验事先对总体某是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否成立。些数量特征所作的假设是否成立。3 3统计分析包括统计描述和统计推断两大部分。3资料仅供参考,不当之处,请联系改正。第一节第一节 数值型变量资料的统计描述数值型变量资料的统计描述例例9.12002年某市年某市150名名2029岁正常男子的岁正常男子的尿酸浓度尿酸浓度(mol/L),资料见表,资料见表9-1。如何进行。如何进行统计描述?统计描述?4 4第一节 数值型变量资料的统计描述4资料仅供参考,不当之处,请联系改正。362.6362.6359.7359.7285.9285.9300.2300.2333.6333.6334.0334.0288.8288.8338.5338.5341.9341.9344.6344.633753375298.3298.3364.2364.2367.1367.1338.1338.1316.9316.9332.7332.7324.0324.0282.6282.6369.8369.8398.7398.7338.7338.7308.9308.9392.1392.1368.7368.7352.6352.6378.2378.2346.1346.1278.6278.6318.3318.3323.2323.2322.6322.6382.1382.1322.6322.6309.6309.6352.0352.0372.5372.5399.8399.8335.6335.6341.1341.1371.0371.0355.9355.9362.7362.7368.1368.1332.4332.4405.6405.6328.8328.8358.8358.8405.9405.9362.7362.7316.3316.3338.7338.7402.6402.6379.4379.4329.6329.6354.6354.6331.4331.4349.6349.6419.5419.5324.6324.6329.8329.8357.8357.8312.0312.0313.6313.6338.7338.7328.6328.6291.3291.3329.7329.7361.8361.8392.4392.4414.9414.9319.7319.7327.6327.6395.8395.8358.9358.9289.4289.4366.2366.2387.4387.4298.4298.4408.7408.7389.8389.8362.5362.5354.9354.9352.7352.7316.6316.6348.9348.9348.7348.7401.6401.6334.6334.6308.9308.9367.0367.0345.6345.6401.6401.6357.1357.1304.6304.6338.5338.5388.2388.2355.8355.8329.4329.4321.1321.1320.4320.4313.5313.5339.8339.8409.4409.4387.4387.4378.5378.5392.0392.0352.7352.7376.2376.2388.4388.4344.6344.6308.6308.6347.0347.0428.7428.7369.1369.1311.4311.4376.3376.3349.4349.4289.2289.2366.8366.8371.0371.0387.5387.5413.6413.6348.7348.7392.7392.7401.0401.0313.6313.6366.8366.8387.2387.2319.7319.7329.4329.4357.5357.5348.5348.5346.8346.8406.6406.6357.6357.6338.7338.7341.6341.6349.8349.8289.4289.4366.2366.2357.5357.5298.4298.4336.8336.8387.5387.5342.3342.3366.7366.7387.6387.6332.7332.7324.0324.0表表9-12002年某市年某市150名名2029岁正常男子的尿酸浓度岁正常男子的尿酸浓度(mol/L)5 5362.6359.7285.9300.2333.6334.0资料仅供参考,不当之处,请联系改正。统计描述的内容:统计描述的内容:一、制频数一、制频数(分布分布)表表(表表9-2)和频数分布图和频数分布图(图图9-1)频数表的用途频数表的用途(1)揭示资料的分布特征和分布类型揭示资料的分布特征和分布类型(2)便于发现某些特大或特小的可疑值便于发现某些特大或特小的可疑值(3)便于进一步计算便于进一步计算统计统计指标和统计分析处理指标和统计分析处理二、计算统计指标二、计算统计指标(1)计算平均值计算平均值代表一组资料的平均水平;代表一组资料的平均水平;(2)计算标准差计算标准差-反映资料的离散程度。反映资料的离散程度。三、绘制统计表和统计图三、绘制统计表和统计图6 6统计描述的内容:6资料仅供参考,不当之处,请联系改正。一、编制频数分布表:制表步骤:一、编制频数分布表:制表步骤:(1)求求极差极差或全距或全距(range):R=Xmax Xmin本例,本例,R=428.7278.6150.1(mol/L)。(2)决定组数、组段数和划分组距决定组数、组段数和划分组距(class interval):根据样本含量的多少确定组数,一般设根据样本含量的多少确定组数,一般设815组。组。组段数组段数=取整取整(极差极差/组数组数)。本例:组段数本例:组段数=取整取整(150.1/10)=15.01 15划分组距:每组段的起点和终点分别称为划分组距:每组段的起点和终点分别称为下界下界和和上界上界。组距:本组内组距:本组内的的上界和下界上界和下界之差。之差。组段的划分组段的划分组段的划分组段的划分2702702852853003003153153303303453453603603753753903904054054204354204351 12 23 34 45 56 67 78 89 9101011117 7一、编制频数分布表:制表步骤:组段的划分27028530资料仅供参考,不当之处,请联系改正。(3)列频数表:按上述组段列频数表:按上述组段序列制成表的形式,采用序列制成表的形式,采用划记法或计算机将原始数划记法或计算机将原始数据汇总,得出各组段中所据汇总,得出各组段中所包含的观察例数,即为频包含的观察例数,即为频数,如表数,如表9-2的第的第(2)栏。栏。将各组段及其相应的频数将各组段及其相应的频数列成表格,即为频数表列成表格,即为频数表(frequency table),如,如表表9-2。所绘的图形见图。所绘的图形见图9-1。表表表表9-29-220022002年某市年某市年某市年某市150150名名名名20292029岁岁岁岁正常男子的尿酸浓度的频数分布正常男子的尿酸浓度的频数分布正常男子的尿酸浓度的频数分布正常男子的尿酸浓度的频数分布尿酸浓度尿酸浓度尿酸浓度尿酸浓度(mol/Lmol/L)频数频数频数频数频率频率频率频率(%)(%)2702702 21.331.332852859 96.006.0030030011117.337.33315315222214.6714.67330330242416.0016.00345345272718.0018.00360360202013.3313.33375375151510.0010.0039039011117.337.334054058 85.335.334204354204351 10.670.67合计合计合计合计150150100.00100.008 8(3)列频数表:按上述组段序列制成表的形式,采用划记法或计算资料仅供参考,不当之处,请联系改正。资料的分布类型:资料的分布类型:1.对称分布或正态分布;对称分布或正态分布;2.偏态分布:高峰在左侧或右侧;偏态分布:高峰在左侧或右侧;3.不规则分布:分布很散,无明显高峰不规则分布:分布很散,无明显高峰9 9资料的分布类型:9资料仅供参考,不当之处,请联系改正。二、计算平均值二、计算平均值代表平均资料的平均水平代表平均资料的平均水平1.平均值的种类:平均值的种类:(一一)算术均算术均值值(arithmetic mean,average):常用常用 表表示样本均示样本均值值,希腊字母,希腊字母表示总体均表示总体均值值。适用于对称分。适用于对称分布的数值型变量资料。其计算方法有:布的数值型变量资料。其计算方法有:直接法直接法:i(I=1,2,n)为第为第i个观察对象的观察值个观察对象的观察值 加权法加权法:i 为第为第i组的组中值组的组中值,fi 为第为第i组的例数组的例数:1010二、计算平均值代表平均资料的平均水平 加权法:资料仅供参考,不当之处,请联系改正。表表表表9-29-2分组资料加权法计算平均值及标准差用表分组资料加权法计算平均值及标准差用表分组资料加权法计算平均值及标准差用表分组资料加权法计算平均值及标准差用表尿酸浓度尿酸浓度尿酸浓度尿酸浓度(mol/Lmol/L)组中值组中值组中值组中值(x(xi i)频数频数频数频数(f(fi i)f fi ixxi if fi ixxi i2 2270270277.5277.52 2555.0555.0154012.5154012.5285285292.5292.59 92632.52632.5770006.3770006.3300300307.5307.511113382.53382.51040119.01040119.0315315322.5322.522227095.07095.02288138.02288138.0330330337.5337.524248100.08100.02733750.02733750.0345345352.5352.527279517.59517.53354919.03354919.0360360367.5367.520207350.07350.02701125.02701125.0375375382.5382.515155737.55737.52194594.02194594.0390390397.5397.511114372.54372.51738069.01738069.0405405412.5412.58 83300.03300.01361250.01361250.0420435420435427.5427.51 1427.5427.5182756.3182756.3合计合计15015052470.052470.018518738.018518738.01111表9-2分组资料加权法计算平均值及标准差用表尿酸浓度(m资料仅供参考,不当之处,请联系改正。(二二)几何均几何均值值(geometric mean,G)适用条件适用条件:等比级数资料等比级数资料.原始观察值呈偏态分布、但原始观察值呈偏态分布、但数据经过对数变换后呈正态分布或近似正态分布的资料。数据经过对数变换后呈正态分布或近似正态分布的资料。如医学实践中某些疾病的潜伏期、抗体滴度、平均效价等。如医学实践中某些疾病的潜伏期、抗体滴度、平均效价等。其计算方法有:其计算方法有:直接法直接法:i 为第为第i个观察对象的观察值个观察对象的观察值加权法加权法:i 为第为第i组的组中值组的组中值(或观察值或观察值),fi 为第为第i组例数组例数:1212(二)几何均值(geometric mean,G)加权法资料仅供参考,不当之处,请联系改正。抗体滴度抗体滴度抗体滴度抗体滴度(i i)人数人数人数人数f fi i滴度倒数滴度倒数滴度倒数滴度倒数X Xi ilglg1010(X(Xi i)f fi ilglg1010(X(Xi i)(1)(1)(2)(2)(3)(3)(4)(4)(5)=(2)(4)(5)=(2)(4)1:2.51:2.53 32.52.50.39790.39791.19371.19371:5.01:5.07 75.05.00.69900.69904.89304.89301:10.01:10.0141410.010.01.00001.000014.000014.00001:20.01:20.06 620.020.01.30101.30107.80627.80621:40.01:40.04 440.040.01.60211.60216.40846.4084合合合合计计343434.301334.3013表表9-4 某地某地34名儿童接种麻疹疫苗后血清血凝抑制抗体滴度名儿童接种麻疹疫苗后血清血凝抑制抗体滴度血清血凝抑制抗体的几何平均滴度为血清血凝抑制抗体的几何平均滴度为1:10.206。X=(2.53+5.0 7+10.014+20.0 6+40.0 4)/34=13.6 (算术平均滴度为算术平均滴度为1:13.6)1313抗体滴度(i)人数fi滴度倒数Xilg10(Xi)filg资料仅供参考,不当之处,请联系改正。(三三)中位数中位数(median,M):将观察值按大小排序后,位次居中的观察值。将观察值按大小排序后,位次居中的观察值。M=X(P=50%)在全部观察值中小于在全部观察值中小于M的观察值个数与大于的观察值个数与大于M的观察值个的观察值个数相等。由于数相等。由于M不受个别特小或特大观察值的影响,适用不受个别特小或特大观察值的影响,适用于分布不规则或分散度很高的资料于分布不规则或分散度很高的资料.3个观察值个观察值:1,3,5.M=3;4个观察值个观察值:1,3,5,7.M=4.直接法直接法:设设n 为观察值的个数为观察值的个数,有公式有公式(9-5)及及(9-6)频数表法频数表法:i 为第为第i组的组中值组的组中值(或观察值或观察值),fi 为第为第i组例组例数数:L:中位数组段下限值中位数组段下限值,fL:小于小于L的累计频数的累计频数,i:中位数组距中位数组距.1414(三)中位数(median,M):频数表法:i 资料仅供参考,不当之处,请联系改正。尿铅值尿铅值尿铅值尿铅值(mmol/L)(mmol/L)人数人数人数人数f f累累累累计频计频数数数数ff累累累累计频计频率率率率(%)(%)(1)(1)(2)(2)(3)(3)(4)=(3)(4)=(3)n n0 0272727278.778.7725255454818126.3026.305050959517617657.1457.147575555523123175.0075.00100100393927027087.6687.66125125212129129194.4894.48150150121230330398.3898.381751755 5308308100.00100.00 合计合计合计合计308308表表9-5 308名名6岁以下儿童尿铅值的频数分布岁以下儿童尿铅值的频数分布(中位数计算中位数计算)L:中位数组段下限值中位数组段下限值,fL:小于小于L的累计频数的累计频数,i:中位数组距中位数组距,f50%:中位数组频数中位数组频数.L=50,fL=81,i=25f50%=951515尿铅值(mmol/L)人数f累计频数f累计频率(%)(1)资料仅供参考,不当之处,请联系改正。三、计算标准差三、计算标准差-反映资料的离散程度。反映资料的离散程度。数值变量数据的频数分布有集中趋势和离散程度两个主要数值变量数据的频数分布有集中趋势和离散程度两个主要特征,只有两者相结合,才能全面地认识事物。特征,只有两者相结合,才能全面地认识事物。反映资料的离散程度的统计量反映资料的离散程度的统计量(统计指标统计指标)有:有:(一一)全距全距(range)或极差:或极差:R=Xmax Xmin全距是一组观察值中最大值与最小值之差。全距是一组观察值中最大值与最小值之差。(二二)四分位数间距四分位数间距(quartile interval):Q=X75%X25%,Q包括了全部观察值中间的一半包括了全部观察值中间的一半.(三三)方差方差(variance)和标准差和标准差(standard deviation)1616三、计算标准差-反映资料的离散程度。16资料仅供参考,不当之处,请联系改正。例有例有3组同龄男孩的体重组同龄男孩的体重()测量值如下,其平均体重测量值如下,其平均体重都是都是30(),试分析其离散程度。,试分析其离散程度。分分分分组组观观察察察察值值()全距全距全距全距 R R QQS S甲甲甲甲组组2626282830303232343430308 84 43.163.16乙乙乙乙组组24242727303033333636303012126 64.744.74丙丙丙丙组组2626292930303131343430308 82 22.922.92丙丙丙丙组组*乙乙乙乙组组*甲甲甲甲组组*体重体重232324242525262627272828292930303131323233333434353536363737()1717例有3组同龄男孩的体重()测量值如下,其平均体重都是30资料仅供参考,不当之处,请联系改正。标准差的简化计算方法:标准差的简化计算方法:数学上可证明:数学上可证明:故标准差的计算公式又可写成:故标准差的计算公式又可写成:直接法:直接法:X为观察值为观察值 加权法:加权法:Xi为组中值为组中值 表表表表9-3 9-3 尿酸浓度尿酸浓度尿酸浓度尿酸浓度(mol/Lmol/L)分组资料加权法计算平均数及标准差用分组资料加权法计算平均数及标准差用分组资料加权法计算平均数及标准差用分组资料加权法计算平均数及标准差用表表表表n=fn=fi i=150=150(f(fi ixxi i)=)=52470.0 52470.0(f(fi ixxi i2 2)=18518738.0)=18518738.01818标准差的简化计算方法:故标准差的计算公式又可写成:表9-3 资料仅供参考,不当之处,请联系改正。标准差的应用:标准差的应用:(1)表示观察值的变异程度表示观察值的变异程度(离散程度离散程度):在两组在两组(或几组或几组)资资料均数相近、度量单位相同的条件下,标准差大,表示观料均数相近、度量单位相同的条件下,标准差大,表示观察值的变异度大,即各观察值离均数较远,均数的代表性察值的变异度大,即各观察值离均数较远,均数的代表性较差。较差。(2)(2)结合均数描述正态分布的特征和估计医学参考值范围。结合均数描述正态分布的特征和估计医学参考值范围。结合均数描述正态分布的特征和估计医学参考值范围。结合均数描述正态分布的特征和估计医学参考值范围。(3)(3)结合样本含量结合样本含量结合样本含量结合样本含量n n计算标准误。计算标准误。计算标准误。计算标准误。1919标准差的应用:19资料仅供参考,不当之处,请联系改正。四分位数间距的计算四分位数间距的计算(interquartilerange,Q):中位数计算公式:中位数计算公式:25%位数计算公式:位数计算公式:75%位数计算公式位数计算公式尿铅值尿铅值尿铅值尿铅值(mmol/L)(mmol/L)人数人数人数人数f f累累累累计频计频数数数数ff累累累累计频计频率率率率(%)(%)(1)(1)(2)(2)(3)(3)(4)=(3)(4)=(3)n n0 0272727278.778.7725255454818126.3026.305050959517617657.1457.147575555523123175.0075.00100100393927027087.6687.66125125212129129194.4894.48150150121230330398.3898.381751755 5308308100.00100.00 合计合计合计合计3083082020四分位数间距的计算(interquartile range,资料仅供参考,不当之处,请联系改正。四分位数间距(四分位数间距(interquartilerange,Q)计算公式:Q=X75%X25%X0%X25%X50%X75%X100%|Q|048.1569.21100.0175X1Xn2121四分位数间距(interquartile range,Q)资料仅供参考,不当之处,请联系改正。描述性统计量归纳描述性统计量归纳反映资料的集中反映资料的集中反映资料的集中反映资料的集中趋势的指标趋势的指标趋势的指标趋势的指标反映资料的离反映资料的离反映资料的离反映资料的离散情况指标散情况指标散情况指标散情况指标适用的资料类型适用的资料类型适用的资料类型适用的资料类型1.1.算术平均数算术平均数算术平均数算术平均数方差及标准差方差及标准差方差及标准差方差及标准差对称分布,特别是正态或近似对称分布,特别是正态或近似对称分布,特别是正态或近似对称分布,特别是正态或近似正态分布资料。正态分布资料。正态分布资料。正态分布资料。2.2.几何平均数几何平均数几何平均数几何平均数几何标准差几何标准差几何标准差几何标准差适用于对数正态或近似对数正适用于对数正态或近似对数正适用于对数正态或近似对数正适用于对数正态或近似对数正态分布资料态分布资料态分布资料态分布资料3.3.中位数中位数中位数中位数 四分位数间距四分位数间距四分位数间距四分位数间距或百分位数或百分位数或百分位数或百分位数分布不规则的资料,分散程度分布不规则的资料,分散程度分布不规则的资料,分散程度分布不规则的资料,分散程度大的资料大的资料大的资料大的资料2222描述性统计量归纳反映资料的集中趋势的指标反映资料的离散情况指资料仅供参考,不当之处,请联系改正。变异系数变异系数变异系数变异系数(coefficient of variation(coefficient of variation,CV):CV):若比较度量单位不同或均数相差悬殊的两组若比较度量单位不同或均数相差悬殊的两组若比较度量单位不同或均数相差悬殊的两组若比较度量单位不同或均数相差悬殊的两组(或几组或几组或几组或几组)观察观察观察观察值的变异度,则需用变异系数为相互比较的指标。值的变异度,则需用变异系数为相互比较的指标。值的变异度,则需用变异系数为相互比较的指标。值的变异度,则需用变异系数为相互比较的指标。不属于描述性统计指标,是一个比较用的统计指标。不属于描述性统计指标,是一个比较用的统计指标。不属于描述性统计指标,是一个比较用的统计指标。不属于描述性统计指标,是一个比较用的统计指标。从变异系数比较,体重的变异程度大于身高的变异程度。从变异系数比较,体重的变异程度大于身高的变异程度。变异系数的变异系数的特点:描述的是相对离散程度,没有单位。特点:描述的是相对离散程度,没有单位。适用于:适用于:(1)比较单位不同的多组资料的变异度。比较单位不同的多组资料的变异度。(2)比较均数相差悬殊的多组资料的变异度。比较均数相差悬殊的多组资料的变异度。例例9-10 某地某地25岁男子岁男子100人的调查结果如下:问题:哪人的调查结果如下:问题:哪一个指标的变异度大些?一个指标的变异度大些?2323变异系数(coefficient of variation,资料仅供参考,不当之处,请联系改正。第二节第二节 正态分布和医学参考值范围正态分布和医学参考值范围一、正态分布一、正态分布(normal distribution)2424第二节 正态分布和医学参考值范围24资料仅供参考,不当之处,请联系改正。表表表表9-29-2尿酸浓尿酸浓尿酸浓尿酸浓度的频数分布度的频数分布度的频数分布度的频数分布尿酸浓度尿酸浓度尿酸浓度尿酸浓度(mol/Lmol/L)频数频数频数频数2702702 22852859 930030011113153152222330330242434534527273603602020375375151539039011114054058 84204354204351 1合计合计合计合计150150图图9-2频数分布逐渐向正态分布接近频数分布逐渐向正态分布接近2525表9-2尿酸浓度的频数分布尿酸浓度(mol/L)频数27资料仅供参考,不当之处,请联系改正。(一一)正正态分布的分布的图形形可以可以设想,想,如果如果观察例数逐察例数逐渐增多,增多,组段数也不断增多,段数也不断增多,就会形成一条光滑曲就会形成一条光滑曲线图图9-2(3)。称为正态分布曲线。称为正态分布曲线。这条正态分布这条正态分布曲曲线的特点的特点为:高峰位于中央均数所在高峰位于中央均数所在处、两、两侧逐逐渐降低降低;左右左右对称称;曲曲线在无穷远处在无穷远处与横与横轴相交。相交。把服从正态分布的变量表示为:把服从正态分布的变量表示为:XN(,2)正态分布正态分布曲曲线由两个参数确定:由两个参数确定:平均数平均数,称位置参数,决定平均数所在的位置;,称位置参数,决定平均数所在的位置;方差方差2,称形状参数,决定曲线的高低宽窄。,称形状参数,决定曲线的高低宽窄。2626(一)正态分布的图形正态分布曲线由两个参数确定:26资料仅供参考,不当之处,请联系改正。服从服从正正态分布分布的变量的变量X的概率的概率密度函数密度函数f(X)为式中,式中,式中,式中,为总体均数;为总体均数;为总体均数;为总体均数;为总体标准差;为总体标准差;为总体标准差;为总体标准差;=3.14159=3.14159为圆为圆为圆为圆周率;周率;周率;周率;e e为自然对数的底为自然对数的底为自然对数的底为自然对数的底(e2.71828),X(e2.71828),X为变量。为变量。为变量。为变量。表示为:表示为:uN(0,1),即平均值为,即平均值为0、方差为、方差为1的正态分布。的正态分布。为实际应用方便,将一般正态分布转换为标准正态分布。为实际应用方便,将一般正态分布转换为标准正态分布。转换公式为:转换公式为:u=(X-),u称为标准正态变量。称为标准正态变量。服从标准服从标准正正态分布分布的变量的变量u的概率的概率密度函数密度函数f(u)为2727服从正态分布的变量X的概率密度函数f(X)为式中,为总体均资料仅供参考,不当之处,请联系改正。A.正态分布正态分布 B.标准正态分布标准正态分布图图9-3 正态分布与标准正态分布的面积与纵高正态分布与标准正态分布的面积与纵高按式按式(9-16),根据,根据X的不同取值,绘出正态分布的不同取值,绘出正态分布(normal distribution)的图形的图形(图图9-3A)。按式按式(9-16),根据,根据u的不同取值,绘出标准正态分布的不同取值,绘出标准正态分布(standard normal distribution)的图形的图形(图图9-3B)。Xu2828A.正态分布 B.资料仅供参考,不当之处,请联系改正。图图9-4 正态曲线与标准正态曲线的面积分布正态曲线与标准正态曲线的面积分布二、正态曲线下面积的分布规律二、正态曲线下面积的分布规律:用积分法求得。用积分法求得。表表9-6 9-6 正态分布和标准正态分布曲线下面积正态分布和标准正态分布曲线下面积(概率概率)分布规律对照分布规律对照 正态分布正态分布 标准正态分布标准正态分布 面积面积(概率概率)%)%左侧界值左侧界值 右侧界值右侧界值左侧界值左侧界值 右侧界值右侧界值中间部份中间部份两侧尾部和两侧尾部和 1.01.0 +1.0+1.0 1.01.0 +1.0 +1.0 68.27 68.27 31.73 31.73 1.961.96 +1.96+1.96 1.961.96 +1.96 +1.96 95.00 95.00 5.00 5.00 2.582.58 +2.58+2.58 2.582.58 +2.58 +2.58 99.00 99.00 1.00 1.00 2929图9-4 正态曲线与标准正态曲线的面积分布二、正态曲线下面资料仅供参考,不当之处,请联系改正。为了省去计算的麻烦,编制成了为了省去计算的麻烦,编制成了“标准正态分布曲线下的标准正态分布曲线下的面积面积”(表(表9-8)。表中列出了左侧概率:)。表中列出了左侧概率:(-,-u);右侧概率:右侧概率:(u,+)=(-,-u),(-,u)=1(-,-u)通过查表可求出正态曲线下某区间的面积,进而估计该区通过查表可求出正态曲线下某区间的面积,进而估计该区间观察例数占总例数的百分数或变量值落在该区间的概率。间观察例数占总例数的百分数或变量值落在该区间的概率。查表表时应注意:注意:当当,已知已知时,先,先将观察值将观察值X变换为为u值u=(X-)/,再,再查表;表;当当,未知未知、但、但n足足够大大时,可以用,可以用样本均数本均数和和样本本标准差准差s分分别代替代替和和,进行行u变换u=(X-)/s求得求得u的估的估计值后后再再查表;表;曲曲线下下对称于称于0的区的区间面面积相等,如相等,如(-,-1.96)=(1.96,)曲曲线下横下横轴上的上的总面面积为100或或1。3030为了省去计算的麻烦,编制成了“标准正态分布曲线下的面积”(表资料仅供参考,不当之处,请联系改正。三、医学参考值范围的估计三、医学参考值范围的估计参考值范围参考值范围(reference range)的意义的意义参考值参考值是指正常人体或动物的各种生理常数,正常人是指正常人体或动物的各种生理常数,正常人体液和排泄物中某种生理生化指标或某种元素的含量,以体液和排泄物中某种生理生化指标或某种元素的含量,以及人体对各种试验的正常反应值等。及人体对各种试验的正常反应值等。由于存在个体变异,各种数据不仅因人而异,而且同一个由于存在个体变异,各种数据不仅因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波人还会随机体内外环境的改变而改变,因而需要确定其波动的范围,即动的范围,即医学参考值范围医学参考值范围,亦称医学正常值范围。,亦称医学正常值范围。3131三、医学参考值范围的估计31资料仅供参考,不当之处,请联系改正。制订医学参考值范围时须注意:制订医学参考值范围时须注意:从同质总体中随机抽样。根据研究目的确定同质总体从同质总体中随机抽样。根据研究目的确定同质总体的标准。排除患有影响所研究指标的疾病和有关因素的的标准。排除患有影响所研究指标的疾病和有关因素的同质人群。同质人群。需要有一定的样本含量。需要有一定的样本含量。n100例。例。控制测量误差。控制测量误差。判断是否需要分组确定参考值范围。如不同性别,不判断是否需要分组确定参考值范围。如不同性别,不同年龄组,甚至不同民族。同年龄组,甚至不同民族。确定是取单侧还是取双侧参考值。确定是取单侧还是取双侧参考值。确定适当的百分数范围。确定适当的百分数范围。80%,90%,95%,99%。范围过窄,即诊断标准过严,会增加漏诊;范围过窄,即诊断标准过严,会增加漏诊;范围过宽,即诊断标准过松,会增加误诊;范围过宽,即诊断标准过松,会增加误诊;根据资料分布类型选择统计学方法估计参考值范围。根据资料分布类型选择统计学方法估计参考值范围。3232制订医学参考值范围时须注意:32资料仅供参考,不当之处,请联系改正。表表表表9-79-7三种参考值估计方法的适用对象和三种参考值估计方法的适用对象和三种参考值估计方法的适用对象和三种参考值估计方法的适用对象和95%95%参考值范围的计算参考值范围的计算参考值范围的计算参考值范围的计算资料类型资料类型资料类型资料类型统计方法统计方法统计方法统计方法双侧界限值双侧界限值双侧界限值双侧界限值单侧上界值单侧上界值单侧上界值单侧上界值单侧下界值单侧下界值单侧下界值单侧下界值正态或近似正态或近似正态或近似正态或近似正态分布正态分布正态分布正态分布正态分布正态分布正态分布正态分布法法法法 对数正态或对数正态或对数正态或对数正态或近似对数正近似对数正近似对数正近似对数正态分布态分布态分布态分布对数正态对数正态对数正态对数正态分布法分布法分布法分布法不规则分布不规则分布不规则分布不规则分布百分位数百分位数百分位数百分位数法法法法例例9-11,表,表9-22002年某市年某市150名名2029岁正常男子的尿酸浓度资岁正常男子的尿酸浓度资料。料。X=350.24(mol/L),S=32.97(mol/L).用用正态分布法双侧正态分布法双侧正态分布法双侧正态分布法双侧95%95%的参考值范围的上下界限值为:的参考值范围的上下界限值为:的参考值范围的上下界限值为:的参考值范围的上下界限值为:下界下界下界下界:350.24:350.241.9632.97=285.621.9632.97=285.62(mol/L),上界上界上界上界:350.24+1.9632.97=414.86:350.24+1.9632.97=414.86(mol/L)即即2029岁男性尿酸浓度岁男性尿酸浓度95%95%参考值范围:参考值范围:参考值范围:参考值范围:285.62414.86285.62414.86(mol/L)3333表9-7 三种参考值估计方法的适用对象和95%参考值范围资料仅供参考,不当之处,请联系改正。例例9-12,例,例9-7表表9-5,308名名6岁以下儿童尿铅值资料。用岁以下儿童尿铅值资料。用百分位数百分位数法计算单侧法计算单侧法计算单侧法计算单侧95%95%参考值范围的上界值。即参考值范围的上界值。即参考值范围的上界值。即参考值范围的上界值。即X X95%95%尿铅值尿铅值尿铅值尿铅值(mmol/L)(mmol/L)人数人数人数人数f f累累累累计频计频数数数数ff累累累累计频计频率率率率(%)(%)(1)(1)(2)(2)(3)(3)(4)=(3)(4)=(3)n n0 0272727278.778.7725255454818126.3026.305050959517617657.1457.147575555523123175.0075.00100100393927027087.6687.66125125212129129194.4894.48150150121230330398.3898.381751755 5308308100.00100.00 合计合计合计合计308308L=150:95%组段下限值组段下限值fL=291:小于小于L的累计频数的累计频数i=25:95%组的组距组的组距f95%:=12:95%组频数组频数故故6岁以下儿童尿铅值岁以下儿童尿铅值单侧单侧单侧单侧95%95%参考值范围为:参考值范围为:参考值范围为:参考值范围为:153.33(mmol/L)153.33(mmol/L)3434例9-12,例9-7表9-5,308名6岁以下儿童尿铅值资料资料仅供参考,不当之处,请联系改正。本章小节本章小节资料类型资料类型资料类型资料类型描述性统计量描述性统计量描述性统计量描述性统计量95%95%参考值范围的计算参考值范围的计算参考值范围的计算参考值范围的计算对称分布,特别对称分布,特别对称分布,特别对称分布,特别是正态或近似正是正态或近似正是正态或近似正是正态或近似正态分布资料态分布资料态分布资料态分布资料算术平均数算术平均数算术平均数算术平均数方差及标准差方差及标准差方差及标准差方差及标准差正态分布法:正态分布法:正态分布法:正态分布法:根据正态分布规律根据正态分布规律根据正态分布规律根据正态分布规律双侧:双侧:双侧:双侧:单侧上界:单侧上界:单侧上界:单侧上界:单侧下界:单侧下界:单侧下界:单侧下界:适用于对数正态适用于对数正态适用于对数正态适用于对数正态或近似对数正态或近似对数正态或近似对数正态或近似对数正态分布资料分布资料分布资料分布资料几何平均数几何平均数几何平均数几何平均数几何标准差几何标准差几何标准差几何标准差对数正态分布法:对数正态分布法:对数正态分布法:对数正态分布法:双侧:双侧:双侧:双侧:单侧上界:单侧上界:单侧上界:单侧上界:单侧下界:单侧下界:单侧下界:单侧下界:分布不规则的资分布不规则的资分布不规则的资分布不规则的资料,分散程度大料,分散程度大料,分散程度大料,分散程度大的资料的资料的资料的资料中位数中位数中位数中位数 四分位数间距四分位数间距四分位数间距四分位数间距或百分位数或百分位数或百分位数或百分位数百分位数法:按排序的位置清点位次百分位数法:按排序的位置清点位次百分位数法:按排序的位置清点位次百分位数法:按排序的位置清点位次双侧:双侧:双侧:双侧:XX2.5%2.5%XX97.5%97.5%单侧上界单侧上界单侧上界单侧上界:X:X95.0%95.0%单侧下界:单侧下界:单侧下界:单侧下界:X X5.0%5.0%3535本章小节资料类型描述性统计量95%参考值范围的计算对称分布,资料仅供参考,不当之处,请联系改正。The end3636The end36资料仅供参考,不当之处,请联系改正。第九章第九章 第一讲练习题第一讲练习题 实习九实习九数值变量资料的统计分析数值变量资料的统计分析(1)pp.379-382内容内容(一一)选择题:选择题:1,2,3,9,10。(二二)思考题:思考题:1,2,6。(三)应用题:应用题:1,2,3。3737 第九章 第一讲练习题37资料仅供参考,不当之处,请联系改正。u u.00.00.01.01.02.02.03.03.04.04.05.05.06.06.07.07.08.08.09.09-3.0-3.0.0013.0013.0013.0013.0013.0013.0012.0012.0012.0012.0011.0011.0011.0011.0011.0011.0010.0010.0010.0010-2.9-2.9.0019.0019.0018.0018.0018.0018.0017.0017.0016.0016.0016.0016.0015.0015.0015.0015.0014.0014.0014.0014-2.8-2.8.0026.0026.0025.0025.0024.0024.0023.0023.0023.0023.0022.0022.0021.0021.0021.0021.0020.0020.0019.0019-2.7-2.7.0035.0035.0034.0034.0033.0033.0032.0032.0031.0031.0030.0030.0029.0029.0028.0028.0027.0027.0026.0026-2.6-2.6.0047.0047.0045.0045.0144.0144.0043.0043.0041.0041.0040.0040.0039.0039.0038.0038.0037.0037.0036.0036-2.5-2.5.0062.0062.0060.0060.0059.0059.0057.0057.0055.0055.0054.0054.0052.0052.0051.0051.0049.0049.0048.0048-2.4-2.4.0082.0082.0080.0080.0078.0078.0075.0075.0073.0073.0071.0071.0069.0069.0068.0068.0066.0066.0064.0064-2.3-2.3.0107.0107.0104.0104.0102.0102.0099.0099.0096.0096.0094.0094.0091.0091.0089.0089.0087.0087.0084.0084-2.2-2.2.0139.0139.0136.0136.0132.0132.0129.0129.0125.0125.0122.0122.0119.0119.0116.0116.0113.0113.0110.0110-2.1-2.1.0179.0179.0174.0174.0170.0170.0166.0166.0162.0162.0158.0158.0154.0154.0150.0150.0146.0146.0143.0143-2.0-2.0.0228.0228.0222.0222.0217.0217.0212.0212.0207.0207.0202.0202.0197.0197.0192.0192.0188.0188.0183.0183-1.9-1.9.0287.0287.0281.0281.0274.0274.0268.0268.0262.0262.0256.0256.0250.0250.0244.0244.0239.0239.0233.0233-1.8-1.8.0359.0359.0351.0351.0344.0344.0336.0336.0329.0329.0322.0322.0314.0314.0307.0307.0301.0301.0294.0294-1.7-1.7.0446.0446.0436.0436.0427.0427.0418.0418.0409.0409.0401.0401.0392.0392.0384.0384.0375.0375.0367.0367-1.6-1.6.0548.0548.0537.0537.0526.0526.0516.0516.0505.0505.0495.0495.0485.0485.0475.0475.0465.0465.0455.0455-1.5-1.5.0668.0668.0655.0655.0643.0643.0630.0630.0618.0618.0606.0606.0594.0594.0582.0582.0571.0571.0559.0559-1.4-1.4.0808.0808.0793.0793.0778.0778.0764.0764.0749.0749.0735.0735.0721.0721.0798.0798.0694.0694.0681.0681表9-8 标准正态分布曲线下的面积自-到-u的面积(-,-u),(u,+)=1-(-,-u)3838u.00.01.02.03.04.05.06.07.08.0资料仅供参考,不当之处,请联系改正。-1.4-1.4.0808.0808.0793.0793.0778.0778.0764.0764.0749.0749.0735.0735.0721.0721.0798.0798.0694.0694.0681.0681-1.3-1.3.0968.0968.0951.0951.0934.0934.0918.0918.0901.0901.0885.0885.0869.0869.0853.0853.0838.0838.0823.0823-1.2-1.2.1151.1151.1131.1131.1112.1112.1093.1093.1075.1075.1056.1056.1038.1038.1020.1020.1003.1003.0985.0985-1.1-1.1.1357.1357.1335.1335.1314.1314.1292.1292.1271.1271.1251.1251.1230.1230.1210.1210.1190.1190.1170.1170-1.0-1.0.1587.1587.1562.1562.1539.1539.1515.1515.1492.1492.1469.1469.1446.1446.1423.1423.1401.1401.1379.1379-0.9-0.9.1841.1841.1814.1814.1788.1788.1762.1762.1736.1736.1711.1711.1685.1685.1660.1660.1635.1635.1611.1611-0.8-0.8.2119.2119.2090.2090.2061.2061.2033.2033.2005.2005.1977.1977.1949.1949.1922.1922.1894.1894.1867.1867-0.7-0.7.2420.2420.2339.2339.2358.2358.2327.2327.2296.2296.2266.2266.2236.2236.2206.2206.2177.2177.2148.2148-0.6-0.6.2743.2743.2709.2709.2676.2676.3643.3643.2611.2611.2578.2578.2546.2546.2514.2514.2483.2483.2451.2451-0.5-0.5.3085.3085.3050.3050.3015.3015.2981.2981.2946.2946.2912.2912.2877.2877.2843.2843.2810.2810.2776.2776-0.4-0.4.3446.3446.3409.3409.3372.3372.3336.3336.3300.3300.3264.3264.3228.3228.3192.3192.3156.3156.3121.3121-0.3-0.3.3821.3821.3783.3783.3745.3745.3707.3707.3669.3669.3632.3632.3594.3594.3557.3557.3520.3520.3483.3483-0.2-0.2.4207.4207
展开阅读全文