资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第三篇 医学统计学方法,Statistical Methods in Medicine,1,第九章数值变量资料的统计分析,第一节 数值型资料的统计描述,第二节 正态分布和参考值范围的估计第三节 数值型资料的统计推断,第四节,t,检验和,u,检验,第五节 方差分析,2,terminology,statistical description,统计描述,statistical inference,统计推断,parameter estimation,参数估计,Frequency distribution,频数分布,frequency table,频数表,arithmetic Mean,average,算术平均值,standard deviation,标准差,variance,方差,range,极差,全距,范围,geometric mean,几何平均值,median,中位数,normal distribution,正态分布,reference range,参考值范围,3,统计分析包括,统计描述,和,统计推断,两大部分。,统计描述(,statistical description),是用统计指标、统计表和统计图描述资料的分析规律及其数量特征;,统计推断(,statistical inference),包括总体参数估计和假设检验两个内容。,参数估计:,是用样本统计量估计总体参数所在范围。,假设检验:,是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否成立。,4,第一节 数值型变量资料的统计描述,例9.12002年某市150名2029岁正常男子的尿酸浓度(,mol/L,),,资料见表9-1,。,如何进行统计描述?,5,362.6,359.7,285.9,300.2,333.6,334.0,288.8,338.5,341.9,344.6,3375,298.3,364.2,367.1,338.1,316.9,332.7,324.0,282.6,369.8,398.7,338.7,308.9,392.1,368.7,352.6,378.2,346.1,278.6,318.3,323.2,322.6,382.1,322.6,309.6,352.0,372.5,399.8,335.6,341.1,371.0,355.9,362.7,368.1,332.4,405.6,328.8,358.8,405.9,362.7,316.3,338.7,402.6,379.4,329.6,354.6,331.4,349.6,419.5,324.6,329.8,357.8,312.0,313.6,338.7,328.6,291.3,329.7,361.8,392.4,414.9,319.7,327.6,395.8,358.9,289.4,366.2,387.4,298.4,408.7,389.8,362.5,354.9,352.7,316.6,348.9,348.7,401.6,334.6,308.9,367.0,345.6,401.6,357.1,304.6,338.5,388.2,355.8,329.4,321.1,320.4,313.5,339.8,409.4,387.4,378.5,392.0,352.7,376.2,388.4,344.6,308.6,347.0,428.7,369.1,311.4,376.3,349.4,289.2,366.8,371.0,387.5,413.6,348.7,392.7,401.0,313.6,366.8,387.2,319.7,329.4,357.5,348.5,346.8,406.6,357.6,338.7,341.6,349.8,289.4,366.2,357.5,298.4,336.8,387.5,342.3,366.7,387.6,332.7,324.0,表9-12002年某市150名2029岁正常男子的尿酸浓度(,mol/L,),6,统计描述的内容:,一、制频数(分布)表(表9-2)和频数分布图(图9-1),频数表的用途,(1)揭示资料的分布特征和分布类型,(2)便于发现某些特大或特小的可疑值,(3)便于进一步计算,统计,指标和统计分析处理,二、计算统计指标,(1)计算平均值代表一组资料的平均水平;,(2)计算标准差-反映资料的离散程度。,三、绘制统计表和统计图,7,一、编制频数分布表:制表步骤:,(1),求,极差,或全距,(,range):R=,X,max,X,min,本例,,R=428.7278.6150.1(,mol/L)。,(2),决定组数、组段数和划分组距(,class interval):,根据样本含量的多少确定组数,一般设815组。,组段数=取整(极差/组数)。,本例:组段数=取整,(150.1/10)=,15.01,15,划分组距:每组段的起点和终点分别称为,下界,和,上界,。,组距:本组内,的,上界和下界,之差。,组段的划分,270,285,300,315,330,345,360,375,390,405,420435,1,2,3,4,5,6,7,8,9,10,11,8,(3)列频数表:按上述组段序列制成表的形式,采用划记法或计算机将原始数据汇总,得出各组段中所包含的观察例数,即为频数,如表9-2的第(2)栏。将各组段及其相应的频数列成表格,即为频数表(,frequency table),,如,表9-2,。所绘的图形见图9-1。,表9-22002年某市150名2029岁正常男子的尿酸浓度的频数分布,尿酸浓度(,mol/L,),频数,频率(%),270,2,1.33,285,9,6.00,300,11,7.33,315,22,14.67,330,24,16.00,345,27,18.00,360,20,13.33,375,15,10.00,390,11,7.33,405,8,5.33,420435,1,0.67,合计,150,100.00,9,资料的分布类型:,对称分布或正态分布;,2.偏态分布:高峰在左侧或右侧;,3.不规则分布:分布很散,无明显高峰,10,二、计算平均值代表平均资料的平均水平,1.平均值的种类:,(一)算术均,值,(,arithmetic mean,average):,常用,表示样本均,值,,希腊字母,表示总体均,值,。适用于对称分布的数值型变量资料,。,其计算方法有:,直接法:,i,(I=1,2,n),为第,i,个观察对象的观察值,加权法:,i,为第,i,组的组中值,f,i,为第,i,组的例数:,11,表9-2分组资料加权法计算平均值及标准差用表,尿酸浓度(,mol/L,),组,中值(,x,i,),频数(,f,i,),f,i,x,i,f,i,x,i,2,270,277.5,2,555.0,154012.5,285,292.5,9,2632.5,770006.3,300,307.5,11,3382.5,1040119.0,315,322.5,22,7095.0,2288138.0,330,337.5,24,8100.0,2733750.0,345,352.5,27,9517.5,3354919.0,360,367.5,20,7350.0,2701125.0,375,382.5,15,5737.5,2194594.0,390,397.5,11,4372.5,1738069.0,405,412.5,8,3300.0,1361250.0,420435,427.5,1,427.5,182756.3,合计,150,52470.0,18518738.0,12,(二)几何均,值,(,geometric mean,G),适用条件:等比级数资料.原始观察值呈偏态分布、但数据经过对数变换后呈正态分布或近似正态分布的资料。如医学实践中某些疾病的潜伏期、抗体滴度、平均效价等。其计算方法有:,直接法:,i,为第,i,个观察对象的观察值,加权法:,i,为第,i,组的组中值(或观察值),f,i,为第,i,组例数:,13,抗体滴度(,i,),人数,f,i,滴度倒数,X,i,lg,10,(,X,i,),f,i,lg,10,(,X,i,),(1),(2),(3),(4),(5)=(2)(4),1:,2.5,3,2.5,0.,3979,1.,1937,1:,5.0,7,5.0,0.6990,4.8930,1:,10.0,14,10.0,1.0000,14.0000,1:,20.0,6,20.0,1.,3010,7.8062,1:,40.0,4,40.0,1.6021,6.4084,合计,34,34.3013,表,9-4,某地34名儿童接种麻疹疫苗后血清血凝抑制抗体滴度,血清血凝抑制抗体的几何平均滴度为1:10.206。,X=(2.53+5.0 7+10.014+20.0 6+40.0 4)/34=13.6,(,算术平均滴度为1:13.6),14,(三)中位数,(,median,M):,将观察值按大小排序后,位次居中的观察值。,M=X,(P=50%),在全部观察值中小于,M,的观察值个数与大于,M,的观察值个数相等。由于,M,不受个别特小或特大观察值的影响,适用于分布不规则或分散度很高的资料.,3,个观察值:1,3,5.,M=3;4,个观察值:1,3,5,7.,M=4.,直接法:设,n,为观察值的个数,有公式,(9-5)及(9-6),频数表法:,i,为第,i,组的组中值(或观察值),f,i,为第,i,组例数:,L,:,中位数组段下限值,f,L,:,小于,L,的,累计频数,i,:,中位数组距.,15,尿铅值,(,mmol,/L),人数,f,累计频数,f,累计频率,(%),(1),(2),(3),(4)=(3)n,0,27,27,8.77,25,54,81,26.30,50,95,176,57.14,75,55,231,75.00,100,39,270,87.66,125,21,291,94.48,150,12,303,98.38,175,5,308,100.00,合计,308,表,9-5 308名6岁以下儿童尿铅值的频数分布(中位数计算),L,:,中位数组段下限值,f,L,:,小于,L,的累计频数,i,:,中位数组距,f,50%,:,中位数组频数.,L=50,f,L,=81,i=25,f,50%,=95,16,三、计算标准差-反映资料的离散程度。,数值变量数据的频数分布有集中趋势和离散程度两个主要特征,只有两者相结合,才能全面地认识事物。,反映资料的离散程度的统计量(统计指标,),有:,(一)全距(,range),或极差:,R=,X,max,X,min,全距是一组观察值中最大值与最小值之差。,(二)四分位数间距(,quartile interval):,Q=X,75%,X,25%,Q,包括了全部观察值中间的一半.,(三)方差(,variance),和标准差(,standard deviation),17,例有,3,组同龄男孩的体重,(),测量值如下,其平均体重都是30,(),,,试分析其离散程度。,分组,观察值(),全距,R,Q,S,甲组,26,28,30,32,34,30,8,4,3.16,乙组,24,27,30,33,36,30,12,6,4.74,丙组,26,29,30,31,34,30,8,2,2.92,丙,组,*,*,*,*,*,乙,组,*,*,*,*,*,甲,组,*,*,*,*,*,体重,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,(),18,标准差的简化计算方法:,数学上可证明:,故标准差的计算公式又可写成:,直接法:,X,为观察值 加权法:,X,i,为组中值,表9-3,尿酸浓度(,mol/L,),分组资料加权法计算平均数及标准差用表,n=,f,i,=150,(,f,i,x,i,)=,52470.0,(,f,i,x,i,2,)=185187
展开阅读全文