武汉大学医学统计学串讲讲义演示文档

资源描述

.,医学统计学武汉大学,.,第一部分绪论,.,一、什么是统计学? Whats statistics?,是一门关于收集、整理和分析（统计）数据的科学。医学统计学是统计学方法在医学中的运用。医学研究中观测结果多为随机事件，通过统计学方法可以揭示其内在规律。,.,（1）设计： design（2）收集资料 collection of data （3）整理资料 sorting data （4）分析资料 analysis of data,二、统计工作的基本步骤,1）专业设计2）统计设计,1）统计报表2）医疗卫生工作记录3）专题调查和实验,1）对数据检查、核对2）按分析要求分组、汇总,1）统计描述 2）统计推断,.,用定量方法测定得到，有大小之分，有度量衡单位。,三、统计资料类型,（一）计量资料 measurement data,.,将观察单位按属性或类型分组计数所得的资料。分为：1、二项分类资料； 2、多项分类资料。,（二）计数资料 enumeration count data,.,.,（三）等级资料 ranked ordinal data,将观察单位按某属性不同程度分组计数所得的资料。,.,例：测得一群人Hb值（g/dL），此资料为计量资料；按正常和异常分为两组，此时资料为计数资料；按量的多少分为: 16 (Hb增高)。此时资料为等级资料。,资料间的相互转化,.,四、统计学的基本概念,（一）同质与变异,同质（homogeneity）指各观察指标受相同因素影响的部分。,变异（variation) 在同质的基础上个体间的差异。,.,例某地某年用随机抽样方法检查了140名健康成年男子的红细胞数（1012/L），检测结果如下表：,观察指标的同质部分：“某地某年健康成年男子”观察指标的变异部分：各个体间红细胞数间的差异,.,医学统计学的基本概念,（二）总体与样本（population & sample),总体：是根据研究目的所确定的同质观察单位（某种变量值）的全体。 1）有限总体（有时间、空间限制）例研究2008年温州市肝癌死亡率。 2）无限总体例研究某药对高血压病的疗效。样本：从总体中随机抽取一部分个体所组成的集合。,.,医学统计学的基本概念,（三）随机抽样,1.单纯随机抽样2.系统（机械）随机抽样3.整群随机抽样4.分层随机抽样,从总体中随机抽取部分个体的过程。（总体中每一个观察单位均有同等的机会被抽取到）随机抽样是样本客观反映总体情况的前提。随机抽样方法：,.,单纯随机抽样,即先将调查总体的全部观察单位编号，再随机抽取部分观察单位组成样本。,例：欲了解某单位职工HBsAg阳性率，该单位有职工1000人，试按单纯随机抽样法，抽取一例数为100的样本。,.,系统随机抽样,又称等距抽样或机械抽样，即先将总体的观察单位按某一顺序号等分成n个部分，再从第一部分随机抽第k号观察单位，依次用相等间隔，机械地从每一部分各抽一个观察单位组成样本。,例：欲了解某单位职工HBsAg阳性率，该单位有职工1000人，试按系统抽样法，抽取一例数为100的样本。,.,整群随机抽样,先将总体划分为n个群，每个群包括若干观察单位，再随机抽取k个群，并将被抽取的各个群的全部观察单位组成样本。,例：某校有80个班级，各班学生50人，现用锡克氏试验调查该校学生白喉易感率，随机抽查了8个班的全部学生。,.,分层随机抽样,按有关影响因素把观察对象分成若干层次，然后将同一层次的观察对象进行随机抽取。,例：欲了解某地人群HBsAg阳性率情况，按年龄段、职业、性别等因素分层后进行抽样。,.,医学统计学的基本概念,（四）误差主要有：粗差、系统误差、随机误差（如测量误差、抽样误差等）,问题：某中医师对某方剂进行改良，改良后的方剂治疗某病患者30例，有效率为80%，原方剂治疗30例，有效率为60%，问两者有效率有无差别？,抽样误差：抽样引起的总体参数与样本统计量之间sampling error 的差别。,.,医学统计学的基本概念,（五）参数与统计量 (parameter & statistic) 参数：统计量：检验统计量：,总体的特征量，如总体均数、总体标准差等。样本的统计指标如样本均数、标准差等。用于统计检验的样本指标。如 t、u、x2、F 等,.,均表示某事件发生可能性大小的量。,（六）频率和概率,但：频率为变量，fn(A) =m/n 概率P(A)为常数。若n足够大， fn(A) P(A),小概率事件 P(A) 0.05“小概率事件一次是不太可能发生的”,医学统计学的基本概念,第二部分计量资料的统计描述,.,第一节计量资料的统计描述,一、计量资料的频数表二、集中趋势的描述三、离散程度的描述,.,1、频数表的编制2、频数分布的特征3、频数分布的类型4、频数表的用途,一、计量资料的频数表,.,例某地用随机抽样方法检查了140名成年男子的红细胞数，检测结果如下表：,.,(1)求全距或极差(R),(2)定组段和组距(i),1. 频数表的编制,.,(3)列出频数表,某地140名正常男子红细胞数的频数表,.,2. 频数分布的特征,(1)集中趋势(2)离散趋势,.,(1)对称分布其中一种常见的类型为正态分布.(2)偏态分布有正偏态、负偏态之分.,3. 频数分布的类型,.,4. 频数表的用途(1)了解资料的分布类型.(2)发现异常值.(3)在频数表的基础上计算有关指标。,.,1、算术均数，X2、几何均数 G3、中位数 M,二、集中趋势的描述,.,概念: 数值的平均.计算: 1)直接法:,例2.1 求某地140名正常成年男子红细胞数均值为,1. 均数（mean) ，X,2)加权法:,应用: 对称分布，尤其是正态分布.,.,概念：指一组数据的倍数平均。计算：(1)直接法：,2. 几何均数 ( geometric mean, G ),.,例：5份血清的抗体效价为1：10，1：100，1：1000，1：10000，1：100000，求其平均效价。,或者： 1：10，1：100，1：1000，1：10000，1：100000的指数部分为：-1，-2，-3，-4，-5，其平均值为-3，故G =10-3=1：1000,.,（2）加权法：,.,何谓对数正态分布？某资料由变量值 X1，X2， Xn组成，已知其分布呈偏态。若每个变量值取对数，如Y1=lgX1，Y2=lgX2， Yn=lgXn，且Y1，Y2， Yn呈正态分布。此时，,将对数值还原为原始数值，则：,应用: (1)变量值呈倍数关系 (2)对数正态分布,.,3. 中位数 M,概念：是一组由小到大按顺序排列的观察值中位次居中的数值。计算：(1)直接法: n为奇数时,n为偶数时,某病患者9人发病潜伏期为2,3,3,3,4,5,6,9,16天, 求中位数。若在第20天又发现1例患者，则其中位数为：,3. 中位数 (median M),.,利用百分位数计算公式进行计算. 百分位数(PX)是一种位置指标, 。中位数是一个特定的百分位数，即M= P50 。,(2)频数表法：,.,百分位数计算公式：,.,百分位数计算公式：,M,.,M,.,.,.,.,应用：（1）偏态分布资料；（2）资料分布一端或两端有未确定值。,.,.,三、离散程度的描述,例：三组同性别、同年龄儿童的体重（Kg）如下，分析其集中趋势与离散趋势。甲组：26 28 30 32 34 均数：X=30 Kg 乙组：24 27 30 33 36 均数：X=30 Kg 丙组：26 29 30 31 34 均数：X=30 Kg,三、离散趋势的描述,.,描述离散程度的常用指标,1、全距（极差）（R）2、四分位数间距（QR）3、方差（2 S2）和标准差（、S）4、变异系数（CV）,.,反映一组同质观察值个体差异的范围。 R甲=8； R乙=12； R丙=8。缺点（1）不能反映组内其它观察值的变异度。（2）样本含量越大，则全距可能也越大。,1. 全距（极差）,.,即P75P25 四分位数可看作是一组同质观察值居中的50%变量值的变异范围。,2. 四分位数间距（quartile range, QR）,.,不受极值影响，较稳定。,与全距比较有何优点？,应用：（1）偏态分布；（2）资料一端或两端有未确定值。,.,.,变量值的离散程度可看作是各个变量值距离中心点（均数）的远近问题。用算式表示： x 但： x=0 则求： x2 （离均差平方和） x2 大小与变异度有关外，还与变量值个数（N）有关。故：,3. 方差（2 S2）和标准差（、S）(variance & standard deviation),.,为了用原单位表示，开方即：,标准差或方差越大，说明个体差异越大，则均数的代表性越差。,.,实际工作中经常得到的是样本资料，总体均数是不知道的，只能用样本均数来估计总体均数，这样：用 xx2 代替 x2 n 代替 N 但这样算得结果常比真实低。,因此，统计学家提出用 n - 1 来校正。,.,即：样本标准差（S）,S2 称为样本方差,.,式中n-1称为自由度，用希腊字母 (ju:psilen)表示。自由度的概念：是指随机变量能自由取值的个数。例：X+Y+Z=10 = 2 又例：,当样本均数一定时，随机变量可以自由取值的变量值个数只能是n - 1 个。,.,计算： 1）不分组资料：,例：三组同性别、同年龄儿童的体重（Kg）如下，分析其集中趋势与离散趋势。甲组：26 28 30 32 34 均数：X=30 Kg 乙组：24 27 30 33 36 均数：X=30 Kg 丙组：26 29 30 31 34 均数：X=30 Kg,计算得：S甲=3.16，S乙=4.74，S丙=2.92,.,2）分组资料：,计算得：S = 0.38（1012/ L）,.,应用: 对称分布，尤其是正态分布,.,应用:（1）比较单位不同的几组资料的变异程度（2）比较均数相差悬殊的几组资料的变异程度,4. 变异系数（CV）,.,例2.9 某地调查110名18岁男大学生，其身高均数为172.73cm，标准差为4.09cm；其体重均数为55.04kg，标准差为4.10kg，试比较两者变异度。,某卫生防疫站对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下,试计算其平均滴度抗体滴度 1:8 1:16 1:32 1:64 1:128 1:256 1:512 例数 2 6 5 10 4 2 1,.,某市1974年为了解该地居民发汞的基础水平, 为汞污染的环境监测积累资料, 调查了留住该市一年以上, 无明显肝、肾疾病，无汞作业接触史的居民238 人的发汞含量如下:,用何种指标说明本资料的集中位置和变异程度较好？并计算之；,.,某检验师测定了10名正常成年钢铁工人的血红蛋白值(g/dl)和红细胞数(万/mm3)如下,试比较这两个检测项目的结果哪个变异性大?,血红蛋白(g/dL) 13.0 13.6 14.0 14.5 14.6 14.7 15.2 15.5 15.8 16.0血细胞数(万/mm3) 510 515 517 518 520 522 524 525 528 530,.,第二部分数值变量的描述性统计,统计图表；统计指标。,.,第一节频数分布一. 编制频数表的步骤,求极差R=84-57cm=27（次/分）划分组段确定组数：较大样本时，一般取10组左右。确定组距：极差/组数=27/10=2.73（次/分）确定各组段的上下限：上限=下限+组距统计各组段内的数据频数，编制频数表,.,表2.1 130名健康成年男子脉搏（次/分）的频数分布表,脉搏组段（1）,频数（2）,频率（%）（3）,累计频数（4）,累计频率（%）（5）,5659626568717477808385合计,25121525261915101130,1.543.859.2311.5419.2320.0014.6211.547.690.77,2719345985104119129130,1.545.3814.6226.1545.3865.3880.0091.5499.23100.00,.,二. 频数表的用途,可以揭示资料的分布类型和分布特征，以便于选用相应的统计分析方法。便于进一步计算指标和统计处理。便于发现某些特大或特小的可疑值。,.,第二节集中趋势的描述,三种平均数算术均数几何均数中位数。,.,（一）算术均数（x）,简称均数，适合于表达呈正态分布资料的平均水平。直接法： X=,X1+Xn,n,=,X,n,例2-2：X,=,81+70+66+69,13,=71.69（次/分）,.,加权法X=,fX,f,例： X=,572+605+6312+84 1,130,=71.12（次/分）,.,（二）几何均数（G）,适用于原始数据分布不对称，但经对数转换后呈对称分布的资料。G= n X1X2XnG=lg-1（）,lgX,n,G=lg-1（）,f lgX,f,.,例：40名麻疹易感儿童接种麻疹疫苗后一个月，测其血凝抑制抗体滴度，结果如表所示，求几何均数。,抗体滴度,人数 f,滴度倒数 X,lgX,1：41：81：161：321：641：1281：2561：512,145811641,48163264128256512,0.60210.90311.20411.50511.80612.10722.40822.7093,G=lg-1（,f lgX,n,）=lg-1（1 0.6021+4 0.9031+ +1 2.7093）,40,.,=lg-1（,40,67.1282,）,=48,G=1：48,.,（三）中位数（M）,适合于表达偏态资料、或分布不明的资料的平均水平，尤其适合于表达只知数据的个数、但部分较大或较小数据的具体数值未准确知道的资料的平均水平。,.,对于原始数据和频数分布表资料，分别用下列两式计算中位数。,M=,（X n/2+X（n/2+1））/2,（n为偶数）,X（n+1）/2,（n为奇数）,M = LM +,iM,fM,（,n,2,fL ）,其中， LM ：中位数所在组下限； iM ：中位数所在组的组距； fM ：中位数所在组的频数； fL ：中位数所在组前一组的累计频数。,.,例2-4 表2.3 107正常人的尿铅含量（g/L）的中位数计算表,含量（ g/L ）（1）,频数f（2）,累计频数 f （3）,累计频率 % （4）,0481216202428合计,1422291815612107,1436658398104105107,13.0833.6460.7577.5791.5997.2098.13100.00,M=8+ (107/2 - 36) = 10.41(g/L),4,29,.,第三节离散程度的描述,例：设有三组同年龄、同性别儿童体重（kg）数据如下：甲组 26 28 30 32 34乙组 24 27 30 33 36丙组 26 29 30 31 34,.,描述离散程度的指标：极差、四分位数间距、方差、标准差、变异系数。,.,一. 极差（全距，R）,为一组同质观察值中最大值与最小值之差。甲组 R=34-26=8乙组 R=36-24=12甲组数据分布较乙组集中。,.,优点：计算简单缺点：1.没有充分利用样本信息，只考虑最大值与最小值之差异，不能反映组内其它观察值的变异度。2.样本含量越大，抽到较大或较小观察值的可能性越大，则极差可能越大，因此，样本含量悬殊时不宜用极差比较分布的离散度。所以，一般不用极差来反映离散程度。,.,二. 四分位数间距（Q）1.分位数的概念分位数是一种位置指标，一个特定的分位数将任何一个频数曲线下的面积分为两部分。第1四分位数记作Q1，第2、第3四分位数，分别记作Q2、Q3；第1百分位数，记作P1。同理，还有第2、第3、、第99百分位数，分别记作P2、P3、、P99。显然，Q1=P25、Q2=P50=M、Q3=P75,.,2.百分位数的计算公式对连续型变量频数表资料，按下式计算第X百分位数PX：PX=LX+,iX,fX,（nX%,fL ）,其中， LX ：第X百分位数所在组下限； iX ：第X百分位数所在组的组距； fX ：第X百分位数所在组的频数； fL ：第X百分位数所在组前一组的累计频数。,.,例某地200例正常成人血铅含量的频数分布如表所示，请计算出血铅含量的95%正常值范围。200例正常成人血铅含量的频数分布表,血铅含量频数累计频数（mol/L）（1）（2）,00.240.480.720.971.211.451.691.932.172.422.662.903.14,6484336281314441201,65497133161174188192196197199199200,解：即求P95。nX%=20095%=190P95 =1.69+ （190-188）,0.24,4,=1.81 （mol/L）,故某地正常人血铅含量95%的单侧正常值范围的上限为 1.81 （mol/L）。,.,3.四分位数间距（Q）Q=P75-P25Q=QU-QL优缺点：用四分位数间距作为描述数据分布离散程度的指标，比极差稳定，但仍未考虑到每个数据的大小，常用于描述偏态频数分布以及分布的一端或两端无确切数值资料的离散程度。,.,2=,（X-）2,N,S2=,（X-X）2,n - 1,n - 1称为自由度,三.方差,., =,（X-）2,N,S=,（X-X）2,n - 1,直接法； s=,X2-（ X）2/n,由于（X-X）2 =X2-（ X）2/n，所以,n - 1,加权法： s= fX2-（ fX）2/f,f - 1,四.标准差,.,五. 变异系数（CV）,CV=,S,X,100%,1.用于比较度量衡单位不同的多组资料的变异度。2.比较均数相差悬殊的多组资料的变异度。,.,一. 正态分布的概念和特征,正态分布的图形：正态分布的密度函数：f（X）=,1, 2,e,-（X-）2,2 2,-X+ ,通常用N（， 2）表示均数为、方差为2的正态分布。,第四节正态分布,.,正态分布的特征,1.正态曲线在横轴上方均数处最高；2.正态分布以均数为中心，左右对称；3.正态分布有两个参数，即均数与标准差。是位置参数，当固定不变时，越大，曲线沿横轴越向右移动；越小，曲线沿横轴越向左移动。是变异度参数，当固定不变时，越大，曲线越矮平；越小，曲线越尖峭。4.正态曲线下的面积分布有一定的规律。,.,常用的两个区间： 1.96 及2.58 的区间面积分别占总面积（或总观察例数）的95%及99%，如下图所示：,95%,2.5%,2.5%,-1.96 ,+1.96 ,99%,-2.58 ,+2.58 ,0.5%,0.5%,.,二. 标准正态分布,令 u=,X- ,（u）=,1,2,e,-,u2,2,- u+ ,用N（0，1）表示标准正态分布,.,三. 正态分布的应用,制定医学参考值范围许多统计方法的理论基础,.,参考值范围的制定,正态分布法百分位数法,%909599,双侧X1.64SX1.96SX2.58S,单只有下限X-1.28SX-1.64SX-2.33S,侧只有上限X+1.28SX+1.64SX+2.33S,双侧P5P95P2.5P97.5P0.5P99.5,单只有下限P10P5P1,侧只有下限 P90 P95 P99,.,补充题以下是101名30-49岁正常成年男子的血清总胆固醇（mmol/L）测定值的频数表，请据此资料：（1）选择适当的集中趋势指标并计算之；（2）选择适当的离散程度指标并计算之；（3）求该地30-49岁健康男子血清总胆固醇的正常值范围；（4）估计该地30-49岁健康男子血清总胆固醇值小于4.50 mmol/L的概率。,血清总胆固醇2.53.03.54.04.55.05.56.06.57.07.5合计,频数f1892325179621101,fx2.752633.7597.75118.7589.2551.7537.513.57.25478.25,fx27.5684.50126.56415.44564.06468.56297.56234.3891.1352.562342.31,.,3.抽样误差和 t 分布,Sampling error and t distribution,.,抽样误差的概念,由抽样引起的样本统计量与总体参数间的差异两种表现形式样本统计量与总体参数间的差异样本统计量间的差异,.,抽样研究个体变异,抽样误差产生的条件,.,均数的抽样误差及标准误,表现一：样本均数与总体均数之差值表现二：多个样本均数间的离散度,.,中心极限定理(central limit theorem),从均数为、标准差为的总体中独立随机抽样，当样本含量n增加时，样本均数的分布将趋于正态分布，此分布的均数为，标准差为,.,标准误(standard error，SE),样本统计量的标准差称为标准误，用来衡量抽样误差的大小。样本均数的标准差称为标准误。此标准误与个体变异成正比，与样本含量n的平方根成反比。,.,实际工作中，往往是未知的，一般可用样本标准差s代替：因为标准差s随样本含量的增加而趋于稳定，故增加样本含量可以降低抽样误差。,.,中心极限定理表明，即使从非正态总体中随机抽样，只要样本含量足够大，样本均数的分布也趋于正态分布，见图3.1 。,.,四个非正态分布的总体抽样结果（A偏三角分布、B均匀分布、C指数分布、D双峰分布）,.,图3.1描述了来自不同总体的样本均数之抽样误差和抽样分布规律。事实上，任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论基础。,.,标准差与标准误的联系和区别,联系都是变异指标。S反映个体观察值的变异；反映统计量的变异。当n不变时，标准差，标准误,.,.,t分布,设从正态分布N(, )中随机抽取含量为n的样本，样本均数和标准差分别为和s，设：则t值服从自由度为n-1的t分布(t-distribution)。Gosset于1908年在生物统计杂志上发表该论文时用的是笔名“Student”，故t分布又称Student t分布。,.,图3.2 自由度分别为1、5、时的t分布,.,t分布的特征,t分布为一簇单峰分布曲线t分布以0为中心，左右对称t分布与自由度有关，自由度越小，t分布的峰越低，而两侧尾部翘得越高，；自由度逐渐增大时，t分布逐渐逼近标准正态分布；当自由度为无穷大时，t分布就是标准正态分布。,.,t分布的特征,每一自由度下的t分布曲线都有其自身分布规律t分布表明，从正态分布总体中随机抽取的样本，由样本计算的t值接近0的可能性较大，远离0的可能性较小。t0.05,102.228，表明，从正态分布总体中抽取样本含量为n=11的样本，则由该样本计算的t值大于等于2.228的概率为0.025，小于等于-2.228的概率亦为0.025。 P(t-2.228)+P(t2.228)0.05 或：P(-2.228t100，故可以用标准正态分布代替t分布，u0.10=1.64 即该地12岁男孩平均身高的90可信区间为：141.77143.57(cm)，可认为该地12岁男孩平均身高在141.77143.57(cm)之间。,.,.,两均数之差的区间估计,设两样本之样本含量、均数和方差分别为：n1,n2，,和s12, s22，根据数理统计结果：,服从自由度为=n1+n2-2的t分布。,.,例4.3 某医生研究转铁蛋白对病毒性肝炎诊断的临床意义，测得12名正常人和15名病毒性肝炎患者血清转铁蛋白含量，结果如下，试估计正常人和患者的转铁蛋白含量均数之差的95可信区间。,.,根据资料算得：,s12=10.382s22=14.392,自由度为=n1+n2-2=12+15-2=25、0.05的t界值为：t0.05,25=2.060,(271.8917235.2067 ) 2.060 4.95 = 26.48 46.88,两组均数之差的95可信区间为：,可以认为病毒性肝炎患者的血清转铁蛋白含量较正常人平均低36.68，其95CI为26.4846.88。,.,率的可信区间,与均数一样，率也存在抽样误差 ,率的标准差又称率的标准误为：,率的抽样误差,.,率的分布,当总体率0.5时为正偏态，当0.5时为负偏态，当=0.5时为对称分布。只有当n较大、率和(1-)都不太小时，例如n和n(1-)均大于5时，率的抽样分布近似于正态分布。,.,总体率的区间估计,正态近似法查表法,.,正态近似法,条件: 样本例数n足够大，且样本率p和(1-p)都不太小时，即np和n(1-p)均大于5时，样本率p 的抽样分布近似正态分布,( , ),总体率的可信区间：,.,例从某地人群中随机抽取144人，检查乙型肝炎表面抗原携带状况，阳性率为9.20，求该地人群的乙型肝炎表面抗原阳性率的95可信区间。,n =144，p=9.20,95可信限为：9.20%1.962.41%即该地人群的乙型肝炎表面抗原阳性率的95可信区间为：4.48%13.92%。,.,查表法,例4.5 有人调查29名非吸毒妇女，出狱时有1名HIV(人免疫缺陷病毒)阳性，求阳性率95可信区间?,直接查附表6.2,在行n=29, 列x=1交叉处0.117.8即为阳性率95可信区间,.,正确理解可信区间的涵义(一),可信区间一旦形成，它要么包含总体参数，要么不包含总体参数，二者必居其一，无概率可言。所谓95的可信度是针对可信区间的构建方法而言的。以均数的可信区间为例，其涵义是：如果重复100次抽样，每次样本含量均为n，每个样本均按构建可信区间，则在此100个可信区间内，理论上有95个包含总体均数，而有5个不包含总体均数。,.,正确理解可信区间的涵义(二),在区间估计中，总体参数虽未知，但却是固定的值（且只有一个），而不是随机变量值。,.,图4.1 100个来自N(0,1)的样本所估计的可信区间示意,.,可信区间与参考值范围的区别,可信区间用于估计总体参数，总体参数只有一个。参考值范围用于估计变量值的分布范围，变量值可能很多甚至无限。95%的可信区间中的95%是可信度，即所求可信区间包含总体参数的可信程度为95%95%的参考值范围中的95%是一个比例，即所求参考值范围包含了95%的正常人。,.,第五部分假设检验,第一节假设检验的意义第二节假设检验的思路第三节假设检验的步骤第四节假设检验的正确应用第五节假设检验的几个相关问题,.,总体是100例正常成年男子的血红蛋白(单位：g/L)，从中随机抽取样本a1 和样本 a2 ；总体B是另外100例正常成年男子的红细胞数，从中随机抽取样本b ；三个样本的含量均为10例，有关数值如下：,.,在知道A和B总体的参数时,a1-a2,a1-b1,.,假如事先不知道A和B是不是同一个总体,a1-b1,？,.,例6.1 测得25例某病女性患者的血红蛋白(Hb)，其均数为150(g/L)，标准差为16.5(g/L)。而该地正常成年女性的Hb均数为132(g/L)。问该病女性患者的Hb含量是否与正常女性Hb含量不同？,.,？,目的：推断病人的平均血红蛋白(未知总体均数)与正常女性的平均血红蛋白(已知总体均数0)间有无差别 = 0,.,手头样本对应的未知总体均数等于已知总体均数0除抽样误差外，,已知:,，差别仅仅是由于抽样误差所致；,病人与正常人存在本质上的差异,.,一、假设检验的意义,分辨一个样本是否属于某特定总体分辨两个（或两个以上）样本是否分别属于两个不同的总体，并对总体作出适当的结论,.,二、假设检验的基本思想,“反证法”的思想先根据研究目的建立假设，从H0假设出发，先假设它是正确的，再分析样本提供的信息是否与H0有较大矛盾，即是否支持H0，若样本信息不支持H0，便拒绝之并接受H1,否则不拒绝H0 。,.,检验假设(null hypothesis)，记为H0 H0：132，病人与正常人的平均血红蛋白含量相等；备择假设(alternative hypothesis)，记为H1H1：132，病人与正常人的平均血红蛋白含量不等。,（一）建立假设,.,其中H0假设比较单纯、明确，在H0 下若能弄清抽样误差的分布规律，便有规律可循。而H1假设包含的情况比较复杂。因此，我们着重考察样本信息是否支持H0假设（因为单凭一份样本资料不可能去证明哪个假设是正确的，哪一个不正确）。,.,设定检验水准的目的就是确定拒绝假设H0时的最大允许误差。医学研究中一般取=0.05 。检验水准实际上确定了小概率事件的判断标准。,（二）确定检验水准,.,（三）选定检验方法计算检验统计量(计算样本与总体的偏离),统计量t表示，在标准误的尺度下，样本均数与总体均数0的偏离。这种偏离称为标准t离差。,.,根据抽样误差理论，在H0假设前提下，统计量t服从自由度为n-1的t分布，即t值在0的附近的可能性大，远离0的可能性小，离0越远可能性越小。 t值越小，越利于H0假设 t值越大，越不利于H0假设,.,（四）结论(根据小概率原理作出推断),在H0成立的前提下出现现有差别或更大差别的可能性P(| t | 5.4545) 小于0.05，是小概率事件，即现有样本信息不支持H0。抉择的标准为：当P 时，拒绝H0，接受H1 当P 时，不拒绝H0 本例P0.05，按 =0.05的水准，拒绝H0，接受H1，差别有统计学意义。认为该病女性患者的Hb含量高于正常女性的Hb含量。,.,.,-2.064,2.064,0, =24,0.025,0.025,t0.05,24=2.064 P =P ( |t| 2.064 )=0.05,P=P(|t|5.4545)t0.05,24=2.064 P 0.05,.,二、配对设计 t 检验(paired design t-test),配对设计使用条件：当个体间的差异不均匀时，将差异较小的个体配成对子，分别给予不同的处理，以保证两组间的均衡可比性。,.,（一）配对设计的形式,自身配对同一对象接受两种处理，如同一标本用两种方法进行检验，同一患者接受两种处理方法；同一对象处理前后。异体配对将条件相近的实验对象配对，并分别给予两种处理。,.,若两处理因素的效应无差别，差值d的总体均数d应该为0，故可将该检验理解为样本均数与总体均数d =0的比较配对t检验的实质就是检验样本差值的总体均数是否为0。,（二）基本思想,.,例6.2 现用两种测量肺活量的仪器对12名妇女测得最大呼气率(PEER)(L/min)，资料如表6.1，问两种方法的检测结果有无差别?,.,按 = n-1=12-1=11查t值表，得t0.20,11=1.363，t0.10,11=1.796，t0.10,11tt0.20,11，则0.20P0.10，差别无统计学意义，尚不能认为两种仪器检查的结果不同。,H0：d0，两仪器检验结果相同；H1：d0，两仪器检验结果不同。,双侧 =0.05。,已知n=12,差值标准差,.,例6.3 某医生研究脑缺氧对脑组织中生化指标的影响，将乳猪按出生体重配成7对，一组为对照组，一组为脑缺氧模型组。试比较两组猪脑组织钙泵的含量有无差别。,.,H0：d0，即两组乳猪脑组织钙泵含量相等；H1：d0，即对照组乳猪脑组织钙泵含量高于实验组。单侧 =0.05。,按= n-1=7-1=6查t界值表，得单侧t0.05,6=1.943，tt0.05,6，则P0.05，差别有统计学意义，可以认为脑缺氧可造成钙泵含量的降低。,.,（三）两样本均数比较的t检验 (independent samples t-test),有些研究的设计既不能自身配对，也不便异体配对，而只能把独立的两组相互比较。例如手术组与非手术组、新药组与对照组。目的：在于推断两个样本所代表的两总体均数1和2是否相等。,.,.,例6.4 某医生研究转铁蛋白对病毒性肝炎诊断的临床意义，测得12名正常人和15名病毒性肝炎患者血清转铁蛋白含量(g/dl)，结果见例4.3。问患者和正常人转铁蛋白含量是否有差异?,.,H0 ：12，正常人与病毒性肝炎患者的转铁蛋白含量相等；H1 ：12 ，正常人与病毒性肝炎患者的转铁蛋白含量不等。双侧 =0.05,s12=10.382s22=14.392,=n1n22=12152=25,按自由度25查附表2，t界值表得t0.001,25=3.725，tt0.001,25，P0.001，差别有统计学意义，可以认为病毒性肝炎患者的转铁蛋白含量较低。,.,在两个样本均数比较时，若两组样本含量都很大，可用u检验，其计算公式为：,u为标准正态离差，按正态分布界定P值并作出结论。,.,例6.5 某市于1973年和1993抽查部分12岁男童对其发育情况进行评估，其中身高的有关资料如下，试比较这两个年度12岁男童身高均数有无差别。1973 年：n1=120 =139.9cm s1=7.5cm；1993 年：n2=153 =143.7cm s2=6.3cm。,H0 ：12，即该市两个年度12岁男童平均身高相等；H1 ：12，即该市两个年度12岁男童平均身高不等。双侧 =0.05。,P0.01，差别有统计学意义，可认为该市1993年12岁男童平均身高比1973年高。,.,(四)假设检验中需注意的几个问题,1.建立假设 “假设”是对总体特征的表述 H0与H1并非并列，而是以H0为主 H0与H1的表述随资料性质、分析目的和检验方法而定。,.,(四)假设检验中需注意的几个问题,2.验证假设各种检验方法都以统计量的分布为依据检验统计量与H0密切相关：H0条件下产生了检验统计量t的概率分布反证法推理：在H0条件下，抽得现有样本统计量的概率(P)很小，就认为样本数据与H0假设有矛盾，且这种矛盾不能用抽样误差来解释，所以可认为该样本来自H1假设，则接收H1；反之。,.,3.判断水准必须事先确定，一般取0.05。,(四)假设检验中需注意的几个问题,4. 正确理解P值P值是决策的依据P0.05 及其意义：首先P不指H0成立之可能，而是指从H0假设总体中随机抽到差别至少等于现有差别的机会。,.,5. Significant 的本义及假设检验结果的表述 Significant的本义是“有意义的”、“非偶然的”,(四)假设检验中需注意的几个问题,前辈学者曾将Significance译作“显著性”，或Significant译作“显著的”，因而假设检验也习惯上被称作“显著性检验”，已延用至今,.,(四)假设检验中需注意的几个问题,6.第一类错误与第二类错误假设检验结论拒绝H0，接受H1 不拒绝H0 H0真实第一类错误( ) 正确推断(1) H0不真实正确推断(1) 第二类错误()统计学上规定：H0真实时被拒绝为第一类错误(又称型错误，type error)，H0不真实时不拒绝为第二类错误(又称型错误，type error)。,.,第一类错误和第一类错误的关系,.,6.检验的功效,实际应用假设检验时，当P 而拒绝H0接受H1，要注意第一类错误出现；当P 而不拒绝H0，要注意第二类错误的出现。尤其是，第二类错误率表示失去对真实的H1作出肯定结论之概率，故1 就是对真实的H1作出肯定结论之概率，常被用来表达某假设检验方法的检验的功效(power of a test)，国内学者称它为把握度：假设检验对真实的H1作肯定结论之把握程度。 ,.,7.双侧检验与单侧检验,检验假设的写法不同：,.,选用双侧检验与单侧检验：原则上依据资料的性质来选择。若比较甲、乙两种方法孰优，这里含有甲优于乙和乙优于甲两种可能的结果，而且研究者只要求分出优劣，故应选用双侧检验，若甲是从乙改进而得，已知如此改进可能有效，也可能无效，但不可能改进后反不如前，故应选用单侧检验。不要无把握时误用单侧检验，也不可在条件具备时错过正当使用的机会。,.,8. t检验的正确应用,(1)资料的代表性与可比性所谓代表性是指该样本从相应总体中经随机抽样获得，能够代表总体的特征；所谓可比性是指各对比组间除了要比较的主要因素外，其它影响结果的因素应尽可能相同或相近为了保证资料的可比性，必须要有严密的实验设计，保证样本随机抽取于同质总体，这是假设检验得以正确应用的前提。,.,8. t检验的正确应用,(2)应用t检验对两样本均数进行比较时，要求原始数据满足如下三个条件：独立性(independence) 正态性(normality)：方差齐性(homogeneity)：,.,8. t检验的正确应用,(3) t检验与u检验公式查表与n关系计算精度 t 较复杂需无关精确 u 简单否 n较大近似 *思考：同一资料，t 检验有统计学意义，u检验一定有统计学意义？ t检验有统计学意义，u检验不一定有统计学意义？,

展开阅读全文

武汉大学医学统计学串讲讲义演示文档

最新文档