数学总体均数估计和假设检验课件

资源描述

医学统计学医学统计学第四章第四章总体均数估计和假设检验总体均数估计和假设检验主讲：黄志碧主讲：黄志碧重点掌握重点掌握1、抽样误差、标准误、可信区间、假设检验、检、抽样误差、标准误、可信区间、假设检验、检验效能（把握度）、单侧检验、双侧检验、验效能（把握度）、单侧检验、双侧检验、型错型错误与误与型错误的概念。型错误的概念。2、标准差与标准误的区别和联系、标准差与标准误的区别和联系、t分布的特征、分布的特征、t分布和分布和u分布的区别和联系。分布的区别和联系。3、标准误、可信区间的计算方法和应用。、标准误、可信区间的计算方法和应用。4、假设检验的基本步骤，、假设检验的基本步骤，t检验和检验和 u检验的应用及检验的应用及其条件。其条件。5、应用假设检验注意事项。、应用假设检验注意事项。资料的统计分析方法资料的统计分析方法统计描述统计描述(statistical descreptive)：频数表、直方图、平均数指标、离散度指标。说频数表、直方图、平均数指标、离散度指标。说明数据分布特征和分布类型。明数据分布特征和分布类型。统计推断（统计推断（statistical inference)：用样本信息来推断总体的特征（以小窥大）。用样本信息来推断总体的特征（以小窥大）。（1）参数估计（总体均数估计，总体率估计）参数估计（总体均数估计，总体率估计）（2）假设检验）假设检验第一节第一节均数的抽样误差与标准误均数的抽样误差与标准误总体总体样本样本统计推断统计推断抽样抽样抽样误差抽样误差一、均数抽样误差的概念一、均数抽样误差的概念样本样本用样本推断总体用样本推断总体总体均数总体均数标准差样本均数的均数样本均数的均数样本均数的标准差.n=10 在抽样研究中，由于总体中存在个体变在抽样研究中，由于总体中存在个体变异，而样本仅是总体的一部分，所以由抽异，而样本仅是总体的一部分，所以由抽样得到的样本均数与总体均数之间存在差样得到的样本均数与总体均数之间存在差异，这种差异称为异，这种差异称为抽样误差。抽样误差。抽样研究中，抽样误差是不可避免的，抽样研究中，抽样误差是不可避免的，但其大小可以控制和估计的。但其大小可以控制和估计的。均数的抽样误差均数的抽样误差二、中心极限定理二、中心极限定理 1、在在正正态态总总体体中中，随随机机抽抽取取例例数数为为n的的样样本，样本均数本，样本均数服从正态分布；服从正态分布；2、在在偏偏态态总总体体中中随随机机抽抽样样，当当n足足够够大大时时（n30），样本均数），样本均数也近似正态分布；也近似正态分布；3、从均数为、从均数为，标准差为，标准差为的正态或偏态的正态或偏态总体中，抽取例数为总体中，抽取例数为n的样本，样本均数的均的样本，样本均数的均数数仍为仍为，标准差为，标准差为。三、标准误意义及其计算方法三、标准误意义及其计算方法 1、标准误意义、标准误意义：均数的标准差就是标准误，：均数的标准差就是标准误，它说明均数的抽样误差大小。均数的标准误它说明均数的抽样误差大小。均数的标准误用用表示。表示。2、标准误计算方法：、标准误计算方法：.（理论值）（理论值）.（估计值）（估计值）随着随着 n S 稳定 0均数的标准误与标准差成正比，与样本例均数的标准误与标准差成正比，与样本例数数n n的平方根成反比。的平方根成反比。因此，减少抽样误差最有效的办法：因此，减少抽样误差最有效的办法：增加样本增加样本例数例数例例4.1 已知已知n=10,X=4.89,S=0.62,求其求其标准误标准误(第一个样本）。第一个样本）。3、均数标准误的应用、均数标准误的应用（1）反反映映均均数数抽抽样样误误差差大大小小：标标准准误误越越大大，抽抽样误差越大，反之，就越小；样误差越大，反之，就越小；（2）反反映映均均数数的的可可靠靠性性：标标准准误误越越大大，样样本本均均数数的的抽抽样样误误差差就就越越大大，用用样样本本均均数数推推断断总总体体均均数数的的可可靠靠性性差差；反反之之，越越小小，均均数数抽抽样样误误差差越越小，用样本均数推断总体均数的可靠性好。小，用样本均数推断总体均数的可靠性好。（3）用于估计总体均数的可信区间和均数的假）用于估计总体均数的可信区间和均数的假设检验（见下节）设检验（见下节）标准差和标准误的区别和联系标准差和标准误的区别和联系标准差和标准误都是变异指标，它们之间有区标准差和标准误都是变异指标，它们之间有区别，也有联系。别，也有联系。一、区别一、区别:1、概念不同：、概念不同：标准差是描述观察值标准差是描述观察值(个体值个体值)之间之间的变异程度，的变异程度，S 越小，均数的代表性越好；标准误越小，均数的代表性越好；标准误是描述样本均数的抽样误差，是描述样本均数的抽样误差，Sx越小，均数的可靠越小，均数的可靠性越高；性越高；3、与样本含量的关系不同、与样本含量的关系不同:当样本含量当样本含量 n 足够足够大时，标准差趋向稳定；而标准误随大时，标准差趋向稳定；而标准误随n的增大而减的增大而减小，甚至趋于小，甚至趋于0。联系联系:标准差、标准误均为变异指标，当样本含标准差、标准误均为变异指标，当样本含量不变时，标准误与标准差成正比。量不变时，标准误与标准差成正比。2、用途不同：、用途不同：标准差与均数结合估计参考值标准差与均数结合估计参考值范围，计算变异系数，计算标准误等。标准误用范围，计算变异系数，计算标准误等。标准误用于估计参数的可信区间，进行假设检验等。于估计参数的可信区间，进行假设检验等。第第二节二节 t 分分布布(一一)、t 分布的概念分布的概念对正态变量对正态变量X进行标准化变换，即进行标准化变换，即u变换，变换，可以把一般的正态分布变成标准正态分布，可以把一般的正态分布变成标准正态分布，即即u分布，给应用带来很大方便。分布，给应用带来很大方便。u(0,1)样本均数样本均数X也服从正态分布，也可以将进行也服从正态分布，也可以将进行u变换：变换：由于由于往往未知，往往未知，常用常用代替，不再服代替，不再服从标准正态分布，而服从从标准正态分布，而服从t分布。分布。(二二)、t分布特征：分布特征：1、以、以0为中心，左右对称的单峰分布；为中心，左右对称的单峰分布；2、t分布的形态与自由度分布的形态与自由度有关，有关，越小，越小，t分布曲线越低平分布曲线越低平,尾部的面积较大；尾部的面积较大；逐渐增大，逐渐增大，t分布逼近标准正态分布；分布逼近标准正态分布；，t分布标准正态分布。分布标准正态分布。t分布也是一簇曲线，有不同的自由度就有不同分布也是一簇曲线，有不同的自由度就有不同形态的形态的t分布曲线。分布曲线。注注：所所有有的的t t分分布布的的曲曲线线均均比比正正态态曲曲线线低低。说说明明在在同同样样的的曲曲线线下下面面积积，t t值值uu值值。例例如如，中中间间95%95%面面积积，在在横横轴轴上上的的区区间间：|u|=1.96;|u|=1.96;而而|t|1.96|t|1.96 t值的表示方法：值的表示方法：t/2,为为t界值以外界值以外(曲线尾部）的面积；曲线尾部）的面积；为自由为自由度。度。(三三)、t界值表（附表界值表（附表2）对应于每一自由度取值，就有一条对应于每一自由度取值，就有一条 t 分布分布曲线，每条曲线都有自身曲线下曲线，每条曲线都有自身曲线下 t 值的分布值的分布规律，故相同的曲线下面积所对应的规律，故相同的曲线下面积所对应的t界值不界值不同，而计算同，而计算t 值较为繁杂。为此，统计学家已值较为繁杂。为此，统计学家已制成制成 t 值表，通过查表即获得值表，通过查表即获得t分布曲线下面分布曲线下面积所对应的积所对应的 t界界值。值。查表须注意：查表须注意：1、t 值值有有正正负负值值，由由于于t分分布布是是以以0为为中中心心的的对对称称分分布布，故故表表中中只只列列正正值值，查查表表时时，不管不管 t 值正负只用绝对值；值正负只用绝对值；2、t 值表中插图阴影部分，表示值表中插图阴影部分，表示t,以外以外尾部面积占总面积的百分比，尾部面积占总面积的百分比，即概率；即概率；例例 =10=10时：时：单侧单侧 =1.812=1.812 即即 P(t-1.812)=0.05 P(t-1.812)=0.05 或或 P(t1.812)=0.05P(t1.812)=0.05 P(t-1.812)=1-0.05=0.95 P(t-1.812)=1-0.05=0.95 或或P(t 1.812)=1-0.05=0.95P(t-t P(t-t,)=1-)=1-或或 P(ttP(tt,)=1-)=1-双侧双侧 =2.228=2.228 即即 P(t-2.228)+P(t2.228)=0.05P(t-2.228)+P(t2.228)=0.05 P(-2.228t2.228)=1-0.05=0.95P(-2.228t2.228)=1-0.05=0.95 一般式：一般式：P(t-tP(t-t/2,/2,)+P(tt)+P(tt/2,/2,)=)=P(-tP(-t/2,/2,t t t t/2,/2,)=1-)=1-/2/22（/2）双侧双侧单侧单侧V=10 0 1.812 -2.228 0 2.228第三节第三节总体均数的估计总体均数的估计一、参数估计的概念一、参数估计的概念统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计区间估计用样本指标用样本指标来来估计总体估计总体指标指标二、参数估计的估计方法二、参数估计的估计方法1、点值估计、点值估计：直接用样本均数来估计总体均数：直接用样本均数来估计总体均数缺点：没有考虑抽样误差（可靠性差）缺点：没有考虑抽样误差（可靠性差）2、区区间间估估计计：按按一一定定的的概概率率1-估估计计总总体体均均数数所所在在范围，范围，1称可信度。称可信度。习惯上，常取习惯上，常取1=0.95，即，即95%可信区间可信区间或取或取1=0.99，即，即99%可信区间可信区间若无特别说明，一般取双侧若无特别说明，一般取双侧95%可信区间可信区间（一）单一总体均数可信区间估计方法：（一）单一总体均数可信区间估计方法：1、当、当未知，且未知，且n较小（较小（n100）：）：估计男女红细胞数差值的估计男女红细胞数差值的95%可信区间。可信区间。某地抽查了部分健康成人的红细胞数，结某地抽查了部分健康成人的红细胞数，结果如下表。果如下表。女性红细胞数女性红细胞数95%可信区间为：可信区间为：男性红细胞数男性红细胞数95%可信区间为：可信区间为：男女红细胞数差值的男女红细胞数差值的95%可信区间为：可信区间为：可信区间的涵义：可信区间的涵义：从总体中作随机抽样，根据每个样本可计算出从总体中作随机抽样，根据每个样本可计算出一个可信区间，那么一个可信区间，那么95%95%可信区间，意味着固定样可信区间，意味着固定样本含量本含量n n作作100100次抽样，算得次抽样，算得100100个区间，有个区间，有9595个可个可信区间包括总体均数（估计正确），只有信区间包括总体均数（估计正确），只有5 5个可信个可信区间不包括总体均数（估计错误）。区间不包括总体均数（估计错误）。5%5%是小概率事件，对一次试验而言出现的可能性是小概率事件，对一次试验而言出现的可能性小，因此在实际应用中可认为总体均数就在所算得小，因此在实际应用中可认为总体均数就在所算得的可信区间之内。的可信区间之内。思考题思考题下面哪种说法是正确的？下面哪种说法是正确的？1、95%可信区间包含总体均数的可能性为可信区间包含总体均数的可能性为95%。2、按、按95%可信区间估计总体均数，对的可可信区间估计总体均数，对的可能性为能性为95%。3、总体均数落在、总体均数落在95%可信区间的可能性为可信区间的可能性为95%。可信区间的两个要素：可信区间的两个要素：准准确确度度：反反映映在在可可信信度度(1)的的大大小小。1越越接接近近1，就越准确。如可信度，就越准确。如可信度99%比比95%准确。准确。精确度：精确度：反映在区间的长度。长度越小越好。反映在区间的长度。长度越小越好。在在例例数数n确确定定的的情情况况下下，二二者者呈呈反反比比关关系系：准准确确度度,精确度精确度(范围变宽范围变宽)。要兼顾准确度和精确度，一般取要兼顾准确度和精确度，一般取95%可信区间。可信区间。可信度确定后，增加样本例数可以提高精确度。可信度确定后，增加样本例数可以提高精确度。三、可信区间与参考值范围区别三、可信区间与参考值范围区别（1）意义不同）意义不同参考值范围是指绝大多数观参考值范围是指绝大多数观察值在某个范围；察值在某个范围；可信区间是指按一定的可可信区间是指按一定的可信度估计总体均数（参数）的所在范围；信度估计总体均数（参数）的所在范围；（2）计算公式不同）计算公式不同可信区间可信区间参考值范围参考值范围（3 3）应用不同）应用不同可信区间可信区间：估计总体均数;参考值范围：参考值范围：判断某项指标是否正常。判断某项指标是否正常。第四节第四节假设检验的原理和基本步骤假设检验的原理和基本步骤一、假设检验原理一、假设检验原理例例 4.50=72.1次次/分分已知总体已知总体n=36 X=74.3 S=5.4未知总体未知总体推断误差原因推断误差原因本本研研究究目目的的是是判判断断是是否否 (72.1(72.1次次/分分)。由由于于存存在在抽抽样样误误差差，来来自自某某一一总总体体的的随随机机样样本本其其样样本本均均数数与与总总体体均均数数往往往往不不等等；或或者者，从从同同一总体中抽取的两个随机样本的样本均数一总体中抽取的两个随机样本的样本均数和和也也往往往往不不同同。因因此此，在在比比较较一一个个样样本本均均数数与与一一个个已已知知的的总总体体均均数数，或或者者，比比较较两两个个样样本本均均数数的的差差别别时时，需需要要判判断断这这种种差差别别的的性性质质和和意意义义，造造成成这这种种差别的原因有两种：差别的原因有两种：1 1、总总体体均均数数不不等等（来来自自不不同同总总体体），有有本本质质差别；差别；2 2、总总体体均均数数相相等等（来来自自相相同同的的总总体体），其其差差别由抽样误差所致，无本质差别。别由抽样误差所致，无本质差别。要要判判断断差差异异属属于于那那种种可可能能，需需要要通通过过假假设设检检验来进行。验来进行。二、假设检验概念二、假设检验概念根据研究目的，对样本所属总体特征提出一根据研究目的，对样本所属总体特征提出一个假设，然后用适当方法，个假设，然后用适当方法，根据样本提供的信根据样本提供的信息息,推断此假设应当拒绝或不拒绝，以便研究推断此假设应当拒绝或不拒绝，以便研究者了解在假设条件下，者了解在假设条件下，差异由抽样误差引起的差异由抽样误差引起的可能性大小。可能性大小。三、假设检验基本思想三、假设检验基本思想假假设设检检验验要要推推断断样样本本（一一个个或或多多个个）所所来来自自的的总总体体其其总总体体参参数数（均均数数、率率）是是否否有有差差别别，可可通通过过判判断断样样本本指指标标的的差差别别是是由由抽抽样样误误差差引引起起的的，还还是是总总体体均均数数不不同同（来来自自不不同同总总体体）所所致致来来达达到到，运运用用反反证法。证法。首先建立检验假设：首先建立检验假设：如上述例子，先假设如上述例子，先假设 ;如果假设成立，即如果假设成立，即来自来自，则，则两者相差不大两者相差不大则则根据样本资料计算所得根据样本资料计算所得t值或值或u值应较小（值应较小（t值值或或u值称检验统计量），出现该值称检验统计量），出现该t值或值或u值的概率值的概率P较较大，如为大概率（如大，如为大概率（如P ），就认为原假设成立），就认为原假设成立（样本均数的差异是由于抽样误差引起）。（样本均数的差异是由于抽样误差引起）。或或如如果果计计算算所所得得的的t值值或或u值值较较大大，则则出出现现该该t值值或或u值值的的概概率率P较较小小，如如P ，就就认认为为原原假假设设不不成成立立，而认为其对立面而认为其对立面成立。成立。作作出出这这种种推推断断的的理理由由：小小概概率率事事件件在在一一次次抽抽样样中中一一般般不不会会发发生生，如如果果发发生生了了就就怀怀疑疑原原假假设设成成立立的的可能性，就认为不成立。可能性，就认为不成立。如如何何得得到到P值值？可可以以通通过过u分分布布和和t分分布布的的原原理理，由由t值或值或u值确定值确定P值。值。四、假设检验的一般步骤四、假设检验的一般步骤 1、建立假设和确定检验水准、建立假设和确定检验水准 2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量 3、确定、确定P值和作出推断结论值和作出推断结论 1、建立假设和确定检验水准、建立假设和确定检验水准基本步骤基本步骤（1）两个假设）两个假设无效假设：无效假设：H0 （检验假设）（检验假设）备择假设：备择假设：H1(2)确定单侧或双侧检验确定单侧或双侧检验根据专业知识和研究目的而定根据专业知识和研究目的而定单侧检验单侧检验：如在比较新旧两种药物的如在比较新旧两种药物的疗效时，如能根据专业知识认为新药疗效疗效时，如能根据专业知识认为新药疗效不会比旧药差，只关心新药是否比旧药好不会比旧药差，只关心新药是否比旧药好（疗效至少相同，绝对排除出现相反的可（疗效至少相同，绝对排除出现相反的可能性），可用单侧检验。能性），可用单侧检验。双侧检验：双侧检验：在比较甲乙两种药物的疗效在比较甲乙两种药物的疗效时，事先不能确定哪种药的疗效较好，只关时，事先不能确定哪种药的疗效较好，只关心两药的疗效有无差别，要用双侧检验。双心两药的疗效有无差别，要用双侧检验。双侧检验若有差别，单侧检验肯定有差别；反侧检验若有差别，单侧检验肯定有差别；反之，单侧检验若有差别，双侧检验不一定有之，单侧检验若有差别，双侧检验不一定有差别。差别。单侧检验更容易得到有单侧检验更容易得到有统计学统计学意义的结论。意义的结论。样本均数与总体均数比较样本均数与总体均数比较检验类型检验类型检验目的检验目的 H0 H1 双侧检验双侧检验是否是否单侧检验单侧检验是否是否是否是否两两样本均数均数比较样本均数均数比较检验类型检验类型检验目的检验目的 H0 H1 双侧检验双侧检验是否是否单侧检验单侧检验是否是否是否是否建立检验假设注意事项建立检验假设注意事项（1）检验假设是对总体特征的假设；）检验假设是对总体特征的假设；（2）H1是是与与0 相相互互联联系系和和相相互互对对立立的的假假设，两者缺一不可；设，两者缺一不可；（3）0 相相假假设设的的内内容容是是两两个个总总体体参参数数相相等等，或或其其差差值值等等于于0，处处理理无无效效，无无相相关关，资料服从某一分布等；资料服从某一分布等；（4）H1反映出单侧还是双侧检验。反映出单侧还是双侧检验。(3)确定检验水准：确定检验水准：检检验验水水准准用用表表示示，是是拒拒绝绝或或不不拒拒绝绝0的的概概率率标标准准，也也就就是是小小概概率率事事件件标标准准，是是人人为为选选定定的的概概率率值值，一一般般取取0.05（根根据据需需要要也也可可取取0.2、0.15、0.1、0.01等）。等）。2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量根根据据研研究究设设计计方方案案、资资料料类类型型、样样本本含含量量大大小小及及分分析析目目的的选选用用适适当当的的检检验验方方法法，并并根根据据样样本本资资料料计计算算相相应应的的检检验验统统计计量量；不不同同的的检检验验方方法法要要用用不不同同的的公公式式计计算算现现有有样样本本的的检检验验统统计计量量（t,u，F值值）。检检验验统统计量是在计量是在H0成立的前提下计算出来。成立的前提下计算出来。3、确定、确定P值值 P值值是是指指由由所所规规定定的的总总体体作作随随机机抽抽样样，获获得得等等于于及及大大于于（或或等等于于及及小小于于）现现有有样样本本获获得得的的检检验验统统计计量量值值的的概概率率。P P也也表表示示H H0 0成立的概率大小。成立的概率大小。手工计算：手工计算：一般是通过查界值表获得。一般是通过查界值表获得。统计软件：统计软件：直接给出精确的直接给出精确的P P值值4 4、作出推断结论（含统计结论和专业结论）、作出推断结论（含统计结论和专业结论）统统计计结结论论：拒拒绝绝H0，接接受受H1，差差异异有有统统计计学学意义）意义）专业结论：专业结论：可认为可认为不同或不等。不同或不等。当当 P时：时：将获得的事后概率将获得的事后概率P与事先规定的概率与事先规定的概率进进行比较，推断统计结论。行比较，推断统计结论。当当P时时统计结论：统计结论：不拒绝不拒绝H0，差异无统计学意义，差异无统计学意义专业结论：专业结论：还不能认为还不能认为不同或不等。不同或不等。注意：注意：对于对于H H0 0，只能说拒绝或不拒绝；对于，只能说拒绝或不拒绝；对于H H1 1只只能说接受。能说接受。假设检验的特点：假设检验的特点：1、统计检验的假设是关于总体特征的假设；、统计检验的假设是关于总体特征的假设；2、用用于于检检验验的的方方法法是是以以检检验验统统计计量量（t,u)的的抽样分布为理论根据；抽样分布为理论根据；3、作出的结论是概率性的，不是绝对的肯定、作出的结论是概率性的，不是绝对的肯定或否定。或否定。假设检验中假设检验中值与值与P值的区别值的区别 1、假假设设检检验验中中值值是是检检验验水水准准，是是拒拒绝绝或或不不拒拒绝绝H0的的概概率率标标准准。的的大大小小是是人人为为选定的，一般取选定的，一般取0.05。2、P值是指从值是指从H0所规定的总体中作随机所规定的总体中作随机抽样抽样,获得等于及大于获得等于及大于(或等于及小于或等于及小于)现有现有样本统计量的概率。通过样本统计量的概率。通过 P值与值与值的比值的比较来确定拒绝或不拒绝较来确定拒绝或不拒绝H0。第五节第五节 t检验检验 t检检验验用用途途：用用于于一一个个或或两两个个样样本本均均数数的的假假设设检验。检验。t检验类型检验类型 1、样本均数与总体均数比较的、样本均数与总体均数比较的t检验检验 2、配对设计、配对设计t检验检验 3、两小样本均数比较的、两小样本均数比较的t检验检验 4、两样本几何均数比较的、两样本几何均数比较的t检验检验 t检验应用条件检验应用条件 1、样本来自正态总体。、样本来自正态总体。2、两样本均数比较，还要求样本的总体方、两样本均数比较，还要求样本的总体方差相等差相等。一、样本均数与总体均数比较（单样本一、样本均数与总体均数比较（单样本t t检验）检验）目的：推断样本均数代表的未知总体均数推断样本均数代表的未知总体均数和已和已知总体均数知总体均数0 0是否有差别，即是否是否有差别，即是否理论值、标准值、理论值、标准值、稳定值稳定值公式公式:=n-1条件：样本来自正态总体。条件：样本来自正态总体。例例 4.50=9.3cm已知总体已知总体X=9.3975cmS=0.3293cm n=12未知总体未知总体是否是否检验步骤：检验步骤：例例4.5建立假设和确定检验水准建立假设和确定检验水准 H0:=9.3cm H1:单侧单侧=0.05今今n=12,X=9.3975cm，s=0.3293cm =9.3cm 例例4.5选定检验方法和计算检验统计量选定检验方法和计算检验统计量v=n-1=12-1=11例例4.5确定确定P值值以以v=11查附表查附表2，t界值表，得：界值表，得：单侧：单侧：t0.05,11=1.796,t0.1,11=1.363 t0.2,11=0.876 t0.1,11 t t0.2,11 0.2P0.1(v一定时，一定时，t 值越大，值越大，P值越小值越小)查查t值表时，先查值表时，先查P=0.05时的界值。时的界值。当当P0.05时，需继续往时，需继续往P更大的一侧查，更大的一侧查，直到最大的直到最大的P值为止。值为止。如使用统计软件，会给出确切的概率值。如使用统计软件，会给出确切的概率值。注意注意例例4.5作作出出推推断断结结论论(两两个个结结论论：统统计计结结论论和和专专业业结论结论)今今0.2P0.1，按，按=0.05水准，不拒绝水准，不拒绝H0,差异无统计学意义差异无统计学意义(统计结论统计结论)，尚不能认为，尚不能认为该山区正常产男婴双顶径大于一般男婴双顶该山区正常产男婴双顶径大于一般男婴双顶径径(专业结论专业结论)。二、二、配对配对t检验（检验（paired t-test)用于配对设计计量资料用于配对设计计量资料配对设计：配对设计：将条件相同或相近的两个对象配成一对，将条件相同或相近的两个对象配成一对，然后将两个对象随机分到两个不同的处理组。然后将两个对象随机分到两个不同的处理组。配对设计的情形：配对设计的情形：(1)(1)配对的两个受试对象分别给予两种处理；配对的两个受试对象分别给予两种处理；(2)(2)同一受试对象分别接受两种不同处理；同一受试对象分别接受两种不同处理；(3)(3)同一样品用两种方法检测；同一样品用两种方法检测；(4)(4)同一受试对象处理前、后所得数据。同一受试对象处理前、后所得数据。配配对对资资料料t t检检验验的的目目的的：推推断断两两种种处处理理（或或方法）的结果有无差别。方法）的结果有无差别。随机选择随机选择9窝中年大鼠，每窝中取两只雌性大鼠随机窝中年大鼠，每窝中取两只雌性大鼠随机地分入甲、乙两组，甲组大鼠不接受任何处理地分入甲、乙两组，甲组大鼠不接受任何处理(即空白对即空白对照照)，乙组中的每只大鼠接受，乙组中的每只大鼠接受3mg/Kg的内毒素。分别测的内毒素。分别测得两组大鼠的肌酐得两组大鼠的肌酐(mg/L)测定结果如下。测定结果如下。窝别编号：窝别编号：1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 甲甲(对照对照)组：组：6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 乙乙(处理处理)组：组：7.5 3.8 6.3 4.3 5.3 7.3 5.6 7.9 7.27.5 3.8 6.3 4.3 5.3 7.3 5.6 7.9 7.2 检检验验血血磷磷含含量量有有甲甲、乙乙两两种种方方法法，其其中中，乙乙法法具具有有快快速速、简简便便等等优优点点。现现用用甲甲、乙乙两两法法检检测测相同的血液样品，所得结果如下表。相同的血液样品，所得结果如下表。问问：检检验验甲甲乙乙两两法法检检出出血血磷磷是是否否相相同同，用用何何统统计方法？计方法？样本号样本号 1 2 3 4 5 6 7 乙乙法法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲甲法法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 某脑电图室观察家兔注射某脑电图室观察家兔注射AT3前后脑电图波形前后脑电图波形的变化，观测结果如下。试分析注射的变化，观测结果如下。试分析注射AT3前后脑前后脑电图波形是否发生了显著性变化。电图波形是否发生了显著性变化。注射注射AT3前后脑电图波形的变化率前后脑电图波形的变化率（%）家兔编号家兔编号注射前注射前注射后注射后 1 29 37 2 28 44 3 38 52 4 29 35 5 34 41 6 41 43 两种测声计两种测声计A A和和B B对同一场地声音的测定结果对同一场地声音的测定结果场地场地测声计测声计A A 测声计测声计B B 差值差值d d(1)(2)(3)(4)=(2)-(3)(1)(2)(3)(4)=(2)-(3)1 87 86 1 1 87 86 1 2 65 66 -1 2 65 66 -1 3 74 77 -33 74 77 -34 95 95 0 4 95 95 0 5 65 60 5 5 65 60 5 6 55 53 26 55 53 27 63 62 1 7 63 62 1 8 88 85 38 88 85 39 61 59 29 61 59 210 54 55 -1 10 54 55 -1 9 9 克矽平治疗前后患者血清粘蛋白（克矽平治疗前后患者血清粘蛋白（mg/Lmg/L）患者号患者号治疗前治疗前治疗后治疗后差值，差值，d d 1 65 34 31 1 65 34 31 2 73 36 37 2 73 36 37 3 73 37 36 3 73 37 36 4 30 26 4 4 30 26 4 5 73 43 30 5 73 43 30 6 56 37 19 6 56 37 19 7 73 50 23 7 73 50 23 180180 配对号配对号新药组新药组安慰剂组安慰剂组差值差值（1）（2）（3）（4）=（2）-（3）1 4.4 6.2 -1.8 2 5.0 5.2 -0.2 3 5.8 5.5 0.3 4 4.6 5.0 -0.4 5 4.9 4.4 0.5 6 4.8 5.4 -0.6 7 6.0 5.0 1.0 8 5.9 6.4 -0.5 9 4.3 5.8 -1.5 10 5.1 6.2 -1.1 -4.3 新药组与安慰剂组血清总胆固醇含量（新药组与安慰剂组血清总胆固醇含量（mmol/L)检验公式检验公式：v=n-1v=n-1应用条件：差值来自正态总体。应用条件：差值来自正态总体。例例 4-6检验步骤检验步骤 1、建立检验假设，确定检验水准、建立检验假设，确定检验水准 H0:d0 H1:d 0 0.05(单侧单侧)2、本例为配对计量资料，用配对、本例为配对计量资料，用配对t检验检验n=8,n=8,n-1=8-1=73、确定、确定P值值=7,查附表查附表2,得：得：4、推断结论、推断结论 0.05P0.025，按按0.05水准，拒绝水准，拒绝H0，接受接受H1,差异有统计学意义，认为实验组差异有统计学意义，认为实验组Wister大鼠血中胆碱酯酶活性高于对照组。大鼠血中胆碱酯酶活性高于对照组。例4-7 1、建立检验假设，确定检验水准、建立检验假设，确定检验水准 H0:d0 H1:d 0 0.052、本例为配对计量资料，用配对、本例为配对计量资料，用配对t检验检验 v=n-1=12-1=110.05 P 0.023、确定P值，推断结论0.05P0.02，按按0.05水准，拒绝水准，拒绝H0，接受，接受H1,差异有统计学意义，认为豚鼠注入肾上腺素前后灌差异有统计学意义，认为豚鼠注入肾上腺素前后灌流滴数不同，注入后灌流滴数增加。流滴数不同，注入后灌流滴数增加。三、成组设计两样本均数比较三、成组设计两样本均数比较t t检验检验（一）（一）t 检验应用条件：检验应用条件：1、两样本均来自正态总体、两样本均来自正态总体 2、两样本的方差齐、两样本的方差齐在正式的统计分析中，先要看方差是否齐，在正式的统计分析中，先要看方差是否齐，如果不齐，要选方差不齐的结果！如果不齐，要选方差不齐的结果！一般的统计软件，都会同时给出方差齐性检验一般的统计软件，都会同时给出方差齐性检验的结果及方差齐和不齐的检验结果。的结果及方差齐和不齐的检验结果。（二）成组设计和及其检验的目的（二）成组设计和及其检验的目的 1 1、成成组组设设计计（又又称称完完全全随随机机随随机机设设计计、单单因因素素设设计）含义：计）含义：将将受受试试对对象象按按随随机机化化的的方方法法分分配配到到各各处处理理组组中中（或或从从两两个个或或多多个个研研究究总总体体中中抽抽取取样样本本）。各各处处理理组（样本）的例数可以相等也可以不等。组（样本）的例数可以相等也可以不等。研究对象甲组乙组总体1总体2样本1样本1 2 2、检检验验的的目目的的：检检验验两两样样本本均均数数和和所所代代表表的的两两总总体体均均数数和和是是否否有有差差别别，或或检检验验两两样样本本几几何何均均数数G G1 1和和G G2 2所所代代表表的的两两总总体体几几何何均均数数是是否否有有差差别。别。两小样本均数比较两小样本均数比较t检验检验t检验检验方差不齐方差不齐方差齐方差齐变量变换变量变换秩和检验秩和检验（三）总体方差相等时两小样本均数的比较（三）总体方差相等时两小样本均数的比较t t检验检验 v=n1+n2-2例4-8 不同组小鼠琼脂肉芽肿重量（不同组小鼠琼脂肉芽肿重量（mg）骨肌康组骨肌康组 108.0 74.8 31.2 132.0 147.6 98.5 82.2 93.3 85.5 110.4 乙醇组乙醇组 94.8 122.5 144.1 151.2 189.3 204.2 155.6 160.3 178.3 165.4 该资料为成组设计资料，将该资料为成组设计资料，将20只小鼠随机只小鼠随机分配到实验组和对照组，看两组小鼠琼脂肉分配到实验组和对照组，看两组小鼠琼脂肉芽肿重量有无差异，用芽肿重量有无差异，用t检验。检验。H H0 0:即两组即两组小鼠琼脂肉芽肿重量总体均数相等小鼠琼脂肉芽肿重量总体均数相等H H1 1:即两组小鼠琼脂肉芽肿重量总体均数不相等即两组小鼠琼脂肉芽肿重量总体均数不相等 V V=n=n1 1+n+n2 2-2=10+10-2=18-2=10+10-2=18查查t t界界值值表表得得：t t0.001,180.001,18=3.922=3.922,t t t t0.001,180.001,18 ,P0.001P0.001。按按 =0.05=0.05，拒拒绝绝H H0 0，接接受受 H H1 1，差差别别有有统统计计学学意意义义，可可以以认认为为骨骨肌肌康康组组和和乙乙醇醇对对照照组组琼琼脂脂肉肉芽芽肿肿平平均均重重量量不不等等，试试验验组组低低于于对对照照组组，即即大大剂剂量量骨骨肌肌康康搽剂对小鼠琼脂肉芽肿有抑制作用搽剂对小鼠琼脂肉芽肿有抑制作用。成成组设计两个样本几何均数比较组设计两个样本几何均数比较 1、应用条件：、应用条件：（1）两样本的对数值均来自正态总体）两样本的对数值均来自正态总体（2）两样本的对数值的方差齐）两样本的对数值的方差齐 2 2、检验公式、检验公式与两样本均数的与两样本均数的t t检验和检验和u u检验公式相同，只是原始数据要作对数变检验公式相同，只是原始数据要作对数变换，用换，用对数值对数值的均数和标准差代公式。的均数和标准差代公式。3、检验步骤、检验步骤与两样本均数的与两样本均数的t检验相同检验相同在使用统计软件进行分析时，先将原始数在使用统计软件进行分析时，先将原始数据取对数，然后用对数值作一般的据取对数，然后用对数值作一般的t检验。检验。注意啦注意啦！四、方差不齐时两小样本均数的比较四、方差不齐时两小样本均数的比较（一）两样本方差齐性检验（一）两样本方差齐性检验（F F检验）检验）=n=n1 1-1,=n-1,=n2 2-1-1例例4-104-10 比比较较骨骨肌肌康康治治疗疗组组和和乙乙醇醇对对照照组组琼琼脂脂肉肉芽肿的总体方差是否相等。芽肿的总体方差是否相等。n n1 1=10,=96.35,s=10,=96.35,s1 1=32.10=32.10 n n2 2=10,=156.57,s=10,=156.57,s2 2=31.74=31.74H H0 0:即两组老鼠琼脂肉芽肿的总体方差相等即两组老鼠琼脂肉芽肿的总体方差相等H H1 1:即两组老鼠琼脂肉芽肿的总体方差不相等即两组老鼠琼脂肉芽肿的总体方差不相等 =0.1=0.1（减小第二类误差，提高把握度）（减小第二类误差，提高把握度）=10-1=9 =10-1=9，=10-1=9=10-1=9查查附附表表 3.13.1，F F界界值值表表（方方差差齐齐性性检检验验用用）F F0.1,(9,9)0.1,(9,9)=3.18=3.18，FFF0.1,P0.1。按按 =0.1=0.1，不不拒拒绝绝H H0 0,差差异异无无统统计计学学意意义义，尚尚不不能认为两总体方差有差别。能认为两总体方差有差别。例4-11检验正常人和喉癌患者血清铁蛋白的总体方检验正常人和喉癌患者血清铁蛋白的总体方差是否不同？差是否不同？例例4-114-11 H H0 0:即正常人和喉癌患者的血清铁蛋白即正常人和喉癌患者的血清铁蛋白总体方差相等总体方差相等H H1 1:即正常人和喉癌患者的血清铁蛋白即正常人和喉癌患者的血清铁蛋白总体方差不相等总体方差不相等 =0.1=0.1（减小第二类误差，提高把握度）（减小第二类误差，提高把握度）=32-1=31 =32-1=31，=25-1=24=25-1=24查查附附表表 3.13.1，F F界界值值表表（方方差差齐齐性性检检验验用用）F F0.02,(12,24)0.02,(12,24)=3.03=3.03，FFFF0.02,(12,24),0.02,(12,24),P0.02,P0.02。按按 =0.1=0.1，拒拒绝绝H H0 0,接接受受H1,H1,差差异异有有统统计计学学意意义义，认为两总体方差有差别。认为两总体方差有差别。注注意意：1 1、两两小小样样本本均均数数比比较较，要要求求两两总总体体方方差差相相等等（进进行行方方差差齐齐性性检检验验），当当一一个个样样本本的的方方差差是是另另一一个个的的3 3倍倍时时，可可以以认认为为两两总总体体方方差差不不相相等等；若若两两样样本本含含量量均均大大于于5050时时，可可以以不不做做方方差差齐齐性性检检验。验。（二）总体方差不等时两小样本均数的检验（二）总体方差不等时两小样本均数的检验 1、Cochran&Cox法法校正临界值校正临界值 2、Satterthwaite法法校正自由度（统计软件普遍使用的方法）校正自由度（统计软件普遍使用的方法）3、Welch法法校正自由度校正自由度检验检验(Cochran&Cox(Cochran&Cox法法)=n =n1 1-1,=n-1,=n2 2-1-1 注注意意：当当n1=n2=n时时，可可用用 v v=n-1直直接接查查t界界值值表确定表确定P值。值。例例4-94-9 检检验验喉喉癌癌病病人人和和正正常常人人血血清清铁铁蛋蛋白白含含量量是是否否不等。不等。由于两总体方差不齐，用由于两总体方差不齐，用检验（近似检验（近似t t检验）检验）H H0 0:即即正常人和喉癌患者的血清铁蛋白正常人和喉癌患者的血清铁蛋白总体均数相等总体均数相等 H H1 1:即正常人和喉癌患者的血清铁蛋白即正常人和喉癌患者的血清铁蛋白总体均数不相等总体均数不相等 =n =n1 1-1=25-1=24,=32-1=31-1=25-1=24,=32-1=31查查t t界值表得：双侧界值表得：双侧，P0.05P0.05 按按 =0.05=0.05，拒拒绝绝H H0 0，接接受受 H H1 1，差差别别有有统统计计学学意意义义，可可以以认认为为喉喉癌癌病病人人和和正正常常人人血血清清铁铁蛋蛋白白总总体体均数不等均数不等,喉癌病人含量高于正常人。喉癌病人含量高于正常人。2、Satterthwaite法法以以t=3.272,v=44t=3.272,v=44（取（取4040）查）查t t界值表得：界值表得：（三）、正态性检验（三）、正态性检验检验资料是否服从正态分布。检验方法有：1、图示法；注意：2、统计检验方法 H0:资料服从正态分布资料服从正态分布（1）W 检验；H1:资料不服从正态分布资料不服从正态分布（2）D 检验（3）矩法第六节第六节型错误与型错误与型错误和检验效能型错误和检验效能型错误：型错误：拒绝实际上成立的拒绝实际上成立的H0，这类这类“弃真弃真”的错误称的错误称型错误或第一类错误。其概率大型错误或第一类错误。其概率大小用小用表示。表示。型错误：型错误：不拒绝（接受）实际上是不成立的不拒绝（接受）实际上是不成立的H0，这类这类“存伪存伪”的错误称的错误称型错误或第二型错误或第二类错误。其概率大小用类错误。其概率大小用表示，但表示，但大小一大小一般不知道。般不知道。拒绝拒绝H H0 0，犯，犯型错误；不拒绝型错误；不拒绝H H0 0 ，犯，犯型错误。型错误。两类错误的关系两类错误的关系型型错错误误的的概概率率为为，型型错错误误的的概概率率为为，而而大小一般是不知道的。大小一般是不知道的。1：称为检验效能（又称把握度），即称为检验效能（又称把握度），即两总体确有差别，两总体确有差别，则按则按检验水准能发现检验水准能发现它们有差别的能力。它们有差别的能力。越大，越大，越小越小；越小，越小，越大，两者呈反比关越大，两者呈反比关系。系。如何确定如何确定和和的取值？的取值？1、若重点减少、若重点减少（例如，为避免把疗效（例如，为避免把疗效与常规药本无差别的新药当做有差别，致与常规药本无差别的新药当做有差别，致使无故废弃常规药，使无故废弃常规药，即严格要求即严格要求），则取），则取0.01 2、若若重重点点减减少少（例例如如，当当欲欲用用新新方方法法取取代代旧旧方方法法时时，为为了了慎慎重重起起见见，宁宁可可把把无无差差别别当当成成有有差差别别,以以提提高高把把握握度度），则则取取0.1或或0.2。3、若若需需兼兼顾顾和和，则则取取0.05较较为为恰恰当。当。4、若若要要同同时时减减少少和和，只只能能增增加加样样本本的含量。的含量。第七节第七节假设检验应注意的问题假设检验应注意的问题 1、要有严密的抽样研究设计，应考虑到、要有严密的抽样研究设计，应考虑到被比较的样本的可比性，这是假设检验的被比较的样本的可比性，这是假设检验的前提。前提。2、选用的假设检验方法应符合其应用条、选用的假设检验方法应符合其应用条件。根据研究件。根据研究设计方案、资料类型、样本设计方案、资料类型、样本含量大小及分析目的含量大小及分析目的选用适当的检验方法。选用适当的检验方法。3、正确理解差别有无显著性的统计意义。、正确理解差别有无显著性的统计意义。不要把统计结论中的不要把统计结论中的“差异有显著性差异有显著性”理解理解为差异很大；为差异很大；“差异无显著性差异无显著性”理解为差异很小。理解为差异很小。假设检验不能判断总体参数间差异的大小。假设检验不能判断总体参数间差异的大小。是否拒绝是否拒绝H0，取决于：，取决于：1、被研究的事物有无本质的差异、被研究的事物有无本质的差异 2、抽样误差大小：、抽样误差大小：（1）个体差异大小）个体差异大小（2）样本例数多少）样本例数多少 3、检验水准、检验水准的高低的高低例数甲指标乙指标 n XS XS甲组 18 3.481.65 5.231.12 乙组 12 4.762.52 6.381.21 P=0.10 P=0.01甲指标两均数甲指标两均数相差相差1.28乙指标两均数乙指标两均数相差相差1.15解释解释差值大小差值大小抽样误差大小抽样误差大小变异度变异度例数多少例数多少4、结论不能绝对化。、结论不能绝对化。即即拒绝拒绝H0，犯犯型错误；型错误；不拒绝不拒绝H0，犯，犯型错误。型错误。无论是否拒绝无论是否拒绝H0，都可能犯错误！，都可能犯错误！5、注意统计学意义和实际意义的区别、注意统计学意义和实际意义的区别有统计学意义，不一定有实际意义！有统计学意义，不一定有实际意义！无统计学意义，不一定无实际意义！无统计学意义，不一定无实际意义！（1）统统计计结结论论和和专专业业结结论论一一致致，则则最最终终结结论论两两者一致；者一致；（2）统计结论和专业结论不一致时：）统计结论和专业结论不一致时：A、统计结论有意义，而专业结论无意义，则、统计结论有意义，而专业结论无意义，则最终结论无意义；最终结论无意义；B、有实际意义而无统计学意义，要增加样本、有实际意义而无统计学意义，要增加样本含量，进一步验证。含量，进一步验证。有统计学和实际意义有统计学和实际意义有统计意义，可能有统计意义，可能有实际意义有实际意义有统计意义，无有统计意义，无实际意义实际意义无统计意义，可能有实无统计意义，可能有实际意义，样本例数太少际意义，样本例数太少确实无差别确实无差别有实际有实际意义值意义值H0 6、可信区间与假设检验的关系、可信区间与假设检验的关系（1）可信区间亦可用于回答假设检验问题可信区间亦可用于回答假设检验问题；若算得的可信区间包含了若算得的可信区间包含了H0，则不拒绝，则不拒绝H0;若若不包含不包含H0，则拒绝，则拒绝H0。（2）可信区间比假设检验还可提供更多的）可信区间比假设检验还可提供更多的信息。除能说明有无统计学意义外，还能提示信息。除能说明有无统计学意义外，还能提示有无实际意义。有无实际意义。但这并不意味着可以完全用可信区间但这并不意味着可以完全用可信区间代替假设检验。假设检验得到的代替假设检验。假设检验得到的P 值可以值可以较精确地说明结论的概率保证，而可信区较精确地说明结论的概率保证，而可信区间只能告诉我们在间只能告诉我们在水准上有无统计学意水准上有无统计学意义，却不能象义，却不能象P值那样提供精确的概率。值那样提供精确的概率。因此两者结合使用。因此两者结合使用。根根据据大大量量调调查查的的资资料料，已已知知健健康康成成年年男男子子的的脉脉搏搏均均数数为为72.172.1次次/分分。某某医医生生在在山山区区随随机机调调查查了了3636名名健健康康成成年年男男子子，求求得得其其脉脉搏搏均均数数为为74.374.3次次/分分，标标准准差差为为5.45.4次次/分分。问问能能否否认认为为该该山山区区成成年年男男子子的的脉搏数与一般成年男子的脉搏均数不同？脉搏数与一般成年男子的脉搏均数不同？

展开阅读全文

数学总体均数估计和假设检验课件

最新文档