抽样误差与假设检验t检验课件

资源描述

抽样误差与假设检验t检验抽样误差与假设检验t检验1统计推断：用样本信息推论总体特征的过程。统计推断：用样本信息推论总体特征的过程。包括：包括：参数估计参数估计:运用统计学原理，用从样本计算出运用统计学原理，用从样本计算出来的统计指标量，对总体统计指标量进行估计。来的统计指标量，对总体统计指标量进行估计。假设检验：又称显著性检验，是指由样本间存假设检验：又称显著性检验，是指由样本间存在的差别对样本所代表的总体间是否存在着差在的差别对样本所代表的总体间是否存在着差别做出判断。别做出判断。方法：均数的参数估计、均数方法：均数的参数估计、均数t 检验检验统计推断：用样本信息推论总体特征的过程。2一、抽样误差与标准误一、抽样误差与标准误（一）概念（一）概念1、抽样误差抽样误差：是伴随抽样所产生的样本统是伴随抽样所产生的样本统计量与参数之间的差别。计量与参数之间的差别。2、标准误标准误：符号：符号，表示抽，表示抽样误差大小的指标；也称为样本均数的标准样误差大小的指标；也称为样本均数的标准差；反映了用样本均数代替总体均数的可靠差；反映了用样本均数代替总体均数的可靠性程度的大小，增加样本容量可以降低抽样性程度的大小，增加样本容量可以降低抽样误差。误差。抽样误差与抽样分布抽样误差与抽样分布一、抽样误差与标准误抽样误差与抽样分布3（二）、表达式与计算（二）、表达式与计算样本均数的标准差，也称为标准样本均数的标准差，也称为标准误，反映了样本均数间的离散程误，反映了样本均数间的离散程度，也反映了样本均数与总体均度，也反映了样本均数与总体均数的差异。数的差异。例例4.1 某市随机抽查某市随机抽查12岁男孩岁男孩100人，得身高均数人，得身高均数139.6cm,标标准差准差6.85cm,计算标准误。计算标准误。（二）、表达式与计算样本均数的标准差，也称为标准误，4标准差与标准误联系与区别标准差与标准误联系与区别标准差标准差标准误标准误含含义义测量值的离散程度测量值的离散程度样本均数的离散程度样本均数的离散程度（统计量对参数的散度）（统计量对参数的散度）计计算算大大小小大大小小用用途途描述测量值离散程度、描述测量值离散程度、计算计算cv、计算正常值范、计算正常值范围、计算标准误围、计算标准误参数可信区间的估计参数可信区间的估计假设检验，表达误差的内涵假设检验，表达误差的内涵联联系系都是离散程度的指标都是离散程度的指标,标准误是通过标准差来计算标准误是通过标准差来计算标准差与标准误联系与区别标准差标准误含义样本均数的离散程度计5二、抽样分布、抽样分布从正态总体中抽样，样本均数（从正态总体中抽样，样本均数（）的抽样分布：）的抽样分布：1.n较大时（较大时（n50)，服从正态分布服从正态分布,经过标准化转换经过标准化转换服从标准正态分布即服从标准正态分布即 u分布分布2.n较小时（较小时（n50），），是非正态的单峰对称分布是非正态的单峰对称分布就有小样本统计量就有小样本统计量()的转换值服从的转换值服从t分布分布（是一组曲线）。（是一组曲线）。二、抽样分布从正态总体中抽样，样本均数（）的抽样分布：6抽样分布抽样分布抽样分布7事先给定的概率1-称为可信度，常取95%或99%（1）统计意义：从总体中作大数次随机抽样，有95%求得的可信区间包含总体均数。1、建立检验假设，确定检验水准（2）同一受试对象或同一样本的两个部分，分别接受两种不同处理：5次/分,n=30,由于已知 ,故选用单样本t检验（）2N一定时，测量值的离散程度越小，用样本均数估计总体均数的抽样误差就越小。如：把服用两种降糖药的病人配成对（1）t分布法（未知，n50）1 16.(2)可得到一个样本均数及该样本标准误；根据大量调查，已知健康成年男子脉搏的均数为72次/分，某医生在一山区随机调查了30名健康成年男子，求得脉搏均数为74.男 193 3.（）2N一定时，测量值的离散程度越小，用样本均数估计总体均数的抽样误差就越小。查表2，可得 t 0.本例中:n=100,=139.自由度：对子数-1假设检验：又称显著性检验，是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。概率论：事件的发生不是绝对的，只是可能性大小而已。单个样本t检验:是样本均数代表的总体均数和已知总体均数的比较.3 1.英国统计学家：哥塞德在英国统计学家：哥塞德在1908年以笔名年以笔名“student”提出了著名的提出了著名的t分布，故也称为分布，故也称为student t分布。分布。t分布是描述小样本均值转换度的分布。分布是描述小样本均值转换度的分布。1、从正态总体中抽样，大样本均数的转换值服从、从正态总体中抽样，大样本均数的转换值服从标准正太分布标准正太分布2、小样本均数的转换值服从、小样本均数的转换值服从t分布分布事先给定的概率1-称为可信度，常取95%或99%英国统计学8（1）tu(n)（2）和和N(0,1)一一样样都都是是单单峰峰分分布布，以以0为为中中心心对对称称（3）越越小小，则则越越大大，t值值越越分分散散，和和N(0,1)相相比比，集集中中在在这这部部分分的的比比例例越越少少，尾尾部部翘得越高。翘得越高。2、t分布的特征分布的特征（1）tu(n)2、t分布的特征9抽样误差与假设检验t检验课件10t 分布（与分布（与u 分布分布比较的特点）比较的特点）t 分布（与u 分布比较的特点）11 横横坐坐标标为为自自由由度度，纵纵坐坐标标为为概概率率p，表表中中数数字字表表示示自自由由度度为为、p为为、t的的界界值值，记记如单侧如单侧 =0.05，=20可查得可查得 =1.725 表示表示p(t1.725)=0.05 由由t分布的对称性分布的对称性p(t-1.725)=0.05 t,以外尾部面积的百分数是以外尾部面积的百分数是3、t界值表界值表横坐标为自由度，纵坐标为12 的界值的界值的界值13与u分布比较U的临界值小于的临界值小于t曲线相应的临界值的绝对曲线相应的临界值的绝对值值当当n时，临界值相近。时，临界值相近。自由度越小，自由度越小，t的临界点越偏离的临界点越偏离u的临界点。的临界点。与u分布比较U的临界值小于t曲线相应的临界值的绝对值14总体均数的参数估计总体均数的参数估计参数估计：是指由样本指标值（统计参数估计：是指由样本指标值（统计量）估计总体指标值（参数）量）估计总体指标值（参数），即用即用样本均数估计总体均数，有两种估计样本均数估计总体均数，有两种估计方法：方法：(1)、点估计、点估计（近似值）（近似值）(2)、区间估计、区间估计（近似范围）（近似范围）总体均数的参数估计参数估计：是指由样本指标值（统计量）估计总15一、点估计一、点估计点估计点估计:用样本均数直接作为总体均数的估计用样本均数直接作为总体均数的估计值值,未考虑抽样误差。未考虑抽样误差。如用如用估计相应的估计相应的当当时,样本均本均值趋近于近于总体均体均值.如果如果 ,则更可靠更可靠.一、点估计点估计:用样本均数直接作为总体均数的估计值,未考16二、区间估计二、区间估计1、概念、概念可信区间：也称为置信区间（可信区间：也称为置信区间（confidence interval,CI),是按预先给定的概率估计未知总体是按预先给定的概率估计未知总体均数的可能范围均数的可能范围.事先给定的概率事先给定的概率1-称称为可信度，常取可信度，常取95%或或99%总体均数的总体均数的95%（或（或99%）可信区间：表示该）可信区间：表示该区间包括总体均数区间包括总体均数的概率的概率为95%（或（或99%).二、区间估计1、概念17根据总体标准差根据总体标准差是否已知，以及是否已知，以及样本含量本含量n的大小而异。的大小而异。（1）t分布法（n50）2、计算方法、计算方法根据总体标准差是否已知，以及样本含量n的大小而异。2、计算18（1）t分布法（分布法（未知，未知，n50）按按t分布原理，可用以下公式进行区间估计：分布原理，可用以下公式进行区间估计：对上式进行变换，得置信度为对上式进行变换，得置信度为1-的的总体均数可信体均数可信区区间的通式的通式为：习惯将上式写成将上式写成:（1）t分布法（未知，n50)总体均数的可信区间总体均数的可信区间.已知已知:未知但未知但n足足够大大:(2)U分布法(已知或未知,但n足够大n50)总体均数的21差别无显著性，或无统计意义，我们只是认为以很大的把握拒绝原假设的理由还不够充分，并不意味着我们很相信它。参数估计:运用统计学原理，用从样本计算出来的统计指标量，对总体统计指标量进行估计。单个样本t检验:是样本均数代表的总体均数和已知总体均数的比较.例某医师测得40名老年慢性支气管炎病人中17-酮类固醇排除量均数为15.=n1+n2-2=12+13-2=23；7 -0.统计显著性与其它专业上的显著性的意义不同6 0 02、标准误：符号，表示抽样误差大小的指标；(1)当 p ,拒绝 H0,接受H1，按接受H1下结论，可能犯错误；所代表的总体均数间有无差别。3 13.可信区间比假设检验可提供更多的信息t,以外尾部面积的百分数是根据大量调查，已知健康成年男子脉搏的均数为72次/分，某医生在一山区随机调查了30名健康成年男子，求得脉搏均数为74.（统计量对参数的散度）山区成年男子平均脉搏数与一般成年男子不同。单个样本t检验:是样本均数代表的总体均数和已知总体均数的比较.01),区分大小概率事件的标准.t,以外尾部面积的百分数是H1：12，即不同性别健康人群脂蛋白有差别；u可以可以查表表某地某地12岁男孩身高均数的男孩身高均数的95%的可信区的可信区间.本例中本例中:n=100,=139.6,s=6.85,u0.05=1.96该地地12岁男孩身高均数的男孩身高均数的95%可信区可信区间为:138.3(cm)141.0(cm)差别无显著性，或无统计意义，我们只是认为以很大的把握拒绝原假22注意（1）统计意义：从总体中作大数次随机抽）统计意义：从总体中作大数次随机抽样，有样，有95%求得的可信区间包含总体均数。求得的可信区间包含总体均数。并不是做一次抽样求得可信区间包括并不是做一次抽样求得可信区间包括的概的概率是率是0.95，对一次抽样而言只有两种可能，对一次抽样而言只有两种可能，要么可信区间包含要么可信区间包含，要么不包含，要么不包含。（2）与医学正常值范围不同）与医学正常值范围不同注意（1）统计意义：从总体中作大数次随机抽样，有95%求得的23正常值范围估计与可信区间估计正常值范围估计与可信区间估计正常值范围正常值范围概念：绝大多数正常人的某概念：绝大多数正常人的某指标范围。（指标范围。（95%，99%,指绝大多数正常人）指绝大多数正常人）计算公式：计算公式：用途：判断观察对象的用途：判断观察对象的某项指标是否正常某项指标是否正常.可信区间可信区间概念：总体均数所在的数概念：总体均数所在的数值值范围（范围（95%，99%指可信指可信度）度）计算公式：计算公式：用途：估计总体均数用途：估计总体均数正常值范围估计与可信区间估计正常值范围可信区间24假设检验的意义和步骤假设检验的意义和步骤假设检验（假设检验（hypothesis test）也称显著性检验）也称显著性检验(significance test)。二十世纪二、三十年代。二十世纪二、三十年代Neyman和和Pearson建立了统计假设检验问题的建立了统计假设检验问题的数学模型。数学模型。假设检验假设检验:建立在统计抽样分布建立在统计抽样分布,小概率事件原理小概率事件原理基础上的对差别性质进行风险推断的一种逻辑思基础上的对差别性质进行风险推断的一种逻辑思维方法维方法.假设检验的意义和步骤假设检验（hypothesis test25假设检验：假设检验：1、原因2、目的3、原理4、过程（步骤）、过程（步骤）5、结果假设检验：261、假设检验的原因、假设检验的原因由于个体差异的存在，即使从同一总体中由于个体差异的存在，即使从同一总体中严格的随机抽样，严格的随机抽样，X1、X2、X3、X4、，、，不同。不同。因此，因此，X1、X2 不同有两种（而且只有两种）可能：不同有两种（而且只有两种）可能：（1）分别所代表的总体均数相同，由于抽样误差造）分别所代表的总体均数相同，由于抽样误差造成了样本均数的差别。差别无显著性成了样本均数的差别。差别无显著性。（2）分别所代表的总体均数不同。差别有显著性。）分别所代表的总体均数不同。差别有显著性。1、假设检验的原因由于个体差27 根据大量调查，已知健康成年男子脉搏的根据大量调查，已知健康成年男子脉搏的均数为均数为72次次/分，某医生在一山区随机调查分，某医生在一山区随机调查了了30名健康成年男子，求得脉搏均数为名健康成年男子，求得脉搏均数为74.2次次/分分,标准差为标准差为6.5次次/分，能否据此认分，能否据此认为该山区成年男子的脉搏均数高于一般人为该山区成年男子的脉搏均数高于一般人?根据大量调查，已知健康成年男子脉搏的均数为72次/分，283、确定P值，作出推断结论05的水准拒绝H0，接受H1，差异有统计学意义。5次/分,n=30,由于已知 ,故选用单样本t检验（1）t分布法（n,不能拒绝 H0,不能接受H1，按不能接受H1下结论，也可能犯错误；（95%，99%,指绝大多数正常人）山区成年男子平均脉搏数与一般成年男子不同。我我们们当当然然不不能能强强求求脉脉搏搏均均数数恰恰为为72次次/分分时时，才才认认为为山山区区成成年年男男子子的的脉脉搏搏均均数数和和一一般般人人一一样样，因因为为即即使使一一样样由由于于抽抽样样误误差差的的存存在在，样样本本均均数数未未必必等等于于72，造造成成山山区区健健康康成成年年男男子子的脉搏样本均数与一般人不同的原因有的脉搏样本均数与一般人不同的原因有:抽样误差抽样误差环境因素的影响环境因素的影响要回答这一问题就是假设检验问题要回答这一问题就是假设检验问题3、确定P值，作出推断结论我们当然不能强求脉搏均数恰为7292、假设检验的目的、假设检验的目的 l判断是由于何种原因造成的不同，以做判断是由于何种原因造成的不同，以做出决策。出决策。(推断参数是否相等推断参数是否相等)无效假设无效假设备择假设备择假设2、假设检验的目的判断是由于何种原因造成的不同，以做出303、假设检验的原理、假设检验的原理/思想思想反证法：当一件事情的发生只有两种可能反证法：当一件事情的发生只有两种可能A和和B，为了肯定其中的一种情况为了肯定其中的一种情况A，但又不能直接证实，但又不能直接证实A，这时否定另一种可能，这时否定另一种可能B，则间接的肯定了，则间接的肯定了A。小概率事件原理小概率事件原理:小概率事件在一次抽样中不可能小概率事件在一次抽样中不可能发生发生.概率论：事件的发生不是绝对的，只是可能性大概率论：事件的发生不是绝对的，只是可能性大小而已。即小而已。即,带有风险性的推断带有风险性的推断.3、假设检验的原理/思想反证法：当一件事情的发生只有两种可能314、假设检验的一般步骤、假设检验的一般步骤建立一对假设建立一对假设(注意单双侧注意单双侧)确定显著性水准（确定显著性水准（）:无效假设无效假设(H0)：两个总体均数相等；：两个总体均数相等；备择假设备择假设(H1)：与与 H0 相反相反;预先给定的概率值预先给定的概率值(0.05或或0.01),区分大小概率事件的标准区分大小概率事件的标准.如上例，如上例，H0：1=72 H1：172 =0.05 计算统计量：计算统计量：(选择不同的统计方法：选择不同的统计方法：u检验检验,t检验检验,F检验等检验等)确定概率值确定概率值p和做出统计推断结论和做出统计推断结论:(p值实际得到犯一类错误的可能性值实际得到犯一类错误的可能性,p,则统计则统计推断推断为为按按检验检验水准水准,接受接受H0,拒拒绝绝H1)4、假设检验的一般步骤建立一对假设(注意单双侧)确定显著325、假设检验的结果、假设检验的结果接受无效假设无效假设拒绝无效假设拒绝无效假设正确理解结论的概率性（都隐含着犯错误的可能正确理解结论的概率性（都隐含着犯错误的可能性）。性）。5、假设检验的结果接受无效假设33六、均数的假设检验t检验(t test)也称student t检验,是计量资料中最常用的假设检验方法,它以t分布为基础.本章将要介绍单个样本的单个样本的t检验检验 (样样本均本均值值与与总总体均体均值值的比的比较较)配对样本配对样本t检验检验两独立样本的两独立样本的t检验检验 (两两样样本均本均值值的比的比较较,方差方差一致一致)六、均数的假设检验t检验(t test)也称student 340 12.范围（95%，99%指可信度）横坐标为自由度，纵坐标为概率p，表中数字表示自由度为、p为、t的界值，记3、确定P值不必查表，双侧检验以u1.两独立样本的t检验 (两样本均值的比较,方差一致)该地12岁男孩身高均数的95%可信区间为:7 -0.如：把服用两种降糖药的病人配成对配对设计资料主要有三种类型：就有小样本统计量()的转换值服从t分布查表2，可得 t 0.单个样本t检验:是样本均数代表的总体均数和已知总体均数的比较.反映了用样本均数代替总体均数的可靠性程度的大小，增加样本容量可以降低抽样误差。男 193 3.(2)、区间估计（近似范围）（2）同一受试对象或同一样本的两个部分，分别接受两种不同处理：1、从正态总体中抽样，大样本均数的转换值服从标准正太分布(2)可得到一个样本均数及该样本标准误；3 1.3 1.单个样本单个样本t检验检验单个样本单个样本t检验检验:是样本均数是样本均数代表的总体均代表的总体均数数和已知总体均数和已知总体均数的比较的比较.适用条件：适用条件：(1)已知一个总体均数；已知一个总体均数；(2)可得到一个样本均数及该样本标准误；可得到一个样本均数及该样本标准误；(3)样本量小于样本量小于50；(4)样本来自正态或近似正态总体。样本来自正态或近似正态总体。0 12.单个样本t检验单个样本t检验35例例:根据大量调查根据大量调查,已知健康成年男子的脉搏已知健康成年男子的脉搏均数为均数为72次次/分分.某医生在某山区随机调查某医生在某山区随机调查30名健康男子名健康男子,求得脉搏均数为求得脉搏均数为74.2次次/分分,标准标准差为差为6.5次次/分分.能否认为该山区的成年男子的能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数脉搏均数高于一般成年男子的脉搏均数?例:根据大量调查,已知健康成年男子的脉搏均数为72次/分.36因本例已知因本例已知 =72次次/分分,=74.2次次/分分,s=6.5次次/分分,n=30,由于已知由于已知 ,故选用单样本故选用单样本t检验检验1、建立、建立检验检验假假设设，确定概率水准，确定概率水准山区成年男子平均脉搏数与一般成年男子相同。山区成年男子平均脉搏数与一般成年男子相同。山区成年男子平均脉搏数与一般成年男子不同。山区成年男子平均脉搏数与一般成年男子不同。2、计计算算检验统计检验统计量量在=0成立的条件下,计算统计量为:因本例已知 =72次/分,373、确定、确定p值值，做出推断，做出推断结论结论查表查表2，可得，可得 t 0.05/2(29)=2.045 今今t0.05,无统计学意义，按无统计学意义，按水准，不拒水准，不拒绝H0，尚不能，尚不能认为该山区成年男山区成年男子平均每分子平均每分钟脉搏数高于一般成年男子。脉搏数高于一般成年男子。3、确定p值，做出推断结论查表2，可得 t 0.05/2(38配对样本配对样本t检验检验配对样本配对样本t检验实际上是配对设计的差值均数检验实际上是配对设计的差值均数与总体均数与总体均数0比较的比较的t检验检验配对样本配对样本t检验的基本原理是假设两种处理的检验的基本原理是假设两种处理的效应相同效应相同,即即1=2,则1-2=0(即即,已知已知总体均体均数数d=0),即即检验差数的差数的样本均数本均数所代表的所代表的未知未知总体均数体均数d 与与0的比的比较.配对样本t检验配对样本t检验实际上是配对设计的差值均数与总体39公式：公式：自由度：对子数自由度：对子数-1适用条件：两组配对计量资料。适用条件：两组配对计量资料。公式：40（1）两种同）两种同质质受受试对试对象分象分别别接受两种接受两种处处理：理：如：把同窝、同性别和体重相近的动物配成一对。（2）同一受）同一受试对试对象或同一象或同一样样本的两个部分，分本的两个部分，分别别接受两种不同接受两种不同处处理：理：如：把服用两种降糖药的病人配成对（3）同一受）同一受试对试对象象处处理（理（实验实验或治或治疗疗）前后的）前后的结结果比果比较较：如：对高血压患者治疗前后配配对设计资对设计资料主要有三种料主要有三种类类型：型：（1）两种同质受试对象分别接受两种处理：配对设计资料主要有三41患者编号（1)舒张压（Kpa)治疗前后差数d（4）（2）（3)d2(5)=(4)*(4)手术前（2)手术后（2）1 16.0 12.0 4.0 16.002 12.0 13.3 -1.3 1.693 14.6 10.6 4.0 16.00 4 13.3 12.0 1.3 1.695 12.0 12.0 0 06 12.0 10.6 1.4 1.967 14.6 10.6 4.0 16.008 14.6 14.6 0 09 12.0 12.7 -0.7 0.4910 13.3 13.3 0 0合计 12.7 53.83患者编号舒张压（Kpa)治疗前后差数dd2手术前手术后1 42例例15-11 某医院在研究某医院在研究肾动肾动脉成形脉成形术术前后血液前后血液动动力力学的学的改改变变中，中，观观察了察了10例病人手例病人手术术前后的前后的血血压变压变化情况化情况见见表表15-6，试问试问手手术术前后舒前后舒张压张压有无有无变变化？化？1、建立检验假设，确定检验水准、建立检验假设，确定检验水准H0:d=0,即假设手术前后舒张压无变化，样本即假设手术前后舒张压无变化，样本是从差数均数为是从差数均数为0的总体中抽得。的总体中抽得。H1：d 0，即手术前后舒张压有变化。，即手术前后舒张压有变化。=0.05例15-11 某医院在研究肾动脉成形术前后血液动力学的改变432、计算检验统计量、计算检验统计量先计算差值先计算差值d及及d2,得得计算差值均数计算差值均数计算差值的标准差计算差值的标准差计算差值的标准误得计算差值的标准误得2、计算检验统计量446、可信区间与假设检验的联系与区别差别有显著性，或有统计意义，指我们有很大的把握认为原假设不正确，并非是说它们有较大的差别。0 12.1、建立检验假设，确定概率水准3、假设检验的原理/思想可信区间比假设检验可提供更多的信息7 -0.建立一对假设(注意单双侧)确定显著性水准（）:性别人数均值标准差预先给定的概率值(0.05/2(29)故，p0.自由度越小，t的临界点越偏离u的临界点。7 -0.1、建立检验假设，确定检验水准配对样本t检验实际上是配对设计的差值均数与总体均数0比较的t检验如单侧 =0.3 25例糖尿病患者随机分成两组，甲组单纯用药物治疗，乙组采用药物治疗合并饮食疗法，二个月后测空腹血糖(mmol/L)如表5-2 所示，问两种疗法治疗后患者血糖值是否相同？0 16.2选用的假设检验方法应符合其应用条件(2)可得到一个样本均数及该样本标准误；计算计算t值值、确定、确定p值，作出推断结论值，作出推断结论自由度自由度n-1=10-1=9,t 0.05(9)=2.262本例本例t t0.05(11),p0.05,按按0.05检验水检验水准，不拒绝准，不拒绝H0,即还不能认为手术前后的舒即还不能认为手术前后的舒张压不同。张压不同。6、可信区间与假设检验的联系与区别计算t值、确定p值，作出45两独立样本的两独立样本的t检验检验目的：目的：由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本所代表的总体均数间有无差别。所代表的总体均数间有无差别。计算公式及意义：计算公式及意义：公式：公式：两独立样本的t检验目的：由两个样本均数的差别推断两样本 46应用条件应用条件:（1）已知）已知/可可计计算两个算两个样样本均数及它本均数及它们们的的标标准准差差；（2）两个）两个样样本之一的例数少于本之一的例数少于50；（3）样样本来自正本来自正态态或近似正或近似正态总态总体；体；（4）方差方差齐齐。自由度：自由度：n1+n2 2 应用条件:自由度：n1+n2 2 47两独立样本两独立样本t t检验检验实例分析实例分析例例5.3 255.3 25例糖尿病患者随机分成两组，例糖尿病患者随机分成两组，甲组单纯用药物治疗，乙组采用药物治疗甲组单纯用药物治疗，乙组采用药物治疗合并饮食疗法，二个月后测空腹血糖合并饮食疗法，二个月后测空腹血糖(mmol/L)(mmol/L)如表如表5-2 5-2 所示，问两种疗法治疗所示，问两种疗法治疗后患者血糖值是否相同？后患者血糖值是否相同？两独立样本t检验实例分析例5.3 25例糖尿病患者随48抽样误差与假设检验t检验课件49两独立样本两独立样本t t检验检验检验步骤检验步骤1 1、建立检验假设，确定检验水准、建立检验假设，确定检验水准H H0 0：1 1=2 2，两种疗法治疗后患者血糖值的总，两种疗法治疗后患者血糖值的总体均数相同体均数相同;H H1 1：1 1 2 2，两种疗法治疗后患者血糖值的总体，两种疗法治疗后患者血糖值的总体均数不同；均数不同；0.050.05。2 2、计算检验统计量、计算检验统计量两独立样本t检验检验步骤1、建立检验假设，确定检验水准50两独立样本两独立样本t t检验检验检验步骤检验步骤代入公式，得代入公式，得:两独立样本t检验检验步骤代入公式，得:51两独立样本两独立样本t t检验检验实例分析实例分析按公式计算，算得按公式计算，算得:3 3、确定、确定P P值，作出推断结论值，作出推断结论两独立样本两独立样本t t检验自由度为检验自由度为 =n n1 1+n n2 2-2-2=12+13-2=23=12+13-2=23；查查t t界值表，界值表，t t0.05(23)0.05(23)=2.069=2.069，t t0.01(23)0.01(23)=2.807.=2.807.两独立样本t检验实例分析按公式计算，算得:52两独立样本两独立样本t t检验检验实例分析实例分析由于由于 t t0.01(23)0.01(23)t t t t0.05(23)0.05(23)，0.01 0.01 t 53配对配对t检验与两样本的检验与两样本的 t检验的比较检验的比较配对配对两样本两样本随机分配随机分配多次对间随机多次对间随机完全随机完全随机计算方法计算方法误差内涵误差内涵测量误差测量误差抽样误差抽样误差误差大小误差大小小小大大效率效率高高低低配对t检验与两样本的 t检验的比较配对两样本随机分配多次对间54两样本含量较大时均数的比较当样本含量较大时，可用u检验法某医院对4050岁年龄组的男、女不同性别的健康人群测定了脂蛋白有无差别？性别人数均值标准差男 193 3.97 1.04女 128 3.58 0.90两样本含量较大时均数的比较当样本含量较大时，可用u检验法性别551、建立假设并确定检验水准、建立假设并确定检验水准H0:1=2，即不同性即不同性别别健康人群健康人群脂蛋白脂蛋白无差无差别别；H1：12，即不同性即不同性别别健康人群健康人群脂蛋白有脂蛋白有差差别别；=0.051、建立假设并确定检验水准562、计算、计算u值值 2、计算u值 573、确定、确定P值值不必不必查查表，双表，双侧检验侧检验以以u1.96时时、P0.05，今，今u3.751.96，故，故p0.05。按。按=0.05的水准，拒的水准，拒绝绝H0，接受，接受H1。认为认为男性男性脂蛋白含量高于女性脂蛋白含量高于女性脂蛋白脂蛋白含量。含量。3、确定P值不必查表，双侧检验以u1.96时、P0.058t检验中的注意事项检验中的注意事项 1.要有严密的抽样研究计划要有严密的抽样研究计划要保证样本是从同质总体中随机抽取。要保证样本是从同质总体中随机抽取。除了对比的因素外，其它影响结果的因素应一致。除了对比的因素外，其它影响结果的因素应一致。2选用的假设检验方法应符合其应用条件选用的假设检验方法应符合其应用条件要要了了解解变变量量的的类类型型是是计计量量的的还还是是计计数数的的，设设计计类类型型是是配配对对设设计还是成组设计，是大样本还是小样本。计还是成组设计，是大样本还是小样本。t检验中的注意事项 1.要有严密的抽样研究计划59假设检验的结论是根据概率推断的，所以不是绝假设检验的结论是根据概率推断的，所以不是绝对正确的：对正确的：(1)当 p ,不能拒绝不能拒绝 H0,不能接受不能接受H1，按，按不能接受不能接受H1下结论，也可能犯错误；下结论，也可能犯错误；3.正确理解假设检验的结论（概率性）正确理解假设检验的结论（概率性）假设检验的结论是根据概率推断的，所以不是绝对正确的：3.正确604.正确理解差别有无显著性的统计意义正确理解差别有无显著性的统计意义差差别别有有显显著著性性，或或有有统统计计意意义义，指指我我们们有有很很大大的的把把握握认认为为原假设不正确，并非是说它们有较大的差别。原假设不正确，并非是说它们有较大的差别。差差别别无无显显著著性性，或或无无统统计计意意义义，我我们们只只是是认认为为以以很很大大的的把把握握拒拒绝绝原原假假设设的的理理由由还还不不够够充充分分，并并不不意意味味着着我我们们很很相相信它。信它。5.统统计计显显著著性性与与其其它它专专业业上上的的显显著著性性的的意意义义不不同同4.正确理解差别有无显著性的统计意义616、可信区间与假设检验的联系与区别、可信区间与假设检验的联系与区别1.可信区可信区间间也可以回答假也可以回答假设检验设检验的的问题问题 2.可信区可信区间间比假比假设检验设检验可提供更多的信息可提供更多的信息根据研究的目的和根据研究的目的和专业专业知知识识来决定来决定单单双双侧侧，在没有特在没有特别说别说明的情况下通常采取双明的情况下通常采取双侧侧。7.单侧检验与双侧检验单侧检验与双侧检验6、可信区间与假设检验的联系与区别1.可信区间也可以回答假62自由度：对子数-14 1.6 14.01),区分大小概率事件的标准.事先给定的概率1-称为可信度，常取95%或99%H0：1=2，两种疗法治疗后患者血糖值的总体均数相同;8 14.2选用的假设检验方法应符合其应用条件05的水准，拒绝H0，接受H1。计算差值的标准差计算差值的标准误得（）2N一定时，测量值的离散程度越小，用样本均数估计总体均数的抽样误差就越小。3 25例糖尿病患者随机分成两组，甲组单纯用药物治疗，乙组采用药物治疗合并饮食疗法，二个月后测空腹血糖(mmol/L)如表5-2 所示，问两种疗法治疗后患者血糖值是否相同？合计 12.在没有特别说明的情况下通常采取双侧。假设检验：又称显著性检验，是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。6 10.（）1标准误是一种特殊的标准差，其表示抽样误差的大小。4、假设检验的一般步骤9mol/d,标准差为5.（）2N一定时，测量值的离散程度越小，用样本均数估计总体均数的抽样误差就越小。1 16.假设检验中两类错误假设检验中两类错误第第 I 类错误和第类错误和第 II 类错误类错误假设检验的结果有两种。假设检验的结果有两种。(1)当拒绝拒绝 H0 时时,可能犯错误，可能可能犯错误，可能拒绝了实际上成立的拒绝了实际上成立的H0，称为称为类错误（类错误（“弃真弃真”的错误的错误），其概率大小用），其概率大小用表示。表示。(2）当）当不能拒绝不能拒绝 H0 时，也可能犯错误，时，也可能犯错误，没有拒绝实际上没有拒绝实际上不成立的不成立的H0,这类称为这类称为 II 类错误（类错误（“存伪存伪”的错误）的错误）,其其概率大小用概率大小用表示表示,值一般不能确切的知道。值一般不能确切的知道。自由度：对子数-1假设检验中两类错误第 I 类错误和第 63是非判断：（）1标准误是一种特殊的标准差，其表示抽样误差的大小。（）2N一定时，测量值的离散程度越小，用样本均数估计总体均数的抽样误差就越小。（）3假设检验的目的是要判断两个样本均数的差别有多大。是非判断：64

展开阅读全文

抽样误差与假设检验t检验课件

最新文档