4抽样误差与假设检验

资源描述

第四章第四章抽样误差与假设检验抽样误差与假设检验第一节第一节均数的抽样误差与标准误差均数的抽样误差与标准误差一、抽样误差一、抽样误差从总体当中随机抽取一份样本，计算均数。从总体当中随机抽取一份样本，计算均数。这个均数不同于总体的均数。为什么？这个均数不同于总体的均数。为什么？再从该总体中随机抽取一份样本，再计算均数。再从该总体中随机抽取一份样本，再计算均数。前后两个均数不等。为什么？前后两个均数不等。为什么？抽样误差！抽样误差！样本均数抽样分布具有如下特点：样本均数抽样分布具有如下特点：1 1、各样本均数未必等于总体均数；、各样本均数未必等于总体均数；2 2、各样本均数间存在差异；、各样本均数间存在差异；3 3、样本均数围绕总体均数呈正态分布；、样本均数围绕总体均数呈正态分布；4 4、样本均数变异范围较原变量变异范围大大缩小，、样本均数变异范围较原变量变异范围大大缩小，这这100100个样本均数的均数为个样本均数的均数为167.69cm167.69cm，标准差为，标准差为1.69cm1.69cm。在非正态分布总体中可进行类似抽样。在非正态分布总体中可进行类似抽样。可得到如下结论：可得到如下结论：若变量服从正态分布，则各样本均数也服从正态若变量服从正态分布，则各样本均数也服从正态分布。分布。若变量不服从正态分布，当样本量足够大时，各若变量不服从正态分布，当样本量足够大时，各样本均数样本均数近似近似服从正态分布，当样本量很小时，服从正态分布，当样本量很小时，则样本均数为非正态分布。则样本均数为非正态分布。样本均数的总体均数为样本均数的总体均数为，而样本均数的标准差比，而样本均数的标准差比原来个体值的标准差要小，为区别两者，我们用原来个体值的标准差要小，为区别两者，我们用来表示，其计算公式为来表示，其计算公式为（标准误）（标准误）反映样本均数间的离散程度。反映样本均数间的离散程度。（标准误的估计值）（标准误的估计值）例例1 2000年某研究所随机调查某地健康成年年某研究所随机调查某地健康成年男子男子27人，得到血红蛋白的均数为人，得到血红蛋白的均数为125g/L，标准，标准差为差为15g/L。试估计该样本均数的抽样误差。试估计该样本均数的抽样误差。标准差与标准误的区别与联系标准差与标准误的区别与联系标准差：描述个体值间的变异，标准差较小，表标准差：描述个体值间的变异，标准差较小，表示观察值围绕均数的波动较小，说明样本均数的代示观察值围绕均数的波动较小，说明样本均数的代表性就越好。表性就越好。标准误：描述样本均数的抽样误差，标准误较小，标准误：描述样本均数的抽样误差，标准误较小，表示样本均数与总体均数较接近。说明样本均数的表示样本均数与总体均数较接近。说明样本均数的可靠性。可靠性。用途用途标准差：表示变量值离散程度的大小，结合均数估计标准差：表示变量值离散程度的大小，结合均数估计参考值范围。参考值范围。标准误：表示抽样误差的大小，估计总体均数的可信标准误：表示抽样误差的大小，估计总体均数的可信区间。区间。与样本含量的关系与样本含量的关系标准差：随样本含量的增多，逐渐趋于稳定标准差：随样本含量的增多，逐渐趋于稳定标准误：随样本含量的增多逐渐减小。标准误：随样本含量的增多逐渐减小。联系联系 1 1、标准差与标准误都是变异指标，说明个体值之间、标准差与标准误都是变异指标，说明个体值之间差异是用标准差，说明样本均数之间差异时用标准差异是用标准差，说明样本均数之间差异时用标准误。误。2 2、当样本含量不变时，标准差越大，标准误越大。、当样本含量不变时，标准差越大，标准误越大。标准差和标准误的区别随机变量随机变量X XN N（m m，s s2 2）标准正态分布标准正态分布N N（0 0，1 12 2）Z变换标准正态分布标准正态分布N N（0 0，1 12 2）均数均数Student Student t t分布分布自由度：自由度：n n-1-1t 分布分布一、一、t t分布的概念分布的概念从正态总体从正态总体N(,2)中进行无数次样本含量为中进行无数次样本含量为n的随机抽样，每次均可得到一个的随机抽样，每次均可得到一个和一个和一个S，通过，通过公式转换，可得无数个公式转换，可得无数个t值，值，t值的分值的分布即为含量为布即为含量为n的的t值的总体或称值的总体或称t-分布。分布。t值的分布与自由值的分布与自由度度有关（实际有关（实际是样本含量是样本含量n不同）不同）。t 分布的图形不是分布的图形不是一条曲线，而是一条曲线，而是一簇曲线。一簇曲线。vt t分布曲线是单峰分布，以分布曲线是单峰分布，以0 0为中心，左右两侧对称为中心，左右两侧对称v曲线的中间比标准正态曲线（曲线的中间比标准正态曲线（Z Z分布曲线）低，两分布曲线）低，两侧翘得比标准正态曲线略高。侧翘得比标准正态曲线略高。vt t分布曲线随自由度分布曲线随自由度而变化，当样本含量越小而变化，当样本含量越小（严格地说是自由度（严格地说是自由度=n-1=n-1越小），越小），t t分布与分布与Z Z分分布差别越大；当逐渐增大时，布差别越大；当逐渐增大时，t t分布逐渐逼近于分布逐渐逼近于Z Z分分布，当布，当=时，时，t t分布就完全成正态分布分布就完全成正态分布。vt t分布曲线是一簇曲线，而不是一条曲线。分布曲线是一簇曲线，而不是一条曲线。vt t分布下面积分布规律：查分布下面积分布规律：查t t分布表。分布表。vt-分布曲线下面积为分布曲线下面积为1二、二、t 分布的图形和分布的图形和t 分布表分布表t分布曲线特点：分布曲线特点：同标准正态分布曲线一样，统计应用中最为关心的是t分布曲线下的尾部面积（即概率p）与横轴t值间的关系。为使用方便，统计学家编制了不同自由度v下的t界值表（附表2）。在t界值表中，横标目为自由度v，纵标目为概率p。表中数字表示当v和p确定时，对应的t临界值（critical value）。t t 分布表分布表该表中分别给出了单侧概率和两侧尾部面积之和的双侧概率所对应的t临界值。单侧概率相对应的t临界值用符号表示。双侧概率相对应的t临界值用符号表示。例如：当单侧概率p=0.05时，v=16，单侧当双侧概率p=0.05时，v=16，双侧 /2/2/20 0(b)(b)-t-t/2/2t t/2/2 /2/2/2单双侧单双侧t t分布示意图分布示意图T T为单侧临界值为单侧临界值T T/2/2为单侧临界值为单侧临界值0 0(a)(a)t t在相同自由度时，值越大，概率p越小；从t界值表中亦可看出：而在相同t值时，双侧概率p为单侧概率p的两倍。即：第四章第四章抽样误差与假设检验抽样误差与假设检验第一节第一节均数的抽样误差与标准误差均数的抽样误差与标准误差统计推断包括参数估计和假设检验。参数估计就统计推断包括参数估计和假设检验。参数估计就是用样本指标（统计量）来估计总体指标（参数）。是用样本指标（统计量）来估计总体指标（参数）。第二节第二节总体均数的估计总体均数的估计参数估计参数估计点估计点估计(point estimation)区间估计区间估计(interval estimation)一、参数估计的概念一、参数估计的概念，即认为即认为20002000年该地所有健康成年男性血红年该地所有健康成年男性血红蛋白量的总体均数为蛋白量的总体均数为125125g/L。1.点估计点估计：用样本统计量直接作为总体参数的估计值用样本统计量直接作为总体参数的估计值。例如例如于于2000年测得某地年测得某地2727例健康成年男性血红蛋白量例健康成年男性血红蛋白量的样本均数为的样本均数为125125g/L，试估计其总体均数。试估计其总体均数。按预先给定的概率按预先给定的概率(1)估计总体参数的可能范估计总体参数的可能范围围，该范围就称为该范围就称为总体参数的总体参数的总体参数的总体参数的1 1 可信区间可信区间可信区间可信区间。可信区间由两个数值即可信区间由两个数值即可信限可信限可信限可信限构成，其中最小值构成，其中最小值称为下限，最大值称为上限。严格讲，可信区间不包称为下限，最大值称为上限。严格讲，可信区间不包括上下限两个端点值。括上下限两个端点值。2 2、区间估计区间估计预先给定的概率(1)称为可信度可信度可信度可信度，常取95%或99%。如无特别说明，一般取双侧95%。可信区间的含义是：有（1-）的把握认为总体参数位于该区间内。而不是总体参数落在该范围的可能性为。从总体中作随机抽样，根据每个样本可以算得一个置信区间。95%的置信区间，意味着作100次抽样，算得100个置信区间，平均有95个置信区间包括了总体均数，只有5个不包括。5%是小概率事件，在一次试验中出现的可能性很小。因此就认为总体均数在算得的置信区间内，可信度是95%，犯错误的概率是5%。总体均数可信区间的计算总体均数可信区间的计算 1.1.1.1.未知且样本例数未知且样本例数未知且样本例数未知且样本例数n n n n较小时，按较小时，按较小时，按较小时，按t t t t分布原理分布原理分布原理分布原理:t t/2,/2,是按自由度是按自由度=n-1=n-1，由附表由附表2 2查查得的得的t t值值。99%的双侧置信区间：的双侧置信区间：95%的双侧置信区间：的双侧置信区间：例例2 2 已知某地已知某地2727例健康成年男性血例健康成年男性血红红蛋白量的均数蛋白量的均数为为，标准差标准差S=15g/LS=15g/L,试问该地试问该地健康成年男性血健康成年男性血红红蛋白量蛋白量的的95%95%和和99%99%置信区间。置信区间。95%CI：99%CI：本例本例n=27n=27，S=15S=152.2.已知已知，按标准正态分布原理计算，按标准正态分布原理计算，按标准正态分布原理计算，按标准正态分布原理计算 Z Z/2/2为标准正态变量，为标准正态变量，Z Z/2/2相当于按相当于按=时及时及P P取取，由附由附表表2 2查的的查的的t t界值。界值。95%95%的双侧置信区间：的双侧置信区间：99%99%的双侧置信区间：的双侧置信区间：3.3.若若未知，未知，但样本例数但样本例数但样本例数但样本例数n n n n足够大（足够大（足够大（足够大（n n n n50505050）时）时）时）时由由t t分布可知，自由度越大，分布可知，自由度越大，t t分布越逼近标准正分布越逼近标准正态分布，此时态分布，此时t t曲线下有曲线下有95%95%的的t t值约在值约在1.96之间，即99%的双侧置信区间：95%的双侧置信区间：例例3 3 某市某市20002000年随机测量了年随机测量了9090名名1919岁健康男大学生的岁健康男大学生的身高，其均数为身高，其均数为172.2cm172.2cm，标准差为标准差为4.5cm,4.5cm,，试估计试估计该地该地1919岁健康男大学生的身高的岁健康男大学生的身高的95%95%置信区间。置信区间。该市该市1919岁健康男大学生的身高的岁健康男大学生的身高的95%95%置信区间置信区间(171.3,173.1)cm(171.3,173.1)cm可信区间的确切含义可信区间的确切含义 95%95%的可信区间的理解：的可信区间的理解：1 1、所要估计的总体参数有、所要估计的总体参数有95%95%的可能在我们所估计的的可能在我们所估计的可信区间内。可信区间内。2 2、从正态总体中随机抽取、从正态总体中随机抽取100100个样本，可算得个样本，可算得100100个个样本均数和标准差，也可算得样本均数和标准差，也可算得100100个均数的可信区间，个均数的可信区间，平均约有平均约有9595个可信区间包含了总体均数。个可信区间包含了总体均数。3 3、但在实际工作中，只能根据一次试验结果估计可、但在实际工作中，只能根据一次试验结果估计可信区间，我们就认为该区间包含了总体均数信区间，我们就认为该区间包含了总体均数。意义意义意义意义：95%的参考值范围是指同质总体内包括的参考值范围是指同质总体内包括95%个体值个体值的估计的估计范围。范围。若总体为正态分布，常按计算。95%的可信区间是指按的可信区间是指按95%的置信度估计的的置信度估计的总体参数总体参数的所的所在范围。若为大样本，按在范围。若为大样本，按计算。计算。计算上计算上计算上计算上：置信区间用标准误，参考值范围用标准差。置信区间用标准误，参考值范围用标准差。思考！思考！均数置信区间与参考值范围的区别均数置信区间与参考值范围的区别思考！思考！均数置信区间与参考值范围的区别均数置信区间与参考值范围的区别计算上计算上计算上计算上：置信区间用标准误，参考值范围用标准差。置信区间用标准误，参考值范围用标准差。第四章第四章抽样误差与假设检验抽样误差与假设检验第一节第一节均数的抽样误差与标准误差均数的抽样误差与标准误差一、假设检验的概念：一、假设检验的概念：一般科研程序一般科研程序:假说假说-验证验证-对假说作出结对假说作出结论论统计上的假设检验统计上的假设检验:假设检验亦称为显著性检验，是先对总假设检验亦称为显著性检验，是先对总体的参数或分布作出某种假设，然后用适当体的参数或分布作出某种假设，然后用适当的方法，根据样本对总体提供的信息，推断的方法，根据样本对总体提供的信息，推断此假设应当被拒绝或不拒绝。此假设应当被拒绝或不拒绝。什么是假设检验？3.3.特点特点 (1)采用逻辑上的反证法(2)依据统计上的小概率原理1.1.概念概念事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立2.2.类型类型 (1)参数假设检验 (2)非参数假设检验假设检验的基本原理假设检验的基本原理抽样误差所致抽样误差所致（来自同一总体）（来自同一总体）P0.05=P0.05=?假设检验回答假设检验回答P0.05=P0.05=环境条件影响环境条件影响（来自不同总体）（来自不同总体）反反证证法法小小概概率率思思想想先对总体的参数或分布作出某种假设，再用先对总体的参数或分布作出某种假设，再用适当的方法根据样本对总体提供的信息，推断此适当的方法根据样本对总体提供的信息，推断此假设应当拒绝或不拒绝。假设应当拒绝或不拒绝。如果第一种可能性较小时，可以拒绝它而接受如果第一种可能性较小时，可以拒绝它而接受后者，统计上称后者，统计上称差异有统计学意义差异有统计学意义。本例两个均数不等有两种可能性：本例两个均数不等有两种可能性：山区成年男子的脉搏总体均数与一般健康成年男山区成年男子的脉搏总体均数与一般健康成年男子的脉搏总体均数是相同的，差别仅仅由于抽样子的脉搏总体均数是相同的，差别仅仅由于抽样误差所致误差所致,来自同一总体；来自同一总体；受山区某些因素的影响，两个总体的均数是不相受山区某些因素的影响，两个总体的均数是不相同的同的,有本质性区别有本质性区别,不是来自同一总体。不是来自同一总体。如果第一种可能性较大时，可以接受它，统计如果第一种可能性较大时，可以接受它，统计上称上称差异无统计学意义差异无统计学意义；如何作出判断呢？按照逻辑推理如何作出判断呢？按照逻辑推理:假设检验的基本步骤假设检验的基本步骤:检验水准检验水准(亦称显著性水准亦称显著性水准)符号为符号为，是一个预先给定概率值。是一个预先给定概率值。1 1建立检验假设、确定检验水准和单双侧建立检验假设、确定检验水准和单双侧检验假设检验假设无效假设无效假设备择假设备择假设符号为符号为H H0 0:1 12 2 符号为符号为H H1 1:1 12 2 即假设均数来自同一总体，它们的即假设均数来自同一总体，它们的总体均数相同，样本均数间无本质总体均数相同，样本均数间无本质的不同，差别仅由抽样误差引起；的不同，差别仅由抽样误差引起；即假设均数来自不同总体，它们之即假设均数来自不同总体，它们之间的差别存在本质的不同，并非仅间的差别存在本质的不同，并非仅由抽样误差引起。由抽样误差引起。确定检验水准：确定检验水准：亦称为显著性水准，符号为，是预先给定的概率值。是判定样本指标与总体指标或两样本指标间的差异有无统计学显著性意义的概率水准，在实际工作中，常取0.05。可根据不同的研究目的给予不同的设置，如方差齐性检验，正态性检验常取0.1或0.2。双侧检验与单侧检验(假设的形式假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0m=m0H1m m0m m0H H1 1的内容反映出检验的单双侧。的内容反映出检验的单双侧。2 2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量（1 1）根据资料的类型、设计类型、检验方法的适用）根据资料的类型、设计类型、检验方法的适用条件等选择检验方法条件等选择检验方法（2 2）不同的检验方法要用不同的公式计算检验统计）不同的检验方法要用不同的公式计算检验统计量量（3 3）不同的设计类型要用不同的公式）不同的设计类型要用不同的公式(t(t值、值、u u值、值、2 2值等值等 )4 4、确定、确定P P值和作出推断结论值和作出推断结论（1 1）P P值：指从值：指从H H0 0所规定的总体中进行随机抽样，所规定的总体中进行随机抽样，抽得等于及大于（或等于及小于）现有样本获得的抽得等于及大于（或等于及小于）现有样本获得的检验统计量值（如检验统计量值（如t t值或值或u u值）的概率。值）的概率。（2 2）方法：）方法：查表查表将将P P与预先规定的概率（检验水准与预先规定的概率（检验水准）比较）比较作出结论作出结论若若PP结论：按所取结论：按所取检验水准，拒绝检验水准，拒绝H H0 0，接，接受受H H1 1，有统计学意义（差异有显著性），可认为，有统计学意义（差异有显著性），可认为不同或不等（高于或低于）；不同或不等（高于或低于）；若若PP结论：按按所取结论：按按所取检验水准，不拒绝检验水准，不拒绝H0H0，无统计学意义（差异无显著性），还不能认为无统计学意义（差异无显著性），还不能认为不同不同或不等。或不等。注意注意：下结论时，对：下结论时，对H H0 0只能说拒绝或不拒绝；对只能说拒绝或不拒绝；对H H1 1只能说接受只能说接受H H1 1。作出推断结论作出推断结论当：当：t 0.05 (差异无显著性差异无显著性)t 0.01()t t 0.05()0.01 按所取检验水准不拒绝按所取检验水准不拒绝H0 P 按所取检验水准拒绝按所取检验水准拒绝H01 1、表示均数抽样误差大小的统计指标是（、表示均数抽样误差大小的统计指标是（）A A、标准差、标准差 B B、方差、方差 C C、均数标准误、均数标准误D D、变异系数、变异系数 E E、样本标准误、样本标准误2 2、表示（表示（）A A、总体均数、总体均数 B B、样本均数的标准差、样本均数的标准差C C、总体均数的离散程度、总体均数的离散程度 D D、变量值、变量值x x的离散程度的离散程度E E、变量值、变量值x x的可靠程度的可靠程度C CB BC C3 3、标准误越大，则表示此次抽样得到的样本频率、标准误越大，则表示此次抽样得到的样本频率（）A A、系统误差越大、系统误差越大 B B、可靠程度越大、可靠程度越大 C C、抽样误差越大、抽样误差越大 D D、可比性差、可比性差 E E、代表性差、代表性差4 4、要减少抽样误差，通常的做法是（、要减少抽样误差，通常的做法是（）A A、适当增加样本例数、适当增加样本例数 B B、将个体变异控制在一个范围内、将个体变异控制在一个范围内 C C、严格挑选观察对象、严格挑选观察对象D D、增加抽样次数、增加抽样次数 E E、减少系统误差、减少系统误差A A

展开阅读全文

4抽样误差与假设检验

最新文档