统计学第7章假设检验

资源描述

,单击此处编辑母版标题样式,/,*,统计学教程,第,7,章假设检验,统计学教程,第,7,章假设检验,7.1,假设检验的一般问题,7.1.1,小概率原理,7.1.2,假设检验的一般步骤,7.1.3,假设检验两类错误,7.1.4,双侧检验和单侧检验,7.1.5,P,值,7.2,单一总体参数的假设检验,7.2.1,总体均值的假设检验,7.2.2,总体比例的假设检验,7.2.3,总体方差的假设检验,7.3,两个总体参数的假设检验,7.3.1,两个总体均值之差的假设检验,7.3.2,两个总体比值之差的假设检验,7.3.3,两个总体方差之比的假设检验,/,7:06 PM,第,6,章,抽样分布与参数估计,统计学教程,6.1,抽样分布,统计学教程,第,6,章抽样分布与参数估计,6.1,抽样分布,6.1.2,大数定律和中心极限定理,1,大数定律,在对客观事物及其现象进行观测和实验中，随着观测或实验的次数增多，事件发生的频率和均值逐渐地趋于某个常数。,（,1,）贝努利定理（,Bernoulli Theorem,）,（,6.1,）,贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而以严格的数学形式表述了频率的稳定性特征，即,n,当很大时，事件发生的频率与概率之间出现较大的偏差的可能性很小。由此，在,n,充分大的场合，可以用事件发生的频率来替代事件的概率。,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.1,抽样分布,（,2,）车比雪夫定理（,Chebyshev,Theorem,）,设随机变量相互独立，且具有相同的有限的数学期望和方差，对于任意正整数有,（,6.2,）,称序列,依概率收敛于总体均值,。即,当,n,充分大时,，车比雪夫不等式几乎都是成立的；当,n,趋于无穷大时，,n,个随机变量的均值趋于总体均值。,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.1,抽样分布,2,中心极限定理,在客观现实中，有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的，任何一个因素在总的影响中的作用都是微小的，这种随机变量往往近似地服从正态分布。,中心极限定理（,Central Limit Theorem,）,反映了随机变量近似地服从正态分布的特征。,中心极限定理是大样本推断的理论基础。,独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机变量相互独立，服从同一分布，且具有相同的有限的数学期望和方差，则,（,6.3,）,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.1,抽样分布,2,中心极限定理,在客观现实中，有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的，任何一个因素在总的影响中的作用都是微小的，这种随机变量往往近似地服从正态分布。,中心极限定理（,Central Limit Theorem,）,反映了随机变量近似地服从正态分布的特征。中心极限定理是大样本推断的理论基础。,独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机变量相互独立，服从同一分布，且具有相同的有限的数学期望和方差，则,（,6.3,）, 讨论题,大数定律和中心极限定理对于参数估计的意义。,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.1,抽样分布,6.1.3,三种分布,1,总体分布,总体分布（,Population Distribution,）,是指由客观存在的，构成总体的个体所形成的频数分布，及其相关参数数值。例如，当研究某一企业职工收入情况时，该企业全体职工的收入状况的频数分布，以及反映该企业全体职工收入状况的均值、方差、偏态系数和峰度系数，从不同角度综合描述了这一总体的分布特征。,我们往往是通过对构成总体的部分个体进行观察，即通过样本数据计算的统计量，例如样本均值、样本方差、样本偏态系数和样本峰度系数，以及样本的频数分布来推断总体参数，用样本分布来估计总体分布。,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.1,抽样分布,2,样本分布,样本分布（,Sample Distribution,）,是指由构成样本的个体所形成样本的,频数分布，以及计算出来的相关统计量,。,样本中的个体都是来自于总体，具有总体的相关信息和基本特征，样本分布是总体分布的一个映象，一个缩影。当,样本容量,充分大时，样本分布趋近于总体分布。,样本分布是指某一个具体的样本中的个体数量特征,。由于样本是随机抽取的，每一次抽取的样本中的个体不尽相同，每一个具体的样本分布也会与对应的总体分布存在或大或小的偏误，根据样本计算的统计量是随机变量。,（随机抽取的）样本的分布与客观的总体分布之间的误差，需要借助抽样分布概念。,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.1,抽样分布,3,抽样分布,抽样分布（,Sampling Distribution,）,是指从同分布总体中，独立抽取的相同样本容量的,样本统计量,的,概率分布,。所以，,抽样分布是样本分布的概率分布，抽样分布是抽样理论的研究对象。,抽样分布反映了依据样本计算出来的统计量数值的概率分布，这是科学地进行统计推断的基础。例如，在大样本场合，由中心极限定理有样本均值趋于正态分布。,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.1,抽样分布,3,抽样分布,抽样分布（,Sampling Distribution,）,是指从同分布总体中，独立抽取的相同样本容量的,样本统计量,的概率分布。所以，,抽样分布是样本分布的概率分布，抽样分布是抽样理论的研究对象。,抽样分布反映了依据样本计算出来的统计量数值的概率分布，这是科学地进行统计推断的基础。例如，在大样本场合，由中心极限定理有样本均值趋于正态分布。, 讨论题,为什么说抽样分布是抽样理论研究的对象，解释三种分布之间的联系。,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.1,抽样分布,6.1.4,样本均值的抽样分布,1,大样本场合下的样本均值抽样分布,在反复抽取容量相同的独立同分布样本条件下，所得到的样本均值的概率分布称为样本均值的抽样分布。在样本容量充分大的情况下，即大样本场合，样本均值依据中心极限定理趋于正态分布。,所谓独立同分布样本为从无限总体中随机抽取的等概样本，或从有限总体中以放回方式，随机抽取的等概样本。,所谓大样本是指能够满足中心极限定理要求，使样本均值趋于正态分布的样本容量。在统计实践中一般称样本容量大于,30,即为大样本这只是一个粗略的经验数值。,有离散变量样本均值的计算公式,（,6.4,）,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.1,抽样分布,在样本容量充分大的场合下，样本均值渐进地趋于数学期望为总体均值，方差为总体方差的,n,分之一的正态分布，即,样本均值的数学期望为总体均值，表明从平均的观点来看，用样本均值估计总体均值不存在偏差，即具有无偏性；样本均值的方差为总体方差的,n,分之一，表明只要总体方差是有限的，那么随着样本容量的增大，样本均值的方差相应减小，用样本均值估计总体均值的误差也相应减小。同时可以由总体方差和样本容量，精确地计算出这一样本均值的方差，并且用这一样本方差度量使用样本均值估计总体均值的误差。,通过对样本均值的标准化处理，在用样本均值估计总体均值时，可以使用标准正态分布来计算抽样误差出现的概率。,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.2,参数估计的一般问题,6.2.3,点估计量的评价准则,在参数的点估计中，可以从一致性、无偏性和有效性三个方面对点估计量进行评价。,1,一致性,一致性（,Consistency,）,是指当样本容量趋于无穷大时，估计量依概率收敛于总体参数。即,（,6.25,）,则称为的满足一致性准则的估计量，一般称之为一致估计量。,一致估计量随着样本容量的增大，其数值越来越接近被估计的总体参数。,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.2,参数估计的一般问题,2,无偏性,无偏性（,Unbiasedness,）,是指估计量的数学期望等于未知的总体参数真值。即,（,6.26,）,则称为的满足无偏性准则的估计量，一般称之为无偏估计量。,样本均值是总体均值的一个无偏估计量。,（,6.27,）,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.2,参数估计的一般问题,2,无偏性,无偏性（,Unbiasedness,）,是指估计量的数学期望等于未知的总体参数真值。即,（,6.26,）,则称为的满足无偏性准则的估计量，一般称之为无偏估计量。,样本均值是总体均值的一个无偏估计量。,（,6.27,）, 讨论题,总体方差的最大似然估计量和矩估计量是否均为无偏估计量。,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.2,参数估计的一般问题,3,有效性,有效性（,Effectiveness,）,是指采用均方误差对估计量精确程度的测定，通常表现为两个估计量的均方误差之比。,均方误差就是一个测定估计量本身的离散程度，以及估计量数学期望与总体相关参数的真值的偏倚程度的测度。,均方误差（,Mean Square Error,）,是估计量与总体参数真值的离差的平方的数学期望，有,（,6.28,）,若将估计量的数学期望与总体参数真值的离差记为，称为估计量的偏差，作为反映估计量与总体参数真值偏倚程度的测度。则可将式（,6.23,）写为,（,6.29,）,/,7:06 PM,统计学教程,第,6,章抽样分布与参数估计,6.2,参数估计的一般问题,均方误差是由估计量的方差和偏差两部分组成。其中估计量的方差反映的是估计量本身的离散程度；估计量的偏差反映的是估计量的数学期望与总体参数真值的偏倚程度。,当两个估计量均为无偏估计量时，均方误差的式（,6.29,）中的第二项为,0,，只剩下第一项估计量的方差。这时只要比较估计量的方差就可以对其有效性进行评价。,从计算均方误差的式（,6.29,）可知，对于一个估计量的评价，需要综合分析它对于相关总体参数的估计误差，不能简单地认为一个无偏的估计量就一定优于一个有偏的估计量，还要具体度量有偏估计量的偏倚程度，以及两个估计量的有效性。所以，有效性是评价估计量的一个综合性的重要的准则。,/,7:06 PM,第,7,章假设检验,7.1,假设检验的一般问题,统计学教程,统计学教程,第,7,章假设检验,7.1,假设检验的一般问题,7.1.1,小概率原理,小概率原理（,Small Probability Theory,）,是指在发生概率很小的随机事件在一次实验中几乎是不可能发生的。,小概率原理是统计假设检验判定接受或拒绝假设的标准和依据。由于概率很小的随机事件在一次实验中几乎是不可能发生的，假如概率很小的随机事件，在一次实验中竟然发生了，则认为假设条件不正确，将原先设定的假设推翻，即拒绝原先设定的假设。,/,7:06 PM,统计学教程,第,7,章假设检验,7.1,假设检验的一般问题,7.1.2,假设检验的一般步骤,一般可以将假设检验的步骤归纳为五个部分。,1,提出原假设和备择假设,原假设,（,Null Hypothesis,）,是指通过样本信息来推断正确与否的命题，也称为零假设。,备择假设,（,Alternative Hypothesis,）,是指原假设对立的命题，是原假设的替换假设。,2,选定适当的检验统计量,如同参数估计，假设检验同样是从,抽样分布,出发，借助样本统计量进行的统计推断。在假设检验中的样本统计量称为检验统计量。,检验统计量,（,Test Statistic,）,是指根据样本数据计算得到的，对原假设进行判断的样本统计量。,/,7:06 PM,统计学教程,第,7,章假设检验,7.1,假设检验的一般问题,3,确定适当的显著性水平,显著性水平,（,Significance Level,）,是指,正确的原假设遭到拒绝的错误发生的概率。,显著性水平一般取,0.1,、,0.05,或,0.01,等数值。显著性水平的具体是根据研究目的，有关条件，假设检验量等具体情况，由人们主观确定的。,各类统计软件在给出检验统计量的数值时，一般都给出该检验统计量数值的相伴概率，即,p,值。,p,值,是根据检验统计量的数值，及其相关概率分布，自由度等计算出来的,实际的临界显著性水平,，反映了由该检验统计量进行假设检验时，发生正确的原假设遭到拒绝的错误的实际概率水平。,/,7:06 PM,统计学教程,第,7,章假设检验,7.1,假设检验的一般问题,4,计算检验统计量的数值,检验统计量的数值一般也称为检验统计值。,5,假设检验的判断,假设检验的判断是根据选定的显著性水平和检验统计量的分布，确定拒绝域的临界值，将检验统计量的数值与临界值相比较，进而作出接受或者拒绝原假设的判断的方法和过程。,拒绝域（,Rejection Region,）,是指检验统计量拒绝原假设的所有取值的集合。,临界值（,Critical Value,）,是指根据选定的显著性水平所确定的拒绝域的边界数值。,拒绝域是由显著性水平确定的一个数值区间，若由样本数据计算的检验统计量的数值落在这个区间里，就拒绝原假设，否则将接受原假设。,拒绝域的界定是根据具体的显著性水平所计算的临界值，计算出了临界值，也就确定了拒绝域。,/,7:06 PM,统计学教程,第,7,章假设检验,7.1,假设检验的一般问题,7.1.3,假设检验的两类错误,假设检验的判断是建立样本分布的基础上，依据一定的概率水平进行的统计推断。,假设检验将可能出现的错误分为第,类错误和第,II,类错误两种类型。,第,类错误（,Typeerror,）,是指当原假设为真时拒绝原假设的错误，又称为弃真错误。,通常将犯第,类错误的概率记为,。,这个概率就是显著性水平。因此，显著性水平又可表述为犯第,类错误的概率。,第,II,类错误（,Type II error,）,是指当原假设为假时接受原假设的错误，又称为取伪错误。,通常将犯第,II,类错误的概率记为,。,从而，在假设检验中进行判断时，存在判断正确和判断错误的四种概率。,/,7:06 PM,统计学教程,第,7,章假设检验,表,3.1,假设检验中四种结果发生的概率,在假设检验中，人们总是希望能够进行正确的判断，犯这两类错误的概率越小越好。然而，在样本容量一定的前提下，犯这两类错误的概率是互为消长的。若减小犯第,类错误的概率，就增大了犯第,II,类错误的概率，同样，若减小犯第,II,类错误的概率，就增大了犯第,类错误的概率。,7.1,假设检验的一般问题,/,7:06 PM,统计学教程,第,7,章假设检验,7.1,假设检验的一般问题,图,7.1,假设检验中出现两类错误的示意图,/,7:06 PM,统计学教程,第,7,章假设检验,7.1,假设检验的一般问题,7.1.4,双侧检验和单侧检验,1,双侧检验,双侧检验（,Two-Sides test,）,是指在数轴上的两端同时设置拒绝域的边界数值，同时进行控制的假设检验。双侧检验的备择假设是指没有特定的方向性，含有“”运算符号的假设检验，一般也称为双尾检验（,Two-Tailed test,）。,如图所示，在双侧检验中需要在概率分布的两端，各二分之一显著性水平的位置上确定拒绝域边界的临界数值，从而保证了样本落在接受域的概率仍为。,/,7:06 PM,统计学教程,第,7,章假设检验,7.1,假设检验的一般问题,2,单侧检验,单侧检验（,One-Side test,）,是指仅在数轴上的一端设置拒绝域的边界数值，只进行单一方向控制的假设检验。单侧检验的备择假设在数轴上具有特定的方向性，是一种包含“,”,运算符号的假设检验，一般也称为单尾检验（,One-Tailed test,）。,如图所示，在单侧检验中只需要在概率分布的某一端的显著性水平的位置上，确定拒绝域边界的临界数值，进行显著性检验。单侧检验方向，即设置拒绝域的边界数值的位置，可以是在概率分布的右端或者左端，这两种方式均使样本落在接受域的概率为。,/,7:06 PM,统计学教程,第,7,章假设检验,7.1,假设检验的一般问题,7.1.5 p,值,p,值,（,P-Value,）,是当原假设为真时，由样本信息给出的犯第,类“弃真”错误的概率的精确数值，所以也称为观察到的显著性水平（,Observed Significance Level,）。,各种统计软件在计算各类检验统计量时，均会同时给出与具体检验统计值相对应的,p,值，因此,p,值又称为相应的检验统计量的相伴概率（,Concomitant Probability,）。,利用,p,值进行假设检验的判断，不仅可以依据值与设定显著性水平数值进行比较，当,p,值大于显著性水平时就拒绝原假设，当,p,值小于显著性水平时就接受原假设；而且还可以知道在接受原假设时，,p,值小于显著性水平的具体数值，以及犯第,类“弃真”错误的确切概率。,/,7:06 PM,第,7,章假设检验,7.2,单一总体参数的假设检验,统计学教程,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,7.2.1,总体均值的假设检验,1,大样本总体均值的假设检验,由抽样分布可知，在大样本场合样本均值趋于正态分布，并且有样本均值的标准差为总体标准差除以样本容量的平方根。由此可得,（,7.1,）,在总体方差已知时，样本均值的方差也已知，所以式（,7.1,）可写为,（,7.2,）,当总体方差未知时，采用,样本方差,来替代总体方差，这时检验统计量为,（,7.3,）,/,7:06 PM,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,例,7.4,某大学为了培养一年级新生良好的自我管理能力和自习习惯，规定晚自习时间为,3,小时。根据历史数据，一年级新生晚自习时间长度服从正态分布。该大学教学管理部门在新生入学后的第,12,周进行了一次一年级新生晚自习时间调查，随机抽取了,100,名新生的晚自习时间长度数据构成样本，计算得样本均值为,2.8,小时,，假设的总体均值为,3,小时，样本容量为,100,。此外，已知总体标准差为,0.8,小时。,要求,取显著性水平为,5%,，试检验总体均值与学校规定的,3,小时（假设的总体均值）之间有无显著差异。,解,对其进行双侧检验。,（,1,）提出零假设和备择假设，为,（,2,）确定检验统计量。本例样本容量为,100,，属大样本，并且总体标准差已知，因此采用式（,7.2,）的,Z,检验统计量进行检验。,/,7:06 PM,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,（,3,）确定显著性水平。选定的显著性水平为。在双侧检验场合，需要在正态总体曲线的左右两端尾部确定临界点，并构成拒绝域，在本例中有显著性水平。,（,4,）计算检验统计量。根据式（,7.2,）计算得,（,5,）进行判断。,通过查阅正态分布表，或借助,Excel,的,NORMSINV,函数计算。显著性水平为,0.025,时，有。由,教材,P.323,，,可查得，当显著性水平,0.975,时，有。由于,-2.5,，小于左端临界值,-1.96,，处在拒绝域中，因此拒绝零假设，认为该校一年级新生晚自习时间长度的总体均值与学校规定的,3,小时（假设的总体均值）之间存在显著差异。,/,7:06 PM,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,例,7.5,若仅仅将例,7.4,中的样本容量由,100,减少到,36,，其它条件都不变。,要求,仍然取显著性水平为,5%,，试检验总体均值与学校规定的,3,小时（假设的总体均值）之间有无显著差异。,解,由于本例与例,7.4,相比较，仅仅是样本容量减少，其它条件都不变。仍采用检验统计量进行检验，则所影响到的只是样本容量减少引起,Z,检验统计量取值的减小，以及由样本容量减少导致的犯第,I,类错误的概率，或者第,II,类错误的概率的增大。仍采用式（,7.2,）计算检验统计量，有,由于，小于临界值,-1.96,，处在接受域中，因此接受零假设（,不能拒绝零假设,），认为该校一年级新生晚自习时间长度的总体均值与学校规定的,3,小时（假设的总体均值）之间没有显著差异。,/,7:06 PM,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,同一个问题，为什么当样本容量减少时反倒由拒绝原假设，转为接受原假设了呢？,这是因为显著性水平没有变，在样本容量减少时，为了保证犯第,类错误的概率不变，即犯“弃真” 错误的风险不增大，只有通过扩大接受域来实现，就会导致犯第,II,类错误的概率的相应增大，增加“取伪”的风险。,这意味着在样本容量减少时，若显著性水平不变，即犯第,类错误的概率不变，必然导致犯第,II,类错误的概率增大。即样本容量减少时犯第,类错误的概率不变，是以增大犯第,II,类错误的风险为代价，通过扩大接受域的取值区间来实现的。,因此，应对假设检验中出现的两类错误，尤其是以隐含形式存在的第,II,类“取伪”错误，给以充分的重视。,/,7:06 PM,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,同一个问题，为什么当样本容量减少时反倒由拒绝原假设，转为接受原假设了呢？,这是因为显著性水平没有变，在样本容量减少时，为了保证犯第,类错误的概率不变，即犯“弃真” 错误的风险不增大，只有通过扩大接受域来实现，就会导致犯第,II,类错误的概率的相应增大，增加“取伪”的风险。,这意味着在样本容量减少时，若显著性水平不变，即犯第,类错误的概率不变，必然导致犯第,II,类错误的概率增大。即样本容量减少时犯第,类错误的概率不变，是以增大犯第,II,类错误的风险为代价，通过扩大接受域的取值区间来实现的。,因此，应对假设检验中出现的两类错误，尤其是以隐含形式存在的第,II,类“取伪”错误，给以充分的重视。,讨论题,若例,7.5,中其它条件都不变，试计算与学校规定的,3,小时之间出现,显著,差异的样本均值的临界值。,/,7:06 PM,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,2,小样本总体均值的假设检验,在正态总体的小样本（一般为小于,30,）的情况下，总体均值的假设检验分为总体方差已知和总体方差未知两种类型。,当总体方差已知时，标准化后样本均值仍然服从正态分布，所以依然采用式（,7.2,）来计算检验统计量。,当总体方差未知时，样本均值标准化后的统计量服从于自由度为,n-1,的,t,分布，此时其,T,检验统计量为,（,7.4,）,/,7:06 PM,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,例,7.6,以例,6.16,中的有关数据为例。某地抽取了样本容量为,18,的一小样本，对在该地就业的本科生在毕业一年后的月工资情况进行调查，假定该总体服从正态分布，但总体方差未知，样本数据如表,3.2,所示。,表,3.2 18,名毕业一年本科生的月工资情况元,要求,若在相邻的,S,市就业的毕业一年本科生的月工资均值为,2400,元，试在显著性水平为,5%,前提下，检验该地就业的毕业一年本科生的月工资总体均值是否显著低于相邻的,S,市的水平。,解,属于单侧检验。,零假设和备择假设，为,计算检验统计量,接受零假设。,/,7:06 PM,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,例,7.7,将例,7.6,中的检验问题由比较相邻,S,市的水平，改为与该市的预期控制目标,2200,元比较。,要求,试检验该地毕业一年本科生的月工资总体均值与该市的预期控制目标,2200,元之间是否存在显著差异。,解,其进行双侧检验。,这时，将在例,7.6,中提出的零假设和备择假设改为,根据式（,7.4,）计算,小于临界值，处在接受域中，因此接受零假设，认为该地毕业一年本科生的月工资总体均值与该市的预期控制目标,2200,元不存在显著差异。,；,/,7:06 PM,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,7.2.3,总体方差的假设检验,对于总体方差的假设检验需要采用卡方分布，要求总体服从正态分布。有,（,7.8,）,对于给定的显著性水平，卡方,分布的双侧检验的接受域和拒绝,域的情况如图,7.5,所示。,/,7:06 PM,统计学教程,第,7,章假设检验,7.2,单一总体参数的假设检验,例,7.9,利用第,6,章例,6.6,中,36,名同学的月工资的有关数据，若月工资服从正态分布，并有该市对于月工资标准差的预期目标值为,400,元。,要求,试在显著性水平为,5%,前提下，检验该地毕业一年本科生的月工资总体标准差与,400,元之间是否存在显著差异。,解,进行双侧检验。,零假设和备择假设，,计算,卡方,检验统计量数值,接受零假设，认为该地毕业一年本科生的月工资总体标准差与该市的预期目标标准差水平的,400,元之间不存在显著差异。,/,7:06 PM,第,7,章假设检验,7.3,两个总体参数的假设检验,统计学教程,统计学教程,第,7,章假设检验,7.3,两个总体参数的假设检验,7.3.1,两个总体均值之差的假设检验,1,两个总体方差已知情况下的假设检验,在两个正态总体的方差与为已知情况下，无论样本容量大小，两个样本均值之差的分布均服从正态分布，对样本均值之差进行标准化处理，即可得总体均值之差假设检验的统计量。,（,7.9,）,由于两个总体均值之差的假设检验的原假设一般为总体均值假之差为,0,的双侧检验，或者是包括总体均值假之差为,0,在内的单侧检验。在这一前提下，两个总体均值之差的假设检验统计量为,（,7.10,）,/,7:06 PM,统计学教程,第,7,章假设检验,7.3,两个总体参数的假设检验,例,7.10,根据第,6,章的例,6.11,有关数据，,A,、,B,两厂电机工作时定子线圈最高温度的总体标准差数据为已知，其中,A,工厂为,8,，,B,工厂为,6,，并有样本均值分别为,A,工厂,110,，,B,工厂,114,。,要求,试检验在给定显著性水平为,0.05,时，,A,、,B,两厂电机工作时定子线圈最高温度的总体均值之间是否存在显著差异。,解,本例属于双侧检验。,提出零假设和备择假设，为,计算检验统计量。根据式（,7.10,）计算得,拒绝零假设，认为在给定显著性水平为,0.05,时，,A,、,B,两厂电机工作时定子线圈最高温度的总体均值之间存在着显著差异。,；,/,7:06 PM,统计学教程,第,7,章假设检验,7.3,两个总体参数的假设检验,2,两个相等总体方差未知情况下的估计,在两个服从正态分布总体的方差为未知，并且相等，自这两个总体中独立地抽取两个随机样本来进行假设检验。令这两个相等的未知总体联合方差的估计量为,（,7.11,）,一般有原假设令总体均值假之差为,0,，则,T,检验统计量的计算公式为,（,7.13,）,/,7:06 PM,统计学教程,第,7,章假设检验,7.3,两个总体参数的假设检验,3,两个不相等总体方差未知情况下的假设检验,若有两个均服从正态分布的总体，总体方差未知并且不相等，自这两个总体中独立地抽取两个随机样本，服从于自由度为,f,的,t,分布，自由度,f,的计算公式为,（,7.14,）,由于一般原假设令总体均值假之差为,0,，,T,检验统计量的计算公式为,（,7.16,）,/,7:06 PM,统计学教程,第,7,章假设检验,7.3,两个总体参数的假设检验,例,7.11,假如将例,7.10,中已知总体已知条件，改为总体方差未知且不相等，原题中总体方差数据作为样本方差，其它条件不变。,解,由于总体方差未知，不能采用式（,7.10,）计算的,T,检验统计量进行检验，而需要采用式（,7.14,）计算,T,检验统计量的自由度,f,，,并运用式（,7.16,）计算的,T,检验统计量进行检验。先采用式（,7.14,）计算,T,检验统计量的自由度,f,，,有,式（,7.16,）与式（,7.10,）的形式一致，本例采用同样数据按照式（,7.16,）计算得到的检验统计量数值，与在例,7.9,按照式（,7.10,）计算的检验统计量数值是相同的。所不同的一个是服从正态分布，一个是服从自由度为,f,的,t,分布，两者接受域的临界值是不同的。,/,7:06 PM,统计学教程,第,7,章假设检验,7.3,两个总体参数的假设检验,例,7.12,仍然使用例,7.10,中有关数据，总体方差未知且不相等。,解,由于两个样本的样本容量均为,49,，可以视为属于充分大的大样本，因此采用式（,7.17,）的,Z,检验统计量。,与,例,7.9,中的情况类似，式（,7.17,）与式（,7.9,）的形式一致，只是采用了样本方差和来代替未知的两个总体方差和，所以本例采用同样数据按照式（,7.17,）计算的检验统计量数值，与在例,7.8,按照式（,7.9,）计算的检验统计量数值是相同的。并且两者都是根据正态分布，来计算接受域的临界值。所以本例的假设检验方法、过程和结论,与例,7.8,相同。,所不同仅仅在于本例中根据正态分布得到的临界值为,1.96,，而在例,7.9,中根据分布得到的临界值为,1.985,。由于样本容量较大，两者的差异不是很大。本例中采用的正态分布检验统计量方法，是例,7.9,中采用的,t,分布检验统计量方法的近似方法。,/,7:06 PM,统计学教程,第,7,章假设检验,7.3,两个总体参数的假设检验,7.3.3,两个总体方差之比的假设检验,总体方差之间是否相等的假设检验一般也称为方差齐性检验。,当两个均服从正态分布的总体的参数都为未知，两个独立样本的样本方差之比是两个总体方差比值的估计量。并且由两个方差比值的比值构成,F,检验统计量，有,（,7.21,）,由于两个总体方差之比的原假设一般是两个总体方差比值为,1,的双侧检验，或者包括以两个总体方差比值等于,1,条件在内的单侧检验，在此前提下两个总体方差之比的假设检验统计量为,（,7.22,）,/,7:06 PM,统计学教程,第,7,章假设检验,7.3,两个总体参数的假设检验,例,7.13,某商学院对该院一年级和二年级的同学进行了一次参加课外体育活动情况调查，在这两个年级里各自独立地抽取了,10,名同学在过去一周里参加课外体育活动的累计时间，具体数据如表,3.3,所示。,表,3.3,某商学院一、二年级同学一周内课外体育活动情况小时,要求,试以显著性水平，检验该商学院一、二年级同学一周内课外体育活动时间长度的方差是否存在显著差异。,解,属于双侧检验。,（,1,）提出零假设和备择假设。有,/,7:06 PM,统计学教程,第,7,章假设检验,7.3,两个总体参数的假设检验,（,2,）确定检验统计量。采用式（,7.22,）的分布检验统计量。,（,3,）确定显著性水平。,（,4,）计算检验统计量。由和，根据式（,7.22,）计算得,（,5,）进行判断。,由于有检验统计量的数值为,1.1685,，处在接受域的,0.2484,和,4.026,之内，因此接受零假设，认为该商学院一年级和二年级同学课外体育活动时间长度的方差之间不存在显著差异。,/,7:06 PM,第,7,章假设检验,Excel,应用,统计学教程,统计学教程,第,7,章假设检验,Excel,应用,例,7.14,某化工企业为了提高主产品的收率，对生产工艺进行了改进，并从改进前后的实际生产过程中各自独立地抽取了,15,次收率数据构成了两个随机样本。,表,3.4,某化工企业主产品生产工艺改进对收率的影响情况,%,要求,（,1,）对改进前后收率的总体方差比值进行假设检验，显著性水平为,0.05,。,（,2,）在（,1,）的基础上，采用适当的方法。对改进前后收率的总体均值之差进行假设检验，显著性水平为,0.05,。,/,7:06 PM,第,7,章假设检验,小结与练习,统计学教程,统计学教程,第,7,章假设检验,本章小结,本章介绍了假设检验的一般问题，单一总体参数的均值、比例和方差的假设检验，以及两个总体参数的均值之差、比例之差和方差比值的假设检验的方法。,本章的重点是如何针对不同情况和要求，正确地运用,Z,分布，,t,分布，,F,分布和卡方分布来构造检验统计量，进行假设检验。,本章的难点集中在假设检验的一般问题一节中，包括小概率原理、假设检验的一般步骤、假设检验两类错误、双侧检验和单侧检验、,P,值等假设检验的基础理论和基本方法。,/,7:06 PM,统计学教程,第,7,章假设检验,思考与练习,习题：,教材,P.188P.189,10,、,11,、,14,、,15,、,16,/,7:06 PM,第,7,章假设检验,结束,统计学教程,

展开阅读全文

统计学 第7章 假设检验

最新文档

统计学第7章假设检验