非参数统计学讲义(第二章)讲稿.doc

上传人:wux****ua 文档编号:9477594 上传时间:2020-04-05 格式:DOC 页数:22 大小:948.50KB
返回 下载 相关 举报
非参数统计学讲义(第二章)讲稿.doc_第1页
第1页 / 共22页
非参数统计学讲义(第二章)讲稿.doc_第2页
第2页 / 共22页
非参数统计学讲义(第二章)讲稿.doc_第3页
第3页 / 共22页
点击查看更多>>
资源描述
第二章 单样本模型1 符号检验和有关的置信区间在有了一个样本之后,很自然地想要知道它所代表的总体的“中心”在哪里例如,在对人们的收入进行了抽样之后,就自然要涉及“人均收入”和“中间收入”等概念这就与统计中的对总体的均值(mean),中位数(median)和众数(mode)等位置参数的推断有关。例如,在知道总体是正态分布时,要检验其均值是否为;一个传统的基于正态理论的典型方法是t检验它的检验统计量定义为 这里为样本均值,而为样本标准差。t检验的统计量在零假设下有n1个自由度的t分布。检验统计量是用样本标准差s代替了有标准正态分布的检验统计量的总体标准差后而产生的在大样本时,二者几乎相等。t检验也许是世界上用得最广泛的检验之一。但是,t检验并不稳健,在不知总体分布时,特别是小样本时,应用t检验就可能有风险。这时就要考虑使用非参数方法。对于本章所要介绍的数据趋势或随机性检验,就不存在简单的参数方法非参数方法总是简单实用的。 本章所介绍的一些检验有代表性,因此这里的讨论将比其它章节更为仔细一旦熟悉了非参数方法的一些基本思路,后面的内容就很容易理解了一、 问题的提出【例2-1】联合国人员在世界上66个大城市生活花费指数(以纽约市1962年12为100)按自小至大的次序排列如下(这里北京的指数为99):表2-1 生活花费指数数据66757880818182838383838485858686868687878888888888898989899090919191919293939696969799100101102103103104104104105106109109110110110111113115116117118155192在例子中,人们可能会问:总体的平均(或者中间)水平 刻划位置参数的量有:平均值:;中位数:;修整均值:,;众数;中列数:。是多少?北京是在该水平之上还是之下?可以假定这个样本是从世界许多大城市中随机抽样而得的所有大城市的指数组成总体可能出现的问题是:这个总体的平均(或者中间)水平是多少?北京是在该水平之上还是之下?这里的平均(或中间)水平是一个位置参数。一般的统计书中的均值就是一个位置参数中位数是另一个位置参数它们都是数据总体中心位置的度量和位置参数相对的一个参数为尺度参数;比如在标准统计课本中的描述数据集中和分散程度的方差或标准差 这个例子经过简单计算,得到样本均值为96.45,而样本中位数为91;它们都可作为总体的中心的估计,除此之外,众数(频率最大的点,本例是88)可作为中间位置 通常在正态总体分布的假设下,关于总体均值的假设检验和区间估计是用与t检验有关的方法进行的。然而,在本例中,总体分布是未知的为此首先看该数据的直方图从图中很难说这是什么分布。在右边的两个点分别是东京和香港。 由于此时我们不知道总体是否为正态分布(或者数据表明它就不是一个正态分布),所以有关参数统计中的t-统计量就不能用,势必要选择非参数的统计量来解决这样的问题。符号检验(Sign Test)是利用正、负号的数目对某种假设作出判定的非参数统计方法。二、 普通的符号检验1基本方法如果所研究的问题,可以看作是只有两种可能:“成功”或“失败”,并且成功或失败的出现被假定遵从二项式分布,以“”表示成功,以“”表示失败,那么随机抽取的样本就有两个参数:成功的概率P+和失败的概率P。这样就可以构造一个假设:这是双侧检验,对备择假设H1来说,不要求P+是否大于P。如果所研究的问题,要求考虑是P+比较大还是P比较大,则需用单侧备择假设,即 这里表示P+是比较大的,被用来说明P是比较大的。为了检验上面的假设,普通的符号检验所定义的检验统计量为和。表示为正符号的数目,表示为负符号的数目,是符号的总数目。要对假设作出判定,需要找到一个P值。因为对于和来说,抽样分布是一个带有(表示成功的概率)的二项式分布,所以如果H0为真,从二项分布表中能够根据n、和查到P值。若P值很小,表明H0为真的可能性很小,数据不支持H0,而支持H1。注:双边假设检验中的尾概率P-值应是单边假设检验中的P-值的2倍;在n()较小时,可以利用二项分布表查表,计算出精确的P-值;在n(n20)较大时,则要用正态分布来近似,因为,所以,并且要作连续性修正。普通的符号检验其判定可以归纳如表22所示。注释:表2-2 生活花费指数数据 注意与教材中取最小二者之间最小值的等价性。备择假设P值(二项分布表)的右尾概率的左尾概率的右尾概率的左尾概率和中大者右尾概率的2倍和中小者左尾概率的2倍备择假设P值(正态分布表)的右尾概率的右尾概率和中大者右尾概率的2倍2应用在实际问题的研究中,常常会遇到难以用数值确切表达的问题,而采用符号检验可以帮助解决这类问题的研究。【例2-2】女性在对事物的看法上是否倾向于比男性保守些社会科学家对这样的事实很感兴趣,当夫妇俩人有一个类似的观点时,妻子可能比丈夫要保守。为了验证这一事实是否成立,随机选取了50对夫妇进行调查。按预先制定的问题每人分别被间问,结果只有10对夫妇的看法倾向性差异较大,而其中9对夫妇的妻子确实比丈夫保守。分析;研究这问题,可以看作是“成功”与“失败”的问题,妻子比丈夫保守为成功,妻子不如丈夫保守为失败。因为希望得出妻子比丈夫较为保守的结论,故而备择假设是单侧的,即P+P。这样建立的假设为:由于在10对符合条件的夫妇中,有9对妻子比丈夫保守,因而9,1,n10。根据n10,9,查附表,为9的右尾概率P0.0107,也就是说,对于成功概率05的二项分布来说,在10次试验中,有9次或9次以上成功的概率P为0.0107,这是个极小的概率。因此,可以得出结论:这批调查的数据不支持H0,而支持备择假设,即妻子确实比丈夫要保守些。【例2-3】广告对商品促销是否起作用人们一般认为广告对商品促销起作用,但是否对某种商品的促销起作用并无把握。为了证实这一结论,随机对15个均销售该种商品的商店进行调查,得到的数据如表23。表2-3 广告前后销售稿况表商 店123456789101112131415未作广告每日销量222223332323233广告后每日销量233442343342344差值的符号分析:由于假定随机油取的15个商店在广告前后其它条件均没有变化,如营业员人数,营业面积,服务质量等等,仅仅是考察广告的作用,因此符合普通符号检验的条件。由于想得出广告起作用的结论,因而是单侧检验,即广告后销量增加。建立的假设为根据表2-3可知,10,而2,n12。在附表中,n12,l0的右尾概率P00193。这也是一个很小的概率,表示调查结果不支持H0,而支持H1,即广告确实对这种商品促销起了作用。【例2-4】顾客对咖啡、茶的喜好是否有差异。若有差异,是否更喜欢茶。为了解顾客对咖啡,茶的喜好情况,在某商店随机抽取l5名顾客进行调查,结果有12名顾客更喜欢茶,2名顾客更喜欢咖啡,1名对两者同样爱好。分析:顾客对咖啡、茶的喜好调查,其目的只是为了比较两者中哪个更受欢迎,并无定量的数值,因而可以来用符号检验。在咖啡、茶中更喜欢茶为“成功”,反之为“失败”故可建立假设这一假设仅判定对二者喜欢程度有无差异。由调查结果知:12,2,n14。查附表,n14时,与中大者12右尾概率的2倍是20006500130。显然P00130很小,以显著性水平005,P足够小,故这批数据不支持H0,即顾客对咖啡和茶的喜爱有显著差异。要判断是否更喜欢茶,建立单侧备择假设根据上面的分析,n14,12时,附表显示的P值为00065。对于001,P值也足够小,故数据不支持H。,而支持H+。顾客在咖啡和茶中更喜欢茶。三、 位置的符号检验1基本方法一个随机抽取的样本,有n个数据,其实际的总体中位数记作M,假定的中位数是某个特定值,记作M0。若研究问题时关心的是:真实的中位数M是否不同于M0,可以建立假设如果关心的是:真实的中位数M是否大于或小于特定的数M0,则应建立单侧备择假设 只要样本数据能够被测量,至少是定距尺度测量,若定序尺度测量的,应能与M0相比并决定大小次序,也就是说,数据与M0比较的结果能用“十”或“一”表示,设定在M0附近是连续的,则普通的符号检验方法可以应用。这就是符号检验法用于单样本位置的推断。检验统计量。位置的符号检验所定义的检验统计量也是和,表示每一个观察数据与特定的数M0的差值的符号为正的数目,即;表示符号为负的数目,即。,n表示符号的总数目。由于M为中位数,故每一个样本点要么大于M,要么小于M(除去相等的那些点)且概率都为0.5。所以一系列的样本观察值就相当于一个n重Bernoulli试验,从而有和。和就是所要找的统计量,因为它满足统计量的要求:样本的函数;分布已知。P值的确定。当时,与普通的符号检验一样,从附表中查找;若n20,由正态近似得到P值,在正态分布表中查找。2应用【例2-1】接引例分析:零假设H0:M99 备择假设H1:M99选取统计量K=S+Bin(65,0.5),这里n为除去99这一点后剩余的样本点数;统计量选取的是与当中一个较小的量,与查表的做法不同。计算P-值判断【例2-6】生产过程是否需要调整某企业生产一种钢管,规定长度的中位数是10米。现随机地从正在生产的生产线上选取10根进行测量,结果为:9.810.19.79.99.810.09.710.09.99.8分析:中位数是这个问题中所关心的一个位置参数。若产品长度真正的中位数大于或小于10米,则生产过程需要调整。这是个双侧检验,应建立假设为了对假设作出判定,先要得到检验统计量、。将调查得到数据分别与10比较,算出各个符号的数目:l,7,n8(差值0的不计)。在附表中,n8,与中较大者7的右尾概率的2倍是20.03520.0704。若显著性水平005,P已足够大,表明调查数据支持H0;根据这批数据,生产过程暂不需做调整3配对样本位置的符号检验作为单样本位置的符号检验,也能够应用于配对样本。随机选取n个数据对,至少是定距尺度测量,若是定序尺度测定,那么就要既对于样本的数据,又要对于M0都是定序尺度。因为,为利用符号检验,至少要求每对数据的差值相对于M0来说都是可以测定的。假定差值总体在M0附近是连续的,M0表示随机变量的数对之间差值的总体中位数,M0仍表示特定的数,则将位置的符号检验假设中的M以MD替代就可以得到配对样本的假设组 配对样本的方法同单样本位置的符号检验方法一样,检验统计量也是、。但是,是差值与M0的差值的符号为正的数目,是为负的符号数目。其中。和以前样,若,则n中不计。判定假设的P值仍在附表中,按以前那样查找。若n20,也是利用与按(2.1)式计算Z,在附表中查找相应的P值。【例2-6】领导者的领导水平是可以训练的为验证领导水平是可以训练的,根据人的聪明程度、人品、受教育状况等,随机抽选出12个人配成6对,每对中有一人随机选择受训,记作T,另一人则不受训记作C。经过一段时间后,按被设计好的问题评价他们的领导水平,结果如表2-4。表2-4 配对样本评价表配对样本编号T的评价(x)C的评价(y)xy的符号11310219733420424385402263915分析:表中的分数并不是精确测量的结果,它只是相对的领导能力比较。它没有一个精确的量的意义,而是一对中两人比较,反映领导水平差异性的符号。如果领导水平是可以训练的,那么接受待定训练的成员应该比那些配对的非受训人员有较高的分数,因此比备择是单侧的。合适的假设为 由表2-4给出的数据可知,5,l,n6,在二项分布表中查找的准确P值为n6,5的右尾概率,即P01094。于显著性水平005。显然P值是够大的。因此这批数据支持H0,不支持H1,即这批数据不足以说明领导水平是可以训练的。 【例2-7】人的智商是否随出生顺序而升高通过对以往在校学生的调查发现,智商往往随着出生顺序而升高,这种关系在成年人中是否也存在?通过随机选取13对成人的同胞兄弟姐妹进行调查,得到智商的数值如表2-5。 表2-5 配对样本智商值统计表配对样本编号第一胎出生的智商值(x)以后出生的智商值(y)Xy的符号1868229094391964101106593926859079298811512097274107580111201301210611013104109分析:如果成年人的智商与出生顺序有关,并与孩子的规律相同,那么头一胎出生的人的智商值应该比自己的其他兄弟姐妹低。因此应建立单侧备择假设。差值是第一胎的智商值减去后面出生的弟或妹的智商值。对于零假设,应该是他们的智商值无差异,也就是智商值差值的中位数M00。这是一个配对样本位置的符号检验。建立在差值中位数基础上的假设为 由表25可知,2,11,n13。在附表中相对于n13,11的石尾概率是00112,这是准确的P值。对于显著性水平005,P值要小得多。这意味着,对于那些差值的中位数为0的随机变量,在13个符号中,有11个是负号的情况极少出现。因而数据不支持H0。,而支持。这表明对于成年人来说,出生顺序仍然对智商有影响,智商随着出生顺序而增高。四、 中位数的置信区间符号检验的统计方法可以用来估计单样本总体中位数的置信区间、配对样本差值总体中位数的置信区间。1顺序统计量顺序统计量(Order Statistic)亦称次序统计量。它在非参数统计中有很多的应用。它是原有样本数据按逐渐升高的顺序排列的。这里,若rs,那么,只是表明它们以什么样的顺序被观察,按从小到大则顺序在前,在后,至于它们的相对数值大小是多少并没有意义。顺序统计量没有与原有变量相同的概率函数,即使原变量是独立的,顺序统计量事实上可能不独立。2置信区间置信区间即满足一定置信度的区间,非参数统计中置信区间仍是指的用样本指标估计总体指标变动范围和可靠程度。对未知分布的单样本总体中位数置信区的估计、差值总体中位数置信区间的估计,是与符号检验方法相对应的。在置信区间的估计中,使用顺序统计量。设为样本点的顺序统计量,若M是未知分布的总体中位数或差值总体的中位数,它是真实的但未知,则其置信区间由置信系数来决定。是由研究者选择的,越大,则置信区间越宽,区间宽,由其提供的关于位置参数的信息就越少,因此选择时应对精度及提供信息量作权衡。由或确定的置信区间为 由符号检验知:大于M和小于M的样本点数都服从,则有 满足(2.3)的i和j的搭配很多,即置信区间很多。我们希望选择一个对称区间。令,则k应满足: 这里所给出的区间为“对称”区间,“对称”指的是区间的两个端点分别到X(1)和X(n)的距离相等。 在满足置信度的前提下,我们再来保证精度,选择一个最优的置信区间。这里,n是样本数据的个数,k是置信区间下限的一个临界值。当时,k能够借助二项分布表找到,若n20,k的近似值是以带有连续性修正的正态分布为基础,通过式计算得到 式中,Z是一个正数,它是与标准正态分布表中的一个右尾概率相对应的分位数值。【例2-7】在例2-5中测量的钢管长度的中位数置信区间,使用置信系数090。分析:将测量的样本数据按从小到大的顺序排列,得到顺序统计量97979898989999100100101要确定这批数据总体真实中位数的90置信区间,就是要找到与相对应的k。因为置信区间的端点是顺序统计量中处在第k十1位置,第nk位置的两个数值。在双侧检验中,k是一个临界值,是在二项分布表中,根据水平,即P值为,样本数据个数n查到的一个左尾的正号或负号的数目,由090,010,x10,查附表可知,表中没有005而只有00547,这是距005最近的P值,因此,k为左尾的正号或负号数目是2。k2,意味着中位数M的8906的置信区间为 即=9.8,10.0也就是说,可以有近90的把握,钢管的中位数处在98米至l0米之间。注:对于单测检验来说,置信区间估计的方法基本同上,只是对于置信系数来说,在附表中查找k时,P不是,而是。例如对应于单侧检验。估计的95置信区间,根据095。005,n10,查二项分布表,得到与P00547相应的,的左尾数目为2,即与09453对应的k2。因此,钢管中位数M98的置信系数为9453。对于单侧检验来说,估计的95置信区间,在附表中,根据P005,n10。查找,由于在表中与单侧检验H相对应的是的左尾概率,所以k2,即M的9453的置信区间为,也就是M100。例 我国国有经济15个行业的1996年职工平均工资按从小到大的次序为(单位:元)4038 4940 5798 6161 6344 6610 6695 67096967 6992 7897 7987 8546 8679 8701求中位数的置信区间。把n个样本点按从小达到的顺序排列,得假设顺序统计量,由构成区间作为中位数的置信区间。由于大于和小于中位数M的样本点数服从B(N,0.5)由于得到的区域是以中位数位对称的,故kP(Kk)1-2P(Kk)置信区间区间长00.00000001.00000004038,8701466310.00003050.99993904940,8679373920.00048830.99902345789,8546275730.00369260.99261476161,7987182640.01757810.96484386344,699264850.05923460.88153086610,6967357在区间估计中,区间的长度(估计精度)和置信度(概率保证度)是刻画估计优劣的两个指标,我们要求精度越高,保证度越大越好,但二者是相互矛盾的,故选择6344,6992,其区间较短,而概率保证度较大。2 Wilcoxon符号秩检验Wilcoxon符号秩检验(Wilcoxon Signed Rank Test)亦称威尔科克逊带符号的等级检验,它是对符号检验的一种改进。符号检验只利用关于样本的差异方向上的信息,即符号的信息,并未考虑差别的大小,Wilcoxon符号秩检验弥补了符号检验的这点不足。一、 Wilcoxon符号秩检验1特点:它将差的符号信息与差的大小信息集于一身,自然要比符号检验更为有效。2做法及要求:它把差的绝对值的秩分别按不同的符号相加作为检验统计量;与符号检验的条件类似,Wilcoxon符号秩检验也要求总体的分布是连续的,但增加了一条:总体关于其真实的中位数M是对称的。3检验步骤:提出原假设,;计算。代表着样本点到M0的距离;找出绝对秩。即对绝对值排序,找出它们的n个秩;选取统计和 其中,为的绝对秩的和;为的绝对秩的和,。,其中,; 取 取 取计算尾概率P-值P-值F 如果是小样本,可以查Wilcoxon符号秩检验分布 有关分布的讨论详见教材P34。表即可F 如果是大样本,我们可以使用正态近似,得到一个与W有关的正态随机变量Z的值,查正态分布表求得P-值。因为Wilcoxon符号秩统计量是线性符号秩统计量的一个特例,所以有,。F 如果存在打结的情况,正态近似公式要作修正。详见教材P39。在许多情况下,数据中有相同的数字,称为结(tie)结中数字的秩为它们按升幂排列后位置的平均值比如2.5,3.1,3.1,6.3,10.4这五个数的秩为1,2.5,2.5,4,5。也就是说,处于第二和第三位置的两个3.1得到秩(2十3)22.5这样的秩称为中间秩。如果结多了,零分布的大样本公式就不准了。因此,在公式中往往要作修正。判断二、 应用1单样本的应用【例2-8】铸件的机加工是否应转包出去某钢铁公司订购了一批铸件,在使用前需进行机加工。这一任务可由公司承担,也可以转包给他人。公司为减少加工费用,所确定原则是:若铸件重量的中位数超过25公斤,就转包出去;等于或小于25公斤则不转包。从这批100件中随机抽取了8件进行测量,每件重量分别为:243,258,254,248,252,251,250,255。使用这些数据,能否作出这批铸件是否转包的决定。分析:这个问题中,公司采用的是以重量为基础的标准,而且关系到中位数,又因为样本的数量很小,因而宜采用Wilcoxon符号秩检验。在这里假定铸件重量是对称性分布似乎比正态分布更合理。由于考虑是否转包,因而备择假设应是单侧,建立的假设组为 为作出判定,需要计算统计量和,计算过程见表26。表中第7个数字与假定中位数正好相等,因此D=0。由于0无法给出正或负号,因而在对差的绝对值排等级时也就被忽略不计。当时,在排列分等级过程中,其秩取这些等级的简单干均数。,数值从小到大排等级应是第2级和第3级,取(2十3)2为其秩,即、的秩均为25。表2-6 秩次和计算表编 号重量(x)D=x-25的秩D的符号124.3-0.70.76225.80.80.87325.40.40.44424.8-0.20.22.5525.20.20.22.5625.10.10.11725.000825.50.50.55根据表中D的符号和的秩,可以计算得到:根据n7,和查附表3,得到的左尾概率为01875和02344。与相对应的右尾概率即P(02344十01875)20211。由于P0211相对于显著性水平已足够大,因此调查数据支持H0,即该公司订购的这批铸件,从减少加工费用的角度还是不转包为好。2配对样本的应用Wilcoxon符号秩检验大量地应用于配对样本。若MD表示两个随机变量差值总体的中位数,M0是某一特定的数,那么可以建立的假设组为 应用Wilcoxon符号秩检验的数据应含有n对观察值,。或有一组n个差值,即,且假定差值的总体是连续的,关于中位数MD是对称的。一般来说,这些差值至少是定距尺度测量的,若是定序尺度,则为检验所需的等级,符号都应能确定。对假设作出判断的方法基本与单样本相同,只是D不再是,而应是,即。【例2-9】新配方是否有助于防晒黑某防晒美容霜制造者,欲了解一种新配方是否有助于防晒黑,对7个志愿者进行了试验。在每人脊椎一侧涂原配方的美容霜,另一侧涂新配方的美容霜。背部在太阳下暴晒后,按预先给定的标准测定晒黑程度如表2-7。表2-7 两种配方晒黑程度测量结果编 号原配方(y)新配方(x)编 号原配方(y)新配方(x)14238544332515365549331367483646152分析:这一问题是配对样本,同一个人使用两种不同配方的美容霜,以检验两种配方对防晒黑的作用是否有显著不同,可以应用Wilcoxon符号秩检验。新配方的晒黑程度记作x,原配方的为y,则差值。假定关于中位数对称,那么两种配方的作用无显著差异时,的总体中位数应是0,即M00。为检验新配方是否优于原配方,则应建立的假设组为为对假设作出判定,要计算和,计算过程如表2-8。表2-8 检验统计量计算表 表中是因为M0=0。编 号xyD=x-y的秩D的符号13842-442253512213363155345261-99553344-1111664955-66473648-12127由表可知根据n7,查附表,得到的左尾概率P0055。这个概率对于显著性水平005来说已够大。一般在样本较小时,宜取稍大些的显著性水平,以避免犯第二类的错误,即“以假为真”的错误。取显著性水平005,则该调查数据支持H。,即两种配方对晒黑的作用没有什么显著差异。若对于显著性水平010,该次调查结果则不支持H。,即调查足以说明新配方对防晒的效果优于原配方。若希望同时减小犯两类错误的可能性,应增加样本数目。符号检验与Wilcoxon符号秩检验的联系:1区别(1)符号检验仅使用各个观察值和中位数差值或配对样本差值与中位数差值方向上的信息,而没有考虑差值的大小。例如在本例中,我们选取34和16,由于其位置对称,从而导致符号提供信息的对称,导致结论的对称性,显然结论是不科学的。(2)符号秩检验不仅利用差值方向上的信息,还利用了差值大小的信息,因此,它提供的信息量要多于符号检验。关于两种检验的功效有过不少的研究和报道,有兴趣的读者可以去阅读有关书籍。在大多数情况下Wilcoxon符号秩检验应该被优先使用。2共同点(1)符号检验和符号秩检验都是非参数检验,都能运用于单一观察的数据或配对观察数据的差,都能用于总体中位数或差值总体的推断。(2)它们对总体所要求的假定都是极小的。对符号检验来说,是总体连续;对符号秩检验来说,再增加一个关于中位数对称。(3)这两种检验数据测量层次的要求都不高。普通的符号检验被使用于两分类总体,类似于回答“是”或“不是”的问题,可用于定类尺度的测量,但要求差异的方向能够被表示出;符号秩检验至少要求定序尺度测量,仅当等级和符号能够被表示出时。由于两个检验都与符号有关,因而处理0差值的方法是共同的,均被忽略不计。3与学生t检验的比较如果总体分布是对称性的,且方差已知,那么符号检验、符号秩检验、学生t检验都可以被选择使用,因为在对称性分布情况下,均值与中位数相等。然而,学生t检验是建立在正态分布假设基础上,这是一个比对称性假设严格得多的假定条件。当样本数据的正态假定可靠,且数据是在定距尺度测量时,学生t检验作为一种最强有力的方法应该被优先选择。但当下列情况之一发生时,非参数检验的方法要优于参数检验方法。(1) 样本数目很小;(2) 唯一可以得到的数据是定类或定序尺度测量的;(3) 作为一组数据的处理,样本的中位数似乎比均值更可靠;(4) 对于所研究的问题来说,中位数是比均值更有代表性的位置参数;(5) 总体很少或者几乎没有一个概率分布(对符号秩检验仅需要一个对称性假定);(6) 总体分布未知,但几乎很少类似于正态。3 游程检验一、 问题的提出游程检验亦称连贯检验或串检验,是一种随机性检验方法,应用范围很广。例如生产过程是否需要调整,即不合格产品是否随机产生;奖券的购买是否随机;期货价格的变化是否随机等等。若事物的发生并非随机,即有某种规律,则往往可寻找规律,建立相应模型,进行分析,作出适宜的决策。或如果一个试验者希望从总体的一个样本所包含的信息中得出关于该总体的某些结论,那么它的样本必须是随机样本,所以对样本是否为随机样本的检验也至关重要。二、 普通的游程检验(Ordinary Runs Test)1游程的含义一个可以两分的总体,如按性别区分的人群,按产品是否毛病区分的总体等等,随机从中抽取一个样本,样本也可以分为类;类型I和类型R。若凡属类型I的给以符号A,类型B的以符号B,则当样本按某种顺序排列(如按抽取时间先后排列)时,一个或者一个以上相同符号连续出现的段,就被称作游程,也就由说,游程是在一个两种类型的符号的有序排列中,相同符号连续叫现的段。例如,抛掷一枚硬币,机器是否发生故障,的差都可以得到一系列的符号或记号。110001000011011234567定义:游程是指一个具有相同符号的连续串,在与它前后相接的是不同的符号或完全无符号。例中的游程数目U=7个。2游程检验的基本思想在任一给定容量的样本中,游程的总数标志着样本是否是随机的。若游程的数目过少,则意味着样本由于缺乏独立性而形成了一致的趋势;若数目过多,则序列存在着某种周期性的影响。例如:抛币20次,结果如下。H H H H H H H H H H T T T T T T T T T TH T H T H T H T H T H T H T H T H T H T因此可以通过游数目的多与少来判断序列是否存在随机性。3基本方法(1)提出假设随机抽取的一个样本,其观察值按某种顺序排列,如果研所关心的问题是:被有序排列的两种类型符号是否随机排列,则以建立双侧备择,假设组为H0:序列是随机的H1:序列不是随机的如果关心的是序列是否具有某种倾向,则应建立单侧备择,假设为H0:序列是随机的H+:序列具有混合的倾向或H0:序列是随机的H:序列具有成群的倾向为了对假设作出判定,被收集的样本数据仅需定类尺度测量,但要求进行有意义的排序,按一定次序排列的样本观察值能够被变换为两种类型的符号。如某售票处按到来的先后顺序排队购标的人,按性别分别记作A、B两种类型的符号,可以得到一个序列:AABABB。第一种类型的符号数目记作m,第二种记作n,则N=m十n。(2)选择统计量在H。为真的情况下,两种类型符号出现的可能性相等,其在序列中是交互的。相对于一定m、n,序列游程的总数应在一个范围内。若游程的总数过少,表明某一游程的长度过长,意味着有较多的同一符号相连,序列存在成群的倾向;若游程总数过多,表明游程长度很短,意味着两个符号频繁交替,序列具有混合的倾向。因此,无论游程的总数过多或过少,都表明序列不是随机的。根据两种类型符号的变化,选择的检验统计量为U。U游程的总数目(3)确定P-值在小样本时F 可以直接查表【例2-12】抛币结果为:H H H H H H H H H H T T T T T T T T T T分析:该题中m=10,n=10,U=2,查表可得接受域为:6,16,而U=26,拒绝原假设,认为不是随机序列。F 利用公式(详见教材P47)备择假设P值序列具有混合的倾向(游程大)Z的右尾概率序列具有聚类的倾向(游程小)Z的左尾概率序列是非随机的Z的较小的尾巴概率的两倍【例2-13】工厂的质量管理。原始资料详见教材P48。在大样本时U抽样分布的一种很好的近似是正态分布,这种正态分布的数学期望和方差分别为: 将其标准化得:【例2-14】检验时间序列的平稳性。由时间序列的样本数据(上交所每日收盘综合指数),将原始数据原均值比较,从而得到符号,N=93,m=56,n=37,U=10。,所以,拒绝原假设,认为非随机,即原始序列非平稳。【例2-15】设X和Y分别具有分布函数和,检验:。在我国的工业和商业企业中随机抽取22家企业进行资产负债率行业差异分析,其1999年底的资产负债率()如下:工业647655825982707561647383商业77808065939184918486两个行业的负债水平是否有显著性差异。顺序12345678910111213141516171819202122负债率55596164646570737576778080828283848486919193组别111112111122211122222211111,2,1111,222,111,222222共有6各游程。如果原假设成立,则两个行业的负债水平的分布使相同的,将其混合后,应能较为充分、均匀地混合,游程数R应该比较大,反之当游程数R较小,则说明两个总体的分布可能不同。从生产线上抽取产品检验,是否应采用频繁抽取小样本的方法。在一个刚刚建成的制造厂内,质检员需要设计一种抽样方法,以保证质量检验的可靠性。生产线上抽取的产品可以分成两类,有瑕疵,无瑕疵。检验非用与受检产品数量有关。一般情况下,有毛病的产品如果是成群出现的,则要频繁抽取小样本,进行检验。如果有毛病的产品是随机产生的,则每天以间隔较长地抽取一个大样本。现随机抽了30件产品,按生产线抽取的顺序排列:0000111111111111110001111111检验瑕疵的产品是随机出现的吗?有瑕疵的产品是随机出现 有瑕疵的产品是成群出现VAR00002Test Value1.0000Cases = Test Value23Total Cases30Number of Runs4Z-3.811Asymp. Sig. (2-tailed).000例、假设某企业在过去15年中盈亏情况为:00001111111000111111(1盈利,0亏损)。改企业某一年盈利对以后是否亏损有无影响? -2.84316当, Runs Test VAR00001Test Value(a)1.00Cases = Test Value13Total Cases20Number of Runs4Z-2.843Asymp. Sig. (2-tailed).004a Median三、 基于上、下游程的检验上、下游程(Runs Up and Down)亦称升降串。这个检验不是单纯地用两个符号的多少以及游程的数目来进行,而是利用每个观察值与紧挨其前面的一个数值比较大小,决定升、降,利用形成的升降串进行检验。因此它比普通的游程检验能够提供更多的信息。1上、下游程的含义随机抽样得到的观察值按某一顺序排列,序列中每个观察值与其前面的一个数值比较,如果前面的数值较小,就构成一个上列串,即一个上游程;如果前面的数值比较大,就构成一个下降串,即一个下游程。一个上游程中包含的观察值数目,就是游程的长度例如,某一序列的观察值为7,15,l,2,5,8。这个序列有一个长度是l的上游程,因为第二个值15比前面的值7要大,而比后面的值1也要大,紧跟着是一个长度为1的下游程,然后是一个长度为3的上游程。如果用十、一表示上升或下降的变化方向,那么上面序列的变动结果是:十,一,十,十,十。这个序列观察值的数目,即样本数据的个数N6,上、下游程的总数为3。2基本方法(1)提出假设和普通游程检验类似,如果研究的问题是序列是否随机,可以建立双侧备择,若关心的是序列是否有某种倾向,则建立单侧备择。为对假设作出判定。所需要的数据至少是定序尺度测量的。在H0为真的情况下。相继的观察值之间差值的符号为“十”或为“一”的可能性相等。因此,上、下游程的总数可以反映序列的变动。如果相同的符号成群,游程的总数就会太少,表明序列是有一个恒定方向的倾向,成顺序增加,或顺序减少;如果符号不断地变化,游程的总数就会很多,表明序列有经常的波动或循环移动或漂浮不定的变动。(2)选择统计量检验统计量。N个不同观察值按某一顺序排列后,可以得到一个N一1个正号或负号组成的相应次序的序列,这个序列的上、下游程总数就是检验统计量,记作V即有V上、下游程的总数(3)确定P-值在小样本时(N25)检验统计量V与U的分布不同,V的抽样分布也可心查表获得。V的取值范围从l到N一1,N是观察值即样本数据内数目。在大样本时(N25)检验统计量V近似正态分布,均值为(2N一1)3,标准差是。通过连续性修正,计算得到,查表可得相应的P-值。表2-10 上、下游程检验判定指导表备择假设P-值:序列有混合倾向ZR的右尾概率:序列有成群倾向ZR的左尾概率:序列是非随机的Z的右尾概率的2倍3应用【例2-15】对儿童的调查是否会因为儿童之间相互通气产生某种倾向对儿童的好斗原因进行研究,按时间顺序观察了同一幼儿园的24名儿童,观察结果如表211。如果这一结果受到调查中儿之间相互通气的影响,产生某种倾向,那么就无法利用它进行儿好斗的原因分析。因此,利用这批数据之前,有必要对其是否陷进行检验。表2-11 按照观察顺序记录的儿童好斗程度评分编号分数编号分数编号分数编号分数1317121315198622382614132061336943157821134431075162422754111217132366441231827248分析:由于研究只关心序列是否随机,因而可建立双侧备。建立的假设组为H0:序列是随机的H1:序列不是随机的这一问题可以来用普通游程检验,也可用上、下游程检验F应用普通游程检验。表211的评分结果按从小到大的顺序排列,中位数是25,则高于中位数的编号为1,低于中位数的编号为0,将表21l中的按观察顺序记录的分数换成相应的符号0、1,可以得到m12,n12,Nm十n24,U10。查附表,得到P0.150。由于是双侧检验,因而P应取200150030,对于显著性水平0.05:P已足够大,表明数据支持H。,即调查结果没有受儿童之间相互通气的影响,是随机的。F上、下游程检验。将表211的调查评分,按升、降给以符号十、一,得到下面23个符号一,十,十,一,十,一,十,十,十,一,十,十,一,十,一,一,十,十,一,一,一,一,十这一序列,包含上、下游程数目总共14个,即v14。查附表,N24,V14,P02768,由于是双侧检验,P应是2027680.5536。显然,对于显著性水平005,P已足够大。因此,调查数据在5的显著水平上不能拒绝H。,表明调查结果没有受儿童相互通气的影响。与普通游程检验的结论一致。4 正态记分检验一、 基本思想在各种秩检验当中,由于秩检验统计量为秩的函数,而秩的分布是一个均匀分布,当我们用正态分布来代替它就形成正态记分(normal score)。当我们把按升幂排列的秩用升幂排列的正态分布点(如:)代替,形成了Van der Waerden型记分 正态记分的种类很多,还有一种称为期望正态记分(expected normal score),是用正态分布第i个顺序统计量的期望值来代替正态记分。实践中它与Van der Waerden型记分得出的结果差不多。二、 两个等价的正态记分检验1对应于Wilcoxon符号秩统计量。由线性符号秩统计量记分函数且。需要改变记分:记为,则有正态记分检验统计量为:或注解:统计量的选择依据备择假设在大样本的时候要用正态近似2对应于统计量的检验。前面的做法同上面的检验,用相应的正态记分来代替这些秩,如果为的秩,则相应的符号正态记分为:用W表示记分的和,即,正态记分检验统计量为:【例2-16】续例2-10,做正态记分检验,详见教材P42。5 Cox-Stuart趋势检验一、 问题的提出在判断某个序列或变量的增减趋势时,光凭目测法从图形中很难得出结论。【例2-17】我国1985年到1996年的出口和进口贸易差额(以亿美元为单位)。-149.0-119.7-37.7-77.5-66.087.480.543.5-122.254.0167.0122.2二、 Cox-Stuart检验1检验类型 H0:无增长趋势 H1:有增长趋势 H0:无减少趋势 H1:有减少趋势 H0:无趋势 H1:有增长或减少趋势2数学描述设分别来自分布为的总体,对称于零点,则就对应为:就对应为:就对应为:3操作方法F 基本思想:把每一个观察值和相隔大约n/2的另一个观察值配对比较(大约有n/2个对子),然后看增长的对子和减少的对子各有多少来判断总的趋势。F 操作步骤:取和组成一个点对。其中,对数用每一点对的两元素差的符号衡量增减。令为正的的数目,为负的的数目 这里,不包含差为零的对子。当越大时,即正号越多时,有下降趋势;反之,则有增长趋势。在H0下,()。检验。对应上面的三种检验类型,分别取统计量,则P-值= 数据越少越难拒绝原假设。【例2-18】续例2-17【本章思考题】1符号检验与Wilcoxon符号秩检验的区别与联系?2什么游程及如何进行游程检验?3如何进行Cox-Stuart趋势检验?补充:概率论中常用的几种变换 拉氏变换(Laplace引入组合数学)与母函数相对应;指数变换与矩母函数相对应;傅里叶(Fourier)变换与特征函数相对应。1母函数(Generating Function)(1)定义:设X为取非负整数值的随机变量,X的母函数定义为:其中,的母函数也称为对的z变换或几何变换。NOTE:由Laplace在19世纪初引入概率论;作用:主要计算数学期望和方差;组合数学中的计数;性质:两个独立随机变量(取非负整数值)和的母函数是这两个随机变量的母函数的乘积,结论可以推广到n个独立随机变量的情形。(2)应用举例例:从装有号码1,2,3,4,5,6的小球的袋中,有放回地取5个小球(取出1个记下号码放回再依次取),求所得号码总和为15的概率。解:令为第i次取得小球的号码,诸是相互独立的且为同分布,则为摸得的5个小球号码的总和。可以求得的母函数为:,由性质可得:所求概率为的展开式中的系数,所以2矩母函数(1)定义:随机变量X的矩母函数定义为这种变换称为指数变换。(2)性质:;若X的矩母函数存在,则X的矩母函数与分布函数是一一对应的。(3)应用举例例:设X与Y相互独立,则解:,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 工作总结


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!