次序统计量及其分布课件

上传人:文**** 文档编号:242620220 上传时间:2024-08-29 格式:PPT 页数:24 大小:376.20KB
返回 下载 相关 举报
次序统计量及其分布课件_第1页
第1页 / 共24页
次序统计量及其分布课件_第2页
第2页 / 共24页
次序统计量及其分布课件_第3页
第3页 / 共24页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二层,第三层,第四层,第五层,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二层,第三层,第四层,第五层,*,5.3,次序统计量及其分布,定义,定义,5-3-1:,设,为取自总体,X,的样本,,将其按大小顺序排序,则称,X,(,k,),为第,k,个次序统计量,( No.k Order Statistic),特别地,称,(,5-3-1,),为最小顺序统计量,(Minimum order Statistic),称,(,5-3-2,),为最大顺序统计量,(Maximum order Statistic),。,1,5.3 次序统计量及其分布定义定义 5-3-1: 设为取,例,5-3-1,:设总体,X,的分布为仅取,0, 1, 2,的离散均匀分布,其分布列为,x,0 1 2,p,现从中抽取容量为,3,的样本,其一切可能取值有,种,现将它们以及由它们所构成的次序统,计量 的一切可能值列在表中,(P243),,,由此可给出,的分布列如下:,X,(1),0,1,2,P,19/27,7/27,1/27,X,(2),0,1,2,P,7/27,13/27,7/27,X,(3),0,1,2,P,1/27,7/27,19/27,2,例5-3-1:设总体X的分布为仅取 0, 1, 2 的离散均,可见这三个次序统计量的分布是不相同的。,进一步,我们可以给出两个次序统计量的联合分布,如,x,(1),和,x,(2),的联合分布列为,x,(2),x,(1),0,1,2,0,7/27,9/27,3/27,1,0,4/27,3/27,2,0,0,1/27,易于看出,不等于,即,x,(1),和,x,(2),是不独立的。,3,可见这三个次序统计量的分布是不相同的。进一步,我们可以给出两,次序统计量的分布,(一)单个次序统计量的分布,定理,5-3-1,:设总体,X,的密度函数为,p,(,x,),,分布函数为,F,(,x,),,,x,1,x,2,x,n,为样本,则第,k,个次序统计量,x,(,k,),的密度函数为,(,5-3-3,),证明: 对任意的实数,x,,考虑次序统计量,x,(,k,),取值落在小区间,(,x , x,+,x,内这一事件,它等价于,“,样本容量为,n,的样本中有,1,个观测值落在区间,(,x , x,+,x,之间,而有,k,-1,个观测值小于等于,x,,有,n-k,个观测值大于,x,+,x,”,,其直观示意图见下图,5-8 .,4,次序统计量的分布(一)单个次序统计量的分布定理 5-3-1:,x,x,+,x,n-k,k,- 1,1,图,58,x,(,k,),的取值示意图,样本的每一分量小于等于,x,的概率为,F,(,x,) ,落入区间,(,x , x,+,x,概率为,F(,x,+ ,x,)-F(,x,),落入区间,(x+ x, b,的概率为,1-,F,(,x,+,x,),,而将,n,个分量分成这样的三组,总的分法有,种,于是,若以,F,k,(,x,),记,x,(,k,),的分布函数,则由多项分布可得,5,x x+xn-kk,两边同除以,x,并令 ,x,0 ,即有,推论,1,:最大次序统计量,x,(,n,),的概率密度函数为,推论,2,:最小次序统计量,x,(1),的概率密度函数为,(5-3-4),(5-3-5),6,两边同除以 x , 并令 x0 , 即有推论1 :最大,例,5-3-2,:,设总体,X,的密度函数为,现从该总体中抽得一个容量为,5,的样本,试计算,解: 我们首先应求出,x,(2),的分布。由总体密度函数不难求出总体分布函数为,由公式(,5-3-3,)可以得到,x,(2),的密度函数为,7,例 5-3-2 :设总体X 的密度函数为现从该总体中抽得一个,于是,8,于是8,(二)多个次序统计量的联合分布,仅讨论任意二个次序统计量的情形。,定理,5-3-2,:设总体,有密度函数,f,(,x,) ,a,x,b,(同样可设,a,= -,b,= +,),。并且,1,2, ,n,是取自这一总体的一个样本,则其任意两个次序统计量,(1),(2),的联合分布密度函数为,(,5-3-6,),证明:对增量,y, ,z,以及,y, 0,可以推出,则,该分布参数为,(,n,-1, 2 ),的贝塔分布。,12,例5-3-4:设总体分布为 U ( 0 , 1 ) , x1,总体分位数与样本分位数,(一)总体分位数,定义,5-3-2,: 设总体,X,的分布函数为,F,(,x,),,满足,(5-3-7),的,x,称为,X,的,分位数,如下图所示。,几种常用分布,的分位数,13,总体分位数与样本分位数(一)总体分位数定义5-3-2: 设总,都在书后附表中可以查到。其中,N,( 0, 1 ),是分布函数表,(,x,),反过来查,而其它几个分布,则是分别对给出,的几个的常用值如,=0, 0.25, 0.05, 0.1, 0.9, 0.95, 0.975,等等,列出相应分布对应值的,分位点。图,5-9,给出了四种常用分布的,分位点表示方法,其中,N,( 0, 1 ),的,分位点通常记成,u,.,图,5-9,14,都在书后附表中可以查到。其中 N ( 0, 1 )是分布函数,这里要注意到如下几个有用的事实。,,要求的分位数,x,可化成求,1),若,N,( 0, 1 ),的分位数,.,此时,,故,从而,2,) 对于,T t,(,n,),,由密度函数的对称性可知,即,(,5-3-8,),(,5-3-9,),15,这里要注意到如下几个有用的事实。,要求的分位数 x, 可化,3,)对于,F,分布,由于,所以,即,(,5-3-10,),16,3)对于 F分布由于所以即(5-3-10)16,(二)样本分位数,定义,5-3-3,:设,为取自总体,X,的次序统计量,称,m,p,为样本,p,分位数,。(,Sample p,Quantile ),特别地,当,p,=,时,称,m,p,为,样本中位数,。,(,5-3-11,),(,5-3-12,),17,(二)样本分位数定义5-3-3:设为取自总体 X 的次序统计,对多数总体而言,要给出样本,p,分位数的精确分布通常不是一件容易的事,但当,n,+,时,样本,p,分位数的渐近分布有比较简单的表达式,我们这里不加证明地给出如下定理。,定理,5-3-4,:设总体密度函数为,f,(,x,) ,x,p,为其,p,分位数,,f,(,x,),在,x,p,处连续且,f,(,x,) 0 ,则当,n,+,时,样本,p,分位数,m,p,的渐近分布为,特别地,对样本中位数有,(,5-3-13,),18,对多数总体而言,要给出样本 p 分位数的精确分布通常不是一件,例,5-3-2,:,设总体,X,为柯西分布,其密度函数为,其分布函数为,易知,,是该总体的中位数,即,x,=,.,设,是来自该总体的样本,则,当样本容量,n,较大时,样本中位数,m,0.5,的渐近分布为,19,例5-3-2: 设总体 X 为柯西分布,其密度函数为其分布函,五数概括与箱线图,次序统计量的应用之一就是五数概括与箱线图。在得到有序样本后,容易计算如下五个值:,最小观测值,x,min,=,x,(1),;,最大观测值,x,max,=,x,(,n,),;,中位数,m,0.5,;,第一,4,分位数,Q,1,=,m,0.25,第三,4,分位数,Q,3,=,m,0.75,。,所谓五数概括就是指用这五个数来大致描述一批数据的轮廓。,20,五数概括与箱线图次序统计量的应用之一就是五数概括与箱线图。在,例,5-3-4,:表,5,5,是某厂,160,名销售人员某月的销售量数据的有序样本,由该批数据可计算得到:,五数概括的图形表示称为箱线图,由箱子和线段组成。图,5-11,是该例中样本数据的箱线图,其作法如下,下面就通过一个具体的实例说明之。,21,例 5-3-4 :表 55 是某厂 160 名销售人员某月,45,74,76,80,87,91,92,93,95,96,98,99,104,106,111,113,117,120,122,122,124,126,127,127,129,129,130,131,131,133,134,134,135,136,137,137,139,141,141,143,145,148,149,149,149,150,150,153,153,153,153,154,157,160,160,162,163,163,165,165,167,167,168,170,171,172,173,174,175,175,176,178,178,178,179,179,179,180,181,181,188,189,189,191,191,191,192,192,194,194,194,194,195,196,197,197,198,198,198,199,200,201,202,204,204,205,205,206,207,210,214,214,215,215,216,217,218,219,219,221,221,221,221,221,222,223,223,224,227,227,228,229,232,234,234,238,240,242,242,242,244,246,253,253,255,258,282,290,314,319,表,5,11,某厂,160,名销售员的月销售量的有序样本,22,457476808791929395969899104106,(,1,)画一个箱子,其两侧恰为第一,4,分位数和第三,4,分位数,在中位数位置上画一条竖线,它在箱子内,这个箱子包含了样本中,50%,的数据;,45 144 181 212 319,图,5-11,月销售量数据的箱线图,(,2,)在箱子左右两侧各引出一条水平线,分别至最小值和最大值为止,每条线段包含了样本中,25%,的数据。,箱线图可用来对数据分布的形状进行大致的判断。图,5-12,给出三种常见的箱线图,分别对应对称分布、左偏分布和右偏分布。,23,(1)画一个箱子,其两侧恰为第一 4 分位数和第三 4 分位,左偏 对称 右偏,图,5-12,三种常见的箱线图及其对应的分布轮廓,如果我们要对几批数据进行比较,则可以在一张纸上同时画出这批数据的箱线图。图,5,13,是某厂,20,天生产的某种产品的直径数据画成的箱线图,从图中可以清楚地看出,第,17,天的产品出现了异常。,1 2 3 4 5 6 7 8 9 10 12 14 16 18 20,30,40,50,24,左偏,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!