概率论与数理统计第5章-统计量及其分布1综述课件

上传人:仙*** 文档编号:241543588 上传时间:2024-07-03 格式:PPT 页数:82 大小:1.52MB
返回 下载 相关 举报
概率论与数理统计第5章-统计量及其分布1综述课件_第1页
第1页 / 共82页
概率论与数理统计第5章-统计量及其分布1综述课件_第2页
第2页 / 共82页
概率论与数理统计第5章-统计量及其分布1综述课件_第3页
第3页 / 共82页
点击查看更多>>
资源描述
第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1 1页页四川理工学院第五章 统计量及其分布 5.1 总体与样本5.2 样本数据的整理与显示5.3 统计量及其分布5.4 三大抽样分布5.5 充分统计量 第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2 2页页四川理工学院引言:引言:数理统计学数理统计学的任务是如何使用有效的方法的任务是如何使用有效的方法去收集、整理、分析和推断带有去收集、整理、分析和推断带有随机性影响随机性影响的数据。的数据。例如:若规定灯泡寿命低于例如:若规定灯泡寿命低于10001000小时者为次品,小时者为次品,如何确定次品率?由于灯泡寿命试验是破坏性试验,如何确定次品率?由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡不可能把整批灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验,以样本的信息来推断总体的信作为样本进行检验,以样本的信息来推断总体的信息,这是数理统计学研息,这是数理统计学研 究的问题之一。究的问题之一。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3 3页页四川理工学院数理统计学的应用:数理统计学的应用:几乎在人类活动的一切领域都能程度不同几乎在人类活动的一切领域都能程度不同的找到它的应用。的找到它的应用。工农业生产,医药卫生,天气预报、地震、工农业生产,医药卫生,天气预报、地震、地质勘测。社会(抽样调查)、经济领域(定地质勘测。社会(抽样调查)、经济领域(定量化)等等量化)等等第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4 4页页四川理工学院RAFisher(费歇尔费歇尔)戈赛特戈赛特(W.S.Gosset)K.PearsonJ.NeymanE.S.PearsonA.Wald许宝禄许宝禄第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5 5页页四川理工学院5.1 总体与个体总体与个体总体:研究对象的全体数据 分布个体:构成总体的每个成员第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6 6页页四川理工学院例5.1.1 考察某厂的产品质量,以0记合格品,以1记不合格品,则 总体=该厂生产的全部合格品与不合格品 =由0或1组成的一堆数若以 p 表示这堆数中1的比例(不合格品率),则该总体可由一个二点分布表示:X 0 1P 1 p p第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7 7页页四川理工学院5.1.2 样本样本样本:从总体中随机抽取的n个个体,用大写字母 X1,X2,Xn,则X1,X2,Xn称为总体的一个样本。n为样本容量,简称样本量。样本中的个体称为样品第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第8 8页页四川理工学院 一方面,由于样本是从总体中随机抽取的,抽 取前无法预知它们的数值,因此,样本是随机 变量,用大写字母 X1,X2,Xn 表示;另一方面,样本在抽取以后经观测就有确定的 观测值,因此,样本又是一组数值。此时用小 写字母 x1,x2,xn 表示是恰当的。简单起见,无论是样本还是其观测值,样本一般均用 x1,x2,xn 表示,应能从上下文中加以区别。样本具有两面性第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第9 9页页四川理工学院例例5.1.35.1.3 啤酒厂生产的瓶装啤酒规定净含量为啤酒厂生产的瓶装啤酒规定净含量为640 640 克。由于随机性,事实上不可能使得所有的啤酒克。由于随机性,事实上不可能使得所有的啤酒 净含量均为净含量均为640640克。现从某厂生产的啤酒中随机克。现从某厂生产的啤酒中随机 抽取抽取1010瓶测定其净含量,得到如下结果瓶测定其净含量,得到如下结果:641,635,640,637,642,638,645,643,639,640641,635,640,637,642,638,645,643,639,640这是一个容量为这是一个容量为1010的样本的观测值,的样本的观测值,对应的总体为该厂生产的瓶装啤酒的净含量。对应的总体为该厂生产的瓶装啤酒的净含量。这样的样本称为这样的样本称为完全样本。完全样本。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1010页页四川理工学院例例5.1.45.1.4 考察某厂生产的某种电子元件的考察某厂生产的某种电子元件的 寿命,选了寿命,选了100100只进行寿命试验,得到只进行寿命试验,得到 如下数据:如下数据:第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1111页页四川理工学院表表5.1.25.1.2 100100只元件的寿命数据只元件的寿命数据表5.1.2中的样本观测值没有具体的数值,只有一个范围,这样的样本称为分组样本。寿命范围 元件数 寿命范围 元件数 寿命范围 元件数 (0 24 4 (192 216 6 (384 408 4 (24 48 8 (216 240 3 (408 432 4 (48 72 6 (240 264 3 (432 456 1 (72 96 5 (264 288 5 (456 480 2 (96 120 3 (288 312 5 (480 504 2 (120 144 4 (312 336 3 (504 528 3 (144 168 5 (336 360 5 (528 552 1 (168 192 4 (360 184 1 552 13第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1212页页四川理工学院 独立性:样本中每一样品的取值不影响其 它样品的取值-x1,x2,xn 相互独立。要使得推断可靠,对样本就有要求,使样本能很好地代表总体。通常有如下两个要求:随机性:总体中每一个个体都有同等机会 被选入样本-xi 与总体X有相同的分布。简单随机抽样:简单随机样本第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1313页页四川理工学院用简单随机抽样方法得到的样本称为用简单随机抽样方法得到的样本称为简单随机样本,简单随机样本,也简称也简称样本。样本。于是,样本于是,样本 x x1 1,x x2 2,x xn n 可以看成是可以看成是独立同分布独立同分布(iid iid)的随机变量,的随机变量,其共同分布即为其共同分布即为总体分布。总体分布。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1414页页四川理工学院思考:若总体的密度函数为若总体的密度函数为p p(x x),则其样本的(联,则其样本的(联 合)密度函数是什么?合)密度函数是什么?设总体设总体X X具有分布函数具有分布函数F F(x x),x x1 1,x x2 2,x xn n 为取自该总体的容量为为取自该总体的容量为n n的样本,的样本,则样本则样本联合分布函数联合分布函数为为第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1515页页四川理工学院5.2.1 经验分布函数5.2 样本数据的整理与显示设 x1,x2,xn 是取自总体分布函数为F(x)的样本,若将样本观测值由小到大进行排列,为 x(1),x(2),x(n),则称 x(1),x(2),x(n)为有序样本,用有序样本定义如下函数 第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1616页页四川理工学院则则F Fn n(x x)是一非减右连续函数,且满足是一非减右连续函数,且满足F Fn n()=0)=0 和和 F Fn n()=1)=1由此可见,由此可见,F Fn n(x x)是一个分布函数,是一个分布函数,并称并称F Fn n(x x)为为经验分布函数。经验分布函数。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1717页页四川理工学院例5.2.1 某食品厂生产听装饮料,现从生产线上 随机抽取5听饮料,称得其净重(单位:克)351 347 355 344 351x(1)=344,x(2)=347,x(3)=351,x(4)=351,x(5)=355这是一个容量为5的样本,经排序可得有序样本:第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1818页页四川理工学院其经验分布函数为由由伯努里大数定律:伯努里大数定律:只要只要 n n 相当大,相当大,F Fn n(x x)依概率收敛于依概率收敛于F F(x x)。0 0,x x 344 344 0.20.2,344 344 x x 347 347F Fn n(x x)=0.4)=0.4,347 347 x x 351 351 0.8 0.8,351 351 x x 355 355 1 1,x x 355 355第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第1919页页四川理工学院更深刻的结果也是存在的,这就是格里纹科定理。更深刻的结果也是存在的,这就是格里纹科定理。定理定理5.2.15.2.1(格里纹科定理)(格里纹科定理)设设x1,x2,xn是取自是取自 总体分布函数为总体分布函数为F F(x x)的样本的样本,F Fn n(x x)是其经验分是其经验分 布函数,布函数,当当n n时时,有,有P P supsup F Fn n(x x)F F(x x)0 0 =1=1格里纹科定理表明:格里纹科定理表明:当当n n 相当大时,经验分布函相当大时,经验分布函数是总体分布函数数是总体分布函数F F(x x)的一个良好的近似。的一个良好的近似。经典的统计学中一切统计推断都以样本为依据,经典的统计学中一切统计推断都以样本为依据,其理由就在于此。其理由就在于此。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2020页页四川理工学院 160 196 164 148 170 160 196 164 148 170 175 178 166 181 162 175 178 166 181 162 161 168 166 162 172 161 168 166 162 172 156 170 157 162 154 156 170 157 162 1545.2.2 频数-频率分布表样本数据的整理是统计研究的基础,整理数据的最样本数据的整理是统计研究的基础,整理数据的最常用方法之一是给出其常用方法之一是给出其频数分布表频数分布表或或频率分布表。频率分布表。例例5.2.25.2.2 为研究某厂工人生产某种产品的能力,为研究某厂工人生产某种产品的能力,我们随机调查了我们随机调查了2020位工人某天生产的该种产品位工人某天生产的该种产品 的数量,数据如下的数量,数据如下第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2121页页四川理工学院(1)(1)对样本进行分组:对样本进行分组:作为一般性的原则,组数通作为一般性的原则,组数通 常在常在520520个,对容量较小的样本个,对容量较小的样本;(2)(2)确定每组组距:确定每组组距:近似公式为近似公式为组距组距d d=(=(最大观测值最大观测值 最小观测值最小观测值)/)/组数组数;(3)(3)确定每组组限确定每组组限:各组区间端点为各组区间端点为a a0 0,a a1 1=a a0 0+d d,a a2 2=a a0 0+2+2d d,a ak k=a a0 0+kdkd,形成如下的分组区间形成如下的分组区间(a a0 0,a,a1 1,(,(a a1 1,a a2 2,(,(a ak k-1-1 ,a ak k 对这对这2020个数据个数据(样本样本)进行整理进行整理,具体步骤如下具体步骤如下:其中其中a a0 0 略小于最小观测值略小于最小观测值,a ak k 略大于最大观测值略大于最大观测值.第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2222页页四川理工学院(4)统计样本数据落入每个区间的个数统计样本数据落入每个区间的个数频数,频数,并列出其频数频率分布表。并列出其频数频率分布表。表5.2.1 例5.2.2 的频数频率分布表 组序 分组区间 组中值 频数 频率 累计频率(%)1 (147,157 152 4 0.20 20 2 (157,167 162 8 0.40 60 3 (167,177 172 5 0.25 85 4 (177,187 182 2 0.10 95 5 (187,197 192 1 0.05 100合计 20 1第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2323页页四川理工学院5.2.3 样本数据的图形显示一、直方图直方图是频数分布的图形表示,它的横坐标表示所关心变量的取值区间,纵坐标有三种表示方法:频数,频率,最准确的是频率/组距,它可使得诸长条矩形面积和为1。凡此三种直方图的差别仅在于纵轴刻度的选择,直方图本身并无变化。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2424页页四川理工学院把每一个数值分为两部分,前面一部分(百位和十位)称为茎,后面部分(个位)称为叶,然后画一条竖线,在竖线的左侧写上茎,右侧写上叶,就形成了茎叶图。如:二、茎叶图数值 分开 茎 和 叶 112 11|2 11 和 2第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2525页页四川理工学院例例5.2.35.2.3 某公司对应聘人员进行能力测试,测试某公司对应聘人员进行能力测试,测试 成绩总分为成绩总分为 150150分。下面是分。下面是5050位应聘人员的测位应聘人员的测 试成绩(已经过排序):试成绩(已经过排序):64677072747676798081828283858688919192939393959595979799100100102104106106107108108112112114116118119119122123125126128133我们用这批数据给出一个茎叶图,见下页。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2626页页四川理工学院图5.2.3 测试成绩的茎叶图6 4 77 0 2 4 6 6 98 0 1 2 2 3 5 6 8 9 1 1 2 3 3 3 5 6 6 7 7 910 0 0 2 4 6 6 7 8 811 2 2 4 6 8 9 912 2 3 5 6 813 3 第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2727页页四川理工学院在要比较两组样本时,可画出它们的背靠背的茎叶图。甲车间 6 2 0 5 6 乙车间8 7 7 7 5 5 5 4 2 1 1 6 6 7 7 8 8 8 7 7 6 6 4 4 2 1 7 2 2 4 5 5 5 5 6 6 6 8 8 9 8 7 6 6 5 3 2 8 0 1 1 3 3 3 4 4 4 6 6 7 7 8 7 3 2 1 0 9 0 2 3 5 8 5 3 0 0 10 7 注意:茎叶图保留数据中全部信息。当样本量较 大,数据很分散,横跨二、三个数量级时,茎叶图并不适用。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2828页页四川理工学院5.3.1 统计量与抽样分布5.3 统计量及其分布当人们需要从样本获得对总体各种参数的认识时,最好的方法是构造样本的函数,不同的函数反映总体的不同特征。定义5.3.1 设 x1,x2,xn 为取自某总体的样 本,若样本函数T=T(x1,x2,xn)中不含有任 何未知参数。则称T为统计量。统计量的分布 称为抽样分布。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第2929页页四川理工学院按照这一定义:若 x1,x2,xn 为样本,则 以及经验分布函数F Fn n(x x)都是统计量。而当,2 未知时,x1,x1/等均不是统计量。尽管统计量不依赖于未知参数,但是它的分布一般是依赖于未知参数的。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3030页页四川理工学院5.3.2 样本均值及其抽样分布 定义5.3.2 设 x1,x2,xn为取自某总体的样本,其算术平均值称为样本均值,一般用 表示,即思考:在分组样本场合,样本均值如何计算?二者结果相同吗?第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3131页页四川理工学院定理5.3.2 数据观测值与均值的偏差平方和 最小,即在形如 (xic)2 的函数中,样本均值的基本性质:定理5.3.1 若把样本中的数据与样本均值之差 称为偏差,则样本所有偏差之和为0,即 最小,其中c为任意给定常数。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3232页页四川理工学院样本均值的抽样分布:定理5.3.3 设x1,x2,xn 是来自某个总体的样本,x为样本均值。(1)若总体分布为N(,2),则xx的精确分布为N(,2/n);(2)若总体分布未知或不是正态分布,但 E(x)=,Var(x)=2,则n 较大时 的渐近分 布为N(,2/n),常记为 。xAN(,2/n)这里渐近分布是指n 较大时的近似分布.第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3333页页四川理工学院5.3.3 样本方差与样本标准差称为样本标准准差。s*=s*2定义5.3.3称为样本方差,其算术平方根在n 不大时,常用 作为样本方差,其算术平方根也称为样本标准差。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3434页页四川理工学院在这个定义中,(xi x)2n1称为偏差平方和的自由度。其含义是:x在 确定后,n 个偏差x1x,x2x,xnx能自由取值,因为只有n1个数据可以自由变动,而第n个则不 (xi x)=0.称为偏差平方和,中样本偏差平方和有三个不同的表达式:它们都可用来计算样本方差。思考:分组样本如何计算样本方差?第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3535页页四川理工学院样本均值的数学期望和方差,以及样本方差的数学期望都不依赖于总体的分布形式。定理5.3.4 设总体 X 具有二阶矩,即 E(x)=,Var(x)=2 ,x1,x2,xn 为从该总体得到的样本,x和s2 分别是样本均值和样本方差,则E(x)=,Var(x)=2/n,E(s2)=2 第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3636页页四川理工学院5.3.4 样本矩及其函数 样本均值和样本方差的更一般的推广是样本矩,这是一类常见的统计量。定义5.3.4样本二阶中心矩就是样本方差。样本一阶原点矩就是样本均值。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3737页页四川理工学院当总体关于分布中心对称时,我们用当总体关于分布中心对称时,我们用x和和 s刻画样本特征很有代表性,而当其不对称时,刻画样本特征很有代表性,而当其不对称时,只用只用 就显得很不够。为此,需要一些刻画就显得很不够。为此,需要一些刻画分布形状的统计量,如分布形状的统计量,如样本偏度样本偏度和和样本峰度,样本峰度,它它们都是样本中心矩的函数。们都是样本中心矩的函数。样本偏度s反映了总体分布密度曲线的对称性信息。样本峰度k反映了总体分布密度曲线在其峰值附近的陡峭程度。定义:s=b3/b23/2 称为样本偏度,k=b4/b22-3称为样本峰度。x和和 s第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3838页页四川理工学院5.3.5 次序统计量及其分布 另一类常见的统计量是次序统计量。一、定义5.3.7 设 x1,x2,xn 是取自总体X的样本,x(i)称为该样本的第i 个次序统计量,它的取值 是将样本观测值由小到大排列后得到的第 i 个 观测值。其中x(1)=minx1,x2,xn称为该样本 的最小次序统计量,称 x(n)=maxx1,x2,xn为 该样本的最大次序统计量。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第3939页页四川理工学院例例5.3.65.3.6 设总体设总体X X 的分布为仅取的分布为仅取0 0,1 1,2 2的离散的离散 均匀分布,分布列为均匀分布,分布列为0 0 1 1 2 2 1/31/3 1/3 1/31/3 1/3我们知道,在一个样本中,x1,x2,xn 是独立同分布的,而次序统计量 x(1),x(2),x(n)则既不独立,分布也不相同,看下例。现从中抽取容量为现从中抽取容量为3 3的样本,其一切可能取值有的样本,其一切可能取值有3 33 3=27=27种,表种,表5.3.65.3.6列出了这些值,由此列出了这些值,由此第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4040页页四川理工学院 0 1 2 0 1 2我们可以清楚地看到这三个次序统计量的分布是不相同的。可给出的可给出的 x x(1)(1),x x(2)(2),x x(3)(3)分布列如下:分布列如下:0 1 2第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4141页页四川理工学院进一步,我们可以给出两个次序统计量的联合分布,如,x(1)和x(2)的联合分布列为01207/279/273/27104/273/272001/27x(1)x(2)第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4242页页四川理工学院因为 P(x(1)=0,x(2)=0)=7/27 ,二者不等,由此可看出x(1)和 x(2)是不独立的。而 P(x(1)=0)*P(x(2)=0)=(19/27)*(7/27),第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4343页页四川理工学院二、单个次序统计量的分布定理5.3.5 设总体X的密度函数为p(x),分布 函数为F(x),x1,x2,xn为样本,则第k个 次序统计量x(k)的密度函数为第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4444页页四川理工学院例5.3.7 设总体密度函数为 p(x)=3x2,0 x1.从该总体抽得一个容量为5的样本,试计算 P(x(2)1/2)。解:总体的分布函数为:由公式可得:第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4545页页四川理工学院例5.3.8 设总体分布为U(0,1),x1,x2,xn为样 本,试求第 k 个次序统计量的分布。解:总体的分布函数为:求第 k 个次序统计量的密度函数为:第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4646页页四川理工学院三、多个次序统计量的联合分布对任意多个次序统计量可给出其联合分布,以两个为例说明:定理5.3.6 在定理5.3.5的记号下,次序统计 量(x(i),x(j),(i j)的联合分布密度函数为第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4747页页四川理工学院次序统计量的函数在实际中经常用到。如 样本极差 Rn=x(n)x(1),样本中程 x(n)x(1)/2。样本极差是一个很常用的统计量,其分布只在很少几种场合可用初等函数表示。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4848页页四川理工学院令 R=x(n)x(1),由 R 0,可以推出0 x(1)=x(n)R 1 R,则例5.3.9 设总体分布为U(0,1),x1,x2,xn 为 样本,则(x(1),x(n)的联合密度函数为p1,n(y,z)=n(n1)(zy)n-2,0 y z 1这正是参数为(n1,2)的贝塔分布。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第4949页页四川理工学院5.3.6 样本分位数与样本中位数样本中位数也是一个很常见的统计量,它也是次序统计量的函数,通常如下定义:更一般地,样本p分位数mp可如下定义:第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5050页页四川理工学院定理5.3.7 设总体密度函数为p(x),xp为其p分 位数,p(x)在xp处连续且 p(xp)0,则特别,对样本中位数,当n时近似地有当n 时样本 p 分位数 mp 的渐近分布为第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5151页页四川理工学院例5.3.10 设总体为柯西分布,密度函数为p(x,)=1/(1+(x)2),x x +通常,样本均值在概括数据方面具有一定的优势。通常,样本均值在概括数据方面具有一定的优势。但当数据中含有极端值时,使用中位数比使用均但当数据中含有极端值时,使用中位数比使用均值更好,中位数的这种抗干扰性在统计中称为具值更好,中位数的这种抗干扰性在统计中称为具有有稳健性稳健性。不难看出不难看出是该总体的中位数,即是该总体的中位数,即x0.5=。设设 x1,x2,xn 是来自该总体的样本,当样本量是来自该总体的样本,当样本量n n 较大时,样本中位数较大时,样本中位数m0.5 的渐近分布为的渐近分布为m0.5 AN(,2/4n).第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5252页页四川理工学院5.3.7 五数概括与箱线图次序统计量的应用之一是五数概括与箱线图。在得到有序样本后,容易计算如下五个值:最小观测值 xmin=x(1),最大观测值 xmax=x(n),中位数 m0.5,第一4分位数 Q1=m0.25,第三4分位数 Q3=m0.75.所谓五数概括就是指用这五个数:xmin,Q1,m0.5,Q3,xmax来大致描述一批数据的轮廓。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5353页页四川理工学院5.4 三大抽样分布大家很快会看到,有很多统计推断是基于正态分布的假设的,以标准正态变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有明显表达式,它们被称为统计中的“三大抽样分布”。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5454页页四川理工学院5.4.1 2 分布(卡方分布)定义5.4.1 设 X1,X2,Xn,独立同分布于标准 正态分布N(0,1),则 2 2=X12+Xn2的分布称 为自由度为n 的 2 2分布,记为 2 2 2 2(n n)。德国大地测量学者赫尔梅特(T.Helmet)1876年,在研究正态总体样本方差时发现了卡方分布第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5555页页四川理工学院卡方分布的密度函数:第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5656页页四川理工学院该密度函数的图像是一只取非负值的偏态分布 第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5757页页四川理工学院第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5858页页四川理工学院第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第5959页页四川理工学院第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6060页页四川理工学院第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6161页页四川理工学院5.4.2 F 分布定义5.4.2 设X1 2 2(m m),X2 2 2(n n),),X1与X2独立,则称 F=(X1/m)/(X2/n)的分布是自由度为 m 与 n 的 F分布,记为F F(m,n),其中m 称为分子自 由度,n 称为分母自由度。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6262页页四川理工学院第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6363页页四川理工学院该密度函数的图象也是一只取非负值的偏态分布 第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6464页页四川理工学院当随机变量F F(m,n)时,对给定 (01),称满足 P(F F1(m,n)=1)=1 的F1(m,n)是自由度为m 与 n 的F 分布的1 1 分位数。由 F 分布性质:F(n,m)=1/F1(m,n)。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6565页页四川理工学院65第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6666页页四川理工学院第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6767页页四川理工学院5.4.3 t 分布 定义 5.4.3 设随机变量X1 与X2 独立,且X1 N(0,1),X2 2 2(n n),则称t=X1/X2/n的分布为自由度为n 的t 分布,记为t t(n)。英国医生戈赛特(笔名:学生)1980年导出了t统计量的精确分布,开创了小样本的先河第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6868页页四川理工学院第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第6969页页四川理工学院 t 分布的密度函数的图象是一个关于纵轴对称的分布,与标准正态分布的密度函数形状类似,只是峰比标准正态分布低一些尾部的概率比标准正态分布的大一些。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7070页页四川理工学院 n1时,t 分布的数学期望存在且为0;n2时,t 分布的方差存在,且为n/(n2);当自由度较大(如n30)时,t 分布可以用 正态分布 N(0,1)近似。自由度为1的 t 分布就是标准柯西分布,它的均值不存在;第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7171页页四川理工学院当随机变量t t(n)时,称满足P(t t1(n)=1)=1的 t1(n)是自由度为 n 的 t 分布的1 1分位数.分位数 t1(n)可以从附表4中查到。譬如 n=10,=0.05,那么从附表4上查得t10.05(10)=t0.95(10)=1.812.由于 t 分布的密度函数关于0 对称,故其分位数间有如下关系t(n1)=t1(n1)第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7272页页四川理工学院推论5.4.2 设 x1,x2,xn 是来自N(,2)的样本,x和s2 分别是样本均值和样本方差,则有第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7373页页四川理工学院推论5.4.3 在推论5.4.1的记号下,设 12=22=2,并记则第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7474页页四川理工学院5.5 充分统计量5.5.1 充分性的概念例5.5.1 为研究某个运动员的打靶命中率,我们 对该运动员进行测试,观测其10次,发现除第 三、六次未命中外,其余8次都命中。这样的 观测结果包含了两种信息:(1)打靶10次命中8次;(2)2次不命中分别出现在第3次和第6次 打靶上。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7575页页四川理工学院第二种信息对了解该运动员的命中率是没有什么帮助的。一般地,设我们对该运动员进行n 次观测,得到 x1,x2,xn,每个xj 取值非0即1,命中为1,不命中为0。令 T=x1+xn,T为观测到的命中次数。在这种场合仅仅记录使用T 不会丢失任何与命中率 有关的信息,统计上将这种“样本加工不损失信息”称为“充分性”。样本 x=(x1,x2,xn)有一个样本分布F (x),这个分布包含了样本中一切有关 的信息。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7676页页四川理工学院统计量T=T(x1,x2,xn)也有一个抽样分布F T(t),当我们期望用统计量T 代替原始样本并且不损失任何有关 的信息时,也就是期望抽样分布 F T(t)像 F(x)一样概括了有关 的一切信息,这即是说在统计量 T 的取值为 t 的情况下样本 x 的条件分布 F(x|T=t)已不含 的信息,这正是统计量具有充分性的含义。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7777页页四川理工学院定义5.5.1 设 x1,x2,xn 是来自某个总体 的样本,总体分布函数为F (x;),统计 量 T=T(x1,x2,xn)称为 的充分统计 量,如果在给定T 的取值后,x1,x2,xn 的条件分布与 无关.第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7878页页四川理工学院5.5.2 因子分解定理充分性原则:在统计学中有一个 基本原则-在充分统计量存在的场合,任何统计推断都 可以基于充分统计量进行,这可以简化统计 推断的程序。定理5.5.1 设总体概率函数为 p(x;),X1,Xn 为样本,则 T=T(X1,Xn)为充分统计量的充分 必要条件是:存在两个函数g(t;)和h(x1,xn),使得对任意的 和任一组观测值 x1,x2,xn,有p(x1,x2,xn;)=g(T(x1,x2,xn);)h(x1,x2,xn)(5.5.1)第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第7979页页四川理工学院例5.5.4 设x1,x2,xn是取自总体U(0,)的样本,即总体的密度函数为其中g(t,)是通过统计量 T 的取值而依赖于样本的。p(x;)=1/,0,0 x 0 ,0 ,其他于是样本的联合密度函数为第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第8080页页四川理工学院取T=x(n),并令 g(t;)=(1/)n nI I t t ,h(x)=1,由因子分解定理知T=x(n)是 的充分统计量。p(x1;)p(xn;)=0,其它 (1/)n n,0minximaxxi 由于诸xi 0 0,所以我们可将上式改写为p(x1;)p(xn;)=(1/)n nI I x(n)例5.5.5 设x1,x2,xn 是取自总体N(,2)的样 本,=(,2)是未知的,则联合密度函数为第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第8181页页四川理工学院取 t1=xi,t2=xi2,并令g(t1,t2,)=(22)-n/2exp-n 2/(22)exp(t22 t1)/(22),其中 h(x)=1,由因子分解定理,T=(xi,xi2)是充分统计量。第五章第五章 统计量及其分布统计量及其分布 华东师范大学华东师范大学7/3/20247/3/2024第第8282页页四川理工学院 是一一对应的,这说明在正态总体场合 常用的进一步,我们指出这个统计量与(x,s2)(x,s2)是充分统计量。
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!