概率论-第6章-样本及抽样分布

上传人:su****e 文档编号:243739556 上传时间:2024-09-30 格式:PPTX 页数:90 大小:1.92MB
返回 下载 相关 举报
概率论-第6章-样本及抽样分布_第1页
第1页 / 共90页
概率论-第6章-样本及抽样分布_第2页
第2页 / 共90页
概率论-第6章-样本及抽样分布_第3页
第3页 / 共90页
点击查看更多>>
资源描述
,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,概率论与数理分析,第六章 样本及抽样分布,1,随机样本,2,直线图和箱线图,3,抽样分布,引言,随机变量,及其所伴随的概率分布全面描述了随机,现象的统计性规律。,概率论,的许多问题中,随机变量的概率分布通常,是已知的,或者假设是已知的,而一切计算与推理都,是在这已知是基础上得出来的。,但,实际中,情况往往并非如此,一个随机现象所,服从的分布可能是完全不知道的,或者知道其分布概,型,但是其中的某些参数是未知的。,1,随机样本,例如:,某公路上行驶车辆的速度服从什么,分布是未知的,;,电视机的使用寿命服从什么,分布是未知的,;,产品是否合格服从两点分布,但参数,合格率,p,是,未知的;,数理统计,的任务则是,以概率论为基础,根据试验,所得到的数据,对研究对象的客观统计规律性做出合,理的推断。,1,随机样本,一、总体与个体,1.,总体,试验的全部可能的观察值称为总体,.,2.,个体,总体中的每个可能观察值称为个体,.,例,1,在,研究,2 000,名学生,的年龄时,这些学生的年龄的全体就构成一个总体,每个学生,的年龄就是个体,.,1,随机样本,3.,容量,总体中所包含的个体的个数称为总体的容量,.,4.,有限总体和无限总体,容量为有限的称为有限总体,.,容量为无限的称为无限总体,.,产的灯泡寿命,.,某工厂,10,月份生产的灯泡寿命所组成的总,个体的总数就是,10,月份生产的灯泡数,个有限总体,;,例,2,体中,这是,而该工厂生产的所有灯泡寿命所组成,的总体是一个无限总体,它包括以往生产和今后生,1,随机样本,所形成的总体中共含,2 000,个,例,3,在考察某大学一年级男生的身高这一试,试验中,,若一年级男生共,2 000,人,,每个男生的身高,是一个可能观察值,,可能观察值,,是一个有限总体,.,总体也是有限总体,.,例,4,考察某一湖泊中某种鱼的含汞量,,所得,1,随机样本,我们可以认为,有些有限总体,,它的容量很大,它是一个无限总体,.,例,5,考察全国正在使用的某种型号灯泡的,寿,可以认为是无限总体,.,命,所形成的总体,由于可能观察值的个数很多,就,1,随机样本,因此在理论上可以把总体与概率分布等同起来,.,我们关心的是总体中的个体的某项指标,(,如人的身高、灯泡的寿命,汽车的耗油量,),.,由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性,.,从而,可以把这种数量指标看作一个随机变量,X,,因此随机变量,X,的分布就是该数量指标在总体中的分布,.,总体就可以用一个随机变量及其分布来描述,.,1,随机样本,5.,总体分布,例如,:,研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量,X,表示,或用其分布函数,F,(,x,),表示,.,某批,灯泡的寿命,总体,寿命,X,可用一概率,(指数)分布来刻划,鉴于此,常用随机变量的记号,或用其分布函数表示总体,.,如,说总体,X,或总体,F,(,x,) .,1,随机样本,类似地,在研究某地区中学生的营养状况时 ,若关心的数量指标是身高和体重,我们用,X,和,Y,分别表示身高和体重,那么此总体就可用二维随机变量,(,X,Y,),或其联合分布函数,F,(,x,y,),来表示,.,统计,中,总体这个概念的要旨是:,总体就是一个随机变量,(,向量,),或一个,概率分布,.,1,随机样本,X,的分布函数和数字特征就称为,总体的分布,函数和数字特征,.,今后将不区分总体与相应的随机,变量,.,参数为,p,的(,0-1,),分布:,例如,,我们检验自生产线出来的零件是次品还,是正品,,以,0,表示产品是正品,,以,1,表示产品为次品,.,的随机变量,.,设出现次品的频率,为,p,(常数),,那么总体是由一,些,“,0”,和一些,“,1”,所组成,,这一总体对应于一个具有,1,随机样本,根据获得的数据来对总体分布得出,在数理统计中,人们,都是通过从总体中抽取,一部分个体,被抽出的部分个体叫做总体的一个样本,.,判断的,.,所谓从总体抽取一个个体,就是对总体,X,进行,一次观察并记录其结果,.,1,随机样本,二、随机样本的定义,1.,样本的定义,1,随机样本,2.,简单随机抽样的定义,获得简单随机样本的抽样方法称为简单随机抽样,.,1,随机样本,解,例,7,1,随机样本,解,例,8,1,随机样本,1,随机样本,三、小结,个体 总体,有限总体,无限总体,基本概念,:,统称为总体,X,.,说明,2,随机样本,一个总体对应一个随机变量,X,说明,1,我们将不区,分总体和相应的随机变量,在实际中遇到的总体往往是有限总体,它,个数很大时,在理论上可认为它是一个无限总体,.,对应一个,离散型,随机变量,;,当总体中包含的个体的,1,随机样本,男子的头颅的最大宽度,(,mm,),,141,148,132,138,154,142,150,146,155,158,150,140,147,148,144,150,149,145,149,158,143,141,144,144,126,140,144,142,141,140,145,135,147,146,141,136,140,146,142,137,148,154,137,139,143,140,131,143,141,149,148,135,148,152,143,144,141,143,147,146,150,132,142,142,143,153,149,146,149,138,142,149,142,137,134,144,146,147,140,142,140,137,152,145,一、直方图,例,1,下面给出了,84,个伊特拉斯坎,(,Etruscan,),人,数据的,“频率直方图”,.,现在来画这些,2,直方图和箱线图,步骤:,1.,找出最小值,126,,,最大值,158,,,现取区间,124.5,159.5,;,2.,将区间,124.5,,,159.5,等分为,7,个小区间,,3.,小区间的端点称为组限,数出落在每个小区,2,直方图和箱线图,列表如下:,组 限,频 数,频 率,累计频率,124.5129.5,1,0.0119,0.0119,129.5134.5,4,0.0476,0.0595,134.5139.5,10,0.1191,0.1786,139.5144.5,33,0.3929,0.5715,144.5149.5,24,0.2857,0.8572,149.5154.5,9,0.1071,0.9524,154.5159.5,3,0.0357,1.0000,这样的图形叫频率直方图,.,2,直方图和箱线图,2,直方图和箱线图,频率直方图,二、箱线图,定义,2,直方图和箱线图,综上,,2,直方图和箱线图,2,直方图和箱线图,例,2,设有一组容量为,18,的样本如下(已经排过序),122 126 133 140 145 145 149 150 157,解,162 166 175 177 177 183 188 199 212,2,直方图和箱线图,2,直方图和箱线图,数据集的箱线图是由箱子和直线组成的图形,,它是基于以下五个数的图形概括:,2,直方图和箱线图,在同一水平,高度自箱子右侧引一条水平线直至最大值,.,2,直方图和箱线图,以下是,8,个病人的血压(收缩压,,mmHg,)数,解,故,例,3,试作出箱线图,.,据(已经过排序 ),,102 110 117 118 122 123 132 150,2,直方图和箱线图,故,故,作出箱线图如图所示,.,2,直方图和箱线图,例,4,量(以升计,.,数据应经过排序),女子组,2.7 2.8 2.9 3.1 3.1 3.1 3.2 3.4 3.4,男子组,4.1 4.1 4.3 4.3 4.5 4.6 4.7 4.8 4.8,试分别画出这两组数据的箱线图,.,下面分别给出了,25,个男子和,25,个女子的肺活,3.4 3.4 3.4 3.5 3.5 3.5 3.6 3.7 3.7,3.7 3.8 3.8 4.0 4.1 4.2 4.2,5.1 5.3 5.3 5.3 5.4 5.4 5.5 5.6 5.7,5.8 5.8 6.0 6.1 6.3 6.7 6.7,2,直方图和箱线图,解,女子组,男子组,作出箱线图如(教材,P134,)图,6-4,所示,.,2,直方图和箱线图,在数据集中,,称为,四分位数间距,.,某一个观察值不寻常地大于或,小于该数据集中的其他数据,,称为,疑似异常值,.,疑似异常值,2,直方图和箱线图,修正箱线图,自箱子左侧引一水平线段直至数据集中,又自箱子右侧引一,除去疑似异常值后的最小值,,水平线直至数据集中除去疑似异常值后的最大值,.,2,直方图和箱线图,例,5,下面给出了某医院,21,个病人的住院时间(以,1 2 3 3 4 4 5 6 6 7 7 9 9,解,试画出修正箱线图(数据已经过排序),.,天计),,10 12 12 13 15 18 23 55,2,直方图和箱线图,故,55,是疑似异常值,,且仅此一个疑,疑似异常值,.,作出修正箱线图如(教材,P135,)图,6-5,所示,.,2,直方图和箱线图,1.,频率直方图作图步骤,(1),找出最小值和,最大值,,,(2),将选定区间分为,k,个小区间;,三、小结,2,直方图和箱线图,高度自箱子右侧引一条水平线直至最大值,.,2.,箱线图,作图步骤,2,直方图和箱线图,一、基本概念,1.,统计量的定义,3,抽样分布,是,不是,实例,1,3,抽样分布,2.,几个常用统计量的定义,(1),样本平均值,(2),样本方差,其观察值,3,抽样分布,其观察值,(3),样本标准差,其观察值,3,抽样分布,(4),样本,k,阶,(,原点,),矩,其观察值,(5),样本,k,阶中心矩,其观察值,3,抽样分布,证明,再根据第五章辛钦定理知,由以上定义得下述结论,:,3,抽样分布,由第五章关于依概率收敛的序列的性质知,由第五章关于依概率收敛的序列的性质知,以上结论是下一章所要介绍的矩估计法的理,论根据,.,3,抽样分布,3.,经验分布函数,经验分布函数的做法如下,:,3,抽样分布,实例,3,抽样分布,实例,3,抽样分布,一般地,,3,抽样分布,格里汶科定理,3,抽样分布,二、常见分布,统计量的分布称为抽样分布,.,自由度是指,上式,右端包含的独立变量的个数,.,3,抽样分布,证明,3,抽样分布,3,抽样分布,性质,1,(,此性质可以推广到多个随机变量的情形,. ),3,抽样分布,性质,2,证明,3,抽样分布,3,抽样分布,根据正态分布的对称性知,例,1,3,抽样分布,附表,5,只详列到,n,=40,为止,.,例,2,3,抽样分布,例如,利用上面公式,而查详表可得,费舍尔,(,R.A.Fisher,),证明,:,3,抽样分布,例,3,解,根据正态分布的性质,3,抽样分布,3,抽样分布,3,抽样分布,t,分布又称学生氏,(Student),分布,.,2.,3,抽样分布,形,.,当,n,充分大时,其图,形类似于标准正态,变量概率密度的图,3,抽样分布,由分布的对称性知,3,抽样分布,例,4,3,抽样分布,3.,3,抽样分布,3,抽样分布,根据定义可知,3,抽样分布,例,5,3,抽样分布,证明,3,抽样分布,3,抽样分布,4.,正态总体的样本均值与样本方差的分布,定理一,3,抽样分布,定理二,3,抽样分布,证明,由,t,分布的定义知,定理三,且两者独立,3,抽样分布,定理四,3,抽样分布,3,抽样分布,证明,(1),由定理二,3,抽样分布,(2),3,抽样分布,3,抽样分布,解,例,6,3,抽样分布,查标准正态分布表知,3,抽样分布,解,例,7,3,抽样分布,3,抽样分布,3,抽样分布,三、小结,两个最重要的统计量,:,样本均值,样本方差,三个来自正态分布的抽样分布,:,3,抽样分布,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!