统计量和抽样分布

上传人:zhu****ng 文档编号:249303890 上传时间:2024-10-28 格式:PPT 页数:35 大小:842KB
返回 下载 相关 举报
统计量和抽样分布_第1页
第1页 / 共35页
统计量和抽样分布_第2页
第2页 / 共35页
统计量和抽样分布_第3页
第3页 / 共35页
点击查看更多>>
资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,从本章起转入课程的第二部分,数理统计,数理统计的特点是应用面广,分支较多.社会的发展不断向统计提出新的问题.,第四章、抽样分布,引言,从本章节开始,,我们将讲述数理统计的基本内容.,理统计作为一门学科诞生于19世纪末20世纪初,,有广泛应用的一个数学分支,,它以概率论为基础,,据试验划观察得到的数据,,来研究随机现象,,研究对象的客观规律性作出合理的估计和判断.,大量随机现象必然呈现出它们的规律性,,故理论上只,要对随机现象进行足够多次观察,,则研究对象的规律,数,是具,根,以便对,由于,必就一定能清楚地呈现出来,,但实际上人们常常无法,对所研究的对象的全体(或,总体,),进行观察,,而只能抽,取其中的部分(或,样本,),数据.,数理统计的任务包括:,限的数据资料;,究,,从而对研究对象的性质、特点,,作出合理的推断,此即所谓的,统计推断问题,,,本课程主要讲述统计推断,的基本内容.,进行观察或试验以获得有限的,怎样有效地收集、,整理有,怎样对所得的数据资料进行分析、,研,由于学时有限,课程的的这部分内容我们只介绍理论部分,即抽样分布。至于具体的方法,学生可以自己推导并学会处理问题。,4.1 统计量,一、总体与样本,一,个统计问题总有它明确的研究对象.,1.,总体,研究某批灯泡的质量,研究对象的全体称为,总体(母体),,总体中每个成员称为,个体,.,总体,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.,某批,灯泡的寿命,该批灯泡寿命的全体就是总体,国产轿车每公里,的耗油量,国产轿车每公里耗油量的全体就是总体,由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布.,这样,,总体就可以用一个随机变量及其分布来描述.,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数,F,(,x,)表示.,某批,灯泡的寿命,总体,寿命,X,可用一概,率分布来刻划,鉴于此,常用随机变量的记号,或用其分布函数表示总体.如,说总体,X,或总体,F,(,x,),.,F,(,x,),类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用,X,和,Y,分别表示身高和体重,那么此总体就可用二维随机变量(,X,Y,)或其联合分布函数,F,(,x,y,)来表示.,统计中,总体这个概念,的要旨是:,总体就是一个,概率分布,.,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“,抽样,”,所抽取的部分个体称为,样本,.样本中所包含的个体数目称为,样本容量,.,2.样本的数学描述,从国产轿车中抽5辆进行耗油量试验,样本容量为5,样本是随机变量.,抽到哪5辆是随机的,容量为,n,的样本可以看作,n,维随机向量.,样本的双重含义,:泛指一次抽样结果,是一个,n,维向量,称为样本的一个观测值。,n,维随机向量;指某次具体抽样结果,但是,一旦取定一组样本,得到的是,n,个具体的数 ,称为样本的一次观察值,简称样本观测值.,2.,独立性,:,X,1,X,2,X,n,是相互独立的随机变量.,最常用的一种抽样方法叫作“,简单随机抽样,”,它要求抽取的样本满足下面两点:,代表性,:,X,1,X,2,X,n,中每一个与所考察的总,体有相同的分布,.,独立,且每一个,与X有相同的分布,则称,定义1,设总体X具有分布函数,是来自总体X的样本,若,相互,为简单的随机样本,简称样本。,事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.,3.总体、样本、样本值的关系,简单随机样本是应用中最常见的情形,今后,当说到“,X,1,X,2,X,n,是取自某总体的样本”时,若不特别说明,就指简单随机样本.,总体(理论分布),?,样本,样本值,统计是从手中已有的资料-样本值,去推断总体的情况-总体分布,F,(,x,)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,分组数据统计表和频率直方图,通过观察或试验得到的样本值,,一般是杂乱无章的,,需要进行整理才能从总体上呈现其统计规律性,,组数据统计表或频率直方图是两种常用的整理方法.,1.,分组数据表:,若样本值较多时,,组,,分组的组数应与样本容量相适应.,分组太少,,难以反映出分布的特征,,分组太多,,则由于样本取,值的随机性而使分布显得杂乱.,因此,,分,可将其分成若干,则,分组时,,确定,分组数(或组距)应以突出分布的特征并冲淡样本的,随机波动性为原则.,区间所含的样本值个数称为该,区间的,组频数.,组频数与总的样本容量之比称为,组,(略小于,),和,(略大于,),选取常数,2.,频率直方图:,频率直方图能直观地表示出组频,率的分布.,其步骤如下:,(1),频率.,设,是样本,个观察值.,的,中,求出,和最,的最小者,大者,将区间,等分成,个小区间,使,(一般取,(2),并,在,左右,,且小区间不包含右端点):,(3),组频率,及,求组频数,(4),在,上以,为高,,为宽作小矩形,,其面积恰为,所有小矩形合在一起就构成了频率,直方图.,例1,从某厂生产的某种零件中随机抽取120个,测得,其质量(单位,:g,),如下表所示,列出分组表,并作频率,直方图,.,解,先从这120个样,本值中找出最小值,190,取,将区间,等分成11个小区间,最大值,222,组距,例1,从某厂生产的某种零件中随机抽取120个,测得,其质量(单位,:g,),如下表所示,列出分组表,并作频率,直方图,.,解,得到分组表及频,从直方图的形状,可以粗略地认为该种零件的质量,率直方图,.,服从正态分布,其数学期望在209附近.,经验分布函数,定义2,设总体,的一个容量为,的样本的样本值,可按大小次序排列成,若,则不大于,的样本值的频率为,因而函数,与事件,在,独立重复试验中的频率相同的,,称,为,经验分布函数.,注:,样本的频率直方图可以形象地描述总体的概率,分布的大致形态,,而经验分布函数则可以用来描述,总体分布函数的大致形状.,有下列结论(格里汶科,1933):,对于上述经验分布函数,由此结果,,对于任一实数,当,充分大时,,经验分布函数的任一个观察值,与总体分布,从而在实际中可当作,来使用.,这就是由样本推断总体其可行性,的最基本的理论依据.,只有微小的差别,,函数,由样本值去推断总体情况,需要对样本值进行“,加工,”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,二、统计量和抽样分布,1.统计量,定义2,设是来自总体X的一个样,本,是一个连续函数,如果,中不包含任何未知参数,则称,是 的一个统计量。,例如,,设总体,服从正态分布,,未知.,为总体的一个样,令,本,,则,与,均为该样本的统计量,,但,不是该样本的统计量,,因其含有总体分布中的未知,参数,注,:,样本,是,维随机向量,,这个随机向量的函数,,用大写字母,,如:,等;,但是,,体取定一组观察值,时,,统计量就是一个具,统计量是,当样本,具,体的实数值,,用小写字母,如:,等.,2.几个常见统计量,样本均值,样本方差,它反映了总体均值,的信息,它反映了总体方差,的信息,样本标准差:,修正样本方差:,样本,k,阶原点矩,样本,k,阶中心矩,k,=1,2,它反映了总体,k,阶矩,的信息,它反映了总体,k,阶,中心矩的信息,补充说明,在样本方差中,中,,为样本的偏差平方和,,,可将其变形如下:,称,从而,例2,某厂实行计件工资制,为及时了解情况,随机,抽取30名工人,调查各自在一周内加工的零件数,然后按规定算出每名工人的周工资如下,:,(单位,:元,),其样本均值,它反映了该厂工人周工资的一般水平,.,为,:,这便是一个容量为,30,的样本观察值,所以样本方差为,进一步我们计算样本方差,及样本标准差,由于,样本标准差为,例3,设我们获得了如下三个样本,:,样本,样本,样本,如果将它们画在数轴上,(如图),明显可见它们的“分,散”程度是不同的,:,样本,在这三个样本中比较密集,而样本,比较分散,.,这一直觉可以用样本方差来表示,.,这三个样本的均,值都是 5,即,而样本容量,易得,例3,设我们获得了如下三个样本,:,样本,样本,样本,易得,同理易得,由此可见,这与直觉是一致的,.,由于样本方差的量纲与样本的量纲不一致,故常用,样本标准差表示,分散程度,易求出,易求出,同样有,由于样本方差,(或样本标准差),很好地反映了总体方,差,(或标准差),的信息,因此,当方差,未知时,常用,去估计,而总体标准差,常用样本标准差,去估,计.,例3,设我们获得了如下三个样本,:,样本,样本,样本,分位数,设随机变量,的分布函数为,对给定的实数,若实数,满足不等式,(1),则称,为随机变量,的分布的,上侧分位数,.,若实数,满足不等式,(2),则称,为随机变量,的分布的,双侧分位数,.,例如,,标准正态分布的上侧分位数和双侧分位数,分位数,例如,,,标准正态分布的上侧分位数和双侧分位数,分别如下图:,分位数的性质:,通常,,直接求解分位数是很困难的,,对常用的统计,分布,,可利用附录中给出的分布函数值表来得到分,位数的值.,例4,设,求标准正态分布的水平 0.05 的上,侧分位数和双侧分位数,.,解,由于,查标准正态分布函数值表可得,而水平 0.05 的双侧分位数为,它满足,:,查标准正态分布函数值表可得,今后,分别记,与,为标准正态分布的上侧,注,:,分位数与双侧分位数.,则,且,标准正态分布 的上侧分位数记为,由于,标准正态概率密度为偶函数,所以若,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!