资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作,。,但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断,。,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科,.,数理统计学,数理统计学是一门应用性很强的学科,.,它是研究怎样以,有效的方式,收集、,整理和分析,带有随机性的数据,,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议,.,计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势,.,学习统计无须把过多时间花在计算上,可以更有效地把时间用在基本概念、方法原理的正确理解上,.,国内外著名的统计软件包:,SAS,,,SPSS,,,STAT,等,都可以让你快速、简便地进行数据处理和分析,.,概率论,与,数理统计,是两个有密切联系的学科,它们都以随机现象的统计规律为研究对象,.,但在研究问题的方法上有很大区别:,概率论,已知随机变量服从某分布,寻求分布的性质、数字特征、及其应用,;,数理统计,通过对试验数据的统计分析,寻找所服从的分布和数字特征,从而推断总体的规律性,.,数理统计的核心问题,由样本推断总体,6.1,总体与样本,1.,总体、个体和样本的概念,2.,随机样本的定义,3.,小结,总体容量有限的称为,有限总体,总体,一,个统计问题总有它明确的研究对象,.,(1),总体,研究对象的全体称为,总体,(,母体,),,,总体中每个对象称为,个体,.,总体、个体和样本的概念,研究某批灯泡的质量,总体,考察国产 轿车的质量,在统计研究中,人们关心总体仅仅是关心其每个个体的一项,(,或几项,),数量指标和该数量指标在总体中的分布情况,.,该批灯泡寿命的全体就是总体,灯泡的寿命,每公里的耗油量,所有国产轿车每公里耗油量的全体就是总体,这时,,每个个体具有的数量指标的全体就是总体,.,称总体中所含个体的数目为,总体容量,总体容量无限的称为,无限总体,.,并常用随机变量的记号或用其分布函数表示总体,.,比如说,总体,X,或,总体,F,(,x,),.,很自然地,我们就用随机变量,X,来表示所考察的总体,.,设该大学一年级学生的年龄分布如下,年龄,18 19 20 21,22,比例,0.5 0.3 0.1 0.07 0.03,若从该大学一年级学生中任意抽查学生的年龄,,X,的概率分布是:,可见,X,的概率分布反映了总体中各个值的分布情况,.,考察某大学一年级,学生的年龄,某大学一年级全体学生,的年龄构成问题的总体,也就是说,,总体可以用一个随机变量,X,或其分布来描述,.,所得结果为一随机变量,记作,X,.,X,概率,X,的,分布函数,和数字特征就是,总体,的,分布函数和数字特征,.,今后不必区分总体和其相应的随机变量,.,那么,此总体就可用描述其寿命的随机变量,X,或用其分布函数,F,(,x,),表示,.,我们用,X,和,Y,分别表示身高和体重,那么此总体就可用二维随机变量,(,X,Y,),或其联合分布函数,F,(,x,y,),来表示,.,总体概念的要旨,:,总体就是一个随机变量或,一个概率分布!,再如,若研究某地区中学生的营养状况时,关心的数量指标是身高和体重,,如研究某批灯泡的寿命时,关心的,数量指标就是寿命,样本中所包含的个体数目称为,样本容量,.,但是,一旦取定一组样本,得到的是,n,个具体的数,x,1,x,2,x,n,按一定规则从总体中抽取若干个体进行观察试验以获得有关总体的信息,.,为推断总体分布及各种特征,从国产轿车中抽,5,辆进行耗油量试验,样本容量为,5,(,2,)样本,样本是随机变量,抽到哪,5,辆是随机的!,容量为,n,的样本可以看作,n,维随机变量,(,X,1,X,2,X,n,),.,所,抽取的部分个体称为样本,.,这一抽取过程称为,抽样,称为,样本,(,X,1,X,2,X,n,),的一组观测值,,简称,样本值,.,它要求抽取的样本,X,1,X,2,X,n,满足下面两点,:,它可以用与总体同分布的,n,个相互独立的随机变量,X,1,X,2,X,n,表示,.,1.,随机性:随机样本抽取,即,X,i,(,i,=1,2,n,),与所考察的总体,X,同分布,.,为了使抽取的样本能很好地反映总体的信息,,必须考虑抽样方法,.,最常用的一种抽样方法叫作,简单随机抽样,2.,独立性:,X,1,X,2,X,n,是相互独立的随机变量,;,抽样的目的是为了对总体进行统计推断,,由简单随机抽样得到的样本称为,简单随机样本,,今后,说到,“,X,1,X,n,是来自某总体的样本”,时,若不特别说明,就指,简单随机样本,.,则其简单随机样本的联合分布函数为,F,(,x,1,x,2,x,n,),=,简单随机样本是应用中最常见的情形,若总体,X,的分布函数为,F,(,x,),若总体,X,的概率密度为,f,(,x,),则其简单随机样本的联合概率密度为,F,(,x,1,),F,(,x,2,),F,(,x,n,),解,例,1,解,例,2,3.,小结,(3),简单随机样本,:,设,X,1,X,2,X,n,为来自总体的样本,若,X,1,X,2,X,n,相互独立且与均总体,同分布,称,X,1,X,2,X,n,为来自总体的简单随机样本,第二节 样本分布函数 直方图,一、样本分布函数,我们把总体的分布函数,称为总体分布函数.从总体中抽取容量为,n,的样本得到,n,个样本观测值,若样本容量,n,较大,则相同的观测值可能重复出现若干次,为此,应当把这些观测值整理,并写出下面的样本频率分布表:,观测值,总计,频,数,频,率,1,其中,定义,设函数,其中和式 是对小于或等于 的一切 的频率,求和,则称 为,样本分布函数,经验分布函数,。,易知样本分布函数 具有下列性质:,(2)是非减函数,(1),(3),(4)在每个观测值 处是右连续的,点 是 的跳跃间断点,在该点的跃度就等于频率,样本分布函数 的图形如图6,-1,所示,图6-1,对于任意的实数 总体分布函数 是事件 的概率;样本分布函数 是事件 发生的频率根据伯努利大数定理可知,当 时,对于任意的正数 ,有,格利文科(,Glivenko,),进一步证明了,当 时,样本分布函数 与总体分布函数 之间存在着更密切的近似关系的结论,.,这些结论就是我们在数理统计中可以依据样本来推断总体的理论基础,频率,直方图常用于描述数据的分布情况,它通常是把数据的值域分成若干相等的区间,于是数据就按区间分成若干组,在每个区间上作一个小矩形:,小矩形的面积该组的频率,2,所有的小长方形的面积之和,.,于是,5.2,直方图,1.,统计量的定义,5.3,统计量,是,不是,实例1,2.,几个常用统计量的定义,(1),样本均值,(2),样本方差,其观察值,其观察值,(3),样本标准差,其观察值,(4),样本,k,阶(原点)矩,其观察值,(5),样本,k,阶中心矩,其观察值,当样本容量较大时,相同的样本观测值往往可能重复出现,为了使计算简化,应先把所得的数据整理,设得到下表:,观测值 总计,频数 ,其中 .于是样本均值 ,样本方差,样本二阶中心矩 可以分别按下列公式计算:,(1,1),(,12),(,13),若总体 的 阶矩 存在,独立且与 同分布。故有,与样本二阶中心矩,显然,当样本容量 充分大时,样本方差,是近似相等的,则当 时,独立且与,X,同分布,所以,因为,进而由第五章中关于依概率收敛的序列的性质知道,其中 为连续函数,这就是下一章所要介绍的矩估计法的理论根据。,从而由第五章的大数定理知,谢谢,
展开阅读全文