资源描述
,数理统计,第,*,页,太原理工大学数学学院,分为,两大类,:,一、,如何科学地安排试验,以获取有效的随机数据,-,描述统计学,如:试验设计、抽样方法等。,二、,研究如何分析所获得的随机数据,对所研究的问题进行科学的、合理的估计和推断,尽可能地为采取一定的决策提供依据,作出精确而可靠的结论,-,推断统计学,如,:,参数估计、假设检验等。,数理统计,-,数据来分析对象满足的概率规律,.,100,个样品进行强度测试,于是面临下列几个问题:,例如,某厂生产一型号的合金材料,用随机的方法选取,1,、估计这批合金材料的强度均值是多少,?,(,参数的点估计,),2,、强度均值在什么范围内?,(,参数的区间估计,),3,、若规定强度均值不小于某个定值为合格,那么这,批,材料是否合格?,(,参数的假设检验,),4,、这批合金的强度是否服从正态分布?,(,分布检验,),6,、若这批合金,由,几种原料用不同的比例合成,那么,如何表达这批合金的强度与原料比例之间的关系?,(,回归分析,问题),5,、若这批材料是由两种不同工艺生产的,那么不同,的工艺对合金强度有否影响?,若有,影响,那一种,工艺,生产的强度较好?,(,方差分析,),1.2,充分统计量与完备统计量,1.1,数理统计的基本概念,1.3,几个常用的分布,1.4,次序统计量及其分布,第,1,章 统计量与抽样分布,一、总体与样本,1.,总体,研究对象的某项数量指标值全体称为总体,或母体,总体中每个元素称为,个体,。,研究某批灯泡的质量,总体,考察国产 轿车的质量,总体,1.1,基本概念,考察某工厂生产的灯泡寿命,考察某型号手机的质量,考察吸烟和患肺癌的关系,破坏性的试验更是不允许对整个总体进行考察,.,在实际问题中,要考察整个总体往往是不可能的,,因为它需要耗费太多的资源和太多的时间,.,有些,2.,样本,样本中所包含的个体数目称为,样本容量,.,从国产轿车中,抽,5,辆进行,耗油量试验,样本容量为,5,。,为了推断总体分布及各种特征,,一个可行的办法,是从该总体中按一定的规则抽取若干个个体进行观察,和试验,,以获得有关总体的信息,.,这一抽取过程称为,“,抽样,”,所抽取的部分个体称为,样本,.,方法,.,由于抽样的目的是为了对总体进行统计推断,,为了使抽取的样本能很好地反映总体,,必须考虑抽样,统计中,采用的抽样方法是随机抽样法,即子样中每个个体是从母体中随意地取出来的。,(,1,),重复(返回)抽样,分量,X,k,与所考察的总体有相同的分布,从,总体中抽取个体检查后放回,,母体成分不变(分布不变),相互独立的随机变量,.,对无限母体而言做无返回抽取,并不改变母体的成分,独立且同分布于母体,(,2,)非重复(无返回)抽样,取出样本后改变了母体的成分,所以,对有限母体,,不相互独立,,最常用的抽样方法叫做,“,简单随机抽样,”,(2),独立同分布性,简单随机抽样,要求抽取的样本满足,:,(1),代表性,(随机性):,其中每一个,每一个个体被抽到的可能性相同。,从,总体中抽取样本的每一个,分量,X,k,是随机的,是相互独立的随机变量,.,今后当说到,“,X,1,X,2,X,n,是取自某总体的样本”时,若不特别说,明,就指简单随机样本,.,简单随机样本可以用与总体同分布的,n,个相互独立的,随机变量,表示,.,分量,X,k,与所考察的总体有相同的分布,若总体,X,的分布函数为,联合分布函数为,若总体,X,的分布密度函数为,则其简单随机样本的,则其简单随机样本的,联合密度函数为,离散总体,则样本的分布列,样本的联合分布为,(1),总体,X,的分布律为,例,1,对下列总体分别求出样本的联合分布,样本的联合概率密度为,(2),总体,X,的概率密度为,例,1,对下列总体分别求出样本的联合分布,我们只能观察到随机变量取的值,而见不到随机变量,.,我们抽样后得到的资料都是具体的、确定的值,.,如我们从某班学生中抽取,10,人测量身高,得到,10,个数,它们是样本取到的值而不是样本,.,因而可以由样本值去推断总体,.,总体分布决定了样本取值的概率规律,,也就是样本,取到样本值的规律,,去推断总体的情况,-,总体分布,F,(,x,),的性质,.,样本是联系二者的桥梁,统计是从手中已有的资料,-,样本值,,3.,总体、样本、样本值的关系,4.,样本的分布,1,)样本的频数分布,将,n,个样本值,按从小到大排列,把相同,的数合并,并指出其频数(样本中各数出现的次数),x,频数,频率,1,)样本的经验分布函数,样本值,样本值小于或等于,x,的个数,作,样本的经验分布函数,给出了在,n,次独立重复试验中,事件,出现的频率,具有分布函数的一切性质。如:,非降,右连续;,由频数分布知,若样本为,n,维,r.v,那么对于每一样本值,就可作一个经验分布函数,故,是随机变量,-,n,次独立重复试验中,事件,发生的频率。,由伯努利大数定律,,这就是我们可以由样本推断总体的基本理论依据,.,格列汶科进一步证明了:当,n,时,,F,n,(,x,),以概率,1,关于,x,一致收敛于,F,(,x,),,,即,这就是著名的格列汶科定理,.,定理告诉我们,当样本容量,n,足够大时,对所有的,x,F,n,(,x,),与,F,(,x,),之差的绝对值都很小,这件事发生的概率为,1.,5,、直方图,(1),离散情况,(2),连续情况,其中 为未知。如何估计?,i,p,设总体,X,为连续型随机变量,如何估计未知的密度函数,f,(,x,)?,定义,1,设,是,来自总体,X,的一个样本,,为一实值,连续函数,,其不,包含任何,未知参数,则称,为,一个,统计量,。,为,的,观测值。,注:,是,随机变量的函数仍为随机变量。,便是一个数。,注:统计量是随机变量。,二、统计量,1.,统计量,例,1,为来自总体的样本,未知,,已知,判断下列函数哪些是统计量。,2.,几个常见的统计量,样本均值,样本方差,它反映了总体,均值的信息,是来自总体,X,的一个样本,,它反映了总体,方差的信息,样本标准差,修正样本方差,样本,k,阶原点矩,它反映了总体,k,阶矩,的信息,样本,k,阶原点矩,样本,k,阶中心矩,它反映了总体,k,阶,中心矩的信息,证,左边,重要公式,常见统计量的性质,是,来自总体,例,2,设,的,一样本,总,体,的,阶矩,存在,证明,(1),(2),证,独立且与,同,分布,独立且与,同,分布,(2),由辛钦大数定律,知,定理二,(辛钦大数定律),为一列,相互独立,同分布,的,随机变量,且具有相同的数学期望,即,设,定理三(伯努利大数定律),设,事件,在,每次试验中出现的概率为,p,在,n,次重复独立试验中出现的频率为,即,且,
展开阅读全文