资源描述
第二章 数理统计的基本概念,与抽样分布,第一节 数理统计的几个基本概念,第二节 经验分布函数和直方图,第三节 常用统计分布,第四节 抽样分布,第五节 顺序统计量与样本极差,数理统计发展简史,1662,年 格朗特,关于死亡公报的自然和政治观察,(,1,)提出了,“,数据简约,”,的思想;,(,2,)指出了数据的可信性问题;,(,3,)统计比率的稳定性概念;,(,4,)引进了生命表的概念。,创新思想:,“,贝叶斯提出了一种归纳推理的理论,以后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法,.,”,摘自,中国大百科全书,贝叶斯,(17021761),贝叶斯公式、贝叶斯风险、贝叶斯决策函数、贝叶斯决策规则、贝叶斯估计量、贝叶斯方法、贝叶斯统计,“,他的思想深入数学、空间、大自然的奥秘,.,他推动了数学的进展直到下个世纪,.,”,摘自慕尼黑博物馆高斯画像下的诗句,“,高斯是世界上最伟大的数学家,.,”,拉普拉斯,高斯,(1777-1855),“,高尔顿等人关于回归分析的先驱性的工作,以及时间序列分析方面的一些工作,,是数理统计学发展史中的重要事件,.,”,摘自,中国大百科全书,高尔顿,(18221911),现代统计学的奠基人,,公认为统计学之父。,皮尔逊,(1857,1936),“,费希尔是使统计学成为一门有坚实理论基础并获得广泛应用的主要统计学家之一,.,”,摘自,中国大百科全书,费希尔,(1890,1962),“,内曼与皮尔逊在,1928,1938,年期间发表了一系列文章,建立了假设检验的一种严格的数学理论,.,”,摘自,中国大百科全书,内曼,(1894,1981),“,从,1938,年到,1945,年,许(宝騄)所发表的论文处在多元分析数学理论发展的前沿,.,许推进了矩阵论在统计理论中的作用,同时也证明了有关矩阵的一些新的定理,.,”,安德逊,许宝禄,(19101970),“,我不希望自己的文章登在有名的杂志上而出名,我希望杂志因为登了我的文章而出名。”,统计的应用领域,统计学,经济学,管理学,医学,工程学,社会学,actuarial work,(,精算,),agriculture,(,农业,),animal science,(,动物学,),anthropology,(,人类学,),archaeology,(,考古学,),auditing,(,审计学,),crystallography,(,晶体学,),demography,(,人口统计学,),dentistry,(,牙医学,),ecology,(,生态学,),econometrics,(,经济计量学,),education,(,教育学,),election forecasting and projection,(,选举预测和策划,),engineering,(,工程,),epidemiology,(,流行病学,),finance,(,金融,),fisheries research,(,水产渔业研究,),gambling,(,赌博,),genetics,(,遗传学,),geography,(,地理学,),geology,(,地质学,),historical research,(,历史研究,),human genetics,(,人类遗传学,),hydrology,(,水文学,),Industry,(,工业,),linguistics,(,语言学,),literature,(,文学,),manpower planning,(,劳动力计划,),management science,(,管理科学,),marketing,(,市场营销学,),medical diagnosis,(,医学诊断,),meteorology,(,气象学,),military science,(,军事科学,),nuclear material safeguards,(,核材料安全管理,),ophthalmology,(,眼科学,),pharmaceutics,(,制药学,),physics,(,物理学,),political science,(,政治学,),psychology,(,心理学,),psychophysics,(,心理物理学,),quality control,(,质量控制,),religious studies,(,宗教研究,),sociology,(,社会学,),survey sampling,(,调查抽样,),taxonomy,(,分类学,),weather modification,(,气象改善,),第一节 数理统计的几个基本概念,1,总体与样本,2,统计量,1,总 体 与 样 本,一个统计问题总有它明确的研究对象,.,1.,总体(,population,),研究对象的全体称为,总体,,,总体中所包含的个体的个数称为总体的,容量,.,总体中每个成员称为,个体,,,因此在理论上可以把,总体,与,概率分布,等同起来,.,总,体可以用随机变量及其分布来描述,.,在实际研究中,我们关心的是总体中的个体的某个或某些指标,(,如人的身高、灯泡的寿命,汽车的耗油量,),.,例,1,研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量,X,表示,或用其分布函数,F,(,x,),表示,.,某批,灯泡的寿命,总体,寿命,X,可用一概率(指数)分布来刻划,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,用,X,和,Y,分别表示身高和体重,那么此总体就可用二维随机变量,(,X,Y,),或其联合分布函数,F,(,x,y,),来表示,.,统计中,,总体就是一个概率分布,.,2.,样本(,sample,),(1),定义,为了解总体的分布,从总体中随机地取,n,个有代表性的个体,X,1,X,n,称,X,1,X,n,为总体的,一个样本,;,n,称为,样本容量,.,在实施抽样之后,得到,n,个实数,x,1,x,n,它们分别是,X,1,X,n,的观测值,称为,样本值,有时简称样本,.,注,:,样本的二重性,1.,样本是随机变量,:,X,1,X,2,X,n,2.,样本是一组数值,:,x,1,x,2,x,n,例,.,啤酒厂生产的瓶装啤酒规定净含量为,640 g,由于随机性,事实上不可能使得所有的啤酒净含量均达到标准,.,现从某厂生产的啤酒中随机地抽取,10,瓶测定其净含量,记为,X,1,,,X,2,,,,,X,10,,具体结果如下:,641 635 640 637 642 638 645 643 639 640,这是一容量为,10,的样本的观测值,对应的总体为该厂生产的瓶装啤酒的净含量,.,最常用的一种抽样叫作“,简单随机抽样”,,其特点:,1.,代表性,:,X,1,X,2,X,n,中每一个与所考察的总体有,相同的分布,.,2.,独立性,:,X,1,X,2,X,n,是相互独立的随机变量,.,由简单随机抽样得到的样本称为,简单随机样本,,它可以看成是,n,个,相互独立,且,与总体同分布,的随机变量,X,1,X,2,X,n,.,(2),简单随机抽样,简单随机样本是应用中最常见的情形,今后,当说到“,X,1,X,2,X,n,是取自某总体的样本”时,,若不特别说明,就指简单随机样本,.,=F,(,x,1,),F,(,x,2,),F,(,x,n,),若总体,X,的分布函数为,F,(,x,),则其简单随机样本,(,X,1,X,2,X,n,),的联合分布函数为,若总体,X,为离散型,分布列为,其简单随机样本的联合概率分布列为,若总体,X,为连续型,分布密度为,p,(,x,;,),其简单随机样本的联合概率密度函数为,以后统一称为,概率函数,.,例,1,设总体,X,B,(1,p,),,设,X,1,X,2,X,3,是来自总体,X,的一个样本,,(,1,)写出(,X,1,X,2,X,3,)的(联合)概率函数;,(,2,),求,X,1,+,X,2,+,X,3,的概率分布。,总体(理论分布)?,样本,样本值,统计是从手中已有的资料,样本值,去推断总体的情况,总体分布,F,(,x,),的性质,.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体,.,样本是联系二者的桥梁,注:总体、样本、样本值的关系,2,统计量,定义,设,X,1,X,n,是来自总体,X,的一个样本,若样本函数,T,=,T,(,X,1,X,n,),不含任何未知参数,则称,T,是一个,统计量,。,统计量的分布称为,抽样分布,。,2.1,定义,2.2.,常用统计量,1,样本均值,1,、定义:,设,X,1,X,2,X,n,是取自某总体的样本,其算术平均值称为,样本均值,,即:,它反映了,总体均值,的信息,定理,1,样本均值的分布,设,X,1,X,2,X,n,是来自某个总体,X,的样本,,(,1,)若总体分布为 ,则,(,2,)若总体分布未知或不是正态分布,但,则 的,渐近分布,为 。,(大样本场合),n,取不同值时样本均值的分布,注,:,总体:,样本:考虑投掷,n,次,,X,1,X,n,表示第,i,次投掷情况,,样本均值:,样本值:投掷,100,次后,得到正面的次数为,51,次,,样本均值:,2.2,样本方差,1,、定义:,设,X,1,X,2,X,n,是取自某总体的样本,则称,为,样本方差,,其算术平方根,S,称为,样本标准差,。,它反映了总体,方差的信息,注:,定义中的,n,是样本容量,称为,偏差平方和,n,-1,称为,自由度,.,即自由变动的,r.v.,的个数,.,这是由于,在 确定后,n,个偏差 中只有,n,-1,个可以自由变动,.,2.3,修正样本方差,1,、定义:,设,X,1,X,2,X,n,是取自某总体的样本,则称,为,样本方差,,其算术平方根,S,*,称为,修正样本标准差,。,它反映了总体,方差的信息,定理,2,设,X,1,X,2,X,n,是取自某总体,X,的样本,且,X,具有二阶矩,即,则有,它反映了总体,方差的信息,思考题,若总体四阶矩存在,考虑,2.4,样本矩,它反映了总体,k,阶原点矩的信息,为,样本,k,阶原点矩,.,k,=1,2,定义:,设,X,1,X,2,X,n,是取自某总体,X,的样本,称统计量,2.4,样本矩,为,样本,k,阶中心矩,.,它反映了总体,k,阶,中心矩的信息,称统计量,k,=2,3,
展开阅读全文