第六章 数理统计的基本概念

上传人:ning****hua 文档编号:243149806 上传时间:2024-09-16 格式:PPT 页数:29 大小:353KB
返回 下载 相关 举报
第六章 数理统计的基本概念_第1页
第1页 / 共29页
第六章 数理统计的基本概念_第2页
第2页 / 共29页
第六章 数理统计的基本概念_第3页
第3页 / 共29页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第六章 数理统计的基本概念,绪言,数理,统计包括两大内容:,一、,试验的设计和研究,-研究更合理、更有效、更精确地获取观察资料的方法。,二、,统计推断,-研究如何利用一定的资料对所关心的问题作出尽可能精确、可靠的结论。,例 为了解南京市民2002年收入情况,现抽样调查10000人的收入。,问题,:,1. 怎样从10000人的收入情况去估计全体南京市民的平均收入?怎样估计所有南京市民的收入与平均收入的偏离程度?,2.,若市政府提出了全体南京市民平均收入应达到的标准,从抽查得到的10000人收入数据,如何判断全体南京市民的平均收入与收入标准有无差异?差异是否显著?,3.,抽查得到的10000人的收入有多有少,若这10000人来自不同的行业,那么,收入的差异是由于行业不同引起的,还是仅由随机因素造成的?,4.,假设收入与年龄有关,,从抽查得到的10000人收入和年龄的对应数据,如何表述全体南京市民的收入,与年龄之间的关系?,问题1实质:从10000人的收入出发,估计全体南京市民收入分布的某些数字特征(此处是期望和方差)。,-,在数理统计中,解决这类问题的方法称为,参数估计,。,问题2实质:根据抽查得到的数据,去检验总体收入的某个数字特征(此处是期望)与给定值的差异。,-,在数理统计中,解决这类问题的方法称为,假设检验,。,问题3实质:分析数据误差的原因(此处是行业)。当有多个因素起作用时,还要分析哪些因素起主要作用。,-,在数理统计中,解决这类问题的方法称为,方差分析,。,问题4实质:根据观察数据研究变量间(此处是收入与年龄间)的关系。,-,在数理统计中,解决这类问题的方法称为,回归分析,。,第一节 随机样本,一、总体,在,数理统计中,将所研究的对象的某项指标值的全体称为,总体,(或母体),而将构成总体的每个单位称为一个,个体,。,当,总体中包含的个体总数是有限的,就称总体为,有限总体,,否则称总体为,无限总体,。,设待,研究的指标为,X,,由于,X,的取值是对随机抽取的个体观察得到的,因而可将,X,视为随机变量,并设其分布函数为,F(x)。,定义6.1,一个随机变量,X(,或其分布函数,F(x),叫做一个总体,,X,的每个可能值叫做一个个体。,二、样本,从,总体,X,中,随机地抽取,n,个个体进行观察,可得到,n,个观察值,将其依抽取的顺序记为,若将,总体在进行第,i,次抽样时对应的随机变量记为 ,则 就是 的观察值。,我们提出以下,要求,:,与,X,同分布;,2. 相互独立。,抽样方式为重复抽样,实际应用中,一般当有限总体中包含个体数目,N10n,时,即使采用不重复抽样,也认为要求满足。,定义6.2,若 相互独立,且均与总体,X,有相同分布,则称随机向量( )为总体,X,的,一个容量为,n,的简单随机样本(简称,样本,),称,n,为,样本容量,。,设 的观察值为 ,称( )为,X,的一个,样本观察值,(样本点),称,=( )为,样本空间,。,说明,:1.,是,样本观察值全体所成集合,是,n,维空间上的点集,它不是总体,X,的样本空间。,在一次抽样之前,我们只知道样本( )(,n,维,随机变量),而在抽样之后,则得到一个具体的,n,维实向量,( ),它是,中的一个点,故称其为样本点。,注意,:对任何总体,X,,其容量为,n,的样本是,唯一,的,而每次抽样得到的样本观察值一般说来是不同的。,设,X,的分布函数为,F(x),,由定义6.2,,X,的容量为,n,的样本,的第,i,个分量 的分布函数为,因 相互独立,故 分布函数为,若,X,是离散型随机变量,其分布律为,P(X= ),i=1,2,.,则 的分布律为,若,X,是连续型随机变量,其密度函数为,f(x),,则,的密度函数为,三、样本分布函数,问题,:用样本观察值推断总体,其结论可靠吗?,解决问题的,途径,:根据抽样得到的样本观察值构造一个函数-样本分布函数,再证明当,n,很大时,样本分布函数近似于总体的分布函数。,定义6.3,设总体,X,的一组,样本观察值为 ,将这组值依大小顺序重排成 。构造函数,称 为,样本分布函数,(或称,经验分布函数,)。,说明,:1. 在定义6.3中,,k/n,是不大于,x,的样本观察值出现的频率。,2. 对总体进行两次抽样,会得到两组不同的,样本观察值,因而就会产生两个不同的样本分布函数。,3.,样本分布函数是一个阶梯函数:设,则,当 ,有,当 , 有,即: 在 处有 的跃度。,5. 当,n,越大, 的图形与总体分布函数,F(x),的图形越近似。,6. 由贝努利大数定律或,W.,格列汶科定理(1953) 可从理论上证明:当,n,很大时,有,4. 容易证明: 确是某随机变量 的分布函数,且有,第二节 抽样分布,一、统计量,定义6.4,(教材,p159),设 是总体,X,的一个样本, 是,不含任何未知参数,的连续函数,则称 是一个统计量。,若 是一个统计量, 是一组样本观察值,则称 是 的一个观察值。,二、样本数字特征,定义6.5,(教材,p160),设 是总体,X,的一个样本,称以下统计量为样本数字特征:,当,k,为正整数,称,设 为来自总体,X,的样本,,为来自总体,Y,的样本,称,说明,:1. 样本原点矩反映样本的平均特征,样本中心矩反映样本的离散特征,样本协方差反映两个样本的相关程度。,2. 样本数字特征是随机变量,但对一组样本观察值,得到的样本数字特征观察值是一个具体的数,我们通常把这个数也称为样本均值、样本方差、样本相关系数等。,3. 使用最多的样本数字特征是样本均值、样本标准差和样本相关系数。,三、顺序统计量,说明,:1.对两次抽样,尽管观察值由小到大的排列顺序可能改变,但对顺序统计量来说,改变的仅是其取值,其形式不变。,2.,顺序统计量是样本的函数,因而是随机变量。,问题,:顺序统计量的表达式是什么?,定义6.6,设 ( ) 是样本 ( ) 的,一组观察值,将 按由小到大的顺序排列成,。设 ,记,k=1,2,n.,称(,),为( )的顺序统计量。,结论1,. 是统计量。,定义6.7,设 为 的顺序统计量,称,为,样本中位数,。,称 为,样本极差,。,引入样本矩的,意义,:,称 为总体,X,的,k,阶,原点矩,对样本 ,因 与,X,同分布,有,由辛,钦大数,定律,对样本,k,阶原点矩 ,有,P,利用依概率收敛的性质,对任何连续函数,有,P,结论2,. 只要总体的,k,阶矩存在,则样本,k,阶矩的任何连续函数依概率收敛于总体,k,阶矩的同一函数。,说明,:结论2 正是我们进行参数估计的理论基础。,四、 的分布,1.,设 , 是,X,的一个样本,则,2. 若,X,的分布类型未知,仅知,E(X)=,,D(X)= ,,则,.,五、 分布,定义6.8,(教材,p162-163),设总体,XN(0,1),,,是总体的一个样本,则称,服从自由度为,n,的,分布,,记为 。,注,:1.,2. 的密度函数表达式和曲线见教材,p163(,不用掌握,)。,性质1,. 设,XN(0,1),,则,性质2,. 设 , 是,X,的一个样本,则,性质3,. 设 ,则,定理6.1,.,推论,.,定理6.2,. 设 ,则对任何,x,,有,说明,:定理6.2保证了当,n,很大时, 可近似地用正态分布代替,即 ,其中,XN(0,1)。,L,分布的用途,: 分布在正态总体方差的估计和检验问题和非参数检验中起重要作用。,六、,t-,分布,定义6.9,. (教材,p165),设,XN(0,1),, ,,且,X,与,Y,相互独立,,则称 服从自由度为,n,的,t-,分布,,,记,为,Tt(n),。,注,:1.,t-,分布的密度函数表达式见教材,p165 (,不用掌握,);,2.,t-,分布的密度函数曲线见教材,p165,,曲线关于,x=0,对称,和标准正态分布的密度函数曲线图形类似,但当,n,较小时,,t-,分布与标准正态分布的差异较大。,t-,分布在尾部比标准正态分布在尾部有较大的概率。,定理6.3,设 ,且,X,与,Y,相互独立,,则,定理6.4,设,Tt(n),,则当,n1,,E(T)=0,;,当,n2,,D(T)=n/(n-2),。,定理6.5,设,Tt(n),t(n;x),为,T,的密度函数,则,说明,:一般当,n30,,,取,t(n), N(0,1),。,t-,分布的用途,:,t-,分布主要用于小样本情形正态总体的均值估计和检验,以及正态线性模型可估函数的推断。,七、,F-,分布,定义6.10,(教材,166,) 设 ,且,X,与,Y,相互独立,,则称,服从,第一自由度为,m,,,第二自由度为,n,的,F-,分布,,记为,FF(m,n),。,注,:,F-,分布的密度函数表达式及其曲线见教材,p166-167,(,不用掌握,)。,性质6,设,FF(m,n),,则,当,n2,,E(F)=n/(n-2),;,当,n4,,D(F)=,。,性质5,设,Tt(n),,则,F-,分布的用途,:,F-,分布在对两个正态总体的未知参数进行假设检验中及在方差分析理论中起重要作用。,性质4,对,F-,分布,若,FF(m,n),,则,1/,FF(n,m),。,八、抽样分布的几个重要结论,定理6.6,(教材,p168,定理二、三),设总体 为来自总体的样本,,为样本均值, 为样本方差, 则有,1.,2.,相互独立,;,3.,推论,设 , 为其样本方差, 则,注,:证明见教材,p172-174,附录(,可不掌握,)。,定理6.7,(教材,p169,定理四),设 , 和,分别为来自总体,X,和,Y,的样本,且两样本,相互独立,,设 分别为两样本的样本均值, 分别为两样本的样本方差, 则有,1.,2.,特别,当 ,有,3.,特别,当 ,有,说明,:1. 证明见教材,p170(,可不掌握,);,2. 这几个结论在参数估计、假设检验等统计问题的推断中具有重要意义,也是考研内容之一,要注意对结论的理解,并会简单应用。,例,1 设 是来自泊松分布,()的一个样本,,分别为样本均值、样本方差,求,说明,:本题求 的方法值得重视,因为在参数估计的无偏性讨论中要用到这种方法。,思考题1(,2001年数学三考研试题填空题,),设总体,X,服从正态分布 ,而 是来自总体,X,的,简单随机样本,则随机变量,服从 _ 分布,参数为_ 。,思考题2(,2003年数学一考研试题选择题,),设随机变量,Xt(n),n1, ,,则( ),Y (n). B. Y (n-1).,C. YF(n,1). D. YF(1,n).,例,2.(,2001年数学一考研试题十二题,),设总体,X,服从正态分布 ,(,0),从该,总体中抽取简单随机样本 ,其样本均值,,求,统计量,的,数学期望。,九、概率分布的,分位数,定义6.11,设,X,为随机变量,对任何0, )= ,的数 为,X,的,上侧分位数,;称满足,P(X )= ,的数 为,X,的,双侧分位数,。,1.,N(0,1),的上侧,分位数,设,XN(0,1),,对任何0, )= , =?,由,( )=1- ,,查标准正态分布表(,p439,表2)即可求出 。,公式:对任何0,1,,2.,N(0,1),的双侧,分位数,设,XN(0,1),,对任何0, )= , =?,,,即,P(X )= ,,其中 由,( )=1- /2,求出。,3. -分布的上侧,分位数,设,X (n),,对任何0, (n) )= , (n) =?,查,p443,表4。,注,:当,n30,,用近似公式,4.,t-,分布的,分位数,设,Xt(n),,对任何0, (n) )= , (n) =?,设 为,t(n),的双侧,分位数,和标准正态分布的讨论类似,我,们有,注,:当,n30,,用近似公式,查,p441,表3 求出 。,公式,:,5.,F-,分布的上侧,分位数,设 ,对任何0, )= ,,=?,查,p447,表5 求出 。,公式,:,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!