抽样与抽样分布课件

上传人:n85ho7****4h85bh 文档编号:243094234 上传时间:2024-09-15 格式:PPT 页数:64 大小:2.13MB
返回 下载 相关 举报
抽样与抽样分布课件_第1页
第1页 / 共64页
抽样与抽样分布课件_第2页
第2页 / 共64页
抽样与抽样分布课件_第3页
第3页 / 共64页
点击查看更多>>
资源描述
, , , , , , ,*,华南理工大学精品课程,第三章 抽样与抽样分布,引例:,专家的这种说法是否成立?,为进一步调查三聚氰胺事件,,2008,年国家有关部门对一百多家奶制品厂的牛奶制品进行抽样检查。其中河北三鹿、山西雅士利、内蒙古伊利、蒙牛集团、青岛圣源、上海熊猫、山西古城、江西光明乳业英雄牌、宝鸡惠民、多加多乳业、湖南南山等,22,个厂家,69,批次产品中检出三聚氰胺,被要求立即下架。,但是报告中,发现对每个厂家的抽样样本数都不一样,而且抽样的乳制品中基本上都发现了三聚氰胺的残留,可是只有部分要求下架。,请思考下面的问题。,华南理工大学精品课程,提出问题,检验人员如何选择样本?,Q1,Q2,Q3,常用的抽样方法有哪些?,如何确定抽样的样本量?,Q4,样本数据该如何处理?,本章学习目标,了解抽样的概率抽样方法,理解抽样分布的意义,了解抽样分布的形成过程,了解常用概率分布之间的关系,理解中心极限定理,掌握常用的抽样方法,第一节 抽样的概念与特点,统计学中研究总体和样本之间的关系:,1,)从总体到样本。研究从总体中抽出的所有可能样本统计量的分布及其与原总体的关系。即抽样分布,2,)从样本到总体。从总体中随机抽取样本,并对样本对总体进行推论。即统计推断问题。,第一节 抽样的概念与特点,1,),抽样的概念,从总体中抽取一个样本作为总体的代表,这一过程称为,抽样,。,对样本进行调查,再根据抽样分布的原理利用样本资料对总体数量特征进行科学的估计与推断,这就是,抽样估计,。,2,)抽样的特点,(,1,)随机性;,(,2,)部分推断总体;,(,3,)抽样推断的误差可以事先计算并加以控制,。,一、基本概念,二、样本均值 的抽样分布形式,三、单个样本统计量的抽样分布,四、两个样本统计量的抽样分布,五、常用的几个概率分布的关系,第二节 抽样分布,三种不同性质的分布,1,)总体分布,2,)样本分布,3,)抽样分布,这些内容与前面内容有什么关系?,一、基本概念,总体分布,总体分布:所有元素出现概率的分布。,总体分布往往是未知的,很多场合不可能获取得对所有个体元素的观察值。,当然有些时候可以通过理论计算进行假定。,一、基本概念,样本分布,样本分布:,假设总体变量为,N,,抽取样本规模为,n,,如果,n,趋近,N,的时候,样本分布实际上也在趋向总体分布。,因此,样本分布又称为经验分布。,一、基本概念,抽样分布,抽样分布是对样本统计量概率分布的一种描述方式。,关键点:,1,)样本统计量;,2,)由样本,n,个观察值计算的统计量的概率分布就是抽样分布。,3,)抽样分布经常用到的统计量:样本均值,中位数等。,一、基本概念,总体,计算样本统计量,如:样本均值、比例、方差,样本,一、基本概念,总体分布,抽样分布的形成过程,【,例,】,设一个总体(比如掷骰子),,含有,6,个元素,(,个体,),,即总体单位数,N,=,6,。,6,个个体分别为,x,1,=1,,,x,2,=2,,,x,3,=3,,,x,4,=4,,,x5=5,,,x6=6,。总体的均值、方差及分布如下:,均值和方差,案例分析,现从总体中抽取,n,2,的简单随机样本,在重复抽样条件下,共有,6,2,=36,个样本。所有样本的结果为:,第二观察值,第一观察值,1,2,3,4,5,6,1,(,1,,,1,),(,1,,,2,),(,1,,,3,),(,1,,,4,),(,1,,,5,),(,1,,,6,),2,(,2,,,1,),(,2,,,2,),(,2,,,3,),(,2,,,4,),(,2,,,5,),(,2,,,6,),3,(,3,,,1,),(,3,,,2,),(,3,,,3,),(,3,,,4,),(,3,,,5,),(,3,,,6,),4,(,4,,,1,),(,4,,,2,),(,4,,,3,),(,4,,,4,),(,4,,,5,),(,4,,,6,),5,(,5,,,1,),(,5,,,2,),(,5,,,3,),(,5,,,4,),(,5,,,5,),(,5,,,6,),6,(,6,,,1,),(,6,,,2,),(,6,,,3,),(,6,,,4,),(,6,,,5,),(,6,,,6,),案例分析,表,3-1,样本容量为,2,的,36,次重复抽样观察值,计算出各样本的均值,如下表,3-2,。并给出样本均值的抽样分布如图,3-2,第二观察值,第一观察值,1,2,3,4,5,6,1,1,1.5,2,2.5,3,3.5,2,1.5,2,2.5,3,3.5,4,3,2,2.5,3,3.5,4,4.5,4,2.5,3,3.5,4,4.5,5,5,3,3.5,4,4.5,5,5.5,6,3.5,4,4.5,5,5.5,6,案例分析,表,3-2,样本平均值一览图,图,3-2,投掷骰子时间样本的均值分布图,= 3.5,2,=2.9,= 3.5,2,=1.45,案例分析,从案例中可以看出,样本均值的抽样分布与总体分布,以及样本容量,n,之间存在某种关系。,思考题:,刚才定义了抽样分布的概念,那么如果选择样本均值进行观察,其分布与哪些因素有关?,二、样本均值 的抽样分布形式,二、样本均值 的抽样分布形式,样本均值:,1,)一个重要的样本统计量;,2,)推断总体均值的重要指标;,抽样分布:,1,)与样本的规模有关;,2,)可以求解得到一个理论上的概率分布。,样本均值 的抽样分布于总体和样本大小都有关系,有以下结论:,如果原有总体是正态分布,那么无论样本容量大小,样本均值的抽样分布都服从正态分布,若是非正态分布,则样本容量足够大时(,n 30,),无论总体服从何种分布,样本均值都趋近于正态分布。(中心极限定理),二、样本均值 的抽样分布形式,= 50,=10,X,总体分布,n,= 4,抽样分布,x,n,=16,二、样本均值 的抽样分布形式,当总体服从正态分布,N,(,2,),时,来自该总体的所有容量为,n,的样本的均值,x,也服从正态分布,,x,的数学期望为,,方差为,2,/,n,。即,x,N,(,2,/,n,),当样本容量足够大时,(,n,30),,样本均值的抽样分布逐渐趋于正态分布,一个任意分布的总体,x,中心极限定理:,设从均值为,,,方差为,2,的一个任意总体中抽取容量为,n,的样本,当,n,充分大 时,样本均值的抽样分布近似服从均值为,,,方差为,2,/n,的正态分布。,二、样本均值 的抽样分布形式,x,的分布趋于正态分布的过程,二、样本均值 的抽样分布形式,总体分布,正态分布,非正态分布,大样本,小样本,正态分布,正态分布,非正态分布,大样本,小样本,二、样本均值 的抽样分布形式,样本均值的抽样分布,无论重复抽样还是不重复抽样,有样本均值的数学期望,样本均值的方差,重复抽样时,不重复抽样时,其中,,N,为总体容量,,n,为样本容量,三、单个样本统计量的抽样分布,比较及结论:,1.,样本均值的均值,(,数学期望,),等于总体均值,2.,样本均值的方差等于总体方差的,1/,n,通过前面表,3-2,的数据来验证,三、单个样本统计量的抽样分布,如果总体的标准差未知,则可以用样本标准差代替,此时样本均值得抽样分布则服从自由度为,(n-1),的,t,(,student distribution,)分布,即,三、单个样本统计量的抽样分布,样本比例的抽样分布,在商务与经济管理中,许多情况下要用到比率估计;,需要用到样本的比例,去估计总体的比例,。,举例:在一批抽样的产品中,有合格的产品和不合格的产品,其中合格产品和不合格产品的比率就是一个值得关注的统计量。,适用于研究分类或定型的变量。,三、单个样本统计量的抽样分布,样本比例的抽样分布,-,适于研究分类变量,总体,(,或样本,),中具有某种属性的单位与全部单位总数之比,不同性别的人与全部人数之比,合格品,(,或不合格品,),与全部产品总数之比,2.,总体比例用 表示,3.,样本比例用,p,表示,三、单个样本统计量的抽样分布,样本比例的数学期望,样本比例的方差,重复抽样,不重复抽样,样本比例的抽样分布,数学期望与方差,三、单个样本统计量的抽样分布,用样本方差去推断总体方差,就必须知道样本方差的分布。,在重复选取容量为,n,的样本时,由样本方差所有可能值形成的相对频数分布就是样本方差的抽样分布。统计证明:对于来自正态总体的简单随机样本,比值 的抽样分布服从自由度为,(n-1),的,2,的分布,样本方差的抽样分布,三、单个样本统计量的抽样分布,分布,由阿贝,(,Abbe,),于,1863,年首先给出,后来由海尔墨特,(,Hermert,),和卡,皮尔逊,(,K,Pearson,),分别于,1875,年和,1900,年推导出来,设,x,N(,,,2,),,则,令,Y=Z,2,,则,Y,服从自由度为,1,的,2,分布,即,当总体,X,N(,,,2,),从中抽取容量为,n,的样本,则,三、单个样本统计量的抽样分布,三、单个样本统计量的抽样分布,分布具有以下特征,:,(,1,),分布的变量始终为正值;,(,2,),分布的形状取决于自由度,n,的大小,通常为不对称的右偏分布,但随着自由度的增大逐渐趋于对称,(,3,),分布的数学期望为,n,,方差为,2n,(为自由度)。,(,4,),分布具有可加性。若,U,和,V,是两个独立的随机变量,分别服从自由度为,n,1,和,n,2,的,分布,则随机变量,U+V,也服从自由度为,n,1,+n,2,的,分布。,样本方差的抽样分布计算流程,选择容量为,n,的,简单随机样本,计算样本方差,s,2,计算卡方值,2,= (,n,-1),s,2,/,2,计算出所有的,2,值,不同容量样本的抽样分布,c,2,n,=1,n,=4,n,=10,n,=20,m,s,总体,三、单个样本统计量的抽样分布,选择容量为,n,的,简单随机样本,计算样本方差,s,2,计算卡方值,2,= (,n,-1),s,2,/,2,不同容量样本的抽样分布,c,2,n,=1,n,=4,n,=10,n,=20,m,s,总体,4.1 .,两个样本均值之差的抽样分布,4.2 .,两个样本比例之差的抽样分布,4.3 .,两个样本方差比的抽样分布,四、两个样本统计量的抽样分布,问题的提出,实际问题中,我们需要研究两个总体的比较问题,这就需要进一步研究两总体均值之差,两总体比例之差,两总体方差之比。,研究两总体均值之差,需要了解样本均值的分布。,设从两个总体中分别独立地抽取样本容量为,n1,和,n2,的样本,由两个样本均值之差的所有可能取值形成的相对频数分布。,4.1,、两个样本均值之差的抽样分布,两个总体都为正态分布,即:,两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差:,方差为各自的方差之和,m,1,s,1,总体,1,s,2,m,2,总体,2,计算每一对样本的,m,1,-,m,2,抽样分布,抽取简单随机样本,x2,、样本容量,n,2,计算,抽取简单随机样本,x1,、样本容量,n,1,计算,所有可能样本的,4.1,、两个样本均值之差的抽样分布,即:,4.1,、两个样本均值之差的抽样分布,4.2,、两个样本比例之差的抽样分布,假设两个总体服从二项分布,分别从两个总体中抽取容量为,n,1,和,n,2,的独立样本,当两个样本都为大样本时,则两个样本比率的抽样分布可以用正态分布来近似,其分布的均值和方差分别为:,即:,4.2,、两个样本比例之差的抽样分布,4.3,两个样本方差比的抽样分布,假设两个总体都为正态分布:,分别从两个总体中抽取容量为,n,1,和,n,2,的独立样本,两个样本方差比,的抽样分布,服从,F,分布,即:,F,分布,是由统计学家费希尔,(R.A.Fisher),提出的,所以姓氏的第一字母命名。,设,U,是服从自由度为,n,1,的,2,分布的随机变量,即: ,,V,是服从自由度为,n,2,的,2,分布的随机变量,即,:,,且,U,和,V,相互独立,则:,从前面内容中可以知道样本方差的抽样分布服从,2,(n-1),分布。,4.3,两个样本方差比的抽样分布,不同自由度的,F,分布(图示),F,(,1,10),(5,10),(10,10),4.3,两个样本方差比的抽样分布,五、常用概率分布的关系,一般情况下,概率分布之间的关系主要有四种关系:极限关系、变换关系、独立同分布随机变量之和的关系,以及特殊情形。,通过上述关系,可以把正态分布、学生(,t,)分布、卡方分布及,F,分布联系起来。,极限关系,极限关系是指当某个参数趋向于某值时,一个随机变量的概率分布函数逼近于另一个随机变量的概率分布函数。,(,1,)当,n,足够大,则,t(n),分布渐近于标准正态分布,(,2,),设 ,那么当 时,则,分布渐进于 分布。,(3),当,n,足够大,则,t(n),分布,渐近于 分布。,(4),当,n,足够大,,则 分布渐近于标准正态分布 。,(5),当 时,则 分布渐近于 分布,五、常用概率分布的关系,变换关系,是指对一个随机变量进行函数变换而得到的新变量。,(,1,) , 与 相互独立,则,(,2,) , 与 相互独立,则,(,3,) ,则 。,(,4,) ,则 。,(,5,) ,且 与 相互独立,则,五、常用概率分布的关系,独立同分布随机变量和的分布,有一些特殊的分布,当有,n,个独立的随机变量同分布于一种分布时,它们的和往往服从于另一种新的分布。,(1),设 独立同分布,于标准正态分布,则,五、常用概率分布的关系,五、常用概率分布的关系,图,3-8,四种概率分布的关系图,当样本容量足够大时,(,n,30),,样本均值的抽样分布逐渐趋于正态分布,中心极限定理:,设从均值为,,方差为,2,的一个任意总体中抽取容量为,n,的样本,当,n,充分大时,样本均值的抽样分布近似服从均值为,、方差为,2,/,n,的正态分布,一个任意分布的总体,x,第三节 中心极限定理的应用,案例分析,案例:每到临近重大节日,为了满足巨大的市场需要,副食品加工厂提高了对于食品的生产规模,而此时工厂的质量管理人员,对工厂生产的副食品进行质量检验,检验的指标中主要是某个硝酸盐的,NO,(,=45,)计算公式如下:,可以算出来,z(2.53)=0.9943,即根据生产商的声明,硝酸盐含量高于,45mg,的概率为,1,0.9943=0.0057,因此根据这个结果,.,该食品在此次抽样中出现硝酸盐含量超标的可能性为极小概率事件,如果此次样本抽查出其中一个出现超标(,1/40=0.025,),则有理由认为该厂生产的食品不合格。,第四节,常用的抽样方法,非概率抽样,概率抽样,简单随机抽样,分层抽样,簇群抽样,等距抽样,一、简单随机抽样,从总体中抽取,n,个单位作为样本时,要使得每一个总体单位都有相同的概率被抽中,这样的抽样方法称为简单随机抽样(,simple random sampling,),又称为纯随机抽样。,应用最广泛;,最基本的抽样方法;,其他抽样方法都是在它的基础上发展;,总体单位很大时,编制抽样框较难;,可能得到一个“差”的简单随机样本。,一、简单随机抽样,简单随机抽样常用的两种方法:,1,)抽签法。当总体单位,N,较少时,可以用同质均匀的材料制作,N,个签,并充分混合,可分别采取两种方法抽取。一种是,全样本抽选法,,即从,N,个签中一次抽选,n,个,这,n,个签上的号码即为入样的单位号码;另一种是,逐个抽选法,,即一次抽取一个签,但不放回,接着抽下一个签,直到抽够,n,个签为止,这,n,个签上号码所对应的单位入样。可以证明,这两种方法抽到的,个单位的样本是等价的。,2,)随机数法。当总体较大时,抽签法实施起来比较困难,这时可以利用随机数表、随机数色子、摇奖机、计算机产生的伪随机数进行抽样。,(,1,)总体均值的估计,(,2,)总量的估计,(,3,)总体比例估计,一、简单随机抽样,(,4,)总体比例估计的方差的无偏估计,(,5,)样本均值的方差的无偏估计,一、简单随机抽样,利用辅助信息,在抽样之前将总体的,N,个单元划分为互不交叉、互不重叠的,L,个层,每一层包含的单元数分别为,,从而,。然后在每一层中进行独立抽样,分别从各层中抽取的容量为,的样本,得到的样本容量为,这种抽样方式就是分层抽样(,Stratified Sampling,),也被称为分类抽样。,二、分层抽样,层(类)间的差距尽可能大,而层内个体之间的差异尽可能小。,优点:,1,)分层抽样的研究对象更为具体,2,)分层抽样适合大规模,跨地区和跨行业的大规模调查,3,)提高估计的精度,二、分层抽样,三、簇群抽样,簇群抽样(,Cluster Sampling,),也称整群抽样,就是先将总体依据存在的某种联系划分为几个簇群,(Cluster),,即初级抽样单元,然后以群为单位进行抽样,进而对抽中的各个群中包含的所有个体单位(即次级抽样单元)进行观察和研究。,例如,对某居民小区的户均网购情况进行调查,可以采取两种不同的抽样方法,一种方法是将住户看做抽样基本抽样单元,采用简单随机抽样对被选中的住户进行调查;另一种方法是将小区内每栋居民楼看成一个群,随机抽取一定数量的居民楼,然后对楼内的所有的住户进行调查,这就是簇群抽样。,三、簇群抽样,优点,:,抽样工作简单高效,而且当簇内各单位差异明显,而且基本能够反映和接近总体特征的时候,簇群抽样的精度较好;,缺点,:,如果抽中的簇群与总体特征差距明显,则会导致估计精度较低,效果较差,与分层抽样相比,,簇群抽样是选择一个或者几个簇作为总体的代表,而簇的划分有时并没有一个客观的标准。因此,从抽样估计的,通体精度,考虑,,簇群抽样要低于分层抽样,。但由于簇群抽样调查单位相对集中,平均单位调查费用较少,因此可以适当扩大群样本量以提高簇群抽样的精度,同时使调查费用仍比较少。,四、等距抽样,如果把总体按照某种顺序进行排列,然后采取某种既定规则进行间隔抽取个体的方式被称为等距抽样(,Systematic Sampling,),或者系统抽样,又称为机械抽样。,1,、,简单容易,2,、,实际的抽样误差很可能要低于简单随机抽样,直线等距抽样:,把总体单元排成一条直线,以,为抽样间距,把总体分为,n,段,每段,k,个单元。然后从,1,至,k,之间随机抽取一个整数,,即在第一段的,k,个单元中随机抽取一个单元为起点,假设为第,r,个单元,而后每隔,k,个单元抽出一个样本单元,直到抽满,n,个单元。这样总体中编号为,的单元全部入样。,四、等距抽样,小结,总体分布、样本分布和抽样分布的关系,双总体参数推断时样本统计量的分布,统计研究中常用到,Z,变量、,t,变量、,F,变量等的作用与意义,常用的集中概率分布的关系,常用的几种抽样方法,思考与讨论,中心极限定理的含义及应用,样本统计量与总体统计量之间的关系,常用的几种概率分布之间的关系,常用的几种抽样方法的联系与区别,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!