5概率基础知识7_总体、样本与统计量(精品)

上传人:仙*** 文档编号:245719425 上传时间:2024-10-10 格式:PPT 页数:82 大小:2.07MB
返回 下载 相关 举报
5概率基础知识7_总体、样本与统计量(精品)_第1页
第1页 / 共82页
5概率基础知识7_总体、样本与统计量(精品)_第2页
第2页 / 共82页
5概率基础知识7_总体、样本与统计量(精品)_第3页
第3页 / 共82页
点击查看更多>>
资源描述
电子科技大学,数理统计基本概念,probability,probability,第七章 抽样调查,总体、样本与统计量,常用统计分布,一、抽样调查的概念,1,、概念:是,按照随机原则,,从研究总体中抽取,部分单位进行调查,并推断总体数量特征的一种非,全面调查(运用数理统计原理,根据被抽取那部分单位的数量特征来推算总体数量特征)。,2,、特点:,抽样调查是非全面调查;,一定要遵守随机原则;,利用样本数据推算总体数量特征;,抽样调查必然产生抽样误差。,7.1,抽样调查概述,二、抽样调查的作用,1,、适用于不能或者很难进行全面调查的场合;,主要是无限总体和破坏性试验。,2,、适用于理论上能进行全面调查,但实际上,没有必要的场合;,3,、能节约人力、费用和时间,比较灵活;,4,、可以验证和修正全面调查的正确性和不足;,5,、可用于工业生产过程的质量控制;,6,、可用于某种总体的假设检验。,三,、抽样调查的几个基本概,念,以,概率论为理论基础,研究,2),研究如何合理地,分析随机数据,从而作出科学的,推断,(,称为,统计推断,).,1,),研究如何以有效的方式,收集和整理,随机数据,;,总体,:研究对象的单位元素所组成的集合,.,个体,:组成总体的每个单位元素,.,例,1,要考察本校男生的身体情况,则将本校,的所有男生视为一个总体,而每一位男生就是,一个个体,.,(一)总体,总 体 是 随 机 变 量,总体指标:根据总体标志值计算的指标。,总体指标,总体成数,总体方差:,(标准差),总体平均数,:,(二)样本,从总体中抽取一部分,(,取,n,个,),进行观测,再依据这,n,个个体的试验,(,或观察,),的结果去推断总体的性质,.,样本,:,按照,一定的规则,从总体中抽取的一部分个体,.,抽样,:抽取样本的过程,.,样本容量,:样本中个体的数目,n .,抽样指标:根据样本总体标志值计算的指标。,抽样指标,样本成数:,样本方差:,(标准差),样本平均数:,为使样本具有代表性,抽样应满足什么条件,从民意测验看抽样,?,(,1,),X,i,与总体同分布,;,(,2,),X,1, X,2, , X,n,相互独立,.,从民意测验看抽样,1936,年,,Franklin Delano Rosevelt(,罗斯福,),与共和党的候选人,-,Kansas,州州长,Alfred Landon(,兰登,),竞选总统,.,绝大多数观测家认为罗斯福会是获胜者,但,文学摘要,却预测兰登会以,57,%,: 43,%,的优势获胜,.,摘要,自,1916,年以来的历届总统选举中都正确地预测出获胜的一方,但这次罗斯福以,62,%,: 38,%,的压倒优势取胜!,(,不久,文学摘要,就垮了,),#,摘要,调查的过程是将问卷寄给一千万人, 这些人的名字和地址摘自电话簿或俱乐部会员名册,这筛掉了不属俱乐部或未装电话的穷人,.,这在,1936,年前影响不大,因为穷人富翁以类,似的思考投票;但,1936,年经济正在从大萧条中恢复,故穷人选罗斯福,而富翁们选兰登,.,抽样方法和规则:,1,)抽样必须遵循随机原则,2,)抽样调查必然会产生误差,抽样误差是可以事先计算和控制的。,抽样调查的组织方式,(一)简单随机抽样,(二)类型抽样,(三)机械抽样,(四)整群抽样,(五)多阶段抽样,四、抽样调查的组织方式,(一)简单随机抽样,(二)类型抽样,(三)机械抽样,(四)整群抽样,(五)多阶段抽样,(一)简单随机抽样,1,、概念:又称纯随机抽样,是对总体,不作任何处理,,随机抽取样本单位的方法。,2,、种类:,(,1,)直接抽选法,(,2,)抽签法,(,3,)随机数字表法,3,、特点:,简单,最符合随机原则,但误差较大。,(二)类型抽样,1,、概念:又称分类抽样,是先对总体各单位按一定,标志加以分类,,然后再从各类中按随机原则抽取样本单位的方法。,2,、种类:,(,1,)类型比例抽样,(,1,)不等比例抽样,3,、特点:,把分组法与随机抽样有机结合,提高了样本的代表性,误差较小。,(三),机械抽样,1,、概念:又称等距抽样或系统抽样,是先对总体按,一定顺序加以排列,,然后按一定的间隔抽取样本单位的方法。,2,、种类:,(,1,)按排队标志与研究目的是否有关分:,按无关标志机械抽样,按有关标志机械抽样,(,2,)按抽样单位抽选的方法不同分为,随机起点等距抽样、半距起点等距抽样、对称等距抽样,3,、特点:,简便易行,但容易出现系统误差。,(四)整群抽样,1,、概念:是先对总体按某一标志分为若干群或组,然后,,以群为抽样单位,抽取样本的方法。,2,、特点:,方便节约费用,但误差较大。,(五)多阶段抽样,1,、概念:样本不是一次性抽取,而是分两个或两个以上阶段。,2,、特点:,节约人力和物力;,可以以现成的行政区域、组织系统作为划分各阶段的依据。,五、抽样方法,(一)重复抽样,特点:,N,保持不变,各单位中选的机会均等。,(二)不重复抽样,特点:,N,逐渐减小,各单位中选的机会逐渐提高。,六、统计量,统计量:,样本的不含任何未知参数的函数。,总 体 是 随 机 变 量,统计量 是 随机变量,(,或向量),样 本 是 随 机 向 量,样本均值,:,样本方差,:,常见统计量:,样本,k,阶原点矩,:,样本,k,阶中心矩,:,统称,样本矩,抽样误差的意义,纯随机抽样抽样平均误差的计算,分类抽样抽样平均误差的计算,机械抽样抽样平均误差的计算,整群抽样抽样平均误差的计算,7.2,抽样误差,一、抽样误差的意义,(,一)抽样误差的,概念,抽样误差是指样本指标与总体指标之间数量上的差,别,,用符号表示为:,抽样误差的来源为:,统计调查误差,登记性误差,代表性误差,随机误差,偏 差,抽样平均误差:所有抽样实际误差的平均数或,所有可能出现的样本指标的标准差。,抽样实际误差:一个样本指标与总体指标之间的数量差别。,(,二)影响抽样平均误差的因素,1,、总体,标志变动度(,2,或,):与抽样,平均误差,呈正比关系。,2,、抽样单位数(,n):,与抽样平均误差呈反方向变化。,3,、抽样组织方式。,4,、抽样方法。,(,三)抽样平均误差的概念简例,以,平均数抽样平均误差为例,例,有四个工人,各人每月产量分别是,40,,,50,,,70,,,80,件,现在随机从其中抽取,2,人,并求平均加工零件数,用以代,表,4,人总体的平均产量水平。,为方便说明问题,先计算出,4,人的月平均产量为:,1,、重复抽样:样本配合数,=44=16,2,、不重复抽样:样本配合数,=43=12,很明显,重复抽样平均误差大于不重复抽样平均误差。,(四)抽样平均误差的的意义,1,、可以衡量抽样调查的准确性;,2,、是抽样推断和估计的基本根据。,重复抽样抽样平均误差计算表,序号,样本变量,样本平均数,离差,离差平方,1,2,3,4,40,,,40,40,,,50,40,,,70,40,,,80,40,45,55,60,-20,-15,-5,0,400,225,25,0,5,6,7,8,50,,,40,50,,,50,50,,,70,50,,,80,45,50,60,65,-15,-10,0,5,225,100,0,25,9,10,11,12,70,,,40,70,,,50,70,,,70,70,,,80,55,60,70,75,-5,0,10,15,25,0,100,225,13,14,15,16,80,,,40,80,,,50,80,,,70,80,,,80,60,65,75,80,0,5,15,20,0,25,225,400,合计,2000,不重复抽样抽样平均误差计算表,序号,样本变量,样本平均数,离差,离差平方,1,2,3,40,,,50,40,,,70,40,,,80,45,55,60,-15,-5,0,225,25,0,4,5,6,50,,,40,50,,,70,50,,,80,45,60,65,-15,0,5,225,0,25,7,8,9,70,,,40,70,,,50,70,,,80,55,60,75,-5,0,15,25,0,225,10,11,12,80,,,40,80,,,50,80,,,70,60,65,75,0,5,15,0,25,225,合计,1000,二、纯随机抽样平均误差的计算,(,一)平均数抽样平均误差的计算,1,、重复抽样,根据数理统计证明:在纯随机重复抽样条件下,抽样平均,误差与全及总体的标准差成正比,与样本总体单位数的平方根,成反比,利用此关系可得出重复抽样平均数抽样误差的计算公,式为:,总体标准差的来源,1,、过去调查所得资料,选多个方差中最大的,2,、用样本标准差代替总体标准差:,用,s,代替,。,3,、用小规模调查资料,4,、用估计资料,2,、不重复抽样,其中,(,1,n/N,)是修正系数。,(二)成数抽样平均误差的计算,假定,某一现象有两种表现,具有一种表现的单位数为,N,1,,,变量值为,1,,不具有该种表现的单位数为,N,0,,变量值为,0,,则,平均数、方差分别为:,2,、不重复抽样平均误差,1,、重复抽样平均误差,三、分类抽样平均误差的计算,关键问题是影响抽样平均误差的主要因素:,组内方差,,,计算抽样平均误差时用平均组内方差。,总体:用 表示,样本:用 表示。,(一)平均数抽样平均误差的计算,1,、重复抽样,:,2,、不重复抽样,:,其中,平均组内方差为:,总体平均组内方差:,样本平均组内方差:,例:,假定用分类比例抽样方式,从山区、丘陵、平原三种类型的,200,亩耕地上抽取,10,块(每块,1,亩,亩产量见下表)进行抽样调查,用来推断全部耕地的平均亩产量,求平均亩产量的抽样平均误差。,三、分类抽样平均误差的计算,分类抽样平均数抽样平均误差计算表,类型,抽样地块数,亩产量(斤),x,i,组平均亩产(斤),山区,2,300,320,310,-10,10,100,100,丘陵,3,390,420,450,420,-30,0,30,900,0,900,平原,5,600,600,700,750,800,690,-90,-90,10,60,110,8100,8100,100,3600,12100,解:(,1,)计算各组内方差:,(,2,)计算平均组内方差:,(,3,)计算抽样平均误差:,(二)成数抽样平均误差计算,2,、不重复抽样,:,1,、重复抽样,:,其中,平均组内方差为:,总体平均组内方差:,样本平均组内方差:,仍用上述资料计算成数的抽样平均误差。,假设亩产,450,斤以上为高产田,不到,450,斤的为低产田,计算高产田所占比重的抽样平均误差。,分类抽样成数抽样平均误差计算表,类型,抽样地块数,高产田地块数,高产田所占比重(,p,i,),1-p,i,p,i,(1-p,i,),山区,2,0,0,1,0,丘陵,3,1,0.33,0.67,0.2211,平原,5,5,1,0,0,三、分类抽样平均误差的计算,解:(,1,)计算平均组内方差:,(,2,)计算抽样平均误差:,三、分类抽样平均误差的计算,四、机械抽样平均误差的计算,机械抽样一般都用不重复抽样。,无关标志排队机械抽样类似于简单随机抽样,计算公式为:,有关标志排队机械抽样类似于分类抽样,计算公式为:,五、整群抽样平均误差的计算,其中:,R,:总体群数;,r,:样本群数;总体或样本平均,数群间方差的计算公式为:,关键问题是影响抽样平均误差的主要因素:,群间方差,,,总体:用 表示。,整群抽样一般都用不重复抽样,需要修正系数。,(一)平均数抽样平均误差的计算,(二)成数抽样平均误差的计算,其中:,R,:总体群数;,r,:样本群数;总体或样本成数,群间方差的计算公式为:,数 理 统 计 的 引 入,某厂生产的一批产品中次品率为,p,。从中抽取,10,件产品装箱。,1,)没有次品的概率,2,)平均有几件,次品,概,率,3,)为以,0.95,的概率保证箱中有,10,件正品,箱中至少要装多少件产品。,所有这些问题的关键是,p,是已知的!,如何获取,p,?,这就是数理统计的任务了!,一个很自然的想法就是:,首先从这批产品中随机抽取产品进行检验。,怎样随机抽取这属于抽样理论与方法问题,。,其次利用概率论的知识处理实测数据。,如何分析、处理实测数据。这属于统计推断的问题。也是我们研究的内容。,统计推断常解决的问题:,1,)如何估计次品率,p,?,2,)如果以,p,0.01,为出厂的标准,这批产品能否出厂?,数 理 统 计 的 引 入,参数估计问题,假设检验问题,#,7.3,常用统计分布,上侧分位数,u,( 0, 45,),时,有,2,(,n,),的,上侧分位数,( 0,1 ),:,阴影部分面积为,3.,自由度为,n,的,t,分布,T,t,(,n,),又称学生氏分布,-,第一个研究者,以,Student,作笔名发表文章,.,即,随机变量,T,服从,自由度为,n,的,t,分布,.,定理,7.2.2,设随机变量,X,Y,相互独立,X,N,(0,1),,,Y,2,(,n,),,,则,阴影部分面积为,t,(,n,),的,上侧分位数,t,(,n,),( 0,1 ),:,T,分布的特点,:,1.,关于纵轴对称,:,例,查表计算,:,t,-,t,=,t,1,-,因,=P,T,t,=,P,T,-,t,=1,-,P,T,-,t,故,P,T,t,=1,.,即,t,=,-,t,1,-,例,查表计算,:,2.,n,较大时,,,4.,F,分布,F,F,(,n,1,n,2,),称,X,服从第一自由度为,n,1,第二自由度为,n,2,的,F,分布,.,定理,7.2.3,设随机变量,X,,,Y,相互独立,,,X,2,(,n,1,),,,Y,2,(,n,2,),,,则,即随机变量,F,服从第一自由度为,n,1,,,第二自由度为,n,2,的,F,分布,.,例 统计量的分布,(,之二,),F,(,n,1,n,2,),的,上侧分位数,F,(,n,1,n,2,),( 0,1 ),:,阴影部分面积为,推论,1,推论,2,证,二、抽样分布定理,定理,7.2.4,应用例,定理,6.2.5,设正态总体,X,与,Y,相互独立,,,X,样本为,X,1,,,X,2,,,X,n,1,样本均值和样本方差为,;,Y, ,,样本为,Y,1,,,Y,2,,,Y,n,2,,,样本均值和样本方差为,.,有,分析,证明,: (2),服从,正态分布,,,S,w,2,可化为,2,分布,二者组合而成的统计量应服从,t,分布,.,因 , 相互独立,故,U,与,V,也相互,独立,从而,总体、个体,简单随机样本,统计量,统计量的分布,正态总体的,2,个抽样定理,样本均值,样本方差,样本矩(样本相关系数),2,分布,t,分布,F,分布,分位数,结构定理,例,7.2.1,设随机变量,X,服从正态分布,N,(0,1),对给定的,(01),,数,u,满足 ,,则,x,等于,u,是上侧,分位数,.,解,阴影部分面积为,(1,-,)/2,面积为,#,例,7.2.2,统计量的分布,(,之一,),解,设,X,1,X,2, ,X,n,是来自正态总体,的容量为,n,的样本,求下列统计量的概率分布:,#,例,7.2.3,查表计算概率,注意,应注意分布表的定义与查法!,#,解,例,7.2.4,统计量的分布,(,之二,),设,X,1,X,2, ,X,n,+,m,是来自正态总体,的样本,求下列统计量的概率分布,由,t,分布结构定理,,#,3.,因,Z,t,(,m,),根据,t,分布结构定理,有,例,7.2.5,设,X,1,X,2,.,X,9,是来自正态总体,X,的随机样本,令,证明统计量,Z,服从自由度为,2,的,t,分布,.,证,记,D,(,X,)=,2,(,未知,),,有,由于,Y,1,Y,2,相互独立,故,从而,由抽样分布定理知,因,Y,1,和,Y,2,相互独立,Y,1,和,S,2,相互独立,而且,Y,2,和,S,2,相互独立,故,Y,1,Y,2,和,S,2,相互独立,.,根据,t,分布结构定理知,服从自由度为,2,的,t,分布,.,#,证明,且,X,1,,,X,2,,,X,n,相互独立,,,X,i,N,(0,1),,,证 因,也相互独立同分布,,根据独立同分布中心极限定理有,近似成立,故,#,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!