第六章抽样估计课件

上传人:94****0 文档编号:241514197 上传时间:2024-07-01 格式:PPT 页数:123 大小:1.36MB
返回 下载 相关 举报
第六章抽样估计课件_第1页
第1页 / 共123页
第六章抽样估计课件_第2页
第2页 / 共123页
第六章抽样估计课件_第3页
第3页 / 共123页
点击查看更多>>
资源描述
第六章 抽样估计第六章 抽样估计主要内容n1.抽样估计概述n2.抽样误差n3.抽样估计的方法n4.样本容量的确定主要内容1.抽样估计概述设设计计抽抽样样方方案案定定义义总总体体及及样样本本选选择择抽抽样样框框选选择择抽抽样样方方法法确确定定样样本本容容量量抽样调查的程序抽样调查的程序进进入入调调查查阶阶段段设定选选确抽样调查的程序进选 择 抽 样 框n抽样框就是所有总体单位的集合,抽样框就是所有总体单位的集合,是总体的数据目录或全部总体单位是总体的数据目录或全部总体单位的名单。的名单。n根据抽样框可以根据抽样框可以重新界定总体重新界定总体。如。如抽样框是电话簿,则家庭成员总体抽样框是电话簿,则家庭成员总体可以被重新界定为列入电话簿中的可以被重新界定为列入电话簿中的那部分家庭的成员。那部分家庭的成员。选 择 抽 样 框抽样框就是所有总体单位的集合,是总体的数据抽 样 框n例例 如:如:要从商学院的全体学生中抽取要从商学院的全体学生中抽取500名学生作为调查样本,则商学院全名学生作为调查样本,则商学院全体在校生的名单就是这次抽样的样本框;体在校生的名单就是这次抽样的样本框;如果是从该校所有班级中抽取部分班级如果是从该校所有班级中抽取部分班级的全体同学作为调查样本,则此时的抽的全体同学作为调查样本,则此时的抽样框就是全校所有班级的名单,因为此样框就是全校所有班级的名单,因为此时的抽样单位已经不再是单个的学生,时的抽样单位已经不再是单个的学生,而是单个的班级。而是单个的班级。抽 样 框例 如:要从商学院的全体学生中抽取500名学生作n注注 意:意:一般街道居委名录、企一般街道居委名录、企业名录、电话本、花名册、俱业名录、电话本、花名册、俱乐部名录、黄页簿、工商局企乐部名录、黄页簿、工商局企业登记库、行业年鉴等都是市业登记库、行业年鉴等都是市场调查中常用的抽样框。场调查中常用的抽样框。注 意:一般街道居委名录、企业名录、电话本、花名册、俱乐部名1.抽样估计的概述n概念:概念:n在抽样调查抽样调查的基础上,用样本的实际资料计算样样本指标本指标,并据此估计和推断总体相应数量特征估计和推断总体相应数量特征的一种统计推断方法统计推断方法。n特点:特点:n随机原则抽取;随机原则抽取;n部分部分单位推断总体推断总体;n误差可算可控误差可算可控;n基于概率概率的一种统计推断方法。1.抽样估计的概述概念:n理论基础:理论基础:大数法则、中心极限定理n大数法则:大数法则:关于大量的随机现象具有稳定性质的法则。它论证了抽样平均数趋近于总体平均数的趋势,为抽样估计提供了重要的依据。n中心极限定理:中心极限定理:研究变量和分布序列的极限定理。n如果总体变量存在有限的平均数和方差,那么不论这个总体变量分布如何,随着抽样单位数n的增加,抽样平均数的分布将趋近于正态分布。理论基础:抽样估计中的基本概念n(一)总体和样本n(二)总体指标和样本指标n(三)重复抽样和不重复抽样抽样估计中的基本概念(一)总体和样本总体和样本n总体:总体:研究现象的全体,由所研究范围内具有某种相同性质的全体单位相同性质的全体单位所组成的整体。通常用N表示。品质标志品质标志数量标志数量标志总体总体属性总体属性总体变量总体变量总体总体和样本总体:研究现象的全体,由所研究范围内具有某种相同性n样本(子样)样本(子样):从总体中随机抽取出来,代表总体的那部分单位的集合。n样本单位数样本单位数,又称样本容量样本容量,通常用n表示。样本容量如何确定呢?样本容量如何确定呢?样本(子样):从总体中随机抽取出来,代表总体的那部分单位的集 样本容量的确定样本容量的确定一般来讲:一般来讲:当当 n 30n 30,称为,称为大样本大样本;当当 n 30n 30,称为,称为小样本小样本。样本容量样本容量指样本中含有的总体单位的指样本中含有的总体单位的数目,数目,通常用通常用n 来表示。来表示。确定适当样本容量的意义:确定适当样本容量的意义:q若若n过大,调查工作量增大,体现不出抽样过大,调查工作量增大,体现不出抽样调查的优越性;调查的优越性;q若若n 过小,抽样误差会增大,抽样推断就过小,抽样误差会增大,抽样推断就会失去价值。会失去价值。样本容量的确定一般来讲:当 n 30,称为大样本样本容量样本容量调查误差调查误差调查费用调查费用小样本容量小样本容量节省费用但节省费用但调查误差大调查误差大大样本容量大样本容量调查精度高调查精度高但费用较大但费用较大找出在规定误差找出在规定误差范围内的最小样范围内的最小样本容量本容量确定样本容量的意义确定样本容量的意义找出在限定费用找出在限定费用范围内的最大样范围内的最大样本容量本容量样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本总体指标和样本指标n总体指标:总体指标:根据总体中各单位的标志值或标志属性计算的,反映总体数量特征总体数量特征的综合指标。总体是唯一确定的总体指标的数值也是唯一确定的样本数据(已知)总体指标(未知)抽样估计抽样估计推断和估计总体指标和样本指标总体指标:根据总体中各单位的标志值或标志属统计推断统计推断总体指标:总体指标:参参数(未知量)数(未知量)样本总体指标:样本总体指标:统统计量(已知量)计量(已知量)总体是唯一确定总体是唯一确定 的,样本总体不唯一的,样本总体不唯一注注 意意统计推断总体指标:参数(未知量)样本总体指标:统计量(已知量设总体变量X为:X1,X2,X3,XN,则有:或或或或对于变量总体变量总体,常用的总体指标有总体平均数 、总体标准差设总体变量X为:X1,X2,X3,XN,则有:或或对于变量 对于属性总体属性总体,最常用的指标是成数成数。总体成数总体成数表示总体中具有某种性质的单位数在总体全部单位数中所占的比重,以P P表示;总体中不具有某种性质的单位数在总体全部单位数中所占的比重则以Q Q表示。设总体N个单位中,有N N1 1个单位具有某种性质,N N0 0个单位不具有某种性质,N1+N0=N,则有:,对于属性总体,最常用的指标是成数。设总体N个单n样本指标:样本指标:根据样本各单位各单位标志值或标志属性计算的综合指标,也称统计量统计量,它是来估计和推断总体参数估计和推断总体参数的。n与总体指标相对应,有样本平均数样本平均数、样本样本成数成数及样本标准差样本标准差等。样本指标:根据样本各单位标志值或标志属性计算的综合指标,也称设样本变量x x的观察值为:x x1 1,x x2 2,x xn n,则:样本平均数:样本平均数:样本标准差:样本标准差:样本方差:样本方差:样本成数:样本成数:或或或样本成数的标准差:样本成数的标准差:设样本变量x的观察值为:x1,x2,xn,则:样本平均数重复抽样重复抽样又称作重置抽样、有放回抽样又称作重置抽样、有放回抽样抽出抽出个体个体登记登记特征特征放回放回总体总体继续继续抽取抽取特点特点同一总体单位有可能被重复抽中,同一总体单位有可能被重复抽中,而且每次抽取都是而且每次抽取都是独立独立进行进行重复抽样又称作重置抽样、有放回抽样抽出登记放回继续特点同一总不重复抽样不重复抽样又被称作不重置抽样、不又被称作不重置抽样、不放回抽样放回抽样抽出抽出个体个体登记登记特征特征继续继续抽取抽取特点特点同一总体中每个单位被抽中的机会并同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不均等,在连续抽取时,每次抽取都不是独立不是独立进行。进行。是最常用的抽样方法,用于无限总体和许多是最常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。有限总体样本单位的抽样。不重复抽样又被称作不重置抽样、不放回抽样抽出登记继续特点同一名 称样 本总 体定义从总体中抽出的部分单位研究对象的全部单位特征统计量参数符号 样本容量 样本平均数 样本比率 样本方差 样本标准差 总体容量 总体平均数 总体比率 总体方差 总体标准差名 称样 本总 体定义从总体中抽出的部分单位研究对象的全部单1.纯随机抽样(简单随机抽样)纯随机抽样(简单随机抽样)对总体不做任何分类或排序,完全按随机原则抽样。适用范围:适用范围:总体规模不大,内部差异较小。总体规模不大,内部差异较小。例:一个班组有A、B、C、D、E 5个工人,随机抽取2个工人的日工资数作为了解整个班组平均工资水平的样本。可能的结果是 有放回抽样:25个样本不放回抽样:20个样本随机抽样设计样本号ABCDEABCDE1.纯随机抽样(简单随机抽样)有放回抽样:25个样本随机抽2.等距抽样(机械抽样或系统抽样)等距抽样(机械抽样或系统抽样)将总体按某一标志值顺序排列,然后相等距离或相等间隔抽取样本将总体按某一标志值顺序排列,然后相等距离或相等间隔抽取样本单位。单位。间隔距离:间隔距离:N:总体单位数:总体单位数 n:需要抽取的样本单位数:需要抽取的样本单位数 例:从某企业例:从某企业5000名职工中抽取名职工中抽取100人进行家庭收入水平调查。人进行家庭收入水平调查。样本的距离样本的距离=起点的选择:按姓氏排序,在第一个间隔中随机选取。起点的选择:按姓氏排序,在第一个间隔中随机选取。排序标志排序标志无关标志无关标志有关标志有关标志2.等距抽样(机械抽样或系统抽样)排序标志无关标志 优点:优点:1.能保证被抽取的单位在总体中均匀分布 2.能使抽样过程简化 应用中的注意事项:应用中的注意事项:注意抽样间隔或样本距离和现象本身的节奏性和循环周期相重合的问题 第六章抽样估计课件3.类型抽样(分类抽样或分层抽样)类型抽样(分类抽样或分层抽样)先将总体中的所有单位按某个标志分组,然后从各组按纯随机抽样或等先将总体中的所有单位按某个标志分组,然后从各组按纯随机抽样或等距抽样方式抽样。采用这种方法,由于各单位之间的差异因划类或分层距抽样方式抽样。采用这种方法,由于各单位之间的差异因划类或分层而缩小,这就比较容易选出有代表性的样本而缩小,这就比较容易选出有代表性的样本 适用范围:适用范围:总体情况复杂,各类型或层次之间的差异较大而总体容量总体情况复杂,各类型或层次之间的差异较大而总体容量又较大。又较大。优点:优点:比简单纯随机抽样更精确,能以较少的抽样单位数得到较准确的比简单纯随机抽样更精确,能以较少的抽样单位数得到较准确的推断结果。特别是当总体各单位变量值大小悬殊、各组标志变动程度很推断结果。特别是当总体各单位变量值大小悬殊、各组标志变动程度很大时,划分类型能保证各组都有选中的机会。大时,划分类型能保证各组都有选中的机会。3.类型抽样(分类抽样或分层抽样)先将总体中的所类型抽样分类类型抽样分类 类型比例抽样:类型比例抽样:按统一的比例来确定各类型组应抽选的样本单位数,即各类型中抽取的样本单位数 占各类型组所有单位数 的比例是相等的,等同于样本单位总数 n 占总体单位数 N 的比例类型适宜抽样:类型适宜抽样:考虑各类型标志变动程度 不同,变动程度大的组要多抽样,变动程度小的类型组可少抽样,使得各类型组的变动程度 在所有类型变动程度之和 中的比例相同,等同于 或类型抽样分类类型比例抽样:按统一的比例来确定各类型组应抽选的n例:某项粮食播种面积20000亩,其中有平原和山区两种地形。以类型抽样的方法了解平均粮食产量。地形全部面积(Ni)样本面积(ni)平原山区 14000 6000合计 20000总体N比例抽样适宜抽样N1N2N3n1n2n3n类型抽样确定各组样本的方法:类型抽样确定各组样本的方法:地形全部面积(Ni)样本面积(ni)平原 140004.整群抽样整群抽样 将总体按某个标志分为多个群,按纯随机抽样方式或等距抽样方式,将总体按某个标志分为多个群,按纯随机抽样方式或等距抽样方式,抽取若干群,然后对所抽中的各群中的全部单位一一进行调查。抽取若干群,然后对所抽中的各群中的全部单位一一进行调查。适宜范围:适宜范围:不适合单个抽样的场合,就可采用整群抽样方式。不适合单个抽样的场合,就可采用整群抽样方式。优缺点:优缺点:调查方便,但抽样误差较大。调查方便,但抽样误差较大。例:从某县例:从某县100个村中抽出个村中抽出10个村,进行全面调查,就可以大致了个村,进行全面调查,就可以大致了 解农村家庭副业发展情况。解农村家庭副业发展情况。总群数 R=13C DG K样本数 r=4样本容量n=nc+nd+ng+nkADCFGHIJKLMBE4.整群抽样总群数 R=13C D样本数 r=5.多阶段抽样多阶段抽样 总体包含的单位很多,分布很广,要通过一次抽样抽选样本很困总体包含的单位很多,分布很广,要通过一次抽样抽选样本很困难,此时,可以将其分成若干阶段,然后逐阶段进行抽样,以完成难,此时,可以将其分成若干阶段,然后逐阶段进行抽样,以完成整个抽样过程。整个抽样过程。特点:多个阶段、多种方法综合抽样,优点是降低抽样成本。特点:多个阶段、多种方法综合抽样,优点是降低抽样成本。例:对某山区的林采蓄积量作抽样调查。将总体例:对某山区的林采蓄积量作抽样调查。将总体50块面积相等的地块面积相等的地划为划为10个区,每个区包括个区,每个区包括5个地块。采用两阶段抽样,先从个地块。采用两阶段抽样,先从10个区个区选中选中30%,再从选中的区域中抽取,再从选中的区域中抽取60%的地块组成样本进行调查。的地块组成样本进行调查。第六章抽样估计课件2.抽样误差n抽样误差地概念n抽样误差的侧度2.抽样误差抽样误差地概念-指所选取的样本的结果不能指所选取的样本的结果不能完全代表总体而导致的误差。完全代表总体而导致的误差。抽样误差抽样误差误差种类误差种类样本单位的结构与总体单位结构分布不一致而产生的误差。-指所选取的样本的结果不能完全代表总体而导致的误差。抽三种误差的区别:n登记误差:登记误差:由于人的由于人的主观失误主观失误在观察、在观察、登记、计算时造成的误差,可以避免。登记、计算时造成的误差,可以避免。n系统性误差:系统性误差:由于由于有意识有意识选取调查单位选取调查单位造成的系统偏差,理论上可以避免。造成的系统偏差,理论上可以避免。n随机误差:随机误差:由于按照由于按照随机原则随机原则抽取样本抽取样本而产生的误差,无法避免但可以控制。而产生的误差,无法避免但可以控制。因因因因 此:此:此:此:理论上讲,抽样误差一般指理论上讲,抽样误差一般指理论上讲,抽样误差一般指理论上讲,抽样误差一般指随机误差随机误差随机误差随机误差,而不包括而不包括而不包括而不包括登记性误差和系统性偏差登记性误差和系统性偏差登记性误差和系统性偏差登记性误差和系统性偏差。三种误差的区别:登记误差:由于人的主观失误在观察、登记、计算影响抽样误差的因素 总体各单位的差异程度:总体各单位的差异程度:标准差越大,抽样误差越大;标准差越大,抽样误差越大;样本单位数的多少:样本单位数的多少:n 越大,抽样误差越小;越大,抽样误差越小;抽样方法:抽样方法:不重复抽样比重复抽样小;不重复抽样比重复抽样小;抽样组织方式:抽样组织方式:简单随机抽样最大。简单随机抽样最大。影响抽样误差的因素 总体各单位的差异程度:抽样误差的侧度n(一)抽样实际误差n(二)抽样平均误差n(三)抽样极限误差抽样误差的侧度(一)抽样实际误差抽样实际误差抽样实际误差n 在一次具体的抽样调查中,由随机随机因素因素引起的样本指标与总体指标之间的离差。抽样实际误差抽样实际误差是无法计算的。同时,抽样实际误差仅仅是一系列可能出现的可能出现的误差数值之一误差数值之一,因此,抽样实际误差没没有概括所有有概括所有可能产生的抽样误差。抽样实际误差 在一次具体的抽样调查中,由随机因素引起的样抽样平均误差抽样平均误差n反映抽样误差一般水平一般水平的一个指标。n是指抽样平均数的标准差或抽样成数的标准差。n设以 表示样本平均数的抽样平均误差,以 表示样本成数的抽样平均误差,M表示全部可能的样本数目,则有:抽样平均误差反映抽样误差一般水平的一个指标。(例题分析)【例例例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4 4。4 4 个个个个体体分分别别为为x x1 1=1=1、x x2 2=2=2、x x3 3=3=3 、x x4 4=4=4 。总总体的均值、方差及分布如下体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差(例题分析)【例】设一个总体,含有4个元素(个体),即总体(例题分析)现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为n3,4n3,3n3,2n3,1n3n2,4n2,3n2,2n2,1n2n4,4n4,3n4,2n4,1n4n1,4n4n1,3n3n2n1n1,2n1,1n1n第二个观察值第二个观察值n第一个第一个n观察值观察值n所有可能的所有可能的n=2 的样本(共的样本(共16个)个)(例题分析)现从总体中抽取n2的简单随机样本,在重复(例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布n3.5n3.0n2.5n2.0n3n3.0n2.5n2.0n1.5n2n4.0n3.5n3.0n2.5n4n2.5n4n2.0n3n2n1n1.5n1.0n1n第二个观察值第二个观察值第第 个个观察值观察值n16个样本的均值(个样本的均值(x)X X样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(X X)1.51.53.03.04.04.03.53.52.02.02.52.5(例题分析)计算出各样本的均值,如下表。并给出样本均值(例题分析)=2.5 2=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P(X X)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5X X(例题分析)=2.5 总体分布14230.1.2 在实际抽样调查中,总体单位数N常常很大,样本单位数n一般也不小于30,由此产生的所有样本数目是极大的,不可能抽完所有可能的样本;同时,在开展抽样调查之前,总体指标是未知的。因此,实际工作中,定义式缺乏可操作性。在实际抽样调查中,总体单位数N常常很大,样本单位抽样平均误差n1.平均数的抽样平均误差n(1)在简单随机重复抽样条件下:n式中:代表总体标准差,n代表样本单位数。n(2)在简单随机不重复抽样条件下:修正因子修正因子1故不重复抽故不重复抽样的抽样平样的抽样平均误差总是均误差总是小于重复抽小于重复抽样的抽样平样的抽样平均误差。均误差。抽样平均误差1.平均数的抽样平均误差修正因子 ),使区间(,)涵盖被估计参数真值得概率为(),即置信度区间下限区间上限区间估计是根据给定的置信度的要求,估计出可能包含总体参数的区可将抽样极限误差的公式变形,如下:对总体平均数和总体成数进行区间估计的公式。即当有了样本指标,并根据给定的置信度计算出抽样极限误差之后,就可得到以同样的置信度水平来估计总体平均数和总体成数的区间。可将抽样极限误差的公式变形,如下:对总体平均数和总体成数进行总体均值的区间估计1.区间估计的基本原理区间估计的基本原理2.正态总体或大样本的估计正态总体或大样本的估计3.正态总体小样本的估计正态总体小样本的估计总体均值的区间估计1.区间估计的基本原理区间估计的图示 X95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x区间估计的图示X95%的样本-1.96 x+1 1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为(1-为是总体参数未在区间内的比例 3.常用的置信水平值有 99%,95%,90%n相应的相应的 为0.01,0.05,0.10置信水平 1.将构造置信区间的步骤重复很多次,置信区间包含总体参 1.由样本统计量所构造的总体参数的估计区间称为置信区间。2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。置信区间(confidence interval)样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限 1.由样本统计量所构造的总体参数的估计区间称为置信置信区间与置信水平 均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了区间包含了区间包含了%的区间未包含的区间未包含的区间未包含的区间未包含 1-1-/2 2 /2 21.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值2.我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间与置信水平 均值的抽样分布(1-)%区间包总体均值的区间估计(正态总体、已知,或非正态总体、大样本)总体均值的区间估计(正态总体、已知,或非正态总体、大总体均值的区间估计 1.假定条件总体服从正态分布,方差()已知如果不是正态分布,可由正态分布来近似(n 30)2.总体均值 在1-置信水平下的置信区间为重复抽样重复抽样不重复抽样不重复抽样总体均值的区间估计 1.假定条件重复抽样不重复抽样(例题分析)【例例例例】某某种种零零件件的的长长度度服服从从正正态态分分布布,从从某某天天生生产产一一批批零零件件中中按按重重复复抽抽样样方方法法随随机机抽抽取取9 9个个,测测得得其其平平均均长长度度为为21.4cm21.4cm。已已知知总总体体标标准准差差为为=0.15cm=0.15cm。试试估估计计该该批批零零件件平平均均长长度度的的置信区间,置信水平为置信区间,置信水平为95%95%。解解解解:已已知知 N N(,0.150.152 2),n n=9,=9,1-1-=95%95%,z z/2/2=1.96=1.96 总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该批零件平均长度的置信区间在该批零件平均长度的置信区间在21.302cm21.498cm21.302cm21.498cm之间之间 (例题分析)【例】某种零件的长度服从正态分布,从某天生产一批(例题分析)【例例例例】在在某某天天生生产产的的500500袋袋食食品品中中,按按不不重重复复抽抽样样方方法法随随机机抽抽取取2525袋袋进进行行检检查查,测测得得平平均均每每袋袋的的重重量量为为996996g g。已已知知该该种种袋袋装装食食品品的的重重量量服服从从正正态态分分布布,且且标标准准差差为为2020g g。试试估估计计该该种食品平均重量的置信区间,置信水平为种食品平均重量的置信区间,置信水平为95%95%。解:解:已知已知N(,202),n=25,1-=95%,z/2=1.96 总体均值总体均值 在在1-置信水平下的置信区间为置信水平下的置信区间为该种食品平均重量的置信区间为该种食品平均重量的置信区间为988.35g g1003.65g g之间之间(例题分析)【例】在某天生产的500袋食品中,按不重复抽样方总体均值的区间估计(正态总体、未知、小样本)总体均值的区间估计(正态总体、未知、小样本)总体均值的区间估计(小样本)1.假定条件n总体服从正态分布,且方差()未知n小样本(n 30)2.使用 t 分布统计量3.总体均值 在1-置信水平下的置信区间为总体均值的区间估计(小样本)1.假定条件总体均值 在1t 分布 分分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,它它通通常常要要比比正正态态分分布布平平坦坦和和分分散散。一一个个特特定定的的分分布布依依赖赖于于称称之之为为自自由由度度的的参参数数。随随着着自自由由度度的的增增大大,分分布布也也逐逐渐渐趋趋于正态分布于正态分布 X X Xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t分布分布标准正态分布标准正态分布t(df=13)t(df=5)Z Zt 分布 分布是类似正态分布的一种对称分布,它通常要比正态总体均值的区间估计(例题分析)【例例例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使使用用寿寿命命(小小时时)如如下下。建立该批灯泡平均使用寿命建立该批灯泡平均使用寿命95%95%的置信区间的置信区间16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计(例题分析)【例】已知某种灯泡的寿命服从正总体均值的区间估计(例题分析)解解解解:已已知知 N N(,2 2),n n=16,=16,1-1-=95%95%,t t/2/2=2.131=2.131。根据样本数据计算得:。根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8小小时时1503.21503.2小时小时总体均值的区间估计(例题分析)解:已知N(,2),n总体比例的区间估计大样本重复抽样时的估计方法大样本重复抽样时的估计方法大样本不重复抽样时的估计方法大样本不重复抽样时的估计方法总体比例的区间估计大样本重复抽样时的估计方法总体比例的区间估计(重复抽样)1.假定条件n总体服从二项分布n可以由正态分布来近似2.使用正态分布统计量3.3.3.总体比例总体比例总体比例 在在在1-1-1-置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为总体比例的区间估计(重复抽样)1.假定条件3.总体比例总体比例的区间估计(不重复抽样)1.假定条件n总体服从二项分布n可以由正态分布来近似2.使用正态分布统计量3.3.3.总体比例总体比例总体比例 在在在1-1-1-置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为总体比例的区间估计(不重复抽样)1.假定条件3.总体比例总体比例的区间估计(例题分析)【例例例例】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机抽抽取取了了100100个个下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信区间信区间解:解:解:解:已知已知 n n=100=100,p p65%65%,z z/2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区间为区间为55.65%74.35%55.65%74.35%总体比例的区间估计(例题分析)【例】某城市想要估计下岗职工中总体比例的区间估计(例题分析)【例例例例】某某企企业业共共有有职职工工10001000人人。企企业业准准备备实实行行一一项项改改革革,在在职职工工中中征征求求意意见见,采采取取不不重重复复抽抽样样方方法法随随机机抽抽取取200200人人作作为为样样本本,调调查查结结果果显显示示,有有150150人人表表示示赞赞成成该该项项改改革革,5050人人表表示示反反对对。试试以以95%95%的的概概率率确确定定赞赞成成改改革革的的人人数数比比例例的置信区间的置信区间解:解:解:解:已知已知 n n=100=100,p p75%75%,z z/2/2=1.96=1.96该该企企业业职职工工中中赞赞成成改改革革的的人人数数比比例例的置信区间为的置信区间为69.63%80.37%69.63%80.37%之间之间 总体比例的区间估计(例题分析)【例】某企业共有职工1000人样本容量的确定 组织抽样调查的一项重要工作就是要确定合适的样本容量。样本容量直接关系到调查的精度、调查费用、调查时间、需要配备的人力物力等许多方面。样本容量多大才合适呢?样本容量的确定 组织抽样调查的一项重要工作就是要确必要样本容量的计算公式n在重复抽样条件下,样本平均数的抽样极限误差的公式为:n故可以反推出必要样本容量的计算公式:必要样本容量的计算公式在重复抽样条件下,样本平均数的抽样极限n同样,在不重复抽样条件下,样本平均数的抽样极限误差的公式为:n故可以反推出必要样本容量的计算公式:同样,在不重复抽样条件下,样本平均数的抽样极限误差的公式为:n同样,在重复和不重复抽样条件下成数的必要样本容量分别为:同样,在重复和不重复抽样条件下成数的必要样本容量分别为:n从上述公式中可以看出,样本的必要单位数n受抽样极限误差 的制约,越小则样本n就需要越多。从上述公式中可以看出,样本的必要单位数n受抽样极限误差 (例题分析)【例例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?(例题分析)【例】拥有工商管理学士学位的大学毕业生年薪的标准解解解解:已知已知 =2000=2000,=400,=400,1-1-=95%=95%,z z/2/2=1.96=1.96 1 12 2/2 22 2置信度为置信度为90%90%的置信区间为的置信区间为即应抽取即应抽取9797人作为样本人作为样本 解:已知=2000,=400,1-=951.的取值一般小于0.12.未知时,可取最大值0.5确定样本容量应该注意的问题1.的取值一般小于0.1确定样本容量应该注意的问(例题分析)【例例例例】根根据据以以往往的的生生产产统统计计,某某种种产产品品的的合合格格率率约约为为90%90%,现现要要求求 边边 际际 误误 差差 为为5%5%,在在 求求 95%95%的的置置信信区区间间时时,应应抽抽取取多多少少个个产产品作为样本?品作为样本?解解解解:已已知知=90%=90%,1-1-=95%=95%,Z Z/2/2=1.96=1.96,E E=5%=5%应抽取的样本容量应抽取的样本容量为为 应抽取应抽取139139个产品作为样本个产品作为样本(例题分析)【例】根据以往的生产统计,某种产品的合格率约为9课堂练习一、判断题部分一、判断题部分 1.1.从全部总体单位中按照随机原则抽取从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。部分单位组成样本,只可能组成一个样本。()一、判断题部分 1.从全部总体单位中按照随机原则抽取 2.2.在抽样推断中,全及指标值是确定在抽样推断中,全及指标值是确定的、唯一的,而样本指标值是一个随机的、唯一的,而样本指标值是一个随机变量。(变量。()2.在抽样推断中,全及指标值是确定的、唯一的,而样本指标 3.3.抽样成数的特点是:样本成数越大,抽样成数的特点是:样本成数越大,则抽样平均误差越大。(则抽样平均误差越大。()3.抽样成数的特点是:样本成数越大,则抽样平均误差越 4.4.抽样平均误差总是小于抽样极限误抽样平均误差总是小于抽样极限误差。(差。()4.抽样平均误差总是小于抽样极限误差。(5.5.从全部总体单位中抽取部分单位构从全部总体单位中抽取部分单位构成样本,在样本变量相同的情况下,重成样本,在样本变量相同的情况下,重复抽样构成的样本个数大于不重复抽样复抽样构成的样本个数大于不重复抽样构成的样本个数。(构成的样本个数。()5.从全部总体单位中抽取部分单位构成样本,在样本变 6.6.抽样平均误差反映抽样误差的一抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽般水平,每次抽样的误差可能大于抽样平均误差,也可能小于抽样平均误样平均误差,也可能小于抽样平均误差。(差。()6.抽样平均误差反映抽样误差的一般水平,每次抽样的误 7.7.在抽样推断中,抽样误差的概率度在抽样推断中,抽样误差的概率度越大,则抽样极限误差就越大于抽样越大,则抽样极限误差就越大于抽样平均误差。(平均误差。()7.在抽样推断中,抽样误差的概率度越大,则抽样极限误差 8.8.抽样估计的优良标准有三个:抽样估计的优良标准有三个:无偏无偏性、可靠性和一致性。(性、可靠性和一致性。()8.抽样估计的优良标准有三个:无偏性、可靠 9.9.抽样推断的目的是,通过对部分单位抽样推断的目的是,通过对部分单位的调查,来取得样本的各项指标。(的调查,来取得样本的各项指标。()9.抽样推断的目的是,通过对部分单位的调查,来取得n 10.10.总体参数区间估计必须具备三个总体参数区间估计必须具备三个要素即:估计值、抽样误差范围和抽样要素即:估计值、抽样误差范围和抽样误差的概率度。(误差的概率度。()10.总体参数区间估计必须具备三个要素即:估计值、抽样n1.1.抽样平均误差是(抽样平均误差是()。)。nA.A.抽样指标的标准差抽样指标的标准差nB.B.总体参数的标准差总体参数的标准差nC.C.样本变量的函数样本变量的函数 nD.D.总体变量的函数总体变量的函数n二、单项选择题部分二、单项选择题部分A A1.抽样平均误差是()。二、单项选择题部分A2.2.抽样调查所必须遵循的基本原则是(抽样调查所必须遵循的基本原则是()。)。A.A.准确性原则准确性原则 B.B.随机性原则随机性原则C.C.可靠性原则可靠性原则 D.D.灵活性原则灵活性原则B B2.抽样调查所必须遵循的基本原则是()。B3.3.在简单随机重复抽样条件下,当抽样平在简单随机重复抽样条件下,当抽样平均误差缩小为原来的均误差缩小为原来的1/21/2时,则样本单位时,则样本单位数为原来的(数为原来的()。)。A.2A.2倍倍 B.3B.3倍倍 C.4C.4倍倍 D.1/4D.1/4倍倍 C C3.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/4.4.在一定的抽样平均误差条件下(在一定的抽样平均误差条件下()。)。A.A.扩大极限误差范围,可以提高推断的可靠程度扩大极限误差范围,可以提高推断的可靠程度 B.B.扩大极限误差范围,会降低推断的可靠程度扩大极限误差范围,会降低推断的可靠程度 C.C.缩小极限误差范围,可以提高推断的可靠程度缩小极限误差范围,可以提高推断的可靠程度 D.D.缩小极限误差范围,不改变推断的缩小极限误差范围,不改变推断的可靠程度可靠程度A A4.在一定的抽样平均误差条件下()。An5.5.反映样本指标与总体指标之间的平均反映样本指标与总体指标之间的平均误差程度的指标是(误差程度的指标是()。)。nA.A.平均数离差平均数离差 nB.B.概率度概率度 nC.C.抽样平均误差抽样平均误差 nD.D.抽样极限误差抽样极限误差C C5.反映样本指标与总体指标之间的平均误差程度的指标是()。n6.6.以抽样指标估计总体指标要求抽样指以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值标值的平均数等于被估计的总体指标值本身,这一标准称为(本身,这一标准称为()。)。nA.A.无偏性无偏性 nB.B.一致性一致性 nC.C.有效性有效性 nD.D.准确性准确性A A6.以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的7.7.抽样误差是指(抽样误差是指()。)。A.A.调查中所产生的登记性误差调查中所产生的登记性误差B.B.调查中所产生的系统性误差调查中所产生的系统性误差C.C.随机的代表性误差随机的代表性误差D.D.计算过程中产生的误差计算过程中产生的误差C C7.抽样误差是指()。Cn8.8.抽样极限误差和抽样平均误差的数值抽样极限误差和抽样平均误差的数值之间的关系为(之间的关系为()。)。nA.A.抽样极限误差可以大于或小于抽样平抽样极限误差可以大于或小于抽样平均误差均误差nB.B.抽样极限误差一定大于抽样平均误差抽样极限误差一定大于抽样平均误差nC.C.抽样极限误差一定小于抽样平均误差抽样极限误差一定小于抽样平均误差nD.D.抽样极限误差一定等于抽样平均误差抽样极限误差一定等于抽样平均误差A A8.抽样极限误差和抽样平均误差的数值之间的关系为()。An1.1.抽样推断的特点是(抽样推断的特点是()n.由推算认识总体的一种认识方法由推算认识总体的一种认识方法 n.按随机原则抽取样板单位按随机原则抽取样板单位 n.运用概率估计的方法运用概率估计的方法 n.可以计算,但不能控制抽样误差可以计算,但不能控制抽样误差 n.可以计算并控制抽样误差可以计算并控制抽样误差n三、多项选择题部分三、多项选择题部分1.抽样推断的特点是()三、多项选择题n2.2.抽样估计中的抽样误差(抽样估计中的抽样误差()n.是不可避免要产生的是不可避免要产生的 n.是可以通过改进调查方式来消除的是可以通过改进调查方式来消除的n.是可以事先计算出来的是可以事先计算出来的 n.只能在调查结束后才能计算的只能在调查结束后才能计算的n.其大小是可能控制的其大小是可能控制的2.抽样估计中的抽样误差()n3.3.从总体中抽取样本单位的具体方法有从总体中抽取样本单位的具体方法有()n.简单随机抽样简单随机抽样 n.重复抽样重复抽样 n.不重复抽样不重复抽样 n.等距抽样等距抽样 n.非概率抽样非概率抽样3.从总体中抽取样本单位的具体方法有()n4.4.抽样推断中,样本容量的多少取决于抽样推断中,样本容量的多少取决于()n.总体标准差的大小总体标准差的大小 n.允许误差的大小允许误差的大小 n.抽样估计的把握程度抽样估计的把握程度 n.总体参数的大小总体参数的大小 n.抽样方法和组织形式抽样方法和组织形式4.抽样推断中,样本容量的多少取决于(n5.5.用抽样指标估计总体指标,所谓优良用抽样指标估计总体指标,所谓优良估计的标准有(估计的标准有().客观性客观性 B.B.无偏性无偏性 C.C.一致性一致性 D.D.有效性有效性 E.E.优良性优良性 5.用抽样指标估计总体指标,所谓优良估计的标准有(本章结束
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!