统计学原理-抽样调查课件

上传人:29 文档编号:241666249 上传时间:2024-07-14 格式:PPT 页数:88 大小:928.49KB
返回 下载 相关 举报
统计学原理-抽样调查课件_第1页
第1页 / 共88页
统计学原理-抽样调查课件_第2页
第2页 / 共88页
统计学原理-抽样调查课件_第3页
第3页 / 共88页
点击查看更多>>
资源描述
第七章第七章 抽样调查抽样调查第七章抽样调查1 1l教学内容和要求明确抽样调查与推断明确抽样调查与推断(估计估计)的涵义和特点的涵义和特点掌握抽取样本的方式方法掌握抽取样本的方式方法掌握抽样误差的涵义及计算方法掌握抽样误差的涵义及计算方法掌握样本容量的确定方法掌握样本容量的确定方法熟练地对总体参数进行估计熟练地对总体参数进行估计了解参数的经济意义了解参数的经济意义教学内容和要求明确抽样调查与推断(估计)的涵义和特点2 2第一节第一节 抽样调查与统计推断基础知识抽样调查与统计推断基础知识一、一、抽样调查的概念、特点和适用范围抽样调查的概念、特点和适用范围11、抽样抽样抽样是根据一定的调查目的,从调查对象中抽取部分单抽样是根据一定的调查目的,从调查对象中抽取部分单位构成样本的过程位构成样本的过程全部工业企业部分工业企业第一节抽样调查与统计推断基础知识一、抽样调查的概念、特3 32 2、抽样种类、抽样种类概率抽样(随机抽样)非概率抽样(非随机抽样)简单随机抽样分层抽样等距抽样整群抽样2、抽样种类概率抽样非概率抽样简单随机抽样分层抽样等距抽4 43 3、抽样调查的概念、抽样调查的概念抽样调查是按照随机原则从调查对象中抽取一部分单位作为样抽样调查是按照随机原则从调查对象中抽取一部分单位作为样本进行调查,以其所获得的样本资料,对总体的数量特征进行本进行调查,以其所获得的样本资料,对总体的数量特征进行估计的一种非全面调查方式。估计的一种非全面调查方式。抽样调查抽样调查抽样(手段)推断(目的)调查对象或总体样本抽取推断调查3、抽样调查的概念抽样调查是按照随机原则从调查对象中抽取一部5 54 4、抽样调查的特点、抽样调查的特点 -与其他非全面调查相比较与其他非全面调查相比较按照随机原则抽取调查单位按照随机原则抽取调查单位根据样本信息对总体的数量特征进行估计根据样本信息对总体的数量特征进行估计存在误差但可以计算并施加控制存在误差但可以计算并施加控制4、抽样调查的特点-与其他非全面调查相比较6 65 5、抽样调查的适用范围、抽样调查的适用范围在不可能进行全面调查的情况下,抽样调查是唯一选择在不可能进行全面调查的情况下,抽样调查是唯一选择在时效性要求很高的情况下,适用于抽样调查在时效性要求很高的情况下,适用于抽样调查在不必要开展全面调查的情况下,适用于抽样调查在不必要开展全面调查的情况下,适用于抽样调查在对全面调查进行补充和修正时,适用于抽样调查在对全面调查进行补充和修正时,适用于抽样调查5、抽样调查的适用范围在不可能进行全面调查的情况下,抽样调查7 7二、抽样调查与估计的步骤二、抽样调查与估计的步骤设计抽样方案设计抽样方案抽样样本单位抽样样本单位对样本单位进行调查对样本单位进行调查由样本信息对总体特征进行估计由样本信息对总体特征进行估计二、抽样调查与估计的步骤设计抽样方案抽样样本单位对样本单位进8 8三、抽样调查与推断的常用指标三、抽样调查与推断的常用指标1 1、总体指标(总体参数)、总体指标(总体参数)用以描述与刻画总体数量特征。特点:既定,唯一,未知。用以描述与刻画总体数量特征。特点:既定,唯一,未知。总体平均数总体平均数总体方差与标准差总体方差与标准差符号规定:符号规定:N-N-总体单位数总体单位数 n-n-样本单位数样本单位数 X-X-总体平均数总体平均数 P-P-总体成数总体成数 x x-样本平均数样本平均数 p-样本成本成数 -总体标准差总体标准差 S-S-样本标准差样本标准差n-样本单位数,也叫样本容量。样本单位数,也叫样本容量。n30时,为大样本,时,为大样本,n30时为小样本时为小样本三、抽样调查与推断的常用指标1、总体指标(总体参数)用以描9 9总体成数总体成数总体单位属性有时为品质标志,品质标志有时为总体单位属性有时为品质标志,品质标志有时为是非标志是非标志是非标志是非标志-标志表现只有两种情况,如,性别:男,女;产品质量:合格,不标志表现只有两种情况,如,性别:男,女;产品质量:合格,不合格。合格。变量值变量值X X频数频数f f成数成数成数成数(频率)(频率)一种属性一种属性1 1N N1 1P=NP=N1 1/N/N另一种属性另一种属性0 0N N2 21-P=N1-P=N2 2/N/N N N1 1是非标志的平均数、方差和标准差是非标志的平均数、方差和标准差N N1 1/N=P/N=PP(1-P)总体成数总体单位属性有时为品质标志,品质标志有时为是非标志-10101 1、样本指标(样本统计量)、样本指标(样本统计量)用以描述与刻画样本数量特征。样本既定时:唯一,可知。用以描述与刻画样本数量特征。样本既定时:唯一,可知。样本平均数样本平均数样本方差与标准差样本方差与标准差样本成数样本成数(平均数平均数)1、样本指标(样本统计量)用以描述与刻画样本数量特征。样本1111四、数据的分布特征及其度量 峰峰度度均值反均值反映集中映集中趋势趋势偏偏斜斜度度所有数据所有数据对均值的对均值的偏离或离偏离或离散度散度四、数据的分布特征及其度量1212集中趋势的度量:集中趋势的度量:众数众数、中位数和四分位数、中位数和四分位数、平均数平均数平均数平均数离散程度的度量:离散程度的度量:极差极差、平均差、平均差、方差和标准差方差和标准差方差和标准差方差和标准差、离散系数、离散系数峰度的度量:峰度的度量:峰度系数峰度系数偏度的度量:偏度的度量:偏度系数偏度系数集中趋势的度量:众数、中位数和四分位数、平均数离散程度的度1313第二节抽样方法与抽样调查组织方式一、一、抽取样本的方法抽取样本的方法uu重复抽样重复抽样亦称回置抽样亦称回置抽样每抽出一个单位在登记后仍放回去每抽出一个单位在登记后仍放回去同一个单位有多次被重复抽中的可能同一个单位有多次被重复抽中的可能uu不重复抽样不重复抽样亦称不回置抽样亦称不回置抽样已经被抽出的单位不再放回已经被抽出的单位不再放回每个单位只有被抽中一次的可能每个单位只有被抽中一次的可能第二节抽样方法与抽样调查组织方式一、抽取样本的方法1414二、抽样调查组织方式简单随机抽样简单随机抽样简单随机抽样简单随机抽样:对总体不做任何处理对总体不做任何处理,直接随机抽取样本。具体包括抽签法,直接随机抽取样本。具体包括抽签法,随机数表法。适用性:总体单位之间差异较小,且总体单位数目较少的情况。随机数表法。适用性:总体单位之间差异较小,且总体单位数目较少的情况。类型抽样:类型抽样:类型抽样:类型抽样:又称分层抽样又称分层抽样,将总体单位按某种属性特征分类或分层,再从各将总体单位按某种属性特征分类或分层,再从各类或各层抽样。适用性:总体单位之间差异较大,且总体单位数目较多的情类或各层抽样。适用性:总体单位之间差异较大,且总体单位数目较多的情况。况。等距抽样:等距抽样:等距抽样:等距抽样:又称机械抽样或系统抽样,将总体各单位按一定标志或顺序排列,又称机械抽样或系统抽样,将总体各单位按一定标志或顺序排列,实施等距或等间隔(实施等距或等间隔(k=N/nk=N/n)抽样。)抽样。整群抽样:整群抽样:整群抽样:整群抽样:又称集团抽样,将总体按某一标志划分成若干群,随机抽取若干又称集团抽样,将总体按某一标志划分成若干群,随机抽取若干群,对抽中的群内的所有单位逐一调查。群,对抽中的群内的所有单位逐一调查。二、抽样调查组织方式简单随机抽样:对总体不做任何处理,直1515第三节、简单随机抽样及抽样估计第三节、简单随机抽样及抽样估计一、抽样误差测算一、抽样误差测算二、抽样区间估计二、抽样区间估计三、抽样数目确定三、抽样数目确定第三节、简单随机抽样及抽样估计一、抽样误差测算二、抽样区间估16161 1、统计调查误差、统计调查误差、统计调查误差、统计调查误差登记性误差:登记性误差:登记性误差:登记性误差:所有统计调查活动都可能会产生登记性误差。所有统计调查活动都可能会产生登记性误差。全面调查和非全面调查皆如此。表现为样本的统计数据与真值全面调查和非全面调查皆如此。表现为样本的统计数据与真值有偏误。通过加强监管和组织工作,可以减少乃至消除此误差。有偏误。通过加强监管和组织工作,可以减少乃至消除此误差。代表性误差:代表性误差:代表性误差:代表性误差:代表性误差只存在于非全面调查,表现为样本结代表性误差只存在于非全面调查,表现为样本结构与总体结构不一致。抽样调查中的代表性误差不可避免,但可构与总体结构不一致。抽样调查中的代表性误差不可避免,但可以计算和控制。以计算和控制。一、抽样误差一、抽样误差1、统计调查误差登记性误差:所有统计调查活动都可能会产生登记17172 2、抽样平均误差、抽样平均误差、抽样平均误差、抽样平均误差抽样平均误差是样本平均数或样本成数的标准差抽样平均误差是样本平均数或样本成数的标准差3 3名同学成绩为名同学成绩为8888,8282,9696平均平均88.6666788.66667分,不重复抽样分,不重复抽样,n=2,n=2可能的样本为:可能的样本为:可能的样本为:可能的样本为:8888,8282;88 88,9696;82 82,9696平均数:平均数:平均数:平均数:85 92 89 85 92 8988.66667抽样误差就是用来反映样本平均数与总体平均数的离差的抽样误差就是用来反映样本平均数与总体平均数的离差的2、抽样平均误差抽样平均误差是样本平均数或样本成数的标准差31818样本平均数的抽样平均误差样本平均数的抽样平均误差样本成数的抽样平均误差样本成数的抽样平均误差 当样本单位数既定时当样本单位数既定时,从一个总体可抽取多个样本,抽样指标(如平均数、从一个总体可抽取多个样本,抽样指标(如平均数、抽样成数等),就有多个不同的数值,它们对总体指标(如总体平均数、总体成抽样成数等),就有多个不同的数值,它们对总体指标(如总体平均数、总体成数等)的离差也就有大有小,这就必需用一个指标来衡量抽样误差的一般水平。数等)的离差也就有大有小,这就必需用一个指标来衡量抽样误差的一般水平。抽样平均误差是抽样平均数(或抽样成数)的标准差,它反映抽样平均数抽样平均误差是抽样平均数(或抽样成数)的标准差,它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。(或抽样成数)与总体平均数(或总体成数)的平均差异程度。样本平均数的抽样平均误差样本成数的抽样平均误差当样本1919根据概率论与数理统计学的有关知识,抽样平均误差公式根据概率论与数理统计学的有关知识,抽样平均误差公式重复抽样:重复抽样:不重复抽样:不重复抽样:上例只有上例只有3 3名同学作为总体,不重复抽样且每次样本容量为名同学作为总体,不重复抽样且每次样本容量为2 2,所有可能的抽样可以试验。但当总体单位较多时候,各种可能所有可能的抽样可以试验。但当总体单位较多时候,各种可能的抽样是不可以一一试验的。这就需要而且只能根据一个样本的抽样是不可以一一试验的。这就需要而且只能根据一个样本进行计算。进行计算。根据概率论与数理统计学的有关知识,抽样平均误差公式重复抽样:2020考虑问题:哪些因素影响抽样平均误差?它们如何影响抽样平均误差?1、总体标准差2、样本单位数n3、抽样方法4、抽样的组织方式考虑问题:哪些因素影响抽样平均误差?2121解:已知解:已知N=30N=30,n=4n=4,2 2=4=4例题:某工人某天生产电子元件例题:某工人某天生产电子元件3030件,已知其方差为件,已知其方差为4 4,现,现从中抽取从中抽取4 4件产品进行质量检查。试计算本次抽样平均误差件产品进行质量检查。试计算本次抽样平均误差在重复抽样下:在重复抽样下:厘米厘米在不重复抽样下:在不重复抽样下:厘米厘米解:已知N=30,n=4,2=4例题:某工人某天生产电子2222例题:有例题:有5 5个工人的日产量分别为(单位:件):个工人的日产量分别为(单位:件):6 6,8 8,1010,1212,1414,用重复抽样的方法,从中随机抽取,用重复抽样的方法,从中随机抽取2 2个工人的日产量,个工人的日产量,用以代表这用以代表这5 5个工人的总体水平。计算抽样平均误差个工人的总体水平。计算抽样平均误差 解:总体平均数件抽样平均误差件?总体标准差件例题:有5个工人的日产量分别为(单位:件):6,8,10,12323在抽样平均误差公式中有总体方差在抽样平均误差公式中有总体方差 2 2、P P(1-P1-P)或标准差或标准差,P P(1-P1-P)的平方根,)的平方根,但是在大部分情况下,但是在大部分情况下,总总体方差体方差或或标标准差是准差是未知的。如何未知的。如何处处理?理?用以前或同类现象的标准差代替用以前或同类现象的标准差代替当有多个标准差可供选择时,选其最大者当有多个标准差可供选择时,选其最大者当为成数时,选其最接近当为成数时,选其最接近0.50.5的那一个的那一个P P,因为,因为P=0.5P=0.5时,时,p p最大最大当当为为成数成数时时,没可供,没可供选择选择的成数,直接取的成数,直接取p=0.5p=0.5用样本标准差代替用样本标准差代替在大样本下,直接用在大样本下,直接用S S代替代替 在小在小样样本下,用本下,用S S代替代替,S S=在抽样平均误差公式中有总体方差2、P(1-P)或标准差,24241 1、甲乙两地区各抽选、甲乙两地区各抽选400400家企业进行调查,结果表明,甲地区平均家企业进行调查,结果表明,甲地区平均每个企业盈利每个企业盈利300300万元,乙地区平均每个企业盈利万元,乙地区平均每个企业盈利8080万元,甲乙两万元,甲乙两地区标准差系数分别为地区标准差系数分别为30%30%和和20%20%,请计算两地区的抽样平均误差,请计算两地区的抽样平均误差练习题2 2、某企业生产的产品,按正常生产经验,合格率为、某企业生产的产品,按正常生产经验,合格率为90%90%,现从,现从50005000件产品中抽取件产品中抽取5050件进行检验,求合格率的抽样平均误差件进行检验,求合格率的抽样平均误差 3、要估计某县10万家庭的电视机拥有率,随机抽取100户家庭,发现有85户拥有电视机,求电视机拥有率的平均抽样误差。1、甲乙两地区各抽选400家企业进行调查,结果表明,甲地区平25252、解:在重复抽样条件下,合格率的抽样平均误差为:在不重复抽样条件下,合格率的抽样平均误差为:2、解:在重复抽样条件下,合格率的抽样平均误差为:26263、根据已知条件可得:p=85/100=0.852=p(1-p)=0.850.15=0.1275在重置抽样下:=0.0357不重置抽样下:=0.0357计算结果表明,用样本的拥有率来估计总体的拥有率,其抽样误差平均说来为3.6%左右。3、根据已知条件可得:27273 3、抽样极限误差、抽样极限误差抽样极限误差也叫允许误差,是指样本指标与总体指标之间抽样误抽样极限误差也叫允许误差,是指样本指标与总体指标之间抽样误差的可能范围。或者说,在一定的差的可能范围。或者说,在一定的置信度置信度置信度置信度下,抽样估计可以允许的下,抽样估计可以允许的误差范围。误差范围。抽样平均数的极限误差抽样平均数的极限误差抽样成数的极限误差抽样成数的极限误差置信度置信度,又称置信水平或把握度,是表明抽样指标和总体指标的误差不超过一定范围的概率保证度,一般表示为1-,是显著显著性水平性水平样本指标与总体指标之间的差异绝对值不超过极限误差样本统计量与总体参数之间的差异绝对值不超过极限误差3、抽样极限误差抽样极限误差也叫允许误差,是指样本指标与总体2828这样看来,置信度越大,极限误差就越大,反之,置信度越这样看来,置信度越大,极限误差就越大,反之,置信度越小,极限误差就越小。小,极限误差就越小。根据平均数抽样分布理论,在给定置信度根据平均数抽样分布理论,在给定置信度1-1-时时,大大大大样样本条件本条件本条件本条件下的下的极限极限误误差可以表示差可以表示为为:抽样平均数的极限误差抽样平均数的极限误差抽样成数的极限误差抽样成数的极限误差Z Z/2/2是什么?是什么?是什么?是什么?在给定显著性水平,或者给定置信水平1-时候,标准正态分布的临界值为Z/2,可查Z分布表取得广泛应用的是:1-=90%,Z=1.651-=95%,Z=1.961-=95.45%,Z=21-=99%,Z=2.581-=99.73%,Z=3这样看来,置信度越大,极限误差就越大,反之,置信度越小,极限2929统计学原理-抽样调查课件3030对刚下线的对刚下线的10001000个酒瓶重量进行检查。重复抽取个酒瓶重量进行检查。重复抽取100100个酒个酒瓶,样本平均重量为瓶,样本平均重量为100100克,样本标准差为克,样本标准差为5 5克,试以克,试以95%95%的把握度估计本次抽查的抽样极限误差的把握度估计本次抽查的抽样极限误差解解解解:依照题意,已知:依照题意,已知:N=1000N=1000,n=100n=100,S=5S=5,1-1-=95%=95%ZZ/2/2=1.96=1.96抽样平均数的极限误差抽样平均数的极限误差重复抽样的平均误差重复抽样的平均误差本次抽样极限误差意思是说,我们有95%的把握保证样本的平均重量与总体的平均重量的误差不超过0.98克对刚下线的1000个酒瓶重量进行检查。重复抽取100个酒瓶,31312 2、某电扇厂对、某电扇厂对15001500台电扇使用寿命进行抽样调查,抽取台电扇使用寿命进行抽样调查,抽取3030台,台,平均寿命为平均寿命为4545万小时,使用寿命的标准差为万小时,使用寿命的标准差为240240小时,试以小时,试以95%95%的置信水平计算本次抽查的极限误差的置信水平计算本次抽查的极限误差1 1、对某地区电视机拥有率进行抽样调查,抽取、对某地区电视机拥有率进行抽样调查,抽取100100户,调查显示户,调查显示9090户拥有电视机,试以户拥有电视机,试以95%95%的把握程度计算本次调查的极限误差的把握程度计算本次调查的极限误差2、某电扇厂对1500台电扇使用寿命进行抽样调查,抽取30台3232二、抽样区间估计:二、抽样区间估计:利用样本信息对总体数量特征进行推断利用样本信息对总体数量特征进行推断区间估计:在一定的置信度下,根据样本统计量推断总体参区间估计:在一定的置信度下,根据样本统计量推断总体参数与总体总量的可能范围或置信区间。数与总体总量的可能范围或置信区间。1 1、总体均值的区间估计:由样本平均数估计总体均值的可能范围总体均值的区间估计:由样本平均数估计总体均值的可能范围由由抽样极限误差抽样极限误差的定义:在的定义:在1-1-下,下,总体均值的置信区间:总体均值的置信区间:亦即,在大样本下,给定置信度1-时,总体均值的总体均值的区间估计区间估计抽样平抽样平均误差均误差二、抽样区间估计:利用样本信息对总体数量特征进行推断3333总体均值的区间估计的含义总体均值的区间估计的含义:-由样本平均数估计总体均值的可能范围由样本平均数估计总体均值的可能范围在大样本下,给定置信度1-时,总体均值的置信区间为:含义:我们有1-(95%)的把握能保证总体均值落在上述区间之内例题例题例题例题:对刚下线的对刚下线的10001000个酒瓶重量进行检查。重复抽取个酒瓶重量进行检查。重复抽取100100个酒个酒瓶,样本平均重量为瓶,样本平均重量为100100克,样本标准差为克,样本标准差为5 5克,试以克,试以95%95%的置的置信度估计这批酒瓶重量的置信区间,并说明其含义是什么?信度估计这批酒瓶重量的置信区间,并说明其含义是什么?解解解解:已知:已知:N=1000N=1000,n=100n=100,S=5S=5,1-1-=95%=95%,ZZ/2/2=1.96=1.96重复抽样的平均误差重复抽样的平均误差总体均值的置信区间:(100-1.960.5,100+1.960.5)(99.02,100.98)总体均值的区间估计的含义:-由样本平均数估34342 2、总体成数的区间估计:由样本成数估计总体成数的可能范围总体成数的区间估计:由样本成数估计总体成数的可能范围由成数的由成数的抽样极限误差抽样极限误差的定义:在的定义:在1-1-下,下,总体成数的置信区间:总体成数的置信区间:亦即,在大样本下即,例、对某地区电视机拥有率进行调查,抽取例、对某地区电视机拥有率进行调查,抽取100100户,调查显示户,调查显示9090户拥有电视机,户拥有电视机,试以试以95%95%的把握程度估计本地区电视机拥有率的把握程度估计本地区电视机拥有率解解:n=100,n1=90,即 p=90/100=0.9,1-=95%,即 z/2=1.96(重复)抽样平均误差(成数)抽样极限误差在把握度为95%下的置信区间:(90%-5.88%,90+5.88%)即(84.12%,95.88%)我们以95%把握度保证本地区电视机拥有率介于84.12%95.88%之间 2、总体成数的区间估计:由样本成数估计总体成数的可能范围由成35353 3、总体总量的区间估计:由样本总量估计总体总量的可能范围总体总量的区间估计:由样本总量估计总体总量的可能范围总体标志总量的区间估计:由均值的区间估计推断总体标志总量的可能范围总体标志总量的区间估计:由均值的区间估计推断总体标志总量的可能范围总体标志总量的区间估计:由均值的区间估计推断总体标志总量的可能范围总体标志总量的区间估计:由均值的区间估计推断总体标志总量的可能范围1000(99.02,100.98)=(99020,100980)前例题:酒瓶总重量:即,在95%的置信度下,这批酒瓶的总重量介于99020100980克之间总体成数总量的区间估计:由成数区间估计推断总体成数总量的可能范围总体成数总量的区间估计:由成数区间估计推断总体成数总量的可能范围前例题假定该地区有居民家庭10000户拥有电视机的总户数:10000(84.12%,95.88%)=(8412,9588)户在95%置信度下,该地区拥有电视机的家庭总数介于84129588户之间3、总体总量的区间估计:由样本总量估计总体总量的可能范围总体3636练习题对一批产品的质量进行调查,随机抽取对一批产品的质量进行调查,随机抽取100100个产品,调查发现有个产品,调查发现有6 6个产品不合格,若以个产品不合格,若以95%95%的置信水平,可否能推断这批产品的不的置信水平,可否能推断这批产品的不合格率不会超过合格率不会超过10%10%?计算其置信区间。?计算其置信区间。练习题对一批产品的质量进行调查,随机抽取100个产品,调查发3737某市对职工年收入水平进行抽样调查,抽样资料及调查结某市对职工年收入水平进行抽样调查,抽样资料及调查结果见下表:果见下表:组别组别抽样人数抽样人数(人)(人)样本人均年收入样本人均年收入(元)(元)样本标准差样本标准差(元)(元)第一产业职工第一产业职工第二产业职工第二产业职工第三产业职工第三产业职工100100200200500500200002000034000340005800058000310031005200520090009000以95的概率保证推断该市职工人均年收入的置信区间(采用重复抽样)。思考题某市对职工年收入水平进行抽样调查,抽样资料及调查结果见3838三、抽样数目确定三、抽样数目确定在重复抽样条件下:在重复抽样条件下:平均数估计的必要样本单位数的确定平均数估计的必要样本单位数的确定 在不重复抽样条件下:由由三、抽样数目确定在重复抽样条件下:平均数估计的必要样本单位3939某厂对某厂对1000010000个电子元件的耐用时间进行检查,根据以往资料可知该个电子元件的耐用时间进行检查,根据以往资料可知该型号电子元件耐用时间的标准差为型号电子元件耐用时间的标准差为800800小时,要求置信概率为小时,要求置信概率为95.45%,95.45%,抽样误差范围不超过抽样误差范围不超过200200小时,问:需要抽取多少个电子元件检查?小时,问:需要抽取多少个电子元件检查?已知:已知:N=10000N=10000个个1-1-=95.45%Z=95.45%Z/2/2=2=2若采取若采取重复抽样:重复抽样:重复抽样:重复抽样:若采取若采取不重复抽样:不重复抽样:不重复抽样:不重复抽样:某厂对10000个电子元件的耐用时间进行检查,根据以往资料可4040n 成数估计的必要样本单位数的确定成数估计的必要样本单位数的确定 在在重复重复重复重复抽样条件抽样条件抽样条件抽样条件在不重复不重复抽样条件抽样条件下由由成数估计的必要样本单位数的确定在重复抽样条件4141上例中,若对上例中,若对1000010000个电子元件的合格率进行检查,根据以往调个电子元件的合格率进行检查,根据以往调查资料得知产品合格率为查资料得知产品合格率为96%96%,要求在,要求在95.45%95.45%的概率保证程度下,的概率保证程度下,抽样误差范围不超过抽样误差范围不超过4%4%,试确定需要抽取的电子元件数量?,试确定需要抽取的电子元件数量?已知:已知:N=10000N=10000个个P=96%P=96%p=4%p=4%1-1-=95.45%Z=95.45%Z/2/2=2=2若采取不重复抽样不重复抽样若采取重复抽样重复抽样上例中,若对10000个电子元件的合格率进行检查,根据以往调4242现对某地区电视机拥有率进行调查。以往曾经做过三次调查,抽现对某地区电视机拥有率进行调查。以往曾经做过三次调查,抽取家庭均为取家庭均为500500户,拥有电视机的家庭分别为户,拥有电视机的家庭分别为400400、436436、450450户,户,若置信度为若置信度为95%95%,误差范围不超过,误差范围不超过3%3%,本次调查至少应该抽取多,本次调查至少应该抽取多少个家庭户?少个家庭户?现对某地区电视机拥有率进行调查。以往曾经做过三次调查,抽取家4343第四节其他抽样组织方式类型抽样等距抽样整群抽样第四节其他抽样组织方式类型抽样等距抽样整群抽样4444一、类型抽样一、类型抽样(分层抽样分层抽样)亦称分层抽样亦称分层抽样先将总体各单位分成若干类型或层先将总体各单位分成若干类型或层从各类型中抽取样本单位从各类型中抽取样本单位再由各类型的样本单位组成一个样本再由各类型的样本单位组成一个样本一、类型抽样(分层抽样)亦称分层抽样4545类型抽样的样本抽取类型抽样的样本抽取总体单位数总体单位数N N,样本单位,样本单位n n,分成,分成k k组或层,每一组抽取多少组或层,每一组抽取多少样本单位样本单位n ni i?等额抽取样本:等额抽取样本:等比例抽取样本等比例抽取样本每一组抽取n/k个样本单位N=NN=N1 1+N+N2 2+N+N3 3+N+Nk kn=nn=n1 1+n+n2 2+n+n3 3+n+nk kn ni i=n=n(N(Ni i/N)/N)考虑:哪一种样本抽取方法更科学?为什么?考虑:哪一种样本抽取方法更科学?为什么?类型抽样的样本抽取总体单位数N,样本单位n,分成k组或4646 类型抽样的抽样平均误差类型抽样的抽样平均误差类型抽样用平均组内方差代替总方差计算抽样平均误差类型抽样用平均组内方差代替总方差计算抽样平均误差n类型抽样类型抽样:平均数的抽样平均误差平均数的抽样平均误差在在重复抽样重复抽样条件下:条件下:在不重复抽样条件下:为各组内方差为平均组内方差类型抽样的抽样平均误差类型抽样:平均数的抽样平均误差在重4747n类型抽样类型抽样:成数的抽样平均误差成数的抽样平均误差在在重复抽样重复抽样条件下:条件下:在不重复抽样条件下:为各组内方差为平均组内方差类型抽样:成数的抽样平均误差在重复抽样条件下:4848 类型抽样类型抽样:抽样极限误差的计算抽样极限误差的计算类型抽样用平均组内方差代替总方差计算抽样平均误差类型抽样用平均组内方差代替总方差计算抽样平均误差重复抽样的极限误差重复抽样的极限误差不重复抽样的极限误差不重复抽样的极限误差抽样极限误差抽样极限误差为平均组内方差对于平均数为平均组内方差对于成数类型抽样:抽样极限误差的计算重复抽样的极限误差不重复抽样4949 类型抽样类型抽样:抽样极限误差的区间估计抽样极限误差的区间估计类型抽样用平均组内方差代替总方差计算抽样平均误差类型抽样用平均组内方差代替总方差计算抽样平均误差总体均值的置信区间总体均值的置信区间在大样本下,给定置信度1-时,总体均值的置信区间为:总体成数的置信区间总体成数的置信区间在大样本下,给定置信度1-时,总体均值的置信区间为:类型抽样:抽样极限误差的区间估计总体均值的置信区间在大样5050某镇种植小麦某镇种植小麦5000050000亩,其中平原亩,其中平原4000040000亩,山区亩,山区1000010000亩亩,采用不重复抽样,按采用不重复抽样,按2%2%的比例共抽取的比例共抽取100100亩进行产量调查,亩进行产量调查,根据实割实测结果根据实割实测结果,计算的样本指标见下表计算的样本指标见下表,试计算抽样平试计算抽样平均误差,并以均误差,并以95%95%的置信度,推断全部小麦田亩平均产量的置信度,推断全部小麦田亩平均产量的置信区间的置信区间类型类型全部面积全部面积(亩)(亩)NNi i样本面积样本面积(亩)(亩)n ni i样本平均亩产样本平均亩产(千克)(千克)x xi i样本标准差样本标准差(千克)(千克)i i平原平原山区山区4000040000100001000080080020020036036025025080806060合计合计500005000010001000某镇种植小麦50000亩,其中平原40000亩,山区10005151类型类型全部面积全部面积(亩)(亩)NNi i样本面积样本面积(亩)(亩)n ni i样本平均亩产样本平均亩产(千克)(千克)x xi i样本标准差样本标准差(千克)(千克)i i平原平原山区山区4000040000100001000080080020020036036025025080806060合计合计500005000010001000平均组内方差:平均组内方差:抽样平均误差:抽样平均误差:抽样极限误差:抽样极限误差:抽样平均数:抽样平均数:产量置信区间:产量置信区间:以95%的把握推断全部小麦的亩产介于333.3342.7千克类型全部面积(亩)Ni样本面积(亩)ni样本平均亩产(千克5252考虑考虑:什么情况下进行类型抽样什么情况下进行类型抽样?如果对全国大学毕业生就业状况开展调查如果对全国大学毕业生就业状况开展调查,如何分类如何分类?思考考虑:什么情况下进行类型抽样?如果对全国大学毕业生5353某市对中老年患高血压病人数所占比重进行抽样推断,某市对中老年患高血压病人数所占比重进行抽样推断,采取不重复抽样按采取不重复抽样按4%4%的比例抽取样本单位,调查结果的比例抽取样本单位,调查结果及相关指标见下表。试在及相关指标见下表。试在95%95%把握程度下计算高血压病把握程度下计算高血压病人数所占比重的置信区间与总的患者数量。人数所占比重的置信区间与总的患者数量。组别组别总体单位数总体单位数(人)(人)N Ni i样本单位数样本单位数(人)(人)n ni i患高血压人数患高血压人数比重()比重()p pi i样本方差样本方差()()P Pi i(1(1p pi i)老年组老年组中年组中年组1500015000200002000060060080080015158812.7512.757.367.36合计合计350003500014001400某市对中老年患高血压病人数所占比重进行抽样推断,采取不重复抽5454二、等距抽样等距抽样的概念:亦叫机械抽样或系统抽样先将总体各单位按某一标志排队然后按等距离抽取样本单位二、等距抽样等距抽样的概念:5555等距抽样的操作程序:等距抽样的操作程序:第一步第一步:编制抽样框:编制抽样框将总体按有关标志(将总体按有关标志(x x)从低到高顺序排队)从低到高顺序排队 列出辅助(无关)标志(列出辅助(无关)标志(f f)将辅助标志依次累计将辅助标志依次累计列出抽中单位列出抽中单位与研究内容有直接关系的标志,如调查今年的产量,可把照往年产量作为有关有关标志标志进行排队与所研究的内容无直接关系的标志,如居民生计调查,可把人口数作为辅助辅助标志标志进行排队等距抽样的操作程序:与研究内容有直接关系的标志,如调查今年的5656某村民小组有某村民小组有3030户农户,若调查该村民小组户农户,若调查该村民小组所有农户所有农户20052005年人均收入水平,如何实施年人均收入水平,如何实施等距抽样?等距抽样?例题某村民小组有30户农户,若调查该村民小组所有农户20055757序号序号1 1 1 12 2 2 23 3 3 34 4 4 45 5 5 56 6 6 67 7 7 78 8 8 89 9 9 910101010111111111212121213131313141414141515151520042004年人均收入年人均收入(十元)(十元)x x185185185185187187187187190190190190198198198198201201201201218218218218256256256256260260260260274274274274290290290290295295295295325325325325340340340340366366366366368368368368人口数(人)人口数(人)f f4 4 4 42 2 2 25 5 5 53 3 3 34 4 4 43 3 3 33 3 3 34 4 4 45 5 5 54 4 4 42 2 2 21 1 1 15 5 5 54 4 4 43 3 3 3人口数累计人口数累计4 4 4 46 6 6 611111111141414141818181821212121242424242828282833333333373737373939393940404040454545454949494952525252抽中户抽中户序号序号16161616171717171818181819191919202020202121212122222222232323232424242425252525262626262727272728282828292929293030303020042004年人均收入年人均收入(十元)(十元)x x370370370370371371371371388388388388402402402402410410410410446446446446453453453453470470470470477477477477490490490490499499499499502502502502503503503503516516516516520520520520人口数(人)人口数(人)f f4 4 4 42 2 2 23 3 3 33 3 3 34 4 4 44 4 4 42 2 2 24 4 4 43 3 3 34 4 4 45 5 5 54 4 4 43 3 3 33 3 3 35 5 5 5人口数累计人口数累计56565656585858586161616164646464686868687272727274747474787878788181818185858585909090909494949497979797100100100100105105105105抽中户抽中户抽样框序号1234567891011121314152004年人均5858第二步:计算抽样距离(K)如果抽取6户进行调查,则:抽样距离K=105617.5第二步:计算抽样距离(K)如果抽取6户进行调查,则:5959第三步:抽取调查单位半距起点、等距抽样随机起点、对称等距抽样第三步:抽取调查单位半距起点、等距抽样6060u半距起点、等距抽样以第一个抽样距离的以第一个抽样距离的一半处一半处作为第一个调查单位作为第一个调查单位以后毎以后毎隔一个抽样距离隔一个抽样距离抽取一个调查单位抽取一个调查单位直到最后一个调查单位抽出为止直到最后一个调查单位抽出为止半距起点、等距抽样以第一个抽样距离的一半处作为第一个调查单6161以抽取以抽取6 6户为例,户为例,抽取的样本户:抽取的样本户:第第1 1户户 n n1 1=17.52=17.528.75 8.75 为第为第3 3号户号户第第2 2户户 n n2 2=8.75+17.5=26.25 =8.75+17.5=26.25 为第为第8 8号户号户第第3 3户户 n n3 3=26.25+17.5=43.75 =26.25+17.5=43.75 为第为第1313号户号户以此类推,直至抽完样本单位以此类推,直至抽完样本单位序号序号1 1 1 12 2 2 23 3 3 34 4 4 45 5 5 56 6 6 67 7 7 78 8 8 89 9 9 910101010111111111212121213131313141414141515151520042004年人均收入年人均收入(十元)(十元)x x185185185185187187187187190190190190198198198198201201201201218218218218256256256256260260260260274274274274290290290290295295295295325325325325340340340340366366366366368368368368人口数(人)人口数(人)f f4 4 4 42 2 2 25 5 5 53 3 3 34 4 4 43 3 3 33 3 3 34 4 4 45 5 5 54 4 4 42 2 2 21 1 1 15 5 5 54 4 4 43 3 3 3人口数累计人口数累计4 4 4 46 6 6 611111111141414141818181821212121242424242828282833333333373737373939393940404040454545454949494952525252抽中户抽中户3 3 3 38 8 8 813131313序号序号16161616171717171818181819191919202020202121212122222222232323232424242425252525262626262727272728282828292929293030303020042004年人均收入年人均收入(十元)(十元)x x370370370370371371371371388388388388402402402402410410410410446446446446453453453453470470470470477477477477490490490490499499499499502502502502503503503503516516516516520520520520人口数(人)人口数(人)f f4 4 4 42 2 2 23 3 3 33 3 3 34 4 4 44 4 4 42 2 2 24 4 4 43 3 3 34 4 4 45 5 5 54 4 4 43 3 3 33 3 3 35 5 5 5人口数累计人口数累计56565656585858586161616164646464686868687272727274747474787878788181818185858585909090909494949497979797100100100100105105105105抽中户抽中户以抽取6户为例,抽取的样本户:第1户n1=17.526262u 随机起点、对称等距抽样随机起点、对称等距抽样第一个单位在第一个抽样距离范围内第一个单位在第一个抽样距离范围内随机确定随机确定为为r r以后各样本单位按以后各样本单位按对称等距抽取对称等距抽取 上例:若抽取上例:若抽取6 6户,第一户随机确定为户,第一户随机确定为5 5,则各户依次为:,则各户依次为:第第1 1户户 n n1 1:r=5 :r=5 为第为第2 2号户号户 第第2 2户户 n n2 2:2K:2Kr=217.5r=217.55 530 30 为第为第9 9号户号户 第第3 3户户 n n3 3:2K+r=217.5+5:2K+r=217.5+540 40 为第为第1212号户号户 第第4 4户户 n n4 4:4K:4Kr r 417.5417.55 565 65 为第为第2020号户号户 第第5 5户户 n n5 5:4K+r:4K+r417.5+5417.5+575 75 为第为第2323号户号户 第第6 6户户 n n6 6:6K:6Kr r 617.5617.55 5100 100 为第为第2929号户号户从第二个单位起依次用从第二个单位起依次用2 2、4 4、6 6、倍的倍的K K值减、加值减、加r r值确定。值确定。l当n为偶数时随机起点、对称等距抽样第一个单位在第一个抽样距离范围内随机6363序号序号1 1 1 12 2 2 23 3 3 34 4 4 45 5 5 56 6 6 67 7 7 78 8 8 89 9 9 910101010111111111212121213131313141414141515151520042004年人均收入年人均收入(十元)(十元)x x185185185185187187187187190190190190198198198198201201201201218218218218256256256256262626260 0 0 0274274274274290290290290295295295295325325325325340340340340366366366366368368368368人口数(人)人口数(人)f f4 4 4 42 2 2 25 5 5 53 3 3 34 4 4 43 3 3 33 3 3 34 4 4 45 5 5 54 4 4 42 2 2 21 1 1 15 5 5 54 4 4 43 3 3 3人口数累计人口数累计4 4 4 46 6 6 611111111141414141818181821212121242424242828282833333333373737373939393940404040454545454949494952525252抽中户抽中户2 2 2 29 9 9 912121212序号序号16161616171717171818181819191919202020202121212122222222232323232424242425252525262626262727272728282828292929293030303020042004年人均收入年人均收入(十元)(十元)x x370370370370371371371371388388388388402402402402410410410410446446446446453453453453474747470 0 0 0477477477477490490490490499499499499502502502502503503503503516516516516520520520520人口数(人)人口数(人)f f4 4 4 42 2 2 23 3 3 33 3 3 34 4 4 44 4 4 42 2 2 24 4 4 43 3 3 34 4 4 45 5 5 54 4 4 43 3 3 33 3 3 35 5 5 5人口数累计人口数累计56565656585858586161616164646464686868687272727274747474787878788181818185858585909090909494949497979797100100100100105105105105抽中户抽中户20202020 23232323 29292929 第第1 1户户 n n1 1:r=5 :r=5 为第为第2 2号户号户 第第2 2户户 n n2 2:2K:2Kr=217.5r=217.55 530 30 为第为第9 9号户号户 第第3 3户户 n n3 3:2K+r=217.5+5:2K+r=217.5+540 40 为第为第1212号户号户 第第4 4户户 n n4 4:4K:4Kr r 417.5417.55 565 65 为第为第2020号户号户 第第5 5户户 n n5 5:4K+r:4K+r417.5+5417.5+575 75 为第为第2323号户号户 第第6 6户户 n n6 6:6K:6Kr r 617.5617.55 5100 100 为第为第2929号户号户序号1234567891011121314152004年人均6464抽中户的位置可用图形表示如下:1k2k3k4k5k6kn1n2n3n4n5n6抽中户的位置可用图形表示如下:1k2k3k4k5k6kn1n6565采取采取先抽中间、再抽两边先抽中间、再抽两边的办法的办法。若中间单位数为奇数,则各单位依次用中间单位数为起点的奇数倍K值加、减r值确定。若中间单位数为偶数,则各单位依次用中间单位数加1为起点的奇数倍K值减、加r值确定。中间单位之后计算方法与抽取单位数为偶数时的方法相同中间单位之前中间单位按f/2计算l当当n为奇数时为奇数时采取先抽中间、再抽两边的办法。若中间单位数为奇数,则各6666上例中,若抽取上例中,若抽取5 5户(中间单位数是户(中间单位数是3 3,即为,即为奇数奇数)抽样距离抽样距离KK105510552121第一个单位第一个单位n n1 1 随机确定为随机确定为1515中间单位中间单位n n3 3f/2f/21052105252.552.5中间单位中间单位以前以前还有一个单位,即还有一个单位,即n n2 2n n2 2=2K=2Kr r22122115152727中间单位中间单位以后以后有两个单位,即有两个单位,即n n4 4和和n n5 5n n4 4=3K+r=321=3K+r=32115157878n n5 5=5K=5Kr r52152115159090则抽取的则抽取的5 5户依次为第户依次为第5 5、8 8、1616、2323、2626号的农户号的农户上例中,若抽取5户(中间单位数是3,即为奇数)抽6767上例中,若上例中,若n=7n=7户(中间单位数是户(中间单位数是4 4,即为,即为偶数偶数)抽样距离抽样距离KK105710571515第一个单位第一个单位n n1 1随机确定为随机确定为4 4中间单位中间单位n n4 4 f/2f/21052105252.552.5中间单位中间单位以前以前还有还有n n2 2和和n n3 3两个单位两个单位n n2 22K2Kr r2152154 42626n n3 32K+r2K+r2152154 43434中间单位中间单位以后以后有三个单位,即有三个单位,即n n5 5(4+14+1)K Kr r5155154 47171n n6 65K+r5K+r515+4515+47979n n7 77K7Kr r7157154 4101101则抽取的则抽取的7 7户依次为第户依次为第1 1、8 8、1010、1616、2121、2424、3030号的农户号的农户上例中,若n=7户(中间单位数是4,即为偶数)6868序号序号1 1 1 12 2 2 23 3 3 34 4 4 45 5 5 56 6 6 67 7 7 78 8 8 89 9 9 910101010111111111212121213131313141414141515151520042004年人均收入年人均收入(十元)(十元)x x18518518518518718718718719019019019019819819819820120120120121821821821825625625625626026026026027427427427429029029
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!