第6章抽样推断课件

上传人:沈*** 文档编号:241646823 上传时间:2024-07-12 格式:PPTX 页数:139 大小:1.57MB
返回 下载 相关 举报
第6章抽样推断课件_第1页
第1页 / 共139页
第6章抽样推断课件_第2页
第2页 / 共139页
第6章抽样推断课件_第3页
第3页 / 共139页
点击查看更多>>
资源描述
第六章第六章 抽样推断抽样推断 第六章第六章 抽样推断抽样推断1抽样推断有关概念与理论依据2抽样误差3抽样估计和推算4抽样推断的组织形式第一节第一节 抽样推断有关概念与理论依据抽样推断有关概念与理论依据 一、抽样推断的意义、内容一、抽样推断的意义、内容(一)概念(一)概念 按照随机原则从总体中抽取一部分单位进行按照随机原则从总体中抽取一部分单位进行观察,并根据被抽取的那部分单位的结果,对总观察,并根据被抽取的那部分单位的结果,对总体作出具有一定可靠程度的推断体作出具有一定可靠程度的推断 。统计推断的过程统计推断的过程总体总体总体总体总体均值、总体均值、总体均值、总体均值、比例、方差比例、方差比例、方差比例、方差样样样样本本本本样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方差差差差差差(二)特点(二)特点 1 1、按照随机原则抽取部分单位、按照随机原则抽取部分单位,抽样推断运抽样推断运抽样推断运抽样推断运 用概率估计的方法用概率估计的方法用概率估计的方法用概率估计的方法。2 2、部分单位、部分单位 总体。总体。3 3、抽样误差可以计算和控制。、抽样误差可以计算和控制。(三三)抽样推断的内容抽样推断的内容w参数估计参数估计 依据所获得的样本观察资料,对依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量所研究现象总体的水平、结构、规模等数量特征进行估计。特征进行估计。w假设检验假设检验 利用样本的实际资料来检验事先利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的对总体某些数量特征所作的假设是否可信的一种统计分析方法。一种统计分析方法。二、抽样推断的作用二、抽样推断的作用 抽抽样调查方法是市场经济国家在调查方法样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。成本低、速度快、应用面广等优点。建立起建立起以周期性普查为基础、经常性抽样以周期性普查为基础、经常性抽样调查为主体,必要的统计报表、重点调查、综调查为主体,必要的统计报表、重点调查、综合分析等为补充的国家统计调查方法体系,是合分析等为补充的国家统计调查方法体系,是我国统计方法制度改革的指导思想。我国统计方法制度改革的指导思想。1.1.实实际工作不可能进行全面调查观察,而又需要了解际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;其全面资料的事物;2.2.虽虽可进行全面调查观察,但比较困难或并不必要;可进行全面调查观察,但比较困难或并不必要;3.3.对对普查或全面调查统计资料的质量进行检查和修正;普查或全面调查统计资料的质量进行检查和修正;4.4.抽抽样方法适用于对大量现象的观察,即组成事物样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的假设用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。进行检验,判断这种假设的真伪,以决定取舍。三、抽样推断的基本概念三、抽样推断的基本概念(一一)全及总体和抽样总体全及总体和抽样总体(总体和样本总体和样本)全全及总体:所要调查观察的全部事物。及总体:所要调查观察的全部事物。总体单位数用总体单位数用N N表示。表示。抽抽样总体:抽取出来调查观察的单位。样总体:抽取出来调查观察的单位。抽样总体的单位数用抽样总体的单位数用n n表示。表示。n 30 n 30 大样本大样本 n 30 n 30时,时,t分布与标准正态分布分布与标准正态分布N(0,1)就非常接近就非常接近.但对较小的但对较小的n值,值,t分布与标准正态分布之间有较大分布与标准正态分布之间有较大差异差异.且且P|T|t0P|X|t0,其中,其中X N(0,1),即,即在在t分布的尾部比在标准正态分布的尾部有着更大的概分布的尾部比在标准正态分布的尾部有着更大的概率率.t 分布的数学期望与方差分布的数学期望与方差设设Tt(n),则,则E(T)=0,D(T)=设设(X1,X2,Xn)为来自正态总体为来自正态总体 XN(,2)的样本,则统计量的样本,则统计量证证由于由于与与S 2相互独立,且相互独立,且由定义由定义5.4得得 设设(X1,X2,Xn1)和和(Y1,Y2,Yn2)分别是来自正态总体分别是来自正态总体N(1,2)和和N(2,2)的样本,且它们相互独立,则统计量的样本,且它们相互独立,则统计量其中其中、分别为两总体的样本方差分别为两总体的样本方差.分布分布 定义定义 设总体设总体 ,是是 的的一个样本一个样本,则称统计量则称统计量 服从自由度服从自由度为为n n的的 分布,记作分布,记作自由度是指独立随机变量的个数,自由度是指独立随机变量的个数,n n个相互独立的标准正态分布之平方和个相互独立的标准正态分布之平方和服从自由度为服从自由度为n n的的 分布分布 五、抽样推断的基本原理五、抽样推断的基本原理举例说明举例说明 总体方差已知时总体方差已知时总体均值总体均值的区间估计的区间估计 当当X X ,可以证明抽自该总体的简单随机样本,可以证明抽自该总体的简单随机样本X1,X2X1,X2,XnXn的样本平均数的样本平均数 服从数学期望为服从数学期望为 ,方差,方差为为 的正态分布,即的正态分布,即 采用统计量采用统计量Z Z,将非标准正态分布转化为标准正态分布,将非标准正态分布转化为标准正态分布,N(0,1)例例对于给定的置信概率对于给定的置信概率,可以查正态分布表,可以查正态分布表,(即概率度即概率度t)t)使得:使得:得出相应的临界值得出相应的临界值即在给定的显著性水平即在给定的显著性水平 下,总体均值下,总体均值 在在 的置信概率下的置信区间为的置信概率下的置信区间为 第二节第二节 抽样误差抽样误差 一、抽样误差的概念及种类一、抽样误差的概念及种类在抽样调查中,总体指标与样本指标不一致,两者在抽样调查中,总体指标与样本指标不一致,两者的偏差称为抽样误差。的偏差称为抽样误差。抽样误差抽样误差即指随机误差,这是抽样调查即指随机误差,这是抽样调查固有的误差,是无法避免的。固有的误差,是无法避免的。抽样误差的作用:抽样误差的作用:1.1.在在于说明样本指标的代表性大小。于说明样本指标的代表性大小。误差大,则样本指标代表性低;误差大,则样本指标代表性低;误差小,则样本指标代表性高;误差小,则样本指标代表性高;误差等于误差等于0 0,则样本指标和总体指标一样大。,则样本指标和总体指标一样大。2.2.说说明样本指标和总体指标相差的一般范围。明样本指标和总体指标相差的一般范围。二、抽样平均误差二、抽样平均误差 (一)概念(一)概念 抽样平均误差抽样平均误差是是所有可能出现的样本指标所有可能出现的样本指标的标的标准差。反映样本指标与总体指标之间误差的一般水准差。反映样本指标与总体指标之间误差的一般水平。平。通常用通常用表示。表示。即是由于抽样的随机性而产生的样本指标与总即是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。体指标之间的平均离差。(二)理论公式(二)理论公式例例1010102010301040105020102020203020402050301030203030304030504010402040304040405050105020503050405050合合计计101010-20400102015-15225103020-10100104025-52510503000201015-15225202020-10100203025-52520403000205035525301020-10100302025-5253030300030403552530504010100401025-52540203000403035525404040101004050451522550103000502035525503040101005040451522550505020400合合计计-2500(三)实际计算公式(三)实际计算公式(以纯随机抽样为例)(以纯随机抽样为例)1.1.重重复抽样复抽样2.2.不不重重复抽样复抽样总体方差未知时解决方法:总体方差未知时解决方法:w1、用样本方差代替、用样本方差代替w2 2、用过去全面调查的资料,也可以、用过去全面调查的资料,也可以用过去用过去 抽样抽样调查的资料代替。调查的资料代替。某灯泡厂从一天所生产的产品某灯泡厂从一天所生产的产品10,00010,000个中抽取个中抽取100100个个检查其寿命,得平均寿命为检查其寿命,得平均寿命为20002000小时,根据以往资小时,根据以往资料料=20=20小时,试求抽样平均误差。小时,试求抽样平均误差。例例重复抽样重复抽样:不重复抽样不重复抽样:某玻璃器皿厂某日生产某玻璃器皿厂某日生产1500015000只印花玻璃杯,现只印花玻璃杯,现按重复抽样方法从中抽取按重复抽样方法从中抽取150150只进行质量检验,有只进行质量检验,有147147只合格,试求这批印花玻璃杯合格率的抽样平只合格,试求这批印花玻璃杯合格率的抽样平均误差。均误差。例例(四)影响抽样误差的因素:(四)影响抽样误差的因素:4.4.不不同的抽样组织形式。同的抽样组织形式。1.1.全全及总体标志变异程度。及总体标志变异程度。2.2.抽抽样单位数目的多少。样单位数目的多少。3.3.不不同的抽样方法。同的抽样方法。例:例:假定抽样单位数增加假定抽样单位数增加 2 2 倍、倍、0.50.5倍时,倍时,其他条件不变,抽样平均误差怎样变化?其他条件不变,抽样平均误差怎样变化?解解:抽样单位数增加抽样单位数增加 2 2 倍,即为原来的倍,即为原来的 3 3 倍倍抽样单位数增加抽样单位数增加 0.5 0.5倍,即为原来的倍,即为原来的 1.5 1.5倍倍即:即:当样本单位数增加当样本单位数增加2 2倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.5770.577倍倍。即:即:当样本单位数增加当样本单位数增加0.50.5倍时,抽样平均误差为原来的倍时,抽样平均误差为原来的0.81650.8165倍倍。例:例:假定抽样平均误差缩小假定抽样平均误差缩小40%40%时,时,其他其他条件不变,条件不变,抽样单位数怎样变化?抽样单位数怎样变化?解解:抽样平均误差缩小抽样平均误差缩小40%40%时,时,即为原来的即为原来的 60%60%,即:当抽样平均误差缩小即:当抽样平均误差缩小40%40%时,样本时,样本单位数增加单位数增加1.781.78倍。倍。一、抽样极限误差一、抽样极限误差 样本指标与总体指标之间允许的误差范围叫抽样极限样本指标与总体指标之间允许的误差范围叫抽样极限误差。也称抽样允许误差。误差。也称抽样允许误差。它是样本指标可允许变动的上限或下限与总体指标它是样本指标可允许变动的上限或下限与总体指标之差的绝对值。之差的绝对值。即:即:第三节第三节 抽样估计和推算抽样估计和推算 根据中心极限定理,得知当根据中心极限定理,得知当n n足够大时,抽样总体为足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率间叫抽样极限误差,也称置信区间,即在概率F(t)F(t)的保的保证下:证下:=t=t,(,(t t为概率度)为概率度)当当F(t)=68.27%F(t)=68.27%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的1 1倍倍(t=1);(t=1);当当F(t)=95.45%F(t)=95.45%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的2 2倍倍(t=2);(t=2);当当F(t)=99.73%F(t)=99.73%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的3 3倍倍(t=3);(t=3);例例可见,可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。抽样极限误差,即扩大或缩小了以后的抽样误差范围。上例资料编成次数分配表如下:上例资料编成次数分配表如下:样本数样本数f f 101-20152-15203-10254-530503545403104521550120合计合计25-30 -30 样本个数样本个数 样本频率样本频率 样本累计频率样本累计频率 0 0 5 5 10 10 15 15 20 20 合计合计 -30 -30 样本个数样本个数 样本频率样本频率 样本累计频率样本累计频率 0 5 0.20 0.20 0 5 0.20 0.20 5 8 0.32 0.52 5 8 0.32 0.52 10 6 0.24 0.76 10 6 0.24 0.76 15 4 0.16 0.92 15 4 0.16 0.92 20 2 0.08 1.00 20 2 0.08 1.00 合计合计 25 1.00 -25 1.00 -P409(一)(一)点估计点估计二、抽样估计方法二、抽样估计方法(定值估计)(定值估计)点估计点估计点估计的方法有点估计的方法有矩估计法矩估计法顺序统计量法顺序统计量法最大似然法最大似然法最小二乘法最小二乘法理论基础是理论基础是抽样分布抽样分布 =S2 设设表示总体平均数表示总体平均数的估计量,的估计量,表示总体成数表示总体成数P P的估计量,的估计量,表示总体方差表示总体方差的估计量,的估计量,则点估计的基本公式为:则点估计的基本公式为:点估计量优劣的标准:点估计量优劣的标准:(三)有效性(三)有效性 (一)无偏性(一)无偏性(二)一致性(二)一致性1 1无偏性无偏性设设为未知参数为未知参数的估计量的估计量,若估计量,若估计量的期望等于未知参数的真值,即的期望等于未知参数的真值,即则称则称为为的无偏估计量。的无偏估计量。无偏性无偏性 w估计量的数学期望等于被估计的总体参数估计量的数学期望等于被估计的总体参数P P(X X)X XC CA A 无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏w对于任意给定的对于任意给定的00,有,有对于这种极限,我们称估计量对于这种极限,我们称估计量 依概率收依概率收敛于敛于 。2 2一致性一致性 一致性一致性 w随随着着样样本本容容量量的的增增大大,估估计计量量越越来来越越接接近近被估计的总体参数被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量 P P(X X)X X3 3有效性有效性设设为为的两个无偏估计量,的两个无偏估计量,的方差小于的方差小于的方差,即的方差,即V(V()V()V()则称则称是较是较有效的估计量。有效的估计量。有效性有效性 AB 中位数的抽样分布中位数的抽样分布中位数的抽样分布中位数的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布X XP P(X X)一一一一个个个个方方方方差差差差较较较较小小小小的的的的无无无无偏偏偏偏估估估估计计计计量量量量称称称称为为为为一一一一个个个个更更更更有有有有效效效效的估计量。的估计量。的估计量。的估计量。如如如如,与与与与其其其其他他他他估估估估计计计计量量量量相相相相比比比比 ,样样样样本本本本均均均均值值值值是是是是一一一一个个个个更更更更有效的估计量有效的估计量有效的估计量有效的估计量(二二)区间估计区间估计是是根据样本指标和抽样误差去推断全及指根据样本指标和抽样误差去推断全及指标的可能范围,并能反映出估计的准确程度和把标的可能范围,并能反映出估计的准确程度和把握程度。握程度。由于区间估计所表示的是一个可能的范围,而不是由于区间估计所表示的是一个可能的范围,而不是一个绝对可靠的范围。就是说,推断全及指标在这个一个绝对可靠的范围。就是说,推断全及指标在这个范围内只有一定的把握程度。用数学的语言讲,就是范围内只有一定的把握程度。用数学的语言讲,就是有一定的概率。有一定的概率。区间估计区间估计 落在总体均值某一区间内的样本落在总体均值某一区间内的样本X95.45%95.45%的样本的样本的样本的样本99.73%99.73%的样本的样本的样本的样本x-3x-3 68.27%68.27%的样本的样本的样本的样本x-2x-2 x-x-X+X+3 3 X+2X+2 X+X+xl换句话说,对于总体的被估计指标换句话说,对于总体的被估计指标X X,找出样,找出样本的两个估计量本的两个估计量x1x1和和x2x2,使被估计指标,使被估计指标X X落在落在区间(区间(x1x1,x2x2)内的概率)内的概率1-1-l0101,为已知的。,为已知的。l即即P P(x1Xx2)=1-x1Xx2)=1-是给定的。我们称区是给定的。我们称区间(间(x1 x1,x2 x2)为总体指标)为总体指标X X的置信区间,其的置信区间,其估计置信度为估计置信度为1 1一一,称,称为显著性水平,为显著性水平,x1x1是置信下限,是置信下限,x2x2是置信上限。是置信上限。某农场进行小麦产量的抽样调查,该农场小麦播种面积为某农场进行小麦产量的抽样调查,该农场小麦播种面积为1000010000亩,采用不重复的简单随机抽样从中选亩,采用不重复的简单随机抽样从中选100100亩作为样本,进亩作为样本,进行实割实测,得到样本的平均亩产量为行实割实测,得到样本的平均亩产量为400400千克,样本标准差为千克,样本标准差为1212千克。试以概率千克。试以概率95.45%95.45%保证,估计该农场保证,估计该农场1000010000亩小麦平均亩产量亩小麦平均亩产量的可能范围。的可能范围。例例 某农场进行小麦产量的抽样调查,该农场小麦播种面积为某农场进行小麦产量的抽样调查,该农场小麦播种面积为1000010000亩,采用不重复的简单随机抽样从中选亩,采用不重复的简单随机抽样从中选100100亩作为样本,进亩作为样本,进行实割实测,得到样本的平均亩产量为行实割实测,得到样本的平均亩产量为400400千克,样本标准差为千克,样本标准差为1212千克。试以概率千克。试以概率95.45%95.45%保证,估计该农场保证,估计该农场1000010000亩小麦平均亩产量亩小麦平均亩产量的可能范围。的可能范围。则:则:例例 某机械厂日产某种产品某机械厂日产某种产品80008000件,现采用纯随机重复件,现采用纯随机重复抽样方式,从中抽取抽样方式,从中抽取400400件进行观察,其中有件进行观察,其中有380380件为件为一级品,试以概率一级品,试以概率95.45%95.45%的可靠程度推断全部产品的的可靠程度推断全部产品的一级品率及一级品数量的范围。一级品率及一级品数量的范围。例例 某机械厂日产某种产品某机械厂日产某种产品80008000件,现采用纯随机重复件,现采用纯随机重复抽样方式,从中抽取抽样方式,从中抽取400400件进行观察,其中有件进行观察,其中有380380件为件为一级品,试以概率一级品,试以概率95.45%95.45%的可靠程度推断全部产品的的可靠程度推断全部产品的一级品率及一级品数量的范围。一级品率及一级品数量的范围。例例三、全及总体总量指标的推断三、全及总体总量指标的推断(一一)直接推断法直接推断法1.1.如如果采用点估计方法:上例果采用点估计方法:上例1 1中:中:40010000=400(40010000=400(万千克万千克)如果用区间估计方法:上例如果用区间估计方法:上例1 1中该农场小麦总产量的范围为:中该农场小麦总产量的范围为:t=2:(397.62 t=2:(397.62 402.38)10000=397.62 402.38)10000=397.62 402.38(402.38(万千克万千克)t=3:(396.43 t=3:(396.43 403.57)10000=396.43 403.57)10000=396.43 403.57(403.57(万千克万千克)2.2.上上例例2 2中,全部一级品数量的范围为:中,全部一级品数量的范围为:(92.82%(92.82%97.18%)8000=7425.6 97.18%)8000=7425.6 7774.4(7774.4(件件)(二二)修正系数法修正系数法就就是用抽样所得的调查结果同有关资料对是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种比的系数来修正全面统计资料时采用的一种方法。方法。某村某村60006000农户,农户,20052005年年末统计养猪头数,上报的年年末统计养猪头数,上报的是是90009000头,现抽头,现抽1010(600(600户户)的农户复查,发现有漏报,的农户复查,发现有漏报,也有重报。按也有重报。按600600户,原来数字是户,原来数字是890890头,实际复查为头,实际复查为935935头。头。例例1 1某市房地局,年报工资总额某市房地局,年报工资总额3218.13218.1万元。万元。现抽查现抽查1414个单位:个单位:年报:年报:415.03415.03万元万元 多报:多报:0.440.44万元万元 少报:少报:1.471.47万元万元抵冲后抵冲后 1.47-0.44=1.03(1.47-0.44=1.03(万元万元)例例2 2 第四节第四节 抽样设计与组织实施抽样设计与组织实施一、抽样设计的有关问题一、抽样设计的有关问题(一)设计抽样调查方案的基本要求(一)设计抽样调查方案的基本要求1 1、遵循随机原则、遵循随机原则2 2、控制误差范围、控制误差范围3 3、考虑投入产出关系、考虑投入产出关系4 4、保证必要的样本容量、保证必要的样本容量5 5、选择适宜的抽样组织方式、选择适宜的抽样组织方式(二)抽样框的编制(二)抽样框的编制抽样框一般有三种形式:抽样框一般有三种形式:1 1、名录、名录抽样框抽样框2、区域抽样框、区域抽样框3、时间抽样框、时间抽样框 一个理想的抽样框的要求是,它应该尽可能地一个理想的抽样框的要求是,它应该尽可能地一个理想的抽样框的要求是,它应该尽可能地一个理想的抽样框的要求是,它应该尽可能地与目标总体相一致。与目标总体相一致。与目标总体相一致。与目标总体相一致。一般而言,如果总体中的每个元素在清单上分一般而言,如果总体中的每个元素在清单上分一般而言,如果总体中的每个元素在清单上分一般而言,如果总体中的每个元素在清单上分别只出现一次,且清单上又没有总体以外的其他元别只出现一次,且清单上又没有总体以外的其他元别只出现一次,且清单上又没有总体以外的其他元别只出现一次,且清单上又没有总体以外的其他元素出现,则该清单就是一个完备的抽样框。在完备素出现,则该清单就是一个完备的抽样框。在完备素出现,则该清单就是一个完备的抽样框。在完备素出现,则该清单就是一个完备的抽样框。在完备的抽样框中,每个元素必须且只能同一个号码对应。的抽样框中,每个元素必须且只能同一个号码对应。的抽样框中,每个元素必须且只能同一个号码对应。的抽样框中,每个元素必须且只能同一个号码对应。简单随机抽样简单随机抽样(纯随机抽样纯随机抽样)类型抽样类型抽样(分类抽样分类抽样)机械抽样机械抽样(等距抽样等距抽样)整群抽样整群抽样(分群抽样分群抽样)二、抽样组织方式二、抽样组织方式 (一一)简单随机抽样简单随机抽样(纯随机抽样纯随机抽样)1 1、内容:、内容:2 2、随机抽取样本的具体做法:、随机抽取样本的具体做法:(1 1)直接抽取法;)直接抽取法;(2 2)抽签法;)抽签法;(3 3)随机数字表法。)随机数字表法。对总体中所有单位除编号外不加任何处理,对总体中所有单位除编号外不加任何处理,完全随机地抽取调查单位。完全随机地抽取调查单位。3 3、特点:、特点:(1 1)是最基本的抽样方式;)是最基本的抽样方式;(2 2)简便易行;)简便易行;(3 3)适用于总体单位数不太多的均匀总体。)适用于总体单位数不太多的均匀总体。(四个公式)(四个公式)4 4、抽样平均误差的计算抽样平均误差的计算5 5、总体指标的区间估计、总体指标的区间估计 (两个不等式)(两个不等式)例例1:从某县农民家庭中随机抽取从某县农民家庭中随机抽取100户调查其年收入情况,农民户调查其年收入情况,农民家庭按年人均纯收入分组资料如下家庭按年人均纯收入分组资料如下,试以试以95%的概率保证程度对的概率保证程度对全县农民家庭的年人均纯收入和年人均纯收入在全县农民家庭的年人均纯收入和年人均纯收入在10000元以上户元以上户数所占比重作出区间估计数所占比重作出区间估计.年人均纯收入年人均纯收入(元元)户数户数(户户)9000以下以下39000-10000710000-110002811000-120003212000-130002013000以上以上10合合计计100例例1:从某县农民家庭中随机抽取从某县农民家庭中随机抽取100户调查其年收入情况,农民家庭户调查其年收入情况,农民家庭按年人均纯收入分组资料如下按年人均纯收入分组资料如下,试以试以95%的概率保证程度对全县的概率保证程度对全县农民家庭的年人均纯收入和年人均纯收入在农民家庭的年人均纯收入和年人均纯收入在10000元以上户数所元以上户数所占比重作出区间估计占比重作出区间估计.年人均纯收入年人均纯收入(元元)户数户数(户户)fxxf9000以下以下39000-10000710000-110002811000-120003212000-130002013000以上以上10合合计计100例例1:从某县农民家庭中随机抽取从某县农民家庭中随机抽取100户调查其年收入情况,农民家庭户调查其年收入情况,农民家庭按年人均纯收入分组资料如下按年人均纯收入分组资料如下,试以试以95%的概率保证程度对全县的概率保证程度对全县农民家庭的年人均纯收入和年人均纯收入在农民家庭的年人均纯收入和年人均纯收入在10000元以上户数所元以上户数所占比重作出区间估计占比重作出区间估计.年人均纯收入年人均纯收入(元元)户数户数(户户)fxxf9000以下以下3850025500250563009000-1000079500665002500470010000-1100028105002940002217880011000-1200032115003680038720012000-130002012500250002464200013000以上以上101350013500044521000合合计计100-1139000141790000例例2:2:电视台某栏目主持人欲知观众对该栏目是否喜欢电视台某栏目主持人欲知观众对该栏目是否喜欢,随机抽取随机抽取400名观众调查名观众调查,其中喜欢的有其中喜欢的有240人人.试在试在95.45%的概率保证下的概率保证下,估计喜欢该栏目的观众比重范估计喜欢该栏目的观众比重范围围.如果该主持人希望估计的误差不超过如果该主持人希望估计的误差不超过5%,则有多大则有多大的把握程度的把握程度?例例3:某学校随机抽查某学校随机抽查10名男生,平均身高名男生,平均身高170cm,标准差,标准差12cm,问有多大把握估计全校男生,问有多大把握估计全校男生身高介于身高介于160.5179.5cm之间?之间?(二)类型抽样(二)类型抽样(分类抽样分类抽样)1 1、内容:、内容:先对总体各单位按一定标志加以分类先对总体各单位按一定标志加以分类(组组),然后再从各类然后再从各类(组组)中按随机原则抽取样本。中按随机原则抽取样本。2 2、样本分配形式:、样本分配形式:(1 1)等等比例抽样;比例抽样;(2 2)不不等比例抽样。等比例抽样。(3 3)抽样调查成本较低。)抽样调查成本较低。3 3、特点:、特点:(1 1)先分组,后抽样;)先分组,后抽样;(2 2)样本代表性高、抽样误差较小;)样本代表性高、抽样误差较小;4 4、抽样平均误差的计算:、抽样平均误差的计算:(1 1)重复抽样:)重复抽样:(2 2)不重复抽样:)不重复抽样:5、总体指标的区间估计、总体指标的区间估计 两个不等式两个不等式 某农场种小麦某农场种小麦1200012000公顷,其中平原公顷,其中平原36003600公顷,公顷,丘陵丘陵60006000公顷,山地公顷,山地24002400公顷。现用类型等比例抽公顷。现用类型等比例抽样调查样调查12001200公顷,平均单位面积产量公顷,平均单位面积产量1500015000千克,高千克,高产田面积比重产田面积比重79%79%。资料如下表。资料如下表。试以试以68.27%68.27%概率概率保证估计该农场小麦单位面积产量的区间。保证估计该农场小麦单位面积产量的区间。以同以同样概率保证估计该农场小麦高产田面积比重的区间。样概率保证估计该农场小麦高产田面积比重的区间。类类型型全场播全场播种面积种面积(公顷公顷)抽样调抽样调查面积查面积(公顷)(公顷)单位面积单位面积产量不均产量不均匀程度指匀程度指标标(千克千克)高产田比重高产田比重(%)丘陵地区丘陵地区600075080平原地区平原地区360084090山山地地2400100060合合计计120001200-例例 某农场种小麦某农场种小麦1200012000公顷,其中平原公顷,其中平原36003600公顷,公顷,丘陵丘陵60006000公顷,山地公顷,山地24002400公顷。现用类型等比例抽公顷。现用类型等比例抽样调查样调查12001200公顷,平均单位面积产量公顷,平均单位面积产量1500015000千克,高千克,高产田面积比重产田面积比重79%79%。资料如下表。资料如下表。试以试以68.27%68.27%概率概率保证估计该农场小麦单位面积产量的区间。保证估计该农场小麦单位面积产量的区间。以同以同样概率保证估计该农场小麦高产田面积比重的区间。样概率保证估计该农场小麦高产田面积比重的区间。类类型型全场播全场播种面积种面积(公顷公顷)抽样调抽样调查面积查面积(公顷)(公顷)单位面积单位面积产量不均产量不均匀程度指匀程度指标标(千克千克)高产田比重高产田比重(%)piNinii丘陵地区丘陵地区600075080平原地区平原地区360084090山山地地2400100060合合计计120001200-例例 某农场种小麦某农场种小麦1200012000公顷,其中平原公顷,其中平原36003600公顷,公顷,丘陵丘陵60006000公顷,山地公顷,山地24002400公顷。现用类型等比例抽公顷。现用类型等比例抽样调查样调查12001200公顷,平均单位面积产量公顷,平均单位面积产量1500015000千克,高千克,高产田面积比重产田面积比重79%79%。资料如下表。资料如下表。试以试以68.27%68.27%概率概率保证估计该农场小麦单位面积产量的区间。保证估计该农场小麦单位面积产量的区间。以同以同样概率保证估计该农场小麦高产田面积比重的区间。样概率保证估计该农场小麦高产田面积比重的区间。类类型型全场播全场播种面积种面积(公顷公顷)抽样调抽样调查面积查面积(公顷)(公顷)单位面积单位面积产量不均产量不均匀程度指匀程度指标标(千克千克)高产田比重高产田比重(%)piNinii丘陵地区丘陵地区600060075080平原地区平原地区360036084090山山地地2400240100060合合计计120001200-例例337500000254016000240000000831516000类别类别高产田高产田比重比重(%)非高产田非高产田比重比重(%)麦田不均匀麦田不均匀程度指标程度指标(%)抽样调查抽样调查面积面积(公顷公顷)pi(1-pi)nipi1-pipi(1-pi)ni丘陵丘陵80201660096.0平原平原9010936032.4山地山地60402424057.6合计合计-1200186(三)机械抽样(三)机械抽样(等距抽样等距抽样)先先将全及总体的所有单位按某一标志将全及总体的所有单位按某一标志顺序排队,然后按固定的间隔抽取样本。顺序排队,然后按固定的间隔抽取样本。1 1、内容:、内容:(1 1)无关标志无关标志:选择标志与抽样调查内容无关。选择标志与抽样调查内容无关。(2 2)有关标志有关标志:选择标志与抽样调查内容有关。选择标志与抽样调查内容有关。2 2、样本抽取方法:、样本抽取方法:(1 1)随随机起点等距抽样机起点等距抽样k k k k+a 2k+a (n-1)k+aak(k为抽取间隔)(2 2)半半距起点等距抽样距起点等距抽样k k kk(k为抽取间隔)(3 3)对对称等距抽样称等距抽样k k k 2k-a 2k+a 4k-a 4k+aak(k为抽取间隔)3 3、特点:、特点:(2 2)第一个样本是随机的;后面的样本是确定的;)第一个样本是随机的;后面的样本是确定的;(1 1)先排队,后抽样;先排队,后抽样;按无关标志排队,相当于简单随机抽样,按无关标志排队,相当于简单随机抽样,按有关标志排队,相当于类型抽样。按有关标志排队,相当于类型抽样。(3 3)注意避免抽样间隔与现象本身的周期重合。)注意避免抽样间隔与现象本身的周期重合。4 4、抽样平均误差的计算(不重复抽样):、抽样平均误差的计算(不重复抽样):(1 1)无关标志排队,按简单随机抽样方法计算。)无关标志排队,按简单随机抽样方法计算。(2 2)有关标志排队,按类型抽样的方法计算。有关标志排队,按类型抽样的方法计算。5、总体指标的区间估计、总体指标的区间估计两个不等式两个不等式(四)整群抽样(分群抽样)(四)整群抽样(分群抽样)先将总体分成若干群,再以群为单位从总体中抽取先将总体分成若干群,再以群为单位从总体中抽取样本群,对抽中的群内所有单位都进行观察。样本群,对抽中的群内所有单位都进行观察。2 2、特点:、特点:(2 2)一般比其它抽样方式的抽样误差大。)一般比其它抽样方式的抽样误差大。(3 3)抽样误差受群间方差的影响。)抽样误差受群间方差的影响。(1 1)工作比较简单;)工作比较简单;1 1、内容:、内容:3 3、抽样平均误差的计算(不重复抽样)、抽样平均误差的计算(不重复抽样):4 4、总体指标的区间估计、总体指标的区间估计两个不等式两个不等式 把某企业大量生产的一种零件分成把某企业大量生产的一种零件分成288288群,现从群,现从中抽取中抽取2424群产品进行检验,用以检查产品的合格率,群产品进行检验,用以检查产品的合格率,检查结果如下表。试以检查结果如下表。试以99.73%99.73%的概率保证估计全部的概率保证估计全部零件合格率的区间。零件合格率的区间。合格率合格率%群数群数8028549012953983合计合计24例例合格率合格率%群数群数ripipiri8020.801.6-0.09960.019848540.853.4-0.04960.0098490120.9010.80.000409530.952.850.05040.007629830.982.940.08040.01939合计合计24-21.59-0.05669例例例例三、抽样数目的确定三、抽样数目的确定(一)影响必要抽样数目的因素(一)影响必要抽样数目的因素(二)必要抽样数目的计算(二)必要抽样数目的计算 (简单随机抽样)(简单随机抽样)建筑工地打土方工人建筑工地打土方工人40004000人,需测定平均每人工人,需测定平均每人工作量,要求误差范围不超过作量,要求误差范围不超过0.2M0.2M3 3,并需有,并需有99.73%99.73%保证保证程度。根据过去资料程度。根据过去资料为为1.5M1.5M3 3、1.36M1.36M3 3和和1.48M1.48M3 3,求,求样本数应是多少?如果误差范围缩小一半样本数应是多少?如果误差范围缩小一半,其他条件不其他条件不变变,样本数又应是多少?样本数又应是多少?例例1 1 某笔厂月产某笔厂月产1000010000支金笔,以前多次抽样调查支金笔,以前多次抽样调查,一等一等品率为品率为90%90%、92%92%、96%96%和和94%94%,现在要求误差范围在,现在要求误差范围在2%2%之内,可靠程度达之内,可靠程度达95.45%95.45%,问必须抽取多少单位数?,问必须抽取多少单位数?例例2 2注意:必要抽样数目计算时方差问题:注意:必要抽样数目计算时方差问题:w1 1、取最大值。取最大值。最大最大w2 2、p p 取最接近取最接近0.50.5的值。的值。最小最小 0.5 0.5一、名词解释一、名词解释二、简答二、简答三、判断三、判断抽样推断抽样推断 抽样误差抽样误差 抽样平均误差抽样平均误差 抽样极限误差抽样极限误差 1、影响抽样平均误差大小的因素有哪些?影响抽样平均误差大小的因素有哪些?2、影响样本容量的因素有哪些?影响样本容量的因素有哪些?1、重复抽样的抽样误差不一定大于不重复抽样重复抽样的抽样误差不一定大于不重复抽样的抽样误差。的抽样误差。()()三、选择三、选择2 2、因为不知道总体方差或标准差,所以无法计、因为不知道总体方差或标准差,所以无法计 算抽样平均误差。算抽样平均误差。()()3、抽样平均误差总是小于抽样极限误差。(、抽样平均误差总是小于抽样极限误差。()4 4、在简单随机抽样中,如果重复抽样的抽样极限、在简单随机抽样中,如果重复抽样的抽样极限误差增长误差增长40%40%,其它条件不变,则样本单位数,其它条件不变,则样本单位数只需要原来的一半左右。只需要原来的一半左右。()1 1、抽样调查的主要目的()、抽样调查的主要目的()A A、用样本指标来推算总体指标、用样本指标来推算总体指标 B B、对调查单位作深入研究、对调查单位作深入研究 C C、计算和控制抽样误差、计算和控制抽样误差 D D、广泛运用数学方法、广泛运用数学方法2 2、抽样平均误差反映了样本指标与总体指标之间的(、抽样平均误差反映了样本指标与总体指标之间的()A A、实际误差、实际误差B B、实际误差的绝对值、实际误差的绝对值C C、平均误差程度、平均误差程度D D、可能误差范围、可能误差范围3 3、反映样本指标与总体指标之间抽样误差可能范围的、反映样本指标与总体指标之间抽样误差可能范围的指标是()指标是()A A、抽样平均误差、抽样平均误差B B、抽样极限误差、抽样极限误差 C C、抽样允许误差抽样允许误差D D、精确程度、精确程度4 4、在其他条件不变的情况下,提高抽样估计的可靠程、在其他条件不变的情况下,提高抽样估计的可靠程度,其精确程度将()度,其精确程度将()A A、保持不变、保持不变B B、随之扩大、随之扩大 C C、随之缩小、随之缩小D D、无法确定、无法确定5 5、极限误差与抽样平均误差数值之间的关系为()、极限误差与抽样平均误差数值之间的关系为()A A、前者一定小于后者、前者一定小于后者 B B、前者一定大于后者、前者一定大于后者 C C、前者一定等于后者、前者一定等于后者 D D、前者既可以大于后者,也可以小于后者、前者既可以大于后者,也可以小于后者6 6、成数方差的最大值,是()、成数方差的最大值,是()A A、0.10.1B B、0.90.9C C、0.250.25 D D、0.50.57 7、在其它条件不变的情况下,抽样单位数增加一半,、在其它条件不变的情况下,抽样单位数增加一半,则抽样平均误差()则抽样平均误差()A A、缩小为原来的、缩小为原来的81.6%81.6%B B、缩小为原来的、缩小为原来的50%50%C C、缩小为原来的、缩小为原来的25%25%D D、扩大为原来的四倍、扩大为原来的四倍8 8、在简单随机重复抽样条件下,为使抽样误差减少、在简单随机重复抽样条件下,为使抽样误差减少 一半,样本容量应增加()一半,样本容量应增加()A A、4 4倍倍B B、3 3倍倍C C、2 2倍倍D D、1 1倍倍9 9、在一定的抽样平均误差条件下()、在一定的抽样平均误差条件下()A A、扩大极限误差范围,可以提高推断的可靠程度、扩大极限误差范围,可以提高推断的可靠程度 B B、扩大极限误差范围,会降低推断的可靠程度、扩大极限误差范围,会降低推断的可靠程度 C C、缩小极限误差范围,可以提高推断的可靠程度、缩小极限误差范围,可以提高推断的可靠程度 D D、缩小极限误差范围,不改变推断的可靠程度、缩小极限误差范围,不改变推断的可靠程度 某地区某地区20072007年随机抽取年随机抽取100100户住户,测得户户住户,测得户均月收入为均月收入为30003000元,标准差为元,标准差为400400元,元,其中有其中有1010户的户均月收入在户的户均月收入在60006000元以上,若以元以上,若以95.45%95.45%的概率保证程度,试估计:的概率保证程度,试估计:(1 1)该地区住户户均月收入的可能范围)该地区住户户均月收入的可能范围(2 2)在全部住户中,户均月收入在)在全部住户中,户均月收入在60006000元以上的元以上的户数所占比重的可能范围。户数所占比重的可能范围。一批商品一批商品1000010000件运抵仓库,随机抽取件运抵仓库,随机抽取100100件检验其质量,发现有件检验其质量,发现有1010件不合格,试以件不合格,试以95.45%95.45%的概率保证程度对该批商品的合格率的概率保证程度对该批商品的合格率作出区间估计。若误差范围缩小一半,其他作出区间估计。若误差范围缩小一半,其他条件不变,问需要从总体中抽取多少件商品条件不变,问需要从总体中抽取多少件商品进行检验?进行检验?某厂对产品使用寿命进行检测,用简某厂对产品使用寿命进行检测,用简单随机不重复抽样方法从单随机不重复抽样方法从50005000个成品中抽取个成品中抽取200200个,对其进行寿命调查,测得样本平均个,对其进行寿命调查,测得样本平均寿命为寿命为43404340小时,样本标准差为小时,样本标准差为731731小时。小时。(1 1)试以)试以95%95%的概率保证程度对的概率保证程度对该批产品的平均使用寿命进行区间估计。该批产品的平均使用寿命进行区间估计。(2 2)若概率保证程度不变,极限误差)若概率保证程度不变,极限误差不超过不超过7070小时,按重复抽样方法,则至少小时,按重复抽样方法,则至少要抽取多少件产品为样本。要抽取多少件产品为样本。从某个年级学生中按简单随机抽样方式抽取从某个年级学生中按简单随机抽样方式抽取4040学生,对统计课的考试成绩进行检查,得知其平学生,对统计课的考试成绩进行检查,得知其平均分数为均分数为78.7578.75分,标准差为分,标准差为12.1312.13分。要求:分。要求:(1 1)试以)试以95.45%95.45%的概率保证程度推断全年级学生的概率保证程度推断全年级学生考试成绩的区间范围。考试成绩的区间范围。(2 2)若误差范围缩小一半,其他条件不变,问需)若误差范围缩小一半,其他条件不变,问需要抽取多少名学生?要抽取多少名学生?P248训练资料训练资料2P249训练资料训练资料 End of Chapter 6End of Chapter 6w人员训练皆合格,品质交期皆无论。7月-247月-24Friday,July 12,2024w诚信为本质量佳,优质服务誉天下。20:28:1820:28:1820:287/12/2024 8:28:18 PMw安全网、挽留生命的网。7月-2420:28:1820:28Jul-2412-Jul-24w创新是根本,质量是生命,务实是宗旨,效益是目标。20:28:1820:28:1820:28Friday,July 12,2024w为了您全家幸福,请注意安全生产。7月-247月-2420:28:1820:28:18July 12,2024w今天工作不安全,明天生活无保障。2024年7月12日8:28 下午7月-247月-24w抱怨事件速处理,客户欢喜以满意。12 七月 20248:28:18 下午20:28:187月-24w质量-价值与尊严的起点。七月 248:28 下午7月-2420:28July 12,2024w优质灌溉,缔造将来。2024/7/12 20:28:1820:28:1812 July 2024w雄关漫道真如铁,而今迈步从头越。8:28:18 下午8:28 下午20:28:187月-24w每天自我检讨,品质自然更好。7月-247月-2420:2820:28:1820:28:18Jul-24w培育礼仪员工,创造团队精神。2024/7/12 20:28:19Friday,July 12,2024w地火两线别接反,完活之后再合电。7月-242024/7/12 20:28:197月-24谢谢大家!谢谢大家!
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!