总体均值的区间估计课件

上传人:94****0 文档编号:241719843 上传时间:2024-07-18 格式:PPT 页数:75 大小:1,012.69KB
返回 下载 相关 举报
总体均值的区间估计课件_第1页
第1页 / 共75页
总体均值的区间估计课件_第2页
第2页 / 共75页
总体均值的区间估计课件_第3页
第3页 / 共75页
点击查看更多>>
资源描述
一家食品生产企业以生产袋装食品为主,每天的产量约为一家食品生产企业以生产袋装食品为主,每天的产量约为80008000袋左袋左右。按规定每袋的重量应不低于右。按规定每袋的重量应不低于100100克,否则即为不合格。为对产量质克,否则即为不合格。为对产量质量进行检测,企业设有质量检查科专门负责质量检验,并经常向企业量进行检测,企业设有质量检查科专门负责质量检验,并经常向企业高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要求。高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要求。由于产品的数量大,进行全面的检验是不可能的,可行的办法是由于产品的数量大,进行全面的检验是不可能的,可行的办法是抽样,然后用样本数据估计平均每袋的重量。质检科从某天生产的一抽样,然后用样本数据估计平均每袋的重量。质检科从某天生产的一批食品中随机抽取了批食品中随机抽取了2525袋,下表袋,下表1 1是对每袋食品重量的检验结果。是对每袋食品重量的检验结果。实践中的统计第六章第六章 总体参数估计总体参数估计 一家食品生产企业以生产袋装食品为主1 根据表根据表1 1的数据,质检科估计出该天生产的食品每袋的平均重量在的数据,质检科估计出该天生产的食品每袋的平均重量在101.38109.34101.38109.34克之间,其中,估计的可信程度为克之间,其中,估计的可信程度为95%95%,估计误差不超过,估计误差不超过4 4克。产品的合格率在克。产品的合格率在96.07%73.93%96.07%73.93%之间,其中,估计的可信程度为之间,其中,估计的可信程度为95%95%,估计误差不超过估计误差不超过16%16%。表1 25袋食品的重量(克)112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.010808101.6108.498.4100.5115.6102.2105.093.3第六章第六章 总体参数估计总体参数估计 表1 25袋食品的重量(克)112.5101.0102 质检报告提交后,企业高层领导人提出几点意见:一是抽取的样质检报告提交后,企业高层领导人提出几点意见:一是抽取的样本大小是否合适?能不能用一个更大的样本进行估计?二是能否将估本大小是否合适?能不能用一个更大的样本进行估计?二是能否将估计的误差再缩小一点?比如,估计平均重量时,估计误差不超过计的误差再缩小一点?比如,估计平均重量时,估计误差不超过3 3克,克,估计合格率时误差不超过估计合格率时误差不超过10%10%;三是总体平均重量的方差是多少?因为;三是总体平均重量的方差是多少?因为方差的大小说明了生产过程的稳定性,过大或过小的方差都意味着应方差的大小说明了生产过程的稳定性,过大或过小的方差都意味着应对生产过程进行调整。对生产过程进行调整。第六章第六章 总体参数估计总体参数估计 质检报告提交后,企业高层领导3第六章第六章 总体参数估计总体参数估计本章重点本章重点本章重点本章重点1、参数估计的基本问题;、参数估计的基本问题;2、单个总体均值和比率的区间估计;、单个总体均值和比率的区间估计;3、小样本下的总体参数估计方法;、小样本下的总体参数估计方法;4、样本容量的确定方法;、样本容量的确定方法;5、两个总体均值和比率差异的区间估计;、两个总体均值和比率差异的区间估计;6、分层、整群和等距抽样的区间估计。、分层、整群和等距抽样的区间估计。本章难点本章难点本章难点本章难点1、一般正态分布、一般正态分布标准正态分布;标准正态分布;2、区间估计的原理;、区间估计的原理;3、两总体联合方差的表达形式。、两总体联合方差的表达形式。第六章 总体参数估计本章重点4第一节第一节 参数估计的基本问题参数估计的基本问题一、点估计点估计就是用样本估计量的一个具体观测值直接作为总体的未知参数的估计值的方法。如上例中随机抽取的100头的平均每头毛重(95.5kg)可作为10000头平均每头毛重 的点估计值 常用的估计量有:(1)样本平均数 为总体平均数 的估计量;(2)样本方差 为总体方差 的估计量;(3)样本成数 为总体成数 P 估计量。第一节 参数估计的基本问题一、点估计5二、点估计的性质 在对总体特征做出估计时,并非所有估计量都是优良的,从而产生了评价估计量是否优良的标准。作为优良的估计量应该符合如下三个标准:第六章第六章 总体参数估计总体参数估计二、点估计的性质 第六章 总体参数估计61、无偏性 如果样本某统计量的数学期望值等于其所估计的总体参数真值,则这个估计统计量就叫做该总体参数的无偏估计量。如样本平均数的数学期望是总体平均数,则样本均值是总体均值的无偏估计量。这里无偏估计量是指没有系统偏差(非随机偏差)的平均意义上的量,即如果说一个估计量是无偏性的,并不是保证用于单独一次估计中没有随机性误差,只是没有系统性偏差而已。这是一个优良估计量的重要条件。若以 代表被估计的总体参数,代表 的无偏估计量则有:第六章第六章 总体参数估计总体参数估计1、无偏性第六章 总体参数估计72、一致性 若估计量随样本容量n的增大而越来越接近总体参数值时,则称该估计量为被估计参数的一致性估计量。估计量的一致性是从极限意义上讲的,它适用于大样本的情况。如果一个估计量是一致性估计量,那么采用大样本就更加可靠。当然,样本容量n增大时,估计量的一致性会增强,但调查所需的人、财、物力也相应增加。例如,以样本平均数估计总体平均数,符合一致性的要求,即存在如下关系:式中 为任意正数。第六章第六章 总体参数估计总体参数估计2、一致性第六章 总体参数估计83、有效性 有效性是指无偏估计量中方差最小的估计量。无偏估计量只考虑估计值的平均结果是否等于待估计参数的真值,而不考虑估计的每个可能值及其次数分布与待估计参数真值之间离差大小的离散程度。我们在解决实际问题时,不仅希望估计值是无偏的,更希望这些估计值的离差尽可能地小,即要求比较各无偏估计量中与被估计参数的离差较小的为有效估计量。如样本平均数与中位数都是总体均值的无偏估计量,但在同样的样本容量下,样本平均数是有效的估计量。第六章第六章 总体参数估计总体参数估计3、有效性第六章 总体参数估计9点估计的缺点:不能反映估计的误差和精确程度 因为点估计是基于样本得到的,是随机变量,不可能期望它的值与相应的总体参数的真实值相等,也就是说点估计值和总体参数的真是值之间总会存在一定误差,并且我们是不知道这个误差有多大,这样我们估计的可信度大打折扣。在这一节中,我们将说明如何利用点估计值对单个总体均值和总体比率进行区间估计,并给出估计的可靠程度和准确程度。区间估计:利用样本统计量和抽样分布估计总体参数的可能区间第六章第六章 总体参数估计总体参数估计点估计的缺点:不能反映估计的误差和精确程度第六章 总体参数10第二节第二节 单个总体均值和比率的区间估计单个总体均值和比率的区间估计一、总体均值的区间估计:大样本(n30)情形和小样本(n30)情形。第二节 单个总体均值和比率的区间估计一、总体均值的区间估计:11大样本的情形大样本的情形【例例1 1】Duotu公司是一家专营体育设备和附件的公司,为了监控公司的服务质量,Duotu公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查,满意分数的标准差稳定在20分左右。最近一次对100名顾客的抽样显示,满意分数的样本均值为82分,试建立总体满意分数的区间。我们可以将样本满意得分的均值(我们可以将样本满意得分的均值(82分)作为该公司分)作为该公司所有顾客组成的总体的平均满意得分的点估计。当然你也所有顾客组成的总体的平均满意得分的点估计。当然你也许会问:许会问:“这一估计有多好?这次估计的把握程度有多高这一估计有多好?这次估计的把握程度有多高?”有多好有多好这一问题其实是想知道以样本均值作为总这一问题其实是想知道以样本均值作为总体均值的点估计时所产生的误差有多大。体均值的点估计时所产生的误差有多大。大样本的情形【例1】Duotu公司是一家专营体育设备和附件的12我们把无偏点估计值与总体参数之差的绝对值称为抽样误差。当我们用样本均值估计总体均值时,抽样误差可以表达为:如果我们可以利用式6-1将抽样误差计算出来,那么就可以将式6-1变形为:(6-1)(6-2)我们把无偏点估计值与总体参数之差的绝对值称为抽样误差。当我们13 要进行区间估计,关键是将抽样误差E求解。若 E 已知,则区间可表示为:此时,可以利用样本均值的抽样分布对抽样误差的大小进行描述。上例中,已知,样本容量n=100,总体标准差 ,根据中心极限定理可知,此时样本均值服从均值为 ,标准差为 的正态分布。即:要进行区间估计,关键是将抽样误差E求解。若 E 已知,14抽样误差的概率表述抽样误差的概率表述我们可以确定样本均值 在总体均值82的周围波动,波动的幅度即为抽样误差。根据抽样分布的知识,这个波动幅度即抽样误差。可以根据事先给定的概率加以计算 ,为了方便运算,通常我们先将一般的正态分布转化为标准正态分布。由概率论,若 ,服从标准正态分布,记为 。由标准正态分布,有以下式子成立 (6-4)抽样误差的概率表述我们可以确定样本均值 在总体均值8215 一般称,为置信度,可靠程度等,反映估计结果的可信程度。若事先给定一个置信度,则可根据标准正态分布找到其对应的临界值 。进而计算抽样误差总体均值的区间估计课件16 若,则查标准正态分布附表3可得,抽样误差 此时抽样误差的意义可表述为:以样本均值为中心的3.92的区间包含总体均值的概率是95%,或者说,样本均值产生的抽样误差是3.92或更小的概率是0.95。常用的置信度还有90%,95.45%,99.73%,他们对应的临界值分别为1.645,2和3,可以分别反映各自的估计区间所对应的精确程度和把握程度。若,17 计算区间估计:计算区间估计:在CJW公司的例子中,样本均值产生的抽样误差是3.92或更小的概率是0.95。因此,可以构建总体均值的区间为,由于,从一个总体中抽取到的样本具有随机性,在一次偶然的抽样中,根据样本均值计算所的区间并不总是可以包含总体均值,它是与一定的概率相联系的。如下图所示:计算区间估计:183.923.92图图1 根据选择的在根据选择的在 、位置的样本均值建立的区间位置的样本均值建立的区间3.923.92图1 根据选择的在 、19 上图中,有上图中,有95%的样本均值落在阴影部分,这个区域的样本均的样本均值落在阴影部分,这个区域的样本均值值3.92的区间能够包含总体均值。的区间能够包含总体均值。因此,总体均值的区间的含义为,我们有因此,总体均值的区间的含义为,我们有95%的把握认为,的把握认为,以样本均值为中心的以样本均值为中心的3.92的区间能够包含总体均值。的区间能够包含总体均值。通常,称该区间为置信区间,其对应的置信水平为通常,称该区间为置信区间,其对应的置信水平为 置信区间的估计包含两个部分:点估计和描述估计精确度的置信区间的估计包含两个部分:点估计和描述估计精确度的正负值。也将正负值称为误差边际或极限误差,反映样本估计正负值。也将正负值称为误差边际或极限误差,反映样本估计量与总体参数之间的最大误差范围。量与总体参数之间的最大误差范围。总结总结:上图中,有95%的样本均值落在阴影部分,这个20计算区间估计:计算区间估计:在大多数的情况下,总体的标准差都是未知的。根据抽样分布定理,在大样本的情况下,可用样本的标准差s作为总体标准差的点估计值,仍然采用上述区间估计的方法进行总体参数的估计。计算区间估计:21【例例2 2】某市交通部门为了对城市的环境进行监测,定期公布该市居民每天小汽车的里程数,抽取36个居民作为一个简单随即样本,得到资料如表6-2所示。试构造该市民每天小汽车里程数的总体均值的95%的置信区间。居民居民汽车里程数汽车里程数居民居民汽车里程数汽车里程数居民居民汽车里程数汽车里程数居民居民汽车里程数汽车里程数12345678932504024334445484410111213141516171847313639464539384519202122232425262727435436344823364228 2930313233343536343934354253284939【例2】某市交通部门为了对城市的环境进行监测,定期公22分析:区间估计包括两个部分点估计和误差边际,只需分别求出即可到的总体的区间估计。解:已知(1)样本的平均里程数(2)极限误差(误差边际)分析:区间估计包括两个部分点估计和误差边际,只需分别求出23样本标准差极限误差(3)95%的置信区间为39.5 2.54 即(36.96,42.04)公里。注意注意(1)置信系数一般在抽样之前确定,根据样本所建立的区间能包含总体参数的概率为100(1-)%(2)置信区间的长度(准确度)在置信度一定的情况下,与样本容量的大小呈反方向变动,若要提高估计准确度,可以扩大样本容量来达到。样本标准差24二、总体均值的区间估计:小样本的情况二、总体均值的区间估计:小样本的情况 在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分布。我们讨论总体服从正态分布的情况。t分布的图形和标准正态分布的图形类似,如下图示:二、总体均值的区间估计:小样本的情况 250标准正态分布t分布(自由度为20)t分布(自由度为10)图6-3 标准正态分布与t分布的比较第六章第六章 总体参数估计总体参数估计0标准正态分布t分布(自由度为20)t分布(自由度为10)图26 在分布中,对于给定的置信度,同样可以通过查表找到其对应的临界值,利用临界值也可计算区间估计的极限误差 因此,总体均值的区间估计在总体标准差未知的小样本情况下可采用下式进行:假定总体服从正态分布;第六章第六章 总体参数估计总体参数估计 在分布中,对于给定的置信度,同样可以通27【例例3 3】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修支援掌握及其维修的操作,以减少培训工人所需要的时间。为了评价这种培训方法,生产经理需要对这种程序所需要的平均时间进行估计。以下是利用新方对名职员进行培训的培训天数资料。根据上述资料建立置信度为的总体均值的区间估计。(假定培训时间总体服从正态分布)。职员时间职员时间职员时间职员时间职员时间职员时间第六章第六章 总体参数估计总体参数估计【例3】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修28 解:依题意,总体服从正态分布,(小样本),此时总体方差未知。可用自由度为(n-1)=14的t分布进行总体均值的区间估计。样本平均数 样本标准差 极限误差 95%的置信区间为53.87 3.78 即(50.09,57.65)天。第六章第六章 总体参数估计总体参数估计 解:依题意,总体服从正态分布,(小样本),此时总29三、总体比例的区间估计三、总体比例的区间估计 对总体比例 的区间估计在原理上与总体均值的区间估计相同。同样要利用样本比例 的抽样分布来进行估计。若,则样本比例近似服从正态分布。同样,抽样误差 类似的,利用抽样分布(正态分布)来计算抽样误差三、总体比例的区间估计30 上式中,是正待估计的总体参数,其值一般是未知,通常简单的用 替代 。即用样本方差 替代总体方差 。则,极限误差的计算公式为:上式中,是正待估计的总体参数,其值一般是未知31【例例4】1997年菲瑞卡洛通讯公司对全国范围内的902名女子高尔夫球手进行了调查,以了解美国女子高尔夫球手对自己如何在场上被对待的看法。调查发现,397名女子高尔夫球手对得到的球座开球次数感到满意。试在95%的置信水平下估计总体比例的区间。分解:解:依题意已知,(1)样本比例(2)误差边际第六章第六章 总体参数估计总体参数估计【例4】1997年菲瑞卡洛通讯公司对全国范围内的902名女子32 (3)95%的置信区间0.44 0.0324 即(0.4076,0.4724)。结论:在置信水平为95%时,所有女子高尔夫球手中有40.76%到47.24%的人对得到的球座开球数感到满意。(3)95%的置信区间0.44 0.0324 33第三节第三节 确定样本容量确定样本容量极限误差其计算需要已知若我们选择了置信度由此,得到计算必要样本容量的计算公式:第三节 确定样本容量极限误差34一、总体均值估计时样本容量的确定一、总体均值估计时样本容量的确定【例例5】在以前的一项研究美国租赁汽车花费的研究中发现,租赁一辆中等大小的汽车,其花费范围为,从加利福尼亚州的奥克兰市的每天36美元到康涅狄格州的哈特福德市的每天73.50美元不等,并且租金的标准差为9.65美元。假定进行该项研究的组织想进行一项新的研究,以估计美国当前总体平均日租赁中等大小汽车的支出。在设计该项新的研究时,项目主管指定对总体平均日租赁支出的估计误差边际为2美元,置信水平为95%。解:依题意,可得 将以上结果取下一个整数(90)即为必要的样本容量。一、总体均值估计时样本容量的确定【例5】在以前的一项研究美国35 说明:由于总体标准差 在大多数情况下 是未知的,可以有以下方法取得 的值。(1)使用有同样或者类似单元的以前样本的样本标准差;(2)抽取一个预备样本进行试验性研究。用实验性样本的标准差作为 的估计值。(3)运用对 值的判断或者“最好的猜测”,例如,通常可用该值全距的1/4作为 的近似值。说明:36二、总体比率估计时的样本容量确定二、总体比率估计时的样本容量确定【例例6】在例中,该公司想在1997年结果的基础上进行一项新的调查,以重新估计女子高尔夫球手的总体中对得到的球座开球此数感到满意的人数所占的比例。调查主管希望这项新的调查在误差边际为0.025、置信水平为95%的条件下来进行,那么,样本容量应该为多大?解:依题意,可得 将以上结果取下一个整数(1515)即为必要的样本容量。二、总体比率估计时的样本容量确定【例6】在例中,该公司想在137在建立总体比例的区间估计时,确定样本容量的原理与上节中在建立总体比例的区间估计时,确定样本容量的原理与上节中在建立总体比例的区间估计时,确定样本容量的原理与上节中在建立总体比例的区间估计时,确定样本容量的原理与上节中使用的为估计总体均值时确定样本容量的原理相类似。使用的为估计总体均值时确定样本容量的原理相类似。使用的为估计总体均值时确定样本容量的原理相类似。使用的为估计总体均值时确定样本容量的原理相类似。说明:说明:由于总体比例 在大多数情况下是未知的,可以有以下方法取得 的值。(1)使用有同样或者类似单元的以前样本的样本比例;(2)抽取一个预备样本进行试验性研究。用实验性样本的比例作为 的估计值。(3)运用对 值的判断或者“最好的猜测”;(4)如果上面的方法都不适用,采用 。在建立总体比例的区间估计时,确定样本容量的原理与上节中使用的38第四节第四节 两个总体均值和比率差异的区间估计两个总体均值和比率差异的区间估计一、两个总体均值差异的估计:独立样本 的抽样分布两个总体均值之差的抽样分布的形式:如果两个总体的样本大小都足够大,可以以正态分布来近似如果两个总体的样本大小都足够大,可以以正态分布来近似。第四节 两个总体均值和比率差异的区间估计一、两个总体均值差异39 的点估计量为:的点估计量为:40 例例11下表是某商店从光顾市中心商店和郊区商店的顾客中抽取下表是某商店从光顾市中心商店和郊区商店的顾客中抽取的样本数据:的样本数据:试对两个不同区域的顾客年龄之差做出置信水平为试对两个不同区域的顾客年龄之差做出置信水平为95%95%的区间的区间估计。估计。解:依据区间估计的一般原理以及解:依据区间估计的一般原理以及 首先计算点估计的值首先计算点估计的值商店 被抽样的顾客数 样本平均年龄 样本的标准差市中心商店 郊区商店例1下表是某商店从光顾市中心商店和郊区商店的顾客中抽取的41 接下来计算极限误差接下来计算极限误差得到总体均值之差的得到总体均值之差的95%95%的置信区间为的置信区间为54.0654.06即(即(0.94,9.040.94,9.04)岁)岁 接下来计算极限误差得到总体均值之差的95%的置信区间为542(三)当某一个样本容量小于30或两个样本容量同时小于30时 假设:(1)两个总体都服从正态分布;(2)两个总体方差相等。此时(三)43 当总体方差未知时,我们不再对两个总体的方差进行单独估当总体方差未知时,我们不再对两个总体的方差进行单独估计而直接估计计而直接估计 将两个样本的数据结合起来可以提供一个总体将两个样本的数据结合起来可以提供一个总体方差方差 的估计的估计 当当 的点估计为的点估计为 当总体方差未知时,我们不再对两个总体的方差44 小样本情况下,用小样本情况下,用t t分布来估计两个总体均值之间的差异,分布来估计两个总体均值之间的差异,此时自由度为此时自由度为n1+n2-2n1+n2-2,例例2 2 对克利夫兰国家银行的两个支行顾客的独立随机样本的对克利夫兰国家银行的两个支行顾客的独立随机样本的账户余额进行核查得到下面的结果:账户余额进行核查得到下面的结果:小样本情况下,用t分布来估计两个总体均值之45 支行 被抽取的账户数 样本平均余额 样本标准差A B用这些数据来建立两个支行账户余额样本均值差异的置信度是用这些数据来建立两个支行账户余额样本均值差异的置信度是90%90%的置信区间。假定两个支行检察账户余额服从正态分布,且的置信区间。假定两个支行检察账户余额服从正态分布,且两个支行检察账户余额的方差相等。两个支行检察账户余额的方差相等。解:首先将两个样本的方差合并得到总体方差的合并估计:解:首先将两个样本的方差合并得到总体方差的合并估计:支行 被抽取的账户数 样46则有:标准差的对应估计值为则有:标准差的对应估计值为 当当=0.10=0.10时,查时,查t t分布表可得分布表可得 。因。因此,区间估计为:此,区间估计为:即(即(-21.41-21.41,181.41181.41)则有:标准差的对应估计值为 当=0.10时,47二、两个总体比率差异的估计二、两个总体比率差异的估计两个总体比例之差的推断和检验分别与两个总体的均值之差两个总体比例之差的推断和检验分别与两个总体的均值之差的推断方法大致相同的推断方法大致相同 适用于来自两个总体的独立、随机样本。适用于来自两个总体的独立、随机样本。两个总体比例之差的点估计量:两个总体比例之差的点估计量:期望值:期望值:标准差标准差二、两个总体比率差异的估计两个总体比例之差的推断和检验分别与48在大样本的情况下,以课本例题讲解在大样本的情况下,49第五节第五节 分层、整群和等距抽样的区间估计分层、整群和等距抽样的区间估计1、解释抽样推断的含义 第五节 分层、整群和等距抽样的区间估计1、解释抽样推断的含义506.5其他抽样方法下总方差的计算 在第六章中学习到,除简单随机抽样方法外,在现实中还可运用分层抽样、整群抽样、系统抽样等抽样方法,每一次抽样都涉及到对总体参数的估计过程。通过前面的知识,可知对总体参数的估计过程中比较关键的因素是计算总体方差。如果已知总体方差,总体参数区间估计的过程与前面介绍的方法相同。STAT6.5其他抽样方法下总方差的计算516.5.1分层抽样分层抽样在简单随机抽样中,我们计算总方差是采用的公式是在分层抽样中,我们事先将总体按一定的标志进行分层,所形成的数据实际等同于组距式数列,在组距式数列中,总方差需要运用方差加法定理来计算。STAT6.5.1分层抽样52 这就是说,如果要计算总方差,则需分别将组间方差和平均组内方差先计算出来。在分层抽样下,是否真的需要由组间方差和平均组内方差相加来计算总方差呢?我们来考察一下分层抽样的实施过程:层间抽样:在每一层抽取 全面调查 层间方差 层内抽样:抽取部分样本单位 抽样调查 层内方差 我们说抽样误差是抽样调查这种调查方式所特有的误差,因此上述两部分误差中只有由于抽样调查所形成的层内方差才是抽样误差的组成部分,而由于全面调查所形成的层间方差不是抽样误差的组成部分。STAT 这就是说,如果要计算总方差,则需分别将组间方53因此,STAT因此,54【例例7】某厂有甲、乙两个车间生产保温瓶,乙车间产量是甲车间的2倍。现按产量比例共抽查了60支,结果如下。试以95.45%的可靠程度推断该厂生产的保温瓶的平均保温时间的可能范围。【例7】某厂有甲、乙两个车间生产保温瓶,乙车间产量是甲车间的55【例例8】某地一万住户,按城乡比例抽取一千户,进行彩电拥有量调查,结果如下。试以95.45%的概率推断该地彩电拥有户比率的范围。【例8】某地一万住户,按城乡比例抽取一千户,进行彩电拥有量调566.5.2整群抽样整群抽样与分层抽样类似,整群抽样下,总方差的计算仍然需要分解:同样考察整群抽样的实施过程:层间抽样:在部分层中抽取 抽样调查 群间方差层内抽样:抽取全部样本单位 全面调查 群内方差类似的,只有群间方差是抽样误差的组成部分。STAT6.5.2整群抽样57因此,STAT因此,58【例例9】某乡播种某种农作物3000亩,分布在60块地段上,每块地段50亩。现抽取5块地,得资料如下。现要求以95%的概率估计这种农作物的平均亩产。总体:R=60群样本:r=5群【例9】某乡播种某种农作物3000亩,总体:R=60群59概念总结回顾概念总结回顾1、解释抽样推断的含义 简单的讲,抽样推断就是用样本中的信息来推断总体的信息。为什么要进行抽样推断?这是因为对于我们要研究的的问题来说,有的情况下我们掌握着总体的全部数据,因此总体的信息我们都能够得到而不需要推断。但在大部分情况下,我们对总体的全部数据是无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。概念总结回顾1、解释抽样推断的含义602、解释简单随机抽样、分层抽样、系统抽样和整群抽样的含义。简单随机抽样是指从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n的样本有相同的机会(概率)被抽中,这样的抽样方式称为简单随机抽样。分层抽样也称分类是指在抽样之前先将总体划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。为提高抽样的效果,在分层或分类时应使层内各元素差异尽量小,而使层与层之间的差异尽量大。系统抽样,也称等距抽样或机械抽样。先将总体总体各元素按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直到抽取n个元素形成一个样本。整群抽样是先将总体划分成若干群。然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察。第六章第六章 总体参数估计总体参数估计2、解释简单随机抽样、分层抽样、系统抽样和整群抽样的含义。第614、什么是重置抽样和不重置抽样?5、什么是抽样分布?某个样本统计量的抽样分布,从理论上讲就是在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频度分布或概率分布。它是针对样本估计量的分布。样本估计量是样本的一个函数,在统计学中称作统计量,因此抽样分布也是指统计量的分布。以样本平均数为例,它是总体平均数的一个估计量,如果按照相同的样本容量,相同的抽样方式,反复的抽取样本,每次可以计算一个平均数,所有可能样本的平均数所形成的分布,就是样本平均数的抽样分布。第六章第六章 总体参数估计总体参数估计4、什么是重置抽样和不重置抽样?第六章 总体参数估计626、样本统计量的分布与总体分布的关系是什么?由于现实中我们不可能将所有的样本都抽出来,因此,统计量的抽样分布实际上是一种理论分布,但它与总体分布存在着密切的关系,以均值的抽样分布为例,其抽样分布与原有总体的分布有关,如果原有总体是正态分布,那么,无论样本容量的大小,样本方差也服从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n。如果原有总体的分布不是正态分布,就要看样本容量的大小了,当n为大样本时(n30),根据统计上的中心极限定理可知,当样本容量n增大时,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于服从正态分布。其分布的数学期望为总体均值,方差为总体方差的1/n。第六章第六章 总体参数估计总体参数估计6、样本统计量的分布与总体分布的关系是什么?第六章 总体参637、样本均值抽样分布的两个主要特征是什么?它们与总体参数有什么关系?样本均值的期望值和样本均值的方差是样本均值抽样分布的两个主要特征值。第六章第六章 总体参数估计总体参数估计7、样本均值抽样分布的两个主要特征是什么?它们与总体参数有什648、简述评价估计量好坏的标准?1、无偏性。无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。2、有效性。一个无偏的估计量并不意味着它就非常接近被估计的参数,它还必须与总体参数的离散程度比较小。3、一致性。一致性是指随着样本增大,点估计量的值越来越接近总体的参数。一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数。第六章第六章 总体参数估计总体参数估计8、简述评价估计量好坏的标准?第六章 总体参数估计65 9、如何理解置信区间估计的原理?区间估计是以给出一个估计的范围来对总体参数做出估计,并相应的给出置信的概率。10、简述样本容量与置信水平、总体方差、边际误差的关系。从样本容量的公式可以看出,样本容量与置信概率成正比,在其他条件不变的情况下,置信概率越大,所需的样本容量越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量越大;样本容量与边际误差的平方成反比,我们可以接受的边际误差越大,所需的样本容量就越小。第六章第六章 总体参数估计总体参数估计 9、如何理解置信区间估计的原理?第六章 总体参数估66习题习题1、在抽样的基本概念中()A 全及总体与样本总体均是惟一的 B 全及总体与样本总体均不是惟一的 C 全及总体是惟一的且样本总体不是惟一的 D 全及总体不是惟一的且样本总体均是惟一的 2、在不重置抽样条件下,每个全及总体单位被选为样本单位的概率亦均为()A 1/N B 1/n C 1/N-1 D 1/n-1 CA习题1、在抽样的基本概念中()CA673、在不重复抽样的安排下,所有样本的可能个数为()A N!/n!(N-n)!B Nn C N!D n!4、在随机抽样理论中()A 简单随机抽样在抽样理论中作为其它抽样组织方法的基础 B 分层随机抽样在抽样理论中作为其它抽样组织方法的基础 C 整群抽样在抽样理论中作为其它抽样组织方法的基础 D 等距抽样在抽样理论中为作为其它抽样组织方法的基础AA第六章第六章 总体参数估计总体参数估计3、在不重复抽样的安排下,所有样本的可能个数为()AA第六章685、只要样本是随机抽取的,我们就可以认为样本可以基本上代替总体,这是_做保证。A 大数定律 B 中心极限定理 C 中值定理 D 离散特质6、大数定律的数学表达式为()7、当样本容量n30,则无论是否已知总体分布状态,样本平均数分布趋于正态分布,即()A第六章第六章 总体参数估计总体参数估计5、只要样本是随机抽取的,我们就可以认为样本可以基本上代替总698、如果已知总体变量服从正态分布,则样本平均数分布与总体分布()A 不同中心且总体分布更集中 B 同中心且样本平均数分布更集中 C 同中心且总体分布更集中 D 不同中心且样本平均数更集中B第六章第六章 总体参数估计总体参数估计8、如果已知总体变量服从正态分布,则样本平均数分布与总体分布70计算题计算题1、已知某树苗培植园内的树茎直径服从正态分布,从中随机的抽取了10株,测得其树茎直径的数据如下(单位:厘米)10.1 8.9 7.6 11.3 10.7 9.4 9.9 10.2 10.5 11.7 (1)试求该批树苗直径的平均值及标准差。(2)你能否推断该园内树苗直径的具体分布是什么?计算题1、已知某树苗培植园内的树茎直径服从正态分布,从中随机712、某县欲统计今年小麦产量,调查了全县100个村子的小麦产量,测得全县每个村子小麦产量的平均值为1700(吨)标准差为200(吨)。若从全县的100个村子中按重复抽样的方法随机抽取10个村子,则由10个村子组成的样本平均产量的期望值时多少?平均产量的标准差又是多少?若采用的是不重复抽样的方法,那么由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?第六章第六章 总体参数估计总体参数估计2、某县欲统计今年小麦产量,调查了全县100个村子的小麦产量723、某地区工人的平均工资是15元/小时,标准差为4元/小时。若从该地区抽取50个工厂,问所取样本的平均工资W的期望值和方差个是多少?平均工资W的抽样分布是什么?4、一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该电信服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前好的比例进行区间估计。第六章第六章 总体参数估计总体参数估计3、某地区工人的平均工资是15元/小时,标准差为4元/小时。735、为了确定某大学生佩戴眼镜的比例,调查人员欲对该大学的学生进行抽样调查。而根据以往的调查结果表明,该大学有75%的学生佩戴眼镜,则对于边际误差E分别为(1)5%;(2)10%;(3)15%时,抽取的样本量各为多少合适?(=0.05)6、为调查某单位每个家庭每天观看电视的平均时间是多长,随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。(1)试对家庭每天平均看电视时间进行区间估计。(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制在第一问的水平,问此时需调查多少户才能满足要求?(=0.05)第六章第六章 总体参数估计总体参数估计5、为了确定某大学生佩戴眼镜的比例,调查人员欲对该大学的学生747、据某市场调查公司对某市80名随机受访的购房者的调查,得到该购房者中本地人购房比例P的区间估计,在置信水平为=0.10下,其边际误差E=0.08。则:(1)这80名受访样本中本地购房者的比例P是多少?(2)若置信水平为=0.05,则要保持同样的精度进行区间估计,需要调查多少名购房者?第六章第六章 总体参数估计总体参数估计7、据某市场调查公司对某市80名随机受访的购房者的调查,得到75
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!