《统计学》(第二版)学习指导与习题训练答案-总体参数区间估计(6)

上传人:ra****d 文档编号:243486085 上传时间:2024-09-24 格式:PPT 页数:76 大小:924KB
返回 下载 相关 举报
《统计学》(第二版)学习指导与习题训练答案-总体参数区间估计(6)_第1页
第1页 / 共76页
《统计学》(第二版)学习指导与习题训练答案-总体参数区间估计(6)_第2页
第2页 / 共76页
《统计学》(第二版)学习指导与习题训练答案-总体参数区间估计(6)_第3页
第3页 / 共76页
点击查看更多>>
资源描述
,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,STAT,案例导入,一家食品生产企业以生产袋装食品为主,每天的产量约为8000袋左右。按规定每袋的重量应不低于100克,否那么即为不合格。为对产量质量进行检测,企业设有质量检查科专门负责质量检验,并经常向企业高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要求。,由于产品的数量大,进行全面的检验是不可能的,可行的方法是抽样,然后用样本数据估计平均每袋的重量。质检科从某天生产的一批食品中随机抽取了25袋,下表是对每袋食品重量的检验结果。假定该种袋装食品重量服从正态分布。,第六章 总体参数估计,STAT,根据表,1,的数据,质检科估计出该天生产的食品每袋的平均重量在克之间,其中,估计的可信程度为,95%,,估计误差不超过,4,克。产品的合格率在,95.68%,64.32%,之间,其中,估计的可信程度为,95%,,估计误差不超过,15.68%,。,表,1 25,袋食品的重量(克),112.5,102.6,100.0,116.6,136.8,101.0,107.5,123.5,95.4,102.8,103.0,95.0,102.0,97.8,101.5,102.0,108.8,101.6,108.4,98.4,100.5,115.6,102.2,105.0,93.3,STAT,第六章 总体参数估计,STAT,质检报告提交后,企业高层领导人提出几点意见:一是抽取的样本大小是否适宜?能不能用一个更大的样本进行估计?二是能否将估计的误差在缩小一点?比方,估计平均重量时估计误差不超过3克,估计合格率时误差不超过10%。三是总体平均重量的方差是多少?因为方差的大小说明了生产过程的稳定性,过大或过小的方差都意味着应对生产过程进行调整。,STAT,第六章 总体参数估计,第六章 总体参数估计,STAT,本章重点,1、单个总体均值的区间估计;,2、样本容量确实定;,3、两个总体均值之差的区间估计;,本章难点,1、小样本情形下总体参数的区间估计;,2、其他组织形式总体参数的区间估计及样本容量确实定;,一、 点估计,点估计就是用样本估计量的一个具体观测值直接作为总体的未知参数的估计值的方法。,如例中随机抽取的,100,头的平均每头毛重,(95.5kg),可作为,10000,头平均每头毛重 的点估计值,常用的估计量有:,(1),样本平均数 为总体平均数 的估计量;,(2),样本方差 为总体方差 的估计量;,(3),样本成数 为总体成数,估计量。,参数估计的根本问题,STAT,第六章 总体参数估计,在对总体特征做出估计时,并非所有估计量都是优良的,从而产生了评价估计量是否优良的标准。作为优良的估计量应该符合如下三个标准:,二、点估计的性质,STAT,STAT,第六章 总体参数估计,1、无偏性,如果样本某统计量的数学期望值等于其所估计的总体参数真值,那么这个估计统计量就叫做该总体参数的无偏估计量。如样本平均数的数学期望是总体平均数,那么样本均值是总体均值的无偏估计,量。这里无偏估计量是指没有系统偏差(非随机偏差)的平均意义上的量,即如果说一个估计量是无偏性的,并不是保证用于单独一次估计中没有随机性误差,只是没有系统性偏差而已。这是一个优良估计量的重要条件。,假设以 代表被估计的总体参数, 代表 的无偏估计量,那么有:,STAT,STAT,第六章 总体参数估计,2、一致性,假设估计量随样本容量n的增大而越来越接近总体参数值时,那么称该估计量为被估计参数的一致性估计量。估计量的一致性是从极限意义上讲的,它适用于大样本的情况。如果一个估计量是一致性估计量,那么采用大样本就更加可靠。当然,样本容量n增大时,估计量的一致性会增强,但调查所需的人、财、物力也相应增加。例如,以样本平均数估计总体平均数,符合一致性的要求,即存在如下关系:,式中 为任意小的正数。,STAT,STAT,第六章 总体参数估计,3、有效性,有效性是指无偏估计量中方差最小的估计量。无偏估计量只考虑估计值的平均结果是否等于待估计参数的真值,而不考虑估计的每个可能值及其次数分布与待估计参数真值之间离差大小的离散程度。我们在解决实际问题时,不仅希望估计值是无偏的,更希望这些估计值的离差尽可能地小,即要求比较各无偏估计量中与被估计参数的离差较小的为有效估计量。如样本平均数与中位数都是总体均值的无偏估计量,但在同样的样本容量下,样本平均数是有效的估计量。,STAT,STAT,第六章 总体参数估计,6.2,单个总体均值和比率的区间估计,点估计的缺点:不能反映估计的误差和精确程度,区间估计:利用样本统计量和抽样分布估计总体参数的可能区间,STAT,STAT,第六章 总体参数估计,STAT,【例1】Duotu公司是一家专营体育设备和附件的公司,为了监控公司的效劳质量, Duotu公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查,满意分数的标准差稳定在20分左右。最近一次对100名顾客的抽样显示,满意分数的样本均值为80分,试建立总体满意分数的区间。,一抽样误差,抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。,抽样误差,一、 总体均值的区间估计大样本n30,实际未知,STAT,第六章 总体参数估计,STAT,要进行区间估计,关键是将抽样误差 求解。假设 ,那么区间可表示为:,此时,可以利用样本均值的抽样分布对抽样误差的大小进行描述。,上例中,样本容量n=100,总体标准差 ,根据中心极限定理可知,此时样本均值服从均值为 ,标准差为,的正态分布。,即:,STAT,第六章 总体参数估计,STAT,二抽样误差的概率表述,由概率论可知,,服从标准正态分布,即,,有以下关系式成立:,一般称,,为置信度,可靠程度等,反映估计结果的可信程度。假设事先给定一个置信度,那么可根据标准正态分布找到其对应的临界值 。进而计算抽样误差,STAT,第六章 总体参数估计,STAT,假设,,那么查标准正态分布表可得,,抽样误差,此时抽样误差的意义可表述为:以样本均值为中心的的区间包含总体均值的概率是95%,或者说,样本均值产生的抽样误差是或更小的概率是。,常用的置信度还有90%,95.45%,99.73%,他们对应的临界值分别为,2和3,可以分别反映各自的估计区间所对应的精确程度和把握程度。,STAT,第六章 总体参数估计,STAT,在Duotu公司的例子中,样本均值产生的抽样误差是或更小的概率是。因此,可以构建总体均值的区间为,,由于,从一个总体中抽取到的样本具有随机性,在一次偶然的抽样中,根据样本均值计算所的区间并不总是可以包含总体均值,它是与一定的概率相联系的。如以下图所示:,三计算区间估计:,STAT,第六章 总体参数估计,STAT,图,1,根据选择的在 、 、 位置的样本均值建立的区间,STAT,上图中,有95%的样本均值落在阴影局部,这个区域的样本均值的区间能够包含总体均值。,因此,总体均值的区间的含义为,我们有95%的把握认为,以样本均值为中心的的区间能够包含总体均值。,通常,称该区间为置信区间,其对应的置信水平为,置信区间的估计包含两个局部:点估计和描述估计精确度的正负值。也将正负值称为误差边际或极限误差,反映样本估计量与总体参数之间的最大误差范围。,总结:,STAT,第六章 总体参数估计,STAT,在大多数的情况下,总体的标准差都是未知的。根据抽样分布定理,在大样本的情况下,可用样本的标准差,s,作为总体标准差的点估计值,仍然采用上述区间估计的方法进行总体参数的估计。,STAT,第六章 总体参数估计,STAT,【,例,2,】,某市交通部门为了对城市的环境进行监测,定期公布该市居民每天小汽车的里程数,抽取了,36,个居民作为一个简单随机样本,得到资料如下。试构造该市居民每天小汽车里程数的总体均值的,95%,的置信区间。,居民,汽车里程数,居民,汽车里程数,居民,汽车里程数,居民,汽车里程数,1,2,3,4,5,6,7,8,9,32,50,40,24,33,44,45,48,44,10,11,12,13,14,15,16,17,18,47,31,36,39,46,45,39,38,45,19,20,21,22,23,24,25,26,27,27,43,54,36,34,48,23,36,42,28,29,30,31,32,33,34,35,36,34,39,34,35,42,53,28,49,39,STAT,第六章 总体参数估计,STAT,分析:区间估计包括两个局部点估计和误差边际,只需分别求出即可到的总体的区间估计。,解:,1样本的汽车里程数,2误差边际,STAT,第六章 总体参数估计,STAT,样本标准差,误差边际,390%的置信区间为39.5 2.13 即,里。,注意,1置信系数一般在抽样之前确定,根据样本所建立的区间能包含总体参数的概率为,2置信区间的长度准确度在置信度一定的情况下,与样本容量的大小呈反方向变动,假设要提高估计准确度,可以扩大样本容量来到达。,STAT,第六章 总体参数估计,STAT,在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分布。我们讨论总体服从正态分布的情况。,t分布的图形和标准正态分布的图形类似,如以下图示:,二、总体均值的区间估计:小样本,n30,STAT,第六章 总体参数估计,STAT,0,标准正态分布,t分布自由度为20,t分布自由度为10,图2标准正态分布与t分布的比较,STAT,第六章 总体参数估计,STAT,在分布中,对于给定的置信度,同样可以通过查表找到其对应的临界值,利用临界值也可计算区间估计的误差边际,因此,总体均值的区间估计在总体标准差未知的小样本情况下可采用下式进行:,假定总体服从正态分布;,STAT,第六章 总体参数估计,STAT,【例3】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修职员掌握及其维修的操作,以减少培训工人所需要的时间。为了评价这种培训方法,生产经理需要对这种程序所需要的平均时间进行估计。以下是利用新方对名职员进行培训的培训天数资料。,根据上述资料建立置信度为的总体均值的区间估计。假定培训时间总体服从正态分布。,职员时间职员时间职员时间,STAT,第六章 总体参数估计,STAT,解:依题意,总体服从正态分布,小样本,此时总体方差未知。可用自由度为n-1=14的t分布进行总体均值的区间估计。,样本平均数,样本标准差,误差边际,95%的置信区间为,53.87 3.78 即,天。,STAT,第六章 总体参数估计,STAT,对总体比例 的区间估计在原理上与总体均值的区间估计相同。同样要利用样本比例 的抽样分布来进行估计。,假设, 那么样本比例近似服从正态分布。,同样,抽样误差,类似的,利用抽样分布正态分布来计算抽样误差,三、 总体比率的区间估计,STAT,第六章 总体参数估计,STAT,上式中, 是正待估计的总体参数,其值一般是未知,通常简单的用 替代 。,即用样本方差 替代总体方差 。,那么, 误差边际的计算公式为:,STAT,第六章 总体参数估计,STAT,【例4】1997年菲瑞卡洛通讯公司对全国范围每内的902名女子高尔夫球手进行了调查,以了解美国女子高尔夫球手对自己如何在场上被对待的看法。调查发现,397名女子高尔夫球手对得到的球座开球次数感到满意。试在95%的置信水平下估计总体比例的区间。,分解:,解:依题意,,1样本比例,2误差边际,STAT,第六章 总体参数估计,STAT,395%的置信区间0.44 0.0324,即,。,结论:在置信水平为95%时,所有女子高尔夫球手中有40.76%到47.24%的人对得到的球座开球数感到满意。,STAT,第六章 总体参数估计,STAT,第六章 总体参数估计,6.3 样本容量确实定,误差边际,其计算需要,假设我们选择了置信度,STAT,由此,得到计算必要样本容量的计算公式:,STAT,第六章 总体参数估计,一、总体均值估计时样本容量确实定,STAT,【例5】拥有工商管理硕士学位的毕业生每年年薪底薪的标准差大约为2000元,假定希望估计每年年薪底薪的95%的置信区间。如果研究者期望的极限误差为200元,样本容量应当有多大?,解:依题意,,可得,将以上结果取下一个整数385即为必要的样本容量。,第六章 总体参数估计,STAT,说明:,由于总体标准差 在大多数情况下 是未知的,可以有以下方法取得 的值。,1使用有同样或者类似单元的以前样本的样本标准差;,2抽取一个预备样本进行试验性研究。用实验性样本的标准差作为 的估计值。,3运用对 值的判断或者“最好的猜测,例如,通常可用全距的1/4作为 的近似值。,STAT,第六章 总体参数估计,STAT,在建立总体比例的区间估计时,确定样本容量的原理与第三节第一点中使用的为估计总体均值时确定样本容量的原理相类似。,二、 总体比率估计时样本容量确实定,STAT,第六章 总体参数估计,STAT,【例6】Louis HarrisAssociates对女性行政人员所进行的一项调查说明,33%的被调查者认为他们所在的公司十分适合女性行政人员工作。假定?职业女性?每年一度对该比率进行调查,令总体比率的值为 ,如果希望极限误差为 ,应选取多少名女性行政人员组成样本?假定区间估计中取置信水平为95.45%。,解:依题意,,可得,将以上结果取下一个整数89即为必要的样本容量。,STAT,第六章 总体参数估计,STAT,说明:,由于总体比例 在大多数情况下是未知的,可以有以下方法取得 的值。,1使用有同样或者类似单元的以前样本的样本比例;,2抽取一个预备样本进行试验性研究。用实验性样本的比例作为 的估计值。,3运用对 值的判断或者“最好的猜测;,4如果上面的方法都不适用,采用 。,STAT,第六章 总体参数估计,STAT,练习:,对某种白炽灯进行使用寿命检验,根据以往正常生产经验,灯泡使用寿命标准差为0.4小时,合格率为90%,先采用重复抽样的方式,在95.45%的概率保证度下,抽样平均使用寿命的极限误差不超过0.08小时,合格率的误差不超过5%,试计算必要的样本容量。,第六章 总体参数估计,6.4,两个总体均值之差、比率差异的区间估计,一、 两个总体均值差异的估计:独立样本,的抽样分布:,两个总体均值之差的抽样分布的形式:,如果两个总体的样本大小都足够大,可以以正态分布来近似,。,STAT,的点估计,STAT,第六章 总体参数估计,STAT,【例7】The Butler County银行与信托公司在S市有两个支行,现在该公司想对位置不同的支行进行调查以了解他们的信用卡使用情况,以便为公司采取新的营销措施提供依据。公司负责人对位于市区的A支行和另一个地处某郊区的B支行进行调查,以95%的置信水平估计这两个支行的信用卡余额均值的差异。,假定从两支行各抽取了一个由49张信用卡组成的随机样本,样本均值如下:银行A:4500元;银行B:3250元。设两个总体的方差分别为,解:依据区间估计的一般原理以及,首先计算点估计的值,STAT,第六章 总体参数估计,STAT,接下来计算误差边际,得到总体均值之差的95%的置信区间为,即, 元。,STAT,第六章 总体参数估计,STAT,假假设在例7中,我们事先并没有关于总体方差的任何资料,但是抽样过程已经取得了两个样本的标准差料如下:,STAT,第六章 总体参数估计,在,95%,的置信水平下,两个总体均值之差的置信区间为:,即125023.31=,元。,STAT,STAT,第六章 总体参数估计,假定:,1两个总体都服从正态分布。,2两个总体方差相等,假设总体方差 , 抽样分布是正态分布(无论样本容量大小),数学期望为 ,标准差为:,STAT,STAT,第六章 总体参数估计,假设总体方差 未知,用两个样本方差 估计。,STAT,STAT,第六章 总体参数估计,的区间估计的具体表达式为,STAT,STAT,第六章 总体参数估计,【,例,8】,某城市的规划小组想要估计两个相邻地区家庭平均收入之差。经过调查得到这两个地区家庭的独立随机样本提供如下的资料,表,6-3,两个相邻地区的独立样本数据,地区,1,地区,2,试计算两个地区平均收入之差的,95%,的置信区间。,(,假定两个总体服从方差相等的正态分布,),STAT,STAT,第六章 总体参数估计,在,95%,的置信水平下,两个地区家庭平均收入之差的区间为元至元之间。,STAT,两个总体比例之差的推断和检验分别与两个总体的均值之差的推断与检验的方法大致相同,适用于来自两个总体的独立、随机样本。,两个总体比例之差的点估计量:,期望值:,标准差,二、两个总体比率差异的估计,STAT,在大样本的情况下,,例9某税收机设想要比较两个地区办事处的工作质量。通过随机抽取每个办事处拟定的纳税申报单的样本并且确认其中哪些为正确的,该机构可以估计每个办事处的有错申报的比率。特别值得注意的是其比率之差。,STAT,第六章 总体参数估计,STAT,令:,假设来自于两个办事处的独立随机样本提供了下面信息:,STAT,第六章 总体参数估计,STAT,STAT,第六章 总体参数估计,STAT,归纳:,两个总体比例之差的区间估计:大样本情况下,90%的置信区间为,。,STAT,第六章 总体参数估计,6.5,分层抽样、整群抽样和等距抽样的区间估计,STAT,STAT,第六章 总体参数估计,一、分层随机抽样的区间估计,一总体均值的区间估计,在分层抽样中,总体首先被分成假设干个层,然后再从各层中随即抽取一定的样本单位组成一个样本。,设总体由个单位组成,并被划分为 层,各层包含 , , 个单位,那么 。又设总的样本容量为 ,从每一层各自独立地抽取一个简单随机样本,各层的样本容量分别为 , , ,满足 。,STAT,STAT,第六章 总体参数估计,整个总体的均值便是各层均值的加权算术平均数,即,第,h,层的样本均值的数学期望和方差分别为,STAT,根据数学期望的性质,有,STAT,第六章 总体参数估计,STAT,所以,估计量 的方差值与各层内方差 有关,与层之间的差异无关。,因此,是总体均值,的无偏估计量。,STAT,第六章 总体参数估计,STAT,假设各层的样本容量 是等比例分配的,即,那么 的方差就简化为:,STAT,第六章 总体参数估计,根据方差加法定理,在分组情况下,有,总方差 =组内平均方差 +组间方差 ,STAT,在分层抽样情形下,总方差仅由层内平均方差构成,小于简单随机抽样时的总方差,因此分层抽样的抽样误差比简单随机抽样的抽样误差小的结论。另外,我们还可以通过扩大层间方差进一步提高分层抽样的效率。,STAT,第六章 总体参数估计,STAT,总体层内方差 一般是未知的,可用样本层内方差 代替,得到方差的无偏估计:,假设给定置信度为 ,极限误差为,STAT,第六章 总体参数估计,STAT,因此总体均值 的 置信区间:,【,例,10,】,某厂有甲、乙两个车间生产保温瓶,乙车间产量是甲车间的,2,倍。现按产量比例共抽查了,60,支,结果如下。试以,95.45%,的可靠程度推断该厂生产的保温瓶的平均保温时间的可能范围。,STAT,第六章 总体参数估计,STAT,层,1,2,25,28,1.2,0.8,合计,解:从题意可知,样本单位在各层是等比例分配的,于是,点估计值,STAT,第六章 总体参数估计,STAT,抽样标准差,总体均值的,95.45%,的置信区间为:,,,27+0.24,,,即,26.76,27.24,小时。,STAT,第六章 总体参数估计,STAT,二样本容量确实定,重复抽样方法下,不重复抽样方法下,STAT,第六章 总体参数估计,STAT,三总体成数的区间估计,在大样本情形下,总体成数 的点估计量为:,方差为,STAT,第六章 总体参数估计,STAT,在大样本情形下,总体成数 的置信水平 的 置信区间:,STAT,第六章 总体参数估计,二、 整群抽样的区间估计,STAT,一总体均值的区间估计,设总体被划分为 群,每群都包含 个单位,总体的单位数 。又设总体均值为 ,总体第 群的均值为 。于是有:,总体的,个群看作是 个群单位。他们分别具有标志值,,,,,,,,,第六章 总体参数估计,STAT,设从总体的 个群单位中以等概率的方式随机抽取 个群单位组成样本,其标志值分别为 按简单随机抽样中的估计方法对总体均值作出估计。,的无偏估计为,STAT,第六章 总体参数估计,STAT,STAT,第六章 总体参数估计,STAT,当样本容量 足够大时,总体均值 的置信度为 的置信区间为,【,例,11,】,某市对,800,个商店某月份零售额作整群抽样调查,每,5,个商店分为一群,随机抽取,36,群作为样本,得到表所列资料。试求该月平均每个商店零售额的置信度为,95.45%,的置信区间。,STAT,第六章 总体参数估计,STAT,表,6-4,36,个样本群平均零售额资料 单位:元,样本群号,平 均,零售额,样本群号,平 均,零售额,样本群号,平 均,零售额,样本群号,平 均,零售额,1,3400,10,1950,19,3480,28,4230,2,3720,11,5000,20,2040,29,2600,3,3340,12,7200,21,2260,30,2850,4,2400,13,3800,22,5200,31,3450,5,2300,14,3572,23,3360,32,3680,6,2960,15,4020,24,3484,33,5480,7,3320,16,1740,25,3580,34,2926,8,5400,17,2400,26,3670,35,1856,9,4200,18,2880,27,4500,36,6300,STAT,第六章 总体参数估计,STAT,解:依题意有,,点估计值,样本群间方差,抽样标准差,极限误差,STAT,第六章 总体参数估计,STAT,故有,95.45%,的把握估计某月份每个商店的平均零售额在元与元之间。,STAT,第六章 总体参数估计,STAT,二样本群数确实定,假定估计量服从正态分布,在不重复抽样下,STAT,第六章 总体参数估计,STAT,三总体成数的区间估计,当样本容量 足够大时,总体成数 的置信度为 的置信区间为:,STAT,第六章 总体参数估计,STAT,三、等距抽样的区间估计,等距抽样的具体方式很多,区间估计的方法也比较复杂,如果总体内各单位的次序是按无关标志排队的,可以预期等距抽样本质上相当于简单随机抽样且有相同的方差,可用以前学过的方法进行区间估计。如果按有关标志排队,那么需根具体情况处理。,STAT,第六章 总体参数估计,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 商业计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!