第7章参数估计课件

上传人:29 文档编号:241566542 上传时间:2024-07-05 格式:PPT 页数:69 大小:843.46KB
返回 下载 相关 举报
第7章参数估计课件_第1页
第1页 / 共69页
第7章参数估计课件_第2页
第2页 / 共69页
第7章参数估计课件_第3页
第3页 / 共69页
点击查看更多>>
资源描述
第七章参数估计第七章参数估计1第七章参数估计1大学生每周上网花多少时间?大学生每周上网花多少时间?回答类别回答类别人数(人)人数(人)频率(频率(%)3小时以下小时以下321636小时小时3517.569小时小时3316.5912小时小时2914.512小时以上小时以上7135.5合计合计200100 平均上网时间为平均上网时间为8.58小时,标准差为小时,标准差为0.69小时。全校学生小时。全校学生每周的平均上网时间是多少?每周上网时间在每周的平均上网时间是多少?每周上网时间在12小时以上小时以上的学生比例是多少?你做出估计的理论依据是什么?的学生比例是多少?你做出估计的理论依据是什么?2大学生每周上网花多少时间?回答类别人数(人)频率(%)3小时学习目标学习目标1、掌握参数估计的基本方法和原理。、掌握参数估计的基本方法和原理。2、理解并掌握置信区间和置信水平的、理解并掌握置信区间和置信水平的含义。含义。3、理解并掌握评价估计量的标准。、理解并掌握评价估计量的标准。4、掌握一个总体参数的区间估计方法,、掌握一个总体参数的区间估计方法,了解两个总体参数区间估计的基本了解两个总体参数区间估计的基本方法。方法。5、掌握估计一个总体均值和总体比例、掌握估计一个总体均值和总体比例时样本量的确定方法。时样本量的确定方法。3学习目标1、掌握参数估计的基本方法和原理。31.参数估计:总体分布类型已知,仅需对分布参数估计:总体分布类型已知,仅需对分布 的未知参数进行的估计的未知参数进行的估计2.估计量:用于估计总体参数的随机变量估计量:用于估计总体参数的随机变量u如样本均值,样本比例、样本方差等如样本均值,样本比例、样本方差等例如例如:样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量3.估计值:估计参数时计算出来的统计量的具体值估计值:估计参数时计算出来的统计量的具体值u如果样本均值如果样本均值 x=80,则,则80就是就是 的估计值的估计值4.参数用参数用 表示,估计量表示,估计量用用 表示表示一、一、参数估计的一般问题参数估计的一般问题41.参数估计:总体分布类型已知,仅需对分布 平均数平均数平均数平均数标准差标准差标准差标准差比例比例比例比例参数参数 统计量统计量 x xs sp p 总体总体总体总体 样本样本样本样本5参数统计量 总体样本5参数估计的方法参数估计的方法矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计量法估估 计计 方方 法法点点 估估 计计区间估计区间估计6参数估计的方法矩估计法最小二乘法最大似然法顺序统计量法估 计点估计点估计(point estimate)1.1.用用样样本本的的估估计计量量的的某某个个取取值值直直接接作作为为总总体体参参数数的估计值的估计值例例如如:用用样样本本均均值值直直接接作作为为总总体体均均值值的的估估计计;用用两个样本均值之差直接作为总体均值之差的估计两个样本均值之差直接作为总体均值之差的估计2.2.无法给出估计值接近总体参数程度的信息无法给出估计值接近总体参数程度的信息l虽虽然然在在重重复复抽抽样样条条件件下下,点点估估计计的的均均值值可可望望等等于于总总体体真真值值,但但由由于于样样本本是是随随机机的的,抽抽出出一一个个具具体体的样本得到的估计值很可能不同于总体真值的样本得到的估计值很可能不同于总体真值l一一个个点点估估计计量量的的可可靠靠性性是是由由它它的的抽抽样样标标准准误误差差来来衡衡量量的的,这这表表明明一一个个具具体体的的点点估估计计值值无无法法给给出出估估计的可靠性的度量计的可靠性的度量 二战中的二战中的二战中的二战中的点估计点估计点估计点估计7点估计(point estimate)用样本的估计量的某个二战中的点估计二战中的点估计 德军有多少辆坦克?德军有多少辆坦克?二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的,他们把坦克从人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连续开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?们的生产编号。那么怎样利用这些号码来估计坦克总数呢?在这个问题中,总体参数是未知的坦克总数在这个问题中,总体参数是未知的坦克总数N,而缴获坦克的编而缴获坦克的编号则是样本。制造出来的坦克总数肯定大于等于记录的最大编号则是样本。制造出来的坦克总数肯定大于等于记录的最大编号。为了找到它比最大编号大多少,我们先找到被缴获坦克编号。为了找到它比最大编号大多少,我们先找到被缴获坦克编号的平均值,并认为这个值是全部编号的中点。因此样本均值号的平均值,并认为这个值是全部编号的中点。因此样本均值乘以乘以2就是总数的一个估计;当然要特别假设缴获的坦克代表就是总数的一个估计;当然要特别假设缴获的坦克代表了所有坦克的一个随机样本。这种估计了所有坦克的一个随机样本。这种估计N的公式的缺点是:不的公式的缺点是:不能保证均值的能保证均值的2倍一定大于记录中的最大编号。倍一定大于记录中的最大编号。8二战中的点估计 德军有多少辆坦N的另一个点估计公式是:用观测到的最大编号乘以因的另一个点估计公式是:用观测到的最大编号乘以因子子1+1/n,其中,其中 n 是被俘虏坦克个数。假如你俘虏了是被俘虏坦克个数。假如你俘虏了10 辆坦克,其中最大编号是辆坦克,其中最大编号是50,那么坦克总数的一个估,那么坦克总数的一个估计是(计是(1+1/10)50=55。此处我们认为坦克的实际数。此处我们认为坦克的实际数略大于最大编号。略大于最大编号。从战后发现的德军记录来看,盟军的估计值非常接近所从战后发现的德军记录来看,盟军的估计值非常接近所生产的坦克的真实值。记录仍然表明统计估计比通常通生产的坦克的真实值。记录仍然表明统计估计比通常通过其他情报方式作出估计要大大接近于真实数目。统计过其他情报方式作出估计要大大接近于真实数目。统计学家们做得比间谍们更漂亮!学家们做得比间谍们更漂亮!资资 料料 来来 源源:GUDMUND R.IVERSEN和和 MARY GERGRN著著,吴吴喜喜之之等等译译:统统计计学学基基本本概概念念和和方法,高等教育出版社,施普林格出版社,方法,高等教育出版社,施普林格出版社,2000。9N的另一个点估计公式是:用观测到的最大编号乘以因子1+1/n点估计量的常用评价准则:无偏性无偏性l无偏性:估计量的数学期望与总体待估参数的真值相等:P P()B BA A无偏无偏无偏无偏有偏有偏10点估计量的常用评价准则:无偏性无偏性:估计量的数学期望与总体点估计量的常用评价准则:有效性l 在两个无偏估计量中方差较小的估计量较为有效。AB 的抽样分布的抽样分布 的抽样分布的抽样分布P P()11点估计量的常用评价准则:有效性 在两个无偏估计量中估计量的常用评价准则:一致性l指随着样本容量的增大,估计量越来越接近被估计的总体参数。AB较小的样本容量较小的样本容量较大的样本容量较大的样本容量 P(X)X X12估计量的常用评价准则:一致性指随着样本容量的增大,估计量越来区间估计l根据事先确定的置信度1-给出总体参数的一个估计范围。l置信度1-的含义是:在同样的方法得到的所有置信区间中,有100(1-)%的区间包含总体参数。l抽样分布是区间估计的理论基础。估计值估计值(点估计点估计)置信下限置信下限置信上限置信上限置信区间置信区间13区间估计根据事先确定的置信度1-给出总体参数的一个估计置信区间的表述置信区间的表述(95%的置信区的置信区间)从均值为从均值为从均值为从均值为185185的总体中抽出的总体中抽出的总体中抽出的总体中抽出n=10n=10的的的的2020个样本构造出个样本构造出个样本构造出个样本构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 我没有抓住参数!我没有抓住参数!点估计值点估计值点估计值点估计值 14置信区间的表述(95%的置信区间)从均值为185的总体中二、一个总体参数的区间估计二、一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均均值比例比例方差方差15二、一个总体参数的区间估计总体参数符号表示样本统计量均值比例(一)总体均值的区间估计(一)总体均值的区间估计总体均值区间的一般表达式:总体均值的置信区间是由样本均值加减估计误差得到的估计误差由两部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度总体均值在置信水平下的置信区间可一般性地表达为 样本均值样本均值分位数值分位数值样本均值的标准误差样本均值的标准误差16(一)总体均值的区间估计总体均值区间的一般表达式:样本均值相关理论总体正态总体正态?n30?已已知知?否是是否否是实际中总体方差总是未知的,因实际中总体方差总是未知的,因而这是应用最多的公式。在大样而这是应用最多的公式。在大样本时本时t值可以用值可以用z值来近似。值来近似。根据中心极限定理得根据中心极限定理得到的近似结果。到的近似结果。未知时用未知时用s来估计。来估计。增大增大n?数学?数学变换变换?17相关理论总体正态?n30?2已知?否是是否否是实际中总体Example:用用SPSS进行进行总体均值总体均值区间估计区间估计l例:儿童电视节目的赞助商希望了解儿童每周看电例:儿童电视节目的赞助商希望了解儿童每周看电视的时间。下面是对视的时间。下面是对100名儿童进行随机调查的结名儿童进行随机调查的结果(小时)。计算平均看电视时间果(小时)。计算平均看电视时间95%的置信区间。的置信区间。39.719.534.727.041.315.120.531.318.317.021.529.915.016.436.823.424.128.923.424.440.646.423.639.435.519.529.331.220.634.915.531.638.938.727.226.514.715.628.424.043.920.629.19.521.042.413.932.829.832.933.038.028.720.619.738.637.117.015.123.421.021.829.321.322.823.432.511.343.830.815.823.220.333.530.037.824.426.929.027.727.122.036.123.022.126.522.926.930.225.223.835.321.635.730.822.724.521.926.550.318Example:用SPSS进行总体均值区间估计例:儿童电视节总体均值的区间估计总体均值的区间估计(例题分析例题分析)总体均值总体均值 在在1-置信水平下的置信区间为置信水平下的置信区间为儿童每周看电视的平均时间的儿童每周看电视的平均时间的95%95%95%95%置信区间为置信区间为置信区间为置信区间为25.5325.5325.5325.53分分分分钟钟钟钟28.8528.8528.8528.85分钟。分钟。分钟。分钟。19总体均值的区间估计(例题分析)总体均值在1-置信水平下SPSS输出结果(数据:输出结果(数据:tv.xls)操作:分析操作:分析-描述统计描述统计-探索探索统计量标准误均值27.191.8373均值的 95%置信区间下限25.530上限28.8525%修整均值26.977中值26.500方差70.104标准差8.3728极小值9.5极大值50.320SPSS输出结果(数据:tv.xls)操作:分析-描述统(二)总体比例的区间估计(二)总体比例的区间估计1.假定条件l总体服从二项分布l可以由正态分布来近似lnp(成功次数)和n(1-p)(失败次数)均应该大于52.使用正态分布统计量 z3.3.总体比例总体比例总体比例总体比例 在在在在1-1-置信水平下置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为的置信区间为样本比例样本比例分位数值分位数值样本比例的标准误差样本比例的标准误差21(二)总体比例的区间估计1.假定条件3.总体比例在总体比例的置信区间:例子总体比例的置信区间:例子解:显然有解:显然有因此可以用正态分布进行估计。因此可以用正态分布进行估计。/2=1.645结论:我们有90的把握认为悉尼青少年中每天都抽烟的青少年比例在19.55%23.85%之间。19861986年对悉尼年对悉尼995995名青少年的名青少年的随机调查发现,随机调查发现,有有216216人每天都人每天都抽烟。试估计悉抽烟。试估计悉尼青少年中每天尼青少年中每天都抽烟的青少年都抽烟的青少年比例的比例的90%90%的置的置信区间。信区间。22总体比例的置信区间:例子解:显然有结论:我们有90的把握认SPSS的计算结果的计算结果l在SPSS中将“是否吸烟”输入为取值为1和0的属性变量,权数分别为216和779。计算这一变量均值的置信区间即为比例的置信区间。统计量标准误均值.2171.01308均值的 90%置信区间下限.1956上限.23865%修整均值.1857中值.0000方差.170标准差.41247极小值.00极大值1.00范围1.00四分位距.0023SPSS的计算结果在SPSS中将“是否吸烟”输入为取值为1和(三)总体方差的区间估计(三)总体方差的区间估计1.估计一个总体的方差或标准差估计一个总体的方差或标准差2.假设总体服从正态分布假设总体服从正态分布3.总体方差总体方差 2 的点估计量为的点估计量为s2,且且4.总体方差在总体方差在1-置信水平下的置信区间为置信水平下的置信区间为24(三)总体方差的区间估计1.估计一个总体的方差或标准差4.总体方差的区间估计总体方差的区间估计(图示图示)1-1-1-1-总体方差的总体方差的总体方差的总体方差的总体方差的总体方差的1-1-1-1-1-1-的置信区间的置信区间的置信区间的置信区间的置信区间的置信区间自由度为自由度为自由度为自由度为n n-1-1的的的的 25总体方差的区间估计(图示)2 21-2总体方差的区间估计总体方差的区间估计(例题分析例题分析)【例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了25袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布。以以95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.326总体方差的区间估计(例题分析)【例】一家食品生产企业以生产总体方差的区间估计总体方差的区间估计(例题分析例题分析)解解:已知已知n25,1-95%,根据样本数据计算得根据样本数据计算得 s2=93.21 2置信度为置信度为95%的置信区间为的置信区间为 该企业生产的食品总体重量标准差的该企业生产的食品总体重量标准差的95%置信区置信区间为间为7.54g13.43g27总体方差的区间估计(例题分析)解:已知n25,1-9待估参数待估参数待估参数待估参数均值均值比例比例方差方差大样本大样本小样本小样本大样本大样本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分布一个总体参数的区间估计一个总体参数的区间估计(小结小结)28待估参数均值比例方差大样本小样本大样本2分布2已知2已三、两个总体参数的区间估计三、两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值差比例差方差比29三、两个总体参数的区间估计总体参数符号表示样本统计量均值差比(一)均值之差区间的一般表达式(一)均值之差区间的一般表达式1.两个总体均值的置信区间是由两个样本均值之差加减估计误差得到的2.估计误差由两部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度3.两个总体均值之差(1-2)在置信水平下的置信区间可一般性地表达为(x1-x2)分位数值分位数值(x1-x2)的标准误差的标准误差30(一)均值之差区间的一般表达式两个总体均值的置信区间是由两个两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)1.假定条件假定条件两个两个总体都服从正态分布,总体都服从正态分布,1、2已知已知若若不不是是正正态态分分布布,可可以以用用正正态态分分布布来来近近似似(n1 30和和n2 30)两个样本是独立的随机样本两个样本是独立的随机样本2.使用正态分布统计量使用正态分布统计量 z31两个总体均值之差的估计(独立大样本)1.假定条件31两个总体均值之差的估计两个总体均值之差的估计(大样本大样本)1.1,2已已知知时时,两两个个总总体体均均值值之之差差 1-2在在1-置信水平下的置信区间为置信水平下的置信区间为2.1、2未知时,未知时,两个总体均值之差两个总体均值之差 1-2在在1-置信水平下的置信区间为置信水平下的置信区间为32两个总体均值之差的估计(大样本)1.1,2已两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例】某某地地区区教教育育管管理理部部门门想想估估计计两两所所中中学学的的学学生生高高考考时时的的英英语语平平均均分分数数之之差差,为为此此在在两两所所中中学学独独立立抽抽取取两两个个随随机机样样本本,有有关关数数据据如如右右表表。建建立立两两所所中中学学高高考考英英语语平平均均分分数数之之差差95%的的置信区间置信区间 两个样本的有关数据两个样本的有关数据 中学中学1中学中学2n1=46n2=33S1=5.8 S2=7.233两个总体均值之差的估计(例题分析)【例】某地区教育管理部门两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解:两个总体均值之差在两个总体均值之差在1-置信水平下的置信区间为置信水平下的置信区间为 两两所所中中学学高高考考英英语语平平均均分分数数之之差差95%的的置置信信区间为区间为5.03分分10.97分分34两个总体均值之差的估计(例题分析)解:两个总体均值之差在两个总体均值之差的区间估计两个总体均值之差的区间估计(独立小样本独立小样本)35两个总体均值之差的区间估计(独立小样本)35两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本:1 1=)1.假定条件假定条件l两个两个总体都服从正态分布总体都服从正态分布l两个总体方差未知但相等:两个总体方差未知但相等:1=2l两个独立的小样本两个独立的小样本(n130和和n230)2.总体方差的合并估计量总体方差的合并估计量3.估计估计量量 x1 1-x2 2的抽样标准差的抽样标准差36两个总体均值之差的估计(独立小样本:12=22 两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本:1 1=)4.两个样本均值之差的标准化两个样本均值之差的标准化5.两个总体均值之差两个总体均值之差 1-2在在1-置信水平下的置信水平下的置信区间为置信区间为37两个总体均值之差的估计(独立小样本:12=22)两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例】为为估估计计两两种种方方法法组组装装产产品品所所需需时时间间的的差差异异,分分别别对对两两种种不不同同的的组组装装方方法法各各随随机机安安排排12名名工工人人,每每个个工工人人组组装装一一件件产产品品所所需需的的时时间间(单单位位:min)下下如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差相相等等。试试以以95%的的置置信信水水平平建建立立两两种种方方法法组组装装产产品品所所需平均时间差值的置信区间需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间 方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.52 21 138两个总体均值之差的估计(例题分析)【例】为估计两种方法组装两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解:根据样本数据计算得根据样本数据计算得 合并估计量为合并估计量为两两种种方方法法组组装装产产品品所所需需平平均均时时间间之之差差的的置置信信区区间间为为0.14min7.26min39两个总体均值之差的估计(例题分析)解:根据样本数据计算得某公司为了解男女推销员的推销能力是否有差某公司为了解男女推销员的推销能力是否有差别,随机抽取别,随机抽取16名男推销员和名男推销员和25名女推销员进名女推销员进行测试。男推销员的平均销售额为行测试。男推销员的平均销售额为30250元,标元,标准差为准差为18400元,女推销员的平均销售额为元,女推销员的平均销售额为33750元,标准差为元,标准差为13500元。假设男女推销员元。假设男女推销员的销售额服从正态分布,且方差相等。试建立的销售额服从正态分布,且方差相等。试建立男女推销员销售额之差的男女推销员销售额之差的95%的置信区间。的置信区间。40某公司为了解男女推销员的推销能力是否有差别,随机抽取16名男解解 假设用随机变量假设用随机变量 ,分别表示男女推销员的销售额,则由已分别表示男女推销员的销售额,则由已知条件有知条件有 又因两总体方差相等,可以估计出它们的共同方差:又因两总体方差相等,可以估计出它们的共同方差:我们有我们有95%的把握认为:男推销员的销售额既有可能比女推销员多的把握认为:男推销员的销售额既有可能比女推销员多6568元,也有可能比女推销员少元,也有可能比女推销员少13568元,所以男女推销员的推销能元,所以男女推销员的推销能力没有显著差别。力没有显著差别。41解 假设用随机变量 ,分别表示男两个总体均值之差的估计两个总体均值之差的估计(小样本小样本:1 1 )1.假定条件假定条件l两个两个总体都服从正态分布总体都服从正态分布l两个总体方差未知且不相等:两个总体方差未知且不相等:1 2l两个独立的小样本两个独立的小样本(n130和和n230,n1 n2)2.使用统计量使用统计量42两个总体均值之差的估计(小样本:12 22)1两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本:1 1 )两个总体均值之差两个总体均值之差 1-2在在1-置信水平下的置置信水平下的置信区间为信区间为自由度自由度自由度自由度43两个总体均值之差的估计(独立小样本:1222)两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例】沿沿用用前前例例。假假定定第第一一种种方方法法随随机机安安排排12名名工工人人,第第二二种种方方法法随随机机安安排排8名名工工人人,即即n1=12,n2=8,所所得得的的有有关关数数据据如如表表。假假定定两两种种方方法法组组装装产产品品的的时时间间服服从从正正态态分分布布,且且方方差差不不相相等等。以以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.22 21 144两个总体均值之差的估计(例题分析)【例】沿用前例。假定第一两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解:根据样本数据计算得根据样本数据计算得 自由度为自由度为 两两种种方方法法组组装装产产品品所所需需平平均均时时间间之之差差的的置置信信区区间间为为0.192min9.058mni45两个总体均值之差的估计(例题分析)解:根据样本数据计算得两个总体均值之差的估计两个总体均值之差的估计(匹配大样本匹配大样本)1.假定条件假定条件两个匹配的大样本两个匹配的大样本(n1 30和和n2 30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布2.两两个个总总体体均均值值之之差差 d=1-2在在1-置置信信水平下的置信区间为水平下的置信区间为对应差值的均值对应差值的均值对应差值的标准差对应差值的标准差对应差值的标准差对应差值的标准差46两个总体均值之差的估计(匹配大样本)假定条件对应差值的均值两个总体均值之差的估计两个总体均值之差的估计(匹配小样本匹配小样本)1.假定条件假定条件两个匹配的小样本两个匹配的小样本(n1 30和和n2 30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布 2.两个总体均值之差两个总体均值之差 d=1-2在在1-置信水置信水平下的置信区间为平下的置信区间为47两个总体均值之差的估计(匹配小样本)假定条件47两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例例】患患有有高高血血压压的的10名名男男患患者者正正在在进进行行一一种种锻锻炼炼与与饮饮食食的的系系统统调调养养,以以期期降降低低血血压压。表表中中给给出出每每个个病病人人训训练练开开始始时时和和六六个个月月后后的的 舒舒 张张 压压(单单 位位:mmHg)。由由此此数数据据集集,试试确确定定 (开开始始时时与与六六个个月月后后的的差差的的均均值值)的的99%置置信信区区间间,假假定定差差值值总总体体服服从从正正态分布。态分布。病人病人起始起始六个六个后后差值差值1141142-1216916543158150841801764514714346160157371751705816315769148143510163162148两个总体均值之差的估计(例题分析)【例】患有高血压的10名两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解:根据样本数据计算得根据样本数据计算得高高血血压压患患者者开开始始时时与与六六个个月月后后的的差差的的均均值值的的99%置置信信区区间间为为1.32 mmHg6.48 mmHg49两个总体均值之差的估计(例题分析)解:根据样本数据计算得1.假定条件假定条件l两个两个总体服从二项分布总体服从二项分布l大样本大样本l两个样本是独立的两个样本是独立的2.两个总体比例之差两个总体比例之差 1-2在在1-置信水平下置信水平下的置信区间为的置信区间为(二)两个总体比例之差的区间估计(二)两个总体比例之差的区间估计501.假定条件(二)两个总体比例之差的区间估计50两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析)【例例】在在某某个个电电视视节节目目的的收收视视率率调调查查中中,从从农农村村随随机机调调查查了了400人人,有有32%的的人人收收看看了了该该节节目目;城城市市随随机机调调查查了了500人人,有有45%的的人人收收看看了了该该节节目目。试试以以95%的的置置信信水水平平估估计计城城市市与与农农村村收收视视率率差别的置信区间差别的置信区间 1 12 251两个总体比例之差的估计(例题分析)【例】在某个电视节目的收两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析)解解:假假设设用用p1,p2分分别别表表示示某某电电视视节节目目城城市市和和农农村村的的收收视视率率,则则由由已已知知条条件件可可知知,n1=500,n2=400,p1=45%,p2=32%,1-=95%,z/2=1.96,1 1-2置信度为置信度为95%的置信区间为的置信区间为城市与农村收视率差值城市与农村收视率差值95%的置信区间为的置信区间为6.68%19.32%52两个总体比例之差的估计(例题分析)解:假设用p1,p(三)两个总体方差比的区间估计(三)两个总体方差比的区间估计1.比较两个总体的方差比比较两个总体的方差比2.用两个样本的方差比来判断用两个样本的方差比来判断如果如果S12/S22接近于接近于1,说明两个总体方差很接近说明两个总体方差很接近如果如果S12/S22远离远离1,说明两个总体方差之间存在差异说明两个总体方差之间存在差异3.总体方差比在总体方差比在1-置信水平下的置信区间为置信水平下的置信区间为53(三)两个总体方差比的区间估计比较两个总体的方差比53两个总体方差比的区间估计两个总体方差比的区间估计(图示图示)F FF F1-1-1-1-F F 总体方差比的总体方差比的1-1-的置信区间的置信区间方差比置信区间示意图方差比置信区间示意图54两个总体方差比的区间估计(图示)FF1-F 两个总体方差比的区间估计两个总体方差比的区间估计(例题分析例题分析)【例例】为为了了研研究究男男女女学学生生在在生生活活费费支支出出(单单位位:元元)上上的的差差异异,在在某某大大学学各各随随机机抽抽取取25名名男男学学生生和和25名女学生,得到下面的结果名女学生,得到下面的结果 男学生:男学生:女学生:女学生:试试以以90%置置信信水水平平估估计计男男女女学学生生生生活活费费支支出出方方差比的置信区间差比的置信区间 55两个总体方差比的区间估计(例题分析)【例】为了研究男女学生两个总体方差比的区间估计两个总体方差比的区间估计(例题分析例题分析)解解:根根据据自自由由度度 n1=25-1=24,n2=25-1=24,查查得得 F/2(24,24)=1.98,F1-/2(24,24)=1/1.98=0.505 12/22置信度为置信度为90%的置信区间为的置信区间为男女学生生活费支出方差比的置信区间为男女学生生活费支出方差比的置信区间为0.471.84 56两个总体方差比的区间估计(例题分析)解:根据自由度 n1两个总体参数的区间估计两个总体参数的区间估计(小结小结)待估参数待估参数待估参数待估参数均值差均值差比例差比例差方差比方差比独立大样本独立大样本独立小样本独立小样本匹配样本匹配样本独立大样本独立大样本 1 12 2、2 22 2已已 1 12 2、2 22 2未未Z Z分布分布Z Z分布分布 1 12 2、2 22 2已知已知 1 12 2、2 22 2未知未知Z Z分布分布 1 12 2=2 22 2 1 12 2 2 22 2正态总体正态总体F F分布分布Z Z分布分布t t分布分布t t分布分布Z分布分布t分布分布57两个总体参数的区间估计(小结)待估参数均值差比例差方差比独四、必要样本量的计算 样本量越大抽样误差越小。由于调查成本方面的原因,在调查中我们总是希望抽取满足误差要求的最小的样本量。l实际抽样误差l抽样平均误差l最大允许误差58四、必要样本量的计算 样本量越大抽样误差越小实际抽样误差l样本估计值与总体真实值之间的绝对离差称为实际抽样误差。l由于在实践中总体参数的真实值是未知的,因此实际抽样误差是不可知的;l由于样本估计值随样本而变化,因此实际抽样误差是一个随机变量。59实际抽样误差样本估计值与总体真实值之间的绝对离差称为实际抽样抽样平均误差抽样平均误差l抽样平均误差:样本均值的标准差,也就是前面说的标准误。它反映样本均值(或比例)与总体均值(比例)的平均差异程度。l例如对简单随机抽样中的样本均值有:或 (不重复抽样)l我们通常说“抽样调查中可以对抽样误差进行控制”,就是指的抽样平均误差。由上面的公式可知影响抽样误差的因素包括:总体内部的差异程度;样本容量的大小;抽样的方式方法。60抽样平均误差抽样平均误差:样本均值的标准差,也就是前面说的标最大允许误差l最大允许误差(allowable error):在确定置信区间时样本均值(或样本比例)加减的量,一般用E来表示,等于置信区间长度的一半。在英文文献中也称为margin of error。l置信区间=l最大允许误差是人为确定的,是调查者在相应的置信度下可以容忍的误差水平。61最大允许误差最大允许误差(allowable error):如何确定必要样本量?l必要样本量受以下几个因素的影响:1、总体标准差。总体的变异程度越大,必要样本量也就越大。2、最大允许误差。最大允许误差越大,需要的样本量越小。3、置信度1-。要求的置信度越高,需要的样本量越大。4、抽样方式。其它条件相同,在重复抽样、不重复抽样;简单随机抽样与分层抽样等不同抽样方式下要求的必要样本容量也不同。62如何确定必要样本量?必要样本量受以下几个因素的影响:62简单随机抽样下估计总体均值时样本容量的确定l式中的总体方差可以通过以下方式估计:l根据历史资料确定l通过试验性调查估计63简单随机抽样下估计总体均值时样本容量的确定式中的总体方差可简单随机抽样下估计总体比例时样本容量的确定l式中的总体比例可以通过以下方式估计:l根据历史资料确定l通过试验性调查估计l取为0.564简单随机抽样下估计总体比例时样本容量的确定64样本量的确定(实例1)需要多大规模的样本才能在需要多大规模的样本才能在 90%的置信的置信水平上保证均值的误差在水平上保证均值的误差在 5 之内之内?前前期研究表明总体标准差为期研究表明总体标准差为 45.nZE=222222(1645)(45)(5)219.2 220.向上取整65样本量的确定(实例1)需要多大规模的样本才能在 90%的置样本量的确定(实例2)一一家家市市场场调调研研公公司司想想估估计计某某地地区区有有电电脑脑的的家家庭庭所所占占的的比比例例。该该公公司司希希望望对对比比例例p的的估估计计误误差差不不超超过过0.05,要要求求的的可可靠靠程程度度为为95%,应应抽抽多多大大容容量量的的样样本本(没没有有可可利利用用的的p估计值)?估计值)?解:已 知 E=0.05,=0.05,Z/2=1.96,当未知时取为0.5。66样本量的确定(实例2)一家市场调研公司想估计某地区有电脑的家实例3你在美林证券公司的人力资源部工作。你计划在员工中进行调查以求出他们的平均医疗支出。你希望有 95%置信度使得样本均值的误差在$50 以内。过去的研究表明 约为$400。需要多大的样本容量?nZE=222222(196)(400)(50)24586246.67实例3你在美林证券公司的人力资源部工作。你计划在员工中进行经常不断地学习,你就什么都知道。你知道得越多,你就越有力量StudyConstantly,AndYouWillKnowEverything.TheMoreYouKnow,TheMorePowerfulYouWillBe写在最后经常不断地学习,你就什么都知道。你知道得越多,你就越有力量写谢谢你的到来学习并没有结束,希望大家继续努力Learning Is Not Over.I Hope You Will Continue To Work Hard演讲人:XXXXXX 时 间:XX年XX月XX日 谢谢你的到来演讲人:XXXXXX
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!