比率估计与回归估计课件

上传人:仙*** 文档编号:241781245 上传时间:2024-07-23 格式:PPTX 页数:36 大小:1.14MB
返回 下载 相关 举报
比率估计与回归估计课件_第1页
第1页 / 共36页
比率估计与回归估计课件_第2页
第2页 / 共36页
比率估计与回归估计课件_第3页
第3页 / 共36页
点击查看更多>>
资源描述
第五章第五章 比率估计与回归估计比率估计与回归估计2本章要点本章要点 本章讨论了简单随机抽样和分层随机抽样下比率估计量本章讨论了简单随机抽样和分层随机抽样下比率估计量和回归估计量的构造及性质。要求:和回归估计量的构造及性质。要求:掌握总体比率、比率估计量及回归估计量的概念。掌握总体比率、比率估计量及回归估计量的概念。了解比率估计量、回归估计量的偏倚、方差及方差的了解比率估计量、回归估计量的偏倚、方差及方差的估计量。估计量。掌握应用比率估计量及回归估计量的条件。掌握应用比率估计量及回归估计量的条件。3第一节第一节 问题的提出问题的提出n 在许多实际问题中常常涉及两个调查变量(指标)在许多实际问题中常常涉及两个调查变量(指标)Y 和和X。对于包含个抽样单元的总体除了对总体信息进行估计外,。对于包含个抽样单元的总体除了对总体信息进行估计外,常常要估计总体比率常常要估计总体比率R。总体比率在形式上总是表现为两个。总体比率在形式上总是表现为两个变量总值或均值之比。变量总值或均值之比。在涉及两个变量的抽样调查中,有两种情况需要应用比率在涉及两个变量的抽样调查中,有两种情况需要应用比率估计量。一种情况是利用双变量样本对总体比率进行估计需估计量。一种情况是利用双变量样本对总体比率进行估计需应用比率估计量,此时两个变量均为调查变量。另一种情况应用比率估计量,此时两个变量均为调查变量。另一种情况是一个变量为调查变量,另一个变量表现为与调查变量有密是一个变量为调查变量,另一个变量表现为与调查变量有密切关系的辅助变量,在对调查变量总体总值、总体均值等目切关系的辅助变量,在对调查变量总体总值、总体均值等目标量进行估计时,利用已知的辅助变量信息构造比率估计量标量进行估计时,利用已知的辅助变量信息构造比率估计量可以改进估计的精度。可以改进估计的精度。n 基于这种考虑利用已知的辅助变量信息构造比率估计量就基于这种考虑利用已知的辅助变量信息构造比率估计量就可使估计精度加以改进。可使估计精度加以改进。4 第二节第二节 比率估计比率估计n 一、比率估计量一、比率估计量 设对有两个调查变量设对有两个调查变量Y 和和X 的总体进行简单随机抽样的总体进行简单随机抽样,分别以,分别以y,x表示样本总值表示样本总值,以,以 表示样本均值,以表示样本均值,以 为样为样本比率本比率,用,用 作为总体比率作为总体比率R的估计称为的比率估计的估计称为的比率估计。比率估计量除了使用调查变量样本信息外,还要使用辅助变量比率估计量除了使用调查变量样本信息外,还要使用辅助变量总体信息与样本信息,而且是非线性估计量。这类估计量称为复杂总体信息与样本信息,而且是非线性估计量。这类估计量称为复杂估计量。由于比率估计量使用的信息比简单估计量多,因而有可能估计量。由于比率估计量使用的信息比简单估计量多,因而有可能比简单估计量有更高的精度。同时由于比率估计量是非线性估计量,比简单估计量有更高的精度。同时由于比率估计量是非线性估计量,因而对其性质的研究比对简单估计量要复杂得多。因而对其性质的研究比对简单估计量要复杂得多。5n二、二、比率估计量的偏倚与均方误差比率估计量的偏倚与均方误差 比率估计量是有偏估计量,但当样本量增大时其偏倚比率估计量是有偏估计量,但当样本量增大时其偏倚将趋于零将趋于零。理论上可以证明,理论上可以证明,分别为分别为 的近似无的近似无偏估计量偏估计量,而且对于比率估计量,其方差主要取决于而且对于比率估计量,其方差主要取决于 与与 之间的差异,当之间的差异,当 时,估计量方差将很小。时,估计量方差将很小。换言之,比率估计量将有很高的精度。这告诉我们,只换言之,比率估计量将有很高的精度。这告诉我们,只有当两个变量大致成正比例关系时,应用比率有当两个变量大致成正比例关系时,应用比率 估计量才能使估计精度有较大改进。估计量才能使估计精度有较大改进。6n三、三、比率估计量方差的估计与置信区间比率估计量方差的估计与置信区间 对于一般的对于一般的n,比率估计量呈右偏分布,只有,比率估计量呈右偏分布,只有当当n30,0.1,0.1这些条件同时满足时才这些条件同时满足时才能直接用正态分布构造置信区间。能直接用正态分布构造置信区间。R的置信区间为的置信区间为 其中其中 是标准正态分布的上是标准正态分布的上/2/2分位点,分位点,01。类似可得。类似可得 、Y的置信区间。的置信区间。7案例一案例一8解解 答过程答过程9案例二案例二n 10解答过程解答过程11n四、四、比率估计量优于简单估计量的条件比率估计量优于简单估计量的条件 定量分析计算表明,并非任何情况下比率估计量都优于简单估计量,定量分析计算表明,并非任何情况下比率估计量都优于简单估计量,只有当调查变量与辅助变量有较高的正相关性时比率估计量才能使估计只有当调查变量与辅助变量有较高的正相关性时比率估计量才能使估计精度有较大提高。若精度有较大提高。若 ,则只需当,则只需当 0.5 时比率估计量就比时比率估计量就比简单估计量精度高。简单估计量精度高。12n五、多元比率估计五、多元比率估计 对于调查变量对于调查变量Y,若有,若有p个具有正相关性的辅助变量个具有正相关性的辅助变量 则则可构造多元比率估计。可构造多元比率估计。设设 是是 的基于第的基于第k个辅助变量的比率估计,则个辅助变量的比率估计,则 的多元比率的多元比率估计量为:估计量为:其中其中 是相应变量的样本总值,是相应变量的样本总值,是辅助是辅助变量总体均值,变量总体均值,是适当选取的权,满足是适当选取的权,满足 。利用拉格朗日乘数法可计算得利用拉格朗日乘数法可计算得 此时最小方差为此时最小方差为 13案例三案例三14解答过程解答过程15n六、乘积估计六、乘积估计 当辅助变量当辅助变量X 与调查变量与调查变量Y 呈负相关关系时,不能应用比率估计呈负相关关系时,不能应用比率估计而应改用乘积估计而应改用乘积估计 乘积估计优于简单估计的条件是乘积估计优于简单估计的条件是 此时此时 在实际问题中与调查变量呈负相关的变量很少见,因此乘积估计在实际问题中与调查变量呈负相关的变量很少见,因此乘积估计应用极为有限。应用极为有限。16 第三节第三节 回归估计回归估计n 一、定义一、定义 在简单随机抽样下,总体均值在简单随机抽样下,总体均值 和总体和总体总值总值Y的回归估计量定义为:的回归估计量定义为:其中其中 ,分别为调查变量、辅助变量的分别为调查变量、辅助变量的样本均值,样本均值,是辅助变量的总体均值,是辅助变量的总体均值,称为回归系数。称为回归系数。17n二、二、为设定常数情形为设定常数情形 设设 是设定常数,取是设定常数,取 ,则回归估计量,则回归估计量是是 的无偏估计量。的无偏估计量。其方差为其方差为当当 时时 达最小值达最小值18n 三、三、取样本回归系数情形取样本回归系数情形 若若需根据样本确定,一个合理的选择是取需根据样本确定,一个合理的选择是取为样本为样本回归系数回归系数此时此时 的回归估计量的回归估计量为一复杂估计量,不再具有无偏性。为一复杂估计量,不再具有无偏性。19n四、回归估计与比率估计及简单估计的大样本比较四、回归估计与比率估计及简单估计的大样本比较 对于大的样本量,总有对于大的样本量,总有 这就是说在大样本下回归估计总是优于简单估计,仅在这就是说在大样本下回归估计总是优于简单估计,仅在0时两时两者效果相同。者效果相同。的充分必要条件为的充分必要条件为 这等价于这等价于 因此除非因此除非Y 关于关于X 的总体回归系数的总体回归系数BR,否则回归估计总是优于比,否则回归估计总是优于比率估计,仅在率估计,仅在BR时两者效果相同。时两者效果相同。20案例四案例四 21解答过程(解答过程(1)22解答过程(解答过程(2)23解答过程(解答过程(3)24第四节第四节 分层比率估计与分层回归估计分层比率估计与分层回归估计n一、分别比率估计与联合比率估计一、分别比率估计与联合比率估计n(一一)分别比率估计分别比率估计25n(二二)联合比率估计联合比率估计 26n二二 分别回归估计与联合回归估计分别回归估计与联合回归估计 (一)分别回归估计(一)分别回归估计27n(二)联合回归估计(二)联合回归估计28三、各种估计量的比较三、各种估计量的比较n 对分层随机抽样在有辅助变量可利用时,为提高估计精度可以采用分别比对分层随机抽样在有辅助变量可利用时,为提高估计精度可以采用分别比率估计、联合比率估计、分别回归估计、联合回归估计等多种形式的估计量,率估计、联合比率估计、分别回归估计、联合回归估计等多种形式的估计量,因此自然存在一个问题,即如何对这些估计量进行比较。因此自然存在一个问题,即如何对这些估计量进行比较。n 由以上各种估计量的构造可以知道,分别比率估计和分别回归估计必须由以上各种估计量的构造可以知道,分别比率估计和分别回归估计必须使用总体各层的辅助变量均值使用总体各层的辅助变量均值 或总值或总值 的信息,而联合比率估计和联合的信息,而联合比率估计和联合回归估计不要求使用总体各层的辅助变量信息,只要求使用总体的辅助变量回归估计不要求使用总体各层的辅助变量信息,只要求使用总体的辅助变量均值均值 或总值或总值X的信息,分别估计量比联合估计量对总体信息的使用更详细的信息,分别估计量比联合估计量对总体信息的使用更详细一些,因此,当各层样本量一些,因此,当各层样本量 都比较大时,分别比率估计精度比联合比率估都比较大时,分别比率估计精度比联合比率估计高,分别回归估计精度比联合回归估计高。计高,分别回归估计精度比联合回归估计高。n 但是各层样本量但是各层样本量 较小时,分别比率估计、分别回归估计将有较大偏倚,较小时,分别比率估计、分别回归估计将有较大偏倚,从而均方误差比较大。此时如果总样本量比较大,则采用联合比率估计、联从而均方误差比较大。此时如果总样本量比较大,则采用联合比率估计、联合回归估计更好一些。合回归估计更好一些。29案例五案例五30解答过程(解答过程(1)n 相邻两年产量之间存在较高的正相关性,因此对今年平均亩产进行估计时相邻两年产量之间存在较高的正相关性,因此对今年平均亩产进行估计时以去年产量为辅助变量构造分层比率估计和分层回归估计是适宜的,此处以去年产量为辅助变量构造分层比率估计和分层回归估计是适宜的,此处 n (1)分别比率估计分别比率估计31解答过程(解答过程(2)n(2)联合比率估计联合比率估计 32解答过程(解答过程(3)n(3)分别回归估计分别回归估计33解答过程(解答过程(4)n(4)联合回归估计联合回归估计 以上结果表明不论是比率估计还是回归估计,总有分别估计量优于联合以上结果表明不论是比率估计还是回归估计,总有分别估计量优于联合估计量;不论是分别估计量还是联合估计量,总有回归估计优于比率估计。估计量;不论是分别估计量还是联合估计量,总有回归估计优于比率估计。34编号为奇数的习题答案编号为奇数的习题答案5.15.1 2000,2000,36,136,1 0.95,t0.95,t1.96,1.96,0.0180.018,0.0000153590.000015359,0.00392 置信区间为 。5.35.3当当 时用第一种方法,用第一种方法,当当 时用第二种时用第二种方法,当方法,当 时两种方法都可使用。这是因为:时两种方法都可使用。这是因为:,若若 则则 0 0 0p经常不断地学习,你就什么都知道。你知道得越多,你就越有力量pStudyConstantly,AndYouWillKnowEverything.TheMoreYouKnow,TheMorePowerfulYouWillBe写在最后谢谢你的到来学习并没有结束,希望大家继续努力Learning Is Not Over.I Hope You Will Continue To Work Hard演讲人:XXXXXX 时 间:XX年XX月XX日
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!