资源描述
*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第九章 参数估计,(Parameters estimation),参数估计,,通俗地说,就是根据抽样结果来合理,地、科学地估计总体的参数很可能是什么?或者在什,么范围。,点估计,:根据样本数据算出一个单一的估计值,,用来估计总体的参数值。,区间估计,:计算抽样平均误差,指出估计的可信,程度,进而在点估计的基础上,确定总体参数的所在,范围或区间。,11/15/2024,1,第九章 参数估计(Parameters estima,第一节 点估计,(Point estimation),点估计:点值估计,是以一个最适当的,样本统计值来代表总体参数值。,估计量如果具有无偏性、一致性和有效,性,就可以认为这种统计量是总体参数的合理,估计或最佳估计。,11/15/2024,2,第一节 点估计(Point estimation),一、求点估计值的标准,无偏性,:要求统计量抽样分布的均值恰好等于被估计的参数之值。比如,中心极限定理告诉我们,样本均值抽样分布的均值恰好等于总体均值,因此用样本均值估计总体均值就满足这个标准。,有效性,:要求估计值的抽样分布有较小的分散性,即选择抽样分布的标准差较小的统计量作为估计量。,一致性,:要求统计量随着样本容量,n,的增大以更大的概率接近被估计参数。,11/15/2024,3,一、求点估计值的标准8/7/20233,二、点估计值的计算,1.总体均值的点估计,2.总体方差的点估计值,在统计学中,常常用符号“”来表示无偏估计量。数学上可以证明,对于随机样本而言,才是总体方差 的无偏估计量,它称为修正样本方差。,11/15/2024,4,二、点估计值的计算 在统计学中,常常用符号,例研究者要调查某社区居民家庭收入分,布的差异情况,现随机抽查了10户,得到样本,方差为200(元,2,)。试以此资料估计总体家庭,收入分布的差异情况。,解 因为样本容量较小,宜用修正样本,方差作为总体方差点估计量。即,222.2,11/15/2024,5,例研究者要调查某社区居民家庭收入分8/7,第二节 区间估计,(Interval estimation),一、有关区间估计的几个概念,1.置信区间:,区间估计是求所谓置信区间的方法。置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。,2.显著性水平 :,用置信区间来估计的不可靠程度。,区间估计的任务是,在点估计值的两侧设置一个区间,使得总体参数被估计到的概率大大增加。可靠性和精确性(即信度和效度)在区间估计中是相互矛盾的两个方面。,11/15/2024,6,第二节 区间估计(Interval estimation),3.置信度(水平),:用置信区间估计的可靠性(把握度),4.抽样平均误差 与概率度 Z,抽样平均误差 :样本均值抽样分布的标准差。反映在参数周围抽样平均值的平均变异程度。,越大,样本均值越分散。,概率度:Z在参数估计中被称为概率度,其大,小由,决定.,11/15/2024,7,3.置信度(水平):用置信区间估计的,显著性水平、置信水平、概率度,之间的关系:,=0.10时,=0.90,Z,/2,=1.65,=0.05时,=0.95,Z,/2,=1.96,=0.01时,=0.99,Z,/2,=2.58,11/15/2024,8,显著性水平、置信水平、概率度8/7/2023,二、,区间估计的做法,从点估计值开始,向两侧展开一定倍数的抽样平,均误差,并估计总体参数很可能就包含在这个区间之,内。,11/15/2024,9,二、区间估计的做法8/7/20239,对参数 的区间估计的步骤,:,1.首先从总体抽取一个样本,根据收集的样本资,料求出它 的均值。,2.根据合乎实际的置信水平查表求得概率度,3.根据总体标准差和样本容量求出抽样平均误差,4.以均值为基准,向两侧展开 倍抽样平均误差,的区间。,抽样极限误差,(,更普遍地可以写成抽样估计的允许误差,),抽样估计的精度,11/15/2024,10,对参数 的区间估计的步骤:8/7/202310,三、大样本,总体均值的区间估计,(根据总体方差是否知道,估计分两种情况),1.已知,2.未知,用 代替,11/15/2024,11,三、大样本,总体均值的区间估计8/7/202311,例 设某工厂妇女从事家务劳动服从正态分布,,0.66,2,,根据36人的随机抽样调查,样本每天平均从事家务劳动的时间为2.65小时,求 的置信区间(置信度 =0.95)。,解 按题意,此为大样本,且总体方差已知,又,36,2.65,0.66,0.95。,查表得 1.96,代入公式有,2.65 1.96 2.65 0.22,因此,有95的把握,该厂妇女的平均从事家务劳动的时间在2.87 2.43小时之间。,11/15/2024,12,例 设某工厂妇女从事家务劳动服从正,从来自在“白领犯罪与罪犯生涯:一些初步研究结果”的一项研究报告的数据表明,白领犯罪可能是年纪较大者,并且显示比街头罪犯有较低的犯罪率。给出数据为:白领犯罪发作平均年龄为54岁,=100,标准差被估计为7.5岁。建立真实平均年龄的90%置信区间。,11/15/2024,13,从来自在“白领犯罪与罪犯生涯:一些初步,例 从某校随机地抽取100名男学生,测得平均身,高为170厘米,标准差为7.5厘米,试求该校学生平均身,高95的置信区间。,解 按题意,此为大样本,且总体方差未知,又,100,170,7.5,0.95,查表得 1.96,代入公式有,1701.96 1701.47,因此,有95的把握,该校学生的平均身高在,168.5 171.5厘米之间。,11/15/2024,14,例 从某校随机地抽取100名男学生,测得,1.小样本,且为正态总体,总体均值的区间估计,(用,分布),第三节 其他类型的置信区间,11/15/2024,15,第三节 其他类型的置信区间 8/7/202315,例,在一个正态总体中抽取一个容量为25的样本,其均值为52,标准差为12,求置信水平为95的总体均值的置信区间。,解 根据题意,总体方差未知,且为小样本,故用 分布统计量。由95置信水平查 分布表得概率度 (24)2.064,代入公式得,522.064 525.06,因此,置信水平95的总体均值的置信区,间是从46.94到57.06。,11/15/2024,16,例 在一个正态总体中抽取一个容,2.大样本总体成数的估计,从总体的均值估计过渡到总体的成数估计,其方法和,思路完全相同,只要用 代替 ,用 代替,若总体成数未知,允许误差取,或,11/15/2024,17,2.大样本总体成数的估计8/7/202317,例假若从某社区抽取一个由200个家庭组成的样,本,发现其中有36%的家庭由丈夫在家庭开支上作决,定的次数超过半数。试问家庭开支的半数以上由丈夫,决定的家庭的置信区间是多少?(置信水平99%),解法一,解法二,11/15/2024,18,例假若从某社区抽取一个由200个家庭组成,三、总体方差的区间估计,由第八章 分布的性质,我们知道有,因此,对于给定的置信水平,,总体方差的区间估计为,11/15/2024,19,三、总体方差的区间估计8/7/202319,例,研究者调查某社区居民家庭收入情况,现随机抽查了10,户,得到样本方差为S200(元,2,),试以90的置信水平估计居民,总体家庭收入之方差的置信区间。,解 根据题意,查分布表得,3.325,16.919,代入公式有,所以该社区居民收入之方差90置信水平的置信区间为,118.2601.5,(元,2,)。,11/15/2024,20,例 研究者调查某社区居民家庭收入情况,,第四节 抽样平均误差,1.简单随机抽样,回置抽样,不回置抽样,校正因子 主要用于总体不够大时。,11/15/2024,21,第四节 抽样平均误差1.简单随机抽样8/7/20232,抽样设计效果指标deff,Deff1,说明该抽样方式误差小于简单随,机抽样,11/15/2024,22,抽样设计效果指标deff8/7/202322,2.分层抽样,层内方差的平均(层间方差不进入):,回置抽样:,不回置抽样,11/15/2024,23,2.分层抽样8/7/202323,3.整群抽样,总体可看作是以群为单位的简单随机抽样。,群间方差(群内方差不进入):,整群抽样平均误差:,11/15/2024,24,3.整群抽样8/7/202324,第五节 样本容量的确定,回置:,不回置:,11/15/2024,25,第五节 样本容量的确定回置:8/7/202325,设某市家庭月户均收入服从正态分布,标准差为,160元,现要对该市家庭之月平均收入加以估计,,(1)若置信水平为95%,平均收入的最大误差在,10元以内,问样本容量为多少?,(2)若置信水平为90%,平均收入的最大误差在,10元以内,问样本容量为多少?,(3)若置信水平为99%,平均收入的最大误差在,10元以内,问样本容量为多少?,(4)若置信水平为95%,平均收入的最大误差在,20元以内,问样本容量为多少?,(5)改变最大误差,对样本大小有什么影响?,(6)改变置信水平,对样本大小有什么影响?,(983,697,1704,246),11/15/2024,26,设某市家庭月户均收入服从正态分布,标准差为8/,练习,1、根据居民100户抽样家计调查,居民用于食品,费用占总收入的比例平均为45%,比例的标准差为,20%。求食品费用占居民总收入比例的区间估计(置,信度为95%)。,2、根据某大学100名学生的抽样调查,每月平均,用于购买书籍的费用为4.5元,标准差为5元,求大学,生每月用于购买书籍费用的区间估计(置信度为,95%)。,3、某工厂根据200名青年职工的抽样调查,其中60%,参加各种形式的业余学习。求青年职工参加业余学习,比例的区间估计(置信度为95%)。,(0.41,0.49)(3.52,5.48)(0.54,0.66),11/15/2024,27,练习 1、根据居民100户抽样家计调查,居民用,4、从7225名社区居民中以不回置法抽取500成人,的调查显示,51%的回答者认为“父母在必要时应该打,小孩”。尽管大部分儿童成长专家说,打是不恰当的。,请指出在置信水平为99%时成人总体参数 的估计的,最大误差。,5、进行电话调查来估计有个人电脑的住户的比,例。被调查的350户中,75户有个人电脑。(1)给出,有个人电脑的总体比例的点估计;(2)给出95%的置,信度时估计的最大误差。,11/15/2024,28,4、从7225名社区居民中以不回置法抽取5,
展开阅读全文