第4章参数估计教学课件

上传人:沈*** 文档编号:241644641 上传时间:2024-07-12 格式:PPT 页数:37 大小:929.50KB
返回 下载 相关 举报
第4章参数估计教学课件_第1页
第1页 / 共37页
第4章参数估计教学课件_第2页
第2页 / 共37页
第4章参数估计教学课件_第3页
第3页 / 共37页
点击查看更多>>
资源描述
一、再论总体与样本、再论总体与样本 1.1.总体和总体参数总体和总体参数 在推断统计中,人们关心的是所研究对象的某个标志值 X(如产品的寿命,居民家庭月收入水平和月生活费支出等),它是一个随机变量。因而在推断统计中 总体总体某个随机变量取值的全体。按总体 X 所包含的个体数是有限还是无限的,可将总体分为有限总体和无限总体两类。总体参数总体参数总体指标,如总体均值、总体方差 2等,它们都是未知常数。4.1 统计量统计量1 2.简单随机样本简单随机样本 设总体为 X,X1,X2,Xn 为从总体 X 中抽取的 n 个个体,则称 X1,X2,Xn 为总体 X 的一个样本,并称 n 为样本容量。样本中每个个体 Xi 也是随机变量,称为样本分量。在一次抽样中所观测到的样本数据 x1,x2,xn,称为样本观察值。简单随机样本如果样本的各分量 Xi 相互独立,且与总体 X 是同分布的,则称该样本为简单随机样本。在推断统计中,都假定样本是简单随机样本。2 由于样本包含了总体的大量信息,因而可以用统计量来推断总体的未知参数,如总体均值、方差、比例等。几个常用的统计量几个常用的统计量二、统计量二、统计量设 X1,X2,Xn 为总体 X 的一个样本,g(X1,X2,Xn)若 g 中不含总体的未知参数,设 x1,x2,xn 是一组样本观察值,则称 g(x1,x2,xn)是统计量 g(X1,X2,Xn)的一个观察值。则称g(X1,X2,Xn)为一个统计量。为一连续函数,思考:统计量为什么不能含有未知参数?l样本均值样本均值:l样本方差样本方差:l样本标准差样本标准差:3一、点估计的概念一、点估计的概念 设 是总体 X 的未知参数,4.2 参数的点估计参数的点估计是用 X 的样本构造的统计量,的一个观察值去估计未知参数 的真值,的点估计;为 的估计量;为 的一个估计值。用一个特定样本对总体未知参数所作的估计,仅是所有可能估计值中的一个点,故称为点估计。称为参数并称统计量4在本章所讨论的问题中,需要估计的总体未知参数主要有总体成数、总体均值和总体方差。1.1.成数的概念成数的概念总体成数总体成数也称总体比例,指具有某一属性的个体数在总体中所占的比重,记为 P。二、点估计的方法二、点估计的方法 N1总体中具有某一属性的个体数;N 总体中的个体总数。思考 在社会、经济、管理领域有哪些是人们经常关注的成数?5 n1样本中具有某一属性的个体数;n 样本容量。可以证明,样本成数、样本均值和样本方差分别是总体成数、总体均值和总体方差的优良估计。即样本成数样本成数指样本中具有某种属性的个体数占的比重,记为 p。6 某企业在所生产的某种元件中,随机抽取了10个元件进行寿命试验,测得的寿命数据如下(小时)1502,1453,1367,1108,1650 1213,1208,1480,1550,1700 试估计该元件的平均寿命 和寿命的方差 2。解解:使用计算器的 SD 功能可得【例【例1 1】产品寿命均值和方差的估计产品寿命均值和方差的估计 7三、标准误差三、标准误差 1.1.抽样误差的概念抽样误差的概念 在一次抽样中,用样本均值估计总体均值或用样本成数估计总体成数时,估计的误差可以分别表示为 但由于总体均值和总体成数是未知的,因此无法了解一次次估计的抽样误差,为此需要引进抽样平均误差的概念。2.抽样平均误差抽样平均误差 指对所有可能的样本,估计量的估计值与总体参数间的平均离差。用样本均值估计总体均值的抽样平均误差就是估计量估计量 用样本成数估计总体成数的抽样平均误差就是估计量估计量 p 的总体标准差82.2.标准误差标准误差 由于估计量的总体标准差是未知的总体参数,因此在具体计算时就需要使用用它们的点估计标准误差标准误差。标准误差也就是估计量总体标准差的点估计,它就是估计量的样本标准差。在软件求解输出中通常都会给出相应的标标准误差准误差。总体均值估计的标准误差总体均值估计的标准误差记总体均值估计的标准误差为则不难求得估计总体成数的标准误差估计总体成数的标准误差记总体成数估计的标准误差为 Sp,同样可求得91.1.无偏性无偏性为未知参数 的估计量,则称为 的无偏估计量,无偏估计不会出现倾向性的估计偏差,是对估计量的最基本要求。可以证明,对任意总体,样本成数、样本均值和样本方差都分别是总体成数、总体均值和总体方差的无偏估计。四、估计量的评价标准四、估计量的评价标准简称无偏估计。若 思考:估计量为什么要满足无偏性?=无偏估计 有偏估计10有效性是衡量估计量最重要的标准。是参数 的两个无偏估计,有效;是 所有是 的最小方差无偏估计,2.有效性有效性若对相同的样本容量,若则称也称为 的有效估计。样本均值和样本成数都是总体均值和总体成数的有效估计;而对正态总体,是总体方差的有效估计。可以证明,对任意总体,样本方差也无偏估计中方差最小的,思考 在有效性的定义中为什么要固定样本容量?为什么有效性是衡量估计量最重要的标准?在样本容量相同时,有效估计是所有无偏估计中抽样平均抽样平均误差误差最小的。114.3 区间估计区间估计 由于点估计存在误差,因此仅对总体参数作出点估计是不够的,还需要了解估计的精度及其误差。一、区间估计的概念区间估计的概念 所谓区间估计,就是在给定的可信度下,估计未知参数的可能取值范围,即求未知参数的置信区间。设 为总体分布的未知参数,若由样本确定的两个统计量和对给定的小概率,满足就称区间为 的置信度为 1-的置信区间。12二、总体均值的区间估计二、总体均值的区间估计xf(x)0n=1n=4n=10n=,N(0,1)l标准正态分布分布是标准正态分布分布是 t 分布的极限分布分布的极限分布l当当 n 很大时,很大时,t 分布近似于标准正态分布。分布近似于标准正态分布。1.t 分布分布 t 分布是统计学中一个重要的分布,它有一个参数称为自由度,自由度为 n 的 t 分布分布记为 tt(n)。t t 分布密度函数的图形分布密度函数的图形130 xf(x)t 分布的分布的右侧侧 分位点分位点 t(n)t(n)为自由度为 n 的 t 分布中满足下式的右侧 分位点:P t t(n)=t(n)由给定的概率,可查表得到 t(n)。t(n)是什么你理解了吗?你会查 t 分布表吗?14可用 Excel 的统计函数 TINV 返回 t(n)。格式格式:TINV(2,n)功能功能:返回 t(n)的值。说明:TINV(,n)返回的是 t/2(n)的值。用 Excel 求 t(n)152.总体均值的置信区间总体均值的置信区间t(n-1)和 S2 分别为由此可得 的置信度为 1-的置 故对给定的置信度 1-,有即设 X1,X2,Xn 为 X 的容量为 n 的样本,可以证明,统计量 /2/2 t/2(n-1)-t/2(n-1)0f(x)x1-总体 X 的为样本均值和样本方差。信区间为16允许误差允许误差 在给定置信度的条件下,允许误差反映了区间估计的精度或误差大小,它是 t/2(n-1)与标准误差的乘积。显然,置信度越高,/2 就越小,t/2(n-1)的值就越大;而样本容量越大,标准误差就越小,同时t/2(n-1)的值也会稍微减小。因此在区间估计中,调查者可以通过控制样本容量,来达到所需要的估计精度。在总体均值的置信区间中,称为置信区间的允许误差允许误差。17【例【例2 2】求例1中电子元件平均寿命 的95%置信区间。故该电子元件平均寿命的 95%置信区间为解:解:由例1,/2=0.025,=1423,S=196.5,=1-0.95=0.05,n=20,t/2(n-1)=t0.025(19)=2.0930 思考 以上求总体均值置信区间的方法你理解了吗?18用用 Excel 求解总体均值的置信区间求解总体均值的置信区间 可用 Excel 的【工具】“数据分析”“描述统计”求解总体均值 的置信区间。19课堂练习课堂练习 1 某压缩机厂随机抽取了10台压缩机进行寿命试验,测得寿命数据(小时)如下:15020,14530,13670,11080,1650012130,12080,14800,15500,17000求该厂所生产压缩机平均寿命的置信度为95%的置信区间。20 1.标准正态分布的右侧标准正态分布的右侧 分位点分位点 Z Z 是标准正态分布中满足下式的右侧分位点:P Z Z =0f(x)x z(Z)三、三、总体成数的区间估计总体成数的区间估计可倒查正态分布表得到 Z。如:要查 Z0.025,查正态分布表,(1.96)=0.975,故 Z0.025=1.961-=0.975,思考:你知道怎样查 Z 吗?=1-21可用 Excel 的统计函数 NORMSINV 返回 Z。格式:NORMSINV(1-)功能:返回 Z 的值。注意注意:NORMSINV()返回的是 Z1-的值。用 Excel 求 Z222.2.总体成数的置信区间总体成数的置信区间设总体成数为 P,可以证明,统计量对给定的置信度1-,有同样可得,总体成数的置信度为 1-的置信区间为在大样本的条件下,同样称 d 为置信区间的允许误差允许误差,它是 Z/2 与标准误差的乘积。/2/2 Z/2-Z/20f(x)x1-23【例例3 3】某市为了解市民对反腐败工作的满意度,随机调查了 500 位市民,其中有 108 人表示满意。求该市市民中对反腐败工作总体满意度 P 的置信度为95%的置信区间。在 95%置信度下,该市对反腐败工作感到满意的市民比例为以上求总体成数置信区间的方法你理解了吗?解解:满意度为成数,=1-0.95=0.05,/2=0.025n=500,,查表得 Z0.025=1.96,样本成数 p=108/500=21.6%24课堂练习课堂练习 2 某厂在所生产的产品中随机抽取了300件进行质量检验,其中有5件次品,求该厂产品次品率的置信度为95%的置信区间。25样本容量大,可以提高统计推断的精度,但将增加不必要的人力、费用和时间开支。如果的样本容量过小,则又会使统计推断的误差过大,推断结果就达不到必要的精度要求。确定样本容量的原则确定样本容量的原则 在满足所需的置信度和允许误差的条件下,确定所需的最低样本容量。四、样本容量的确定四、样本容量的确定261.1.总体均值估计时样本容量的确定总体均值估计时样本容量的确定 在给定置信度和允许误差 d 的条件下,由可得 上式中样本标准差也是未知的,通常可以先通过小规模抽样作出估计。由于使用的是近似公式,可知实际采用的最低样本容量应比计算结果稍大。但由于样本容量 n 是未知的,因此上式中的 t/2(n-1)也是不确定的,可用 Z/2 代替 t/2(n-1),得27【例【例4 4】在例2 的电子元件平均寿命的区间估计问题中,要求在95%的置信度下,使估计的允许误差不超过100小时,并设已得到例1的先期抽样数据。则至少需要抽取多少元件的进行寿命试验?解解:由例1,S=196.5,可知至少需要抽取15个元件进行寿命试验。=1-0.95=0.05,/2=0.025,Z0.025=1.96,282.2.总体成数估计时样本容量的确定总体成数估计时样本容量的确定其中样本成数 p 也是未知的。在产品次品率等问题的估计中,可先通过小规模抽样作出估计,也可根据过去的信息估计。由于当 p=0.5 时,p(1-p)达到最大值。因此在民意调查民意调查和满意度调查满意度调查中,应取 p=0.5 29案例讨论题:民意调查中的问题国外民意调查机构在进行民意调查时,通常要求(在 95%的置信度下)将调查误差(即置信区间的 d 值)控制在 3%以内。问为满足该调查精度要求,至少需要调查多少选民?如果要求在 95%的置信度下,调查误差为 2%,则至少需要调查多少选民?在估计总体成数时,样本容量要多大才是大样本?30区间估计小结区间估计小结 均值 成数 P31本章内容到此结束本章内容到此结束 32课堂练习课堂练习 1 解答解答 压缩机平均寿命的置信度为95%的置信区间为 由所给数据,可求得:S=1965,n=10,=1-0.95=0.05,t/2(n-1)=t0.025(9)=2.2622你做对了吗?33课堂练习课堂练习 2 解答解答解解:次品率为成数,=1-0.95=0.05,/2=0.025,n=300,查表得 Z0.025=1.96,样本成数 p=5/300=0.0167,该厂产品次品率的置信度为95%的置信区间为你做对了吗?34案例讨论题解答案例讨论题解答可知在总体成数的估计中,样本容量至少要到1000左右才是大样本。要求 d=0.02,故需要的样本容量至少为本案例中 p 未知,由于是民意调查,故可取 p=0.5,d=0.03,=1-0.95=0.05,/2=0.025,Z0.025=1.96,故需要的样本容量至少为你做对了吗?35谢谢!
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!