抽样推断与参数估计

上传人:lisu****2020 文档编号:253005555 上传时间:2024-11-27 格式:PPT 页数:39 大小:1.63MB
返回 下载 相关 举报
抽样推断与参数估计_第1页
第1页 / 共39页
抽样推断与参数估计_第2页
第2页 / 共39页
抽样推断与参数估计_第3页
第3页 / 共39页
点击查看更多>>
资源描述
Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,第,8,章 抽样推断与参数估计,第一节 抽样误差,第二节 抽样单位数目的确定,第三节 参数估计,第一节 抽样误差,2.1,、抽样平均误差,(一)概念,(二)计算,1,、简单随机抽样,2,、类型抽样,3,、等距抽样,4,、整群抽样,5,、阶段抽样,(三)影响抽样平均误差的因素,2.2,、抽样极限误差,2.3,、抽样极限误差与抽样平均误差的关系,返回,一、抽样平均误差,(一)抽样平均误差的概念,实际误差,平均误差,抽样平均误差:样本指标与总体指标间平均的离差,1,、简单随机抽样平均误差的计算公式,平均数的抽样平均误差,成数的抽样平均误差,二、抽样平均误差计算,练习,1,、某冷库冻鸡平均每只重,1200,克,标准差,70,克,如果重复随机抽取,100,只和,200,只,分别计算,抽样平均误差。,2,、该,冷库冻鸡合格率为,97%,,如果重复随机抽取,100,只和,200,只,分别计算,抽样平均误差。,3,、据电视观众抽样调查资料显示:电视观众平均收视时间为,95,分钟,标准差为,70,,如果采用重复抽样的方法随机抽取,10000,人或,40000,人,分别计算抽样平均误差。,4,、,据,CNNIC“,中国互联网络发展状况统计报告”显示:截止到,2009,年,1,月中国宽带网民占网民总体的,90.6%,,如果采用重复随机抽取方法在网民中抽取,100,人和,400,人,分别计算抽样平均误差。,5.,从总体,300,个单位中随机重复抽取,36,个单位作样本,其标准差为,6,,则平均数的平均抽样误差为:(),(,1,),2,(,2,),1,(,3,),3,(,4,),4,6,从总体,300,个单位中随机不重复抽取,36,个单位作样本,其标准差为,6,,则平均数的平均抽样误差为:(),7.,在随机重复抽样条件下,为使抽样误差减少一半,样本容量应增加到:(),(,1,),1,倍(,2,),2,倍 (,3,),3,倍(,4,),4,倍,2,、类型抽样,(,1,)概念:,类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。,(,2,)样本单位数在各类型组中的分配方式,等额分配:在各类型组中分配同等单位数。,等比例分配:按各类型组在总体中所占比例分配样本单位数。即:,最优分配:按各类型组的规模大小和差异程度,确定各类型组的样本单位数。,(,3,)抽样平均误差的计算公式,平均数的抽样平均误差,重复,不重复且等比例,成数的抽样平均误差,重复,不重复且等比例,例 题,有,12,块小麦地,每块,1,亩。,6,块处于丘陵地带,亩产量(斤)分别为:,300 330 330 340 370 370,。,6,块处于平原地带,亩产量(斤)分别为:,420 420 450 460 490 520,。抽查,4,块,测定,12,块地的平均亩产量,计算其抽样误差。,设亩产在,350,以上的为高产田,抽查,4,块,测定,12,块地高产田的比重,计算其抽样误差。,用类型抽样,每类抽,2,块,计算各组方差 平均组内方差 抽样误差,亩产量,300,1600,330,100,330,100,340,0,370,900,370,900,合计,3600,亩产量,420,1600,420,1600,450,100,460,0,490,900,520,3600,合计,7800,丘陵,平原,地块数,高产田数,高产田比重,%,丘陵,6,2,33.3,66.67,22.2,平原,6,6,100,0,0,3,、等距抽样,(,1,)概念:将总体各单位标志值按某一标志顺序排队,然而按一定的间隔抽取样本单位。,(,2,)排对的方法,无关标志排队 有关标志排队,(,3,)抽取样本单位的方法,按相等的距离取样,对称等距取样,(,4,)抽取第一个样本单位的方法,随机抽取 居中抽取,4,、整群抽样,(1),概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。,(,2,)抽样平均误差的计算公式,某水泥厂一昼夜的产量为,14400,袋,现每隔,144,分钟抽取,1,分钟的水泥(,10,袋)检查平均每袋重量和一级品率,样本资料如下:,计算抽样平均误差,(,3,)例题,一昼夜有,1440,分钟,即把总体分为,1440,群,,R=1440,每隔,144,分钟抽取,1,分钟的水泥(,10,袋),,r=10,(三)影响抽样平均误差的因素,1,、总体标准差的大小,2,、样本单位数的多少,3,、抽样方法的不同,4,、抽样组织方式的差别,2.2,抽样极限误差,样本指标围绕总体指标左右两侧波动形成的一定,范围,。,抽样极限误差:样本指标与总体指标最大可能的误差范围,2.3,、,抽样极限误差,与,抽样平均误差,的关系,(一)抽样分布,据中心极限定理,当总体为正态或总体非正态但,n30,时,样本均值的分布趋近于正态分布;当,n,足够大时,样本成数的分布近似为正态分布。,(二)关系,第三节 抽样单位数目的确定,3.1,、抽样单位数目的计算,(一)简单随机抽样,(二)类型抽样,(三)等距抽样,(四)整群抽样,3.2,、影响,抽样单位数目的因素,3.1,抽样单位数目的计算,(一)简单随机抽样单位数目的确定,1,、计算公式,(,1,)平均数,(,2,)成数,2.,例题,(,1,)某类产品根据以往资料的估计,总体方差,5.456,千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到,99.73%,,误差范围不超过,0.9,千克,需要抽多少样本单位?,按题意,(,2,)根据以往资料的估计,该类产品的一等品率为,90%,,可靠程度仍为,99.73%,,误差范围不超过,5%,,推断该批产品的一等品率,需要抽多少样本单位?,按题意,(二)类型抽样,1,、计算公式,重复抽样,不重复抽样,平均数,2,、例题,某工厂早、中、晚生产罐头,10000,瓶,根据以往资料的估计平均重量的类型平均方差为,0.549,克,合格率的类型平均方差为,0.02787,,要求可靠程度为何,95%,,平均重量的允许误差为,0.11,克,合格率的允许误差为,0.025,,用类型抽样推断,10000,瓶罐头的平均重量和合格率,需要抽多少样本单位?,据题意,(三)等距抽样,计算公式,(,1,)按有关标志排队,同类型重复抽样,(,2,)按无关标志排队,同简单随机不重复抽样,3.2,、影响抽样单位数目的因素,总体各单位的变异程度,抽样推断的准确程度,抽样推断的可靠程度,Z,抽样的组织形式,抽样的方法,第四节 抽样估计,4.1,估计量的优良标准,:,无偏性、有效性、一致性,4.2,抽样估计的方法,(一)点估计:直接用样本指标代替总体指标,不能准确的告诉我们估计的把握程度,(二)区间估计:不仅仅告诉我们一个范围,告诉我们估计的把握程度,1,、平均数的区间估计,2,、成数的区间估计,3,、,2,个总体平均数之差的估计,4,、两个总体比例之差的估计,二、抽样估计的方法,(一)点估计,(二)区间估计,特点:不是指出被估计参数的确定数值,而是指出被估计参数的的可能范围,同时对参数落在某一范围内给定相应概率的保证程度,。,z-,概率度,1,、平均数的区间估计,(1),样本取自总体方差已知的正态分布,(,大、小样本),返回,例:经抽样调查计算样本亩产粮食,600,公斤,并求得抽样平均误差是,3,公斤,现给定抽样误差极限为,6,公斤,求总体平均亩产落在估计区间的概率?,已知:,u=3,公斤,=6,公斤,则估计区间(,600-6,,,600+6,),=,(,594,,,606,),查正态概率表得,落在估计区间的概率为,:,F,(,z)=F(2)=95.45%,例:麦当劳餐馆在星期内抽查,9,名顾客的消费额如下,在概率,90,的保证下,顾客平均消费额的估计区间,15 24 38 26 30 42 18 30 25 34 44 20 35 46 28 47.,解:,计算样本的平均数和标准差:,根据给定的置信度,(,),90%,查概率表,z=1.64,计算,:,消费额下限,=,消费额上限,=,点估计,:,麦当劳餐馆顾客平均消费额为,32,元,区间估计,:,以,90%,的概率保证,麦当劳餐馆顾客消费额在之间,某制造厂质量管理部门希望估计本厂生产的,5500,包原材料的平均重量,抽出,250,包,测得平均重量,65,千克。总体标准差,15,千克。总体为正态分布,在置信水平为,95%,的条件下建立这种原材料的置信区间。,5500,包原材料的平均重量在,63.14,66.86,之间。,总体平均数估计,根据置信度的要求,估计极限误差可能的范围,并指出估计区间,具体步骤如下:,抽取样本,并根据样本的标志值求出样本平均数 和标准差,S,,在大样本的情况下用,S,代替,根据给定的置信度,(,),,查正态分布概率表得到,z,根据 计算估计区间的上下限。,例:为了估计一分钟广告的平均费用,抽出,15,个电视台组成样本,得样本均值,10000,元,标准差,2000,元。总体近似服从正态分布,在置信水平为,96.76%(z=2.14),的条件下建立广告平均费用的置信区间。,电视台一分钟广告的平均费用在,8894,11106,之间。,(,二,),根据极限抽样误差 ,求概率保证度,(,),。,具体步骤如下:,抽取样本,并根据样本的标志值求出样本平均数 作为总体平均数的估计值,并计算标准差,S,以推算平均误差,根据给定的极限抽样误差,估计总体平均数上下限。,根据 概率度,查正态分布概率表,求得置信度,F(,),。,在一项新广告的跟踪调查中,在被调查的,400,人中有,240,人会记起广告的标语。试求会记起广告语占总体比率的,95%,置信度的估计区间。,根据样本资料计算:,P=n1/n2=240/400=60%,根据给定的置信度要求,F(Z)=95%,,查表,Z=1.96,根据,以概率,95%,的保证程度,会计会记起广告语的人数占总体比率的之间,总体成数的估计,(,一,),根据置信度的要求,估计极限误差可能的范围,并指出估计区间范围,具体步骤如下:,抽取样本,计算样本的成数,p,和标准差,S,,并由此推算出抽样的平均误差,u,根据给定的置信度,(,),,查正态分布概率表得到,z,根据 计算总体成数的上下限。,成数的区间估计,例,1:,某企业在一项关于职工流动原因的研究中,从原职工中随机抽取了,200,人访问,有,140,人离开的原因是工资太低。以,95%,的置信水平对总体这种原因离开的人员比例进行区间估计。,该企业由于工资低离开的职工比例为,63.6%,与,76.4%,之间,Thank You!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!