总体均值的置信区间

上传人:cel****460 文档编号:243729138 上传时间:2024-09-29 格式:PPTX 页数:70 大小:685.85KB
返回 下载 相关 举报
总体均值的置信区间_第1页
第1页 / 共70页
总体均值的置信区间_第2页
第2页 / 共70页
总体均值的置信区间_第3页
第3页 / 共70页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,总体均值的置信区间,统计推断的过程,总体,样本,总体均值、比例、方差,样本统计量,例如:样本均值、比例、方差,9/29/2024,2,第一节 抽样调查,一、抽样调查的概念及特点,1抽样调查:从所研究的总体中抽出一局部单位,作为样本进展观察研究,以认识总体的数量特征一种统计方法。,2抽样估计:根据样本分布的原理、利用样本资料提供的信息对总体的某些数量特征进展科学的估计或推断。,9/29/2024,3,1根据局部实际资料对全部总体的数量特征作出估计;,2按随机原那么从全部总体中抽取样本单位;,3抽样误差可以事先计算并加以控制;,二、抽样调查的作用,1.对不可能进展全面调查现象进展抽样估计;,2.抽样调查可以节省人力物力,提高调查的经济效益,又能够节省时间,提高调查的实效性。,9/29/2024,4,三、抽样调查的几个根本概念,1总体,总体单位的总数称为总体容量用N表示。,2样本,从总体中抽取来代表总体的局部总体单位所构成的整体。,样本单位的总数称为样本容量用n表示。,种类:大样本,小样本,9/29/2024,5,2.总体参数和样本指标,1总体参数总体指标,如 或记为 、P、 等。,2样本指标估计量或样本统计量,如 、p、s 等。,1重复抽样回置抽样,2不重复抽样不回置抽样,9/29/2024,6,1概率抽样,根本的组织方式有:整群抽样、分层抽样、等距抽样、简单随机抽样。,2非概率抽样,根据调查者的经历或判断,从总体中有意识的抽取假设干单位构成样本。如典型调查、重点调查、方便偶遇抽样等。,9/29/2024,7,1定义:包括全体抽样单位的名单框架。,2形式:,名单抽样筐列出全部总体单位的名录一览表。如企业名单、居民名单、学生名单;,区域抽样筐按地理位置将总体范围划分为假设干小区域,以小区域为抽样单位;,时间表抽样筐将总体全部单位按照时间顺序排列,把总体的时间过程分为假设干小的时间单位,以时间单位为抽样单位。如检测流水线上的产品质量时以1分钟为一个抽样单位。,9/29/2024,8,第二节 抽样误差,一、抽样误差的概念,一抽样误差的性质,由于随机抽样的偶然因素使各单位的构造缺乏以代表总体的构造而引起抽样指标与总体指标间的绝对离差。,2.抽样调查中误差的来源,(1)登记性误差:可防止,(2)代表性误差 系统误差:非随机、可防止,随机性误差:可计算、控制,抽样估计中所指的误差主要指随机误差。,9/29/2024,9,二抽误误差的影响因素,1.样本容量:即样本单位数,9/29/2024,10,二、抽样平均误差,一抽样平均误差的概念,所有可能样本的估计值与相应总体参数的标准差,反映样本估计值与其中心的平均离散程度。,二抽样平均误差的计算公式,9/29/2024,11,样本均值的抽样分布一个例子,【例】设一个总体,含有4个元素个体,即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下:,均值和方差,总体分布,1,4,2,3,0,.1,2,.3,9/29/2024,12,现从总体中抽取,n,2的简单随机样本,在重复抽样条件下,共有4,2,=16个样本。所有样本的结果如下表,3,4,3,3,3,2,3,1,3,2,4,2,3,2,2,2,1,2,4,4,4,3,4,2,4,1,4,1,4,4,1,3,3,2,1,1,2,1,1,1,第二个观察值,第一个,观察值,所有可能的,n,= 2 的样本(共16个),9/29/2024,13,样本均值的抽样分布,1.0,0,1,2,3,P,(,x,),1.5,3.0,4.0,3.5,2.0,2.5,x,计算出各样本的均值,如下表。并给出样本均值的抽样分布,3.5,3.0,2.5,2.0,3,3.0,2.5,2.0,1.5,2,4.0,3.5,3.0,2.5,4,2.5,4,2.0,3,2,1,1.5,1.0,1,第二个观察值,第一个,观察值,16个样本的均值(,x,),9/29/2024,14,所有样本均值的均值和方差,式中:M为样本数目,比较及结论:,1. 样本均值的均值数学期望等于总体均值,2. 样本均值的方差等于总体方差的1/n,9/29/2024,15,(1)重复抽样,(2)不重复抽样,9/29/2024,16,(1)重复抽样,(2)不重复抽样,例:从40000件产品中随机抽取200件进展检查,结果有10件不合格。求合格率的抽样平均误差?,9/29/2024,17,三、抽样极限误差,一概念,又称允许误差。指样本指标与总体指标之间产生抽样误差被允许的最大可能范围。,二抽样极限误差的计算,9/29/2024,18,三抽样误差的概率度,基于概率估计的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量。,极限误差除以抽样平均误差得到的相对数称为概率度。用Z表示。,四抽样估计的置信度,指样本指标与总体指标误差不超过一定范围的概率保证程度。抽样误差的概率就是概率度Z的函数,即:,9/29/2024,19,9/29/2024,20,第三节 简单随机抽样估计的方法,一、抽样估计的优良标准,同一个总体参数有多个样本估计量,终究哪一个才是最优估计量呢,常用以下三个标准衡量:,1.无偏性:估计量的数学期望等于被估计的总体参数,P,(,X,),X,C,A,无偏,有偏,9/29/2024,21,2.有效性:,一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量。,A,B,中位数的抽样分布,均值的抽样分布,X,P,(,X,),9/29/2024,22,3.一致性:,随着样本容量的增大,估计量越来越接近被估计的总体参数。,A,B,较小的样本容量,较大的样本容量,P,(,X,),X,9/29/2024,23,二、总体参数的点估计,从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计。,例如: 用样本均值作为总体未知均值的估计值就是一个点估计。,2.点估计的方法:有矩估计法、顺序统计量法、最大似然法、最小二乘法等。,优点,:简单明确,缺点:,不能说明估计结果的抽样误差和把握程度。,9/29/2024,24,三、总体参数的区间估计,(一区间估计的概念要点,3.例如: 总体均值在5070之间,置信度为 95%,置信区间,置信下限,置信上限,样本统计量 (点估计),9/29/2024,25,二区间估计的内容,2,已知,2,未知,均 值,方 差,比 例,置 信 区 间,9/29/2024,26,落在总体均值某一区间内的样本,95% 的样本,x,-1.96,x,x,+1.96,x,99.73% 的样本,x,- 3,x,x,+ 3,x,90%的样本,x,-1.65,x,x,+1.65,x,9/29/2024,27,三置信水平,总体未知参数落在区间内的概率,表示为 (1 - ,为显著性水平,是总体参数未在区间内的概率。,9/29/2024,28,四总体均值的区间估计 (),1.假定条件,总体服从正态分布,且总体方差,如果不是正态分布,可以由正态分布来近似 (n 30),使用正态分布统计量,总体均值,在1-,置信水平下的,置信区间为,9/29/2024,29,总体均值的区间估计正态总体:实例,【例1】某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。总体标准差 。,解:N(2),x2.14, n=9, 1- = 0.95,/2,总体均值的置信区间为,我们可以,95,的概率保证该种零件的平均长度在21.30221.498 mm之间。,9/29/2024,30,总体均值的区间估计非正态总体:实例,【例2】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95的置信水平估计该大学全体学生平均每天参加体育锻炼的时间总体方差为36分钟。,解: x26, =6,n=100,1- = 0.95,/2,我们可以,95,的概率保证平均每天参加锻炼的时间在24.82427.176 分钟之间。,9/29/2024,31,总体均值的置信区间,(,未知),1.假定条件,总体方差未知,总体必须服从正态分布,使用 t 分布统计量,3. 总体均值,在1-,置信水平下的,置信区间为,9/29/2024,32,总体均值的区间估计,(,未知,实例,),【例3】从一个正态总体中抽取一个随机样本,,n,= 25 ,其均值,x,= 50 ,标准差,s,= 8。 建立总体均值,m,的95%的置信区间,。,解:N(,2),x=50, s=8, n=25, 1- = 0.95,t/2=2.0639。,我们可以,95,的概率保证总体均值在46.6953.30 之间,9/29/2024,33,五总体比例的置信区间,1.,假定条件,两类结果,总体服从二项分布,可以由正态分布来近似,使用正态分布统计量,3.,总体比例,的置信区间为,9/29/2024,34,例4:,某城市想要估计下岗职工中女性所占的比例,随机抽取了100名下岗职工,其中65人为女性职工。试以99.73%的置信水平估计该城市下岗职工中女性比例的置信区间?,9/29/2024,35,影响区间宽度的因素,1.数据的离散程度,,用 来测度,样本容量,3.置信水平 (1 -,),影响,Z,的大小,9/29/2024,36,区间估计步骤以估计 为例:,计算样本统计量,计算抽样平均误差,计算抽样极限误差,确定置信区间,9/29/2024,37,四、样本容量确实定,思考:1.影响样本容量的因素?,2.比例条件下n确实定?,9/29/2024,38,课堂练习: 3788.26,4111.74 77.86%,92.14%,用简单随机抽样方法,从一批电子产品中按重复抽样抽取100个对其使用寿命进展测试,结果如下:,1以95.45的概率保证,程度估计该产品的平均使用,寿命区间?,2假设 3000小时以下为不,合格品,试以同样的概率估,计该产品合格率的区间?,使用寿命,(小时),产品个数,3000,以下,15,3000,4000,30,4000,5000,50,5000,以上,5,9/29/2024,39,第四节 其他抽样组织形式的参数估计,9/29/2024,40,一、分层抽样及其参数估计,一概念,(1)等比例分配法,(2)不等比分配法:奈曼法、经济法,二等比例抽样的参数估计,回忆:纯随机抽样估计步骤,思考:等比例抽样估计关键应是什么?,9/29/2024,41,平均数的参数估计,思考:成数的参数估计?,9/29/2024,42,例题:,某地区对居民在一年内用于某类消费的支出进展了等比例分层抽样,结果如下单位:元。,要求以95.45%的置信水平,估计该地区平均每户支出的区间?,调查,户数,平均,支出,方差,城镇,40,350,2209,农村,80,260,2916,9/29/2024,43,9/29/2024,44,二、等距抽样及其参数估计,一概念,(1) 无关标志排队等距抽样,(2) 有关标志排队等距抽样 半距起点等距抽样,对称起点等距抽样,二等距抽样参数估计,(1)无关标志排队等距抽样,(2)有关标志排队等距抽样,9/29/2024,45,三、整群抽样及其参数估计,一概念,二参数估计,假设将总体全部N个单位划分成R群,从中随机抽取r群,被抽中的群的平均值为,9/29/2024,46,例题:,某商场有某种饮料,500箱,每箱6瓶,现随机抽取10箱检查每瓶的含菌量数,测得这10箱的平均每瓶含菌数分别为:90、80、65、85、75、70、50、70、60、65个。要求以95%的置信度推断这批饮料的平均含菌数的区间?,9/29/2024,47,9/29/2024,48,思考:,1.某工厂产品是连续性生产,每分钟产量是10件产品,为检查产品质量,在24小时中每隔30分钟取下一分钟的产品进展全部检查,这是什么抽样组织形式?,2.要进展全国城市居民家庭平均收入调查,从全国城市中70个城市,再从抽出的城市中抽140个街道,然后再从抽出的街道中抽出1400个家庭进展调查,这是什么抽样组织形式?,3.我国农产品产量如何进展抽样调查?,9/29/2024,49,第五节 假设检验,引例,美国利伯?月球作用生物潮与人的情绪?,9/29/2024,50,一、假设检验的概念,事先对总体参数或总体分布形式特征作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著性差异,从而决定应承受或否认原假设。,所以,假设检验也称为显著性检验。,9/29/2024,51,二、假设检验的步骤,第一步:确定原假设和备择假设;,第二步:明确检验统计量;,第三步:根据显著性水平,确定拒绝域;,第四步:计算检验统计量的数值;,第五步:给出判断结论。,9/29/2024,52,三、假设检验中的两类错误,在作出承受或者拒绝原假设的结论时,是基于样本信息来判断的。由于样本的随机性,使假设检验有可能出现两类错误。,1、第一类错误拒真错误,当原假设H0为真,但由于样本的随机性使样本统计量落在了拒绝区域,从而导致作出的判断是拒绝原假设,概率,P拒绝H0 | H0为真 ,2、第二类错误取伪错误,当原假设H0不真时承受原假设,取伪概率为,P承受H0 | H0为不真 ,9/29/2024,53,四、总体均值的假设检验,1.总体方差Z检验法,1双侧检验:H0:0; H1 :0 ,那么临界值为-Za/2和Za/2 ,当|Z| Za/2时拒绝原假设,否那么承受原假设;,承受区域,Za/2,-,Za/2,9/29/2024,54,例题:,某地对100户居民进展调查说明,长话费下调第一周,平均每个长话的通话时间为14.5分钟,而此前的调查为13.6分钟。总体标准差为5分钟。请问长话的通话时间在资费调整前后是否有明显变化?,9/29/2024,55,9/29/2024,56,2左侧检验:H0:0; H1 :0 那么临界值为 Za ,当ZZa时拒绝原假设,否那么承受原假设;,9/29/2024,57,2.总体方差未知t检验法,例题:,1998年全国人均年消费支出1590元,同期在新疆一个25户的样本说明,其年人均消费支出为1450元,样本标准差为220元,试以0.1的显著性水平判断,新疆的人均年消费水平支出是否明显的低于全国平均水平?,9/29/2024,58,9/29/2024,59,五、总体成数的假设检验,例题:,假设规定男婴占新生儿总数的比例不超过51.7%,即可认为出生性别比例正常。某地一个由400名新生儿组成的样本说明,男婴所占比例为53.4%,试以0.05的显著性水平分析:该地出生性别比例是否超出正常范围。,9/29/2024,60,9/29/2024,61,例题:,高尔夫球生产企业规定,合格球的射程为280 码。某日随机抽取36 个球组成一个样本,测得其平均射程为 278.5码,标准差为12码。试在显著性水平为0.05条件下,检验该批球的射程是否不为280码。,不能拒绝原假设,即不能否认0 = 280 码。,280码处于置信区间之中,不能拒绝原假设。,9/29/2024,62,本章练习,一、填空,,在这种形式下,假设成数50,允许误差不超过5 ,概率为95.45,那么必要抽样数目为 。,2.抽样估计的方法有两种,即 和 。,指标来估计总体指标。,4.作区间估计时实质上同时作了如下两方面的判断,即: 的判断和 的判断。,9/29/2024,63,二、选择,1.用简单随机抽样重复抽样方法抽取样本单位,如果要使用抽样极限误差降低50,那么样本容量需扩大到原来的 ,2.某机械厂生产的铸件合格率为90,那么其标准差为 ,3.在抽样推断中,样本的容量 ,越小越好,越大越好,取决于统一的抽样比例,取决于对抽样推断可靠性的要求,9/29/2024,64,6.连续生产的电子管厂,产品生产周期小于1分钟,在一天中,每隔一小时抽取分钟的产品进展检验,这是 ,.简单随机抽样 .类型抽样,7.事先将总体各单位按某一标志排列,然后依排列顺序和按一样的间隔来抽选调查单位的抽样称为 ,.简单随机抽样 .类型抽样,9/29/2024,65,三、计算,1.一家公司的采购部刚收到一批公司产品所需要的元件,元件的供给厂商宣称这批元件的次品率不超过2%。采购部经理对此存有疑心,因而随机抽取300个元件进展检测,结果显示次品率为4%。请你以5%的显著性水平进展检验,以此来评价供给厂商关于元件质量承诺的可靠性。,9/29/2024,66,9/29/2024,67,P243或245-10,2.采用简单随机重复抽样的方法,从养鸡场2000只鸡中抽查200只,发现其中190只是安康的,有10只出现疾病。,1计算安康鸡比率的抽样平均误差;,2以95.45%的概率保证程度,对安康鸡只比率和安康鸡只数数量进展区间估计;,3如果安康鸡比率的极限误差为2.31%,那么其概率保证程度是多少?,9/29/2024,68,9/29/2024,69,谢谢,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 药学课件


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!