资源描述
按一下以編輯母片文字樣式,第二層,第三層,第四層,第五層,*,按一下以編輯母片標題樣式,按一下以編輯母片文字樣式,第二層,第三層,第四層,第五層,按一下以編輯母片標題樣式,*,按一下以編輯母片文字樣式,第二層,第三層,第四層,第五層,按一下以編輯母片標題樣式,*,按一下以編輯母片文字樣式,第二層,第三層,第四層,第五層,按一下以編輯母片標題樣式,*,按一下以編輯母片文字樣式,第二層,第三層,第四層,第五層,按一下以編輯母片標題樣式,*,按一下以編輯母片文字樣式,第二層,第三層,第四層,第五層,按一下以編輯母片標題樣式,*,1,第四节,第七章,置信区间的概念,一、置信区间的概念,二 、数学期望的置信区间,三 、方差的置信区间,2,一、置信区间的概念,这种形式的估计称为,区间估计,.,前面,我们讨论了参数点估计,.,它是用样本算得的,一个值去估计未知参数,.,但是点估计值仅仅是未知参数,的一个近似值,,它没有反映出这个近似值的误差范围,,使用起来把握不大,.,范围通常用区间的形式给出的。,较高的,可靠程度,相信它包含真参数值,.,也就是说,我们希望确定一个区间,,使我们能以比,这里所说的“,可靠程度,”是用概率来度量的,,称为置信概率,置信度或置信水平,.,习惯上把,置信水平,记作,,这里 是一个很小,的正数,称为,显著水平,。,3,定义,7.6,若由总体,X,的,样本,X,1,X,2,X,n,确定的,则称 为随机区间。,两个统计量,随机区间与常数区间,不同,,其长度与在数轴上,的位置与样本,有关。,当一旦获得样本值,那么,,都是常数。,为常数区间。,4,定义,7.7,若满足,设 是总体,X,的 一个未知参数,,的,置信区间,.,(双侧置信区间),.,的,置信水平,(置信度),为,分别称为置信下限和置信上限,为显著水平,.,为置信度,,则称区间 是,若存在随机区间,对于给定的,5,置信水平的大小是根据实际需要选定的,.,根据一个实际样本,,,使,一个尽可能小的区间,由于正态随机变量广泛存在,,指标服从正态分布,,特别是很多产品的,我们重点研究,一个正态总体,情形,由给定的置信水平,我们求出,即取置信水平 或,0.95,,,0.9,等,.,例如,通常可取显著水平 等,.,数学期望 和方差 的区间估计。,6,设,为总体,的样本,,分别是样本均值和样本方差。,对于任意给定的,,,我们的任务是通过样本寻找一,它以,1,的概率包含总体,X,的数学期望,。,个区间,,7,一、数学期望的置信区间,设,则随机变量,1,、已知,2,时,,的置信区间,令,8,令,这就是说随机区间,它以,1,的概率包含总体,X,的数学期望,。,由定义可知,此区间即为,的,置信区间,。,9,这就是说随机区间,置信区间也可简记为,它以,1,的概率包含总体,X,的数学期望,。,由定义可知,此区间即为,的,置信区间,。,其置信度为,1,。,置信下限,置信上限,10,若取,查表得,若由一个样本值算得样本均值的观察值,则得到一个区间,我们称其为置信度为,0.95,的,的,置信区间。,其含义是:,若反复抽样多次,每个样本值(,n,=16),按公式,即,确定一个区间。,11,确定一个区间。,在这么多的区间内包含,的占,0.95,不包含,的占,0.05,。,本题中,属于那些包含,的区间的可信,程度,为,0.95.,或“该区间包含,”,这一事实的可信程度,注:,的置信水平,1,的置信区间不唯一。,为,0.95.,12,由中心极限定理知,,当,n,充分大时,,无论,X,服从什么,分布,都近似有,的置信区间是总体,的前提下提出的。,均可看作,EX,的置信区间。,13,例,1,设总体,X,N,(,0.09),, 有一组样本值:,12.6,,,13.4,,,12.8,,,13.2,,,求参数,的置信度为,0.95,的置信区间,.,解,的置信区间为,代入样本值算得,12.706,,,13.294,.,得到,的一个区间估计为,注:该区间不一定包含,.,有,1,= 0.95,,,0,= 0.3,,,n,= 4,14,又如,上例中同样给定,可以取标准正态分布上,分位点,z,0.04,和,z,0.01 ,则又有,则,的置信度为,0.95,的置信区间为,与上一个置信区间比较,同样是,其区间长度不一样,上例,比此例,短。,15,置信区间短表示估计的精度高,,第一个区间为优,(单峰对称的)。,可见,像,N,(0,1),分布那样概率密度,的图形是单峰且对称的情况。,当,n,固定时以,的区间长度为最短,,我们一般选择它。,若以,L,为区间长度,则,可见,L,随,n,的增大而减少(,给定时),,有时我们嫌置信度,0.95,偏低或偏高,,也可采用,0.99,或,0.9.,对于,1,不同的值,,可以得到不同的置信区间。,16,估计在区间 内,.,这里有两个要求,:,只依赖于样本的界限,(,构造统计量,),可见,对参数 作区间估计,,就是要设法找出两个,一旦有了样本,就把,2.,估计的精度要尽可能的高,.,如要求区间长度,尽可能短,或能体现该要求的其它准则,.,1.,要求 很大的可能被包含在区间 内,,就是说,概率,即要求估计尽量可靠,.,要尽可能大,.,可靠度与精度是一对矛盾,,条件下尽可能提高精度,.,一般是在保证可靠度的,17,例,2,已知某种油漆的干燥时间,X,(单位,:,小时),服从正态分布,其中,未知,现在抽取,25,个样品做试验,,得数据后计算得,取,求,的置信区间。,解,所求为,18,例,3,中随机地抽查了,9,人,其高度分别为:,已知幼儿身高,现从,5,6,岁的幼儿,115, 120, 131, 115, 109, 115, 115, 105, 110cm;,19,2,、未,知,2,时,,的置信区间,当总体,X,的方差未知时,,容易想到用样本方差,2,代替,2,。,已知,则对给定的,,令,查,t,分布表,可得,的值。,则,的置信度为,1,的置信区间为,20,例,4,40,名旅游者。,解,本题是在,2,未知的条件下求正态总体参数,的,置信区间。,选取统计量为,由公式知,的置信区间为,查表,则所求,的置信区间为,为了调查某地旅游者的消费额为,X,,,随机访问了,得平均消费额为,元,样本方差,设,求该地旅游者的平均消费额,的置信区间。,若,2,25,的置信区间为,即,21,例,5,用某仪器间接测量温度,重复测量,5,次得,求温度真值的置信度为,0.99,的置信区间。,解,设,为温度的真值,,X,表示测量值,通常是一个,正态随机变量,问题是在未知方差的条件下求,的置信区间。,由公式,查表,则所求,的置信区间为,22,例,6,解,本题是在,2,未知的条件下求正态总体参数,的,置信区间。,由公式知,的置信区间为,查表,则所求,的置信区间为,为了估计一批钢索所能承受的平均张力(单位,kg/cm,2,),设钢索所能承受的张力,X,,,分别估计这批钢索所能承受的平均张力,的范围与,所能承受的平均张力,。,随机选取了,9,个样本作试验,,即,则钢索所能承受的平均张力为,6650.9 kg/cm,2,由试验所得数据得,23,三、方差,2,的置信区间,下面我们将根据样本找出,2,的置信区间,,这在研究,生产的稳定性与精度问题是需要的。,已知总体,我们利用样本方差对,2,进行估计,,由于不知道,S,2,与,2,差多少?,容易看出把,看成随机变量,又能找到,它的概率分布,则问题可以迎刃而解了。,的概率分布是难以计算的,而,对于给定的,24,即,则得到,2,随机区间,以 的概率包含未知方差,2,,,这就是,2,的置信度为,1,的,置信区间,。,25,例,1,某自动车床加工零件,抽查,16,个测得长度(毫米),怎样估计该车床加工零件长度的方差。,解,先求,2,的估计值,或,查表,26,所求,2,的置信度为,0.95,的 置信区间,所求,标准差,的置信度为,0.95,的 置信区间由,得,得,27,例,2,为了估计灯泡使用时数(小时)的均值,和,解,查表,测试了,10,个灯泡得,方差,2,,,若已知灯泡的使用时数为,X,,,求,和,2,的置信区间。,由公式知,的置信区间为,的置信区间为,查表,即,由公式知,2,的置信区间为,2,的置信区间为,28,例,3,电动机由于连续工作时间(小时)过长会烧坏,,解,查表,烧坏前连续工作的时间,X,,得,求,和,2,的置信区间。,今随机地从某种型号的电动机中抽取,9,台,,测试了它们在,设,由公式知,的置信区间为,即,所求,2,的置信度为,0.95,的 置信区间,得,29,寻找置信区间的方法,一般是从确定,误差限,入手,.,使得,称,为 与,之间的误差限,.,,可以找到一个正数,,,只要知道 的概率分布,确定误差限并不难,.,我们选取未知参数的某个估计量,,根据置信水平,由不等式,可以解出 :,这个不等式就是我们所求的置信区间,.,30,单正态总体的区间估计,被估,参数,条件,统计量,置信区间,已知,2,未知,2,2,未知,31,作业,P294 4 5 6 8 10 12,32,婴儿体重的估计,例,4,假定初生婴儿的体重服从正态分布,随机抽取,12,名婴儿,测得体重为:(单位:克),3100, 2520, 3000, 3000, 3600, 3160, 3560, 3320, 2880, 2600, 3400, 2540,试以,95%,的置信度估计初生婴儿的平均体重以及方差,.,解,设初生婴儿体重为,X,克,则,X,N,(, , ,2,),(1),需估计,而未知 ,2,.,33,作为统计量,.,有,=,,,n,=,,,t,0.025,(11)=,,,即,的置信区间。,(1),需估计,而未知 ,2,.,34,(2),需估计,2,而未知, ,,有 ,2,0.025,(11)=,,,2,0.975,(11)=,,,35,例,5,解,由置信区间的概念,所求,的,0.99,的 置信区间为,在交通工程中需要测定车速(单位,km/h),由以往,2,、现在作了,150,次观测,试问平均测量值的误差在,的经验知道,,即,测量值为,X,,,测量值的误差在 之间,。,1,、至少作多少次观测,才能以,0.99,的可靠性保证平均,之间的概率有多大?,由题意要求,用平均测量值 来估计,其误差,由题意知,36,至少要作,86,次观测,,才能以,0. 99,的可靠性保持平均测量,误差在,之间。,即,则钢索所能承受的平均张力为,6650.9 kg/cm,2,令,37,例,6,设总体,X N(,0.09),, 有一组样本值:,12.6,,,13.4,,,12.8,,,13.2,,,求参数,的置信度为,0.95,的置信区间,.,解,:有,1,=0.95,,,0,=0.3,,,n=4,是,的无偏估计量,是优良估计量,且,从而,38,在标准正态分布表中查得上侧分位数,得,的置信区间为,Z,/2,=,Z,0.025,=1.96,39,代入样本值算得,得到,的一个区间,估计为,12.706,,,13.294,.,注:该区间不一定包含,.,总结此例,做了以下工作:,1,)根据,优良性准则,选取统计量来,估计参数;,是,的优良估计量:无偏、有效、相合,.,
展开阅读全文