资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,实验数据处理方法,第三部分:统计学方法,第十四章 假设检验,(Hypothesis Testing),第十三章 假设检验,(Hypothesis Testing),一.假设检验的基本概念,二.假设检验的一般方法,三.假设检验的一个例子:,LiMa,显著性(,Significance,),第十三章 假设检验,(Hypothesis Testing),一.假设检验的基本概念,1.什么是假设检验,实验的目的:验证一个科学论断的正确性,假设检验:利用概率和统计的语言,根据实验的结果来验证一个理论模,型是否可接受。,统计假设:待检验的理论模型,例:,0,粒子的衰变。,实验结果:测量衰变时间求,0,粒子的平均寿命。,理论模型:I=1/2规则,,0,的寿命是,-,的两倍,,-,的寿命,0,的寿命,0,问题:,0,?,由于有测量误差,对该问题的回答:=,0,概率是多少?,第十三章 假设检验,(Hypothesis Testing),2.假设检验的分类,(1)参数检验:如果欲检验的统计假设只包括某些参数的特定值,,(2)非参数检验:被观测的随机变量的分布是否符合一个特定的,原假设:欲检验的统计假设,如,如:,0,?,函数形式?两个给定的实验分布是否具有相同,分布形式?,3.原假设和备择假设(,Null Hypothesis,Alternative Hypothesis,),H,0,:,=,0,备择假设:实验结果有可能支持原假设,也可能支持别的假设而拒,绝原假设,与原假设不同的其它假设称为备择假设,如,H,1,:,0,第十三章 假设检验,(Hypothesis Testing),一般情况下,是否接收原假设依赖于与备择假设的比较结果。,简单假设:假设中参数的值是一常数,如,4.简单假设和复合假设(,Simple Hypothesis,Composite Hypothesis,),H,0,:,=,0,复合假设:假设中的某一参数的值不是完全确定的,如,H,:,0,、,H,1,:,0,如何选择原假设和备择假设,要根据所要解决的实际问题决定,第十三章 假设检验,(Hypothesis Testing),二.假设检验的一般方法,随机变量,x,参数检验,观测结果:容量为,n,的样本,,(,x,1,x,2,x,n,),定义通过观测结果来接收原假设或拒绝原假设的标准,.,:,f,(,x,),,为未知参量,检验,是否取某一值,原假设 H,0,:,=,0,备择假设 H,1,:,=,1,检验统计量:,t,=,t,(,x,1,x,2,x,n,),t,的定义域:,第十三章 假设检验,(Hypothesis Testing),即:若,t,的观测量,t,obs,,,f,(,t,|H,o,):H,0,为真时,,t,的.,:显著性水平(Significance Level),,t,c,:临界值,f,(,t,|H,1,):H,1,为真时,,t,的.,R,:,中的子域,:,t,落入,R,中的概率。,0,1(H,0,为真时),R,:H,0,的拒绝域,-,R,:H,0,的接收域,否则,接收H,0,f,(,t,|H,o,),-,R,R,t,c,t,落入,R,,则拒绝H,0,第十三章 假设检验,(Hypothesis Testing),第一类错误(弃真错误):当H,0,为真时,,t,obs,有,的概率落入,R,应尽可能地小,1-,:H,0,对H,0,的检验势,当,t,obs,t,c,时,H,0,被拒绝,而实验上H,0,为真,I类错误的概率:,第二类错误(取伪错误):H,0,不为真,但却接收了H,0,II类错误的概率:,f,(,t,|H,o,),1,-,R,t,c,t,1-,大,II类错误的概率小,第十三章 假设检验,(Hypothesis Testing),假设检验的方法:,应尽可能地小,设,x,的.:,1.选择合适的检验统计量,t,标准:,尽可能地小,1-,尽可能大。,三.复合假设的检验:似然比(Likelihood Ratio),f,(,t,|H,1,),t,c,t,1-,:的子空间,即,2.选择适当的临界值,t,c,,,x,样本:,(,x,1,x,2,x,n,),的取值空间,的分量中只有一个受到某种约束,第十三章 假设检验,(Hypothesis Testing),原假设,备择假设,设,:,L,在中的极大值,:,在H,0,为真时,,L,在中的极大值,定义:,:,似然比(Likelihood Ratio),不可能比,大,H,0,为真的可能性较大,H,0,为真的可能性较小,可作为原假设,H,0,的检验统计量,第十三章 假设检验,(Hypothesis Testing),对H,0,的检验,:,L,在中的极大值,y,=,y,(,),中当,H,0,为真时有,个参数取固定值,则,当样本容量n很大时,统计量-2ln,趋近于自由度为,的,2,分布,求在给定的显著性水平,下,,的临界值,:,g,(,|H,0,):在,H,0,为真时,,的.,如果,g,(,|H,0,)的函数形式未知:,h,(,y,|H,0,),y,(,),一般情况下,,g,(,|H,0,)很难找到,采用近似方法:,设,2,(,),分布求,令,第十三章 假设检验,(Hypothesis Testing),例:,点源寻找中的Li-Ma显著性,问题:来自某一天体方向的事例数的超出是,点源信号还是背景,N,on,:向源事例数,未知量:,事例数,N,s,,源方向的背景事例数,N,B,涨落,如果是信号,如何用统计学的方法描述这种超出?,实验测量:,背景事例:强子和核引起的簇射,是各向同性的,,N,off,:离源事例数,t,on,:向源测量时间,t,off,:离源测量时间,可用似然比检验解决上述问题。,第十三章 假设检验,(Hypothesis Testing),原假设,备择假设,N,on,、,N,off,服从什么分布?,假定:事例率为常数,则,N,on,、,N,off,服从,Possion,分布,令L,=,t,on,/,t,off,如果,H,0,为真,,N,s,=0,,:平均值,N,S,、,N,B,的估计值:,N,on,和,N,off,的平均值:,(1),H,0,为真时,,N,on,全为本底事例。,第十三章 假设检验,(Hypothesis Testing),参数空间:,N,B,:x轴,,N,S,:y轴,H,0,为真时,有一个参数取定值:自由度为1,(2),H,1,为真时:,,N,S,0,H,0,:,N,S,=0 :=x,轴,H,1,:,N,S,0 :=,N,S,0,,N,B,0,第十三章 假设检验,(Hypothesis Testing),似然函数:,由于,N,on,和,N,off,是独立的随机变量,故一次实验获得测量量,N,on,和,N,off,概率为,第十三章 假设检验,(Hypothesis Testing),似然比:,如果,N,on,、,N,off,不是很小,-2 ln,2,(1),2,分布的定义:如果,N(,2,),2,:,x,偏离平均值,多少标准偏差,u,-2 ln,在H,0,假设为真时,,=观测结果偏离H,0,多少个,标准偏差。,第十三章 假设检验,(Hypothesis Testing),李-马显著性,(Li-Ma significance),
展开阅读全文