资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,2024/11/29,1,假设检验基础,流行病与卫生统计学教研室,2024/11/29,2,假设检验的概念和基本原理,生活实例,某商家宣称,:,他的一大批鸡蛋,“,坏蛋率为,1,”,。,为了对这批鸡蛋的质量作出判断,某质量监督员从中随机抽取,5,个作检查,结果,4,个为好蛋,,1,个为变质蛋。,根据此结果,作为质量监督员如何评价鸡蛋的质量?,为什么?,2024/11/29,3,假设检验,(hypothesis test),假设检验是一种重要的工具。,假设检验,(hypothesis test),是依据样本间存在差异,来对样本所对应的总体间是否存在差别作出判断的一种方法。,2024/11/29,4,假设检验的思维逻辑,反证法,小概率事件的推断原理,小概率事件在一次观察或实验中是几乎不可能出现的。,2024/11/29,5,例,7.2,某医生研究一种新的治疗充血性心力衰竭的方法。对,50,位心功能在,23,级之间的成年男性患者进行,4,周的治疗,考察其疗效。评价疗效的一个指标是锻炼持续时间的增加量,(,分钟,),。以前常规的治疗方法能使患者的锻炼持续时间平均增加,3,分钟。该医生通过,50,位接受新方法治疗的患者的数据算得锻炼持续时间平均增加,4,分钟,标准差为,1.5,分钟。该新疗法使患者锻炼持续时间的平均增加量是否多于常规疗法的,3,分钟?,2024/11/29,6,?,2024/11/29,7,假设检验的基本步骤,建立假设(,H,0,和,H,1,),,确定单双侧检验,确定检验水准,选择检验方法,计算检验统计量,确定,P,值,作出推断结论,2024/11/29,8,1.,建立假设,(,H,0,和,H,1,),,确定单双侧检验,建立假设,(,H,0,和,H,1,),H,0,零假设或原假设,(,null hypothesis),通常为两总体参数相等或服从某分布;,H,1,备择假设,(,alternative hypothesis),通常为两总体参数不相等或不服从某分布;,确定单双侧检验,由研究目的及专业知识所决定,从备择假设,H,1,看:,H,1,:,0,(,0,和,0,),2024/11/29,9,2.,确定检验水准,(,size of a test),检验水准,:为预先规定的小概率事件的标准,通常取值,0.05,或,0.01,可根据研究目的进行调整,2024/11/29,10,3.,选择检验方法,计算检验统计量,应根据研究目的、资料类型、设计类型及样本含量大小等因素选择合适的假设检验方法;,在,H,0,成立的前提下,由样本已知信息构造检验统计量;,通常根据构造的检验统计量来命名假设检验方法。,2024/11/29,11,4.,确定,P,值,值的含义:由,H,0,所规定的总体作随机抽样,获得等于及大于现有样本统计量值的概率。,怎样确定值:构造的检验统计量服从相应的分布,查相应分布界值表确定值。,一般双侧检验查双侧界值,单侧检验查单侧界值。,2024/11/29,12,5.,作出推断结论,与检验水准,相比作出推断结论,,拒绝,H,0,,接收,H,1,(在,H,0,成立的前提下,一次随机抽样发生了小概率事件),,不能拒绝,H,0,(在,H,0,成立的前提下,一次随机抽样没有发生小概率事件,没有充足的理由拒绝,H,0,),2024/11/29,13,例,7-2,的假设检验的基本步骤,H,0,:,3,(,新疗法使患者锻炼持续时间的平均增加量等于常规疗法的,3,分钟,),H,1,:,3,(新疗法使患者锻炼持续时间的平均增加量不等于常规疗法的,3,分钟 ),检验水准,0.05,查界值表,自由度近似取,50,,可得到,拒绝零假设,接受备择假设,可以认为,“,新疗法使患者锻炼持续时间的平均增加量不等于常规疗法的,3,分钟,”,2024/11/29,14,确定检验水准,作出推断结论,不能拒绝,H,0,拒绝,H,0,,接受,H,1,P,P,选定检验方法,计算检验统计量,确定值,建立假设,确定单双侧检验,2024/11/29,15,第三节 两类错误及检验效能,假设检验的两类错误,假设检验的功效,2024/11/29,16,一 、假设检验的两类错误,假设检验是根据有限的样本信息对总体作推断,不论做出那种推断结论,都有可能发生错误。,2024/11/29,17,一 、假设检验的两类错误,第,类错误与第,类错误的概念,将假设检验的结果与实际情况相比:,第,类错误,(,typeerror),:,H,0,为真时,,拒绝,H,0,第,类错误,(,type error),:,H,0,不真时,,不拒绝,H,0,2024/11/29,18,推断结论和两类错误,实际情况,检验结果,拒绝,H,0,不拒绝,H,0,H,0,真,第,类错误,(),结论正确,(1-),H,0,不真,结论正确,(1-),第,类错误(,),2024/11/29,19,一 、假设检验的两类错误,第,类错误,犯第,类错误概率为,的意义,的取值,第,类错误,犯第,类错误概率为,的意义,的取值,2024/11/29,20,与,关系示意图,2024/11/29,21,二、假设检验的功效,概念:,1-,称为假设检验的功效,(,power of a test,),统计学意义:,如果两个总体参数间确实存在差异,使用假设检验方法能够发现这种差异,(,即拒绝,),的能力被称为检验效能,(power of test),。一般情况下要求检验效能应在,0.8,以上。,2024/11/29,22,检验,(,t,-test ),单样本设计的,检验,配对设计的,检验,完全随机设计(成组设计)的,检验,2024/11/29,23,每种不同设计类型的,检验均主要从以下四个方面介绍:,1.,设计类型,2.,可解决的问题,3.,假设检验步骤,4.,适用条件,2024/11/29,24,(一),单样本设计的,检验,one-sample,t,-test,单样本设计,例,8.1,例,2,已知中学一般男生的心率平均值为,74,次,/,分钟,为了研究经常参加体育锻炼的中学生心脏功能是否与一般的中学生相同,在某地区中学随机抽取常年参加体育锻炼的男生,16,名,测量他们的心率,结果分别为,55,、,72,、,58,、,57,、,70,、,75,、,72,、,69,、,61,、,67,、,69,、,73,、,59,、,71,、,53,、,69,。请作统计推断。,2024/11/29,25,例,3,测得,25,例女性患者的血红蛋白,(,Hb),,,其均数为,150,(g/L),,标准差为,16.5,(g/L),。,而当地正常成年女性的,Hb,均数为,132,(g/L),,,问该病女性患者的,Hb,含量是否与正常女性,Hb,含量不同,?,2024/11/29,26,单样本设计,检验可解决问题,?,2024/11/29,27,单样本设计,检验的假设检验步骤,作出推断结论,不能拒绝,H,0,拒绝,H,0,,接受,H,1,P,P,查,=,n,-1,的,界值表,确定,值,H,0,:=,0,H,1,: ,0,(,双侧),0,或,查,=,n,-1,的,界值表,确定,值,H,0,:,d,=0,H,1,: ,d,0,0.05,2024/11/29,37,配对设计检验的适用条件,独立性,正态性,2024/11/29,38,(三)完全随机设计,检验(两独立样本,检验,)(,two independent samples t-test,),完全随机设计类型(两种形式),1.,从同一个同体中随机抽取两个样本,分别采用两种不同的处理,比较不同处理结果是否有差异。,2.,从两个总体中随机抽取两个样本,两样本信息不同,推断两总体信息是否不同。,2024/11/29,39,完全随机设计类型(两种形式),例,8.3,例,8.4,例,8.6,例某医院用某新药与常规药治疗婴幼儿贫血,将,20,名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量,(g/L),如下,问新药与常规药的疗效有无差别?,新药组,24,36,25,14,26,34,23,20,15,19,常规药组,14,18,20,15,22,24,21,25,27,23,2024/11/29,40,例某市于,1973,年和,1993,年抽查部分,12,岁男童对其生长发育情况进行评估,其中身高的有关资料如下,试比较这两个年度,12,岁男童身高均数有无差别。,1973,年:,120,均数,139.9 cm,标准差,7.5 cm,1993,年:,153,均数,143.7 cm,标准差,6.3 cm,完全随机设计类型(两种形式),2024/11/29,41,完全随机设计,检验可解决的问题,?,2024/11/29,42,完全随机设计,检验的假设检验步骤,作出推断结论,不能拒绝,H,0,拒绝,H,0,,,接受,H,1,P,P,查相应,的,界值表,确定,值,H,0,:,1,= ,2,H,1,: ,1, ,2,0.05,2024/11/29,43,完全随机设计检验的适用条件,独立性,正态性,方差齐性,(,equal variances),:,两样本来自的两总体方差相等,方差齐性判断:,经验判断,作方差齐性检验,2024/11/29,44,完全随机设计两组比较假设检验分析思路,先作方差齐性检验,检验,方差齐,方差不齐,变量变换,秩和检验,2024/11/29,45,?,方差齐性检验,2024/11/29,46,方差齐性检验的假设检验步骤,0.05,查相应的,F,界值表,确定值,作出推断结论,不能拒绝,H,0,拒绝,H,0,接受,H,1,P,P,2024/11/29,47,(教材,95,页),2024/11/29,48,小结定量资料三种不同设计类型检验比较,区别,单样本设计,配对设计,成组设计,设计形式,解决的问题,建立假设,统计量,自由度计算,前提条件,不满足条件,可采用方法,2024/11/29,49,正态性检验,正态性检验的方法,图示法,P-P,图,Q-Q,图,统计检验方法,W,检验、,D,检验、矩法、拟合优度检验,2024/11/29,50,应用假设检验应注意的问题,样本的代表性与组间均衡性,根据研究目的、资料类型、设计类型及样本含量大小选择适当的假设检验方法,正确理解,P,值的含义,不论得出哪种结论,均有可能犯错误,统计学意义与实际意义,2024/11/29,51,假设检验与区间估计的关系,假设检验与区间估计是统计推断的两个重要内容;,实际上,每一种区间估计都可以对应一种假设检验方法。,2024/11/29,52,假设检验与区间估计的关系,置信区间具有假设检验的主要功能;,置信区间可以提供假设检验没有的信息(置信区间在回答差别有无统计学意义的同时,还可以提示差别有无实际意义);,假设检验可提供置信区间不提供的信息,当统计结论为拒绝,H,0,时,假设检验可以报告确切的,P,值,说明检验结论的概率保证;,当统计结论为不拒绝,H,0,时,假设检验可以对检验功效做出估计。,2024/11/29,53,如图 置信区间可以提供的信息,2024/11/29,54,假设检验与区间估计的关系,总之,置信区间与相应的假设检验既能提供等价信息,又各自有不同的功能,两者结合起来,可以提供更全面更完整的信息,2024/11/29,55,本章小结,掌握内容,假设检验的基本步骤,检验,应用假设检验应注意的问题,第,类错误与第,类错误,2024/11/29,56,本章小结,了解内容,假设检验的功效计算,正态性检验的目的与检验方法,
展开阅读全文