资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,浙江大学医学院流行病与卫生统计学教研室 沈毅,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,t,检验,假设检验的基本思想,:,小概率反证法,即原假设成立时,若在一次抽样中就发生了小概率事件,则应推翻原假设。,假设检验的两类错误,:,类错误(弃真)、,类错误(存伪),t,检验,单样本,单样本,t,检验,两样本,成组设计两样本均数比较的,t,检验,配对设计样本均数比较的,t,检验,样本均数与总体均数的比较即单样本的,t,检验通过,One-Sample T Test,过程实现。,建立假设:,H,0,:,=,0,,样本均数与总体均数的差异完全是,抽样误差造成。,H,1,:,0,,样本均数与总体均数的差异除了由,抽样误差造成外,也反映了两个总体均数确,实存在的差异。,=0.05,单样本,t,检验,例,1,为研究某山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数。某医生在一山区随机抽查了,20,名健康成年男子,求得其脉搏的均数为,74.2,次,/,分,标准差为,6.0,次,/,分。根据大量调查,已知健康成年男子脉搏数均数为,72,次,/,分,能否据此认为该山区成年男子的脉搏均数高于一般成年男子的脉搏数?数据见,pulse,.sav,:,75,、,74,、,72,、,74,、,79,、,78,、,76,、,69,、,77,、,76,、,70,、,73,、,76,、,71,、,78,、,77,、,76,、,74,、,79,、,77,。,单样本,t,检验,单样本,t,检验,单样本,t,检验,要检验的变量:,pulse,总体均数,共有,20,个测量值,质量均值为,75.05,次,/,分,标准差为,2.892,次,/,分,标准误为,0.647,次,/,分。,单样本,t,检验,分析结果,(,1,)单样本统计量,单样本,t,检验,t,值为,4.716,,自由度为,19,,双侧检验,p,值小于,0.001,,则按所取检验水准,0.05,,则拒绝,H,0,,接受,H,1,,即表明可认为样本该山区健康成年男子脉搏的均数高于一般健康成年男子。,分析结果,(,2,)单样本检验,差值的均值为,3.050,,,95,可信区间为,1.70,4.40,。,单样本,t,检验,1.,总体均数置信区间与,t,检验的一致性,上述分析结果同时给出了均数的置信区间和,t,检验的结果,两者的结论实际上是完全一致的。,置信区间可用于回答假设检验的问题,同时这两者又是互为补充的关系:置信区间回答“量”的问题,即总体均数的范围在哪里,而假设检验是回答“质”的问题,即总体均数之间是否存在差异,以及在统计上确认这种差异的把握有多大。,置信区间在回答有无统计学意义的同时,还可进一步回答这种差异有无实际意义。,单样本,t,检验,2.,单样本,t,检验的应用条件,当样本例数较小时,一般要求样本取自正态总体。,由中心极限定理可知,如果原始数据不服从正态分布,只要样本量足够大,其样本均数的抽样分布仍然是正态的。也就是说只要数据分布不是强烈的偏态,一般而言单样本,t,检验都是适用的。,总的来说,单样本,t,检验非常稳健,只要没有明显的极端值,其分析结果都是非常稳定的。,成组设计,t,检验,两样本均数的比较即两样本,t,检验通过,Independent-,Samples T Test,过程实现。,建立假设:,H,0,:,1,=,2,,两个样本均数的差异完全是抽样误,差造成,两个总体均数相同。,H,1,:,1,2,,两个样本均数的差异除了由抽样误,差造成外,两个总体均数确实存在差异。,=0.05,例,2,现希望评价两位老师的教学质量,试比较其分别任教的甲、乙两班(设甲、乙两班原成绩相近,不存在差别)考试后的成绩是否存在差异?见,score.sav,甲班:,85 73 86 77 94 68 82 83 90 88 76 85 87 74 85 80,82 88 90 93,乙班:,75 90 62 98 73 75,75,76 83 66 65 78 80 68 87 74,64 68 72 80,成组设计,t,检验,成组设计,t,检验,要检验的变量:,Score,分组变量,成组设计,t,检验,定义组别具体数值,成组设计,t,检验,成组设计,t,检验,成组设计,t,检验,给出两个班级的各种统计量,包括样本含量、均数、,标准差、标准误,分析结果,(,1,)各组统计量,成组设计,t,检验,方差齐性检验,结果,p,=0.397,表明方差齐。,若方差齐,参考,Equal variances assumed,一行统计量,若方差不齐,参考,Equal variances not assumed,一行统计量,分析结果,(,2,)两样本检验,独立性,(,independence,),各观察值之间相互独立,不能相互影响,正态性,(,normality,),各个样本均来自正态总体,方差齐性,(,homoscedascity,),各个样本所在总体的方差相等,成组设计,t,检验,应用条件,独立性,:在实际应用中,独立性对结果的影响较大,但检验数据独立性的方法比较复杂,一般都是根据资料的性质来加以判断。例如遗传性疾病、传染病的数据可能就存在非独立的问题。如果从专业背景上可以肯定数据不存在这些问题,则一般独立性总是能够满足的。,独立性,正态性,:在,SPSS,中,正态分布的考察方法有:偏度系数、峰度系数;直方图、,P-P,图;也可进行各种假设检验。而最常用的对于正态分布的检验就是,K-S,单样本检验。,t,检验对资料的正态性有一定的耐受能力,如果资料只是少许偏离正态,则结果仍然很稳健。若偏离正态很远,则最好考虑变量变换,或用非参数方法加以分析。,以例,2,(,score.sav,)为例,用,K-S,单样本检验考察数据的正态性。,注意:应分组考察正态性,而不是合并进行,正态性,为分组进行正态性检验,首先对数据进行拆分,正态性,数据拆分后,右下角显示,Split File On,,表示,正处于数据已拆分状态,正态性,正态性,正态分布,泊松分布,均匀分布,指数分布,正态性,正态性,正态性检验结果,P,=0.779,,表明数据服从正态分布,P,=0.908,,表明数据服从正态分布,在上述两样本,t,检验的结果中已经提供了,Levenes,检验的结果,在,SPSS,的,Explore,过程中提供了更为详细的,Levenes,方差齐性检验。,方差齐性,Levenes,方差齐性检验,方差齐性,Based on Mean,:基于均数,Based on Median,:基于中位数,Based on Median and with adjusted df,:,基于调整自由度的中位数,Based on trimmed mean,:基于截尾均数,方差齐性,同一受试对象处理前后的数据,同一受试对象两个部位的数据,同一样品用两种方法(仪器等)检验的结果,配对两个受试对象分别接受两种处理后的数据,配对设计,t,检验,常用的配对设计有,4,种情况:,配对设计均数的比较即配对,t,检验通过,Paired-Samples,T Test,过程实现。,建立假设:,H,0,:,d,=0,,两种处理没有差别,H,1,:,d,0,,两种处理存在差别,=0.05,例,3,用某药治疗,10,名高血压病人,对每人治疗前、后舒张压(,mmHg,)进行测量,数据见,pair.sav,,问该药有无降压作用?,治疗前后的舒张压测量结果,配对设计,t,检验,配对设计,t,检验,选入配对变量,配对设计,t,检验,配对设计,t,检验,分析结果,(,1,)配对样本统计量,(,2,)配对变量相关性分析,配对差值的统计描述,差值的检验结果,配对设计,t,检验,分析结果,(,2,)配对,t,检验,上表的结果可知:,t,=2.645,,,p,=0.027,,,按所取检验水准,0.05,,则拒绝,H,0,,接受,H,1,。治疗前后的差异具有统计学意义,即认为某药对高血压病人有影响。,
展开阅读全文