资源描述
,*,第七章 假设检验基础,1,学习要点,1、掌握假设检验的概念、原理、基本步骤;,2、掌握常见t检验方法及要求条件;,3、掌握Poisson分布资料的z检验及其条件,4、熟悉假设检验的逻辑思维方法(p的意义、结论的写作等),5、掌握两类错误,6、掌握假设检验的注意事项、假设检验与置信区间的关系,2,3,4,(一)概念:何谓假设检验?,例,已知北方农村儿童前囟门闭合月龄为,14.1月,。某研究人员从东北某县抽取,36名,儿童,得囟门闭合月龄均值为,14.3月,,标准差为,5.08月,。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?,?,5,北方农村儿童前囟门闭合月龄的平均数,0,,,东北某县,儿童前囟门闭合月龄的,平均数,1,,,0,1,平均数为14.3,标准差为5.08,N=36,平均数为14.1,Population,SAMPLE,6,(二)假设检验的基本原理(基本思想):,1、为什么要进行假设检验?,因为样本均数存在差别的原因有:,完全由抽样误差造成,研究因素造成(本质上的差别),统计上就是推断样本均数的差别,由造成的概率大小。,7,如果由造成的概率很大(如P0.05),则认为差别无统计意义。,如果由造成的概率很小(如P0.05)则认为样本均数的差别不是,而是造成,则认为差别有统计意义。,8,首先对总体参数或分布做出假设,,建立假设,(H,0,和H,1,),,,H,0,为,检验假设(无效假设),, H,1,为,备择假设,。,再选方法计算统计量,,然后判断,H,0,这一假设成立的概率大小,这一方法过程称为,假设检验,。,9,样本统计量不等,抽样误差所致,(来自同一总体),环境条件所致,(来自不同总体),?,假设检验回答,P0.05,P0.05,10,假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面,(,H,0,),出发间接判断要解决的问题,(,H,1,),是否成立。然后在,H,0,成立的条件下计算检验统计量,最后获得,P,值来判断,。,11,(三).假设检验的基本步骤:,12,H,1,的内容直接反映了检验单双侧。若,H,1,中只是,0,或,14.1(月),该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平,检验水准(size of a test),=0.05,21,2、选定检验方法,计算统计量:,样本均数与总体均数比较t检验,本例中,,未知,故应用t检验,22,3.,确定,P,值,做出推断结论,自由度为35 ,查附表2,得到:,单侧,得知,P,0.25,。,按,=0.05检验水准不拒绝H,0,,即该县儿童前囟门闭合月龄的均数不大于一般儿童。,23,0.236,P,0.682,V=35,24,二、配对资料的比较,1.配对的形式,:,自身比较,处理前后比较;,同一样品接受两种不同处理;,成对的两个对象给予两种不同的处理;,25,目的:,差值,d,的总体均数是否为,0,。,条件:,理论上要求差值来自正态分布总体。,2.推断的目的及条件:,26,例7-3,用两种方法测定12份血清样品中Mg,+,含量(mmol/L),结果如下表所示,试问两种方法测定结果有无差异?,27,表7-3 两种方法测定血清Mg,+,(,mmol/L,),样品,甲基百里酚蓝,葡萄糖激酶两点法,1,0.94,0.92,2,1.02,1.01,3,1.14,1.11,4,1.23,1.22,5,1.31,1.32,6,1.41,1.42,7,1.53,1.51,8,1.61,1.61,9,1.72,1.72,10,1.81,1.82,11,1.93,1.93,12,2.02,2.04,差值,-0.02,-0.01,-0.03,-0.01,0.01,0.01,-0.02,0.00,0.00,0.01,0.00,0.02,28,(1)建立检验假设,确定检验水准,H,0,:,d,0,两种方法测定结果之差总体均数为0,H,1,:,d,0,,=0.05,(2)计算检验统计量,本例,n,=12,,29,(3)确定P值,作出推断结论,查附表2的,t,界值表得,0.4,P,0.5。按,=0.05,水准,不拒绝H,0,,有统计学意义。尚不能认为,两种方法测定结果有差异。,30,表2 3组肥胖患者治疗前后体重、BMI、体脂百分率比较 ( ),31,两本均数比较的,t,检验亦称为成组t检验,又称为独立样本,t,检验(independent samples t-test)。,适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它们各自所代表的总体均数是否相等。,三、两独立样本均数的比较,32,要求条件:,样本来自正态总体,两样本总体方差相等。,1.两小样本均数比较,(,n,1,50且 n,2,50,),,t,检验,33,样本估计值为 :,总体方差已知:,标准误的计算公式,34,若n,1,=n,2,时:,已知S,1,和S,2,时:,35,例7-4,某口腔科测得长春市13-16岁居民男性20人初期腭弓深度均值为17.15cm,标准差为1.59cm,女性34人的均值为16.92cm,标准差为1.42cm。根据该资料可否认为该市13-16岁居民腭弓深度有性别差异?,36,(1)建立检验假设,H,0,:,1,2,,即腭弓深度相同,H,1,:,1,2,,即腭弓深度不同,0.05,37,(2)计算,t,值,38,(3)确定,P,值 作出推断结论,=20+34-2=52,查,t,界值表,得,t,0.5,50,=0.679,现t=0.550,0.5。按=0.05水准,不拒绝,H,0,,差异无统计学意义。,结论:,尚不能认为该市13-16岁居民腭弓深度有性别差异。,39,2.两大样本均数比较,(,n,1,50且n,2,50,),,z,检验。,推断目的:,推断两样本来自的总体均数是否相等。,40,若变量变换后总体方差齐性,可采用,t,检验,(,如两样本几何均数的,t,检验,就是将原始数据取对数后进行,t,检验,),;,若变量变换后总体方差仍然不齐,可采用,t,检验或Wilcoxon秩和检验。,若两总体方差不等( ),?,41,2,.,近似,t,检验(,t, 检验),Cochran & Cox 调整,t,界值,Satterthwaite 调整自由度,42,43,Possion分布资料的z检验,当总体均数,20,时, Possion分布近似正态分布。,一、单样本资料的z检验,例,7-8,某市计划,2005,年接种吸附百白破联合疫苗无菌化脓发生率控制在,25/10,万人次以内。该市随机抽查该年吸附百白破联合疫苗,77755,人次,其中发生化脓例数,23,例,问,2003,年该市无菌化脓发生率能否达到要求?,以,10,万人次作为一个单位,该市,2005,年实际发生的化脓例数:,23/7775=29.58/10,万人次,44,以,10,万人次为一单位,,2005,年计划控制化脓人数为,25,人20。,1. 建立检验假设,确定检验水准,H,0,=25,H,1,25,=0.05,2. 计算统计量,3 . 确定p值,作出推断结论,当z=0.916时对应的单侧P=0.1788,P0.05,按,=0.05,水准,不拒绝H0,可以认为2005年该市无菌化脓发生率能达到要求。,45,二、两独立样本资料的z检验,当总体均数,20,时, Possion分布近似正态分布。,H,0,1,=,2,H,1,1,2,=0.05,当两样本,观测单位数相等,时,,若总体均数,20 ,,H,0,成立时,,当两样本,观测单位数不相等,时,46,例7-9,某市研究不同性别成年人意外伤害死亡情况有无差别,随机抽取该市2002年男女疾病检测数据各10万人,男女因意外伤害死亡人数分别为51人和23人。问该市2002年不同性别每10万人口意外伤害死亡平均人数是否相等?,47,1. 建立检验假设,确定检验水准,H,0,1,=,2,H,1,1,2,=0.05,2. 计算统计量,3 . 确定p值,作出推断结论,当z=3.2549时对应的双侧P=0.0024,按,=0.05,水准,拒绝H,0,,可以认为2002年该市男女意外杀害死亡平均人数有差异,且男性较高。,48,例7-10,某车间改革生产工艺前,测得三次粉尘浓度,每升空气中分别为38、29和36颗粉尘;改革后测取两次,浓度分别为25和18颗粉尘。问改革前后平均粉尘浓度是否相等?,49,1. 建立检验假设,确定检验水准,H,0,1,=,2,H,1,1,2,=0.05,2. 计算统计量,3 . 确定p值,作出推断结论,当z=2.723时对应的双侧P=0.007,按,=0.05,水准,拒绝H,0,,可以认为改革前后粉尘浓度不同,且改革后粉尘浓度较低。,50,可信区间与假设检验的关系,一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了,H,0,,则按,水准,不拒绝,H,0,;若不包含,H,0,,则按,水准,拒绝,H,0,,接受,H,1,。,51,另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。,52,图,7-4,可信区间在统计推断上提供的信息,53,虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率,检验水准,的前提下进行计算,而假设检验能够获得一较为,确切的概率,P,值,。,54,一、I型错误和II型错误,假设检验是利用小概率反证法思想,根据,P,值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝,H,0,,都可能犯错误。见下表。,55,表1 推断结论和两类错误,实际情况,检验结果,拒绝,H,0,不拒绝,H,0,H,0,真,H,0,不真,第类错误 (),结论正确 (1-),结论正确(1-),第类错误(),56,I 型错误:,“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是,(其值等于检验水准),II型错误:,“实际有差别,但下了不拒绝,H,0,的结论”,假阴性错误。犯这种错误的概率是,(其值未知),。,但n一定时,,增大,,则减少。,57,58,59,1-, :检验效能(power):当,两总体确有差别,按,检验水准,所能发现这种差别的能力。,60,减少I型错误的主要方法:假设检验时设定,值。,减少II型错误的主要方法:,提高,检验效能,。,提高,检验效能的最有效方法:增加样本量,。,如何,选择合适的样本量:实验设计,。,61,假设检验应当注意的问题,比较的样本间有均衡性和可比性,-,随机抽样;,选用的假设检验方法应符合其应用条件;,正确理解差别有无显著性的统计意义;,结论不能绝对化;,报告结论时应列出统计量值,注明单侧或双侧检验,写出,P,值的确切范围,。,62,正态性检验,和两样本方差比较的,F,检验,63,t,检验的应用条件是正态总体且方差齐性;配对,t,检验则要求每对数据差值的总体为正态总体。,进行两小样本,t,检验时,一般应对资料进行方差齐性检验,尤其两样本方差悬殊时。,若方差齐,采用一般的,t,检验;若方差不齐,则采用,t,检验。,64,正态性检验 (normality test),1图示法:P-P plot,Q-Q plot,2矩法,偏度系数(skewness),,峰度系数(kurtosis)。,3,W,检验法,4,D,检验法,65,两均数差别检验的比较:,大样本也可近似用z检验,66,
展开阅读全文