资源描述
Click to edit Master title style,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,Monday, September 30, 2024,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,两个率或多个率的比较,一、 率的抽样误差与标准误,样本率(p)和总体率()的差异称为率的抽样误差(sampling error of rate) ,用率的标准误standard error of rate度量。,假设总体率未知,用样本率p估计,标准误的计算,二、 总体率的可信区间,总体率的可信区间 (confidence interval of rate):,根据样本率推算总体率可能所在的范围,率的统计学推断,一、样本率与总体率比较u检验,二、两个样本率的比较u检验,一、样本率与总体率比较的u检验,u检验的条件:n p 和n1- p均大于5时,二、两个独立样本率比较的u检验,表5-1 两种疗法的心血管病病死率比较,u,检验的条件:,n,1,p,1,和,n,1,(,1- p,1,),与,n,2,p,2,和,n,2,(,1- p,2,)均 5,卡方检验,2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson1857-1936于1900年提出的一种具有广泛用处的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。,本章仅限于介绍两个和多个率或构成比比较的2检验。,一、卡方检验的根本思想(1),表5-1 两种疗法的心血管病病死率的比较,22表或四格表(fourfold table),实际频数A (actual frequency) ( a、b、c、d)的,理论频数T( theoretical frequency)H0:1=2=:,a的理论频数 (a+b)pc= (a+b)(a+c.)/ n=nRnC,b的理论频数 (a+b)(1-pc)= (a+b)(b+d.)/ n =nRnC,c的理论频数 (c+d)pc= (c+d)(a+c)/ n =nRnC,d的理论频数 (c+d)(1-pc)= (c+d)(b+d.)/ n =nRnC,一、卡方检验的根本思想(2),各种情形下,理论与实际偏离的总和即为卡方值chi-square value,它服从自由度为的卡方分布。,P,2分布chi-square distribution,2检验的根本公式,上述根本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此根底上开展起来的。它不仅适用于四格表资料,也适用于其它的“行列表。,二、四格表专用公式1,为了不计算理论频数T, 可由根本公式推导出,直接由各格子的实际频数a、b、c、d计算卡方值的公式:,二、四格表专用公式2,2(1) u224.82n40,所有T5时,三、连续性校正公式1,2分布是一连续型分布,而行列表资料属离散型分布,对其进展校正称为连续性校正(correction for continuity),又称Yates校正Yates correction。,当n40,而1T5时,用连续性校正公式,当n40或T1时,用Fisher准确检验(Fisher exact test ),校正公式,:,三、连续性校正公式2,因为1,T,5,且,n,40时,所以应用连续性校正,2,检验,四、配对四格表资料的,2,检验,配对四格表资料的2检验也称McNemar检验McNemars test,H0:b,c来自同一个实验总体两种剂量的毒性无差异;,H1:b,c来自不同的实验总体两种剂量的毒性有差异;=0.05。,五、行列RC表资料的2检验,R,C,表的,2,检验通用公式,几种,R,C,表的检验假设,H,0,R,C,表的计算举例,RC表2检验的应用本卷须知,1. 对RC表,假设较多格子1/5的理论频数小于5,或有一个格子的理论频数小于1,那么易犯第一类错误。,出现某些格子中理论频数过小时怎么办?,1增大样本含量最好!,2删去该格所在的行或列丧失信息!,3根据专业知识将该格所在行或列与别的行或列合并。丧失信息!甚至出假象,RC表2检验的应用本卷须知,2.多组比较时,假设效应有强弱的等级,如+,+,+,最好采用后面的非参数检验方法。2检验只能反映其构成比有无差异,不能比较效应的平均程度。,3.行列两种属性皆有序时,可考虑趋势检验或等级相关分析。,
展开阅读全文