第十七章分类资料的统计推断课件

上传人:hknru****knru 文档编号:243120364 上传时间:2024-09-16 格式:PPT 页数:45 大小:809.50KB
返回 下载 相关 举报
第十七章分类资料的统计推断课件_第1页
第1页 / 共45页
第十七章分类资料的统计推断课件_第2页
第2页 / 共45页
第十七章分类资料的统计推断课件_第3页
第3页 / 共45页
点击查看更多>>
资源描述
,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,第十七章 分类资料的统计推断,第一节 率的抽样误差与区间估计,一、率的抽样误差,如同前面所讨论过的样本均数与总体均数存在着抽样误差一样,样本率与总体率同样存在着抽样误差。这个误差的大小我们用,率的标准误,来描述,,用 表示。,由于抽样引起的样本率之间及样本率与总体率之间的误差,称为,率的抽样误差,或,率的标准误。,式中 为总体率, 为样本例数。,由于在实际中,总体率往往未知,我们常用样本率,P,来近似代替总体率,则上述公式变为:,式中 为,样本率的标准误,,,P,为样本率,为样本例数。,例,17-1,某研究者为了解某地儿童结核的自然感染情况,调查了,500,儿童,其中有,20,人感染了结核,结核的自然感染率为,4%.,试估计该样本频率的抽样误差。,已知:,p=4%,n=500,代入公式得到标准误估计值:,点估计,区间估计,正态近似法,查表法,总体率的估计,二、率的区间估计,(一)正态近似法,当,n,足够大,且,np,和,n(1-p),均大于等于,5,时,,P,的分布接近正态分布。可用下列公式来求总体率的可信区间:,例,17.1,中结核感染率,95%,的可信区间为,(二)查表法,当样本含量较小时,比如,n50,特别是,p,接近,0,或,1,,需查表(百分率的可信区间表),得到总体率的可信区间。,第二节 率的,u,检验,一、样本率与总体率的比较,例,17.2,某研究者用新的方法治疗脑梗死患者,98,人,治疗四周后其生活能力改善率为,50%,。一般情况下脑梗死患者四周后生活能力改善率为,30%,,问该疗法与一般情况相比其生活能力改善率是否有统计学差异?,分析:,np,和,n(1-p),均大于等于,5,,可认为近似正态分布,可用,u,检验。,1,、建立检验假设,确定检验水准,H,0,:,1,=,2,H,1,:,1,2,=0.05,2,、计算统计量,3,、确定,P,值,做出推断结论,二、 两样本率的比较,例,17.3,某研究者为了解乙肝携带率的城乡差异,调查了城乡居民,1000,人,其中城市,522,人,乙肝携带者,24,人,携带率为,4.6%,农村,478,人,乙肝携带者为,33,人,携带率为,6.9%,,试比较乙肝携带城乡差异有无统计学差异。,1,、建立检验假设,确定检验水准,H,0,:,1,=,2,H,1,:,1,2,=0.05,2,、计算检验统计量,3,、确定,P,值,做出推断结论,。,第三节,2,检验,2,检验,(Chi-square test),是英国人,K .Pearson,(,1857-1936,)于,1900,年提出的一种具有广泛用途的统计方法检验。,用途:,1,、两个及多个样本率或构成比的比较,2,、两分类变量间的关联分析,3,、频数分布的拟和优度检验,四格表资料的基本形式,(一),2,检验的基本思想,一 四格表资料的,2,检验,例,17-1,某研究者为探讨不同性别大学生的近视眼患病率是否相同。收集了资料见表,17-2,。问男女同学近视眼患病率有无差别?,表,17-2,男女生近视眼患病率的比较,性别,近视人数,视力正常人数,合计,患病率,%,男,88,(,104,),112(96),200,44.0,女,120,(,104,),80(96),200,60.0,合计,208,192,400,52.0,性别,近视人数,视力正常人数,合计,患病率,%,男,88,(,104,),a,112(,96,)b,200,44.0,女,120,(,104,),c,80(,96,)d,200,60.0,合计,208,192,400,52.0,实际频,数,A,理论频,数,T,A,:实际频数,T,:理论频数,即如果检验假设成立,应该观察到的例数。,2024/9/16,21,2,分布是一种连续型分布,,按分布的密度函数可给出不同自由度的一簇分布曲线。,2,分布的形状依赖于,自由度,的大小。,2,分布,(,chi-square distribution,),3.84,7.81,12.59,P,0.05,的临界值,(二),2,检验的步骤,(,1,) 建立检验假设,确定检验水准,H,0,:,1,=,2,,,H,1,:,1,2,,,=0.05,(,2,)计算检验统计量值,(3),确定,P,值,作出推断结论,故,P,0.01,,按,=0.05,的检验水准,拒绝,H,0,,接受,H,1,,差别有统计学意义,可认为女生的患病率高于男性。,查,2,界值表:,二、四格表资料,2,检验的专用公式,组别,阳性,阴性,合计,A,组,a,b,a+b,B,组,c,d,c+d,合计,a+c,b+d,a+b,+,c+d,为了不计算理论频数,T,可由基本公式推导出,直接由,各格子的实际频数,(,a,、,b,、,c,、,d,)计算卡方值的公式:,例,1,2,界值表,是根据连续性的理论分布计算出来的,但分类变量资料属于非连续性分布,由此计算出的,2,值,也是不连续的,仅是,2,分布的一种近似,尤其是自由度为,1,的四格表,当,n,与,T,较小时,所得的,P,值较小,须做连续性校正:,三、四格表资料,2,检验的校正公式,n,40,,且,T,min,5,时,用,2,检验基本公式和专用公式,n,40,,但,1,T,min,5,时,用,2,检验校正公式,n40,,或,T,min,1,时,或,P,用四格表,Fisher,确切概率法,校正公式:,例,17-5,某医师用甲乙两种方法治疗单纯性肥胖,结果见表,17-3,。试问两种方法的疗效有无统计学差异?,表,17-3,两种疗法对单纯性肥胖疗效的比较,组别,有效,无效,合计,甲,25(,27.7,),7(,4.3,),32,乙,27(,24.3,),1,(3.7),28,合计,52,8,60,n=78,,,T,22,=28*8/60=3.75,应计算校正值,(,1,) 建立检验假设,确定检验水准,H,0,:,1,=,2,,,H,1,:,1,2,,,=0.05,(,2,)求检验统计量值,(3),确定,P,值,作出推断结论,例,17-5,:,若未进行校正,,2,= 4.33,,则,P0.05.,二 配对四格表资料的,2,检验,例,17-6,某研究者用甲乙两种试剂检验,132,份,HBsAg,阳性血清,结果见表,17-5,。问两种方法的检测结果有无差别?,分类变量的配对设计资料特点:,一组观察对象分别观察其两种分类变量的表现,归纳成双向,交叉排列的统计表。,配对设,计资料,表,7-3,两种方法的检测结果,甲试剂,乙试剂,合计,80(a),10(b),90,31(c),11(d),42,合计,111,21,132,b+c,40,,,3.,确定,P,值,下结论。,P,2,0.005,2,,得,P,0.005,,按,=0.05,的检验水准,拒绝,H,0,,接受,H,1,,可认为,三种疗法治疗的有效率不等,根据,=3,查,2,界值表,四 行,列表,2,检验注意事项,1,、行,列表资料,2,检验,一般不宜有,1/5,以上格子理论频数,小于,5,,或有一个格子的理论频数小于,1,。,对理论数太小有三种处理办法:,A:,最好是增加样本例数以增大理论频数,B:,删除理论频数太小的行和列,或与性质相近邻行列合并,C:,改用双向无序,R,C,表资料的,Fisher,确切概率法,B,法可能会损失信息,损害样本的随机性,故不宜作常规方法,2,、对于等级资料的统计处理,即当处理效应按强弱分为若干个级别,如:,-,、,+,、,+,、,+,、,+,等,由于效应是按顺序排列的,那么按试验结果整理为,单向有序行列表,,在比较各处理组的效应有无差别时,宜用下一讲的秩和检验。若作了,2,检验,只说明各处理组的效应在构成比上有无差异。,3,、当多个样本率或构成比比较时,如拒绝,H0,只能认为各总体率或总体构成比之间差别有统计学意义,不能说明彼此间都有差别,或某两者间有差别,若要进一步对每两个率,/,构成比进行比较,可用多个率的多重比较。,SPSS,软件,谢谢,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!