定性资料的分析课件

上传人:阳*** 文档编号:84628226 上传时间:2022-05-04 格式:PPT 页数:75 大小:691KB
返回 下载 相关 举报
定性资料的分析课件_第1页
第1页 / 共75页
定性资料的分析课件_第2页
第2页 / 共75页
定性资料的分析课件_第3页
第3页 / 共75页
点击查看更多>>
资源描述
定性资料的分析第七章第七章 定性资料的分析定性资料的分析 定性资料的分析统计描述统计描述统计推断统计推断指标描述指标描述图表描述图表描述参数估计参数估计假设检验假设检验统计分析统计分析定性资料的分析定性资料的分析定性资料的分析参数估计参数估计 率的区间估计率的区间估计假设检验假设检验 检验检验、2u定性资料的分析一、率的可信区间一、率的可信区间 与均数一样,率也存在抽样误差 ,率的标准差又称率的标准误为: 率的抽样误差率的抽样误差nppsp)1 ( 定性资料的分析(一)率的分布(一)率的分布 当总体率当总体率 0.5时为正偏态,时为正偏态,当当 0.5时为负偏态,时为负偏态,当当 =0.5时为对称分布。时为对称分布。只有当只有当n较大、率较大、率 和和(1- )都不太小时,例都不太小时,例如如n 和和n(1- )均大于均大于5时,率的抽样分布近时,率的抽样分布近似于正态分布。似于正态分布。定性资料的分析(二)总体率(二)总体率 的区间估计的区间估计 正态近似法正态近似法 查表法查表法定性资料的分析1.1.正态近似法正态近似法条件条件: 样本例数样本例数n足够大,且样本率足够大,且样本率p和和(1-p)都不都不 太小时,即太小时,即np和和n(1-p)均大于均大于5时,样本率时,样本率p 的抽样分布近似正态分布的抽样分布近似正态分布 psuppsup( , )总体率总体率 的可信区间:的可信区间: 定性资料的分析例例 从某地人群中随机抽取从某地人群中随机抽取144144人,检查乙型肝炎表面人,检查乙型肝炎表面抗原携带状况,阳性率为抗原携带状况,阳性率为9.209.20,求该地人群的乙型肝,求该地人群的乙型肝炎表面抗原阳性率的炎表面抗原阳性率的9595可信区间。可信区间。 n =144,p=9.20 %41. 20241. 0144/)092. 01 (092. 0ps9595可信限为:可信限为:9.20%9.20%1.961.962.41%2.41%即该地人群的乙型肝炎表面抗原阳性率的即该地人群的乙型肝炎表面抗原阳性率的9595可信可信 区间为:区间为:4.48%4.48%13.92%13.92%。定性资料的分析2.2.查表法查表法例例4.5 有人调查有人调查29名非吸毒妇女,出狱时有名非吸毒妇女,出狱时有1名名HIV(人免疫缺陷病毒人免疫缺陷病毒)阳性,求阳性率阳性,求阳性率95可信区间可信区间? 直接查附表直接查附表6.2,6.2,在行在行n=29, n=29, 列列x=1x=1交叉处交叉处0.10.117.817.8即即为为阳性率阳性率95可信区间可信区间定性资料的分析 0 pv例例7.1 据临床经验,一般的胃溃疡病患者有据临床经验,一般的胃溃疡病患者有20会出现胃出血症状。某医院观察了会出现胃出血症状。某医院观察了304例例65岁的胃溃疡病患者,其中有岁的胃溃疡病患者,其中有96例发生胃例发生胃出血,占出血,占31.58,问老年患者是否较一般,问老年患者是否较一般患者易出血?患者易出血? 7.1 7.1 样本率与总体率的比较样本率与总体率的比较 定性资料的分析目的:目的:推断样本是否来自某已知总体推断样本是否来自某已知总体 条件:条件:正态近似检验:正态近似检验:np5 n(1-p)5 可信区间估计:不符合上述条件可信区间估计:不符合上述条件 (二项分布原理)(二项分布原理)定性资料的分析npu/ )1 (000样本率与总体率比较的样本率与总体率比较的正态近似检验正态近似检验定性资料的分析检验假设:检验假设: H0: = 0, 老年胃溃疡病患者的胃出血率等于老年胃溃疡病患者的胃出血率等于20;H1: 0, 老年胃溃疡病患者的胃出血率大于老年胃溃疡病患者的胃出血率大于20。 单侧单侧 =0.05。 P3.84的可能性只有的可能性只有0.05,是一小概,是一小概 率事件。率事件。 0 3.84 0 .1 .2 .3 .4 .5 定性资料的分析v本例本例 2 =3.52 0.05。v按按 = 0.05水准不拒绝水准不拒绝H0,差别无统计学意义。,差别无统计学意义。故尚不能认为单纯手术疗法与联合疗法对乳腺故尚不能认为单纯手术疗法与联合疗法对乳腺癌患者治疗效果有差别。癌患者治疗效果有差别。定性资料的分析基本思想概括基本思想概括v若若H0成立,则四个格子的实际频数成立,则四个格子的实际频数A与理与理论频数论频数T之差异纯系抽样误差所致之差异纯系抽样误差所致,故一,故一般不会很大,般不会很大, 2值也就不会很大;值也就不会很大;在一次随在一次随机试验中,出现大的机试验中,出现大的 2 值的概率值的概率P 是很小的。是很小的。定性资料的分析v因此,若根据实际样本资料求得一个很因此,若根据实际样本资料求得一个很小的小的P,且,且P (检验水准检验水准),根据小概率,根据小概率原理,就有理由怀疑原理,就有理由怀疑H0的真实性,因而的真实性,因而拒绝它;若拒绝它;若P ,则没有理由拒绝,则没有理由拒绝H0 定性资料的分析四格表资料 2检验检验专用公式 )()()()(22dbcadcbanbcad52. 335968447131)5782739(22定性资料的分析 由于由于 2分布是一种连续性分布,附表分布是一种连续性分布,附表3中中 2界值是根界值是根据此连续性分布的理论公式计算出来的,但两个或据此连续性分布的理论公式计算出来的,但两个或多个率比较的原始数据却属定性资料,是不连续的,多个率比较的原始数据却属定性资料,是不连续的,故式故式(7.5)只是一个近似计算公式。计算出来的只是一个近似计算公式。计算出来的 2值往值往往偏大,相应的往偏大,相应的P值偏小,从而人为地增加了范第一值偏小,从而人为地增加了范第一类错误的机会。为纠正这种偏性,可采用校正类错误的机会。为纠正这种偏性,可采用校正 2,用,用 C2表示。表示。 四格表资料四格表资料 2检验检验的校正的校正定性资料的分析v 2检验不校正的条件:检验不校正的条件: n 40 且所有且所有T 5v 2检验校正的条件:检验校正的条件: n40 但有但有lT5 四格表资料四格表资料 2检验检验的应用条件的应用条件确切概率法确切概率法: 当当n和和T过小,如过小,如T1或或n40时因近时因近似程度太差,不宜用似程度太差,不宜用 2检验,而应改用检验,而应改用确确切概率法切概率法。定性资料的分析四格表资料四格表资料 2检验检验的校正公式的校正公式TTAC22)5.0()()()()2/(22dbcadcbanncbdaC定性资料的分析表7.3 两组化疗的缓解率比较 治疗组 缓解 未缓解 合计 缓解率(%) 单纯化疗 2(4.68) 10(7.32) 12 16.67 复合化疗 14(11.32) 15(17.68) 29 48.28 合 计 16 25 41 39.02 例例7.3 比较单用甘磷酰芥比较单用甘磷酰芥(单纯化疗组单纯化疗组)与复合使用争光霉与复合使用争光霉素、环磷酰胺等药素、环磷酰胺等药(复合化疗组复合化疗组)对淋巴系统肿瘤的疗效,对淋巴系统肿瘤的疗效,问两组患者总体的完全缓解率有无差别问两组患者总体的完全缓解率有无差别 定性资料的分析H0: 1= 2;H1: 1 2。 0.05。 按按 =1查附表查附表3, 2界值表,得界值表,得P0.05,按,按 = 0.05水水准不拒绝准不拒绝H0,差异无统计学意义。故根据本资料尚不,差异无统计学意义。故根据本资料尚不能认为两种疗法的总体缓解率有差别。能认为两种疗法的总体缓解率有差别。84. 336. 22516291241)2/414110152(21 ,05. 022C本例本例a 格的理论频数最小,格的理论频数最小,T11=12 16/41=4.6840,故考虑用校正公式计算,故考虑用校正公式计算 2 值。值。定性资料的分析u检验与检验与 2检验的关系检验的关系 v两样本率比较时,如为双侧检验,则两样本率比较时,如为双侧检验,则u检验和检验和四格表四格表 2检验是等价的,即自由度为检验是等价的,即自由度为1的的 2=u2 ;校正校正u检验和四格表校正检验和四格表校正 2检验也是等检验也是等价的,应用条件亦相同。若为单侧检验,则价的,应用条件亦相同。若为单侧检验,则用用u检验较为方便。检验较为方便。 定性资料的分析数据特点数据特点: 多多(R)个率的比较,其基本数据个率的比较,其基本数据 有有R行行2列,构成列,构成R2表,用以表述表,用以表述R个率的个率的基本数据。基本数据。目的目的: R2表的表的 2检验用于推断检验用于推断R个样本率个样本率 各自所代表的总体率是否相等。各自所代表的总体率是否相等。 7.3 多个样本率的比较多个样本率的比较 定性资料的分析 多个样本率的比较的公式多个样本率的比较的公式 ) 1(22CRnnAn式中,式中,A为第为第R行第行第C列对应的实际频数,列对应的实际频数,nR为第为第R行的行合计,行的行合计, nC为第为第C列的列合计,列的列合计, n为总样本含量。为总样本含量。 iiiTTA22)(定性资料的分析例例7.4 某地调查了某地调查了19951998四个年度中小学女生的贫四个年度中小学女生的贫血状况,见表血状况,见表7.4,问各年度间学生贫血率有无差别?,问各年度间学生贫血率有无差别? 表7.4 某地各年度学生贫血检出率的比较(%) 年份 贫血人数 正常人数 合计 检出率(%) 1995 279 4702 4981 5.60 1996 271 2089 2360 11.48 1997 367 2161 2528 14.52 1998 784 4199 4983 15.73 合计 1701 13151 14852 11.45 定性资料的分析H0:四个年度学生的贫血检出率相等;:四个年度学生的贫血检出率相等;H1:四个年度学生的贫血检出率不等或不全相等。:四个年度学生的贫血检出率不等或不全相等。 =0.05。 =(4-1)(2-1)=3。查附表。查附表3, 2界值表,得界值表,得P0.005。按按 =0.05水准拒绝水准拒绝H0,接受,接受H1,差异有统计学意义。,差异有统计学意义。故可认为该地四个年份中小学女生贫血检出率不相等故可认为该地四个年份中小学女生贫血检出率不相等 281.6263 ) 1131514983419917014983784131512528216117012528367 131512360208917012360271131514981470217014981279(14852222222222定性资料的分析多个率的多重比较多个率的多重比较 当多个样本率比较的当多个样本率比较的 2检验,结论为拒绝检验,结论为拒绝H0时,只能认为各总体率之间总的说来有差别,时,只能认为各总体率之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者但不能说明它们彼此间都有差别,或某两者间有差别。若要进一步比较哪些率之间有差间有差别。若要进一步比较哪些率之间有差别,应进行多重比较。别,应进行多重比较。 定性资料的分析Scheff可信区间法可信区间法 原理原理: 通过计算两率之差的可信区间来推断比通过计算两率之差的可信区间来推断比较组间有无差异。较组间有无差异。两率之差的两率之差的(1- )100%可信区间可信区间BBBAAAkBAnppnpppp)1 ()1 ()(21,pA和和pB分别为比较组的样本率;分别为比较组的样本率;nA和和nB分别为比较分别为比较组的样本含量;组的样本含量;k所有的组数。所有的组数。定性资料的分析例例7.5 试对例试对例7.4四个年度学生贫血检出率的分析四个年度学生贫血检出率的分析结果进一步作两两比较结果进一步作两两比较 . 2=281.6263,P0.005,该地四个年份中小学,该地四个年份中小学女生贫血检出率总的说来有差别。女生贫血检出率总的说来有差别。 2检验的结果检验的结果: 2=281.6263,P0.005,该地四个年份中小学,该地四个年份中小学女生贫血检出率总的说来有差别。女生贫血检出率总的说来有差别。 2检验的结果检验的结果:定性资料的分析98与与97两年间学生贫血检出率差别的两年间学生贫血检出率差别的95%可信区间可信区间之计算如下之计算如下81. 7214,05. 02528)1452. 01 (1452. 04983)1573. 01 (1573. 0)1452. 01573. 0 (21,kBBBAAAkBAnppnpppp)1 ()1 ()(21,98与与97两年间学生贫血检出率差别的两年间学生贫血检出率差别的95%可信可信区间区间(-0.0122,0.0364). 定性资料的分析 四个年度学生贫血检出率的两两比较四个年度学生贫血检出率的两两比较 定性资料的分析构成比的比较构成比的比较 构成比构成比(proportion) 又称构成指标,表示某又称构成指标,表示某一事物内部各组成部分所占的比重或频率,一事物内部各组成部分所占的比重或频率,常以百分数表示,计算公式为:常以百分数表示,计算公式为: %100观察单位总数同一事物各组成部分的的观察单位数事物内部某一组成部分构成比定性资料的分析构成比有两个特点:构成比有两个特点:各部分构成比的合计为各部分构成比的合计为1或或100%事物内部某一部分的构成比发生变化时,事物内部某一部分的构成比发生变化时,其他部分也会相应发生变化其他部分也会相应发生变化表2.2 507名傣族人血型的频数分布 血型 频数 构成比(%) O 205 40.43 A 112 22.09 B 150 29.59 AB 40 7.89 合计 507 100.00 定性资料的分析多多(R)个率的比较,构成个率的比较,构成 R2表表如有如有R个都分为个都分为C类的构成比类的构成比(R2,C3),则,则其基本数据有其基本数据有R行行C列,组成列,组成RC表表,又称,又称行行列表列表22表表、R2表表是是行行列表列表的特殊情形的特殊情形定性资料的分析目的目的:对多对多(R)个构成比检验的目的是推断各样本分个构成比检验的目的是推断各样本分别代表的总体构成比是否相同,用别代表的总体构成比是否相同,用 2检验。检验。基本思想:基本思想:首先假设各样本所代表的总体构成比相首先假设各样本所代表的总体构成比相同,均等于合计的构成比,据此,可算得每个格子同,均等于合计的构成比,据此,可算得每个格子的理论频数的理论频数(见表见表7.6括号内数据括号内数据)。如果检验假设是。如果检验假设是真实的,则每一格子的理论频数与实际频数一般均真实的,则每一格子的理论频数与实际频数一般均不会相差很大,即不会相差很大,即 2值一般不会很大;若根据样本信值一般不会很大;若根据样本信息算得一个很大的息算得一个很大的 2值,则有理由怀疑值,则有理由怀疑H0的成立,的成立,进而拒绝它。进而拒绝它。 定性资料的分析例例7.6 某市对城、郊区小学三四年级学生营养状况进某市对城、郊区小学三四年级学生营养状况进行了抽样调查,资料如表行了抽样调查,资料如表7.6试考察该地城、郊儿童营试考察该地城、郊儿童营养状况的构成比有无差别?养状况的构成比有无差别? 定性资料的分析H0:城郊儿童营养状况的构成比相同;:城郊儿童营养状况的构成比相同; H1:城郊儿童营养状况的构成比不同。:城郊儿童营养状况的构成比不同。 =0.05。 按按 =(3-1) (2-1)=2查附表查附表3, 2界值表,得界值表,得P0.05,按,按 =0.05水准拒绝水准拒绝H0,接受,接受H1,差,差异有统计学意义,可认为该市城郊两地儿童异有统计学意义,可认为该市城郊两地儿童营养类型构成比不同。营养类型构成比不同。 9563. 6)195145951514568814544147105521510598810544(2502222222定性资料的分析7.5 配对设计两样本率的比较配对设计两样本率的比较 目的目的: 通过对单一样本数据的分析,推断两通过对单一样本数据的分析,推断两种处理的结果有无差别种处理的结果有无差别 。配对设计配对设计: 是医学研究中常用的设计方法之是医学研究中常用的设计方法之一,二分类结果资料的配对研究常用于比较一,二分类结果资料的配对研究常用于比较两种检验方法、两种培养方法、两种提取方两种检验方法、两种培养方法、两种提取方法等的差别。法等的差别。 定性资料的分析配对设计的配对设计的特点特点是对同一样本的每一份检品是对同一样本的每一份检品分别用甲、乙两种方法处理,观察其阳性与阴分别用甲、乙两种方法处理,观察其阳性与阴性例数。性例数。 表7.8 配对设计两种方法结果比较 乙法 甲法 + 合计 + a b a+b c d c+d 合计 a+c b+d a+b+c+d=n 定性资料的分析当当b+c40时:时: 直接计算直接计算 2当当20b+c40时:时: 计算计算 2C当当b+c20时:时:计算确切概率计算确切概率配对配对 2检验的应用条件检验的应用条件cbcb22)(cbcbC22)1(定性资料的分析例例7.8 用两种检验方法对某食品作沙门氏菌检用两种检验方法对某食品作沙门氏菌检验,结果如表验,结果如表7.9,试比较两种方法的阳性结果,试比较两种方法的阳性结果是否有差别。是否有差别。 表7.9 两种检验方法结果比较 常规培养法 荧光抗体法 + 合计 + 160(a) 26(b) 186 5(c) 48(d) 53 合计 165 74 239 定性资料的分析H0:两种检验方法的结果相同,即总体:两种检验方法的结果相同,即总体B=C;H1:两种检验方法的结果不同,即总体:两种检验方法的结果不同,即总体B C。 =0.05。按按 =1查查 2界值表,界值表,P0.005。在。在 =0.05水准上拒绝水准上拒绝H0 ,接受,接受H1,差异有统计学意义。可认为两法检验,差异有统计学意义。可认为两法检验结果不同,荧光抗体法阳性结果高于常规培养法。结果不同,荧光抗体法阳性结果高于常规培养法。 90.12526) 1526(22定性资料的分析7.6 似然比检验(似然比检验(likelihood ratio test) 四格表资料和行列表资料除可使用四格表资料和行列表资料除可使用 检验,检验,还可使用似然比检验(还可使用似然比检验(likelihood ratio testlikelihood ratio test)检验,计算统计量检验,计算统计量G G。2优点:优点:可以不考虑样本含量的大小可以不考虑样本含量的大小)lnlnlnln(2nnnnnnAAGCCRR定性资料的分析年龄年龄(岁岁)血红蛋白含量血红蛋白含量(mg/ml)合计合计30609011063(2.10)4026138276(4.83)57834318982(4.07)527629159合计合计1114918585430 某市郊区某市郊区430430名名6 68 8岁儿童血红蛋白岁儿童血红蛋白(mg/ml)(mg/ml)构成比较构成比较定性资料的分析 3(1/4)个格子)个格子T40,且,且4个个理论频数理论频数T均大于均大于5,方可用,方可用 2检验;当检验;当n40但有一个理论频数但有一个理论频数 lT5时,需用时,需用校正校正 2检验检验;若出现;若出现T1或或n40时,则用时,则用确切概率法检验为妥确切概率法检验为妥 7.9 定性资料假设检验的正确应用定性资料假设检验的正确应用 定性资料的分析两样本率比较时,如为双侧检验,则两样本率比较时,如为双侧检验,则u检验和四格表检验和四格表 2检验是等价的,校正检验是等价的,校正u检验和四格表校正检验和四格表校正 2检验也是等价的,检验也是等价的,应用条件亦相同。若为单侧检验,则用应用条件亦相同。若为单侧检验,则用u检验较为方便。检验较为方便。 定性资料的分析当多个样本率当多个样本率(或构成比或构成比)比较的假设检比较的假设检验结论为拒绝检验假设,只能认为各总验结论为拒绝检验假设,只能认为各总体率体率(或总体构成比或总体构成比)之间总的说来有差之间总的说来有差别,但不能说明它们彼此间都有差别,别,但不能说明它们彼此间都有差别,或某两者间有差别。若要进一步明确差或某两者间有差别。若要进一步明确差别之所在,可进行多重比较。别之所在,可进行多重比较。 定性资料的分析RC表2检验的应用注意事项 1. 1. 对对R RC C表,若较多格子(表,若较多格子(1/51/5)的理论频数小于)的理论频数小于5 5或有一个格子的理论频数小于或有一个格子的理论频数小于1 1,则易犯第一类错误。,则易犯第一类错误。出现某些格子中理论频数过小时怎么办?出现某些格子中理论频数过小时怎么办? (1 1)增大样本含量(最好!)增大样本含量(最好!) (2 2)删去该格所在的行或列(丢失信息!)删去该格所在的行或列(丢失信息!) (3 3)根据专业知识将该格所在行或列与别的行或列合并)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象)。(丢失信息!甚至出假象) 定性资料的分析RC表2检验的应用注意事项 2. 2.多组比较时,若效应有强弱的等级,如多组比较时,若效应有强弱的等级,如+ +,+,+,最好采用后面的非参数检验方法。最好采用后面的非参数检验方法。2 2检验只能反映其构成比检验只能反映其构成比有无差异,不能比较效应的平均水平。有无差异,不能比较效应的平均水平。 3.3.行列两种属性皆有序时,可考虑趋势检验或等级相关行列两种属性皆有序时,可考虑趋势检验或等级相关分析。分析。 定性资料的分析
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!