资源描述
计数资料的统计分析统计资料的类型数值变量 : 计量资料分类变量 : 计数资料 有序分类 : 变量之间有程度的差别 , 且排列有序 . (等级变量 )无序分类 : 二项分类多项分类变量的转换 : 定量 定性连续型计量资料离散型计量资料第十章 分类变量资料的统计分析第一节 统计描述一 .描述指标 (相对数 )1. 率 (rate) :单位 : %,万分率 ,10万分率2. 构成比 (constituent ratio) 单位 : % 特点 :3. 相对比 (relative ratio)常用率比 例 10-1某研究者 2000年对某校的初中生进行了近视患病情况调查 ,试计算各年级近视患病率和构成比及三年级和一年级患病率的相对比 .年级 检查人数 患病人数 患病率 构成比 相对比一 年级 442 67 二年级 428 68三年级 405 74 合计 1275 209 16.39 100.015.16 32.0615.89 32.53 18.27 35.41 1.2二 . 应用相对数时注意事项1. 分母 不宜太小2. 率和构成比的区别3. 样本含量不等的 几个率的平均值 不等于 几个率的算数平均值4. 对率或构成比进行比较时 ,应注意 资料的可比性5. 率的标准化6. 两样本率进行比较时应进行 假设检验三 .率的标准化1.基本思想 : 为消除内部构成不同对指标的影响, 采用统一的内部构成计算标准化率 ,使得出的标准化率具有可比性 .2.计算方法 : 直接法 : 已知各年龄组的实际发病率 ,用标准人口数或标准人口构成进行计算间接法 : 标准化死亡比 (SMR), 实际死亡数与预期死亡数的比3. 率的标准化应注意的问题第三节 率的标准化法 (standardization)西医组 中西医结合组 病型 病例数 治愈数 治愈率 (%) 病例数 治愈数 治愈率 (%) 普通型 60 36 60 20 13 65重型 20 8 40 60 27 45 爆发型 20 4 20 20 5 25合计 100 48 48 100 45 45例 : 某病两种疗法治愈率的比较西医标准化治愈率 P= 88200 = 44%中西医标准化治愈率 P= 98200 = 49%例 : 某病两种疗法治愈率的比较西医组 中西医结合组 病型 病例数 原治愈率 (%) 预期治愈数 原治愈率 (%) 预期治愈数 普通型 80 60 48 65 52重型 80 40 32 45 36 爆发型 40 20 8 25 10合计 200 88 98率的标准化1.基本思想 : 为消除 内部构成不同 对指标的影响 , 采用 统一的内部构成 计算标准化率 ,使得出的标准化率具有可比性 .2.计算方法 : 直接法 : 已知各年龄组的实际发病率 ,用标准人口数或标准人口构成进行计算间接法 : 标准化死亡比 (SMR), 实际死亡数与预期死亡数的比 3. 率的标准化应注意的问题 由于内部构成不同 ,影响到要比较的总率 ,需要标准化处理? 标准化率只用于比较,已经不代表实际的水平。 各分组率有交叉 ,不能用标准化率比较 抽样得到的标准化率的比较 ,也应该进行假设检验 .第二节 计数资料统计推断一 . 率的抽样误差和标准误样本率和总体率或样本率之间存在的差异 ,称抽样误差 .率的抽样误差用率的标准误表示 .(p or Sp).( p =阳性率 , 1- p=阴性率 )二 . 总体率的区间估计2. 查表法 : 当 n 50, 样本率 p 接近与 0或 1时 ,该资料服从二项分布 ,用查表法估计样本含量p u Sp1. 正态近似法 :np 和 n(1-p)5条件 : n 足够大 ,样本率 p 或 1-p均不太小时 , 即例 10-5为了解某地乙肝表面抗原携带情况 ,某研究者在该地人群中随机检测了该地 200人 ,乙肝表面抗原阳性 7人 ,乙肝表面抗原携带率为 3.5%, 试计算标准误并估计 95% 和 99% 可信区间 .95% 可信区间 : 3.5% 1.96 Sp99% 可信区间 : 3.5% 2.58 Spn=200 X=7, P=3.5% 三 . 两个率比较的 u 检验当 np和 n(1-p) 5 时 样本率的分布近似正态分布 u 检验(一 ) 检验步骤 : 1. 建立假设 , 确定检验水准 H0: H1: =0.052. 选择检验方法 , 计算 u 值3. 确定 P 值 , 判断结果(二 )资料类型1. 样本率与总体率的比较 (例 10-6)计算公式 :2. 两个样本率的比较 (例 10-7)计算公式 :第三节 X2 检验 (chi-square test)基本思想检验实际频数与理论频数的吻合程度 ,实际频数与理论频数越相近 , X2 值越小 ; 反之 ,实际数与理论数相差越大 , X2值越大 .计算公式 :理论频数的计算 : TRC= nRnC / ndf=(行数 -1)(列数 -1)例 10-8 某医生用 A,B两种药物治疗急性下呼吸道感染 .A药治疗 74例 ,有效 68例 ;B药治疗 63例 ,有效 52例 .问两种药物的有效率是否有差别 ?处理 有效 无效 合计 有效率(%)A 药 68 6 74 91.89B 药 52 11 63 82.54合计 120 17 137 87.59例 10-8 某医生用 A,B两种药物治疗急性下呼吸道感染 .A药治疗 74例 ,有效 68例 ;B药治疗 63例 ,有效 52例 .问两种药物的有效率是否有差别 ?处理 有效 无效 合计 有效率(%)A 药 68 (64.82) 6 (9.18) 74 91.89B 药 52 (55.18) 11(7.82) 63 82.54合计 120 17 137 87.59二 . 2 检验的基本步骤建立检验假设 ,确定检验水准H0: 1= 2H1: 1 2=0.052. 计算 2 值资料类型不同 ,计算公式不同3. 确定 P 值 , 判断结果根据查 2 界值表 , 确定 P值三 . 四格表资料的 2 检验1. 四格表资料的 2 检验的 专用公式df =(R-1)(C-1)=1四格表资料的 2 检验的校正- Yates 连续校正校正公式 :校正的目的 :英国统计学家 (Yates)认为 2分布是一种连续性分布 ,而四格表中的资料属离散性分布 ,得到的 2统计量的抽样分布也是离散的 .因此 ,为改善 2统计量分布的连续性 ,建议进行校正 .连续性校正应遵循的条件 :1. T 5, 且 N 40时 , 用非校正的公式2. 1 T 40:当 b+c40 时 , 用校正公式 . (McNemar 检验 )4. 行 列表资料的 2检验 (R C 表资料 )基本公式 : A 每个格子的实际频数 nR A所对应的行合计nC A所对应的列合计例 10-12. 某研究者欲比较甲、乙、丙三家医院住院患者院内感染情况,随机抽查同一时期住院患者感染情况,结果如下:试比较三家医院院内感染率有无差别。表 10-12 三家医院住院患者的院内感染率比较医院 感染 未感染 合计合计 77 509 586甲 43 188 231乙 19 170 189丙 15 151 166H0:三家医院院内感染率相同H1:三家医院院内感染率不相同或不全相同 0.05 df=(行数 -1)(列数 -1) (3 1)(2 1) =2查 X2界值表: X20.05(2)=5.99 X20.01(2)=9.21 按 0.05,拒绝 H0,接受 H1,差别有统计学意义,即可认为三家医院住院病人的院内感染率有差别。然而,三者之间谁和谁有差别,还不知道。应该进一步进行两两比较两两比较,可采用 X2分割行 列表资料 2检验应注意事项1. 行 列表资料 2检验公式的应用条件 :不能有 1/5以上 的格子的 理论数 5,或者 ,不能有 1个格子 的 理论数 12. 如果资料不能满足上述条件 ,则可以通过(1) 在可能的情况下再增加样本量 ;(2)专业上允许的情况下 ,合并相邻的行或列;(3) 删去理论数太小的行和列3. 假设检验结果有差别 ,只能认为总的率或构成比有差别4. 单向有序变量(等级资料)的行 列表,不能用 X2检验比较组间效应,如果作 X2,只能说明个处理组间的效应在构成比上有无差别。表 10-12 中药和西药对某病的疗效比较药物 治愈 好转 无效 合计合计 163 102 70 335中药 78 42 32 152西药 85 60 38 183小结计数资料的统计描述指标 : 率、构成比、相对比计数资料的统计推断总体参数估计: PuSp率的假设检验: 样本率与总体率的比较 - u检验两个大样本率的比较 - u检验两个样本率的比较 - 2检验配 对设计资 料的两个率比 较 - 2检验多个 样 本率的比 较 - RC表的 2检验假 设检验 的基本步 骤 完全相同统计资料处理的基本思路资料的整理 : 统计图,统计表统计资料的描述 (描述指标)统计学推断总体参数的估计(可信区间)假设检验 统计资料类型的判断例 1. 某研究者欲比较甲乙两药治疗高血压的效果 ,进行了随机对照试验 .甲乙药组各选择了 50名病人 ,甲药组血压平均下降了 10.67mmHg,标准差是 3.27mmHg, 乙药组平均下降了 13.20mmHg,标准差是 4.33mmHg. 问两药降压效果是否不同 ?例 2. 为调查 2型糖尿病发病易感因素 ,某研究者进行了一项以医院为基础的病例对照研究 .结果发现 ,在 200名糖尿病病例中 , 100人有糖尿病遗传家族史 ;而 200名对照者中只有 50人有糖尿病家族史 .问糖尿病家族史是否在两组中分布不同 ?例 3. 为比较 A,B,C,D四种药物治疗小细胞肺癌的效果 ,将 160人随机分配进入四个治疗组 .每组 40人 .治疗结果见下表 ,试比较四种药物治疗效果有无差别 ?处理组 有效 无效 合计 . A 药 15 25 40B 药 10 30 40C 药 13 27 40D 药 8 32 40合计 46 114 160 .例 4. 用 A、 B两种不同的方法对 58例系统红斑狼疮患者血清中的抗体进行测定,资料见下表,问两种检测结果有无差别 ?A 法 + -B 法 合计+ 11 12 23- 2 33 35合计 13 45 58 .例 5. 为研究铅作业与工人尿铅含量的关系 ,随机抽查了 3种作业工人的尿铅结果,见下表 .问 3种作业工人的尿铅含量是否不同 ?铅 作业组 调离铅作业组 非铅作业组 .0.01 0.11 0.090.16 0.23 0.020.24 0.18 0.050.18 0.14 0.020.28 0.20 0.010.14 0.12 0.10
展开阅读全文