分类变量资料的统计分析课件

上传人:沈*** 文档编号:241096713 上传时间:2024-05-30 格式:PPT 页数:66 大小:1.45MB
返回 下载 相关 举报
分类变量资料的统计分析课件_第1页
第1页 / 共66页
分类变量资料的统计分析课件_第2页
第2页 / 共66页
分类变量资料的统计分析课件_第3页
第3页 / 共66页
点击查看更多>>
资源描述
第四章第四章 分类变量资料的统计分析分类变量资料的统计分析2024/5/301第四章 分类变量资料的统计分析2023/7/251第一节第一节 分类变量资料的统计描述分类变量资料的统计描述一、一、常用的相对数指标常用的相对数指标(一)(一)构成比构成比(proportion)构成比即一事物内部各组成部分所占的比重构成比即一事物内部各组成部分所占的比重或分布。常用百分数表示。又称构成指标。或分布。常用百分数表示。又称构成指标。2024/5/302第一节 分类变量资料的统计描述一、常用的相对数指标2023 例例4.1(P51)4.1(P51)手术治疗某支气管扩张患者,术后手术治疗某支气管扩张患者,术后体温升至体温升至3838,胸腔积液,手术前后检查白细胞记数,胸腔积液,手术前后检查白细胞记数和分类见表和分类见表4-14-1。术前中性白细胞构成比是术前中性白细胞构成比是71.66。2024/5/303 例4.1(P51)手术治疗某支气管扩张患者,术后构成比的特点:构成比的特点:各组成部分的构成比之和为各组成部分的构成比之和为100 或或1。事物内部某一部分的构成比发生变化,其它事物内部某一部分的构成比发生变化,其它 部分的构成比也相应地发生变化。部分的构成比也相应地发生变化。2024/5/304构成比的特点:2023/7/254(二)(二)率率(rate)又称频率指标,说明某现象发生的频率或强度。又称频率指标,说明某现象发生的频率或强度。即某现象发生的观察单位数与可能发生某现象的观即某现象发生的观察单位数与可能发生某现象的观察单位总数之比。可以百分率、千分率、万分率、察单位总数之比。可以百分率、千分率、万分率、十万分率等表示。十万分率等表示。2024/5/305(二)率(rate)2023/7/255 例例4.2(P52)4.2(P52)在药物的不良反应监测中,调查在药物的不良反应监测中,调查了药物的皮肤过敏反应,结果见表了药物的皮肤过敏反应,结果见表4-24-2。人全血过敏反应率是人全血过敏反应率是3.52%。()2024/5/306 例4.2(P52)在药物的不良反应监测中,调查了(三)(三)比比(ratio)也称相对比(也称相对比(ralative ratio),指两个有联),指两个有联系指标之比。系指标之比。2024/5/307(三)比(ratio)2023/7/257 例例4.3(P52)某地某地2005年城区肺癌死亡率为年城区肺癌死亡率为21.39/10万,郊区肺癌死亡率为万,郊区肺癌死亡率为13.99/10万,试万,试用相对比来反映用相对比来反映2005该地城区与郊区的肺癌死亡率该地城区与郊区的肺癌死亡率情况。情况。该地城区肺癌死亡率与郊区肺癌死亡率之比是该地城区肺癌死亡率与郊区肺癌死亡率之比是1.53。2024/5/308 例4.3(P52)某地2005年城区肺例:例:42024/5/309例:42023/7/259(四)动态数列(四)动态数列(dynamic series)是按时间顺序排列起来的一系列统计指标(包是按时间顺序排列起来的一系列统计指标(包括绝对数、相对数或平均数),用以说明事物在时括绝对数、相对数或平均数),用以说明事物在时间上的变化和发展趋势。间上的变化和发展趋势。1、绝对增长量、绝对增长量 累计绝对增长量累计绝对增长量 逐年绝对增长量逐年绝对增长量 2 2、发展速度和增长速度、发展速度和增长速度 定基比发展速度定基比发展速度 环比发展速度环比发展速度 定基比增长速度定基比增长速度 环比增长速度环比增长速度2024/5/3010(四)动态数列(dynamic series)2023/7/2024/5/30112023/7/2511常用相对数指标常用相对数指标:2024/5/3012常用相对数指标:2023/7/25122024/5/30132023/7/25132024/5/30142023/7/2514二、应用相对数时应二、应用相对数时应注意注意的问题的问题1、计算相对数的分母不宜过小、计算相对数的分母不宜过小2、分析时不能以构成比代替率、分析时不能以构成比代替率3、正确计算平均率、正确计算平均率 对观察单位数不等的几个率,不能直接相加求对观察单位数不等的几个率,不能直接相加求其平均率,必须先分别进行分子和分母的相加,再其平均率,必须先分别进行分子和分母的相加,再计算平均率。计算平均率。2024/5/3015二、应用相对数时应注意的问题1、计算相对数的分母不宜过小204、相对数比较时应注意资料的可比性、相对数比较时应注意资料的可比性 通常需注意三点:通常需注意三点:(1)研究对象是否同质)研究对象是否同质 (2)其它影响因素在各组的内部构成是否相同)其它影响因素在各组的内部构成是否相同 (3)同一地区不同时期资料的对比应注意客观)同一地区不同时期资料的对比应注意客观 条件有无变化条件有无变化5、样本率或构成比的比较应做假设检验、样本率或构成比的比较应做假设检验2024/5/30164、相对数比较时应注意资料的可比性2023/7/2516三、率的标准化法三、率的标准化法 例例4.4(P54)某省疾病控制中心欲进行甲、某省疾病控制中心欲进行甲、乙两地某病总死亡率的比较,收集资料见表乙两地某病总死亡率的比较,收集资料见表4-5。2024/5/3017三、率的标准化法 例4.4(P54)某省疾(一)标准化法的意义和基本思想一)标准化法的意义和基本思想v意义意义:比较两个(或两个以上)总体率时,如比较两个(或两个以上)总体率时,如果两个总体的内部构成有所差别,就不能直接果两个总体的内部构成有所差别,就不能直接拿两个总体率来做比较和下结论。拿两个总体率来做比较和下结论。2024/5/3018(一)标准化法的意义和基本思想2023/7/2518v基本思想基本思想:在:在两个或多个率(或构成比)进行比两个或多个率(或构成比)进行比较时,为了较时,为了消除内部构成不同的影响,采用统一消除内部构成不同的影响,采用统一的的“标准人口构成标准人口构成”,分别计算标准化率后再做,分别计算标准化率后再做对比的方法。对比的方法。这种消除内部构成差别,使总的率这种消除内部构成差别,使总的率能够直接进行比较的方法就叫做能够直接进行比较的方法就叫做标准化法标准化法。采用统一标准调整后的率为标准化率,简称为采用统一标准调整后的率为标准化率,简称为标化率标化率(standardized rate)或调整率)或调整率(adjusted rate)常用常用 表示。表示。2024/5/30192023/7/2519 (二)标准化率的计算(二)标准化率的计算1、选择标准人口、选择标准人口v选一个具有代表性的、内部构成相对稳定的较大选一个具有代表性的、内部构成相对稳定的较大人群作为标准人群作为标准v将所比较的两组资料内部各相应小组的观察单位将所比较的两组资料内部各相应小组的观察单位数相加,作为共同的标准数相加,作为共同的标准v从所比较的两组中任选一组的内部构成作为标准从所比较的两组中任选一组的内部构成作为标准 本例选用两组合计人口做标准。本例选用两组合计人口做标准。2024/5/3020 (二)标准化率的计算2023/7/25202、计算预期发生数、计算预期发生数 预期发生数预期发生数=标准人口数标准人口数原发生率原发生率表表4-6 甲、乙两地用甲、乙两地用“标准人口数准人口数”计算算标准化死亡率(准化死亡率(1/10万)万)年年龄组标准人口数准人口数甲地甲地乙地乙地原死亡率原死亡率预期死亡数期死亡数原死亡率原死亡率预期死亡数期死亡数(1)(2)(3)(4)(5)(6)034827160.00 00.00 0305342404.90 268.64 464050215836.1618249.9025150398151148.35591179.9171760258248319.68826324.4383870141940323.47459329.01467合合计531745343.12208439.4623192024/5/30212、计算预期发生数表4-6 甲、乙两地用“标准人口数”计算3、计算标准化率、计算标准化率甲地标准化死亡率甲地标准化死亡率=2084/5317453=39.19/10=2084/5317453=39.19/10万万乙地标准化死亡率乙地标准化死亡率=2319/5317453=43.51/10=2319/5317453=43.51/10万万 乙地标准化率高于甲地。乙地标准化率高于甲地。2024/5/30223、计算标准化率甲地标准化死亡率=2084/5317453=表表4-7 标准人口构成比计算标准化死亡率(标准人口构成比计算标准化死亡率(1/10万)万)年年龄组标准人口准人口构成比构成比甲地甲地乙地乙地原死亡率原死亡率分配死亡率分配死亡率原死亡率原死亡率分配死亡率分配死亡率(1)(2)(3)(4)=(2)(3)(5)(6)=(2)(5)00.6550 0.000.0000 0.000.0000 300.1005 4.900.4925 8.640.8683 400.0944 36.163.4135 49.904.7106 500.0749 148.3511.1114 179.9113.4753 600.0486 319.6815.5364 324.4315.7673 700.0267 323.478.6366 329.018.7846 合合计1.0000 43.1239.190439.4643.60612024/5/3023表4-7 标准人口构成比计算标准化死亡率(1/10万)年2024/5/30242023/7/25242024/5/30252023/7/25252024/5/30262023/7/2526(三)标准化时应(三)标准化时应注意的问题注意的问题v内部构成不同的资料比较总率时需标准化,或进行内部构成不同的资料比较总率时需标准化,或进行多元统计分析。否则需分别比较各分组的率,也可得多元统计分析。否则需分别比较各分组的率,也可得出正确结论。出正确结论。v标准化后的率并不表示率的实际水平,只能表示相标准化后的率并不表示率的实际水平,只能表示相互比较资料间的相对水平。互比较资料间的相对水平。选定的标准不同,算得的选定的标准不同,算得的标准化率也不同。故只能对统一标准的标化率进行比标准化率也不同。故只能对统一标准的标化率进行比较。较。v 两样本标准化率是样本值,存在抽样误差,若想判两样本标准化率是样本值,存在抽样误差,若想判断其总体率是否相同,还应作假设检验。断其总体率是否相同,还应作假设检验。2024/5/3027(三)标准化时应注意的问题内部构成不同的资料比较总率时需标准第二节第二节 分类变量资料的统计推断分类变量资料的统计推断一、率的抽样误差和总体率的区间估计一、率的抽样误差和总体率的区间估计(一)率的抽样误差和标准误(一)率的抽样误差和标准误2024/5/3028第二节 分类变量资料的统计推断一、率的抽样误差和总体率的 例例4.64.6(P56P56)某地随机抽取某地随机抽取500500名儿童,乙肝名儿童,乙肝感染率为感染率为4.50%4.50%,求乙肝感染率的标准误。,求乙肝感染率的标准误。该地该地500500名儿童乙肝感染率的标准误为名儿童乙肝感染率的标准误为0.93%0.93%。2024/5/3029 例4.6(P56)某地随机抽取500名儿童,乙肝(二)总体率的可信区间(二)总体率的可信区间 估计总体率可用点估计和区间估计进行。这估计总体率可用点估计和区间估计进行。这里仅介绍区间估计。里仅介绍区间估计。1、查表法、查表法2 2、正态近似法、正态近似法2024/5/3030(二)总体率的可信区间2、正态近似法2023/7/2530改错改错2024/5/3031改错2023/7/2531二、率二、率的的u u检验检验 当当 n n5050,且,且npnp和和n(1-p)5n(1-p)5时,即服从正态分时,即服从正态分布时,样本率与总体率、两样本率之间进行比较可采布时,样本率与总体率、两样本率之间进行比较可采用用u u检验。检验。(一)样本率与总体率的比较(一)样本率与总体率的比较2024/5/3032二、率的u检验 当 n50,且np和n(1-p)5 例例4.74.7(P57P57)根据以往经验,一般胃溃疡根据以往经验,一般胃溃疡患者中有患者中有20%发生胃出血症状。某医院观察发生胃出血症状。某医院观察65岁以上溃疡病患者岁以上溃疡病患者152例,有例,有31.6%的患者出的患者出现胃出血症状。问老年人溃疡病患者是否容易发现胃出血症状。问老年人溃疡病患者是否容易发生胃出血?生胃出血?2024/5/3033 例4.7(P57)根据以往经验,一般胃溃疡患者中2024/5/30342023/7/2534(二)样本率与样本率的比较(二)样本率与样本率的比较2024/5/3035(二)样本率与样本率的比较2023/7/2535 检验(chi-square test或称卡方或称卡方检验)是用)是用途非常广泛的一种假途非常广泛的一种假设检验方法。本方法。本节仅介介绍用用于于两个或两个以上的率(或构成比)的差异比两个或两个以上的率(或构成比)的差异比较和配和配对四格表四格表资料料差异差异比比较的方法。的方法。三、三、检验检验2024/5/3036 检验(chi-square test 例例4.9(P58)4.9(P58)某医师为了观察两种药物治疗慢性某医师为了观察两种药物治疗慢性支气管炎的疗效,将病人随机分为两组,结果见表支气管炎的疗效,将病人随机分为两组,结果见表4-4-8 8,试对两组疗效进行比较(比较差异)。,试对两组疗效进行比较(比较差异)。表表4-8 4-8 两种药物治疗慢性支气管炎的效果两种药物治疗慢性支气管炎的效果组别组别有效有效无效无效合计合计有效率有效率(%)(%)甲组甲组54(50.75)54(50.75)62(65.25)62(65.25)11611687.1087.10乙组乙组44(47.25)44(47.25)64(60.75)64(60.75)10810868.7568.75合计合计989812612622422477.7877.78(一)四格表资料的卡方检验(一)四格表资料的卡方检验2024/5/3037 例4.9(P58)某医师为了观察两种药物治疗慢性 基本数据是四个数据的表格称为基本数据是四个数据的表格称为四格表四格表(fourfold(fourfold table)table),其相应的资料就称为四格表资料。,其相应的资料就称为四格表资料。a a、b b、c c、d d分别为四格表中的四个实际频数分别为四格表中的四个实际频数 n n为总例数为总例数2024/5/3038 基本数据是四个数据的表格称为四格表(fourfold1、卡方检验的基本思想、卡方检验的基本思想2024/5/30391、卡方检验的基本思想2023/7/2539 值的大小反映了实际数与理论数的相差情况,值的大小反映了实际数与理论数的相差情况,若零假设若零假设 成立,则理论数和实际数应相差不大,成立,则理论数和实际数应相差不大,较大的较大的 值出现的概率较小。故根据资料计算的值出现的概率较小。故根据资料计算的 值越大,就越有理由推翻零假设值越大,就越有理由推翻零假设 。2024/5/3040 值的大小反映了实际数与理论数的相差情况,若零假(1 1)建立假)建立假设,确定,确定检验水准水准(2 2)计算卡方算卡方值2024/5/3041(1)建立假设,确定检验水准(2)计算卡方值2023/7/2(3 3)确定)确定P P值,做出,做出结论2024/5/3042(3)确定P值,做出结论2023/7/25422024/5/30432023/7/25432024/5/30442023/7/25442 2、四格表专用公式法、四格表专用公式法 四格表专用公式只需计算最小理论值,而下面四格表专用公式只需计算最小理论值,而下面的基本公式必需计算出四个理论值。的基本公式必需计算出四个理论值。2024/5/30452、四格表专用公式法 2023/7/25453 3、四格表卡方值的校正、四格表卡方值的校正2024/5/30463、四格表卡方值的校正2023/7/2546 例例4.104.10(P59P59)某医院观察了某医院观察了2828例肝硬化患者例肝硬化患者和和1414例再生障碍性贫血患者的血清中抗血小板抗体的例再生障碍性贫血患者的血清中抗血小板抗体的阳性情况,结果见表阳性情况,结果见表4-104-10。问两类患者血清中抗血小。问两类患者血清中抗血小板抗体阳性率有无差异。板抗体阳性率有无差异。2024/5/3047 例4.10(P59)某医院观察了28例肝硬化患者(1 1)建立假)建立假设,确定,确定检验水准水准(2 2)计算卡方算卡方值2024/5/3048(1)建立假设,确定检验水准(2)计算卡方值2023/7/2(3 3)确定)确定P P值,做出,做出结论2024/5/3049(3)确定P值,做出结论2023/7/2549四格表资料差异(及关联)分析方法四格表资料差异(及关联)分析方法2024/5/3050四格表资料差异(及关联)分析方法2023/7/2550(二)(二)配对资料配对资料的的 检验检验 配对设计即所比较资料除研究因素外,其它的影配对设计即所比较资料除研究因素外,其它的影响因素都尽可能相同的设计。响因素都尽可能相同的设计。配对设计的资料包括配对设计的资料包括:(1)同一批样品用两种不同的处理方法)同一批样品用两种不同的处理方法 (2)观察对象根据配对条件配成对子,同)观察对象根据配对条件配成对子,同一一对对子内不同的个体分别接受不同的处理子内不同的个体分别接受不同的处理 (3)在病因和危险因素的研究中,将病人和对照)在病因和危险因素的研究中,将病人和对照按配对条件配成对子,研究是否存在某种病因或危险按配对条件配成对子,研究是否存在某种病因或危险因素。因素。2024/5/3051(二)配对资料的 检验 配对设计即所比较资 配对资料若观察的结果只有阳性、阴性两种配对资料若观察的结果只有阳性、阴性两种可能,清点这类资料只有四种情况可能,清点这类资料只有四种情况:(a):(a)甲甲+乙乙+,(b)(b)甲甲+乙乙-,(c)(c)甲甲-乙乙+,(,(d d)甲)甲-乙乙-。将(。将(a a)、)、(b)(b)、(c)(c)、(d)(d)四种情况的对子数填入表格,即得到四种情况的对子数填入表格,即得到如下配对四格表。如下配对四格表。甲法甲法乙法乙法+(甲(甲+乙乙+)(甲(甲+乙乙-)(甲(甲-乙乙+)(甲(甲-乙乙-)2024/5/3052 配对资料若观察的结果只有阳性、阴性两种可能,2024/5/30532023/7/2553 例例4.11(P60)4.11(P60)为比较两种检验方法(中和法和为比较两种检验方法(中和法和血凝法)检测关节痛病人的抗血凝法)检测关节痛病人的抗“O”O”结果,观察结果,观察115115例例关节痛患者,结果见表关节痛患者,结果见表4-114-11,问两种检验结果有无差,问两种检验结果有无差别?别?2024/5/3054 例4.11(P60)为比较两种检验方法(中和法(2)(2)计算算 值值(1)(1)建立假设,确定水准建立假设,确定水准2024/5/3055(2)计算 值(1)建立假设,确定水准2023/7/25(3 3)确定)确定P P值值(4 4)判断结果)判断结果补充补充2024/5/3056(3)确定P值(4)判断结果补充2023/7/2556三、行三、行列表的列表的 检验检验1、多个、多个样本率(或构成比)比本率(或构成比)比较 基本数据的行数或列数大于基本数据的行数或列数大于2时,通称,通称为行行列列表,表,简记为R C表。行表。行列表资料的列表资料的 检验可检验可用于用于两个以上的率(或构成比)差异的比较。两个以上的率(或构成比)差异的比较。2024/5/3057三、行列表的 检验1、多个样本率(或构成比)比较 例例4.12(P60)4.12(P60)某医院研究急性白血病与慢某医院研究急性白血病与慢性白血病患者的血型构成情况有无不同,资料性白血病患者的血型构成情况有无不同,资料见表见表4-124-12,问两组差别有无统计学意义。,问两组差别有无统计学意义。2024/5/3058 例4.12(P60)某医院研究急性白血病与慢性白(1)(1)建立假设,确定水准建立假设,确定水准(2)(2)计算算 值2024/5/3059(1)建立假设,确定水准(2)计算 值2023/7/25(3)(3)确定确定P P值(4)(4)判断结果判断结果2024/5/3060(3)确定P值(4)判断结果2023/7/25602024/5/30612023/7/2561 例例4.134.13(P61P61)某城市欲调查不同环境污染某城市欲调查不同环境污染程度下出生婴儿的致畸情况,资料见表程度下出生婴儿的致畸情况,资料见表4-134-13,问三个地区出生婴儿的致畸率有无差别。问三个地区出生婴儿的致畸率有无差别。2024/5/3062 例4.13(P61)某城市欲调查不同环境污染程度下出生(1)(1)建立建立假设和确定水准假设和确定水准(2)(2)计算算 值值2024/5/3063(1)建立假设和确定水准(2)计算 值2023/7/25(3)(3)确定确定P P值(4)(4)判断结果判断结果注意注意:如果假设检验的结论是拒绝零假设,只能认:如果假设检验的结论是拒绝零假设,只能认为各总体率或构成比之间总的来说有差别,但并不为各总体率或构成比之间总的来说有差别,但并不是说它们彼此之间是说它们彼此之间均均有差别。若需判断哪些组间有有差别。若需判断哪些组间有差别,还需进行两两比较(卡方分割)。差别,还需进行两两比较(卡方分割)。2024/5/3064(3)确定P值(4)判断结果注意:如果假设检验的结论是拒绝零2024/5/30652023/7/2565 若若不满足适用条件不满足适用条件可采取以下措施可采取以下措施:增加样本含量增加样本含量 删去理论数太小的行和列删去理论数太小的行和列 从专业上考虑如果允许,可将太小的理论数从专业上考虑如果允许,可将太小的理论数 所在的行或列的实际数与性质相近的邻近行所在的行或列的实际数与性质相近的邻近行 或列中的实际数合并或列中的实际数合并(2)(2)如果结论是拒绝零假设,只能认为各总体率或构成如果结论是拒绝零假设,只能认为各总体率或构成比之间总的来说有差别,但并不是说它们彼此之间比之间总的来说有差别,但并不是说它们彼此之间均均有有差别。若需判断哪些组间有差别,还需进行两两比较。差别。若需判断哪些组间有差别,还需进行两两比较。2 2、行、行列表列表 检验的检验的注意事项注意事项2024/5/3066 若不满足适用条件可采取以下措施:2、行列表
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!