分类变量的统计描述

上传人:san****019 文档编号:20305439 上传时间:2021-03-06 格式:PPT 页数:36 大小:455.10KB
返回 下载 相关 举报
分类变量的统计描述_第1页
第1页 / 共36页
分类变量的统计描述_第2页
第2页 / 共36页
分类变量的统计描述_第3页
第3页 / 共36页
点击查看更多>>
资源描述
第三章 分类变量的统计描述 分类变量的频数分布及其统计指标 标准化法及其应用 动态数列及其应用 主要内容 : 第三章 分类变量的统计描述 第一节 分类变量的频数分布及其统计指标 表 3-1 某单位高血压患病情况 年龄(岁) ( 1) 检查人数 ( 2) 患病人数 ( 3) 患者构成比 %( 4) 患病率 %( 5) 20 2000 140 33.3 7.0 40 1500 180 42.9 12.0 50-60 500 100 23.8 20.0 合计 4000 420 100.0 10.5 分类变量的频数分布 表 3 - 1 吸 毒 与 非 吸 毒 人 群 职 业 构 成 对 比 分 析 吸 毒 组 非 吸 毒 组 职业 人数 ( n ) 构 成 比 ( % ) 人数 ( n ) 构 成 比 ( % ) 学生 4 1 . 2 9 2 3 6 . 4 4 无业 1 8 3 5 9 . 0 3 5 0 1 4 . 0 1 个体 5 4 1 7 . 4 2 2 7 7 . 5 6 工人 5 3 1 7 . 1 0 1 2 5 3 5 . 0 1 司机 3 0 . 9 7 2 0 . 5 6 其它 1 3 4 . 1 9 1 3 0 3 6 . 4 2 合计 310 1 00.00 3 5 7 1 0 0 . 0 0 第一节 分类变量的频数分布及其统计指标 一、 常用的相对数指标 比率 速率 比 三种类型: 第一节 分类变量的频数分布及其统计指标 频表示事物内部某个组成部分所占的比重, 包括: 频率指标 和 构成比指标 。 K 单位总数可能发生某现象的观察 数发生某现象的观察单位频率 二、常用的相对数指标 分子是分母的一部分 ;无量纲,在 0 1范围内取值; K 是比例基数,可取 100%, 1000 、 10万 /10万等,根据习惯 用法来决定。 第一节 分类变量的频数分布及其统计指标 1.比率 100%观察单位总数同一事物各组成部分的 位数某一组成部分的观察单构成比 问: 结合例 3.1谈谈构成比与频率的区别。 二、常用的相对数指标 第一节 分类变量的频数分布及其统计指标 1.比率 表 3-1 某单位高血压患病情况 420 100 180 140 患病人数 ( 3) 100. 0 23.8 42.9 33.3 患者构成比 %( 4) 10.5 20.0 12.0 7.0 患病率 %( 5) 4000合计 50050-60 150040 200020 检查人数 ( 2) 年龄(岁) ( 1) 中国累积报告的 HIV感染者按性别分布图 1985 2001.6 不详 1.5% 女 16.9% 男 81.6% 二、常用的相对数指标 第一节 定性变量的分布特征 1.比率 例 3-1 某医生研究了慢性阻塞性肺病 (COPD)病人的 吸烟情况,自 1998 2000年收治 COPD病人 356人,其中 231 人有三十年及以上的经常吸烟史 (日平均 1支以上 ),在本 院其它科室收治的同年龄组段的非 COPD病人 (无其它呼吸 系统疾患 )479人,其中有三十年及以上的经常吸烟史的 183人 ,试计算并比较两组病人的 吸烟率 。 表 3 - 2 C O P D 病 人 与 非 病 人 的 吸 烟 情 况 资 料 有 吸 烟 史 无 吸 烟 史 合计 吸 烟 率 C O P D 病 人 231 125 356 6 4 . 8 9 % 非 病 人 183 296 479 3 8 . 0 2 % 合 计 414 421 835 4 9 . 5 8 % 速率 表示单位时间内某现象发生的频率。如 人时发病率 的分子是新发生的事件数,分母是人 时数(观察人数乘以时间)的总和, 多用于大人 群长时间随访的资料 。 K 时间)单位数可能发生某事件的观察( 数某事件发生的观察单位速率 二、常用的相对数指标 2.速率 : 第一节 定性变量的分布特征 K 观察年数)每个观察单位数( 病例数观察期间内某疾病新发人年发病率 二、常用的相对数指标 2.速率 : 第一节 定性变量的分布特征 K 均人口数同年内能发生某病的平 该年新发某病的病例数发病率 例 在某医院的院内感染调查中, 5031个病人共 观察了 127859人日(例均 25.4日),其中有 596人在医院发生感染,求 医院感染率。 医院感染率 =596/127859=0.0047人 /人日 意味着平均每天有 0.47%的病人将在医院获得感染。 第一节 定性变量的分布特征 二、常用的相对数指标 2.速率 : 上海常住人口出生婴儿性别比约为 107: 100; 深圳市出生人口男女性别比例为 120 8100 ; 北京流动人口在京出生的性别比例高达 128100 ; 重庆现在的男女比例为 140100 , 海南、广东等省出生的性别比例竟然高达 130: 100以上; 全国出生人口性别比为 117。 二、常用的相对数指标 第一节 定性变量的分布特征 3. 比 二、常用的相对数指标 最常见 : 体质指数( BMI)、男女性别比等 相对比 =A/B 第一节 定性变量的分布特征 3. 比 比 是指任何两个相关联的变量 A与 B之比。 A和 B可以是绝对数、相对数和平均数, A和 B的量纲可以 不同,也可相同,但 A和 B互不包含 . 防止概念混淆 计算相对数时分母应有足够数量 正确地合并估计频率 (或强度 )型指标 相对数间的比较要具备可比性 : 观察的对象是否同质,研究的方法(如检测手段、 抽样方法)是否相同,观察的时间是否一致等;被比较 的总体是否具有可比性。 对相对数的统计推断 合计 4050 6070 80 年龄组 30.52100.004481468 12.1429.25 45.6165.10 86.36 15.1828.79 30.1321.65 4.24 68129 13597 19 560441 296149 22 患病率( %) =(3)/(2)患者年龄构成比( %)白内障例数 受检人数 率与构成比的误用 应用相对数应注意的事项: 第一节 定性变量的分布特征 应用相对数应注意的事项: 二、常用的相对数指标 应用相对数应注意的事项: 例: 某县的 3个乡上报了 1994年的肠道传染病统计料,结 果如下: 甲 乡人口数是 91960,肠道传染病的发病人数为 1122例, 乙 乡人口数是 76740,肠道传染病的发病人数为 1499例, 丙 乡人口数是 108930,肠道传染病的发病人数为 866例。 请回答: 1.那个乡的肠道传染病发病率高 ? 2.3个乡肠道传染病的平均发病率是多少 ? 应用相对数应注意的事项: 表 10 2 两校学生吸烟率比较 医科大学 工业大学 组别 在校学 生数 吸烟人 数 吸烟率 (%) 在校学 生数 吸烟人 数 吸烟率 (%) 男生 1000 100 10.00 9000 450 5.00 女 9000 90 1.00 1000 5 0.50 合 计 10000 190 1.90 10000 455 4.55 例 观察比较两学校在校学生的吸烟率,结果见下表 表 3. 2 甲、乙 两厂 同 工种 工人 某病 的 患病率 甲 厂 乙 厂 工龄 ( 年 ) 人数 患病 人 数 患病 率( % ) 人数 患病 人 数 患病 率( % ) 3 4 00 1 2 3 .0 100 2 2 .0 3 100 1 8 18 .0 4 00 4 0 10 . 0 合 计 5 00 30 6. 0 5 00 42 8. 4 例如表 3-2两种疗法的治愈率比较。 一、标准化法的基本思想 第二节 标准化法及其应用 要正确比较两厂的合计患病率,必须先 将两组工人的 工龄构成 按照统一标准 进行校正 , 然后计算出校正后的标准化患病率再进行比较。 这种用统一的内部构成,然后计算标准化率的 方法 , 称为 标准化法 。 一、标准化法的基本思想 第二节 标准化法及其应用 标准化法的 基本思想 是: 采用某影响因 素的统一标准构成,对内部构成不同的各人 群率进行调整,以消除人口构成不同对人群 总率的影响,使标准化率具有可比性。 一、标准化法的基本思想 常用计算方法: 直接法 间接法 第二节 标准化法及其应用 二、标准化率的计算 若已知年龄别死亡率,可采用 直接法 ; 根据已有资料的条件,采用不同的方法计算标准化率 若只有总死亡数和年龄别人口数而缺乏年龄 别死亡率时,或各年龄组人口数较小,年龄别 死亡率不稳定时,宜用 间接法 。 如: 对死亡率的年龄构成标准化 第二节 标准化法及其应用 1.两组资料中 任选一组资料 的 人口数 ( 或人口构成 ) 作 为两者的 “ 共同标准 ” 。 这种方法适用于直接法 。 2.两组资料各部分人口之和组成的人口数 ( 或人口构成 ) 作为两者的 “ 共同标准 ” 。 这种方法适用于直接法 。 3.另外选用一个 通用的 或 便于比较的标准 作为两者的 “ 共同标准 ” ,如采用全国、全省或全地区的数据作为 标准。 选择标准构成的方法通常有三种: 第二节 标准化法及其应用 二、标准化率的计算 计算标准化率的步骤: 1.根据 对比资料所具备的 条件选用直接法或间 接法 。 2.选定标准构成 。 3.选择公式 计算标准化率 第二节 标准化法及其应用 二、标准化率的计算 表 5 - 4 甲、乙两种疗法治疗某病的治愈率比较 甲疗法 乙疗法 病 型 病人数 治愈数 治愈率( % ) 病人数 治愈数 治愈率( % ) 普通型 300 180 60.0 100 65 65.0 重 型 100 35 35.0 300 125 41.7 合 计 400 215 53.8 400 190 47.5 第二节 标准化法及其应用 表 5 - 5 按式( 5 - 10 )用直接法计算标准化治愈率( % ) 甲疗法 乙疗法 病型 ( 1 ) 标准治 疗人数 ( N i ) ( 2 ) 原治愈率 预期治愈数 ( p i ) ( N ip i ) ( 3 ) ( 4 ) = ( 2)( 3 ) 原治愈率 预期治愈数 ( p i) ( N i p i ) ( 5 ) (6 ) = (2) (5) 普通型 400 60.0 24 0 65.0 26 0 重 型 400 35.0 1 4 0 41.7 16 7 合计 800( N ) 53.8 38 0 47.5 427 第二节 标准化法及其应用 2.间接标准化法 例 5-6 经研究表明,女性原发性骨质疏松随年龄增长 患病率增高。 1998年某省在城市和农村分别抽样调查了 50岁以上的老年妇女 776例和 789例,这些人中患有原发 性骨质疏松症者城市为 322例,农村为 335例,总患病率 分别为 41.5%和 42.5%。 由于本次调查的城乡老年妇女年龄构成不同,如表 5-7 第 2栏和第 5栏,需对两个总患病率进行标准化后方可比 较。 第二节 标准化法及其应用 表 5 - 7 1998 年某省城乡女性原发性骨质疏松症患病率比较 城市 农村 年龄组 (岁) ( 1 ) 调查人数 ( 2 ) 患病人数 ( 3 ) 患病率 ( % ) ( 4 ) 调查人数 ( 5 ) 患病人数 ( 6 ) 患病率 ( % ) ( 7 ) 50 354 241 60 251 315 70 130 175 80 及以上 41 58 合计 776 322 41.5 789 335 42.5 第二节 标准化法及其应用 表 5 - 8 按式 (5 - 12 ) 用间接法计算标准化患病率( % ) 城市 农村 年龄组 (岁) ( 1 ) 标准患病率 i P ( 2 ) 人口数 i n ( 3 ) 预期患病人数 ii nP (4)= (2)(3) 人口数 i n (5) 预期患病人数 ii nP ( 6 )= (2)( 5 ) 50 21.3 354 75 241 51 60 46.1 251 116 315 145 70 65.5 130 85 175 11 5 80 及以上 71.7 41 29 58 42 合计 42.1 776 305 789 35 3 第二节 标准化法及其应用 1.标准化法只适用于某因素两组内部构成不同 , 并有可 能影响两组总率比较的情况 。 2.标准化率已不再反映当地的实际水平 , 它只表示相互 比较的几组资料间的相对水平 。 3.两样本标准化率为样本值 , 若了解两样本标准化率之 间的差别是否有统计学意义 , 应进行假设检验 。 三、应用标准化时的注意事项 第二节 标准化法及其应用 表 3-9 某大学 1992-2002年本科专业招生动态变化 年份 ( 1) 符号 ( 2) 学生 人数 ( 3) 绝对增长量 发展速度 % 增长速度 % 累计 逐年 ( 4) ( 5) 定基比 环比 ( 6) ( 7) 定基比 环比 ( 8) ( 9) 1992 a0 4200 - - 100.0 100.0 - - 1993 a1 4500 300 300 107.1 107.1 7.1 7.1 1994 a2 4800 600 300 114.3 106.7 14.3 6.7 1995 a3 4900 700 100 116.7 102.1 16.7 2.1 1996 a4 5150 950 250 122.6 105.1 22.6 5.1 1997 a5 5320 1120 170 126.7 103.3 26.7 3.3 1998 a6 5510 1310 190 131.2 103.6 31.2 3.6 1998 a7 5780 1580 270 137.6 104.9 37.6 4.9 2000 a8 5950 1750 170 141.7 102.9 41.7 2.9 2001 a9 6000 1800 50 142.9 100.8 42.9 0.8 2002 a10 6200 2000 200 147.6 103.3 47.6 3.3 第三节 动态数列及其分析指标 第三节 动态数列及其分析指标 动态数列 : 一系列按时间顺序排列起来的统计 指标,用以说明事物在时间上的变化和发 展趋势。 定基比 环比 第三节 动态数列及其分析指标 主要指标 : 一、绝对变化量 二、发展速度 三、增长速度 四、平均发展速度与平均增长速度 绝对增长量是说明事物在一定时期增长的绝对值。 可分为 : 累积变化量 :即报告年的指标与某一固定年(基期 水平)指标之差, 逐年变化量 :即报告年的指标与前一年指标之差, 第三节 动态数列及其分析指标 一、绝对变化量: 发展速度 :表示报告期指标的水平相当于基期水平 的百分之多少或若干倍; 第三节 动态数列及其分析指标 二、发展速度 环比发展速度 = 0a an 1n n a a 计算公式: 定基发展速度 = 增长速度 :表示的是净增加或减少了多少倍。可计 算定基比增长速度与环比增长速度, 第三节 动态数列及其分析指标 三、增长速度 增长速度 = 发展速度 % - 100% =发展速度 -1。 是各环比发展速度的几何平均数,说 明某事物在一个较长时期中逐年平均发展 变化的程度。 第三节 动态数列及其分析指标 四、平均发展速度和平均增长速度 计算公式: 平均发展速度 = 平均发展速度 = =1.04=104% 平均增长速度 =平均发展速度 -1=1.04-1=4% n naa 0 1042006200 是各增长变化速度的平均数,说明某 事物在一个较长的时期中逐年平均增长的 程度。 平均发展速度 : 平均增长速度 : 第三节 动态数列及其分析指标 主要指标 : 一、绝对增长量 二、发展速度 三、增长速度 四、平均发展速度与平均增长速度 谢谢 !
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!