资源描述
复 习 检 验 、 检 验 ; 检 验 ; 秩 和 检 验 ; 直 线 回 归 与 相 关 ;ut2 连 续 性 变 量 与 分 类 变 量分 类 变 量双 变 量 可 以 是 连 续 性 变 量 , 但 实际 上 处 理 的 是 再 生 的 等 级 变 量双 变 量 可 以 是 连 续 性 变 量 圆 的 周 长 公 式 R=2r圆 的 面 积 公 式 S=r2一 一 对 应 , 非 常 明 确 确 定性 关 系 身 高 体 重165cm 60kg50kg65kgIm 10kg?!既 是 必 然 的 又 是 不 确 定 的 关 系 称为 相 关 关 系 (correlation) 确 定性 关系 非 确定 性关 系 医 学 上 , 许 多 现 象 之 间 也 都 有 相 互 联 系 , 其表 现 形 式 多 样 , 关 系 有 疏 密 程 度 的 不 同 , 相互 间 可 能 有 因 果 关 系 , 也 可 能 有 伴 随 关 系 。 密 切 程 度 : 体 温 与 脉 搏 身 高 与 体 重 产 前 检 查与 婴 儿 体 重 因 果 关 系 : 乙 肝 病 毒 乙 肝 伴 随 关 系 : 丈 夫 的 身 高 和 妻 子 的 身 高相 关 与 回 归 就 是 用 于 研 究 和 解 释 两 个 变 量 之 间相 互 关 系 的 。 研 究 方 法 相 关 分 析 : 反 应 变 量 间 的 密 切 程 度 与 变 化趋 势 回 归 分 析 : 变 量 间 数 量 上 的 依 存 关 系 回 归 分 析 分 类 按 变 量 间 的 关 系 可 分 为 : 直 线 回 归 和 曲 线回 归 。 按 研 究 变 量 的 数 量 可 分 为 : 一 元 回 归 与 多元 回 归 。 相 关 分 析 分 类 按 变 量 间 的 关 系 : 线 性 相 关 与 曲 线 相 关 按 资 料 的 分 布 分 析 方 法 : Pearson相 关 与 等级 相 关 第 一 节 直 线 回 归是 用 于 研 究 两 个 连 续 性 变 量x与 y之 间 的 线 性 依 存 关 系 的 一 种 统 计分 析 方 法 。 回 归 F.Galton 33.73 0.516Y X 75706560 75 70 65 60 height of father he igh t o f s on :一 . 直 线 回 归 方 程 及 其 计 算 SAH患 者 第 一 天 血 清 和 脑 脊 液IL-6(pg/ml)检 测 结 果 患 者 号 1 2 3 4 5 6 7 8 9 10血 清IL-6(x) 22.4 51.6 58.1 25.1 65.9 79.7 75.3 32.4 96.4 85.7脑 脊 液IL-6(y) 134.0 167.0 132.3 80.2 100.0 139.1 187.2 97.2 192.3 199.4 血 清 IL-6 (pg/ml) 10080604020脑脊液IL-6 (pg/ml) 220200180160140120 1008060Y X X Y 称 为 自 变 量 。( independent variable)称 为 因 变 量 。 ( dependent variable)可 以 精 确 测量 或 严 格 控制 依 赖 性 XY P119, P121 通 式 : y =a+bx 自 变 量因 变 量直 线 在 y轴 上 的 截 距 直 线 的 斜 率a0表 示 直 线 与 纵 轴 的 交 点 在 原 点 上 方a0, Y随 X的 增 大 而 增 大 ( 减 少 而 减 少 ) 斜 上 ; b0: X每 增 加 ( 减 少 ) 一 个 观 测 单 位 , 增 加 ( 减 少 )b个 单 位 。b0 b0 b=0 :y 表 示 给 定 X时 Y的 平 均 值 的 估 计 值 。其 涵 义 是 均 数 不 同 X时 Y均 数 的 估 计 值 ,与 一 般 的 均 数 的 计 算 方 法 不 同 , 这 里 的 均 数 是给 定 X的 条 件 下 , 由 回 归 方 程 估 计 得 到 的 , 故又 称 条 件 均 数 (conditional mean)。Y n Y n 即 Y估 计 值 之 均 数 等 于 Y观 察 值 之 总 平 均 。 且当 自 变 量 时 , Y的 估 计 值 等 于 。 X X Y P121 回 归 方 程 参 数 的 计 算 最小二乘法原则(least square method): 使 各 散 点 到直 线 的 纵 向 距 离 的 平 方 和 最 小 。 即 使 最 小 。Y Y 残 差 : 点 到 直 线 的 纵 向 距 离 2 22xyxx x yxyx x y yl nb l xx x x n a y b x P120 xy 1797.19610.72 2( )Y Y 例 10.1 某 医 院 测 量 了 10名 3岁 男 童 体 重 (X,kg)与 体 表 面 积 (Y,103cm2), 数 据 见 表 10.1, 试作 回 归 分 析 。 实 例 表 10.1 男 童 体 重 (X,kg)与 体 表 面 积 (Y,103cm2) 编 号 X(1) Y(2) X2(3) Y2(4) XY(5)1 11.0 5.283 121.00 27.91009 58.113002 11.8 5.299 139.24 28.07940 62.528203 12.0 5.358 144.00 28.70816 64.296004 12.3 5.292 151.29 28.00526 65.091605 13.1 5.602 171.61 31.38241 73.386216 13.7 6.014 187.69 36.16820 82.391807 14.4 5.830 207.36 33.98890 83.952008 14.9 6.102 222.01 37.23441 90.91980 9 15.2 6.075 231.04 36.90562 92.3400010 16.0 6.411 256.00 41.10092 102.57600 合 计 134.4 57.266 1831.24 329.48337 775.59461 (1) 画 散 点 图 , 判 断 是 否 有 线 性 趋 势 。 按 (X,Y)实 测值 在 直 角 坐 标 图 上 画 出 10个 点 , 见 图 10.2。 由 散 点图 判 断 , 两 变 量 间 有 线 性 趋 势 , 可 以 作 直 线 回 归 分析 。 11 12 13 14 15 165.05.56.06.5 (2) 求 直 线 回 归 方 程 。 在 例 10.1中 已 算 得 X和 Y的 均 数 、 离 均差 平 方 和 与 离 均 差 积 和 lXX, lXY, lYY。 =13.44, =5.7266, lXX=24.9040, lYY=1.5439,lXY=5.9396 按 公 式 (11.2), (11.3)得 回 归 系 数 和 截 距 分 别为 : (103cm2/kg) a=5.7266-13.440.2385=2.5212(103cm2) 由 此 , 可 列 出 直 线 回 归 方 程 :X Y 2385.09040.249396.5 b XY 2385.05212.2 二 . 回 归 直 线 根 据 求 得 的 回 归 方 程 , 可 以 在 自 变 量 X的 实 测 范 围 内 任 取 两 个 值 , 代 入 方 程 中 ,求 得 相 应 的 两 个 Y值 , 以 这 两 对 数 据 找 出 对应 的 两 个 坐 标 点 , 将 两 点 连 接 为 一 条 直 线 ,就 是 该 方 程 的 回 归 直 线 。 回 归 直 线 一 定 经 过 ( 0, a ) ,( ) 。 这 两 点 可 以 用 来 核 对 图 线 绘 制是 否 正 确 。 ,X Y (3) 绘 制 回 归 直 线 。 在 自 变 量 X的 实 测 范 围 内 任取 相 距 较 远 且 易 读 数 的 两 X值 , 代 入 直 线 回 归 方程 求 得 两 点 (X1, ), (X2, ), 过 这 两 点 作 直 线 即为 所 求 回 归 直 线 。 本 例 取 X1=12, 得 =5.3832; 取 X2=15, 得 =6.0987。 2Y 1Y 2Y1Y x=12,y=5.3832 x=15 ,y=6.0987 ( 0, a ) ( ),X Y XY 2385.05212.2 与 其 它 假 设 检 验 一 样 , 直 线 回 归 方 程 也 是 从 样 本资 料 计 算 而 得 的 , 同 样 也 存 在 着 抽 样 误 差 问 题 。所 以 , 需 要 对 样 本 的 回 归 系 数 b进 行 假 设 检 验 ,以 判 断 b是 否 从 回 归 系 数 为 零 的 总 体 中 抽 得 。 为了 判 断 抽 样 误 差 的 影 响 , 需 对 回 归 系 数 进 行 假 设检 验 。 总 体 的 回 归 系 数 一 般 用 表 示 。 三 .回 归 系 数 的 假 设 检 验 b0原 因 : 由 于 抽 样 误 差 引 起 , 总 体 回 归 系 数 =0 存 在 回 归 关 系 , 总 体 回 归 系 数 0 22yx y ys n 0 , 2b b bb bt ns s yxb xxss l 22 yx y ys n Sb为 回 归 系 数 的 标 准 误 SYX为 Y的 剩 余 标 准 差 各 观 察值 Y到 回 归 直 线 的 距 离 的 标 准 差 ,表 示 扣 除 X的 影 响 后 Y的 变 异 程 度 。 H0: 总 体 回 归 系 数 0;H1: 总 体 回 归 系 数 0。 2 2 2 2 0.127308X X Y YY Y Y Y X X 2. 0.127308 0.12622 10 20.2385 9.435/ 0.1262/ 24.904YXb Y X XXY YS nbt S l =n-2=8查 表 得 0.05/2,8 2.3060t 0.05/2,8, ,bt t 则 P0.05故 按 =0.05的 水 准 拒 绝 H0, 接 受 H1, 可 以 认 为 认 为 体 重 与 体 表面 积 之 间 有 回 归 关 系 。 应 变 量 变 异 的 分 解 Y Y Y Y Y Y ( )Y Y 回 归 部 分( )Y Y总 情 况 ( )Y Y 剩 余 部 分( , )P X Y 实 测 点Y XY Y 2 2 2 ( ) ( ) ( ) , 2 ( )( ) 0,: ( ) ( ) ( )Y Y Y Y Y Y Y Y Y YY Y Y Y Y YSS SS SS 回总 剩 回总 剩等 式 两 边 平 方 后 再 求 和 因 为所 以 有即同 样 有 : yySS l总 2 2/xy xy xx xxSS bl l l b l 回 2( )2 2YX SSY YS MSn n 剩 剩 1 21,/ ,/ 2SS MSF SS MS n 回 回 回 回 剩剩 剩 剩统 计 量 F服 从 自 由 度 为 的 F分 布 。, 回 剩 例 : 检 验 体 重 与 体 表 面 积 间 无 直 线 回 归 关 系 是 否成 立 ? 0.05 计 算 检 验 统 计 量 F:注 意 : 两 种 检 验 是 完 全 等 价 的 , 即 6.9084 2.6284t F H0: 体 重 与 体 表 面 积 间 无 直 线 回 归 关 系 ;H1: 体 重 与 体 表 面 积 间 有 直 线 回 归 关 系 。变 异 来 源 SS MS F回 归 1.4166 1 1.4166 89.01剩 余 0.1273 8 0.0159总 变 异 1.5439 9 0.1715 得 F=89.01, 今 1=1, 2=8, 查 附 表 4, F界值 表 , 得 P0r =1r 0r = -1r = 0 yyxxxy lllr X和 Y的 离 差 积 和X的 离 差 平 方 和 Y的 离 差 平 方 和(x-x)(y-y)(x-x)2 (y- y)2 二 .相 关 系 数 的 计 算 例 10.1 某 医 院 测 量 了 10名 3岁 男 童 体 重 (X,kg)与 体 表 面 积 (Y,103cm2), 数 据 见 表 10.1, 试作 相 关 分 析 。 实 例 表 10.1 男 童 体 重 (X,kg)与 体 表 面 积 (Y,103cm2) 编 号 X(1) Y(2) X2(3) Y2(4) XY(5)1 11.0 5.283 121.00 27.91009 58.113002 11.8 5.299 139.24 28.07940 62.528203 12.0 5.358 144.00 28.70816 64.296004 12.3 5.292 151.29 28.00526 65.091605 13.1 5.602 171.61 31.38241 73.386216 13.7 6.014 187.69 36.16820 82.391807 14.4 5.830 207.36 33.98890 83.952008 14.9 6.102 222.01 37.23441 90.91980 9 15.2 6.075 231.04 36.90562 92.3400010 16.0 6.411 256.00 41.10092 102.57600 合 计 134.4 57.266 1831.24 329.48337 775.59461 (1) 画 散 点 图 , 判 断 是 否 有 线 性 趋 势 。 按 (X,Y)实 测值 在 直 角 坐 标 图 上 画 出 10个 点 , 见 图 10.2。 由 散 点图 判 断 , 两 变 量 间 有 线 性 趋 势 , 且 为 正 相 关 。 可 以作 相 关 分 析 。 。 11 12 13 14 15 165.05.56.06.5 lxy= (x-x)(y-y)=5.9396lxx= (x-x)2=24.9040lyy= (y-y)2=1.5439 1.相 关 程 度 是 0.95792.相 关 方 向 是 正 相 关 三 .相 关 系 数 的 假 设 检 验对 相 关 系 数 的 假 设 检 验 , 常 用 t检 验 , 选 用统 计 量 t的 计 算 公 式 如 下 : 220 211 2r rr r nt rS rrn =n-2 Sr- 相 关 系 数 的 标 准 误 解 : ( 1) 建 立 检 验 假 设 , 确 定 检 验 水 准 H0:=0H1:0 查 t 0.05, 8=2.306,P(0.05,12), P0.05。 计 算 法 : 时当 50n 时 ,当 50n )2/()1( 02 nrrt ss ,自 由 度 n-sr 2 2413 78 78/12 0.6894650 78 /12 637 78 /12sr 确 定 P值 并 作 出 统 计 推 断 本 例 , n 12, 查 rS界 值 表 , 得 P0.05, 按 0.05水 准 拒 绝 H0 , 接 受 H 1 , 可 认 为抗 白 指 数 与 临 床 疗 效 间 存 在 等 级 相 关 关 系 。 注 意 事 项两 个 变 量 之 间 相 关 关 系 具 有 统 计 学 意 义 , 只能 从 统 计 学 上 反 映 出 它 们 之 间 的 变 化 存 在 某种 规 律 性 , 不 能 直 接 把 这 种 相 关 性 解 释 为 因果 关 系 。当 观 察 例 数 较 少 ( 如 n15) 时 , 相 关 系 数 容易 受 个 别 观 察 对 象 的 特 殊 值 影 响 。 因 此 须 事先 作 好 试 验 设 计 , 正 确 确 定 样 本 含 量 。 应 区 别 相 关 强 度 与 相 关 有 统 计 学 意 义 相 关 具 有 统 计 学 意 义 指 该 样 本 相 关 系 数 r来 自相 关 系 数 =0的 总 体 的 概 率 很 小 。 而 相 关 强 度表 示 两 变 量 间 相 互 联 系 的 密 切 程 度 。注 : 当 遇 到 两 变 量 之 间 的 相 关 系 数 具 有 统 计 学 意义 但 r值 不 大 时 , 下 结 论 要 特 别 慎 重 。 如 : r =0.20, n=100 定 性 资 料 的 相 关 定 性 指 标 间 的 相 关 程 度 和 方 向 常 用 列 联 系 数(contingency coefficient)来 表 示 四 格 表 资 料 的 相 关 分 析 列 联 系 数 rn来 描 述 两 个 分 类 变 量 间 的 密切 程 度 和 相 关 方 向 , 其 意 义 类 似 于 直 线 相关 系 数 r。 列 联 系 数 rn在 -1 +1之 间 , 其 正 负 表 示相 关 方 向 , 且 绝 对 值 越 大 , 相 关 越 密 切 ;r n=0时 , 表 示 无 相 关 。 )()()( dbcadcba bcadrn 例 10.4 某 中 医 师 采 用 两 种 方 法 观 察 舌 象200例 , 观 察 结 果 如 表 10.4, 试 分 析 两 种 观察 方 法 的 结 果 间 有 无 联 系 ? 表 10.4 两 种 方 法 观 察 舌 象 的 结 果 比 较 乙 法 甲 法 合 计+ + 84 (a) 16 (b) 100 (a+b) 20 (c ) 80 (d) 100 (c+d)合 计 104 (a+c) 96 (b+d) 200 (n) 计 算 列 联 系 数 6405.096104100100 20168084 nr 行 列 表 资 料 的 相 关 分 析 表 示 行 列 表 资 料 的 相 关 关 系 的 列 联 系 数 种类 很 多 , 其 中 Cramr修 正 列 联 系 数 V较 适合 于 描 述 定 性 资 料 的 相 关 , 其 公 式 为 : 行 列 表 资 料 的 相 关 分 析 式 中 2为 行 列 表 的 2值 , n为 样 本 含 量 , min(R-1,C-1)表 示 取 (行 数 -1)或 (列 数 -1)中 的 最 小 值 , 与 r及 rn不 同 , V的取 值 范 围 在 01之 间 , 0表 示 无 关 ; 越 接 近 于 1表 示 关 系 越密 切 ; 1表 示 完 全 相 关 。 注 意 , V只 表 示 两 指 标 间 的 相 关 程度 , 并 不 表 示 相 关 方 向 。 2min( 1, 1)V n R C 例 10.5 某 人 按 两 种 血 型 系 统 统 计 某 地 6094人的 血 型 分 布 , 结 果 见 表 10.5, 问 两 种 血 型 的分 布 间 有 无 关 系 ? 表 10.5 某 地 6094人 按 两 种 血 型 系 统 划 分 结 果 ABO MN血 型 合 计血 型 M N MNO 431 490 902 1823A 388 410 800 1598B 495 587 950 2032AB 137 179 325 641合 计 1451 1666 2977 6094 计 算 列 联 系 数 从 列 联 系 数 来 看 , 两 种 血 型 分 类 系 统 的 列联 系 数 很 小 , 无 相 关 关 系 。 8.5952 0.02666094 min(4 1,3 1)V 列 联 相 关 系 数 的 假 设 检 验 列 联 系 数 是 否 为 0的 假 设 检 验 与 构 成 比 是 否相 同 的 假 设 检 验 相 同 , 即 是 可 用 2检 验 代替 相 应 的 相 关 检 验 。
展开阅读全文