资源描述
典 型 相 关 分 析 典 型 相 关 分 析 是 研 究 两 组 随 机 变 量 pXXXX , 21 与 qYYYY , 21 之 间 的 相 关 关 系 , 探 讨 它 们 之 间 相 关 关 系 的 表 达 方 式 与 强 弱 的 度 量 。 在 实 际 问 题 中 , 经 常 遇 到 要 研 究 一 部 分 变 量 与 另 一 部 分 变 量 之 间 的 相 关 关 系 , 例 如 : 在 工 厂 里 , 考 察 原 料 的 若 干 项 质 量 指 标 pXXX , 21 与 产 品 的 若 干 项 主 要 质 量 指 标 qYYY , 21 之 间 的 相 关 性 ; 在 经 济 学 中 研 究 几 种 主 要 肉 食 品 的 价 格 与 销 售 量 之 间 的 相 关 性 ; 在 气 象 学 中 研 究 相 继 两 天 气 象 因 子 间 的 相 关 性 ; 在 卫 生 防 疫 中 研 究 某 些 疾 病 与 生 活 习 惯 之 间 的 相 关 性 , 等 等 。 典 型 相 关 分 析 方 法 采 用 主 成 分 分 析 的 做 法 , 在 每 一 组 变 量 中 都 适 当 构 造 若 干 个 有 代 表 性 的 综 合 性 指 标 ( 变 量 的 线 性 组 合 ) , 通 过 考 察 这 些 综 合 性 指 标 间 的 相 关 性 来 揭 示 两 组 原 始 变 量 间 的 相 关 关 系 。 设 paaaa , 21 , qbbbb , 21 是 两 个 按 某 种 规 则 确 定 的 常 值 向 量 , 则 pp XaXaXaXa 2211 可 看 作 是 第 一 组 随 机 变 量 pXXX , 21 的 某 项 综 合 性 指 标 , qqYbYbYbYb 2211 可 看 作 是 第 二 组 随 机 变 量 qYYY , 21 的 某 项 综 合 性 指 标 , 规 则 是 希 望 通 过 适 当 选 择 向 量ba, , 使 综 合 性 指 标 Xa 与 Yb 有 最 大 相 关 系 数 。 由 bYDbaXDa bYXCovaYbDXaD YbXaCovYbXa , 可 知 , 若 不 对 向 量 ba, 加 以 适 当 限 制 , 使 相 关 系 数 YbXa , 达 到 最 大 的 ba, 将 不 唯 一 。 这 是 因 为 , 随 机 变 量 乘 以 常 数 后 不 改 变 相 互 间 的 相 关 系 数 。 较 为 合 理 的 限 制 是 1 aXDa 且 1 bYDb 。 于 是 构 造 具 有 最 大 相 关 系 数 的 两 个 综 合 性 指 标 Xa 与 Yb 的 问 题 就 转 化 为 在 约 束 条 件 1 aXDa , 1 bYDb 之 下 求ba, , 使 bYXCova , 达 到 最 大 。 如 果 qp 维 随 机 向 量 YX 的 协 方 差 矩 阵 YYYX XYXX 已 知 则 babYXCova XY , ( 10.14) aaaXDa XX ( 10.15) bbbYDb YY ( 10.16) 两 综 合 性 指 标 Xa 与 Yb 的 构 造 就 转 化 为 求 解 约 束 优 化 问 题 1 1 bb aats ba YYXXXYba.min, ( 10.17) 经 过 一 系 列 的 理 论 推 导 , 可 以 匹 配 出 r 对 综 合 性 指 标 Xai 和 Ybi , ri ,2,1 , 根 据 它 们 间 相 关 系 数 的 大 小 , 依 次 称 Xa1 , Yb1 是 X ,Y 的 第 一 对 典 型 相 关 变 量 , 它 们 间 具 有 最 强 的 线 性 相 关 性 , 其 相 关 系 数 1 称 第 一 典 型 相 关 系 数 ; 称Xa2 , Yb2 是 X , Y 的 第 二 对 典 型 相 关 变 量 , 它 们 间 的 线 性 相 关 性 仅 次 于 第 一 对 典 型 相 关 变 量 , 其 相 关 系 数 2 称 第 二 典 型 相 关 系 数 ; 等 等 。 从 数 学 手 段 上 看 , 就 是 先 求 矩 阵 YXYYXYXX A 11 或XYXXYXYYB 11 的 非 零 特 征 根 022221 r , 再 求 矩 阵 A和B 与 各 特 征 根 相 配 对 的 分 别 满 足 条 件 1 iXXi aa , 1 iYYi bb 的 特 征 向 量 ii ba , ri ,2,1 。 例 : 考 查 吸 烟 者 的 年 龄 体 形 ( 指 标 为 : 1X 年 龄 ; 2X 体 重 ; 3X 日 吸 烟 量 ;4X 胸 围 ) 与 基 本 健 康 状 况 ( 指 标 为 : 1Y 脉 搏 ; 2Y 收 缩 压 ; 3Y 舒 张 压 ) 之 间 的 相 关 关 系 。 由 于 总 体 的 协 差 阵 未 知 , 为 了 进 行 样 本 典 型 相 关 分 析 , 随 机 抽 取 了 容 量 为 15 的 样 本 , 测 得 观 测 值 如 表 10.1 所 示 。 表 10.1 年 龄 ( 岁 ) 体 重 ( 斤 ) 日 吸 烟 量 ( 支 ) 胸 围 ( 厘 米 ) 脉 搏 ( 次 /分 ) 收 缩 压 (mm Hg) 舒 张 压 (mm Hg) 25 125 30 83.5 70 130 85 26 131 25 82.9 72 135 80 28 128 35 88.1 75 140 90 29 126 40 88.4 78 140 92 27 126 45 80.6 73 138 85 32 118 20 88.4 70 130 80 31 120 18 87.8 68 135 75 34 124 25 84.6 70 135 75 36 128 25 88.0 75 140 80 38 124 23 85.6 72 145 86 41 135 40 86.3 76 148 88 46 143 45 84.8 80 145 90 47 141 48 87.9 82 148 92 48 139 50 81.6 85 150 95 45 140 55 88.0 88 160 95 算 得 样 本 协 差 阵 : X1 X2 X3 X4 Y1 Y2 Y3 X1 66.552 49.719 57.038 2.205 36.729 53.562 29.362 X2 49.719 62.695 77.848 -2.576 40.300 50.610 37.838 X3 57.038 77.848 144.781 -5.595 63.329 75.019 69.633 X4 2.205 -2.576 -5.595 7.000 1.079 2.524 0.260 Y1 36.729 40.300 63.329 1.079 35.257 42.971 34.086 Y2 53.562 50.610 75.019 2.524 42.971 66.638 40.610 Y3 29.362 37.838 69.633 0.260 34.086 40.610 44.410 即 0007595557622052 59557811448487703857 5762848776956271949 2052038577194955266 . . . .XX 410446104008634 610406386697142 086349714225735 . . .YY 260052420791 633690197532963 838376105030040 362295625372936 . . . .XY YXYYXYXXA 11 = 0090759045503930 0070705033401990 0020177015701320 0370149023304150 . . . . 求 得 矩 阵 A的 特 征 根 : 915021 . , 339022 . , 032023 . , 000024 . 相 应 得 典 型 相 关 系 数 : 95701 . , 58202 . , 18203 . , 04 由 于 3 相 对 于 21 , 已 经 很 小 , 只 计 算 前 两 对 典 型 相 关 变 量 即 可 。 进 一 步 算 得 对 应 于 915021 . , 339022 . 的 分 别 满 足 条 件 1 iXXi aa ,21,i 的 特 征 向 量 07200580019003101 .,.,.,.a 01900890014013902 .,.,.,. a 类 似 地 可 算 得 XYXXYXYYB 11 = 332003201080 019028801110 61082706670 . . . 0210021012101 .,.,.b 2270155003202 .,.,. b 故 得 第 一 对 典 型 相 关 变 量 43211 0720058001900310 XXXXXa . 3211 021002101210 YYYYb . 其 典 型 相 关 系 数 95701 . 第 二 对 典 型 相 关 变 量 43212 019.0089.0014.0139.0 XXXXXa 3212 227015500320 YYYYb . 其 典 型 相 关 系 数 582.02 对 于 典 型 相 关 分 析 的 以 上 结 果 , 可 以 归 纳 出 一 些 概 括 性 的 结 论 : 做 为 年 龄 体 形 的 第 一 项 综 合 性 指 标 43211 0720058001900310 XXXXXa . , 由 于 34 XX , 的 系 数 相 对 较 大 , 表 明 该 项 指 标 主 要 由 胸 围 和 每 日 的 吸 烟 量 所 决 定 。 而 做 为 与 该 项 指 标 有 最 大 线 性 相 关 关 系 的 健 康 状 况 综 合 性 指 标 3211 021002101210 YYYYb . 则 主 要 由 脉 搏 次 数 所 决 定 。 又 由 于 第 一 典 型 相 关 系 数 95701 . 为 正 且 很 接 近 于 1、 34 XX , 与 1Y 的 系 数 皆 为 正 , 说 明 每 分 钟 的 脉 搏 次 数 与 胸 围 和 吸 烟 量 有 非 常 密 切 的 正 相 关 关 系 , 即 胸 围 越 大 、 吸 烟 量 越 多 , 心 跳 就 越 快 。
展开阅读全文