资源描述
第 十 章 典 型 相 关 分 析v 10.1 引 言v 10.2 总 体 典 型 相 关v 10.3 样 本 典 型 相 关v 10.4 典 型 相 关 系 数 的 显 著 性 检 验 10.1 引 言v 典 型 相 关 分 析 ( canonical correlation analysis) 是 研究 两 组 变 量 之 间 相 关 关 系 的 一 种 统 计 分 析 方 法 , 它能 够 有 效 地 揭 示 两 组 变 量 之 间 的 相 互 线 性 依 赖 关 系 。v 典 型 相 关 分 析 是 由 霍 特 林 ( Hotelling,1935,1936) 首先 提 出 的 。 典 型 相 关 分 析 的 应 用 例 子v 在 工 厂 里 , 考 察 产 品 的 q个 质 量 指 标 (y1,y2, ,yq)与 原 材 料 的 p个 质 量 指 标 (x1,x2, ,xp)之 间 的 相 关 关 系 ;v 牛 肉 、 猪 肉 的 价 格 与 按 人 口 平 均 的 牛 肉 、 猪 肉 的 消 费 量 之 间的 相 关 关 系 ;v 初 一 学 生 的 阅 读 速 度 、 阅 读 才 能 与 数 学 运 算 速 度 、 数 学 运 算才 能 之 间 的 相 关 关 系 ;v 硕 士 研 究 生 入 学 考 试 的 各 科 成 绩 与 本 科 阶 段 一 些 主 要 课 程 成绩 之 间 的 相 关 关 系 ;v 一 组 政 府 政 策 变 量 与 一 组 经 济 目 标 变 量 之 间 的 相 关 关 系 。 10.2 总 体 典 型 相 关v 一 、 典 型 相 关 的 定 义 及 导 出v 二 、 典 型 相 关 变 量 的 性 质v 三 、 从 相 关 矩 阵 出 发 计 算 典 型 相 关 一 、 典 型 相 关 的 定 义 及 导 出v 设 x=(x1,x2, ,xp)和 y=(y1,y2, ,yq)是 两 组 随 机 变 量 , 且V(x)=11(0), V(y)=22(0), Cov(x, y)=12, 即 有其 中 21=12。v 我 们 研 究 u=ax与 v=by之 间 的 相 关 关 系 , 其 中a=(a1,a2, ,ap), b=(b1,b2, ,bq)v Cov(u,v)=Cov(ax,by)=aCov(x,y)b=a 12bV(u)=V(ax)=aV(x)a=a11aV(v)=V(by)=bV(y)b=b22b11 1221 22V x y 所 以附 加 约 束 条 件 V(u)=1, V(v)=1即 a11a=1, b22b=1在 此 约 束 条 件 下 , 求 a Rp和 b Rq, 使 得(u,v)=a 12b达 到 最 大 。 1211 22,u v a ba a b b v 令 , 于 是 约 束 条 件 化 为=1, =1 利 用 柯 西 不 等 式 (1.8.1), 有 由 (1.8.3)式 知 , 当 =1时 , 达 到 最 大 值 , 其 中 是 非 负 定 矩 阵 的 最 大 特 征 值 , 1相 应 的 单 位 特 征 向 量 。 若 取 1 2 1 211 22 a b, 22 1 2 1 212 11 12 221 2 1 2 1 2 1 211 12 22 11 12 221 2 1 1 222 21 11 12 22 a b 1 2 1 1 222 21 11 12 22 21 21 1 2 1 1 222 21 11 12 22 1 2 1 21 11 12 22 1 1 11 , (10.2.7) 则 依 (1.8.1) 式 知 , 不 等 式 (10.2.7)中 的 等 号 成 立 。 从 而 , 当 取 时 , (u,v)=a12b达 到 最 大 值1( 显 然 11) 。 称 为 第 一 对 典 型 相 关 变 量 , 称 1为 第 一 个 典 型 相 关 系 数 。v 记 m为 12的 秩 , 则 从 而 , 有 m个 正 特 征 值 , 记 为 , 相 应 的 正 交 单 位 特 征 向 量 记 为 1,2, ,m。 和 都 具 有 相 同 的 非 零 特 征 值 。 1 2 1 21 11 1 1 22 1 a a b b , 1 1 1 1u v a x b y, 1 2 1 1 2 1 2 1 222 21 11 12 22 11 12 2212rank rankrank m 1 2 1 1 222 21 11 12 22 ( 0) 2 2 21 2 0m 1 2 1 1 222 21 11 12 22 1 2 1 1 2 1 1 1 111 12 22 21 11 22 21 11 12 11 12 22 21, , v 令则 1,2, ,m为 的 相 应 于 的正 交 单 位 特 征 向 量 ; a1,a2, ,am为 的 相 应 于 的 特 征 向 量 ; b1,b2, ,bm为 的 相 应于 的 特 征 向 量 。v 第 一 对 典 型 相 关 变 量 u1,v1提 取 了 x与 y之 间 相 关 的 最 主 要 部 分, 如 果 这 一 部 分 还 显 得 不 够 , 可 以 在 剩 余 相 关 中 再 求 出 第 二对 典 型 相 关 变 量 u2=ax,v2=by, 也 就 是 a,b应 满 足 标 准 化 条 件且 应 使 得 第 二 对 典 型 相 关 变 量 不 包 括 第 一 对 典 型 相 关 变 量 所含 的 信 息 , 即(u 2,u1)=(ax,a1x)=Cov(ax, a1x)=a11a1=0(v2,v1)=(by,b1y)=Cov(by,b1y)=b22b1=0 1 2 1 2 1 2 1 211 12 22 11 221 , , , 1,2, ,i i i i i ii i m a b 1 2 1 1 211 12 22 21 11 2 2 21 2, , , m 1 111 12 22 21 2 2 21 2, , , m 1 122 21 11 12 2 2 21 2, , , m 在 这 些 约 束 条 件 下 使 得(u2,v2)=(ax,by)=a12b达 到 最 大 。v 一 般 地 , 第 i( 1im) 对 典 型 相 关 变 量 ui=ax,vi=by是 指 , 找出 a Rp,b Rq, 在 约 束 条 件a11a=1, b22b=1a11ak=0, b22bk=0, k=1,2, ,i1下 , 使 得 (ui,vi)=(ax,by)=a12b达 到 最 大 。 v 令 , 于 是 上 述 约 束 条 件 等 价 于=1, =1k=0, k=0, k=1,2, ,i11 2 1 211 22, a b v 由 (1.8.4) 式 知 , 在 该 约 束 条 件 下 , 当 =i时 , 达 到 最 大 值 。 若 取则 依 (1.8.1) 式 , 不 等 式 (10.2.7)中 的 等 号 成 立 。 所 以 , 当 取a=ai,b=bi时 , (ui,vi)达 到 最 大 值 i, 称 它 为 第 i个 典 型 相 关 系数 , 称 ai,bi为 第 i对 典 型 系 数 。1 2 1 1 222 21 11 12 22 2i1 2 1 211 12 221= ( ),i i ii 二 、 典 型 相 关 变 量 的 性 质v 1.同 一 组 的 典 型 变 量 互 不 相 关v 2.不 同 组 的 典 型 变 量 之 间 的 相 关 性v 3.原 始 变 量 与 典 型 变 量 之 间 的 相 关 系 数v 4.典 型 相 关 系 数 也 是 某 种 复 相 关 系 数v 5.简 单 相 关 、 复 相 关 和 典 型 相 关 之 间 的 关 系 1.同 一 组 的 典 型 变 量 互 不 相 关v 设 x,y的 第 i对 典 型 变 量 为ui=aix, vi=biy, i=1,2, ,m则 有V(ui)=ai11ai=1, V(vi)=bi22bi=1, i=1,2, ,m(ui,uj)=Cov(ui,uj)=ai11aj=0, 1ijm(vi,vj)=Cov(vi,vj)=bi22bj=0, 1ijm 2.不 同 组 的 典 型 变 量 之 间 的 相 关 性v (ui,vi)=i, i=1,2, ,mv 记 u=(u1,u2, ,um), v=(v1,v2, ,vm), 则 上 述 两 个 性 质 可 用 矩阵 表 示 为 V(u)=I, V(v)=I, Cov(u,v)=或其 中 =diag( 1,2, ,m)。 1 2 1 211 12 22, Cov , Cov , Cov ,0 1i j i j i j i ji j j i ju v u v i j m a x b y a x y b ,V u I v I 3.原 始 变 量 与 典 型 变 量 之 间 的 相 关 系 数v 记 A=(a1,a2, ,am), B=(b1,b2, ,bm), 则 原 始 变 量 与 典 型 变 量之 间 的 协 方 差 矩 阵 为Cov(x,u)=Cov(x,Ax)=11ACov(x,v)=Cov(x,By)=12BCov(y,u)=Cov(y,Ax)=21ACov(y,v)=Cov(y,By)=22Bv 原 始 变 量 与 典 型 变 量 之 间 的 相 关 矩 阵 为 其 中 1 11 11 1 121 12 21 2 22, , , , , x u D A x v D By u D A y v D B 1 1 2 1diag , , , diag , ,p qV x V x V y V y D D (10.2.18) (10.2.18)式 的 证 明v 现 证 明 第 一 个 等 式 , 其 余 三 个 等 式 的 证 明 是 完 全 类似 的 。 令其 中 1=E(x), 2=E(y), 即 对 x和 y的 各 分 量 作 标 准 化变 换 , 于 是 * 1 * 11 1 2 2 x D x y D y , * *1 11 1 111 11, , Cov ,Cov Cov , x u x u x uD x u D x uD A , 4.典 型 相 关 系 数 也 是 某 种 复 相 关 系 数v 与 y的 复 相 关 系 数 为v 与 x的 复 相 关 系 数 为i iu a x , 1,2, ,iu i i m y i iv b y , 1,2, ,iv i i m x 5.简 单 相 关 、 复 相 关 和 典 型 相 关 之 间 的 关 系v 当 p=q=1时 , x与 y之 间 的 ( 惟 一 ) 典 型 相 关 就 是 它 们 之 间 的简 单 相 关 ; 当 p=1或 q=1时 , x与 y之 间 的 ( 惟 一 ) 典 型 相 关 就 是 它 们 之 间的 复 相 关 。 可 见 , 复 相 关 是 典 型 相 关 的 一 个 特 例 , 而 简 单 相 关 是 复 相 关的 一 个 特 例 。v 第 一 个 典 型 相 关 系 数 至 少 同 x( 或 y) 的 任 一 分 量 与 y( 或 x)的 复 相 关 系 数 一 样 大 , 即 使 所 有 这 些 复 相 关 系 数 都 较 小 , 第一 个 典 型 相 关 系 数 仍 可 能 很 大 ; 同 样 , 从 复 相 关 的 定 义 也 可 以 看 出 , 当 p=1( 或 q=1) 时 , x( 或 y) 与 y( 或 x) 之 间 的 复 相 关 系 数 也 不 会 小 于 x( 或 y) 与y( 或 x) 的 任 一 分 量 之 间 的 相 关 系 数 , 即 使 所 有 这 些 相 关 系数 都 较 小 , 复 相 关 系 数 仍 可 能 很 大 。 三 、 从 相 关 矩 阵 出 发 计 算 典 型 相 关v 有 时 , x和 y的 各 分 量 的 单 位 不 全 相 同 , 我 们 希 望 在 对 各 分 量作 标 准 化 变 换 之 后 再 作 典 型 相 关 分 析 。v 设 为 的 相 关 矩 阵 , 现 在 来 求 x*和 y*的 典 型相 关 变 量 。11 1221 22 R RR R R xy* * * *, 1,2, ,i i i m a x b y , * 1 1 1 11 1 1 11 1 11* 1 1 1 12 2 2 22 2 22* * 1 1 1 11 2 1 12 2 12* * 1 1 1 12 1 2 21 1 21Cov , Cov ,Cov , Cov ,V VV Vy x x D x D D D Ry D y D D D Rx y D x y D D D RD y x D D D R 于 是因 为所 以 式 中 , 有 。 同 理式 中 , 有 。 1 11 1 1 1 1 1 1 1 1 111 12 22 21 1 11 1 1 12 2 2 22 2 2 21 11 1 11 11 12 22 21 1 R R R R D D D D D D D DD D 1 1 211 12 22 211 1 1 21 11 12 22 21 1 1 1i i ii i i a aD D Da Da1 1 * 2 *11 12 22 21 i i i R R R R a a* 1i ia Da * *11 1 11 1 11 1i i i i i i a R a a D R Da a a1 1 * 2 *22 21 11 12 i i i R R R R b b* 2i ib D b * *22 2 22 2 22 1i i i i i i b R b b D R D b b b v 由 此 可 见 , 为 x*和 y*的 第 i对 典 型 系 数 , 其 第 i个 典 型 相 关系 数 仍 为 i, 在 标 准 化 变 换 下 具 有 不 变 性 , 这 一 点 与 主 成 分分 析 有 所 不 同 。v 由 于故 x*和 y*的 第 i对 典 型 变 量 是 x和 y的 第 i对典 型 变 量 ui=aix, vi=biy的 中 心 化 值 , 自 然 都 具 有 零 均 值 。v 例 10.2.1 设 x,y有 如 下 相 关 矩 阵 :这 里 | 1, | | 1, 可 以 保 证 存 在 。* *,i ia b * * * * * *,i i i iu v a x b y11 22 121 1 ,1 1 R R R, 111 111 22, R R * * * 11 1 1 1 1* * * 12 2 2 2 2i i i i i i ii i i i i i iu uv v a x a D D x a x a a b y b D D y b y b b 由 于 11有 惟 一 的 非 零 特 征 值 11=2, 故 有 惟 一 非零 特 征 值 在 约 束 条 件 下 , 相 应 于 特 征 值 的 特 征 向 量 为 。 同 理 , 在 约 束 条 件 下 , 1 111 12 22 21 2 222 22 21 11 11 11 11 1 ,111 1 21 1 1 1 R R R R 11 111111 11 111 111 12 22 21 R R R R 221 41 1 21 1/2*1 2 1 a 1* *1 11 1 1 a R a * *1 22 1 1 b R b 相 应 于 特 征 值 的 特 征 向 量 为 。所 以 , 第 一 对 典 型 相 关 变 量 为第 一 个 典 型 相 关 系 数 为 。 由 于 |1, |, 表 明 第 一 个 典 型 相 关 系 数 大 于 两 组 原 始变 量 之 间 的 相 关 系 数 。1 122 21 11 12 R R R R 21 1/2*1 2 1 b 1 1/2 1/2* * * * * *1 12 1 , 2 1 a x x b y y1 1 1/21 2 1 1 10.3 样 本 典 型 相 关v 设 数 据 矩 阵 为则 样 本 协 方 差 矩 阵 为S可 用 来 作 为 的 估 计 。 当 np+q时 , 可 分 别 作 为 的 估 计 ; 它 们 的 非 零特 征 值 可 用 来 估 计 ; 1 1 11 1 11 11 1p qn n n np n nqx x y yx x y y x yX Y x y 11 1221 22 S SS S S 1 1 1 111 12 22 21 22 21 11 12 S S S S S S S S和1 1 1 111 12 22 21 22 21 11 12 和2 2 21 2 mr r r 2 2 21 2 m v 相 应 的 特 征 向 量 作 为 a1,a2, ,am的 估 计 ,作 为 b1,b2, ,bm的 估 计 。 的 正 平 方 根 rj称 为 第 i个 样 本 典 型 相关 系 数 , 称 为 第 i对 样 本 典 型 相 关 变 量 , i=1,2, ,m。v 中 心 化 的 m对 典 型 变 量 为将 样 本 (xj,yj), j=1,2, ,n代 入 上 式 , 有分 别 称 uji和 vij为 ( 第 j个 样 品 的 ) xj和 yj的 第 i个 样 本 典 型 变 量得 分 。 由 约 束 条 件 可 得 ui的 样 本 方 差 v 同 理 可 得 vi的 样 本 方 差1 2 , , , ma a a 1 2 , , , mb b b2iri ia x b y和 , 1,2, , , 1,2, ,ji i j ji i ju v j n i m a x x b y y , 11 i ia S a =1 2 111 11 1 1,2, ,1 1n nji i j j i i ij ju i mn n a x x x x a a S a = =1,211 1,2, ,1 n jij v i mn =1, 1,2, ,i i i i iu v i m a x x b y y , , v 可 画 出 第 一 对 典 型 变 量 得 分 (uj1,vj1), j=1,2, ,n的 散点 图 , 该 图 能 最 大 限 度 地 呈 现 两 组 变 量 之 间 的 相 关性 , 也 可 用 来 检 查 是 否 有 异 常 值 出 现 。 如 需 要 , 可再 画 出 第 二 对 或 更 多 对 的 典 型 变 量 得 分 散 点 图 。v 样 本 典 型 变 量 对 ( 在 前 述 的 约 束 条 件 下 ) 使 样 本 相关 系 数 达 到 最 大 , 而 非 使 ( 总 体 ) 相 关 系 数 达 到 最大 ; 同 组 的 样 本 典 型 变 量 之 间 是 样 本 不 相 关 , 而 非( 总 体 ) 不 相 关 ; 样 本 典 型 变 量 的 样 本 方 差 为 1, 而非 ( 总 体 ) 方 差 为 1。 v 例 10.3.1 某 康 复 俱 乐 部 对 20名 中 年 人 测 量 了 三 个 生理 指 标 : 体 重 (x1)、 腰 围 (x2)、 脉 搏 (x3)和 三 个 训 练 指标 : 引 体 向 上 (y1)、 起 坐 次 数 (y2)、 跳 跃 次 数 (y3)。 其数 据 列 于 表 10.3.1。表 10.3.1 某 康 复 俱 乐 部 的 生 理 指 标 和 训 练 指 标 数 据编 号 x1 x2 x3 y1 y2 y31 191 36 50 5 162 602 189 37 52 2 110 603 193 38 58 12 101 1014 162 35 62 12 105 375 189 35 46 13 155 586 182 36 56 4 101 42 7 211 38 56 8 101 38 8 167 34 60 6 125 409 176 31 74 15 200 4010 154 33 56 17 251 25011 169 34 50 17 120 3812 166 33 52 13 210 11513 154 34 64 14 215 10514 247 46 50 1 50 5015 193 36 46 6 70 3116 202 37 62 12 210 12017 176 37 54 4 60 2518 157 32 52 11 230 8019 156 33 54 15 225 73 20 138 33 68 2 110 43 v 的 特 征 值 分 别 为 0.6630、 0.0402和 0.0053, 于 是 r 1=0.797, r2=0.201, r3=0.073相 应 的 样 本 典 型 变 量 系 数 为11 2212 21 1 1 0.870 1 , 0.696 10.366 0.353 1 0.496 0.669 10.390 0.493 0.226 0.552 0.646 0.1920.151 0.225 0.035 R RR R1 111 12 22 21 R R R R 因 此 , 第 一 对 样 本 典 型 变 量 为 如 果 需 要 , 第 二 对 样 本 典 型 变 量 为* * *1 2 3* * *1 2 30.775 1.884 0.191 1.579 , 1.181 , 0.5060.059 0.231 1.0510.350 0.376 1.297 1.054 , 0.124 , 1.2370.716 1.062 0.419 a a ab b b* * * *1 1 2 3* * * *1 1 2 30.775 1.579 0.0590.350 1.054 0.716u x x xv y y y * * * *2 1 2 3* * * *2 1 2 31.884 1.181 0.2310.376 0.124 1.062u x x xv y y y v 例 10.3.2 在 研 究 组 织 结 构 对 “职 业 满 意 度 ”的 影 响 时 , 作 为 其中 一 部 分 , 邓 讷 姆 (Dunham)调 查 了 职 业 满 意 度 与 职 业 特 性 相关 的 程 度 。 对 从 一 大 型 零 售 公 司 各 分 公 司 挑 出 的 n=784个 行政 人 员 , 测 量 了 p=5个 职 业 特 性 变 量 : 用 户 反 馈 (x1)、 任 务 重要 性 (x2)、 任 务 多 样 性 (x3)、 任 务 特 性 (x4)及 自 主 权 (x5)和 q=7个 职 业 满 意 度 量 : 主 管 满 意 度 (y1)、 事 业 前 景 满 意 度 (y2)、 财政 满 意 度 (y3)、 工 作 强 度 满 意 度 (y4)、 公 司 地 位 满 意 度 (y5)、工 种 满 意 度 (y6)及 总 体 满 意 度 (y7)。 对 784个 被 测 者 的 样 本 相关 矩 阵 为v 11 1.000.49 1.00 0.53 0.57 1.000.49 0.46 0.48 1.000.51 0.53 0.57 0.57 1.00 R 样 本 典 型 相 关 系 数 和 样 本 典 型 变 量 系 数 列 于 表 10.3.2中 。2212 21 1.000.43 1.000.27 0.33 1.00 0.24 0.26 0.25 1.000.34 0.54 0.46 0.28 1.000.37 0.32 0.29 0.30 0.35 1.000.40 0.58 0.45 0.27 0.59 0.31 1.000.33 0.32 0.20 0.19 0.30 0.37 0.210.30 0.21 0.16 0.08 0.27 0. RR R 35 0.200.31 0.23 0.14 0.07 0.24 0.37 0.180.24 0.22 0.12 0.19 0.21 0.29 0.160.38 0.32 0.17 0.23 0.32 0.36 0.27 表 10.3.2 典 型 相 关 系 数 和 典 型 变 量 系 数标 准 化 变 量x1* 0.42 0.34 0.86 0.79 0.03x2* 0.20 0.67 0.44 0.27 0.98x3* 0.17 0.85 0.26 0.47 0.91x4* 0.02 0.36 0.42 1.04 0.52x5* 0.46 0.73 0.98 0.17 0.44r j 0.55 0.24 0.12 0.07 0.06标 准 化 变 量y1* 0.43 0.09 0.49 0.13 0.48y2* 0.21 0.44 0.78 0.34 0.75y3* 0.04 0.09 0.48 0.61 0.35y4* 0.02 0.93 0.01 0.40 0.31y5* 0.29 0.10 0.28 0.45 0.70y 6* 0.52 0.55 0.41 0.69 0.18y7* 0.11 0.03 0.93 0.27 0.01 *1a *2a *3a *4a *5a*1b *2b *3b *4b *5b 第 一 对 样 本 典 型 变 量 为 根 据 典 型 系 数 , u1*主 要 代 表 了 用 户 反 馈 和 自 主 权 这两 个 变 量 , 三 个 任 务 变 量 显 得 并 不 重 要 ; 而 v1*主 要代 表 了 主 管 满 意 度 和 工 种 满 意 度 变 量 , 其 次 代 表 了事 业 前 景 满 意 度 和 公 司 地 位 满 意 度 变 量 。 我 们 也 可从 相 关 系 数 的 角 度 来 解 释 典 型 变 量 , 原 始 变 量 与 第一 对 典 型 变 量 间 的 样 本 相 关 系 数 列 于 表 10.3.3中 。* * * * * *1 1 2 3 4 5* * * * * * * *1 1 2 3 4 5 6 70.42 0.20 0.17 0.02 0.460.43 0.21 0.04 0.02 0.29 0.52 0.11u x x x x xv y y y y y y y v 所 有 五 个 职 业 特 性 变 量 与 第 一 典 型 变 量 u1*有 大 致 相 同 的 相 关系 数 , 故 u1*可 以 解 释 为 职 业 特 性 变 量 , 这 与 基 于 典 型 系 数 的解 释 不 同 。 v1*主 要 代 表 了 主 管 满 意 度 、 事 业 前 景 满 意 度 、 公司 地 位 满 意 度 和 工 种 满 意 度 , v1*可 以 解 释 为 职 业 满 意 度 公司 地 位 变 量 , 这 与 基 于 典 型 系 数 的 解 释 基 本 相 一 致 。 第 一 对典 型 变 量 u1*与 v1*的 样 本 相 关 系 数 r1=0.55, 可 见 , 职 业 特 性 与职 业 满 意 度 之 间 有 一 定 程 度 的 相 关 性 。表 10.3.3 原 始 变 量 与 典 型 变 量 的 样 本 相 关 系 数原 始 变 量 样 本 典 型 变 量 原 始 变 量 样 本 典 型 变 量x u1* v1* y u1* v1*x1: 用 户 反 馈 0.83 0.46 y1: 主 管 满 意 度 0.42 0.76x2: 任 务 重 要 性 0.73 0.40 y2: 事 业 前 景 满 意 度 0.36 0.64x3: 任 务 多 样 性 0.75 0.42 y3: 财 政 满 意 度 0.21 0.39x4: 任 务 特 性 0.62 0.34 y4: 工 作 强 度 满 意 度 0.21 0.38x5: 自 主 权 0.86 0.48 y5: 公 司 地 位 满 意 度 0.36 0.65y6: 工 种 满 意 度 0.45 0.80y7: 总 体 满 意 度 0.28 0.50 10.4 典 型 相 关 系 数 的 显 著 性 检 验v 一 、 全 部 总 体 典 型 相 关 系 数 均 为 零 的 检 验v 二 、 部 分 总 体 典 型 相 关 系 数 为 零 的 检 验 一 、 全 部 总 体 典 型 相 关 系 数 均 为 零 的 检 验v 设 。 又 设 S为 样 本 协 差 阵 , 且 np+q。v 考 虑 假 设 检 验 问 题 : H0: 1=2= =m=0 H1: 1,2, ,m至 少 有 一 个 不 为 零其 中 m=minp,q。 若 检 验 接 受 H0, 则 认 为 讨 论 两 组 变 量 之 间的 相 关 性 没 有 意 义 ; 若 检 验 拒 绝 H0, 则 认 为 第 一 对 典 型 变 量是 显 著 的 。 (10.4.1)式 实 际 上 等 价 于 假 设 检 验 问 题H 0: 12=0, H1: 120H0成 立 表 明 x与 y互 不 相 关 。 , , 0p qN x y (10.4.1) 似 然 比 检 验 统 计 量 为对 于 充 分 大 的 n, 当 H0成 立 时 , 统 计 量在 给 定 的 下 , 若 , 则 拒 绝 H0, 认 为 典型 变 量 u1与 v1之 间 的 相 关 性 是 显 著 的 ; 否 则 , 就 认为 第 一 个 典 型 相 关 系 数 不 显 著 。 21 1 1m ii r 21 11 3 ln2Q n p q pq 21Q pq v 例 10.4.1 在 例 10.3.1中 , 假 设 为 多 元 正 态 数 据 , 欲检 验 : H0: 1=2=3=0, H1: 10它 的 似 然 比 统 计 量 为查 2分 布 表 得 , ,因 此 在 =0.10的 显 著 性 水 平 下 , 拒 绝 原 假 设 H 0, 也即 认 为 至 少 有 一 个 典 型 相 关 是 显 著 的 。 2 2 21 1 2 31 11 1 11 0.6330 1 0.0402 1 0.0053 0.3504120 3 3 3 ln 15.5 ln0.3504 16.2552r r rQ 2 20.10 0.059 14.684 9 16.919 , 二 、 部 分 总 体 典 型 相 关 系 数 为 零 的 检 验v 若 H0: 1=2= =m=0经 检 验 被 拒 绝 , 则 应 进 一 步 检 验 假 设 H0: 2= =m=0 H1: 2, ,m至 少 有 一 个 不 为 零若 原 假 设 H0被 接 受 , 则 认 为 只 有 第 一 对 典 型 变 量 是 有 用 的 ;若 原 假 设 H0被 拒 绝 , 则 认 为 第 二 对 典 型 变 量 也 是 有 用 的 。v 如 此 进 行 下 去 , 直 至 对 某 个 k, 假 设 H0: k+1= =m=0被 接 受, 这 时 可 认 为 只 有 前 k对 典 型 变 量 是 显 著 的 。v 对 于 假 设 检 验 问 题 H 0: k+1= =m=0 H1: k+1, ,m至 少 有 一 个 不 为 零 其 检 验 统 计 量 为对 于 充 分 大 的 n, 当 H0为 真 时 , 统 计 量近 似 服 从 2 (pk)(qk) 。 给 定 , 若 , 则 拒 绝 H0, 认 为 k+1是 显 著 的 , 即 第 k+1对 典 型 变 量 显 著 相关 。v 以 上 的 一 系 列 检 验 实 际 上 是 一 个 序 贯 检 验 , 检 验 直 到 对 某 个k值 H 0未 被 拒 绝 为 止 。 事 实 上 , 检 验 的 总 显 著 性 水 平 已 不 是 了 , 且 难 以 确 定 。 还 有 , 检 验 的 结 果 易 受 样 本 容 量 大 小 的 影响 。 因 此 , 检 验 的 结 果 只 宜 作 为 确 定 典 型 变 量 个 数 的 重 要 参考 依 据 , 而 不 宜 作 为 惟 一 的 依 据 。 通 常 选 择 尽 可 能 小 的 k。 2+1 1 1mk ii k r 21 111 3 ln2 kk i kiQ n k p q r 21kQ p k q k v 例 10.4.2 在 例 10.3.1中 , 欲 进 一 步 检 验 :H0: 2=3=0, H1: 20检 验 统 计 量 为故 接 受 H0, 即 认 为 第 二 个 典 型 相 关 是 不 显 著 的 。 因此 , 只 有 一 个 典 型 相 关 是 显 著 的 。 2 22 2 3 22 1 2 20.101 1 1 0.0402 1 0.0053 0.9547120 1 3 3 3 ln216.08 ln0.9547 0.745 7.779 4r rQ r
展开阅读全文