讲相关与回归分析

上传人:san****019 文档编号:22696191 上传时间:2021-05-30 格式:PPT 页数:118 大小:1.11MB
返回 下载 相关 举报
讲相关与回归分析_第1页
第1页 / 共118页
讲相关与回归分析_第2页
第2页 / 共118页
讲相关与回归分析_第3页
第3页 / 共118页
点击查看更多>>
资源描述
复 习 检 验 、 检 验 ; 检 验 ; 秩 和 检 验 ; 直 线 回 归 与 相 关 ;ut2 连 续 性 变 量 与 分 类 变 量分 类 变 量双 变 量 可 以 是 连 续 性 变 量 , 但 实际 上 处 理 的 是 再 生 的 等 级 变 量双 变 量 可 以 是 连 续 性 变 量 圆 的 周 长 公 式 R=2r圆 的 面 积 公 式 S=r2一 一 对 应 , 非 常 明 确 确 定性 关 系 身 高 体 重165cm 60kg50kg65kgIm 10kg?!既 是 必 然 的 又 是 不 确 定 的 关 系 称为 相 关 关 系 (correlation) 确 定性 关系 非 确定 性关 系 医 学 上 , 许 多 现 象 之 间 也 都 有 相 互 联 系 , 其表 现 形 式 多 样 , 关 系 有 疏 密 程 度 的 不 同 , 相互 间 可 能 有 因 果 关 系 , 也 可 能 有 伴 随 关 系 。 密 切 程 度 : 体 温 与 脉 搏 身 高 与 体 重 产 前 检 查与 婴 儿 体 重 因 果 关 系 : 乙 肝 病 毒 乙 肝 伴 随 关 系 : 丈 夫 的 身 高 和 妻 子 的 身 高相 关 与 回 归 就 是 用 于 研 究 和 解 释 两 个 变 量 之 间相 互 关 系 的 。 研 究 方 法 相 关 分 析 : 反 应 变 量 间 的 密 切 程 度 与 变 化趋 势 回 归 分 析 : 变 量 间 数 量 上 的 依 存 关 系 回 归 分 析 分 类 按 变 量 间 的 关 系 可 分 为 : 直 线 回 归 和 曲 线回 归 。 按 研 究 变 量 的 数 量 可 分 为 : 一 元 回 归 与 多元 回 归 。 相 关 分 析 分 类 按 变 量 间 的 关 系 : 线 性 相 关 与 曲 线 相 关 按 资 料 的 分 布 分 析 方 法 : Pearson相 关 与 等级 相 关 第 一 节 直 线 回 归是 用 于 研 究 两 个 连 续 性 变 量x与 y之 间 的 线 性 依 存 关 系 的 一 种 统 计分 析 方 法 。 回 归 F.Galton 33.73 0.516Y X 75706560 75 70 65 60 height of father he igh t o f s on :一 . 直 线 回 归 方 程 及 其 计 算 SAH患 者 第 一 天 血 清 和 脑 脊 液IL-6(pg/ml)检 测 结 果 患 者 号 1 2 3 4 5 6 7 8 9 10血 清IL-6(x) 22.4 51.6 58.1 25.1 65.9 79.7 75.3 32.4 96.4 85.7脑 脊 液IL-6(y) 134.0 167.0 132.3 80.2 100.0 139.1 187.2 97.2 192.3 199.4 血 清 IL-6 (pg/ml) 10080604020脑脊液IL-6 (pg/ml) 220200180160140120 1008060Y X X Y 称 为 自 变 量 。( independent variable)称 为 因 变 量 。 ( dependent variable)可 以 精 确 测量 或 严 格 控制 依 赖 性 XY P119, P121 通 式 : y =a+bx 自 变 量因 变 量直 线 在 y轴 上 的 截 距 直 线 的 斜 率a0表 示 直 线 与 纵 轴 的 交 点 在 原 点 上 方a0, Y随 X的 增 大 而 增 大 ( 减 少 而 减 少 ) 斜 上 ; b0: X每 增 加 ( 减 少 ) 一 个 观 测 单 位 , 增 加 ( 减 少 )b个 单 位 。b0 b0 b=0 :y 表 示 给 定 X时 Y的 平 均 值 的 估 计 值 。其 涵 义 是 均 数 不 同 X时 Y均 数 的 估 计 值 ,与 一 般 的 均 数 的 计 算 方 法 不 同 , 这 里 的 均 数 是给 定 X的 条 件 下 , 由 回 归 方 程 估 计 得 到 的 , 故又 称 条 件 均 数 (conditional mean)。Y n Y n 即 Y估 计 值 之 均 数 等 于 Y观 察 值 之 总 平 均 。 且当 自 变 量 时 , Y的 估 计 值 等 于 。 X X Y P121 回 归 方 程 参 数 的 计 算 最小二乘法原则(least square method): 使 各 散 点 到直 线 的 纵 向 距 离 的 平 方 和 最 小 。 即 使 最 小 。Y Y 残 差 : 点 到 直 线 的 纵 向 距 离 2 22xyxx x yxyx x y yl nb l xx x x n a y b x P120 xy 1797.19610.72 2( )Y Y 例 10.1 某 医 院 测 量 了 10名 3岁 男 童 体 重 (X,kg)与 体 表 面 积 (Y,103cm2), 数 据 见 表 10.1, 试作 回 归 分 析 。 实 例 表 10.1 男 童 体 重 (X,kg)与 体 表 面 积 (Y,103cm2) 编 号 X(1) Y(2) X2(3) Y2(4) XY(5)1 11.0 5.283 121.00 27.91009 58.113002 11.8 5.299 139.24 28.07940 62.528203 12.0 5.358 144.00 28.70816 64.296004 12.3 5.292 151.29 28.00526 65.091605 13.1 5.602 171.61 31.38241 73.386216 13.7 6.014 187.69 36.16820 82.391807 14.4 5.830 207.36 33.98890 83.952008 14.9 6.102 222.01 37.23441 90.91980 9 15.2 6.075 231.04 36.90562 92.3400010 16.0 6.411 256.00 41.10092 102.57600 合 计 134.4 57.266 1831.24 329.48337 775.59461 (1) 画 散 点 图 , 判 断 是 否 有 线 性 趋 势 。 按 (X,Y)实 测值 在 直 角 坐 标 图 上 画 出 10个 点 , 见 图 10.2。 由 散 点图 判 断 , 两 变 量 间 有 线 性 趋 势 , 可 以 作 直 线 回 归 分析 。 11 12 13 14 15 165.05.56.06.5 (2) 求 直 线 回 归 方 程 。 在 例 10.1中 已 算 得 X和 Y的 均 数 、 离 均差 平 方 和 与 离 均 差 积 和 lXX, lXY, lYY。 =13.44, =5.7266, lXX=24.9040, lYY=1.5439,lXY=5.9396 按 公 式 (11.2), (11.3)得 回 归 系 数 和 截 距 分 别为 : (103cm2/kg) a=5.7266-13.440.2385=2.5212(103cm2) 由 此 , 可 列 出 直 线 回 归 方 程 :X Y 2385.09040.249396.5 b XY 2385.05212.2 二 . 回 归 直 线 根 据 求 得 的 回 归 方 程 , 可 以 在 自 变 量 X的 实 测 范 围 内 任 取 两 个 值 , 代 入 方 程 中 ,求 得 相 应 的 两 个 Y值 , 以 这 两 对 数 据 找 出 对应 的 两 个 坐 标 点 , 将 两 点 连 接 为 一 条 直 线 ,就 是 该 方 程 的 回 归 直 线 。 回 归 直 线 一 定 经 过 ( 0, a ) ,( ) 。 这 两 点 可 以 用 来 核 对 图 线 绘 制是 否 正 确 。 ,X Y (3) 绘 制 回 归 直 线 。 在 自 变 量 X的 实 测 范 围 内 任取 相 距 较 远 且 易 读 数 的 两 X值 , 代 入 直 线 回 归 方程 求 得 两 点 (X1, ), (X2, ), 过 这 两 点 作 直 线 即为 所 求 回 归 直 线 。 本 例 取 X1=12, 得 =5.3832; 取 X2=15, 得 =6.0987。 2Y 1Y 2Y1Y x=12,y=5.3832 x=15 ,y=6.0987 ( 0, a ) ( ),X Y XY 2385.05212.2 与 其 它 假 设 检 验 一 样 , 直 线 回 归 方 程 也 是 从 样 本资 料 计 算 而 得 的 , 同 样 也 存 在 着 抽 样 误 差 问 题 。所 以 , 需 要 对 样 本 的 回 归 系 数 b进 行 假 设 检 验 ,以 判 断 b是 否 从 回 归 系 数 为 零 的 总 体 中 抽 得 。 为了 判 断 抽 样 误 差 的 影 响 , 需 对 回 归 系 数 进 行 假 设检 验 。 总 体 的 回 归 系 数 一 般 用 表 示 。 三 .回 归 系 数 的 假 设 检 验 b0原 因 : 由 于 抽 样 误 差 引 起 , 总 体 回 归 系 数 =0 存 在 回 归 关 系 , 总 体 回 归 系 数 0 22yx y ys n 0 , 2b b bb bt ns s yxb xxss l 22 yx y ys n Sb为 回 归 系 数 的 标 准 误 SYX为 Y的 剩 余 标 准 差 各 观 察值 Y到 回 归 直 线 的 距 离 的 标 准 差 ,表 示 扣 除 X的 影 响 后 Y的 变 异 程 度 。 H0: 总 体 回 归 系 数 0;H1: 总 体 回 归 系 数 0。 2 2 2 2 0.127308X X Y YY Y Y Y X X 2. 0.127308 0.12622 10 20.2385 9.435/ 0.1262/ 24.904YXb Y X XXY YS nbt S l =n-2=8查 表 得 0.05/2,8 2.3060t 0.05/2,8, ,bt t 则 P0.05故 按 =0.05的 水 准 拒 绝 H0, 接 受 H1, 可 以 认 为 认 为 体 重 与 体 表面 积 之 间 有 回 归 关 系 。 应 变 量 变 异 的 分 解 Y Y Y Y Y Y ( )Y Y 回 归 部 分( )Y Y总 情 况 ( )Y Y 剩 余 部 分( , )P X Y 实 测 点Y XY Y 2 2 2 ( ) ( ) ( ) , 2 ( )( ) 0,: ( ) ( ) ( )Y Y Y Y Y Y Y Y Y YY Y Y Y Y YSS SS SS 回总 剩 回总 剩等 式 两 边 平 方 后 再 求 和 因 为所 以 有即同 样 有 : yySS l总 2 2/xy xy xx xxSS bl l l b l 回 2( )2 2YX SSY YS MSn n 剩 剩 1 21,/ ,/ 2SS MSF SS MS n 回 回 回 回 剩剩 剩 剩统 计 量 F服 从 自 由 度 为 的 F分 布 。, 回 剩 例 : 检 验 体 重 与 体 表 面 积 间 无 直 线 回 归 关 系 是 否成 立 ? 0.05 计 算 检 验 统 计 量 F:注 意 : 两 种 检 验 是 完 全 等 价 的 , 即 6.9084 2.6284t F H0: 体 重 与 体 表 面 积 间 无 直 线 回 归 关 系 ;H1: 体 重 与 体 表 面 积 间 有 直 线 回 归 关 系 。变 异 来 源 SS MS F回 归 1.4166 1 1.4166 89.01剩 余 0.1273 8 0.0159总 变 异 1.5439 9 0.1715 得 F=89.01, 今 1=1, 2=8, 查 附 表 4, F界值 表 , 得 P0r =1r 0r = -1r = 0 yyxxxy lllr X和 Y的 离 差 积 和X的 离 差 平 方 和 Y的 离 差 平 方 和(x-x)(y-y)(x-x)2 (y- y)2 二 .相 关 系 数 的 计 算 例 10.1 某 医 院 测 量 了 10名 3岁 男 童 体 重 (X,kg)与 体 表 面 积 (Y,103cm2), 数 据 见 表 10.1, 试作 相 关 分 析 。 实 例 表 10.1 男 童 体 重 (X,kg)与 体 表 面 积 (Y,103cm2) 编 号 X(1) Y(2) X2(3) Y2(4) XY(5)1 11.0 5.283 121.00 27.91009 58.113002 11.8 5.299 139.24 28.07940 62.528203 12.0 5.358 144.00 28.70816 64.296004 12.3 5.292 151.29 28.00526 65.091605 13.1 5.602 171.61 31.38241 73.386216 13.7 6.014 187.69 36.16820 82.391807 14.4 5.830 207.36 33.98890 83.952008 14.9 6.102 222.01 37.23441 90.91980 9 15.2 6.075 231.04 36.90562 92.3400010 16.0 6.411 256.00 41.10092 102.57600 合 计 134.4 57.266 1831.24 329.48337 775.59461 (1) 画 散 点 图 , 判 断 是 否 有 线 性 趋 势 。 按 (X,Y)实 测值 在 直 角 坐 标 图 上 画 出 10个 点 , 见 图 10.2。 由 散 点图 判 断 , 两 变 量 间 有 线 性 趋 势 , 且 为 正 相 关 。 可 以作 相 关 分 析 。 。 11 12 13 14 15 165.05.56.06.5 lxy= (x-x)(y-y)=5.9396lxx= (x-x)2=24.9040lyy= (y-y)2=1.5439 1.相 关 程 度 是 0.95792.相 关 方 向 是 正 相 关 三 .相 关 系 数 的 假 设 检 验对 相 关 系 数 的 假 设 检 验 , 常 用 t检 验 , 选 用统 计 量 t的 计 算 公 式 如 下 : 220 211 2r rr r nt rS rrn =n-2 Sr- 相 关 系 数 的 标 准 误 解 : ( 1) 建 立 检 验 假 设 , 确 定 检 验 水 准 H0:=0H1:0 查 t 0.05, 8=2.306,P(0.05,12), P0.05。 计 算 法 : 时当 50n 时 ,当 50n )2/()1( 02 nrrt ss ,自 由 度 n-sr 2 2413 78 78/12 0.6894650 78 /12 637 78 /12sr 确 定 P值 并 作 出 统 计 推 断 本 例 , n 12, 查 rS界 值 表 , 得 P0.05, 按 0.05水 准 拒 绝 H0 , 接 受 H 1 , 可 认 为抗 白 指 数 与 临 床 疗 效 间 存 在 等 级 相 关 关 系 。 注 意 事 项两 个 变 量 之 间 相 关 关 系 具 有 统 计 学 意 义 , 只能 从 统 计 学 上 反 映 出 它 们 之 间 的 变 化 存 在 某种 规 律 性 , 不 能 直 接 把 这 种 相 关 性 解 释 为 因果 关 系 。当 观 察 例 数 较 少 ( 如 n15) 时 , 相 关 系 数 容易 受 个 别 观 察 对 象 的 特 殊 值 影 响 。 因 此 须 事先 作 好 试 验 设 计 , 正 确 确 定 样 本 含 量 。 应 区 别 相 关 强 度 与 相 关 有 统 计 学 意 义 相 关 具 有 统 计 学 意 义 指 该 样 本 相 关 系 数 r来 自相 关 系 数 =0的 总 体 的 概 率 很 小 。 而 相 关 强 度表 示 两 变 量 间 相 互 联 系 的 密 切 程 度 。注 : 当 遇 到 两 变 量 之 间 的 相 关 系 数 具 有 统 计 学 意义 但 r值 不 大 时 , 下 结 论 要 特 别 慎 重 。 如 : r =0.20, n=100 定 性 资 料 的 相 关 定 性 指 标 间 的 相 关 程 度 和 方 向 常 用 列 联 系 数(contingency coefficient)来 表 示 四 格 表 资 料 的 相 关 分 析 列 联 系 数 rn来 描 述 两 个 分 类 变 量 间 的 密切 程 度 和 相 关 方 向 , 其 意 义 类 似 于 直 线 相关 系 数 r。 列 联 系 数 rn在 -1 +1之 间 , 其 正 负 表 示相 关 方 向 , 且 绝 对 值 越 大 , 相 关 越 密 切 ;r n=0时 , 表 示 无 相 关 。 )()()( dbcadcba bcadrn 例 10.4 某 中 医 师 采 用 两 种 方 法 观 察 舌 象200例 , 观 察 结 果 如 表 10.4, 试 分 析 两 种 观察 方 法 的 结 果 间 有 无 联 系 ? 表 10.4 两 种 方 法 观 察 舌 象 的 结 果 比 较 乙 法 甲 法 合 计+ + 84 (a) 16 (b) 100 (a+b) 20 (c ) 80 (d) 100 (c+d)合 计 104 (a+c) 96 (b+d) 200 (n) 计 算 列 联 系 数 6405.096104100100 20168084 nr 行 列 表 资 料 的 相 关 分 析 表 示 行 列 表 资 料 的 相 关 关 系 的 列 联 系 数 种类 很 多 , 其 中 Cramr修 正 列 联 系 数 V较 适合 于 描 述 定 性 资 料 的 相 关 , 其 公 式 为 : 行 列 表 资 料 的 相 关 分 析 式 中 2为 行 列 表 的 2值 , n为 样 本 含 量 , min(R-1,C-1)表 示 取 (行 数 -1)或 (列 数 -1)中 的 最 小 值 , 与 r及 rn不 同 , V的取 值 范 围 在 01之 间 , 0表 示 无 关 ; 越 接 近 于 1表 示 关 系 越密 切 ; 1表 示 完 全 相 关 。 注 意 , V只 表 示 两 指 标 间 的 相 关 程度 , 并 不 表 示 相 关 方 向 。 2min( 1, 1)V n R C 例 10.5 某 人 按 两 种 血 型 系 统 统 计 某 地 6094人的 血 型 分 布 , 结 果 见 表 10.5, 问 两 种 血 型 的分 布 间 有 无 关 系 ? 表 10.5 某 地 6094人 按 两 种 血 型 系 统 划 分 结 果 ABO MN血 型 合 计血 型 M N MNO 431 490 902 1823A 388 410 800 1598B 495 587 950 2032AB 137 179 325 641合 计 1451 1666 2977 6094 计 算 列 联 系 数 从 列 联 系 数 来 看 , 两 种 血 型 分 类 系 统 的 列联 系 数 很 小 , 无 相 关 关 系 。 8.5952 0.02666094 min(4 1,3 1)V 列 联 相 关 系 数 的 假 设 检 验 列 联 系 数 是 否 为 0的 假 设 检 验 与 构 成 比 是 否相 同 的 假 设 检 验 相 同 , 即 是 可 用 2检 验 代替 相 应 的 相 关 检 验 。
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!