资源描述
第 六 章 概 率 分 布 第 6章 章 节 内 容6.1 概 率 的 基 本 概 念6.2 正 态 分 布6.3 二 项 分 布6.4 样 本 分 布 6.1 概 率 的 基 本 概 念在 个 别 试 验 中 其 结 果 呈 现 出 不 确 定 性 , 在 大量 重 复 试 验 中 其 结 果 又 具 有 统 计 规 律 性 的 现象 , 称 为 。 例 如 掷 硬 币 、 抛 骰 子 等概 率 论 与 数 理 统 计 是 研 究 和 揭 示 随 机 现 象 统计 规 律 性 的 一 门 数 学 学 科 。 6.1.1 什 么 是 概 率 nmAW )(随 机 事 件 的 当 n无 限 增 大 时 , 随 机 事 件 A的 频 率 会稳 定 在 一 个 常 数 P, 这 个 常 数 就 是 随 机 事 件A的 。 nmLimAP n )( ( 一 ) 后 验 概 率 ( 或 统 计 概 率 ) ( 6.1)( 6.2) 观 察 随 机 事 件 A出 现 的 次 数 的 方 式 来决 定 A的 概 率 , 称 为 后 验 概 率 。 ( 二 ) 先 验 概 率 ( 古 典 概 率 )古 典 概 率 模 型 要 求 满 足 两 个 条 件 : 试 验 的 所 有 可 能 结 果 ( 或 基 本 事 件 ) 是 有 限 的 ; 每 一 种 基 本 事 件 出 现 的 可 能 性 相 等 。 nmAP )(n为 基 本 事 件 的 总 数 ;m为 事 件 A包 含 的 基 本 事 件 的 数 目 。( 6.3) 在 事 件 A发 生 之 前 , 可 以 通 过 计 算 确 定的 概 率 , 称 为 。 Dewey.G统 计 了 约 438023个 字 母 , 得 到 的英 语 中 特 定 字 母 的 频 率字 母 频 率 字 母 频 率 字 母 频 率E 0.1268 L 0.0394 P 0.0186T 0.0978 D 0.0389 B 0.0156A 0.0788 U 0.028 V 0.0102O 0.0776 C 0.0268 K 0.006I 0.0707 F 0.0256 X 0.0016N 0.0706 M 0.0244 J 0.001S 0.0634 W 0.0214 Q 0.0009R 0.0594 Y 0.0202 Z 0.0006H 0.0573 G 0.0187 历 史 上 的 投 掷 硬 币 试 验 实 验 者 投 掷次 数 正 面 向 上的 次 数 频 率德 摩 根 2048 1061 0.5181蒲 丰 4040 2048 0.5069K.皮 尔 逊 12000 6019 0.5016K.皮 尔 逊 24000 12012 0.5005 投 掷 硬 币 的 概 率 是 后 验 概 率 与 先验 概 率 ? 6.1.2 概 率 的 基 本 性 质1 的 概 率 都 是 在 0与 1之间 的 正 数 , 即 : 0 P(A)12 的 概 率 等 于 零 , 即 : P(A)= 0 3 的 概 率 等 于 1, 即 : P(A)= 1 ( 一 ) 概 率 的 公 理 系 统 ( 二 ) 概 率 的 加 法 定 理 若 事 件 发 生 , 则 事 件 就 一 定 不发 生 , 这 样 的 两 个 事 件 为 。 两 互 不 相 容 事 件 和 的 概 率 , 等 于 这两 个 事 件 概 率 之 和 , 即 : )()()( BPAPBAP )()()()( 2121 nn APAPAPAAAP (6.4a) (6.4b) ( 三 ) 概 率 的 乘 法 定 理 若 事 件 发 生 不 影 响 事 件 是 否 发 生 ,这 样 的 两 个 事 件 为 。 两 个 互 相 独 立 事 件 同 时 出 现 的 概 率 , 等于 这 两 个 事 件 概 率 的 乘 积 , 即 )()()( BPAPABP )()()()( 2121 nn APAPAPAAAP (6.5a) (6.5b) 例 : 某 一 学 生 从 个 试 题 中 任 意 抽 取 一 题 ,进 行 口 试 。 如 果 抽 到 每 一 题 的 概 率 为 1 5,则 抽 到 试 题 或 试 题 的 概 率 是 多 少 ? 如果 前 一 个 学 生 把 抽 过 的 试 题 还 回 后 , 后 一个 学 生 再 抽 , 则 个 学 生 都 抽 到 试 题 1的 概率 是 多 少 ? 该 学 生 抽 到 试 题 1或 者 试 题 2为 不 相容 事 件 : 525151)()()( BPAPBAP四 个 学 生 均 抽 到 试 题 1为 独 立 事 件 : 6251515151514321 AAAAP 例 : 一 个 口 袋 装 有 6只 球 , 其 中 4只 白 球 、 2只 红 球 , 从 袋 中 取 球 两 次 。考 虑 两 次 取 球 方 式 ( a) 放 回 抽 样 , 第 一 次取 一 只 球 , 观 察 其 颜 色 后 放 回 , 搅 匀 后 再 取一 球 。 ( b) 不 放 回 抽 样 , 第 一 次 取 一 球 不放 回 袋 中 , 第 二 次 从 剩 余 的 球 中 再 取 一 球 。请 问 这 两 种 情 况 下 取 到 一 只 白 球 和 一 只 红 球的 概 率 。 放 回 取 样第 一 次 取 到 白 球 , 第 二 次 取 到 红 球 : 926264)()()( BPAPABP第 一 次 取 到 红 球 , 第 二 次 取 到 白 球 : 926462)()()( , BPAPBAP取 到 一 只 白 球 和 一 只 红 球 的 概 率 : 949292)()( , BAPABPP 不 放 回 取 样 第 一 次 取 到 白 球 , 第 二 次 取 到 红 球 : 1545264)()()( BPAPABP第 一 次 取 到 红 球 , 第 二 次 取 到 白 球 : 1545462)()()( , BPAPBAP取 到 一 只 白 球 和 一 只 红 球 的 概 率 : 158154154)()( , BAPABPP 问 题 : 小 明 的 班 上 有 83名 同 学 , 至 少 有一 位 同 学 与 小 明 的 生 日 相 同 的 概 率 ?( 一 年 按 365天 计 算 )82名 同 学 与 小 明 的 生 日 均 不 相 同 的 概 率 为 : 7985.0)365364( 82 不 同P至 少 一 位 同 学 与 小 明 的 生 日 相 同 的 概 率 为 :2015.07985.0-11 不 同同 PP n nP 365 1-365364365 )(不 同 83365 138-365364365 )( 00004.0 99996.0-1 不 同同 PPn 20 23 30 40 50 64 100p 0.411 0.507 0.706 0.891 0.97 0.997 1 问 题 : 83人 的 班 上 , 至 少 两 人 生 日 相 同的 概 率 为 多 少 ? 0 1000 2000 30000 0.2 0.4 0.6 0.8 1 0 50 100 150 2000 0.2 0.4 0.6 0.8 1 “与 小 明 生 日 相 同的 概 率 ” 与 “ 班 级人 数 ” 的 关 系 “至 少 两 人 生 日 相同 的 概 率 ” 与 “ 班级 人 数 ” 的 关 系人 数概率 人 数概率 小 明 的 小 组 有 6人 , ( 1) 有 人 与 小 明 出 生 月份 相 同 的 概 率 为 多 少 ? ( 2) 至 少 2人 出 生 月份 相 同 的 概 率 为 多 少 ? 3528.0) 1211(-11 5 不 同同 PP 9606.012 )1612(1112-11 6 不 同同 PP ( 1)( 2) 6.1.3 概 率 分 布 类 型概 率 分 布 是 指 对 随 机 变 量 取 不 同 值 时 的 概 率 的描 述 , 一 般 用 概 率 分 布 函 数 进 行 描 述 。是 总 体 的 分 布 , 而 是 样 本 的分 布 。给 出 的 是 单 个 结 果 发 生 的 可 能 性 ,是 对 随 机 变 量 所 有 可 能 结 果 的 可 能 性 分 布 描述 , 通 常 可 以 写 成 某 个 函 数 式 形 式 。 分 组 区 间 组 中 值 人 数 频 率 频 率 密 度180 181 1 0.01 0.0033177 178 3 0.04 0.0133174 175 5 0.06 0.0200171 172 3 0.04 0.0133168 169 5 0.06 0.0200165 166 7 0.08 0.0267162 163 15 0.18 0.0600159 160 18 0.22 0.0733156 157 14 0.17 0.0567153 154 9 0.11 0.0367150 151 3 0.04 0.0133学 生 身 高 次 数 分 布 表 次 数 频 率 频 率 密 度 150 159 168 177 150 159 168 177 150 159 168 177 151 160 169 178 151 160 169 178 151 160 169 178 学 生 身 高 次 数 分 布 图 全 国 学 生 身 高 概 率 分 布 图 151 160 169 178 151 160 169 178 概 率 概 率 密 度 概 率 分 布 中 的 曲 线 高 度 一 般 为 概 率 密 度 ,面 积 表 示 概 率 , 横 坐 标 为 样 本 值 ; 有 少 数 情 况 下 , 曲 线 高 度 表 示 概 率 ( 如P179二 项 分 布 ) 。 ( 一 ) 离 散 分 布 与 连 续 分 布依 随 机 变 量 的 类 型 , 可 将 概 率 分 布 分 为 离 散 分布 与 连 续 分 布 。当 随 机 变 量 只 取 孤 立 的 数 值 时 , 这 种 随 机 变 量称 为 离 散 随 机 变 量 , 离 散 随 机 变 量 的 概 率 分 布称 为 离 散 分 布 。连 续 随 机 变 量 的 概 率 分 布 称 为 连 续 分 布 。心 理 与 教 育 统 计 学 中 最 常 用 的 离 散 型 分 布 是, 最 常 用 的 连 续 型 分 布 是 。 ( 二 ) 经 验 分 布 与 理 论 分 布依 分 布 函 数 的 来 源 , 可 将 概 率 分 布 分 为 经 验 分布 与 理 论 分 布 。是 指 根 据 观 察 或 实 验 所 获 得 的 数 据 而编 制 的 次 数 分 布 或 频 率 分 布 。 经 验 分 布 往 往 是总 体 的 一 个 样 本 。有 两 个 含 义 , 一 是 随 机 变 量 概 率 分 布的 函 数 ( 如 ) , 二 是 按 某 种 数 学 模 型计 算 出 的 总 体 的 次 数 分 布 ( 如 ) 。 ( 三 ) 基 本 随 机 变 量 分 布 与 抽 样 分 布依 所 描 述 的 数 据 的 样 本 特 性 , 可 将 概 率 分 布 分为 基 本 随 机 变 量 分 布 与 抽 样 分 布 。是 随 机 变 量 各 种 不 同 取 值 情况 的 概 率 分 布 , 如 二 项 分 布 与 正 态 分 布 。是 从 同 一 总 体 内 抽 取 的 不 同的 概 率 分 布 , 如 平 均 数 分 布 , 方 差 分 布 ,相 关 系 数 分 布 等 。 复 习 )()()( BPAPABP l古 典 概 率 与 统 计 概 率 )()()( BPAPBAP 加 法 原 理 :乘 法 原 理 :l频 率 与 概 率l频 率 分 布 与 概 率 分 布 6.2 正 态 分 布也 称 为 常 态 分 布 , 是 连 续 型 随 机 变量 概 率 分 布 的 一 种 , 是 在 数 理 统 计 的 理 论 与实 际 应 用 中 占 有 最 重 要 地 位 的 一 种 理 论 分 布 。心 理 与 教 育 中 大 量 的 现 象 均 按 正 态 形 式 分 布 ,如 智 力 高 低 、 成 绩 好 坏 、 社 会 态 度 等 。 正 态 分 布 由 于 1733年 发 现 的 。 拉 普拉 斯 、 高 斯 对 正 态 分 布 的 研 究 也 做 出 了 贡 献 ,故 有 时 称 正 态 分 布 为 。 2 2221 Xey是 圆 周 率 3.14159e是 自 然 对 数 的 底 2.71828X为 随 机 变 量 取 值为 理 论 平 均 数 ; 为 理 论 标 准 差 ;y为 概 率 密 度 , 即 正 态 分 布 的 纵 坐 标 。 6.2.1 正 态 分 布 的 特 征1.正 态 分 布 的 形 式 是 对 称 的 , 它 的 对 称 轴 是 经过 平 均 数 的 垂 线 。2.正 态 分 布 的 中 央 点 ( 即 平 均 数 ) 最 高 , 然 后逐 渐 向 两 侧 下 降 , 曲 线 的 形 式 是 先 向 内 弯 ,然 后 向 外 弯 , 拐 点 位 于 正 负 1个 标 准 差 处 , 曲线 两 端 向 X轴 无 限 接 近 。 3. 正 态 曲 线 下 的 总 的 面 积 为 1, 经 过 平 均 数的 垂 线 将 正 态 曲 线 下 的 面 积 划 分 为 相 等 的 两个 部 分 , 各 为 0.5。 dxeA X x 2 2221 (6.8) 4. 正 态 分 布 是 一 族 分 布 。 它 随 随 机 变 量 的 平均 数 、 标 准 差 的 大 小 与 单 位 的 不 同 而 有 不 同的 分 布 形 态 。 标 准 正 态 分 布 的 =0, =1。 标 准 正 态 分布 通 常 写 作 N( 0, 1) 正 态 分 布 。 2221 Zey (6.9) -5 -4 -3 -2 -1 0 1 2 3 4 50 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 -5 -4 -3 -2 -1 0 1 2 3 4 50 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 =2, =1 -5 -4 -3 -2 -1 0 1 2 3 4 50 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 =0, =1=-2, =1 平 均 数 决 定 了 正 态 曲 线 在 横 轴 上 的 位 置 -5 -4 -3 -2 -1 0 1 2 3 4 50 0.5 1 1.5 -5 -4 -3 -2 -1 0 1 2 3 4 50 0.5 1 1.5 -5 -4 -3 -2 -1 0 1 2 3 4 50 0.5 1 1.5 =0, =0.5 =0, =1 =0, =2 标 准 差 大 的 正 态 曲 线 低 阔 , 标 准 差 小 的正 态 曲 线 高 窄 5. 正 态 分 布 中 各 差 异 量 数 值 相 互 间 有 固 定的 比 率 。 P102, P163s=1.2533AD=1.4826Qs 标 准 差 ;AD 平 均 差 ;Q 四 分 位 差 。 6. 正 态 分 布 曲 线 下 , 标 准 差 与 概 率 ( 面 积 )有 一 定 的 数 量 关 系 2 3 3 2%26.68 %44.95 %74.99 6.2.2 正 态 分 布 表 的 编 制 和 使 用 利 用 积 分 公 式 可 求 出 正 态 曲 线 下 任 何 区间 的 面 积 , 但 需 要 计 算 。 统 计 学 家 编 制 了 标准 正 态 分 布 表 , 使 其 使 用 非 常 方 便 。 使 用 正 态 分 布 表 时 , 首 先 应 该 确 定 其 编制 方 法 : 1) 从 Z=- 开 始 。 2) Z=0开 始 。 P概 率Y概 率 密 度Z分 数 正 态 分 布 表 一 般 分 为 三 栏 :1) Z分 数 (X- )/ , 一 般 罗 列 到 3.99。2) 概 率 密 度 (y) 某 一 Z分 数 对 应 的 曲 线 纵坐 标 高 度 。 当 Z=0时 , y=0.39893) 概 率 值 (P) 不 同 Z分 数 点 与 平 均 数 之 间的 曲 线 下 的 面 积 。 ( 二 ) 正 态 分 布 表 的 使 用1.依 据 Z分 数 求 概 率 ( p)( 1) 求 某 Z分 数 值 与 平 均 数 ( Z=0) 之 间 的概 率 。 P概 率Z分 数 ( 2) 求 某 Z分 数 以 上 或 以 下 的 概 率Z分 数 ( 3) 求 两 个 Z分 数 之 间 的 概 率 。Z1 Z2 2. 从 概 率 ( P) 求 Z分 数( 1) 已 知 从 平 均 数 开 始 的 概 率 值 求 Z值 。P概 率Z分 数 ( 2) 已 知 正 态 分 布 两 端 的 概 率 值 求 该 概 率 值分 界 点 的 Z值 。 Z分 数 P概 率 ( 3) 若 已 知 正 态 曲 线 下 中 央 部 分 的 概 率 , 求Z分 数 Z分 数 P概 率 3. 已 知 概 率 或 Z值 , 求 概 率 密 度 y。Z分 数 P概 率 6.2.3 次 数 分 布 的 检 验 方 法 ( 一 ) 皮 尔 逊 偏 态 量 数 法MoMdM M-MdM-Mo sMMSK o s MMSK d)(3 s为 标 准 差 , SK为 偏 态 量 数 ;当 SK=0时 , 分 布 对 称 ;当 SK0时 , 为 正 偏 态 ;当 SK0时 , 分 布 为 正 偏 态 ;当 g1200时 , 偏 度 系 数 才 可 靠 。 (7.2) 峰 度 系 数 用 来 反 映 呈 单 峰 的 数 据 表 现出 来 的 峰 态 情 况 3/)( /)( 2242 NXX NXXg峰 度 系 数 : (7.3) g20 低 阔当 观 测 数 据 N1000时 , 峰 度 系 数 才 可 靠 。 ( 三 ) 观 察 直 方 图 150 160 170 180身高024 6810 1214Frequency Mean = 162.3Std. Dev. = 6.975N = 83( 四 ) 累 加 次 数 曲 线 比 较 数 据 的 累 加 频 率 分 布 曲 线 与 累 加 正态 分 布 概 率 曲 线 。 6.2.4 正 态 分 布 理 论 在 测 验 中 的 应 用( 一 ) 化 等 级 评 定 为 测 量 数 据 在 心 理 与 教 育 评 价 中 , 对 有 些 心 理 量 ,如 爱 好 、 意 志 强 弱 等 常 用 等 级 评 定 法 赋 予 一定 的 评 价 分 数 或 等 级 分 数 , 不 同 评 价 者 的 标准 可 能 不 同 , 等 级 分 数 界 线 宽 , 不 一 定 是 等距 尺 度 。 应 该 将 等 级 评 定 等 距 化 。 被 评 定 的 心 理 量 为 正 态 分 布 , 才 能 将 等 级评 定 转 化 为 等 距 数 据 。E D C B A 表 1为 3位 教 师 对 100名 学 生 的 学 习 能 力 所 作 等 级评 定 的 结 果 。 表 2为 3名 学 生 从 3位 老 师 那 里 获 得的 评 定 等 级 , 试 将 其 转 化 为 Z分 数 。 评 定 等 级等 级 教 师 甲 教 师 乙 教 师 丙A 5 10 20B 25 20 25C 40 40 35 D 25 20 15E 5 10 5总 数 100 100 100 学 生 教 师 甲 教 师 乙 教 师 丙1 B A A2 A B A3 D C C表 1 教 师 对 学 生 的 评 定 结 果 表 2 教 师 对 3名 学 生 的 评 定 结 果 学 生 教 师 甲 教 师 乙 教 师 丙 平 均 分1 0.94 1.65 1.28 1.292 1.96 0.84 1.28 1.363 -0.94 0 -0.32 -0.42 ( 二 ) 确 定 测 验 题 目 的 难 易 度 题 目 难 易 度 一 般 用 答 对 者 的 百 分 数 确 定 ,但 是 百 分 数 不 是 等 距 尺 度 , 有 时 要 比 较 不 同 难易 度 题 目 之 间 的 难 度 距 离 , 需 要 将 难 易 百 分 数根 据 正 态 分 布 概 率 转 换 为 难 度 分 数 。题 号 通 过 率 未 通 过 率 Z分 数 Z+51 0.99 0.01 -2.331 2.6693 0.95 0.05 -1.645 3.3555 0.85 0.15 -1.035 3.965用 未 通 过 率 计 算 Z分 数 ( 三 ) 划 分 等 级 分 数 线公 司 对 新 员 工 工 作 绩 效 进 行 考 核 。 设 全 体 员 工的 绩 效 得 分 呈 正 态 分 布 , 平 均 得 分 80分 , 标 准差 12分 。 现 根 据 考 核 结 果 “ 奖 优 罚 劣 ” : 对 得分 最 高 的 10%员 工 提 升 工 资 和 职 位 , 对 得 分 最低 的 30%员 工 实 行 换 岗 再 培 训 。 已 知 甲 、 乙 两名 员 工 的 考 核 得 分 分 别 是 90和 60分 , 问 他 们 是否 得 到 提 升 或 换 岗 ? 查 表 Z2=-0.52, Z1=1.28 xz zx 76.73801252.0 2 x 36.95801228.11 x90分 的 员 工 不 能 升 职 , 60分 的 员 工 会 轮 岗由 得 : 6.3 二 项 分 布二 项 分 布 是 一 种 具 有 广 泛 用 途 的 离 散 型 随 机变 量 的 概 率 分 布 , 它 是 由 贝 努 里 创 立 的 , 所以 又 叫 。二 项 分 布 是 心 理 与 教 育 统 计 中 常 用 的 一 种 基本 随 机 变 量 分 布 。 6.3.1 二 项 试 验二 项 试 验 又 称 为 贝 努 里 试 验 , 它 必 须 满 足 以 下几 个 条 件 :1.任 何 一 次 试 验 恰 好 有 两 个 结 果 , 成 功 与 失 败 。2.共 有 n次 试 验 , 并 且 n是 预 先 给 定 的 任 一 正 数 。3.每 次 试 验 各 自 独 立 , 各 次 试 验 之 间 无 相 互 影响 。4.某 种 结 果 出 现 的 概 率 在 任 何 一 次 试 验 中 都 是固 定 的 。 是 否 为 二 项 试 验 ?(1)投 掷 硬 币 试 验(2)一 个 口 袋 装 有 6只 球 , 其 中 4只 白 球 、 2只 红球 , 从 袋 中 取 球 两 次 。 ( a) 放 回 抽 样 , 第 一 次 取 一 只 球 , 观 察 其 颜色 后 放 回 , 搅 匀 后 再 取 一 球 。 ( b) 不 放 回 抽 样 , 第 一 次 取 一 球 不 放 回 袋 中 ,第 二 次 从 剩 余 的 球 中 再 取 一 球 。 6.3.2 二 项 分 布 函 数 nnnnnnnnnnn qCqpCqpCpCqp 111110)(二 项 定 理 :项 数 : 二 项 展 开 式 中 共 有 n 1项 。指 数 : p的 指 数 , 从 n0下 降 ; q指 数 从0n为 上 升 。 每 项 p与 q指 数 之 和 等 于 n。系 数 : n个 元 素 中 依 次 取 0n个 元 素 的 组合 数 。 0)( qp 11 11 2 11 3 3 11 4 6 4 11 5 1 0 10 5 11 6 15 20 15 6 11)( qp 2)( qp 3)( qp 4)( qp 5)( qp 6)( qp 杨 辉 三 角 形 用 n 次 方 的 二 项 展 开 式 来 表 达 在 n 次 二项 试 验 中 成 功 事 件 出 现 的 不 同 次 数 ( X 0,1) 的 概 率 分 布 , 叫 做 二 项 分 布 函 数 。 二 项 分 布 是 一 种 离 散 型 随 机 变 量 的 概 率 分 布 设 有 n次 试 验 , 各 次 试 验 彼 此 独 立 的 , 每 次 试验 某 事 件 出 现 的 概 率 都 是 p, 某 事 件 不 出 现 的概 率 都 是 q( 1-p) , 则 对 于 某 事 件 出 现 X次( 0, 1, 2, , n) 的 概 率 分 布 为 : xnxxn qpCpnxb ),( )!(! ! xnx nCx n 式 中 : (6.6) 例 10个 硬 币 投 掷 一 次 , 或 1个 硬 币 投 掷 10次 , 问 5次 正 面 向 上 的 概 率 是 多 少 ?解 : 根 据 题 意 , n=10, p=q=0.5, X=5 5105510 )5.0()5.0()5.0,10,5( Cb 5105 )5.0()5.0()!510(!5 !10 24609.0 例 已 知 某 长 一 批 产 品 中 一 级 品 率 为 0.2现在 从 中 随 机 地 抽 查 20只 。 问 20只 元 件 中 恰好 有 6个 一 级 品 的 概 率 是 多 少 ? 6206620 )8.0()2.0()2.0,20,6( Cb解 :n=20, p=0.2, q=0.8. x=6 6206 )8.0()2.0()!620(!6 !20 109.0 某 人 进 行 射 击 练 习 , 如 果 每 次 射 击 击中 的 命 中 率 为 0.02, 独 立 射 击 400次 ,试 求 至 少 击 中 两 次 的 概 率 。解 : 击 中 的 次 数 为 x, 其 对 应 概 率 为 : xxxCxb 400400 )98.0()02.0()02.0,400,( )1()0(1 xPxPP 399400 )98.0)(02.0(400)98.0(1 9972.0 n 一 个 口 袋 装 有 6只 球 , 其 中 4只 白 球 、 2只红 球 , 从 袋 中 取 球 两 次 。n 放 回 抽 样 , 第 一 次 取 一 只 球 , 观 察 其 颜 色后 放 回 , 搅 匀 后 再 取 一 球 。n 求 取 到 一 只 白 球 与 一 只 红 球 的 概 率 。 9431322)62()64()64,2,1( 1112 Cb解 : 实 验 次 数 n=2, 取 到 白 球 的 次 数 x=1, 白球 的 概 率 p=4/6, 红 球 的 概 率 q=2/6. 6.3.3 二 项 分 布 的 性 质 ( 一 ) 二 项 分 布 是 离 散 型 分 布 , 概 率 直 方 图 是阶 跃 式 。 因 为 X为 不 连 续 变 量 , 用 概 率 条 图 表 示 更为 合 适 。1个 硬 币 投 掷 5次 , 正 面 向 上 0, 1, 2, 3, 4, 5次的 概 率 分 别 为 : 03125.0)5.0()5.0()5.0,5,0( 05025 Cb 15625.0)5.0()5.0()5.0,5,1( 15115 Cb 3125.0)5.0()5.0()5.0,5,2( 25225 Cb 3125.0)5.0()5.0()5.0,5,3( 35335 Cb 15625.0)5.0()5.0()5.0,5,4( 45445 Cb 03125.0)5.0()5.0()5.0,5,5( 45555 Cb 0 1 2 3 4 5 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0 1 2 3 4 50 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0 1 2 3 4 5 6 7 8 9 100 0.05 0.1 0.15 0.2 0.25 -5 0 5 10 15 20 250 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.185次 10次 20次 -5 0 5 10 15 20 25 30 35 40 450 0.02 0.04 0.06 0.08 0.1 0.12 0.14 40次 -10 0 10 20 30 40 50 60 70 80 900 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 -20 0 20 40 60 80 100 120 140 160 1800 0.01 0.02 0.03 0.04 0.05 0.06 0.0780次 160次 p=q=0.5 0 1 2 3 4 50 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 p=0.2, q=0.8 0 1 2 3 4 5 6 7 8 9 100 0.05 0.1 0.15 0.2 0.25 0.3 0.35 -5 0 5 10 15 20 250 0.05 0.1 0.15 0.2 0.25 -5 0 5 10 15 20 25 30 35 40 450 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 -10 0 10 20 30 40 50 60 70 80 900 0.02 0.04 0.06 0.08 0.1 0.12当 pq,二 项 分 布 为 负 偏 态 。当 n很 大 , 偏 态 逐 渐 降 低 , 最 终 趋 近 于 正 态 。当 pq时 , 且 nq5.这 时 二 项分 布 为 正 态 分 布 的 近 似 形 。 5次 10次 20次40次 80次 -20 0 20 40 60 80 100 120 140 160 1800 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 160次 ( 二 ) 二 项 分 布 的 平 均 数 和 标 准 差n 如 果 二 项 分 布 满 足 p q且 nq 5( 或 者 p q且 np 5时 , 二 项 分 布 接 近 于 正 态 分布 。 可 用 下 面 的 方 法 计 算 二 项 分 布 的 平均 数 和 标 准 差 。 二 项 分 布 的 平 均 数 为 np npq 二 项 分 布 的 标 准 差 为 ( 6 7) ( 6 8) n 求 p=0.2, q=0.8, n=160次 的 二 项 分 布 的 平 均 值和 标 准 差 。 322.0160 np 06.58.02.0160 npq解 : np=0.2160=325, 该 二 项 分 布 接 近 正 态分 布 。 -20 0 20 40 60 80 100 120 140 160 180 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 6.3.4 二 项 分 布 的 应 用二 项 分 布 函 数 除 了 用 来 求 成 功 事 件 恰 好 出 现 X次 的 概 率 之 外 , 在 教 育 中 主 要 用 来 判 断 试 验结 果 的 机 遇 性 与 真 实 性 的 界 限 。 例 如 , 一 个 学 生 凭 猜 测 做 10个 是 非 题 , 平均 可 以 猜 对 5题 。 什 么 情 况 下 可 以 说 他 是 真会 而 不 是 猜 测 呢 ?做 对 题 数 概 率 累 加 概 率0 0.000977 0.0009771 0.009766 0.0107422 0.043945 0.0546883 0.11719 0.171884 0.20508 0.376955 0.24609 0.62305 6 0.20508 0.828137 0.11719 0.945318 0.043945 0.989269 0.009766 0.9990210 0.000977 1 做 对 8道 题 的累 加 概 率 达 到0.989, 8道 题以 上 即 可 认 为是 真 会 做 。 例 如 , 一 个 学 生 凭 猜 测 做 10个 四 选 一 的 选 择 题 ,什 么 情 况 下 可 以 说 他 是 真 会 而 不 是 猜 测 呢 ?做 对 题 数 概 率 累 加 概 率0 0.056314 0.0563141 0.18771 0.244032 0.28157 0.525593 0.25028 0.775884 0.146 0.921875 0.058399 0.980276 0.016222 0.996497 0.00309 0.99958 8 0.000386 0.999979 2.86E-05 110 9.54E-07 1 做 对 5道 题以 上 即 可 认为 是 真 会 做 。 统 计 游 戏小 时 候 经 常 看 到 有 这 样 的 游 戏 , 在 一 块 倾 斜 的板 上 有 n排 钉 子 , 在 钉 子 的 下 方 有 n 1个 格 子 ,对 应 的 奖 励 。 自 侧 方 弹 出 一 个 玻 璃 球 , 任 其 自由 下 落 , 在 下 落 的 过 程 中 让 小 球 碰 到 钉 子 时 ,会 改 变 下 落 方 向 。 每 碰 装 一 次 时 , 玻 璃 球 向 两边 下 落 的 可 能 性 相 等 。 一 块 钱 可 以 玩 5次 , 中间 对 应 的 奖 励 很 小 , 两 侧 对 应 的 奖 励 可 能 有 5元 、 10元 。 Galton钉 板 概 率 模 型请 问 每 个 格 子 内 的 概 率 是 多 少 ? 0.5 0.510.25 0.5 0.25 10.5 0.50.25 0.5 0.250.125 0.375 0.375 0.1250.0625 0.25 0.375 0.25 0.0625 xnxxn qpCpnxb ),( xnxxnCnxb )5.0()5.0()5.0,( 复 习 xnxxn qpCpnxb ),( )!(! ! xnx nC xn 式 中 : (6.6) 二 项 分 布 函 数 : -20 0 20 40 60 80 100 120 140 160 1800 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 -20 0 20 40 60 80 100 120 140 160 1800 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 p=q=0.5 80次 160次 -20 0 20 40 60 80 100 120 140 160 1800 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 20次 谢 谢 大 家 ! 6.4 样 本 分 布样 本 分 布 指 样 本 统 计 量 的 分 布 , 在 科 学 研 究中 , 一 般 是 通 过 一 个 样 本 进 行 分 析 , 只 有 知道 了 样 本 统 计 量 的 分 布 规 律 , 才 能 依 据 样 本对 总 体 进 行 推 论 。在 谈 及 样 本 统 计 量 的 分 布 时 , 首 先 要 保 证 各个 样 本 是 独 立 的 , 各 个 样 本 都 服 从 同 样 的 分布 。样 本 的 取 样 方 法 应 该 用 随 机 抽 样 的 方 法 。 研 究 总 体 与 从 中 抽 取 的 样 本 之 间 的 关 系 是 统 计学 的 中 心 内 容 。 对 这 种 关 系 的 研 究 可 从 两 方 面 着手 :( 1)抽 样 分 布 : 从 总 体 到 样 本 , 这 就 是 研 究 抽样 分 布 (sampling distribution)的 问 题 , 统 计 量的 概 率 分 布 称 为 抽 样 分 布 ; ( 2) 统 计 推 断 : 从 样 本 到 总 体 , 这 就 是 统 计 推断 (statistical inference)问 题 。 统 计 推 断 是 以 总 体 分 布 和 样 本 抽 样 分 布 的 理论 关 系 为 基 础 的 。 为 了 能 正 确 地 利 用 样 本 去 推 断总 体 , 并 能 正 确 地 理 解 统 计 推 断 的 结 论 , 须 对 样本 的 抽 样 分 布 有 所 了 解 。 我 们 知 道 , 由 总 体 中 随 机 地 抽 取 若 干 个 体 组成 样 本 , 即 使 每 次 抽 取 的 样 本 含 量 相 等 , 其 统 计量 (如 , S)也 将 随 样 本 的 不 同 而 有 所 不 同 , 因 而 样本 统 计 量 也 是 随 机 变 量 , 也 有 其 概 率 分 布 。 我 们把 统 计 量 的 概 率 分 布 称 为 抽 样 分 布 。 由 总 体 随 机 抽 样 (random sampling)的 方 法可 分 为 有 复 置 抽 样 和 不 复 置 抽 样 两 种 。 复 置 抽 样 : 指 每 次 抽 出 一 个 个 体 后 , 这 个 个 体应 返 回 原 总 体 ;不 复 置 抽 样 : 指 每 次 抽 出 的 个 体 不 返 回 原 总 体 。对 于 无 限 总 体 , 返 回 与 否 都 可 保 证 各 个 体 被 抽到 的 机 会 相 等 。对 于 有 限 总 体 , 就 应 该 采 取 复 置 抽 样 , 否 则 各个 体 被 抽 到 的 机 会 就 不 相 等 。 导 言一 、 抽 样 的 目 的 运 用 样 本 推 断 总 体试 验 测 定 所 得 样 本 数 据试 验 目 的 获 得 总 体 信 息因 此 要 研 究 样 本 与 总 体 关 系 如 何 通 过 对 样 本 数 据 的 分 析 获 得总 体 信 息 总 体 1x2x3x kx 导 言总 体 1x2x3x kx 二 、 样 本 平 均 数 及 其 分 布 :iX iX 许 多 Si 形 成 样 本 标 准 差 抽 样 分 布 。 许 多 形 成 样 本 平 均 数 抽 样 分 布 。 由 样 本 平 均 数 构 成的 总 体 称 为 样 本 平 均 数 的 抽 样 总 体 。 和 一 个 标 准 差 Si 。每 一 个 样 本 有 一 个 样 本 平 均 数 样 本 平 均 数 抽 样 分 布 iX 样 本 平 均 数 分 布151164153157161182178175172175 151 164 153164 161 182157 161 172 156平 均 值169163 原 始 数 据 的 分 布 140 145 150 155 160 165 170 175 180 185 190 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 样 本 平 均 数 分 布 图 示 140 145 150 155 160 165 170 175 180 185 190 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 n=2n=3n=4n=5n=6随 机 抽 样 1000次 1. 总 体 分 布 为 正 态 , 方 差 已 知 , 样 本 平 均数 的 分 布 为 正 态 分 布 。 X nX X 平 均 数 分 布 的 平 均 数 ;平 均 数 分 布 的 标 准 差 , 一 般 称 为 标准 误 , 可 用 SE表 示 。X (7.4a) (7.4b) 2. 总 体 分 布 为 非 正 态 , 方 差 已 知 , 这 时 样本 足 够 大 时 , 样 本 平 均 数 的 分 布 为 渐 近 正态 分 布 。 X nX (7.5a) (7.5b) 6.4.2 样 本 标 准 差 和 方 差 分 布151164153157161182178175172175 151 164 153164 161 182157 161 172 711.367.77标 准 差 0 5 10 15 20 25 30 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 标 准 差 分 布 图 示 n=2n=3n=4n=5n=6随 机 抽 样 1000次 的 标 准 差 n 自 正 态 分 布 的 总 体 中 抽 取 容 量 为 n的 样 本 ,当 样 本 量 足 够 大 时 (n30), 样 本 方 差 及 标 准差 分 布 趋 近 于 正 态 分 布 。 sX ns 2 22 sX (7.6a) (7.6b) (7.6c) 二 、 样 本 平 均 数 及 其 分 布 :n 抽 样 分 布 总 体 与 原 总 体 有 什 么 关 系 ?n 与 ?n 与 ? n 抽 样 分 布 总 体 与 原 总 体 关 系 如 下 :n 1、 样 本 平 均 数 分 布 的 平 均 数 等 于 原 总 体 平 n 2、 样 本 平 均 数 分 布 的 标 准 差 等 于 原 总 体 标n 即 x = ,nx = n( 标 准 误 ) 准 差 除 以均 数 , 即ix is 标 准 误标 准 误 (平 均 数 抽 样 总 体 的 标 准 差 ) 的 大 小 反 映 样 本 平 均 数 的 抽 样 误 差 的 大 小 , 即 精确 性 的 高 低 。 标 准 误 大 , 说 明 各 样 本 平 均 数 间差 异 程 度 大 , 样 本 平 均 数 的 精 确 性 低 。 反 之 , 小 ,说 明 各 样 本 平 均 数 间 的 差 异 程 度 小 , 样 本 平 均数 的 精 确 性 高 。 的 大 小 与 原 总 体 的 标 准 差 成 正比 , 与 样 本 含 量 n的 平 方 根 成 反 比 。 从 某 特 定 总 体抽 样 , 因 为 是 一 常 数 , 所 以 只 有 增 大 样 本 含 量 才能 降 低 样 本 平 均 数 的 抽 样 误 差 。 x = nX X x xX X 注 意 , 样 本 标 准 差 与 样 本 标 准 误 是 既 有 联 系又 有 区 别 的 两 个 统 计 量 。 二 者 的 区 别 在 于 : 样 本 标 准 差 S 是 反 映 样 本 中 各 观 测值 x1 , x2 , xn, 变 异 程 度 大 小 的 一 个 指标 , 它 的 大 小 说 明 了 对 该 样 本 代 表 性 的 强弱 。 样 本 标 准 误 是 样 本 平 均 数 , , 的 标 准 差 , 它 是 抽 样 误 差 的 估 计 值 , 其 大小 说 明 了 样 本 间 变 异 程 度 的 大 小 及 精 确 性 的 高低 。 X 1x 2x kx 对 于 大 样 本 资 料 , 常 将 样 本 标 准 差 S与 样 本平 均 数 配 合 使 用 , 记 为 S, 用 以 说 明 所考 察 性 状 或 指 标 的 优 良 性 与 稳 定 性 。 对 于 小 样 本 资 料 , 常 将 样 本 标 准 误 与 样 本平 均 数 配 合 使 用 , 记 为 , 用 以 表 示 所 考 察 性 状 或 指 标 的 优 良 性 与 抽 样 误 差 的 大 小 。 XX xX X x 3、 若 原 分 布 为 正 态 分 布 , 平 均 数 分 布 亦 为 正 态 分布 。若 原 分 布 是 非 正 态 分 布 , 当 n增 大 时 , 平 均 数 分 布亦 趋 向 正 态 分 布 。所 以 n30时 , 可 以 认 为 新 分 布 符 合 正 态 分 布 。 例 3-4, 某 品 种 葡 萄 总 体 , 果 穗 长 =30cm, =10.8cm, 随 机 抽 50个 果 穗 ,所 得 样 本 平 均 数 与 相 差 不 超 过 3cm的 概 率 是 多 少 ?解 : 已 知 U= 查 附 表 3得U UU U 以 上 做 法 对 不 对 不 对 !分 析 : 已 知 、 , 求 | -| 3cm的 概 率 , 求 样 本 平 均 数 的 信 息 , 算 U值 须 用 , 上 面 的 解 答 错 用 。x- 3 =0.2810.8? x 正 确 做 法 :从 样 本 均 数 分 布 规 律 入 手 样 本 均 数 分 布解 : U= U UU U x = , x = nx 53.1508.10 xxx- 3= =1.961.53 若 题 目 改 为 某 葡 萄 品 种 总 体 , 果 穗 长 =30cm, =10.8cm, 若 从 其 中 抽 取 50个 穗 ,问 50 穗 中 , 长 度 与 相 差 不 超 过 3cm的 果 穗共 有 多 少 穗 ?解 : U= P=0.22=22%50 0.22=11( 穂 )x- =0.28 例 3-5 某 枇 杷 单 果 重 =30g, =9.6g, 今 从 中 抽 取 50个分 析 : 已 知 总 体 分 布 =30, =9.6, 问解 : 的 概 率 是 多 少 ? x 9.5 = = =1.36n 50 xx- 29-30 1U= = = =0.741.36 1.36 x 29g的 概 率 P? 样 本 中 果 , 其 平 均 单 果 重 x 29g查 附 表 3得 两 尾 概 率 0.46, 那 么 单 尾 概 率 =0.46/2=0.23,所 以平 均 单 果 重 小 于 等 于 29g的 概 率 为 0.23。 若 将 是 题 目 改 成 : 某 枇 杷 品 种 平 均 单 果 重 =30g, =9.6g,问 单 果 重 小 于 29g的 概 率 是多 少 ?解 : U=P( 29X30时 , t分 布 接 近 正 态 分 布 , 方 差大 于 1, 随 着 n-1的 增 大 而 方 差 趋 于 1. ( 二 ) t分 布 表 的 使 用t值 p 845.22/01.0 t 845.2005.0 t ( 三 ) 样 本 平 均 数 的 分 布n 1. 总 体 分 布 为 正 态 , 方 差 未 知 时 , 样 本 平均 数 的 分 布 为 t分 布 。 nsnss nX 11 n XXs 2)( 1 )( 21 n XXsn其 中 : 平 均 数 分 布 的 标 准 差 为 : (7.8) n 2. 当 总 体 为 非 正 态 分 布 , 其 方 差 由 未 知 时 ,若 满 足 n30这 一 条 件 , 样 本 平 均 数 的 分 布 近似 为 t分 布 。 nsnss nX 11 复 习1. 总 体 分 布 为 正 态 , 方 差 已知 , 样 本 平 均 数 的 分 布 为 正态 分 布 。 2. 总 体 分 布 为 正 态 , 方 差 未 知 时 ,样 本 平 均 数 的 分 布 为 t分 布 。 XiXZ nsXnsXt nii 11 nX X n snss nX 11 n XXs 2)( 1 )( 21 n XXsn 6.4.4 卡 方 分 布 2分 布 是 统 计 分 析 中 应 用 较 多 的 一 种 抽样 分 布 。 从 一 个 服 从 正 态 分 布 的 总 体 中 , 每 次 随机 抽 取 随 机 变 量 : nXXX 11211 ,nXXX 22221 , nXXX 33231 , 222 11211 , nXXX 21iX222 22221 , nXXX222 33231 , nXXX 22iX 23iX nXXX 11211 ,nXXX 22221 , nXXX 33231 , XZ nZZZ 11211 , nZZZ 22221 ,nZZZ 33231 , 222 11211 , nZZZ222 22221 , nZZZ222 33231 , nZZZ 2 1iZ 22iZ 23iZ 由 得 : ( 一 ) 卡 方 分 布 的 计 算 : 2 222 )( XZi 总 体 为 正 态 分 布 , 已 知 总 体 平 均数 。 总 体 为 正 态 分 布 , 总 体 平 均 数 未知 , 可 用 样 本 平 均 数 代 替 。 222 22 )( nsXX S2分 布 实 质 是 卡 方 分 布 df=n-1 (7.9a) (7.9b) ( 二 ) 卡 方 分 布 的 特 点 0 5 10 15 20 25 30 35 40 0 0.02 0.04 0
展开阅读全文