资源描述
本 门 课 程 的 学 习 要 求掌 握 生 物 统 计 学 的 基 本 原 理 和 基 本 概 念 ;掌 握 科 学 地 收 集 、 整 理 和 分 析 数 据 资 料 的 基本 知 识 与 技 能 ;初 步 掌 握 设 计 实 验 的 基 本 方 法 , 培 养 从 事 教学 和 科 研 工 作 的 能 力 。 通 过 本 课 程 的 学 习 一 、 生 物 统 计 学 的 概 念二 、 生 物 统 计 学 的 产 生 和 发 展三 、 在 生 物 学 科 研 工 作 中 的 作 用四 、 学 习 生 物 统 计 学 的 方 法主要内容 无 处 不 在 的 统 计 1980年 6月 , 首 届 国 际 红 楼 梦 研 讨 会 在美 国 召 开 , 威 斯 康 星 华 裔 学 者 陈 炳 藻 独 树一 帜 , 宣 读 了 题 为 从 词 汇 上 的 统 计 论 红 楼 梦 作 者 的 问 题 的 博 士 论 文 。 他从 字 、 词 出 现 频 率 入 手 , 通 过 计 算 机 进 行统 计 、 处 理 、 分 析 , 对 红 楼 梦 后 40回系 高 鹗 所 作 这 一 流 行 看 法 提 出 异 议 , 认 为120回 均 系 曹 雪 芹 所 作 。 精 确 到 小 数 点 的 爱 情 -统 计 学 博 士 的 求 婚 信 统 计 数 字 大 仲 马 的 作 品 多 曲 折 感 人 , 而 大 仲 马 又 多 私 生 子 , 所 以 ,取 笑 讥 讽 他 的 人 , 往 往 把 他 的 作 品 比 作 他 的 私 生 子 。 最使 他 头 痛 的 是 巴 黎 统 计 学 会 的 秘 书 长 李 昂 纳 , 这 人 是 大 仲马 的 朋 友 , 每 次 举 统 计 数 字 的 例 子 , 总 是 说 大 仲 马 的 情 妇和 私 生 子 有 多 少 。 有 一 年 该 统 计 学 会 开 年 会 , 大 仲 马 估计 , 李 昂 纳 又 要 大 放 厥 词 , 说 他 的 坏 话 了 。 于 是 他 请 求 参加 年 会 , 获 得 了 批 准 , 果 然 不 出 大 仲 马 所 料 , 李 昂 纳 又 举他 的 情 妇 和 私 生 子 的 例 子 。 李 昂 纳 报 告 完 毕 , 请 大 仲 马致 词 。 一 向 不 愿 在 大 庭 广 众 之 下 发 表 演 讲 的 大 仲 马 , 这 次却 破 例 登 台 说 : “ 所 有 统 计 数 字 都 是 撒 谎 的 , 包 括 有 关 本 人 的 数 字 在 内 。 ” 听 众 哄 堂 大 笑 。 数 学 家 的 幽 默 统 计 学 家 调 侃 数 学 家 : 你 们 不 是 说 若 且 , 则 吗 ! 那 么 想 必 你 若 喜 欢 一 个 女 孩 ,那 么 这 个 女 孩 喜 欢 的 男 生 你 也 喜 欢 吧 ?数 学 家 反 问 道 : 那 么 你 把 左 手 放 到 一 锅 一 百 度 的开 水 中 , 右 手 放 到 一 锅 零 度 的 冰 水 里 想 来 也 没 事吧 ! 因 为 它 们 平 均 不 过 是 五 十 度 而 已 ! ” 由 上 可 知 , 统 计 与 数 量 有 关 , 同 时它 已 经 渗 透 到 社 会 经 济 活 动 和 科 学 研 究的 方 方 面 面 , 统 计 无 处 不 在 。 案 例 在 一 个 水 库 中 养 着 许 多 鱼 , 管 理 人 员 希望 了 解 鱼 的 大 致 数 量 , 这 就 是 一 个 实 践 中 的统 计 学 问 题 。 由 于 鱼 不 听 从 指 挥 , 会 在 各 处 自 由 游 动的 , 因 此 , 在 进 行 统 计 时 , 必 须 创 造 性 地 提出 解 决 方 案 。 一 种 解 决 方 法 先 从 水 库 的 不 同 位 置 一 共 捕 上 来 1000条 鱼 ,在 每 条 鱼 的 尾 部 作 上 一 个 标 记 , 应 当 保 证 标 记不 会 影 响 鱼 的 自 由 游 动 。 然 后 , 将 鱼 全 部 放 回水 库 。 几 天 后 , 从 水 库 中 再 捕 上 来 1000条 鱼 ,检 查 其 中 尾 巴 上 有 标 记 的 鱼 的 数 量 。 假 定 在 第二 次 捕 上 来 的 1000条 鱼 中 , 有 20条 尾 巴 上 做 了标 记 , 则 可 以 推 断 , 水 库 中 鱼 的 总 数 大 致 为 :1000 ( 20 1000) 5万 条 。 统 计 (Statistics)的 涵 义 统 计 是 人 们 认 识 客 观 世 界 总 体数 量 变 动 关 系 和 变 动 规 律 的 活动 的 总 称 , 是 认 识 客 观 世 界 的有 力 工 具 。 统 计 的 研 究 对 象 的 特 点 : ( 一 ) 数 量 性 。 统 计 数 据 是 客 观事 物 量 的 反 映 。 ( 二 ) 总 体 性 。 统 计 的 数 量 研 究是 对 现 象 总 体 中 各 单 位 普 遍 存 在的 事 实 进 行 大 量 观 察 和 综 合 分 析 。 ( 三 ) 变 异 性 。 总 体 各 单 位 的 特征 表 现 存 在 着 差 异 , 而 且 这 些 差异 并 不 是 事 先 可 以 预 知 的 。 概 念 : 生 物 统 计 学 是 应 用 概 率 论 和 数 理 统 计 原 理 来 研 究生 物 界 数 量 变 异 规 律 的 一 门 科 学 。 实 质 : 生 物 统 计 学 从 研 究 思 路 上 看 , 它 是 以 样 本 来 推 断总 体 的 一 门 学 科 。 特 点 : 1、 概 率 性 : 研 究 手 段 是 概 率 论 以 及 建 立 在 概 率 论基 础 上 的 数 理 统 计 方 法 , 更 主 要 的 是 其 结 论 是 不 确 切 的 。2、 归 纳 性 : 生 物 统 计 学 由 样 本 来 推 断 总 体 的 研 究 思 路 是由 特 殊 到 一 般 的 归 纳 过 程 。 3、 实 践 性生 物 统 计 学 的 概 念 1894年 , 发 表 了 一 系 列 生 物 统 计 学的 论 文 , 奠 定 生 物 统 计 学 的 基 础 ( 英国 毕 尔 生 ) 。哥 尔 顿 (Galton)在 十 九 世 纪 末 叶 , 应用 统 计 方 法 研 究 人 种 特 征 与 遗 传 , 创 立了 生 物 统 计 学 。 英 国 人 达 尔 文 的 侄 子 弗 朗 西 斯 哥 尔 顿 直 到1883年 才 发 明 出 “ 优 生 学 ” 这 个 词 。 一 开 始 ,高 尔 顿 的 提 议 没 有 博 得 积 极 的 反 应 。 很 多 人 对他 的 人 工 控 制 生 育 的 思 想 感 到 震 惊 。 人 们 对高 尔 顿 的 遗 传 观 点 也 非 常 怀 疑 。 再 者 , 因 为 出身 名 门 的 孩 子 通 常 能 比 普 通 人 受 到 更 好 的 教 育 ,所 以 怎 么 肯 定 他 们 的 能 力 就 是 天 生 的 呢 ? 后 来 , 哥 尔 顿 花 了 很 多 的 精 力 , 提 出 一种 生 物 学 上 的 统 计 技 术 , 以 直 接 回 应 最 初 出现 的 怀 疑 态 度 ( Cowan, 1972b) 。 他 更 加 详细 地 表 明 , 遗 传 控 制 了 人 口 的 性 质 。 他 将 统计 学 方 法 应 用 于 变 异 的 研 究 , 这 也 为 生 物 统计 学 派 的 研 究 道 路 奠 定 了 基 础 。 后 来 , 他 的 学 生 卡 尔 皮 尔 逊 (KPearson)利 用 生 物 统 计 学 来 捍 卫 达 尔 文 主 义 。 可 以 认为 , 皮 尔 逊 定 量 技 术 的 真 实 结 构 反 映 出 他 想为 优 生 学 政 策 提 供 明 确 科 学 证 据 的 欲 望( Mack enzie, 1982) 。 在 皮 尔 逊 的 学 生RA费 舍 尔 那 里 也 发 现 同 样 的 观 点 ( Bennett, 1983; No rton, 1983) 。 1820年 法 国 人 Laplace及 同 时 代 的Gauss发 现 正 态 分 布 , 卡 尔 皮 尔 逊 在1906年 继 续 主 持 哥 尔 顿 试 验 室 , 他 所 提出 的 卡 方 (2)测 验 在 遗 传 学 上 研 究 性 状 分离 时 被 广 泛 应 用 。 他 的 学 生 WSGosset所 提 出 的 值 测 验 法 已 成 为 当 代 生 物 统计 工 作 的 基 本 工 具 之 一 。 我 国 在 二 十 世 纪 三 十 年代 就 出 版 有 实 用 生 物 统 计学 ( 王 绶 , 1937年 ) , 并且 成 为 必 修 课 , 在 许 多 方 面加 以 应 用 。 生 物 统 计 学 近 年 来 发 展 甚 速 , 从中 又 分 支 为 生 物 统 计 遗 传 学 、 生 态 统计 学 、 毒 理 统 计 学 等 等 。 当 前 , 由 于电 子 计 算 机 的 普 及 , 使 运 算 技 术 出 现新 的 跃 进 , 原 来 十 分 繁 琐 的 计 算 变 得十 分 简 单 、 迅 速 , 而 且 更 加 精 确 。 应用 统 计 方 法 以 及 先 进 的 试 验 设 计 来 进行 分 析 、 研 究 , 在 生 物 学 的 研 究 中 将越 来 越 显 得 重 要 。 生 物 学 是 一 门 实 验 科 学 。 不 管 你 从事 的 是 生 物 学 的 哪 一 个 分 枝 , 都 不 可 能完 全 脱 离 实 验 , 只 进 行 逻 辑 推 理 。 而 实验 所 得 到 的 结 果 几 乎 无 例 外 地 都 带 有 或多 或 少 的 不 确 定 性 , 即 实 验 误 差 。 在 这种 情 况 下 不 用 统 计 学 要 想 得 到 正 确 的 结论 是 不 可 能 的 。 可 以 毫 不 夸 张 地 说 , 作 为 一 个 实 验 科学 工 作 者 , 离 开 了 统 计 学 就 寸 步 难 行 。 希望 大 家 通 过 这 门 课 程 的 学 习 , 能 够 掌 握 常用 的 统 计 方 法 , 尤 其 是 它 们 的 条 件 , 适 用范 围 、 优 缺 点 等 , 从 而 能 够 应 用 它 们 去 解决 实 践 中 遇 到 的 问 题 。 生 物 统 计 学 是 运 用 数 理 统 计 的 的 原 理 和 方 法来 分 析 和 解 释 生 物 界 各 种 现 象 和 试 验 调 查 资 料 的一 门 科 学 。 随 着 生 物 学 的 不 断 发 展 , 生 物 统 计 学在 水 产 养 殖 、 水 生 生 物 、 渔 业 资 源 及 捕 捞 等 水 产学 科 领 域 已 有 广 泛 应 用 。 生 物 统 计 学 在 设 计 、 质 控 、 数 据 管 理 、 统 计 分 析 、 结 果评 价 等 各 个 环 节 均 发 挥 了 重 要 作 用 。 统 计 研 究 的 基 本 环 节统 计 设 计 收 集 数 据 整 理 与 分 析 资 料 积 累开 发 应 用统 计 学 理论 与 相 关实 质 性 学科 理 论 描 述 统 计推 断 统 计统 计 调 查 、实 验 统 计 研 究 的 全 过 程 包 括 以 下 基 本 环 节 :( 一 ) 统 计 设 计根 据 所 要 研 究 问 题 的 性 质 , 在 有 关 学 科 理 论 的 指 导 下 ,制 定 统 计 指 标 、 指 标 体 系 和 统 计 分 类 , 给 出 统 一 的 定义 、 标 准 。 同 时 提 出 收 集 、 整 理 和 分 析 数 据 的 方 案 和工 作 进 度 等 。 搞 好 统 计 设 计 不 仅 要 有 统 计 学 的 一 般 理论 和 方 法 为 指 导 , 而 且 还 要 求 设 计 者 对 所 要 研 究 的 问题 本 身 具 有 深 刻 的 认 识 和 相 关 的 学 科 知 识 。( 二 ) 收 集 数 据统 计 数 据 的 收 集 有 两 种 基 本 方 法 。 对 于 大 多 数 自 然 科 学和 工 程 技 术 研 究 来 说 , 有 可 能 通 过 有 控 制 的 科 学 实 验去 取 得 数 据 , 这 时 可 以 采 用 实 验 法 。 对 于 社 会 经 济 现象 来 说 , 一 般 无 法 进 行 重 复 实 验 , 要 取 得 有 关 数 据 就必 须 进 行 调 查 观 察 。 ( 三 ) 整 理 与 分 析描 述 统 计 是 指 对 采 集 的 数 据 进 行 登 记 、 审 核 、 整 理 、 归 类 ,在 此 基 础 上 进 一 步 计 算 出 各 种 能 反 映 总 体 数 量 特 征 的 综 合指 标 , 并 用 图 表 的 形 式 表 示 经 过 归 纳 分 析 而 得 到 的 各 种 有用 的 统 计 信 息 。推 断 统 计 是 在 对 样 本 数 据 进 行 描 述 的 基 础 上 , 利 用 一 定 的 方法 根 据 样 本 数 据 去 估 计 或 检 验 总 体 的 数 量 特 征 。 推 断 统 计是 现 代 统 计 学 的 主 要 内 容 。( 四 ) 统 计 资 料 的 积 累 、 开 发 与 应 用对 于 已 经 公 布 的 统 计 资 料 需 要 加 以 积 累 , 同 时 还 可 以 进 行 进一 步 的 加 工 , 结 合 相 关 的 实 质 性 学 科 的 理 论 知 识 去 进 行 分析 和 利 用 。 如 何 更 好 地 将 统 计 数 据 和 统 计 方 法 应 用 于 各 自的 研 究 领 域 是 应 用 统 计 学 研 究 的 一 个 重 要 方 面 。 计 算 器统 计 数 表统 计 软 件 第 一 章 统 计 资 料 的 收 集 与 整 理 1.1 总 体 与 样 本 1.2 数 据 类 型 及 频 数 ( 率 ) 分 布 1.3 样 本 的 几 个 特 征 数 总 体 ( 集 合 ) 和 个 体 ( 构 成 集 合 的 元 素 )根 据 研 究 目 的 确 定 的 、 符 合 指 定 条 件 的 全 部 观察 对 象 称 为 总 体 。 一 般 用 希 腊 字 母 表 示 总 体 数 值 ,如 , , , , 等 。 注 意 :( 2) 总 体 具 有 同 质 性 : 每 个 个 体 具 有 共 同 的 观察 特 征 , 而 与 其 它 总 体 相 区 别 ;( 1) 按 组 成 总 体 个 体 的 多 寡 分 为 : 有 限 总 体 和无 限 总 体 ; 样 本 和 样 本 容 量 总 体 中 抽 出 若 干 个 个 体 组 成 的 集 体 称为 样 本 。 一 般 用 拉 丁 字 母 表 示 样 本 数值 , 如 、 等 。 样 本 中 包 含 的 个 体 的 个 数 称 为 样 本 的容 量 , 又 称 为 样 本 的 大 小 。 通 常 用 表 示 。 一 般 以 样 本 含 量 少 于 30者 为 小样 本 , 大 于 30者 为 大 样 本 。 注 意 : 抽 样 是 按 随 机 原 则 选 取 的 , 即总 体 中 每 个 个 体 有 同 样 的 机 会 被 选 入样 本 。 样 本 与 总 体 之 间 的 关 系 样 本 是 总 体 的 一 部 分 , 是对 总 体 随 机 抽 样 后 得 到 的集 合 。 对 观 察 者 而 言 , 总 体 是 不了 解 的 , 了 解 的 只 是 样 本的 具 体 情 况 。 我 们 所 要 做的 就 是 通 过 对 这 些 具 体 样本 的 情 况 的 研 究 , 来 推 知整 个 总 体 的 情 况 。 Xn+1XnX1 样本总体 总 体 单 位调 查 单 位 总 体 单 位调 查 单 位普 查对 全 部 单 位进 行 调 查 总 体 单 位调 查 单 位重 点 调 查只 调 查 重 点 单 位 ( 单 位数 不 多 但 其 标 志 量 占 标志 总 量 比 重 较 大 的 单 位 ) 总 体 单 位调 查 单 位抽 样 调 查按 随 机 原 则 选 择 调查 单 位 , 各 单 位 被选 中 的 机 会 相 同 。 总 体 单 位调 查 单 位典 型 调 查对 典 型 单 位 进 行 调查 , 典 型 单 位 的 选择 并 不 一 定 按 规 模 1.2 数 据 类 型 及 频 数 ( 率 )分 布一 、 资 料 类 型二 、 资 料 搜 集 与 整 理三 、 频 数 ( 率 ) 分 布 常 用 统 计图 ( 表 ) 资 料 的 分 类正 确 地 进 行 资 料 的 分 类是 资 料 整 理 、 分 析 的 前 提 。通 过 试 验 或 调 查 所 获 得 的 资料 一 般 可 以 分 为 三 大 类 : 一 、 数 量 性 状 资 料 ( d a t a o f quantitative characteristics)二 、 质 量 性 状 资 料 (data of qualitative characteristics)三 、 半 定 量 ( 等 级 ) 资 料 (semi-quantitative or ranked data)资 料 的 分 类 一 、 数 量 性 状 资 料( 一 ) 概 念 数 量 性 状 是 指 能 够 以 测 量 、称 量 或 计 数 的 方 法 表 示 其 特 征 的 性 状 。 观 察 测 定 数 量 性 状 而 获 得 的 数 据 就 是数 量 性 状 资 料 。 ( 二 ) 分 类 数 量 性 状 资 料 的 记 载 有量 测 和 计 数 两 种 方 式 , 因 而 数 量 性 状又 分 为 计 量 资 料 和 计 数 资 料 两 种 。一 、 数 量 性 状 资 料 ( 二 ) 分 类 1.计 量 资 料 : 指 用 量 测 手 段 得 到 的 数 量 资 料 。这 种 资 料 的 各 个 观 察 值 不 一 定 是 整 数 , 两 个 相 邻的 整 数 间 可 以 有 带 小 数 的 任 何 数 值 出 现 , 其 小 数值 的 多 少 由 度 量 工 具 的 精 度 而 定 , 它 们 之 间 的 变异 是 连 续 性 的 。 因 此 亦 称 为 连 续 性 变 异 资 料 。 例 如 身 高 、 产 奶 量 、 绵 羊 剪 毛 量 、 血 液 的 生 理生 化 指 标 等 属 于 连 续 性 数 量 性 状 资 料 。一 、 数 量 性 状 资 料 在 一 个 区 间 内 可 以 连 续 不断 取 值 的 资 料 需 要 使 用度 量 工 具取 值165 166165.1165.2 ( 二 ) 分 类 2 计 数 资 料 : 指 用 计 数 方 式 得 到 的 数 量 资 料 。 它 的 各 个 观 察 值 只 能 以 整 数 表 示 , 两 个 相 邻 整 数不 得 有 任 何 带 小 数 的 数 值 出 现 。 因 此 , 该 类 资 料 也 称不 连 续 性 变 异 资 料 或 间 断 ( 离 散 ) 性 变 异 资 料 。 如 猪 的 产 仔 数 、 鸡 的 产 蛋 数 、 鱼 的 尾 数 、 寄 生 虫虫 卵 数 等 。一 、 数 量 性 状 资 料 其 一 切 可 能 取 值 都 以 整 数 形 式出 现 , 并 可 以 一 一 列 举 的 资 料特 定 范 围 的 人 口 数 、 林木 株 数 、 畜 禽 数 量 等 等 取 值 不 需要 用 工 具度 量 , 用计 数 的 方式 即 可 二 、 质 量 性 状 资 料 ( 一 ) 概 念 和 特 点 质 量 性 状 是 指 只 能 观 察 而 不 能 测 量 的 性 状 。 这 类 性 状 本 身 不 能 直 接 用 数 值 表 示 ,要 获得 这 类 性 状 的 数 据 资 料 ,须 对 其 观 察 结 果 作 数量 化 处 理 。 ( 二 ) 质 量 性 状 数 量 化 的 方 法 1、 统 计 次 数 法 质 量 性 状 数 量 化 常采 用 统 计 次 数 法 , 所 谓 统 计 次 数 法 是 指 在一 定 的 总 体 或 样 本 中 , 根 据 某 一 质 量 性 状的 类 别 统 计 其 个 体 数 。 这 种 由 质 量 性 状 数量 化 得 来 的 资 料 又 叫 次 数 资 料 。二 、 质 量 性 状 资 料 ( 二 ) 质 量 性 状 数 量 化 的 方 法 . 评 分 法 : 对 某 一 质 量 性 状 , 因 其类 别 不 同 分 别 给 予 评 分 以 便 统 计 分 析 。 例如 研 究 绵 羊 的 油 汗 色 泽 遗 传 时 , 可 将 种油 汗 色 泽 分 别 给 予 不 同 的 分 数 : 深 黄 分 、黄 色 分 、 浅 黄 分 、 乳 白 分 、 白 色 分 。 二 、 质 量 性 状 资 料 三 、 半 定 量 ( 等 级 ) 资 料( 一 ) 概 念 半 定 量 或 等 级 资 料 是 指 将观 察 单 位 按 所 考 察 的 性 状 或 指 标 的 等级 顺 序 分 组 ( 三 组 以 上 ) , 然 后 清 点各 组 观 察 单 位 的 次 数 而 得 的 资 料 。 ( 二 ) 特 点 这 类 资 料 既 有 次 数 资 料 的 特 点 , 又 有 程度 或 量 的 不 同 。 如 粪 便 潜 血 试 验 的 阳 性 反 应 是 在 涂 有 粪 便 的 棉 签 上加 试 剂 后 观 察 颜 色 出 现 的 快 慢 及 深 浅 程 度 分 为 六 个等 级 ; 又 如 用 某 种 药 物 治 疗 畜 禽 的 某 种 疾 病 , 疗 效分 为 “ 无 效 ” 、 “ 好 转 ” 、 “ 显 效 ” 和 “ 控 制 ” 四个 级 别 ; 然 后 统 计 各 级 别 的 供 试 畜 禽 数 。 半 定 量 资料 在 兽 医 研 究 中 是 常 见 的 。三 、 半 定 量 ( 等 级 ) 资 料 资 料 搜 集 与 整 理 统 计 工 作 一 般 分 为 三 个 步 骤 : 收 集 资 料 、整 理 资 料 和 分 析 资 料 。 搜 集 资 料 ( 数 据 ) 是 进 行 统 计 工 作 的 第一 步 也 是 最 重 要 的 一 步 。 如 果 搜 集 数 据的 计 划 不 周 密 , 原 始 记 录 不 正 确 , 往 往会 造 成 整 理 、 分 析 的 困 难 , 甚 至 得 出 错误 的 结 论 , 而 这 些 缺 点 难 以 在 以 后 的 两个 步 骤 中 补 救 的 。 在 搜 集 资 料 时 , 应 注 意 如 下 几 点 : . 要 有 目 的 性 . 要 有 代 表 性 . 样 本 含 量 要 恰 当 资 料 整 理 的 内 容在 调 查 或 试 验 中 所 得 到 的 大 量 数 据 是分 散 的 数 据 。 要 了 解 事 物 总 的 特 征 和 发 展情 况 , 必 须 对 这 些 数 据 进 行 科 学 的 分 组 归纳 , 使 数 据 系 统 化 , 便 于 进 一 步 统 计 分 析以 及 反 映 被 研 究 事 物 的 规 律 性 , 这 个 过 程称 为 数 据 的 整 理 。 通 常 我 们 用 X表 示 变 量 用 ),2,1( nixi 表 示 变 量 值 ,),2,1( nif i 表 示 次 数 。 用 原 始 资 料 的 检 查 与 核 对 资 料 的 整 理 依 次 表 ( 小 样 本 ) 计 数 资 料 的 整 理 与 分 组 ( 采 用 样 本 数 据 的 自然 值 进 行 分 组 ) 计 量 资 料 的 整 理 与 分 组 ( 组 距 式 分 组 法 ) 质 量 性 状 资 料 、 半 定 量 ( 等 级 ) 资 料 的整 理资 料 整 理 的 内 容 获 得 的 资 料 在 未 整 理 之 前 , 称 为 原 始 资 料 。对 原 始 资 料 可 从 以 下 两 个 方 面 进 行 检 查 : 1 资 料 的 完 整 性 原 始 记 录 有 无 遗 漏 或 重 复 2 资 料 的 正 确 性 原 始 数 据 是 否 正 确 、 合 理 , 有 无 矛 盾 , 特别 注 意 特 大 或 特 小 数 据 及 异 常 数 据 。一 、 资 料 的 检 查 与 核 对 二 、 资 料 的 整 理( 一 ) 计 数 资 料 的 整 理( 二 ) 计 量 资 料 的 整 理( 三 ) 质 量 性 状 资 料 、 半 定 量( 等 级 ) 资 料 ) 的 整 理 对 原 始 资 料 进 行 检 查 核 对 后 , 根 据 资 料 中 观 察值 的 多 少 确 定 是 否 分 组 。 1.当 观 察 值 不 多 , 变 异 范 围 不 大 时 , 不 必 分 组 ,直 接 进 行 统 计 分 析 。 ( 依 次 表 ) 2.当 观 察 值 较 多 , 变 异 范 围 较 大 时 , 须 将 观 察值 分 成 若 干 组 , 以 便 统 计 分 析 。 将 观 察 值 分 组 归 类 制 成 次 数 分 布 表 ( “ 唱票 式 ” ) 看 出 资 料 的 集 中 和 变 异 情 况 。 ( 一 ) 计 数 资 料 的 整 理 依 次 表 、 分 组 当 数 据 不 多 时 可 不 必 分 组 , 这 时 可 将 变数 按 数 值 大 小 依 次 排 列 起 来 , 形 成 一 个由 小 到 大 的 数 字 表 , 称 为 “ 依 次 表 ” 。 当 数 据 较 多 时 , 如 30个 变 数 以 上 的 大 样本 , 制 成 “ 依 次 表 ” 则 较 麻 烦 , 这 时 需要 将 数 据 分 成 若 干 组 , 以 便 统 计 分 析 。 大 白 鼠 编 号 1 2 3 4 5 6 7 8 9 10产 仔 数 6 7 4 6 5 8 6 3 7 5表 1-1 10只 大 白 鼠 的 繁 殖 力 单 位 : 只例 如 , 表 1-1为 10只 大 白 鼠 繁 殖 力 的 记 录 ,在 未 加 整 理 以 前 只 是 一 堆 数 字 , 看 不 出 资 料的 任 何 意 义 。 如 将 表 1-1整 理 成 依 次 表( 表 1-2) , 可 以 看 出 10只大 白 鼠 中 繁 殖 力 变 异 的 情况 , 即 产 仔 数 最 高 为 8只 ,最 低 为 3只 , 变 异 范 围 为 3-8只 。 大 白 鼠 编 号 产 仔 数83510147296 3455666778表 1-2 10只 大 白 鼠 的 繁 殖 力 依 次 表 单 位 : 只 表 1-3 50只 小 鸡 的 出 壳 天 数 21 20 20 21 23 22 22 22 21 22 20 23 22 23 22 19 22 23 24 22 19 22 21 21 21 22 22 24 22 21 21 22 22 23 22 22 21 22 22 23 22 23 22 22 23 23 22 21 22 22 从 上 表 可 以 看 出 , 小 鸡 出 壳 天 数 在 19-24之 间 变动 , 用 观 察 值 各 个 不 同 值 进 行 分 组 。 表 1-4 50只 小 鸡 出 壳 天 数 的 次 数 分 布 表出 壳 天 数 划 线 计 数 次 数 ( f) 19 2 20 下 3 21 正 正 10 22 正 正 正 正 止 24 23 正 止 9 24 合 计 2 50 ( 二 ) 计 量 资 料 的 整 理-组 距 式 分 组 法 求 全 距 全 距 是 数 据 内 变 量 最 大 值 与最 小 值 之 差 , 它 是 整 个 样 本 的 变 异 幅 度 。 确 定 组 数 组 数 的 决 定 可 用 经 验 分 组 法 ,它 与 样 本 的 个 体 数 有 关 。 确 定 组 距 每 一 组 内 变 量 的 范 围 跨 度 称为 组 距 。 组 距 =全 距 /组 数 确 定 组 中 值 及 组 限 数 据 归 组 ( 以 唱 票 的 方 式 ) 样 本 含 量 40 60 60 100 100200 200500 500以 上拟 分 组 数 6 8 7 10 9 12 12 17 17 20表 1-5 按 样 本 含 量 决 定 组 数 总 的 变 异 范 围 。 简 称 全 距( 或 极 差 ) , 用 R 来 表 示 。minmax XXR 指 每 组 两 端 表 示 各 组 界 限 的 变 量 值 , 各组 的 最 小 值 为 下 限 L, 最 大 值 为 上 限 U。当 首 、 末 组 组 限 采 用 “ 以 下 ”或 “ 以 上 ” 形 式 时 。 每 组 内 变 量 的 范 围 跨 度 , 为 上下 限 之 差每 组 变 量 取 值 范 围 的 中 点 数 值 2 下限上限 组 中 值 =各 组 只 包 括 本 组 下 限 变 量 值 至本 组 上 限 以 下 变 量 值 的 单 位 。“ 以 上 ” 组 距 数 列 的 上 限 值“ 以 下 ” 组 距 数 列 的 下 限 值 。 先 计 算 开 口 组 的 假 定 上 、 下 限 : 22 相 邻 组 组 距上 限首 组首 组 假 定 下 限首 组 上 限 22 相 邻 组 组 距下 限末 组末 组 假 定 上 限末 组 下 限 以 某 纯 系 蛋 鸡 200枚 蛋 重 资 料 为 例 说 明 其 整 理 的基 本 步 骤 和 方 法 : 1、 求 全 距 R。 资 料 中 , 最 大 值 为 62.1g, 最 小 值 为 45.3g,则 全 距 为 62.1-45.3=16.8g 2、 确 定 组 数 K。 组 数 要 适 当 , 一 般 以 达 到 既简 化 资 料 又 不 影 响 反 映 资 料 的 规 律 性 为 原 则 。具 体 可 参 照 表 1-5.本 例 n=200, 初 步 确 定 组 数 为11组 。 某 纯 系 蛋 鸡 200枚 蛋 重 单 位 : g52.6 54.3 57.7 55.8 45.3 53.2 57.0 54.8 52.3 53.0 49.5 56.257.5 55.9 48.4 51.2 53.8 50.5 50.5 57.0 47.5 54.1 53.2 50.755.6 51.5 57.8 52.5 54.9 57.9 50.7 46.2 56.0 56.5 51.2 48.255.2 55.2 48.5 50.1 58.6 56.1 53.8 50.3 55.6 62.1 57.8 48.054.7 61.2 51.0 51.9 59.0 52.6 53.0 52.9 51.5 58.1 47.2 61.753.7 49.1 56.1 55.1 53.7 53.4 53.9 52.6 52.1 53.8 48.9 53.2 59.2 50.1 57.6 52.8 57.0 61.4 53.4 53.9 56.3 54.1 52.9 50.955.6 47.9 53.7 54.4 56.7 51.1 55.1 55.2 57.5 50.6 57.5 54.1 3、 确 定 组 距 i。 每 组 最 大 值 与 最 小 值 之 差 称 为 组距 , 记 为 i。 本 例 4、 确 定 组 限 及 组 中 值 。 各 组 的 最 大 值 与 最 小 值称 为 组 限 , 最 小 值 为 下 限 , 最 大 值 为 上 限 。 组 中值 是 该 组 的 代 表 值 。 第 一 组 的 组 中 值 以 接 近 或 等 于 资 料 中 的 最 小 值 为好 。 本 例 第 一 组 的 组 中 值 取 45.0( 最 小 值 45.3) ,KRi / 组 数全 距组 距 5.153.111/8.16 i 组 距组 上 限组 距组 下 限组 下 限 )( 组 上 限组 中 值 21212 则 第 一 组 的 下 限第 一 组 上 限 为 : 44.25+1.5=45.75 (第 二 组 下 限 )第 二 组 上 限 为 : 45.75+1.5=47.25 (第 三 组 下 限 )依 次 类 推 , 第 三 组 47.25; 第 四 组 48.75; .依 次 分 组 下 去 ,直 到 资 料 中 的 最 大 值 归 入 最 后 一 组 为 止 。 但 为 了 避 免 个 别 数 据 归 组 的 两 面 性 ( 假 如 资 料中 有 一 枚 重 为 47.25g, 是 将 其 归 入 第 二 组 , 还 是归 入 第 三 组 呢 ? ? ) , 通 常 将 每 组 的 上 限 略 去 不写 。 如 第 一 组 44.25, 第 二 组 45.75, 第 三 组47.25 , .。 5、 归 组 划 线 计 数 , 作 次 数 分 布 表 ( “ 唱 票 式 ” )和 次 数 分 布 图 。 25.445.12/10.45 表 1-6 某 纯 系 蛋 鸡 200枚 蛋 重 的 次 数 分 布 表组 别 组 中 值 画 线 计 数 次 数 ( f)44.25- 45.045.75- 46.547.25- 48.048.75- 49.550.25- 51.051.75- 52.553.25- 54.054.75- 55.556.25- 57.057.75- 58.559.25- 60.0 60.75- 61.5合 计 200 孟 德 尔 在 研 究 分 离 规 律 时 用 纯 种 圆 滑和 纯 种 皱 缩 的 豌 豆 的 杂 交 子 一 代 进 行 自 交试 验 , 他 记 录 了 10个 植 株 所 结 种 子 的 形 态 ,在 原 始 记 录 中 , 种 子 有 两 种 类 型 : 圆 滑 、皱 缩 。 将 原 始 记 录 ( 443粒 ) 按 种 子 类 型 进 行分 组 ( 三 ) 质 量 性 状 资 料 、 半 定 量( 等 级 ) 资 料 的 整 理 植 株 号 圆 滑 种 子 数 量 皱 缩 种 子 数 量12345678910合 计百 分 率表 1-7 10株 子 一 代 自 交 后 分 离 情 况 植 株 号 圆 滑 种 子 数 量 皱 缩 种 子 数 量1 45 122 27 83 24 74 19 105 32 116 26 67 38 248 22 109 28 610 25 7合 计百 分 率表 1-8 10株 子 一 代 自 交 后 分 离 情 况 植 株 号 圆 滑 种 子 数 量 皱 缩 种 子 数 量1 45 122 27 83 24 74 19 105 32 116 26 67 38 248 22 109 28 610 25 7合 计 336 107百 分 率 75.8% 24.2%表 1-9 10株 子 一 代 自 交 后 分 离 情 况 ( 三 ) 质 量 性 状 资 料 、 半 定 量( 等 级 ) 资 料 的 整 理 可 按 性 状 或 等 级 进 行 分 组 , 分 别 统 计 各 组 的 次数 , 然 后 制 成 次 数 分 布 表 。表 1-10 子 二 代 猪 毛 色 分 离 情 况 毛 色 次 数 ( f) 频 率 (%)白 色 83 74.55黑 色 27 25.45合 计 110 100.00 从 变 量 值 低 的 组 开 始 , 将 各 组 次 数( 频 率 ) 逐 次 向 变 量 值 高 的 组 累 计 ,说 明 某 一 组 上 限 以 下 各 组 的 累 计 次 数( 频 率 ) 。 从 变 量 值 高 的 组 开 始 , 将 各 组 次 数( 频 率 ) 逐 次 向 变 量 值 低 的 组 累 计 ,说 明 某 一 组 下 限 以 上 各 组 的 累 计 次 数( 频 率 ) 。各 组 频 数 占 总 频 数 的 比 重 销 售 额( 百 万 元 ) 商 店数 频 率( ) 累 计 次 数 累 计 频 率( )5以 下5 1010 1515 2020 2525以 上合 计 410161343 50 820322686 100f ff 1005016 销 售 额( 百 万 元 ) 商 店数 频 率( ) 累 计 次 数 累 计 频 率( )向 上累 计 向 上累 计5以 下5 1010 1515 2020 2525以 上合 计 41016134350 820322686100 41430434750 828608694100f ff 销 售 额( 百 万 元 ) 商 店数 频 率( ) 累 计 次 数 累 计 频 率( )向 上累 计 向 下累 计 向 上累 计 向 下累 计5以 下5 1010 1515 2020 2525以 上 410161343 820322686 41430434750 5046362073 828608694100 100927240146合 计 50 100 f ff 统 计 表 是 用 表 格 形 式 来 表 示 数 量 关 系 , 使 数据 条 理 化 、 系 统 化 , 便 于 理 解 、 分 析 和 比 较 。统 计 图 是 用 几 何 图 形 来 表 示 数 量 关 系 , 不 同形 状 的 几 何 图 形 , 可 以 将 研 究 对 象 的 特 征 、 内 部构 成 、 相 互 关 系 等 形 象 直 观 地 表 达 出 来 , 便 于 分析 比 较 。 统 计 表 ( 一 ) 统 计 表 的 结 构 和 要 求 统 计 表 由 标 题 、 横 标 目 、 纵 标 目 、 线 条 、 数 字 及合 计 构 成 。 ( 二 ) 统 计 表 的 种 类 1. 简 单 表 由 一 组 横 标 目 和 一 组 纵 标 目 组 成 ,纵 横 标 目 都 未 分 组 。 2. 复 合 表 由 两 组 或 两 组 以 上 的 横 标 目 与 纵 标目 结 合 而 成 , 或 一 组 横 标 目 与 两 组 或 两 组 以 上的 纵 标 目 结 合 而 成 , 或 两 组 或 组 以 上 的 横 、 纵 标目 结 合 而 成 。 浓 度 所 在的 组 限( mg/m3) f 频 率( ) 累 计 次 数 累 计 频 率( )向 上累 计 向 下累 计 向 上累 计 向 下累 计0 0.050.100.150.200.25 合 计 84162132464729 500 16.832.426.49.29.45.8 100 84246378424471500 5004162541227629 16.849.275.684.894.2100 10083.250.824.415.25.8 ff表 1-11 标 题横 标 目纵标目 数字合 计Example 表 1-4 50只 小 鸡 出 壳 天 数 的 次 数 分 布 表 出 壳 天 数 划 线 计 数 次 数 ( f) 19 2 20 下 3 21 正 正 10 22 正 正 正 正 止 24 23 正 止 9 24 合 计 2 50 Example 标 题纵标目 数字合 计出 壳 天 数 划 线 计 数 次 数表 只 小 鸡 出 壳 天 数 的 次 数 分 布 表合 计横 标 目 以 点 、 线 条 、 面 积 等 方 法 描 述 、显 示 统 计 数 据 的 形 式 统 计 图 ( 一 ) 统 计 图 绘 制 的 基 本 要 求 ( 二 ) 常 用 统 计 图 及 其 绘 制 方 法 1.条 形 图 2.直 方 图 3.圆 形 图 4.线 图 ( 折 线 图 ) 5.散 点 图.(特 别 是 随 着 计 算 机 技 术 的 发 展 , 统 计 图的 种 类 越 来 越 丰 富 ) 一 、 平 均 数 ( 主 要 介 绍 算 术 平均 数 Arithmetic Mean)二 、 标 准 差 (Standard Deviation)三 、 变 异 系 数 ( Coefficient of Variability) 1.3 样 本 的 几 个 特 征 数 次 数 分 布 表 和 次 数 分 布 图 , 可 以 形 象 、 直观 地 表 示 出 资 料 的 两 个 特 征 集 中 性 和 离 散 性 。为 了 更 简 单 、 精 确 地 描 述 资 料 的 特 征 , 本 节 介 绍三 个 统 计 量 : 平 均 数 、 标 准 差 和 变 异 系 数 。平 均 数 反 应 资 料 的 集 中 性 , 标 准 差 和 变 异系 数 反 应 资 料 的 离 散 性 。 平 均 数 (Mean)平 均 数 的 意 义 : 平 均 数 用 来描 述 资 料 的 集 中 性 , 即 指 出资 料 中 数 据 集 中 较 多 的 中 心位 置 。 平 均 数 的 作 用 :平 均 数 是 资 料 的 代 表 数 ;常 用 于 同 类 性 质 资 料 间 的 相 互 比 较 。平 均 数 的 种 类 : 其 中 应 用 最 为 普 遍 的 是 算术 平 均 数 , 此 外 还 有 几 何 平 均 数 、 中 数 、众 数 和 调 和 平 均 数 。平 均 数 (Mean) 算 术 平 均 数(Arithmetic Mean) ( 一 ) 算 术 平 均 数 的 定 义 资 料 中 各 观 察 值 的 总 和 除 以 观 察 值 的 个 数 所得 的 商 , 称 为 算 术 平 均 数 。 在 统 计 学 中 , 简称 为 平 均 数 或 均 数 。 用 符 号 表 示 。 x 算 术 平 均 数(Arithmetic Mean) ( 二 ) 计 算 方 法 1、 直 接 法 对 样 本 含 量 较 小 , 未 分 组 的 资 料适 用 。 nxn xxxx ni in 121 其 中 , ( Sigma) 为 总 和 符 号 , 表 示 从 第一 个 观 察 值 x1 累 加 到 第 n个 观 察 值 xn , 若 在 意 义上 已 明 确 时 , 简 记 为 。 x ni ix1算 术 平 均 数(Arithmetic Mean) 关 于 总 和 符 号 的 几 个 性 质 常 数 的 总 和 等 于 该 常 数 的 n倍 , 即 代 数 和 的 总 和 等 于 总 和 的 代 数 和 , 即 总 和 符 号 内 的 常 数 因 子 可 以 提 取 到 总 和 符 号 之外 , 即 nCCni 1 其 中 C为 常 数 ; 注 意 : 在 后 面 一 些 章 节经 常 会 遇 到 C代 表 一 个 为 常 量 的 式 子 iiiiii zyxzyx )( nj ki ijki nj ij xx 1 11 1 ii xaax ( a为 常 数 ) 2、 加 权 法 适 用 于 已 分 组 的 资 料 k kkfff xfxfxfx 21 2211 ffxfxfki iki ii11各 组 的 次 数 fi 是 权 衡 各 组 中 值 xi 在 资 料 中 所 占比 重 大 小 的 数 量 , 因 此 f被 称 为 是 x的 “ 权 ”( right) ,加 权 法 也 由 此 而 得 名 。 xi 各 组 组 中 值 ; fi 各 组 次 数 ; k 分 组 数 。 (三 )平 均 数 的 基 本 性 质 1、 样 本 各 个 观 察 值 与 平 均 数 之 差 的 和 为 零 ,即 离 均 差 之 和 为 零 ; 2、 样 本 各 观 察 值 与 平 均 数 之 差 的 平 方 和 为 最小 , 即 离 均 差 的 平 方 和 最 小 。 0,0)(1 )(简 记 为 xxxxni i 221 21 2 )()( )()( axxxxa axxx ni ini i )(简 记 为 :常 数 3、 统 计 学 已 证 明 , 样 本 平 均 数 是 总 体 平均 数 的 无 偏 估 计 值 。 对 总 体 而 言 , 用 表 示 平 均 数 。 无 偏 估 计 : 当 一 个 统 计 量 的 数 学 期 望 值 等于 等 于 相 应 总 体 参 数 时 , 称 该 统 计 量 为 其 总体 参 数 的 无 偏 估 计 。 x(三 )平 均 数 的 基 本 性 质 几 何 平 均 数(Geometric Mean)( 一 ) 定 义 指 n个 观 察 值 乘 积 的 n次 方 根 。 即 nnn n xxxxxxG 1).(. 2121 几 何 平 均 数(Geometric Mean)( 二 ) 适 用 条 件 主 要 应 用 于 数 据 呈 倍 数 关 系 或 不 对 称分 布 的 资 料 , 算 术 平 均 数 对 这 类 资 料的 代 表 性 差 。 如 抗 体 效 价 ( 1: 10, 1:100, 1: 1000, 1: 10000) 、 增 长 率或 生 长 率 、 动 态 发 展 速 度 等 。 1、 应 用 公 式 计 算 ( 实 际 应 用 时 常 取 对 数 )n nxxxG 21 nxxxnG lglglg1lg 21 ni ixn 1 lg1 ni ixnG 11 lg1lg 例 如 , 海 虾 养 殖 试 验 , 各 旬 的 生 长 速 度3.0, 1.5 1.3, 1.2, 1.2, 1.1, 1.1,求 海 虾 的 旬 平 均 生 长 速 度 。 ,即 海 虾 旬 平 均 生 长 速 度为 1.38。 14.01.1lg22.1lg25.1lg3lg71lg G 38.114.0lg 1 G 几 何 平 均 数(Geometric Mean) 2、 当 资 料 编 成 次 数 分 布 表 时 ,)lg(lg 1 f xfG i 各 组 组 中 值 ; 各 组 次 数 ; 几 何 平 均 数(Geometric Mean)xifi 标 准 差 (Standard Deviation)平 均 数 是 资 料 的 代 表 数 , 其 代表 性 强 弱 受 资 料 中 各 观 察 值 变 异 程度 的 影 响 。 仅 利 用 平 均 数 对 一 个 资料 的 统 计 特 征 作 全 面 描 述 是 不 够 的 ,还 应 引 入 一 个 能 说 明 资 料 各 观 察 值变 异 程 度 大 小 的 统 计 量 。 用 来 表 示 资 料 变 异 程 度 的 指 标较 多 , 常 用 的 有 极 差 、 标 准 差 、变 异 系 数 、 方 差 等 , 其 中 以 方 差与 标 准 差 应 用 最 为 广 泛 。 标 准 差 (Standard Deviation) 一 、 标 准 差 的 引 入 全 距 ( 极 差 ) : 只 利 用 了 资 料 中 最 大 值和 最 小 值 , 不 能 准 确 表 达 资 料 中 各 个 观 察 值的 变 异 程 度 。标 准 差 (Standard Deviation) 一 、 标 准 差 的 引 入 离 均 差 可 表 达 观 察 值 偏 离 平均 数 的 程 度 和 性 质 , 但 由 于 离 均 差 之 和 为零 , 因 此 它 不 能 表 示 整 个 资 料 中 所 有 观 察值 的 总 偏 离 程 度 。 若 用 ,使 用 起 来 又 不 方 便 , 在统 计 学 中 未 被 采 用 。 xx )( xx标 准 差 (Standard Deviation) 为 消 除 离 均 差 的 负 号 , 先 将 各 离 均 差平 方 ; 再 求 离 均 差 的 平 方 之 和( 简 称 平 方 和 , 记 为 SS) , 为 消 除 样 本 含 量 的 影 响 以 离均 差 的 平 方 和 除 以 自 由 度 n-1。 则 统 计 量 称 为 均 方( 缩 写 为 MS) , 又 称 为 样 本 方 差 , 记为 S2 , 即 :2)( xx 2)( xx )1/()( 2 nxx 标 准
展开阅读全文