现代社会调查方法之抽样.ppt

上传人:xt****7 文档编号:20886980 上传时间:2021-04-20 格式:PPT 页数:87 大小:3.63MB
返回 下载 相关 举报
现代社会调查方法之抽样.ppt_第1页
第1页 / 共87页
现代社会调查方法之抽样.ppt_第2页
第2页 / 共87页
现代社会调查方法之抽样.ppt_第3页
第3页 / 共87页
点击查看更多>>
资源描述
章 第 四 章 抽 样 抽 样 目 的 要 求掌 握 概 率 抽 样 的 原 理 、 程 序 与 方 法 ;掌 握 抽 样 误 差 的 概 念 与 测 量 方 法 ;熟 悉 非 概 率 抽 样 方 法 与 样 本 规 模 ;了 解 抽 样 的 意 义 ; 目 录 抽 样 的 意 义 与 作 用1 概 率 抽 样 的 原 理 与 程 序2 概 率 抽 样 方 法3 非 概 率 抽 样 方 法4 样 本 规 模 与 抽 样 误 差5 以 上 现 象 是 否 说 明 了 这样 一 个 道 理 :我 们 可 以 通 过 对 部 分 的观 察 来 推 论 总 体 的 情 况 。“ 管 中 窥 豹 , 可 见 一 斑 ”“ 一 叶 知 秋 ”在 日 常 生 活 当 中 所 熟知 的 抽 样 有 哪 些 ? 一 、 抽 样 的 意 义 与 作 用(一 )抽 样 的 意 义 人 们 在 研 究 某 个 自 然 现 象 或 社 会 现 象 时 , 往 往 会 遇 到不 方 便 、 不 可 能 或 不 必 要 对 所 有 的 对 象 作 调 查 的 情 况 ,于 是 从 中 抽 取 一 部 分 对 象 作 调 查 , 这 就 是 抽 样 .复 杂 的 社 会 现 象 有 限 的 研 究 资 源 抽 样 主 要 涉 及 和 处 理 有 关 总 体 与 部 分 之 间 的 关 系 问 题 。抽 样 作 为 人 们 从 部 分 认 识 整 体 这 一 过 程 的 关 键 环 节 , 其基 本 作 用 是 向 人 们 提 供 一 种 实 现 “ 由 部 分 认 识 总 体 ” 这一 目 标 的 途 径 和 手 段 。 抽 样 ( 二 ) 抽 样 的 作 用 抽 样 是 社 会 研 究 的 主 要 内 容 之 一 , 也 是 社 会 调 查的 一 个 重 要 步 骤 。 它 与 研 究 目 的 及 研 究 内 容 紧 密 相 关 。 它 直 接 关 系 到 资 料 的 收 集 、 整 理 与 分 析 。 它 还 涉 及 到 整 个 研 究 的 费 用 以 及 应 用 的 范 围 。 抽 样 是 否 科 学 , 直 接 关 系 到 研 究 的 成 败一 、 抽 样 的 意 义 与 作 用 ( 三 ) 抽 样 的 相 关 概 念抽 样 ( sampling) :从 组 成 某 个 总 体 的 所 有 元 素 的 集 合 中 ,按 一 定 的 方 式 选 择 或 抽 取 一 部 分 元 素 的 过 程 。总 体 ( population) : 构 成 它 的 所 有 元 素 的 集 合例 : 四 川 省 应 届 毕 业 生 择 业 倾 向 调 查 。 通 常 用 N表 示样 本 ( sample) 从 总 体 中 按 一 定 方 式 抽 取 出 的 一 部 分 元 素的 集 合 。例 : 12.8万 名 应 届 毕 业 生 中 抽 取 1000名 大 学 生 。 通 常 用 n表示一 、 抽 样 的 意 义 与 作 用 抽 样 单 位 ( sampling unit) 一 次 直 接 的 抽 样 所 使 用 的 基 本 单 位 。抽 样 单 位 与 构 成 总 体 的 元 素 有 时 是 相 同 有 时 又 不 同 。如 12.8万 大 学 生 , 当 以 1000名 大 学 生 作 为 样 本 时 ? 当 以 40个 班 级作 为 样 本 时 ?抽 样 框 ( sampling frame) 抽 样 范 围 , 指 一 次 直 接 抽 样 时 总 体 中所 有 抽 样 单 位 的 名 单 。例 : 从 一 所 中 学 的 全 体 学 生 中 抽 取 200名 学 生 作 为 调 查 样 本 。 从 一 所 中 学 的 所 有 班 级 中 抽 取 20个 班 级 作 为 调 查 样 本 。参 数 值 ( parameter) 是 对 总 体 中 某 一 变 量 的 综 合 描 述 , 或 总 体中 所 有 元 素 某 些 特 征 的 综 合 数 量 表 现 。 最 常 见 的 参 数 值 是 总 体某 一 变 量 的 平 均 值 。 参 数 值 只 有 对 总 体 中 的 每 一 个 元 素 进 行 调查 或 测 量 才 能 得 到 。例 : 某 市 待 业 青 年 平 均 年 龄 , 某 工 厂 工 人 的 平 均 收 入 。一 、 抽 样 的 意 义 与 作 用 统 计 值 ( statistic) 是 对 样 本 中 某 一 变 量 的 综 合 描 述 , 或 样 本中 所 有 元 素 某 些 特 征 的 综 合 数 量 表 现 。 根 据 样 本 计 算 出 来 的关 于 样 本 变 量 的 数 量 表 现 。统 计 值 是 从 样 本 中 计 算 出 来 的 , 它 是 相 应 的 参 数 值 的 估 计 值 。参 数 值 : 确 定 的 、 唯 一 的 、 未 知 的 。 统 计 值 : 变 化 的 。置 信 度 ( confidence level) 总 体 参 数 值 落 在 样 本 统 计 值 某 一区 间 内 的 概 率 , 或 者 说 , 是 总 体 参 数 值 落 在 样 本 统 计 值 某 一区 间 内 的 把 握 性 程 度 。反 映 的 是 样 本 的 可 靠 性 程 度 。 如 置 信 水 平 为 95%, 则 表 示 总体 参 数 值 落 在 样 本 统 计 值 某 一 区 间 的 概 率 为 95%。置 信 区 间 ( confidence intevalue) 上 述 “ 某 一 区 间 ” , 就 是置 信 区 间 。 指 在 一 定 置 信 水 平 下 , 样 本 统 计 值 与 总 体 参 数 值之 间 的 误 差 范 围 。 与 误 差 范 围 成 正 比 。一 、 抽 样 的 意 义 与 作 用 依 据 概 率 论 的 基 本 原理 , 按 照 等 概 率 原 则进 行 的 抽 样 , 能 够 避免 抽 样 过 程 中 的 人 为误 差 , 保 证 样 本 的 代表 性 依 据 研 究 者 的 主 观 意愿 、 判 断 或 是 否 方 便等 因 素 来 抽 取 对 象 ,往 往 产 生 较 大 误 差 ,难 以 保 证 样 本 的 代 表性 。 ( 四 ) 抽 样 的 类 型 根 据 抽 取 对 象 的 具 体 方 式 分 类 :概 率抽 样 非 概率 抽 样一 、 抽 样 的 意 义 与 作 用 抽 样 方 法 概 率 抽 样非 概 率 抽 样 简 单 随 机 抽 样系 统 抽 样分 层 抽 样整 群 抽 样多 段 抽 样偶 遇 抽 样判 断 抽 样定 额 抽 样雪 球 抽 样 ( 一 ) 概 率 抽 样 的 基 本 原 理1.无 意 识 抽 样 导 致 的 偏 差方 便 获 取 的 样 本 : 易 得 , 但 缺 乏 代 表 性 ; 例 如 : 如 何 获 取 由 100个 学 生 构 成 的 样 本访 问 者 的 偏 好 影 响 样 本 的 代 表 性 ; 例 如 : 有 意 回 避 具 有 某 些 特 (“ 酷 ” 、 “ 冷 ” )的 受 访 者抽 样 的 地 点 影 响 样 本 的 代 表 性 例 如 : 图 书 馆 门 口 访 问二 、 概 率 抽 样 的 原 理 与 程 序 ( 一 ) 概 率 抽 样 的 基 本 原 理2.同 质 性 和 异 质 性 买 100支 单 价 为 1元 的 铅 笔 , 在 结 账 的 时 候 是 用 乘法 还 是 加 法 ?买 10支 单 价 为 1元 的 铅 笔 、 20支 单 价 为 2元 的 签 字笔 和 30支 单 价 为 5元 的 钢 笔 , 结 账 时 该 如 何 计 算 ?10*1+20+2+30*5100铅 笔 具 有 同 质 性 , 60支 笔 具 有 异 质 性 ( 价 格 不同 )二 、 概 率 抽 样 的 原 理 与 程 序 对 于 具 有 同 质 性 的 总 体 , 我 们 只 需 要 了 解 其 中 一 个 成 员 , 就能 知 道 整 个 群 体 的 情 况 ; 对 于 具 有 异 质 性 总 体 , 我 们 往 往 需要 根 据 总 体 内 部 的 不 同 特 征 选 取 一 定 数 量 具 有 代 表 性 的 样 本来 推 论 总 体 的 情 况 。 例 : 西 南 医 科 大 学 在 校 生 网 购 情 况 分 析研 究 总 体 : 西 南 医 科 大 学 在 校 大 一 、 大 二 、 大 三 学 生是 否 具 有 同 质 性 ?否 , 不 同 经 济 状 况 、 消 费 观 念 会 导 致 不 同 的 网 购 行 为采 用 抽 样 调 查 : 选 取 100个 具 有 代 表 性 的 样 本 来 推 论 西 南医 科 大 学 在 校 生 的 网 购 情 况 。 ( 二 ) 抽 样 分 布 抽 样 分 布 是 根 据 概 率 的 原 则 而 成 立 的 理 论 分 布 ,它 显 示 出 : 从 一 个 总 体 中 不 断 抽 取 样 本 时 , 各 种可 能 出 现 的 样 本 统 计 值 的 分 布 情 况 。二 、 概 率 抽 样 的 原 理 与 程 序 当 样 本 容 量 为 2个 时 , 根 据 组 合 公 式 计 算 总 共 可 以 抽 取 45个 不 同 的 样本 , 这 些 样 本 的 平 均 数 范 围 从 6.5年 ( 当 ) 到 14.5年 , 其 中 会 产 生 一些 相 同 的 平 均 数 , 比 如 6-14, 7-13, 8-12, 9-11这 四 个 样 本 的 平 均数 都 是 10年 。 当 样 本 容 量 为 3个 时 , 可 以 抽 取 120个 样 本 , 这 些 样 本 的平 均 数 范 围 从 7年 到 14年 , 其 中 相 同 的 平 均 数 更 多 。 当 样 本 容 量 继 续 增 大 时 ( 越 来 越 接 近 总 体 的1/2时 ) , 样 本 平 均 数 的 分 布 会 进 一 步 发 生 变化 。 趋 势 是 : 平 均 数 的 范 围 将 逐 步 缩 小 ( 即 分 布 图的 底 部 越 来 越 窄 ) ; 相 同 的 平 均 数 会 相 应 增 多; 全 部 平 均 数 的 分 布 向 总 体 平 均 数 集 中 的 趋 势也 会 越 来 越 明 显 。 根 据 “ 中 心 极 限 定 理 ” , 当 n( 抽 取 的 样 本 量 ) 足 够 大时 ( 通 常 假 定 大 于 30) , 无 论 总 体 的 分 布 如 何 , 其 样 本平 均 数 所 构 成 的 分 布 都 趋 于 正 态 分 布 。 根 据 概 论 统 计 理 论 , 正 态 根 部 曲 线 下 的 任 何 部 分 的 面 积都 可 以 用 数 学 方 法 推 算 。 这 意 味 着 , 任 何 两 个 数 值 之 间的 样 本 平 均 数 次 数 所 占 的 比 例 都 是 可 以 求 得 的 。约 有 68%的 样 本 平 均 数 在 “ ”这 两 个 数 值 的 范 围 内 约 有 95.46%的 样 本 统 计 值 落 在 总 体 参 数 值 正 负 两 个 标 准 差 范 围 内 。se 在 实 际 应 用 中 , 人 们 更 多 的 是 采 用 以 下 几 个 数 字 :有 90%落 在 之 间 ;有 95%落 在 之 间 ;如 果 从 反 面 来 考 虑 这 一 结 论 , 可 以 得 出 以 下 推 论 : 对 于 任何 一 次 随 机 抽 样 来 说 , 其 样 本 的 统 计 值 落 在 总 体 参 数 值 正负 1.65个 标 准 差 之 间 的 概 率 是 90%。只 要 我 们 采 用 的 是 随 机 抽 样 的 方 法 , 就 可 以 根 据 抽 样 分 布, 用 样 本 的 数 值 来 推 论 总 体 的 情 况 。SE65.1 SE96.1 界 定 总 体 : 对 从 中 抽 取 样 本 的 总 体 范 围 与 界 限 作 明 确 的界 定 制 定 抽 样 框 : 依 据 已 经 明 确 界 定 的 总 体 范 围 , 收 集 总 体中 全 部 抽 样 单 位 的 名 单 , 并 通 过 对 名 单 进 行 统 一 编 号 来建 立 起 供 抽 样 使 用 的 抽 样 框 决 定 抽 样 方 案 : 选 择 抽 样 方 法 , 确 定 样 本 规 模 实 际 抽 取 样 本 :评 估 样 本 质 量 :二 、 概 率 抽 样 的 原 理 与 程 序( 三 ) 抽 样 的 一 般 程 序 例 : 西 南 医 科 大 学 在 校 生 学 习 倦 怠 的 原 因 及 影 响 因 素 的 调 查界 定 总 体 : 所 有 西 南 医 科 大 学 在 校 学 生制 定 抽 样 框 : 假 定 有 3万 名 在 校 生 , 则 需 要 搜 集 所 有 3万 名 学生 名 单 , 进 行 统 一 编 号 来 建 立 起 供 抽 样 使 用 的 抽 样 框 。决 定 抽 样 方 案 : 根 据 实 际 的 情 况 , 选 择 合 适 的 抽 样 方 法 , 并确 定 样 本 规 模 。 如 选 择 简 单 随 机 抽 样 , 样 本 规 模 为 200人 。抽 取 样 本 :评 估 样 本 质 量 :对 样 本 的 代 表 性 、 偏 差 等 进 行 检 验 在 实 践 上 可 行 可 行 性 目的性最 有 利 于 研 究 资 料的 获 取 和 最 符 合 研究 的 目 的与 研 究 的 可 得 资源 相 适 应 能 够 从 样 本 自 身计 算 出 有 效 的 估计 值 或 抽 样 变 动的 近 似 值( 四 ) 抽 样 设 计 的 原 则美 国 抽 样 专 家 科 什 ( kish) 教 授 提 出 一 个 优 秀 的 抽 样 设 计 应 该 满 足的 四 条 标 准 : 经 济 性可 测 性目 的 性可 行 性四 条 标 准 之 间 存 在 着 一 定 的 制 约 关 系 , 甚 至 相 互 冲 突 。增 加 可 测 性 加 大 样 本 容 量 增 加 资 源 经 济 性 减 弱实 际 的 抽 样 设 计 就 是 研 究 者 在 这 四 条 标 准 中 进 行 取 舍 和 保 持 平 衡 的 过 程 三 、 概 率 抽 样 的 方 法 偶 遇 抽 样判 断 抽 样定 额 抽 样雪 球 抽 样简 单 随 机 抽系 统 多 层 抽 样分 层 抽 样整 群 抽 样多 段 抽 样概 率 抽 样非 概 率 抽 样抽 样 类 型 概 率 抽 样 是 按 照 概 率 原 理 进 行 的 , 它 要 求 样 本 具 有 随 机 性 ,即 总 体 中 每 一 个 成 员 都 有 被 抽 中 的 可 能 性 。 不 同 形 式 的 概 率 抽 样 对 选 择 涉 及 调 查 研 究 问 题 的 性 质 、 良好 的 抽 样 框 的 获 得 、 调 查 研 究 经 费 的 多 少 、 资 料 收 集 方 法等 因 素 有 不 同 的 要 求 。 又 称 纯 随 机 抽 样 , 是 按 照 等 概 率 原 则 直 接 从 含 有 N个 元 素 的 总 体中 抽 取 n个 元 素 组 成 样 本 ( Nn) , 常 用 的 办 法 是 抽 签 。 概 率 抽 样的 最 基 本 形 式 。要 点 : 它 要 求 被 抽 取 样 本 的 总 体 的 个 体 数 有 限它 是 从 总 体 中 逐 个 进 行 抽 取它 是 一 种 不 放 回 抽 样它 是 一 种 等 概 率 抽 样用 从 个 体 数 为 N的 总 体 中 抽 取 一 个 容 量 为 n的样 本 , 那 么 每 个 个 体 被 抽 取 的 概 率 等 于 Nn 方 法 : 1.总 体 较 少 : 搅 拌 抽 签 ; 2.总 体 较 多 : 用 随 机 数 表 抽 签 法 (抓 阄 法 ) 将 总 体 中 的 所 有 个 体 ( 共 N个 ) 编 号( 号 码 可 以 从 1到 N) , 并 把 号 码 写 在形 状 、 大 小 相 同 的 号 签 上 ( 号 签 可 以用 小 球 、 卡 片 、 纸 条 等 制 作 ) , 然 后 将这 些 号 签 放 在 同 一 个 箱 子 里 , 进 行 均 匀搅 拌 。 抽 签 时 , 每 次 从 中 抽 出 1 个 号 签 ,连 续 抽 取 n次 , 就 得 到 一 个 容 量 为 n的样 本 。 对 个 体 编 号 时 , 也 可 以 利 用 已 有的 编 号 。 例 如 学 生 的 学 号 , 座 位 号 等 。 随 机 数 表 法随 机 数 表 是 统 计 工 作 者 用 计 算 机 生 成 的 随 机 数 , 保 证 表中 的 每 个 位 置 上 的 数 字 是 等 可 能 出 现 的用 随 机 数 表 进 行 抽 样 的 步 骤 : 将 总 体 中 个 体 编 号 ; 选 定开 始 的 数 字 ; 获 取 样 本 号 码用 随 机 数 表 抽 取 样 本 , 可 以 任 选 一 个 数 作 为 开 始 , 读 数的 方 向 可 以 向 左 , 也 可 以 向 右 、 向 上 、 向 下 等 等 。 因 此并 不 是 唯 一 的由 于 随 机 数 表 是 等 概 率 的 , 因 此 利 用 随 机 数 表 抽 取 样 本保 证 了 被 抽 取 个 体 的 概 率 是 相 等 的 简 单 随 机 抽 样 方 法 的 优 缺 点 优 点 :可 能 产 生 代 表 性 样 本 缺 点 :不 容 易 做抽 样 元 素 多 , 编 号 难必 须 能 够 接 触 到 被 选 中 的 个 体搅 拌 均 匀 不 易 定 义 : 等 距 抽 样 或 机 械 抽 样 , 将 总 体 的 元 素 编 号排 序 后 , 按 照 固 定 的 间 隔 抽 取 个 体 组 成 样 本 的 方法 。 系 统 抽 样 的 具 体 步 骤 1、 给 总 体 中 的 每 一 个 元 素 按 顺 序 编 上 号 码 , 制 定 出 抽样 框 。 2、 计 算 出 抽 样 时 间 距 , 方 法 是 用 总 体 的 规 模 除 以 样 本的 规 模 。 K( 抽 样 间 隔 ) =N( 总 体 规 模 ) /n( 样 本 规 模 ) 3、 在 最 前 面 的 K个 元 素 中 , 采 用 简 单 随 机 抽 样 的 方 法 抽取 一 个 元 素 , 记 下 这 个 元 素 的 编 号 ( 假 设 为 A) , A称为 随 机 起 点 。 4、 在 抽 样 框 中 , 自 A开 始 , 每 隔 K个 元 素 抽 取 一 个 元 素 ,即 所 抽 元 素 编 号 为 A, A+K, A+2K, A+( n-1) K。 5、 将 这 n个 元 素 合 起 来 , 就 构 成 了 该 总 体 的 一 个 样 本 。 系 统 抽 样 例 子 : 某 校 3000名 新 生 中 抽 取 100名 样 本 。 3000/100=30 每 隔 30人 取 1名 。 起 始 值 是 2号 , 下 一 个 就 是 32号 。 依 次 类 推 。 注 意 1: 系 统 抽 样 的 一 个 十 分 重 要 的 前 提 条 件 , 是 总 体中 个 体 的 排 列 , 相 对 于 研 究 的 变 量 来 说 是 随 机 的 , 即 不存 在 某 种 与 研 究 变 量 相 关 的 规 则 分 布 。 否 则 , 系 统 抽 样的 结 果 将 会 产 生 极 大 的 偏 差 。 例 如 : 从 总 体 2000户 家 庭 的 社 区 中 , 抽 取 一 个 50户 家 庭 的 样 本 进 行调 查 消 费 状 况 的 调 查 , 而 这 2000户 家 庭 的 名 单 是 按 每 个 家 庭 总 收 入的 多 少 , 由 高 到 低 的 顺 序 排 列 的 。 初 始 号 码 为 3和 38, 所 抽 样 本 家庭 平 均 收 入 有 很 大 区 别 , 消 费 状 况 也 有 很 大 区 别 。注 意 2: 元 素 排 列 的 周 期 性 可 能 导 致 抽 样 的 重 大 偏 差 ! 例 如 : 每 个 班 级 内 的 50名 学 生 按 照 学 生 成 绩 的 高 低 来 排序 , 抽 样 间 距 为 50, 每 个 班 抽 取 一 名 学 生 组 成 样 本 , 初始 号 码 为 2或 48号 , 所 抽 样 本 的 平 均 成 绩 差 别 很 大 系 统 抽 样 的 优 缺 点 优 点 : ( 1) 简 单 易 操 作 ( 2) 当 对 总 体 结 构 有 一 定 了 解 时 , 充 分 利 用 已 有 的 信 息 对 总 体 中 的 个体 进 行 排 队 后 再 抽 样 , 可 提 高 抽 样 效 率 ( 3) 当 总 体 中 的 个 体 存 在 一 种 自 然 编 号 时 , 采 用 系 统 抽 样 比 较 方 便 缺 点 : ( 4) 当 在 不 了 解 样 本 总 体 的 情 况 下 ( 如 性 别 差 异 , 经 济 基 础 , 个 人 喜好 , 天 气 因 素 等 等 ) , 所 抽 出 的 样 本 可 能 会 有 一 定 的 偏 差 。 ( 三 ) 分 层 抽 样 ( stratified sampling)又 称 类 型 抽 样 , 它 是 先 将 总 体 中 的 所 有 元 素 按 某种 特 征 或 标 志 ( 如 性 别 、 年 龄 、 地 域 等 ) 划 分 成若 干 类 型 或 层 次 , 然 后 再 在 各 个 类 型 或 层 次 中 采用 简 单 随 机 抽 样 或 系 统 抽 样 的 办 法 抽 取 一 个 子 样本 , 最 后 将 子 样 本 合 起 来 构 成 样 本 。 分 层 抽 样 的 步 骤1.总 体 与 样 本 容 量 确 定 抽 取 的 比 例 。2.由 分 层 情 况 , 确 定 各 层 抽 取 的 样 本 数 。3.各 层 的 抽 取 数 之 和 应 等 于 样 本 容 量 。4.对 于 不 能 取 整 的 数 , 求 其 近 似 值 。 Nnk ii Nkn nni nnNkn iii ,每 部 分 抽 取 的 个 体 数 样 本 容 量 该 部 分 的 个 体 总 数 总 体 中 的 个 体 数 分 层 抽 样 举 例 一 个 单 位 的 职 工 有 500人 , 其 中 不 到 35岁 的 有 125人 ,35 49岁 的 有 280人 , 50岁 以 上 的 有 95人 。 为 了 了 解 该 单 位 职工 年 龄 与 身 体 状 况 的 有 关 指 标 , 从 中 抽 取 100名 职 工 作 为 样 本 ,应 该 怎 样 抽 取 ? 解 : 抽 取 人 数 与 职 工 总 数 的 比 是 100: 500 1: 5,则 各 年 龄 段 ( 层 ) 的 职 工 人 数 依 次 是 125: 280: 95 25: 56: 19, 然 后 分 别 在 各 年 龄 段 ( 层 ) 运 用 简 单 随 机 抽样 方 法 抽 取 。 答 : 在 分 层 抽 样 时 , 不 到 35岁 、 35 49岁 、 50岁 以 上 的 三 个年 龄 段 分 别 抽 取 25人 、 56人 和 19人 。 在 不 增 加 样 本 规 模 的 前 提 下 降 低 抽 样 误 差 , 提 高 抽 样 精 度 , 增 大 代表 性 。便 于 了 解 总 体 内 不 同 层 次 的 情 况 , 以 及 对 总 体 中 的 不 同 层 次 进 行 单独 研 究 或 者 进 行 比 较 。 对 抽 样 框 的 要 求 比 较 高 , 必 须 有 分 层 的 辅 助 信 息 ;收 集 或 编 制 抽 样 框 的 费 用 比 较 高 ;若 调 查 变 量 与 分 层 的 变 量 不 相 关 , 效 率 可 能 降 低 ; 分 层 的 标 准 问 题 三 种 抽 样 方 法 的 比 较类 别 各 自 特 点 相 互 联 系 适 用 范 围 共 同 点简 单 随 机 抽 样 从 总 体 中逐 个 抽 取 总 体 中 的 个体 数 较 少 抽 样 过 程中 每 个 个体 被 抽 取的 概 率 相等系 统 抽 样 将 总 体 均 分 成 几 部分 , 按 事 先 确 定 的规 则 在 各 部 分 抽 取 在 起 始 部 分 抽 样时 采 用 简 单 随 机抽 样 总 体 中 的 个体 数 较 多分 层 抽 样 将 总 体 分 成 几 层 ,分 层 进 行 抽 取 各 层 抽 样 时 采 用简 单 随 机 抽 样 或系 统 抽 样 总 体 由 差 异明 显 的 几 部分 组 成简 单 随 机 抽 样 最 简 单 , 但 是 也 是 相 对 复 杂 的 。 系 统 抽 样 操 作 简 单 ,在 有 充 分 的 总 体 信 息 的 前 提 下 , 估 计 精 度 比 随 机 抽 样 高 , 且 操 作、 简 单 。 分 层 抽 样 由 于 已 经 利 用 了 总 体 信 息 , 因 此 估 计 精 度 也 比 随 机 简 单 抽 样 要 高 。 ( cluster sampling) 将 总 体 按 某 种 标 准 划 分 为 一 些 子 群 体 , 每 个 子 群 为 一 个 抽 样 单 位 ,用 随 机 方 法 从 中 抽 若 干 子 群 , 将 抽 出 的 子 群 中 的 所 有 个 体 结 合 起 来构 成 样 本 。 整 群 抽 样 例 子 : 大 学 有 100个 班 , 每 班 30人 , 现 在 抽 300人 , 怎 么 抽 样 ? 抽 10个 班 。 某 城 市 10万 户 , 要 抽 取 1000户 , 怎 么 办 ? 社 区 200个 , 社 区 户 数 500。 选 2个 社 区 。 整 群 抽 样 特 点 : 抽 样 单 位 不 是 单 个 的 个 体 , 而 是 成 群 的 个 体 优 缺 点 : 优 点 : 不 需 要 详 细 的 所 有 元 素 的 名 单 , 简 单 , 费 用低 缺 点 : 样 本 的 分 布 面 不 广 , 代 表 性 相 对 较 差 整 群 抽 样 和 分 层 抽 样 的 比 较 : 子 群 间 异 质 性 强 , 群 内 同 质 性 强 分 层 抽 样 子 群 间 同 质 性 强 , 群 内 异 质 性 强 整 群 抽 样 ( 五 ) 多 阶 段 抽 样 ( multidstage sampling) 按 抽 样 元 素 的 隶 属 关 系 或 层 次 关 系 , 把 抽 样 分 为 几 个 阶 段 进 行 。 在社 会 调 查 中 , 当 总 体 的 规 模 特 别 大 , 或 者 总 体 分 布 的 范 围 特 别 广 时 ,研 究 者 一 般 采 取 多 段 抽 样 的 方 法 来 抽 取 样 本 。 例 1: 大 学 院 系 班 级 学 生 例 2: 城 市 区 街 道 居 委 会 家 庭 个 人 如 调 查 “ 泸 州 市 青 年 工 人 收 入 状 况 ” ,首 先 以 企 业 为 单 位 抽 样 , 即 以 全 市 的 企 业 为 抽 样 框 , 从中 随 机 抽 取 一 部 分 企 业 ( 5) ;然 后 在 抽 中 的 企 业 中 以 车 间 为 抽 样 单 位 抽 样 , 即 从 全 部 车 间 中 抽 取 若 干 个 车 间 ( 20) :最 后 , 在 抽 中 的 车 间 内 抽 取 青 年 工 人 ( 1000人 ) 五 种 概 率 抽 样 方 法 比 较“ 四 川 医 科 大 学 在 校 学 生 食 堂 满 意 度 调 查 ” , 总 共 有 学生 10000人 , 其 中 男 生 6000人 , 女 生 4000人 ; 学 院 22个 , 大一 2000人 , 大 二 3000人 , 大 三 3000人 , 大 四 2000人 。 抽 取1000个 样 本 。简 单 随 机 抽 样 方 法 :先 根 据 10000个 学 生 的 名 单 制 作 抽 样 框 , 然 后 根 据 随 机 数表 或 抓 阄 方 式 抽 取 1000名 学 生 。系 统 抽 样 :先 根 据 10000个 学 生 的 名 单 制 作 抽 样 框计 算 抽 样 间 距 : 10000/1000=10在 10000个 学 生 中 随 机 抽 取 一 个 学 生 : 例 如 33号在 抽 样 框 中 从 33号 开 始 每 隔 10个 学 生 抽 取 一 个 样 本 : 43、53、 63、 73. 分 层 抽 样首 先 把 10000名 学 生 分 为 男 生 、 女 生 两 个 部 分 ,男 生 6000人 、女 生 4000人 , 比 例 为 3:2采 用 随 机 抽 样 或 系 统 抽 样 方 法 , 按 照 每 部 分 抽 取 个 体 数 :该 部 分 的 个 体 总 数 =样 本 容 量 : 总 体 中 的 个 体 数 原 则 , 从女 生 中 抽 取 400人 , 男 生 中 抽 取 600人 , 组 成 样 本 。或将 10000名 学 生 分 为 大 一 、 大 二 、 大 三 、 大 四 四 个 部 分 ,大 一 2000人 , 大 二 3000人 , 大 三 3000人 , 大 四 2000人采 用 随 机 抽 样 或 系 统 抽 样 方 法 , 按 照 每 部 分 抽 取 个 体 数 :该 部 分 的 个 体 总 数 =样 本 容 量 : 总 体 中 的 个 体 数 原 则 , 大一 中 抽 取 200人 , 大 二 中 抽 取 300人 , 大 三 抽 取 300人 , 大四 中 抽 取 200人 , 组 成 样 本 。 整 群 抽 样把 全 校 22个 学 院 作 为 抽 样 框 , 从 22个 学 院 中 采 用 简 单 随 机抽 样 、 分 层 抽 样 或 系 统 抽 样 的 方 法 抽 取 3个 学 院 , 将 3个 学院 中 所 有 的 学 生 所 有 调 查 样 本 。多 阶 段 抽 样把 全 校 2个 各 学 院 作 为 抽 样 框 , 从 22个 学 院 中 采 用 简 单 随机 抽 样 、 分 层 抽 样 或 系 统 抽 样 的 方 法 抽 取 5个 学 院 ;从 5个 学 院 的 所 有 班 级 作 为 抽 样 框 ( 如 80个 班 级 ) , 从 80个班 级 中 采 用 简 单 随 机 抽 样 、 分 层 抽 样 或 系 统 抽 样 的 方 法 抽取 个 40班 级 ;以 40个 班 级 中 的 所 有 学 生 作 为 抽 样 框 , 采 用 简 单 随 机 抽 样 、分 层 抽 样 或 系 统 抽 样 的 方 法 抽 取 1000名 学 生 作 为 调 查 样 本 ; ( 六 ) PPS抽 样是 一 种 常 用 的 不 等 概 率 抽 样 方 法 , 叫 做 “ 概 率 与元 素 的 规 模 大 小 成 比 例 的 抽 样 ” 。 多 段 抽 样 中 , 其 实 暗 含 了 一 个 假 定 : 即 每 一 个 阶 段 抽 样 时 , 其 元 素 的规 模 是 相 同 的 。 比 如 第 一 阶 段 抽 取 学 校 时 , 暗 含 了 每 个 学 校 的 规 模 相 同 。 在 这 样 的 假 定 下 , 采 取 上 述 几 种 随 机 抽 样 的 方 法 , 最 终 每 名 学 生 被 抽中 的 概 率 相 等 。 但 现 实 生 活 中 , 每 一 个 学 校 包 含 的 学 生 人 数 不 同 , 因而 按 照 上 述 多 段 抽 样 的 方 法 来 抽 取 样 本 时 , 最 终 每 名 学 生被 抽 中 的 概 率 实 际 上 是 不 同 的 。 从 100所 学 校 中 抽 取 10所 学 校 ( 规 模 不 一 样 大 ) 假 设 甲 学校 比 较 大 , 有 2万 名 学 生 , 乙 学 校 比 较 小 , 只 有 3千 名 学 生。 那 么 当 二 者 在 第 一 阶 段 都 被 抽 中 后 , 第 二 阶 段 分 别 从 他们 中 抽 取 500名 学 生 , 甲 学 校 学 生 被 抽 中 的 概 率 为 :(10/100)*(500/20000)=1/400 乙 学 校 学 生 被 抽 中 的 概 率 为 :(10/100)*(500/30000)=1/600 PPS抽 样 原 理 : 以 阶 段 性 的 不 等 概 率 换 取 最 终 的 、 总 体 的等 概 率 。 做 法 ( 以 二 阶 段 为 例 ) : 1、 在 第 一 阶 段 , 每 个 群 按 照 其 规 模 ( 其 所 含 元素 的 数 量 ) 被 给 予 大 小 不 等 的 抽 取 概 率 。 2、 到 了 第 二 阶 段 , 从 每 个 抽 中 的 群 中 都 抽 取 同样 多 的 元 素 ( 也 是 不 等 概 率 的 ) 。 正 是 这 一 大 一 小 , 平 衡 了 由 于 群 的 规 模 带 来 的概 率 差 异 。 公 式每 一 个 元 素被 抽 中 的 概 率 所 抽 取 的 群 数 总 体 的 规 模群 的 规 模 群 的 规 模平 均 每 个 群 中所 要 抽 取 的 元 素 PPS的做法已经排除了群的规模这一影响因素第一个分子与第二个分母相互约掉了每一个元素的被选中概率变成了:(所抽取的群数*每个群中所抽取的元素数目)/总体的规模。 这实际上就是样本规模除以总体规模。 PPS的 具 体 操 作 方 法 :1、 在 确 定 的 总 体 内 , 给 每 个 抽 样 单 位 按 序 编 号, 并 且 写 出 它 们 的 规 模 ;2、 累 计 相 加 每 个 抽 样 单 位 包 含 的 单 位 数 , 并 根据 累 计 相 加 结 果 确 定 每 个 单 位 的 号 码 范 围 ;3、 采 用 随 机 数 表 的 方 法 或 等 距 抽 样 的 方 法 选 择号 码 , 号 码 所 对 应 的 单 位 入 选 第 一 阶 段 样 本 ;4、 在 被 抽 取 的 单 位 中 , 按 照 抽 样 元 素 的 多 少 进行 第 二 阶 段 抽 样 。 用 PPS方 法 抽 取 第 一 阶 段 样 本 举 例学校序号 学生人数/人 累计人数/人 号码范围 入选号码 入样单位01 4000 4000 000001-004000 002032 单位102 5000 9000 004001-00900003 3200 12200 009001-012200 009786 单位204 20000 32200 012201-032200 012234029824 单位3、4 05 6000 38200 032201-038200 99 10000 492000 482001-492000 484551 单位20100 8000 500000 492001-500000 ( 七 ) 户 内 抽 样 当 研 究 者 以 家 庭 作 为 分 析 单 位 , 以 入 户 进行 结 构 式 访 谈 的 方 法 收 集 资 料 时 , 往 往 采取 多 阶 段 的 抽 样 方 法 , 市 ( 县 ) 镇 ( 乡) 村 ( 街 ) 居 委 会 ( 居 民 组 ) 家 庭 家 庭 成 员 。 以 家 庭 为 单 位 时 , 从 入 选 家 庭 中 抽 取 一 个 成 年 人 构 成 访谈 对 象 的 抽 样 方 法 。 方 法 : 科 什 选 择 法 ( kish)如 : 关 于 开 展 农 村 土 地 集 中 化 生 产 调 查 研 究 具 体 做 法 :1.调 查 表 编 号 : 将 调 查 问 卷 编 号 为 A、 B1、 B2、 C、 D、 E1、 E2、 F八 种 , 每 种 表 的 数 目 分 别 占 调 查 问 卷 总数 的 1/6、 1/12、 1/12、 1/6、 1/6、 1/12、 1/12、1/6。2.印 制 选 择 卡 : 印 制 若 干 套 ( 1套 八 种 ) ” 选 择 卡 “发 给 调 查 员 , 每 人 1套 。3.给 抽 中 家 庭 每 个 成 年 人 按 照 男 性 在 前 、 年 龄 大 的 在前 的 方 法 进 行 编 号 并 排 序 。 4.根 据 调 查 表 上 的 编 号 找 出 编 号 相 同 的 那 种 “ 选 择 表” 查 出 中 选 个 体 的 序 号 , 进 行 调 查 。 Kish 选 择 表A 式 选 择 表如 果 家 庭 户 中 18岁以 上 人 口 数 为 被 抽 选 人的 序 号 为1 12 13 1 4 15 16或 以 上 1 F 式 选 择 表如 果 家 庭 户 中 18岁 以 上 人 口 数 为 被 抽 选 人的 序 号 为1 12 23 34 45 56或 以 上 6 序 号 年 龄 和 性 别 特 征1 最 年 长 的 男 性2 次 年 长 的 男 性 n 最 年 幼 的 男 性n+1 最 年 长 的 女 性n+2 次 年 长 的 女 性 n+m 最 年 幼 的 女 性 序 号 成 员 特 征1 爸 爸 50岁2 儿 子 23岁3 奶 奶 70岁4 妈 妈 48岁 5 女 儿 27岁 序 号 成 员 特 征1 爸 爸 50岁2 儿 子 23岁3 奶 奶 70岁4 妈 妈 48岁 5 女 儿 27岁 F 式 选 择 表如 果 家 庭 户 中 18岁 以 上 人 口 数 为 被 抽 选 人的 序 号 为1 12 23 34 45 56或 以 上 6 (一 )偶 遇 抽 样 定 义 : 方 便 抽 样 或 自 然 抽 样 , 指 研 究 者 根 据 现 实 情 况 ,以 自 己 方 便 的 形 式 抽 取 偶 然 遇 到 的 人 作 为 对 象 , 或 者仅 仅 选 择 那 些 离 得 最 近 、 最 容 易 找 到 的 人 作 为 对 象 。适 用 范 围可 用 于 经 常 性 的 市 场 调 查 ;可 用 于 正 式 市 场 调 查 之 前 的 试 验 调 查 ;任 意 调 查 适 用 于 同 质 总 体 。 优 点 : 方 便 、 灵 活 , 简 便 易 行 , 及 时 取 得 所 需资 料 , 节 约 时 间 和 费 用 成 本 低缺 点 : 样 本 的 代 表 性 差 、 有 很 大 的 偶 然 性 。 例 : 1.在 商 场 、 码 头 等 公 共 场 所 调 查 2.街 头 拦 截 调 查 3.报 刊 的 读 者 调 查 : 也 叫 立 意 抽 样 , 研 究 者 根 据 自 己 的 主 观 判 断 来 抽 选 样本 , 分 为 印 象 判 断 抽 样 和 经 验 判 断 抽 样 。印 象 判 断 抽 样 : 纯 粹 凭 研 究 者 的 主 观 印 象 抽 样经 验 判 断 抽 样 : 根 据 以 往 经 验 和 对 调 查 对 象 的 了 解 抽 样注 意 的 问 题 : 判 断 抽 样 的 关 键 是 抽 样 标 准 的 确 立 , 这 种 方 法 的 运 用与 研 究 者 本 人 的 因 素 比 如 理 论 修 养 、 实 践 经 验 以 及 对 调 查对 象 的 熟 悉 程 度 有 关 : 多 用 于 无 法 确 定 总 体 边 界 、 或 总 体 规模 小 、 调 查 所 涉 及 的 范 围 较 窄 , 或 调 查 时 间 、 人力 等 条 件 有 限 而 难 以 进 行 大 规 模 抽 样 的 情 况 。 优 点 : 可 以 充 分 发 挥 研 究 人 员 的 主 观 能 动 作 用 。样 本 是 按 照 调 查 人 员 的 需 要 来 选 定 的 , 所 以 较 好地 满 足 了 特 殊 的 调 查 需 要 。 缺 点 : 如 果 调 查 人 员 在 选 取 样 本 时 主 观 判 断 出 现偏 差 , 则 判 断 抽 样 极 易 发 生 较 大 的 抽 样 误 差 。 样本 的 代 表 性 难 以 判 断 , 不 能 推 论 。 例 : 某 高 校 有 2000名 学 生 , 其 中 男 生 占 60 , 女 生 占 40 ;文 科 学 生 和 理 科 学 生 各 占 50 ; 一 年 级 学 生 占 40 、 二 年 级 、三 年 级 、 四 年 级 学 牛 分 别 占 30 、 20 和 10 。 现 在 要 用 定额 抽 样 方 法 依 上 述 3个 变 数 抽 取 一 个 规 模 为 100人 的 样 本 。 依据 总 体 的 构 成 和 样 本 规 模 , 我 们 可 得 到 下 列 定 额 表 定 额 抽 样 与 分 层 抽 样 的 区 别 在 于 , 定 额 抽 样 最 后 抽 取样 本 时 所 采 用 的 方 法 是 非 随 机 抽 样 。配 额 抽 样 的 优 点 适 用 于 设 计 调 查 者 对 总 体 的 有 关 特 征 具 有 一 定 的 了 解而 样 本 数 较 多 的 情 况 下 , 实 际 上 , 配 额 抽 样 属 于 先 “ 分层 ” ( 事 先 确 定 每 层 的 样 本 量 ) 再 “ 判 断 ” ( 在 每 层 中以 判 断 抽 样 的 方 法 选 取 抽 样 个 体 ) ; 费 用 不 高 , 易 于 实施 , 能 满 足 总 体 比 例 的 要 求 。 配 额 抽 样 的 缺 点 (四)滚雪球抽样 当 无 法 了 解 总 体 时 , 可 以 从 总 体 中 少 数 成 员 入 手 , 对他 们 进 行 调 查 , 并 进 一 步 询 问 还 知 道 哪 些 符 合 条 件 的 再进 一 步 询 问 。例 : 对 球 迷 、 戏 迷 的 调 查缺 点 : 同 质 性 较 强 优 点 : 简 单 、 易 行 , 可 以 获 得 对 调 查 对 象 的 大 致 了 解 。缺 点 : 代 表 性 差 , 调 查 资 料 不 能 从 数 量 上 推 断 总 体 。 :又称样本容量,就是指样本所含个案的数量。 确 定 样 本 规 模 也 是 每 一 项 具 体 的 社 会 研 究 所 必 须 解 决 的 问 题 之 一 .l统 计 学 与 社 会 研 究 的 样 本统 计 学 中 通 常 以 30为 界 ,把 样 本 分 为 大 样 本 和 小 样 本 .社 会 研 究 中 的 样 本 规 模 至 少 不 能 少 于 100个 个 案 , 确 定 样 本 规 模 需 要 考 虑 的 因 素 : 1.推 断 的 把 握 性 与 精 确 度 ; 2.总 体 的 规 模 ; 3.总 体 的 异 质 性 程 度 ; 4.应 答 率 ; 5.研 究 者 所 拥 有 的 资 源 。 1.推 断 的 把 握 性 与 精 确 度 置 信 度 : 把 握 性 置 信 区 间 : 精 确 度 一 般 地 说 , 在 其 他 条 件 不 变 的 情 况 下 , 置 信 度 越 高 ,即 推 断 的 可 靠 程 度 越 高 , 所 要 求 的 样 本 规 模 就 越 大 ; 置 信 区间 越 小 ,即 样 本 值 与 总 体 值 之 间 误 差 范 围 越 小 , 所 要 求 的 样本 规 模 就 越 大 。 不 同 允 许 误 差 水 平 所 需 的 最 少 样 本 量 2.总 体 的 规 模 在 置 信 度 和 抽 样 误 差 不 变 的 条 件 下 , 样 本 规 模 是 随 着 总体 规 模 的 扩 大 而 扩 大 , 但 样 本 占 总 体 的 比 重 却 不 断 缩 小 。 当 总 体 规 模 大 到 一 定 程 度 时 (例 如 100万 ), 样 本 规 模 的 增加 对 抽 样 误 差 的 影 响 就 微 乎 其 微 。例 如 : 美 国 大 选 的 民 意 调 查 中 样 本 通 常 不 超 过 3000 总 体 规 模 与 样 本 规 模 的 关 系(置 信 度 95%, 抽 样 误 差 3%) 1000 350 352000 460 233000 480 16 5000 550 1110000 600 620000 640 3.250000 650 1.3100000 680 0.68500000 700 0.14 3.总 体 的 异 质 性 程 度 : 异 质 性 程 度 越 高 , 所 需 样 本规 模 越 大例 如 做 淘 宝 店 主 研 究 时 候 , 发 了 六 万 份 问 卷 ,只 回 收 到 了 2%的 问 卷 , 应 答 率 很 低 , 但 是 淘 宝 店主 是 一 类 同 质 性 很 高 的 总 体 , 如 果 异 质 性 稍 高 一些 调 查 也 就 失 败 了 。 4.应 答 率 。应 答 率 的 多 少 直 接 影 响 到 获 得 数 据 样 本 的多 少 , 进 而 影 响 到 测 量 效 率 , 应 答 率 高 通常 就 会 采 用 合 理 的 样 本 量 , 应 达 率 低 通 常要 增 大 样 本 量 。 5.研 究 者 所 拥 有 的 资 源 。可 用 资 源 多 为 了 保 守 起 见 , 通 常 会 对 样 本 量 做 保守 估 计 , 既 尽 可 能 增 大 样 本 量 , 反 之 亦 然 。 ( 二 ) 抽 样 误 差 : 样 本 的 统 计 值 与 总 体 的 参 数 值 之 间 的 误 差 。 由 于 抽 样 本 身 所 具 有 的 随 机 性 所 引 起 , 是 不 可 避 免 的 。抽 样 误 差 : 抽 样 的 随 机 性 引 起非 抽 样 误 差 : 人 为 原 因 导 致 的 误 差注 意 : 并 非 样 本 规 模 越 大 调 查 结 果 就 越 精 确 ! THANKYOU
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!