SPSS-20.0-学习教程

上传人:gbs****77 文档编号:10633708 上传时间:2020-04-13 格式:DOC 页数:51 大小:1.56MB
返回 下载 相关 举报
SPSS-20.0-学习教程_第1页
第1页 / 共51页
SPSS-20.0-学习教程_第2页
第2页 / 共51页
SPSS-20.0-学习教程_第3页
第3页 / 共51页
点击查看更多>>
资源描述
1 SPSS20 0工具简介 最新 统计要与大量的数据打交道 涉及繁杂的计算和图表绘制 现代的数据分析 工作如果离开统计软件几乎是无法正常开展 在准确理解和掌握了各种统计方法原 理之后 再来掌握几种统计分析软件的实际操作 是十分必要的 常见的统计软件有 SAS SPSS MINITAB EXCEL 等 这些统计软件的功 能和作用大同小异 各自有所侧重 其中的 SAS 和 SPSS 是目前在大型企业 各 类院校以及科研机构中较为流行的两种统计软件 特别是 SPSS 其界面友好 功 能强大 易学 易用 包含了几乎全部尖端的统计分析方法 具备完善的数据定义 操作管理和开放的数据接口以及灵活而美观的统计图表制作 SPSS 在各类院校以 及科研机构中更为流行 SPSS Statistical Product and Service Solutions 意为统计产品与服务解决方案 自 20 世纪 60 年代 SPSS 诞生以来 为适应各种操作系统平台的要求经历了多次版 本更新 各种版本的 SPSS for Windows 大同小异 在本试验课程中我们选择 PASW Statistics 20 0 作为统计分析应用试验活动的工具 1 SPSS 的运行模式 SPSS 主要有三种运行模式 1 批处理模式 这种模式把已编写好的程序 语句程序 存为一个文件 提交给 开始 菜单上 SPSS for Windows Production Mode Facility 程序运行 2 完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作 用户无须学会编程 简 单易用 3 程序运行模式 这种模式是在语句 Syntax 窗口中直接运行编写好的程序或者在脚本 script 窗口中运行脚本程序的一种运行方式 这种模式要求掌握 SPSS 的语句或 脚本语言 本试验指导手册为初学者提供入门试验教程 采用 完全窗口菜单运行模式 2 SPSS 的启动 1 在 windows 开始 程序 PASW 在它的次级菜单中单击 SPSS 12 0 for Windows 即可启动 SPSS 软件 进入 SPSS for Windows 对话框 如图 1 1 2 图 1 2 所示 图 1 1 SPSS 启动 图 1 1 PASW Statistics 启动对话框 3 SPSS 软件的退出 SPSS 软件的退出方法与其他 Windows 应用程序相同 有两种常用的退出方法 按 File Exist 的顺序使用菜单命令退出程序 直接单击 SPSS 窗口右上角的 关闭 按钮 回答系统提出的是否存盘的问题 3 之后即可安全退出程序 4 SPSS 的主要窗口介绍 SPSS 软件运行过程中会出现多个界面 各个界面用处不同 其中 最主要的 界面有三个 数据编辑窗口 结果输出窗口和语句窗口 1 数据编辑窗口 启动 SPSS 后看到的第一个窗口便是数据编辑窗口 如图 1 3 所示 在数据编 辑窗口中可以进行数据的录入 编辑以及变量属性的定义和编辑 是 SPSS 的基本 界面 主要由以下几部分构成 标题栏 菜单栏 工具栏 编辑栏 变量名栏 观 测序号 窗口切换标签 状态栏 图 1 3 数据浏览界面 标题栏 显示数据编辑的数据文件名 菜单栏 通过对这些菜单的选择 用户可以进行几乎所有的 SPSS 操作 关于菜单的详细的操作步骤将在后续实验内容中分别介绍 为了方便用户操作 SPSS 软件把菜单项中常用的命令放到了工具栏里 当鼠 标停留在某个工具栏按钮上时 会自动跳出一个文本框 提示当前按钮的功能 另 外 如果用户对系统预设的工具栏设置不满意 也可以用 视图 工具栏 设 定 命令对工具栏按钮进行定义 菜单栏 工具栏 编辑栏 观 测 序 号 变量名栏 窗口切换标签 状态栏 标题栏 4 编辑栏 可以输入数据 以使它显示在内容区指定的方格里 变量名栏 列出了数据文件中所包含变量的变量名 观测序号 列出了数据文件中的所有观测值 观测的个数通常与样本容量 的大小一致 窗口切换标签 用于 数据视图 和 变量视图 的切换 即数据浏览窗 口与变量浏览窗口 数据浏览窗口用于样本数据的查看 录入和修改 变量浏览窗 口用于变量属性定义的输入和修改 状态栏 用于说明显示 SPSS 当前的运行状态 SPSS 被打开时 将会显示 PASW Statistics Processor 的提示信息 2 结果输出窗口 在 SPSS 中大多数统计分析结果都将以表和图的形式在结果观察窗口中显示 窗口右边部分显示统计分析结果 左边是导航窗口 用来显示输出结果的目录 可 以通过单击目录来展开右边窗口中的统计分析结果 当用户对数据进行某项统计分 析 结果输出窗口将被自动调出 当然 用户也可以通过双击后缀名为 spo 的 SPSS 输出结果文件来打开该窗口 5 试验1 数据文件管理 一 试验目的与要求 通过本试验项目 使学生理解并掌握 SPSS 软件包有关数据文件创建和整理的 基本操作 学习如何将收集到的数据输入计算机 建成一个正确的 SPSS 数据文件 并掌握如何对原始数据文件进行整理 包括数据查询 数据修改 删除 数据的排 序等等 二 试验原理 SPSS 数据文件是一种结构性数据文件 由数据的结构和数据的内容两部分构 成 也可以说由变量和观测两部分构成 一个典型的 SPSS 数据文件如表 2 1 所示 表 2 1 SPSS 数据文件结构 姓名 性别 年龄 张三 1 45 李四 2 23 王五 2 45 SPSS 变量的属性 SPSS 中的变量共有 10 个属性 分别是变量名 Name 变量类型 Type 长度 Width 小数点位置 Decimals 变量名标签 Label 变量名值标签 Value 缺失值 Missing 数据列的显示宽度 Columns 对其方式 Align 和度量尺度 Measure 定义一个变量至少要定义它的两个属性 即变 量名和变量类型 其他属性可以暂时采用系统默认值 待以后分析过程中如果有需 要再对其进行设置 在 spss 数据编辑窗口中单击 变量视窗 标签 进入变量视 窗界面 如图 2 1 所示 即可对变量的各个属性进行设置 观测 变量 数据内容 6 图 2 1 变量视窗 三 试验内容与步骤 1 创建一个数据文件 数据文件的创建分成三个步骤 1 选择菜单 文件 新建 数据 新建一个数据文件 进入数据 编辑窗口 窗口顶部标题为 PASW Statistics 数据编辑器 2 单击左下角 变量视窗 标签进入变量视图界面 根据试验的设计定义 每个变量类型 3 变量定义完成以后 单击 数据视窗 标签进入数据视窗界面 将每个 具体的变量值录入数据库单元格内 2 读取外部数据 当前版本的 SPSS 可以很容易地读取 Excel 数据 步骤如下 1 按 文件 打开 数据 的顺序使用菜单命令调出打开数据对 话框 在文件类型下拉列表中选择数据文件 如图 2 2 所示 7 图 2 2 Open File 对话框 2 选择要打开的 Excel 文件 单击 打开 按钮 调出打开 Excel 数据源 对话框 如图 2 3 所示 对话框中各选项的意义如下 工作表 下拉列表 选择被读取数据所在的 Excel 工作表 范围 输入框 用于限制被读取数据在 Excel 工作表中的位置 图 2 3 Open Excel Data Source 对话框 3 数据编辑 8 在 SPSS 中 对数据进行基本编辑操作的功能集中在 Edit 和 Data 菜单中 4 SPSS 数据的保存 SPSS 数据录入并编辑整理完成以后应及时保存 以防数据丢失 保存数据文 件可以通过 文件 保存 或者 文件 另存为 菜单方式来执行 在数 据保存对话框 如图 2 5 所示 中根据不同要求进行 SPSS 数据保存 图 2 5 SPSS 数据的保存 5 数据整理 在 SPSS 中 数据整理的功能主要集中在 数据 和 转换 两个主菜单下 1 数据排序 Sort Case 对数据按照某一个或多个变量的大小排序将有利于对数据的总体浏览 基本操 作说明如下 选择菜单 数据 排列个案 打开对话框 如图 2 7 所示 2 抽样 Select Case 在统计分析中 有时不需要对所有的观测进行分析 而可能只对某些特定的对象有 兴趣 利用 SPSS 的 Select Case 命令可以实现这种样本筛选的功能 以 SPSS 安装 配套数据文件 Growth study sav 为例 选择年龄大于 10 的观测 基本操作说明 9 图 2 7 排列个案 对话框 如下 打开数据文件 Growth study sav 选择 数据 选择个案 命令 打开 对话框 如图 2 8 图 2 8 选择个案对话框 指定抽样的方式 全部个案 不进行筛选 如果条件满足 按指定条 件进行筛选 本例设置 产品数量 150 如图 2 9 所示 10 图 2 9 选择个案 对话框 设置完成以后 点击 continue 进入下一步 确定未被选择的观测的处理方法 这里选择默认选项 过滤掉未选定的个 案 单击 ok 进行筛选 结果如图 2 10 图 2 10 选择个案的结果 3 增加个案的数据合并 合并文件 添加个案 将新数据文件中的观测合并到原数据文件中 在 SPSS 中实现数据文件纵向合 并的方法如下 11 选择菜单 数据 合并文件 添加个案 如图 2 11 选择需要追加 的数据文件 单击打开按钮 弹出 Add Cases 对话框 如图 2 12 图 2 11 选择个体数据来源的文件 图 2 12 选择变量 4 增加变量的数据合并 合并文件 添加变量 增加变量时指把两个或多个数据文件实现横向对接 例如将不同课程的成绩文 12 件进行合并 收集来的数据被放置在一个新的数据文件中 在 SPSS 中实现数据文 件横向合并的方法如下 选择菜单 数据 合并文件 添加变量 选择合并的数据文件 单 击 打开 弹出添加变量 如图 2 12 所示 图 2 12 单击 Ok 执行合并命令 这样 两个数据文件将按观测的顺序一对一地横 向合并 5 数据拆分 Split File 在进行统计分析时 经常要对文件中的观测进行分组 然后按组分别进行分 析 例如要求按性别不同分组 在 SPSS 中具体操作如下 选择菜单 数据 分割文件 打开对话框 如图 2 13 所示 13 图 2 13 分割文件对话框 选择拆分数据后 输出结果的排列方式 该对话框提供了 3 种方式 对全 部观测进行分析 不进行拆分 在输出结果种将各组的分析结果放在一起 进行比较 按组排列输出结果 即单独显示每一分组的分析结果 选择分组变量 选择数据的排序方式 单击 ok 按钮 执行操作 6 计算新变量 在对数据文件中的数据进行统计分析的过程中 为了更有效地处理数据和反 映事务的本质 有时需要对数据文件中的变量加工产生新的变量 比如经常需要把 几个变量加总或取加权平均数 SPSS 中通过 计算 菜单命令来产生这样的新变 量 其步骤如下 选择菜单 转换 计算变量 打开对话框 如图 2 14 所示 14 图 2 14 Compute Variable 对话框 在目标变量输入框中输入生成的新变量的变量名 单击输入框下面类型与标签 按钮 在跳出的对话框中可以对新变量的类型和标签进行设置 在数字表达式输入框中输入新变量的计算表达式 例如 年龄 20 单击 如果 按钮 弹出子对话框 如图 2 15 所示 包含所有个体 对所有的 观测进行计算 如果个案满足条件则包括 仅对满足条件的观测进行计算 单击 Ok 按钮 执行命令 则可以在数据文件中看到一个新生成的变量 15 图 2 15 如果 子对话框 四 备择试验 某航空公司 38 名职员性别和工资情况的调查数据 如表 2 3 所示 试在 SPSS 中进行如下操作 1 将数据输入到 SPSS 的数据编辑窗口中 将 gender 定义为字符型变量 将 salary 定义为数值型变量 并保存数据文件 命名为 试验 1 1 sav 2 插入一个变量 income 定义为数值型变量 3 将数据文件按性别分组 4 查找工资大于 40000 美元的职工 5 当工资大于 40000 美元时 职工的奖金是工资的 20 当工资小于 40000 美 元时 职工的奖金是工资的 10 假设实际收入 工资 奖金 计算所有职工的 实际收入 并添加到 income 变量中 表 2 3 某航空公司 38 名职员情况的调查数据表 Id Gender Salary Id Gender Salary 1 M 57000 20 F 26250 16 2 M 40200 21 F 38850 3 F 21450 22 M 21750 4 F 21900 23 F 24000 5 M 45000 24 F 16950 6 M 32100 25 F 21150 7 M 36000 26 M 31050 8 F 21900 27 M 60375 9 F 27900 28 M 32550 10 F 24000 29 M 135000 11 F 30300 30 M 31200 12 M 28350 31 M 36150 13 M 27750 32 M 110625 14 F 35100 33 M 42000 15 M 27300 34 M 92000 16 M 40800 35 M 81250 17 M 46000 36 F 31350 18 M 103750 37 M 29100 19 M 42300 38 M 31350 17 试验2 描述统计 一 试验目的与要求 统计分析的目的在于研究总体特征 但是 由于各种各样的原因 我们能够 得到的往往只能是从总体中随机抽取的一部分观察对象 他们构成了样本 只有通 过对样本的研究 我们才能对总体的实际情况作出可能的推断 因此描述性统计分 析是统计分析的第一步 做好这一步是进行正确统计推断的先决条件 通过描述性 统计分析可以大致了解数据的分布类型和特点 数据分布的集中趋势和离散程度 或对数据进行初步的探索性分析 包括检查数据是否有错误 对数据分布特征和规 律进行初步观察 本本试验旨在于 引到学生利用正确的统计方法对数据进行适当的整理和显 示 描述并探索出数据内在的数量规律性 掌握统计思想 培养学生学习统计学的 兴趣 为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实 的基础 二 试验原理 描述统计是统计分析的基础 它包括数据的收集 整理 显示 对数据中有 用信息的提取和分析 通常用一些描述统计量来进行分析 集中趋势的特征值 算术平均数 调和平均数 几何平均数 众数 中位数 等 其中均数适用于正态分布和对称分布资料 中位数适用于所有分布类型的资料 离散趋势的特征值 全距 内距 平均差 方差 标准差 标准误 离散系 数等 其中标准差 方差适用于正态分布资料 标准误实际上反映了样本均数的波 动程度 分布特征值 偏态系数 峰度系数 他们反映了数据偏离正态分布的程度 三 试验内容与步骤 下面给出的一个例题是来自 SPSS 软件自带的数据文件 Employee data 该文 件包含某公司员工的工资 工龄 职业等变量 我们将利用此例题给出相关的描述 统计说明 本例中 我们将以员工的当前工资为例 计算该公司员工当前工资的一 些描述统计量 如均值 频数 方差等 描述统计量的计算 1 频数分析 Frequencies 1 1频数分析多适用于离散变量 其功能是描述离散变量的分布特征 18 基本统计分析往往从频数分析开始 通过频数分析能够了解变量取值的状况 对把握数据的分布特征是非常有用的 比如 在某项调查中 想要知道被调查者的 性别分布状况 频数分析的第一个基本任务是编制频数分布表 SPSS 中的频数分 布表包括的内容有 1 频数 Frequency 即变量值落在某个区间中的次数 2 百分比 Percent 即各频数占总样本数的百分比 3 有效百分比 Valid Percent 即各频数占有效样本数的百分比 这里有效 样本数 总样本 缺失样本数 4 累计百分比 Cumulative Percent 即各百分比逐级累加起来的结果 最 终取值为百分之百 频数分析的第二个基本任务是绘制统计图 统计图是一种最为直接的数据刻 画方式 能够非常清晰直观地展示变量的取值状况 频数分析中常用的统计图包括 条形图 饼图 直方图等 频数分析的应用步骤 在 SPSS 中的频数分析的实现步骤如下 选择菜单 文件 打开 数据 在对话框中找到需要分析的数据 文件 SPSS Employee data 然后选择 打开 选择菜单 分析 描述统计 频率 如图 2 1 所示 图2 1 Frequencies对话框 确定所要分析的变量 例如 年龄 在变量选择确定之后 在同一窗口上 点击 Statistics 按钮 打开统计量对话 询问是否输出频数分布表 19 框 如下图 2 2 所示 选择统计输出选项 图2 2 统计量子对话框 图2 3 Charts子对话框 结果输出与分析 点击 Frequencies 对话框中的 OK 按钮 即得到下面的结果 20 表2 4 描述性统计量 Statistics Gender N Valid 474 Missing 0 表 2 4 中给出了总样本量 N 其中变量 Gender 的有效个数 Valid 为 474 个 缺失值 missing 为 0 表2 5 Gender频数分布表 Frequency Percent Valid Percent Cumulative Percent Valid Female 216 45 6 45 6 45 6 Male 258 54 4 54 4 100 0 Total 474 100 0 100 0 表 2 5 中 Frequency 是频数 Percent 是按总样本量为分母计算的百分比 Valid Percent 是以有效样本量为分母计算的百分比 Cumulative Percent 是累计百分 比 图 2 5 变量 Gender 的条形图 图 2 6 变量 Gender 的饼图 Femal MaleGndr05102530FrequncyGendr 图2 5 变量gender的条形图 FemalMr 图2 6 变量gender的饼图 2 描述统计 Descriptives 2 2 描述统计主要对定距型或定比型数据的分布特征作具体分析 21 SPSS 的 描述 命令专门用于计算各种描述统计性统计量 本节利用某年国 内上市公司的财务数据来介绍描述统计量在 SPSS 中的计算方法 具体操作步骤如 下 选择菜单 分析 描述统计 描述 如图 2 7 所示 图 2 7 描述 对话框 将待分析的变量移入 Variables 列表框 例如将每股收益率 净资产收益率 资产负债率等 2 个变量进行描述性统计 以观察上市公司股权集中度情况和负债比 率的高低 Save standardized values as variables 对所选择的每个变量进行标准化处理 产生相应的 Z 分值 作为新变量保存在数据窗口中 其变量名为相应变量名前加 前缀 z 标准化计算公式 sxiZ 单击 选项 按钮 如图 2 8 所示 选择需要计算的描述统计量 各描述统 计量同 Frequencies 命令中的 Statistics 子对话框中大部分相同 这里不再重复 22 图 2 8 选项 子对话框 在主对话框中单击 ok 执行操作 结果输出与分析 在结果输出窗口中给出了所选变量的相应描述统计 如表 2 6 所示 从表中可 以看到 我国上市公司前两大股东持股比例之比平均高达 102 9 说明 一股独大 的现象比较严重 前五大股东持股比例之和平均为 51 8 资产负债率平均为 46 78 另外 从偏态和峰度指标看出 前两大股东持股比例之比的分布呈现比较明 显的右偏 而且比较尖峭 为了验证这一结论 可以利用 Frequencies 命令画出变 量 z 的直方图 如图 2 9 表2 6 描述统计量表 Descriptive Statistics N Mean Std Skewnes s Kurtosis Statistic Statistic Statistic Statistic Std Error Statistic Std Error 前两大股东持股比例 之比 315 102 865 199 1997 46 4 168 137 22 404 274 前五大股东持股比例 的平方和 315 51836 1496003 602 137 318 274 23 资产负债率 315 4677 16773 165 137 414 274 Valid N listwise 315 2 0 02 04 06 08 0Zscore 东东36091250Frequncy Mean 1 4273E6Std Dv0 Histogram 图 2 9 变量 Z 的直方图 3 探索分析 Explore 调用此过程可对变量进行更为深入详尽的描述性统计分析 故称之为探索分 析 它在一般描述性统计指标的基础上 增加有关数据其他特征的文字与图形描述 显得更加细致与全面 对数据分析更进一步 探索分析一般通过数据文件在分组与不分组的情况下获得常用统计量和图形 一般以图形方式输出 直观帮助研究者确定奇异值 影响点 还可以进行假设检验 以及确定研究者要使用的某种统计方式是否合适 在打开的数据文件上 选择如下命令 选择菜单 分析 描述统计 探索 打开对话框 24 因变量列表 待分析的变量名称 例如将每股收益率作为研究变量 因子列表 从源变量框中选择一个或多个变量进入因子列表 分组变量可以 将数据按照该观察值进行分组分析 标准个案 在源变量表中指定一个变量作为观察值的标识变量 在输出栏中 选择两者都 表示输出图形及描述统计量 选择 统计量 按钮 选择想要计算的描述统计量 如图所示 对所要计算的变量的频数分布及其统计量值作图 打开 Plots 对话框 出现如 下图 结果的输出与说明 25 1 Case Processing Summary 表 在Case Processing Summary 表中可以看出female 有216个个体 Male258个个体 均无缺 失值 2 Descriptives 表 Descriptives Gender Statistic Std Error Mean 26 031 92 514 258 Lower Bound 25 018 29 95 Confidence Interval for Mean Upper Bound 27 045 55 5 Trimmed Mean 25 248 30 Median 24 300 00 Variance 57123688 2 68 Std Deviation 7 558 021 Minimum 15 750 Maximum 58 125 Range 42 375 Interquartile Range 7 013 Skewness 1 863 166 Female Kurtosis 4 641 330 Mean 41 441 78 1 213 96 8 Lower Bound 39 051 19 95 Confidence Interval for Mean Upper Bound 43 832 37 5 Trimmed Mean 39 445 87 Median 32 850 00 Variance 380219336 303 Std Deviation 19 499 214 Minimum 19 650 Maximum 135 000 Range 115 350 Interquartile Range 22 675 Skewness 1 639 152 Current Salary Male Kurtosis 2 780 302 3 职位员工薪水直方图显示 26 20 30 40 50 60 Curent Salry0102030 40Frequncy Mean 26 031 9Std Dv758N for gendr FmaleHist 4 茎叶图描述 茎叶图自左向右可以分为3 大部分 频数 Frequency 茎 Stem 和叶 Leaf 茎表 示数值的整数部分 叶表示数值的小数部分 每行的茎和每个叶组成的数字相加再乘以茎宽 Stem Width 即茎叶所表示的实际数值的近似值 Current Salary Stem and Leaf Plot for gender Female Frequency Stem Leaf 2 00 1 55 16 00 1 6666666666777777 14 00 1 88889999999999 31 00 2 0000000000000111111111111111111 35 00 2 22222222222222222222233333333333333 38 00 2 44444444444444444444444444555555555555 22 00 2 6666666666677777777777 17 00 2 88888899999999999 7 00 3 0001111 8 00 3 22233333 8 00 3 44444555 5 00 3 66777 2 00 3 88 27 11 00 Extremes 40800 Stem width 10000 Each leaf 1 case s 5 箱图 Femal MaleGendr 02 40 6 80 1 20 14 Curent Salry 43150634822413768 29031 图中灰色区域的方箱为箱图的主体 上中下3 条线分别表示变量值的第75 50 25百分位 数 因此变量的50 观察值落在这一区域中 方箱中的中心粗线为中位数 箱图中的触须线是中间的纵向直线 上端截至线为变量的最 大值 下端截至线为变量的最小值 四 备择试验 完成下列试验内容 并按试验 1 所附试验报告的格式撰写报告 1 表2 7为某班级16位学生的身高数据 对其进行频数分析 并对实验报告作出说明 表 2 7 某班 16 位学生的身高数据 学号 性别 身高 cm 学号 性别 身高 cm 1 M 170 9 M 150 2 F 173 10 M 157 28 3 F 169 11 F 177 4 M 155 12 M 160 5 F 174 13 F 169 6 F 178 14 M 154 7 M 156 15 F 172 8 F 171 16 F 180 2 测量18台电脑笔记重量 见表2 8 对其进行描述统计量分析 并对试验结果作出 说明 表 2 8 18 台笔记本电脑重量表 序号 1 2 3 4 5 6 7 8 9 重量 1 75 1 92 1 59 1 85 1 83 1 68 1 89 1 70 1 79 序号 10 11 12 13 14 15 16 17 18 重量 1 66 1 80 1 83 2 05 1 91 1 76 1 88 1 83 1 79 29 试验3 统计推断 一 试验目的与要求 1 熟悉点估计概念与操作方法 2 熟悉区间估计的概念与操作方法 3 熟练掌握T检验的SPSS操作 4 学会利用T检验方法解决身边的实际问题 二 试验原理 1 参数估计的基本原理 2 假设检验的基本原理 三 试验演示内容与步骤 1 单个总体均值的区间估计 例题 为研究在黄金时段中 即每晚8 30 9 00 内 电视广告所占时间的多少 美 国广告协会抽样调查了20个最佳电视时段中广告所占的时间 单位 分钟 请给 出每晚8 30 开始的半小时内广告所占时间区间估计 给定的置信度为 95 操作 程序 打开 SPSS 建立数据文件 电视节目市场调查 sav 这里 研究变量为 time 即每天看电视的时间 选择区间估计选项 方法如下 选择菜单 分析 描述统计 探索 打开图3 1Explore 对话框 从源变量清单中将 time 变量移入Dependent List框中 30 图3 1 Explore对话框 单击上图右方的 统计量 按钮打开 探索 统计量 对话框 在设置均值的 置信水平 如键入95 完成后单击 继续 按钮回到主窗口 图3 2 探索 统计量设置窗口 返回主窗口点击ok运行操作 计算结果简单说明 表3 1 描述统计量 Descriptives Statistic Std Error time Mean 6 5350 13480 95 Confidence Interval for Mean Lower Bound 6 2529 Upper Bound 6 8171 5 Trimmed Mean 6 5167 Median 6 4500 Variance 363 Std Deviation 60287 Minimum 5 60 Maximum 7 80 Range 2 20 Interquartile Range 95 Skewness 295 512 Kurtosis 612 992 如上表显示 从上表 95 Confidence Interval for Mean 中可以得出 每 晚8 30 开始的半小时内广告所占时间区间估计 置信度为 95 为 6 2529 6 8171 其中lower Bound 表示置信区间的下限 Upper Bound表示置信 区间的上限 点估计是 6 5350 31 2 两个总体均值之差的区间估计 例题 The Wall Street Journal 1994 7 声称在制造业中 参加工会的妇女比 未参加工会的妇女的报酬要多2 5 美元 想通过统计方法 对这个观点是否正确给 出检验 假设抽取了7位女性工会会员与8位非工会会员女性报酬数据 要求对制造业中 参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差进行区间估计 预 设的置信度为95 打开 SPSS 按如下图示格式输入原始数据 建立数据文件 工会会员工 资差别 spss 这里 会员 表示是否为工会会员的变量 y 表示是工会会员 n表 示非工会会员 报酬 表示女性员工报酬变量 单位 千美元 计算两总体均值之差的区间估计 采用 独立样本T 检验 方法 选择菜单 分析 比较均值 独立样本 T检验 打开对话框 变量选择 1 从源变量清单中将 报酬 变量移入检验变量框中 表示要求该变量的均 值的区间估计 2 从源变量清单中将 group 变量移入分组变量框中 表示总体的分类变量 图3 3 独立样本T检验 对话框 定义分组 单击定义组按钮 打开Define Groups 对话框 在Group1 中输 32 入1 在Group2 中输入2 1表示非工会会员 2 表示工会会员 完成后单击 继 续 按钮回到主窗口 图3 4 define groups设置窗口 计算结果 单击上图中 OK 按钮 输出结果如下图所示 1 Group Statistics 分组统计量 表 分别给出不同总体下的样本容量 均值 标准差和平均标准误 从该表中可以 看出 参加工会的妇女平均报酬为19 925 不参加工会的妇女平均报酬为 20 1429 表3 2 分组统计量 Group Statistics 会员 N Mean Std Deviation Std Error Mean 1 00 8 19 9250 46522 16448报酬 2 00 7 20 1429 52236 19743 2 Independent Sample Test 独立样本T 检验 表 Levene s Test for Equality of Variance 为方差检验 在Equal variances assumed 原假设 方差相等 下 F 0 623 因为其P 值大于显著性水平 即 Sig 0 444 0 05 说明不能拒绝方差相等的原假设 接受两个总体方差是相等的 假设 因此参加工会会员的女性报酬与未参加工会的女性报酬平均工资之差95 的 区间估计为 0 76842 0 33271 T test for Equality of Means 为检验总体均值是否相等的t 检验 由于在本例 中 其P 值大于显著性水平 即 Sig 0 408 0 05 因此不应该拒绝原假设 也 就是说参加工会的妇女跟未参加工会的妇女的报酬没有显著差异 本次抽样推断结 论不支持The Wall Street Journal 1994 7 提出的 参加工会的妇女比未参加工会 33 的妇女的报酬要多2 5 美元 观点 即参加工会的妇女不比未参加工会的妇女的报 酬多 表3 3 独立样本T检验结果 Independent Samples Test Levene s Test for Equality of Variances t test for Equality of Means F Sig t df Sig 2 tailed Mean Difference Std Error Differenc e 95 Confidence Interval of the Difference Lower Upper 报酬 Equal variances assumed 623 444 855 13 408 21786 25485 76842 33271 Equal variances not assumed 848 12 187 413 21786 25697 77679 34108 3 单个总体均值的假设检验 单样本T检验 例子 某种品牌的沐浴肥皂制造程序的设计规格中要求每批平均生产120 块肥 皂 高于或低于该数量均被认为是不合理的 在由10 批产品所组成的一个样本中 每批肥皂的产量数据见下表 在0 05 的显著水平下 检验该样本结果能否说明制 造过程运行良好 判断检验类型 该例属于 大样本 总体标准差 未知 假设形式为 H0 0 H1 0 软件实现程序 打开已知数据文件 然后选择菜单 分析 比较均值 单样本T 检验 打开One Sample T Test 对话框 从源变量清单中将 产品数量 向右移入 Test Variables 框中 34 图3 5 one sample T test窗口 在 Test Value 框里输入一个指定值 即假设检验值 本例中假设为120 T 检 验过程将对每个检验变量分别检验它们的平均值与这个指定数值相等的假设 One Sample T Test 窗口中 OK 按钮 输出结果如下表所示 1 One Sample Statistics 单个样本的统计量 表 分别给出样本的容量 均值 标准差和平均标准误 去去去 35 试验4 方差分析 一 试验目标与要求 1 帮助学生深入了解方差及方差分析的基本概念 掌握方差分析的基本思想 和原理 2 掌握方差分析的过程 3 增强学生的实践能力 使学生能够利用SPSS统计软件 熟练进行单因素方 差分析 两因素方差分析等操作 激发学生的学习兴趣 增强自我学习和研究的能 力 二 试验原理 在现实的生产和经营管理过程中 影响产品质量 数量或销量的因素往往很多 例如 农作物的产量受作物的品种 施肥的多少及种类等的影响 某种商品的销量 受商品价格 质量 广告等的影响 为此引入方差分析的方法 方差分析也是一种假设检验 它是对全部样本观测值的变动进行分解 将某种 控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差 加以比较 据以推断各组样本之间是否存在显著差异 若存在显著差异 则说明该 因素对各总体的影响是显著的 方差分析有3个基本的概念 观测变量 因素和水平 观测变量是进行方差分 析所研究的对象 因素是影响观测变量变化的客观或人为条件 因素的不同类别或 不通取值则称为因素的不同水平 在上面的例子中 农作物的产量和商品的销量就 是观测变量 作物的品种 施肥种类 商品价格 广告等就是因素 在方差分析中 因素常常是某一个或多个离散型的分类变量 根据观测变量的个数 可将方差分析分为单变量方差分析和多变量方差分析 根据因素个数 可分为单因素方差分析和多因素方差分析 在SPSS中 有 One way ANOVA 单变量 单因素方差分析 GLM Univariate 单变量多因素方 差分析 GLM Multivariate 多变量多因素方差分析 不同的方差分析方法适 用于不同的实际情况 本节仅练习最为常用的单因素单变量方差分析 三 试验演示内容与步骤 单因素方差分析也称一维方差分析 对两组以上的均值加以比较 检验由单一 因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义 并 可以进行两两组间均值的比较 称作组间均值的多重比较 主要采用One way ANOVA过程 36 采用One way ANOVA过程要求 因变量属于正态分布总体 若因变量的分布 明显是非正态 应该用非参数分析过程 若对被观测对象的试验不是随机分组的 而是进行的重复测量形成几个彼此不独立的变量 应该用Repeated Measure菜单项 进行重复测量方差分析 条件满足时 还可以进行趋势分析 假设某汽车经销商为了研究东部 西部和中部地区市场上汽车的销量是否存在 显著差异 在每个地区随机抽取几个城市进行调查统计 调查数据放置于数据文件 汽车销量调查 sav 中 在SPSS 中试验该检验的步骤如下 步骤1 选择菜单 分析 比较均值 单因素方差分析 依次 将观测变量销量移入因变量列表框 将因素变量地区移入因子列表框 图 4 1 One Way ANOVA 对话框 单击两两比较按钮 如图4 2 该对话框用于进行多重比较检验 即各因素 水平下观测变量均值的两两比较 方差分析的原假设是各个因素水平下的观测变量均值都相等 备择假设是各均 值不完全相等 假如一次方差分析的结果是拒绝原假设 我们只能判断各观测变量 均值不完全相等 却不能得出各均值完全不相等的结论 各因素水平下观测变量均 值的更为细致的比较就需要用多重比较检验 37 图 4 2 两两比较对话框 假定方差齐性选项栏中给出了在观测变量满足不同因素水平下的方差齐性条件 下的多种检验方法 这里选择最常用的LSD检验法 未假定方差齐性选项栏中给出 了在观测变量不满足方差齐性条件下的多种检验方法 这里选择Tamhane s T2 检验 法 Significance level输入框中用于输入多重比较检验的显示性水平 默认为5 单击选项按钮 弹出options子对话框 如图所示 在对话框中选中描述性 复选框 输出不同因素水平下观测变量的描述统计量 选择方差同质性检验复选框 输出方差齐性检验结果 选中均值图复选框 输出不同因素水平下观测变量的均值 直线图 在主对话框中点击ok按钮 可以得到单因素分析的结果 试验结果分析 表4 1给出了不同地区汽车销量的基本描述统计量以及95 的置信区间 38 图 4 3 选项子对话框 表4 1 各个地区汽车销量描述统计量 Descriptives 销量 N Mean Std Deviation Std Error 95 Confidence Interval for Mean Minimum Maximum Lower Bound Upper Bound 西 10 157 90 22 278 7 045 141 96 173 84 120 194 中 9 176 44 19 717 6 572 161 29 191 60 135 198 东 7 196 14 30 927 11 689 167 54 224 75 145 224 Total 26 174 62 27 845 5 461 163 37 185 86 120 224 表4 2给出了Levene方差齐性检验结果 从表中可以看到 Levene 统计量对应的 p值大于0 05 所以得到不同地区汽车销量满足方差齐性的结论 表4 2 各地区汽车销量方差齐性检验表 Test of Homogeneity of Variances Levene Statistic df1 df2 Sig 1 262 2 23 302 表4 3是单因素方差分析 输出的方差分析表解释如下 总离差 SST 19384 154 组间平方和 SSR 6068 174 组内平方和或残差平方和 SSE 13315 979 相应的自由度分别为 25 2 23 组间均方差MSR 3034 087 组内均方差578 956 F 5 241 由于p 0 013 相关 双变量 打开对话框 将变量 住房支出 与 年收入 移入variables列表框 点击ok运行 结果如表5 2所示 表5 2 住房支出与年收入相关系数表 Correlations 住房支出 千美元 年收入 千美元 住房支出 千美元 Pearson Correlation 1 966 Sig 2 tailed 000 N 20 20 年收入 千美元 Pearson Correlation 966 1 Sig 2 tailed 000 N 20 20 Correlation is significant at the 0 01 level 2 tailed 从表中可得到两变量之间的皮尔逊相关系数为0 966 双尾检验概率p值尾 0 000 回归 线性 打开Linear Regression 对话框 将变量住房支出y移入Dependent列表框中 将年收入x移入 Independents列表框中 在Method 框中选择Enter 选项 表示所选自变量全部进 入回归模型 46 图5 5 Linear Regresssion 对话框 步骤2 单击Statistics按钮 如图在Statistics子对话框 该对话框中设置要 输出的统计量 这里选中估计 模型拟合度复选框 47 图5 6 Statistics 子对话框 估计 输出有关回归系数的统计量 包括回归系数 回归系数的标准差 标准化的回归系数 t统计量及其对应的p值等 置信区间 输出每个回归系数的95 的置信度估计区间 协方差矩阵 输出解释变量的相关系数矩阵和协差阵 模型拟合度 输出可决系数 调整的可决系数 回归方程的标准误差 回归方程F检验的方差分析 步骤3 单击绘制按钮 在Plots子对话框中的标准化残差图选项栏中选中正态 概率图复选框 以便对残差的正态性进行分析 图5 7 plots子对话框 步骤4 单击保存按钮 在Save子对话框中残差选项栏中选中未标准化复选框 这样可以在数据文件中生成一个变量名尾res 1 的残差变量 以便对残差进行进一 步分析 48 图5 8 Save子对话框 其余保持Spss默认选项 在主对话框中单击ok按钮 执行线性回归命令 其结 果如下 表5 3给出了回归模型的拟和优度 R Square 调整的拟和优度 Adjusted R Square 估计标准差 Std Error of the Estimate 以及Durbin Watson统计 量 从结果来看 回归的可决系数和调整的可决系数分别为0 934和0 93 即住房 支出的90 以上的变动都可以被该模型所解释 拟和优度较高 表5 4给出了回归模型的方差分析表 可以看到 F统计量为252 722 对应的p 值为0 所以 拒绝模型整体不显著的原假设 即该模型的整体是显著的 表5 5给出了回归系数 回归系数的标准差 标准化的回归系数值以及各个回归 系数的显著性t检验 从表中可以看到无论是常数项还是解释变量x 其t统计量对 应的p值都小于显著性水平0 05 因此 在0 05的显著性水平下都通过了t检验 变 量x的回归系数为0 237 即年收入每增加1千美元 住房支出就增加0 237千美元 表5 3 回归模型拟和优度评价及Durbin Watson检验结果 Model Summary b Model R R Square Adjusted R Square Std Error of the Estimate 1 966 a 934 930 37302 a Predictors Constant 年收入 千美元 b Dependent Variable 住房支出 千美元 表5 4 方差分析表 ANOVA b Model Sum of Squares df Mean Square F Sig Regressio n 35 165 1 35 165 252 722 000 a Residual 2 505 18 139 1 Total 37 670 19 a Predictors Constant 年收入 千美元 b Dependent Variable 住房支出 千美元 表5 5 回归系数估计及其显著性检验 Coefficients a Model Unstandardized Coefficients Standardized Coefficients t Sig B Std Error Beta 1 Constant 890 204 4 356 000 年收入 千美元 237 015 966 15 897 000 a Dependent Variable 住房支出 千美元 为了判断随机扰动项是否服从正态分布 观察图5 9所示的标准化残差的P P图 可以发现 各观测的散点基本上都分布在对角线上 据此可以初步判断残差服从正 49 态分布 为了判断随机扰动项是否存在异方差 根据被解释变量y与解释变量x的散点图 如图5 4所示 从图中可以看到 随着解释变量x的增大 被解释变量的波动幅度明 显增大 说明随机扰动项可能存在比较严重的异方差问题 应该利用加权最小二乘 法等方法对模型进行修正 0 0 20 40 60 81 0Observd CumProb0 20 40 60 8 1 0Expectd CumProbDepndt Varible 东Normal P lt ofRgrsin Stdarize Rsidual 图5 9 标准化残差的P P图 四 备择试验 现有1987 2003年湖南省全社会固定资产投资总额NINV和GDP两个指标的年度数 据 见下表 试研究全社会固定资产投资总额和GDP的数量关系 并建立全社会固 定资产投资总额和GDP之间的线性回归方程 湖南省全社会固定资产投资和GDP年度数据 年份 GDP 亿 元 NINV 亿元 年份 GDP 亿 元 NINV 亿 元 1987 509 44 120 38 1995 2195 7 523 50 1988 614 07 144 71 1996 2647 16 684 14 1989 682 8 114 51 1997 2993 667 39 1990 744 44 121 24 1998 3118 1 796 9 1991 833 3 156 39 1999 3326 8 883 9 1992 997 7 234 4 2000 3691 88 1012 2 1993 1278 28 324 58 2001 3983 1174 3 1994 1694 42 422 18 2002 4140 94 1348 附录 管理统计学 上机试验报告格式 试验名称 成绩 姓名 专业 学号 试验日期 试验地点 试验目的 与要求 试验原理 试验内容 试验结论
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!