SPSS统计分析方法及应用.ppt

上传人:sh****n 文档编号:6414502 上传时间:2020-02-25 格式:PPT 页数:38 大小:585KB
返回 下载 相关 举报
SPSS统计分析方法及应用.ppt_第1页
第1页 / 共38页
SPSS统计分析方法及应用.ppt_第2页
第2页 / 共38页
SPSS统计分析方法及应用.ppt_第3页
第3页 / 共38页
点击查看更多>>
资源描述
02 11 17 河北工大廊坊分校经济系周玉江 1 SPSS统计分析方法及应用 课程介绍 SPSS01 1 01 02 11 17 河北工大廊坊分校经济系周玉江 2 0 SPSS课程要求 讲课 32学时考试 闭卷 笔试 教材 SPSS统计分析方法及应用 第二版 薛薇 电子工业出版社 理由 参考书 SPSS在统计分析中的应用 朱建平等 清华大学出版社 SPSS16实用教程 宋志刚等 人民邮电出版社 1 教学安排 02 11 17 河北工大廊坊分校经济系周玉江 3 2 学习的主要章节 第1章SPSS统计分析软件概述第2章SPSS数据文件的建立和管理第3章SPSS数据的预处理第4章SPSS基本统计析第8章SPSS相关分析和线性回归分析第10章SPSS因子分析第14章SPSS时间序列分析 02 11 17 河北工大廊坊分校经济系周玉江 4 3 为什么要学习SPSS 我们讲了微积分 线性代数 概率论与数理统计 统计学等课程 西方经济学 管理学等课程 如何将这些课程完整的结合在一起用于生产实践 SPSS统计分析方法及应用 用定量的方法 研究经济和管理 应用于经济和管理 使得决策有依据 更科学 优化 啤酒与尿布的故事 在美国的一家沃尔玛超市里 有一个有趣的现象 尿布和啤酒赫然摆在一起出售 这是为什么 原来 沃尔玛公司请一家咨询公司进行一年一度的数据分析时发现 购买了尿布的购货单有相当数量的购买了啤酒 02 11 17 河北工大廊坊分校经济系周玉江 5 发现这一个秘密之和 超市将啤酒和尿布放了一起 使得啤酒和销量都大大的提高 咨询公司发现这一秘密的手段就是我们课程的关联分析和频数分析 没有数据挖掘 这一信息将永不见天日 电信 呼叫指纹识别银行 逾期贷款 呆滞贷款证券公司 上市公司是否被特别处理 ST 以上例子使用的工具 都是利用统计分析理论和方法研制的软件系统 行业名称 数据分析 经济分析 数据挖掘 经公司认真的调查发现 美国的妇女们经常会嘱咐她们的丈夫下班以后要为孩子买尿布 而丈夫在买完尿布之后大都顺手买回自己爱喝的啤酒 02 11 17 河北工大廊坊分校经济系周玉江 6 SPSS统计分析方法及应用第一章 SPSS软件概述 SPSS01 1 01 02 11 17 河北工大廊坊分校经济系周玉江 7 1 SPSS概述 随着计算机的普及 数据库的广泛应用 积累了各种各样的数据 这些数据的特点是数据量大 杂乱无章 如何从这些数据中得到有价值的信息 这就是统计分析所研究的内容 而SPSS正是用于统计分析 研究的软件工具 20世纪60年代末 美国斯坦福大学的3位研究生研制开发了统计分析软件 社会科学统计软件包 StatisticalPackageforSocialScience 1975年成立了SPSS软件公司 专门进行统计分析软件的 1 SPSS的产生背景 2 SPSS的发展过程 02 11 17 河北工大廊坊分校经济系周玉江 8 3 SPSS的应用领域 1994 1998年间 SPSS公司兼并了多家从事统计分析软件研发的公司 对这一市场进行了整合 软件名称也改为 统计产品与服务解决方案 StatisticalProductandServiceSolutions 最新版本SPSS17 现在的SPSS统计分析软件在全球拥有26万家以上的用户 广泛应用于通信 医疗 银行 证券 保险 军事 商业 教育 科研和政府等社会的各个领域 是当今世界最流流行的软件之一 见识 研发 由于市场前景广阔 多家从事统计分析软件的公司相继出现 但SPSS公司始终处于市场领先的位置 02 11 17 河北工大廊坊分校经济系周玉江 9 北京市GDP发展曲线模型预测 02 11 17 河北工大廊坊分校经济系周玉江 10 航空公司乘客数量月度数据时间序列模型预测 02 11 17 河北工大廊坊分校经济系周玉江 11 2SPSS使用基础 编辑窗口包括 菜单 工具栏 定义窗口 数据窗口数据编辑窗口的功能是 定义SPSS数据的结构 录入 编辑和管理用于分析的数据 将居民储蓄调查数据 存款 sav数据集打开 SPSS的所有统计分析都是针对编辑窗口中数据的 这些数据保存在以 sav为后缀的数据文件中 1 数据编辑窗口 数据编辑窗口是SPSS的主程序窗口 随着SPSS软件的启动自动打开 并一直保持到退出程序为止 02 11 17 河北工大廊坊分校经济系周玉江 12 变换 分析 图形 程序 附加 数据视图 变量视图 数据编辑区 状态栏 菜单栏 工具栏 02 11 17 河北工大廊坊分校经济系周玉江 13 2 结果输出窗口 1 输出窗口的功能 对数据进行统计分析后输出的分析报表与图形的窗口 输出窗口在进行统计分析后打开 可以存储成以 spo为后缀的文件 可以在需要时打开 2 菜单 工具 栏 随着窗口及操作的不同 系统会增加或减少菜单项 输出窗口中 除数据窗口中的菜单项外 增加了针对输出的菜单项 如 插入 Insert 格式 Format 3 分析结果显示区 目录区和显示区 显示区左边的树形结构的标题 由输出区域的相应对象名称的目录构成 点击目录树中的某一对 02 11 17 河北工大廊坊分校经济系周玉江 14 分析 分析结果显示区 程序 工具栏 目录区 内容区 02 11 17 河北工大廊坊分校经济系周玉江 15 4 输出结果的保存 可以将数据输出结果保存成以 spv为后缀的输出文件永久性的保存 这种文件中的报表 可以粘贴到Word文件中去 演示 居民储蓄调查数据 存款 sav的收入水平变量的频数分析的输出窗口 输出直方图附正态曲线 象名称在显示区显示相应的输出模块 这时的名称和对象均有红色箭头指示 02 11 17 河北工大廊坊分校经济系周玉江 16 SPSS统计分析方法及应用第二章 SPSS数据文件的建立和管理 SPSS02 1 01 02 11 17 河北工大廊坊分校经济系周玉江 17 1SPSS的数据文件 数据中蕴含着许多有价值的信息 需要有一定的方法和手段对数据进行分析 从中提取有价值的信息 这样的过程是数据处理 SPSS的数据及处理结果都将直观的显示在数据窗口中 构成一张二维表 称为数据集 表中的一行称为个案 Case 个案的全体组成了表中的数据 数据表的每一列称为变量 1 变量的数据结构 2数据结构和定义方法 02 11 17 河北工大廊坊分校经济系周玉江 18 个案 当前单元格地址 当前单元格取值 变量 02 11 17 河北工大廊坊分校经济系周玉江 19 2 变量名 变量名是访问分析数据的唯一标志 因此 在定义变量需要首先定义变量名 定义变量名需遵循如下规则 a 变量名的字符个数不多于8个 b 首字符必须是字母或汉字 最后一个位置不能是点儿和下划线 其他位置除 之外的字符均可 c 变量名不区分大小写字母 d 变量名不能使用SPSS的关键字 e 如果定义变量时不给出名字 系统给出以VAR00001 数据集的数据结构是描述数据的特征 包括 变量名 类型 宽度 变量名标签 变量值标签 缺失值和计量尺度 02 11 17 河北工大廊坊分校经济系周玉江 20 2 数据类型 定义变量名要遵循好记和提示意义的原则以方便使用 如果给出的变量名不符合以上规则 系统将给出提示信息 数据类型是每一个变量取值的类型 每种数据的类型都有数据宽度和列宽 数据宽度为存储变量值的最大位数 列宽是数据编辑窗口中每列字符宽度 如果列宽小于数据宽度 将用星号显示溢出 通常这两个宽度相同 形式的默认变量 1 数值型 02 11 17 河北工大廊坊分校经济系周玉江 21 数值型有5种不同的类型 数值型是SPSS最常用的数据类型 通常由阿拉伯数字 0 9 和其它特殊符号 如美元符号 逗号 句点等 组成 a 标准型 Numeric 默认的宽度为8位 包含正负号 小数点及小数位 需要说明的是 数据的显示宽度并不影响数据的存储宽度 b 科学记数法型 ScientificNotation 默认的宽度为8位 包含正负号 字母E及跟在后面的正负号及两位幂次数字 科学记数法型一般存储很大或很小的数 输入时可以按标准型输入 系统会自动转换 例如 1 2E02 1 2 102 0 5E 05 0 5 10 5c 逗号型 Comma 将整数位自个位开始向前每3位用逗号分隔 默认的宽 02 11 17 河北工大廊坊分校经济系周玉江 22 2 字符型 String d 圆点型 Dot 类似于逗号型 不常用 略 e 美元型 Dollar 美元型主要用来表示货币数据 在数值前加上美元符号 如果定义了美元类型 输入时不需输入 系统自动在相应的位置上加上美元符号 字符型是SPSS经常使用的数据类型 字符型数据由字符串构成 表示如学号 姓名 所在系等等字符数据 度为8位 包含正负号 小数点 小数位及逗号 如果定义了数据类型为逗号型 输入时不用输入逗号 系统自动在相应的位置上加上逗号 02 11 17 河北工大廊坊分校经济系周玉江 23 3 日期型 Date 用来表示日期或时间的数据类型称为日期型 如入学日期 生日等等 有两种表现格式 dd mmm yyyy 日 月份的英文前三个字符 4位年份例 20 AUG 2009表示2009年8月20日mm dd yyyy 月 日 年例 20 08 2009表示2009年8月20日 建立数据集例 姓名 字符型 生日 日期型 学历 数值 0中学 1大学 2研究生 工资x 数值 字符型数据默认的宽度为8位 不能进行算术运算 区分大小写 21页 用户定义类型不要求 02 11 17 河北工大廊坊分校经济系周玉江 24 02 11 17 河北工大廊坊分校经济系周玉江 25 3 变量名标签 一般的 变量名多用一两个英文字母表示 如果在输出结果中只能看到的是变量名 将大大的降低可读性 为了补救这一缺憾 SPSS用给出变量名的标签的方法 达到增加数据 输出结果可读性的目的 变量名标签可以使用中文 允许最大长度为120个字符 在意义明确的条件下 变量名标签尽可能的简单 如果变量本身具有可读性 变量名标签可以省略 演示 4 变量值标签 在调查问卷中的选项中 答案经常是英文字母 例如学历 A 初中以下 B 高中 C 大专 在数据集中存储 02 11 17 河北工大廊坊分校经济系周玉江 26 1 建立变量值标签的方法 SPSS可以定义变量值标签 对变量的值进行说明和解释 在数据集中既可以浏览变量的值 也可以浏览变量值标签 输出结果也是如此 十分方便 变量值如果意义明确时 变量值标签可以省略 定义变量值标签的对话窗口如下页图 在值 Value 文本框中输入变量的值 在标签 Lable 文本框中输入相应的标签 单击增加 add 按钮 将建立变量值与值标签之间建立对应关系 这时的值Value文本框为空 若值文本框为空 修改 change 和移去 Remove 按钮都处于休眠状态 是这些英文字母 让人很难读懂和理解 02 11 17 河北工大廊坊分校经济系周玉江 27 变量的值 变量值标签 02 11 17 河北工大廊坊分校经济系周玉江 28 3 修改变量值标签的方法 单击列表框中要删除的标签 这时标签的值重新显示在标签Lable文本框中 在值Value文本框输入原来对应的值 Remove 按钮被激活 可以将对应关系移去 单击列表框中要修改的标签 如果在值Value文本框输入新值 或虽然输入了原来的值 但修改了标签Lable文本框中的值 修改 change 按钮将被激活 点击该按钮将建立新对应关系 5 缺失数据 Missing 2 删除或修改变量值标签的对应关系 02 11 17 河北工大廊坊分校经济系周玉江 29 2 缺失值的种类 在数据分析的过程中 有时某一项数据是空的 没有填 有时有的数据明显是错误的 例如误将年龄的20岁填成了200岁 这两种情况在数据处理中是经常遇到的 SPSS的缺失值有两类 系统缺失值和用户缺失值 称没有数据的单元格为系统缺失值 用点儿 表示 由于人为的原因造成数据失真时的缺失值 称为客户缺失值 如年龄200岁 3 缺失值的指定 1 数据缺失在数据处理过程中不可避免 02 11 17 河北工大廊坊分校经济系周玉江 30 离散值 离散值的选择范围 02 11 17 河北工大廊坊分校经济系周玉江 31 4 缺失值的设置方法 在变量窗口选择设置缺失值的变量 点击Missing列的 按钮 出现缺失值定义界面 NomissingValues默认选项 不定义缺失值 DiscretemissingValues离散值 最多可以设置3个值 在统计分析时 遇到这三个值均当做缺失值处理 例如性别变量定义0 男 1 女 如果遇到 1 2 3均按缺失值处理 Rangeplusoneoptionaldiscretemiss 02 11 17 河北工大廊坊分校经济系周玉江 32 6 计量尺度 例 填报月收入 如果数据在20000 40000元之间 就认为数据是异常值 如月收入填写的是20001米则认为是缺失值 另外 认为工资该高于最低保障200元 如果工资填写为200也认为数据失真 也定义成缺失值 Low 20000 High 40000 DiscreteValues 200 统计学按照计量尺度将数据分成3大类 指定一个缺失值范围 如果数据落到这个范围内即为缺失值 这时还指定一个值 如果变量取了这个值 也认为是缺失值 02 11 17 河北工大廊坊分校经济系周玉江 33 2 定序数据 Ordinal 定距数据即包括诸如身高 体重 工资等类型的连续数据 也包含人数 仪器设备的台数 商品件数等的离散型数据 定距数据可以比较大小 可以做加减运算 定序数据可以排序比较大小 但不能做加减运算 可以用数值和字符表示 如学历包括小学 中学 大学 职称包括助教 讲师 教授 这些可以和数值建立联系 但加减运算没有意义 3 定类数据 Nominal 1 定距型数据 Scale 02 11 17 河北工大廊坊分校经济系周玉江 34 4 变量之间的关系与设置 例如性别可以用男 女表示 民族可以用汉 回 满等表示 它们可以和数值 字母表示 无法进行排序 定距变量包含定序变量包含定类变量 根据分析的需要 可以将变量定义成相应的尺度 计量尺度在变量定义窗口完成 演示 姓名 定类 学历 定序 工资 定距 结课点 定类数据只能互相区别 不能进行排序 可以用数值或字母表示 3 SPSS结构定义的应用案例 02 11 17 河北工大廊坊分校经济系周玉江 35 3SPSS应用案例 银行为了发展储户 扩大业务范围和业务量 委托咨询公司对本企业的发展进行评估 设计了居民储蓄调查问卷 如何理解调查问卷 将调查问卷组织成SPSS能处理和分析的数据 包括 根据调查问卷定义SPSS中的变量 定义数据集的数据结构等 1 每份调查问卷 个案 作为数据集一行 记录 存储 2 问卷中的一个问题作为数据集一列 变量 存储 因此共有15列 变量 数据结构的定义原则 02 11 17 河北工大廊坊分校经济系周玉江 36 02 11 17 河北工大廊坊分校经济系周玉江 37 c c c 02 11 17 河北工大廊坊分校经济系周玉江 38 演示问卷调查数据集 居民储蓄调查数据 4 不同的数据根据其实际的意义与取值定义计量尺度 5 变量标签的作用主要用于变量的解释说明 6 变量的值标签 在数据分析结果输出时可以显示值标签 增加了数据的可读性 1 数据值与标签的转换2 结构浏览Utilities Variables 3 凡是可以用数值1 2 3表示的变量定义成数值型 将更有利于数据分析
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!