SPSS数据分析教程-3-描述性统计分析.ppt

上传人:sh****n 文档编号:6416190 上传时间:2020-02-25 格式:PPT 页数:55 大小:985.50KB
返回 下载 相关 举报
SPSS数据分析教程-3-描述性统计分析.ppt_第1页
第1页 / 共55页
SPSS数据分析教程-3-描述性统计分析.ppt_第2页
第2页 / 共55页
SPSS数据分析教程-3-描述性统计分析.ppt_第3页
第3页 / 共55页
点击查看更多>>
资源描述
SPSS数据分析教程 作者 李洪成姜宏华 第3章描述性统计分析 SPSS数据分析教程 主要内容 描述性统计分析频率分析对数据进行描述的图形化方法和数值方法学习分析数据分布的方法应用SPSS进行描述性数据分析的方法常用统计图形的绘制方法和解释技巧数据标准化 本章学习目标 掌握数据分析项目的整个过程 掌握数据的分类方法 掌握对数据进行描述的图形化方法和数值方法 学习分析数据分布的方法 掌握应用SPSS进行描述性数据分析的方法 掌握常用统计图形的绘制方法和解释技巧 描述性统计和推断性统计 统计学分为描述性统计分析和推断性统计分析描述性统计应用分类 制表 图形以及概括性数据指标来概括数据分布特征的方法 结论不能推及总体 推断性统计推断性统计分析得到的结论适用于总体 统计量 统计分析往往是从了解数据的基本特征开始的 统计上 需要把样本数据所含信息进行概括 融合和抽象 从而得到反映样本数据的综合指标 这些指标称为统计量 描述性统计分析指标 统计量可分为两类一类表示数据的中心位置 例如均值 中位数 众数等一类表示数据的离散程度 例如方差 标准差 极差等用来衡量个体偏离中心的程度 3 1频率分析 频率分析主要通过频率分布表 条形图和直方图 以及集中趋势和离散趋势的各种统计量来描述数据的分布特征 频率分析术语 频率对于定性观测值时 把它们按照某种原则分成一些组 每个观测值必须落入一个类并且只能够落入一个类中 对于给定的类 落入这个类的个案数称为频率落入该类中的个案数和个案总数的比例称为相对频率 案例 数据文件EmployData sav记录了某公司职工的基本信息 例如性别 民族 出生日期 教育水平 工资水平 工作年限等 教育水平为分类变量 它有11个类别 SPSS频率分析 选择 分析 描述统计 频率 频率分析选项 统计量 频率分析选项 图表 频率分析的结果解释 频率表格条形图 直方图 3 2中心趋势的描述 均值中位数众数5 截尾均值 均值 均值即数据的算术平均数 是数据中心趋势的主要度量指标 设变量有n个测量值 则算术均值为 均值的特点 最常用的中心位置度量受极端值影响例 1 3 5 7 9和1 3 5 7 14 中位数 重要的中心位置度量在递增排序后的数据列中若数据个数为奇数 中位数是正中央的数若数据个数是偶数 中位数是正中央的两数的平均值 不受极端值的影 例如 1 5 7 3 9 众数 发生频数最高的数据值不受极端值的影响众数可能不存在可能有多个众数 单峰 双峰 多峰 可用于定量或定性数据 5 截尾均值 避免了极端值的影响 3 3离散趋势的描述 仅仅根据数据的中心趋势指标进行决策是不够的 例如 如果一个国家的不同家庭收入差距很少 而另一个国家的家庭收入差距很大 既存在大量的贫困家庭 也存在许多十分富有的家庭 那么即使这两个国家的中等收入家庭的收入完全一样 其家庭收入情况仍然完全不同 例子 假设我们有以下的三组观测值 观测A 11 12 13 16 16 17 18 21观测B 14 15 15 15 16 16 16 17观测C 11 11 11 12 19 20 20 20这三组观测值的均值都是15 5 那么这三组数据是否相似呢 离散趋势 离散趋势的描述 极差 range 方差 Variance 标准差 S d 分位数 Percentage 变异指标 极差 极差 最大值 最小值受极端值影响较大 方差和标准差 方差标准差 变异系数 在比较两组数据离散程度大小时 如果数据的测量尺度相差太大 直接比较二者的标准差并不合适 需要首先消除测量尺度和量纲的影响 变异系数可以剔除这些影响 其计算公式为 分位数 第p百分位数使得至少有p 的数据小于或等于这个值 且使得至少有 100 p 的数据大于或等于这个值如何计算 将原数据从小到大排列计算i p 100 n若i是整数 则第p百分位数为第i与第i 1项的平均若i不是整数 则向上取整 总结五数 最小值 第一个四分位数 中位数 第三个四分位数 最大值从这五个值可以大致看出数据分布的中心和离散程度 而箱图则是这五个数的图形表现 3 4分布的形状 偏度当偏度0时 分布为正偏或右偏 布图形在右边拖尾 分布图有很长的右尾 尖峰偏左当偏度0 分布为负偏或左偏 即分布图形在左边拖尾 分布图有很长的左尾 峰尖偏右当偏度为0 分布对称 峰度 峰度 3 分布为高峰度 即比正态分布的峰要陡峭 3 分布为低峰度 即比正态分布的峰要平坦些 0 分布为正态峰 3 5SPSS描述性统计 许多菜单均可进行描述性分析 提供描述性统计指标的输出 例如T检验 方差分析 因子分析等SPSS自定义表模块也可以产生大部分的描述性统计指标 SPSS中的菜单 专门的描述性统计菜单 描述 D 该过程则进行一般性的统计描述 探索 E 该过程用于对数据概况不清时的探索性分析 交叉表 C 该过程完成分类数据的统计描述和一般的统计检验 我们常用的检验也包含在该对话框中 频率 实例 分析 描述 频率 频率 统计量的选择 频率 结果的解释 描述性子菜单 探索子菜单 分析 描述统计 探索 该菜单可以对不同的组分别给出描述性统计量 探索 选择统计量 探索 图 探索 结果解释 1 探索 结果解释 2 设定表格 表格 摘要统计量设置 统计图进行描述性统计分析 定性数据条形图饼图帕累托图定量数据直方图茎叶图箱图 频率 描述 频率 图表条形图饼图直方图示例 数据文件DisasterReason sav条形图饼图直方图帕累托图 条形图 饼图 帕累托图 直方图 茎叶图 箱图 描述性 探索直方图茎叶图箱图示例 数据EmployData sav直方图茎叶图箱图 直方图和茎叶图 箱图 从旧对话框作图 重新完成上面两个例子中的图形 箱图除外 饼图 帕累托图 频率 饼图质量控制 排列图图 图表构建程序图 旧对话框 作业
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!