描述性统计ppt课件

上传人:钟*** 文档编号:5844977 上传时间:2020-02-09 格式:PPT 页数:54 大小:2.02MB
返回 下载 相关 举报
描述性统计ppt课件_第1页
第1页 / 共54页
描述性统计ppt课件_第2页
第2页 / 共54页
描述性统计ppt课件_第3页
第3页 / 共54页
点击查看更多>>
资源描述
上节回顾 一 数据的编码 录入与整理二 数据问卷与编码三 编码类型数值型数据的编码非数值型数据的编码多项选择题 限定多选项分类法任意多项二分法四 缺失值的处理替代法剔出法 1 五 数据处理中的操作术语个案 样本 变量 量值六 定义变量定义变量名定义变量类型 宽度及小数位数定义变量标签定义变量值标签定义缺失值七 数据的录入单击 DataView 标签八 数据的导入方法一 File Open Data 方法二 练习通过复制 粘帖的办法 2 九 数据的整理 数据分值的转换Transform Recode IntoDifferentVariables量表的统分Transform Compute数据的排序Data SortCases数据的限选Data SelectCases数据加权Data WeightCases数据的计数Transform CountValueswithcases 3 第8讲描述性统计分析 4 一 描述性统计分析概念 目的通过变量的描述性统计分析 能够掌握和了解样本数据的统计特征和总体分布形态 进而更深入地揭示变量变化的统计规律 方法数据计算 计算常见的描述性统计量的值 准确反映样本数据的统计特征 图形绘制 绘制常见的统计图形 通过图形来直观展现数据的分布特征 比较数据分布的异同 通常 两种方法混合使用 SPSS软件中相关的几种功能频数分析 Frenquencies 描述统计量 Descriptives 探索性分析 Explore 交叉列联表 Crosstabs 比率分析 Ratio P P图Q Q图 5 二 基本描述统计量 1 常见的描述统计量大致可以分为三类 第一类 描述集中趋势 CentralTendency 的统计量第二类 描述离散趋势 Dispersion 的统计量第三类 描述分布形态 Distribution 的统计量 6 二 基本描述统计量 7 二 基本描述统计量 描述离散趋势的统计量与 集中趋势 相反 离散趋势 反映的是一组资料中各个观察值之间的差异或离散程度 即考察所有数据相对于 中心值 分布的疏密程序 有如下统计量 方差 Variance 样本方差越大 说明变量值之间的差异越大 样本方差没有单位 标准差 std deviation 样本标准差越大 说明变量的观测值之间的差异越大 距离均值这个 中心 的离散程度越大 8 二 基本描述统计量 描述离散趋势的统计量极差 Range 也称全距或跨度或范围 R 最大值 最小值极差不考虑最大值与最小值之间的观测值 仅仅依靠端点值来确定 因而稳定性差 最小值 Minimum 一组资料中各个观测值的最小者 最大值 Maximum 一组资料中各个观测值的最大者 均值标准误差 S E Mean StandardErrorofMean 简称标准误 样本数据是从总体数据中抽取出来的 虽然在一定程度上 样本数据可以反映总体数据的特征 但在不同次抽样中所得的样本均值是不同的 并且它们与总体均值间存在差异 均值标准误差就是描述这些样本均值与总体均值之间平均差异程度的统计量 即 样本均值的标准差 9 二 基本描述统计量 描述分布形态的统计量考察数据分布形态特征的统计量 例如 数据分布是否对称 偏斜程度以及陡缓程度 主要有如下两种统计量 偏度 Skewness 偏度值 0 为正偏或右偏 即在峰的右边有大的偏差值 使右边出现一个拖得较远的尾巴 偏度值 0 为负偏或左偏 即在峰的左边有大的偏差值 使左边出现一个拖得较远的尾巴 偏度绝对值越大 偏斜越大 返回 10 峰度 Kurtosis 峰度值 0 数据分布比标准正态分布更陡峭 为尖峰分布 峰度值 0 数据分布比标准正态分布更平缓 为平峰分布 二 基本描述统计量 11 频数分析 12 三 频数分析 概念统计的是每一组中观测点的个数 而不考虑其实际取值 了解变量取值的一般特征 如 哪些数值出现的频率高 变量取值的大致范围是什么 考察数据是否符合要进行的统计分析的假设 如 样本数足够大吗 每个变量的观测值是否合理呢 评估数据的质量 如 有多少缺失值或者有多少数据录入错误 13 三 频数分析 SPSS中的频数分布表频数分析的基本功能之一 是编制频数分布表 以下是几个频数分析时常用的概念 频数 Frenquency 变量值落在某个区间或者某个取值点的个数 百分比 Percent 各频数占总样本数的百分比 有效百分比 ValidPercent 各频数占有效样本数的百分比 累计百分比 CumulativePercent 各百分比逐级累加起来的结果 最终取值是100 返回 14 二 频数分析 频数分析中的统计图频数分析的基本功能之二 是绘制统计图 统计图能非常清晰直观地展示变量的取值状况 包括以下三种图 条形图 BarChart 饼图 PieChart 直方图 Histograms 15 条形图与直方图区别 条形图1 用条形的长度表示各类别频数的多少 其宽度是固定的2 各矩形通常是分开排列的 3 主要用于展示分类数据 直方图1 用面积表示各组频数的多少 矩形的高度表示每一组的频数或频率宽度表示各组的组距 2 由于分组数据具有连续性 各矩形通常是连续排列 3 主要用于展示数值型数据 16 三 频数分析 SPSS操作及案例例一 各门成绩统计结果保存为 3 StudentScore spv 17 三 频数分析 SPSS操作及案例 数据文件 3 StudentScore sav Analyze DescriptiveStatistics Frequencies 18 SPSS操作及案例 数据文件 3 StudentScore sav 例二 语文成绩区间频度分布表步骤1 对 语文 成绩进行分段Transform RecodeIntoDifferentVariables 结果保存为 3 StudentScore 成绩分段 sav 三 频数分析 19 三 频数分析 SPSS操作及案例步骤2 对 分数分段 进行统计Analyze DescriptiveStatistics Frequencies 20 三 频数分析 SPSS操作及案例 21 三 频数分析 SPSS操作及案例输出三门成绩的均值 标准差极差及4分位数四分位数 Quartile 是统计学中分位数的一种 即把所有数值由小到大排列并分成四等份 处于三个分割点位置的得分就是四分位数 22 统计描述分析 23 四 统计描述分析 概念通过频数分析对数据的总体分布状况有了基本了解之后 通常还需要对定距变量的分布特征有更为精确的认识 这就需要通过计算基本描述统计量等途径来实现 变量的值之间可以比较大小 两个值的差有实际意义 这样的变量叫定距变量 在调查被访者的 年龄 和 每月平均收入 都是定距变量 24 SPSS操作及案例分析 数据文件 3 StudentScore sav 例三 计算全部学生各门成绩的平均值 标准差 最大值和最小值 并考察学生成绩的分布形态 四 统计描述分析 25 SPSS操作及案例分析数据文件 3 StudentScore savAnalyze DescriptiveStatistics Descriptives 四 统计描述分析 26 探索性分析 27 五 探索性分析 概念数据探索是统计分析中非常重要的一步 可以帮助我们决定选择哪种统计方法进行数据分析 有如下三方面的考察 1 考察数据的正确性考察数据中的一些异常值 分析这些值产生的原因 判断其正确性 再决定修改 删除或保留它们 2 考察数据的分布特征考察数据的正态分布特征可以为以后进行统计分析时采用正确的统计方法提供正确的依据 3 考察变量之间数据的相互关系变量与变量之间相关性的考察 方差齐性的考察 是一些统计分析过程必须事先了解的 返回 28 五 探索性分析 通过茎叶图 Stem and LeafPlots 描述频度分布例四 数据文件 3 StudentScore sav茎叶图由数字构成 表达变量的频数分布 Analyze DescriptiveStatistics Explore 例如 语文成绩茎叶图 29 通过箱图 Boxplots 描述数据分布箱图也称为箱线图 箱式图 显示了变量数据的中位数 25 百分位数和75 百分位数 并给出偏离总体分布的奇异个案和极端个案 五 探索性分析 30 通过箱图 Boxplots 描述数据分布 五 探索性分析 31 通过箱图 Boxplots 描述数据分布语文成绩箱图 五 探索性分析 32 通过箱图 Boxplots 描述数据分布 数据文件 3 StudentScore sav 五 探索性分析 33 五 探索性分析 通过正态分布检验的Q Q概率图描述数据分布的正态性 有两种 1 正态概率图以变量 语文成绩 的观测值为X轴坐标 以该变量分布的Z分数为纵坐标 斜线为正态分布的Z分数的期望标准线 若观测点离线越近 表示点越符合正态分布 反之 越不符合正态分布 34 五 探索性分析 通过正态分布检验的Q Q概率图描述数据分布的正态性 2 反趋势正态概率图也是以变量 语文成绩 的观测值为X轴坐标 以该变量分布的Z分数与正态分布期望值的偏差为纵坐标 水平直线为期望标准线 若观测点离线越近 表示该点越符合正态分布 反之 越不符合正态分布 35 五 探索性分析 通过正态分布检验的Q Q概率图描述数据分布的正态性 数据文件 3 StudentScore sav Analyze DescriptiveStatistics Explore 36 五 探索性分析 37 五 探索性分析 SPSS操作及案例分析例五 按数据文件 4 Explore sav考察男女学生 英语 数学 语文 三门课程成绩的分布 极端值以及正态分布性和方差的齐性 38 五 探索性分析 SPSS操作及案例分析 箱图 39 五 探索性分析 SPSS操作及案例分析正态概率图反趋势正态概率图 40 五 探索性分析 SPSS操作及案例分析从K S检验以及S W检验两种方法的Sig 值看 均大于0 05 表明三门课程成绩按男女分开的样本都是正态分布的 41 五 探索性分析 SPSS操作及案例分析根据方差齐性检验结果可以看出 语文成绩按照男女分开的样本显著性水平Sig 值都大于0 05 表明方差的差异不显著 也就是说方差是齐性的 42 五 探索性分析 SPSS操作及案例分析例五 操作步骤 数据文件 4 Explore sav Analyze DescriptiveStatistics Explore 43 假设检验假设检验 HypothesisTesting 或者叫做显著性检验 SignificanceTesting 是数理统计学中根据一定假设条件由样本推断总体的一种方法 其基本原理是先对总体的特征作出某种假设 然后通过抽样研究的统计推理 对此假设应该被拒绝还是接受作出推断 既然以假设为前提 那么在进行检验前需要提出相应的假设 H0 原假设或零假设 nullhypothesis 即需要去验证的假设 一般首先认定原假设是正确的 然后根据显著性水平选择是接受还是拒绝原假设 H1 备择假设 alternativehypothesis 一般是原假设的否命题 当原假设被拒绝时 默认接受备择假设 不同的检验有不同的零假设 但基本上对检验结果的判断都遵循以下判别规则 1 如果相伴概率值 P值或Sig 值 小于或等于显著性水平 则拒绝H0 2 相伴概率值 P值或Sig 值 大于显著性水平 则接受H0 3 相伴概率值在spss运行结果中查找 显著性水平可由用户自行设定 如没有特别要求可取默认值0 05K S检验的原假设H0是数据服从指定的分布 如正态分布 卡方检验 chi squaretest 2检验是以 2分布为基础的一种假设检验方法 主要用于分类变量 根据样本数据推断总体的分布与期望分布是否有显著差异 或推断两个分类变量是否相关或相互独立 其原假设H0 观察频数与期望频数没有差别方差齐性检验实际上是指要比较的两组数据的分布是否一致 通俗的来说就是两者是否适合比较 方差齐性原假设H0 认为两总体方差之间不存在显著性差异 方差齐性 44 交叉列联表分析 45 六 交叉列联表分析 概念通过频数分析 能够掌握单个变量的数据分布情况 实际情况 还要了解和分析多个变量不同取值下的分布 掌握多变量的联合分布特征 进而分析变量之间的相互影响和关系 本节主要讲交叉列联表分析 它包括如下两大基本任务 46 六 交叉列联表分析 根据样本数据 产生二维或多维交叉列联表交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表 例如 一个二维交叉列联表 反映了不同户籍和是否购房交叉分组下的分数频数分布情况 例六 数据文件 4 crosstabulation1 sav数据格式 如图 部分 47 六 交叉列联表分析 根据样本数据 产生二维或多维交叉列联表 返回 行百分比 列百分比 48 根据样本数据 产生二维或多维交叉列联表操作步骤 Analyze DescriptiveStatistics Crosstabs 六 交叉列联表分析 49 六 交叉列联表分析 在交叉列联表的基础上 对两两变量间是否存在一定的相关性进行分析在交叉列联表的基础上做进一步的分析 可以得到行变量和列变量之间是否有联系以及联系的紧密程度如何等更深层次的信息 观测频数是分散在列联表的各个单元格中 不容易直接发现行 列变量之间的关系及关系的强弱程度 在此借助非参数检验方法和度量变量间相关程度的统计量等手段进行分析 例如 户口与是否买房看法有没有显著性差异 H0假设 户口状态在是否买房看法上无显著差异H1假设 户口状态在是否买房看法上有显著差异采用的方法 检验和相关性检验 在统计学中检验属于假设检验的范畴 这里只对操作的步骤和结果进行简单解释即可 50 六 交叉列联表分析 在交叉列联表的基础上 对两两变量间是否存在一定的相关性进行分析分析 从表中可以看出 在0 05置信度水平下 双尾检验值为0 002 小于置信度水平 0 05 因此 我们有理由认为 户籍与是否购房之间的关系显著 及不同户籍的人对于是否购房看法不一致 列联表的卡方检验用于检验两个分类变量的关联程度 51 练习题 掌握本节所有概念和SPSS操作步骤完成PPT中的例一 例六 52 均值比较比较样本均值与总体均值之间的差异单样本T检验独立样本T检验配对样本T检验 下节展望 53 谢 结束 谢 54
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!