描述性统计分析ppt课件

上传人:钟*** 文档编号:1301711 上传时间:2019-10-13 格式:PPT 页数:42 大小:2.61MB
返回 下载 相关 举报
描述性统计分析ppt课件_第1页
第1页 / 共42页
描述性统计分析ppt课件_第2页
第2页 / 共42页
描述性统计分析ppt课件_第3页
第3页 / 共42页
点击查看更多>>
资源描述
第三章,描述性统计分析,1,主要内容,3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析,2,3.1 基本描述性统计量简介,3.1.1 描述集中趋势的统计量 1.均值(Mean) 2.众数(Mode) 3.中位数(Median) 4.总和(Sum) 5.百分位数(Percentile Value),3,3.1 基本描述性统计量的定义及计算,3.1.2 描述离散程度的统计量 1.样本方差(Variance) 2.样本标准差(Std. deviation) 3.极差(Range) 4.均值标准误差(Standard Error of Mean),4,3.1 基本描述性统计量的定义及计算,3.1.3 描述总体分布形态的统计量 1. 偏度(Skewness):是描述取值分布形态对称性的统计量;偏度系数大于0,表示其数据分布形态有一条长尾拖在右边,称为右偏或正偏,偏度系数小于0,表示其数据分布形态有一条长尾拖在左边,称为左偏或负偏。偏度系数的绝对值越大,与正态分布相比越偏斜。 2. 峰度(Kurtosis):是描述变量取值分布形态陡缓的统计量;峰度系数等于0,表明数据分布的陡峭程度与正态分布相同。峰度系数大于0时为尖峰分布,表明数据分布的陡峭程度比正态分布大,峰度系数小于0时为平峰分布,表明数据分布的陡峭程度比正态分布小。,5,3.1 基本描述性统计量的定义及计算,3.1.3 描述总体分布形态的统计量 来自于正态总体的偏度及峰度均近似为0,可以利用偏度和峰度的值是否接近0作为检验是否是正态分布的重要依据。,6,主要内容,3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析,7,3.2 频率分析,3.2.1 基本概念及统计原理 频率就是一个变量在各个变量值上取值的个案数,分析时不考虑其实际取值。基本统计分析往往从频率分析开始。通过频率分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。 经过频率分析可以得到如下结果: (1)频率分布表:该表中包含频率、各频率占总样本数的百分比、有效百分比、累计百分比。 (2)统计图:用统计图形展示变量的取值状况,频率分析中提供的统计图形可以是条形图、饼图或者直方图。,8,3.2 频率分析,3.2.2 SPSS实例分析 【例3-1】以下是调查问卷中针对被调查人设置的两个问题: 1、您的家庭月收入大约是:(请包括所有工资、奖金、津贴等在内,以人民币为单位)单选 500-10001 1000-19992 2000-29993 3000-39994 4000-49995 5000-59996 6000-69997 7000-79998 8000-89999 9000-999910 10000及以上11 2、 您的教育程度:(指您受过的最高或正在接受的教育程度)单选 没有受过正式教育/小学.1 初中2 高中/中专/技校 3 大专/大学非本科/高职高专4 大学本科.5 研究生及以上6 从问卷中收集到的数据如表3.1所示 , 试对收集到的数据进行频数分析,9,3.2 频率分析,第1步 数据组织:根据表3.1生成SPSS 数据文件,建2个变量:“收入”、“教 育”, 度量标准均为序号。 第2步 频率分析设置: 选择菜单:“分析 描述统计 频率”, 打开“频率(F)”对话框,将“教育”和 “收入”加入到“变量”列表框中。 打开“统计量”对话框,选中“百分位数” “众数”,并在“百分位数”中添加30.0、 60.0、90.0; 打开“图表”对话框,选中“直方图”及后 面的复选框,表3.1,10,3.2 频率分析,第3步 主要结果及分析: 统计量表 变量“教育”的频率分布表,表中分别显示两个分析变量“教育”及“收入”的有效个案数、缺失值个数、及两个分析变量的“众数”及对应于30%、60%及90%的百分位数 。,表中显示了变量“教育”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。,11,3.2 频数分析,变量“收入”的频率分布表,表中显示了变量“收入”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。,12,3.2 频数分析,变量“教育”的直方图 变量“收入”的直方图,表中显示了变量“教育”的直方图,从图上可以看出受访者教育程度同正态分布相比左偏,不具备明显的正态分布。,表中显示了变量“收入”的直方图,从图上可以看出受访者家庭收入同正态分布相比右偏,不具备明显的正态分布。,13,主要内容,3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析,14,3.3 描述性分析,3.3.1 基本概念及统计原理 描述性分析主要用于输出变量的各类描述性统计量的值,通过上一节的学习可知,频率分析同样可以做到,都是以计算数值型单变量的统计量为主。描述性统计分析没有图形功能,也不能生成频率表,但描述性分析可以将原始数据标准化为Z分数,并以变量形式存入数据文件中,以便后续分析时应用。,15,3.3 描述性分析,3.3.2 实例分析 【例3-2】图3-8是5岁儿童体重、身高、胸围的部分SPSS数据,试对儿童身高作描述性统计分析。(数据文件:data3-2.sav) 第1步 打开数据文件data3-2.sav; 第2步 描述性分析设置: 选择菜单“分析 描述统计 描述” ,打开“描述性”主对话框,将要分析的变量“身高”加入“变量”列表框中。 打开“描述:选项”对话框,选中“均值”、“标准差”、“最小值”、“最大值”、“峰度”、“偏度”及显示顺序的“变量列表”等选项。,16,3.3 描述性分析,第3步 运行结果及分析: 描述性分析结果表,表中分析变量“身高”的个案数、所有个案中的极大值、极小值、均值、标准差及偏度和峰度,17,主要内容,3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析,18,3.4 探索性分析,3.4.1 基本概念及统计原理 与前面介绍的两种分析方法相比,探索性分析更加强大,它是一种在对资料的性质、分布特点等完全不清楚的情况下,对变量进行更深入研究的描述性统计方法。在进行统计分析前,通常需要寻求和确定适合所研究的问题的统计方法, SPSS提供的探索性分析是解决此类问题的有效办法。 探索性分析提供了很多关于数据的概括分析和图表直观描述的方法,不仅对个案数据有效,而且还可以针对分组个案。在输出常用描述性统计量的基础之上,探索性分析增加了有关数据详细分布特征的文字与图形表述,如茎叶图、箱图等,显得更加详细、完整,还可以以方差齐性为目的的变量交换提供线索,有助于用户制定更进一步分析的方案。,19,3.4 探索性分析,3.4.2 实例分析 【例3-3】下表是某班3门课程对应成绩的统计数据,试对其作探索性分析并做是否服从正态分布的检验。 第1步 数据组织:定义2个变量,分别为:“科目”、“成绩”,“科目”的度量标准为“名义”,“成绩”的度量标准为“度量”。 第2步 探索分析设置: 选择菜单“分析 描述统计 探索”,打开“探索” 对话框,将“成绩”字段移入“因变量列表”,“科目”移入“因子列表”。,20,3.4 探索性分析,打开“统计量”对话框,选中“描述性”及“M-估计量”选项; 打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”等选项。 打开“探索:选项”,选中“按列表排除个案”选项。 第3步 运行结果及分析: “成绩”按科目分组的案例处理摘要表,表中显示“成绩”按“科目”分组后各组的有效个案数、个案缺失数及缺失比例等 。,21,3.4 探索性分析,描述性统计量表,表中显示“成绩”按“科目”分组后各分组的描述性统计量,左表中只显示的是”语文“分组的均值、均值的95%置信区间的上下限、中值、方差、标准差、极大/小值、偏度、峰度等 。,22,3.4 探索性分析,M均值估计量,表中提供了四种估计方法,每种估计方法的加权量在表下方给出,对于有异常值或极端值的数据,M均值估计有很好的稳定性,用M估计值代替均值或中位数,结果更准确 。根据样本值的权重不同,可以得到不同的估计量,23,3.4 探索性分析,正态检验表,表中显示了按科目分为的3个分组的两种检验方法的正态性检验结果,包括各分组的统计量、自由度及显著性水平,以K-S方法的“语文”分组为例分析:其自由度sig.=0.200,明显大于0.05,故应接受原假设,认为”语文“分组中的数据服从正态分布。,24,3.4 探索性分析,箱图,箱图中显示成绩按科目分成的三个分组,每个分组中的数据绘制成对应的箱体。每一个箱体上方那条线的取值代表该分组中最大值,下方那条线的取值代表最小值。箱体自身的三条线从上到下分别代表3/4分位点、中位点、1/4分位点的取值。,25,3.4 探索性分析,语文成绩的标准Q-Q图及趋降标准Q-Q图,上图为“科目=语文”分组的成绩标准Q-Q图,Q-Q图可以用来检验数据是否服从某种分布,在Q-Q图中,检验数据是否较好地服从给定分布的标准有两个:看标准Q-Q图上的数据点与直线的重合度;Q-Q趋势图上的点是否关于直线Y=0在较小的范围内上下波动。从上图中可以看出,”科目=语文“的分组中的数据与直线重合度较好,故很好地服从正态分布,这与前面的正态检验表中的结果是一致的。,26,主要内容,3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析,27,3.5 交叉表分析,3.5.1基本概念及统计原理 1.交叉表分析的概念 在实际分析中,常需要分析多个变量之间,一个变量是否对其他变量的取值存在影响,分析变量之间是否存在关系,这种分析就称为交叉表分析,用于定类型变量之间的关系分析。 交叉表是两个或多个变量交叉分组后形成的频数分布表,主要用于研究定类型变量之间有无相关性,给出了变量在不同取值下的数据分布。交叉表分析根据样本数据,产生二维或多维交叉表,并在产生交叉表的基础上,对两两变量间是否存在一定的相关性进行分析。,28,3.5 交叉表分析,2交叉表分析的相关关系的主要检验方法 在分析中,难以在交叉表中直接发现行、列变量之间的关系及关系强度,需要借助非参数检验方法和度量变量间相关程度的统计量进行分析,通常采用检验和相关性检验。 卡方统计检验:常用于检验行列变量之间是否相关。 列联系数:用于名义变量之间的相关系数计算。 V系数(Phi and Cramers V):常用于名义变量之间的相关系数计算。,29,3.5 交叉表分析,3.5.2 SPSS实例分析 【例3-4】 在设置学生评价实验教学的调查表中,“实验准备”是其中的一项指标,为分析“实验准备”情况与评价结果的关系,建立的SPSS数据文件中的部分数据如下图所示,变量值标签如下表所示。(参见数据文件:data3-4.sav。),30,3.5 交叉列联表分析,第1步 数据组织:数据文件中建立两个变量:“实验准备”、“评价结果”,两个变量均为数值型或字符型的分类变量,其度量标准为“名义”,保存为SPSS数据文件data3-4.sav。 第2步 交叉表分析设置: 选择菜单:“分析描述统计 交叉表” ,打开“交叉表”对话框,将“实验准备”及“评价结果”字段分别加入“行(s)”及“列(c)”列表框中。 打开“统计量”对话框,选中“卡方”选项。 打开“单元显示”对话框,选中“观察值”及“四舍五入单元格计数”选项,二者都是缺省设置。,31,3.5 交叉表分析,第3步 主要结果及分析: 案例处理摘要,案例处理摘要表给出了数据基本信息,包括参与分析的有效个案数、缺失信息等。在本例中,每个变量有50个有效个案参与分析,无缺失值。,32,3.5 交叉表分析,第3步 主要结果及分析: 实验准备* 评价结果交叉表,表中给出了数据的33交叉表,与原始数据在形式上基本一致,33,3.5 交叉表分析,第3步 主要结果及分析: 卡方检验结果表,表中显示行、列变量通过卡方检验给出的独立性检验结果。共使用了三种检验方法。上表各种检验方法显著水平sig.都远远小于0.05,所以有理由拒绝实验准备与评价结果是独立的假设,即认为实验准备这个评价指标是同评价结果是相关的。,34,3.5 交叉表分析,第3步 主要结果及分析: 分组条形图,本条形图相当于是实验准备*评价结果交叉表的直观表示,用图形表示可更直观地得出各种情况的比较。,35,主要内容,3.1 基本描述性统计量简介 3.2 频率分析 3.3 描述性分析 3.4 探索性分析 3.5 交叉表分析 3.6 多重响应分析,36,3.6 多重响应分析,3.6.1 基本概念及统计原理 1.基本概念 多重响应分析是对多选项问题的分析方法。多选项问题要求问题的答案都是序号变量或名义变量,并且允许选择的答案可以有多个的问题。 多选项问题在问卷调查中普遍存在,要求被调查者从问卷中给出的若干个可选答案中选择一个以上的答案。 例如,调查消费者拥有的数码产品的种类,有如下的选项: (1)数码相机 (2)数码摄像机 (3)MP3 (4)DVD机 很显然,该问题可选的答案在一个以上,对于此类的多选项问题,通常,在SPSS中处理此类问题的一般步骤为以下两大步骤: (1)将多选项问题分解; (2)利用频数分析或者列联表分组下的频数分析方法进行分析。,37,3.6 多重响应分析,2多选项问题的分解方法 (1)多选项二分法:该分解方法是将多选项问题中的每个答案视为一个SPSS变量,每个变量只取0或1两个值,分别表示选择该答案或没有选择该答案。 (2)多选项分类法 :其分解的基本思想是估计多选项问题最多可能出现的答案个数,然后为每个答案定义一个SPSS变量,变量取值为多选项问题中的可选答案。,38,3.6 多重响应分析,3.6.2 多重响应分析Spss实例分析 【例3-5】对50个消费者进行调查,拥有的数码产品的种类,有如下的选项: (1)数码相机 (2)数码摄像机 (3)MP3 (4)DVD机 可多选,按性别统计拥有各种数码产品的数量(data3-5.sav)。 第1步 分解多选项问题,定义多选项变量集; 分解多项式 :按照二分法分解多选项问题,下表为此多选项问题的前7组数据的二分法记录表,其中性别1为男性,2为女性,其他数据中的1表示拥有该产品,0表示没有。,39,3.6 多重响应分析,定义多选项变量集:选择菜单“分析 多重响应 定义变量集”,打开“定义多重响应集”对话框,将“数码相机”、“数码摄像机”、“MP3”、“DVD机”字段加入“集合中的变量”列表框中,“将变量编码为”选择为“二分法”,“计数值”设为1,输入多响应集的名称为“dp”,单击“添加(A)”按钮,将定义好的数据集添加到“多响应集”列表中。 第2步 进行多重响应交叉分组下的频数分析:选择菜单“分析多重响应交叉表”,弹出“多响应交叉表”对话框,将第1步中建立的多响应集$dp添加到“列”列表框中作为交叉表的列,将“sex”字段添加到“行”列表框作为作为交叉表的行,确定“sex”的定义范围为最小值1、最大值2。,40,3.6 多重响应分析,第3步 主要结果及分析: 多重响应分析个案摘要 多重响应交叉分析结果,左 表中给出参与分析的个案数和缺失值的信息。,右表中显示的是多重响应交叉表分析的频数表。从表中可以看出,男性拥有数码产品的数量高于女性,各种数码数码产品中,拥有MP3的人数最多。,41,The End,42,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!