《SPSS基本统计分析》PPT课件.ppt

上传人:za****8 文档编号:13190776 上传时间:2020-06-07 格式:PPT 页数:35 大小:562.01KB
返回 下载 相关 举报
《SPSS基本统计分析》PPT课件.ppt_第1页
第1页 / 共35页
《SPSS基本统计分析》PPT课件.ppt_第2页
第2页 / 共35页
《SPSS基本统计分析》PPT课件.ppt_第3页
第3页 / 共35页
点击查看更多>>
资源描述
第五章,SPSS基本统计分析描述性统计分析,5.4多选项分析(频数分析和交叉分析),多选项问题的概念:多选项问题是根据实际调查的需要,要求被调查者从问卷给出的若干个可选答案中选择一个以上的答案。目前,市场研究或许多领域对某事物评价的研究中常常遇到这样的问题。可以选多个,分为限选和不限选:限选:如在11种工作种类中,选你喜欢的,最多可选4种(Var1-Var4);求所有人喜欢各种工作的频数或频率。不限选:如在所列的20种电器中,你家所拥有的电器,不限选(Var1-Var20),求所有被调查家庭拥有各种电器的频数或频率。,5.4.1多选项问题的分解,多选项二分法及其编码(multipledichotomiesmethod):多选项二分法是将多选项问题中的每一个答案设为一个SPSS变量,每个变量值有0或1两个取值,分别表示选择了该答案和不选择该答案。如对下面问题有9个可能的答案,每个可选择的答案由一个变量表示,每个变量的值只能有表明“是”和“否”的两个代码0或者1。,左边的表格为向顾客发放的颜色调查,在选择服装时,您喜欢什么颜色作为主体颜色,在答案的“”中打“”(可多选)这是一组问题,每个问题均有两个答案,回答者只能选择其中一种。在建立数据文件时,变量名使用相同的变量主名,后面加以不同序号组成,本组问题的9个变量名可以是color1-color9。而答案的编码规则为:回答“是”变量值为1,回答“否”变量值为0,其他值为缺失值。,多选项分类法及其编码(multiplecategorymethod):多选项分类法中,首先应估计多选项问题最多可能出现的答案个数;然后为每个答案设置一个SPSS变量,变量取值为多选项问题中的所有可选答案。如上面有关选择服装的主体颜色,您可以选择喜欢的三种,在提供的10种答案前上选择。1、红2、橙3、黄4、绿5、青6、蓝7、紫8、黑9、白10说不清这是一个问题,可以有三个答案。在建立数据文件时,要建立三个变量color1-color3表示回答者选择的三个颜色。如选择结果为1、红、6、蓝、8、黑,则变量color1的值为1,变量color2的值为6,变量color3的值为8。,如果采用多选二分法则有6个选项,故应设6个变量,运用0-1编码方法编码,即:1,0,1,0,1,1。如果采用多选分类法,则编码为1,3,5,6,0,0。,1356,问题2:择业中考虑的主要因素(多选),1经济收入2专业对口3发展前途4地理区位5个人爱好6风险大小7劳动强度8社会福利9其他,编码应为:1,0,1,1,1,0,1,1,0。或1,3,4,5,7,8,0,0,0。,136,问题3:您择业中考虑的主要因素有(限选三项),1经济收入2专业对口3发展前途4地理区位5个人爱好6风险大小7劳动强度8社会福利9社会地位10其他,因为限选三项,故应设三个变量,编码依次为1,3,6。,5.4.2多选项分析的基本操作,首先将每个题的若干答案组成一个综合变量即变量集(Set),然后对综合变量的各种取值进行分析。只有通过定义多选项变量集,spss才能确定应对哪些变量取相同值的个案数进行累加。多选项分析在SPSS中是通过Analyze-MultipleResponse中的各项功能实现的。1.DefineSets:(1)从左边的变量中将多选变量集的变量选择到variablesinsets框中,建立多选二分变量集或多选分类变量集。(2)在variablesarecodedas框中指定多选变量集中的变量是按照那种方法编码的。Dichotomies表示以多选二分法编码,并在countedvalue中输入用哪个数值来表示选中该选项。categories表示以多选分类法编码,并在range框中输入变量取值的最小值和最大值。,(3)为多选项变量集命名,系统会自动在该名字前加字符$。(4)单击add按钮将定义好的多选项变量集加到multresponsesets框中。Spss可以定义多个多选项变量集。2.Frequencies:对多选变量集进行频数分析。从multresponsesets中把待分析的多选项变量集选择到tablesfor框中;3.Crosstabs:对多选变量集与其他变量集或与原基本变量进行交叉表分析。,(1)选择列联表的行变量并定义取值范围;(2)选择列联表的列变量并定义取值范围;(3)选择列联表的控制变量并定义取值范围;(4)单击option按钮选择列联表的输出内容和计算方法。Matchvariableacrossresponsesets选项表示,如果列联表的行列变量均为多选项变量集时,第一个变量集的第一个变量与第二个变量集的第一个变量作交叉分组,依次类推。结果中:注意PctofResponses(占总回答数的)和PctofCase(占总个案数)的区别。,5.4.3多选项分析的应用举例,利用居民储蓄调查数据进行分析,实现以下两个分析目标:1.分析储户的储蓄目的;2.分析不同年龄段储户的储蓄目的。,分析,1.为进行多选项分析,首先定义名为cxmd的多选项变量集,其中包括a7_1、a7_2、a7_3三个变量,然后对多选项变量集进行频数分析;2.对不同年龄段储户储蓄目的进行分析,采用多选项交叉分组下的频数分析。,5.5探索分析Explore,1.分析目的和方法奇异性:数据过大或过小(找出、分析原因、是否剔除)分布特征:数据是否来自正态总体考察方法:统计量和统计图形(箱式图、茎叶图、QQ图)2.一般是考察定距变量3.Analyze+DescriptiveStatistics+Explore分析变量(DependentList):数值型变量分组变量(FactorList):分类变量标识变量(LabelCasesby):用某变量的值作为观察值的标识如id,选择一个或多个变量进入Dependent框作为分析变量,单击OK可获得分析变量的一系列基本统计量和图形。,此作为分组变量,可以是字符变量,对分析变量的分析将按该变量的观测值进行分组分析。可有多个分组变量,这时会按多个变量的交叉组合进行分组。,该框中的变量作为标识符,在输出诸如异常值时,用该变量进行标识,只允许有一个标识符。,可同时输出基本统计量和图形只输出基本统计量只输出图形,Explore主对话框,输出基本统计量均值的置信区间,可键入199%的任意值,根据该值算出置信区间的上下限。,给出中心趋势的最大似然比的稳健估计量,当数据分布均匀,且两尾较长,或当数据中存在极端值时,可给出比均值或中位数更合理的估计。,输出最大和最小的5个数,且在输出窗口中加以标明。,输出5%、10%、25%、50%、75%、90%和95%的百分位数。,Statistics对话框,Statistics子对话框:用于选择需要的描述统计量;descriptives:输出均值、中位数、众数、5%修正均值、估计标准误、方差、标准差、最小值、最大值、全距、四分位差、峰度系数及其标准误、偏度系数及其标准误及指定的均值置信区间;m-estmators:做集中趋势的最大稳健估计,该统计量是利用迭代方法计算出来的,受异常值的影响要小得多。如果该估计量离均值较远,则说明数据可能存在异常值,此时宜用该估计量替代均值以反映集中趋势。一共会输出四种m估计量,其中huber适用于数据接近正态分布时,另三种则适用于数据中有许多异常值的情况;outliers:输出五个最大值和五个最小值。percentiles:输出第5%、10%、25%、50%、75%、90%、95%分位数。,plots子对话框:用于选择需要的统计图;boxplots复选框:确定箱式图的绘制方式,可以分组绘制(factorlevelstogether),也可以不分组绘制(dependentstogether),或者不绘制(none);descriptive复选框:可以选择绘制茎叶图(stem-and-leaf)和直方图(histogram);normalityplotwithtest:绘制正态分布图(QQ图),并进行变量是否符合正态分布的检验;,茎叶图(stem-and-leaf),1.用于显示未分组的原始数据的分布2.由“茎”和“叶”两部分构成,其图形是由数字组成的3.以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留一位数字5.茎叶图类似于横置的直方图,但又有区别:直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息6.图的下方会标示出茎宽和实际值的倍数,每行的茎和叶组成的数字再乘以茎宽,即得到实际数据的近似值如茎宽为10,则图中的2.3代表23,同样在图的下方也会标示出每片叶子代表的记录数。,未分组数据茎叶图,例题,某大学数学教师认为,学生学习数学时的焦虑情绪是影响数学成绩的因素之一。他采用两种不同的教学方式(学生自学、教师讲授)考察不同焦虑水平的大学生解决某个数学问题的成绩。首先,通过“数学焦虑水平自评量表”筛选出被试120名,其中高焦虑的被试60名(称为高焦虑水平组),低焦虑的被试60名(称为低焦虑水平组)。再把高、低焦虑水平组被试各分成两组,每组30人,分别采用不同的教学方式学习某个数学问题(120个被试均没有学习过该数学问题)。经过同样的教学时间后,对全体被试进行同样的数学测验,并采取同样的评分标准评定每个学生的数学成绩。是分别对各组被试的数学成绩做探索分析。,练习,利用居民储蓄调查数据,对一次存款金额变量进行探索性分析。,5.6比率分析,5.6.1比率分析的目的和主要指标比率分析用于对两变量间变量值比率变化的描述分析,适用于数值型变量。例如根据1999年各地区保险业务情况的数据,分析各地区财产保险业务的保费收入占全部业务保费收入的比例情况。,通常的分析可以生成各个地区财产保险业务的保费收入占全部业务保费收入的比率变量,然后对该比率变量计算基本描述统计量(如均值、中位数、标准差、全距等),进而刻画比率变量的集中趋势和离散程度。SPSS的比率分析除能够完成上述分析外,还提供了其他相对比描述指标,大致也属于集中趋势描述指标和离散程度描述指标的范畴,具体包括:,(1)加权比率均值(Weightedmean):两变量均值的比,属集中趋势描述指标。(2)AAD(AverageAbsoluteDeviation)平均绝对离差:是对比率变量离散程度的描述,计算公式为:其中,是比率数,M是比率变量的中位数,N为样本数,相对数或平均数计算平均数的计算相对数(或平均数)用Y表示,有Y=a/b,a、b为总量指标。求各期Y的平均一般不能采用简单算术平均法,即因为各期数据Yi的对比基础bi不同,它们对全期总平均水平的影响作用应轻重有别.,计算公式:1.分别计算其分子、分母的平均数2.对比得:上式实质上等于对各期Y加权算术平均。,(3)COD(CoefficientofDispersion)离散系数:也是对比率变量离散程度的描述,计算公式为:(4)PRD(Price-relatedDifferential)相关价格微分:是比率均值与加权比率均值的比,也是比率变量离散程度的描述。,(5)COV变异系数:用于对比率变量离散程度的描述,分为基于均值的变异系数(MeancenteredCOV)和中位数的变异系数(MediancenteredCOV)。前者是通常意义下的变异系数,是标准差除以均值;后者定义为:,5.6.2比率分析的基本步骤(1)选择菜单AnalyzeDescriptiveStatisticsRadio,出现窗口,(2)将比率变量的分子选择到Numerator框中,将比率变量的分母选到Denominator框中。(3)如果做不同组间的比率比较,则将分组变量选择到GroupVariable框中。(4)单击Statistics按钮指定输出哪些关于比率的描述统计量,出现如下窗口:,至此,SPSS将自动计算比率变量,并将相关指标输出到输出窗口中。,报表中的描述性统计分析(casesummaries)过程,casesummaries过程用于按指定的分组变量的不同水平进行交叉描述性统计分析。Analyze-report-casesummary进入。variables框:选择需要进行分析的变量,可多选;groupingvariables框:选择用于分组的变量。如果选择了多个分组变量,则系统会按各个变量的不同取值的交叉组合对汇总变量进行分析。,Displaycase:用于确定是否输出详细的记录列表,下面的三个复选框用于选择具体的输出方式。Statistics子对话框用于选择一些常用的统计量。title子对话框:title框:用于定义输出表格的标题,默认标题为casesummaries。caption框:用于给输出表格加上注解文字。,subheadingsfortotals:用于选择是否给每个分组均显示所计算统计量的名称;excludecasewithmissingvalueslistwise:用于选择是否在分析中删除带有缺失值的变量。missingstatisticsappearas:用于输出一个字符串,用于在输出结果中表示缺失值。,报表中的描述性统计分析举例,1.对居民储蓄调查数据中的居民存款金额按照户口和职业进行分类汇总得到均值、中位数及标准差。分析:可以使用splitfile过程,然后使用descriptive过程来完成。但是我们用这里的casesummary过程一步就能完成。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!