基本统计分析一频数分布表

上传人:xu****iu 文档编号:244862153 上传时间:2024-10-06 格式:PPT 页数:50 大小:339.61KB
返回 下载 相关 举报
基本统计分析一频数分布表_第1页
第1页 / 共50页
基本统计分析一频数分布表_第2页
第2页 / 共50页
基本统计分析一频数分布表_第3页
第3页 / 共50页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS在社会统计中的应用,社会统计中的统计软件,SPSS基础,SPSS在社会统计学中的应用,描述性统计,( Descriptive Statistics),相关分析,(Correlate),回归分析,(Regression),均值比较与检验,(Compare Means),社会统计中的统计软件,统计分析软件是数据分析的主要工具,完整的数据分析过程包括:,数据的收集,数据的整理,数据的分析,统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。,统计分析软件的一般特点,功能全面,系统地集成了多种成熟的统计分析方法;,有完善的数据定义、操作和管理功能;,方便地生成各种统计图形和统计表格;,使用方式简单,有完备的联机帮助功能;,软件开放性好,能方便地和其他软件进行数据交换。,常用统计软件简介,SAS:真正的巨无霸。被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。,SPSS:统计软件中的贵族,S-Plus:S语言(AT&T贝尔实验室)的后续发展,Stata:软件小巧、功能强大,以下,我们介绍的主要是SPSS。,SPSS(PASW)基础,软件名称,Statistical Package for Social Science (1975-2000年),Statistical Product and Service Solutions(2000年-2009年4月),Predictive Analytics Software(2009年4月起),软件发展,1960 年代:美国斯坦福大学三位研究生研制,1970 年代:SPSS 总部成立于芝加哥,推出 SPSS 中小型机版 SPSSX,1980 年代:微机版( V13 SPSS/PC+ 3),1990 年代:Windows 版( v517),2009年4月:被IBM公司收购,改名为PASW。,第一节 描述性统计,频数分布(Frequencies),数据描述(Descriptives),数据探索(Explore),交互列联表(Crosstab),一、频数分布,在SPSS中可以很容易地得出频数分布表,平均数,标准差等。,频数分布:可以概略地看到资料的分布情况,可做初步整理之用,从中还可检查数据输入情况。,命令选择:Analyze,Descriptive Statistics,Frequencies,备 注:可选入多个变量,Statistics:,Dispersion(离差栏):,Std.Deviation 标准差,Variance 方差,Range 全距,Minimum 最小值,Maximum 最大值,S.E.mean 均值的标准误,Central Tendency (集中趋势栏),Mean 均值,Median 中位数,Mode 众数,Sum 总和,Skewness 偏度(0,1.5,0.5,-0.5) Kurtosis 峰度(0,正,负),例:09-01,还可直接作出图形(Charts):,Bar charts:条形图,Pie Charts:圆图、饼图,Histograms:直方图,只适用于连续的数值型变量。,二、数据描述分析过程,适用条件:对于定距以上变量,可以进行集中趋势和离中趋势的统计,命 令:Analyze,Descriptive Statistics,Descriptives,变量要求:可多选,可 选 项:Mean、Std.deviation、Minimum,三、数据探索,1、对数据进行初步考察:,检查数据是否有错误:过大或过小的数据有可能是奇异值、影响点或错误数据。一要找出,二要分析原因,三要决定是否从中剔除。,数据分布特征:许多分析方法对数据的分布有一定要求。从数据是否服从正态分布,决定他们是否可以选用只对正态分布数据适用的分析方法。,Explore :进行初步探索分析,09-03,四、交互列联表,适用条件:根据变量的层次,统计学中有各种不同的相关系数来描述,在社调中常见的两个定类(或一个定类、一个定序),命 令:Analyze,Descriptive Statistics,Crosstabs,变 量:选择一个或多个变量进入Rows,Column框,对复选框的解释,(1)Chi-square,卡方检验。,Pearson Chi-square test,Likehood ration Chi-square test 似然比卡方检验,Fisher,s exactly test 费雪精确检验,(2)Correlation复选框。Pearson,Spearman(只适用于数值型),(3)Nominal Data栏,适用于定类变量的统计量。Lambda复选项,(4)Ordinal Data栏:适用于定序变量的统计量,Gamma、Kendall”s tau-b、Kendall”s tau-c,(5)Nominal by Interval:一个定类一个定距以上变量,Eta统计量,如收入和性别的关联性,Flag significant correlations:用星号标记有统计学意义的相关关系。,第二节 相关分析,相关分析是研究变量间密切程度的一种统计方法。对于其数值可以从小到大排列的数据才能计算其相关系数。,简单相关( Bivariate ),偏相关( Partial ),1、对定距以上两个变量x与y的相关系数采用Pearson相关系数,2、Spearman Kendall相关系数是一种非参测度,是根据数据的秩而不是根据实际值计算的。适合定序数据或不满足正态分布假设的定距数据。,3、偏相关系数:描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性。如:可以控制年龄和工作经验,估计工资收入与受教育程度之间的相关关系。,4、关于相关系数统计意义的检验:由于抽样误差的存在。检验的零假设,总体中两个变量间的关系为0。,SPSS只给出给假设成立的概率P值。,(1)Analyze,Correlations,Bivariate,计算指定的两个变量之间的相关系数,可选择Pearson相关、Spearman和,Kendall Tau-b相关;同时对相关系数进行检验。,Test of Significance 是用于变量间相关的显著性检验。系统默认的是双侧检验。,Two-tailed:事先不知道相关方向,One-tailed:事先知道相关方向,例Data09-03,使用系统默认值进行相关分析:,分析:起始工资、现工资与雇员受教育水平、工作经验、职务等级之间是否存在线性关系。,(2) Analyze,Correlations,Partial,用上例:,- Controlling for. JOBCAT PREVEXP JOBTIME,SALARY EDUC,SALARY 1.0000 .4399,( 0) ( 469),P= . P= .000,EDUC .4399 1.0000,( 469) ( 0),P= .000 P= .,(Coefficient / (D.F.) / 2-tailed Significance), . is printed if a coefficient cannot be computed,第三节 回归分析,回归分析是处理两个及两个以上变量间线性依存关系的统计方法。,回归分析作为一个严肃的统计学模型,有着严格的使用条件。因此在做回归分析之前,应该对数据进行基本的判断。如作出散点图、观察变量间的趋势等。,Analyze,Regression,Linear,Dependent:因变量,只选一个,Independent:自变量,可选入多个自变量。,Method:对自变量的选入方法。,Enter:强行进入法,Forward:向前选择法,Backward:向后剔除法,Stepwise:逐步进入法,(例,及解释),先做散点图:09-03,Graphs-scatter,剩余变差:Y值对于回归直线的偏差。,回归变差:回归已知时误差减少的量。,总变差=剩余变差+回归变差,总平方和=未解释的平方和+已解释的平方和,扩展,几个自变量的线性回归示例:,如:现工资与受教育水平、初始工资、工作经验、职位之间的回归模型。,第四节 均值比较与检验,均值不相等的两个样本不一定来自均值不同的总体;两个变量均数接近的样本是否来自均值相同的总体?,两个样本某变量均值不同,其差异是否具有统计意义。,对调查样本中不同的子总体在某些变量上的平均值之间的差异情况进行比较。,Means: 主要是对样本的描述统计,也直接进行比较。,One-Samples T Test:样本均值和已知,Independent-Samples T Test:独立样本均值差比较,Paired-Samples T Test:配对样本,问:检验男生和女生的学习成绩是否有显著性差异?,检验丈夫和妻子的智商是否有显著性差异?,方差齐次检验:F,一、Means过程,Analyze,Compare Means,Means,例: 09-03男女工资均值,职位不同的男女雇员工资的均值,二、单样本T检验,Analyze,Compare Means,One-Samples T Test,例:已知某地12岁男孩身高142.3cm,现测得某市120名12岁男孩身高资料。11-02,在Test中输入142.3,三、独立样本T检验,要求被比较的两个样本彼此独立,没有配对关系。要求两个样本均来自正态总体。,例:检验男女雇员现工资是否有显著性差异。09-03,Analyze,Compare Means,Independent Samples T Test,四、配对样本T检验,要求被比较的两个样本有配对关系。两个样本均来自正态总体。均值对于检验是有意义的描述统计量。,例:10个高血压患者在施以体育疗法前后测定舒张压。要求判断体育疗法对降低血压是否有效。11-03,零假设:,练习,自己在电脑上进行操作,将频数分析、交互分析、相关分析、回归分析、均数检验等熟悉一遍。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!