第一讲 SPSS基本使用

上传人:门**** 文档编号:243139585 上传时间:2024-09-16 格式:PPT 页数:98 大小:1.71MB
返回 下载 相关 举报
第一讲 SPSS基本使用_第1页
第1页 / 共98页
第一讲 SPSS基本使用_第2页
第2页 / 共98页
第一讲 SPSS基本使用_第3页
第3页 / 共98页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,数据分析,-,何帆,*,第一讲,SPSS,基本用法,何 帆,QQ,:,1048598,Email,:,fei_lai_fengQQ.com,BK:, Program for the Social Sciences,,即社会科学统计软件包。,2000,年后来改名为,Statistical Product & Service Solutions,,即统计产品和服务解决方案。,数据分析,-,何帆,参考资料,参考教材,数据统计与分析技术,-SPSS,软件实用教程,张文彤主编,SPSS,统计分析基础教程,高等教育出版社,张文彤主编,SPSS,统计分析高级教程,高等教育出版社,参考网站,http:/,网络课堂,数据分析,SPSS,安装,下载地址:,http:/61.187.92.238:5008/software/,数模软件,/,SPSS_V13.0.rar,版本,SPSS V13,数据分析,-,何帆,数据分析,-,何帆,SPSS,应用领域,销售分析,市场调查,社会调查,农业生产中产量与因素的分析,产品质量控制,数据分析,-,何帆,SPSS,的运行,点击桌面的,SPSS,的图标,运行,SPSS,,弹出如下窗体。,数据分析,-,何帆,SPSS,的运行,初始画面,运行,SPSS,电子教程,数据分析,-,何帆,SPSS,的运行,初始画面,在,SPSS,提供的表格中输入数据,数据分析,-,何帆,SPSS,的运行,初始画面,执行一个已经存在的,SPSS,数据库文件,数据分析,-,何帆,SPSS,的运行,初始画面,使用数据库向导创建一个新的查询,数据分析,-,何帆,SPSS,的运行,初始画面,打开一个存在的数据文件,数据分析,-,何帆,SPSS,的运行,初始画面,打开一个其他的文件,数据分析,-,何帆,SPSS,的窗口,资料编辑窗口,资料输出窗口,句法编辑窗口,图形编辑窗口,手稿编辑窗口,数据分析,-,何帆,资料编辑窗口,(,常用,),数据分析,-,何帆,资料输出窗口,(,常用,),数据分析,-,何帆,资料输出窗口的操作,打开和保存(可存为加密的文件),移动删除(与资源管理器类似),结果的导出,Export,(导出为,Word,文档时中文不能显示),数据分析,-,何帆,图形编辑窗口,可对图形进行,相应的操作,数据分析,-,何帆,句法编辑窗口,(,几乎不用,),通过对话框的,Paste,按钮进行添加句法。,数据分析,-,何帆,手稿编辑窗口,(,几乎不用,),数据分析,-,何帆,SPSS,的主要功能,数据编辑功能,表格的生成和编辑,图形的生成和编辑,统计功能,与其它软件的连接,数据分析,-,何帆,数据编辑功能,可对变量进行增加、删除、复制、剪切和粘贴等常规操作,还可以对数据进行排序、转置、拆分、集合和加权等操作,合并操作,数据分析,-,何帆,表格的生成和编辑,可生成十种不同风格的表格,依照功能分为:,一般表,多响应表,频数表,数据分析,-,何帆,图形的生成和编辑,条形图:简单,分组,分段,阴影,垂悬,线形图:单线,多线,垂线,投影,面积图:简单,分段,饼状图:简单,爆炸,高低图:高,-,低,-,收盘,距限图,箱图:简单,分组,范围条形图:简单,分组,误差条形图:简单,分组,混合:任意面积图、条形图和线形图的组合,数据分析,-,何帆,图形的生成和编辑,直方图,散点图,诊断和探测图,观测量绘图和时间序列绘图,概率图,自动相关和部分自动相关函数绘图,交叉相关函数绘图,数据分析,-,何帆,统计功能,描述性分析,统计检验,方差分析,列联表,相关分析,回归分析,聚类分析,判别分析,因子分析,数据分析,-,何帆,与其它软件的连接,能直接打开,Excel,、,dBase,、,Lotus1-2-3,、,Access,等文件,文本编辑器生成的数据文件,支持,OLE,和,ActiveX,技术,内置的,VBA,客户语言,可以通过,VB,编程控制,SPSS,SPSS,的数据变量,何 帆,主要内容,常量,变量,表达式,构建新变量,数据文件的转换,常量,常量的定义,SPSS,的常量包括,3,种,:,数值型常量,在单引号或双引号中的字符串常量,按日期格式表示的日期和时间常量,(,极少使用,),常量,数值型常量,有两种书写方式:,1.,定点(小数点位置固定),普通书写方式,,例如:,26,、,38.4,等。,2.,浮点(小数点位置不固定),科学记数法,,常用于表示特别大或特别小的数字,,例如:,1.23D3,、,2.56E-2,、,3.86-2,,,分别表示,1230,、,0.0256,、,0.0386,。,其中,D3,、,E-2,、,-2,表示,10,的,3,、,-2,、,-2,次幂。,常量,在单引号或双引号中的字符串常量,字符串常量是指被单引号或双引号括起来的一串,字符。,例如 ,Tom is boy,如果字符串中本身带有单引号或半个单引号,,则该字符串常量必须使用双引号括起来。,例如 “,Boys Book”,。,常量,观察值的录入,数据录入方法,一旦定义了变量库,结束数据结构修改任务,返回数据编辑窗口的二维表格。,SPSS,输入数据的操作方法是多种多样的,可以按列,(,变量,),输入;也可以按行,(,样本或观测量,),输入。输入前,务必要弄清多少(,m,)个变量、多少(,n,)个样本,以输入,m,列,n,行。,常量,观察值的录入,值标签,如果对一个变量的值定义了标签,输入该变量的值时可以显示输入值,也可以显示输入值的标签。,选择方法是单击主菜单的“,View”,菜单项,展开下拉菜单,点击下拉菜单最下面一栏“,Value Labels”,即可;,常量,观察值的录入,显示某变量的一切信息,选择,Utilities,下的,Variables,,就可显示某变量的一切信息;对话框中左半部是变量列表,列出当前数据编辑窗口中定义的所有变量名。,对话框右半部分是变量信息显示区:“,Variable Information,:”,列出指定变量在数据编辑窗口中的变量名,变量标签,变量值标签,数据类型和缺失值。,变量,变量的定义,若不输入变量名,而直接输入变量值,则系统按变量的输入顺序给出的变量名的默认值为:,VAR00001,、,VAR00002,、,VAR00003,依此类推。于是,可转入,Variable View,后,用键盘输入自己定义的变量名。,例如将“,VAR1SEX”,作为变量名。,变量,变量的定义,SPSS,变量命名应遵循以下原则:,SPSS(V13),变量的变量名由不多于,64,个字符组成;,首字符是字母、中文或特殊符号,,但不能是空格。其后可为数字、字母、中文、特殊符号“”、“,$”,、“,”,或除了“,?”“!”,和“*”以外的字符,但不能以下划线“,_”,和圆点“”作为变量名的最后一个字符,以引起误会。,变量名不能与,SPSS,保留字相同以免引起混乱。,SPSS,的保留字有,ALL,、,AND,、,BY,、,EQ,、,GE,、,GT,、,LE,、,LT,、,NE,、,NOT,、,OR,、,TO,、,WITH,等,13,个。,变量,变量的定义,SPSS,变量命名应遵循以下原则:,系统不区分变量名中的大小写字符。例如:,ABC,和,abc,被认为是同一个变量。,例如:“,A_s1”,; “,a.8$1”,; “,name_1”,; “,_J13name”,;“,Name?1”,; “,all”,; “,2var”,; “南京产量” “,Fem le”,;,变量,变量的类型,SPSS,变量有三种基本类型:数值型、字符型、日期型。数值型变量又按不同要求分为六种,因此共可定义八种类型的变量。变量的系统默认长度一般为,F8.2,,其中,8,是显示宽度,,2,是小数点后面的位数,但可通过主菜单,Edit,中的“,Options”,重新设置。,变量类型,Numeric,:数值型,同时定义数值的宽度(,Width,),即整数部分,+,小数点,+,小数部分的位数,默认为,8,位;定义小数位数(,Decimal Places,),默认为,2,位。,例如,-36452.72,、,5.6467E5,显示出来的都是标准数值格式,Comma,:加显逗号的数值型,即整数部分每,3,位数加一逗号,其余定义方式同数值型。,变量类型,Dot,:,3,位加点数值型,无论数值大小,均以整数形式显示,每,3,位加一小点(但不是小数点),可定义小数位置,但都显示,0,,且小数点用逗号表示。如,1.2345,显示为,12.345,00,(实际是,12345E-4).,Scientific notation,:科学记数型,同时定义数值宽度(,Width,)和小数位数(,Decimal Places,),在数据管理窗口中以指数形式显示。如定义数值宽度为,9,,小数位数为,2,,则,345.678,显示为,3.46E+02,。,变量类型,Date,:日期型,用户可从系统提供的日期显示形式中选择自己需要的。如选择,mm/,dd/yy,形式,则,1995,年,6,月,25,日显示为,06/25/95,。,Dollar,:货币型,用户可从系统提供的日期显示形式中选择自己需要的,并定义数值宽度和小数位数,显示形式为数值前有。,变量类型,Custom currency,:常用型,显示为整数部分每,3,位加一逗号,用户可定义数值宽度和小数位数。如,12345.678,显示为,12,345.678,。,String,:字符型,用户可定义字符长度(,Characters,)以便输入字符。,变量定义,Name,变量名,Type,数据类型,Width,宽度,Decimals,小数位数,Label,变量标签,Values,定义具体变量值,Missing,用于定义变量缺失值,Colomns,显示列宽,Align,对齐方式,Measure,定义变量类型是连续、有序分类还是无序分类,变量标签和值标签的定义,变量标签的定义,变量标签(,Variable Labels,),变量标签,Label,是对变量名的附加的进一步说明。在统计输出中会在与变量名相对应的位置显示该变量的标签,这样有助于分析、输出易读的结果。,变量标签和值标签的定义,变量标签的定义,(,变量)值标签(,Value Labels,),变量值标签是对变量的可能取值所附加的进一步说明和注释,对分类变量往往要定义其取值的标签。因此,在贴标签之前,要弄清变量或变量值代表的意义。,变量标签和值标签的定义,变量标签和值标签示例,变量,变量标签,变量值,值标签,Sex,性别,f,Female,m,Male,age,年龄,1,=14,岁,2,15-64,岁,3,65,岁,Hor,夫妻和睦程度,1,不和睦,2,一般,3,和睦,变量标签和值标签的定义,变量标签和值标签的定义方法,变量标签(,Label,)定义在,Variable View,屏幕下,可在,Label,列下直接输入。,变量值标签(,Values Label,)定义比较麻烦,先用打开值标签的对话框,再进行编辑。,用户缺失值定义,定义缺失值:,SPSS,提供缺失值处理技术。在,Define Variable,对话框中点击,Missing Value.,钮,弹出,Define Missing Values,对话框,用户有,3,个可选项:,用户缺失值定义,1,、,No missing values,:没有缺失值;,2,、,Discrete missing values,:可定义,1-3,个。如测量身高(厘米)的资料,可定义,999,为缺失值;性别的资料(男为,1,、女为,2,),可定义,1,为缺失值;,3,、,Range plus one optional discrete,:可定义缺失值的范围,同时定义另外,1,个不是这一范围的缺失值。如定义,09,为脉搏的缺失值,同时定义,999,为缺失值。,表达式,如果在某种条件下进行计算(,Compute,)、或进行样本选择(,Select Cases,)时,常可见,If,对话框,允许我们根据逻辑运算符或关系运算符对部分样本进行选择、操作。,SPSS,的基本运算共有三种:数学运算、关系运算、逻辑运算。,相应运算的算符如下,SPSS,的基本运算符,数学运算符,关系运算符,逻辑运算符,符号,意义,符号,运算符,意义,符号,运算符,意义,+,加,GT,大于,|,Or,逻辑或,*,乘,=,GE,大于等于,*,幂,=,EQ,等于,(),括号,=,NT,不等于,表达式,算术表达式,算术运算符可以连接数值型的常数、变量和函数构成算术表达式,其运算结果为数值型常数。必须严格执行计算机格式而不是手写格式,,例如:,3X,必须写为,3*X,Y-X*2/(A+B)+1-ABS(A*Z),一个合法的算术表达式。,表达式,算术表达式,运算的优先顺序为:按括号、函数、乘幂、乘或除,加或减的顺序,同一优先级的,从左到右运算。,注意,在,SPSS,中乘幂是*,而不是,,这与,EXCEL,等完全不同;常数、变量、函数和算术表达式的 输入必须在英文状态下而不能在中文状态下,否则无法计算。,表达式,比较表达式,比较算符建立的是两个量之间的比较关系式,由系统判断关系是否成立。如果比较关系成立,比较表达式的值为“真”(,1,),否则为“假”(,0,)。无论进行比较的两个量是字符型还是数值型,比较的结果均是逻辑型常量。,比较算符表中列出的比较算符均有两种表示方法,用符号表示和用字母表示,这两种算符是等价的。,例如:,A,5,和,A GT 5,是等价的,,A,6,则表达式,A,5,为真,其值为,1,;,A,5,,则表达式,A,5,的值为假,值为,0,。,表达式,逻辑表达式,逻辑算符即布尔算符有两种表示方法,用符号表示和用字母表示,这两种算符也是等价的。,例如,: A,B,与,A and B,是等价的。,“逻辑与” 运算符,&(,或,and),前后的两个量均为真时,逻辑表达式的值为“真”,否则为“假”;,例如:,A,B,C,0,A=3 & B,2 & C,6,表达式,逻辑表达式,“逻辑或”运算符,| (,或,or),前后的两个量只要有一个为“真”时,逻辑表达式的值为“真”。只有当操作符前后两个量均为假时,逻辑表达式的值才为“假”。,例如:,A,B | C,0,中只要,A,B,成立,无论,C,为何值,表达式的值均为“真”。或者只要,C,0,成立,无论,A,与,B,为何值,该表达式的值均为“真”。,表达式,逻辑表达式,“逻辑非”运算符,(或,not,),前置算符,它对其后面的量作逻辑非运算。,NOT,后面的量值为“真”,则,NOT,运算结果为“假”。逻辑与的运算顺序高于逻辑或。,例如,: NOT,(,A,0,)中,A,为正数,逻辑表达式的值为“假”;,A,为负数或,A,为,0,,逻辑表达式的值均为“真”。,表达式,逻辑表达式,如果使用逻辑表达式选择每月薪金(,Salary,)在,3000-5000,元的男性(,Sex=m,),以及每月薪金在,2000-4000,元的女性(,Sex=f,),则其表达式为:,Salary=3000 & Salary =2000 & Salary=520 & Score =2000 & Score Open=Data,,可打开的文件类型如下表:,数据文件的转换,SPSS(*.,sav,),SPSS,数据文件(,6.0,13.0,版),SPSS/PC+(*.sys),SPSS 4.0,版数据文件,EXCEL(*.,xls,),EXCEL,数据文件,Text(*.txt),纯文本格式的数据文件,data(*.,dat,),纯文本格式的数据文件,SPSS portable(*.,por,),SPSS,便携格式的数据文件,Lotus(*.w*),Lotus,数据文件,dBase(*.dbf),dBase,系列数据文件,(从,dBase II,IV,),数据文件的转换,数据录入技巧,向导载入,直接拷贝,数据文件的转换,导入数据,可以从,Access,数据库中导入,示例:,demo.mdb,使用菜单,File-,OpenDatabase,-New Query,示例:,demo.mdb,数据文件的转换,SPSS,现在可以直接读入许多格式的数据文件,其中就包括,EXCEL,各个版本的数据文件和,Text,文本文件,示例:,demo.xls,demo.txt,数据文件的转换,保存数据,选择菜单,File=Save,或,Save as,注意:如果你准备将数据存为,SPSS,以外的其他类型,要注意有些设置可能会丢失,如标签和缺失值等。尤其是缺失值,如果想存的数据格式不支持缺失值,那你的数据可能会变的面目全非。,数据预处理,本课主要内容,数据排序,数据转置,数据拆分,数据文件合并,数据选择,变量加权,数据转换,数据排序,有时需要对数据进行大小排序,SPSS,中排序有两种方式,直接改变样本的顺序,(Sort Cases),这种方式会根据选定的排序变量改变样本的顺序,,可以选择一个或多个变量进行排序。,给出排序的顺序号码,(Rank Cases),样本的顺序不改变,新增一列变量,标识样本的顺,序。,数据排序,直接改变样本的顺序,(Sort Cases),菜单“,Data” -“Sort Case”,直接在变量明上右键,在快捷菜单中选择。,数据排序,给出排序的号码,(Rank Cases),菜单“,Transform” -“Rank Cases”,数据转置,与矩阵转置相似,将行列互换,点击“,Data”,菜单中的“,Tranpose,”,命令,数据拆分,如果对数据基于一个或几个变量分类后形成的各组数据的个体感兴趣,可以使用拆分。,点击菜单“,Data”-”Split File”,数据文件合并,样本合并,相同的数据结构,需要增加样本数量时使用,变量合并,增加变量数,同时也有可能增加样本,数据文件合并,样本合并,菜单”,Data”-“Merge Files”-”add cases”,变量合并,菜单”,Data”-“Merge Files” ”-”add variables”,数据选择,数据分析中可能只对一个分类变量的几个水平(组)数据感兴趣,或者在判别分析中,使用,90%,的样本建立判别函数,用其余样本考核判别函数。或者对某一部分具有某种特点的样本感兴趣。可以通过选择数据功能来实现。,菜单,“,Data”-”Select Case”,数据选择,数据选择,All Case,系统默认选项,选择所有样本,If condition is satisfied,选择满足 设定条件的样本,点击,if,按钮弹出,数据选择,Random sample of cases,随即抽取一定比例货数量的样本,选择,并点击,sample,弹出如下窗口,数据选择,Based on time or case range,按观测样本的编号范围选取样本点击,Range,按钮,弹出如下窗口,数据选择,Use filter Variable,用过滤变量选择样本,除了,All case,,其它方法都产生一个过滤变量,filter_$,,在过滤变量中,1,表示选择,,0,表示未选择。,变量加权,变量加权是指对变量,特别是频数变量的加权,常用于计数频数统计表。,菜单,Data -Weight cases,变量加权,变量加权,Do not weight cases,不对变量加权,Weight case by,指定频数变量,对变量加权,即:把变量定义为频数,示例,某高校教授有,12,人,副教授,44,,讲师,50,人,助教,32,,工资分别为:,6500,,,4800,,,3000,,,2400,。计算工资的均值及方差。,数据转换,Spss,中具有强大的数据转换功能,可以使用表达式计算的方式获取新的变量。,数据转换,计算产生变量,(Compute),菜单,Transform-Compute,重新赋值,Record,在问卷调查中,有时为了避免引起误会,需要将某些变量的观测值重新赋值。也可以用于高层次度量尺度的数据向低层次转换。,菜单,Transform-Record-Into same variables,Transform-Record-Into Different variables,重新赋值,菜单,Transform-Record-Into same variables,重新赋值,菜单,Transform-Record-Into Different variables,计数统计,Count,多个变量定义样本值的计数统计,菜单,Transform-Count,计数统计,缺失值的替换,对于缺失值,可采取多种手段进行科学替代。选,Transform,菜单的,Replace Missing Values.,命令项,缺失值的替换,1,、,Series mean,:用该变量的所有非缺失值的均数做替代;,2,、,Mean of nearby points,:用缺失值相邻点的非缺失值的均数做替代,取多少个相邻点可任意定义;,3,、,Median of nearby points,:用缺失值相邻点的非缺失值的中位数做替代,取多少个相邻点可任意定义;,4,、,Linear interpolation,:用缺失值相邻两点非缺失值的中点值做替代;,5,、,Linear trend at point,:用线性拟合方式确定替代值。,练习,请将“彩票数据,.,xls,”文件中的数据转换成,SPSS,保存的“彩票数据,.,sav,文件”。,请上网查询双色球的中奖号码,把,”,彩票数据,.,sav,”,中的数据补充完整,(,到最新的一期,),。,请统计每一期红球号码的和。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!