资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,SPSS,软件使用简介,陈 炳 为,一、,SPSS,基本操作概述,3,SPSS,简史,软件名称,:,原名为:,S,tatistical,P,ackage for,S,ocial,S,cience,(社会统计软件包),随着,SPSS,产品服务领域的扩大和服务深度的增加,,SPSS,公司已于,2000,年正式将英文全称更改为,S,tatistical,P,roduct and,S,ervice,S,olutions,,,(,统计产品与服务解决方案,),软件发展,60,年代:美国斯坦福大学三位研究生研制,70,年代:,SPSS,总部成立于芝加哥,推出,SPSS,中小型机版,SPSSX,80,年代:微机版(,V14,),SPSS/PC+,90,年代:,Windows,版(,v610,),本世纪:,1118,版,中文版,4,SPSS,窗口,数据编辑窗口(,SPSS Data Editor,),数据视窗:,Data View,变量视窗:,Variable View,输出窗口(,Output-SPSS,Viewe,r,),语法窗口,(Syntax-SPSS Syntax Editor),5,SPSS,窗口,数据编辑窗口(,SPSS Data Editor,),数据视窗:,Data View,此窗口下可输入、修改、保存或查看数据,变量视窗:,Variable View,定义、修改或察看变量的设置情况。,名称、宽度、类型、小数位数、变量标签、值标签,6,SPSS,窗口简介,数据编辑窗口,数据表格,标准的电子表格,数据视图:主要界面,变量视图:定义变量,单元格编辑器,显示精确数值,不能直接输入公式,菜单,快捷工具栏,状态栏,7,SPSS,窗口简介,结果草稿窗口,节约系统资源,结果浏览窗口,结果输出美观,提供方便的类似资源管理器的界面,8,二、基本窗口操作入门,10,变 量 编 码,根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。,问题:您认为打工的外地人对南京市的社会秩序是否有影响?(单选),1,有很大影响,2,有较大影响,3,没有影响,4,不好说,4,编码,答案,Ques1(,变量名称,)4(,变量值,),11,确定变量,如:一个问题中有几个变量:,变量由两个部分构成:,变量名,和,变量值,。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分,问题,和,变量,。,12,2,1,单选,题的,变量,设置,13,复(多)选题的变量设置,设置,六个变量,:Ques11_1(,变量名称,)1(,变量值,),Ques11_2(,变量名称,)0(,变量值,),.,14,SPSS,数据文件是一种有结构的数据文件,年级 性别问题,1,问题,n,11.4,222,.,311,文件结构,数据,(,变量值,),个案,case,变量名,变量,SPSS,数据文件的特点,15,设计变量,统计表格格式,统计分析格式,16,设计变量,变量设计的基本原则,不同观察对象的数据不能在同一条记录中出现,每一个测量指标,/,影响因素只能占据一列的位置,即同一个指标的测量数值都应当录入到同一个变量中去,最终的数据集应当能够包含原始数据的所有信息,可以出现违反这些原则的例外情况,如配对,t,检验重复测量数据,17,SPSS,数据文件建立和编辑,变量的类型、定义及新变量的生成,变量命名原则:,不多于,8,个字符(,4,个汉字),变量名不能与保留字相同,保留字有:,all,and,by,eq,ge,gt,le,lt,ne,not,or,to,with,。,系统不区分大小写字符,变量名尽量避免使用中文。可在标签中用中文注释变量代表的意思。,18,2.1.1 SPSS,变量类型与测量尺度,变量类型,数值型,应用最为广泛,字符型,由于分析、整理都较困难,建议尽量少用,改为编码录入,High,Middle,Low,的排序问题,日期型,实际上是特殊的数值型变量,尽量少用,19,定义变量,测量尺度,尺度测量(,Scale Measurement,),温度、体重,序号,(,有序,),测量(,Ordinal Measurement,),默认字母顺序表示大小顺序,等价于有序分类,名义测量(,Nominal Measurement,),等价于无序多分类,20,2.1.2,定义新变量,21,定义新变量,变量名与变量值标签,可用于对变量及变量值含义进行说明,使结果更易于阅读,缺失值,除非问卷中有特殊编码,否则按默认情况处理,其它设置,均按默认值处理,一般不需要更改,22,变量标鉴与值标签存在与否时的显示差异,lcfx,22,47.8,47.8,47.8,10,21.7,21.7,69.6,6,13.0,13.0,82.6,8,17.4,17.4,100.0,46,100.0,100.0,1,2,3,4,Total,Valid,Frequency,Percent,Valid Percent,Cumulative,Percent,变量名,变量标签,值,值标签,23,定义变量的几个说明,变量名最好用英文,少于,8,个字符。,最好加上变量标签,对于分类变量可以加上值标签,每个个案前加上索引号(唯一),如住院号、门诊号。或在数据输入时在所有的材料上先标上号码。,尽量使用数值型变量。,24,2.1.3,变量的录入与修改,可以拷贝、输入、删除等,2.1.4,数据窗口操作技巧,查找异常值、极端值,冻结数据表中的列,充分利用变量名与变量值的标签,记录的快速定位,25,ile,文件,26,File,菜单详解,新建数据文件,打开其他格式的数据文件,直接打开,SPSS,可以直接读入许多常用格式的数据文件,请将,TXT,数据导入,SPSS,(,xuelin.txt,),使用数据库查询打开,利用通用数据库,ODBC,接口读取数据文件,请将,ACCESS,数据导入,SPSS,(,xuelin.mdb,),使用文本导入向导读入文本文件,请将,TXT,数据导入,SPSS,(,xuelin.txt,),27,File,菜单详解,保存数据文件,首次保存,另存为,注意事项,善于使用,S,(,save,的快捷键),存为其他格式时注意兼容性,File,菜单中的其他条目,Display data info,等,28,三 数据文件的进一步整理,3.1 SPSS,对话框,3.2,转换:,Transform,菜单,3.3,数据:,Data,菜单,29,SPSS,对话框元素介绍,一级对话框元素,候选变量列表框,标签变量名,选入变量列表框,变量移动钮,根据当前框的状态不断变化,30,SPSS,对话框元素介绍,一级对话框元素,五个标准按钮,确定、取消,粘贴:用于自动生成,SPSS,程序,重置:恢复对话框状态为初始状态,帮助:方法简介、用法简介,其他按钮,多数情况下会弹出二级对话框,灰色表示不可用,31,SPSS,对话框元素介绍,二级对话框元素,单选框(组),一般均成组出现,多选一,复选框(组),可成组,也可单独出现,多选多,32,SPSS,对话框元素介绍,二级对话框元素,下拉列表框,功能实际上和单选框组相同,文本框,往往会和单选框、复选框结合起来使用,框组,以上各种元素的集合,集中完成某项功能,33,SPSS,结果窗口操作,结果文件的打开和保存,可加密保存,结果内容的移动和删除,标准的拖放式操作,在大纲视图中操作最方便,结果的拷贝、导出操作,注意中文兼容性问题,需要对软件进行设置,34,转换:,Transform,菜单,主要集中了一些对变量进行变换的过程,如对原始数据进行四则运算、对数据重新编码、求出变量的秩次等,这些功能往往在统计分析的预处理中起着非常重要的作用,35,3.2,转换:,Transform,菜单,计算新变量,:最常用和重要的过程,compute,。,变量转换,:包括,Recode,、,Visual Bander,、,Count,、,Rank,、,Automatic Recode,这五个过程,它们实际上都可以被看成是,compute,过程在某一方面功能的强化和打包。,专用过程:包括建立时间序列、缺失值替代和设定随机种子三个过程。,Run Pending Transforms,:用于执行编程中被挂起(,Pending,)的数据整理操作。,36,计算,compute,过程,3.2.1,compute,过程,变量可以新与旧,.,变量可以是常数,可由其它变量值产生,.,可设逻辑条件,.,如,:,总积分,=,红斑,+,水疱大小,+,水疱形态,+,水疱数目,+,淋巴肿大,+,灼痛,疗效,:,改善率,=90,痊愈,1,改善率,=60,显效,2,改善率,=20,好转,3,改善率,20,无效,4,37,Compute,对话框,(,转换,计算变量,),38,疗效的判断,方法,1 compute,分成,4,步生成,方法,2:Recode,39,3.2.2 Recode,过程,转换,-,重新编码为不同(相同)变量,40,3.2.3 rank case,过程,排秩,数据核查时,可从小到大排列。,41,3.3 Data,菜单,对数据进行加工整理,比如根据统计分析的要求对数据进行,分组、合并、加权、筛选,等操作,42,记录拆分:,Split File,过程,将数据文件分组进行处理,Analyze all cases,:不拆分文件,比较组,Compare groups,:按所选变量拆分文件,各组分析结果紧挨在一起便于相互比较,按组输出,Organize output by groups,:按所选变量拆分文件,各组分析结果单独放置,43,记录筛选:,Select Cases,过程,按要求筛选出数据集的一部分,可以使用组合条件进行筛选,可以直接在数据集中抽样,44,记录加权:,Weight Cases,过程,分类资料数据录入格式,列举格式,频数格式,只有先进行加权设定,统计软件才能正确识别和处理数据,45,数据文件的重新排列与转置,对数据集进行数据排列格式间的变换:行列转置,长型、宽型格式互换,长型:在重复测量数据中,每一次测量被单独记录为一个,case,宽型:在重复测量数据中,每一个个体被记录为一个,case,,他的所有测量被记录在不同的变量中,例:将长型数据,Anxiety.sav,转换为宽型格式数据,
展开阅读全文