数据的编码、录入与整理

上传人:huo****ian 文档编号:245200633 上传时间:2024-10-07 格式:PPT 页数:56 大小:1.27MB
返回 下载 相关 举报
数据的编码、录入与整理_第1页
第1页 / 共56页
数据的编码、录入与整理_第2页
第2页 / 共56页
数据的编码、录入与整理_第3页
第3页 / 共56页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,SPSS,基础与,Access,数据库,姓 名,:,郑戟明,电 话,:67703855,答疑时间,:,答疑地点,:,学院楼,B421,商务信息学院计算机教学部,SPSS的名称,1968,年美国斯坦福大学两名研究生研制,原名,SPSS,,英文名称社会科学统计软件包(,S,tatistical,P,ackage for the,S,ocial,S,ciences,),首字母的缩写。,1994-1998,年间陆续并购,SYSTAT,等公司,统计软件的,3S,指的就是,SPSS,、,SAS,、,SYSTAT,2000,年改名为“,S,tatistical,P,roduct and,S,ervice,S,olutions”,,即,“,统计产品与服务解决方案,”,2010,年,SPSS,公司被,IBM,并购。,SPSS软件应用行业,SPSS,软件是一款在很多行业的数据分析应用中,久享盛名,的统计分析工具,是世界上最早的统计分析软件。,应用领域,经济学,教育学,商业,金融,营销研究行业,电子商务数据统计,政府机构,其它,SPSS的影响力,在国际学术界有一条不成文的规定:,凡是用,SPSS,完成的计算和统计分析,,可以不必说明算法。,SPSS发展,1968,年:斯坦福大学三位学生创建了,SPSS,,诞生了第一个用于大型机的统计软件,1975,年:在芝加哥成立,SPSS,总部,1984,年:首先推出了世界上第一个统计分析软件微机版本,SPSS/PC+,,并使其能很快地应用于,自然科学,、,技术科学,、,社会科学,的各个领域,世界上许多有影响的报刊杂志纷纷就,SPSS,的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。,1992,年:推出,Windows,版本,2000,年:,SPSS 11.0,起,,SPSS,全称为“,Statistical Product and Service Solutions”,,即“,统计产品和服务解决方案,”,标志着,SPSS,的战略方向正在做出重大调整。,2009,年:,SPSS,公司宣布重新包装旗下的,SPSS,产品线,定位为,预测统计分析,软件,(,P,redictive,A,nalytics,S,oft,w,are)PASW,,包括四部分:,PASW Statistics (formerly SPSS Statistics),:统计分析,PASW Modeler (formerly Clementine),:数据挖掘,Data Collection family (formerly Dimensions),:数据采集,PASW Collaboration and Deployment Services (formerly Predictive Enterprise Services),:企业应用服务,2010,年:,随着,2009,年,7,月,28,日,,IBM,以,12,亿美元现金收购,SPSS,之后,,各子产品家族名称前面不再以,PASW,为名,修改为统一加上,IBM SPSS,字样:,IBM,SPSS Statistics,:统计分析产品;,IBM,SPSS Modeler,:数据挖掘产品;,IBM,SPSS Data Collection family,:数据采集产品;,IBM,SPSS Collaboration and Deployment Services,:企业应用服务,SPSS发展,SPSS发展,SPSS发展,SPSS认证简介:,认证考试要求参加者回答一系列问题,然后应用,SPSS,软件完成一些任务。目前,SPSS Statistics,认证和,SPSS Modeler,认证系列各有三个考试等级,如下:,一、,SPSS Statistics Certification,1. SPSS Statistics,初级认证:,考试费,1000,元,(学生,500,元),2. SPSS Statistics,中级认证:,考试费,1500,元,(学生,750,元);,3. SPSS Statistics,高级认证:,考试费,2000,元;,SPSS认证简介:,二、,SPSS Modeler Certification,1. SPSS Modeler,初级认证:,考试费,1000,元,(学生,500,元);,2. SPSS Modeler,中级认证:,考试费,2000,元,(学生,1000,元);,3. SPSS Modeler,高级认证:,考试费,3000,元;,SPSS认证简介:,通过,SPSS,专业认证的好处,1.,认证证书, 获得认可的专家证书和赠品。, 有权将付给您的认证证书用于广告和商务宣传。,2.,专业人才, 增强您的职业潜能,帮助您不断提高技术支持水平。, 成为行业公认的技术人才。,3.,技术领先, 不定期获得最近计算机产品资料和技术信息,这些资料将以期刊、技术文件或,CD,方式寄送给您。, 被,SPSS,邀请参加技术研讨会以及展览会。, 从,SPSS,提供的技术支持中得到优惠。,SPSS基础内容:,第,7,讲,SPSS,数据的编码、录入与整理,第,8,讲 统计报告,第,9,讲 描述性统计,第,10,讲 均值比较,第,11,讲 散点图、相关系数,第,12,讲 回归概念、回归系数,第,13,讲,SPSS,综述,SPSS数据分析步骤,建立数据文件,数据加工整理,统计分析,解释分析结果,定义数据文件结构,录入、修改、保存数据,第,7,讲,数据的编码、录入与整理,一、数据的编码、录入与整理,原理,是研究者利用,SPSS,进行统计分析的必要前提。,就是把通过,问卷调查,获得的资料转变为,SPSS,能够识别的数据文件,为各种统计分析做好准备。,数据编码概念,数据编码是指把需要加工处理的数据库信息,用,特定的数字,来表示的一种技术。,根据一定数据结构和目标的定性特征,将数据转换为,代码或编码字符,,在数据传输中表示数据的组成,并作为传送、接受和处理的一组规则和约定。,二、数据问卷与编码,(举例),问卷量表,序号,调查内容,选项,1,您的性别:,(1),男,(2),女,2,你的文化程度:,(1),没上过学,(2),小学,(3),初中,(4),高中,(5),大专以上,3,您想选择下列哪些择偶条件,(,任选三项,),:,(1),相貌,(2),文化水准,(3),气质风度,(4),志同道合,(5),人品,(6),家庭条件,(7),个人收入,(8),其他,4,您购买房屋时,会考虑哪些因素,(,任选,),:,(1),离工作地点的远近,(2),小孩所就读的学校,(3),居家附近的环境,5,您对心理学感兴趣:,(1),不感兴趣,(2),感兴趣,(3),非常感兴趣,6,您对学英语感到厌恶:,(1),不厌恶,(2),厌恶,(3),非常厌恶,二、数据问卷与编码,(举例),变量名,编码,样例,第,1,题,1-,男 ;,0-,女,男,1,第,2,题,1-,没上过学;,2-,小学;,3-,初中;,4-,高中;,5-,大专以上,小学,2,第,3,题,-1,1-,相貌;,2-,文化水准;,3-,气质风度;,4-,志同道合;,5-,人品;,6-,家庭条件;,7-,个人收入;,8-,其他,文化水准,2,第,3,题,-2,1-,相貌;,2-,文化水准;,3-,气质风度;,4-,志同道合;,5-,人品;,6-,家庭条件;,7-,个人收入;,8-,其他,志同道合,4,第,3,题,-3,1-,相貌;,2-,文化水准;,3-,气质风度;,4-,志同道合;,5-,人品;,6-,家庭条件;,7-,个人收入;,8-,其他,人品,5,第,4,题,-,工作,1-,选;,0-,不选,选,1,第,4,题,-,学校,1-,选;,0-,不选,不选,0,第,4,题,-,环境,1-,选;,0-,不选,选,1,第,5,题,A B C(A-1,B-2,C-3),A,1,第,6,题,A B C(A-3,B-2,C-1),A,3,问卷编码方案,三、编码类型,数值型数据,的编码,数值型数据的编码就是根据调查问卷的评分标准对变量赋予分值。,通常采用三点计分、四点计分和五点计分等方式进行评分,如选项,A,、,B,、,C,计分为,1,、,2,、,3,如选项,A,、,B,、,C,、,D,计分为,1,、,2,、,3,、,4,编码示例中的第,5,、,6,题就是属于数值型编码,第,5,题是,正向,数值型,(,被选项的程度越高,分值越大,),第,6,题是,反向,数值型,(,被选项的程度越高,分值越小,),变量名,编码,样例,第,5,题,A B C(A-1,B-2,C-3),A,1,第,6,题,A B C(A-3,B-2,C-1),A,3,三、编码类型,非数值型数据,的编码,非数值型数据的编码,首先要确定编码规则,然后根据规则对变量赋予分值。,双值型,变量的编码,多采用“,0,、,1”,或“,1,、,2”,来赋值;如编码示例中的第,1,题,多值型,变量的编码,采用 “,1,、,2,、,3,、,”,来赋值;如编码示例中的第,2,题,通常对非数值型数据编码,主要起到,分组,的作用,,不,能进行,各种算术运算,变量名,编码,样例,第,1,题,1-,男 ;,0-,女,男,1,第,2,题,1-,没上过学;,2-,小学;,3-,初中;,4-,高中;,5-,大专以上,小学,2,三、编码类型,多项选择题,多项选择题就是题目答案的选项是多选项,限定,多选项分类法,限定了一次最多可以选择项目的个数;,不能直接对题目进行编码,必须先确定最多选择,,并给每个选项建立一个变量;,如编码示例中的第,3,题,任意,多项二分法,表示每一次可以任选几个选项;,编码方法把每一个被选项作为一个变量来定义,,每个变量只能选择“,1,或,0”,;,如编码示例中的第,4,题,变量名,编码,样例,第,3,题,-1,1-,相貌;,2-,文化水准;,3-,气质风度;,4-,志同道合;,5-,人品;,6-,家庭条件;,7-,个人收入;,8-,其他,文化水准,2,第,3,题,-2,1-,相貌;,2-,文化水准;,3-,气质风度;,4-,志同道合;,5-,人品;,6-,家庭条件;,7-,个人收入;,8-,其他,志同道合,4,第,3,题,-3,1-,相貌;,2-,文化水准;,3-,气质风度;,4-,志同道合;,5-,人品;,6-,家庭条件;,7-,个人收入;,8-,其他,人品,5,第,4,题,-,工作,1-,选;,0-,不选,选,1,第,4,题,-,学校,1-,选;,0-,不选,不选,0,第,4,题,-,环境,1-,选;,0-,不选,选,1,四、缺失值的处理,概念,缺失值是指在数据采集与整理过程中,丢失,的内容,往往会给统计分析带来一些麻烦和误差。,类型,用户,缺失值,在问卷调查中把不回答的选项当作缺失值来处理,缺失值可用研究者能识别的数字来表示如“,0,、,9,、,99”,系统,缺失值,指计算机默认的缺失方式,如输入数据空缺、输入非法字符等,通常把缺失值标记为“,.,”,四、缺失值的处理,缺失值处理方法,替代法,:采用统计命令或在相关统计功能中利用参数替代,Transform,Replace Missing Values,剔出法,:剔除有缺失值的题目或剔除有缺失值的整份问卷,五、数据处理中的操作术语,个案,(Cases),一个研究,对象,就是一个个案;一个个案就是一条记录;在数据表格中表示为“一行”,每一个个案,记录,的是一个研究对象各个属性的具体数值,如学生信息,(,姓名、性别、年龄等,),个案,学号,姓名,性别,出生日期,专业编号,0604231,张三,男,87-1-1,01,0604253,李四,女,88-6-30,02,0605321,王五,女,88-8-18,03,0606002,赵六,男,88-12-24,02,每一行为一条记录,每一列为一个字段,每个记录只能对应一个对象且仅为一个,字段,学生表,五、数据处理中的操作术语,样本,(Sample),是指具有共同属性的所有研究对象,如学生的所有信息,样本包含多个个案,在数据表格中表示为“,n,行,”,变量,(Variable),是指问卷中每一个问题,数据库里字段,数据表格中表示为“,一列,”,量值,(Value),是指问卷中的答案,也称为,观测值,,在,SPSS,系统里,单元格中的数值就是变量值,六、定义变量,启动,SPSS,后进入数据编辑窗口,显示为一个空文件,输入数据前首先要定义变量。,建立数据文件,数据加工整理,统计分析,解释分析结果,定义数据文件结构,录入、修改、保存数据,六、定义变量,定义变量所包含的内容:,变量名,(Name),:变量的名称,变量类型,(,Type),:变量的类型,宽度,(Width),:存储变量值的最大值(,1,可存储,1,个字节的字符,,2,可存储,1,个汉字),小数位数,(Decimals),:变量为数值类型时,小数后的位数,变量标签,(Label),:对变量名的注释。光标在变量名上时,会显示该标签,变量值标签,(Values),:变量标签的取值,缺失值,(Missing Values),:定义缺失的值,例如,当定义,99,为缺失值时,当该变量的值为,99,时,把它认为是缺失值,显示数据的列宽,(Colums),:与上面“宽度”不同,它只管显示,对齐方式,(,Align),:左对齐、右对齐、居中,量度类型,(Measure),:定比变量(,Scale,)、定序变量(,Ordinal,)、定类变量(,Nominal,)。只用于统计制图时坐标轴变量的区分和,SPSS,决策树模块的变量定义。,六、定义变量,单击数据编辑窗口左下方的“,Variable View”,标签或双击列的题头,(Var),,打开变量定义窗口,进行变量定义。,六、定义变量,定义变量名,在定义变量窗口中,Name,下的单元格中输入变量名,变量名必须以字母开头,长度不超过,8,个,SPSS,保留的关键词不能作为变量名,AND,、,OR,、,NOT,、,WITH,、,TO,、,BY,、,GT,、,GE,、,LT,、,LE,、,EQ,、,NE,、,ALL,等,SPSS,中允许使用中文变量名,但尽量不要使用,以免出现兼容性问题,六、定义变量,定义变量类型、宽度及小数位数,在,Type,下单击单元格,打开变量类型窗口,选择变量类型,常用变量类型有:,数值型,(Numeric),日期型,(Date),货币型,(Dollar),字符型,(String),在,Width,、,Decimal,下单元格,选择宽度和小数位数,系统默认为“,8”,和“,2”,;或者在变量类型窗口中设置,六、定义变量,定义,变量标签,在,Label,下单击单元格,输入变量标签,SPSS,允许变量标签长度为,255,字节,定义,变量值标签,变量值标签是对变量的每一可能取值进一步描述,当变量是定类或定序变量时,非常有用。变量值标签系统默认为,None,在,Values,下单击单元格,打开变量值标签窗口,输入变量值标签,六、定义变量,定义,缺失值,在,Missing,下单击单元格,打开缺失值窗口,输入缺失值,No missing values,:没有缺失值,Discrete missing values,:定义,13,个单一数为缺失值,Range plus one optional discrete missing values,:定义指定范围为缺失值,同时指定另外一个不在这一范围的单一数为缺失值,六、定义变量,变量定义的信息复制,如果有多个变量的类型相同,可以先定义一个变量,然后把该变量定义的信息复制给新变量,操作步骤:,先定义一个变量,在该变量行号上单击右键,在快捷菜单中选择“,Copy”,选择同类型新变量所在行,单击右键,在快捷菜单中选择“,Paste”,七、数据的录入,定义完所有变量后,单击“,Data View”,标签,在数据编辑窗口输入数据。,数据录入如果按逐行进行,按,Tab,键改变行,数据录入如果按逐列进行,按,Enter,键改变列,也可以通过方向键改变行或列,系统默认的数据文件保存类型为“,.sav”,八、数据的导入,SPSS,具有强大的与其他软件共享数据文件的功能,所以能够导入多种格式的数据,能够导入,SPSS,的数据文件:,*.sys,、*,.,por,、,*,.,xls,、*,.,slk,、*,.w*,、*,.dbf,、*,.,dat,、*,.,syd,、*,.sas7dbat,等,导入数据文件的操作步骤:,执行菜单命令,File Open Data”,选择导入数据文件的类型,通过复制粘贴导入数据,在原系统中打开需要导入的数据文件,复制粘贴到,SPSS,中(,但要注意数据类型,可能出很多问题,),八、数据的导入,例一,(1):,把,Access,中,shift-,MIS.mdb,中的“学生表”信息导入到,SPSS,中,.,a,),.,打开,shift-,MIS.mdb,文件,选中“表”对象,再选中“学生表”。,八、数据的导入,例一,(1):,把,Access,中,shift-,MIS.mdb,中的“学生表”信息导入到,SPSS,中,.,b,),.,菜单上,文件,导出,“保存类型,”,选择“,Microsoft Excel 97-2003(.xls),”,文件名自动为“学生表” “导出”,八、数据的导入,例一,(1):,把,Access,中,shift-,MIS.mdb,中的“学生表”信息导入到,SPSS,中,.,c,),.,启动,SPSS,,,File,OpenData,,“文件类型”选择“,Excel(*.,xls,),”,找到“学生表,.,xls,”文件后,“打开”,d,),.,保存为:学生表,.,sav,八、数据的导入,例一,(2):,数据的导入,将,EXCEL,文件,2-recode.xls,导入到,SPSS,中,启动,SPSS;,方法一:,File,OpenData,.,数据导入后,查看“,Variable View,”标签中的字段名、类型、宽度等。,方法二:练习通过复制、粘帖的办法,把,2-recode.xls,中的数据通过复制,在,SPSS,中粘帖的办法导入到,SPSS,中,但可能会遇到一些问题,请思考如何解决这些问题?,把导入后的数据文件保存为,2-recode.sav,九、数据的整理,概念,数据整理是对录入的数据进行转换、检测、量表统分、个案选择、文件拆分与合并等操作,使原始数据生成后续研究所需要的数据。,操作,SPSS,实现数据整理的功能主要集中在“,Data”,和“,Transform”,两个菜单,九、数据的整理,例二,:,数据分值的转换,数据分值的转换是通过对数据进行重新编码来实现的。在,SPSS,中主要通过“,Transform”,菜单中的“,Recode”,命令来实现,Into Same Variables,:,编码后数据存放在原变量中,覆盖原数据,Into Different Variables,:,编码后数据存放在新定义的变量中,保留原数据,九、数据的整理,例二:数据分值的转换,假设一套量表共,10,题,每题有,A,、,B,、,C,三个选项,现有,10,个被试作答。要求根据评分规则,将被试的原始数据选择转换为量表分数,注意:,1,、,2,、,4,、,7,、,8,、,10,:,正向题,3,、,5,、,6,、,9,:,反向题,量表评分规则,题号,选项,1,2,3,4,5,6,7,8,9,10,A,1,1,3,1,3,3,1,1,3,1,B,2,2,2,2,2,2,2,2,2,2,C,3,3,1,3,1,1,3,3,1,3,10,名被试的作答结果表,题号,被试,1,2,3,4,5,6,7,8,9,10,1,A,B,B,B,A,B,C,A,C,B,2,A,B,B,C,A,B,C,A,C,B,3,A,C,B,B,A,B,C,A,B,B,4,B,B,B,B,B,A,C,B,C,B,5,A,C,A,B,B,A,B,A,B,C,6,B,C,A,B,A,B,B,B,B,A,7,B,C,C,C,A,B,C,A,B,B,8,A,C,A,B,B,A,B,A,C,B,9,A,B,B,B,B,A,C,A,C,B,10,B,B,B,B,A,B,C,B,C,C,九、数据的整理,例二:数据分值的转换,原数据,转换后数据,九、数据的整理,例二,:,数据分值的转换,数据输入:打开数据文件,(2-recode.sav),Transform Recode Into Different Variables,打开“,Recode,”对话框,定义新变量名,打开“,Old and New Value,”对话框,定义转换规则,以原文件名保存,九、数据的整理,例三,:,量表的统分,在数据录入过程中,输入的是最原始、最稳定的反应选项,但在后续的统计分析中通常需要对量表的总分进行推断统计。,量表的统分工作包括,分量表,的统分和,总量表,的统分,,SPSS,中通常用“,Transform”,菜单中的“,Compute”,命令实现量表的统分工作,九、数据的整理,例三:量表的统分,以分值转化后的数据文件,2-recode.sav,为例。,假定该量表由,2,个分量表构成,其中,1,个量表由第,1,、,2,、,5,、,8,、,9,题组成,另一个量表由第,3,、,4,、,6,、,7,、,10,题组成。,计算出每一个被试的分量表分和总量表分。,九、数据的整理,例三,:,量表的统分,打开数据文件,2-recode.sav,。,Transform Compute (,计算分量表分,flb1,、,flb2,和总量表分,zlb,),统分结果保存为,2-lb.sav,九、数据的整理,例四,:,数据的限选,在数据统计分析中,通常需要限定选择部分个案进行研究,如抽取,40%,个案来研究,在,SPSS,中,主要通过,Data Sort Cases,或,Data Select Cases,来实现数据的限选,九、数据的整理,例四:数据的限选,以数据文件,2-lb.sav,为例,找出变量,zlb,的高低分组的,分组,如以总个案的,40%,为界限确定高低分,九、数据的整理,例五:数据的限选,打开数据文件,2-lb.sav,Data Sort Cases,将分数,排序,,确定高分组和低分组的起点分数值,将变量,zlb,转换为变量,zlb1;,将高分组和低分组进行,分组,。,因为以总个案的,40%,为界限确定高低分,所以高分组和低分组各取,4,个个案,10*40%=4(4,个个案,),根据排序可以确定高分组和低分组的起点分数值分别为,22,和,20,九、数据的整理,例五:数据的限选,九、数据的整理,例五:数据的限选,以,SPSS,系统随带数据文件,Anxiety.sav,为例,要求限选前,20,个个案进行后续统计分析。,九、数据的整理,选择所有个案,按指定条件选择个案,对个案进行随机抽样,按比例大概抽样,精确抽样,按范围选择个案,例五,:,数据的限选,多余数据保留在原表中,多余数据被删除,九、数据的整理,例五:数据的限选,打开数据文件,Anxiety.sav,。,Data Select Cases,设置前,20,个个案。,作业,1.,完成课堂示例,2.,课后思考题,P24(1-5),第,3,题结果保存为,xscj.sav,第,4,题的原始文件为,score.sav,下节展望,统计报告,在进行数据处理之前,了解样本数据的基本特征。,在线分析处理报告,个案摘要报告,行形式摘要报告,列形式摘要报告,谢,结束,谢,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!