资源描述
调查数据录入技术(调查数据输入软件EpiData),成都信息工程学院统计学院刘全,第一节、EpiData软件简介EpiData是丹麦的一个非盈利组织编写的用以数据输入的免费软件,要获得该软件,需要通过Internet网登录http:/www.epidata.dk主页,根据相应的提示可下载。EpiData最早的版本Version1.01发布于2000年10月,目前运用得较多的是EpiDataversion3.0版,发布于2003年8月。下面简单介绍如何用EpiData3.0输入数据,并转换成SPSS能够分析的数据。简单、方便、功能强大、适用面广,非常适合于基层调查队和各类调查咨询公司使用。,1、EpiData的用途EpiData是一个用于各种调查问卷数据输入及相关信息处理的计算机程序。EpiData既适合单一问卷的数据处理,也可应用于多问卷的数据处理工作。2、EpiData的使用方法它的基本使用方法是基于文本编辑窗口下,先书写一些简单的文本行,并使它自动转换成数据输入格式命令,然后再添加数据输入控制功能即可实现问卷输入界面的编程。3、EpiData的安装EpiData系统的安装可按照系统安装文件的提示很方便地进行。4、EpiData的系统组成EpiData系统有一个主文件和一个帮助文件组成。用户文件则有存在于同一目录下的几个主名相同的独立文件所组成。,一、EpiData界面打开EpiData程序文件,可以见到其最基本的窗口(见下图)。,从EpiData的基本窗口来看,数据输入主要有6个步骤。(1)制作调查表描述文件(DefineData);建立数据录入源程序(.qes),主要包括:确定变量、内容提示、确定录入格式等;(2)生成数据文件(MakeData);由数据描述文件自动生成数据文件,从而可使用本文件进行数据录入(.rec);(3)建立数据质量控制文件(Checks);编写检验程序,从而可以实现:自动审核、过程控制等功能;(4)数据输入(EnterData);利用上面自动生成的数据文件进行数据录入;(5)浏览数据及统计资料(Document);(6)输出及转换数据(ExportData)。可将录入的数据转换成各种软件(如SPSS、SAS、EXCEL等)能够使用的数据文件。,制作调查表描述文件.qes,自动生产数据记录文件.rec,建立录入数据质量控制文件.chk,录入数据到数据记录文件.rec中去,浏览数据及统计,对数据记录文件.rec中的数据输出及转换,从EpiData的操作过程:6个步骤。,第二节、基本操作说明第一步、制作调查表描述文件(1)新建一个调查表描述文件单击“文件”、“生成调查表文件(QES文件)”,则自动建立一个名字为“EpiData文件1”的空的数据描述文件(见下图),数据描述文件的扩展名为QES,QES是question的缩写。,(2)把空白的“EpiData文件1”文件存储成想要的文件名(如民意调查.qes)方法是:单击“文件”、“另存为”命令,弹出一个对话框后,指定新的文件名(如民意调查.qes),然后选“保存”即可。,(3)输入语句格式变量名变量提示符变量域注释或变量提示符变量名变量域注释其中,方括号项目为可选项。命令举例:name姓名_sex性别#(1)男(2)女year年龄#edu文化程度#(1)大学及以上(2)大专(3)高中(4)初中(5)小学及以下注意:第一必须有一个变量的名字,如id,v1等;第二要对变量进行描述,如id“个案号”,v1“您的性别”等;第三要用#号键定义输入的变量。变量有几个码,就打几个#键。,(4)EpiData中变量的类型,(5)预览输入变量的格式单击“REC文件”、“数据表预览”或用Ctrl+T键,则可预览所设计的数据表录入界面。,“数据表预览”的最大优点是:在不必建立数据文件的情况下,提前对数据输入格式进行检查,可以输入数据,看是否有问题,一旦发现问题,可以及时修正。,(6)输入完毕要存盘。方法:单击“文件”、“存盘”命令存盘,或用Ctrl+S键也一样可以存盘。,案例1、“中国股民投资状况抽样调查”设计,表2.2.2股民投资状况问卷调查表,程序如下:provin省市编码#id调查表编号#sex性别#男女age年龄#周岁result目前为止您做股票的结果是#赚钱不赔不赚赔钱method1依据方法:基本因素#method2技术#method3跟风#method4凭感觉#risk您对投资股票风险有无充分认识#有无invester您是专职还是业余投资者#专职业余,对应的调查项目编码如下,录入界面,(7)自动建立数据记录文件待数据表录入格式文件符合要求后,应生成数据记录文件。数据记录文件的扩展名是rec(recoder的缩写),建立的方法如下。单击“生成REC文件”图标命令,弹出“根据QES文件生成REC文件”对话框,其中有两个选项,一个是“根据QES文件”(说明调查表描述文件的路径与名字),另一个是“生成REC文件”(说明数据文件的路径与名字),然后单击“确定”,即可自动生成数据文件(如“股票投资.REC”)。,至此,问卷输入编程基本完成,打开自动生成的数据文件即可进行数据录入工作!,*调查表项目编码no#姓名name_性别sex#1男2女出生年月日birth年龄age#1.婚姻状况marriage#未婚在婚,与配偶共同生活了year#年离婚或分居丧偶2.是否在业occup:#在业,就业性质是occup1:#国有经济单位城镇集体经济类型单位其他经济类型单位城镇个体或私营业主城镇个体或私营企业被雇佣者离退休再就业人员其它other1:_不在业occup2:#1)离退修,离退修前最长职业是occup3:#工人专业技术行政管理商业服务机关干部军人或警察其它other2:_2)失业人员3)家务劳动者4)丧失劳动力者5)待就业者6)其它other3:_,案例2、“XX调查”设计,录入界面,第三节、数据核查文件,EpiData软件的强大功能是在数据输入过程中可以限制输入范围、控制问项的输入顺序、进行计算、给出输入提示、维持上一记录的数据,还可为输入的数字给出文本描述等。数据核查文件(.chk)就是实现以上目的的专门文件。,一、建立数据核查文件在关闭所有文件情况下,选择“建立CHK文件”图标命令,打开前已建立的数据文件(如“股票投资.rec”),从而将为所选择的数据文件建立数据核查控制文件。,二、控制界面说明:在其话框中,可以对变量标签、范围、是否跳答、数据标签等进行设定。对话框中某些选择项的意义如下:Range/legal规定变量值的范围(如10-80,99)Jumps跳答如输入1S2,则如果输入1则跳到变量S2Mustenter是否必须输入某个值(yes、no)Repeat一般选择NO,若选“YES”则对上次输入的值进行复制(即内定值的设置)。Valuelabel添加数值标签(注:数据录入时可以用F9或+查看合法值。),如选Valuelabel,则可对其变量设置标识。,Jumps跳转举例:如下调查表中,在输入“1婚姻状况”栏目,可输入如下内容:1education,2education,4education则可实现有关跳转操作。,三、常用控制命令1、变量录入后执行命令,AFTERENTRY设置一个命令块,其中的命令是在当前变量录入完毕后/或光标移到另一个变量时执行。AFTERENTRY是一个块命令,必须以END结束。格式如下:AFTERENTRYEND,2、变量录入前执行命令,BEFOREENTRY设置一个命令块,其中的命令是在当前变量激活,但尚未录入时执行。BEFOREENTRY是一个命令块,必须以END结束。格式如下:BEFOREENTRYEND,3、新记录开始时的执行命令(常用于赋初值),4、录入限制及提示命令,5、移动光标命令,6、条件命令,条件命令的结构是:IFTHENENDIF或者是:IFTHENELSEENDIF,例如1:IFfield1othenGOTOfield10ENDIF例如2:IF(Cos(field1)*Sin(field1)0)THENIFfield2field3THENHELPSomethingiswrong.GOTOENDIFELSEField4=Tan(field1)GOTOfield23ENDIF例如3:IFfield10=.THENField11=.Field12=0Date1=”12/03/2001”ENDIF,7、赋值命令,8、函数利用出生日期变量数值计算个体年龄命令。LETAGE=ROUND(TODAY-D1)/365.25)其中TODAY和ROUND()分别是日期和取整函数,D1为出生日期变量。9、终止命令,四、核查文件应用举例如本例,对股民的“性别”进行控制。操作:1、“建立CHK文件”,则弹出对话框,指定相应的REC文件(如“股民投资。REC”)2、光标制定在“性别”位置,选择“Valuelabel”出的“+”,输入相应标记,选“确定并关闭”即可。,核查文件其它例子,VAR1;指定对VAR1的检验RANGE15;指定var1的输入范围15MUSTENTER;要求本变量必须输入JUMPS1VAR4;若输入的是1,则转VAR4变量域去输入2VAR5;若输入的是2,则转VAR5变量域去输入3VAR10;若输入的是3,则转VAR10变量域去输入END;JUMPS结束BEFOREENTRY;在对VAR1输入前,执行VAR1=F1+2VAR1=F1+2ENDAFTERENTRYIF(VAR1=2)AND(F2=1)THENHELP“如果F2有值1,则VAR1不能有值2。请检验您的输入!GOTOVAR1ENDIFENDEND;整体检验程序以END结束注:本程序在CHK程序中产生。,要求在质量控制编程界面下,光标对应VAR1,然后选择“编辑”,则可输入如右质量控制程序。,又例:,BEFOREENTRYIFk1=.THEN&如果变量K1的值缺失,则显示TYPEk1值缺失!HIDEK2-K10&隐含变量K2-K10,UNHIDEK2可恢复K2GOTOname&转name变量处输入ENDIFEND,案例1:“XX调查表”中“年龄”的处理技术,“XX调查表”中“婚姻状况”的处理技术,“XX调查表”中“是否在业”的处理技术,“XX调查表”中“就业性质”的处理技术,“XX调查表”中“其它”的处理技术,“XX调查表”中“不在业”的处理技术,“XX调查表”中“不在业,其它”的处理技术,案例2:,变量设计,问卷描述文件程序设计,*-龙泉驿区机关事业单位非在编后勤人员统计表id*-注意:您正在录入第张表!*类别1、总数2、本区城镇户籍人数3、本区农村户籍人数4、区外城镇户籍人数5、区外农村户籍人数*-total1合计总数#total2本区城镇户#total3本区农村户#total4区外城镇户#total5区外农村户#manage1管理总数#manage2本区城镇户#manage3本区农村户#manage4区外城镇户#manage5区外农村户#busine1业务总数#busine2本区城镇户#busine3本区农村户#busine4区外城镇户#busine5区外农村户#supply1工勤总数#supply2本区城镇户#supply3本区农村户#supply4区外城镇户#supply5区外农村户#*-空岗情况及岗位要求工种为0则退出!-work1工种_sex1性别#age1年龄#skill1技能#time1时间(月数)#need1人数#othe1备注_work2工种_sex2性别#age2年龄#skill2技能#time2时间(月数)#need2人数#othe2备注_work3工种_sex3性别#age3年龄#skill3技能#time3时间(月数)#need3人数#othe3备注_work4工种_sex4性别#age4年龄#skill4技能#time4时间(月数)#need4人数#othe4备注_work5工种_sex5性别#age5年龄#skill5技能#time5时间(月数)#need5人数#othe5备注_,核查文件,1、在supply1supply4处,分别设置:2、在supply5处设置:,录入界面,数据内容,第四节、数据输入(在核查文件.chk的控制下,用数据文件.rec实现数据录入。)方法:单击图中的“数据录入”图标命令,出现对话框后,选择欲录入的数据文件名.rec,从而可以进行数据录入。,应用案例,“成都市龙泉驿区企业用工情况调查”,编写的录入程序,输入界面,生成的SPSS数据文件,第五节、其它操作一、浏览数据文件的信息单击图中的Document,可以对数据文件资料的相关信息进行浏览,这些信息包括了数据文件的相关信息、数据输入注意事项、数据文件标记、数据清单、编码表、逻辑检查等。二、数据转换单击图中的“数据导入/导出”、“数据导出”图标命令,出现对话框后,选择欲导出的数据文件格式,再选择欲导出的数据记录文件.rec,从而可以进行数据导出。,1、输出数据操作单击图中的导出为SPSS文件,打开对话框,在图中寻找需导出的数据记录文件.rec,然后单击“打开”按钮,出现对话框(见左下图)后单击OK按钮,出现对话框(见右下图)后单击OK按钮,输出的数据以指定的文件为名。,三、继续录入数据或修改数据,选择“数据录入/导出”、“数据录入/编辑”,指定欲追加记录的文件名,即可进行追加记录或修改记录。,出现追加界面如左所示。最后存盘即可。,四、记录文件(REC)的合并,选择“数据导入/导出”,“纵向追加记录/横向合并记录”,则出现界面:选择欲合并的两个记录(REC)文件名,确定即可实现多人录入操作。,指定目标文件名,再选“追加:即可。用“数据处理”,“数据一览表”,再指定文件名即可查看追加后的结果文件。,1、纵向追加,2、横向合并在进行调查表描述文件设计中,当调查项目很多时,一般可采用分段设计的方式。即第一部分调查项目由第一录入程序承担,第二部分调查项目由第二录入程序承担,依此类推。这样一来,数据录入完成后就需要将字段横向合并,以得到完整的REC文件。合并操作:选择“数据导入/导出”,“纵向追加记录/横向合并记录”,则出现如下界面:(横向添加字段)选择文件对话框,五、数据检验,1、静态数据检验数据录入后的检验“数据处理”、“一致性检验(对调查表双录入后的差异对比)”操作如下:选择菜单“数据处理”、“一致性检验(对调查表双录入后的差异对比)”,则出现如下窗口:,2、动态数据检验实时检验。“工具”、“准备双录入实时检验”动态数据检验可以在数据双录入过程中及时对录入数据进行检验,这样可以对错误进行及时改正。为了进行双录入实时检验,在第一遍录入数据完成后,要在其REC文件基础上建立双工备份文件。其操作如下:选择菜单“工具”、“准备双录入实时检验”,则出现如下界面(图2.6.3):,指定第一遍录入数据所产生的REC文件名(如:人口调查.rec),系统将自动产生其主名相同,但扩展名为“_dbl.rec”的供双录入的新REC文件(图2.6.4):,六、参数设置,“文件”、“选项”,可实现对各种文件的参数设置。1、改变QES、REC等文件的界面2、生成变量的选择,在新REC文件中设置ID启始号:注意:此功能是在新的REC文件中设置ID号,一旦REC文件建立,以后再设置ID起始号则在此文件中不会起作用了。,七、相关操作,1、修改QES文件,并保留原REC文件已有的记录:“工具”、“根据修改的QES文件更新REC文件”2、文件记录过滤在CHK文件中设置KEY变量,如光标定位在相应关键字变量位置,选择“过滤器”、“定义过滤器”,输入数据即可。,八、文件记录排序显示及修改记录,选择“数据处理”、“数据一栏表”,输入REC记录文件名,则进入相应记录文件的“数据编辑”显示窗口。选择“编辑”(或显示值或显示标签)、“根据记录号排序”即可。,基本CHECK的设置,忽略缺失值,跳转,在记录之间转换,录入过程不能用鼠标,录入过程中的翻页,
展开阅读全文