资源描述
,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数据管理和,SPSS,软件,罗艳侠,首都医科大学流行病与卫生统计学系,20,14-10-27,1,2,Design,Collection of data,Sorting data,Analysis of data,资料收集与管理,Our,Objectives,数据,临床研究的最直接产物,也是进一步分析的基础,因此,保证数据的准确性、可靠性、完整性是临床研究中的一项重要工作。,数据管理,:,利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。其目的在于充分有效地发挥数据的作用。,数据管理,是保证试验质量及其重要的环节,,是进行现代统计分析的基础和核心。,3,数据管理,中国国家食品药品监督管理局(,State Food and Drug Administration,SFDA,)在药品临床试验管理规范第五十一条中明确规定,数据管理的目的在于把得自受试者的数据迅速、完整、无误地纳入报告,所有涉及数据管理的各种步骤均需记录在案,以便对数据质量及试验实施进行检查。,数据管理,4,数据管理计划,数据库创建与确认,数据录入与核查,数据确认与疑问表,数据质控检查,数据审核与锁定,数据管理的主要内容,5,作为数据管理的开始,制定一份全面而详细的管理计划,将使整个数据管理过程有章可循、有据可依。所有数据管理过程均应按照其中定义的时间与方法进行操作。,数据管理计划,6,1,.,研究的一般情况,如研究目的、研究的整体设计等。,2,.,数据管理工作的时间表,应与整个研究的大时间表相互协调。,3,.,相关人员与职责,(,临床监察员、数据管理员、录入员等,),4,.,数据库软件的选择与数据库的主要框架等。,5,.,确认数据库,6,.,定义监查员应提交的数据材料,以及材料的移交与管理,数据管理计划内容,7,7,.,如何进行数据录入与核查,8,.,如何进行数据确认,9,.,疑问表如何产生、解决与管理,10,.,如何进行质量检查,包括质量检查的具体质量标准,11,.,数据审核,12,.,数据锁定及移交,13,.,定义需存档的文件,14,.,数据的安全保障措施,15,.,其它需要特殊说明的问题,如电子数据的传递与管理、数据管理的阶段报告等。,数据管理计划内容,8,数据库软件,选择用于录入数据的软件及进行最终统计分析的软件,如,ORACLE、EPI Info 、EPIData,、,SAS、SPSS,等,记录项目注释(,annotation),定义数据库中将纳入的记录项目及相应的变量名称与变量类型,如:定义身高为,height,,类型为数值型,宽度为,3,,不含小数位。这一工作应由研究者与数据管理部门共同完成。如还有其它内容需要进入数据管理环节,则同样应对其进行注释。,数据库的确认(,validation),为数据录入设计适当的录入界面,并确认录入设计是否与注释相一致、录入界面与规则是否方便录入、软件的输出结果是否与录入内容相同等。,数据库创建与确认,9,数据编码 试验过程中,一些重要的项目是以文本形式记录的,如不良事件、伴随疾病、合并用药等,为了分析时归纳与总结的方便,常需要对这些部分进行分类与编码。,数据录入员应进行相应的培训,独立双份录入原则,双份数据库的核对,数据录入与核查,10,在基本消除了录入错误后,便可进行数据检查及确认,需建立有关细节的确认计划,然后编写相应的程序,得到需确认问题的清单,产生关于数据的疑问表。,疑问表将由临床监查员交研究者进行核查、确认或更正,数据确认的结果由临床监查员返回给数据管理员,对数据库进行修改与更新。,此过程循环往复,直至所有疑问均得到明确的答复。,以上过程可借助数据库软件平台得到简化,,如:将可预见的问题设计到录入程序中,这样在录入的同时即可产生疑问表,这种情况在网络背景下由研究者直接录入数据时具有更加明显的优势。,数据确认与疑问表,11,当数据确认与数据库修正工作完成后,即基本排除了数据录入错误及逻辑错误。但这些工作并不能完全保证数据的准确性,进行进一步的质控检查仍然很有必要。,质控检查通常以书面形式,在预先设定的质量标准指导下进行。,对关键变量经常需要进行100%的核查,即:将数据库中的关键变量与原始记录(病例报告表及疑问表)进行核对,通常情况下要求关键变量100%正确。,对非关键变量,通常采用按一定比例抽样的方法进行抽查,通常允许一定的错误率,如0.5%或0.1%等。,数据质控检查,12,数据审核的任务是对数据进行最后的检查,一方面确认数据管理的可靠性,另一方面对数据中存在的一些可能影响统计分析结果的数据做出决定。,数据审核通常需召开一次会议,由所有参与研究人员(如研究者、监察员、管理员、统计分析人员等)共同参加,所形成的结论共同负责。,数据审核过程中,如果发现一些事先未考虑到的问题,需要针对这些问题给出处理意见,如再次发出疑问表、进行约定或根据已有信息做出判断等。,在数据审核会议上,还有另外一项重要的工作,就是讨论并最终确定统计分析计划。之前制定的统计分析计划中可能不能被很好地实现的内容需进行调整。,当所有疑问均已解决、对数据的判断全部完成、统计分析计划也已签署后,数据即可锁定,锁定后的数据交统计分析者进行编程分析。原则上,锁定后的数据将不再更改,除非一些非常明确的证据表明数据中存在错误而且将明显影响分析结果。,数据审核与锁定,13,Data capture tools,CRF,Protocol,Review,Data base,Set up,Data entry tools,Data,Validation,Data lock,Data analysis,Report,FIRST QC,SECOND QC,THIRD QC,FOURTH QC,没有记录的事情没有发生,研究文件的存档,数据数据管理的所有工作均应有书面材料为据,数据管理计划、数据库确认、病例报告表交接、数据确认细节描述、疑问表交接、质控检查、数据审核与锁定等均应有文书为据。,15,注意问题,Epidata,数据录入和数据管理,EpiData,基本情况,选择合适的数据管理软件是保证数据质量的重要方面,参照,EpiInfo,软件,丹麦学者,1999,年发起, 全球咨询小组2000年决定开发,可以直接在,网站上免费下载使用,目前的版本为,版,可在,Windows 95/98/NT/2000/XP,环境下使用,能快速建立数据录入程序,可满足数据的校验录入、双份比较等,建立的数据库可转变成,dBase,、,Excel,文件以及,SAS,、,SPSS,和,Stata,统计分析软件的数据格式,为数据管理软件,暂不具有统计分析功能,适于单表,也适于含子表的情形,EpiData,基本情况,EpiData,秉承,EpiInfo DOS,版本的简便性,简便性体现:以文本形式编写文件,通过程序将此文本文件转换成数据输入表格,安装时不受计算机设置的影响。无需安装或替换任何的,DLL,文件或系统文件,EpiData,基本情况,EpiData,程序可用于,定义数据结构;,简化数据输入;,应用校验原理进行数据录入;,编辑,/,纠正已经录入的数据;,确认变量间的一致性、逻辑性;,显示或打印数据核查错误结果留存;,双份录入数据的比较;,导出数据供统计分析使用。,EpiData,使用流程图,定义数据库结构,设计用户录入界面,建立数据库文件,建立数据核查程序,数据录入,输入完成后数据再核查,数据归档备份。,22,QES,文件,(,调查表文件,),:定义调查表(问卷)的结构,REC,文件,(,数据文件,),:存放数据以及已经定义好的编码,CHK,文件,(,核查文件,),:定义了数据输入时字段的有效性规则,23,24,数据导出,EpiData,软件产生的数据文件以“,REC”,作为扩展名,一般不能被其它软件程序所调用,数据备份,转出为文本文件,数据转成,dBase III,格式,数据转成,Excel,格式,转出成,Stata,、,SPSS,、,SAS,所用的数据,SPSS,统计分析软件,数据录入和数据管理,SPSS,简介,SPSS,(,Statistical Package for Social Science,社会科学统计软件包)和,SAS,一样也是国际上流行的权威性统计分析软件之一。,和,SAS,相比,它更突出的特色是友好的窗口菜单式用户界面。在非统计专业科研人员中流行。,在,Windows,操作系统下它的版本不断升级,但基本统计分析窗口操作无太大变化。,SPSS,的主要窗口,主要有三类:数据编辑窗口(,Data Editor,)、结果输出窗口(,Viewer,)和语法窗口(,Syntax Editor,)。,数据编辑窗口,-SPSS Data Editor,数据视窗(,Data View,)和变量视窗(,Variable View,),Data View,主要用于显示和编辑数据,Variable View,则用来定义编辑变量的有关属性,:,包括变量名(,Name,)、类型,(Type),、宽度,(Width),、,小数位数,(Decimal),、标签,(Label),、值标签,(Values),、,缺失值,(Missing),、列宽,(Columns),、对齐方式,(Align),和,测量类型,(Measure),等。,结果输出窗口,-SPSS Viewer,显示分析结果和系统信息。,系统启动时并不打开输出窗口,当完成首次统计分析过程后会自动打开。如果处理成功,就显示处理结果;如果处理过程中发生错误或失败,则提示出错信息。,在窗口标题栏自动显示其对应的输出文件名;若是新开的窗口,按顺序自动标记为,“,Output1,”,、,“,Output2,”,、,等。,窗口菜单和工具栏,1.File,:文件管理菜单,有关文件的调入、存储、显示和打印等;,:编辑菜单,有关文本的编辑,及系统选项设置等;,:视图菜单,可定义窗口视图;,4.,Data,:数据管理菜单,可定义及修改变量属性,对记录选择、排序、加权以及对数据文件进行转置、连接、汇总等;,5.,Transform,:数据转换处理菜单,有关数值的计算、重新赋值、缺失值替代等;,6.,Analyze,:统计分析菜单,包含,SPSS,提供的所有统计分析过程;,7.,Graphs,:图形菜单,包含各种统计图的绘制;,:用户选项菜单,可显示变量列表、文件信息,定义及使用集合,运行脚本文件和编辑菜单项等;,:窗口管理菜单,有关窗口的排列、选择、显示等;,:求助菜单,调用各种帮助文件。,保存数据,选择菜单,FileSave,,由于该数据从来没有被保存过,所以弹出,Save as,对话框,用户确定盘符、路径、文件名以及文件格式后点击,OK,钮,即可保存数据文件。,SPSS,的主要文件类型:,数据文件:,data.sav,结果输出文件:,数据的类型,SPSS,中的变量属性有四个:变量名,(Name),、变量类型,(Type),、变量标签,(Lable),和变量长度,(Width),。,定义,SPSS,的变量类型至少应该定义变量名、变量类型,其他的可采用默认。,为变量命名应该采用以下原则:,一般有不多于,8,个字符组成。,首字母为字母,其后可以为字母或数字或除,“?!*”,以外的字符,但应该注意不能以下划线“,-”,或圆点,“,.”,作为变量名的最后一个字符。,变量名不能用“,ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT,OR, TO, WITH ”SPSS,的保留字。,系统不区分变量名中的大小写字符。例如,ABC,和,abc,被认为是同个变量。,变量类型与数据长度,常用的,SPSS,数据类型,(Type),有数值型,字符型和日期型。,数值型变量又按不同的类型分为,5,种,(1) Numeric,:标准数值型,同时定义数值的宽度(,Width,),即整数部分,+,小数点,+,小数部分的位数,默认为,8,位;定义小数位数(,Decimal Places,),默认为,2,位。,(2) Comma,:加逗号的数值型,(3) Dot,:加点的数值型,(4) Scientific notation,:科学记数型,(5) Date,:日期型,(6) Dollar,:货币型,(7) Custom currency,:自定义型,(8) String,:字符型,字符型变量不能参与运算。,变量标签和变量值标签,变量标签是对变量名的进一步说明。可以是中文或英文。在统计分析输出时,在相应的位置显示改变量标签。,如变量名,H,,对应的变量标签可以,Hight,,或身高。,变量值标签是对变量的可能取值所附加的一种说明。对分类变量往往要定义其取值标签。,例,.,某克山病区测得,11,例克山病患者与,13,名健康人的血磷值,(mmol/L),如下,问该地急性克山病患者与健康人的血磷值是否不同?,患者,健康人,: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48,变量的定义,该资料是定量资料,因此我们需要建立两个变量,一个变量代表血磷值,取名为,X,,另一个变量代表观察对象是健康人还是克山病人,取名为,GROUP,。,Missing,,用于定义变量缺失值;,Columns,,定义显示列宽;,Align,,定义显示对齐方式;,Measure,,按度量精度将变量分为定量变量,(Scale),、等级变量,(Ordinal),和定性变量,(Nominal),。该选项只用于统计制图时坐标轴变量的区分以及,SPSS,决策树模块的变量定义。,Values,,用于定义具体变量值的标签;以,group,为例,单击,Value,框右半部的省略号,会弹出变量值标签对话框如,输入数据,在,Data View,中输入相应的数据,一个单元格输入一个数据,,Group,中输入,1,代表患者,,2,代表健康人。,保存数据,选择菜单,File,Save,,由于该数据从来没有被保存过,所以弹出,Save as,对话框。,41,
展开阅读全文