问卷数据的录入与清理.ppt

上传人:za****8 文档编号:15153227 上传时间:2020-08-04 格式:PPT 页数:30 大小:310.51KB
返回 下载 相关 举报
问卷数据的录入与清理.ppt_第1页
第1页 / 共30页
问卷数据的录入与清理.ppt_第2页
第2页 / 共30页
问卷数据的录入与清理.ppt_第3页
第3页 / 共30页
点击查看更多>>
资源描述
统计数据分析基础教程基于SPSS和Excel的调查数据分析,第3章 问卷数据的录入与清理,本章内容,3.1 问卷数据的录入 3.2 在Excel中录入数据 3.3 核对和清理数据 3.4 在Excel中核对数据 3.5 在SPSS中录入数据 3.6 在SPSS中核对数据 附录 Excel数据分析工具 附录 在Excel中生成随机数,问卷数据的录入与清理,进行数据统计分析之前,必须先将问卷数据录入计算机。 为了保证不“GIGO,Garbage In Garbage Out”(垃圾进垃圾出),在统计分析之前,需要对录入的数据进行核对和清理。,3.1 问卷数据的录入,数据输入就是将问卷数据所对应的编码通过扫描或用键盘输入计算机,建立数据文件的过程。 目前,数据输入的方式主要有三种: 人工输入 计算机辅助系统转换 光电输入,3.1问卷数据的录入(人工输入),人工输入的注意事项: 要规定统一的输入内容和输入格式。 挑选和培训数据输入人员。 数据输入过程中需要注意: 第一,统一规定数据文件名。 第二,数据输入时要为每一个输入人员提供一份有关输入内容和格式的手册。 第三,要为每个输入人员提供足够的空间摆放问卷,避免不同输入人员的问卷或者同一输入人员已输入和未输入的问卷发生混淆,造成漏输或重复输入,影响问卷的质量。 第四,每个输入人员在完成各自负责的问卷的输入任务后,由研究者把他们的数据合并成一个总的数据文件,以供统计分析使用。为了避免数据丢失,要把每个输入人员输入的数据单独存档,以备查找。,3.2 在Excel中录入数据(单选题),1确定取得单一答案 2尽可能使用单选题 3单选题如何编码和输入 Q1.请问您现在是否拥有手机? 1.有2.没有(跳至Q12题) 例3-1 在Excel中录入单选题Q1的数据 单选题的编码和输入(用文字当列名,图3-1) 单选题的编码和输入(用题号当列名,图3-2),3.2 在Excel中录入数据(单选题),例3-1 在Excel中录入单选题Q1的数据 单选题的编码和输入(用文字当列名,图3-1) 单选题的编码和输入(用题号当列名,图3-2),3.2 在Excel中录入数据(多选题),多选题分为多项限选题、多项排序题、多项任选题。 Q2.请问您当初购买手机的原因是什么?(可多选,最多3项) 1.方便与家人联络 2.方便与朋友同学联络 3.追求流行 4.工作需要 5.同学间比较的心理 6. 别人赠送 7.手机价格下降 8.厂商推出的促销方案 9.网内互打较便宜 10.其他 例3-2 在Excel中录入多选题Q2的数据 多选题的编码有2种:分类法和二分法。 “分类法”编码和输入(图3-3) “二分法”编码和输入 有关“分类法”和“二分法”编码,请参见P7274 冻结窗格(比较图3-4和图3-5),3.2 在Excel中录入数据(多选题),例3-2 在Excel中录入多选题Q2的数据 “分类法”编码和输入(图3-3),3.2 在Excel中录入数据(多选题),例3-2 在Excel中录入多选题Q2的数据 冻结窗格(比较图3-4和图3-5),3.2 在Excel中录入数据(填空题),填空题也称开放题,不提示任何答案,要求使用者直接填写。 对数值型的数据,为了取得其真正的数字(如:55),而非只取得区间(如:4160),会采用填空题的方式取得数据(定量数据,数值型数据),例如: 请问您平均每个月手机的话费约 元? 定量数据可不经任何转换,即可计算各种统计量:均值、标准差、最大值、最小值等,而且也可以直接进行均值比较与检验,甚至可以作为回归分析的因变量或自变量。 如果为了取得数据的方便,就设计成选择题(单选题): 请问您平均每个月手机的话费约多少钱? 1.20元及以下2.2140元3.4160元 4.6180元5.81100元6.101元及以上 例3-3 在Excel中录入填空题的数据(图3-6),3.2 在Excel中录入数据(填空题),例3-3 在Excel中录入填空题的数据(图3-6),3.2 在Excel中录入数据(量表),量表其实是一种顺序尺度(有序变量),只有大小先后的关系,无倍数关系。 量表有多种编码方式,如P60的表3-2是量表常用的三种编码方式。 例3-4 在Excel中录入量表的数据(图3-7),补充:输入数据时,对于量表编码,要取得同向,如P34的例2-26,反向题要正向编码后再输入,3.2 在Excel中录入数据(量表),例3-4 在Excel中录入量表的数据(图3-7),3.2 在Excel中录入数据(排名题),排名(多项排序)是一种衡量的方式。如: 下列几种手机的入网方式,请问您认为哪一种的收费最便宜? 请依排名顺序,填入1、2、3、4、5: 全球通 神州行 如意通 动感地带 新时空 分 此种类型的问卷,作为被排名的对象也不宜太多。否则,受访者也无法排列好。排个5、6项基本就是上限了。 例3-5 在Excel中录入排名题的数据(图3-8) 可将排名题改为单选题,3.2 在Excel中录入数据(排名题),例3-5 在Excel中录入排名题的数据(图3-8),3.3 核对和清理数据,数据有效范围的清理 对数据中的奇异值进行清理。 数据逻辑一致性的清理 依据问卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的合理性,主要针对的是相倚问题和多项限选题。 数据质量的抽查,个案(Case):一份问卷的数据在计算机中的编码值,占一行,3.4 在Excel中核对数据,筛选出范围不合理的单列 例3-6 在Excel中核对“大小适中”的数据 用自动筛选找出不合理的关联题 例3-7 在Excel中核对关联题“是否有手机”与“平均月费”的数据 用高级筛选找出重复的记录 例3-8 用Excel处理重复的记录,3.4 在Excel中核对数据,筛选出范围不合理的单列 例3-6 在Excel中核对“大小适中”的数据,3.4 在Excel中核对数据,用自动筛选找出不合理的关联题 例3-7 在Excel中核对关联题“是否有手机”与“平均月费”的数据,没有手机但有手机话费,有手机但没有手机话费,3.4 在Excel中核对数据,用高级筛选找出重复的记录 例3-8 用Excel处理重复的记录,3.5 在SPSS中录入数据,手工建立数据文件 例3-9 在SPSS中,手工建立调查问卷的数据文件 1.调查问卷(P6869) 2.确定变量的个数 3.在SPSS中定义变量 4.单选题的变量定义 5.多选题的变量定义:二分法和分类法 从Excel获取数据文件 例3-10 将Excel中的数据导入到SPSS数据文件中 方法一:先在SPSS中定义好变量,然后通过“复制粘贴”方式将数据从Excel复制到SPSS中。 方法二:利用打开数据文件的方法直接把Excel中的数据导入到SPSS中,然后再定义变量属性。,3.5 在SPSS中录入数据,多选题的变量定义:二分法和分类法 二分法(Multiple Dichotomies Method):将每个可能的答案设为一个变量,变量的取值最多有两个(1和0),分别表示“选”或“不选”(在实际应用中,经常只有一个取值1,表示“选”,而用空值表示“不选”)。这种方法的缺点是需要的变量个数比较多;优点是比较简单。二分法常用于“不限选” 和 “限选不排名” 。 分类法(Multiple Category Method):分类法常用于“限选”(很少用于“不限选”),包括“限选不排名” 和“限选排名” 。按照限选的最多答案设置变量个数,每个变量的取值为选项值。比如,一个多选题,如果最多可选3个答案,那就设置3个变量,分别用来存放3个可能的答案。如果某受访者只填答两个,那么第3个变量的取值为缺失值;如果某受访者只填答一个,那么第2、3个变量的取值均为缺失值。分类法的优点是需要的变量个数比较少。,补充:限选不排序多选题的两种编码三种组合方式,以问题5(Q5)限选不排序多选题为例 方式1:二分法编码:P73的表3-5(4个变量,编码为1) 方式2:分类法编码:P73的表3-6(2个变量,编码为1、2、3、4) 补充方式3:变量个数采用二分法(4个变量),编码采用分类法(1、2、3、4),具体如下:,建议:应用案例实验1,如果限选不排序多选题的选项超过了2项(如:可多选,最多3项),建议采用方式3,这样的好处是核对容易。请参见“补充:多选题两种编码和核对.xls”,实际应用中,建议采用方式2。 因为一般只核对单列数据有效范围,很少核对逻辑一致性,改错:P74的表39改为,由于采用“分类法”编码,所以在SPSS中的Values也应该是分类法编码,而不是简单的“选”或空白。 修改的目的:在用SPSS进行多选变量的频率分析时(具体见第六章),SPSS的输出结果可读性好。,3.5 在SPSS中录入数据,从Excel获取数据文件 例3-10 将Excel中的数据导入到SPSS数据文件中 方法一:先在SPSS中定义好变量,然后通过“复制粘贴”方式将数据从Excel复制到SPSS中。 方法二:利用打开数据文件的方法直接把Excel中的数据导入到SPSS中,然后再定义变量属性。具体如下:在SPSS中,单击菜单“File”-“Open”-“Data”,进入“Open File”对话框,在最下面的“文件类型”框中选择“Excel(*.xls)”,然后选择录入好数据的Excel文件(要求该文件暂时没有被Excel打开),单击“打开”,进入“Opening Excel Data Source”对话框,单击“OK”。 定义变量属性:对每个变量进行进一步的定义(如变量名标签、变量值标签等),以期达到SPSS分析所要求的目的,3.6 在SPSS中核对数据,利用SPSS的一维频率分析Frequencies命令可以发现单变量范围不合理的数据。 利用SPSS的交叉表分析Crosstabs命令可以发现两个变量之间的逻辑一致性问题。,实践题,1999年关于外商投资企业雇员调查问卷(P8081) 要求: (1)确定问卷中每个问题应该设置的变量的个数,并区分是定性(分类)变量还是定量(数值型)变量。 (2)给每个变量定义变量名、数据类型、变量名标签。 (3)对于定性(分类)变量,定义相应的变量值标签(类别编码含义)。 (4)自己填写一份问卷,并把有关信息输入数据文件中。 (5)利用Excel随机数发生器,按照问题的编码,随机生成900份问卷数据,并对生成的数据进行核对。 (6)保存这901份问卷的数据。,请参见实验3.4,随机数 生成方法 请参见 实验3.1 实验3.2,附录 Excel数据分析工具,1. Excel数据分析工具及其安装 (1)工作表函数与数据分析工具的区别 (2)数据分析工具的安装(两种方法) 方法二有2个要求 Excel软件的菜单“工具”“宏” “安全性”为“中”; Analysis文件夹下的5个文件都要有 2. 统计分析工具的内容 3. 统计分析工具的使用,更详细的安装步骤请参见Analysis文件夹下的“Excel数据分析工具的安装说明.doc”,附录 在Excel中生成随机数,1在Excel中生成序号 2在Excel中生成随机数 利用“数据分析”工具 “离散”分布 “柏(伯)努利”分布 利用RANDBETWEEN随机整数函数 由于每次计算工作表时都将返回一个新的数值,所以最好能够将其产生的随机整数保存不变,具体做法是先“复制”再在原处“粘贴”为“值”。,变量个数(m):表示要产生m列 随机数个数(n):表示要产生n行 一共产生n行m列的随机数,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!