问卷数据的录入与清理.ppt

上传人:zhu****ei 文档编号:5424453 上传时间:2020-01-29 格式:PPT 页数:30 大小:310.50KB
返回 下载 相关 举报
问卷数据的录入与清理.ppt_第1页
第1页 / 共30页
问卷数据的录入与清理.ppt_第2页
第2页 / 共30页
问卷数据的录入与清理.ppt_第3页
第3页 / 共30页
点击查看更多>>
资源描述
统计数据分析基础教程 基于SPSS和Excel的调查数据分析 第3章问卷数据的录入与清理 本章内容 3 1问卷数据的录入3 2在Excel中录入数据3 3核对和清理数据3 4在Excel中核对数据3 5在SPSS中录入数据3 6在SPSS中核对数据附录 Excel数据分析工具附录 在Excel中生成随机数 问卷数据的录入与清理 进行数据统计分析之前 必须先将问卷数据录入计算机 为了保证不 GIGO GarbageInGarbageOut 垃圾进垃圾出 在统计分析之前 需要对录入的数据进行核对和清理 3 1问卷数据的录入 数据输入就是将问卷数据所对应的编码通过扫描或用键盘输入计算机 建立数据文件的过程 目前 数据输入的方式主要有三种 人工输入计算机辅助系统转换光电输入 3 1问卷数据的录入 人工输入 人工输入的注意事项 要规定统一的输入内容和输入格式 挑选和培训数据输入人员 数据输入过程中需要注意 第一 统一规定数据文件名 第二 数据输入时要为每一个输入人员提供一份有关输入内容和格式的手册 第三 要为每个输入人员提供足够的空间摆放问卷 避免不同输入人员的问卷或者同一输入人员已输入和未输入的问卷发生混淆 造成漏输或重复输入 影响问卷的质量 第四 每个输入人员在完成各自负责的问卷的输入任务后 由研究者把他们的数据合并成一个总的数据文件 以供统计分析使用 为了避免数据丢失 要把每个输入人员输入的数据单独存档 以备查找 3 2在Excel中录入数据 单选题 1 确定取得单一答案2 尽可能使用单选题3 单选题如何编码和输入Q1 请问您现在是否拥有手机 1 有 2 没有 跳至Q12题 例3 1在Excel中录入单选题Q1的数据单选题的编码和输入 用文字当列名 图3 1 单选题的编码和输入 用题号当列名 图3 2 3 2在Excel中录入数据 单选题 例3 1在Excel中录入单选题Q1的数据单选题的编码和输入 用文字当列名 图3 1 单选题的编码和输入 用题号当列名 图3 2 3 2在Excel中录入数据 多选题 多选题分为多项限选题 多项排序题 多项任选题 Q2 请问您当初购买手机的原因是什么 可多选 最多3项 1 方便与家人联络 2 方便与朋友同学联络 3 追求流行 4 工作需要 5 同学间比较的心理 6 别人赠送 7 手机价格下降 8 厂商推出的促销方案 9 网内互打较便宜 10 其他例3 2在Excel中录入多选题Q2的数据多选题的编码有2种 分类法和二分法 分类法 编码和输入 图3 3 二分法 编码和输入有关 分类法 和 二分法 编码 请参见P72 74冻结窗格 比较图3 4和图3 5 3 2在Excel中录入数据 多选题 例3 2在Excel中录入多选题Q2的数据 分类法 编码和输入 图3 3 3 2在Excel中录入数据 多选题 例3 2在Excel中录入多选题Q2的数据冻结窗格 比较图3 4和图3 5 3 2在Excel中录入数据 填空题 填空题也称开放题 不提示任何答案 要求使用者直接填写 对数值型的数据 为了取得其真正的数字 如 55 而非只取得区间 如 41 60 会采用填空题的方式取得数据 定量数据 数值型数据 例如 请问您平均每个月手机的话费约元 定量数据可不经任何转换 即可计算各种统计量 均值 标准差 最大值 最小值等 而且也可以直接进行均值比较与检验 甚至可以作为回归分析的因变量或自变量 如果为了取得数据的方便 就设计成选择题 单选题 请问您平均每个月手机的话费约多少钱 1 20元及以下 2 21 40元 3 41 60元 4 61 80元 5 81 100元 6 101元及以上例3 3在Excel中录入填空题的数据 图3 6 3 2在Excel中录入数据 填空题 例3 3在Excel中录入填空题的数据 图3 6 3 2在Excel中录入数据 量表 量表其实是一种顺序尺度 有序变量 只有大小先后的关系 无倍数关系 量表有多种编码方式 如P60的表3 2是量表常用的三种编码方式 例3 4在Excel中录入量表的数据 图3 7 补充 输入数据时 对于量表编码 要取得同向 如P34的例2 26 反向题要正向编码后再输入 3 2在Excel中录入数据 量表 例3 4在Excel中录入量表的数据 图3 7 3 2在Excel中录入数据 排名题 排名 多项排序 是一种衡量的方式 如 下列几种手机的入网方式 请问您认为哪一种的收费最便宜 请依排名顺序 填入1 2 3 4 5 全球通神州行如意通动感地带新时空分此种类型的问卷 作为被排名的对象也不宜太多 否则 受访者也无法排列好 排个5 6项基本就是上限了 例3 5在Excel中录入排名题的数据 图3 8 可将排名题改为单选题 3 2在Excel中录入数据 排名题 例3 5在Excel中录入排名题的数据 图3 8 3 3核对和清理数据 数据有效范围的清理对数据中的奇异值进行清理 数据逻辑一致性的清理依据问卷中的问题相互之间所存在的某种内在的逻辑联系 来检查前后数据之间的合理性 主要针对的是相倚问题和多项限选题 数据质量的抽查 个案 Case 一份问卷的数据在计算机中的编码值 占一行 3 4在Excel中核对数据 筛选出范围不合理的单列例3 6在Excel中核对 大小适中 的数据用自动筛选找出不合理的关联题例3 7在Excel中核对关联题 是否有手机 与 平均月费 的数据用高级筛选找出重复的记录例3 8用Excel处理重复的记录 3 4在Excel中核对数据 筛选出范围不合理的单列例3 6在Excel中核对 大小适中 的数据 3 4在Excel中核对数据 用自动筛选找出不合理的关联题例3 7在Excel中核对关联题 是否有手机 与 平均月费 的数据 没有手机但有手机话费 有手机但没有手机话费 3 4在Excel中核对数据 用高级筛选找出重复的记录例3 8用Excel处理重复的记录 3 5在SPSS中录入数据 手工建立数据文件例3 9在SPSS中 手工建立调查问卷的数据文件1 调查问卷 P68 69 2 确定变量的个数3 在SPSS中定义变量4 单选题的变量定义5 多选题的变量定义 二分法和分类法从Excel获取数据文件例3 10将Excel中的数据导入到SPSS数据文件中方法一 先在SPSS中定义好变量 然后通过 复制 粘贴 方式将数据从Excel复制到SPSS中 方法二 利用打开数据文件的方法直接把Excel中的数据导入到SPSS中 然后再定义变量属性 3 5在SPSS中录入数据 多选题的变量定义 二分法和分类法二分法 MultipleDichotomiesMethod 将每个可能的答案设为一个变量 变量的取值最多有两个 1和0 分别表示 选 或 不选 在实际应用中 经常只有一个取值1 表示 选 而用空值表示 不选 这种方法的缺点是需要的变量个数比较多 优点是比较简单 二分法常用于 不限选 和 限选不排名 分类法 MultipleCategoryMethod 分类法常用于 限选 很少用于 不限选 包括 限选不排名 和 限选排名 按照限选的最多答案设置变量个数 每个变量的取值为选项值 比如 一个多选题 如果最多可选3个答案 那就设置3个变量 分别用来存放3个可能的答案 如果某受访者只填答两个 那么第3个变量的取值为缺失值 如果某受访者只填答一个 那么第2 3个变量的取值均为缺失值 分类法的优点是需要的变量个数比较少 补充 限选不排序多选题的两种编码三种组合方式 以问题5 Q5 限选不排序多选题为例方式1 二分法编码 P73的表3 5 4个变量 编码为1 方式2 分类法编码 P73的表3 6 2个变量 编码为1 2 3 4 补充方式3 变量个数采用二分法 4个变量 编码采用分类法 1 2 3 4 具体如下 建议 应用案例实验1 如果限选不排序多选题的选项超过了2项 如 可多选 最多3项 建议采用方式3 这样的好处是核对容易 请参见 补充 多选题两种编码和核对 xls 实际应用中 建议采用方式2 因为一般只核对单列数据有效范围 很少核对逻辑一致性 改错 P74的表3 9改为 由于采用 分类法 编码 所以在SPSS中的Values也应该是分类法编码 而不是简单的 选 或空白 修改的目的 在用SPSS进行多选变量的频率分析时 具体见第六章 SPSS的输出结果可读性好 3 5在SPSS中录入数据 从Excel获取数据文件例3 10将Excel中的数据导入到SPSS数据文件中方法一 先在SPSS中定义好变量 然后通过 复制 粘贴 方式将数据从Excel复制到SPSS中 方法二 利用打开数据文件的方法直接把Excel中的数据导入到SPSS中 然后再定义变量属性 具体如下 在SPSS中 单击菜单 File Open Data 进入 OpenFile 对话框 在最下面的 文件类型 框中选择 Excel xls 然后选择录入好数据的Excel文件 要求该文件暂时没有被Excel打开 单击 打开 进入 OpeningExcelDataSource 对话框 单击 OK 定义变量属性 对每个变量进行进一步的定义 如变量名标签 变量值标签等 以期达到SPSS分析所要求的目的 3 6在SPSS中核对数据 利用SPSS的一维频率分析Frequencies命令可以发现单变量范围不合理的数据 利用SPSS的交叉表分析Crosstabs命令可以发现两个变量之间的逻辑一致性问题 实践题 1999年关于外商投资企业雇员调查问卷 P80 81 要求 1 确定问卷中每个问题应该设置的变量的个数 并区分是定性 分类 变量还是定量 数值型 变量 2 给每个变量定义变量名 数据类型 变量名标签 3 对于定性 分类 变量 定义相应的变量值标签 类别编码含义 4 自己填写一份问卷 并把有关信息输入数据文件中 5 利用Excel随机数发生器 按照问题的编码 随机生成900份问卷数据 并对生成的数据进行核对 6 保存这901份问卷的数据 请参见实验3 4 随机数生成方法请参见实验3 1实验3 2 附录 Excel数据分析工具 1 Excel数据分析工具及其安装 1 工作表函数与数据分析工具的区别 2 数据分析工具的安装 两种方法 方法二有2个要求Excel软件的菜单 工具 宏 安全性 为 中 Analysis文件夹下的5个文件都要有2 统计分析工具的内容3 统计分析工具的使用 更详细的安装步骤请参见Analysis文件夹下的 Excel数据分析工具的安装说明 doc 附录 在Excel中生成随机数 1 在Excel中生成序号2 在Excel中生成随机数利用 数据分析 工具 离散 分布 柏 伯 努利 分布利用RANDBETWEEN随机整数函数由于每次计算工作表时都将返回一个新的数值 所以最好能够将其产生的随机整数保存不变 具体做法是先 复制 再在原处 粘贴 为 值 变量个数 m 表示要产生m列随机数个数 n 表示要产生n行一共产生n行 m列的随机数
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!