数据挖掘与客户管理期末考试卷卷及答案

资源描述

试卷代号：7563 A卷浙江广播电视大学1月期末考试试题数据挖掘与客户管理期末考试试卷（试卷总分：100分，考试时间：120分钟）题号一二三四总分分数一、名词解释（每题4分，共20分）1数据挖掘：2. 过度拟合：3. 过抽样：4辛普森差别系数（基尼系数）：5数据仓库：二、填空题（每空2分，共30分）1. 数据挖掘的三大支柱分别是、和。2. 互动循环过程有四个业务过程，这四个过程循环往复，分别是理解业务问题、将数据转换成可执行的决策、和。 3. 预测模型成功应用的三个假定分别是、和。4. 数据仓库的长处是和。5. 数据仓库可由多种数据中心构成，数据仓库设计者们安排好这些数据中心的最重要挑战是要建立合适的。6. 使用无监督的数据挖掘措施必须。7. 为了保证输入数据早于输出成果,可以用措施对数据时间元素进行解决。8. 分段输入组合模型和模型分段组合模型的最大区别在于。9. 客户流失的因素，大体可以分为两类：自愿流失和。三、单选题(每题2分，共20分)1. 公司所建立的预测模型的好坏取决于模型在( )上的体现效果。A 得分集 B训练集 C测试集 D评价集2. 客户在经济活动中具有多重身份，下面哪一种不是其身份之一( )。A行为身份 B所有权身份 C学习身份 D决策身份 3. 下列四条描述中，对的的一条是( )。A 公司实行数据挖掘，必须要有数据仓库。B公司要实行数据挖掘最佳的方式是请编外专家。C公司购买现成数据挖掘模型的一种先决条件是：该公司的产品、客户、市场定位和所买来的现成模型设计之初的假设相吻合。D 在建模的时侯，增益最高的模型就是最佳的模型。4. 数据挖掘算法以( )形式来组织数据。A 行 B列 C 记录 D 表格5. 公司要建立预测模型，需准备建模数据集，如下四条描述建模数据集对的的是( )。 A 数据越多越好。 B 尽量多的适合的数据。 C得分集数据是建模集数据的一部分。D 以上三条都对的。6. K均值类别侦测规定输入的数据类型必须是( )。A整型 B数值型 C字符型 D逻辑型7. 在决策树和合计增益图的关系转化过程图中，决策树上某一页节点的增益与合计增益图上的( )相相应。A线段长度 B线段斜率 C 相相应的线段长度 D相相应的线段斜率8. 公司为提高每个客户的价值，应实现( )最优化。A 促销活动 B 预算最优化 C客户最优化 D三者都不是9. 数据挖掘的典型案例“啤酒与尿布实验”最重要是应用了( )数据挖掘措施。A 分类 B 预测 C 组合或关联法则 D聚类10. 公司成功实行数据挖掘，需要如下( )知识或技术A 预先的规划 B 对商业文体的理解 C综合商业知识和技能 D 都需要四、简答题（每题6分，共30分）1. 数据挖掘的六种常用算法和技术分别是什么？ 2. 实现数据挖掘技术在公司中专业化应用的四种有效途径？3. 一般觉得有哪几种措施可以提高客户的价值？4. 数据挖掘中的数据需要采用哪些格式？ 5. 预测模型的建立过程有哪些？数据挖掘与客户管理期末考试试卷答案（试卷总分：100分，考试时间：120分钟）一、名词解释（每题4分，共20分）1. 数据挖掘：是通过自动或半自动化的工具对大量的数据进行摸索和分析的过程，其目的就是发现其中故意义的模式和规律。2. 过度拟合：预测模型对训练集和测试集的模式记忆太深，而不能较好地、一般化地对将来数据进行预测。3. 过抽样：多抽取稀有事件，少抽取常用成果，以建立模型集的过程。目的是调节模型集中稀疏数据与一般数据间的比例关系，使之保持在15%-30%.4. 辛普森差别系数（基尼系数）：衡量度量总体的差别限度。解释为从总体中有放回地随机获得两个样品属于不同类别的概率。公式为：2P1（1P1），其中P1是属于第一类的概率。5. 数据仓库：是从关系型数据库中发展起来的，是一种面向主题的、集成的、反映历史变化的和相对稳定的数据集合。二、填空题（每空2分，共30分）1. 数据挖掘技术与算法、无所不在的数据、建立有效的预测模型2. 决策实行、评价决策模型3. 过去是将来的预言家、数据是可以获得的、数据中应涉及我们的预期目的4. 数据仓库是从一种点上观测整个公司，而不是许多小定义的“地下仓库”的拼凑集合、数据挖掘记录的是最令人感爱好的具体的数据5. 纬度和事实6. 人机交互7. 将时间范畴附加届时间字段上8. 数据的分段是预先懂得的还是模型决定的9. 非自愿流失三、单选题(每题2分，共20分)1. A 2. C 3. B 4. D 5. B 6. B 7. D 8. C 9. C 10. B 四、简答题（每题6分，共30分）1. 数据挖掘的六种常用算法和技术分别是什么？分类：解决成果是离散的估计：解决的是持续的成果预测：任何的预测都可以被觉得是分类或估计。不同之处在于你强调的是什么：可以对分类后的成果加以检查；但在预测中，检查只能等待事物发生后才干拟定。组合或关联分析聚类：其与分类的区别是聚类不依赖于事先拟定好的组别。描述与可视化：“女性比男性更支持民主党”。2. 实现数据挖掘技术在公司中专业化应用的四种有效途径？购买与公司的商业问题配套的评分机制购买数据挖掘软件此类整体解决方案聘任外部专家完毕预测模型的建立组织内部掌握数据挖掘技能3. 一般觉得有哪几种措施可以提高客户的价值？一般觉得，有如下三种措施可以提高客户的价值：对客户已有产品，增添新功能，或者说提高产品的购买价值。向客户发售更多、更容易升级的产品。使客户能长期购买我司的产品。4. 数据挖掘中的数据需要采用哪些格式？数据挖掘中的数据需要采用如下格式：所有数据应当在一种表格/数据库视图中每一行相应于与业务问题有关的一种案例忽视具有单一值/几乎单一值的列忽视所有行的值都不同的列删除所有同义列对于预测模型，目的列必须是可辨认的5. 预测模型的建立过程有哪些？收集建模所需的尽量多的适合的数据，即收集模型集数据；建立训练集数据，用于建立预测模型；建立测试集数据，用于预测模型的修正；建立评价集数据，用于估计模型的效果，或不同模型的效果比较；建立得分集数据，该数据不属于模型集的一部分，不懂得这部分数据会产生什么样的成果。

展开阅读全文

数据挖掘与客户管理期末考试卷卷及答案

最新文档