资源描述
数据仓库与数据挖掘课程教学大纲课程代码:1101309118课程名称:数据仓库与数据挖掘英文名称:Data Warehousing and Data Mining学 分:3 总学时:48讲课学时:30 实验学时:上机学时:18课外学时:适用对象:经济管理类信息管理与信息系统专业先修课程:计算机基础,数据库学生自主学习时数建议:30 课程性质 目的和任务数据仓库与数据挖掘是信息管理与信息系统专业的专业模块课。通过课程学习,使学生能够了解数据仓库及数据挖掘的产生和发展历史,掌握如何设计并实现比较规范的数据仓库系统,掌握数据挖掘的基本概念、技术和应用方法。培养学生应用数据仓库和数据挖掘理论和技术解决实际问题的能力。1. 了解数据管理技术从数据库到数据仓库的发展过程。2. 掌握数据仓库的定义、特点和研究数据仓库的必要性。3. 掌握数据仓库的体系结构和联机分析处理的概念4. 掌握数据仓库的数据组织、数据预处理与规划管理5. 掌握数据仓库规划、设计、管理的基本方法6. 掌握数据挖掘的基本概念及与数据仓库的关系7. 熟悉聚类分析、分类发现和关联规则等数据挖掘算法的使用环境、算法特点,并能进行算法复杂性的分析。8 .认识数据挖掘的发展趋势和应用前景9.能够在科研实践中应用数据仓库技术和应用数据挖掘的方法。二、教学基本要求在充分讲解数据仓库与数据挖掘基本概念、基本原理和基本技术的基础上,注重实际应用能力的培养,通过理论知识的学习和上机环节,结合实例,使学生能够比较好的掌握数据仓库与数据挖掘基础知识,重点培养学生利用数据仓库与数据挖掘技术分析、解决实际问题的基本技能。学生应系统学习并掌握数据仓库与数据挖掘的基本概念,认真思考并理解其发展的一般规律,准确理解和掌握数据仓库与数据挖掘的基本方法和技术及在实际工作中的应用。1. 学生应对数据库系统的基本概念、基本原理和关系数据理论有较扎实的理解,应比较熟悉关系数据库的原理和实施方法。2. 学生应具备数据结构和算法分析的基本知识。3. 能够结合实际问题进行数据仓库的结构设计工作,包括对多维数据模型的构造、事实表与维表的定义等。4. 教学中应结合实例对每种数据挖掘算法进行分析,对算法复杂性进行研究。5. 教学中应分析本学科当前的研究现状,提出需解决的问题。三 教学内容第一单元数据仓库与数据挖掘概述1、教学内容(1) 了解数据仓库与数据挖掘的产生、发展,熟悉数据挖掘的应用;(2) 掌握基本概念和数据库中的知识发现过程;(3) 数据仓库的基本原理;(4) 操作型处理(事务型处理)和分析型处理;(5) 了解OLAP,掌握其基本概念、特点、特性;基本动作、展现方式、OLAP的体系结构和分类。2、重点和难点:(1) 重点:数据库中的知识发现过程;(2) 难点:操作型处理(事务型处理)和分析型处理。第二单元关联规则挖掘技术1、教学内容(1) 关联规则挖掘的基本概念;(2) 关联规则挖掘的分类;(3) 关联规则挖掘的Apriori算法;(4) 关联规则挖掘算法FP-growtho2、重点和难点:(1) 重点:关联规则挖掘的Apriori算法;(2) 难点:关联规则挖掘算法FP-growtho第三单元分类和聚类1、教学内容(1) 决策树基础;(2) 决策树算法;(3) 分类器评价标准;(4) 距离和相似系数;(5) 系统聚类法。2、重点和难点:(1) 重点:决策树基础;(2) 难点:决策树算法。第四单元遗传算法和因子分析1、教学内容(1) 生物进化理论和遗传学的基本知识;(2) 遗传算法基本原理;(3) 遗传算法关键技术;(4) 因子分析的基本思想;(5) 因子分析原理。2、重点和难点:(1) 重点:遗传算法关键技术;(2) 难点:因子分析原理。第五单元离群点挖掘1、教学内容(1) 离群点挖掘的概念;(2) 基于统计的方法;(3) 基于距离的方法;(4) 基于密度的方法;(5) 基于聚类的方法。2、重点和难点:(1) 重点:基于统计的方法;(2) 难点:基于聚类的方法。四 实践环节设计本课程安排18学时实验,详见本课程实验教学大纲。五、课外习题及课程讨论为达到本课程的教学基本要求,课外思考题或习题不应少于20题。六、教学方法与手段本课程采用板书与多媒体课件结合的方式进行课堂教学。七、各教学环节学时分配内容讲课实验上机习题课讨论课自主学习合计数据仓库与数据挖掘概述22关联规则挖掘技术6410分类和聚类6410遗传算法和因子分析8614离群点挖掘6410串讲22合计301848八、学生自主学习要求课外学生按照授课学时:自主学习时间比例1: 1来对应各章节自主学习、归纳、总结。九 考核方式1、本课程考试为闭卷笔试。2、学生的课程总评成绩由平时总评成绩和期末考试成绩两部分构成(平时总评所占比例原则上为30%,其中实验成绩占20%,出勤、课堂表现、学习主动性等占10%)。十、推荐教材和教学参考书教材:数据仓库与数据挖掘教程,陈立伟编著,清华大学出版社,201 lo参考书:数据挖掘原理与技术,张云涛、龚玲编著,电子工业出版社,2004o数据仓库原理与实践,林宇编著,人民邮电出版社,2003o十一 说明1、注重实践教学,强调理论和实际相结合,要求学生会操作。2、部分实验需在课余时间进行。大纲制订人:数据仓库与数据挖掘课程组大纲审定人:制订日期:2014年5月数据仓库与数据挖掘课程实验(上机)教学大纲一、教学目标与基本要求数据仓库与数据挖掘的实践课程主要介绍数据仓库的工作机理及其构建过程,要求学生熟练使用数据库管理系统MS SQL Server,掌握典型的数据仓库系统及其开发工具的使用,理解数据挖掘的工作原理与流程,掌握典型数据挖掘技术及其工具的使用方法,熟悉SQL SERVER BI DEV集成挖掘环境。通过上述实验环节,使学生加深了解和更好地掌握数据仓库与数据挖掘课程教学大纲要求的内容。二、基本理论与实验(上机)技术知识本实验教学内容为数据仓库与数据挖掘课程实验。通过实验,可加深学生对课堂教学的理论知识的理解和巩固,掌握计算机操作技能,提高开发应用软件能力和细致科学研究素养。三 实验(上机)方法特点与基本要求在数据仓库与数据挖掘的课程实验过程中,要求学生做到:(1)预习实验指导书有关部分,认真做好实验内容的准备,就实验可能出现的情况提前作出思考和分析。(2)仔细观察上机操作时出现的各种现象,记录主要情况,作出必要说明和分析。(3)认真书写实验报告。实验报告包括实验目的和要求,实验情况及其分析。(4)遵守机房纪律,服从辅导教师指挥,爱护实验设备。(5)实验课程不迟到。如有事不能出席,所缺实验一般不补。(6)实验报告按班级分次统一在规定时间内提交。实验报告的格式见本指导书的第三部分。实验报告内容应包括:实验名称、目的、内容、原理、环境、实验步骤、实验总结(思考题的回答及实验心得)等内容。四 主要仪器设备1、本实验的计算机配置:1G以上的CPU ; 128 MB以上内存,32MB以上显存;软件配置:Windows 2000/XP/2003o2、应用软件:Sql server 2005 等。五、实验(上机)项目的设置与内容提要序号实验(上机)项目内容提要实验学时实验类型每组人数实验要求1关联规则挖掘技术关联规则挖掘的Apriori算法;关联规则挖掘算法FP-growtho4综合1必做2分类和聚类决策树基础;决策树算法;系统聚类法4综合1必做3遗传算法和因遗传算法关键技术;6综合1必做子分析因子分析算法4离群点挖掘基于统计的方法;基于距离的方法;基于密度的方法;基于聚类的方法4综合1必做注:总实验学时为18学时。六、实验(上机)报告要求每次实验提交实验报告。实验报告由提交实验成果电子和纸质文档组成,并附有实验原始记录。(注:实验指导书中有实验目的和实验步骤的详细说明,在实验报告中可不作说明。)七考核方式与成绩评定1、考核方式:上机态度与实验报告相结合的方式;2、成绩评定:考核方法根据实验叙述及报告编辑要求,按实验报告质量及结合上机态度评定实验成绩,实验成绩按学生总成绩的20%计。十 推荐教材和教学参考书教 材:数据仓库与数据挖掘教程,陈立伟编著,清华大学出版社,2011。参考书:数据挖掘原理与技术,张云涛、龚玲编著,电子工业出版社,2004o数据仓库原理与实践,林宇编著,人民邮电出版社,2003o
展开阅读全文