数据挖掘实验指南part.ppt

上传人:tian****1990 文档编号:11536567 上传时间:2020-04-27 格式:PPT 页数:17 大小:2.72MB
返回 下载 相关 举报
数据挖掘实验指南part.ppt_第1页
第1页 / 共17页
数据挖掘实验指南part.ppt_第2页
第2页 / 共17页
数据挖掘实验指南part.ppt_第3页
第3页 / 共17页
点击查看更多>>
资源描述
数据挖掘实验指南,本ppt主要为08届信科胡旭灵根据实验课内容制作,10届统计旷英兰参与部分修改,特表感谢!,2020/4/27,1,数据挖掘实验指南,本ppt使用说明,标为红色字体为课程涉及的主要操作此ppt主要为方便大家熟悉weka的基本使用,如果要深入学习,可参考其他书籍,欢迎和大家一起共同学习进步。软件中提到的软件自带数据,是指在软件安装文件夹中有个data的文件夹里面的数据。,2020/4/27,2,数据挖掘实验指南,总体框架,2020/4/27,3,数据挖掘实验指南,Weka软件,Weka软件是著名的免费数据挖掘软件,各位同学可到官方网站下载http:/www.cs.waikato.ac.nz/ml/weka/共有两种类型,一种以jre结尾,表示软件自带java虚拟机,另一种不带(适合pc上已安装java虚拟机)。,2020/4/27,4,数据挖掘实验指南,安装运行weka,下载安装包后,解压安装。注:安装后若发现运行软件出现一闪而过,则说明java环境变量没设置好(鉴于大家都学过java,设环境变量的步骤是大家应该会的)。,2020/4/27,5,数据挖掘实验指南,设置java环境变量后运行,2020/4/27,6,数据挖掘实验指南,Weka功能简介,Weka介绍菜单栏里program里有个重要的logwindow日志窗口选项卡,用来显示包括出错信息等。Visualization是进行数据可视化操作Tools是与查看文件有关的功能,2020/4/27,7,数据挖掘实验指南,四大主要应用程序,Explorer是探索数据的环境,在本课程中将主要介绍。Experimenter是用来运行算法试验,算法检验等的环境。Knowledgefolw这个环境与explorer相似,但支持拖放。simpleCLI是命令行界面,可以直接执行weka命令,其实在cmd命令窗里也可直接运行weka的命令,前提是设好环境变量等。,2020/4/27,8,数据挖掘实验指南,读取数据,举例:Exploreropenfile(选择本机安装文件夹里自带的数据)选择weather.arff,2020/4/27,9,数据挖掘实验指南,(注:.arff文件是weka识别的主要类型,weka还识别spss的.cvs类型的数据,故数据转换为普通数据-spss.csv-.arff,也可以用写字板和记事本打开arff文件以观察数据),2020/4/27,10,数据挖掘实验指南,Explorer的process界面简介,点击edit可修改数据,选择属性后点击remove可删除属性,可进行数据的变换如离散化的数据预处理,数据预处理的主要选项,2020/4/27,11,数据挖掘实验指南,数据预处理,数据预处理作为数据挖掘的前奏,起着奠基石的作用,希望引起各位同学的重视。,2020/4/27,数据挖掘实验指南,12,数据预处理举例:离散化,打开C:ProgramFilesWeka-3-6dataweather.arff后点击choose,点击,2020/4/27,13,数据挖掘实验指南,选择choose后选择过滤规则:离散化,Choose-filters-unsupervised-attribute-discretize,discretize,2020/4/27,14,数据挖掘实验指南,选择规则后,应用规则进行离散化,1、双击所选规则可进行规则的参数设置,见右框,2、此框可调整参数,4、点击apply则应用规则,3、进行选择要离散化的属性,2020/4/27,15,数据挖掘实验指南,离散化后的结果,2、应用规则后,离散化分为10类,如下图所示,1、应用规则后再点击该属性,可视化,2020/4/27,16,数据挖掘实验指南,数据预处理总结,数据预处理的方式非常多,但基本流程跟离散化差不多,请各位同学自行尝试,多实践。,2020/4/27,17,数据挖掘实验指南,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!