标签: weka数据挖掘
weka中文版官方最新版是一款非常实用的数据挖掘软件,这款软件广泛应用于SQL数据库领用,下面有绿色资源网小编为您带来weka中文版32位/64位官网最新版下载,需要的朋友欢迎来本站免费下载使用。
WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。
Weka是一款开源的、非商业性质的免费数据挖掘软件,集合了大量能承担数据挖掘任务的计算机学习算法,包括对数据进行预处理、分类、回归、聚类、关联规则以及在新的交互界面上的可视化。数据挖掘软件Weka的技术基于假设数据是以一种单个文件或关联的,在那里,每个数据点都被许多属性标注。
Weka使用Java的数据库链接能力可以访问SQL数据库,并可以处理一个数据库的查询结果。它主要的用户接品是Explorer,也同样支持相同功能的命令行,或是一种基于组件的知识流接口。如果想自己实现数据挖掘算法的话,可以看一下Weka的接口文档,在Weka 中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是一件很困难的事情。
WEKA把分类(Classification)和回归(Regression)都放在“Classify”选项卡中,这是有原因的。
在这两个任务中,都有一个目标属性(输出变量)。我们希望根据一个样本(WEKA中称作实例)的一组特征(输入变量),对目标进行预测。为了实现 这一目的,我们需要有一个训练数据集,这个数据集中每个实例的输入和输出都是已知的。观察训练集中的实例,可以建立起预测的模型。有了这个模型,我们就可 以新的输出未知的实例进行预测了。衡量模型的好坏就在于预测的准确程度。
在WEKA中,待预测的目标(输出)被称作Class属性,这应该是来自分类任务的“类”。一般的,若Class属性是分类型时我们的任务才叫分类,Class属性是数值型时我们的任务叫回归。
现在我们计划挖掘出支持度在10%到100%之间,并且lift值超过1.5且lift值排在前100位的那些关联规则。我们把 “lowerBoundMinSupport”和“upperBoundMinSupport”分别设为0.1和1,“metricType”设为 lift,“minMetric”设为1.5,“numRules”设为100。其他选项保持默认即可。“OK” 之后在“Explorer”中点击“Start”开始运行算法,在右边窗口显示数据集摘要和挖掘结果。
下面是挖掘出来的lift排前5的规则。
Best rules found:
1. age=52_max save_act=YES current_act=YES 113 ==> income=43759_max 61 conf:(0.54) < lift:(4.05)> lev:(0.08) [45] conv:(1.85)
2. income=43759_max 80 ==> age=52_max save_act=YES current_act=YES 61 conf:(0.76) < lift:(4.05)> lev:(0.08) [45] conv:(3.25)
3. income=43759_max current_act=YES 63 ==> age=52_max save_act=YES 61 conf:(0.97) < lift:(3.85)> lev:(0.08) [45] conv:(15.72)
4. age=52_max save_act=YES 151 ==> income=43759_max current_act=YES 61 conf:(0.4) < lift:(3.85)> lev:(0.08) [45] conv:(1.49)
5. age=52_max save_act=YES 151 ==> income=43759_max 76 conf:(0.5) < lift:(3.77)> lev:(0.09) [55] conv:(1.72)
对于挖掘出的每条规则,WEKA列出了它们关联程度的四项指标。
命令行方式
我们也可以利用命令行来完成挖掘任务,在“Simlpe CLI”模块中输入如下格式的命令:
java weka.associations.Apriori options -t directory-path"bank-data-final.arff
即可完成Apriori算法。注意,“-t”参数后的文件路径中不能含有空格。
在前面我们使用的option为
-N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 命令行中使用这些参数得到的结果和前面利用GUI得到的一样。
我们还可以加上“- I”参数,得到不同项数的频繁项集。我用的命令如下:
java weka.associations.Apriori -N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -I -t d:"weka"bank-data-final.arff
挖掘结果在上方显示,应是这个文件 的样子。
加载全部内容
FinalShell(SSH客户端Windows)v2018 免费版34.4M8人在玩finalshell是一款非常强大的网络服务管理器。finalshell不仅支持登录SSH和Windows远程桌面,还可以为开发、运维人员提供多种实用功能,让你轻松管理服务器,维护日常工作。
下载BBwebsocketv2018 绿色版1.3M5人在玩BBwebsocket是一款pc端websocket/ws/wss协议调试工具,可以帮助用户调试服务器,确保服务器的正常运行。BBwebsocket软件界面简洁,使用方便,用需要的用户欢迎下载体验!
下载吃鸡服务器状态查询V1.4 绿色版377KB5人在玩吃鸡服务器状态查询是一款针对吃鸡游戏服务器检测显示最新状态工具,通过这款工具可以帮助玩家检测游戏老是掉线的原因,使用起来真的十分方便,有需要的朋友可以下载体验一下。
下载SqlDbxv2018 中文版1M3人在玩sqldbx使用教程,sqldbx连接oracle。SqlDbx是一个多功能的SQL数据库管理,编辑,查询工具,SqlDbx支持多种数据源查询编辑,是一款功能强大的数据库编辑查询工具。
下载小鸟云管家v1.0.1.20 官方最新版87.4M2人在玩小鸟云管家,一款非常便捷的服务器管理工具。软件为用户提供服务器站点管理、资源监控、服务器优化、数据库管理、环境管理等多种功能,使用非常方便!
下载护卫神主机大师v4.1.0 官方版117.0M2人在玩护卫神主机大师让你的管理服务器更轻松,它支持用主机系统开设网站,支持开设的网站使用独立权限,支持多版本PHP等,为你的网站301重定向。
下载Aloof RDP Server远程共享服务器v8.8 官方版21.9M1人在玩AloofRDPServer软件是一款非常好用的远程共享服务器,这款软件功能非常强大,能够让多个用户同时登陆服务器,服务器上传文件速度快,安全性高,欢迎各位感兴趣的朋友们下载使用这款软件。
下载hfs网络文件服务器v2018 绿色版855KB1人在玩fs网络文件服务器是专为个人用户所设计的HTTP档案系统,如果您觉得架设FTPServer太麻烦,那么这个软件可以提供您更方便的网络文件传输系统,下载后无须安装,只要解压缩后执行即可。
下载AppServ正式版v8.0.0 最新版87.2M0人在玩AppServ一键包64位最新版是一款运行在windows系统上的Web服务器环境,包含最新版本的Apache、PHP、PHP7、MySQL、phpMyAdmin等组件。还支持TSL和SSL,十分强大!
下载iis6.0下载14.8M0人在玩微软WindowsServer2003中的IIS6.0下载为用户提供了集成的、可靠的、可扩展的、安全的及可管理的内联网、外联网和互联网Web服务器解决方案。IIS6.0经过改善的结构可以完全满足全球客户的需求。这篇文章介绍了WindowsServer2003中IIS下载6.0给用户带来的益处、
下载