weka集成到web系统_最理想的JAVA报表工具有哪些

Ⅰ 国内有哪些数据分析和数据挖掘的软件

数据挖掘工作现在很多都是写脚本代码进行的，像r，python，工具的话商用就是IBM的SPSS Modeler，就是以前的Clementine, 还有SAS，matlab，这些都是超贵的，excel也有数据挖掘插件。开源的也很多，像RapidMiner，Knime,Weka,Orange这些都是知名的开源数据挖掘工具。其实现在很多BI产商也出了数据挖掘工具，基于web的，还支持分布式计算，操作封装的更容易操作，而且还能定制算法，服务更好，这都是国产产商的优势，像亿信华辰的豌豆DM，思迈特的Smartbi Mining，另外还有些厂商叫什么AI挖掘，那就是营销了，蹭AI的热度，实际还是数据挖掘的理论

Ⅱ 最理想的JAVA报表工具有哪些

看你需求了，如果是简单的PDF，自己用iText自己写就行了，如果是复杂的，可以使用iReport，我前公司就用这个，用了2年了，简单容易上手，文档也全。

Ⅲ 用web 怎么开发一个weka系统

从你的提问感觉你是一个新手。
如果你是学生想根据语言找一份工作可以长期发展，我建议你选择php。java的内容相对于php比较庞杂，如果不是去培训学校进行实际的开发培训，自己学习想达到能找工作的水平，还是需要你自己有一定的学习能力的。而p

Ⅳ 数据挖掘从入门到进阶要看什么书

数据挖掘从入门到进阶要看什么书
做数据挖掘也有些年头了，写这篇文一方面是让我写篇文，朋友作为数据挖掘方面的参考，另一方面也是有抛砖引玉之意，希望能够和一些大牛交流，相互促进，让大家见笑了。
Q&A：
Q:学习,最近在看集体智慧编程,楼主可否推荐下数学基础的书?
A:我数学本身也不好自己也在偷偷补因为看的不多也不能给出个提纲式的建议只能给您列下我近期看过和在看的觉得不错的书您看做参考吧
矩阵方面 Kaare Brandt Petersen的《The Matrix Cookbook》网易公开课中的《麻省理工公开课：线性代数》
2.概率论与数理统计方面 JohnA.Rice 的《数理统计与数据分析》《统计建模与R软件》
3.微积分方面网易公开课中的《麻省理工学院公开课：单变量微积分》
其实您只要有了
1、概率论与数理统计以及其他统计学基础
2、扎实的线性代数功底
3、微积分（如果能学习下实变函数和泛函分析就更好了）
这几方面的基础基本上机器学习的大部分算法您都具有了其数学基础
如果您觉得我说的太泛可以先看看《模式分类》这本书的附录中的数学基础这样您就大体有个印象了
入门：
数据挖掘入门的书籍，中文的大体有这些：
Jiawei Han的《数据挖掘概念与技术》
Ian H. Witten / Eibe Frank的《数据挖掘实用机器学习技术》
Tom Mitchell的《机器学习》
TOBY SEGARAN的《集体智慧编程》
Anand Rajaraman的《大数据》
Pang-Ning Tan的《数据挖掘导论》
Matthew A. Russell的《社交网站的数据挖掘与分析》
很多人的第一本数据挖掘书都是Jiawei Han的《数据挖掘概念与技术》，这本书也是我们组老板推荐的入门书（我个人觉得他之所以推荐是因为Han是他的老师）。其实我个人来说并不是很推荐把这本书。这本书什么都讲了，甚至很多书少有涉及的一些点比如OLAP的方面都有涉猎。但是其实这本书对于初学者不是那么友好的，给人一种教科书的感觉，如果你有大毅力读完这本书，也只能获得一些零碎的概念的认识，很难上手实际的项目。
我个人推荐的入门书是这两本：TOBY SEGARAN的《集体智慧编程》和Ian H. Witten / Eibe Frank的《数据挖掘实用机器学习技术》
《集体智慧编程》很适合希望了解数据挖掘技术的程序员，这本书讲述了数据挖掘里面的很多实用的算法，而且最重要的是其讲述的方式不是像Han那种大牛掉书袋的讲法，而是从实际的例子入手，辅以python的代码，让你很快的就能理解到这种算法能够应用在哪个实际问题上，并且还能自己上手写写代码。唯一的缺点是不够深入，基本没有数学推导，而且不够全面，内容不够翔实。不过作为一本入门书这些缺点反而是帮助理解和入门的优点。
推荐的另一本《数据挖掘实用机器学习技术》则相对上一本书要稍微难一点，不过在容易理解的程度上依然甩Han老师的书几条街，其作者就是着名的Weka的编写者。整本书的思想脉络也是尽可能的由易到难，从简单的模型入手扩展到现实生活中实际的算法问题，最难能可贵的是书的最后还稍微讲了下如何使用weka，这样大家就能在学习算法之余能够用weka做做小的实验，有直观的认识。
看完上述两本书后，我觉得大体数据挖掘就算有个初步的了解了。往后再怎么继续入门，就看个人需求了。
如果是只是想要稍微了解下相关的技术，或者作为业余爱好，则可随便再看看Anand Rajaraman的《大数据》以及Matthew A. Russell的《社交网站的数据挖掘与分析》。前者是斯坦福的”Web挖掘”这门课程的材料基础上总结而成。选取了很多数据挖掘里的小点作为展开的，不够系统，但讲的挺好，所以适合有个初步的了解后再看。后者则亦是如此，要注意的是里面很多api因为GFS的缘故不能直接实验，也是个遗憾
如果是继续相关的研究学习，我认为则还需要先过一遍Tom Mitchell的《机器学习》。这本书可以看做是对于十多年前的机器学习的一个综述，作者简单明了的讲述了很多流行的算法（十年前的），并且对于各个算法的适用点和特点都有详细的解说，轻快地在一本薄薄的小书里给了大家一个机器学习之旅。
进阶：
进阶这个话题就难说了，毕竟大家对于进阶的理解各有不同，是个仁者见仁的问题。就我个人来说，则建议如下展开：
视频学习方面：
可以看看斯坦福的《机器学习》这门课程的视频，最近听说网易公开课已经全部翻译了，而且给出了双语字幕，更加容易学习了^_^
书籍学习方面：
我个人推荐的是这样：可以先看看李航的《统计学习方法》，这本书着重于数学推导，能让我们很快的对于一些算法的理解更加深入。有了上面这本书的基础，就可以开始啃一些经典名着了。
这些名着看的顺序可以不分先后，也可以同时学习：
Richard O. Duda的《模式分类》这本书是力荐，很多高校的数据挖掘导论课程的教科书便是这本（也是我的数据挖掘入门书，很有感情的）。如果你不通读这本书，你会发现在你研究很多问题的时候，甚至一些相对简单的问题（比如贝叶斯在高斯假设下为什么退化成线性分类器）都要再重新回头读这本书。
Christopher M. Bishop的《Pattern Recognition And Machine Learning》这本书也是经典巨着，整本书写的非常清爽。
The Elements of Statistical Learning》这本书豆友有句很好的吐槽“机器学习 — 从入门到精通”可以作为这本书的副标题。可以看出这本书对于机器学习进阶的重要性。值得一说的是这本书虽然有中文版，但是翻译之烂也甚是有名，听说是学体育的翻译的。
Hoppner, Frank的《Guide to Intelligent Data Analysis》这本书相对于上面基本经典巨着并不出名，但是写的甚好，是knime官网上推荐的，标榜的是解决实际生活中的数据挖掘问题，讲述了CRISP-DM标准化流程，每章后面给出了R和knime的应用例子。
项目方面：
事实上，我觉得从进阶起就应该上手一些简单的项目了。如果不实践只是看书和研究算法，我觉得是无法真正理解数据挖掘的精髓所在的。打个简单的比方，就算你看完了C Primer、effective C 等等书籍，如果自己不写C ，那么自己也就会停留在hello world的级别。实践出真知非常切合数据挖掘这门学科，实际上手项目后才会发现什么叫”80%的准备，20%的建模”，real world的问题我认为并不是仅仅靠modeling就能很好的解决的。详细的可以看看《Guide to Intelligent Data Analysis》就能略知一二。如果上手做推荐或者一些简单的项目，也可以考虑用用mahout，推荐的入门手册是《mahout in action》。项目问题说来话长，有时间会以CRISP流程为引单独作文，这里也就不详谈了。
软件方面：
我常用而且推荐的软件有如下，这里只是简单的列出，以后有时间再详细分析和写出入门：
Weka Java的软件，可以集成到自己的项目中
Orange 一个用python写的数据挖掘开源软件，界面做的很漂亮，可以做图形化实验，也可以用python调用编程。
Knime 和Orange类似，特点是可以集成weka和R等开源软件
SAS的EM模块以及R 还有最最经典的matlab大大
这里有篇文有简要的介绍http://www.oschina.net/question/12_14026
再往后：
再往后的其实就是我就是觉得是学数学了，然后就是深入读一些你感兴趣的topic的书籍和paper，接项目，做项目了。发展有数据分析师或者去专门的企业做数据研究员，当然混学术界的我就不清楚了。
初略写完发现成一篇长文了，最近也是在做一个用眼底照片预测stroke的项目，比较忙，等闲下来以后也会写些算法或者软件或者实际项目的心得的文。当然也只是我个人粗浅的想法，也希望能和大家有所交流，相互促进，我个人的邮箱是[email protected]，有什么问题可以再帖子里讨论，也可邮件交流^_^

Ⅳ 数据挖掘实用机器学习工具与技术怎么样

大数据时代应用机器学习方法解决数据挖掘问题的实用指南。
洞察隐匿于大数据中的结构模式，有效指导数据挖掘实践和商业应用。
weka系统的主要开发者将丰富的研发、商业应用和教学实践的经验和技术融会贯通。
广泛覆盖在数据挖掘实践中采用的算法和机器学习技术，着眼于解决实际问题
避免过分要求理论基础和数学知识，重点在于告诉读者“如何去做”，同时包括许多算法、代码以及具体实例的实现。
将所有的概念都建立在具体实例的基础之上，促使读者首先考虑使用简单的技术。如果简单的技术不足以解决问题，再考虑提升到更为复杂的高级技术。
新版增加了大量近年来最新涌现的数据挖掘算法和诸如Web数据挖掘等新领域的介绍，所介绍的weka系统增加了50%的算法及大量新内容。

Ⅵ Weka研究有什么用途

weka是数据挖掘的平台之一，weka中集成了很多算法，主要用于数据挖掘方面，例如人脸识别，文本识别以及基因工程等等。算法不同，效果不同，这就要仔细研究了。

Ⅶ 数据挖掘常用的软件有哪些

1、Rapid Miner

Rapid Miner是一个数据科学软件平台，为数据准备、机器学习、深度学习、文本挖掘和预测分析提供一种集成环境。它是领先的数据挖掘开源系统之一。该程序完全用Java编程语言编写。该程序提供了一个选项，以便用户试用大量可任意嵌套的操作符，这些操作符在XML文件中有详细说明，可由Rapid Miner的图形用户界面来构建。

2、Orange

Orange是一个开源数据可视化、机器学习和数据挖掘工具包。它有一个可视化编程前端，可用于探索性数据分析和交互式数据可视化。Orange是一个基于组件的可视化编程软件包，用于数据可视化、机器学习、数据挖掘和数据分析。Orange组件称为窗口组件，范围广泛：从简单的数据可视化、子集选择和预处理，到学习算法和预测建模的评估，不一而足。Orange的可视化编程通过界面来进行，其中工作流程通过连接预定义或用户设计的窗口组件来创建，而高级用户可以将Orange用作Python库，以便操纵数据和更改窗口组件。

3、Kaggle

Kaggle是世界上数据科学家和机器学习者社区。Kaggle以开设机器学习竞赛起家，但现在逐渐变成基于公共云的数据科学平台。Kaggle是一个平台，有助于解决难题、招募强大的团队并宣传数据科学的力量。

4、Weka

怀卡托知识分析环境(Weka)是新西兰怀卡托大学开发的一套机器学习软件。该软件用Java编写。它含有一系列面向数据分析和预测建模的可视化工具和算法，附带图形用户界面。Weka支持几种标准数据挖掘任务，更具体地说是指数据预处理、聚类、分类、回归、可视化和特征选择。

关于数据挖掘常用的软件有哪些，青藤小编就和您分享到这里了。如果你对大数据工程有浓厚的兴趣，希望这篇文章能够对你有所帮助。如果您还想了解更多数据分析师、大数据工程师的技巧及素材等内容，可以点击本站的其他文章进行学习。

weka集成到web系统

与weka集成到web系统相关的内容