我需要在weka中使用SVM来过滤使用Java的文档

2018-06-18 01:00:14

我是一个绝对的初学者。从未使用Java在Weka中创建分类器或任何内容我之前使用过该接口。基本上我有点失落我已经看过weka的过滤器类并且稍微玩了一下。我的文件是文本文件，我需要将它们分成两类。

我不知道如何定义类别或如何将文档加载到IDE中进行分类

:-(

任何帮助/教程或指针将不胜感激。

我发现这个java教程非常有帮助，虽然有很少的在线资源（我发现）

http://www.cs.waikato.ac.nz/ml/weka/index_documentation.html

希望这可以帮助

第一次使用weka是一种痛苦，但你需要经历它。

另外，我尝试了weka，但由于JVM内存异常，我必须转储它。我使用Ruby编写了自己的小集群算法，性能表现更好。

无论如何，下面是如何在WEKA中使用SVM：

您可以按照本教程中关于如何在weka中使用SVM：www.stat.nctu.edu.tw/~misg/WekaInC.ppt

现在，您将需要ARFF格式的数据（并且我建议您使用这个数据，因为根据我的经验，这有助于提高WEKA的数据结构）。所以，你可以使用我自己写的XML2ARFF-Converter。您可以修改它以读取文本文件并将您的文本文件转换为ARFF。

链接地址: http://www.djcxy.com/p/50915.html