我需要在weka中使用SVM来过滤使用Java的文档
我是一个绝对的初学者。 从未使用Java在Weka中创建分类器或任何内容我之前使用过该接口。 基本上我有点失落我已经看过weka的过滤器类并且稍微玩了一下。 我的文件是文本文件,我需要将它们分成两类。
我不知道如何定义类别或如何将文档加载到IDE中进行分类
:-(
任何帮助/教程或指针将不胜感激。
我发现这个java教程非常有帮助,虽然有很少的在线资源(我发现)
http://www.cs.waikato.ac.nz/ml/weka/index_documentation.html
希望这可以帮助
第一次使用weka是一种痛苦,但你需要经历它。
另外,我尝试了weka,但由于JVM内存异常,我必须转储它。 我使用Ruby编写了自己的小集群算法,性能表现更好。
无论如何,下面是如何在WEKA中使用SVM:
您可以按照本教程中关于如何在weka中使用SVM:www.stat.nctu.edu.tw/~misg/WekaInC.ppt
现在,您将需要ARFF格式的数据(并且我建议您使用这个数据,因为根据我的经验,这有助于提高WEKA的数据结构)。 所以,你可以使用我自己写的XML2ARFF-Converter。 您可以修改它以读取文本文件并将您的文本文件转换为ARFF。
上一篇: I need to make a SVM in weka to filter documents using Java