在weka中看不到名义值
我有一个数据集,其中包含一些名义值作为特征。 我的训练集具有一套在我的测试集中不存在的名义特征的值。 例如我的训练集中的特征对应于
@attribute h4 {br,pl,com,ro,th,np}
和测试集中的相同功能
@attribute h4 {br,pl,abc,th,def,ghi,lmno}
我相信正因为如此,weka不允许我重新评估我在我的测试集上的训练集上建立的模型。 有没有解决的办法? 我错过了什么吗?
编辑:我使用的是RandomForest分类器。
谢谢
Weka寻求测试集中使用的所有名义值也存在于训练集中,因为分类器在进行预测之前应该学习。
Weka也使用名义值和它们的指数; 因此,对同一属性的名义值使用相同的顺序以获得可靠的结果很重要。
在你的情况下,只需对训练集和测试集使用相同的值(即涵盖所有值)。
您的组合值{br,pl,com,ro,th,np,abc,th,def,ghi,lmno}
可用于训练集和测试集。