用于矢量数据的限制玻尔兹曼机的替代方案(而不是二进制)

我有一个非常大的语料库,每个元素都由大量的高维数据组成。 元素不断被添加到语料库中。 潜在地,每个交互只需要考虑一部分语料库。 元素被标记,可能具有与这些标签的强度相关联的多个标签和权重。 据我所知,数据并不稀少。

输入数据是大约(10-1000)个输入之间范围为-1 ... 1的一组参数。 这取决于什么机器学习方法是最合适的,这可能有些灵活。

我瞄准高端智能手机设备。 理想情况下,处理可以在同一台设备上完成,但我愿意将其传输到适中的服务器。

对于这种情况,什么是适当的机器学习方法?

我一直在读随机forrest决策树,限制玻尔兹曼机器,深度学习玻尔兹曼机器等,但我可以真正使用经验丰富的手的建议,指导我采取几种方法进行研究,这将有效地提供条件。

如果我的描述看起来不可靠,请让我知道,因为我仍然在认真思考这些想法,并可能从根本上误解某些方面。


尝试使用最简单的k-最近邻居算法。 您可以使用曼哈顿距离功能来实现快速距离功能。 然后,您可以根据最近的点数选择加权平均或多数课程。

这也与内核回归类似。 我会建议使用数据结构(如kd树)来有效地存储您的点。

链接地址: http://www.djcxy.com/p/68603.html

上一篇: Alternatives to Restricted Boltzmann Machine for vector data (instead of binary)

下一篇: ComboBox Event Triggered for the Change