具有健身评分的机器学习算法

我不确定这是用于StackOverflow还是程序员,但是因为它更倾向于实现,所以我在这里问。

我正在寻找一种算法,可以使用n输入(所有浮点数)并生成m (所有浮点数; m < n )个输出。 然后可以使用某种健身评分来训练该系统,以了解输入与输出之间的相关性。

什么是最好的算法用于这样的目的?


一点上下文:我想使用机器学习,而不是自发布的算法,因为我不知道数据之间的(完全)相关性,我知道机器学习算法的结果是否会有好处并从那里训练。

我有几个变量需要传入:

  • 只有我知道的信息(自信0-1
  • 关于所有人都知道的关于我的信息(资源和以前的成绩0-1
  • 我正在查看的人员的风险状况(分别基于其他参与者0-1
  • 我正在查看的人的行为特征(分别基于其他玩家0-1
  • 我正在查看的玩家的资源(分别为0-1
  • 玩家总数(基于0-1最大玩家数)
  • 预测结果(偏差0-1
  • 输出应该是:

  • 采取行动(从“无所事事”到“尽快行动” 0-1
  • 要采取的行动量(从“不是很多”到“你能做的最多” 0-1
  • 我有非常大的数据集可以处理,所以理想的算法建议也可以持久化。


    我已经看到像人工神经网络这样的算法,但是这些算法不允许进行健身评分,因为它们需要将输入和输出耦合在一起。 我不能说,我只能计算这些数字是正确的机会(健身评分 - 从未设计过>= 1


    从描述来看,它看起来像一个强化学习的经典问题,其中你确实有一些特工执行动作(这里定义为动作+力量,但这仍然是一个动作),它改变了特工的一些内部状态并获得至少)奖励。

    有许多方法可以从您的环境中学习一项好的策略(规则选择特定操作),包括(但不限于):

  • Q学习
  • MDP(马尔可夫决策过程)
  • 蒙特卡罗方法
  • 链接地址: http://www.djcxy.com/p/36859.html

    上一篇: Machine learning algorithm with fitness score

    下一篇: Algorithm to "learn" from user input