Minimax算法井字中间状态

我一直在尝试理解在游戏的井字游戏的中间状态下运行minimax算法。 但我无法这样做。 我明白min max算法会在每一步中为玩家返回最佳状态。 如果国家是这样的

在游戏的最后阶段,更容易理解的是,导致玩家获得优势或最大分数的状态是最佳配置。 在这个例子中,我们可以看到叶子上得分'1'的状态是最好的状态。 但是在中间阶段或游戏开始时会发生什么。

国家在开始或中间状态

假设我们有3个位置开始,或者玩家可以通过玩某个位置来进入这些状态。 而且这些位置进一步导致树下进一步的电路板配置。 来自初始/开始节点的三个分支中的每一个最终将导致在叶节点处由'1'表示的胜利或者在叶节点中由'-1'表示的失败或者在一些情况下由'0'表示的绘制。

minimax算法在这里做什么? minimax将在初始节点之后返回哪个位置或分支?


这里提到的极小极小算法检查移动的极值结果。 对于旨在最大化得分的玩家(在Tic-Tac-Toe的情况下,最大分数为1),移动的值是所有可能结果的最大值,并且该算法旨在最大化移动的值。

同样,对于旨在最小化得分的玩家来说,该算法的目标是选择minimaxl值(Tic-Tac-Toe为-1)。

更正式地说,如果移动会导致终端游戏状态(即移动到达游戏树的一片叶子),则移动的价值是所得到的最终游戏状态的值。 如果移动导致游戏树的内部节点,则取决于游戏树的级别是偶数还是奇数(因为移动将由交替玩家完成)并且是递归定义的; 对于偶数级别,移动的值是连续移动可达到的最小值,对于奇数级别,移动的值是可以达到的连续移动的最大值(反之亦然,取决于级别的确切定义和哪个球员瞄准什么价值)。

更不正式地,最小最大化算法基于以下推理来评估整个游戏树。 要评估一个动作,只需做出动作,并采取对手的位置并进行相同的评估,即对动作进行评估并再次取得对手的位置。 总的来说,这会导致在假设对手也发挥最佳效果的情况下确定最优的移动 - 通过使用最小最大化算法来评估他或她的移动,通过模拟他或她的移动来实现该移动。

链接地址: http://www.djcxy.com/p/56375.html

上一篇: Minimax Algorithm Tic Tac Toe Intermediate State

下一篇: generating game tree