- class mindspore_rl.utils.VanillaFunc(env)[源代码]
这是Vanilla MCTS的自定义传入算法。每个动作的先验概率是一个均匀分布。simulation中会进行随机选择动作从而获得结果。
- 参数:
env (Environment) - 传入的环境
样例:
>>> env = TicTacToeEnvironment(None) >>> vanilla_func = VanillaFunc(env)
这是Vanilla MCTS的自定义传入算法。每个动作的先验概率是一个均匀分布。simulation中会进行随机选择动作从而获得结果。
env (Environment) - 传入的环境
样例:
>>> env = TicTacToeEnvironment(None)
>>> vanilla_func = VanillaFunc(env)