MindSpore Reinforcement Release Notes

Reinforcement 0.6.0-alpha Release Notes

[BETA] 支持GAIL(Generative Adversarial Imitation Learning Jonathan Ho et al..2016) 算法。算法解决了HalfCheetah环境问题，支持GPU后端设备。
[BETA] 支持C51(Marc G. Bellemare et al..2017) 算法。算法解决了CartPole环境问题，支持CPU后端设备。
[BETA] 支持CQL(Conservative Q-Learning Aviral Kumar et al..2019) 算法。算法解决了Hopper环境问题，支持CPU和GPU后端设备。
[BETA] 支持AWAC(Accelerating Online Reinforcement Learning with Offline Datasets Ashvin Nair et al..2020) 算法。算法解决了Ant环境问题，支持CPU和GPU后端设备。
[BETA] 支持Dreamer(Danijar Hafner et al..2020) 算法。算法解决了Walker-walk环境问题，支持GPU后端设备。

感谢以下人员做出的贡献:

Pro. Peter, Huanzhou Zhu, Bo Zhao, Gang Chen, Weifeng Chen, Liang Shi, Yijie Chen.

欢迎以任何形式对项目提供贡献！