HackerNews中文版

强化学习很有趣，但构建强化学习的流程并不有趣。我们让强化学习重新变得有趣。

查看原文

https://maxreward.vercel.app/<p>Reinforcement Learning is fun, but building the RL pipeline is not fun. We bring the fun back in RL.

端到端强化学习后训练