强化学习

由站点技能导入器展示的强化学习技能与工作流。

2 个技能
K
stable-baselines3

作者 K-Dense-AI

面向机器学习工作流的 stable-baselines3 技能指南:训练 RL 智能体、对接 Gymnasium 环境,并更有把握地选择 PPO、SAC、DQN、TD3、DDPG 或 A2C。适合标准单智能体强化学习、快速原型验证,以及实用的 stable-baselines3 用法。

机器学习
收藏 0GitHub 0
K
pufferlib

作者 K-Dense-AI

pufferlib 是一款高性能强化学习技能,适用于快速并行仿真、向量化 rollout 和多智能体训练。可通过本 pufferlib 指南完成安装、理解 pufferlib 的用法,并将 RL 流水线适配到 Gymnasium、PettingZoo、Atari、Procgen 或 NetHack 风格环境中。适合面向吞吐量优化和可扩展 PPO 工作流的代码生成。

代码生成
收藏 0GitHub 0
强化学习