强化学习

由站点技能导入器展示的强化学习技能与工作流。

2 个技能

stable-baselines3

作者 K-Dense-AI

面向机器学习工作流的 stable-baselines3 技能指南：训练 RL 智能体、对接 Gymnasium 环境，并更有把握地选择 PPO、SAC、DQN、TD3、DDPG 或 A2C。适合标准单智能体强化学习、快速原型验证，以及实用的 stable-baselines3 用法。

机器学习

收藏 0GitHub 0

pufferlib

作者 K-Dense-AI

pufferlib 是一款高性能强化学习技能，适用于快速并行仿真、向量化 rollout 和多智能体训练。可通过本 pufferlib 指南完成安装、理解 pufferlib 的用法，并将 RL 流水线适配到 Gymnasium、PettingZoo、Atari、Procgen 或 NetHack 风格环境中。适合面向吞吐量优化和可扩展 PPO 工作流的代码生成。

代码生成

收藏 0GitHub 0