强化学习

由站点技能导入器展示的强化学习技能与工作流。

2 個技能

stable-baselines3

作者 K-Dense-AI

這份 stable-baselines3 技能指南適用於機器學習工作流程：訓練 RL agent、串接 Gymnasium 環境，並在 PPO、SAC、DQN、TD3、DDPG 或 A2C 之間更有把握地做選擇。最適合標準的單一 agent 強化學習、快速原型開發，以及實際的 stable-baselines3 使用情境。

Machine Learning

收藏 0GitHub 0

pufferlib

作者 K-Dense-AI

pufferlib 是一套高效能強化學習技能，適合快速平行模擬、向量化 rollout 與多智能體訓練。這份 pufferlib 指南可協助你安裝、理解 pufferlib 的用法，並將 RL 流程延伸到 Gymnasium、PettingZoo、Atari、Procgen 或 NetHack 風格環境。特別適合著重吞吐量與可擴充 PPO 工作流程的程式生成需求。

程式碼生成

收藏 0GitHub 0