K
stable-baselines3
作者 K-Dense-AI
這份 stable-baselines3 技能指南適用於機器學習工作流程:訓練 RL agent、串接 Gymnasium 環境,並在 PPO、SAC、DQN、TD3、DDPG 或 A2C 之間更有把握地做選擇。最適合標準的單一 agent 強化學習、快速原型開發,以及實際的 stable-baselines3 使用情境。
Machine Learning
收藏 0GitHub 0
作者 K-Dense-AI
這份 stable-baselines3 技能指南適用於機器學習工作流程:訓練 RL agent、串接 Gymnasium 環境,並在 PPO、SAC、DQN、TD3、DDPG 或 A2C 之間更有把握地做選擇。最適合標準的單一 agent 強化學習、快速原型開發,以及實際的 stable-baselines3 使用情境。
作者 K-Dense-AI
pufferlib 是一套高效能強化學習技能,適合快速平行模擬、向量化 rollout 與多智能體訓練。這份 pufferlib 指南可協助你安裝、理解 pufferlib 的用法,並將 RL 流程延伸到 Gymnasium、PettingZoo、Atari、Procgen 或 NetHack 風格環境。特別適合著重吞吐量與可擴充 PPO 工作流程的程式生成需求。