Rl

stable-baselines3

bởi K-Dense-AI

Hướng dẫn skill stable-baselines3 cho quy trình Machine Learning: huấn luyện tác tử RL, kết nối môi trường Gymnasium, và chọn PPO, SAC, DQN, TD3, DDPG hoặc A2C với ít phải đoán mò hơn. Phù hợp nhất cho reinforcement learning một tác tử tiêu chuẩn, tạo mẫu nhanh và sử dụng stable-baselines3 thực tế.

Machine Learning

Yêu thích 0GitHub 0

pufferlib

bởi K-Dense-AI

pufferlib là một skill học tăng cường hiệu năng cao, hỗ trợ mô phỏng song song nhanh, rollout vector hóa và huấn luyện đa tác tử. Hãy dùng hướng dẫn pufferlib này để cài đặt, nắm cách sử dụng pufferlib và điều chỉnh các pipeline RL với Gymnasium, PettingZoo, Atari, Procgen hoặc các môi trường kiểu NetHack. Phù hợp cho tạo mã tập trung vào thông lượng và các quy trình PPO có khả năng mở rộng.

Code Generation

Yêu thích 0GitHub 0

Rl

Rl skills and workflows surfaced by the site skill importer.