Gymnasium

Gymnasium skills and workflows surfaced by the site skill importer.

2 skills

stable-baselines3

por K-Dense-AI

Guia da skill stable-baselines3 para fluxos de trabalho de Machine Learning: treine agentes de RL, conecte ambientes Gymnasium e escolha entre PPO, SAC, DQN, TD3, DDPG ou A2C com menos suposições. É ideal para reinforcement learning padrão de agente único, prototipação rápida e uso prático do stable-baselines3.

Machine Learning

Favoritos 0GitHub 0

pufferlib

por K-Dense-AI

pufferlib é uma skill de reinforcement learning de alto desempenho para simulação paralela rápida, rollouts vetorizados e treinamento multiagente. Use este guia do pufferlib para instalar, entender o uso do pufferlib e adaptar pipelines de RL com ambientes Gymnasium, PettingZoo, Atari, Procgen ou no estilo NetHack. Ideal para geração de código focada em throughput e workflows escaláveis de PPO.

Code Generation

Favoritos 0GitHub 0