Rl

Rl skills and workflows surfaced by the site skill importer.

2 skills

stable-baselines3

por K-Dense-AI

Guía de stable-baselines3 para flujos de trabajo de Machine Learning: entrena agentes de RL, conecta entornos Gymnasium y elige PPO, SAC, DQN, TD3, DDPG o A2C con menos incertidumbre. Es ideal para aprendizaje por refuerzo estándar de agente único, prototipado rápido y un uso práctico de stable-baselines3.

Machine Learning

Favoritos 0GitHub 0

pufferlib

por K-Dense-AI

pufferlib es una skill de aprendizaje por refuerzo de alto rendimiento para simulación paralela rápida, rollouts vectorizados y entrenamiento multiagente. Usa esta guía de pufferlib para instalarlo, entender cómo se utiliza pufferlib y adaptar pipelines de RL con Gymnasium, PettingZoo, Atari, Procgen o entornos al estilo NetHack. Ideal para generación de código centrada en alto rendimiento y flujos de PPO escalables.

Code Generation

Favoritos 0GitHub 0