Trl

Trl taxonomy generated by the site skill importer.

1 skills

huggingface-llm-trainer

por huggingface

huggingface-llm-trainer te ayuda a entrenar o ajustar modelos de lenguaje y visión en Hugging Face Jobs con TRL o Unsloth. Usa esta skill de huggingface-llm-trainer para SFT, DPO, GRPO, modelado de recompensas, comprobación de datasets, selección de GPU, guardado en Hub, monitorización con Trackio y exportación a GGUF para flujos de trabajo de desarrollo backend.

Backend Development

Favoritos 0GitHub 10.4k

Trl