Trl

Trl taxonomy generated by the site skill importer.

1 skills

huggingface-llm-trainer

por huggingface

huggingface-llm-trainer ajuda você a treinar ou fazer fine-tuning de modelos de linguagem e visão no Hugging Face Jobs com TRL ou Unsloth. Use esta skill huggingface-llm-trainer para SFT, DPO, GRPO, reward modeling, validação de datasets, escolha de GPU, salvamento no Hub, monitoramento com Trackio e exportação para GGUF em fluxos de trabalho de desenvolvimento de backend.

Backend Development

Favoritos 0GitHub 10.4k

Trl