H
huggingface-llm-trainer
por huggingface
huggingface-llm-trainer ajuda você a treinar ou fazer fine-tuning de modelos de linguagem e visão no Hugging Face Jobs com TRL ou Unsloth. Use esta skill huggingface-llm-trainer para SFT, DPO, GRPO, reward modeling, validação de datasets, escolha de GPU, salvamento no Hub, monitoramento com Trackio e exportação para GGUF em fluxos de trabalho de desenvolvimento de backend.
Backend Development
Favoritos 0GitHub 10.4k
