H
huggingface-llm-trainer
作者 huggingface
huggingface-llm-trainer 可協助你在 Hugging Face Jobs 上使用 TRL 或 Unsloth 訓練或微調語言與視覺模型。這個 huggingface-llm-trainer 技能適用於 SFT、DPO、GRPO、reward modeling、資料集檢查、GPU 選擇、Hub 儲存、Trackio 監控,以及供後端開發流程使用的 GGUF 匯出。
後端开发
收藏 0GitHub 10.4k
