Hhuggingface-llm-trainer作者 huggingfacehuggingface-llm-trainer 可帮助你在 Hugging Face Jobs 上使用 TRL 或 Unsloth 训练或微调语言模型和视觉模型。这个 huggingface-llm-trainer 技能适用于 SFT、DPO、GRPO、奖励模型训练、数据集检查、GPU 选择、Hub 保存、Trackio 监控,以及面向后端开发工作流的 GGUF 导出。后端开发收藏 0GitHub 10.4k