Trl

Trl taxonomy generated by the site skill importer.

1 个技能

huggingface-llm-trainer

作者 huggingface

huggingface-llm-trainer 可帮助你在 Hugging Face Jobs 上使用 TRL 或 Unsloth 训练或微调语言模型和视觉模型。这个 huggingface-llm-trainer 技能适用于 SFT、DPO、GRPO、奖励模型训练、数据集检查、GPU 选择、Hub 保存、Trackio 监控，以及面向后端开发工作流的 GGUF 导出。

后端开发

收藏 0GitHub 10.4k

Trl