Trl

huggingface-llm-trainer

作成者 huggingface

huggingface-llm-trainer は、Hugging Face Jobs 上で TRL または Unsloth を使い、言語モデルや視覚モデルを学習・ファインチューニングするのに役立ちます。この huggingface-llm-trainer スキルは、SFT、DPO、GRPO、reward modeling、データセット検証、GPU 選定、Hub への保存、Trackio 監視、さらにバックエンド開発ワークフロー向けの GGUF 書き出しまでカバーします。

Backend Development

お気に入り 0GitHub 10.4k

Trl

Trl taxonomy generated by the site skill importer.