por huggingface
huggingface-local-models te ayuda a encontrar modelos de Hugging Face que se ejecutan en local con llama.cpp y GGUF, elegir una cuantización práctica y ponerlos en marcha en CPU, Apple Metal, CUDA o ROCm. Cubre la खोज de modelos, la localización exacta del archivo GGUF, la configuración de servidor frente a CLI y una vía rápida para desarrollo de backend e inferencia local privada.
