por huggingface
huggingface-local-models ajuda você a encontrar modelos do Hugging Face que rodam localmente com llama.cpp e GGUF, escolher uma quantização prática e iniciar em CPU, Apple Metal, CUDA ou ROCm. O guia cobre descoberta de modelos, localização exata do arquivo GGUF, configuração para server ou CLI e um caminho rápido para desenvolvimento de backend e inferência local privada.
