huggingface-local-models

por huggingface

huggingface-local-models te ayuda a encontrar modelos de Hugging Face que se ejecutan en local con llama.cpp y GGUF, elegir una cuantización práctica y ponerlos en marcha en CPU, Apple Metal, CUDA o ROCm. Cubre la खोज de modelos, la localización exacta del archivo GGUF, la configuración de servidor frente a CLI y una vía rápida para desarrollo de backend e inferencia local privada.

Estrellas10.4k

Favoritos0

Comentarios0

Agregado4 may 2026

CategoríaBackend Development

Comando de instalación

npx skills add huggingface/skills --skill huggingface-local-models

Puntuación editorial

Este skill obtiene 82/100, lo que indica que es una opción sólida para el directorio si buscas un flujo de trabajo centrado en encontrar modelos GGUF de Hugging Face y ejecutarlos en local con llama.cpp. El repositorio aporta suficiente detalle operativo para reducir las dudas frente a un prompt genérico, aunque conviene seguir esperando cierto criterio específico por modelo y tener en cuenta que no incluye un comando de instalación.

82/100

Puntos fuertes

Trazado claro del alcance: seleccionar modelos GGUF y lanzarlos con llama.cpp en CPU, Metal, CUDA o ROCm
Orientación operativa sólida con búsqueda basada en URL, confirmación exacta del archivo .gguf, selección de cuantización y comandos directos de llama-cli/llama-server
Las referencias de apoyo sobre aceleración por hardware, descubrimiento en Hub y cuantización reducen la ambigüedad durante la ejecución

Puntos a tener en cuenta

No hay comando de instalación en SKILL.md, así que la adopción sigue dependiendo de que el usuario ya tenga llama.cpp disponible o lo instale aparte
Parte del flujo depende de que el repositorio del modelo ofrezca una recomendación clara para uso local; en casos límite, puede ser necesario recurrir a la selección manual de cuantización o archivo

Huggingface Llama Cpp MCP Cli Local Llm OpenAI

Resumen

Visión general de la skill `huggingface-local-models`

huggingface-local-models te ayuda a encontrar un modelo de Hugging Face que ya funcione con llama.cpp, elegir una cuantización GGUF razonable y ejecutarlo en local en CPU, Apple Metal, CUDA o ROCm. Es especialmente útil cuando necesitas decidir rápido qué modelo local usar, no cuando buscas un listado genérico de modelos.

La mejor opción para preparar inferencia local con `huggingface-local-models`

Usa la skill huggingface-local-models si necesitas convertir una idea de modelo en un comando que realmente se pueda ejecutar, sobre todo en flujos de backend que requieren inferencia local predecible, servicio compatible con OpenAI o ejecución privada/sin conexión.

En qué destaca

La skill se centra en los puntos que suelen bloquear la adopción: encontrar repos GGUF, comprobar los nombres exactos de los archivos, elegir la cuantización adecuada para tu hardware y decidir si conviene usar llama-cli o llama-server.

Cuándo no es la herramienta adecuada

Si necesitas benchmarking de modelos, ingeniería de prompts para una app concreta o una arquitectura completa de despliegue, esta skill se queda corta. Te ayuda a poner en marcha un modelo local de forma limpia; no sustituye el diseño del sistema ni la evaluación.

Cómo usar la skill `huggingface-local-models`

Instala y abre los archivos correctos

Instala la skill huggingface-local-models con:

npx skills add huggingface/skills --skill huggingface-local-models

Después, lee primero SKILL.md y luego references/hub-discovery.md, references/quantization.md y references/hardware.md. Esos archivos contienen las reglas reales de decisión para descubrir modelos, elegir la cuantización y ajustar el arranque según el hardware.

Convierte un objetivo vago en una solicitud útil

El mejor uso de huggingface-local-models empieza con un conjunto concreto de restricciones: familia del modelo, hardware objetivo, límite de memoria y si necesitas CLI o servidor. Un buen input se ve así:

“Encuentra un modelo Qwen de menos de 24B que funcione en un MacBook de 16 GB y dime cuál es la mejor cuantización GGUF.”
“Necesito un endpoint local compatible con OpenAI para un asistente de programación en una sola GPU NVIDIA.”
“Elige un modelo pequeño que vaya bien en CPU y pierda la menor calidad posible.”

Un input débil como “recomiéndame un modelo local” obliga a adivinar y ralentiza la selección.

Sigue el flujo del repositorio, no un prompt genérico

El huggingface-local-models guide es primero URL: busca en Hugging Face con apps=llama.cpp, abre la página del repositorio con ?local-app=llama.cpp, confirma los nombres exactos de los .gguf en la API del árbol y luego arranca con llama-cli -hf <repo>:<QUANT> o llama-server -hf <repo>:<QUANT>. Usa --hf-repo y --hf-file solo cuando la nomenclatura no sea estándar.

Consejos prácticos de arranque que sí importan

Para huggingface-local-models for Backend Development, prioriza la forma de servicio por encima del hype del modelo: usa llama-server cuando necesites una API, verifica el acceso restringido con hf auth login y convierte pesos de Transformers solo si no existe ya un GGUF. El hardware cambia el comando: Metal en Apple Silicon, CUDA en NVIDIA, ROCm en AMD y ajuste por número de núcleos en CPU.

Preguntas frecuentes de la skill `huggingface-local-models`

¿Esto es solo para usuarios de `llama.cpp`?

Sí, principalmente. La skill huggingface-local-models está pensada alrededor de repos GGUF y compatibles con llama.cpp, así que encaja mejor cuando ese runtime ya es tu objetivo o ya lo has elegido.

¿Necesito el CLI de Hugging Face antes de usarla?

No necesariamente para descubrir modelos. Los flujos basados en URL del repositorio te permiten buscar e inspeccionar modelos sin herramientas extra, pero hf auth login se vuelve importante para repos restringidos y algunos flujos con acceso privado.

¿En qué se diferencia de pedirle a un chatbot una sugerencia de modelo?

Un prompt normal puede inventarse o suponer un nombre de modelo; esta skill te ayuda a validar el repositorio real, el archivo, la cuantización y el comando de arranque. Eso reduce el fallo más común: elegir un modelo que parece correcto pero no tiene el artefacto GGUF adecuado o no encaja con tu hardware.

¿`huggingface-local-models` es apta para principiantes?

Sí, si tu objetivo es “ejecutar con éxito un modelo local”. Es menos apta para principiantes si quieres convertir pesos, depurar flags de compilación o ajustar el comportamiento en varias GPU sin leer las páginas de referencia enlazadas.

Cómo mejorar la skill `huggingface-local-models`

Dale a la skill las restricciones que necesita

La mayor mejora de calidad viene de especificar desde el principio el hardware y el objetivo de salida. Incluye RAM o VRAM, sistema operativo y si quieres uso tipo chat, código o servidor. Por ejemplo: “macOS, 16 GB de memoria unificada, quiero el mejor modelo para programación que siga respondiendo con agilidad.”

Prioriza evidencia exacta del repositorio y del archivo

La skill funciona mejor cuando confirmas la recomendación de local-app de Hugging Face y el nombre exacto del archivo .gguf antes de arrancar. Si el repositorio tiene varias cuantizaciones, elige según tu presupuesto de memoria en lugar de asumir por defecto el archivo más pequeño.

Vigila los fallos más comunes

Los errores habituales son elegir una familia de modelo antes de comprobar el hardware, saltarse la verificación del nombre del archivo y usar un comando de servidor cuando primero sería más seguro probar con CLI. Si el rendimiento es malo, ajusta la cuantización, el offload a GPU o el número de hilos antes de concluir que el modelo es malo.

Itera con una segunda pasada más precisa

Después de la primera ejecución, refina la entrada con síntomas concretos: latencia, presión de memoria, caída de calidad o poco uso de GPU. Un buen seguimiento para huggingface-local-models sería: “El mismo modelo, pero necesito menos memoria y mejor calidad de respuesta; dime la siguiente mejor cuantización y el comando de arranque.”

Calificaciones y reseñas

Aún no hay calificaciones

Comparte tu reseña

Inicia sesión para dejar una calificación y un comentario sobre esta skill.

0/10000

Reseñas más recientes

Guardando...

Más skills de esta categoría

wrangler

por cloudflare

La skill wrangler te ayuda a encontrar los comandos de CLI correctos, las estructuras de configuración y los pasos de despliegue para Cloudflare Workers. Úsala para el uso de wrangler, para comprobar la instalación de wrangler y como una guía práctica de wrangler al crear o publicar Workers para Backend Development.

Backend Development

Favoritos 0GitHub 1.3k

clickhouse-best-practices

por ClickHouse

clickhouse-best-practices es una skill de mejores prácticas de ClickHouse para Database Engineering. Orienta el diseño de esquemas, la optimización de consultas, la estrategia de inserción y la conectividad con agentes mediante recomendaciones basadas en reglas, lo que facilita activar, revisar y citar el uso de clickhouse-best-practices en flujos de trabajo de ClickHouse.

Database Engineering

Favoritos 0GitHub 412

clickhouse-architecture-advisor

por ClickHouse

clickhouse-architecture-advisor ayuda a diseñar cargas de trabajo de ClickHouse con decisiones adaptadas al workload sobre ingesta, particionamiento, joins, diccionarios, upserts y preagregación. Es especialmente útil para Backend Development, observabilidad, SIEM, analítica de producto, telemetría IoT y pipelines financieros. La skill clasifica la orientación como official, derived o field.

Backend Development

Favoritos 0GitHub 412

chdb-datastore

por ClickHouse

chdb-datastore es una skill compatible con pandas para realizar análisis de datos rápidos con una DataStore API respaldada por ClickHouse. Admite conectores de archivos, bases de datos y nube, joins entre distintas fuentes y cambios mínimos de código en flujos de trabajo al estilo pandas. Usa esta guía de chdb-datastore cuando busques una capa de análisis lista para usar sobre conjuntos de datos grandes.

Data Analysis

Favoritos 0GitHub 0

mcp-server-patterns

por affaan-m

mcp-server-patterns es una guía práctica para el desarrollo de MCP Server con el SDK de Node/TypeScript. Aprende cuándo usar tools, resources, prompts, validación con Zod y stdio frente a Streamable HTTP, con notas de API actuales para una implementación y depuración más seguras.

MCP Server Development

Favoritos 0GitHub 156.2k

laravel-tdd

por affaan-m

laravel-tdd es una guía de desarrollo guiado por pruebas en Laravel para PHPUnit y Pest. Ayuda a elegir entre pruebas unitarias, de características e integración, además de la estrategia de base de datos, el uso de fakes, los objetivos de cobertura y un flujo de trabajo práctico para automatizar pruebas.

Test Automation

Favoritos 0GitHub 156.2k

django-security

por affaan-m

django-security es una guía práctica para reforzar apps de Django con autenticación, autorización, protección CSRF, prevención de XSS e inyección SQL, cookies seguras y ajustes de producción. Ayuda a desarrolladores y revisores a ejecutar una Security Audit enfocada, detectar rápido configuraciones de riesgo y aplicar correcciones concretas antes del despliegue.

Security Audit

Favoritos 0GitHub 156.1k

uv-package-manager

por wshobson

Usa la skill uv-package-manager para planificar instalaciones, migrar desde pip o Poetry y aplicar flujos de trabajo prácticos con uv en la configuración de proyectos Python, lockfiles, CI, Docker y workspaces.

Project Setup

Favoritos 0GitHub 32.6k

performance-optimization

por addyosmani

La skill performance-optimization te ayuda a medir primero, encontrar el cuello de botella real, corregirlo y verificar los resultados. Úsala cuando existan requisitos de rendimiento, sospeches una regresión o necesites mejorar Core Web Vitals, tiempos de carga o la latencia de interacción.

Performance Optimization

Favoritos 0GitHub 18.7k

huggingface-vision-trainer

por huggingface

huggingface-vision-trainer te ayuda a instalar y usar una skill de Hugging Face para trabajos de entrenamiento de visión: detección de objetos, clasificación de imágenes y segmentación con SAM/SAM2. Cubre preparación de datasets, configuración de GPU en la nube, evaluación, registro con Trackio y publicación de resultados en el Hub. Es ideal para automatización en backend y flujos de entrenamiento repetibles.

Backend Development

Favoritos 0GitHub 10.4k

constant-time-analysis

por trailofbits

constant-time-analysis es una skill de auditoría de seguridad para detectar riesgos de canal lateral por temporización en código criptográfico antes de que se conviertan en fallos explotables. Úsala para revisar matemáticas dependientes de secretos, ramas, comparaciones y el código compilado al auditar C, C++, Go, Rust, Swift, Java, Kotlin, PHP, JavaScript, TypeScript, Python o Ruby.

Security Audit

Favoritos 0GitHub 5k

azure-eventgrid-dotnet

por microsoft

azure-eventgrid-dotnet es una guía práctica para usar Azure Event Grid SDK para .NET. Cubre la selección de paquetes, los pasos de instalación, las opciones de autenticación y la publicación o consumo de eventos para topics, domains, namespaces y CloudEvents. Ideal para desarrollo backend y flujos de trabajo .NET orientados a eventos.

Backend Development

Favoritos 0GitHub 2.2k

durable-objects

por cloudflare

Habilidad de durable-objects para Cloudflare Workers y desarrollo de backend. Aprende cuándo usar Durable Objects para coordinación con estado, RPC, alarmas, WebSockets, almacenamiento SQLite, configuración de wrangler, pruebas y revisiones de buenas prácticas. Incluye orientación de instalación y uso basada en la documentación de Cloudflare y referencias del repositorio.

Backend Development

Favoritos 0GitHub 1.3k

terraform-stacks

por hashicorp

terraform-stacks es una habilidad práctica para HashiCorp Terraform Stacks. Úsala para crear, modificar y validar archivos .tfcomponent.hcl y .tfdeploy.hcl, conectar componentes y despliegues, gestionar infraestructura multientorno o multirregión, y resolver problemas de sintaxis, dependencias y estructura de Stack. Encaja especialmente bien en flujos de trabajo de desarrollo backend e ingeniería de plataformas.

Backend Development

Favoritos 0GitHub 583

terraform-style-guide

por hashicorp

terraform-style-guide ayuda a generar y revisar Terraform HCL siguiendo las convenciones de estilo de HashiCorp, la organización de archivos y valores predeterminados orientados a la seguridad. Úsalo para generación de código nativo de Terraform, estructura de módulos, variables, outputs y configuración más segura en repositorios reales.

Code Generation

Favoritos 0GitHub 583

tinybird-python-sdk-guidelines

por tinybirdco

tinybird-python-sdk-guidelines te ayuda a instalar y usar tinybird-sdk en proyectos Tinybird basados en Python. Cubre datasources, endpoints, clientes, conexiones, migración desde archivos heredados y flujos de desarrollo backend, con orientación para build y deploy.

Backend Development

Favoritos 0GitHub 16

huggingface-local-models

Visión general de la skill huggingface-local-models

La mejor opción para preparar inferencia local con huggingface-local-models

En qué destaca

Cuándo no es la herramienta adecuada

Cómo usar la skill huggingface-local-models

Instala y abre los archivos correctos

Convierte un objetivo vago en una solicitud útil

Sigue el flujo del repositorio, no un prompt genérico

Consejos prácticos de arranque que sí importan

Preguntas frecuentes de la skill huggingface-local-models

¿Esto es solo para usuarios de llama.cpp?

¿Necesito el CLI de Hugging Face antes de usarla?

¿En qué se diferencia de pedirle a un chatbot una sugerencia de modelo?

¿huggingface-local-models es apta para principiantes?

Cómo mejorar la skill huggingface-local-models

Dale a la skill las restricciones que necesita

Prioriza evidencia exacta del repositorio y del archivo

Vigila los fallos más comunes

Itera con una segunda pasada más precisa

Calificaciones y reseñas

Visión general de la skill `huggingface-local-models`

La mejor opción para preparar inferencia local con `huggingface-local-models`

Cómo usar la skill `huggingface-local-models`

Preguntas frecuentes de la skill `huggingface-local-models`

¿Esto es solo para usuarios de `llama.cpp`?

¿`huggingface-local-models` es apta para principiantes?

Cómo mejorar la skill `huggingface-local-models`