huggingface-local-models

von huggingface

huggingface-local-models hilft dir dabei, Hugging Face-Modelle zu finden, die sich lokal mit llama.cpp und GGUF ausführen lassen, eine praxistaugliche Quantisierung zu wählen und sie auf CPU, Apple Metal, CUDA oder ROCm zu starten. Der Leitfaden deckt Modellentdeckung, die exakte Suche nach GGUF-Dateien, Server- vs. CLI-Setup und einen schnellen Pfad für Backend-Entwicklung und private lokale Inferenz ab.

Stars10.4k

Favoriten0

Kommentare0

Hinzugefügt4. Mai 2026

KategorieBackend Development

Installationsbefehl

npx skills add huggingface/skills --skill huggingface-local-models

Kurationswert

Dieser Skill erreicht 82/100 und ist damit ein solider Kandidat für das Verzeichnis, wenn Nutzer einen fokussierten Workflow suchen, um Hugging Face-GGUF-Modelle zu finden und sie lokal mit llama.cpp auszuführen. Das Repository liefert genug operative Details, um das Rätselraten gegenüber einem generischen Prompt zu reduzieren; dennoch sollten Nutzer weiterhin etwas modellspezifisches Urteilsvermögen mitbringen und beachten, dass ein Installationsbefehl fehlt.

82/100

Stärken

Klarer Anwendungsfall und enger Fokus auf die Auswahl von GGUF-Modellen und deren Start mit llama.cpp auf CPU, Metal, CUDA oder ROCm
Starke praxisnahe Anleitung mit URL-first-Suche, exakter Bestätigung der .gguf-Datei, Quantisierungsauswahl und direkten llama-cli-/llama-server-Befehlen
Hilfreiche Zusatzhinweise zu Hardwarebeschleunigung, Hub- શોધung und Quantisierung reduzieren Unklarheiten bei der Umsetzung

Hinweise

Kein Installationsbefehl in SKILL.md, daher setzt die Nutzung voraus, dass llama.cpp bereits verfügbar ist oder separat installiert wird
Ein Teil des Workflows hängt davon ab, dass das Modell-Repo eine klare lokale App-Empfehlung bietet; in Grenzfällen müssen Nutzer möglicherweise auf manuelle Quantisierungs- oder Dateiauswahl zurückgreifen

Huggingface Llama Cpp MCP Cli Local Llm OpenAI

Überblick

Überblick über die Skill `huggingface-local-models`

huggingface-local-models hilft dir dabei, ein Hugging Face-Modell zu finden, das bereits mit llama.cpp funktioniert, eine sinnvolle GGUF-Quantisierung auszuwählen und es lokal auf CPU, Apple Metal, CUDA oder ROCm zu betreiben. Am nützlichsten ist die Skill, wenn du schnell eine praktische Entscheidung für einen lokalen Modellbetrieb treffen willst und kein allgemeines Modell-Roundup suchst.

Beste Passform für das lokale Inference-Setup

Nutze die Skill huggingface-local-models, wenn du aus einer groben Modellidee einen lauffähigen Befehl machen musst, besonders für Backend-Workflows mit planbarer lokaler Inference, OpenAI-kompatiblem Serving oder privatem/offline Einsatz.

Worin die Skill besonders stark ist

Der Fokus liegt auf den Punkten, die die Nutzung meist ausbremsen: GGUF-Repositories finden, exakte Dateinamen prüfen, die passende Quantisierung für deine Hardware wählen und entscheiden, ob llama-cli oder llama-server die bessere Wahl ist.

Wann die Skill das falsche Werkzeug ist

Wenn du Modell-Benchmarking, Prompt Engineering für eine konkrete App oder eine vollständige Deployment-Architektur brauchst, ist diese Skill zu eng gefasst. Sie hilft dir, ein lokales Modell sauber zum Laufen zu bringen; sie ersetzt weder Systemdesign noch Evaluation.

So nutzt du die Skill `huggingface-local-models`

Installieren und die richtigen Dateien öffnen

Installiere die Skill huggingface-local-models mit:

npx skills add huggingface/skills --skill huggingface-local-models

Lies dann zuerst SKILL.md und danach references/hub-discovery.md, references/quantization.md und references/hardware.md. Diese Dateien enthalten die eigentlichen Entscheidungsregeln für Modellsuche, Quantisierungswahl und hardwareabhängige Startparameter.

Aus einem vagen Ziel eine nützliche Anfrage machen

Die beste Nutzung von huggingface-local-models beginnt mit klaren Rahmenbedingungen: Modellfamilie, Zielhardware, Speicherlimit und die Frage, ob du ein CLI oder einen Server brauchst. Gute Eingaben sehen so aus:

„Finde ein Qwen-Modell unter 24B, das auf einem 16-GB-MacBook läuft, und gib mir die beste GGUF-Quantisierung.“
„Ich brauche einen lokalen OpenAI-kompatiblen Endpoint für einen Coding-Assistenten auf einer einzelnen NVIDIA-GPU.“
„Wähle ein kleines, CPU-freundliches Modell mit möglichst wenig Qualitätsverlust.“

Schwache Eingaben wie „empfiehl mir ein lokales Modell“ erzwingen Raten und bremsen die Auswahl aus.

Dem Workflow des Repos folgen, nicht einem generischen Prompt

Der huggingface-local-models guide ist URL-first: Suche auf Hugging Face mit apps=llama.cpp, öffne die ?local-app=llama.cpp-Seite des Repos, bestätige die exakten .gguf-Dateinamen über die Tree-API und starte dann mit llama-cli -hf <repo>:<QUANT> oder llama-server -hf <repo>:<QUANT>. Nutze --hf-repo und --hf-file nur dann, wenn die Benennung unüblich ist.

Praktische Starttipps, die wirklich zählen

Für huggingface-local-models for Backend Development sollte die Serverform vor dem reinen Modell-Hype kommen: Verwende llama-server, wenn du eine API brauchst, prüfe gesperrte Zugriffe mit hf auth login, und konvertiere Transformers-Weights nur dann, wenn es noch kein GGUF gibt. Die Hardware entscheidet über den Befehl: Metal auf Apple Silicon, CUDA auf NVIDIA, ROCm auf AMD und Core-Count-Tuning auf CPU.

FAQ zur Skill `huggingface-local-models`

Ist das nur für Nutzer von `llama.cpp` gedacht?

Ja, vor allem. Die Skill huggingface-local-models ist um GGUF- und llama.cpp-kompatible Repos herum aufgebaut und deshalb am besten geeignet, wenn dieses Runtime-Umfeld dein Ziel ist oder bereits feststeht.

Brauche ich die Hugging Face CLI, bevor ich sie nutze?

Nicht unbedingt für die Suche. Die URL-basierten Workflows des Repos erlauben es dir, Modelle zu suchen und zu prüfen, ohne extra Tools einzurichten. hf auth login wird aber wichtig für gesperrte Repos und manche Workflows mit privatem Zugriff.

Worin unterscheidet sich das von einer Chatbot-Modellempfehlung?

Ein normaler Prompt rät vielleicht zu einem Modellnamen; diese Skill hilft dir, das tatsächliche Repo, die Datei, die Quantisierung und den Startbefehl zu verifizieren. Das reduziert den häufigsten Fehler: ein Modell zu wählen, das zwar plausibel klingt, aber nicht das richtige GGUF-Artefakt oder die passende Hardware-Kompatibilität hat.

Ist `huggingface-local-models` anfängerfreundlich?

Ja, wenn dein Ziel lautet: „ein lokales Modell erfolgreich zum Laufen bringen“. Weniger anfängerfreundlich ist sie, wenn du Gewichte konvertieren, Build-Flags debuggen oder Multi-GPU-Verhalten optimieren willst, ohne die verlinkten Referenzseiten zu lesen.

So verbesserst du die Skill `huggingface-local-models`

Gib der Skill die nötigen Rahmenbedingungen

Der größte Qualitätsgewinn entsteht, wenn du Hardware und Ausgabeziel von Anfang an nennst. Füge RAM oder VRAM, Betriebssystem und die gewünschte Nutzung hinzu — Chat, Code oder Server. Zum Beispiel: „macOS, 16 GB Unified Memory, ich will das beste Coding-Modell, das sich trotzdem reaktionsschnell anfühlt.“

Bevorzuge eindeutige Repo- und Dateibelege

Die Skill arbeitet am besten, wenn du die Hugging-Face-Empfehlung für local-app und den exakten .gguf-Dateinamen vor dem Start bestätigst. Wenn das Repo mehrere Quants anbietet, entscheide nach deinem Speicherbudget und nicht einfach nach der kleinsten Datei.

Achte auf die typischen Fehlerquellen

Die üblichen Fehler sind, sich vor der Hardwareprüfung schon auf eine Modellfamilie festzulegen, den Dateinamen nicht zu verifizieren und einen Server-Befehl zu verwenden, obwohl ein CLI-Test zuerst sicherer wäre. Wenn die Leistung schlecht ist, passe Quantisierung, GPU-Offload oder Thread-Anzahl an, bevor du davon ausgehst, dass das Modell selbst schlecht ist.

In einem zweiten Durchlauf gezielt nachschärfen

Nach dem ersten Lauf solltest du die Eingabe mit konkreten Symptomen präzisieren: Latenz, RAM-Druck, Qualitätsverlust oder zu geringe GPU-Auslastung. Ein besseres Follow-up für huggingface-local-models ist: „Dasselbe Modell, aber ich brauche weniger Speicherverbrauch und bessere Antwortqualität; gib mir die nächstbeste Quantisierung und den passenden Startbefehl.“

Bewertungen & Rezensionen

Noch keine Bewertungen

Teile deine Rezension

Melde dich an, um für diesen Skill eine Bewertung und einen Kommentar zu hinterlassen.

0/10000

Neueste Rezensionen

Wird gespeichert...

Mehr Skills in dieser Kategorie

wrangler

von cloudflare

Die wrangler-Skill hilft dir, die richtigen CLI-Befehle, Konfigurationsstrukturen und Deploy-Schritte für Cloudflare Workers zu finden. Nutze sie für die wrangler-Verwendung, wrangler-Installationsprüfungen und als praxisnahen wrangler-Leitfaden beim Entwickeln oder Ausliefern von Workers für Backend Development.

Backend Development

Favoriten 0GitHub 1.3k

clickhouse-best-practices

von ClickHouse

clickhouse-best-practices ist ein ClickHouse-Best-Practices-Skill für Database Engineering. Er unterstützt bei Schemadesign, Query-Tuning, Insert-Strategien und Agenten-Anbindung mit regelbasierten Empfehlungen und macht die Nutzung von clickhouse-best-practices in ClickHouse-Workflows leichter auszulösen, zu prüfen und zu zitieren.

Database Engineering

Favoriten 0GitHub 412

clickhouse-architecture-advisor

von ClickHouse

clickhouse-architecture-advisor hilft bei der Gestaltung von ClickHouse-Workloads mit workloadbewussten Entscheidungen für Ingestion, Partitionierung, Joins, Dictionaries, Upserts und Voraggregation. Besonders nützlich ist das Skill für Backend-Entwicklung, Observability, SIEM, Produktanalysen, IoT-Telemetrie und Finanzpipelines. Das Skill kennzeichnet Empfehlungen als `official`, `derived` oder `field`.

Backend Development

Favoriten 0GitHub 412

chdb-datastore

von ClickHouse

chdb-datastore ist ein pandas-kompatibles Skill für schnelle Datenanalyse mit einer von ClickHouse gestützten DataStore-API. Es unterstützt Connectoren für Dateien, Datenbanken und Cloud-Dienste, Cross-Source-Joins und minimale Codeänderungen für pandas-ähnliche Workflows. Nutzen Sie diesen chdb-datastore-Leitfaden, wenn Sie eine Drop-in-Analyseschicht für größere Datensätze suchen.

Data Analysis

Favoriten 0GitHub 0

mcp-server-patterns

von affaan-m

mcp-server-patterns ist ein praxisnaher Leitfaden für die MCP-Server-Entwicklung mit dem Node/TypeScript-SDK. Er zeigt, wann Tools, Resources, Prompts, Zod-Validierung sowie stdio oder Streamable HTTP sinnvoll sind, und enthält aktuelle API-Hinweise für eine sicherere Implementierung und Fehlersuche.

MCP Server Development

Favoriten 0GitHub 156.2k

laravel-tdd

von affaan-m

laravel-tdd ist ein Laravel-Leitfaden für testgetriebene Entwicklung mit PHPUnit und Pest. Er hilft bei der Wahl zwischen Unit-, Feature- und Integrationstests, bei der Datenbankstrategie, bei Fakes, Abdeckungszielen und einem praxistauglichen Workflow für Testautomatisierung.

Test Automation

Favoriten 0GitHub 156.2k

django-security

von affaan-m

django-security ist ein praxisnaher Leitfaden zum Absichern von Django-Apps mit Authentifizierung, Autorisierung, CSRF, XSS, Schutz vor SQL-Injection, sicheren Cookies und Production-Settings. Er hilft Entwicklern und Reviewern dabei, einen fokussierten Security Audit durchzuführen, riskante Konfigurationen schnell zu erkennen und vor dem Deployment konkrete Korrekturen umzusetzen.

Security Audit

Favoriten 0GitHub 156.1k

uv-package-manager

von wshobson

Nutze den uv-package-manager-Skill, um Installationen zu planen, von pip oder Poetry zu migrieren und praxistaugliche uv-Workflows für Python-Projekt-Setup, Lockfiles, CI, Docker und Workspaces anzuwenden.

Project Setup

Favoriten 0GitHub 32.6k

performance-optimization

von addyosmani

Die performance-optimization Skill hilft dir, zuerst zu messen, den eigentlichen Engpass zu finden, ihn zu beheben und die Ergebnisse zu überprüfen. Nutze sie, wenn Leistungsanforderungen bestehen, du eine Regression vermutest oder Core Web Vitals, Ladezeiten oder Interaktionslatenz verbessert werden müssen.

Performance Optimization

Favoriten 0GitHub 18.7k

huggingface-vision-trainer

von huggingface

huggingface-vision-trainer hilft dir bei der Installation und Nutzung eines Hugging Face Skills für Vision-Trainingsjobs: Objekterkennung, Bildklassifikation und SAM/SAM2-Segmentierung. Abgedeckt werden Dataset-Vorbereitung, Cloud-GPU-Setup, Evaluation, Trackio-Logging und das Hochladen der Ergebnisse zum Hub. Ideal für Backend-Automatisierung und wiederholbare Trainings-Workflows.

Backend Development

Favoriten 0GitHub 10.4k

constant-time-analysis

von trailofbits

constant-time-analysis ist eine Security-Audit-Skill zum Finden von Timing-Side-Channel-Risiken in kryptografischem Code, bevor sie zu ausnutzbaren Bugs werden. Nutze sie, um geheimnisabhängige Mathematik, Verzweigungen, Vergleiche und kompilierten Output zu prüfen, wenn du C, C++, Go, Rust, Swift, Java, Kotlin, PHP, JavaScript, TypeScript, Python oder Ruby analysierst.

Security Audit

Favoriten 0GitHub 5k

azure-eventgrid-dotnet

von microsoft

azure-eventgrid-dotnet ist ein praxisnaher Leitfaden zur Nutzung des Azure Event Grid SDK für .NET. Er behandelt die Auswahl des passenden Pakets, Installationsschritte, Authentifizierungsoptionen sowie das Veröffentlichen und Empfangen von Events für Topics, Domains, Namespaces und CloudEvents. Ideal für Backend-Entwicklung und eventgetriebene .NET-Workflows.

Backend Development

Favoriten 0GitHub 2.2k

durable-objects

von cloudflare

durable-objects Skill für Cloudflare Workers und Backend-Entwicklung. Erfahre, wann Durable Objects für zustandsbehaftete Koordination, RPC, Alarme, WebSockets, SQLite-Speicher, wrangler-Konfiguration, Tests und Best-Practice-Reviews sinnvoll sind. Enthält Installations- und Nutzungshinweise auf Basis von Cloudflare-Dokumentation und Repo-Referenzen.

Backend Development

Favoriten 0GitHub 1.3k

terraform-stacks

von hashicorp

terraform-stacks ist ein praxisnahes Skill für HashiCorp Terraform Stacks. Verwende es, um .tfcomponent.hcl- und .tfdeploy.hcl-Dateien zu erstellen, anzupassen und zu validieren, Komponenten und Deployments zu verbinden, Infrastruktur über mehrere Umgebungen oder Regionen hinweg zu verwalten und Probleme mit Stack-Syntax, Abhängigkeiten und Layout zu beheben. Besonders gut geeignet für Backend-Entwicklung und Platform-Engineering-Workflows.

Backend Development

Favoriten 0GitHub 583

terraform-style-guide

von hashicorp

terraform-style-guide hilft beim Erstellen und Prüfen von Terraform HCL nach HashiCorp-Styleguide, sinnvoller Dateistruktur und sicherheitsbewussten Standardwerten. Verwenden Sie es für Terraform-nahen Code, Modulaufbau, Variablen, Outputs und sicherere Konfigurationen in realen Repositories.

Code Generation

Favoriten 0GitHub 583

tinybird-python-sdk-guidelines

von tinybirdco

tinybird-python-sdk-guidelines hilft dir beim Installieren und Verwenden von tinybird-sdk für Python-basierte Tinybird-Projekte. Es behandelt Datasources, Endpoints, Clients, Verbindungen, die Migration aus Legacy-Dateien sowie Backend-Workflows mit Build- und Deploy-Hinweisen.

Backend Development

Favoriten 0GitHub 16

huggingface-local-models

Überblick über die Skill huggingface-local-models

Beste Passform für das lokale Inference-Setup

Worin die Skill besonders stark ist

Wann die Skill das falsche Werkzeug ist

So nutzt du die Skill huggingface-local-models

Installieren und die richtigen Dateien öffnen

Aus einem vagen Ziel eine nützliche Anfrage machen

Dem Workflow des Repos folgen, nicht einem generischen Prompt

Praktische Starttipps, die wirklich zählen

FAQ zur Skill huggingface-local-models

Ist das nur für Nutzer von llama.cpp gedacht?

Brauche ich die Hugging Face CLI, bevor ich sie nutze?

Worin unterscheidet sich das von einer Chatbot-Modellempfehlung?

Ist huggingface-local-models anfängerfreundlich?

So verbesserst du die Skill huggingface-local-models

Gib der Skill die nötigen Rahmenbedingungen

Bevorzuge eindeutige Repo- und Dateibelege

Achte auf die typischen Fehlerquellen

In einem zweiten Durchlauf gezielt nachschärfen

Bewertungen & Rezensionen

Überblick über die Skill `huggingface-local-models`

So nutzt du die Skill `huggingface-local-models`

FAQ zur Skill `huggingface-local-models`

Ist das nur für Nutzer von `llama.cpp` gedacht?

Ist `huggingface-local-models` anfängerfreundlich?

So verbesserst du die Skill `huggingface-local-models`