huggingface-local-models

作成者 huggingface

huggingface-local-models は、Hugging Face のモデルの中から llama.cpp と GGUF でローカル実行できるものを見つけ、実用的な量子化設定を選び、CPU、Apple Metal、CUDA、ROCm で起動するためのスキルです。モデル探索、正確な GGUF ファイルの特定、サーバー／CLI のセットアップ、そしてバックエンド開発やプライベートなローカル推論にすぐ使える導線までカバーします。

スター10.4k

お気に入り0

追加日2026年5月4日

カテゴリーBackend Development

インストールコマンド

npx skills add huggingface/skills --skill huggingface-local-models

編集スコア

このスキルの評価は 82/100 で、Hugging Face の GGUF モデルを探して llama.cpp でローカル実行する、目的のはっきりしたワークフローを求めるユーザー向けの有力な掲載候補です。一般的なプロンプトに比べて運用面の情報が十分にあり、迷いを減らせますが、モデルごとの判断は多少必要で、インストールコマンドがない点は前提として見ておく必要があります。

82/100

強み

GGUF モデルを選び、CPU、Metal、CUDA、ROCm で llama.cpp 起動につなげるための、明確なトリガーと適用範囲がある
URL 起点の検索、.gguf ファイルの正確な確認、量子化の選択、llama-cli / llama-server の直接実行まで、実務向けの案内が強い
ハードウェアアクセラレーション、Hub の探索、量子化に関する補足情報があり、実行時の曖昧さを減らせる

注意点

SKILL.md にインストールコマンドがないため、採用には llama.cpp がすでに使えるか、別途インストールする前提が残る
一部の手順は、モデル repo にローカルアプリ向けの明確な推奨があることを前提にしているため、例外的なケースでは手動での量子化・ファイル選択に切り替える必要がある

Huggingface Llama Cpp MCP Cli Local Llm OpenAI

概要

huggingface-local-models skill の概要

huggingface-local-models は、Hugging Face 上で llama.cpp でそのまま使えるモデルを見つけ、無理のない GGUF の quant を選び、CPU、Apple Metal、CUDA、ROCm でローカル実行するための skill です。汎用的なモデル一覧ではなく、すぐに実用的なローカル運用判断を出したいときに最も役立ちます。

ローカル推論環境の構築に向いているケース

huggingface-local-models skill は、ざっくりしたモデル案を実際に動くコマンドへ落とし込みたいときに使います。特に、予測しやすいローカル推論、OpenAI 互換のサービング、あるいはプライベート／オフライン実行が必要なバックエンド用途に向いています。

何が得意か

この skill は、導入の壁になりやすい部分にフォーカスしています。具体的には、GGUF リポジトリの発見、正確なファイル名の確認、ハードウェアに合った quant の選定、llama-cli と llama-server のどちらで動かすかの判断です。

向いていない使い方

モデルのベンチマーク、特定アプリ向けのプロンプト調整、あるいは本格的なデプロイ構成が必要なら、この skill では範囲が狭すぎます。ローカルモデルをきれいに動かす助けにはなりますが、システム設計や評価の代わりにはなりません。

huggingface-local-models skill の使い方

インストールして、読むべきファイルを開く

huggingface-local-models skill は次のコマンドで追加します。

npx skills add huggingface/skills --skill huggingface-local-models

その後は、まず SKILL.md を読み、続けて references/hub-discovery.md、references/quantization.md、references/hardware.md を確認します。これらのファイルに、モデル探索、quant 選び、ハードウェア別の起動設定に関する実際の判断ルールがまとまっています。

あいまいな目的を、使える依頼に変える

huggingface-local-models をうまく使うコツは、最初から具体的な制約をそろえることです。モデル系統、対象ハードウェア、メモリ上限、CLI かサーバーか、をはっきりさせます。たとえば次のような入力が有効です。

“Find a Qwen model under 24B that runs on a 16 GB MacBook and give me the best GGUF quant.”
“I need a local OpenAI-compatible endpoint for a coding assistant on a single NVIDIA GPU.”
“Choose a small CPU-friendly model with the least quality loss.”

“ローカルモデルをおすすめして” のような弱い依頼では、推測が増えて選定が遅くなります。

一般論のプロンプトではなく、リポジトリの流れに従う

huggingface-local-models guide は URL 起点です。まず Hugging Face で apps=llama.cpp を検索し、リポジトリの ?local-app=llama.cpp ページを開き、次に tree API で正確な .gguf ファイル名を確認します。そのうえで llama-cli -hf <repo>:<QUANT> か llama-server -hf <repo>:<QUANT> で起動します。命名が標準的でない場合だけ --hf-repo と --hf-file を使います。

実運用で効く起動のコツ

huggingface-local-models for Backend Development では、モデルの話題性よりも提供形態を優先します。API が必要なら llama-server を使い、gated access がある場合は hf auth login でアクセスを確認し、GGUF がすでに存在しないときだけ Transformers の重みから変換します。ハードウェアによってコマンドも変わります。Apple Silicon では Metal、NVIDIA では CUDA、AMD では ROCm、CPU では core count の調整が重要です。

huggingface-local-models skill の FAQ

これは `llama.cpp` ユーザー専用ですか？

基本的にはその通りです。huggingface-local-models skill は GGUF と llama.cpp 互換のリポジトリを前提にしているので、そのランタイムを使う、または使う前提が固まっているときに最適です。

使う前に Hugging Face CLI は必要ですか？

探索だけなら必須ではありません。リポジトリの URL ベースの流れで、追加ツールなしにモデル検索と確認はできます。ただし、gated repo や一部の private アクセス系ワークフローでは hf auth login が重要になります。

チャットボットにモデル推薦を聞くのと何が違いますか？

通常のプロンプトはモデル名を推測するだけかもしれませんが、この skill は実際の repo、ファイル、quant、起動コマンドまで検証するのを助けます。その結果、見た目は合っていても、必要な GGUF アーティファクトがない、あるいはハードウェアに合わない、という典型的な失敗を減らせます。

`huggingface-local-models` は初心者向けですか？

「1つのローカルモデルを確実に動かしたい」という目的なら、はい。重みの変換、ビルドフラグのデバッグ、マルチ GPU の挙動調整までやりたい場合は、リンク先の reference pages を読まずに進めるには少し初心者向けではありません。

huggingface-local-models skill の改善方法

必要な制約を最初から渡す

品質を大きく上げるポイントは、最初にハードウェア条件と出力の目的を明示することです。RAM または VRAM、OS、チャット用途かコード用途かサーバー用途か、を含めてください。たとえば “macOS, 16 GB unified memory, want the best coding model that still feels responsive.” のように書くと精度が上がります。

正確な repo とファイルの証拠を優先する

この skill は、Hugging Face の local-app 推奨を確認し、起動前に正確な .gguf ファイル名を確かめるときに最も強く機能します。repo に複数の quant があるなら、最小ファイルを機械的に選ぶのではなく、メモリ予算に合わせて選定します。

よくある失敗パターンに注意する

典型的なミスは、ハードウェア確認より先にモデル系統を決めること、ファイル名確認を飛ばすこと、CLI で試すべき場面でいきなり server コマンドを使うことです。性能が悪いなら、モデルが悪いと決めつける前に quant、GPU offload、thread count を調整します。

2回目はより具体的に絞り込む

最初の実行後は、遅延、RAM 圧迫、品質低下、GPU の未使用といった具体的な症状で入力を絞り直します。huggingface-local-models へのより良い再依頼は、たとえば次のようなものです。 “Same model, but I need lower memory use and better answer quality; give me the next-best quant and launch command.”

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

wrangler

作成者 cloudflare

wranglerスキルは、Cloudflare Workersで正しいCLIコマンド、設定形式、デプロイ手順を見つけるのに役立ちます。wranglerの使い方、wranglerの導入確認、Backend DevelopmentでWorkersを作成・公開する際の実用的なwranglerガイドとして活用してください。

Backend Development

お気に入り 0GitHub 1.3k

clickhouse-best-practices

作成者 ClickHouse

clickhouse-best-practicesは、Database Engineering向けのClickHouseベストプラクティス skill です。スキーマ設計、クエリチューニング、insert戦略、エージェント接続を、ルールベースの推奨で整理して案内します。clickhouse-best-practices の使いどころを見極めやすく、レビューや引用にもつなげやすいので、ClickHouse のワークフローで活用しやすいのが特長です。

Database Engineering

お気に入り 0GitHub 412

clickhouse-architecture-advisor

作成者 ClickHouse

clickhouse-architecture-advisor は、ワークロードを踏まえた判断で ClickHouse の設計を支援します。取り込み、パーティション設計、JOIN、辞書、UPSERT、事前集計まで、負荷特性に合わせて選べるのが強みです。Backend Development、可観測性、SIEM、プロダクト分析、IoT テレメトリ、金融系パイプラインで特に役立ちます。ガイダンスは `official`、`derived`、`field` として分類されます。

Backend Development

お気に入り 0GitHub 412

chdb-datastore

作成者 ClickHouse

chdb-datastore は、ClickHouse バックエンドの DataStore API を使って高速なデータ分析を行うための pandas 互換スキルです。ファイル、データベース、クラウドの各コネクタ、異なるソースをまたぐ join、そして pandas 風ワークフローをほとんど変えずに使える点が特長です。大きめのデータセットに対して、そのまま使える分析レイヤーを求めるなら、この chdb-datastore ガイドが役立ちます。

Data Analysis

お気に入り 0GitHub 0

mcp-server-patterns

作成者 affaan-m

mcp-server-patterns は、Node/TypeScript SDK を使った MCP Server 開発の実践ガイドです。ツール、リソース、プロンプト、Zod バリデーション、stdio と Streamable HTTP の使い分けを学べるほか、より安全な実装とデバッグに役立つ最新の API メモも確認できます。

MCP Server Development

お気に入り 0GitHub 156.2k

laravel-tdd

作成者 affaan-m

laravel-tddは、PHPUnitとPestに対応したLaravelのテスト駆動開発ガイドです。単体・機能・統合テストの使い分け、データベース戦略、fakeの活用、カバレッジ目標、テスト自動化まで、実務で使えるワークフローを支援します。

Test Automation

お気に入り 0GitHub 156.2k

django-security

作成者 affaan-m

django-security は、Django アプリを認証、認可、CSRF、XSS、SQLインジェクション対策、セキュアCookie、本番設定の観点から強化するための実践ガイドです。開発者やレビュー担当者が Security Audit を集中的に実施し、リスクの高い設定をすばやく見つけ、デプロイ前に具体的な修正を適用できるようにします。

Security Audit

お気に入り 0GitHub 156.1k

uv-package-manager

作成者 wshobson

uv-package-managerスキルを使って、インストール計画の整理、pipやPoetryからの移行、さらにPythonプロジェクト立ち上げにおけるuvの実践的な運用方法を把握できます。lockfile、CI、Docker、workspaceまで幅広く判断材料を得られます。

Project Setup

お気に入り 0GitHub 32.6k

performance-optimization

作成者 addyosmani

performance-optimization スキルは、まず計測し、真のボトルネックを特定して修正し、結果を検証するためのガイドです。性能要件があるとき、回帰を疑うとき、または Core Web Vitals、読み込み時間、操作時の遅延を改善したいときに使います。

Performance Optimization

お気に入り 0GitHub 18.7k

huggingface-vision-trainer

作成者 huggingface

huggingface-vision-trainer は、物体検出、画像分類、SAM/SAM2 のセグメンテーションといった Hugging Face のビジョントレーニングジョブを導入・活用するためのスキルです。データセット準備、クラウド GPU のセットアップ、評価、Trackio ロギング、結果の Hub へのプッシュまでをカバーします。バックエンド自動化や再現性の高い学習ワークフローに最適です。

Backend Development

お気に入り 0GitHub 10.4k

constant-time-analysis

作成者 trailofbits

constant-time-analysis は、暗号コードに潜むタイミング系サイドチャネルのリスクを、実害のあるバグになる前に見つけるためのセキュリティ監査スキルです。C、C++、Go、Rust、Swift、Java、Kotlin、PHP、JavaScript、TypeScript、Python、Ruby を確認する際に、秘密値に依存する計算、分岐、比較、そしてコンパイル後の出力をレビューするのに使えます。

Security Audit

お気に入り 0GitHub 5k

azure-eventgrid-dotnet

作成者 microsoft

azure-eventgrid-dotnet は、.NET で Azure Event Grid SDK を活用するための実践ガイドです。パッケージ選定、インストール手順、認証方法の選び方に加え、topics、domains、namespaces、CloudEvents に対するイベントの送信・受信までカバーします。バックエンド開発やイベント駆動の .NET ワークフローに最適です。

Backend Development

お気に入り 0GitHub 2.2k

durable-objects

作成者 cloudflare

Cloudflare Workers とバックエンド開発向けの durable-objects スキルです。ステートフルな調整、RPC、アラーム、WebSocket、SQLite ストレージ、wrangler 設定、テスト、ベストプラクティスの確認で Durable Objects を使うべき場面を学べます。Cloudflare のドキュメントとリポジトリ参照に基づく、インストールと利用のガイドも含みます。

Backend Development

お気に入り 0GitHub 1.3k

terraform-stacks

作成者 hashicorp

terraform-stacks は、HashiCorp Terraform Stacks を扱うための実用的なスキルです。.tfcomponent.hcl と .tfdeploy.hcl の作成・修正・検証、コンポーネントとデプロイの接続、マルチ環境／マルチリージョンのインフラ管理、Stack の構文・依存関係・レイアウトのトラブルシュートに使えます。バックエンド開発やプラットフォームエンジニアリングのワークフローに特に適しています。

Backend Development

お気に入り 0GitHub 583

terraform-style-guide

作成者 hashicorp

terraform-style-guide は、HashiCorp のスタイル規約、ファイル構成、セキュリティを意識したデフォルトを踏まえて Terraform HCL の生成とレビューを支援します。Terraform ネイティブなコード生成、モジュール構成、variables、outputs、そして実運用リポジトリでより安全な設定を行う用途に向いています。

Code Generation

お気に入り 0GitHub 583

tinybird-python-sdk-guidelines

作成者 tinybirdco

tinybird-python-sdk-guidelines は、Python ベースの Tinybird プロジェクトで tinybird-sdk を導入・活用するためのスキルです。datasource、endpoint、client、connection、旧形式ファイルからの移行、さらに build / deploy のガイダンスを含むバックエンド開発ワークフローまでカバーします。

Backend Development

お気に入り 0GitHub 16

huggingface-local-models

huggingface-local-models skill の概要

ローカル推論環境の構築に向いているケース

何が得意か

向いていない使い方

huggingface-local-models skill の使い方

インストールして、読むべきファイルを開く

あいまいな目的を、使える依頼に変える

一般論のプロンプトではなく、リポジトリの流れに従う

実運用で効く起動のコツ

huggingface-local-models skill の FAQ

これは llama.cpp ユーザー専用ですか？

使う前に Hugging Face CLI は必要ですか？

チャットボットにモデル推薦を聞くのと何が違いますか？

huggingface-local-models は初心者向けですか？

huggingface-local-models skill の改善方法

必要な制約を最初から渡す

正確な repo とファイルの証拠を優先する

よくある失敗パターンに注意する

2回目はより具体的に絞り込む

評価とレビュー

これは `llama.cpp` ユーザー専用ですか？

`huggingface-local-models` は初心者向けですか？