firecrawl-download

作成者 firecrawl

firecrawl-download は、Web サイト全体やドキュメントの特定セクションを、整理されたローカルファイルとして `.firecrawl/` 配下に保存できるスキルです。サイトマップ作成とスクレイピングを組み合わせ、markdown、リンク、スクリーンショットの取得に対応。オフライン用の docs 保存、複数ページの一括取得、実務的な Web Scraping ワークフローに役立ちます。

スター234

お気に入り0

追加日2026年3月31日

カテゴリーWeb Scraping

インストールコマンド

npx skills add firecrawl/cli --skill firecrawl-download

編集スコア

このスキルの評価は 73/100 です。ディレクトリ掲載には十分な水準で、起動条件は明確かつワークフローも実用的です。一方で、リポジトリには限定的な運用情報しかない単一の `SKILL.md` しかなく、コマンド例以外の判断は利用者側で補う必要があります。

73/100

強み

起動条件が明確です。"download the site"、"offline copy"、"download all the docs" のように、想定ユースケースが具体的に示されています。
エージェント活用の実効性があります。サイトマップ作成とスクレイピングを 1 つのコマンドにまとめ、formats、screenshots、include-paths、limits など実用的なオプションも案内されています。
例が比較的そのまま使えます。`SKILL.md` にはクイックスタート用のコマンド例があり、確認プロンプトを省略するために `-y` を使う点も明記されています.

注意点

運用面の情報は限られています。support files、参考資料、インストール手順、失敗時の対処、スケール上限、出力管理に関する判断基準は用意されていません。
このスキルは experimental と明記されており、本番寄りのエージェント運用では信頼性や安定性に不安が残ります。

Firecrawl Cli Scraping Websites Offline Markdown

概要

firecrawl-download スキルの概要

firecrawl-download でできること

firecrawl-download スキルは、特定の用途に絞ったツールです。Web サイト全体やドキュメントの一部を、整理されたローカルファイルとしてダウンロードできます。サイト内のページを見つけてから各ページをスクレイピングし、.firecrawl/ 配下に markdown、スクリーンショット、またはページごとの複数形式で保存します。

特に役立つのは、ドキュメントをオフラインで保持したいとき、調査用のローカルコーパスを作りたいとき、あるいは後から分析するためにページ群をまとめて再現性高く保存したいときです。汎用的なスクレイピング用プロンプトと比べると、firecrawl-download はサイト全体の取得に向いた流れが最初から用意されているため、クロール設計をゼロから組み立てる必要がありません。

どんな人に firecrawl-download スキルが向いているか

特に相性がいいのは次のようなユーザーです。

ドキュメントをローカル保存したい開発者
サイト内容を収集してレビューしたいリサーチャー
軽量なコンテンツアーカイブを作りたいチーム
「このサイトをダウンロードしたい」という実務的なワークフローを、手探りを減らして実行したいエージェント

目的が「このサイトを使いやすいローカルファイルとして保存したい」であれば、広すぎる Web スクレイピング用プロンプトより firecrawl-download の方が適しています。

インストール前にユーザーが気にするポイント

firecrawl-download を入れるかどうかは、たいてい次の 4 点で決まります。

単一ページではなく、サイト全体やドキュメントの特定セクションを扱えるか
保存先が使いやすいローカル構成になっているか
意図しないページまで落とさないように対象範囲を絞れるか
markdown やスクリーンショットなど複数の出力形式に対応しているか

スキルのソースを見る限り、この 4 点はいずれも満たしています。注意点として、これは experimental と明記されているため、堅牢な長期保存システムというより、実用的な時短ワークフローとして捉えるのが適切です。

Web Scraping ワークフローにおける主な差別化ポイント

firecrawl-download for Web Scraping の強みは、単純なスクレイピング性能の高さだけではありません。コマンドの中に次の流れがまとまっている点が大きいです。

まずサイトマップ取得
次にスクレイピング
ページ単位でのファイル出力
ネストしたローカルディレクトリ構成
ダウンロード時にも scrape オプションを再利用可能

そのため、単にページ内容を返すだけの scrape コマンドよりも、「ドキュメント一式をダウンロードしたい」用途では firecrawl-download の方が導入価値があります。

firecrawl-download スキルの使い方

firecrawl-download のインストール前提

リポジトリを見ると、このスキルは firecrawl/cli の skills/firecrawl-download にあります。実用的な導入手順は次のとおりです。

npx skills add https://github.com/firecrawl/cli --skill firecrawl-download

追加後は次のファイルを確認してください。

skills/firecrawl-download/SKILL.md

このスキルは補助ファイルがほとんどないため、主な一次情報は SKILL.md です。

最初に読むべきファイル

まず確認したいのは次です。

skills/firecrawl-download/SKILL.md

このファイルを見ると、実際のスコープがすぐ分かります。firecrawl download は map と scrape を組み合わせた experimental な便利コマンドで、結果は .firecrawl/ 配下に保存され、ダウンロード時にも scrape オプションが使えます。

firecrawl-download の基本的な使い方

firecrawl-download skill を最短で使うなら、docs やコンテンツのルート URL をそのまま指定します。

firecrawl download https://docs.example.com

無人実行を前提にするなら、スキル側でも次の形が明示的に推奨されています。

firecrawl download https://docs.example.com -y

エージェント実行やスクリプト実行で確認プロンプトを省きたいなら、-y を付けるのが基本です。

スキルをうまく動かすために必要な入力

「このサイトをダウンロードして」のような大まかな指示では弱いことが多いです。より良い入力には、次の情報を含めます。

ルート URL
本当に必要なセクションの境界
最大ページ数
必要な出力形式
スクリーンショットの要否
除外したい対象

たとえば、次のような依頼の方が強いです。

「firecrawl-download を使って https://docs.example.com をローカルに markdown とスクリーンショットで保存し、/guides と /api のみ対象、50 ページまで、翻訳ページは除外してください。」

これなら、スクレイピング前のマッピング段階で適切な範囲を取りやすくなります。

実運用で特に重要なコマンド

ソース上では、実際に価値の高いパターンがいくつか示されています。

# With screenshots
firecrawl download https://docs.example.com --screenshot --limit 20 -y

# Multiple formats per page
firecrawl download https://docs.example.com --format markdown,links --screenshot --limit 20 -y

# Filter by section
firecrawl download https://docs.example.com --include-paths "/features,/sdks"

これらが重要なのは、導入時によくある詰まりどころをそのままカバーしているからです。ページ数が多すぎる、必要なセクションがずれる、出力の粒度が足りない、といった問題に直結します。

ローカルには何が保存されるか

このスキルは .firecrawl/ 配下にネストしたディレクトリを作って出力を保存します。複数形式を指定した場合、各ページごとに次のようなファイルが生成されます。

index.md
links.txt
screenshot.png

このローカルファイル構成の分かりやすさは、単発の scrape プロンプトではなく firecrawl-download install を選ぶ大きな理由のひとつです。

あいまいな目的を実用的なプロンプトに変える方法

最初の発想が次のようなものなら、

「この docs サイトをダウンロードして」

次の要素に分解して書き直すのが有効です。

対象 URL
必要なセクションのフィルタ
ファイル形式
スクリーンショットの要否
ページ上限
除外条件

エージェント向けのプロンプト例:

「firecrawl-download スキルを使って https://docs.example.com をオフライン利用向けにダウンロードしてください。markdown とスクリーンショットで保存し、/getting-started,/api のみ対象、30 ページまで、非対話実行のため -y を使ってください。」

この書き方の方が、対象範囲と出力形式のあいまいさを減らせます。

安定した結果を得るための推奨ワークフロー

実践的な firecrawl-download guide の流れは次のとおりです。

まずは最小限で意味のある docs セクションから始める。
ページ数を増やす前に --include-paths を入れる。
初回は --limit 付きで実行する。
.firecrawl/ の出力構造を確認する。
--screenshot や複数形式は本当に必要な場合だけ追加する。
最初のサンプルが正しければ、そこで初めて対象を広げる。

これにより、「最初から広く取りすぎて大量にダウンロードしてしまう」という典型的な失敗を避けられます。

通常の scrape ではなく firecrawl-download を使うべき場面

firecrawl-download usage が向いているのは、次のようなケースです。

1 ページではなく多数のページが必要
テキストの返却だけでなくローカルファイルとして欲しい
オフラインでたどれるコピーを作りたい
レビューや参照用に docs のスナップショットを素早く取りたい

逆に、通常の scrape が向くのは 1 ページだけ欲しい場合や、抽出ロジックを細かくカスタマイズしたい場合です。firecrawl-download の価値は、サイト規模の保存を短時間で回せるワークフローにあります。

先に知っておきたい制約とトレードオフ

スキルのソースから見える実務上の制約は主に次のとおりです。

experimental と明記されている
あくまで convenience command として最適化されている
出力品質は対象サイトの構造やスコープ指定に左右される
制限なしの広範囲実行はノイズや過剰取得につながりやすい

つまり、制御しやすい docs ダウンロードにはかなり適していますが、完全なアーカイブ品質を必ず保証するものではありません。

firecrawl-download スキル FAQ

firecrawl-download は初心者にも向いている？

はい。特に「docs をローカル保存したい」という用途なら扱いやすいです。コマンド例はシンプルで、対話型ウィザードの助けもあります。ただし初心者でも、ダウンロードが大きくなりすぎないよう、最初は小さめの --limit と狭めの --include-paths から始めるのが安全です。

汎用的な AI スクレイピングプロンプトとの違いは何？

汎用プロンプトでも作業内容は説明できますが、firecrawl-download にはすでに役立つ実行パターンが組み込まれています。つまり、サイトをマップし、各ページをスクレイピングし、ディレクトリに保存する流れが最初からあるということです。これによりセットアップの手間が減り、ワークフローの再現性も上がります。

firecrawl-download はドキュメントサイト専用？

いいえ。ただし、もっとも適合しやすいのはドキュメント用途です。ページ構造や URL パスがある程度予測しやすいサイトで特に力を発揮します。動的要素が多いサイトや、対象範囲を決めにくいサイトでは、より厳密なフィルタや別アプローチが必要になることがあります。

firecrawl-download は markdown 以外も保存できる？

はい。スキルのソースには、ページごとの複数形式出力と任意のスクリーンショット保存が明示されています。読みやすいテキストだけでなく、見た目の証跡も残したい場合には重要なポイントです。

firecrawl-download を使わない方がいいのはどんなとき？

次のような場合は firecrawl-download を使わない方がよいでしょう。

1 ページだけ必要
カスタムの抽出スキーマが必要
スクレイプ時点で深い後処理をしたい
より厳密な保証がある堅牢なアーカイブパイプラインが必要

こうしたケースでは、より限定的な scrape コマンドや、個別設計のワークフローの方が適している可能性があります。

firecrawl-download スキルを改善する方法

まず firecrawl-download の対象範囲を絞る

firecrawl-download の結果を改善する最も簡単な方法は、あいまいさを減らすことです。具体的には次を使います。

--include-paths
--limit
明確な docs ルート URL

制御されていないサイト全体実行より、20 ページ程度に絞った実行の方が、たいてい実用的な結果になります。

実際の後続作業に合わせて出力を選ぶ

何も考えずに毎回すべての形式を要求しないでください。次の工程に合う形式だけを選ぶべきです。

markdown は閲覧・検索・LLM 取り込み向け
links は構造把握が重要なとき向け
--screenshot はレイアウトや UI の証跡が必要なとき向け

こうすることで、実行が軽くなり、出力レビューもしやすくなります。

本番ダウンロード前にサンプル実行する

有効な反復パターンは次のようなものです。

firecrawl download https://docs.example.com --include-paths "/api" --limit 10 -y

まず保存されたファイルを確認し、その後で対象セクションや上限を広げます。これにより、スコープの誤りを早い段階で発見できます。

よくある失敗パターンとその避け方

典型的な問題は次のとおりです。

意図しないセクションまでダウンロードしてしまう
ページ数を取りすぎる
自動実行なのに -y を付け忘れる
実際には不要な出力形式まで要求してしまう

対策はシンプルです。対象範囲を明示し、初回は制限付きで実行し、出力形式は目的に合わせて選んでください。

エージェント利用時はプロンプト品質を上げる

エージェントがこのスキルを呼び出す場合は、次の情報を明示させるのが有効です。

正確な開始 URL
ローカル出力の用途
含めたいセクション
避けたいセクション
出力形式
実行規模の上限

良いプロンプト例:

「firecrawl-download を使って https://docs.example.com のオフライン用 markdown コピーを作成してください。対象は /guides と /reference のみ、各ページのスクリーンショット付き、40 ページまで、非対話で保存してください。」

これは「docs をダウンロードして」より、はるかに実行精度が高くなります。

最初の出力後にどう改善していくか

最初の実行後は、次の点を確認してください。

.firecrawl/ に期待したページが入っていたか
関係ないページが多すぎなかったか
必要だったのはスクリーンショットか、テキストだけか
次回は include paths を広げるべきか、狭めるべきか

firecrawl-download skill を改善する最善の方法は、やみくもに再実行することではありません。最初の出力で実際に何が得られたかを見て、対象範囲と出力形式を調整することです。

評価とレビュー

まだ評価がありません

レビューを投稿

このスキルの評価やコメントを投稿するにはサインインしてください。

0/10000

新着レビュー

保存中...

このカテゴリーの他のスキル

huggingface-datasets

作成者 huggingface

huggingface-datasets スキルは、Hugging Face Dataset Viewer API のワークフローでデータセットの検証、split の解決、行のプレビューとページネーション、テキスト検索、フィルタ適用、parquet リンクや統計情報の取得を行うために使います。読み取り専用のデータセット探索に適した、実用的な huggingface-datasets ガイドです。

Web Scraping

お気に入り 0GitHub 10.4k

data-scraper-agent

作成者 affaan-m

data-scraper-agent は、Web スクレイピング、データ強化、保存までを一貫して行う、再利用可能な公開データパイプラインの構築を支援します。GitHub Actions を使って、ジョブ、価格、ニュース、リポジトリ、スポーツ、掲載情報などを定期監視する用途に向いており、出力先は Notion、Sheets、Supabase に対応します。一度きりの抽出よりも、継続的な追跡に最適です。

Web Scraping

お気に入り 0GitHub 156.1k

baoyu-url-to-markdown

作成者 JimLiu

baoyu-url-to-markdown は、vendored な baoyu-fetch CLI を使い、Chrome CDP・サイト別アダプター・汎用フォールバックで公開中の URL を Markdown に変換します。導入前に、Bun ランタイムの要件、初回の EXTEND.md 設定、X・YouTube・Hacker News・レンダリング後ページでの使い方を確認しておくと安心です。

Format Conversion

お気に入り 0GitHub 13.2k

x-twitter-scraper

作成者 Xquik-dev

x-twitter-scraperを使って、Xquik経由でX（Twitter）のデータ取得と確認付きアクションを実行できます。ツイート検索、ユーザー照会、フォロワー抽出、メディア डाउनलोड、監視、webhook、MCP、書き込み系アクションに対応。Xのログイン情報ではなくAPIキーで行う、Webスクレイピング寄りの調査用途に最適です。

Web Scraping

お気に入り 0GitHub 71

exa-search

作成者 K-Dense-AI

exa-search は、Exa を活用した Web リサーチスキルです。現在の情報を見つけたり、URL からコンテンツを抽出したりする用途に向いています。検索、ソース探索、記事や PDF の抽出、意味ベースの検索、学術的な絞り込みを使った技術・科学リサーチに利用でき、導入と使い方もわかりやすく整理されています。

Web Research

お気に入り 0GitHub 0

browser-use

作成者 browser-use

browser-use は、ページを開く、状態を確認する、番号付き要素をクリックする、フォームに入力する、スクリーンショットを撮る、永続的なブラウザーセッションを再利用するといった操作に対応したブラウザー自動化スキルです。browser-use CLI を使った安定したフォーム入力、ページ遷移、ログイン後のワークフローに適しています。

Browser Automation

お気に入り 0GitHub 84.9k

remote-browser

作成者 browser-use

remote-browserは、サンドボックス環境のエージェントがBrowser Automation用のヘッドレスブラウザを操作するためのスキルです。ページを開く、状態を確認する、番号付き要素をクリックする、入力する、スクリーンショットを撮る、ローカルアプリやCDP対応ブラウザセッションに接続するといった操作に使えます。

Browser Automation

お気に入り 0GitHub 84.9k

firecrawl

作成者 firecrawl

webスクレイピング、検索、クローリング、ページ操作に対応する公式 Firecrawl CLI をインストール・認証・活用するための firecrawl skill です。セットアップ、`firecrawl --status` による確認、ログイン、`.firecrawl/` への安全な出力方法、リポジトリに基づく実践的な使い方まで学べます。

Web Scraping

お気に入り 0GitHub 234

firecrawl-search

作成者 firecrawl

firecrawl-search は、ソースの発見や構造化検索を行い、必要に応じて Firecrawl CLI でページ全文を JSON として取得できる、Web調査向けのスキルです。

Web Research

お気に入り 0GitHub 234

parallel-web

作成者 K-Dense-AI

parallel-web は、parallel-cli を基盤にした Web リサーチと抽出のためのスキルです。Web 検索、URL からのコンテンツ抽出、ソースを使ったデータの補完、さらに学術・科学系ソースを優先した深掘りリサーチを支援します。parallel-web の使い方、Web リサーチ、引用、証拠ベースのワークフローに向いています。

Web Research

お気に入り 0GitHub 0

geomaster

作成者 K-Dense-AI

geomaster は、GIS、リモートセンシング、空間解析、地球観測のワークフローに対応する地理空間サイエンス系スキルです。ラスタ／ベクター操作、衛星画像処理、空間指標の算出、ワークフロー設計などのデータ分析タスクに使えます。geomaster ガイドを使えば、迷いを減らしながら、このスキルのインストール、内容確認、適用まで進められます。

Data Analysis

お気に入り 0GitHub 0

asc-aso-audit

作成者 rudrankriyam

asc-aso-auditは、`./metadata` にある正規の App Store メタデータを使ってオフラインでASO監査を行い、Astro MCPでキーワードの抜けを洗い出すのに役立ちます。`asc metadata pull` の後に asc-aso-audit スキルを使えば、`subtitle`、`keywords`、`description`、`whatsNew` を、勘に頼らず確認できます。

Data Analysis

お気に入り 0GitHub 0

ffuf-web-fuzzing

作成者 jthack

ffuf-web-fuzzing は、隠れたWebコンテンツの発見、ルートやパラメータのテスト、raw リクエスト、オートキャリブレーション、結果分析を使った認証済みターゲットのファジングに役立つ実践的なスキルです。ペネトレーションテストや Security Audit のワークフローで、再現性のある ffuf-web-fuzzing ガイドを必要とするセキュリティテスターに適しています。

Security Audit

お気に入り 0GitHub 0

web-to-markdown

作成者 softaworks

web-to-markdown は、ローカルの `web2md` CLI を使って公開中の Web ページを整った Markdown に変換する Format Conversion スキルです。JS 描画ページ、対話操作が必要なフロー、複数 URL の一括変換にも対応し、Chromium 系ブラウザを利用します。実行されるのは、名前を明示して呼び出した場合のみです。

Format Conversion

お気に入り 0GitHub 1.3k

firecrawl-agent

作成者 firecrawl

firecrawl-agentは、複雑で複数ページにまたがるWebサイトから構造化JSONを抽出したいときに役立つスキルです。Firecrawl CLI agentを使うべき場面、実行方法、schemaの追加、開始URLの指定、価格情報・商品一覧・ディレクトリ型データの出力保存までを判断しやすく紹介します。

Web Scraping

お気に入り 0GitHub 234

firecrawl-map

作成者 firecrawl

firecrawl-map は、サイト内のURLを見つけて一覧化するためのスキルです。検索フィルタ、件数制限、JSON出力、サイトマップモード、サブドメイン制御に対応しており、本格的な scraping や crawling の前段で使いやすく設計されています。

Web Scraping

お気に入り 0GitHub 234