firecrawl-download

作者 firecrawl

firecrawl-download 可協助你把整個網站或文件區段下載成整理好的本機檔案，輸出到 `.firecrawl/` 目錄下。它結合網站地圖探索與內容擷取，支援 markdown、連結與截圖，適合用來建立離線文件副本、批次保存頁面，以及處理實務上的 Web Scraping 工作流程。

Stars234

評論0

加入時間2026年3月31日

分類网页抓取

安裝指令

npx skills add firecrawl/cli --skill firecrawl-download

編輯評分

這個技能的評分為 73/100，代表已達到可收錄於目錄的水準：觸發情境清楚、工作流程也具體可行，但實際採用時仍需要一些自行摸索，因為儲存庫目前只有單一的 `SKILL.md`，除了指令範例之外，操作細節相對有限。

73/100

亮點

觸發性強：描述中明確點出像是「下載整個網站」、「建立離線副本」與「下載所有文件」等具體使用意圖。
對 agent 有實際槓桿效果：它把網站地圖探索與內容擷取整合成單一指令，並說明了 formats、screenshots、include-paths 與 limits 等實用選項。
範例具備可操作性：`SKILL.md` 提供了快速上手指令，並明確註記可使用 `-y` 略過確認提示。

注意事項

操作層面的深度仍有限：沒有支援檔案、參考資料、安裝說明，或是在面對失敗情況、規模限制與輸出管理時可依循的判斷規則。
此技能被明確標示為 experimental，對偏正式生產環境的 agent 工作流程來說，會提高一定的信任與穩定性風險。

Firecrawl Cli 抓取网站离线 Markdown

總覽

firecrawl-download 技能總覽

firecrawl-download 的用途

firecrawl-download 技能專門處理一件事：把整個網站或某個文件區段下載成有條理的本機檔案。它會先做站點探索，再逐頁抓取內容，最後把每一頁存到 .firecrawl/ 底下，格式可以是 markdown、截圖，或每頁多種輸出格式。

如果你想保留文件的離線副本、建立本機研究語料，或用可重複執行的方式大量保存頁面以便後續分析，這個技能特別實用。和一般泛用的 scraping prompt 相比，firecrawl-download 更適合整站或整個文件區的下載情境，因為你不需要從零設計整套 crawl workflow。

哪些人適合使用 firecrawl-download 技能

最適合的使用者包括：

想把技術文件存到本機的開發者
需要蒐集網站內容進行審閱的研究人員
想建立輕量內容封存的團隊
需要一套實用「把這個網站下載下來」流程、又不想靠大量猜測的 agents

如果你的真正目標是「把這個網站存成可用的本機檔案」，那麼這個技能會比寬泛的 web scraping prompt 更對路。

安裝前多數使用者最在意什麼

多數人是否安裝 firecrawl-download，通常取決於四個問題：

它能處理整個網站或整個文件區，而不只是單一頁面嗎？
它會把輸出存成實際可用的本機資料結構嗎？
它能限制抓取範圍，避免下載到不該抓的頁面嗎？
它支援 markdown、截圖等多種輸出類型嗎？

根據技能原始內容，這四題答案都是可以。主要要注意的是，它被標示為 experimental，因此更適合視為方便的工作流程工具，而不是經過高度強化的完整封存系統。

Web Scraping 工作流程中的關鍵差異

firecrawl-download for Web Scraping 的差異點，不只是單純抓取得強不強。真正有價值的是，這個指令把以下流程打包好了：

先做 site mapping
再進行 scraping
逐頁輸出成本機檔案
自動建立巢狀本機目錄
下載時可重用 scrape options

因此，在「下載整份 docs」這類需求上，它比只會回傳頁面內容的單純 scrape command 更值得安裝。

如何使用 firecrawl-download 技能

firecrawl-download 的安裝脈絡

從 repository 內容來看，這個技能位於 firecrawl/cli 的 skills/firecrawl-download。實際可行的安裝方式如下：

npx skills add https://github.com/firecrawl/cli --skill firecrawl-download

加入之後，先查看：

skills/firecrawl-download/SKILL.md

這個技能的支援檔案不多，所以 SKILL.md 就是最主要的依據來源。

先讀這個檔案

請先從這裡開始：

skills/firecrawl-download/SKILL.md

這個檔案能很快說清楚實際範圍：firecrawl download 是一個 experimental 的便利指令，會把 map 與 scrape 結合起來，將結果儲存在 .firecrawl/ 下，並支援在下載過程中使用 scrape options。

firecrawl-download 的基本用法

使用 firecrawl-download skill 最快的方式，就是直接指定 docs 或內容區的根網址：

firecrawl download https://docs.example.com

如果要做無人值守執行，技能內容明確建議使用：

firecrawl download https://docs.example.com -y

只要你想在 agentic 或 scripted workflow 中略過確認提示，就應該加上 -y。

讓技能發揮效果所需的輸入

像「download this site」這種太粗略的要求，通常不夠好。更理想的輸入應包含：

根 URL
你真正想抓的區段範圍
最大頁數
需要哪些輸出格式
是否需要截圖
要排除哪些內容

更完整的請求會像這樣：

「Use firecrawl-download to save https://docs.example.com locally as markdown with screenshots, include only /guides and /api, limit to 50 pages, and skip translated pages.`」

這樣技能在開始 scraping 之前，才有足夠資訊先 map 出正確範圍。

實務上最重要的指令模式

從原始內容可以看出幾個高價值用法：

# With screenshots
firecrawl download https://docs.example.com --screenshot --limit 20 -y

# Multiple formats per page
firecrawl download https://docs.example.com --format markdown,links --screenshot --limit 20 -y

# Filter by section
firecrawl download https://docs.example.com --include-paths "/features,/sdks"

這些範例之所以重要，是因為它們直接對應實際導入時最常見的阻礙：抓太多內容、抓錯區段，或輸出精細度不夠。

本機會寫出哪些內容

這個技能會把輸出存到 .firecrawl/ 底下的巢狀目錄。若你要求多種格式，每一頁可能會產生各自獨立的檔案，例如：

index.md
links.txt
screenshot.png

這種本機檔案組織方式，正是選擇 firecrawl-download install 而不是一次性 scrape prompt 的主要理由之一。

如何把模糊目標改寫成可執行的 prompt

如果你最初只想到：

「download this docs site」

建議改寫成以下資訊：

目標 URL
想抓的區段篩選條件
檔案格式
是否需要 screenshot
頁數上限
任何排除條件

給 agent 的範例 prompt：

「Use the firecrawl-download skill to download https://docs.example.com for offline use. Save as markdown plus screenshots, include only /getting-started,/api, cap at 30 pages, and use -y so the run is non-interactive.`」

這樣效果會更好，因為它把範圍與輸出都講清楚了，不留模糊空間。

取得穩定結果的建議 workflow

實際可行的 firecrawl-download guide workflow 如下：

先從最小但仍有價值的 docs 區段開始。
在提高頁數前，先加上 --include-paths。
第一次先搭配 --limit 執行。
檢查 .firecrawl/ 的輸出結構。
只有在真的需要時，再加入 --screenshot 或多格式輸出。
第一批樣本正確後，再擴大 crawl 範圍。

這樣可以避開常見失敗情境：一開始就下載太多、太快失控。

什麼時候該用 firecrawl-download，而不是一般 scrape

當你需要以下情況時，適合使用 firecrawl-download usage：

很多頁，不是一頁
要的是本機檔案，而不只是回傳文字
需要可瀏覽的離線副本
想快速保存一份 docs snapshot 以供審閱或參考

如果你只需要單一頁面，或是需要高度客製的擷取邏輯，一般 scrape 反而比較合適。firecrawl-download 的核心價值，在於用更快的 workflow 把整個網站層級的內容保存下來。

需要提早知道的限制與取捨

根據技能原始內容，最重要的實務限制包括：

它被標示為 experimental
它是以便利指令為優先設計
輸出品質仍會受到目標網站結構與範圍篩選影響
如果不設限制就做大範圍執行，結果可能很雜或超出需求

所以，這個技能非常適合有控制條件的 docs 下載，但不代表它能保證達到完美、完整的封存結果。

firecrawl-download 技能 FAQ

firecrawl-download 適合新手嗎？

適合，尤其是你的需求只是單純「把 docs 存到本機」。它的指令範例很直接，互動式 wizard 也有幫助。不過新手仍然應該先從較小的 --limit 和較窄的 --include-paths 開始，避免一次下載過大。

它和泛用 AI scraping prompt 的真正差別是什麼？

泛用 prompt 可以描述任務，但 firecrawl-download 已經把實用模式預先編碼好了：先 map 站點、逐頁 scrape，再把檔案存進目錄。這能減少設定摩擦，也讓整體 workflow 更容易重複執行。

firecrawl-download 只適合文件網站嗎？

不是，但文件網站是最明確、最合適的使用情境。它最適合頁面結構和路徑規則相對可預期的網站。若網站高度動態，或範圍界線很難控制，可能就需要更細的篩選，甚至改用其他方法。

firecrawl-download 可以存超過 markdown 以外的格式嗎？

可以。技能原始內容明確展示了每頁多格式輸出，以及可選的 screenshots。這點很重要，因為有些情境不只需要可閱讀文字，也需要保留視覺畫面做輔助記錄。

什麼情況下不該用 firecrawl-download？

如果你只需要以下情況，就不建議使用 firecrawl-download：

一頁內容
自訂擷取 schema
在 scrape 當下做深度後處理
需要有更嚴格保證、完整穩健的 archival pipeline

這些情境下，範圍更窄的 scrape command 或更客製化的 workflow，通常會更適合。

如何改善 firecrawl-download 技能的使用效果

先幫 firecrawl-download 收斂範圍

要改善 firecrawl-download 結果，最簡單的方法就是降低模糊性。請優先使用：

--include-paths
--limit
明確的 docs root URL

一個有範圍控制的 20 頁執行，通常會比不受控的整站下載更有用。

依照實際下游工作選擇輸出

不要預設把所有格式都打開。應該根據下一步用途來選：

markdown：適合閱讀、搜尋與 LLM ingestion
links：適合重視結構關係的情境
--screenshot：適合需要版面或 UI 證據時

這樣能讓執行更輕量，也更容易檢查輸出內容。

先做 sample run，再進行完整下載

一個很實用的迭代模式是：

firecrawl download https://docs.example.com --include-paths "/api" --limit 10 -y

先檢查儲存下來的檔案，再決定是否擴大到更多區段或更高頁數。這樣能在早期就發現錯誤的範圍設定。

常見失敗模式與避開方式

典型問題包括：

下載到錯的區段
抓了太多頁
自動化執行時忘了加 -y
要求了其實不需要的輸出

解法其實很直接：先指定範圍、第一次先限制頁數，並且有意識地選擇輸出格式。

針對 agent 驅動使用方式，提升 prompt 品質

如果是由 agent 呼叫這個技能，請在要求中明確包含：

精確的起始 URL
想要本機輸出的用途
要包含哪些區段
要避開哪些區段
輸出格式
執行頁數上限

好的 prompt 例如：

「Use firecrawl-download to create an offline markdown copy of https://docs.example.com, only for /guides and /reference, with screenshots for each page, limited to 40 pages, and save non-interactively.`」

這會比單純說「download the docs」得到更好的執行結果。

拿到第一批輸出後，該如何迭代

完成第一輪之後，請檢查：

.firecrawl/ 裡是否真的包含你預期的頁面？
無關頁面是不是太多？
你真的需要 screenshots，還是文字就夠了？
下一輪應該放寬還是收窄 include paths？

要改善 firecrawl-download skill 的最佳做法，不是盲目重跑，而是根據第一批實際產出的結果，調整抓取範圍與輸出選項。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

huggingface-datasets

作者 huggingface

使用 huggingface-datasets 技能來處理 Hugging Face Dataset Viewer API 工作流程：驗證資料集、解析 splits、預覽與分頁列資料、搜尋文字、套用篩選條件，並取得 parquet 連結或統計資訊。這是一份實用的 huggingface-datasets 指南，適合只讀的資料集探索。

网页抓取

收藏 0GitHub 10.4k

data-scraper-agent

作者 affaan-m

data-scraper-agent 協助建立可重複執行的公開資料流程，用於網頁爬取、資料增補與儲存。它適合搭配 GitHub Actions 依排程監控工作、價格、新聞、repo、體育賽事與清單，並將結果輸出到 Notion、Sheets 或 Supabase。最適合持續追蹤，不適合一次性擷取。

网页抓取

收藏 0GitHub 156.1k

baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可透過內建的 baoyu-fetch CLI，搭配 Chrome CDP、網站 adapter 與通用 fallback，將即時 URL 轉成 Markdown。使用前建議先確認 Bun 執行環境需求、首次 EXTEND.md 設定流程，以及在 X、YouTube、Hacker News 和需渲染頁面上的實際用法。

格式转换

收藏 0GitHub 13.2k

x-twitter-scraper

作者 Xquik-dev

使用 x-twitter-scraper 透過 Xquik 擷取 X（Twitter）資料與需要確認的動作。它支援貼文搜尋、使用者查詢、粉絲擷取、媒體下載、監控、webhooks、MCP 與寫入動作。最適合搭配 API key 進行類網頁爬蟲的研究，不適合使用 X 登入憑證。

网页抓取

收藏 0GitHub 71

exa-search

作者 K-Dense-AI

exa-search 是一項由 Exa 驅動的網頁研究技能，可用來尋找最新資訊並從 URL 擷取內容。適合用於搜尋、來源發掘、文章與 PDF 擷取，以及具備語意檢索、類學術篩選與清楚安裝／使用指引的技術或科學研究。

Web 研究

收藏 0GitHub 0

browser-use

作者 browser-use

browser-use 是一款用於瀏覽器自動化的技能，可開啟頁面、檢查目前狀態、點擊已編號元素、在欄位中輸入內容、擷取螢幕畫面，並重用持續性的瀏覽器工作階段。若你需要透過 browser-use CLI 穩定完成表單填寫、頁面導覽或登入後流程，這項技能很適合納入評估。

瀏覽器自動化

收藏 0GitHub 84.9k

remote-browser

作者 browser-use

remote-browser 可讓受沙箱限制的代理控制無頭瀏覽器，執行 Browser Automation。你可以用它開啟頁面、檢查目前狀態、點擊帶索引的元素、輸入內容、擷取螢幕截圖，並連線到本機應用程式或支援 CDP 的瀏覽器工作階段。

瀏覽器自動化

收藏 0GitHub 84.9k

firecrawl

作者 firecrawl

firecrawl skill 可協助你安裝、驗證並使用官方 Firecrawl CLI，進行網頁擷取、搜尋、爬取與頁面互動。內容涵蓋安裝設定、`firecrawl --status`、登入流程、將輸出安全寫入 `.firecrawl/`，以及依據 repo 整理的實用使用模式。

网页抓取

收藏 0GitHub 234

firecrawl-search

作者 firecrawl

firecrawl-search 是一個用於網頁研究的 skill，可協助找資料來源、執行結構化搜尋，並透過 Firecrawl CLI 視需要將完整頁面內容擷取為 JSON。

Web 研究

收藏 0GitHub 234

parallel-web

作者 K-Dense-AI

parallel-web 是一個由 parallel-cli 驅動的網頁研究與擷取技能。它可協助你搜尋網路、擷取 URL 內容、從來源補強資料，並進行更深入的研究，且預設優先使用學術與科學來源。適合用於 parallel-web 使用、網頁研究、引用蒐集，以及以證據為先的工作流程。

Web 研究

收藏 0GitHub 0

geomaster

作者 K-Dense-AI

geomaster 是一個地理空間科學技能，適用於 GIS、遙測、空間分析與地球觀測工作流程。可用在資料分析任務中，例如柵格與向量操作、衛星影像處理、空間指標計算與工作流程規劃。geomaster 指南可幫助你安裝、檢視並應用這個技能，少一點猜測、多一點把握。

数据分析

收藏 0GitHub 0

asc-aso-audit

作者 rudrankriyam

asc-aso-audit 可協助你在 `./metadata` 上對 Canonical App Store 中繼資料執行離線 ASO 稽核，再透過 Astro MCP 找出關鍵字缺口。搭配 `asc metadata pull` 後使用 asc-aso-audit skill，可更有把握地檢視 `subtitle`、`keywords`、`description` 和 `whatsNew`。

数据分析

收藏 0GitHub 0

ffuf-web-fuzzing

作者 jthack

ffuf-web-fuzzing 是一項實用技能，可用來發掘隱藏網頁內容、測試路由與參數，並透過原始請求、自動校準與結果分析對受認證目標進行模糊測試。它適合需要一份可重複使用的 ffuf-web-fuzzing 指南、用於滲透測試與 Security Audit 工作流程的資安測試人員。

安全稽核

收藏 0GitHub 0

web-to-markdown

作者 softaworks

web-to-markdown 是一個用於格式轉換的 skill，可透過本機 `web2md` CLI，將即時網頁整理成乾淨的 Markdown；面對 JS 渲染頁面、互動式流程與批次 URL 轉換時，會搭配 Chromium 系列瀏覽器處理。只有在明確以名稱呼叫時才會執行。

格式转换

收藏 0GitHub 1.3k

firecrawl-agent

作者 firecrawl

firecrawl-agent 可從複雜、跨多頁的網站擷取結構化 JSON。本文說明什麼情況適合使用、如何執行 Firecrawl CLI agent、加入 schema、設定起始 URLs，並將輸出保存為定價、商品與目錄型資料擷取結果。

网页抓取

收藏 0GitHub 234

firecrawl-map

作者 firecrawl

firecrawl-map 可協助代理在深入 scraping 或 crawling 前，先探索並列出網站上的 URL，並支援搜尋篩選、筆數限制、JSON 輸出、sitemap 模式與子網域控制等選項。

网页抓取

收藏 0GitHub 234