firecrawl-scrape

作者 firecrawl

firecrawl-scrape 可從已知 URL 擷取乾淨、適合 LLM 使用的內容，也支援經 JavaScript 渲染的頁面。可透過 Firecrawl CLI 或 `npx firecrawl` 抓取 markdown、連結，或取得針對特定頁面的回答。

Stars234

評論0

加入時間2026年3月31日

分類网页抓取

安裝指令

npx skills add firecrawl/cli --skill firecrawl-scrape

編輯評分

這個技能的評分為 72/100，代表對想找明確 URL 擷取指令的目錄使用者而言，列入清單是合理的；但若作為安裝決策頁面，完整度仍不算突出。從儲存庫內容來看，它在觸發意圖辨識與實作指令範例方面表現不錯，能清楚支援將靜態或 JS 渲染頁面擷取為 markdown，也涵蓋多個 URL、輸出格式與查詢式擷取。不過，整體採用判斷資訊仍受限於頂層描述過於精簡、`SKILL.md` 未提供安裝指令，以及缺少支援檔案與更深入的操作指引。

72/100

亮點

描述中的觸發線索很明確，能把使用者像是「scrape」、「fetch」與「read this webpage」這類意圖直接對應到這個技能。
快速上手範例提供了具體使用情境：基本擷取、僅主內容、等待 JS、同時處理多個 URL、替代輸出格式，以及頁面查詢。
相較於泛用型提示詞，這個技能的操作價值更明確：它會引導代理使用 `firecrawl scrape`／`npx firecrawl`、保存輸出結果，並在網頁擷取情境下優先使用它而非 WebFetch。

注意事項

`SKILL.md` 沒有包含安裝指令，因此使用者在實際執行前，仍需依賴外部資訊先完成 CLI 設定。
除了單一 markdown 檔之外，儲存庫的支援內容偏少；沒有可用於疑難排解、auth/setup 或邊界情況處理的腳本、參考資料或配套資源。

Firecrawl 抓取网站 Markdown Cli 浏览器自动化

總覽

firecrawl-scrape 技能總覽

firecrawl-scrape 是做什麼的

firecrawl-scrape 這個技能適合在你已經知道 URL 的情況下，從一個或多個網頁擷取乾淨、適合 LLM 使用的內容。它的設計重點是實用的頁面擷取，不是大範圍的網站探索：你提供頁面網址，它就會回傳結構化輸出，例如 markdown、links，或根據該頁面直接回答查詢結果。

哪些人適合使用 firecrawl-scrape

firecrawl-scrape 很適合需要穩定取得以下頁面內容的使用者：

文件頁面
部落格文章
價格方案頁
產品頁
JavaScript 渲染網站與 SPA

如果一般的 fetch 工具在 client-rendered 頁面上失效，或只回傳一堆不適合直接餵給 LLM 的雜亂 HTML，這個技能特別實用。

使用者真正想解決的工作

多數人其實不是抽象地想做「web scraping」。他們通常想完成的是以下其中一種結果：

把頁面讀成 markdown，供後續分析
只抓主要內容，排除頁首與頁尾
在頁面文字之外，一併擷取 links
對某個已知 URL 提出聚焦問題
平行抓取多個已知 URL

這正是 firecrawl-scrape 比單純下提示「讀這個網頁」更有優勢的地方。

為什麼使用者會選 firecrawl-scrape，而不是一般 fetch

firecrawl-scrape 的主要差異點，在於它是為網頁內容擷取而設計，包含支援 JS-rendered 頁面，且回傳結果針對 LLM 工作流程做了最佳化。上游技能也明確指出：做網頁內容擷取時，應優先使用它，而不是 WebFetch。如果你平常的瀏覽器或 fetch 流程抓不到渲染後內容、被導覽元素干擾，或缺少 link context，這點就很重要。

一眼看懂：適合與不適合的情境

適合：

你已經有明確 URL
你要的是頁面內容，不是整站探索
你需要 markdown 或 links 這種可供機器處理的格式
頁面內容可能需要等待渲染後才會出現

不適合：

你還需要先找出 URL
你需要整站走訪
你需要的不只是抓頁面，還包含互動操作
你只要簡單抓靜態 HTML，而且已經信任其他工具

如何使用 firecrawl-scrape 技能

firecrawl-scrape 的安裝與使用前提

這個技能位於 firecrawl/cli repository 的 skills/firecrawl-scrape。技能本身其實是 Firecrawl CLI 的呼叫指引，所以實際前提是你要能使用 firecrawl 指令，或 npx firecrawl。技能中的範例兩種寫法都有：

firecrawl scrape ...
npx firecrawl ...

如果你的環境裡還沒有可直接使用的 CLI，優先用 npx firecrawl 會比較省去前置安裝麻煩。

firecrawl-scrape 需要什麼輸入

最基本來說，firecrawl-scrape 需要一個明確 URL。接下來輸出品質，會取決於你是否補充這些條件：

需要的輸出格式：markdown、links，或兩者都要
是否只保留主要內容
頁面是否需要用 --wait-for 等待渲染
是否想把原始頁面內容存成檔案
是否希望用 --query 直接得到聚焦答案

這不是拿來處理「幫我研究這家公司」這種模糊目標的技能。它適合的是「抓這個明確頁面，並回傳有用的結果」。

第一次最容易成功的起手命令

如果你只是想拿到可讀的頁面內容，建議先從這裡開始：

firecrawl scrape "<url>" -o .firecrawl/page.md

如果頁面充滿導覽列或側邊欄雜訊，可以改用：

firecrawl scrape "<url>" --only-main-content -o .firecrawl/page.md

如果頁面是 SPA，或內容會在渲染後才載入：

firecrawl scrape "<url>" --wait-for 3000 -o .firecrawl/page.md

什麼時候該用 main-content 模式

--only-main-content 是 firecrawl-scrape 最有價值的選項之一，因為它經常能明顯提升後續摘要與擷取品質。當你的目標是以下情境時，特別建議使用：

摘要文章內容
擷取產品或價格資訊
把內容送進下一個 LLM 步驟
減少 menu、footer 與重複頁面框架造成的 token 浪費

如果你明確需要導覽 links 或頁面周邊版面脈絡，就不要開這個選項。

如何處理 JavaScript 渲染頁面

很多人導入時會卡在一種情況：頁面在瀏覽器裡看起來正常，但用一般 fetch 方法抓回來卻是殘缺內容。firecrawl-scrape 透過可感知渲染的抓取方式來處理這件事。實務上，如果內容是晚一點才出現，就加上 --wait-for，例如 3000 這種合理延遲。

以下情況適合等待渲染：

產品規格是在頁面載入後才補上
文件內容是 client-side hydration
價格表要等 scripts 跑完才出現

不要一開始就預設加很長的等待時間。先從較小延遲開始，只有在輸出明顯缺內容時再往上加。

如何有效率地抓取多個 URL

firecrawl-scrape 支援在同一個命令中放入多個 URL，而且技能說明也提到它們會並行抓取。這很適合小規模、已知頁面的批次工作，例如：

幾個文件頁面
首頁、價格頁與 FAQ
你已經挑好的多篇部落格文章

範例：

firecrawl scrape https://example.com https://example.com/blog https://example.com/docs

如果你已經知道目標頁面，這會比直接做 crawl 更合適。

如何同時取得 markdown 和 links

如果你的下一步同時需要可讀內容與頁面參考資訊，可以要求多種格式一起輸出：

firecrawl scrape "<url>" --format markdown,links -o .firecrawl/page.json

這對以下工作流程特別實用：

先擷取內容，再檢查外部 links
建立帶引用脈絡的筆記
分離正文文字、導覽元素與參照目的地

如果你之後要做結構化後處理，而不是只要一個 markdown 檔，請選擇 JSON 輸出。

如何用 firecrawl-scrape 回答特定問題

firecrawl-scrape usage 其中一個最實用的模式，是在抓取時直接對頁面提問：

firecrawl scrape "https://example.com/pricing" --query "What is the enterprise plan price?"

這在以下情況效果最好：

答案很可能就在單一頁面上
你要的是聚焦擷取，而不是整頁人工閱讀
你想減少手動閱讀時間

如果答案分散在多個頁面，或需要比對多份文件，這種做法就沒那麼適合。

把模糊需求改寫成有效提示

弱的需求：

「把這個網站抓下來，告訴我重點。」

強的需求：

「Use firecrawl-scrape on https://example.com/pricing with --only-main-content. Save markdown to .firecrawl/pricing.md. Then extract plan names, monthly prices, annual billing notes, and enterprise contact language.」

為什麼這樣更好：

指定了明確 URL
選對了輸出模式
定義了抓完後要擷取的內容
降低了範圍模糊的問題

firecrawl-scrape for Web Scraping 的建議工作流程

一個實用的 firecrawl-scrape 流程通常是：

先確認你拿到的是精確頁面 URL。
先從 markdown 擷取開始。
如果頁面很雜，加入 --only-main-content。
如果缺少渲染後內容，加入 --wait-for。
如果 links 結構很重要，改用 --format markdown,links。
只有在任務很聚焦、且答案侷限於單頁時，再使用 --query。

這也符合上游對 scrape 的定位：它是較大流程中的中間步驟，順序通常是 search → scrape → map → crawl → interact。

在 repository 裡先看哪些檔案

先讀 skills/firecrawl-scrape/SKILL.md。幾乎所有實用價值都集中在這個檔案裡：

什麼情況該用這個技能
quick-start 指令
支援的選項
使用技巧

由於這個技能目錄條目偏向安裝決策導向，安裝前最重要的結論其實很簡單：原始文件很精簡，沒有其他必看 helper scripts 或 references，需要你先研究完才能上手。

會直接影響輸出品質的實務採用技巧

以下幾個選擇，對結果影響往往特別大：

優先給精確 URL，不要只給頂層網域。
分析導向任務時，使用 --only-main-content。
只有在輸出明顯不完整時，才加 --wait-for。
把輸出存到 .firecrawl/，先檢查原始結果，再串接後續自動化。
--query 適合頁面內可回答的事實，不適合開放式研究。

這些小決策，通常比多補幾句 prompt wording 更重要。

firecrawl-scrape 技能 FAQ

firecrawl-scrape 比直接貼 URL 下普通 prompt 更好嗎？

通常是，前提是你的工作真的是網頁內容擷取。firecrawl-scrape skill 提供明確的呼叫方式、支援 JS-rendered 頁面、可回傳 markdown 或 links，也提供針對 scraping 的選項。一般 prompt 在簡單閱讀任務上或許可行，但只要頁面需要渲染，或你需要更乾淨的輸出結構，穩定性通常就不如 firecrawl-scrape。

什麼時候該用 firecrawl-scrape，而不是 WebFetch？

當你要做的是網頁內容擷取時，就應該用 firecrawl-scrape。上游技能也明確建議在這類用途下優先使用它，而不是 WebFetch。這個建議特別適用於需要處理 rendered pages、產出更乾淨 markdown，或要求 CLI 行為可重現的 scraping 流程。

firecrawl-scrape 對新手友善嗎？

算是友善，至少相較於很多 scraping 工具來說是如此。第一次上手路徑很短：給一個 URL、跑指令、檢查輸出。你不需要先理解完整的 crawling 策略，就能得到實際價值。新手最需要先理解的一點是：這是頁面抓取，不是整站探索。

firecrawl-scrape 能處理 SPA 和動態頁面嗎？

可以，這正是它存在的核心原因之一。如果頁面依賴 JavaScript rendering，必要時就用 --wait-for，讓內容有時間出現後再擷取。

什麼情況下 firecrawl-scrape 不是對的選擇？

以下情況建議避免使用：

你還不知道目標 URL
你需要大範圍網域探索
你需要遞迴式整站走訪
你的任務需要互動，而不只是擷取
答案必須從很多你尚未辨識的頁面綜合而來

遇到這些情況，search、map、crawl 或其他工具會是更好的第一步。

我需要安裝整個 repository 才能用嗎？

你需要能使用技能所依賴的 Firecrawl CLI 行為，但技能本身很輕量。就安裝決策來看，這個 repository 的額外負擔不高：實用說明都集中在 SKILL.md，也沒有其他你必須先熟悉的 companion scripts 或 resource folders。

如何改善 firecrawl-scrape 的使用效果

給 firecrawl-scrape 更明確、更窄的目標

最常見的品質問題，就是意圖太寬。像下面這類請求通常效果更好：

「擷取價格表」
「回傳 markdown 加 links」
「從這個頁面回答一個問題」

而不是：

「把所有有用的東西都抓下來」

頁面任務越聚焦，後續清理工作就越少。

用具備頁面意識的指示改善輸入

強而有力的輸入，通常會把 URL、輸出模式與擷取目標一起講清楚。範例：

firecrawl scrape "https://example.com/docs/auth" \
  --only-main-content \
  -o .firecrawl/auth.md

接著再明確告訴代理要如何處理這個檔案：

摘要設定步驟
列出必要 headers
擷取程式碼範例
比較不同 auth 方法

這種兩階段模式，通常比在一個模糊請求裡同時要求抓取與分析，更可靠。

先修正缺內容問題，再考慮改整個流程

如果輸出看起來太薄，第一步先測試頁面是否需要等待渲染：

firecrawl scrape "<url>" --wait-for 3000 -o .firecrawl/page.md

很多使用者太早換工具，實際問題其實只是頁面還沒渲染完成。

在下游分析前先降噪

如果結果充滿導覽列、cookie 文字或 footer 內容，可以改用：

firecrawl scrape "<url>" --only-main-content -o .firecrawl/page.md

這通常會改善：

摘要品質
擷取精準度
token 使用效率
類似頁面之間的一致性

打算自動化時，優先使用結構化輸出

如果抓下來的頁面還要送進下一個步驟，最好一開始就要求結構化格式，而不是之後再回頭解析 markdown：

firecrawl scrape "<url>" --format markdown,links -o .firecrawl/page.json

這也會讓 firecrawl-scrape install 的判斷更容易：如果你的流程依賴對 links 有感知的自動化，這個技能就會比單純文字 fetch 工具更對位。

先跑第一次，再迭代，不要一開始就設計過頭

一個高效率的 firecrawl-scrape guide 使用模式是：

先跑最簡單的 scrape
檢查哪裡缺漏或雜訊過多
只加一個選項來修正那個具體問題
重跑並比較結果

常見的迭代路徑：

baseline scrape
加上 --only-main-content
加上 --wait-for
加上 --format markdown,links
用 --query 做直接擷取

這比你在還沒看過頁面輸出前，就先設計一個很複雜的命令更有效率。

常見失敗模式要注意什麼

最常見、也最實際的問題包括：

明明真正目標是子頁面，卻拿 homepage 去抓
期待 scrape 表現得像 crawl
沒有等待 JS-rendered 內容完成
問了需要跨多頁才能回答的 --query
只保存最終摘要，沒保存原始抓取輸出

這些多半都能透過更清楚的範圍界定，加上一輪輸出檢查來避免。

進階使用者如何把 firecrawl-scrape 用得更好

進階使用者通常不是把 scrape 本身弄得更複雜，而是把 firecrawl-scrape 和後續步驟組合得更好。常見且有效的模式是：

先把精確頁面乾淨抓下來
保存原始輸出
再進行擷取、比較或綜合分析

這樣能讓 firecrawl-scrape for Web Scraping 專注在它最擅長的頁面擷取層。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

huggingface-datasets

作者 huggingface

使用 huggingface-datasets 技能來處理 Hugging Face Dataset Viewer API 工作流程：驗證資料集、解析 splits、預覽與分頁列資料、搜尋文字、套用篩選條件，並取得 parquet 連結或統計資訊。這是一份實用的 huggingface-datasets 指南，適合只讀的資料集探索。

网页抓取

收藏 0GitHub 10.4k

data-scraper-agent

作者 affaan-m

data-scraper-agent 協助建立可重複執行的公開資料流程，用於網頁爬取、資料增補與儲存。它適合搭配 GitHub Actions 依排程監控工作、價格、新聞、repo、體育賽事與清單，並將結果輸出到 Notion、Sheets 或 Supabase。最適合持續追蹤，不適合一次性擷取。

网页抓取

收藏 0GitHub 156.1k

baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可透過內建的 baoyu-fetch CLI，搭配 Chrome CDP、網站 adapter 與通用 fallback，將即時 URL 轉成 Markdown。使用前建議先確認 Bun 執行環境需求、首次 EXTEND.md 設定流程，以及在 X、YouTube、Hacker News 和需渲染頁面上的實際用法。

格式转换

收藏 0GitHub 13.2k

x-twitter-scraper

作者 Xquik-dev

使用 x-twitter-scraper 透過 Xquik 擷取 X（Twitter）資料與需要確認的動作。它支援貼文搜尋、使用者查詢、粉絲擷取、媒體下載、監控、webhooks、MCP 與寫入動作。最適合搭配 API key 進行類網頁爬蟲的研究，不適合使用 X 登入憑證。

网页抓取

收藏 0GitHub 71

exa-search

作者 K-Dense-AI

exa-search 是一項由 Exa 驅動的網頁研究技能，可用來尋找最新資訊並從 URL 擷取內容。適合用於搜尋、來源發掘、文章與 PDF 擷取，以及具備語意檢索、類學術篩選與清楚安裝／使用指引的技術或科學研究。

Web 研究

收藏 0GitHub 0

browser-use

作者 browser-use

browser-use 是一款用於瀏覽器自動化的技能，可開啟頁面、檢查目前狀態、點擊已編號元素、在欄位中輸入內容、擷取螢幕畫面，並重用持續性的瀏覽器工作階段。若你需要透過 browser-use CLI 穩定完成表單填寫、頁面導覽或登入後流程，這項技能很適合納入評估。

瀏覽器自動化

收藏 0GitHub 84.9k

remote-browser

作者 browser-use

remote-browser 可讓受沙箱限制的代理控制無頭瀏覽器，執行 Browser Automation。你可以用它開啟頁面、檢查目前狀態、點擊帶索引的元素、輸入內容、擷取螢幕截圖，並連線到本機應用程式或支援 CDP 的瀏覽器工作階段。

瀏覽器自動化

收藏 0GitHub 84.9k

firecrawl

作者 firecrawl

firecrawl skill 可協助你安裝、驗證並使用官方 Firecrawl CLI，進行網頁擷取、搜尋、爬取與頁面互動。內容涵蓋安裝設定、`firecrawl --status`、登入流程、將輸出安全寫入 `.firecrawl/`，以及依據 repo 整理的實用使用模式。

网页抓取

收藏 0GitHub 234

firecrawl-search

作者 firecrawl

firecrawl-search 是一個用於網頁研究的 skill，可協助找資料來源、執行結構化搜尋，並透過 Firecrawl CLI 視需要將完整頁面內容擷取為 JSON。

Web 研究

收藏 0GitHub 234

parallel-web

作者 K-Dense-AI

parallel-web 是一個由 parallel-cli 驅動的網頁研究與擷取技能。它可協助你搜尋網路、擷取 URL 內容、從來源補強資料，並進行更深入的研究，且預設優先使用學術與科學來源。適合用於 parallel-web 使用、網頁研究、引用蒐集，以及以證據為先的工作流程。

Web 研究

收藏 0GitHub 0

geomaster

作者 K-Dense-AI

geomaster 是一個地理空間科學技能，適用於 GIS、遙測、空間分析與地球觀測工作流程。可用在資料分析任務中，例如柵格與向量操作、衛星影像處理、空間指標計算與工作流程規劃。geomaster 指南可幫助你安裝、檢視並應用這個技能，少一點猜測、多一點把握。

数据分析

收藏 0GitHub 0

asc-aso-audit

作者 rudrankriyam

asc-aso-audit 可協助你在 `./metadata` 上對 Canonical App Store 中繼資料執行離線 ASO 稽核，再透過 Astro MCP 找出關鍵字缺口。搭配 `asc metadata pull` 後使用 asc-aso-audit skill，可更有把握地檢視 `subtitle`、`keywords`、`description` 和 `whatsNew`。

数据分析

收藏 0GitHub 0

ffuf-web-fuzzing

作者 jthack

ffuf-web-fuzzing 是一項實用技能，可用來發掘隱藏網頁內容、測試路由與參數，並透過原始請求、自動校準與結果分析對受認證目標進行模糊測試。它適合需要一份可重複使用的 ffuf-web-fuzzing 指南、用於滲透測試與 Security Audit 工作流程的資安測試人員。

安全稽核

收藏 0GitHub 0

web-to-markdown

作者 softaworks

web-to-markdown 是一個用於格式轉換的 skill，可透過本機 `web2md` CLI，將即時網頁整理成乾淨的 Markdown；面對 JS 渲染頁面、互動式流程與批次 URL 轉換時，會搭配 Chromium 系列瀏覽器處理。只有在明確以名稱呼叫時才會執行。

格式转换

收藏 0GitHub 1.3k

firecrawl-agent

作者 firecrawl

firecrawl-agent 可從複雜、跨多頁的網站擷取結構化 JSON。本文說明什麼情況適合使用、如何執行 Firecrawl CLI agent、加入 schema、設定起始 URLs，並將輸出保存為定價、商品與目錄型資料擷取結果。

网页抓取

收藏 0GitHub 234

firecrawl-map

作者 firecrawl

firecrawl-map 可協助代理在深入 scraping 或 crawling 前，先探索並列出網站上的 URL，並支援搜尋篩選、筆數限制、JSON 輸出、sitemap 模式與子網域控制等選項。

网页抓取

收藏 0GitHub 234