firecrawl-map

作者 firecrawl

firecrawl-map 可協助代理在深入 scraping 或 crawling 前，先探索並列出網站上的 URL，並支援搜尋篩選、筆數限制、JSON 輸出、sitemap 模式與子網域控制等選項。

Stars234

評論0

加入時間2026年3月31日

分類网页抓取

安裝指令

npx skills add firecrawl/cli --skill firecrawl-map

編輯評分

此技能評分為 76/100，代表它是相當穩健的目錄收錄候選：代理可獲得清楚的觸發線索、具體的 CLI 範例，以及足以實際上手的選項涵蓋，比起泛用提示可少靠不少猜測。對目錄使用者而言，這些資訊已足以做出有根據的安裝判斷，但也應預期這是一頁相對精簡的技能頁面，對特殊情境與設定步驟的說明不多。

76/100

亮點

觸發性非常強：描述中直接點出明確的使用意圖，例如「map the site」、「find the URL for」與「list all pages」。
操作示例清楚，提供了實際指令，涵蓋針對性搜尋與完整 URL 探索，也包含輸出檔案與 JSON 模式。
在更大工作流程中具實用延展性：它將 map 定位為 search → scrape → map → crawl → interact 流程中的一個步驟。

注意事項

安裝／導入資訊仍有限，因為此技能在 SKILL.md 中未提供 install 指令或設定引導。
支援材料偏少：沒有 scripts、references、resources，也未明確說明限制條件或邊界情境。

Firecrawl Cli 抓取网站工作流 JSON

總覽

firecrawl-map skill 概覽

firecrawl-map 的功能是什麼

firecrawl-map 是一個專門用來發現網站 URL 的聚焦型 skill。當你已知網域、但還不知道確切頁面在哪裡，或是在進行 scraping、crawl、內容擷取之前，想先快速盤點網站結構時，它特別好用。

誰適合使用 firecrawl-map skill

最適合使用 firecrawl-map skill 的，是在做網頁研究、網站探索，或前期爬取規劃的人：

在深入擷取前，先需要找出正確頁面的 AI agents
建置 web scraping 工作流程的開發者
稽核網站公開 URL 足跡的研究人員
想先快速拿到 URL 清單、但不想直接啟動完整 crawl 的操作人員

真正要解決的工作需求

多數使用者想要的其實不是「把所有頁面都抓出來」本身，而是想回答這類問題：

「這個網站的 authentication 文件在哪一頁？」
「在我開始 scrape 之前，這個網域底下有哪些頁面？」
「有沒有 sitemap 可用，能更快找到 URL？」
「我應該先 map，還是直接進 crawl？」

因此，firecrawl-map for Web Scraping 特別適合作為探索階段的工具，而不是最後的資料擷取步驟。

為什麼大家會選 firecrawl-map

它的主要差異點在於速度，以及對範圍的掌控。和「幫我找 docs 頁面」這種通用 prompt 相比，firecrawl-map skill 提供的是可重現的 CLI 路徑：你可以列出 URL、用搜尋詞過濾，並把輸出匯出給後續流程使用。

從 repository 可以看出的主要優勢包括：

可直接用 firecrawl map 透過 CLI 操作
大型網站可搭配 --search 做篩選
URL 清單可輸出為文字或 JSON
支援選擇 sitemap 策略
很適合放在 search 與更深入 crawl／scrape 工作之間，作為中間步驟

它不適合拿來做什麼

當你需要以下能力時，firecrawl-map 就不是對的工具：

擷取完整頁面內容
互動式瀏覽
對每一頁進行詳細的結構化 scraping
超出 URL 發現範圍之外的複雜網站遍歷邏輯

在這些情境中，mapping 是前置準備，不是終點。

如何使用 firecrawl-map skill

firecrawl-map skill 的安裝與執行前提

這個 skill 位於 firecrawl/cli repository 的 skills/firecrawl-map。它設計給能執行下列指令的環境使用：

firecrawl *
npx firecrawl *

如果你的 agent 或本機工作流程可以執行 Bash 指令，通常以下這條 firecrawl-map 安裝／使用路徑就夠了：

npx firecrawl map "<url>" --limit 100

如果你的環境已經全域安裝 Firecrawl CLI，則可改用：

firecrawl map "<url>" --limit 100

使用前先看這個檔案

先從這裡開始：

skills/firecrawl-map/SKILL.md

這個 repository 區塊本身很小，可額外檢查的輔助材料不多。這有利於快速採用，但也代表你在 prompt 裡最好明確說清楚網域、目標，以及輸出格式。

firecrawl-map 的基本使用模式

這個 skill 支援兩種常見用法。

依主題找出最可能的頁面：

firecrawl map "https://example.com" --search "authentication" -o .firecrawl/filtered.txt

取得較完整的 URL 清單：

firecrawl map "https://example.com" --limit 500 --json -o .firecrawl/urls.json

這就是核心的 firecrawl-map usage 模式：如果你是在找某一頁，先用 search 縮小範圍；如果你是在規劃下一步 scraping，先拿一份有上限的 URL 清單。

這個 skill 需要哪些輸入

想把 firecrawl-map skill 用好，以下輸入要清楚提供：

根 URL 或網域
你是要找一個可能頁面，還是要很多 URL
如果已知主題，請提供搜尋詞
希望回傳的 URL 數量上限
輸出格式：純文字或 JSON
是否要把子網域算進去
sitemap 要如何處理

不夠好的輸入：

「幫我找這個網站的 docs」

較好的輸入：

「Map https://docs.example.com，搜尋 authentication，以 JSON 回傳最相關的 URL；只有在主 docs 網域結果太少時，才納入 subdomains。」

後者能大幅減少猜測空間，也讓應該用哪個指令變得很明確。

如何把模糊需求寫成高品質 prompt

一份好的 firecrawl-map 提示寫法，通常是在一句話裡交代清楚五件事：

site
intent
scope
filter
output

範例：

「Use firecrawl-map on https://example.com to list up to 200 public URLs, prefer sitemap discovery, skip unrelated subdomains, and save JSON output for later scraping.」

針對目標頁面探索的範例：

「Use firecrawl-map to find the page on https://example.com most related to pricing API limits, and write matching URLs to a text file.」

最佳工作流程：先 map，再 scrape 或 crawl

實務上可採用這樣的流程：

如果你是在找單一頁面，先用帶 --search 的 firecrawl map
如果你需要較完整的 URL 集合，使用帶 --limit 與 --json 的 firecrawl map
檢查回傳的 URL
選出最相關的頁面
等你對網站結構已有足夠掌握後，再進入 scrape 或 crawl

和盲目直接 scraping 相比，這樣通常更省時間，也更省成本。

會明顯影響輸出品質的選項

最重要的選項有：

--search <query>：最適合在大型網站中定位某個主題頁面
--limit <n>：避免結果集過大
--json：讓後續篩選與自動化更容易
--sitemap <include|skip|only>：當 sitemap 覆蓋率很重要時特別有用
--include-subdomains：可擴大範圍，但也更容易引入雜訊
-o, --output <path>：讓結果可在 pipeline 中重複利用

如果結果雜訊太多，優先收緊的通常是搜尋詞、網域範圍，以及是否納入子網域。

如何選 sitemap 策略

--sitemap 這個選項的重要性，往往比多數使用者預期的還高：

only：如果你信任該網站的 sitemap，且想要更快、更乾淨的覆蓋，這是最快的選擇
include：當你希望 sitemap 能幫忙、但又不想完全依賴它時，是很好的預設值
skip：如果 sitemap 結果過期、不完整，或容易誤導時，這個選項更適合

對文件型網站來說，include 或 only 往往比不加限制的探索，更能得到好的 firecrawl-map for Web Scraping 結果。

什麼時候該納入子網域

只有在目標內容可能不在主 hostname 上時，才建議使用 --include-subdomains，例如：

docs.example.com
developers.example.com
support.example.com

對企業網站來說，不要把它當成預設開關，除非你真的想擴大涵蓋範圍。否則它很容易把 marketing、support 或 app 介面的 URL 一起灌進來，偏離你的目標。

使用者真正需要的實用範例

找 login 或 auth 文件頁面：

firecrawl map "https://docs.example.com" --search "authentication" -o .firecrawl/auth-pages.txt

取得可重複利用的 JSON URL 清單：

firecrawl map "https://example.com" --limit 300 --json -o .firecrawl/site-map.json

對 docs 網站優先採用 sitemap-only 探索：

firecrawl map "https://docs.example.com" --sitemap only --limit 500 --json

當 docs 位置不明時，把範圍擴大到子網域：

firecrawl map "https://example.com" --search "API reference" --include-subdomains

常見導入障礙

大家在使用 firecrawl-map skill 時，主要卡住的通常不是安裝，而是需求表達品質：

一開始就從過於寬泛的網域下手
明明是在找單一頁面，卻忘了加 --search
沒設上限就拉了太多 URL
太早納入 subdomains
把 map 當成內容擷取工具

如果第一次跑出來的結果很亂，先縮小網站範圍、把主題描述得更準，再考慮換工具。

firecrawl-map skill 常見問題

firecrawl-map 會比一般 prompt 更好嗎？

如果任務是在已知網站上做 URL 發現，答案是會。一般 prompt 可能只能猜哪些頁面比較可能存在，但 firecrawl-map 提供的是具體、可重複執行的方法，能直接列舉並篩選目標網域下的 URL。

firecrawl-map skill 適合新手嗎？

適合，因為它的指令面很小。最簡單的起手式就是以下兩條其中之一：

firecrawl map "https://example.com" --search "pricing"

firecrawl map "https://example.com" --limit 100 --json

新手最常犯的錯，是要求它去擷取頁面內容；但這不在這個 skill 的核心用途內。

什麼時候該用 firecrawl-map，而不是直接 crawling？

當你需要先理解網站結構，或先找出候選頁面時，應先用 firecrawl-map。等完成探索後，如果你需要更廣泛的遍歷或頁面層級處理，再進入 crawling。

什麼情況下不該用 firecrawl-map？

以下情況可以直接跳過：

你已經知道確切 URL
你需要頁面文字、metadata 或結構化擷取
你需要的是瀏覽器互動，而不是 URL 列表
任務本身不是網站探索

firecrawl-map 在大型網站上好用嗎？

好用，但前提是你有控制好範圍。請有意識地使用 --search、--limit 和 sitemap 策略。大型網站正是 firecrawl-map usage 最有價值的場景，但也是 prompt 寫得太鬆時最容易產生雜訊的地方。

我該選哪種輸出格式？

如果只是要讓人快速看一份頁面清單，純文字就夠了。如果結果後面還要交給其他工具、script 或流程處理，請選 --json。

如何改善 firecrawl-map skill 的使用效果

一開始就把目標縮得比你想像中更窄

想改善 firecrawl-map 結果，最簡單的方法就是盡早縮小範圍。如果你已經知道內容大概率在 docs，直接用 docs hostname，而不是公司首頁。

較好：

https://docs.example.com

較差：

https://example.com

搜尋詞要對齊頁面意圖

對 firecrawl-map skill 來說，搜尋品質比關鍵字數量更重要。簡短、能表達意圖的詞組，通常比塞滿關鍵字的查詢更有效。

較好：

authentication
rate limits
API reference

較差：

where can I find complete developer authentication API reference and login documentation

前者更利於 URL 過濾，通常也更容易得到乾淨的匹配結果。

只要結果會進入下一步，就優先選 JSON

如果你的下一步是 scrape、filter、classify 或 deduplicate，請直接使用：

--json

這個小選擇會讓 firecrawl-map guide 更容易自動化，也能減少人工清理。

map 不要只跑一次，要迭代使用

比較穩健的工作方式是：

先跑一次範圍較窄的 --search
檢查最可能的 URL
針對最好的子網域或區段，再跑第二次 map
只有在需要時才提高 --limit
等探索結果穩定後，再進入 scrape／crawl

這樣通常比一次跑超大範圍更好，因為能把有效訊號維持在較高水位。

留意常見失敗模式

firecrawl-map for Web Scraping 常見的失敗模式包括：

因網域太寬而出現大量不相關 URL
搜尋詞太模糊，導致漏掉目標頁面
選錯 sitemap 策略，造成清單不完整
不必要地開啟 subdomains，讓結果過於雜亂

每一種都有相對直接的修正方式：縮小網站範圍、明確查詢詞、調整 sitemap 模式，或進一步收斂 scope。

以成功條件來寫 prompt

不要只說「給我所有 URL」，而是要把什麼算成功說清楚。

範例：

「Use firecrawl-map to find pages related to authentication setup on https://docs.example.com. Return the most relevant URLs first, cap at 50, and save JSON output for follow-up scraping.」

這樣一來，工具選擇、參數設定，以及何時該停，都會清楚得多。

保持簡單明確的升級路徑

可採用這條實用的判斷路徑：

需要找一個可能頁面：map --search
需要 URL 清單：map --limit --json
需要頁面內容：先 map，再 scrape
需要更廣泛遍歷：先 map，再 crawl

這是改善 firecrawl-map 使用成果、又不會把工作流程複雜化的最實用方式。

評分與評論

尚無評分

分享你的評論

登入後即可為這項技能評分並留言。

0/10000

此分類中的更多技能

huggingface-datasets

作者 huggingface

使用 huggingface-datasets 技能來處理 Hugging Face Dataset Viewer API 工作流程：驗證資料集、解析 splits、預覽與分頁列資料、搜尋文字、套用篩選條件，並取得 parquet 連結或統計資訊。這是一份實用的 huggingface-datasets 指南，適合只讀的資料集探索。

网页抓取

收藏 0GitHub 10.4k

data-scraper-agent

作者 affaan-m

data-scraper-agent 協助建立可重複執行的公開資料流程，用於網頁爬取、資料增補與儲存。它適合搭配 GitHub Actions 依排程監控工作、價格、新聞、repo、體育賽事與清單，並將結果輸出到 Notion、Sheets 或 Supabase。最適合持續追蹤，不適合一次性擷取。

网页抓取

收藏 0GitHub 156.1k

baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可透過內建的 baoyu-fetch CLI，搭配 Chrome CDP、網站 adapter 與通用 fallback，將即時 URL 轉成 Markdown。使用前建議先確認 Bun 執行環境需求、首次 EXTEND.md 設定流程，以及在 X、YouTube、Hacker News 和需渲染頁面上的實際用法。

格式转换

收藏 0GitHub 13.2k

x-twitter-scraper

作者 Xquik-dev

使用 x-twitter-scraper 透過 Xquik 擷取 X（Twitter）資料與需要確認的動作。它支援貼文搜尋、使用者查詢、粉絲擷取、媒體下載、監控、webhooks、MCP 與寫入動作。最適合搭配 API key 進行類網頁爬蟲的研究，不適合使用 X 登入憑證。

网页抓取

收藏 0GitHub 71

exa-search

作者 K-Dense-AI

exa-search 是一項由 Exa 驅動的網頁研究技能，可用來尋找最新資訊並從 URL 擷取內容。適合用於搜尋、來源發掘、文章與 PDF 擷取，以及具備語意檢索、類學術篩選與清楚安裝／使用指引的技術或科學研究。

Web 研究

收藏 0GitHub 0

browser-use

作者 browser-use

browser-use 是一款用於瀏覽器自動化的技能，可開啟頁面、檢查目前狀態、點擊已編號元素、在欄位中輸入內容、擷取螢幕畫面，並重用持續性的瀏覽器工作階段。若你需要透過 browser-use CLI 穩定完成表單填寫、頁面導覽或登入後流程，這項技能很適合納入評估。

瀏覽器自動化

收藏 0GitHub 84.9k

remote-browser

作者 browser-use

remote-browser 可讓受沙箱限制的代理控制無頭瀏覽器，執行 Browser Automation。你可以用它開啟頁面、檢查目前狀態、點擊帶索引的元素、輸入內容、擷取螢幕截圖，並連線到本機應用程式或支援 CDP 的瀏覽器工作階段。

瀏覽器自動化

收藏 0GitHub 84.9k

firecrawl

作者 firecrawl

firecrawl skill 可協助你安裝、驗證並使用官方 Firecrawl CLI，進行網頁擷取、搜尋、爬取與頁面互動。內容涵蓋安裝設定、`firecrawl --status`、登入流程、將輸出安全寫入 `.firecrawl/`，以及依據 repo 整理的實用使用模式。

网页抓取

收藏 0GitHub 234

firecrawl-search

作者 firecrawl

firecrawl-search 是一個用於網頁研究的 skill，可協助找資料來源、執行結構化搜尋，並透過 Firecrawl CLI 視需要將完整頁面內容擷取為 JSON。

Web 研究

收藏 0GitHub 234

parallel-web

作者 K-Dense-AI

parallel-web 是一個由 parallel-cli 驅動的網頁研究與擷取技能。它可協助你搜尋網路、擷取 URL 內容、從來源補強資料，並進行更深入的研究，且預設優先使用學術與科學來源。適合用於 parallel-web 使用、網頁研究、引用蒐集，以及以證據為先的工作流程。

Web 研究

收藏 0GitHub 0

geomaster

作者 K-Dense-AI

geomaster 是一個地理空間科學技能，適用於 GIS、遙測、空間分析與地球觀測工作流程。可用在資料分析任務中，例如柵格與向量操作、衛星影像處理、空間指標計算與工作流程規劃。geomaster 指南可幫助你安裝、檢視並應用這個技能，少一點猜測、多一點把握。

数据分析

收藏 0GitHub 0

asc-aso-audit

作者 rudrankriyam

asc-aso-audit 可協助你在 `./metadata` 上對 Canonical App Store 中繼資料執行離線 ASO 稽核，再透過 Astro MCP 找出關鍵字缺口。搭配 `asc metadata pull` 後使用 asc-aso-audit skill，可更有把握地檢視 `subtitle`、`keywords`、`description` 和 `whatsNew`。

数据分析

收藏 0GitHub 0

ffuf-web-fuzzing

作者 jthack

ffuf-web-fuzzing 是一項實用技能，可用來發掘隱藏網頁內容、測試路由與參數，並透過原始請求、自動校準與結果分析對受認證目標進行模糊測試。它適合需要一份可重複使用的 ffuf-web-fuzzing 指南、用於滲透測試與 Security Audit 工作流程的資安測試人員。

安全稽核

收藏 0GitHub 0

web-to-markdown

作者 softaworks

web-to-markdown 是一個用於格式轉換的 skill，可透過本機 `web2md` CLI，將即時網頁整理成乾淨的 Markdown；面對 JS 渲染頁面、互動式流程與批次 URL 轉換時，會搭配 Chromium 系列瀏覽器處理。只有在明確以名稱呼叫時才會執行。

格式转换

收藏 0GitHub 1.3k

firecrawl-agent

作者 firecrawl

firecrawl-agent 可從複雜、跨多頁的網站擷取結構化 JSON。本文說明什麼情況適合使用、如何執行 Firecrawl CLI agent、加入 schema、設定起始 URLs，並將輸出保存為定價、商品與目錄型資料擷取結果。

网页抓取

收藏 0GitHub 234

firecrawl-crawl

作者 firecrawl

firecrawl-crawl 可協助代理程式以批次方式擷取整個網站或文件區段的內容，並支援路徑篩選、深度限制、頁數上限、wait 模式，以及工作狀態查詢。

网页抓取

收藏 0GitHub 234