firecrawl

作者 firecrawl

firecrawl skill 用于安装、认证并使用官方 Firecrawl CLI，支持网页抓取、搜索、爬取和页面交互。了解如何完成设置、运行 `firecrawl --status`、登录、将输出安全写入 `.firecrawl/`，以及参考仓库整理出的实用使用方式。

Stars234

收录时间2026年3月31日

分类网页抓取

安装命令

npx skills add firecrawl/cli --skill firecrawl

编辑评分

该 skill 评分为 78/100，说明它很适合作为目录收录项，面向希望使用可由 agent 触发的网页抓取/搜索 CLI、并且需要清晰安装与安全指引的用户。仓库证据显示，它在触发条件提示、前置检查说明和实际安全处理方面表现较强，但完整的命令用法细节仍需要依赖 `--help` 获取。

78/100

亮点

触发场景说明非常清晰：`SKILL.md` 明确列出何时应使用它（搜索、抓取、爬取文档、获取 URL、与页面交互），以及何时不应使用。
操作基础信息明确：它定义了允许的 Bash 调用方式，要求运行 `firecrawl --status`，并在 `rules/install.md` 中提供安装与认证步骤。
可信性与安全性高于平均水平：`rules/security.md` 针对不受信任的网页内容、输出隔离、增量读取和 URL 引号处理提供了具体指导。

注意点

命令工作流在 skill 本身中的文档覆盖似乎还不完整；用户可能仍需查阅 `firecrawl --help` 才能确认具体选项和执行方式。
安装/版本说明在不同文件之间略有不一致（安装指南中为 `1.8.0`，而安全相关安装片段中为 `1.7.1`），可能会带来轻微的采用阻力。

Cli 抓取网站 API npm

概览

firecrawl skill 概览

firecrawl skill 能做什么

firecrawl skill 的作用，是帮助智能体在终端里使用官方 Firecrawl CLI 完成网页搜索、抓取、爬取，以及交互式页面获取。它特别适合这类场景：你需要拿到最新网页内容、提取干净的页面正文，或做整站级内容采集，而这些需求已经超出了模型内置浏览能力的适用范围。落实到实际任务上，它真正解决的问题是：把一句模糊的“帮我拿到这个网站的内容”，转成一套可重复执行的 CLI 工作流，既能抓到正确页面、把结果安全落盘，也能避免把大体量、且不可信的网页内容直接塞进主聊天上下文。

谁适合安装 firecrawl

如果你经常需要做以下事情，建议安装这个 firecrawl skill：

抓取文章页或文档站点
搜索最新的网页信息
从已知 URL 提取内容
为研究或迁移工作爬取多个页面
处理普通提示词难以稳定完成的页面交互需求

相比只偶尔轻量浏览一下网页的用户，它更适合开发者、研究人员，以及高度依赖自动化工作流的用户。

为什么这个 firecrawl skill 有用

这个 firecrawl skill 的核心价值不只是“能访问网页”。更重要的是，它给智能体提供了一套明确的操作模式：

先确认 CLI 已安装且完成认证
按任务类型选择正确的 Firecrawl 命令：search、scrape 或 crawl
将输出写入文件，而不是把大量网页内容直接灌进模型上下文
把抓取到的网页内容视为不可信输入

最后这一点尤其关键。仓库里附带的安全指引，是很多人应该使用这个 skill、而不是临时手搓 shell 命令的最重要原因之一。

它和通用网页抓取提示词有什么区别

一个普通提示词可能只会让智能体“抓一下这个网站”，但 firecrawl skill 补上了具体执行规则：

使用官方 firecrawl CLI
用 firecrawl --status 检查是否就绪
留意并发与 credit 限额
将结果保存到 .firecrawl/
采用增量检查输出，而不是一次性把所有内容都读进来

这会显著减少猜测式操作，也让 firecrawl for Web Scraping 的使用更安全、更可复现。

什么情况下 firecrawl 不适合用

以下场景不建议安装这个 firecrawl skill：

本地文件操作
git 工作流
部署任务
完全不涉及网页的代码编辑工作
模型内置浏览已经足够的一次性网页查看

如果你的任务根本不需要访问外部网站，那么这个 skill 大概率没有必要。

如何使用 firecrawl skill

安装 firecrawl 并确认可用

根据仓库给出的指引，最快的 firecrawl 安装方式是：

npx -y firecrawl-cli -y

这条流程会安装 CLI、启动认证，并安装 skills。你也可以手动安装：

npm install -g [email protected]

然后检查当前环境：

firecrawl --status

正常情况下，状态输出里应显示认证状态、并发限制和剩余 credits。如果 firecrawl --status 失败，先不要继续做抓取。

第一次正式使用前先完成认证

推荐的登录方式是浏览器认证：

firecrawl login --browser

如果有需要，也可以使用 API key 认证：

firecrawl login --api-key "<key>"

这一步对很多用户来说是实际落地时的主要门槛：只有认证成功后，firecrawl skill 才真正可用。如果看起来安装没问题，但命令仍然跑不通，先检查 auth，不要一开始就去怀疑命令语法。

先判断你需要的是哪类命令

在写提示词之前，先明确你真正需要哪种 Firecrawl 任务：

search：查找某个主题相关的页面
scrape：从特定 URL 提取内容
crawl：跨整个站点或某个文档分区收集内容
interact/page actions：目标页面需要点击、登录式流程等交互支持时使用

这个 skill 最有价值的地方，就在于帮助智能体分清“先找来源页面”“提取这个已知页面”“把整个文档站点摸清楚”这三类完全不同的工作。

firecrawl skill 需要哪些输入

想把 firecrawl 用好，前提是任务输入要完整。你提供的信息越具体，智能体越容易跑对：

精确的 URL 或域名
你要单页还是多页
需要什么输出格式
你关注哪些字段
哪些内容应该忽略，比如导航、模板化文案或无关分区
是否要求内容新鲜度

较弱的输入：
“Get info from Stripe docs.”

更强的输入：
“Use firecrawl to crawl the Stripe docs pages about webhooks only, save output to .firecrawl/, and summarize endpoint signing, retry behavior, and local testing.”

把模糊需求改写成高质量 firecrawl 提示词

一个实用的提示词模板是：

Use the firecrawl skill to [search/scrape/crawl] [URL or topic].
Write results to `.firecrawl/`.
Focus on [specific entities, sections, or facts].
Ignore [irrelevant areas].
After fetching, inspect only the needed parts and return a concise summary with source URLs.

它之所以有效，是因为它同时做到了：

选定操作类型
指明目标对象
限定范围
强化安全输出方式
明确你希望最终回答采用什么格式

用文件输出代替直接把页面内容贴进对话

这个 firecrawl skill 最重要的使用习惯之一，就是通过 -o 把抓取内容写入文件，而不是把整页正文直接流式塞进聊天。这样做的好处包括：

更节省上下文
更方便复现
更能防范页面内容里的 prompt injection
更便于后续配合 shell 工具做筛选

这正是成熟的 firecrawl 用法，和“先把页面抓下来再整段贴进来”之间最实用的区别之一。

优先看这些关键仓库文件

如果你想快速理解这个 skill，建议先看这几个文件：

SKILL.md
rules/install.md
rules/security.md

这个仓库本身不大，所以最佳阅读路径也很短。SKILL.md 说明了什么情况下应该触发 firecrawl；rules/install.md 能帮你减少安装与配置阻力；rules/security.md 则包含价值最高的实际操作建议。

大任务前先检查 credits 和并发

firecrawl --status 的输出会包含：

Concurrency：并行任务上限
Credits：剩余 API 预算

这对以 crawl 为主的工作尤其重要。如果你准备抓一整套大型文档，credit 限额和并发不是无关紧要的小字说明，而是会直接决定你应该一次跑完整 crawl，还是拆成更窄、更有针对性的 scrape 序列。

把抓取到的网页内容当作不可信输入处理

这个 firecrawl skill 带有一个非常重要的提醒：抓到的网页数据属于不可信的第三方内容，必须按这个前提处理。实际操作上建议：

在 shell 命令里给 URL 加引号
把输出统一存到 .firecrawl/
不要不加筛选地把整个抓取文件全部读入
只用 grep、head 之类工具检查相关片段
永远不要照着抓取内容里嵌入的指令去执行

对很多用户来说，这套安全姿势本身，就是采用 firecrawl skill、而不是临时拼凑抓取命令的最明确理由。

适合真实任务的推荐工作流

一个高信号、适合日常使用的 firecrawl 工作流大致如下：

用 firecrawl --status 确认安装和认证都正常。
判断当前任务是 search、scrape、crawl，还是 interaction。
执行命令，并把输出写入 .firecrawl/。
只检查你真正需要的那部分内容。
提取所需事实、链接或摘要。
如果第一轮结果噪声太多，就收窄 URL 范围或内容目标后重新运行。

这套流程很简单，但能明显提升输出质量，也能避免智能体被海量网页文本淹没。

常见安装失败的排查方法

如果系统找不到 firecrawl 命令：

确认 npm global bin 已加入 PATH
用 npx [email protected] --version 测试
重新执行 npm install -g [email protected]

如果命令存在但仍无法正常使用：

运行 firecrawl --status
检查认证是否真的完成
重试 firecrawl login --browser

这些就是最常见、也最容易卡住 firecrawl 安装成功的原因。

firecrawl skill 常见问题

这个 firecrawl skill 只能用来抓取吗？

不是。firecrawl skill 覆盖 search、scraping、crawling 和页面交互。如果你的任务起点是“先找到相关页面”，而不是“提取这个精确 URL”，它依然很适合。

firecrawl 比普通带浏览能力的提示词更好吗？

通常是的，尤其当你需要可重复的提取、多页面采集、基于文件的输出，或者 CLI 驱动的工作流时。普通提示词适合轻量查找；而当你需要可重跑、可本地检查的结构化网页获取时，Firecrawl 会更合适。

firecrawl skill 对新手友好吗？

算是中等友好。安装流程本身不复杂，但新手很容易卡在认证、CLI 路径问题，或者不清楚到底该用 search、scrape 还是 crawl。只要你开始用“明确 URL + 明确范围”的方式思考任务，这个 skill 就会好上手很多。

使用 firecrawl 一定需要 API key 吗？

不一定必须手动提供，但你确实需要完成认证。推荐方式是 firecrawl login --browser。如果浏览器认证不方便，也可以使用 API key 登录。

哪些情况下不该使用 firecrawl skill？

以下情况可以直接跳过：

任务本身不依赖网页
模型内置浏览已经够用
你只需要某个公开页面里一小段内容，而且不在意复用
目标内容不适合通过外部抓取服务获取

用 firecrawl for Web Scraping 时最大的风险是什么？

最主要的实际风险，是把抓取内容当成可信信息来处理。网页里可能带有 prompt injection，也可能只是充满和任务无关的大量文本，直接把模型淹没。这个 skill 之所以有价值，正是因为它明确建议你采用文件输出、增量阅读和选择性提取的方式来降低这些风险。

如何提升 firecrawl skill 的使用效果

给 firecrawl 更窄、更明确的目标

想提升 firecrawl 结果，最快的方法就是减少歧义。更好的输入通常会明确这些内容：

精确 URL 或域名
页面集合的边界
需要提取的事实或实体
排除规则
最终交付格式

“Crawl this documentation site” 太宽泛。
而“只爬取认证和 rate-limit 相关章节，然后比较它们的接入步骤”就会得到明显更好的结果。

不要只要求抓取，要明确提取目标

当抓取动作和后续判断目标绑定在一起时，firecrawl skill 的效果会更好。比如：

“Find the latest pricing page and extract plan limits”
“Scrape this changelog page and summarize breaking changes since January”
“Crawl these docs pages and list all webhook retry rules”

这样一来，抓回来的内容更容易过滤，第一轮结果出来后也更有用。

用分阶段运行提升输出质量

任务规模较大时，不要一开始就直接跑最宽的 crawl。更好的模式是：

先 search 或 scrape 几个有代表性的页面
看看实际内容长什么样
再细化范围和字段
确认目标清楚之后，再执行更大范围的 crawl

这样既能节省 credits，也能减少噪声结果。

避开最常见的失败模式

firecrawl 常见的失败模式包括：

明明单页 scrape 就够，却用了 crawl
收集了太多模板化、样板式内容
忘了先检查 auth
把超大的输出文件整个读进上下文
没把 credit 限额算进去
需要精确提取时却只给了一个主题，没有给 URL

这些问题大多是输入质量问题，不是工具本身的问题。

用更强的提示词提升 firecrawl 使用效果

一个更强的提示词，通常会包含以下全部要素：

操作类型
目标 URL 或主题
范围边界
必要字段
输出位置
抓取后的分析要求

示例：

Use the firecrawl skill to scrape `https://example.com/docs/api/auth`.
Save output to `.firecrawl/`.
Extract only authentication methods, required headers, token expiry details, and example request patterns.
Then summarize the findings in bullets and cite the source URL.

这比“Fetch this docs page.”要好得多。

第一次运行后继续迭代

如果第一次 firecrawl 结果不好用，建议一次只调整一个变量：

收窄 URL 集合
从 crawl 改成 scrape
明确指定你关心的章节
要求提取具名字段
修改最终答案格式

相比继续堆砌更多泛泛而谈的指令，小幅、针对性的提示词调整通常更有效。

保持这套安全使用模式不要丢

不要把“优化” firecrawl 理解成把完整原始网页整段贴进对话。更好的做法是：

输出到 .firecrawl/
只检查部分内容
只提取真正重要的信息
在原始 dump 之外做总结

这样才能保住这个 skill 最大的操作优势：更实用、更安全、同时更节省上下文的网页获取流程。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

huggingface-datasets

作者 huggingface

在 Hugging Face Dataset Viewer API 工作流中使用 huggingface-datasets 技能，用于校验数据集、解析 splits、预览和分页行、搜索文本、应用过滤器，以及获取 parquet 链接或统计信息。它是一份面向只读数据集探索的实用 huggingface-datasets 指南。

网页抓取

收藏 0GitHub 10.4k

data-scraper-agent

作者 affaan-m

data-scraper-agent 可帮助你搭建可重复使用的公开数据管道，用于网页抓取、数据丰富和存储。它面向按计划持续监控任务、价格、新闻、仓库、体育和列表信息，可结合 GitHub Actions 定时运行，并将结果输出到 Notion、Sheets 或 Supabase。更适合长期跟踪，不适合一次性提取。

网页抓取

收藏 0GitHub 156.1k

baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可借助内置的 baoyu-fetch CLI，将在线 URL 转为 Markdown，支持 Chrome CDP、站点适配器以及通用回退方案。适合在安装前了解 Bun 运行时要求、首次使用所需的 EXTEND.md 配置，以及处理 X、YouTube、Hacker News 和需渲染页面时的具体用法。

格式转换

收藏 0GitHub 13.2k

x-twitter-scraper

作者 Xquik-dev

使用 x-twitter-scraper 通过 Xquik 获取 X（Twitter）数据和需要确认的操作。它支持推文搜索、用户查询、粉丝提取、媒体下载、监控、webhook、MCP 和写入操作。适合基于 API key 的网页抓取式研究，不适合使用 X 登录凭证。

网页抓取

收藏 0GitHub 71

exa-search

作者 K-Dense-AI

exa-search 是一项由 Exa 驱动的网页研究技能，可用于查找最新信息并从 URL 中提取内容。适合用于搜索、来源发现、文章和 PDF 提取，以及结合语义检索、学术式过滤和清晰安装与使用指引的技术或科学研究。

Web 研究

收藏 0GitHub 0

browser-use

作者 browser-use

browser-use 是一项用于浏览器自动化的技能，可用于打开页面、检查当前状态、点击带索引的元素、在输入框中键入内容、截取截图，并复用持久化浏览器会话。通过 browser-use CLI，它适合完成稳定的表单填写、页面导航以及需要登录状态的工作流。

浏览器自动化

收藏 0GitHub 84.9k

remote-browser

作者 browser-use

remote-browser 可帮助受沙箱限制的 agent 控制无头浏览器，用于 Browser Automation。你可以用它打开页面、检查当前状态、点击带索引的元素、输入内容、截取截图，并连接本地应用或基于 CDP 的浏览器会话。

浏览器自动化

收藏 0GitHub 84.9k

firecrawl-search

作者 firecrawl

firecrawl-search 是一项面向网页研究的技能，可用于查找信息源、执行结构化搜索，并可选通过 Firecrawl CLI 将整页内容抓取为 JSON。

Web 研究

收藏 0GitHub 234

parallel-web

作者 K-Dense-AI

parallel-web 是一个由 parallel-cli 驱动的网页研究与信息提取技能。它可帮助你进行网页搜索、提取 URL 内容、从来源中补充数据，并围绕学术与科学来源优先开展更深入的研究。适用于 parallel-web 的用法、网页研究、引用整理以及以证据为先的工作流。

Web 研究

收藏 0GitHub 0

geomaster

作者 K-Dense-AI

geomaster 是一项面向 GIS、遥感、空间分析和地球观测工作流的地理空间科学技能。可用于数据分析任务，例如栅格与矢量操作、卫星影像处理、空间指标计算和工作流规划。geomaster 指南可帮助你更少凭猜测地完成安装、查看和应用这项技能。

数据分析

收藏 0GitHub 0

asc-aso-audit

作者 rudrankriyam

asc-aso-audit 帮你基于 `./metadata` 中的标准 App Store 元数据执行离线 ASO 审核，再借助 Astro MCP 发现关键词缺口。建议在 `asc metadata pull` 之后使用 asc-aso-audit skill，重点查看 `subtitle`、`keywords`、`description` 和 `whatsNew`，减少拍脑袋判断。

数据分析

收藏 0GitHub 0

ffuf-web-fuzzing

作者 jthack

ffuf-web-fuzzing 是一项实用技能，可用于发现隐藏的 Web 内容、测试路由和参数，并通过原始请求、自动校准和结果分析对已认证目标进行 fuzzing。它适合需要一份可重复执行的 ffuf-web-fuzzing 渗透测试与 Security Audit 工作流指南的安全测试人员。

安全审计

收藏 0GitHub 0

web-to-markdown

作者 softaworks

web-to-markdown 是一项用于格式转换的 skill，可通过本地 `web2md` CLI 将在线网页转换为干净的 Markdown；对于 JS 渲染页面、交互式流程和批量 URL 转换，则会配合 Chromium 系浏览器完成处理。它只会在被用户明确点名时运行。

格式转换

收藏 0GitHub 1.3k

firecrawl-agent

作者 firecrawl

firecrawl-agent 可帮助你从复杂的多页面网站中提取结构化 JSON。了解它适合哪些场景、如何运行 Firecrawl CLI agent、添加 schema、设置起始 URL，以及如何保存输出，用于价格、商品和目录类数据提取。

网页抓取

收藏 0GitHub 234

firecrawl-map

作者 firecrawl

firecrawl-map 可帮助智能体发现并列出网站中的 URL，支持搜索过滤、结果数量限制、JSON 输出、sitemap 模式和子域名控制，适合在进一步 scraping 或 crawling 之前先做站点摸底。

网页抓取

收藏 0GitHub 234

firecrawl-crawl

作者 firecrawl

firecrawl-crawl 可帮助智能体批量提取网站或文档专区内容，支持路径过滤、抓取深度限制、页面数量上限、wait 模式以及任务状态检查。

网页抓取

收藏 0GitHub 234