网页抓取

浏览 数据处理 下与 网页抓取 相关的 Agent Skill,并比较相近工作流、工具与使用场景。

10 个技能
B
remote-browser

作者 browser-use

remote-browser 可帮助受沙箱限制的 agent 控制无头浏览器,用于 Browser Automation。你可以用它打开页面、检查当前状态、点击带索引的元素、输入内容、截取截图,并连接本地应用或基于 CDP 的浏览器会话。

浏览器自动化
收藏 0GitHub 84.9k
B
browser-use

作者 browser-use

browser-use 是一项用于浏览器自动化的技能,可用于打开页面、检查当前状态、点击带索引的元素、在输入框中键入内容、截取截图,并复用持久化浏览器会话。通过 browser-use CLI,它适合完成稳定的表单填写、页面导航以及需要登录状态的工作流。

浏览器自动化
收藏 0GitHub 84.9k
F
firecrawl-agent

作者 firecrawl

firecrawl-agent 可帮助你从复杂的多页面网站中提取结构化 JSON。了解它适合哪些场景、如何运行 Firecrawl CLI agent、添加 schema、设置起始 URL,以及如何保存输出,用于价格、商品和目录类数据提取。

网页抓取
收藏 0GitHub 234
F
firecrawl-browser

作者 firecrawl

firecrawl-browser 是一项用于交互式网页自动化的 Firecrawl 技能。它作为独立浏览器命令已被弃用,目前官方建议改用 firecrawl scrape 配合 firecrawl interact,以处理点击、表单填写、登录流程、分页以及 JavaScript 较重的页面。

浏览器自动化
收藏 0GitHub 234
F
firecrawl

作者 firecrawl

firecrawl skill 用于安装、认证并使用官方 Firecrawl CLI,支持网页抓取、搜索、爬取和页面交互。了解如何完成设置、运行 `firecrawl --status`、登录、将输出安全写入 `.firecrawl/`,以及参考仓库整理出的实用使用方式。

网页抓取
收藏 0GitHub 234
F
firecrawl-crawl

作者 firecrawl

firecrawl-crawl 可帮助智能体批量提取网站或文档专区内容,支持路径过滤、抓取深度限制、页面数量上限、wait 模式以及任务状态检查。

网页抓取
收藏 0GitHub 234
F
firecrawl-download

作者 firecrawl

firecrawl-download 可将整个网站或文档专区下载为整理好的本地文件,输出到 `.firecrawl/` 目录下。它结合站点映射与抓取能力,支持 markdown、链接和截图,适合离线保存文档、副本归档、批量抓取页面,以及实用型 Web Scraping 工作流。

网页抓取
收藏 0GitHub 234
F
firecrawl-search

作者 firecrawl

firecrawl-search 是一项面向网页研究的技能,可用于查找信息源、执行结构化搜索,并可选通过 Firecrawl CLI 将整页内容抓取为 JSON。

Web 研究
收藏 0GitHub 234
F
firecrawl-map

作者 firecrawl

firecrawl-map 可帮助智能体发现并列出网站中的 URL,支持搜索过滤、结果数量限制、JSON 输出、sitemap 模式和子域名控制,适合在进一步 scraping 或 crawling 之前先做站点摸底。

网页抓取
收藏 0GitHub 234
F
firecrawl-scrape

作者 firecrawl

firecrawl-scrape 可从已知 URL 提取干净、适合 LLM 处理的内容,包括经 JavaScript 渲染的页面。可通过 Firecrawl CLI 或 `npx firecrawl` 抓取 markdown、链接,或提取针对单个页面的答案。

网页抓取
收藏 0GitHub 234