抓取

浏览带有 抓取 标签的 Agent Skill,并比较目录中的相关工作流与详情页。

15 个技能
B
browser-use

作者 browser-use

browser-use 是一项用于浏览器自动化的技能,可用于打开页面、检查当前状态、点击带索引的元素、在输入框中键入内容、截取截图,并复用持久化浏览器会话。通过 browser-use CLI,它适合完成稳定的表单填写、页面导航以及需要登录状态的工作流。

浏览器自动化
收藏 0GitHub 84.9k
J
baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可借助内置的 baoyu-fetch CLI,将在线 URL 转为 Markdown,支持 Chrome CDP、站点适配器以及通用回退方案。适合在安装前了解 Bun 运行时要求、首次使用所需的 EXTEND.md 配置,以及处理 X、YouTube、Hacker News 和需渲染页面时的具体用法。

格式转换
收藏 0GitHub 13.2k
O
multi-search-engine

作者 openclaw

multi-search-engine 是一款面向 Web Research 的搜索技能,集成 17 个搜索引擎、高级搜索运算符、时间筛选、注重隐私的搜索选项,以及 WolframAlpha 查询能力。它可帮助智能体在无需 API keys 的情况下,更高效地构建并执行搜索 URL。

Web 研究
收藏 0GitHub 3.8k
S
web-to-markdown

作者 softaworks

web-to-markdown 是一项用于格式转换的 skill,可通过本地 `web2md` CLI 将在线网页转换为干净的 Markdown;对于 JS 渲染页面、交互式流程和批量 URL 转换,则会配合 Chromium 系浏览器完成处理。它只会在被用户明确点名时运行。

格式转换
收藏 0GitHub 1.3k
F
firecrawl-agent

作者 firecrawl

firecrawl-agent 可帮助你从复杂的多页面网站中提取结构化 JSON。了解它适合哪些场景、如何运行 Firecrawl CLI agent、添加 schema、设置起始 URL,以及如何保存输出,用于价格、商品和目录类数据提取。

网页抓取
收藏 0GitHub 234
F
firecrawl-browser

作者 firecrawl

firecrawl-browser 是一项用于交互式网页自动化的 Firecrawl 技能。它作为独立浏览器命令已被弃用,目前官方建议改用 firecrawl scrape 配合 firecrawl interact,以处理点击、表单填写、登录流程、分页以及 JavaScript 较重的页面。

浏览器自动化
收藏 0GitHub 234
F
firecrawl

作者 firecrawl

firecrawl skill 用于安装、认证并使用官方 Firecrawl CLI,支持网页抓取、搜索、爬取和页面交互。了解如何完成设置、运行 `firecrawl --status`、登录、将输出安全写入 `.firecrawl/`,以及参考仓库整理出的实用使用方式。

网页抓取
收藏 0GitHub 234
F
firecrawl-crawl

作者 firecrawl

firecrawl-crawl 可帮助智能体批量提取网站或文档专区内容,支持路径过滤、抓取深度限制、页面数量上限、wait 模式以及任务状态检查。

网页抓取
收藏 0GitHub 234
F
firecrawl-download

作者 firecrawl

firecrawl-download 可将整个网站或文档专区下载为整理好的本地文件,输出到 `.firecrawl/` 目录下。它结合站点映射与抓取能力,支持 markdown、链接和截图,适合离线保存文档、副本归档、批量抓取页面,以及实用型 Web Scraping 工作流。

网页抓取
收藏 0GitHub 234
F
firecrawl-search

作者 firecrawl

firecrawl-search 是一项面向网页研究的技能,可用于查找信息源、执行结构化搜索,并可选通过 Firecrawl CLI 将整页内容抓取为 JSON。

Web 研究
收藏 0GitHub 234
F
firecrawl-map

作者 firecrawl

firecrawl-map 可帮助智能体发现并列出网站中的 URL,支持搜索过滤、结果数量限制、JSON 输出、sitemap 模式和子域名控制,适合在进一步 scraping 或 crawling 之前先做站点摸底。

网页抓取
收藏 0GitHub 234
F
firecrawl-scrape

作者 firecrawl

firecrawl-scrape 可从已知 URL 提取干净、适合 LLM 处理的内容,包括经 JavaScript 渲染的页面。可通过 Firecrawl CLI 或 `npx firecrawl` 抓取 markdown、链接,或提取针对单个页面的答案。

网页抓取
收藏 0GitHub 234
X
x-twitter-scraper

作者 Xquik-dev

使用 x-twitter-scraper 通过 Xquik 获取 X(Twitter)数据和需要确认的操作。它支持推文搜索、用户查询、粉丝提取、媒体下载、监控、webhook、MCP 和写入操作。适合基于 API key 的网页抓取式研究,不适合使用 X 登录凭证。

网页抓取
收藏 0GitHub 71
X
tweetclaw

作者 Xquik-dev

tweetclaw 是 OpenClaw 的可安装插件,用于结构化的 X/Twitter 工作流。这个 tweetclaw 技能涵盖安装、配置、凭证边界、写入和付费操作的显式批准、私有数据处理、监控控制,以及更安全地进行 Social Media 操作时的实用 tweetclaw 用法。

社交媒体
收藏 0GitHub 37
R
reddit

作者 ReScienceLab

reddit 技能通过公开 JSON API 获取 Reddit 帖子、评论串、subreddit 元数据和用户资料。它适合做 Reddit 研究、subreddit 扫描,以及需要真实帖子而不是泛泛摘要的来源可追溯网页研究。无需 API key。

Web 研究
收藏 0GitHub 0
抓取 标签 Agent Skill