抓取

瀏覽帶有 抓取 標籤的 Agent Skill,並比較目錄中的相關工作流與詳情頁。

15 個技能
B
browser-use

作者 browser-use

browser-use 是一款用於瀏覽器自動化的技能,可開啟頁面、檢查目前狀態、點擊已編號元素、在欄位中輸入內容、擷取螢幕畫面,並重用持續性的瀏覽器工作階段。若你需要透過 browser-use CLI 穩定完成表單填寫、頁面導覽或登入後流程,這項技能很適合納入評估。

瀏覽器自動化
收藏 0GitHub 84.9k
J
baoyu-url-to-markdown

作者 JimLiu

baoyu-url-to-markdown 可透過內建的 baoyu-fetch CLI,搭配 Chrome CDP、網站 adapter 與通用 fallback,將即時 URL 轉成 Markdown。使用前建議先確認 Bun 執行環境需求、首次 EXTEND.md 設定流程,以及在 X、YouTube、Hacker News 和需渲染頁面上的實際用法。

格式转换
收藏 0GitHub 13.2k
O
multi-search-engine

作者 openclaw

multi-search-engine 是一款用於 Web Research 的搜尋技能,支援 17 種搜尋引擎、進階運算子、時間篩選、重視隱私的搜尋選項,以及 WolframAlpha 查詢。它可協助代理程式在不需 API key 的情況下,更有效地建立並執行搜尋 URL。

Web 研究
收藏 0GitHub 3.8k
S
web-to-markdown

作者 softaworks

web-to-markdown 是一個用於格式轉換的 skill,可透過本機 `web2md` CLI,將即時網頁整理成乾淨的 Markdown;面對 JS 渲染頁面、互動式流程與批次 URL 轉換時,會搭配 Chromium 系列瀏覽器處理。只有在明確以名稱呼叫時才會執行。

格式转换
收藏 0GitHub 1.3k
F
firecrawl-agent

作者 firecrawl

firecrawl-agent 可從複雜、跨多頁的網站擷取結構化 JSON。本文說明什麼情況適合使用、如何執行 Firecrawl CLI agent、加入 schema、設定起始 URLs,並將輸出保存為定價、商品與目錄型資料擷取結果。

网页抓取
收藏 0GitHub 234
F
firecrawl-browser

作者 firecrawl

firecrawl-browser 是 Firecrawl 的互動式網頁自動化技能。它已不再建議作為獨立瀏覽器指令使用,目前官方引導改用 `firecrawl scrape` 搭配 `firecrawl interact`,處理點擊、表單填寫、登入流程、分頁,以及高度依賴 JavaScript 的頁面。

瀏覽器自動化
收藏 0GitHub 234
F
firecrawl

作者 firecrawl

firecrawl skill 可協助你安裝、驗證並使用官方 Firecrawl CLI,進行網頁擷取、搜尋、爬取與頁面互動。內容涵蓋安裝設定、`firecrawl --status`、登入流程、將輸出安全寫入 `.firecrawl/`,以及依據 repo 整理的實用使用模式。

网页抓取
收藏 0GitHub 234
F
firecrawl-crawl

作者 firecrawl

firecrawl-crawl 可協助代理程式以批次方式擷取整個網站或文件區段的內容,並支援路徑篩選、深度限制、頁數上限、wait 模式,以及工作狀態查詢。

网页抓取
收藏 0GitHub 234
F
firecrawl-download

作者 firecrawl

firecrawl-download 可協助你把整個網站或文件區段下載成整理好的本機檔案,輸出到 `.firecrawl/` 目錄下。它結合網站地圖探索與內容擷取,支援 markdown、連結與截圖,適合用來建立離線文件副本、批次保存頁面,以及處理實務上的 Web Scraping 工作流程。

网页抓取
收藏 0GitHub 234
F
firecrawl-search

作者 firecrawl

firecrawl-search 是一個用於網頁研究的 skill,可協助找資料來源、執行結構化搜尋,並透過 Firecrawl CLI 視需要將完整頁面內容擷取為 JSON。

Web 研究
收藏 0GitHub 234
F
firecrawl-map

作者 firecrawl

firecrawl-map 可協助代理在深入 scraping 或 crawling 前,先探索並列出網站上的 URL,並支援搜尋篩選、筆數限制、JSON 輸出、sitemap 模式與子網域控制等選項。

网页抓取
收藏 0GitHub 234
F
firecrawl-scrape

作者 firecrawl

firecrawl-scrape 可從已知 URL 擷取乾淨、適合 LLM 使用的內容,也支援經 JavaScript 渲染的頁面。可透過 Firecrawl CLI 或 `npx firecrawl` 抓取 markdown、連結,或取得針對特定頁面的回答。

网页抓取
收藏 0GitHub 234
X
x-twitter-scraper

作者 Xquik-dev

使用 x-twitter-scraper 透過 Xquik 擷取 X(Twitter)資料與需要確認的動作。它支援貼文搜尋、使用者查詢、粉絲擷取、媒體下載、監控、webhooks、MCP 與寫入動作。最適合搭配 API key 進行類網頁爬蟲的研究,不適合使用 X 登入憑證。

网页抓取
收藏 0GitHub 71
X
tweetclaw

作者 Xquik-dev

tweetclaw 是可安裝的 OpenClaw 外掛,適用於結構化的 X/Twitter 工作流程。這個 tweetclaw skill 涵蓋安裝、設定、憑證邊界、寫入與付費操作的明確核准、私密資料處理、監控控制,以及更安全進行 Social Media 操作時的實用 tweetclaw 用法。

社交媒体
收藏 0GitHub 37
R
reddit

作者 ReScienceLab

reddit 技能可透過公開 JSON API 擷取 Reddit 貼文、留言串、subreddit 中繼資料,以及使用者個人檔案。它適合 Reddit 研究、subreddit 掃描,以及需要真實貼文而非泛用摘要的具來源網路研究。無需 API 金鑰。

Web 研究
收藏 0GitHub 0
抓取 標籤 Agent Skill