Scraping

Explora agent skills con la etiqueta Scraping y compara workflows relacionados en el directorio.

15 skills
B
browser-use

por browser-use

browser-use es una skill de automatización del navegador para abrir páginas, inspeccionar el estado, hacer clic en elementos indexados, escribir en campos, tomar capturas y reutilizar una sesión persistente del navegador. Úsala para completar formularios con fiabilidad, navegar por sitios y ejecutar flujos con sesión iniciada mediante la CLI de browser-use.

Browser Automation
Favoritos 0GitHub 84.9k
J
baoyu-url-to-markdown

por JimLiu

baoyu-url-to-markdown convierte URLs activas a Markdown con un CLI baoyu-fetch incluido en el repositorio, usando Chrome CDP, adaptadores de sitio y una alternativa genérica. Revisa los requisitos de Bun, la configuración inicial de EXTEND.md y el uso para X, YouTube, Hacker News y páginas renderizadas.

Format Conversion
Favoritos 0GitHub 13.2k
O
multi-search-engine

por openclaw

multi-search-engine es una skill de investigación web con 17 motores de búsqueda, operadores avanzados, filtros por fecha, opciones centradas en la privacidad y consultas de WolframAlpha. Ayuda a los agentes a crear y ejecutar mejores URL de búsqueda sin necesidad de API keys.

Web Research
Favoritos 0GitHub 3.8k
S
web-to-markdown

por softaworks

web-to-markdown es una skill de conversión de formato que transforma páginas web en vivo en Markdown limpio mediante el CLI local `web2md`, usando un navegador de la familia Chromium para páginas renderizadas con JS, flujos interactivos y conversión por lotes de URLs. Solo se ejecuta cuando se invoca explícitamente por nombre.

Format Conversion
Favoritos 0GitHub 1.3k
F
firecrawl-agent

por firecrawl

firecrawl-agent ayuda a extraer JSON estructurado de sitios web complejos y de varias páginas. Descubre cuándo conviene usarlo, cómo ejecutar el agente de Firecrawl CLI, añadir esquemas, definir URLs iniciales y guardar resultados para extraer precios, productos y datos tipo directorio.

Web Scraping
Favoritos 0GitHub 234
F
firecrawl-browser

por firecrawl

firecrawl-browser es una skill de Firecrawl para automatización web interactiva. Está obsoleta como comando de navegador independiente y ahora orienta a usar primero firecrawl scrape y luego firecrawl interact para clics, formularios, flujos de inicio de sesión, paginación y páginas con mucho JavaScript.

Browser Automation
Favoritos 0GitHub 234
F
firecrawl

por firecrawl

Skill de firecrawl para instalar, autenticarse y usar la CLI oficial de Firecrawl para scraping web, búsqueda, rastreo e interacción con páginas. Aprende la configuración, `firecrawl --status`, el inicio de sesión, la salida segura de archivos en `.firecrawl/` y patrones de uso prácticos respaldados por el repositorio.

Web Scraping
Favoritos 0GitHub 234
F
firecrawl-crawl

por firecrawl

firecrawl-crawl ayuda a los agentes a extraer contenido de forma masiva de un sitio web o una sección de documentación, con filtros de rutas, límites de profundidad, topes de páginas, modo de espera y comprobaciones del estado del trabajo.

Web Scraping
Favoritos 0GitHub 234
F
firecrawl-download

por firecrawl

firecrawl-download te ayuda a descargar un sitio o una sección de documentación en archivos locales organizados dentro de `.firecrawl/`. Combina mapeo del sitio y scraping, admite markdown, enlaces y capturas de pantalla, y resulta útil para copias offline de documentación, captura masiva de páginas y flujos prácticos de Web Scraping.

Web Scraping
Favoritos 0GitHub 234
F
firecrawl-search

por firecrawl

firecrawl-search es una skill de investigación web para encontrar fuentes, realizar búsquedas estructuradas y, opcionalmente, extraer el contenido completo de páginas como JSON con Firecrawl CLI.

Web Research
Favoritos 0GitHub 234
F
firecrawl-map

por firecrawl

firecrawl-map ayuda a los agentes a descubrir y listar URLs de un sitio, con opciones de filtrado por búsqueda, límites, salida en JSON, modos de sitemap y control de subdominios antes de hacer scraping o crawling más profundos.

Web Scraping
Favoritos 0GitHub 234
F
firecrawl-scrape

por firecrawl

firecrawl-scrape ayuda a extraer contenido limpio y apto para LLM desde URLs conocidas, incluidas páginas renderizadas con JS. Úsalo para obtener markdown, enlaces o respuestas específicas de una página con Firecrawl CLI o `npx firecrawl`.

Web Scraping
Favoritos 0GitHub 234
X
x-twitter-scraper

por Xquik-dev

Usa x-twitter-scraper para obtener datos de X (Twitter) y acciones con verificación a través de Xquik. Admite búsqueda de tweets, consulta de usuarios, extracción de seguidores, descarga de medios, monitores, webhooks, MCP y acciones de escritura. Es ideal para investigación estilo web scraping con una API key, no para secretos de inicio de sesión de X.

Web Scraping
Favoritos 0GitHub 71
X
tweetclaw

por Xquik-dev

tweetclaw es el plugin instalable de OpenClaw para flujos de trabajo estructurados en X/Twitter. Esta skill de tweetclaw cubre la instalación, la configuración, los límites de credenciales, la aprobación explícita para escrituras y acciones de pago, el manejo de datos privados, los controles de monitorización y el uso práctico de tweetclaw para operar en redes sociales con mayor seguridad.

Social Media
Favoritos 0GitHub 37
R
reddit

por ReScienceLab

La skill de reddit recupera publicaciones de Reddit, hilos de comentarios, metadatos de subreddits y perfiles de usuario mediante la API pública JSON. Está pensada para investigación en Reddit, exploración de subreddits e investigación web con respaldo de fuentes cuando necesitas publicaciones reales en lugar de un resumen genérico. No requiere clave de API.

Web Research
Favoritos 0GitHub 0
Scraping tagged agent skills